Sun. Jan 5th, 2025

GEMINI AI നും CHATGPT നും: ഗൂഗിൾസിന്റെ ചാലഞ്ചർ പറയുന്ന 5 വാസ്തവങ്ങൾ

2023 വർഷം ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ഭൂപ്രകൃതിയിൽ അഭൂതപൂർവമായ മാറ്റം അടയാളപ്പെടുത്തി. AI-യുടെ ലോകത്തിലെ പ്രബലമായ ജഗ്ഗർനട്ട്, ഓപ്പൺ AI-യുടെ ChatGPT, വളർന്നുവരുന്ന ഒരു നക്ഷത്രത്താൽ  വെല്ലുവിളിക്കപ്പെട്ടതായി കണ്ടെത്തി. ഗൂഗിൾ, സെർച്ച് എഞ്ചിൻ ഭീമൻ, അതിന്റെ ഏറ്റവും പുതിയ ഭാഷാ മോഡലും ChatGPT-യുടെ എതിരാളിയുമായ ജെമിനി AI ഉപയോഗിച്ച് അതിന്റെ ചുവടുപിടിച്ചു.

സുന്ദർ പിച്ചൈ പ്രഖ്യാപിച്ചതുപോലെ, ഇത് ഗൂഗിളിൽ AI യിൽ ഒരു പുതിയ ഘട്ടത്തെ അറിയിക്കുന്നു. ഗൂഗിൾ ഉൽപ്പന്നങ്ങളുടെ മുഴുവൻ സ്പെക്ട്രത്തിലും വിപ്ലവം സൃഷ്ടിക്കുമെന്ന് വാഗ്ദാനം ചെയ്യുന്ന AI മോഡലുകളിൽ ജെമിനി ഒരു വലിയ കുതിപ്പ് അടയാളപ്പെടുത്തുന്നു. പിച്ചൈയും ഗൂഗിൾ ഡീപ്‌മൈൻഡ് സിഇഒ ഡെമിസ് ഹസാബിസും അതിന്റെ പ്രാധാന്യത്തെ പ്രശംസിച്ചു, ഈ സാങ്കേതികവിദ്യ ഗൂഗിളിന്റെ വൈവിധ്യമാർന്ന ഓഫറുകളിലുടനീളം എങ്ങനെ തടസ്സമില്ലാതെ സമന്വയിപ്പിക്കുന്നുവെന്ന് ഊന്നിപ്പറയുന്നു.

ഈ പുതിയ AI ടൈറ്റൻ എന്താണ് വാഗ്ദാനം ചെയ്യുന്നതെന്ന് ആശ്ചര്യപ്പെടുന്നുണ്ടോ? അതിന്റെ ആധിപത്യം സ്ഥാപിക്കുന്ന വിചിത്രമായ സവിശേഷതകൾ എന്തൊക്കെയാണ്? കൂടുതൽ അറിയാൻ വായിക്കുക!

ഗൂഗിളിന്റെ ജെമിനി AI

AI വികസനത്തിൽ ടെക് ഭീമന്റെ തകർപ്പൻ നേട്ടമായി വിശേഷിപ്പിക്കപ്പെടുന്ന നൂതന ജനറേറ്റീവ് AI മോഡലായ ജെമിനി ഗൂഗിൾ അവതരിപ്പിച്ചു. ഇന്നുവരെയുള്ള ഏറ്റവും വൈവിധ്യമാർന്നതും ശക്തവുമായ AI ആയി കണക്കാക്കപ്പെടുന്നു. ഗ്രാഫിക്‌സ്, ടെക്‌സ്‌റ്റ്, വോയ്‌സ്, വീഡിയോ എന്നിവയുൾപ്പെടെ വിവിധ മാധ്യമങ്ങളിൽ ജെമിനിയുടെ അഡാപ്‌റ്റബിലിറ്റി അടിവരയിടുന്നു, വരും വർഷത്തിൽ വലിയ ഭാഷാ മോഡലിന്റെ (എൽഎൽഎം) ഈ വിപുലമായ ആവർത്തനം വിപുലീകരിക്കാൻ ഗൂഗിൾ  വിഭാവനം ചെയ്യുന്നു.

AI ചാറ്റ്‌ബോട്ട് ബാർഡിന്റെ വൈസ് പ്രസിഡന്റ് സിസ്‌സി ഹ്‌സിയാവോ, ജെമിനി പ്രോ GPT-3.5 കവിയുക മാത്രമല്ല, എട്ട് വ്യവസായ മാനദണ്ഡങ്ങളിൽ ആറിലും അതിനെ മറികടന്നുവെന്ന് ഒരു പത്രത്തിൽ ഉറപ്പിച്ചു. കൂടാതെ, കൂടുതൽ നൂതനമായ പതിപ്പായ ഗൂഗിൾ ജെമിനി അൾട്രാ, ഏഴ് മെട്രിക്കുകളിൽ GPT-4 നെ മറികടന്നു.

ഒരു വീഡിയോ അവതരണത്തിൽ യഥാർത്ഥ ജീവിതത്തിലുള്ള നീല റബ്ബർ താറാവും താറാവിന്റെ വരയും തമ്മിൽ വേർതിരിച്ചറിയാനുള്ള കഴിവ് പ്രകടമാക്കിക്കൊണ്ട് ഗൂഗിൾ അതിന്റെ ലോഞ്ച് വേളയിൽ ജെമിനിയുടെ ശ്രദ്ധേയമായ ധാരണ പ്രദർശിപ്പിച്ചു.

മൂന്ന് വ്യത്യസ്ത മോഡലുകളിൽ ജെമിനി അരങ്ങേറ്റം കുറിക്കുന്നു-

  • ജെമിനി അൾട്രാ: ഏറ്റവും വലുതും കരുത്തുറ്റതും, വളരെ സങ്കീർണ്ണമായ ജോലികൾക്കായി രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതുമാണ് 
  • ജെമിനി പ്രോ: വിശാലമായ പ്രവർത്തനങ്ങൾക്കായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു
  • ജെമിനി നാനോ: ജെമിനിയിൽ പ്രവർത്തിക്കുന്ന ആപ്പുകൾ വികസിപ്പിക്കാൻ ആഗ്രഹിക്കുന്ന ആൻഡ്രോയിഡ് ഉപയോക്താക്കൾക്കായി

ഗൂഗിൾ ഡീപ്‌മൈൻഡിന്റെ സിഇഒയും സഹസ്ഥാപകനുമായ ഡെമിസ് ഹസാബിസ്, ജെമിനി ടീമിനെ പ്രതിനിധീകരിച്ച് ഒരു ബ്ലോഗ് പോസ്റ്റിൽ പ്രകടിപ്പിച്ചു, “അതിന്റെ അത്യാധുനിക കഴിവുകൾ ഡെവലപ്പർമാരുടെയും എന്റർപ്രൈസ് ഉപഭോക്താക്കളുടെയും AI ഉപയോഗിച്ച് നിർമ്മിക്കുകയും സ്കെയിൽ ചെയ്യുകയും ചെയ്യുന്ന രീതിയെ ഗണ്യമായി വർദ്ധിപ്പിക്കും. ”

ഗൂഗിളിന്റെ മിഥുനത്തെക്കുറിച്ചുള്ള അതിശയകരമായ വസ്‌തുതകളെക്കുറിച്ച് കൂടുതലറിയാതെ നമുക്ക് പഠിക്കാം.

നിങ്ങളുടെ ഏറ്റവും നല്ല മനുഷ്യ സുഹൃത്താകാം!

ഗൂഗിളിന്റെ മിഥുനത്തിന്റെ മുഖമുദ്ര, കാഴ്ചയിലും സംഭാഷണത്തിലും മനുഷ്യരുടെ ഇടപെടലിന്റെ അസാധാരണമായ അനുകരണമാണ്.

GPT-4-ന് സമാനമായി, ജെമിനി ഒരു പരോക്ഷമായി ആക്‌സസ് ചെയ്യാവുന്ന AI മോഡലായി പ്രവർത്തിക്കുന്നു, ഇത് നൂതന ഉൽപ്പന്നങ്ങൾ രൂപപ്പെടുത്തുന്നതിന് Google-നും ഭാവിയിലെ ഡെവലപ്പർമാർക്കും ഒരു ചട്ടക്കൂടായി പ്രവർത്തിക്കുന്നു. അതിന്റെ ശ്രദ്ധേയമായ നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗ് (NLP) ഉപയോക്താക്കൾക്കുള്ള ഇഷ്‌ടാനുസൃത പ്രതികരണങ്ങൾ സുഗമമാക്കുന്നു, ഇത് പരമ്പരാഗത ചാറ്റ്ബോട്ടുകളിൽ നിന്ന് വേർതിരിക്കുന്നു. ഈ കഴിവ് ആരെങ്കിലും പറയുന്നത് മനസ്സിലാക്കാൻ മാത്രമല്ല, അവരുടെ സ്വരവും അവരുടെ വികാരങ്ങളും – കോപം, സന്തോഷം, അനിശ്ചിതത്വം, സന്ദർഭം, സൂക്ഷ്മമായ സൂക്ഷ്മതകൾ എന്നിവ പോലും ഡീകോഡ് ചെയ്യാനും സഹായിക്കുന്നു.

ഗണിതം, ഭൗതികശാസ്ത്രം, ചരിത്രം, നിയമം, വൈദ്യശാസ്ത്രം, ധാർമ്മികത തുടങ്ങിയ 57 വിഷയങ്ങളുടെ സംയോജനം ലോക വിജ്ഞാനവും പ്രശ്‌നവും പരീക്ഷിക്കുന്നതിനായി ഉപയോഗിക്കുന്ന MMLU (മസിവ് മൾട്ടിടാസ്‌ക് ലാംഗ്വേജ് അണ്ടർസ്റ്റിംഗ്) എന്ന വിഷയത്തിൽ മനുഷ്യ വിദഗ്ധരെ മറികടക്കുന്ന ആദ്യ മാതൃക തങ്ങളാണെന്ന് ജെമിനി അഭിമാനത്തോടെ അവകാശപ്പെടുന്നു. ഒപ്പം  പ്രശ്നം പരിഹരിക്കാനുള്ള കഴിവുകൾ”.

ബഹുമുഖ പൊരുത്തപ്പെടുത്തൽ

അൾട്രാ, പ്രോ, നാനോ എന്നീ മൂന്ന് വ്യത്യസ്ത മോഡലുകൾ ഉൾക്കൊള്ളുന്ന ജെമിനി 1.0 വ്യത്യസ്തമായ കഴിവുകൾ അവതരിപ്പിക്കുന്നു. അതിന്റെ ഏറ്റവും നൂതനമായ പതിപ്പ്- ജെമിനി അൾട്രാ, ഏറ്റവും ശക്തമായ ലാർജ് ലാംഗ്വേജ് മോഡൽ (LLM) ആയി നിലകൊള്ളുന്നു, ഇത് എന്റർപ്രൈസസിലെ വളരെ സങ്കീർണ്ണമായ ജോലികൾ കൈകാര്യം ചെയ്യുന്നതിനായി പ്രത്യേകം തയ്യാറാക്കിയതാണ്.

അതേസമയം, ജെമിനി പ്രോ മൂവരിൽ ഏറ്റവും ബഹുമുഖമായി ഉയർന്നുവരുന്നു. ഇതിനകം ബാർഡുമായി സംയോജിപ്പിച്ചിരിക്കുന്നതിനാൽ, വിപുലമായ ന്യായവാദം, ആസൂത്രണം, സമഗ്രമായ ധാരണ എന്നിവ ആവശ്യമായി വരുന്ന നിർദ്ദേശങ്ങൾ ഇത് നിറവേറ്റുന്നു. ജെമിനി API വഴി ഡെവലപ്പർമാർക്കും എന്റർപ്രൈസ് ക്ലയന്റുകൾക്കും ആക്‌സസ് ചെയ്യാവുന്ന ഈ മോഡൽ Google AI സ്റ്റുഡിയോ വഴിയോ Google Cloud Vertex AI വഴിയോ ഡിസംബർ 13 മുതൽ ലഭ്യമാകും, ഇത് അതിന്റെ വിപുലമായ സാധ്യതകളിലേക്ക് ഒരു ഗേറ്റ്‌വേ വാഗ്ദാനം ചെയ്യുന്നു.

ഇതിനു വിരുദ്ധമായി, ഉപകരണത്തിലെ പ്രവർത്തനങ്ങളുടെ കാര്യക്ഷമതയുടെ പ്രതിരൂപമായി വിശേഷിപ്പിക്കപ്പെടുന്ന ജെമിനി നാനോ, Pixel 8 Pro-യിൽ അതിന്റെ ഭവനം കണ്ടെത്തുന്നു. ഇതിന്റെ ഒപ്റ്റിമൈസ് ചെയ്ത ഡിസൈൻ വിവര സംഗ്രഹം, സ്‌മാർട്ട് മറുപടി എന്നിവ പോലുള്ള ടാസ്‌ക്കുകളിൽ മികച്ചതാണ്.

വിപുലമായ മൾട്ടിമോഡാലിറ്റി

മൾട്ടിമോഡൽ AI, ജെമിനിയുടെ വൈദഗ്ധ്യത്തിന്റെ മൂലക്കല്ല്, ഒന്നിലധികം ഇന്ദ്രിയങ്ങളുടെ സഹായത്തോടെ വൈവിധ്യമാർന്ന ഉറവിടങ്ങളിൽ നിന്ന് ഡാറ്റ ശേഖരിക്കുന്നു—ടെക്‌സ്‌റ്റ്, ഇമേജുകൾ, സംഗീതം എന്നിവയും അതിലേറെയും. ഈ ബഹുമുഖ സമീപനം ഉപയോക്താക്കൾക്കും AI-യ്ക്കും ഇടയിൽ കൂടുതൽ ജൈവികവും സമഗ്രവുമായ ഇടപെടൽ പ്രോത്സാഹിപ്പിക്കുകയും ആകർഷകവും ആഴത്തിലുള്ളതുമായ അനുഭവങ്ങൾ സൃഷ്ടിക്കുകയും ചെയ്യുന്നു.

ഉപഭോക്താക്കൾക്ക് ചോദ്യങ്ങൾ ചോദിക്കാനും രേഖാമൂലമുള്ള പ്രതികരണങ്ങൾ സ്വീകരിക്കാനും ഫോട്ടോഗ്രാഫുകളും പ്രമാണങ്ങളും അപ്‌ലോഡ് ചെയ്യാനും കഴിയും. മാനുഷിക ഇടപെടലിന് സമാനമായ ബഹുമുഖ ആശയവിനിമയം പ്രയോജനപ്പെടുത്തുന്നതിലൂടെ, ജെമിനി AI കൂടുതൽ ആഴവും സങ്കീർണ്ണതയും സന്ദർഭോചിതമായ ധാരണയും ഉള്ള ഉപഭോക്താക്കളോട് മനസ്സിലാക്കുകയും പ്രതികരിക്കുകയും ചെയ്യുന്നു.

റോബോട്ടിക്‌സിന് സമാനമായ പ്രവർത്തനങ്ങൾ, സ്പർശനപരമായ ഇടപെടൽ തുടങ്ങിയ മേഖലകളിലേക്ക് വ്യാപിക്കുന്ന വിശാലമായ ചക്രവാളങ്ങൾ ഈ പരിണാമം ലക്ഷ്യമിടുന്നു. ജെമിനി പുരോഗമിക്കുമ്പോൾ, അത് കൂടുതൽ ഇന്ദ്രിയങ്ങളെ സ്വീകരിക്കുകയും അതിന്റെ കൃത്യത, അവബോധം, പ്രവർത്തനക്ഷമത എന്നിവ വർദ്ധിപ്പിക്കുകയും ചെയ്യും.