Fri. Jan 3rd, 2025

Technology

ഐബിഎമ്മും മെറ്റാ ലോഞ്ച് ഗ്ലോബൽ എഐ അലയൻസ്, ഐഐടി ബോംബെ 50 -ലതികം സ്ഥാപനങ്ങൾക്കിടയിൽ

AI അലയൻസ് എന്ന് വിളിക്കപ്പെടുന്ന പ്ലാറ്റ് ഫോo   ഒരു തുറന്ന കമ്മ്യൂണിറ്റിയായിരിക്കുമെന്നും ഉത്തരവാദിത്തത്തോടെ ഈ സാങ്കേതികവിദ്യ വിന്യസിക്കുമെന്നും വാഗ്ദാനം ചെയ്യുന്നു.

സാങ്കേതിക കമ്പനികളും അക്കാദമിക് സ്ഥാപനങ്ങളും ഉൾപ്പെടെ മറ്റ് 50 ഓർഗനൈസേഷനുകളുമായി സഹകരിച്ച് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിനായി (എഐ) ഒരു പുതിയ പ്ലാറ്റ് ഫോo ആരംഭിക്കാൻ ഐബിഎമ്മും മെറ്റയും പങ്കാളികളായി. ഐഐടി ബോംബെ ഈ സംരംഭത്തിന്റെ ഭാഗമാണ്.

AI അലയൻസ് എന്ന് വിളിക്കപ്പെടുന്ന പ്ലാറ്റ് ഫോo ഒരു തുറന്ന കമ്മ്യൂണിറ്റിയായിരിക്കുമെന്നും ഉത്തരവാദിത്തത്തോടെ ഈ സാങ്കേതികവിദ്യ വിന്യസിക്കുമെന്നും വാഗ്ദാനം ചെയ്യുന്നു. മൈക്രോസോഫ്റ്റ് പിന്തുണയുള്ള ഓപ്പൺഎഐ പോലുള്ളവ ഇതിനകം തന്നെ മുന്നേറിയിട്ടുള്ള AI-യിൽ ശക്തമായി ചുവടുറപ്പിക്കാൻ ആഗോളതലത്തിൽ ടെക്‌നോളജി കമ്പനികൾക്കിടയിൽ വർദ്ധിച്ചുവരുന്ന താൽപ്പര്യം ഈ സംരംഭം കാണിക്കുന്നു.

ഐഐടി ബോംബെയിലെ കമ്പ്യൂട്ടർ സയൻസ് ആൻഡ് എഞ്ചിനീയറിംഗ് വിഭാഗം മേധാവി പ്രൊഫസർ വർഷ ആപ്‌തെ പറഞ്ഞു, “ഐഐടി ബോംബെയിലെ കമ്പ്യൂട്ടർ സയൻസ് ഡിപ്പാർട്ട്‌മെന്റ് എഐ അലയൻസിന്റെ ഭാഗമാകുന്നതിൽ ആവേശഭരിതരാണ്. ഘടനാപരമായി സമ്പന്നമായ വിവരങ്ങളുടെ മികച്ച പ്രാതിനിധ്യത്തിനായുള്ള അടിസ്ഥാന മാതൃകകൾ അന്വേഷിക്കുന്നതോടൊപ്പം, കൂടുതൽ വൈവിധ്യമാർന്ന ഭാഷകളിലും ഉച്ചാരണങ്ങളിലും ഭാഷകളിലും സംഭാഷണ, ഭാഷാ മാതൃകകൾ സൃഷ്ടിക്കുന്നതിനും വിന്യസിക്കുന്നതിലും സംഭാവന നൽകുമെന്ന് ഞങ്ങൾ പ്രതീക്ഷിക്കുന്നു.

ഒരു പ്രസ്താവന പ്രകാരം, AI അലയൻസ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത് ഈ രംഗത്ത് തുറന്ന നവീകരണത്തെയും തുറന്ന ശാസ്ത്രത്തെയും പിന്തുണയ്ക്കുന്നതിനാണ്. ഒരു തുറന്ന കമ്മ്യൂണിറ്റിയെ പരിപോഷിപ്പിക്കുന്നതിലും ശാസ്ത്രീയമായ കാഠിന്യം, വിശ്വാസം, സുരക്ഷ, സുരക്ഷ, വൈവിധ്യം, സാമ്പത്തിക മത്സരക്ഷമത എന്നിവ ഉറപ്പാക്കിക്കൊണ്ട് AI-യിൽ ഉത്തരവാദിത്തമുള്ള നവീകരണം ത്വരിതപ്പെടുത്തുന്നതിന് ഡവലപ്പർമാരെയും ഗവേഷകരെയും പ്രാപ്തരാക്കുന്നതിലും ഇത് ശ്രദ്ധ കേന്ദ്രീകരിക്കും.

എഎംഡി, ഡെൽ ടെക്നോളജീസ്, ഒറാക്കിൾ, ഇന്റൽ, റെഡ് ഹാറ്റ്, സർവീസ് നൗ, സോണി ഗ്രൂപ്പ്, ഹഗ്ഗിംഗ് ഫേസ്, ഇംപീരിയൽ കോളേജ് ലണ്ടൻ, കോർണൽ യൂണിവേഴ്സിറ്റി, ഹാർവാർഡ് യൂണിവേഴ്സിറ്റി, യേൽ യൂണിവേഴ്സിറ്റി എന്നിവയും AI സഖ്യത്തിലെ മറ്റ് അംഗങ്ങളിൽ ഉൾപ്പെടുന്നു.

ആഗോള തലത്തിൽ AI സിസ്റ്റങ്ങളുടെ ഉത്തരവാദിത്ത വികസനവും ഉപയോഗവും പ്രാപ്‌തമാക്കുന്നതിന് പരിഹാരങ്ങൾ പങ്കിടുന്നതിനും വികസിപ്പിക്കുന്നതിനുമുള്ള ഒരു പ്ലാറ്റ്ഫോം നൽകുമ്പോൾ സഖ്യം എല്ലാ സ്ഥാപനങ്ങളിൽ നിന്നുമുള്ള വിഭവങ്ങളും അറിവും ശേഖരിക്കും. സംഭാവനകളിലൂടെയും അവശ്യസാധ്യതയുള്ള സോഫ്റ്റ്‌വെയർ സാങ്കേതികവിദ്യ സ്വീകരിക്കുന്നതിലൂടെയും ഒരു AI ഹാർഡ്‌വെയർ ആക്സിലറേറ്റർ ഇക്കോസിസ്റ്റം വളർത്തിയെടുക്കാനും ഇത് ലക്ഷ്യമിടുന്നു.

പൊതുജനങ്ങൾക്കായി വിദ്യാഭ്യാസപരമായ ഉള്ളടക്കം വികസിപ്പിക്കുന്നതിനൊപ്പം ആഗോള AI നൈപുണ്യ-നിർമ്മാണത്തിനും പര്യവേക്ഷണ ഗവേഷണത്തിനും ഇത് പിന്തുണ നൽകും.

ഐബിഎം ചെയർമാനും സിഇഒയുമായ അരവിന്ദ് കൃഷ്ണ പറഞ്ഞു, “എഐയിൽ ഞങ്ങൾ തുടർന്നുവരുന്ന പുരോഗതി, സ്രഷ്‌ടാക്കൾ, ശാസ്ത്രജ്ഞർ, അക്കാദമിക്, ബിസിനസ്സ് നേതാക്കൾ എന്നിവരുടെ കമ്മ്യൂണിറ്റികളിലുടനീളം തുറന്ന നവീകരണത്തിന്റെയും സഹകരണത്തിന്റെയും തെളിവാണ്. AI-യുടെ ഭാവി നിർവചിക്കുന്നതിലെ സുപ്രധാന നിമിഷമാണിത്. സുരക്ഷിതത്വവും ഉത്തരവാദിത്തവും ശാസ്ത്രീയമായ കാഠിന്യവും കൊണ്ട് ഈ ഓപ്പൺ ഇക്കോസിസ്റ്റം നൂതനമായ ഒരു AI അജണ്ടയെ നയിക്കുന്നുവെന്ന് ഉറപ്പാക്കാൻ AI അലയൻസ് വഴി സമാന ചിന്താഗതിക്കാരായ സംഘടനകളുമായി സഹകരിക്കുന്നതിൽ IBM അഭിമാനിക്കുന്നു.

GOOGLE അതിന്റെ ഏറ്റവും വലിയ AI മോഡൽ ജെമിനി ലോഞ്ച് ചെയ്യുന്നു.

ഗൂഗിളിന്റെ ജെമിനി മൂന്ന് മോഡലുകളിൽ ലഭ്യമാകും, ഈ AI മോഡൽ അതിന്റെ ചാറ്റ്ബോട്ട് – ബാർഡ്, സ്മാർട്ട്ഫോൺ പിക്സൽ 8 പ്രോ എന്നിവയുമായി സംയോജിപ്പിക്കും.

ഗൂഗിൾ അതിന്റെ ഏറ്റവും വലുതും കഴിവുള്ളതുമായ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് മോഡൽ എന്ന് വിളിക്കുന്നതിനെ ബുധനാഴ്ച അവതരിപ്പിച്ചു – ഡെവലപ്പർമാർക്ക് അവരുടെ ഉൽപ്പന്നങ്ങൾ നിർമ്മിക്കാനും സെർച്ച് ഭീമന്റെ ചാറ്റ്‌ബോട്ട് ബാർഡിലും മൊബൈൽ ഉപകരണങ്ങളിലും ഇത് ഉപയോഗിക്കാൻ കഴിയും.

ഒരു ബ്ലോഗ് പോസ്റ്റിൽ, ഗൂഗിൾ സിഇഒ സുന്ദർ പിച്ചൈ പറഞ്ഞു, “ഇപ്പോൾ, ഞങ്ങളുടെ ഏറ്റവും കഴിവുള്ളതും പൊതുവായതുമായ മോഡലായ ജെമിനോടൊപ്പമുള്ള ഞങ്ങളുടെ യാത്രയുടെ അടുത്ത ചുവടുവെപ്പ്, നിരവധി മുൻനിര മാനദണ്ഡങ്ങളിലുടനീളം അത്യാധുനിക പ്രകടനത്തോടെ.”

ജെമിനി മൂന്ന് വ്യത്യസ്ത വലുപ്പങ്ങളിൽ ലഭ്യമാകും: അൾട്രാ, പ്രോ, നാനോ. മോഡലുകളുടെ ഈ പുതിയ യുഗത്തെ പ്രതിനിധീകരിക്കുന്നത് ഒരു കമ്പനിയെന്ന നിലയിൽ ഞങ്ങൾ ഏറ്റെടുത്തിട്ടുള്ള ഏറ്റവും വലിയ സയൻസ്, എഞ്ചിനീയറിംഗ് ശ്രമങ്ങളിലൊന്നാണ്, പിച്ചൈ അഭിപ്രായപ്പെട്ടു.

ഗൂഗിൾ പറയുന്നതനുസരിച്ച്, വളരെ സങ്കീർണ്ണമായ ജോലികൾക്ക് ജെമിനി അൾട്രായും വിശാലമായ ടാസ്‌ക്കുകളിലുടനീളം സ്കെയിലിംഗിനായി ജെമിനി പ്രോയും ഉപകരണത്തിലെ ടാസ്‌ക്കുകൾക്ക് ജെമിനി നാനോയും ഉപയോഗിക്കാം.

ഗൂഗിൾ റിസർച്ചിലെ ഞങ്ങളുടെ സഹപ്രവർത്തകർ ഉൾപ്പെടെ, ഗൂഗിളിലുടനീളമുള്ള ടീമുകളുടെ വലിയ തോതിലുള്ള സഹകരണ ശ്രമങ്ങളുടെ ഫലമാണ് ജെമിനി. ഇത് അടിസ്ഥാനപരമായി മൾട്ടിമോഡൽ ആയി നിർമ്മിച്ചതാണ്, അതിനർത്ഥം ടെക്‌സ്‌റ്റ്, കോഡ്, ഓഡിയോ, ഇമേജ്, വീഡിയോ എന്നിവയുൾപ്പെടെ വ്യത്യസ്‌ത തരത്തിലുള്ള വിവരങ്ങൾ സാമാന്യവൽക്കരിക്കാനും തടസ്സമില്ലാതെ മനസ്സിലാക്കാനും പ്രവർത്തിക്കാനും സംയോജിപ്പിക്കാനും ഇതിന് കഴിയും.

ഗണിതം, ഭൗതികശാസ്ത്രം, ചരിത്രം, നിയമം, വൈദ്യശാസ്ത്രം, ധാർമ്മികത തുടങ്ങിയ 57 വിഷയങ്ങളുടെ സംയോജനം ഉപയോഗിക്കുന്ന എംഎംഎൽയുവിൽ (മാസിവ് മൾട്ടിടാസ്ക് ലാംഗ്വേജ് അണ്ടർഡിംഗ്) 90.0% സ്കോറോടെ, മനുഷ്യ വിദഗ്ധരെ മറികടക്കുന്ന ആദ്യ മോഡലാണ് ജെമിനി അൾട്രാ. ലോക വിജ്ഞാനവും പ്രശ്നപരിഹാര കഴിവുകളും പരീക്ഷിക്കുന്നതിന്.

ജെമിനിയുടെ ഉപയോഗത്തെക്കുറിച്ച്, കൂടുതൽ വിപുലമായ ന്യായവാദം, ആസൂത്രണം, മനസ്സിലാക്കൽ തുടങ്ങിയവയ്ക്കായി ബാർഡ് ജെമിനി പ്രോയുടെ മികച്ച പതിപ്പ് ഉപയോഗിക്കുമെന്നും ഇംഗ്ലീഷ് ഭാഷയിൽ ലഭ്യമാകുമെന്നും ഗൂഗിൾ പറഞ്ഞു.

ജെമിനി അതിന്റെ സ്‌മാർട്ട്‌ഫോണായ പിക്‌സൽ 8 പ്രോയിലും ലഭ്യമാകും, അത് റെക്കോർഡർ ആപ്പിൽ സംഗ്രഹിക്കുക, ജിബോർഡിൽ സ്‌മാർട്ട് മറുപടിയിൽ അവതരിപ്പിക്കുക എന്നിങ്ങനെയുള്ള പുതിയ ഫീച്ചറുകളുണ്ടാകും. വരും മാസങ്ങളിൽ, സെർച്ച്, പരസ്യങ്ങൾ, ക്രോം, ഡ്യുയറ്റ് എഐ തുടങ്ങിയ ഉൽപ്പന്നങ്ങളിലും സേവനങ്ങളിലും ജെമിനി ലഭ്യമാകും.

ഡിസംബർ 13 മുതൽ, ഡവലപ്പർമാർക്കും എന്റർപ്രൈസ് ഉപഭോക്താക്കൾക്കും ഗൂഗിൾ എഐ സ്റ്റുഡിയോയിലോ ഗൂഗിൾ ക്ലൗഡ് വെർട്ടക്സ് എഐയിലോ ജെമിനി എപിഐ വഴി ജെമിനി പ്രോ ആക്‌സസ് ചെയ്യാൻ കഴിയും.

വെർട്ടക്സ് എഐ പ്ലാറ്റ്‌ഫോമിൽ ഗൂഗിൾ എഐ മോഡൽ ജെമിനി പ്രോ പുറത്തിറക്കുന്നു

ഗൂഗിൾ മെഡ്‌എൽഎം, ഹെൽത്ത് കെയർ ഇൻഡസ്‌ട്രിക്ക് മികച്ച ഫൗണ്ടേഷൻ മോഡലുകളും ഏറ്റവും പുതിയ ഡ്യുയറ്റ് എഐ ഓഫറുകളും അവതരിപ്പിച്ചു.

ഗൂഗിൾ അതിന്റെ ഏറ്റവും പുതിയ എഐ മോഡൽ ജെമിനി പ്രോ വെർട്ടെക്സ് എഐയിൽ പൊതുവായി ലഭ്യമാക്കി, വലിയ ഭാഷാ മോഡലുകൾക്കായുള്ള വിന്യാസ പ്ലാറ്റ്ഫോം.

മൾട്ടിമോഡൽ ജെമിനി മോഡൽ ടെക്‌സ്‌റ്റ്, ഇമേജുകൾ, ഓഡിയോ, വീഡിയോ, കോഡ് എന്നിവയുൾപ്പെടെ വിവിധ തരം വിവരങ്ങൾ ഒരേസമയം മനസ്സിലാക്കുമെന്ന് പറയപ്പെടുന്നു. ഇത് മൂന്ന് വലുപ്പങ്ങളിൽ വരുന്നു: അൾട്രാ, പ്രോ, നാനോ.

ഡെവലപ്പർമാർക്ക് ഇപ്പോൾ API-കൾ വഴി ജെമിനി പ്രോ ആക്‌സസ് ചെയ്യാനും 130-ലധികം മോഡലുകളുടെ ലിസ്റ്റിൽ നിന്ന് തിരഞ്ഞെടുക്കാനും കഴിയും. അവർക്ക് മോഡൽ പെരുമാറ്റം ഇഷ്ടാനുസൃതമാക്കാനും പരിശീലന പരിജ്ഞാനം വർദ്ധിപ്പിക്കാനും ട്യൂണിംഗ് ടൂളുകൾ, റൈൻഫോഴ്‌സ്‌മെന്റ് ലേണിംഗ്, എക്സ്റ്റൻഷനുകൾ എന്നിവ ഉപയോഗിച്ച് പ്രത്യേക സന്ദർഭങ്ങളിലേക്ക് ജെമിനി പ്രോയെ പൊരുത്തപ്പെടുത്താനും കഴിയും.

“ഇന്ന്, ഗൂഗിൾ ക്ലൗഡിന്റെ എൻഡ്-ടു-എൻഡ് എഐ പ്ലാറ്റ്‌ഫോമായ വെർടെക്‌സ് എഐയിൽ ജെമിനി പ്രോ ഇപ്പോൾ പൊതുവായി ലഭ്യമാണെന്ന് പ്രഖ്യാപിക്കുന്നതിൽ ഞങ്ങൾക്ക് സന്തോഷമുണ്ട്. , ഇപ്പോൾ ഡെവലപ്പർമാർക്ക് വിവരങ്ങൾ പ്രോസസ്സ് ചെയ്യാനും അതിൽ പ്രവർത്തിക്കാനും കഴിയുന്ന ‘ഏജൻറുമാരെ’ നിർമ്മിക്കാൻ കഴിയും,” ഗൂഗിൾ ഒരു ബ്ലോഗ് പോസ്റ്റിൽ പറഞ്ഞു.

“വളരെ സങ്കീർണ്ണമായ ജോലികൾക്കുള്ള ഞങ്ങളുടെ ഏറ്റവും വലുതും കഴിവുള്ളതുമായ മോഡലാണ് ജെമിനി അൾട്രാ, അതേസമയം ജെമിനി പ്രോ വൈവിധ്യമാർന്ന ടാസ്‌ക്കുകളിൽ സ്കെയിൽ ചെയ്യുന്നതിനുള്ള ഞങ്ങളുടെ മികച്ച മോഡലാണ്, കൂടാതെ ഉപകരണത്തിലെ ടാസ്‌ക്കുകൾക്കുള്ള ഞങ്ങളുടെ ഏറ്റവും കാര്യക്ഷമമായ മോഡലാണ് ജെമിനി നാനോ,”.

ഗൂഗിൾ എഐ സ്റ്റുഡിയോയിൽ ജെമിനി പ്രോ ആക്സസ് ചെയ്യാവുന്നതാക്കി.

അടുത്ത വർഷമാദ്യം ഡെവലപ്പർമാർക്കും എന്റർപ്രൈസ് ഉപഭോക്താക്കൾക്കും ഇത് ലഭ്യമാക്കുന്നതിന് മുമ്പ്, ആദ്യകാല പരീക്ഷണങ്ങൾക്കും ഫീഡ്‌ബാക്കിനുമായി തിരഞ്ഞെടുക്കപ്പെട്ട ഉപഭോക്താക്കൾ, ഡവലപ്പർമാർ, പങ്കാളികൾ, സുരക്ഷ, ഉത്തരവാദിത്ത വിദഗ്ധർ എന്നിവർക്ക് ജെമിനി അൾട്രാ ലഭ്യമാക്കും.

ജെമിനി പ്രോ ഉപയോഗിച്ച് കുറഞ്ഞ കോഡ്/കോഡ് ഇല്ലാത്ത സെർച്ചും സംഭാഷണ ഏജന്റുമാരും സൃഷ്ടിക്കാൻ വെർട്ടെക്സ് AI സഹായിക്കുന്നു.

തങ്ങളുടെ മോഡലുകൾ അനുചിതമായ ഉള്ളടക്കം പുറപ്പെടുവിക്കുന്നില്ലെന്ന് ഉറപ്പാക്കാൻ ഡവലപ്പർമാരെ സഹായിക്കുന്നതിന് സുരക്ഷാ ഫിൽട്ടറുകൾ, ഉള്ളടക്ക മോഡറേഷൻ API-കൾ, ഡാറ്റാ ഗവേണൻസ് നിയന്ത്രണങ്ങൾ എന്നിവയും Google അവതരിപ്പിച്ചിട്ടുണ്ട്.

MedLM-നൊപ്പം ഗൂഗിൾ ഡൊമെയ്ൻ-നിർദ്ദിഷ്ടതയിലേക്ക് പോകുന്നു

Med-PaLM-ഉം Med-PaLM 2-ഉം ഉപയോഗിച്ചുള്ള പുരോഗതിയെ അടിസ്ഥാനമാക്കി, ആരോഗ്യ സംരക്ഷണ വ്യവസായ ഉപയോഗ കേസുകൾക്കായി മികച്ച രീതിയിൽ ട്യൂൺ ചെയ്‌ത അടിസ്ഥാന മോഡലുകളുടെ ഒരു കുടുംബമായ MedLM-ഉം Google അനാവരണം ചെയ്‌തു.

യുഎസിലെ Google ക്ലൗഡ് ഉപഭോക്താക്കൾക്ക് Vertex AI പ്ലാറ്റ്‌ഫോമിലെ ‘അനുവദനീയമായ പൊതുവായ ലഭ്യത’ വഴി MedLM ലഭ്യമാണ്, കൂടാതെ മറ്റ് ചില വിപണികളിൽ പ്രിവ്യൂവിൽ ലഭ്യമാണ്.

“നിലവിൽ, Med-PaLM 2-ൽ നിർമ്മിച്ച രണ്ട് മോഡലുകൾ, ആരോഗ്യ സംരക്ഷണ സ്ഥാപനങ്ങൾക്കും അവരുടെ വ്യത്യസ്ത ആവശ്യങ്ങൾക്കും സൗകര്യമൊരുക്കുന്നു. അടിസ്ഥാന ജോലികൾ മുതൽ സങ്കീർണ്ണമായ വർക്ക്ഫ്ലോകൾ വരെയുള്ള വിവിധ ആപ്ലിക്കേഷനുകൾക്കായി ആരോഗ്യ സംരക്ഷണ സ്ഥാപനങ്ങൾ AI-യുടെ ഉപയോഗം പര്യവേക്ഷണം ചെയ്യുകയാണ്.” കമ്പനി പറഞ്ഞു.

“ആദ്യത്തെ MedLM മോഡൽ വലുതും സങ്കീർണ്ണമായ ജോലികൾക്കായി രൂപകൽപ്പന ചെയ്തതുമാണ്. രണ്ടാമത്തേത് ഒരു മീഡിയം മോഡലാണ്, മികച്ച രീതിയിൽ ക്രമീകരിക്കാനും ടാസ്‌ക്കുകളിലുടനീളം സ്കെയിലിംഗിന് മികച്ചതുമാണ്,” അത് കൂട്ടിച്ചേർത്തു.

സൗജന്യ സംഭാഷണങ്ങളെ അടിസ്ഥാനമാക്കി എമർജൻസി ഡിപ്പാർട്ട്‌മെന്റുകളിൽ മെഡിക്കൽ ഡോക്യുമെന്റേഷൻ ഓട്ടോമേറ്റ് ചെയ്യുന്നതിനും മയക്കുമരുന്ന് ഗവേഷണവും വികസനവും ത്വരിതപ്പെടുത്തുന്നതിനും ക്ലിനിക്കൽ ഡോക്യുമെന്റുകൾ വായിക്കൽ, എൻറോൾമെന്റ്, ക്ലെയിമുകൾ എന്നിവ പോലുള്ള സ്വമേധയാലുള്ള പ്രക്രിയകൾ സ്വയമേവയുള്ള ഉപകരണങ്ങൾ നിർമ്മിക്കുന്നതിനും Google, Accenture, HCA Healthcare, BenchSci തുടങ്ങിയ വിവിധ സ്ഥാപനങ്ങളുമായി ഇതിനകം സഹകരിച്ചിട്ടുണ്ട്. കൂടുതൽ പ്രോസസ്സിംഗ്, കൂടാതെ.

ബഹുജനങ്ങൾക്കുള്ള ഡ്യുയറ്റ്

ഡെവലപ്പർമാർക്കുള്ള ഡ്യുയറ്റ് എഐയും സുരക്ഷാ പ്രവർത്തനങ്ങളിൽ ഡ്യുയറ്റ് എഐയും ഇപ്പോൾ പൊതുവായി ലഭ്യമാണെന്നും ഗൂഗിൾ വർക്ക്‌സ്‌പെയ്‌സിൽ ഡ്യുയറ്റ് എഐയിൽ ചേരുമെന്നും സെർച്ച് കമ്പനി അറിയിച്ചു. ഗൂഗിളിന്റെ ഏറ്റവും പുതിയ മോഡലായ ജെമിനി വരും ആഴ്ചകളിൽ ഇതിൽ ഉൾപ്പെടുത്തുമെന്ന് ഗൂഗിൾ അറിയിച്ചു.

Confluent, Elastic, HashiCorp, MongoDB എന്നിവയുൾപ്പെടെ 25-ലധികം പങ്കാളികൾ, സാങ്കേതിക ബോധമുള്ള കോഡിംഗ് സഹായവും ജനപ്രിയ ഡെവലപ്പർ ഉൽപ്പന്നങ്ങൾക്കുള്ള ഡോക്യുമെന്റേഷനിലേക്കുള്ള എളുപ്പത്തിലുള്ള ആക്‌സസും ഉപയോഗിച്ച് ഡ്യുയറ്റ് AI മെച്ചപ്പെടുത്തും. കോഡ് ചെയ്യുമ്പോഴോ ട്രബിൾഷൂട്ടുചെയ്യുമ്പോഴോ ഉപയോക്താക്കൾക്ക് ഡ്യൂയറ്റ് AI-യോട് സഹായം ചോദിക്കാം.

ഡവലപ്പർമാർക്കുള്ള ഡ്യുയറ്റ് AI വിവിധ സംയോജിത വികസന പരിതസ്ഥിതികളിൽ AI- പവർ കോഡും ചാറ്റ് സഹായവും വാഗ്ദാനം ചെയ്യുന്നു, ആപ്ലിക്കേഷൻ വിന്യാസം, ട്രബിൾഷൂട്ടിംഗ് തുടങ്ങിയ ജോലികൾ കാര്യക്ഷമമാക്കുന്നു.

ക്രോണിക്കിളുമായി സംയോജിപ്പിച്ച സെക്യൂരിറ്റി ഓപ്പറേഷനുകളിലെ ഡ്യുയറ്റ് AI, തിരയൽ അന്വേഷണങ്ങൾ, ഓട്ടോമാറ്റിക് കേസ് ഡാറ്റ സംഗ്രഹങ്ങൾ, സംഭവ പരിഹാരത്തിനുള്ള ശുപാർശകൾ എന്നിവയിൽ AI സഹായം വഴി ഭീഷണി കണ്ടെത്തലും പ്രതികരണവും ത്വരിതപ്പെടുത്താൻ ലക്ഷ്യമിടുന്നു.

2023 ഡിസംബർ 13 മുതൽ 2024 ഫെബ്രുവരി 1 വരെ, ഉപഭോക്താക്കൾക്ക് ഡവലപ്പർമാർക്കായി ഒരു ചെലവും കൂടാതെ Duet AI ഉപയോഗിക്കാം. ഉപയോക്താക്കൾക്ക് അതിന്റെ പ്രൊഫഷണൽ സേവന പങ്കാളികളായ Accenture, Deloitte, Infosys, Wipro എന്നിവരുമായി പ്രവർത്തിക്കാനും കഴിയും, അവർക്ക് ഡെവലപ്പർമാർക്കുള്ള Duet AI ഉൾപ്പെടെയുള്ള ജനറേറ്റീവ് AI ഉപഭോക്താക്കളിലേക്ക് എത്തിക്കുന്നതിൽ അവരെ സഹായിക്കാനാകും.

GEMINI AI നും CHATGPT നും: ഗൂഗിൾസിന്റെ ചാലഞ്ചർ പറയുന്ന 5 വാസ്തവങ്ങൾ

2023 വർഷം ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ ഭൂപ്രകൃതിയിൽ അഭൂതപൂർവമായ മാറ്റം അടയാളപ്പെടുത്തി. AI-യുടെ ലോകത്തിലെ പ്രബലമായ ജഗ്ഗർനട്ട്, ഓപ്പൺ AI-യുടെ ChatGPT, വളർന്നുവരുന്ന ഒരു നക്ഷത്രത്താൽ  വെല്ലുവിളിക്കപ്പെട്ടതായി കണ്ടെത്തി. ഗൂഗിൾ, സെർച്ച് എഞ്ചിൻ ഭീമൻ, അതിന്റെ ഏറ്റവും പുതിയ ഭാഷാ മോഡലും ChatGPT-യുടെ എതിരാളിയുമായ ജെമിനി AI ഉപയോഗിച്ച് അതിന്റെ ചുവടുപിടിച്ചു.

സുന്ദർ പിച്ചൈ പ്രഖ്യാപിച്ചതുപോലെ, ഇത് ഗൂഗിളിൽ AI യിൽ ഒരു പുതിയ ഘട്ടത്തെ അറിയിക്കുന്നു. ഗൂഗിൾ ഉൽപ്പന്നങ്ങളുടെ മുഴുവൻ സ്പെക്ട്രത്തിലും വിപ്ലവം സൃഷ്ടിക്കുമെന്ന് വാഗ്ദാനം ചെയ്യുന്ന AI മോഡലുകളിൽ ജെമിനി ഒരു വലിയ കുതിപ്പ് അടയാളപ്പെടുത്തുന്നു. പിച്ചൈയും ഗൂഗിൾ ഡീപ്‌മൈൻഡ് സിഇഒ ഡെമിസ് ഹസാബിസും അതിന്റെ പ്രാധാന്യത്തെ പ്രശംസിച്ചു, ഈ സാങ്കേതികവിദ്യ ഗൂഗിളിന്റെ വൈവിധ്യമാർന്ന ഓഫറുകളിലുടനീളം എങ്ങനെ തടസ്സമില്ലാതെ സമന്വയിപ്പിക്കുന്നുവെന്ന് ഊന്നിപ്പറയുന്നു.

ഈ പുതിയ AI ടൈറ്റൻ എന്താണ് വാഗ്ദാനം ചെയ്യുന്നതെന്ന് ആശ്ചര്യപ്പെടുന്നുണ്ടോ? അതിന്റെ ആധിപത്യം സ്ഥാപിക്കുന്ന വിചിത്രമായ സവിശേഷതകൾ എന്തൊക്കെയാണ്? കൂടുതൽ അറിയാൻ വായിക്കുക!

ഗൂഗിളിന്റെ ജെമിനി AI

AI വികസനത്തിൽ ടെക് ഭീമന്റെ തകർപ്പൻ നേട്ടമായി വിശേഷിപ്പിക്കപ്പെടുന്ന നൂതന ജനറേറ്റീവ് AI മോഡലായ ജെമിനി ഗൂഗിൾ അവതരിപ്പിച്ചു. ഇന്നുവരെയുള്ള ഏറ്റവും വൈവിധ്യമാർന്നതും ശക്തവുമായ AI ആയി കണക്കാക്കപ്പെടുന്നു. ഗ്രാഫിക്‌സ്, ടെക്‌സ്‌റ്റ്, വോയ്‌സ്, വീഡിയോ എന്നിവയുൾപ്പെടെ വിവിധ മാധ്യമങ്ങളിൽ ജെമിനിയുടെ അഡാപ്‌റ്റബിലിറ്റി അടിവരയിടുന്നു, വരും വർഷത്തിൽ വലിയ ഭാഷാ മോഡലിന്റെ (എൽഎൽഎം) ഈ വിപുലമായ ആവർത്തനം വിപുലീകരിക്കാൻ ഗൂഗിൾ  വിഭാവനം ചെയ്യുന്നു.

AI ചാറ്റ്‌ബോട്ട് ബാർഡിന്റെ വൈസ് പ്രസിഡന്റ് സിസ്‌സി ഹ്‌സിയാവോ, ജെമിനി പ്രോ GPT-3.5 കവിയുക മാത്രമല്ല, എട്ട് വ്യവസായ മാനദണ്ഡങ്ങളിൽ ആറിലും അതിനെ മറികടന്നുവെന്ന് ഒരു പത്രത്തിൽ ഉറപ്പിച്ചു. കൂടാതെ, കൂടുതൽ നൂതനമായ പതിപ്പായ ഗൂഗിൾ ജെമിനി അൾട്രാ, ഏഴ് മെട്രിക്കുകളിൽ GPT-4 നെ മറികടന്നു.

ഒരു വീഡിയോ അവതരണത്തിൽ യഥാർത്ഥ ജീവിതത്തിലുള്ള നീല റബ്ബർ താറാവും താറാവിന്റെ വരയും തമ്മിൽ വേർതിരിച്ചറിയാനുള്ള കഴിവ് പ്രകടമാക്കിക്കൊണ്ട് ഗൂഗിൾ അതിന്റെ ലോഞ്ച് വേളയിൽ ജെമിനിയുടെ ശ്രദ്ധേയമായ ധാരണ പ്രദർശിപ്പിച്ചു.

മൂന്ന് വ്യത്യസ്ത മോഡലുകളിൽ ജെമിനി അരങ്ങേറ്റം കുറിക്കുന്നു-

  • ജെമിനി അൾട്രാ: ഏറ്റവും വലുതും കരുത്തുറ്റതും, വളരെ സങ്കീർണ്ണമായ ജോലികൾക്കായി രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതുമാണ് 
  • ജെമിനി പ്രോ: വിശാലമായ പ്രവർത്തനങ്ങൾക്കായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു
  • ജെമിനി നാനോ: ജെമിനിയിൽ പ്രവർത്തിക്കുന്ന ആപ്പുകൾ വികസിപ്പിക്കാൻ ആഗ്രഹിക്കുന്ന ആൻഡ്രോയിഡ് ഉപയോക്താക്കൾക്കായി

ഗൂഗിൾ ഡീപ്‌മൈൻഡിന്റെ സിഇഒയും സഹസ്ഥാപകനുമായ ഡെമിസ് ഹസാബിസ്, ജെമിനി ടീമിനെ പ്രതിനിധീകരിച്ച് ഒരു ബ്ലോഗ് പോസ്റ്റിൽ പ്രകടിപ്പിച്ചു, “അതിന്റെ അത്യാധുനിക കഴിവുകൾ ഡെവലപ്പർമാരുടെയും എന്റർപ്രൈസ് ഉപഭോക്താക്കളുടെയും AI ഉപയോഗിച്ച് നിർമ്മിക്കുകയും സ്കെയിൽ ചെയ്യുകയും ചെയ്യുന്ന രീതിയെ ഗണ്യമായി വർദ്ധിപ്പിക്കും. ”

ഗൂഗിളിന്റെ മിഥുനത്തെക്കുറിച്ചുള്ള അതിശയകരമായ വസ്‌തുതകളെക്കുറിച്ച് കൂടുതലറിയാതെ നമുക്ക് പഠിക്കാം.

നിങ്ങളുടെ ഏറ്റവും നല്ല മനുഷ്യ സുഹൃത്താകാം!

ഗൂഗിളിന്റെ മിഥുനത്തിന്റെ മുഖമുദ്ര, കാഴ്ചയിലും സംഭാഷണത്തിലും മനുഷ്യരുടെ ഇടപെടലിന്റെ അസാധാരണമായ അനുകരണമാണ്.

GPT-4-ന് സമാനമായി, ജെമിനി ഒരു പരോക്ഷമായി ആക്‌സസ് ചെയ്യാവുന്ന AI മോഡലായി പ്രവർത്തിക്കുന്നു, ഇത് നൂതന ഉൽപ്പന്നങ്ങൾ രൂപപ്പെടുത്തുന്നതിന് Google-നും ഭാവിയിലെ ഡെവലപ്പർമാർക്കും ഒരു ചട്ടക്കൂടായി പ്രവർത്തിക്കുന്നു. അതിന്റെ ശ്രദ്ധേയമായ നാച്ചുറൽ ലാംഗ്വേജ് പ്രോസസ്സിംഗ് (NLP) ഉപയോക്താക്കൾക്കുള്ള ഇഷ്‌ടാനുസൃത പ്രതികരണങ്ങൾ സുഗമമാക്കുന്നു, ഇത് പരമ്പരാഗത ചാറ്റ്ബോട്ടുകളിൽ നിന്ന് വേർതിരിക്കുന്നു. ഈ കഴിവ് ആരെങ്കിലും പറയുന്നത് മനസ്സിലാക്കാൻ മാത്രമല്ല, അവരുടെ സ്വരവും അവരുടെ വികാരങ്ങളും – കോപം, സന്തോഷം, അനിശ്ചിതത്വം, സന്ദർഭം, സൂക്ഷ്മമായ സൂക്ഷ്മതകൾ എന്നിവ പോലും ഡീകോഡ് ചെയ്യാനും സഹായിക്കുന്നു.

ഗണിതം, ഭൗതികശാസ്ത്രം, ചരിത്രം, നിയമം, വൈദ്യശാസ്ത്രം, ധാർമ്മികത തുടങ്ങിയ 57 വിഷയങ്ങളുടെ സംയോജനം ലോക വിജ്ഞാനവും പ്രശ്‌നവും പരീക്ഷിക്കുന്നതിനായി ഉപയോഗിക്കുന്ന MMLU (മസിവ് മൾട്ടിടാസ്‌ക് ലാംഗ്വേജ് അണ്ടർസ്റ്റിംഗ്) എന്ന വിഷയത്തിൽ മനുഷ്യ വിദഗ്ധരെ മറികടക്കുന്ന ആദ്യ മാതൃക തങ്ങളാണെന്ന് ജെമിനി അഭിമാനത്തോടെ അവകാശപ്പെടുന്നു. ഒപ്പം  പ്രശ്നം പരിഹരിക്കാനുള്ള കഴിവുകൾ”.

ബഹുമുഖ പൊരുത്തപ്പെടുത്തൽ

അൾട്രാ, പ്രോ, നാനോ എന്നീ മൂന്ന് വ്യത്യസ്ത മോഡലുകൾ ഉൾക്കൊള്ളുന്ന ജെമിനി 1.0 വ്യത്യസ്തമായ കഴിവുകൾ അവതരിപ്പിക്കുന്നു. അതിന്റെ ഏറ്റവും നൂതനമായ പതിപ്പ്- ജെമിനി അൾട്രാ, ഏറ്റവും ശക്തമായ ലാർജ് ലാംഗ്വേജ് മോഡൽ (LLM) ആയി നിലകൊള്ളുന്നു, ഇത് എന്റർപ്രൈസസിലെ വളരെ സങ്കീർണ്ണമായ ജോലികൾ കൈകാര്യം ചെയ്യുന്നതിനായി പ്രത്യേകം തയ്യാറാക്കിയതാണ്.

അതേസമയം, ജെമിനി പ്രോ മൂവരിൽ ഏറ്റവും ബഹുമുഖമായി ഉയർന്നുവരുന്നു. ഇതിനകം ബാർഡുമായി സംയോജിപ്പിച്ചിരിക്കുന്നതിനാൽ, വിപുലമായ ന്യായവാദം, ആസൂത്രണം, സമഗ്രമായ ധാരണ എന്നിവ ആവശ്യമായി വരുന്ന നിർദ്ദേശങ്ങൾ ഇത് നിറവേറ്റുന്നു. ജെമിനി API വഴി ഡെവലപ്പർമാർക്കും എന്റർപ്രൈസ് ക്ലയന്റുകൾക്കും ആക്‌സസ് ചെയ്യാവുന്ന ഈ മോഡൽ Google AI സ്റ്റുഡിയോ വഴിയോ Google Cloud Vertex AI വഴിയോ ഡിസംബർ 13 മുതൽ ലഭ്യമാകും, ഇത് അതിന്റെ വിപുലമായ സാധ്യതകളിലേക്ക് ഒരു ഗേറ്റ്‌വേ വാഗ്ദാനം ചെയ്യുന്നു.

ഇതിനു വിരുദ്ധമായി, ഉപകരണത്തിലെ പ്രവർത്തനങ്ങളുടെ കാര്യക്ഷമതയുടെ പ്രതിരൂപമായി വിശേഷിപ്പിക്കപ്പെടുന്ന ജെമിനി നാനോ, Pixel 8 Pro-യിൽ അതിന്റെ ഭവനം കണ്ടെത്തുന്നു. ഇതിന്റെ ഒപ്റ്റിമൈസ് ചെയ്ത ഡിസൈൻ വിവര സംഗ്രഹം, സ്‌മാർട്ട് മറുപടി എന്നിവ പോലുള്ള ടാസ്‌ക്കുകളിൽ മികച്ചതാണ്.

വിപുലമായ മൾട്ടിമോഡാലിറ്റി

മൾട്ടിമോഡൽ AI, ജെമിനിയുടെ വൈദഗ്ധ്യത്തിന്റെ മൂലക്കല്ല്, ഒന്നിലധികം ഇന്ദ്രിയങ്ങളുടെ സഹായത്തോടെ വൈവിധ്യമാർന്ന ഉറവിടങ്ങളിൽ നിന്ന് ഡാറ്റ ശേഖരിക്കുന്നു—ടെക്‌സ്‌റ്റ്, ഇമേജുകൾ, സംഗീതം എന്നിവയും അതിലേറെയും. ഈ ബഹുമുഖ സമീപനം ഉപയോക്താക്കൾക്കും AI-യ്ക്കും ഇടയിൽ കൂടുതൽ ജൈവികവും സമഗ്രവുമായ ഇടപെടൽ പ്രോത്സാഹിപ്പിക്കുകയും ആകർഷകവും ആഴത്തിലുള്ളതുമായ അനുഭവങ്ങൾ സൃഷ്ടിക്കുകയും ചെയ്യുന്നു.

ഉപഭോക്താക്കൾക്ക് ചോദ്യങ്ങൾ ചോദിക്കാനും രേഖാമൂലമുള്ള പ്രതികരണങ്ങൾ സ്വീകരിക്കാനും ഫോട്ടോഗ്രാഫുകളും പ്രമാണങ്ങളും അപ്‌ലോഡ് ചെയ്യാനും കഴിയും. മാനുഷിക ഇടപെടലിന് സമാനമായ ബഹുമുഖ ആശയവിനിമയം പ്രയോജനപ്പെടുത്തുന്നതിലൂടെ, ജെമിനി AI കൂടുതൽ ആഴവും സങ്കീർണ്ണതയും സന്ദർഭോചിതമായ ധാരണയും ഉള്ള ഉപഭോക്താക്കളോട് മനസ്സിലാക്കുകയും പ്രതികരിക്കുകയും ചെയ്യുന്നു.

റോബോട്ടിക്‌സിന് സമാനമായ പ്രവർത്തനങ്ങൾ, സ്പർശനപരമായ ഇടപെടൽ തുടങ്ങിയ മേഖലകളിലേക്ക് വ്യാപിക്കുന്ന വിശാലമായ ചക്രവാളങ്ങൾ ഈ പരിണാമം ലക്ഷ്യമിടുന്നു. ജെമിനി പുരോഗമിക്കുമ്പോൾ, അത് കൂടുതൽ ഇന്ദ്രിയങ്ങളെ സ്വീകരിക്കുകയും അതിന്റെ കൃത്യത, അവബോധം, പ്രവർത്തനക്ഷമത എന്നിവ വർദ്ധിപ്പിക്കുകയും ചെയ്യും.

ഗൂഗിളിന്റെ ജെമിനി: പുതിയ AI മോഡൽ ചാറ്റ്‌ജിപിടി-യെക്കാൾ മികച്ചതാണോ?

ഓപ്പൺഎഐയുടെ ചാറ്റ്ജിപിടിയുമായി മത്സരിക്കുന്നതിനായി ഗൂഗിൾ ഡീപ്‌മൈൻഡ് അതിന്റെ പുതിയ എഐ മോഡലായ ജെമിനി അടുത്തിടെ പ്രഖ്യാപിച്ചു. രണ്ട് മോഡലുകളും പുതിയ ഡാറ്റ (ചിത്രങ്ങൾ, വാക്കുകൾ അല്ലെങ്കിൽ മറ്റ് മീഡിയ) സൃഷ്ടിക്കുന്നതിനുള്ള ഇൻപുട്ട് പരിശീലന വിവരങ്ങളുടെ പാറ്റേണുകൾ കണ്ടെത്താൻ പഠിക്കുന്ന “ജനറേറ്റീവ് AI” യുടെ ഉദാഹരണങ്ങളാണെങ്കിലും, ചാറ്റ്‌ജിപിടി ഒരു വലിയ ഭാഷാ മോഡലാണ് (LLM)ലാർജ് മല്ട്ടിമോഡൽ മോഡല്‍ – ഉൽപ്പാദിപ്പിക്കുന്നതിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന വലിയ ഭാഷാ മോഡലുകൾ, വാചകം.

GPT എന്നറിയപ്പെടുന്ന ന്യൂറൽ നെറ്റ്‌വർക്കിനെ അടിസ്ഥാനമാക്കിയുള്ള സംഭാഷണങ്ങൾക്കായുള്ള ഒരു വെബ് ആപ്പ് ചാറ്റ്‌ജിപിടി പോലെ തന്നെ (വലിയ അളവിലുള്ള ടെക്‌സ്‌റ്റിൽ പരിശീലിപ്പിക്കപ്പെടുന്നു), Google-ന് Bard എന്ന ഒരു സംഭാഷണ വെബ് ആപ്പ് ഉണ്ട്, അത് LaMDA (പരിശീലനം ലഭിച്ചതാണ്) ഡയലോഗ്). എന്നാൽ ജെമിനിയെ അടിസ്ഥാനമാക്കി ഗൂഗിൾ ഇപ്പോൾ അത് അപ്ഗ്രേഡ് ചെയ്യുന്നു.

LaMDA (ലാംഡ)പോലുള്ള മുൻകാല ജനറേറ്റീവ് AI മോഡലുകളിൽ നിന്ന് ജെമിനിയെ വ്യത്യസ്തമാക്കുന്നത് അതൊരു “മൾട്ടി മോഡൽ രൂപസംബന്ധം” ആണ് എന്നതാണ്. ഇൻപുട്ടിന്റെയും ഔട്ട്പുട്ടിന്റെയും ഒന്നിലധികം മോഡുകൾ ഉപയോഗിച്ച് ഇത് നേരിട്ട് പ്രവർത്തിക്കുന്നു എന്നാണ് ഇതിനർത്ഥം: ടെക്സ്റ്റ് ഇൻപുട്ടും ഔട്ട്പുട്ടും പിന്തുണയ്ക്കുന്നു, ഇത് ഇമേജുകൾ, ഓഡിയോ, വീഡിയോ എന്നിവയെ പിന്തുണയ്ക്കുന്നു. അതനുസരിച്ച്, ഒരു പുതിയ ചുരുക്കെഴുത്ത് ഉയർന്നുവരുന്നു: LMM (വലിയ മൾട്ടിമോഡൽരൂപസംബന്ധം), LLM-മായി തെറ്റിദ്ധരിക്കരുത്.

സെപ്റ്റംബറിൽ, ഓപ്പൺഎഐ GPT-4Vision എന്ന ഒരു മോഡൽ പ്രഖ്യാപിച്ചു, അത് ഇമേജുകൾ, ഓഡിയോ, ടെക്സ്റ്റ് എന്നിവയിലും പ്രവർത്തിക്കാൻ കഴിയും. എന്നിരുന്നാലും, ജെമിനി വാഗ്ദാനം ചെയ്യുന്ന രീതിയിൽ ഇത് പൂർണ്ണമായും മൾട്ടിമോഡൽ രൂപസംബന്ധമല്ല.

ഉദാഹരണത്തിന്, GPT-4V ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്ന ചാറ്റ്‌ജിപിടി-4, ഓഡിയോ ഇൻപുട്ടുകൾക്കൊപ്പം പ്രവർത്തിക്കാനും സംഭാഷണ ഔട്ട്പുട്ടുകൾ സൃഷ്ടിക്കാനും കഴിയുമെങ്കിലും, Whisper എന്ന മറ്റൊരു ആഴത്തിലുള്ള പഠന മോഡൽ ഉപയോഗിച്ച് ഇൻപുട്ടിലെ ടെക്‌സ്‌റ്റിലേക്ക് സംഭാഷണം പരിവർത്തനം ചെയ്‌തുകൊണ്ടാണ് ഇത് ചെയ്യുന്നതെന്ന് OpenAI സ്ഥിരീകരിച്ചു. ചാറ്റ്‌ജിപിടി-4 വ്യത്യസ്‌ത മോഡൽ ഉപയോഗിച്ച് ഔട്ട്‌പുട്ടിൽ ടെക്‌സ്‌റ്റിനെ സംഭാഷണത്തിലേക്ക് പരിവർത്തനം ചെയ്യുന്നു, അതായത് GPT-4V തന്നെ പൂർണ്ണമായും ടെക്‌സ്‌റ്റ് ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു.

അതുപോലെ, ചാറ്റ്‌ജിപിടി-4 ന് ഇമേജുകൾ നിർമ്മിക്കാൻ കഴിയും, പക്ഷേ ഇത് Dall-E 2 എന്ന പ്രത്യേക ആഴത്തിലുള്ള പഠന മോഡലിലേക്ക് കൈമാറുന്ന ടെക്സ്റ്റ് പ്രോംപ്റ്റുകൾ ജനറേറ്റ് ചെയ്തുകൊണ്ടാണ് ഇത് ചെയ്യുന്നത്, ഇത് ടെക്സ്റ്റ് വിവരണങ്ങളെ ചിത്രങ്ങളാക്കി മാറ്റുന്നു.

നേരെമറിച്ച്, ഗൂഗിൾ ജെമിനി രൂപകൽപ്പന ചെയ്തത് “നേറ്റീവ് മൾട്ടിമോഡൽ” ആയിട്ടാണ്. ഇതിനർത്ഥം, കോർ മോഡൽ നേരിട്ട് ഇൻപുട്ട് തരങ്ങളുടെ (ഓഡിയോ, ഇമേജുകൾ, വീഡിയോ, ടെക്സ്റ്റ്) ഒരു പരിധി കൈകാര്യം ചെയ്യുന്നു, അവയും നേരിട്ട് ഔട്ട്പുട്ട് ചെയ്യാൻ കഴിയും.