ലെൻസില്ലാതെ ഫോട്ടോയെടുക്കുന്ന ക്യാമറ, ഓഡിയോ ക്ലിപ്പിൽനിന്നും തെരുവിന്റെ ചിത്രം; നിര്മിത ബുദ്ധി വീണ്ടും ഞെട്ടിക്കുന്നു
Mail This Article
ലോകത്തെ അമ്പരപ്പിച്ച് മുന്നേറിക്കൊണ്ടിരിക്കുകയാണ് നിര്മിതബുദ്ധി. ചാറ്റ്ബോട്ടുകളായി മാത്രമല്ല, വിവരണം നല്കുന്നതിന് അനുസരിച്ച് ചിത്രങ്ങളും വിഡിയോകളും നിര്മിക്കുന്ന നിര്മിത ബുദ്ധിയുമുണ്ട്. ഓഡിയോ ക്ലിപ്പുകളില് നിന്നും ഒരു തെരുവിന്റെ വ്യക്തമായ ചിത്രം നിര്മിച്ചാണ് നിര്മിത ബുദ്ധി വീണ്ടും ഞെട്ടിക്കുന്നത്. ഒസ്റ്റിനിലെ ടെക്സസ് സര്വകലാശാലയിലെ ഗവേഷക സംഘമാണ് കണ്ടെത്തലിനു പിന്നില്.
ഒരു തെരുവിലെ ശബ്ദം കേട്ട് അത് ഏതു തെരുവെന്ന് തിരിച്ചറിയുക എളുപ്പമല്ല. അങ്ങനെയൊരു മികവാണ് നിര്മിത ബുദ്ധി മാറ്റുരച്ചു തെളിയിച്ചിരിക്കുന്നത്. കംപ്യൂടേഴ്സ്, എന്വിയോണ്മെന്റ് ആന്റ് അര്ബന് സിസ്റ്റം എന്ന ജേണലിലാണ് പഠനം പൂര്ണമായി പ്രസിദ്ധീകരിച്ചിരിക്കുന്നത്.വടക്കേ അമേരിക്ക, ഏഷ്യ, യൂറോപ്പ് എന്നിവിടങ്ങളിലെ നൂറിലേറെ യുട്യൂബ് വിഡിയോകളും ഓഡിയോ ക്ലിപ്പുകളും സാംപിളായെടുത്താണ് സംഘം പഠനം നടത്തിയത്.
ഈ ക്ലിപ്പുകള് ഉപയോഗിച്ചാണ് ശബ്ദത്തില് നിന്നും ഹൈറസല്യൂഷന് ചിത്രങ്ങള് നിര്മിക്കാനായി എഐ മോഡലിനെ പരിശീലിപ്പിച്ചെടുത്തത്. പത്തു സെക്കന്ഡ് മാത്രം ദൈര്ഘ്യമുള്ള ഓഡിയോ ക്ലിപ്പുകള് കേട്ട ശേഷം പ്രദേശങ്ങളുടെ ചിത്രങ്ങള് നിര്മിക്കാനാണ് എഐക്ക് നിര്ദേശം നല്കിയത്.
യഥാര്ഥ സ്ഥലത്തോട് വളരെയധികം സാമ്യമുള്ള ചിത്രങ്ങളാണ് ശബ്ദ സന്ദേശത്തെ അടിസ്ഥാനപ്പെടുത്തി നിര്മിത ബുദ്ധി ഒരുക്കിയതെന്നതും ശ്രദ്ധേയമാണ്. നഗരങ്ങളിലേയും ഗ്രാമങ്ങളിലേയും തെരുവുകളുടെ ചിത്രങ്ങള് വെവ്വേറെ നിര്മിക്കാനും നിര്മിത ബുദ്ധിക്കായി. പച്ചപ്പു കൂടുതലും കുറവുമുള്ളതും കുറഞ്ഞതും ആകാശം കൂടുതലായി പശ്ചാത്തലമാക്കിയ നഗരങ്ങളിലേയും ഗ്രാമങ്ങളിലേയുമെല്ലാം തെരുവുകളുടെ ചിത്രങ്ങള് നിര്മിത ബുദ്ധി കൃത്യതയോടെ നിര്മിച്ചു നല്കി.
'ശബ്ദത്തില് നിന്നും ദൃശ്യമാക്കാന് വേണ്ട സൂചനകള് കണ്ടെത്താന് നിര്മിത ബുദ്ധിക്ക് സാധിക്കുന്നുവെന്നാണ് ഞങ്ങള്ക്ക് മനസിലായത്. തികച്ചു വ്യത്യസ്തമായ പ്രദേശങ്ങളെ കൃത്യതയോടെ ശബ്ദം അടിസ്ഥാനമാക്കി നിര്മിക്കാന് എഐക്ക് സാധിച്ചു. നിര്മിത ബുദ്ധിക്ക് ശബ്ദത്തെ ദൃശ്യങ്ങളാക്കി മാറ്റാനാവുമെന്നാണ് ഇതോടെ തെളിഞ്ഞിരിക്കുന്നത്.' പഠനത്തിനു നേതൃത്വം വഹിച്ച ഭൂമിശാസ്ത്ര വിഭാഗം അസിസ്റ്റന്റ് പ്രൊഫസറായ യുഹോ കാങ് പറയുന്നു.
ശബ്ദത്തെ ദൃശ്യവുമായി താരതമ്യപ്പെടുത്തി തിരിച്ചറിയാനുള്ള മനുഷ്യന്റെ കഴിവും പഠനം പരിശോധിച്ചു. മൂന്നു ചിത്രങ്ങളിലൊന്ന് ശബ്ദ സന്ദേശത്തോട് യോജിക്കുന്നത് നല്കിക്കൊണ്ട് ഉചിതമായത് തെരഞ്ഞെടുക്കാന് നിര്ദേശിച്ചപ്പോള് 80 ശതമാനം കൃത്യതയോടെ ചെയ്യാനായി. മനുഷ്യരുടെ ഏതാണ്ട് അതേ കൃത്യതയോടെയാണ് നിര്മിത ബുദ്ധിയും പ്രവര്ത്തിച്ചതെന്നും പഠനത്തില് തെളിഞ്ഞു.
നിര്മിത ബുദ്ധിയുടെ സഹായത്തില് ലെന്സില്ലാതെ ഫോട്ടോയെടുക്കുന്ന ക്യാമറയുടേതു പോലെ അമ്പരപ്പിക്കുന്ന നേട്ടമാണ് ശബ്ദം ദൃശ്യമാക്കുന്നതു വഴി ഈ ഗവേഷകര് കൈവരിച്ചിരിക്കുന്നത്. ലൊക്കേഷന് വിവരങ്ങള് നല്കിയ ശേഷം ക്യാമറ എങ്ങോട്ടു തിരിക്കുന്നോ അവിടുത്തെ ചിത്രങ്ങള് പകര്ത്താന് സാധിക്കുന്ന എഐ ക്യാമറയാണ് നെതര്ലന്ഡുകാരനായ ബ്യോണ് കര്മാന് കണ്ടെത്തിയത്. ലൊക്കേഷന് വിവരങ്ങളെ അടിസ്ഥാനമാക്കി ചിത്രങ്ങള് നല്കുന്ന ക്യാമറക്ക് പാരഗ്രാഫിക്ക എന്നാണ് പേരിട്ടിരുന്നത്.