മൊണാലിസ റാപ്പ് ആലപിച്ചാൽ?
Mail This Article
ലോകം എക്കാലവും വാഴ്ത്തിക്കൊണ്ടിരിക്കുന്ന ലിയനാർഡോ ഡാവിഞ്ചിയുടെ മഹത്തായ സൃഷ്ടിയാണ് മൊണാലിസ. നിഗൂഢതകളും രഹസ്യങ്ങളും ഒളിപ്പിച്ചുവയ്ക്കുന്ന മൊണാലിസയുടെ മുഖഭാവവും ചിരിയും ഏവരെയും എന്നും അദ്ഭുതപ്പെടുത്തിക്കൊണ്ടേയിരിക്കുന്നു. ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് അഥവാ നിർമിത ബുദ്ധിയുടെ സഹായത്തോടെ തയ്യാറാക്കിയ മൊണാലിസയാണ് സമൂഹമാധ്യമങ്ങളിൽ ഇപ്പോൾ തരംഗമായിക്കൊണ്ടിരിക്കുന്നത്. മൈക്രോസോഫ്റ്റിന്റെ ഔദ്യോഗിക എക്സ് പേജിൽ പോസ്റ്റ് ചെയ്തിരിക്കുന്ന ന്യൂജൻ റാപ് ആപലിക്കുന്ന മൊണാലിസയ്ക്ക് ഇതിനോടകം തന്നെ ഏഴു മില്യനിൽ അധികം കാഴ്ചക്കാരെ ലഭിച്ചുകഴിഞ്ഞു. മൈക്രോസോഫ്റ്റിന്റെ വാസാ-1 എന്ന എ.ഐ. ആപ്പ് ഉപയോഗിച്ചാണ് റാപ് ആപലിക്കുന്ന മൊണാലിസയെ സൃഷ്ടിച്ചിട്ടുള്ളത്.
മോണാലിസയും എഐയും
1503നും 1506നും ഇടയിലാണ് മോണലിസയുടെ ചിത്രം ഡാവിഞ്ചി പൂർത്തിയാക്കിയതെന്ന് ചരിത്രാന്വേഷകർ പറയുന്നു. യഥാർത്ഥത്തിൽ അങ്ങനെയൊരു സ്ത്രീ ജീവിച്ചിരുന്നോ അതോ ഡാവിഞ്ചിയുടെ വെറും ഭാവന മാത്രമാണോ മൊണാലിസ എന്ന കാര്യത്തിൽ ഇന്നും ഒരു ഉത്തരം ആരും കണ്ടെത്തിയിട്ടില്ല. ചിത്രത്തിനു പിന്നിലുള്ള അന്വേഷണങ്ങൾ ഇന്നും തുടർന്നുകൊണ്ടേയിരിക്കുമ്പോഴാണ് ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസിന്റെ സഹായത്തോടെ പാട്ടുപാടുന്ന മോണാലിസയെ തയ്യാറാക്കിയിരിക്കുന്നത്. മൈക്രോസോഫ്റ്റ് അവതരിപ്പിച്ച VASA-1 ആർട്ടിഫിഷ്യൽ ഇൻറലിജൻസ് (എ.ഐ.) മോഡൽ ഉപയോഗിച്ചാണ് ചിത്രത്തിന് ജീവൻ നൽകിയിരിക്കുന്നത്.
VASA-1
'തത്സമയം ജനറേറ്റു ചെയ്ത ലൈഫ് ലൈക്ക് ഓഡിയോ-ഡ്രവൺ ടോക്കിങ് ഫേസ്' നിർമിക്കുന്ന ഒരു AI മോഡൽ എന്നാണ് മൈക്രോസോഫ്റ്റ് VASA-1-നെ വിശേഷിപ്പിക്കുന്നത്. വിഷ്വൽ ഇഫെക്റ്റിവ് സ്കിൽ ആണ് 'VAS'.
എഐ ഇമേജ്-ടു-വിഡിയോ മോഡൽ
ഒരു ഫോട്ടോയും അത് സംസാരിക്കേണ്ട ഓഡിയോ ട്രാക്കും മാത്രമാണ് എഐ ഇമേജ്-ടു-വിഡിയോ മോഡൽ തയ്യാറാക്കാൻ ആവശ്യമുള്ളത്. ഒരാളുടെ ചിത്രം ഉപയോഗിച്ച് അയാളുടെ മുഖത്ത് പല ഭാവങ്ങൾ സൃഷ്ടിക്കുവാനും അതിൽ ചലനങ്ങൾ ഉണ്ടാക്കുവാനും VASA-1 ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (എഐ) മോഡലിലൂടെ സാധിക്കുന്നു. കണ്ണുകൾ ഉൾപ്പടെ മുഖത്തെ സൂക്ഷ്മ ചലനങ്ങൾ പോലും സമന്വയിപ്പിച്ചാണ് വിഡിയോകൾ സൃഷ്ടിക്കപ്പെടുന്നത്. ഓഡിയോയുമായി ചേർന്നു നിൽക്കുന്ന ചുണ്ടുകളുടെ ചലനങ്ങൾ പോലും അനിമേഷനുകളിലൂടെ എഐ ആപ്പിലൂടെ ഒരുക്കാൻ കഴിയുന്നു. ഭാവപ്രകടനങ്ങൾ കൊണ്ട് യഥർഥമാണ് എന്നു തോന്നിപ്പിക്കുന്ന വിധത്തിലുള്ള വിഡിയോകളും നിമിഷനേരം കൊണ്ട് ഈ ആപ്പുകൾ ഉപയോഗിച്ച് തയ്യാറാക്കാൻ കഴിയുന്നു. വെറും ചിത്രങ്ങൾ മാത്രം ഉപയോഗിച്ച് തയ്യാറാക്കിയ നിരവധി പ്രമുഖരുടെ വിഡിയോകൾ ഇതിനകം വൈറൽ ആയിരുന്നു.
VASA 1 ഉം മറ്റു മോഡലുകളും
എഐ കമ്പനിയായ റൺവേ, എൻവിഡിയയുടെ ഓഡിയോ 2 ഫേസ് എഐ ആപ്ലിക്കേഷൻ, ഗൂഗിളിന്റെ വ്ലോഗർ എഐ, ഇമോ എഐ എന്നിവയും സമാനമായി വിഡിയോകൾ തയ്യാറാക്കാൻ ഉപയോഗിക്കാറുണ്ട്. ദൈർഘ്യമുള്ള ഓഡിയോ ക്ലിപ്പുകളും ഉപയോഗിക്കാം എന്നതാണു മറ്റ് മോഡലുകളിൽ നിന്നും VASA 1 നെ വ്യത്യസ്തമാക്കുന്നത്. ഒപ്പം മുഖചലനങ്ങളിൽ കൃത്യമായ സൂക്ഷ്മത ഉറപ്പുവരുത്തുവാനും കഴിയുന്നുണ്ടെന്നുമാണ് മൈക്രോസോഫ്റ്റ് തങ്ങളുടെ എഐ മോഡലിനെക്കുറിച്ചു പറയുന്നത്. ഓഫ്ലൈൻ പ്രോസസിങ് മോഡിൽ, മോഡലിന് 512x512 വലുപ്പത്തിലുള്ള വിഡിയോ ഫ്രെയിമുകൾ സെക്കൻഡിൽ 45 ഫ്രെയിമുകൾ സൃഷ്ടിക്കാൻ കഴിയും. ഓൺലൈൻ സ്ട്രീമിങ് മോഡിൽ, ഇതിന് 170 മില്ലിസെക്കൻഡ് മുമ്പുള്ള ലേറ്റൻസിയിൽ സെക്കൻഡിൽ 40 ഫ്രെയിമുകൾ വരെ തയ്യാറാക്കാനും കഴിയുമെന്ന് മൈക്രോസോഫ്റ്റ് ഉറപ്പു നൽകുന്നു.
ആശങ്കകളും ആശ്വാസങ്ങളും
എഐ യുഗത്തിലൂടെയാണ് നാമിപ്പോൾ സഞ്ചരിക്കുന്നത്. ഒരിക്കലും നടക്കില്ലെന്നു കരുതിയിരുന്ന ഒട്ടേറെ കാര്യങ്ങളെ പുനഃസൃഷ്ടിക്കുവാൻ ഈ എഐ യുഗത്തിൽ കഴിയുന്നുണ്ട്. പുത്തൻ അപ്ഡേഷനുകൾ വരുമ്പോൾ പുത്തൻ കണ്ടുപിടുത്തങ്ങളും സംഭവിക്കപ്പെടുന്നു. ഒപ്പം ഒട്ടേറേ ദുരുപയോഗങ്ങളും നടന്നേക്കാമെന്ന ആശങ്കകളും. വളരെയധികം ദുരുപയോഗങ്ങൾക്കിടയാക്കുന്ന ഡീപ്ഫേക്കുകളെ സൃഷ്ടിക്കാൻ VASA-1 ഉപയോഗിക്കപ്പെട്ടേക്കാം എന്ന ആശങ്ക ഉയരുന്നുണ്ട്. ഗവേഷണ ഘട്ടങ്ങളിലൂടെ കടന്നുപോകുന്നതിനാൽ തന്നെ അത്തരം ദുരുപയോഗങ്ങളെ തടയാനുള്ള മാർഗങ്ങൾ സ്വീകരിക്കുമെന്ന് മൈക്രോസോഫ്റ്റും ആശങ്കകൾക്കുള്ള മറുപടിയായി അറിയിക്കുന്നുണ്ട്. ഗുണകരമായ ഒട്ടേറെ കാര്യങ്ങൾക്കുവേണ്ടിയാണ് തങ്ങൾ VASA 1 ലൂടെ ലക്ഷ്യമിടുന്നതെന്നും മൈക്രോസോഫ്റ്റ് പറയുന്നു.