
જટિલ વાતાવરણમાં, માનવીઓ AI કરતાં વાણીનો અર્થ વધુ સારી રીતે સમજી શકે છે, કારણ કે આપણે ફક્ત આપણા કાન જ નહીં, પણ આપણી આંખોનો પણ ઉપયોગ કરીએ છીએ.
ઉદાહરણ તરીકે, આપણે કોઈનું મોં હલતું જોઈએ છીએ અને સહજતાથી જાણી શકીએ છીએ કે આપણે જે અવાજ સાંભળીએ છીએ તે તે વ્યક્તિનો જ હોવો જોઈએ.
મેટા AI એક નવી AI સંવાદ પ્રણાલી પર કામ કરી રહ્યું છે, જે AI ને વાતચીતમાં જે જુએ છે અને સાંભળે છે તે વચ્ચેના સૂક્ષ્મ સહસંબંધોને ઓળખવાનું શીખવશે.
વિઝ્યુઅલવોઇસ એ જ રીતે શીખે છે જે રીતે માણસો નવી કુશળતામાં નિપુણતા મેળવતા શીખે છે, લેબલ વગરના વિઝ્યુઅલ અને શ્રાવ્ય સંકેતો શીખીને શ્રાવ્ય-વિઝ્યુઅલ વાણી અલગતાને સક્ષમ બનાવે છે.
મશીનો માટે, આ સારી દ્રષ્ટિ બનાવે છે, જ્યારે માનવ દ્રષ્ટિ સુધરે છે.
કલ્પના કરો કે તમે વિશ્વભરના સાથીદારો સાથે મેટાવર્સમાં ગ્રુપ મીટિંગ્સમાં ભાગ લઈ શકો છો, નાની ગ્રુપ મીટિંગમાં જોડાઈ શકો છો કારણ કે તેઓ વર્ચ્યુઅલ સ્પેસમાંથી પસાર થાય છે, જે દરમિયાન દ્રશ્યમાં ધ્વનિના રિવર્બ્સ અને ટિમ્બર્સ પર્યાવરણ અનુસાર ગોઠવાય છે.
એટલે કે, તે એક જ સમયે ઑડિઓ, વિડિઓ અને ટેક્સ્ટ માહિતી મેળવી શકે છે, અને તેમાં વધુ સમૃદ્ધ પર્યાવરણીય સમજણ મોડેલ છે, જે વપરાશકર્તાઓને "ખૂબ જ વાહ" અવાજનો અનુભવ કરાવવાની મંજૂરી આપે છે.
પોસ્ટ સમય: જુલાઈ-20-2022