Umelá inteligencia sa učí nakresliť tvár podľa hlasu
Umelé neurónové siete sú čoraz úspešnejšie v rozpoznávaní vzorcov a vzťahov v dátových množinách. Výskumný ústav Computer Science and Artificial Intelligence Laboratory z MIT uviedol vedeckú prácu, podľa ktorej môže umelá inteligencia systému Speech2Face na základe hlasového záznamu vydedukovať, ako daná osoba vyzerá.
Vyžaduje si to tréning na množstve obrázkov ľudí, ktorí rozprávajú a neurálna sieť pritom sleduje 4 096 oblastí ich tvárí. Ďalšia sieť sa potom učí na základe zvukových nahrávok tieto oblasti tváre vizuálne zachytiť. Ako to už pri umelej inteligencii býva, po dostatočne dlhom tréningu je sieť schopná vizualizovať aj tváre ľudí, ktorých fotografie predtým nevidela.
Na obrázku dobre vidno, ako to funguje. Vľavo sú pôvodné tváre osobností, v strede je vizualizácia tvorená rekonštrukciou podľa rozpoznávaných oblastí tváre a napokon vpravo je výsledná podoba, ktorú umelá neurónová sieť vytvorila na základe zvukového záznamu hlasu. Autori pripúšťajú, že má technológia ešte svoje medzery, no už teraz je systém schopný rozpoznať aj niektoré sociálne faktory, ktoré sa podpisujú na hlase osoby.