Halucinovanie je problémom jazykových modelov

Ivan Srba je výskumník Kempelenovho inštitútu inteligentných technológií (KInIT) v Bratislave a v rozhovore hovorí o prínosoch, ale aj rizikách nového modelu umelej inteligencie ChatGPT-3. Ten rozvíril verejný záujem o umelú inteligenciu disruptívnou zmenou v komunikácii s bežnými používateľmi aj profesionálmi v oblasti.

Keď som vám poslal témy, o ktorých sa budeme rozprávať, otázky ste zadali do ChatGPT. Čo ste zistili z jeho odpovedí?

Ako prvé sa ukázalo, že napriek tomu, že boli formulované v slovenčine, model dokázal veľmi precízne vypracovať odpovede v slovenskom jazyku. Druhá prekvapivá vec bola, že odpovede sú nielenže syntakticky správne, ale aj ich pravdivosť je veľmi dobrá. Takže do nejakej miery môžem povedať, že rozhovor medzi nami sa už vlastne uskutočnil, len som na tie otázky neodpovedal ja, ale ChatGPT.

Hovoríte, že mnohé z odpovedí sú veľmi kvalitné. Videli ste tam aj nejaké body, ktoré sú pre vás problematické alebo nesúhlasné?

Musíme si uvedomiť, že otázky, ktoré ste poslali, sa veľmi úzko týkali priamo jeho. Takýchto otázok dostal pomerne veľa nielen odo mňa, ale už predtým od iných novinárov, od iných používateľov, ktorí sa s týmto modelom hrajú, a tak na tieto otázky už mal natrénované dobré odpovede. Keby sme sa ho začali pýtať na iné témy, ktoré možno nie sú tak dobre pokryté, pravdepodobne by sme narazili na odpovede, ktoré nie sú také kvalitné.

Hovoríte, že je natrénovaný na historických dátach. Ako to funguje?

ChatGPT vznikol tak, že mu dali k dispozícii obsah, ktorý sa nachádza na internete. Išlo o novinové články, diskusie, blogy, príspevky zo sociálnych sietí a on sa pozorovaním tohto obsahu snažil porozumieť sémantike, ktorá sa v nich nachádza. Takto bol model natrénovaný a následne ho potrebovali ešte ďalej dotrénovať tým, že mu ukázali diskusie medzi skutočnými ľuďmi. Takýto model by teoreticky dokázal obsiahnuť kolektívnu múdrosť, ktorá sa nachádza na internete, ale nanešťastie aj kolektívnu hlúposť, ak to tak môžem nazvať.

Čo si pod tou hlúposťou môžeme predstaviť?

Keď predchodcovia tohto modelu dostali otázku, generovali obsah, ktorý bol škodlivý, zavádzajúci alebo falošný. Špeciálne v prípade tohto modelu si dali autori zo spoločnosti OpenAI záležať, aby minimalizovali odpovede, ktoré sú nejakým spôsobom toxické. Práve preto si najali pomerne veľké množstvo ľudských anotátorov, ktorí tam dávali otázky, a keď model odpovedal škodlivým spôsobom, označovali to, aby takýmto odpovediam v budúcnosti zabránili.

Takže ChatGPT je pokračovaním prechádzajúceho vývoja. Ale hovorí sa o prelome. Prečo?

Do určitej miery preto, že generovaný text je oveľa prirodzenejší, než bol v predchádzajúcich modeloch. Pôsobí veľmi prirodzene, oveľa viac sa podobá rozhovoru. Model má prekvapivo dobré výsledky aj v jazykoch, ktoré nie sú najväčšie na svete, ako napríklad slovenčina. Človek vidí, že niekedy odpoveď nie je stopercentne prirodzená, ale veľmi sa tomu približuje.

Ako sa takýto systém učí?

Zozbierať obsah z internetu nie je až také náročné, preto nebol problém trénovať ho na týchto dátach. Ale veľmi náročné je zabrániť generovaniu škodlivého obsahu. Práve na to bolo potrebné použiť ľudských anotátorov. Prefiltrovať obsah z internetu sa nedá, no dá sa filtrovať výstup, ktorý poskytuje. To znamená, že na určitý dopyt nemá reagovať.

Môžete v jednoduchosti vysvetliť, ako ho natrénovať na dátach?

Princíp trénovania modelu spočíva v tom, že mu ukážete pôvodný obsah a, zjednodušene povedané, mu skúsite zakryť nejaké slová v tom texte. On má za úlohu predikovať, ako tá veta bude pokračovať ďalej alebo ktoré slovo by sa vo vete malo nachádzať. Takto sa učí sémantiku vety a reprezentáciu daného jazyka. Snaží sa modelovať, ako ľudia používajú jazyk, preto sa to volá generatívny jazykový model. Z reprezentácie potom dokáže generovať nový text, dokáže porozumieť, aký je tam dopyt, a na základe toho potom dokáže vygenerovať odpoveď.

Ale asi nedokáže porozumieť aj obsahu textu?

Predplaťte si TREND za najvýhodnejšiu cenu už od 1 € / týždeň

Plný prístup k prémiovým článkom a archívu
Prémiový prístup na weby Mediálne, TRENDreality a ENJOY
Menej reklamy na TREND.sk

Objednať predplatné

Máte už predplatné? Prihláste sa

Práve čítate: Halucinovanie odpovedí je veľkým problémom jazykových modelov

Halucinovanie odpovedí je veľkým problémom jazykových modelov

Predplaťte si TREND za najvýhodnejšiu cenu už od 1 € / týždeň

Kyberútok na kataster má dopad aj na služby pre Košičanov

Washington čaká zrážka dvoch svetov, nemusí to byť nevyhnutne zlé

Počet lekární v Nemecku klesol na najnižšiu úroveň takmer za päťdesiat rokov

Čínska centrálna banka zastavila nákupy vládnych dlhopisov

Predplaťte si TREND za najvýhodnejšiu cenu už od 1 € / týždeň

Video

Kyberútok na kataster má dopad aj na služby pre Košičanov

Washington čaká zrážka dvoch svetov, nemusí to byť nevyhnutne zlé

Počet lekární v Nemecku klesol na najnižšiu úroveň takmer za päťdesiat rokov

Čínska centrálna banka zastavila nákupy vládnych dlhopisov