Americká spoločnosť OpenAI, ktorá stojí za jazykovým modelom ChatGPT, oficiálne spustila produktovú sériu doteraz známu pod interným označením Strawberry. Firma to oznámila vo štvrtok. O projekte, ktorý bol spočiatku neverejný, už skôr informovala agentúra Reuters. Cieľom autorov je, aby uvažovanie a argumentácia systémov umelej inteligencie prekonali doterajšie limity a priblížili sa ľudským schopnostiam.
Nová produktová séria
Kým Strawbery bolo doterajšie interné označenie, oficiálne bude OpenAI nové modely ponúkať pod názvami o1 a o1-mini. Model o1 je od štvrtka k dispozícii v aplikácii ChatGPT aj jej rozhrania pre programátorov. Výskumný pracovník OpenAI Noam Brown na sieti X potvrdil, že nová produktová séria je totožná s projektom Strawberry. „Jednoducho sme vybrali náhodné slovo. Ak vieme, bola to úplná náhoda,“ dodal.
Spoločnosť OpenAI uvádza, že nový model o1 dosiahol v kvalifikačnej skúške pre medzinárodnú matematickú olympiádu úspešnosť 83 percent, zatiaľ čo úspešnosť doterajšieho najpokročilejšieho modelu GPT-4o predstavovala len 13 percent. Model sa tiež podľa OpenAI výrazne zlepšil v súťažných otázkach z programovania a v riešení prírodovedných problémov prekonal úspešnosť doktorandov.
Podľa Noama Browna sa modelom podarilo zlepšiť skóre v testoch vďaka technike známej ako „reťazec myšlienok“ (chain of thought), ktorá spočíva v rozdelení zložitých problémov na menšie logické kroky.
Bude schopná hĺbkového výskumu
Reuters sa v máji dostal k nedatovanému internému dokumentu, podľa ktorého na projekte Strawberry v OpenAI pracovalo niekoľko tímov. Cieľom malo byť umožniť umelej inteligencii nielen generovať odpovede na otázky, ale plánovať dostatočne dopredu, aby sa mohla nezávisle a spoľahlivo pohybovať po internete a vykonávať niečo, čo OpenAI označuje za „hĺbkový výskum“.
Takzvané veľké jazykové modely (LLM) vedia zhrnúť hutné a náročné texty a zostaviť elegantné jazykové útvary oveľa rýchlejšie ako človek. Doteraz ale zaostávali v riešení jednoduchých logických problémov, ktoré ľudia riešia intuitívne, napríklad rozpoznávanie logických chýb alebo hranie piškvoriek.
V tomto prípade sa modely často uchyľujú k takzvaným halucináciám. Halucinácie sú označenie vygenerovanej odpovede, ktorá obsahuje nepravdivé alebo zavádzajúce informácie. Môže ísť aj o výsledok nedostatočných, neaktuálnych alebo skreslených tréningových dát.
Strawberry má byť podľa zdroja agentúry Reuters kľúčovou súčasťou plánu OpenAI problémy prekonať. Dokument, ku ktorému sa agentúra v máji dostala, potom síce opisuje, čo má projekt dosiahnuť, ale nie ako.
Súčasťou novej technológie by mali byť podľa skorších interných informácií aj takzvané „posttréningy“ generatívnych modelov AI. To znamená ich prispôsobenie, aby sa mohli dodatočne zdokonaliť k výkonu špecifických úloh už po základnom tréningu na množstve všeobecných dát.