Apple, Microsoft, Meta a Google nedávno predstavili nové AI modely s menším počtom parametrov, ktoré sú lacnejšie na vývoj a trénovanie, no stále ponúkajú silné schopnosti. Týmto krokom sa technologické spoločnosti snažia podporiť osvojenie si AI medzi firmami, ktoré majú obavy z nákladov a výpočtového výkonu potrebného na prevádzku veľkých jazykových modelov, ako je napríklad ChatGPT od OpenAI.
Menšie jazykové modely s niekoľkými miliardami parametrov sú prezentované ako lacnejšie, energeticky efektívnejšie a prispôsobiteľnejšie alternatívy, ktoré vyžadujú menej energie na trénovanie a prevádzku, a zároveň lepšie chránia citlivé dáta.
Google, Meta, Microsoft a francúzsky startup Mistral vydali malé jazykové modely, ktoré vykazujú pokročilé schopnosti a môžu byť lepšie zamerané na konkrétne aplikácie. Nick Clegg zo spoločnosti Meta uviedol, že nový 8-miliardový model Llama 3 je porovnateľný s GPT-4, zatiaľ čo Microsoft tvrdí, že jeho model Phi-3-mini so 7 miliardami parametrov prekonal GPT-3.5.
Spoločnosť Meta vstupuje do neľútostného súboja s ChatGPT modelom Llama 3
Menšie modely môžu spracovávať úlohy lokálne na zariadení, namiesto odosielania informácií do cloudu, čo by mohlo osloviť zákazníkov, ktorí dbajú na súkromie a chcú zabezpečiť, aby informácie zostali v rámci interných sietí. Nehovoriac o zníženej potrebe využívania serverov.
Aj keď sa OpenAI naďalej zameriava na vývoj väčších AI modelov, jej šéf Sam Altman priznal, že menšie modely majú svoje miesto na trhu a môžu byť vhodné pre určité úlohy.