Google je upravo objavio svoj najmoćniji AI model dosad, ali što on može?
Gemini je novi i moćni Googleov model umjetne inteligencije koji može razumjeti ne samo tekst već i slike, videozapise i zvuk. Kao multimodalni model, Gemini je opisan kao sposoban za dovršavanje složenih zadataka u matematici, fizici i drugim područjima, kao i za razumijevanje i generiranje visokokvalitetnog koda u različitim programskim jezicima.
Trenutačno je dostupan kroz integracije s Google Bardom i Google Pixel 8 i postupno će se uključiti u druge Googleove usluge.
“Gemini je rezultat velikih zajedničkih napora timova diljem Googlea, uključujući naše kolege iz Google Researcha”, prema Dennisu Hassabisu, izvršnom direktoru i suosnivaču Google DeepMinda. “Izgrađen je od temelja da bude multimodalan, što znači da može generalizirati i neprimjetno razumjeti, djelovati preko i kombinirati različite vrste informacija uključujući tekst, kod, audio, sliku i video.”
Gemini su kreirali Google i Alphabet, Googleova matična tvrtka, i izdali su ga kao najnapredniji AI model tvrtke do sada. Google DeepMind također je dao značajan doprinos razvoju Geminija.
Google opisuje Gemini kao fleksibilan model koji može raditi na svemu, od Googleovih podatkovnih centara do mobilnih uređaja. Kako bi se postigla ova skalabilnost, Gemini se izdaje u tri veličine: Gemini Nano, Gemini Pro i Gemini Ultra.
Gemini Nano: Veličina modela Gemini Nano dizajnirana je za rad na pametnim telefonima, posebno Google Pixel 8. Napravljen je za obavljanje zadataka na uređaju koji zahtijevaju učinkovitu AI obradu bez povezivanja s vanjskim poslužiteljima, kao što je predlaganje odgovora unutar aplikacija za chat ili sažimanje teksta .
Gemini Pro: Radeći na Googleovim podatkovnim centrima, Gemini Pro dizajniran je za pokretanje najnovije verzije tvrtke AI chatbota, Bard. Sposoban je pružiti brzo vrijeme odgovora i razumjeti složene upite.
Gemini Ultra: Iako je još uvijek nedostupan za široku upotrebu, Google opisuje Gemini Ultra kao svoj najsposobniji model, nadmašujući “trenutačne najsuvremenije rezultate na 30 od 32 naširoko korištena akademska mjerila koja se koriste u istraživanju velikog jezičnog modela (LLM) i razvoj.” Dizajniran je za vrlo složene zadatke i planira se objaviti nakon završetka trenutne faze testiranja.
Gemini je sada dostupan na Googleovim proizvodima u svojim veličinama Nano i Pro, kao što su telefon Pixel 8 i chatbot Bard. Google planira s vremenom integrirati Gemini u svoje usluge Search, Ads, Chrome i druge.
Čini se da je Googleov novi model Gemini jedan od najvećih, najnaprednijih modela umjetne inteligencije do danas, iako će izdanje modela Ultra biti ono koje će to sa sigurnošću odrediti. U usporedbi s drugim popularnim modelima koji trenutno pokreću AI chatbotove, Gemini se ističe svojom prirodnom multimodalnom karakteristikom, dok se drugi modeli, poput GPT-4, oslanjaju na dodatke i integracije kako bi bili uistinu multimodalni.