Google kommer med deres næste generation af kunstig intelligens-model Gemini til sin Bard-chatbot fra i dag. Virksomheden siger, at de vil forbedre både ydeevnen og ræsonnementets evne til Bard markant – hvilket giver den mulighed for at forstå billeder, tekst, kode, lyd og video indbygget.
Der var nogle spekulationer om, at den ville blive forsinket på grund af problemer med at forstå visse sprog, og den nye version vil kun være tilgængelig på engelsk. Men under et presseopkald fortalte Google journalister, at det fungerede godt på tværs af flere sprog.
Google lancerede sin Bard-chatbot for otte måneder siden som et eksperiment og som svar på succesen med ChatGPT. Dette er den tredje model, der understøtter værktøjet, siden den blev lanceret, startende med LaMDA, opgraderet til PaLM 2 i sommers og nu Gemini.
Hvad er Gemini?
Gemini er opdelt i tre versioner: Nano, som vil køre på mobile enheder, Pro, som bliver brugt til at drive Bard, og Ultra, som lanceres næste år og driver en ny Bard Advanced.
Google siger, at Gemini Pro præsterer lige så godt som eller bedre end GPT-3.5, modellen fra OpenAI, der driver den gratis version af ChatGPT. De ville ikke sige hvordan Gemini Ultra sammenlignes med GPT-4, kun at den overgår “alle modeller derude” på vigtige benchmarks.
“Gemini kan forstå verden omkring os på den måde, vi gør, og kan absorbere enhver form for input og output. Ikke bare tekst som de fleste modeller, men også kode, lyd, billede og video,” sagde Demis Hassabis, administrerende direktør for Google DeepMind.
Hvordan vil det ændre Bard?
Bard er blevet gradvist forbedret siden lanceringen med tilføjelsen af nogle multimodale funktioner som at analysere indholdet af et billede. Den har også fået udvidelser, så den kan tjekke flyrejser, gennemgå indholdet af en YouTube-video eller tjekke dine e-mails.
Med Gemini bliver det noget helt nyt. Selvom det måske ikke ser anderledes ud på overfladen, vil der under motorhjelmen være en mere kraftfuld motor, der ifølge Google vil have bedre muligheder over hele linjen – i hvert fald på niveau med den gratis version af ChatGPT.
Det er blevet bygget oven på en finjusteret version af Gemini Pro på engelsk, med andre sprog på vej i det nye år. Dette forbedrer dens ræsonnement, planlægning og forståelse i forhold til den tidligere version bygget på PaLM 2.
Den første udgivelse vil kun fungere med tekstbaserede prompter, men da Gemini blev bygget fra bunden til at være multimodalt, vil andre medier komme næste år.
Be the first to comment