Mistral AI udgiver 10-modellers suite for at udfordre amerikanske teknologigiganter

Den franske startup inden for kunstig intelligens, Mistral AI, afslørede tirsdag sin Mistral 3-familie, idet de udgav 10 open-weight-modeller designet til at konkurrere med amerikanske teknologigiganter gennem en strategi, der lægger vægt på tilpasning og edge deployment (udrulning på enheder) frem for rå ydeevne.

Udgivelsen inkluderer Mistral Large 3, en flagskibsmodel med i alt 675 milliarder parametre og 41 milliarder aktive parametre, sammen med ni mindre Ministral 3-modeller optimeret til at køre på enheder lige fra droner til bærbare computere uden internetforbindelse. Alle modeller er udgivet under Apache 2.0-licensen, hvilket tillader ubegrænset kommerciel brug.

Positionering mod rivaler med lukket kildekode

Lanceringen kommer, idet Mistral, værdisat til 13,7 milliarder dollars efter at have rejst 2,7 milliarder dollars i finansiering, søger at differentiere sig fra konkurrenter som OpenAI og Anthropic, der fokuserer på stadig mere sofistikerede systemer med lukket kildekode. Guillaume Lample, Mistrals medstifter og chefvidenskabsmand, fortalte flere medier, at virksomhedens fordel ligger i tilpasning snarere end i benchmark-ydeevne.

“I over 90% af tilfældene kan en lille model udføre opgaven, især hvis den er finjusteret,” sagde Lample. “Dette gør den ikke kun betydeligt mere overkommelig, men også hurtigere, samtidig med at det giver yderligere fordele: ingen bekymringer om privatliv, latency (forsinkelse) eller pålidelighed.”

Meddelelsen kom en dag efter, at Mistral sikrede et flerårigt partnerskab med HSBC for at implementere AI-værktøjer på tværs af den globale banks operationer. Timingen understreger Mistrals voksende fodfæste i erhvervslivet, idet virksomheden rapporterer om kontrakter til en værdi af hundredvis af millioner af dollars med flere selskaber.

Multilingvalt fokus adskiller den europæiske model

Mistral Large 3 adskiller sig gennem omfattende flersproget træning, især i europæiske sprog – en sjældenhed blandt frontier (banebrydende) AI-systemer, der typisk prioriterer engelsk. Modellen har multimodale kapaciteter, der behandler tekst og billeder, et kontekstvindue på 256.000 tokens, og en Mixture of Experts (Ekspertblanding) arkitektur designet for effektivitet.

De ni Ministral 3-varianter spænder over tre størrelser – 14 milliarder, 8 milliarder og 3 milliarder parametre – hver tilgængelig i Base-, Instruct- og Reasoning-konfigurationer. Mistral hævder, at de mindste modeller kan fungere på enheder med så lidt som 4 gigabyte videohukommelse takket være 4-bit kvantisering.

“Den næste bølge af AI vil ikke blive defineret af ren størrelse, men af allestedsnærværelse – af modeller, der er små nok til at køre på en drone, i en bil, i robotter, på en telefon eller en bærbar computer,” udtalte virksomheden.

Mistral implementerer allerede disse kapaciteter gennem partnerskaber med Singapores Home Team Science and Technology Agency om robotik- og cybersikkerhedssystemer, den tyske forsvars-startup Helsing om drone vision-language-modeller, og bilproducenten Stellantis om AI-assistenter i bilen.

About Anders Buhl 1000 Articles
Anders Buhl er manden bag Tech Til Alle. Anders har en baggrund i kommunikation og har derudover tidligere arbejdet med Apple-produkter. Han har en stor interesse inden for mange områder af teknologi og har skrevet om tech og forbrugerelektronik i mange år.

Be the first to comment

Leave a Reply

Din email adresse vil ikke blive vist offentligt.




Dette site anvender Akismet til at reducere spam. Læs om hvordan din kommentar bliver behandlet.