Gemini 3 ankommer med forbedret ræsonnement, multimodalitet og et kontekstvindue på 1 million tokens.

  • Tilgængelig i Gemini-appen og for udviklere; AI-søgetilstand lanceres i USA.
  • Den udmærker sig i benchmarks som LMArena, GPQA Diamond, ARC-AGI-2 og SWE-bench Verified.
  • Google lancerer Antigravity-platformen for agenter, der er i stand til at planlægge og udføre komplekse opgaver.

Billede af Gemini 3 fra Google

Google har præsenteret Gemini 3Dens nye generation af kunstig intelligens-model er designet til at kombinere avanceret ræsonnement, kontekstforståelse og multimodale funktioner. Virksomheden positionerer det som sit hidtil mest kapable system, designet til at fortolke nuancer og løse komplekse opgaver med mindre frem-og-tilbage-samtale.

I den indledende implementering, Gemini-appen og udviklerværktøjerne integrerer allerede denne version, mens AI-tilstand i søgning Den lanceres først i USA. I Spanien og resten af ​​Europa prioriterer Google adgang via appen, API og cloud-tjenester, sammen med en udvidelse af sprog til at omfatte catalansk, baskisk og galicisk.

Hvad bringer Gemini 3, og hvorfor er det relevant?

Gemini 3 kombinerer i ét system den akkumulerede erfaring fra tidligere generationer og et spring i retning af ræsonnement og forståelse af kontekstenVirksomheden fastholder, at modellen "indfanger subtile spor" i kreative ideer og opdeler komplekse problemer i lag, med mere præcise svar og mindre behov for at omformulere forespørgslen.

Denne tilgang resulterer i mere præcise svar, der prioriterer Nyttig information versus klichéerDette er en adfærd, som Google har testet for at reducere smiger og forbedre faktuel nøjagtighed. Desuden tillader modellens multimodale natur at arbejde med tekst, billeder, lyd og video i samme interaktion.

Ydeevne i uafhængige og sammenlignende tests

Ifølge målinger offentliggjort af Google og offentlige ranglister, Gemini 3 Pro Han fører LMArena med 1.501 ELO-point, hvilket overgår sin forgænger. I den akademiske vurdering opnår han 37,5% uden værktøjer i Humanity's Last Exam og 91,9% i GPQA Diamond; i matematik scorer han 23,4% i MathArena Apex.

Den forstærkede ræsonnementsform Dyb tænkning Det tager disse resultater endnu længere, med 41,0% i Humanity's Last Exam og 93,8% i GPQA Diamond. ARC-AGI-2, med kodeudførelse, registrerer 45,1%, en indikator for fremskridt inden for abstrakt ræsonnement og visuel forståelse.

Multimodalitet og et stort kontekstvindue i Gemini 3

En af de store ændringer er kontekstvinduet for 1 million tokensDette letter analysen af ​​omfattende kodelagre, artikler eller lange videoer. Modellen kan for eksempel oversætte og forene håndskrevne opskrifter for at skabe en familiekogebog eller konvertere komplekse materialer til visualiseringer og interaktive kort.

Multimodal læsning afspejles i tests som f.eks. MMMU-Pro (81%) og Video-MMMU (87,6%), og i SimpleQA Verified (72,1%), hvor fokus er på større faktuel nøjagtighed. I AI-tilstand, der er integreret i Søgning, underviser Google i interaktive elementer – såsom widgets og simuleringer – for at forklare koncepter undervejs.

Programmering og agenter: drivkraften bag antigravity

I udviklingsopgaver fører Gemini 3 an WebDev Arena med 1.487 ELODen opnår 54,2% i Terminal-Bench 2.0 og 76,2% i SWE-bench Verified, hvilket betyder større kompetence i at generere kode, bruge værktøjer og betjene et terminalmiljø.

Den mest bemærkelsesværdige nye funktion for byggemæglere er Google AntigravityDenne platform giver agenter adgang til editoren, terminalen og browseren. Med denne platform kan systemet planlægge og udføre komplette softwareworkflows, validere sin egen kode og overlade den endelige gennemgang og revision til udvikleren.

Sikkerhed, ekstern testning og ansvarlig implementering

Google hævder, at dette er dens Den sikreste model til datoDen er forstærket mod smiger og mere modstandsdygtig over for umiddelbare injektioner og misbrug (f.eks. cyberangreb). Vurderingen er en del af dens Frontier Safety Framework og er blevet gennemgået af eksterne eksperter, herunder AISI i Storbritannien og firmaer som Apollo, Vaultis og Dreadnode.

tilstand Dyb tænkning Den gennemgår yderligere validering, før den når Google AI Ultra-abonnenter, på grund af omfanget af dens planlægningsmuligheder og værktøjsbrug. Virksomheden lægger vægt på en gradvis og målrettet udrulning på tværs af produkter og regioner.

Gemini 3 Tilgængelighed

El Gemini 3 Pro-forhåndsvisning Den er tilgængelig i Gemini-appen og via udvikler-API'en gennem AI Studio og Vertex AI. Grænsefladen tilføjer 30 nye sprog, herunder Catalansk, baskisk og galicisk, hvilket letter dens implementering i lokale sammenhænge.

El AI-tilstand i søgning Det starter i USA og vil gradvist udvides; i mellemtiden kan virksomheder og tekniske teams integrere Gemini 3 i deres arbejdsgange med Vertex AI og Gemini Enterprise, udover den nye CLI og Antigravity-platformen for agenter.

Brugsscenarier: fra bedre læring til automatisering af opgaver

Ud over chat kan modellen omdanne komplekst indhold til interaktive oplevelser med grafer, lommeregnere eller simuleringer. Det er nyttigt til at studere tekniske koncepter, analysere sportskampe og foreslå træningsplaner eller opdele dokumenter og generere navigerbare guider.

I deres daglige arbejde kan agenter klassificer Gmail-e-mail, planlæg ture eller udfør opgaver i flere trin ved at kombinere ræsonnement, værktøjskald og browserkontrol, altid med menneskelig overvågning for at opretholde kontrollen.

Google fastholder, at Gemini's indflydelse vokser: "AI-drevet View" ankommer 2.000 millioner brugere hver månedGemini-app har over 650 millioner månedlige downloads, 70 % af cloud-kunderne bruger dens AI-funktioner, og 13 millioner udviklere har bygget løsninger med dens modeller. Disse tal understøtter implementeringen af ​​Gemini 3 inden for produktets økosystem.

Med fokus på ræsonnement, multimodalitet og agenter, Gemini 3 Det fremstår som det fælles grundlag for Googles AI-strategi: en mere direkte, mindre imødekommende platform med mere kontekst, som du i Spanien kan begynde at bruge fra Gemini-appen og, hvis du udvikler, fra AI Studio og Vertex AI; AI Mode Search vil blive aktiveret af markedet.

Google AI-tilstand
relateret artikel:
Googles AI-tilstand ankommer til Spanien: en komplet guide til at forstå og få mest muligt ud af den