Google lanserer Gemma 4, deres store satsing på åpen og lokal AI

  • Gemma 4 er en familie av fire åpne AI-modeller basert på Gemini 3-teknologi, med størrelser fra E2B til 31B parametere.
  • Modellene kombinerer høy «parameterintelligens» med lokal utførelse på mobil-, edge- og proprietær infrastruktur, takket være kontekstvinduer på opptil 256 000 tokens.
  • Apache 2.0-lisensen tillater ubegrenset kommersiell bruk, styrker digital suverenitet og forenkler utrulling i regulerte miljøer i Europa.
  • Gemma 4 er multimodal (tekst, bilde, video og lyd i små modeller), støtter mer enn 140 språk og er tilgjengelig i Google AI Studio, Hugging Face, Kaggle og Ollama.

Gemma 4 AI-modell

Google har tatt et viktig skritt i strategien sin for å åpen kunstig intelligens Med lanseringen av Gemma 4 tar en ny modellfamilie sikte på å kombinere høye nivåer av resonnement med mye mer beskjedne maskinvarekrav. Selskapet presenterer denne generasjonen som et seriøst alternativ for de som trenger å kjøre avansert AI på sin egen infrastruktur, fra mobile enheter til datasentre.

Langt fra å være én enkelt modell, Gemma 4 er et komplett utvalg av fire åpne varianterForslaget er utviklet for utviklere, bedrifter og offentlige enheter som ønsker mer kontroll over dataene og distribusjonene sine, og passer spesielt godt til kravene til Digital suverenitet og regeloverholdelse i Europader makten til å bestemme hvor utførelsen og hvor dataene lagres blir stadig viktigere.

En familie på fire modeller fokusert på "parameterbasert intelligens"

Gemma 4 modellfamilie

Gemma 4 er bygget på samme teknologiske fundament som Gemini 3Men med et klart mål: å maksimere det Google kaller "parameterbasert intelligens"I stedet for å konkurrere utelukkende på størrelse, skryter selskapet av å ha oppnådd ytelsesnivåer som kan sammenlignes med mye større systemer i relativt kompakte modeller.

Familien består av fire forskjellige størrelserEffektiv 2B (E2B), Effektiv 4B (E4B), en modell av 26B med blanding av eksperter (MoE)-arkitektur og en tett variant av 31B parametereSistnevnte befinner seg allerede i topp 3 i Arena AIs rangering for åpne modeller, og overgår alternativer som multipliserer antallet parametere med tjue, noe som er spesielt relevant for de som ønsker å redusere GPU-kostnader uten å ofre kvalitet.

modell 26B MoE Den er optimalisert for å bare aktivere en brøkdel av parameterne (rundt 3,8 milliarder) i inferens, noe som forbedrer tokengenereringshastigheten og energieffektiviteten. I motsetning til dette, versjon 31B tett Den er posisjonert som det foretrukne alternativet for krevende finjusteringsoppgaver, kompleks orkestrering og intensiv bruk i forretnings- eller institusjonsmiljøer.

Google understreker at disse variantene, når det gjelder offentlige benchmarks, konkurrerer direkte med tyngre modeller fra andre leverandører, inkludert de fra kinesiske produsenter som DeepSeek eller Qwen, som de siste årene har blitt sterke i åpen kildekode-økosystemet. Gemma 4s 31B er oppført som den tredje beste åpne modellen i Arena AI, mens 26B MoE også rangerer høyt.

Fra et forretningsperspektiv innebærer forholdet mellom størrelse og ytelse mindre maskinvareutgifter, lavere ventetid og muligheten til å kjøre grensemodeller i én NVIDIA H100 80 GB GPUDette åpner døren for mellomstore europeiske selskaper til å jobbe med avansert AI uten å investere i uforholdsmessig stor infrastruktur.

Kunstig intelligens i lommeformat: mobil, IoT og edge computing

Gemma 4 på mobile enheter

De mindre modellene, E2B og E4BDe er uttrykkelig designet for å operere i nettverkets utkant, det vil si i mobile enheter, IoT og lokal maskinvareGoogle bemerker at disse variantene er optimalisert for å kjøre på Android-smarttelefoner, Raspberry PiJetson Nano og andre lavstrømssystemer, med svært lav latens og selv uten internettforbindelse.

I dette segmentet er ikke bare råkraft prioritert, men evnen til å tilby multimodale funksjoner og rask respons i ressursbegrensede miljøer. Gemma 4-kantmodeller kan håndtere tekst, bilder og video, og når det gjelder E2B og E4B, legger de til innebygd støtte for lydDette muliggjør bruksområder som lokale stemmeassistenter, bildegjenkjenning i felt eller videoanalyse i sanntid uten behov for å sende data til skyen.

Kontekstvinduet for disse lette modellene når 128.000-symbolerDette er tilstrekkelig til å behandle lange dokumenter, omfattende samtaler eller relevante kodestykker i én enkelt ledetekst. Ifølge Google bidrar denne kombinasjonen av bred kontekst og lokal utførelse til å eliminere friksjon. personvern, tilkobling og latensDette er svært relevant for industri-, helse- eller utdanningsprosjekter i Europa, hvor restriksjonene på databehandling blir stadig strengere.

Fra maskinvareprodusentenes perspektiv åpner Gemma 4 døren for integrasjon Avansert AI direkte inn i forbrukerprodukterFra smarttelefoner og nettbrett til medisinsk utstyr og industrielle sensorer har selskapet fremhevet at disse modellene er designet for å fungere med brikker fra vanlige Android-økosystemleverandører, som Qualcomm og MediaTek, noe som letter deres utbredelse.

Videre utnytter arkitekturen til kantmodeller teknikker som Innbygging per lag (PLE) for å maksimere effektiviteten av parameterbruk, noe som muliggjør resonnement og kontekstforståelse til en mye lavere beregningskostnad enn vanlig i generelle modeller.

Multimodalitet, agenter og avansert utviklerstøtte

Gemmas 4 multimodale evner

En av Gemma 4s styrker er dens klare forpliktelse til agentarbeidsflyterModellene er ikke begrenset til å generere tekst: de integrerer seg naturlig funksjonskall, strukturert JSON-utdata og systeminstruksjonerDette tillater konstruksjon av autonome agenter som orkestrerer ulike trinn, kaller eksterne API-er og returnerer resultater i formater som enkelt kan integreres med bedriftsapplikasjoner.

Google insisterer på at alle modellene i Gemma 4-familien er designet som resonnører på høyt nivåmed konfigurerbare tenkemoduser for å justere resonnementsdybden i henhold til oppgaven. Dette gir bedre resultater i flertrinns resonnement, offline kodegenerering og kompleks problemløsning, viktige aspekter i bedrifts- og offentlig forvaltningsmiljøer der pålitelighet er nødvendig.

I det multimodale planet kan de fire modellene behandle Tekst og bilder med forskjellige oppløsninger og sideforhold, mens E2B- og E4B-variantene utvider denne kapasiteten til video og lydDenne kombinasjonen muliggjør for eksempel systemer som analyserer dokumenter med grafikk, industrielle overvåkingsvideoer eller rikt pedagogisk innhold, og genererer kontekstuelle responser i sanntid.

Kontekstvinduet når 256 000 polletter i de største modelleneDette lar brukere laste opp hele kodelagre, lange juridiske kontrakter eller store mengder teknisk dokumentasjon i én enkelt spørring. For support-, konsulent- eller IT-revisjonsteam gjør dette det enklere å automatisere oppgaver som tidligere krevde mange timer med manuell gjennomgang.

Når det gjelder språk, støtter Gemma 4 innebygd mer enn 140 språkFor Europa, og spesielt for Spania, betyr dette at det kan utvikles flerspråklige løsninger som dekker alt fra de viktigste EU-språkene til mindre representerte språk, noe som bidrar til å oppfylle målene for tilgjengelighet og inkludering i offentlige og private tjenester.

Skyintegrasjon, digital suverenitet og utrulling i Europa

Implementeringen av Gemma 4 er ikke begrenset til lokal maskinvare. Google har integrert disse modellene i sitt skytilbud gjennom Vertex AI y Google Kubernetes Engine (GKE)slik at organisasjoner kan konfigurere dedikerte dataressurser og skalere inferensarbeidsmengder etter behov. For regulerte europeiske sektorer kombineres dette med alternativer for Sovereign Cloud og air-gapped eller lokale implementeringer, justert til kravene til datalagring og samsvar med personvernforordningen (GDPR).

Selskapet fremhever at bfloat16-presisjonsvektene til de større modellene kan kjøres effektivt i en enkelt 80 GB NVIDIA H100 GPUreduserer inngangsbarrieren for mellomstore selskaper eller offentlige institusjoner som ønsker å beholde kontrollen over infrastrukturen sin. I kvantiserte versjoner kan modellene også fungere i forbrukermaskinvare eller arbeidsstasjoner, og utvider utvalget av mulige utplasseringer.

For teknologiledere i Spania og resten av Europa er denne kombinasjonen av åpen modell, kontrollert distribusjon og støtte for suveren sky Det muliggjør design av hybridarkitekturer: deler av intelligensen kan ligge i lokale datasentre, mens andre mindre sensitive arbeidsbelastninger kjører i den offentlige skyen, samtidig som en felles teknologisk base opprettholdes.

I tillegg tilbyr Google en Agentutviklingssett (ADK)Et modulært rammeverk som forenkler oppretting, testing og distribusjon av Gemma 4-baserte agenter. Det er også avhengig av tjenester som Skykjøring med NVIDIA RTX PRO 6000 GPU-er (Blackwell) i serverløs modus, som gjør det mulig å lansere pilotprosjekter med høy intensitet uten behov for å anskaffe egen maskinvare fra dag én.

I en europeisk kontekst hvor debatten om KI vanligvis dreier seg om kontroll, åpenhet og reviderbarhet, er muligheten for Implementer åpne modeller under Apache 2.0 i kontrollerte infrastrukturer Det er spesielt attraktivt for administrasjoner, banker, forsikringsselskaper eller selskaper i helsesektoren som trenger å forene innovasjon med strenge regulatoriske rammeverk.

Apache-lisens 2.0, åpent økosystem og fellesskapsgrep

Hvis det er ett aspekt som har skapt spesiell interesse i lokalsamfunnet, er det beslutningen om å lisensiere Gemma 4 under Apache 2.0Tidligere versjoner av Gemma brukte tilpassede lisenser som reiste juridiske spørsmål for kommersielle produkter; nå, med en standard åpen kildekode-lisens, Utviklere og selskaper kan modifisere, omdistribuere og tjene penger på modeller med mye mindre friksjon..

Denne åpningen kommer på et tidspunkt hvor Google prøver gjenvinne terreng i det åpne modelløkosystemetDette kommer etter en periode der alternativer som Metas Llama eller kinesiske modeller (DeepSeek, Qwen, GLM, Minimax) hadde økt i bruk. Innflytelsesrike stemmer i sektoren, som medgründeren av Hugging Face, har beskrevet trekket som en «stor milepæl» for lokal AI, og fremhever at juridiske team nå har et mye tydeligere rammeverk for å godkjenne prosjekter basert på Gemma 4.

Økosystemet rundt Gemma-familien viste allerede styrke før denne versjonen. Google bemerker at tidligere generasjoner overgår... 400 millioner nedlastinger og at samfunnet har skapt mer enn 100.000 varianter tilpasset ulike språk og brukstilfeller. Blant de mest slående eksemplene er modeller spesialisert på bulgarian eller verktøy for kreftforskning som f.eks. Cell2Sentence-skala utviklet ved Yale University.

Med Gemma 4 håper selskapet at «Gemmaverset» vil utvide seg ytterligere, og invitere... Europeiske oppstartsbedrifter, universiteter og forskningssentre å lage sine egne derivater. Kombinasjonen av en permissiv lisens og åpne vekter tillater utvikling av versjoner fokusert på spesifikke sektorer, som helsevesen, justis, Industri 4.0 eller utdanning, som deretter kan deles eller markedsføres uten for mange restriksjoner.

For spanske selskaper betyr denne situasjonen at det er mulig å bygge proprietære løsninger på Gemma 4 – som interne assistenter, bedriftens søkemotorer eller avanserte analysesystemer – samtidig som man beholder kontrollen over kode, data og infrastruktur, noe som passer godt med trenden med å styrke Europeisk teknologisk suverenitet.

Bruksområder: fra oppstartsbedrifter til store selskaper

Gemma 4 har blitt presentert for et bredt spekter av potensielle bruksområderI næringslivet kan modeller brukes til å lage flerspråklige virtuelle assistenter i stand til å håndtere komplekse spørringer gjennom avansert resonnement, eller til å automatisere kodegenerering og -gjennomgang i utviklingsteam.

Større modeller er rettet mot oppgaver som orkestrering av agenter, analyse av store mengder dokumentasjonDette inkluderer å generere tekniske rapporter eller bistå juridiske og compliance-avdelinger. Kombinasjonen av brede kontekstvinduer og multimodal støtte gjør det enkelt for én agent å jobbe med kontrakter, e-poster, diagrammer, bilder av overvåkingssystemer og lydopptak, alt innenfor samme arbeidsflyt.

I utdanning og offentlig sektor gir muligheten til å behandle tekst, bilder og i noen tilfeller video og lyd mulighet til å lage læringsstøtteplattformer som genererer sammendrag, trinnvise forklaringer eller materiale tilpasset ulike nivåer. Lokal implementering bidrar også til å respektere personvernkrav når man arbeider med sensitive data om mindreårige eller sårbare grupper.

Innen oppstartsarenaen kan Gemma 4 være grunnlaget for vertikale produkter Innen fintech, digital helse, logistikk eller B2B SaaS, takket være fleksibiliteten som tilbys av Apache 2.0, kan team gjøre finjustering av modellen på sine egne data, distribuere den lokalt eller i skyen og markedsføre resultatet uten å være bundet til strenge proprietære lisenser.

Spesielt interessant for Europa er muligheten for å utvikle lokale AI-løsninger som respekterer nasjonale og fellesskapsmessige forskrifter, for eksempel ved å lagre data i datasentre på europeisk territorium og holde modellene under direkte kontroll av organisasjonen, noe som kan være nøkkelen til prosjekter knyttet til den fremtidige EU-forordningen om kunstig intelligens.

Hvor og hvordan få tilgang til Gemma 4

Google har gjort Gemma 4-vektene tilgjengelige gjennom ulike kanaler for å legge til rette for at utviklere og forskere skal kunne ta dem i bruk. De åpne vektene kan lastes ned fra Klemme ansiktet y GitHub, mens bruk via grensesnitt og API-er er tilgjengelig i Google AI StudioIntegrasjoner tilbys også med OllamaDocker, Kaggle og verktøy som LM Studio.

Ifølge selskapet kan Gemma 4 kjøres lokalt på «milliarder av Android-enheter» og på tvers av et bredt spekter av maskinvare: fra GPU-er for bærbare datamaskiner og arbeidsstasjoner, helt til dedikerte utviklerakseleratorer. Dette er i tråd med strategien om å utvide avansert AI utover store datasentre, til sluttbrukerenheter og edge computing-miljøer.

For de som vil starte med hurtige tester, er det mest direkte alternativet å bruke Google AI Studio for 26B- og 31B-modellene eller Google AI Edge-galleriet når det gjelder E2B- og E4B-variantene. Parallelt publiserer utviklerfellesskap på plattformer som Hugging Face allerede tilpasninger og bruksklare konfigurasjoner for ulike miljøer.

I Spania og andre europeiske land forventes det at lokale integratorer og leverandører av administrerte tjenester vil begynne å tilby Nøkkelferdige løsninger basert på Gemma 4, som kombinerer utrulling av statlige skytjenester, støtte på spansk og tilpasning til spesifikke sektorforskrifter, som for eksempel innen finansielle tjenester eller helsevesen.

Totalt sett posisjonerer lanseringen av Gemma 4 Google som en av de mest relevante aktørene innen åpne og lokalt kjørbare AI-modellerDette kommer på et tidspunkt hvor europeisk industri krever verktøy som kombinerer høy ytelse, datakontroll og tydelige lisensrammeverk for å bygge langsiktige kommersielle produkter.

edge AI mer personvern
Relatert artikkel:
Edge AI og personvern: Kraftig AI uten å gi bort dataene dine