
Selskapet Nvidia spiller hardt i AI-verdenen med sin nyeste generasjon maskinvare, men nå legger den også til programvare med NVLM. vil konkurrere med GPT-4o og Ringer gjennom en åpen kildekode LLM for å bli med i multimodale modeller (bilde, tekst).
Nvidia dominerer maskinvare for AI med sine GPUer å sentralisere data, med H100- og B200-modellene som de mest representative. Men med NVLM kommer en ny innsats for sektoren for store språkmodeller (LLM). Nvidias forslag kommer til å kjempe i en sektor dominert av OpenAI og dens GPT-4º. Det finnes imidlertid andre konkurrenter også, som Googles Gemini, Metas Llama og Anhtropics Claude 3.5.
Hva foreslår Nvidias NVLM for å revolusjonere AI-verdenen?
NVLM 1.0 fra Nvidia er den nye konkurrenten i verden av store språkmodeller for AI. Utviklerne publiserte en studie som beskriver hvordan det fungerer og hva dette nye forslaget som tar sikte på å konkurrere i programvaresegmentet med AI vil tillate.
Kort sagt er NVLM en hel familie av multimodale LLM-er som ifølge Nvidia leverer bemerkelsesverdige resultater i syn og språk. Studien indikerer en analyse- og utviklingskapasitet som er veldig lik den til andre allerede populære modeller, som GPT-4o.
Hos NVLM finner vi en modell med 72.000 milliarder parametere, den mest ambisiøse og dyktige utgaven til dags dato. Ifølge Nvidia er oppførselen og typen respons bedre enn Llama 3 405B, en mye større modell i henhold til ytelsestester.
En annen fordel med Nvidias forslag er at NVLM tilbyr en åpen kildekode AI-modell av åpne vekter. De ansvarlige lover å publisere koden som brukes til å trene modellen, noe ekstremt nyttig. Utviklere vil kunne bruke det i sine egne prosjekter og gafler.
Hva vil NVLM tilby til AI-verdenen?
Med NVLM kan du analysere visuelle og tekstinndata. Dette oversettes til AIs evne til å tolke memer og analysere fotografier. I tillegg kan du også bruke denne språkmodellen laget av Nvidia for å løse matematiske problemer trinn for trinn.
Driften av dette systemet kombinerer OCR, lokalisering, sunn fornuft, verdenskunnskap og programmeringsferdigheter. Alt dette sammen gjør at NVLM kan svare på ulike forespørsler og situasjoner med stor allsidighet. Å utforske omfanget av denne nye AI-språkmodellen, og dens sammenligning i ytelse med andre aktører i sektoren lar oss forstå hvor teknologien er på fremmarsj.
Om før-trening
De som er ansvarlige for opplæring av NVLM har brukt en forbedret arkitektur for opplæringen og resonnementet til modellen deres. Dens evner er veldig allsidige og den er i stand til å behandle 72.000 XNUMX millioner parametere og direkte rivaler GPT-4o, Llama 3-V-70B og Gemini 1.5 Pro. Dens beste ytelse er for tiden bevist i løsning av matematiske problemer, bilde- og tekstbehandling.
Informasjonen som ble brukt til førtrening og trening ble nøye utvalgt med finjusteringer og menneskelig tilsyn. Arbeidet tjente til å verifisere kvaliteten på datasettene så vel som mangfoldet av kompatible og skalerte oppgaver, inkludert under før-læringsstadiet.
El kraftig algoritme laget av Nvidia Den ble utgitt som åpen kildekode, sammen med modellen med instruksjoner og treningsparametere. De kan brukes og modifiseres uten kostnad, distribuert gjennom Megatron-Core, firmaets utviklingsbibliotek.
Dette er en virkelig milepæl i bransjen, fordi Nvidia gjør det enklere for andre små organisasjoner eller uavhengige forskere å også bidra til å fremme AI. Han gratis tilgang til verktøyet og dens egenskaper som ligner på andre store teknologiprodukter vil markere et før og etter i kampen om kontroll over sektoren.
Med denne nye LLM er målet å utvide basen av brukere og kunder, og favorisere en virksomhet som allerede er lukrativ. Men nå vil det legge til enda flere entusiaster og potensielle brukere over hele verden. Et utmerket skritt for Nvidia, som i tillegg til å dominere AI-sektoren gjennom maskinvare, nå retter seg direkte mot programvaresektoren.
Hybrid forretningsstrategi
Den ledende posisjonen som Nvidia har tatt i teknologisektor og i utviklingen av kunstig intelligens reagerer den på en hybrid forretningsstrategi. På den ene siden vurderer det utvikling og produksjon av brikker og salg av avanserte systemer for å fremme driften av svært forskjellige algoritmer. Dette akselererte genereringen av inntekter og fikk godkjenning fra investorer. På den annen side jobbes det med AI-algoritmer slik at Nvidia posisjonerer seg i et segment hvor det er en ulempe sammenlignet med OpenAI, Google og Meta. Men takket være denne strategien har NVLM vist seg å være et flott verktøy, i stand til å kjempe mot hverandre med AI-giganter som allerede er plassert.
Med de nye Nvidia-prosessorene er hastigheten og kapasiteten for analyse og løsning av matematiske problemer som brukere oppnår bemerkelsesverdig. Ankomsten av NVLM 1.0 vil markere et før og etter for sektoren, og generere muligheten for en ny aktør med Open Source-forslag for å nå ut til et større antall brukere og små og mellomstore bedrifter.
Hvordan vil situasjonen til AI-markedet være nå som Nvidia har gått inn med NVLM?
Inntil nå har Nvidia tilbudt viktigste prosessorer og GPUer for alle typer datasentre og servere der AI-modeller utføres. Men NVLM innebærer Nvidias direkte landing i sektoren, og dette kan generere litt friksjon med resten av konkurrentene. Åpen kildekode-initiativet og den ambisiøse prosessorkraften gjør NVLM til en svært attraktiv språkmodell. Det gjenstår å se hvordan det tilpasser seg og bruken som brukerfellesskapet begynner å gi det for å forstå omfanget fullt ut. Vi vil sannsynligvis begynne å høre viktige nyheter fra AI-sektoren nå som Nvidia har gått inn i spillet.
