DeepSeek V4: 1T-parametermodellen som ønsker å dominere den lange konteksten

  • DeepSeek V4 kommer med en Mixture-of-Experts-arkitektur på opptil 1,6 tonn parametere og nærmere 1 tonn i åpne modeller, og aktiverer bare titalls milliarder per token for å øke effektiviteten.
  • V4-familien tilbyr et kontekstvindu på opptil 1 million tokens som den nye standarden, slik at du kan jobbe med massive kodelagre og dokumentasjon i én omgang.
  • Pro- og Flash-variantene kombinerer høy ytelse, multimodalitet og svært lave inferenskostnader sammenlignet med lukkede modeller som GPT eller Claude.
  • Åpningen av vekter og kompatibilitet med populære API-er bringer frontlinje-AI nærmere europeiske oppstartsbedrifter og selskaper, med spesiell innvirkning på Spania og det spansktalende økosystemet.

DeepSeek V4-modellens lange kontekst

DeepSeeks nye generasjon av modeller har blitt fokus for teknologisk debatt med et veldig klart forslag: kontekst med opptil én million tokens og en arkitektur med mer enn én billion parametere Det kinesiske selskapet er designet for å være effektivt og fremfor alt mye billigere enn lukkede alternativer i USA, og har satset alt på V4, en familie som kombinerer åpne vekter, et stort kontekstvindu og en aggressiv prisstrategi.

Dette trekket kommer på et tidspunkt hvor Europa og Spania gransker kostnadene og den teknologiske suvereniteten til AI. DeepSeek V4 presenterer seg som et attraktivt alternativ for europeiske oppstartsbedrifter, små og mellomstore bedrifter og store selskaper. som trenger kapasitet på grensenivå, men som ikke kan – eller ikke ønsker – å stole helt på dyre proprietære API-er eller eksklusiv maskinvare som de mest ettertraktede NVIDIA GPU-ene.

En V4-familie sentrert rundt 1T parametere og en kontekst på 1M tokens

DeepSeek V4-arkitektur

DeepSeek har annonsert ankomsten av DeepSeek-V4 Preview som en familie av åpne modeller som dreier seg om to ideer: et kontekstvindu med opptil 1 million tokens og gigantiske arkitekturer basert på Mixture-of-Experts (MoE)Innenfor denne familien skiller to hovedvarianter seg ut: DeepSeek-V4-Pro og DeepSeek-V4-Flash, begge med 1M-konteksten som kjennetegn.

I den mest ambisiøse enden opererer V4-Pro i tallene opptil 1,6 billioner totale parametere (1,6T), selv om den bare aktiverer mellom 32 og 49 milliarder parametere i hvert inferensstrinn takket være MoE-skjemaet, som er avgjørende for å opprettholde effektiviteten. Parallelt har selskapet introdusert lettere varianter, som V4-Flash og V4-Lite, med rundt 284–285 milliarder totale parametere og omtrent 13 milliarder aktive parametere, designet for distribusjoner der hastighet og kostnad er prioriteter.

Det totale antallet parametere plasserer V4-familien på toppen av markedet, men den viktige detaljen er at Bare en brøkdel av disse ekspertene er tokenaktiverte.Dette gjør at den kan oppføre seg som en gigantisk modell når det gjelder kapasitet, men med et strømforbruk som er nærmere det for mye mindre modeller. Det er en tilnærming som passer med DeepSeeks fortelling: å konkurrere med store modeller med lukket kildekode uten å skyte i været i brukskostnadene.

Selskapet har også lansert foreløpige varianter som V4-Lite, som fungerer som teknisk validering, og har justert utrullingsplanen. Selv om V4 er fortsatt i en begrenset testfase I noen sammenhenger kan V4 Preview-familien allerede brukes i den offisielle chatboten og gjennom selskapets oppdaterte API, med 1M-konteksten som standardverdi i tjenestene.

Hybridarkitektur og en blanding av eksperter for å gjøre den langsiktige konteksten levedyktig

Nøkkelen til DeepSeeks evne til å tilby et kontekstvindu på én million tokens uten at inferenskostnadene skyter i været ligger i arkitekturen. Produsenten forklarer at V4 introduserer en kombinasjon av hybridpleie, blanding av eksperter og kompresjonsteknikker designet for å fungere med veldig lange sekvenser, noe som reduserer både FLOP-er per token og minnet som kreves.

Blant de tekniske komponentene som selskapet nevner, skiller følgende seg ut: MLA (Multi-Head Latent Attention), DSA eller DeepSeek Sparse Attention, og betingede hukommelsesmekanismer som EngramSammen tar disse komponentene sikte på å redusere byrden ved oppmerksomhetsberegning, spesielt når modellen må håndtere hundretusenvis eller en million tokens i én omgang.

I følge data delt av selskapet selv, i scenarier med 1 million tokens DeepSeek-V4-Pro kan kreve rundt 27 % av FLOP-ene per token og bare 10 % av KV-cachen sammenlignet med tidligere versjoner som DeepSeek-V3.2.Lettere varianter, som V4-Flash, reduserer disse tallene ytterligere, og posisjonerer seg som raske inferensløsninger for applikasjoner der latens er kritisk.

Denne typen forbedringer er ikke bare teoretiske: selskapet hevder at kombinasjonen av MoE, spredt oppmerksomhet og kontekstforståelse tillater opererer med ultralang kontekst i mindre ekstrem maskinvare allerede en kostnad per million tokens som er betydelig lavere enn for mange lukkede modeller med vinduer på 128 000 eller 200 000 tokens.

Ytelse i resonnering, programmering og agentoppgaver

DeepSeek ønsker ikke bare å skille seg ut på grunn av størrelse og kontekst. I sine interne sammenligninger insisterer selskapet på at V4-Pro og variantene er spesielt optimalisert for kompleks resonnering, programmering og agenter.Disse tre områdene står for tiden for en betydelig del av næringslivets etterspørsel. Referansepunkter som SWE-bench, utformet for å måle kapasiteten til Forstå og endre kodelagerDet er snakk om tall over 80 % nøyaktighet, i tråd med ledende lukkede modeller.

I mer generell resonnering – inkludert matematikk, STEM-disipliner og tankekjedeproblemer – plasserer selskapet V4-Pro som en av de sterkeste åpne modelleneog argumenterer for at det nærmer seg nivået av forslag om lukkede grenser. Når det gjelder global bevissthet, plasserer interne data det i forkant av det åpne økosystemet og bare bak noen få svært spesifikke proprietære modeller, som for eksempel visse avanserte varianter av Gemini.

Utover tallene, vekten på agentoppgaver Det peker på en bruk som går langt utover vanlig chat. DeepSeek hevder at V4 driver allerede sin egen infrastruktur av kodeagenter og systemer som kjeder flere trinnDe får tilgang til verktøy og jobber med omfattende databaser eller dokumentdatabaser. Denne tilnærmingen er i tråd med dagens bransjetrende, der mange selskaper ikke lenger bare ser etter en chatbot, men etter assistenter som er i stand til å fungere som «digitale kolleger» i komplekse arbeidsflyter.

Disse sammenligningene bør tas med en klype salt: som med nesten alle nyere AI-utgivelser, Mye av dataene kommer fra selskapet selv og fra tester i kontrollerte miljøer.Likevel vekker kombinasjonen av lang kontekst, effektiv arkitektur og konkurransedyktig ytelse oppmerksomhet blant europeiske utviklere som sammenligner kostnader og muligheter med alternativer som GPT, Claude, Llama eller Mistral.

Åpne modeller, publiserte vekter og kompatibilitet med populære API-er

En av hovedfaktorene som har gjort DeepSeek så kjent er deres engasjement i det åpne økosystemet. Med V4 forsterker selskapet denne tilnærmingen: har publisert den tekniske rapporten og publisert åpne vekter for familien på plattformer som Hugging Faceslik at forskere, bedrifter og offentlige forvaltninger kan laste ned modellene og kjøre dem på sin egen infrastruktur.

Denne åpne tilnærmingen, i motsetning til de helt lukkede forslagene fra mange amerikanske laboratorier, har klare implikasjoner for Spania og EU. Muligheten for å bruke disse modellene i datasentre i EUunder rammeverk som GDPR og EUs fremtidige AI-forordningDet gir en måte å opprettholde større kontroll over data uten å ofre toppfunksjoner.

Når det gjelder praktisk integrasjon, har DeepSeek valgt å redusere friksjon: API-et opprettholder samme base_url og er kompatibelt med OpenAIs ChatCompletions-skjemaer og med Antropiske grensesnittFor mange utviklingsteam betyr dette at migrering av tester eller deler av trafikken til V4 i hovedsak er begrenset til å endre modellidentifikatoren til deepseek-v4-pro eller deepseek-v4-flash og justere noen få parametere.

Samtidig har selskapet satt en tidslinje for pensjonering av eldre modeller, som deepseek-chat og deepseek-reasoner. De vil bli avviklet og omdirigert til V4-Flash helt til de trekkes tilbake fullstendig, noe som tvinger de som brukte dem til å begynne å forberede seg på migreringen. Det er en klar måte å konsentrere tilbudet om den nye generasjonen og unngå å fragmentere brukerbasen i for mange eldre varianter.

Inneholdte slutningskostnader og fokus på økonomisk effektivitet

DeepSeeks fortelling har dreid seg om effektivitet siden oppstarten. Med V4 forsterkes denne diskursen av en kombinasjon av MoE-arkitektur, distribuert oppmerksomhet og maskinvareoptimalisering som tar sikte på å... senke kostnaden per million tokens til nivåer godt under nivåene til de mest kjente premium API-eneNoen eksterne analyser nevner tall rundt 0,30 dollar per million inngangstokener for visse konfigurasjoner, en brøkdel av hva lukkede modeller i toppklassen tar.

I europeisk sammenheng, der infrastruktur- og energikostnader er relevante, passer dette fokuset på effektivitet godt med behovene til oppstartsbedrifter og små og mellomstore bedrifter. Behandling av omfattende juridiske dokumenter, lange medisinske journaler eller hele programvarelagre Det slutter å være en luksus forbeholdt selskaper med nesten ubegrensede budsjetter og blir en del av rimelige scenarier for nye prosjekter.

Noen leverandører av AI-infrastruktur tilbyr allerede tidlig tilgang til DeepSeek V4-baserte noder som en del av katalogene sine, noe som gjør det enklere for europeiske selskaper. de kan evaluere reell ytelse og kostnader uten å måtte bygge sin egen infrastruktur fra bunnen av.For mange organisasjoner er denne testfasen det innledende trinnet før man bestemmer seg for om man skal fortsette med en outsourcet modell eller velge lokale distribusjoner.

I mellomtiden har selskapets delvise taushet angående de nøyaktige opplæringskostnadene og den spesifikke maskinvaren som brukes, skapt tvil i enkelte sektorer. Siden 2025 har det sirkulert mistanker om det faktiske volumet av ressurser som kreves for å trene modellene, inkludert estimater som peker på titusenvis av avanserte GPU-er. DeepSeek insisterer på at de har oppnådd et nytt stadium av «lønnsom langsiktig kontekst»Men den har ennå ikke helt oppklart de ukjente forholdene rundt det materielle omfanget av virksomheten.

Innvirkning på oppstartsbedrifter og selskaper i Spania og Europa

For det europeiske entreprenørskapsøkosystemet, og spesielt for teknologioppstartsbedrifter i Spania, åpner fremveksten av modeller som DeepSeek V4 opp muligheter som inntil nylig var vanskelige å vurdere. Få tilgang til en modell med over en billion parametere innenfor konteksten av 1 million tokens og åpne vekter Det lar deg utforske avanserte produkter uten å være utelukkende avhengig av leverandører i Silicon Valley.

I regulerte sektorer – finans, helse, jus, offentlig forvaltning – er muligheten for kjør modellen i datasentre i EU eller til og med i dine egne anlegg Dette er spesielt relevant. Overholdelse av GDPR og nasjonale personvernforskrifter blir enklere å håndtere når informasjon ikke trenger å forlate europeiske jurisdiksjoner for å bli behandlet av en AI-modell.

Spanske oppstartsbedrifter som jobber med store mengder dokumenter, som for eksempel juridisk teknologi, helseteknologi eller utviklerverktøy, kan utnytte 1M token-konteksten til å analysere komplette filer, svært lange sykehistorier eller monolittiske kodelagre uten å måtte dele dem opp i flere deler og designe kompliserte gjenopprettingssystemer. Dette reduserer teknisk kompleksitet og i mange tilfeller også ventetid.

Samtidig er det viktig å huske på risikoene: økosystemet av verktøy rundt DeepSeek er yngre enn andre åpne modeller som Llama, og Dokumentasjonen og fellesskapsstøtten er fortsatt under modningVidere introduserer det faktum at det er et kinesisk selskap en geopolitisk komponent som noen europeiske organisasjoner ser med forsiktighet, spesielt i prosjekter knyttet til administrasjoner eller kritisk infrastruktur.

Et trekk som legger press på dyre, lukkede modeller

Utover de spesifikke spesifikasjonene tolkes DeepSeek V4 innenfor sektoren som et ytterligere steg i konkurransepresset på de dyreste lukkede modellene på markedetVed å etablere 1M-tokenkonteksten som standard på tvers av sine offisielle tjenester og ledsage den med åpne vekter, sender det kinesiske selskapet et klart budskap: den ultralange konteksten trenger ikke lenger å være en eksklusiv funksjon i noen få dyre proprietære modeller.

For store vestlige laboratorier er dette en utfordring. OpenAI, Anthropic og Google har historisk sett brukt en kombinasjon av høyere kvalitet, bredere kontekst og proprietært økosystem som et verdiforslag. Fremveksten av et åpent alternativ med en enda bedre kontekst i noen tilfeller og svært lave kostnader tvinger frem en nytenkning av produkt- og prisstrategier, spesielt i segmenter der marginen til brukerselskapene er knapp.

I den spansktalende verden, hvor mange oppstartsbedrifter opererer med mye mer beskjedne budsjetter enn sine motparter i USA, jobber konkurransepresset i deres favør. Jo kraftigere og flere åpne modeller som er tilgjengelige, desto større muligheter vil tekniske team ha til å velge basert på pris, samsvar med forskrifter og bruksområde.og ikke bare fra merkevaren bak API-et.

Samtidig vet DeepSeek at satsingen deres ikke er uten utfordringer: de fleste referansepunktene og sammenligningene kommer fra egen dokumentasjon eller fra tester i forhåndsvisningsfaser, og markedet venter fortsatt på å se hvordan V4-modellene presterer når de distribueres massivt i krevende produksjonsmiljøer, inkludert europeiske.

Alt i alt befester ankomsten av DeepSeek V4 en trend som har utviklet seg en stund: Banebrytende AI-modeller er ikke lenger eksklusivt for noen få selskaper med lukkede systemer og astronomiske budsjetter.Med en kombinasjon av over 1 mill. parametere, en kontekst med 1 million tokens, åpne vekter og en diskurs fokusert på effektivitet, introduserer det kinesiske selskapet et alternativ som selskaper og utviklere i Spania og Europa neppe vil kunne ignorere i sine kommende planer for å ta i bruk og fornye AI-infrastruktur.

Konferanse om kunstig intelligens
Relatert artikkel:
Konferanser om kunstig intelligens bringer KI nærmere små og mellomstore bedrifter, turisme og universitetssektoren