Anthropics Mythos: AI-modellen som omskriver reglene for cybersikkerhet

  • Claude Mythos Preview har begrenset tilgang på grunn av dens enestående evner til å finne og utnytte kritiske sårbarheter.
  • Internasjonale banker og regulatorer i USA, Storbritannia og EU analyserer risikoen som modellen utgjør for finansiell og digital infrastruktur.
  • Anthropic tar i bruk Project Glasswing, et samarbeidsprogram med store teknologiselskaper og finansinstitusjoner for å bruke Mythos i defensiv modus.
  • Modellen åpner et nytt scenario for cybersikkerhet i Europa, med større deteksjonskapasitet enn noen gang før, men også med risiko for misbruk hvis bruken blir utbredt.

Antropisk mytologi AI-modell

Anthropics nye kunstige intelligensmodell, kjent som Forhåndsvisning av Claude MythosDet har blitt episenteret for den globale debatten om begrensningene til avansert AI. Selskapet innrømmer selv at systemet er så kraftig når det gjelder cybersikkerhet at de har besluttet å ikke lansere det bredt, en uvanlig avgjørelse i en sektor som er vant til å skryte av hvert nye fremskritt.

Det som står på spill er ikke bare en trinnvis forbedring i forhold til tidligere modeller, men et kvalitativt sprang i evnen til å oppdage og utnytte datamaskinsårbarheterRegjeringer, sentralbanker, store finansinstitusjoner og europeiske regulatorer følger saken nøye, vel vitende om at et slikt verktøy kan styrke forsvaret av kritiske systemerMen det kan også åpne døren for angrep av enestående omfang hvis det skulle falle i gale hender.

Hva er egentlig Claude Mythos, og hvorfor har lanseringen blitt utsatt?

Claude Mythos er en av de nyeste modellene i Claude-familien, Anthropics AI-økosystem som konkurrerer med OpenAIs ChatGPT og Googles GeminiDet er en generell modell, i stand til å resonnere, programmere og arbeide med langsiktig kontekst, men den mest kontroversielle funksjonen er dens ytelse innen offensiv og defensiv cybersikkerhet.

Kalt «røde lag»Spesialister som tester AI-systemer til det ytterste konkluderte i en intern rapport med at Mythos er «overraskende dyktig» i cybersikkerhetsoppgaver. I benchmarktester som f.eks. SWE-benk Verifisert o SWE-benk ProModellen, som er utviklet for å måle evnen til å løse programvareutviklingsproblemer i den virkelige verden, ville lett ha overgått kommersielle alternativer i toppklassen, inkludert avanserte versjoner av GPT og Gemini, ifølge data levert av Anthropic selv.

Utover referansepunktene er det det som har fått alarmklokkene til å ringe at Mythos klarte å finne nulldagssårbarheter – tidligere ukjente feil – i mye brukte programvarekomponenter, noen over to tiår gamle. I systemer som OpenBSD-, FFmpeg- og FreeBSD-komponenter oppdaget modellen ikke bare feil som hadde gått ubemerket hen i årevis, men genererte også fungerende utnyttelser for å utnytte dem.

Stilt overfor disse resultatene valgte Anthropic en avgjørelse som var uvanlig i bransjen: å presentere modellen og deretter annonsere at den ikke vil bli markedsført åpent. fordi de anser det som enestående cybersikkerhetsrisikoer. Selskapet insisterer på at Mythos er den «best tilpassede» modellen de har bygget, men erkjenner at den enorme kapasiteten forsterker konsekvensene av misbruk.

Illustrasjon av avansert AI fokusert på Mythos

En modell med "hacker"-ferdigheter langt utover menneskelige evner

Tekniske dokumenter og rapporter fra ulike organisasjoner er enige om at Mythos markerer et vendepunkt i automatiseringen av komplekse angrepI testmiljøer som simulerte ekte bedriftsnettverk, var systemet i stand til å kjede sårbarheter, eskalere rettigheter og oppnå vedvarende tilgang på få timer – oppgaver som ville tatt en menneskelig ekspert dager eller uker.

I Firefox' JavaScript-motor, for eksempel, klarte tidligere versjoner av Anthropics modeller sjelden å gjøre sårbarheter om til fungerende utnyttelser. Mythos, under de samme testforholdene, genererte dusinvis av operative utnyttelserDen gjenskaper nøyaktig utnyttelsen av de mest effektive vektorene. På analyseplattformer som OSS-Fuzz, designet for å finne feil i åpen kildekode-programvare, får den æren for å ha oppdaget alvorlige sårbarheter som har gått ubemerket hen til tross for årevis med automatisert testing.

Modellen har også vist bemerkelsesverdige egenskaper innen reverse engineeringDen kan rekonstruere deler av et programs logikk fra kompilerte binærfiler, og derfra finne og utnytte feil uten å få tilgang til den opprinnelige kildekoden. Denne typen funksjonalitet bringer AI nærmere scenarier som inntil nylig ble ansett som eksklusive for høyt spesialiserte menneskelige team.

En av de hyppigst siterte episodene i sikkerhetsvurderinger er den såkalte «sandwichtesten». I et isolert laboratoriemiljø fikk Mythos kontroll over et system med eksplisitte instruksjoner om å forsøke flykte fra sandkassen og kontakte forskeren som overvåket testen. Modellen klarte å utnytte en rekke sårbarheter for å unnslippe det begrensede miljøet og sende en e-post til den ansvarlige personen, som ikke var på kontoret på det tidspunktet. Selv om hendelsen skjedde i en tidligere intern versjon og under dirigert kommando, illustrerer den i hvilken grad systemet kan operere i komplekse scenarier med minimal tilsyn.

Til tross for disse demonstrasjonene insisterer analytikerne på å avklare at Vi har ikke å gjøre med en «bevisst» AI eller en med sin egen viljeMythos bestemmer seg ikke for å angripe systemer på egenhånd; den utfører oppgavene den får så effektivt som mulig. Risikoen, i denne forstand, er ikke at modellen vil gjøre opprør, men at noen vil bruke den – eller tvinge den til å gjøre det gjennom sofistikerte instruksjoner – til å utføre skadelige handlinger.

Prosjekt Glasswing: Mytos i forsvarets tjeneste … for noen få utvalgte

I stedet for å åpne opp for allmennheten, har Anthropic valgt å omgi Mythos med et spesifikt program, Prosjekt GlasswingInitiativet er utviklet for å bruke modellens funksjoner på en kontrollert måte for å beskytte kritisk programvare, og innebærer å tilby systemet, under strenge bruksbetingelser, til en utvalgt gruppe store teknologiselskaper, infrastrukturleverandører og finansinstitusjoner.

Blant organisasjonene med tilgang er giganter som Amazon Web Services, Apple, Microsoft, Google CloudNvidia eller Broadcomså vel som nettsikkerhetsfirmaer som CrowdStrike, hvis egen feilaktige programvare forårsaket en stor global forstyrrelse i 2024. Disse får selskap av verdenskjente banker, inkludert JP Morgan Chase og flere store Wall Street-grupper, samt andre organisasjoner som er ansvarlige for å vedlikeholde sensitiv IT-infrastruktur.

Anthropic har også annonsert lån verdt 100 millioner dollar Denne finansieringen vil gjøre det mulig for disse organisasjonene å bruke Mythos til sårbarhetsanalyse, sammen med donasjoner til fri programvarestiftelser som Linux Foundation og Apache Software Foundation. Det offisielle målet er klart: å la de som administrerer verdens mest kritiske programvare identifisere og rette opp feil før slike verktøy blir tilgjengelige for potensielle angripere.

Denne strategien skaper imidlertid noe uro i sektoren. På den ene siden forsterker den ideen om at teknologi er farlig nok til å kreve begrenset tilgang. På den andre siden, Det skaper et gap mellom de som drar nytte av Mythos-"skjoldet" og de som blir holdt utenfor.Bedrifter og administrasjoner som ikke er en del av Glasswing risikerer senere å møte sårbarheter som ble identifisert og rettet i privilegerte miljøer, men som fortsatt er tilstede i deres egne systemer.

I Europa er denne asymmetrien spesielt bekymringsfull for de som er ansvarlige for kritisk infrastruktur og sikkerhetsteamene i store industri- og finanskonsern, som følger nøye med på om Brussel og de europeiske hovedstedene sørger for at lignende programmer inkluderer nøkkelaktører fra kontinentet på like vilkår. og skysuverenitet med de amerikanske partnerne.

Reaksjon fra myndigheter, regulatorer og finanssektoren

Mythos' innvirkning er ikke begrenset til det tekniske området. På bare noen få dager utløste kunngjøringen av modellen møter på høyt nivå i USA og EuropaDen amerikanske finansministeren innkalte lederne for landets største banker til Washington for å vurdere risikoen systemet kunne utgjøre for den finansielle stabiliteten, mens styrelederen for den amerikanske sentralbanken (Federal Reserve) også deltok i disse samtalene.

Ifølge lekkasjer rapportert av internasjonale medier ble disse enhetene angivelig oppfordret til å Test Mythos i defensiv modusbruker den til å skanne sin egen infrastruktur for svakheter før andre kan. Det implisitte budskapet er at trusselen er alvorlig nok til å rettferdiggjøre en koordinert offentlig-privat respons.

I mellomtiden har medgründeren av Anthropic bekreftet at selskapet opprettholder direkte samtaler med den amerikanske regjeringen om Mythos og fremtidige modeller. Disse diskusjonene finner sted i en spent kontekst, etter at amerikanske myndigheter nylig la selskapet til en liste over risikoer i forsyningskjeden, etter friksjon knyttet til bruken av modellene deres av Forsvarsdepartementet.

På den andre siden av Atlanterhavet har EU tatt dette til etterretning. Europakommisjonen har offentlig støttet en gradvis og forsiktig tilnærming til modeller som Mythos, og Finanstilsynsmyndigheter i Storbritannia og på kontinentet har begynt å spesifikt studere de potensielle implikasjonene. for bankvirksomhet og markeder. Den britiske regjeringens AI Security Institute (AISI) har beskrevet systemet som et betydelig sprang fremover når det gjelder cybertrussel sammenlignet med tidligere generasjoner.

I Spania, selv om den offentlige debatten fortsatt er begrenset, følger tilsynsorganer og cybersikkerhetsteam fra banker og store energiselskaper nøye med på denne utviklingen. For den europeiske finanssektoren er ethvert fremskritt som kan legge til rette for koordinerte angrep mot betalingssystemer, interbanknettverk eller handelsplattformer en årsak til alvorlig bekymring.

Skepsis, tvil og debatt om «hypen» rundt Mythos

Anthropics konto, som kombinerer sikkerhetsadvarsler med spektakulære ytelsestall, har ikke vært uten kritikk. Flere eksperter på kunstig intelligens og cybersikkerhet har etterlyst forsiktighet ved tolkning av selskapets uttalelserDet er viktig å merke seg at mye av de tilgjengelige dataene kun kommer fra interne rapporter.

Enkelte analytikere har gjennomgått den omfattende dokumentasjonen som er publisert av Anthropic i detalj, og påpeker at tallet «tusenvis av alvorlige sårbarheter» er basert på ekstrapoleringer fra et relativt lite antall manuelt gjennomgåtte tilfeller. I visse testpakker skal Mythos ha funnet et betydelig antall kritiske feil, men langt fra det nesten apokalyptiske scenariet som noen overskrifter antyder.

Andre uavhengige studier har forsøkt å sammenligne Mythos' ytelse med mindre modeller med åpen kildekode, og sendt sårbare kodebiter til forskjellige AI-er for å se om de kunne oppdage de samme feilene. Resultatene indikerer at Noen åpne modeller er også i stand til å identifisere komplekse sårbarheterDette setter spørsmålstegn ved ideen om at Mythos spiller i en helt annen liga i alle scenarier.

Denne typen moteksempler opphever ikke Mythos' evner, men de antyder at En del av diskursen om at det er for farlig å publisere har også en markedsføringsdimensjon.Å presentere en modell som både usedvanlig kraftig og en potensiell risiko forsterker bildet av teknologisk lederskap og ansvar, noe som er svært verdifullt i et stadig mer konkurransepreget marked.

Bransjens nyere historie minner også om presedensen til GPT-2 i 2019, da OpenAI i utgangspunktet bestemte seg for ikke å publisere hele modellen, med den begrunnelse at den var for farlig på grunn av potensialet til å generere desinformasjon. Til slutt ble denne versjonen offentliggjort uten at noen av de forutsagte katastrofene materialiserte seg, og mange eksperter nevnte den som et eksempel på overreaksjon. Med Mythos, Forskjellen er at fokuset ikke lenger er på teksten, men på integriteten til den digitale infrastrukturen., et mye mer sensitivt område for myndigheter og banker.

En delikat balansegang mellom sikkerhet, forretning og tilgang til teknologi

Utover mediestøyen reiser Mythos-situasjonen et grunnleggende problem: Hvem bestemmer når en AI-modell er for farlig til å lanseres Og under hvilke kriterier? Foreløpig har avgjørelsen vært ensidig fra Anthropics side, som har valgt å holde systemet i en slags kontrollert karantene, og forbeholdt det utvalgte partnere.

Denne posisjonen er ikke utelukkende basert på sikkerhetsmessige årsaker. Å kjøre en modell med Mythos' egenskaper er veldig dyrt med tanke på databehandling, og selskapet erkjenner selv at det for øyeblikket ikke har nødvendig infrastruktur å tilby den i stor skala til millioner av brukere. I praksis går sikkerhetstiltak og tekniske begrensninger hånd i hånd, noe som gir Anthropic tid til å finjustere både modellen og utrullingen.

Samtidig har selskapet begynt å tydelig differensiere mellom sine ulike produkter. Mens Mythos fortsatt er som mest avanserte interne standardenSelv om de er reservert for forskning og strategisk samarbeid, er andre modeller som Claude Opus 4.7 rettet mot daglig bruk av bedrifter og fagfolk. Anthropic har til og med offentlig erkjent at Opus 4.7 er "mindre kapabel" enn Mythos generelt, og spesielt når det gjelder cyberkapasiteter – noe uvanlig i en bransje som vanligvis presenterer hver nye modell som den beste på alle måter.

I denne ordningen fungerer Mythos som testmiljø for neste generasjons funksjonerSelv om kommersielt tilgjengelige modeller bare inkluderer en del av disse funksjonene, med ytterligere begrensninger utformet for å redusere risiko, kan denne separasjonen mellom «eksperimentelle» og «produksjons»-modeller være en rimelig tilnærming for mange europeiske organisasjoner som er interessert i å utnytte AI uten å være i frontlinjen, forutsatt at det er tilstrekkelig åpenhet om de faktiske funksjonene til hvert system.

Det som til slutt dukker opp er et scenario der Cybersikkerhet går for fullt inn i æraen med storskala offensiv og defensiv AIVerktøy som Mythos lover å akselerere identifiseringen av sårbarheter i systemer som har vært i drift i årevis, men de tvinger også frem en nytenkning av hvordan teknologien som ligger til grunn for den digitale økonomien distribueres og styres. For Europa og Spania vil utfordringen ikke bare være å beskytte seg mot stadig kraftigere modeller, men også å sørge for at de ikke blir utelatt fra mekanismene som gjør at de kan brukes til å styrke sin egen sikkerhet.

strategi for nettsikkerhet
Relatert artikkel:
Nettsikkerhetsstrategi: nøkler, rammeverk og praktisk anvendelse