Project Genie, Googles AI-prototype for å skape interaktive verdener

  • Project Genie kombinerer Genie 3, Nano Banana Pro og Gemini for å generere interaktive virtuelle verdener fra tekst eller bilder.
  • Tilgang er begrenset til Google AI Ultra-abonnenter i USA, med økter på opptil 60 sekunder og en oppløsning på rundt 720p.
  • Verktøyet lar deg skisse, utforske og blande verdener i sanntid, men det lider av realismeproblemer, latensproblemer og dårlig karakterkontroll.
  • Evnen til å imitere kjente spill åpner for debatter om opphavsrett og bekymrer deler av videospillindustrien.

AI-prosjekt for å generere interaktive verdener

Google har tatt et nytt skritt i sin offensiv kunstig intelligens brukt i videospill og virtuelle verdener Med lanseringen av Project Genie, en prototype som lar brukere generere og navigere i interaktive miljøer basert på noen få tekstmeldinger eller et bilde, presenterer selskapet verktøyet som et eksperiment som fortsatt er under testing. De første demonstrasjonene har imidlertid skapt både begeistring og tvil i bransjen.

Foreløpig er tilgangen begrenset til abonnenter på Google AI Ultra-abonnementet i USAmed korte økter og fremføringer tydelig preget av systemets eksperimentelle natur. Likevel peker prosjektet mot en fremtid der enhver bruker kan lag en liten «spillbar verden» på få sekunder, uten å måtte vite hvordan man programmerer eller håndterer grafikkmotorer.

Hva er Project Genie, og hvilke teknologier kombinerer det?

Verdensgenerator med kunstig intelligens

Prosjekt Genie er en forskningsprototype utviklet av Google DeepMind og Google AI som fungerer som en interaktiv verdengenerator. Det tekniske fundamentet hviler på tre søyler: Genie 3-modellen, spesialisert på simulering av dynamiske miljøer; Nano Banana Pro, ansvarlig for de visuelle aspektene og skissene; og Gemini, den multimodale modellen som tolker brukerinstruksjoner og fungerer som en assistent under opprettelsen.

Systemets hjerte er Genie 3, en «verdensmodell» som er i stand til å forutsi hva som skjer på skjermen bilde for bildeI motsetning til tidligere teknologier som bare genererte statiske 3D-scener, lar denne tilnærmingen omgivelsene reagere på spillerens bevegelser i sanntid, med en omtrentlig oppløsning på 720p og flere minutter med visuell koherens i henhold til DeepMinds interne eksperimenter.

Basert på det er det integrert Nano Banana Pro, ansvarlig for å generere det første bildet av scenen Denne første visningen starter med en beskrivende tekst eller et referansebilde, og fungerer som en skisse for å bestemme den grafiske stilen, verdens komposisjon og utseendet til karakteren som skal kontrolleres under utforskningen.

Endelig, Gemini fungerer som et orkestreringslag og assistentDen tolker instruksjoner på naturlig språk, hjelper med å justere verden mens den er i farten, og forenkler oppgaver som å endre perspektivet (første- eller tredjeperson), remikse et allerede opprettet miljø eller kombinere flere ideer til et enkelt spillbart scenario.

Hvordan virtuelle verdener skapes og utforskes

Interaktive verdener generert av AI

Project Genies drift er strukturert rundt en progressiv prosess i tre faser Google oppsummerer det som å skissere, utforske og blande verdener. Målet er at hvem som helst skal kunne gå fra en idé til en liten interaktiv opplevelse uten ekstra verktøy.

I første fase skriver brukeren en beskrivelse av verdenen de ønsker å skape, eller laster opp et referansebilde. Fra disse inputtene, Nano Banana Pro genererer en statisk forhåndsvisning Settingen kan være en skog i lavpoly-stil, et futuristisk bymiljø, et historisk landskap eller hva enn som er beskrevet i teksten. Karaktertypen, kameramodusen og noen grunnleggende bevegelsesparametere defineres også i denne fasen.

Når skissen er godkjent, kommer Genie 3 i spill for å la spilleren Utforsk omgivelsene fritt med vanlige PC-kontroller som W-, A-, S- og D-tasteneModellen genererer underveis det som vises foran karakteren, forutsier hvert bilde basert på de foregående og opprettholder en viss konsistens når kameraet dreies eller går tilbake til et område som allerede er besøkt.

Den tredje nøkkelevnen er kombinasjon og remiksing av verdenerSystemet lar brukere se på tidligere genererte scenarier, endre dem med nye parametere, slå dem sammen eller til og med bruke forhåndsgenererte verdener fra Google som grunnlag for å bygge variasjoner. I tillegg kan videoer av øktene deles slik at andre brukere kan se dem eller bruke dem som inspirasjon.

Alt dette kjøres fra en webapplikasjon som ligner på andre Google AI-tjenester, slik at Ingen ekstra programmer trenger å installeres, og det kreves heller ikke avansert teknisk kunnskap.Bare få tilgang til verktøyet, skriv inn instruksjonene og begynn å teste kombinasjoner til du finner et interessant resultat.

Tekniske begrensninger: tid, ytelse og realisme

Begrensninger ved en AI-prototype for virtuelle verdener

Google insisterer på å definere Project Genie som en forskningsprototype med en utpreget eksperimentell karakterDenne betegnelsen er ikke bare en formalitet: nåværende erfaring viser flere klare begrensninger som betinger den praktiske bruken av verktøyet utover den innledende nysgjerrigheten.

Den mest åpenbare er den 60 sekunders grense per generasjon og utforskningsøktEtter det minuttet stenger verden seg ned, og en ny opplevelse må begynne. Selskapet forklarer at denne begrensningen gir en bedre fordeling av dataressurser, ettersom hver økt reserverer en dedikert brikke for brukeren som spiller.

Når det gjelder ytelse, beskriver offentlige tester en oppløsning nær 720p og en frekvens på mellom 20 og 24 bilder per sekundDisse funksjonene er ledsaget av merkbar inputforsinkelse når man beveger figuren eller bytter kamera. Ifølge noen tidlige testere føles opplevelsen mer som en interaktiv video enn et fullstendig flytende, tradisjonelt videospill.

Det bør også bemerkes at Genie 3 Det er ikke en klassisk grafikkmotor, men en modell som forutsier neste bilde. Basert på det ovennevnte. Dette resulterer i merkelig oppførsel: baner som endrer tekstur uten noen åpenbar grunn, elementer som forsvinner, usannsynlig fysikk eller animasjoner som deformeres tilfeldig.

Google advarer selv om at de genererte verdenene «De virker kanskje ikke helt ekte eller samsvarer ikke alltid med indikasjonene eller fysikkens lover.»Og karakterkontrollene kan være upresise. Med andre ord, teknologien viser lovende takter, men den er fortsatt langt fra å tilby en polert spillopplevelse når det gjelder spilling og visuell stabilitet.

Begrenset tilgang og internasjonalt veikart

Begrenset tilgang til en AI-prototype

I denne første fasen er Project Genie kun tilgjengelig for Google AI Ultra-kunder i USASelskapets mest avanserte abonnementsplan er rettet mot bedrifter og skapere som trenger høytytende AI-funksjoner. Det er en premiumtjeneste som begrenser antallet brukere med tilgang til eksperimentet.

Beslutningen om å begrense testingen forklares både av beregningskostnaden for hver økt Dette skyldes Googles interesse i å samle detaljerte tilbakemeldinger før en bredere utrulling. DeepMinds forskningsdirektør, Shlomi Frutcher, understreket at det er «spennende» å kunne åpne disse verktøyene for flere mennesker for å samle inn virkelige bruksmeninger, men foreløpig er det ingen spesifikk dato for deres ankomst i Europa eller andre markeder.

Fra spanske og europeiske brukeres og studiers perspektiv betyr dette at, i hvert fall på kort sikt, Den mest realistiske rollen vil være observatørrollenfølg testene nøye, analyser videoene som allerede sirkulerer på sosiale medier og vurder i hvilken grad denne teknologien kan integreres i arbeidsflyter for nivådesign, rask prototyping eller idévisualisering.

Google har uttrykt sin intensjon om å utvide tilgangen gradvis Forutsatt at ytelse, kostnader og juridiske problemer tillater det. Tempoet i denne utvidelsen vil imidlertid også avhenge av samfunnets respons og hvordan debattene rundt opphavsrett og ansvarlig bruk av tredjepartsinnhold utvikler seg.

Evne til å imitere kjente spill og opphavsrettsdebatt

Et av de mest delikate punktene ved Project Genie har vært dets evnen til å gjenskape, med varierende grad av suksess, verdener som tydelig er inspirert av eksisterende videospillNoen spesialiserte journalister har klart å lage scenarier som tydelig lignet på titler som Super Mario 64, Metroid Prime eller The Legend of Zelda: Breath of the Wild.

I tilfellet med Zelda har de til og med blitt sett karakterer som bruker en paraglider når de hopperDenne gesten er nært knyttet til Nintendo-spillet. Disse tilfeldighetene antyder at modellen har blitt trent ved hjelp av et stort antall offentlig tilgjengelige spillvideoer, noe som reiser spørsmål om behandlingen av åndsverk i AI-trening.

Etter flere tester der verdener inspirert av svært gjenkjennelige spillserier ble gjenskapt, har Google begynt å blokkere genereringen av visse scenarier og karaktererspesielt når spesifikke navn eller varemerker nevnes. I noen tilfeller forhindrer verktøyet direkte opprettelsen av verdener basert på bestemte sagaer, med henvisning til «interessene til tredjeparts innholdsleverandører».

Selskapet forklarer at Project Genie er «trent primært med offentlig tilgjengelige nettdata»Men husk at dette innholdet fortsatt er underlagt opphavsrettslovgivningen. Resultatet er et modereringssystem som fortsatt er under konstruksjon, der noen forsøk på å reprodusere opphavsrettsbeskyttede verk eksplisitt blokkeres, mens andre slipper gjennom så lenge altfor direkte referanser unngås.

Denne uregelmessige oppførselen gir næring til debatten om I hvilken grad kan eller bør AI inspireres av eksisterende spill? Og hvor går grensen mellom hyllest, imitasjon og kopiering? En debatt som sannsynligvis vil være spesielt relevant i regioner som EU, hvor regelverk for treningsdata og opphavsrett innen kunstig intelligens fortsatt er under definert.

Potensiell innvirkning på videospillindustrien

Utover medieappellen ved å se på verdener «som Mario» eller «som Zelda» generert på sekunderProject Genie er en del av et bredere kappløp blant store teknologiselskaper om å bruke generativ AI til spillutvikling. Microsoft har for eksempel avduket prosjekter som Muse for å automatisere deler av design- og produksjonsprosessen, og andre selskaper utforsker lignende løsninger for å redusere kostnader og akselerere utviklingen.

I denne sammenhengen tar Googles forslag sikte på å bli et verktøy for rask prototyping og eksperimentering Dette kan være av interesse for både uavhengige studioer og store utgivere. Muligheten til å bygge et spillbart scenario fra en skisse eller et tekstavsnitt kan legge til rette for tidlig validering av ideer, opprettelse av interne demoer eller testing av mekanikker uten å investere måneder med arbeid.

Fremveksten av denne typen løsninger skaper imidlertid bekymring blant noen i sektoren. På den ene siden, Det er bekymring for den potensielle innvirkningen på visse profesjonelle profiler. Hvis noe av innholdet genereres automatisk. På den annen side er mange utviklere skeptiske til forretningsmodeller der AI trenes på allerede publiserte verk uten klar kompensasjon til forfatterne.

I det europeiske og spanske markedet, hvor debatten om beskyttelse av kulturell skapelse er spesielt intens, vil det være avgjørende å se hvordan verktøy som Project Genie passer inn i fremtidige reguleringer. Aspekter som åpenhet om opplæringsdata, systemer for å reservere seg mot rettighetshavere og kreditering av generert innhold kan utgjøre forskjellen mellom forsvarlig adopsjon og vedvarende konflikt med utviklere og utgivere.

Foreløpig er Project Genie fortsatt i en tidlig fase hvor Det fungerer mer som et offentlig laboratorium enn som et ferdig produkt.Utviklingen, og hvordan Google håndterer de tilhørende juridiske og etiske problemstillingene, vil avgjøre om det til slutt blir integrert i studioarbeidsflyter eller forblir et prangende, men begrenset eksperiment.

Utseendet til denne prototypen gjør det imidlertid klart at store teknologiselskaper ser i Automatisk generering av interaktive verdener et strategisk terreng av første klasse. Selv om den faktiske bruken i dag er begrenset og plaget av tekniske ufullkommenheter, er retningen klar: modeller som i økende grad er i stand til å transformere tekst og bilder til spillbare opplevelser, og en industri som må bestemme hvordan den vil sameksistere med disse nye verktøyene.

Relatert artikkel:
Definisjon av virtual reality Hva du bør vite!