kunstig intelligens

OpenAI lanserer GPT-5.4: Sikter mot proffmarkedet med million-kontekstvindu

OpenAI har sluppet en ny generasjon av sin språkmodell. GPT-5.4 byr på et kontekstvindu på opptil én million tokens, en dedikert resonneringsmodell og et nytt API-system som skal kutte kostnader for utviklere.

Illustrasjonsfoto. ChatGPT tok verden med storm. Nå er en langt kraftigere versjon ute.
Publisert

Torsdag lanserte OpenAI GPT-5.4, en oppdatering selskapet selv posisjonerer mot komplekst og profesjonelt kunnskapsarbeid. Modellen gjøres tilgjengelig i tre ulike varianter for å treffe forskjellige bruksområder i bedriftsmarkedet:

  • GPT-5.4: Standardversjonen.

  • GPT-5.4 Thinking: En dedikert resonneringsmodell for flertrinns problemløsning.

  • GPT-5.4 Pro: En versjon optimalisert for krevende operasjoner.

Nytt oppslagssystem for API-brukere

For selskaper som bygger tjenester på OpenAIs plattform, er det to tekniske endringer som peker seg ut. API-versjonen av GPT-5.4 får et kontekstvindu på én million tokens. Ifølge selskapet krever modellen nå færre tokens for å løse de samme problemene som forgjengerne.

Samtidig endres måten API-en håndterer integrasjoner ("tool calling") på, gjennom et nytt system de kaller Tool Search. Tidligere måtte utviklere inkludere definisjonene for alle tilgjengelige verktøy i selve system-prompten, noe som ble kostbart og token-krevende ved bruk av mange integrasjoner. Det nye systemet lar modellen i stedet gjøre oppslag i verktøydefinisjonene kun ved behov, noe som skal gi raskere og billigere API-kall.

Viser til egne testresultater

Som vanlig ved nye lanseringer, viser OpenAI til en rekke forbedrede resultater i ytelsestester. GPT-5.4 oppnår ifølge selskapet 83 prosent på deres egen GDPval-test for kunnskapsarbeid, og markerer seg i "computer use"-testene OSWorld-Verified og WebArena Verified.

Tredjeparter melder også om ytelsesbyks. Brendan Foody, toppsjef i Mercor, hevder at modellen tok førsteplassen i deres APEX-Agents-test for jus og finans, og at den håndterer store oppgaver som finansielle modeller og juridiske analyser raskere og billigere enn konkurrentene.

Sikkerhet og hallusinasjoner

For å møte bekymringene rundt generativ AI i næringslivet, hevder OpenAI at de har redusert feilraten betydelig. Sammenlignet med GPT-5.2 skal den nye modellen være 33 prosent mindre tilbøyelig til å gjøre feil i enkeltpåstander, mens andelen feil i overordnede svar angivelig er redusert med 18 prosent.

Selskapet har også innført nye sikkerhetsevalueringer for "Thinking"-modellenes tankerekke ("chain-of-thought"). Et kjent problemfelt for AI-sikkerhet er at avanserte modeller i teorien kan skjule sine egentlige resonnementer. OpenAIs egne tester indikerer imidlertid at GPT-5.4 Thinking mangler evnen til å holde tankeprosessen skjult, noe som gjør at kontinuerlig overvåking av tankerekken forblir en fungerende sikkerhetsmekanisme.