-
Leder for utstedelse og styring av BankID
-
Head of Finance
-
Direktør for KI Norge
-
Konserndirektør digitalisering og teknologi
-
Senior Full-Stack Utvikler | Lawai
-
Senior Security Engineer | Firi
-
Medeier* | Boitano
-
Utvikler | Blank
-
FullStack Site Reliability Engineer | Vespa.ai
-
Lead Security Software Engineer | Vespa.ai
kunstig intelligens
OpenAI lanserer GPT-5.4: Sikter mot proffmarkedet med million-kontekstvindu
OpenAI har sluppet en ny generasjon av sin språkmodell. GPT-5.4 byr på et kontekstvindu på opptil én million tokens, en dedikert resonneringsmodell og et nytt API-system som skal kutte kostnader for utviklere.
Torsdag lanserte OpenAI GPT-5.4, en oppdatering selskapet selv posisjonerer mot komplekst og profesjonelt kunnskapsarbeid. Modellen gjøres tilgjengelig i tre ulike varianter for å treffe forskjellige bruksområder i bedriftsmarkedet:
GPT-5.4: Standardversjonen.
GPT-5.4 Thinking: En dedikert resonneringsmodell for flertrinns problemløsning.
GPT-5.4 Pro: En versjon optimalisert for krevende operasjoner.
Nytt oppslagssystem for API-brukere
For selskaper som bygger tjenester på OpenAIs plattform, er det to tekniske endringer som peker seg ut. API-versjonen av GPT-5.4 får et kontekstvindu på én million tokens. Ifølge selskapet krever modellen nå færre tokens for å løse de samme problemene som forgjengerne.
Samtidig endres måten API-en håndterer integrasjoner ("tool calling") på, gjennom et nytt system de kaller Tool Search. Tidligere måtte utviklere inkludere definisjonene for alle tilgjengelige verktøy i selve system-prompten, noe som ble kostbart og token-krevende ved bruk av mange integrasjoner. Det nye systemet lar modellen i stedet gjøre oppslag i verktøydefinisjonene kun ved behov, noe som skal gi raskere og billigere API-kall.
Viser til egne testresultater
Som vanlig ved nye lanseringer, viser OpenAI til en rekke forbedrede resultater i ytelsestester. GPT-5.4 oppnår ifølge selskapet 83 prosent på deres egen GDPval-test for kunnskapsarbeid, og markerer seg i "computer use"-testene OSWorld-Verified og WebArena Verified.
Tredjeparter melder også om ytelsesbyks. Brendan Foody, toppsjef i Mercor, hevder at modellen tok førsteplassen i deres APEX-Agents-test for jus og finans, og at den håndterer store oppgaver som finansielle modeller og juridiske analyser raskere og billigere enn konkurrentene.
Sikkerhet og hallusinasjoner
For å møte bekymringene rundt generativ AI i næringslivet, hevder OpenAI at de har redusert feilraten betydelig. Sammenlignet med GPT-5.2 skal den nye modellen være 33 prosent mindre tilbøyelig til å gjøre feil i enkeltpåstander, mens andelen feil i overordnede svar angivelig er redusert med 18 prosent.
Selskapet har også innført nye sikkerhetsevalueringer for "Thinking"-modellenes tankerekke ("chain-of-thought"). Et kjent problemfelt for AI-sikkerhet er at avanserte modeller i teorien kan skjule sine egentlige resonnementer. OpenAIs egne tester indikerer imidlertid at GPT-5.4 Thinking mangler evnen til å holde tankeprosessen skjult, noe som gjør at kontinuerlig overvåking av tankerekken forblir en fungerende sikkerhetsmekanisme.