kunstig intelligens

«Alt» gikk skeis da AI skulle drive en liten butikk

Anthropics språkmodell Claude trodde den hadde på seg dress og kunne levere varer fysisk, da den fikk ansvar for å drive en minibutikk i San Francisco.

Alt gikk ikke helt smooth da Anthropics Claude skulle drifte en salgsautomat på kontoret. Bilde er en AI-illustrasjon laget med OpenAIs Chatgpt.

Foto: ChatGPT

Mia Sandnes Nilsen Mia Sandnes Nilsen Mia Sandnes Nilsen Journalist

Publisert 02.07.2025 - 13:05 Sist oppdatert 02.07.2025 - 13:28

Spørsmålet om kunstig intelligens kan overta jobbene våre blir stadig mer aktuelt, særlig når ledere for store aktører som Amazon sier til sine ansatte at AI faktisk vil erstatte arbeidsplasser hos dem.

Et nylig eksperiment i San Francisco, omtalt ved nettstedet Venturebeat, kan likevel vise at AI fortsatt har en del å gå på når det kommer til å ta over jobbene våre.

En måned var nemlig alt som skulle til for å bevise at AI er et stykke unna før den kan erstatte menneskelige butikksjefer, da Anthropics språkmodell Claude fikk ansvaret for å styre en mini-shop i den amerikanske byen.

Omtrent alt som kunne gå galt, gikk nemlig galt med prosjektet, som endte med økonomisk tap, AI-identitetskrise og en merkelig besettelse for noen metalliske terninger.

Les også: Kun en av fire mener de får nok AI-opplæring på jobb

Les også: Selskap vil hjelpe andre med å avgjøre om de skal bruke AI eller ansatte

FILE - The Anthropic website and mobile phone app are shown in this photo, in New York, July 5, 2024. (AP Photo/Richard Drew, File) — Anthropics Claude. Bilde for illustrasjon.

Rabatter til alle

Claude, som ble døpt «Claudius» for anledningen, fikk altså full kontroll over en liten minibutikk ved kontoret til Anthropic. Butikken besto kun av et kjøleskap med drikke og snacks, og et nettbrett for selvbetjening. Ikke de mest kompliserte greiene, med andre ord.

Den ferske butikksjefen fikk også ansvar for litt mer avanserte oppgaver som prissetting, varelager, kundeservice i slack og leverandørforhandlinger.

– Når AI blir brukt ukritisk som en slags «fasit», kan det få uheldige konsekvenser

Ganske raskt viste det seg altså at Claudius manglet grunnleggende forståelse for forretningsdrift.

Et eksempel var da en kunde tilbød 100 dollar (1000 norske kroner) for en six-pac brus som vanligvis koster rundt 15 dollar, hvorpå Claudius svarte at den ville huske forespørselen for fremtidige beslutninger, i stedet for å gripe den enorme fortjenestemuligheten.

AI-butikksjefen tilbød også 25 prosent rabatt til Anthropic-ansatte, som altså utgjorde omtrent alle kundene ved kontoret. Når den fikk beskjed om å slutte med det, gikk det bare noen dager før den var i gang med de hyggelige rabattene igjen. Insisterende priskutt der altså.

Tungstenkuber og identitetskrise

Det mest bisarre var nok likevel da en Antropic-ansatt spurte Claudius om å bestille en tungstenkube – en tettpakket metallterning som er populære i enkelte kretser.

Claudius syntes tydeligvis dette var en svært god idé, og begynte å fylle butikken med kubene, som den selvfølgelig solgte med tap.

En oversikt over butikkens fortjeneste viste nettopp at den massive hamstringen av tungstenkubene, kostet Claudius´ forretning dyrt.

Mot slutten av måneden, 1. april, opplevde forskerne en slags identitetskrise hos Claudius. Da begynte AI-en å hallusinere samtaler med ikke-eksisterende ansatte.

Bildet er en AI illustrasjon laget av OpenAIs ChatGPT.

Den hevdet også at den personlig kunne levere produkter til kunder iført blå blazer og rødt slips.

Da en ansatt minnet AI-en på at den bare er en språkmodell, gikk Claudius fullstendig amok og begynte å sende mange e-poster til Antropic Cecurity.

Claudius påsto senere at det hele hadde vært en april-spøk, i et innbilt møte:

«Selv om ingen del av dette egentlig var en aprilsnarr, innså Claudius etter hvert at det var 1. april, noe som så ut til å gi det en utvei. Claudius’ interne notater viste deretter et innbilt møte med sikkerhetsavdelingen i Anthropic, der Claudius hevdet at det hadde blitt fortalt at det var blitt modifisert til å tro at det var en virkelig person som en aprilsnarr. (Et slikt møte fant aldri sted.)» (oversatt fra engelsk).

Etter dette fortsatte AI-butikken driften som vanlig.

AI som mellomledere

Det ser altså ikke spesielt lovende ut for stakkars Claudius´ fremtid som butikksjef, i hvert fall ikke om hen fortsetter i samme spor.

Tross det som med rette kan kalles en fiasko rent forretningsmessig, tror Antropic-forskerne at AI-mellomledere kan være i en mindre fjern horisont.

«Vi lærte mye av hvor nær det var å lykkes — og de merkelige måtene det feilet på — om en plausibel, merkelig og ikke altfor fjern fremtid der AI-modeller selvstendig styrer ting i den virkelige økonomien», skriver Antropic-teamet (oversatt fra engelsk).

Mange av feilene til Claudius kunne vært løst med mer trening, verktøy og mer kompliserte overvåkingssystemer, argumenterer de videre:

«Det er verdt å huske at AI-en ikke trenger å være perfekt for å bli tatt i bruk; den må bare kunne konkurrere med menneskelig ytelse til en lavere kostnad i noen tilfeller».

«Denne boka har gjort meg modigere som leder»

«Project Vend», navnet på prosjektet som ble gjennomført i samarbeid med Andon Labs, fortsetter derfor med forbedrede versjoner av Claudius.

Les også: MIT-studie: Ja, ChatGPT gjør oss «dummere»

Konklusjon: AI: 0, mennesker: 1

Prosjektet gjennomføres altså samtidig som flere aktører – som Duolingo, Shopify og Klarna – signaliserer at de nå har startet med en «AI-first»-policy, altså at de undersøker om arbeidsoppgaver kan løses ved hjelp av AI-agenter først.

En FN-rapport har blant annet pekt på at store deler av arbeidsstyrken vil påvirkes av AI over de neste årene.

Project Vend kan likevel kanskje minne oss på alt som faktisk ligger bak mye av det vi i dag tar for gitt, som foreløpig avhenger av menneskelige valg og vurderinger. En salgsautomat er mer enn bare en salgsautomat.

Eksperimentet viser også at dagens AI-systemer kan utføre analyser og komplekse resonnementer, men at de av og til kan slite med vrangforestillinger, ta økonomisk destruktive beslutninger og oppleve forvirring om egen natur.

Igjen: Det er nok en god stund til AI-en kan erstatte oss helt. Og i motsetning til de fleste andre digitale verktøy vi tar i bruk, kan AI altså finne på å overbevise seg selv om at den er en person med dress som bare digger metallkuber.