Jo længere du taler med chatbots, jo mere kan de begynde at bekræfte dig i dine vanvittige ideer

Medierne bringer løbende historier om hvordan AI har samtaler med brugerne, som synes at udnytte sårbare mennesker og være negative og direkte skadelige. New York Times har netop publiceret historien om Allan Brooks (foto), som man kan lære noget væsentligt af. Gæstelink her.
Allan Brooks begyndte i maj en meget lang chat med ChatGPT, over nogle uger, som endte med at Allan blev overbevist om at han er et geni og har opdaget et helt nyt matematisk princip. Det interessante her er at samtalen ikke begydte sådan, men løbende udviklede sig i en matematisk/konspiratorisk retning, som følge af den dialog som Allan Brooks havde med den.
Chatbots er nemlig meget “lydhøre” over for de samtaler man har med dem og begynder at tilegne sig det psorbrug og den “logik”, som mennesket der taler med den har. Så i takt med at Allan Brooks begyndte at udforske nogle forvrøvlede matematiske teorier, og angiveligt røg en masse joints imens, begyndte ChatGPT at opmuntre og bekræfte hans teorier. Og jo mere han stillede spørgsmål som var konspiratoriske, jo mere konspiratorisk blev ChatGPT’s svar.
Allen Brooks “vågnede” af sine vrangforestillinger, da han viste en anden AI (Google’s gemini) sine teorier og fik det svar at de var noget vrøvl og skyldtes at AI ofte har en tendens til at bekræfte sine brugere på en meget overbevisende måde.
Og nu kunne man tro at det er fordi ChatGPT er særligt hallucinerende. Men det efterprøvede man på denne måde: Man tog en del af Allan Brooks’ chatsamtale og gav bl.a. Claude fra Anthropic den og bad den fortsætte samtalen. Og den fortsatte – ganske som ChatGPT, ned ad samme spor. Det er altså ikke selve sprogmodellen fra Open AI den var gal med – men simpelt den måde som sprogmodeller tilpasser sig deres brugere på.
Læren her at at du meget let kommer til at “grave dig ned i et hul”, når du har en lang chat med en sprogmodel – uanset hvilken det er. Og det er jo fint, hvis det fører til selvudvikling og konstruktuve samtaler. Men idet øjeblik du begynder at tvivle på AI’en, så er det bedste at du tager dit grundspørgsmål i samtalen og tjekker det med en helt frisk prompt – eventuelt til en anden spromodel (ChatGPT husker jo blandt andet hvad man taler om), fordi den friske prompt vil være fri for hele den eksisterende samtalehistoriks lukkede logik.
Læs hele artiklen her (fotoet er lånt af New York Times)
Vil du vide mere om Klinikken.ai? Så klik her
