På andra sidan Atlanten har det börjat blossa upp en rejäl debatt om vilken roll upphovsrätten har när generativ AI nu slår igenom. En del handlar om vem som äger rätten till verk som skapats med AI – det är dock en mindre fråga än så länge eftersom domstol efter domstol konstaterar att AI-skapade verk inte skyddas. Det gäller för övrigt även i Sverige.
Den större frågan just nu handlar om huruvida upphovsrätten beaktas när AI-modellerna tränas. En lång rad författare, senast storheter som John Grisham och George RR Martin, har stämt Open AI för att man misstänker att GPT-modellerna tränats olovligen på författarnas verk. I samma anda har även bildbyrån Getty Images stämt företaget bakom bild-AI:n Stable Diffusion, och det finns fler exempel än så.
Jag skriver ”misstänker” ovan eftersom det inte är uppenbart vilka data som Open AI och de andra AI-företagen har använt för sin träning. Open AI i synnerhet har blivit allt mer förtegna och mindre transparenta för varje ny release.
Ett undantag finns dock och det är datasetet books3 som ingår i ett större träningsset kallat The Pile. Books3, som bland annat använts för att träna Metas Llama-modell, har legat öppet på en fildelningssajt ända tills i augusti när den danska Rättighetsalliansen fick datasetet nedplockat.
Books3 innehåller nära 200 000 böcker som gjorts tillgängliga helt utan författarnas och förlagens medgivande. Det är piratkopior alltså, något annat ord går knappast att använda. Och i veckan publicerade amerikanska tidskriften The Atlantic ett utmärkt stycke servicejournalistik: tidskriften har gjort hela databasen sökbar.
Twitter, förlåt X, svämmade snabbt över av författare som hittat sina verk i databasen. Och det var inga glada miner direkt. Det talas om masstämningar och någon konstaterade att AI-utvecklingen nu nått sitt ”Napster moment”: när den hypermoderna tekniken och den urgamla upphovsrätten återigen kolliderar precis som för över 20 år sedan när de stora skivbolagen fick p2p-tjänsten Napster nedstängd.
I Sverige har den här debatten inte riktigt tagit fart. Men det är inte så att det saknas skäl till debatt: jag roade mig med att göra ett antal sökningar i books3-databasen och hittade mängder av verk av svenska författare, både på svenska och engelska.
Bästsäljande författare som Fredrik Backman, Jan Guillou, Camilla Läckberg, Leif GW Persson, Malin Persson Giolito, Mons Kallentoft och Åsa Larsson finns där liksom hyllade verk från Johannes Anyuru, Jonas Hassen Khemiri, Therese Bohman och Peter Englund. Listan kan göras mycket längre; det är som sagt nästan 200 000 böcker vi talar om.
Om det blir någon debatt här återstår väl att se. Svenskarna har i modern tid haft ett så att säga ganska löst förhållande till just upphovsrätten, minns bara fildelningsdebatten kring The Pirate Bay, Ipred-lagen och hur politikerna lovade att ”inte kriminalisera en hel ungdomsgeneration”.
En annan intressant parallell värd att nämnas i sammanhanget är ju den illa dolda hemligheten att den svenska kronjuvelen inom modern tech, Spotify, byggde upp sin tjänst runt piratkopierad musik, innan skivbolagen senare klev på tåget.
Samtidigt måste man ta i beaktande att maktförhållandena i dag ser delvis annorlunda ut, liksom vilka som oftast pekas ut som ”the bad guys” i dag. Techbolagen har under de senaste 7-8 åren allt mer, och ibland med all rätt, pekats ut som aktörer med allt för mycket makt och allt för tveksamma metoder.
För 15-20 år sedan var skivbolagen, ”upphovsrättsmaffian” och Metallicas trummis Lars Ulrich de som ansågs använda sin stora makt för att slå ner på techbolag och teknikutvecklingen. I dag är det upphovsrättsinnehavarna – författare, konstnärer, fotografer – som ses som de som blir utnyttjade när ”big tech” ska mata sina AI-monster för framtida profiter.
Lägg till det den rädsla och skepticism som, helt naturligt, har väckts av AI-verktygens framfart. Det är liksom ingen slump att en nyhet om att ett företag ersätter de anställda med AI blir ett skräckexempel och inte en framgångsstory om teknisk innovation. Eller att det verkar finnas en stor förståelse för varför AI-hotade manusförfattare och skådespelare gått ut i strejk mot streamingjättarna. Det är helt enkelt tecken i tiden.
Var just den här debatten kommer att landa vet jag inte, mer än ”i domstol”. Men även om upphovsrätt kanske inte är det som folk bryr sig allra mest om sätter det här ändå fingret på flera frågor som är typiska för ett teknikskifte: vad som är värdefullt, vem som skapar det värdet och vem som ska få skörda frukterna. Och de frågorna lär vi få fortsätta diskutera.