Aantal ‘open’ alternatieven voor ChatGPT groeit snel, maar hoe open is AI echt?

 » Werk & ondernemen » Nijmegen innoveert

ChatGPT van het bedrijf OpenAI lijkt alomtegenwoordig, maar open source-varianten ervan krijgen steeds meer de overhand. In een half jaar tijd zijn er tenminste vijftien serieuze alternatieven ontstaan die allemaal tenminste één belangrijk voordeel hebben boven ChatGPT: ze zijn een stuk transparanter. Inzicht in trainingsdata en algoritmen is van cruciaal belang voor het verantwoord gebruik van en onderzoek naar generatieve AI, stellen taalwetenschappers van de Radboud Universiteit.

Bedrijven als OpenAI beweren soms dat achterliggende taalmodellen geheim moeten blijven omdat ze 'existentiële risico's' met zich meebrengen, maar de onderzoekers zijn niet onder de indruk van dit argument. Mark Dingemanse: "Dat gepraat over existentiële risico's is toch vooral een dekmantel voor de reële schade die dit soort modellen nu al veroorzaakt door ingebakken vooroordelen en de vloedgolven aan spam." Openheid, zo stellen de onderzoekers, maakt controle mogelijk en maakt het ook gemakkelijker om makers van zulke modellen verantwoordelijk te houden voor de gegevens die er in gaan (vaak auteursrechtelijk beschermd) en voor de teksten die ze uitspuwen. 

Steeds opener

De onderzoekers hebben het snel veranderende landschap aan varianten van ChatGPT in kaart gebracht in een eerste overzicht dat online verder groeit. Daaruit blijkt dat er al veel werkende alternatieven zijn, maar dat 'open source' veel gradaties kent en dat veel modellen elementen bevatten die niet voor breed gebruik bedoeld zijn. Werk aan de winkel dus, al zijn de wetenschappers voorzichtig optimistisch over de ontwikkelingen. 

Onderzoeker Andreas Liesenfeld: "Het is goed om te zien dat er zoveel open alternatieven in opkomst zijn. Door de populariteit van ChatGPT is het makkelijk om te vergeten dat we eigenlijk niets weten van de tekstbestanden die erin gegaan zijn als trainingsdata, en van andere trucjes die OpenAI achter de schermen uithaalt. Dat is riskant voor wie op dit soort modellen wil bouwen, bijvoorbeeld met nieuwe toepassingen en chatbots. Open modellen maken kritisch en fundamenteel onderzoek mogelijk."  

De onderzoekers laten zien dat modellen uiteenlopen in hoe open ze precies zijn: sommige delen alleen het taalmodel zelf, andere geven ook inzicht in de trainingsdata, sommige zijn ook uitgebreid gedocumenteerd. Mark Dingemanse: "ChatGPT in huidige vorm is niet geschikt voor verantwoord gebruik in onderzoek en onderwijs. Het kan wel woorden herkauwen maar heeft geen benul van betekenis, auteurschap, of bronvermelding. En dat het gratis is betekent vooral dat je gratis werkt voor OpenAI. Met open modellen kunnen we tenminste onder de motorkap kijken en bewuste keuzes maken." 

Verdere punten / voorbeelden 

  • Er worden stappen gezet om de modellen opener te maken. Elke maand komen er weer nieuwe modellen bij in verschillende graden van openheid; deze worden bijgehouden op opening-up-chatgpt.github.io  

  • Veel modellen spelen leentjebuur bij elkaar: een voordeel van openheid, maar de modellen nemen het niet zo nauw met licenties. Zo bouwt het populaire Falcon 40B-instruct model voort op een dataset (Baize) die strikt voor onderzoeksdoeleinden is, maar de Falcon 40B makers moedigen ook commercieel gebruik aan. 

  • Een belangrijke reden dat ChatGPT zo vloeiend voelt is het mensenwerk dat komt kijken bij de zogeten "instruction-tuning", het bijsnoeien van de gegenereerde teksten om ze volgzaam en behulpzaam te doen klinken. Open alternatieven maken het mogelijk om dit beter te begrijpen. 

Dit artikel verscheen eerder op Radboud Universiteit.

Dit vind je misschien ook interessant...