Software als tekstschrijver

Wereldwijd zijn wetenschappers volop bezig om computersystemen te leren wat er op een afbeelding staat. Op basis van algoritmen herkennen systemen wat voor ons vanzelfsprekend is: wat gebeurt er en in welke context? Zo kan de bekende software van Karpathy en Fei Fei inmiddels objecten vertalen naar een concrete tekst. ‘Een man in een zwart T-shirt speelt gitaar’. ‘Een wegwerker in een oranje hesje werkt aan de weg’. ‘Twee jonge meisjes spelen met Lego’.
In de toekomst horen blinden en slechtzienden wellicht via software wat er om hun heen gebeurt. Bijzonder interessante ontwikkelingen. Technologie krijgt ogen om te zien.

Een vergelijkbare kwalitatieve versnelling is gaande in tekst-generatie voor bijvoorbeeld artikelen of social media teksten. Kunstmatige intelligente software wordt steeds beter in het genereren van tekst. Nog niet perfect, dat duurt nog wel even, maar de eerste serieuze resultaten worden geboekt.

Generating Image Descriptions

 

Generative Pretrained Transformer 2

Het Amerikaanse bedrijf OpenAI publiceerde in 2019 bijvoorbeeld een artikel over Generative Pretrained Transformer 2. GPT2 is een AI-systeem getraind om zelfstandig geloofwaardige teksten te genereren. Door de training voorspelt het systeem het volgende woord in een zin. Hierdoor produceert GPT2 volledige teksten. Het computersysteem heeft overigens geen weet van de betekenis van woorden, maar is wel goed in het doen van voorspellingen.

Automatisch gegenereerde nepartikelen

Het GPT2-model (met 774 miljoen parameters) werd in februari 2019 maar zeer beperkt beschikbaar gesteld aan derden. Op de website Talk to Transformer kun je stoeien met de GPT2-software. Je vult een titel in waarna de software een nepartikel produceert. De beperkte beschikbaarstelling van de software in de eerste maanden was tot dan toe een breuk met de open source-traditie van OpenAI. De makers van GPT2 besloten hiertoe, omdat ze vreesden dat de software gebruikt zouden worden voor negatieve doeleinden. Bijvoorbeeld voor het schrijven van misleidende nieuwsartikelen om zo de publieke mening te beïnvloeden. Een belangrijke overweging daarbij was de grote hoeveelheid desinformatie dat het systeem dagelijks kan produceren. Inmiddels is het gehele software pakket van GPT2 beschikbaar gesteld.

Open AI GPT2

 

Controverse over openstellen ‘gevaarlijke’ software

De beslissing van OpenAI om de software in het begin niet volledig beschikbaar te stellen opende de discussie over het delen van bepaalde AI-software. Want mag je zomaar iedere vorm van software openbaar maken en van anderen verwachten dat ze het negatieve gebruik ervan gaan bestrijden?

Stel dat een bepaalde groepering de politie in een kwaad daglicht wil stellen. Met een GPT2-achtig systeem kunnen snel artikelen worden gegenereerd die het sentiment richting de politie negatief beïnvloeden. Op basis van klikgedrag van lezers leert het systeem steeds beter in te spelen op negatieve emoties. Gefantaseerde headlines als  ‘Politie grijpt hardhandig in bij vreedzame demonstratie tegen te tolerant immigratiebeleid’ kunnen razendsnel leiden tot geloofwaardige artikelen die de werkelijkheid geweld aandoen. Een goede reden om gezond kritisch te zijn op het gebruik van deze technologie.

Grover-systeem: het medicijn tegen nepnieuws

Niet lang na de release van GPT2 kwam het Allen Institute for Artificial Intelligence − in 2013 opgericht door mede-oprichter van Microsoft Paul Allen (1953-2018) − met het Grover-systeem. Een nieuw AI-model, losjes gebaseerd op het GPT2-model van OpenAI. Op de website introduceert het instituut de software als ‘het medicijn tegen kunstmatig intelligent gecreëerd nepnieuws’.

Het Grover-model kan zelf nepnieuws maken en herkent zijn eigen manier van werken, gedachtesprongen en voorspellingen. Hierdoor kan het ook goed nepnieuws opsporen. Het systeem is dus tegelijkertijd ziekteverwekker en medicijn. Grover detecteert ook nepnieuws van andere systemen tot wel 92% nauwkeurig. Net zoals OpenAI heeft ook het Allen Institute for Artificial Intelligence besloten om de grote dataset van Grover in beginsel niet openbaar te maken.

automatisch gegenereerde teksten

Journalistieke toepassingen van kunstmatige intelligentie

Het is niet ondenkbaar dat journalisten en bloggers in de toekomst enkel een kladconcept schrijven van hun artikel. Een kunstmatig intelligent systeem rondt het dan netjes voor ze af. Inclusief de correctie van taalfouten en een paar pakkende titels. Je ziet nu al autocorrect- en autocomplete-software opduiken met suggestie voor nieuwe woorden of zinnen. Dat zal dus verder uitgebreid worden.

Het is speculatief, maar het zou kunnen zijn dat in de toekomst GPT2-achtige systemen ook gaat helpen bij het omzeilen van auteursrecht en intellectueel eigendom. Scholieren, onderzoekers, journalisten en auteurs kunnen een GPT2-systeem hun teksten laten herschrijven om plagiaat te voorkomen. De originele bron is dan niet meer te herleiden, maar de tekst is nog wel goed leesbaar.

Tegelijkertijd kun je je afvragen of auteursrecht en intellectueel eigendom hierdoor niet betekenisloos wordt. Het risico ontstaat dat auteurs en journalisten gemakzuchtig stukken tekst kopiëren zonder duiding te geven, hoor- en wederhoor toe te passen of objectief rapporteren. Knippen en plakken is immers veel gemakkelijker dan je grondig verdiepen in een onderwerp.

Voordelen Generatieve AI-software

Een andere mogelijke toepassing van Generatieve AI-text-software is het samenvatten van teksten. Stel je voor: een kunstmatig intelligent systeem vat een rapport van vijftig pagina’s samen tot anderhalf A4. Na het lezen van twintig samenvattingen bent je al een stuk wijzer over een bepaald onderwerp. Op basis van de samenvattingen besluit je welk rapport je uitgebreid wilt lezen. Voordat deze software perfect werkt, zijn we nog wel een paar jaar verder, maar dit soort software wordt ongetwijfeld gemeengoed. Naast samenvatten zou software ook matige auteurs kunnen helpen met schrijfsuggesties, een bepaalde verhaallijn en met dialogen. Automatisch gegenereerde dialogen kunnen ook film- en scripschrijvers een inspiratieboost geven.

Automatisch code schrijven voor programmeurs

Het is speculeren, maar wellicht komt er autocomplete software op de markt voor programmeurs. Software die tijdens het code schrijven voorstelt hoe de volgende regel programmeercode eruit ziet. Programmeren zal hierdoor zoveel sneller gaan. Het programma Deep TabNine doet al zoiets. Het is geen GAN-technologie, maar een andere vorm van machine learning. Het is getraind op twee miljoen bestanden van coderingwebsite GitHub. Deze Deep TabNine-software werkt nog niet perfect, maar het is een kwestie van tijd voordat dat verbetert.

automatisch gegenereerde teksten

 

De toekomst van tekst genererende AI-software

In de toekomst worden onze standaard e-mailberichten waarschijnlijk voor ons geschreven. We hoeven ze enkel nog te lezen en goed te keuren. Het ligt ook voor de hand dat systemen namens ons gaan reageren op eenvoudig te beantwoorden mailtjes. Dat klinkt nu nog futuristisch, maar machines leren snel van onze goed- en afkeuring. Zo zal GPT2-achtige-software chatbots beter laten functioneren en grote stukken tekst goed en vrijwel realtime vertalen. De kwaliteit van autocomplete-software gaat ongetwijfeld met sprongen vooruit. En wie weet gaat het aanvullen van onze zinnen in e-mails, blogs en berichten op sociale media door GPT2-achtige software in de toekomst heel natuurlijk aanvoelen.

Wil je meer lezen over de impact tekst-generatieve software?
Download dan gratis het rapport Machines met verbeeldingskracht.

 

Boek Jarno als spreker

Mijn klanten