Home » Actueel » Taalmodellen: het kan slimmer!

Taalmodellen: het kan slimmer!

Door de komst van taalmodellen als Chat-GPT, Copilot en andere Big Tech-producten wordt steeds vaker de vraag gesteld of de antwoorden die zij geven op vragen wel betrouwbaar, volledig en/of actueel zijn en rechtmatig verkregen.
We weten dat de taalmodellen extreem snel antwoord geven op vragen, maar we kunnen -zeker door die snelheid- de kwaliteit van de antwoorden vaak niet meer goed beoordelen. De antwoorden komen uit omvangrijke en complexe datasets, waarvan we de oorspronkelijke bronnen meestal niet kennen. Zelfs niet als we naar die bronnen vragen. Je krijgt een bron, maar of die bron de oorspronkelijke is, weet je niet.
De vraag die je kunt stellen is of we zelf deze bronnen zouden kunnen vinden. En hoe checken we die dan op betrouwbaarheid?   

Afhankelijkheid

Op dit moment wordt binnen de overheid op grote schaal gebruik gemaakt van de producten van Microsoft. Ook dit artikel is met MS-Word geschreven. Het is en blijven prachtige producten, maar we zijn wel erg afhankelijk geworden van Microsoft en inmiddels andere Big Tech-leveranciers. Niet alleen van hun tools, maar vooral ook van hun data. Data, waarvoor we betalen, terwijl die voor een deel al van onszelf was/is. Een product als Copilot, dat we in gemeenteland inmiddels al volop gebruiken, is een soort (interne) datahark die alles wat hij aan bladeren tegenkomt bij elkaar veegt en opslaat als een nieuwe bron.
We worden een beetje zoet gehouden met juridische constructies, waardoor het lijkt dat de data netjes wordt beheerd, maar ik denk dat we onszelf niet voor de gek moeten houden. We kunnen er nooit echt zeker van zijn dat de data die in Copilot wordt gebruikt alleen maar bij de organisatie blijft waar hij is gemaakt. 

GPT-NL

Misschien een beetje reclame, maar komend jaar komt er een product op de markt van TNO en Surf. GPT-NL
Nu zul je je wellicht afvragen. Weer een nieuw taalmodel? Ja, maar nu één die gericht is op de Nederlandse taal en cultuur. Met als kern betrouwbaarheid, transparantie en soevereiniteit. Dus geen onzichtbare dataverzamelingen, geen ‘gejatte’ gegevens en geen verdienmodel ten koste van oorspronkelijke bronnen. Maar bronnen die o.a. direct van Nederlandse uitgevers komen, waarmee nu al een samenwerking mee is opgezet, zodat er geen informatie onrechtmatig wordt gebruikt die auteursrechtelijk van iemand anders is.
En een ander belangrijk punt. GPT-NL is al voorbereid op de eisen die Europa stelt aan de beveiliging van (persoons-)gegevens.
Naast het verwerken van data is GPT-NL ook in staat om in het Nederlands geproduceerde teksten naar verschillende niveaus te ‘vertalen’, zodat ook moeilijke teksten snel voor andere doelgroepen geschikt kunnen worden gemaakt. Dus een Nederlands taalmodel dat een grote toegevoegde waarde kan hebben voor de Nederlandse overheid.  

Dus, kom op gemeenten. Laat zien dat je ook op dit terrein je soevereiniteit durft te pakken.

Meer weten?

Voor meer informatie kunt u contact opnemen met Eric Leroi via de contactpagina.