Interview met UT-Nieuws

Symposium, workshop en essaywedstrijd Informatica

Computer krijgt gevoel voor humor

De computer staat voor niets: zelfs humor laat zich in algoritmen vangen. Dat is altans het uitgangspunt van de activiteiten die de faculteit Informatica van 11 tot 14 september ter gelegenheid van haar derde lustrum organiseert. Op het programma staan een symposium over 'computationele humor', een unieke wetenschappelijke workshop over de 'automatische interpretatie en generatie van verbale humor', en tenslotte een essaywedstrijd voor informaticastudenten over hetzelfde onderwerp. 'We wilden een thema dat aansluit bij ons eigen onderzoek, maar toch ook iets nieuws bevat', aldus initiatiefnemer prof.dr.ir. Anton Nijholt.

De meligheid van hackers en internetters is bijna spreekwoordelijk, maar anderszins lijkt het thema computer en humor vooral een contradictio in terminis. Geestige computers? Prof.dr.ir. Anton Nijholt (vakgroep Software Engineering en Theoretische Informatica, SETI) blijkt volstrekt serieus: 'Ieder verschijnsel is computationeel te benaderen. Eerst probeer je er consistente en verifieerbare formele modellen voor op te stellen. Dat lukt niet altijd even goed, maar als dat wel het geval is, kun je aspecten van het verschijnsel in software simuleren of aan de computer leren.'

Nijholt kan het weten. Hij leidt samen met prof.dr. Franciska de Jong de INF-onderzoekgroep Natuurlijke-taalverwerking die vanuit de computationele linguïstiek probeert de ongrijpbare menselijke taal in berekenbare modellen te vangen en via die modellen (en niet-conventionele technieken als fuzzy logic en neurale netwerken) de computer te leren met die taal om te gaan. Dit moet leiden tot intelligente systemen die zowel geschreven als gesproken natuurlijke taal adequaat verwerken, waarmee uiteindelijk een meer natuurlijke communicatie tussen mens en computer mogelijk wordt.

Vorderingen zijn er wat betreft automatisch samenvatten, vertalen en het voeren van een dialoog, zij het dat het daarbij meestal gaat om 'specifieke taal' binnen 'specifieke domeinen'. Zo ontwikkelt de UT-vakgroep Informatiesystemen een semi-automatisch indexeerprogramma dat chemische abstracts leest, 'begrijpt' en tot trefwoorden herleidt, zijn er semi-automatische hulpprogramma's voor het vertalen van technische onderhoudshandleidingen, en kun je in Duitsland al telefonisch openbaar vervoer-reisinformatie inwinnen bij een sprekende computervraagbaak, vertelt Nijholt.

Dat het een terrein is vol onverwachte valkuilen, blijkt overigens uit het verhaal over een in Austin, Texas ontwikkeld taalleerprogramma dat korte verhaaltjes kan lezen, samenvatten en weergeven. Dat programma bleek zich uiterst sexistisch te gedragen: in actiezinnen was het onderwerp steevast mannelijk, het lijdend voorwerp vrouwelijk. 'Dat bleek te komen doordat het steeds met zulke voorbeelden was gevoed', grinnikt Nijholt.

Het grote probleem bij de ontwikkeling van zulke taalverwerkende systemen is uiteraard dat natuurlijke taal emotioneel geladen en niet eenduidig is. Elk woord heeft meerdere betekenissen waarvan de juiste vaak alleen is af te leiden uit de context of de bedoeling van de gebruiker. Een moeras van ambiguïteit dat evenwel in de mens-mens interactie onontbeerlijk is omdat het de spreker de ruimte geeft om een dialoog gaande te houden, toespelingen te maken, onkunde te maskeren, kortom te communiceren.

Groter nog dan in de computationele linguïstiek lijken de modelleringsproblemen bij computationele humor. Taal functioneert juist als communicatiemedium doordat mensen bepaalde regeltjes hebben afgesproken, zoals 'normaal' woordgebruik, het zoveel mogelijk vermijden van dubbelzinnigheden, het eerbiedigen van samenhang en logica. Humor echter vindt zijn oorsprong in het feit dat mensen ook al dan niet bewust tegen die regels zondigen. Humor is per definitie meerduidig, dubbelzinnig, brekend met de regels van logisch taalgebruik, gezond verstand of goed fatsoen.

Om een diffuus veld als humor toch te kunnen modelleren is nadere definiëring nodig, zegt Nijholt. Er zijn legio definities, maar bij 'talige' humor ('taal is het humor-medium bij uitstek') komt het vooral neer op 'strijdigheid tussen voorkomen en bedoeling of betekenis' op het niveau van syntaxis (zinsbouw), semantiek (betekenis) of pragmatiek (effect). 'Humor is mensen op het verkeerde been zetten door een woord een andere betekenis te geven of volstrekt buiten de normale context te gebruiken.' Wel valt een fors deel van wat mensen als humor zien bij computationele humor buiten de boot, erkent Nijholt. Want humor heeft immers ook een niet-talige, non-verbale variant. 'Denk aan het pantomimespel van een clown.' En ook talige humor is niet altijd te computeriseren. Het gaat immers niet altijd om het zondigen tegen taalregels of logica. Zo kan een mop ook grappig zijn omdat er een grappige situatie wordt beschreven - de humor ontstaat dan vanuit kennis van de situatie of inlevingsvermogen.

De reikwijdte van computerhumor is dus beperkt, zegt Nijholt. Woordgrapjes en logische taalgrappen zijn relatief makkelijk. Nijholt kucht: 'Ik ben hier niet zo goed in, maar neem nu eens een grapje als: wat is wit en loopt door de woestijn? Een kudde yoghurt.' Hij vervolgt: 'Zo'n woordgrapje als dit, waar strijdige zaken worden gekoppeld, kun je heel goed modelleren. Vervolgens kun je de computer leren dat hier iets niet klopt, en dat hij er dus om kan "lachen". Zulke moppen zou je de computer, gegeven een bepaald domein, kunnen laten genereren en wellicht ook interpreteren.'

Andere grappen zijn lastiger. 'Een Brit, een Fransman en een Rus hebben het over geluk. De Brit zegt: geluk, dat is thuis bij de open haard zitten met een kop thee. Onzin, zegt de Fransman, geluk, dat is verliefd zijn op een mooie vrouw, haar kwijtraken en haar weer terugwinnen. De Rus schudt zijn hoofd. Dan zegt hij: geluk, dat is als om 4 uur 's nachts de KGB op je deur bonst, je toebrult: Iwan Iwanowitsj, je staat onder arrest, en jij kunt zeggen: die woont hierboven! Om een computer dit wrange grapje te laten snappen moet je eigenlijk een complete wereldkennis modelleren.'

Heeft onderzoek naar computationele humor zin? Nijholt: 'Je kunt natuurlijk zeggen: we hebben bij natuurlijke taal al modelleringsproblemen genoeg zonder dat we die humor erbij halen. Toch is computationele humor van belang. Het leert je hoe mensen met talige humor omgaan. En het leert je vooral wat nu in mens-machine interactie ontbreekt. Want als je taal wilt modelleren voor computationele doeleinden kun je niet om humor heen.'

Computationele humor is daarom onmisbaar voor onderzoek naar taalverwerkingssystemen en mens-machine communicatie. Om tot optimale mens-machine systemen te komen, zullen zo ongeveer alle menselijke eigenschappen (inclusief humor) moeten worden gemodelleerd en in zo'n systeem gestopt. Maar ook concretere toepassingen als robotica, automatische tekstinterpretatie (zoals indexeersystemen) en machinaal vertalen (denk aan ondertitels van Amerikaanse soaps) worden door humoronderzoek dichterbij gebracht.

Onderzoek naar computationele humor kan daarnaast volgens Nijholt ook relevant zijn voor de verdere ontwikkeling van kunstmatige intelligentie (AI). Humor is, net als bijvoorbeeld creativiteit, een essentieel bestanddeel van menselijke intelligentie, dat zich nu nog grotendeels aan een computationele benadering onttrekt. Een modellering van humor is echter onontbeerlijk voor een betere modellering van intelligentie.

De bijdrage van humor aan het slimmer maken van computersystemen wordt gedemonstreerd bij de zogenaamde Loebner-competitie - een wedstrijd waarbij onderzoeksgroepen programma's proberen te maken die zo goed een echte mens simuleren, dat een journalistenpanel er in een blinde Turing-test mee kan worden gefopt. 'Het blijkt dat programma's waarin bepaalde truuks, zoals ingeblikte grapjes, zijn ingebouwd, hoger worden aangeslagen dan andere. Humor heeft kennelijk een hoog gehalte aan Turing-power, en dat inzicht kun je benutten om de mens-machine interactie te verbeteren.'

Inmiddels zijn zowel op het gebied van kunstmatige intelligentie als in het natuurlijke-taal onderzoek reeds bescheiden resultaten geboekt met computationele humor, met name metaforisch en ironisch taalgebruik. Daarnaast vorderen de niet-computationele linguistiek en de cognitieve psychologie met de formalisering van humor. Volgens Nijholt worden de ontwikkelde modellen intussen al bij computerexperimenten geïmplementeerd.

Het gaat daarbij zowel om interpretatie van humor (de computer snapt de mop) als om generatie (de computer bedenkt de mop). Een onderzoeksgroep in Edinburgh onder leiding van Graeme Ritchie (te gast op het symposium) werkt aan generatie van verbale humor: de 'fully automated joke generator'.

Humor voor gevorderden, zoals subtiele ironie, blijft echter een brug te ver, zegt Nijholt: dat vereist een modellering van gebruiker en context. 'Je zou eigenlijk een ironieteken moeten hebben, zoals Hugo Brandt Corstius eens heeft geopperd. Maar inderdaad: een computer zal nooit met alle vormen van humoristisch taalgebruik overweg kunnen. Anderzijds: óók mensen kunnen dat niet. Als je hen buiten hun eigen context plaatst snappen ze ook niet alles meer. Waarom zou je dat dan van de computer wel verlangen?'

Dat de computer ironie nooit volledig zal kunnen modelleren wil niet zeggen dat je op dit vlak geen onderzoek kunt doen, vindt Nijholt. Je moet je alleen, net zoals AI-onderzoekers tegenwoordig doen, concentreren op een specifiek domein. Nijholt zet daarbij zijn kaarten op een benadering die uitgaat van een zelflerend neuraal netwerk dat via zijn ervaringen leert om verschil te maken tussen pakweg letterlijk en ironisch taalgebruik.

'Je kunt daarvoor niet de hele wereld in een model stoppen, maar misschien wel het equivalent van de eerste levensjaren van een kind. Misschien ontstaat in zo'n zelflerende netwerk dan een bepaalde "persoonlijkheid", die bijvoorbeeld al dan niet over een zeker gevoel voor humor beschikt. Je hebt dan geen mens gemodelleerd, maar een ding dat bepaalde zaken heeft "meegemaakt" en daar op een goede manier "mee om weet te gaan".'

We hebben het dan wel over toekomstmuziek, erkent Nijholt. 'Toen onlangs aan onderzoekers op het gebied van computationele linguïstiek werd gevraagd wanneer zij verwachtten dat een computer een willekeurig telefoongesprek van de ene taal in de andere zou kunnen vertalen, was het antwoord: niet voor 2050. Met andere woorden: wij zullen het niet meer meemaken.'

Coryfeeën

Voor het INF-symposium en de workshop heeft Nijholt gerenommeerde coryfeeën weten te strikken. Zo hebben de Amerikaanse AI-experts Marvin Minsky (schrijver van 'The Society of Mind') en Douglas Hofstadter (auteur van 'Gödel, Escher, Bach') al toegezegd van de partij te zijn. Andere geïnviteerde sprekers komen uit Engeland, Schotland, Israël en Japan.

Voor INF-studenten is rond het lustrumthema een essaywedstrijd op touw gezet onder het motto 'Berekende humor'. Het gaat om een essay van 4000 tot 8000 woorden waarin de computationele modellering van humor of de mogelijke toepassingen ervan centraal staan. Voor het beste essay ligt een prijs van duizend gulden klaar. Een jury onder leiding van schrijver Gerrit Krol zal de inzendingen beoordelen. Essays moeten voor 1 augustus binnen zijn bij de secretaris van de jury, drs. J. Hulstijn (SETI). Het winnende essay wordt in de symposiumbundel gepubliceerd en wellicht in een wetenschappelijk tijdschrift op het gebied van computationele linguïstiek.

UT Nieuws, 14 maart 1996, Ben van Raaij

Back to Anton Nijholt's Homepage.