UT Mediair
Jaargang 6 - nr. 6 - December 1994
INFORMATICA GAAT REKENEN MET TAAL
Taaltechnologie, de Twentse benadering
Informatica is als wetenschap een nog jong vakgebied,
maar het heeft zich intussen een eigen plaats verworven en de ontwikkelingen
gaan snel.
Zo staat momenteel de digitale snelweg volop in de
belangstelling. Een goede aanleiding voor een beschouwing over het vakgebied
door prof.dr.ir. A. (Anton) Nijholt van de faculteit Informatica.
Voor de zomer verscheen een boek over de opkomst van de
computer (zie kader). Op 29 september sprak prof. Nijholt zijn oratie uit ter
gelegenheid van het aanvaarden van het ambt van hoogleraar in de Theoretische
Informatica. De oratie handelde over de rol van natuurlijke taal en
taaltechnologie bij de toekomstige ontwikkelingen in de informatica.
Taal is een drager van de beschaving, het is bij uitstek
een communicatiemiddel tussen mensen. In onze samenleving worden de
communicatiemogelijkheden steeds complexer. Internationalisering vraagt om
kennis van vreemde talen, automatisering vereist gebruik van computertaal. De
behoefte aan computers die natuurlijke taal kunnen verwerken neemt daarom toe.
En dan niet voor het simpele tekstverwerken, maar voor vertaling van teksen,
zinsontleding, controle van spelling en grammatica, spraakherkenning,
eenvoudige toegang tot databases, etc.
EUROPA
Nijholt stond in zijn oratie uitvoerig stil bij het veeltalige Europa. Het
principe dat de talen van alle lidstaten gelijkwaardig zijn, betekent voor de
Europese Unie enorm veel vertaalwerk. De Unie geeft daar meer dan 20 miljard
gulden per jaar aan uit. Als machinaal vertalen goedkoper is, zijn dus grote
besparingen mogelijk.
Onderzoek aan taal was tot voor kort vooral zuiver
wetenschappelijk gericht op een beter begrip. Dat gold ook voor de industrie.
Philips zette onlangs het fundamentele onderzoek naar vertalen stop, omdat er
niet binnen afzienbare tijd een produkt te verwachten was.
Aan de Universiteit Twente heeft men onder leiding van
Nijholt daarentegen voor een ingebieursbenadering gekozen: doel van het
onderzoek is niet zozeer volledig theoretisch onderbouwde, als wel werkende
produkten af te leveren. Het begrip taaltechnologie typeert deze benadering.
Een half-automatische vertaler die niet voor alle eigenaardigheden van een taal
elegante oplossingen heeft, kan wel met grote tijdwinst een vertaling leveren
die alleen nog nabewerking door een deskundige behoeft. Onderdeel van de
pragmatische benadering, die volgens Nijholt uniek is binnen de Nederlandse
informatica-wereld, is voorts dat men zich beperkt tot één bepaald domein bij
het ontwerpen van een taalverwerkend systeem. Met taal introduceert men immers
kennis van de wereld en het is onmogelijk kennis van de hele wereld in het
systeem te representeren.
SCHISMA
Een voorbeeld van de Twentse ingenieursbeandering van
natuurlijke-taalverwerking is SCHISMA (Schouwburg Information System Access),
een samenwerkingsproject met PTTT Research. SCHISMA is een dialoogsysteem voor
schouwburginformatie en -boekingen. De interactie tussen gebruiker en computer
komt via toetsenbord en beeldscherm tot stand met behulp van getypte tekst. Het
systeem kan een aantal specifieke vragen, gesteld in de Nederlandse taal,
beantwoorden. Welke vragen het systeem kan beantwoorden, hangt niet af van de
structuur van die vargen (of ze 'volgens de regels' zijn gesteld), maar van de
inhoud (het systeem heeft alleen 'verstand' van schouwburgzaken).
Nijholt voorziet in de informatica een grote toekomst voor
natuurlijke-taalverwerking, maar hij is niet bevangen door de digitale
snelweg-koorts die met name in de VS heerst. Taaltechnologie zou de digitale
snelweg van op- en afritten voorzien, waardoor elk huishouden, bedrijf en
instelling eenvoudig toegang zou krijgen. Natuurlijke taal is echter, volgens Nijholt,
slechts één van de toegangsmogelijkheden, en bovendien zal de digitale snelweg
toch vooral bedrijven bedienen. Individuele burgers worden hooguit op een
digitale B-weg aangesloten.