Beeld en Geluid

HOSAN

Automatische spraakherkenning (ASR) wordt steeds breder toegepast binnen de creatieve industrie – van interactieve installaties en voicebots tot ondertiteling van media. Met het project Hoogwaardige Spraakherkenning voor al het Nederlands (HOSAN) werken partijen binnen de sector samen aan een inclusievere toepassing van deze technologie. Uit onderzoek blijkt namelijk dat ASR aanzienlijk minder goed werkt voor bepaalde groepen, zoals mensen met een accent of dialect, ouderen, kinderen en sprekers voor wie Nederlands een tweede taal is. Daardoor dreigen zij uitgesloten te worden van digitale diensten waarin ASR een sleutelrol speelt.

Beeld & Geluid stelt in dit project grote hoeveelheden spraakdata uit het NPO-archief beschikbaar om – met behulp van de nationale supercomputer van SURF – nieuwe, representatieve spraakmodellen te ontwikkelen. In deze eerste fase wordt, op basis van concrete use cases, proefondervindelijk verkend wat er technisch en organisatorisch nodig is om spraakherkenning te verbeteren voor álle Nederlandse sprekers.

Er wordt €89.403 als PPS-programmatoeslag ingezet.

Tags: