Dansk Sprogteknologi i Verdensklasse – rapport fra sprogteknologiudvalget
Kunstig intelligens skal blive bedre til dansk.
I begyndelsen af 2018 nedsatte Kulturministeren et sprogteknologisk udvalg under Dansk Sprognævn. Udvalget har i løbet af 2018 inddraget mere end 120 offentlige og private institutioner og virksomheder i en række workshops og seminarer for at afdække behovet og afsøge mulighederne for at understøtte brugen af dansk i forbindelse med kunstig intelligens (AI). Resultaterne præsenteres nu i rapporten Dansk Sprogteknologi i Verdensklasse.
Meldingen fra alle sider er meget klar: Udvikling af chatrobotter, taleassistenter, tekstanalysesystemer, automatisk oversættelse mm. med høj sproglig kvalitet for dansk er en enorm udfordring for de globale og lokale AI-virksomheder. De investeringer som skal til, er for høje, og det modvirker udviklingen af nye AI-produkter i et sundt og konkurrencedygtigt marked.
Der er derfor brug for offentlige investeringer i åbne sprogresurser og bedre værktøjer til dansk sprogforståelse (tale og tekst) for at det danske samfund kan få udbytte af den nye teknologi. Samtidig bør der investeres mere i uddannelse og forskning i dansk sprogteknologi for at dansk også kan være med i fremtidens systemer.
Gennem årene er der med offentlig og privat støtte blevet udviklet en række sprogresurser og -værktøjer for dansk, men indsatserne har været spredte og ikke koordinerede. Der har bl.a. ikke været tilstrækkelig opmærksomhed på at disse resurser, som ofte har kostet millionbeløb at producere, efterfølgende skulle kunne stilles frit til rådighed. Det betyder at mange datasæt kun er begrænset eller slet ikke anvendelige.
Udvalget foreslår derfor:
- At der oprettes en organisation som har til opgave at koordinere indsatsen for dansk sprogteknologi
- At der oprettes en dansk sprogbank som skal understøtte udviklingen og vedligeholdelse af danske produkter baseret på sprogteknologi og kunstig intelligens, bl.a. ved at gøre danske sprogresurser og sprogværktøjer frit tilgængelige, herunder en dansk termbank
- At uddannelse i dansk sprogteknologi prioriteres
- At forskning i dansk sprogteknologi styrkes.
Udvalget foreslår endvidere at offentlige institutioner får mere fokus på at de ved at stille sproglige data til rådighed kan være med til at sikre brugen af dansk på alle samfundsområder.
I forbindelse med udgivelsen af rapporten udgiver udvalget en oversigt over de danske sprogresurser og sproglige datasæt som har kunnet identificeres i forbindelse med udvalgets arbejde, og som evt. kan danne grundlaget for en dansk sprogbank.
Kulturminister Mette Bock udtaler:
“Jeg vil gerne kvittere for det store og fagligt velfunderede arbejde, som Sprogteknologiudvalget har lagt i sin rapport. Der tegner sig et tydeligt billede af, at teknologier med sproglige komponenter spiller en stadig voksende rolle. Det er afgørende, at det danske sprog også kan følge med ind i en tidsalder, hvor sprogteknologien gradvist integreres i flere og flere områder af vores liv. Jeg ser frem til at se nærmere på udvalgets konklusioner og anbefalinger og glæder mig samtidig over, at regeringen allerede har fokus på området i forbindelse med planen om Digital velfærd i verdensklasse, som udkom i oktober 2018 og den Nationale Strategi for Kunstig Intelligens, som blev udgivet i marts.”
Udvalgets formand Sabine Kirchmeier, Dansk Sprognævn, tilføjer: ”Sprogets betydning for udvikling af kunstig intelligens har i alt for lang tid været overset. Mange tror at data kun er tal, men faktum er at der ligger enorme mængder af viden om os og vores samfund gemt i danske tekster og optagelser af dansk tale. Men man skal knække sprogkoden for at forstå indholdet – og det kræver bedre dansk sprogteknologi og fri adgang til flere sproglige data.
Det har været et stort, men også taknemmeligt arbejde at skabe et overblik over det danske sprogs stilling i forhold til sprogteknologi. Emnet er komplekst, men vi har gjort os stor umage med at forklare det grundigt, så rapporten også kan læses som en introduktion til dansk sprogteknologi. Opbakningen til anbefalingerne har været stor, og det er et enigt udvalg der står bag anbefalingerne”.
Læs mere
Læs rapporten Dansk Sprogteknologi i Verdensklasse (pdf)
Læs mere om udvalgets arbejde på bloggen sprogtek2018.dk
Se Sprognævnets oversigt over danske sprogresurser (xslx)
Kontakt: Sabine Kirchmeier (+45 26 84 63 70).