Bolette Sandford Pedersen
Professor og Viceinstitutleder
Institut for Kommunikation, Det Humanistiske Fakultet, Københavns Universitet
Forskningsfelt: Sprogteknologi, datalingvistik, danske sprogressourcer
Kontakt: bspedersen@hum.ku.dk
Hvad forsker du i?
Jeg forsker i sprogteknologi og datalingvistik og leder Center for Sprogteknologi på Institut for Nordiske Studier og Sprogvidenskab på KU. Jeg arbejder med at udvikle danske sprogressourcer og evalueringsbenchmark til sprogcentreret kunstig intelligens (AI), der skal virke i det danske samfund. Et gennemgående tema i min forskning handler om, hvordan man kan berige statistiske sprogmodeller med den semantiske viden, som man ikke nødvendigvis finder i de tekster, som modellerne er trænet på. Det kan være viden, som typisk er gemt i vores egne ordbøger og encyklopædier, eller som på anden måde er implicit, fx i metaforer, ironi og sarkasme.
Hvorfor er det så vigtigt?
Chatbots og moderne søgemaskiner får større og større indflydelse på den måde, vi genererer viden og kommunikerer i samfundet på. Det er vigtigt at sikre, at de sprogmodeller, der ligger bag disse kraftfulde teknologier, ikke har indarbejdet for voldsomme kulturelle og sproglige bias fra andre typer samfund end dem, de skal bruges i. Bekymringen for skævvredet AI mærker vi ikke kun i Danmark, men generelt i EU, hvor flere store initiativer arbejder for at ruste de mindre sprogsamfund på teknologiområdet i forbindelse med sprogcenteret AI (fx European Language Equality). I relation til Regeringens kommende AI-vision prøver vi også som forskere, med den unikke og specialiserede viden vi har, at være med til at påvirke kursen for kunstig intelligens i Danmark. Det sker bl.a. i dialog og samarbejde med Digitaliseringsstyrelsen og Ministeriet for Digitalisering og Ligestilling.
Et projekt du er stolt af?
Jeg er stolt af de danske sprogressourcer til AI, som jeg har været med til at udvikle i samarbejde med de store sproginstitutioner i Danmark, særligt Det Danske Sprog- og Litteraturselskab (DSL) og Dansk Sprognævn. Jeg kan fx nævne det sidste skud på stammen, Det Centrale OrdRegister, hvor jeg har været ansvarlig for den semantiske komponent COR.SEM sammen med kolleger fra Centeret og DSL. Jeg er også stolt af de danske benchmarks, som vi er ved at udvikle i øjeblikket på en bevilling fra Carlsberg Fondet. De sikrer, at vi kan evaluere danske sprogmodeller ud fra et dansk udgangspunkt og ikke blot teste med oversatte benchmarks.
Opdateret oktober 2024
I forbindelse med tidligere forløb har Bolette arbejdet sammen med Jenny Bøving Arendt, direktør i Danske Gymnasier (Alumner - Policy Fellowship).