Stockholms universitet

Forskningsprojekt AI i runologins tjänst

Projektets huvudmål är att skapa en AI-assistent som ska hitta svar i Samnordisk runtextdatabas utifrån en användares frågor.

Runsten med lysande gröna runor. Skapad av Sofia Pereswetoff-Morath med AI
Illustration: Sofia Pereswetoff-Morath med hjälp av AI.

AI är ett område inom datavetenskap som har som syfte att skapa system som kan utföra uppgifter som normalt skulle kräva mänsklig intelligens. AI har gjort anmärkningsvärda framsteg under det senaste decenniet, särskilt inom området naturlig språkbehandling, som är den gren av AI som handlar om förståelse och generering av naturliga språktexter. En av de mest imponerande innovationerna inom naturlig språkbehandling är utvecklingen av stora språkmodeller (SSM). SSM är dock inte bara en källa till innovationer och möjligheter, utan också en källa till stora utmaningar. SSM kan fabricera fakta, vilket resulterar i texter som är fulla av fel eller motsägelsefulla. Detta är särskilt problematiskt för forskning inom humaniora. Vårt projekt vill ta sig an utmaningen att lära en AI-assistent att leverera svar baserade uteslutande på vetenskaplig grund.

Projektbeskrivning

Vi har valt en disciplin inom humaniora som har en stor men ändå begränsad korpus av informativa texter, nämligen runologin. Runologi är ett ämne som har som syfte att forska om runinskrifter från olika tider. I kärnan för disciplinen ligger språket, nämligen inskrifternas läsning och tolkning, men även många andra frågor är intressanta för runologin, t.ex. runstenars utseende och placering eller runristarna och deras arbetssätt.

Chat GPT ger i nuläget inga vettiga svar inom domänen Runologi och det finns en viss risk att SSM härigenom sekundärt kommer att matas med felaktig eller bristfällig information. Det är därför viktigt och meningsfullt att försöka komma i kapp med processen och kanske till och med leda den i syfte att ge SSM riktiga fakta om och pålitliga exempel på runinskrifter och runor. I projektet kommer vi således att arbeta med att försöka lösa de problem som uppstår i interaktion mellan människa och AI i domänen Runologi. Ett vidare syfte är att underlätta för allmänheten att hitta korrekt information om runor och runinskrifter.

Som källa för beprövad runologisk kunskap väljer vi Samnordisk runtextdatabas. Denna databas innehåller information om 6751 runinskrifter från urnordisk tid till medeltid. Databasen tillåter i teorin sina användare att utföra många intressanta sökningar, men det bör genast sägas att många sökningar är synnerligen svåra att utföra för en otränad användare. Problemet med sådana runologiska databaser överlag är att de kräver specialkunskaper för att användas. För att utföra en sökning på ett effektivt sätt och få ett korrekt resultat måste man först lära sig hur man gör.

Samnordisk runtextdatabas har en öppen licens och existerar just nu i olika versioner. En av dessa versioner har skapats och underhålls av oss, Sofia Pereswetoff-Morath och Vadim Frolov. Vi kallar den för Rundata-net. Denna version skapades under perioden 2013–2016 och har sedan dess använts flitigt i runologisk undervisning på Stockholms universitet.

Rundata-net

Vårt projekts huvudmål är att skapa en AI-assistent som skall hitta svar i databasen utifrån en användares frågor. Projektet handlar om att montera in en AI-textruta i Rundata-net där en användare fritt kan formulera sin sökning på engelska. Vi ämnar pröva även andra språk, men det är känt att SSM i dagsläget fungerar bäst på engelska.

Resultatet på en fråga kommer att visas som en sökning i databasen. Användaren kan då kontrollera att AI förstått uppgiften och genomfört en korrekt sökning. Vi är övertygade om att det första steg för att lära AI mer om runor kommer att leda till större och mer ambitiösa projekt. Nästa delmål, som är betydligt mer komplext, blir att lära AI att formulera självständiga svar, baserade på databasens innehåll.

Sammanfattning: förväntade resultat av projektet

  1. En presentation av projektet i ett lämpligt forum, t.ex. på ett högre seminarium vid Stockholms eller Uppsala universitet eller på en konferens med anknytning till svensk språkhistoria och runologi.
  2. En ny sökruta för fritextsökning i Rundata-net, som utför sökning i databasen utifrån en ställd fråga med hjälp av AI-assistent.
  3. En videoinspelning med instruktioner för och exempel på användning av den nya sökrutan.

Projektmedlemmar

Projektansvariga

Sofia Pereswetoff-Morath

Universitetslektor

Institutionen för svenska och flerspråkighet
Sofia Pereswetoff-Morath

Medlemmar

Vadim Frolov

Microsoft development center Norway