Stockholms universitet

Forskningsprojekt SWEGRAM – Ett textanalysverktyg för svenska och engelska

Annotera och analysera svenska och engelska texter med SWEGRAM

SWEGRAMs verktygskedja
SWEGRAMs verktygskedja för annotering. Illustration: Beáta Megyesi

SWEGRAM syftar till att tillhandahålla ett verktyg för textanalys på svenska och engelska. Användare kan ladda upp en eller flera texter och annotera dem på olika språkliga nivåer med morfologisk och syntaktisk information. De annoterade texterna kan sedan användas för att extrahera statistik om textegenskaper såsom textlängd, ordantal, läsbarhetsmått, ordklass, syntaktiska funktioner och mycket mer.

Användare har möjlighet att ladda ner den annoterade datan tillsammans med statistik för de uppladdade filerna. Datan kan sparas i format som ren text, CSV eller Excel-filer. Dessutom kan användare fortsätta att bygga sin annoterade korpus med verktyget.

Verktyget finns i två versioner: 

En nedladdningsbar version med utökade lingvistiska särdrag:

Nedladdningsbar version

En första onlie-version (som inte underhålls längre): 

Online-version

När du använder SWEGRAM i ditt arbete, vänligen hänvisa till följande publikationer:

SWEGRAM – Annotering och analys av svenska texter (3746 Kb) (2019)

SWEGRAM – A Web-Based Tool for Automatic Annotation and Analysis of Swedish Texts (272 Kb) (2017)

Du hittar fullständig info om samt länkar under rubriken Publikationer.

Projektmedlemmar

Projektansvariga

Beata Megyesi

Professor

Institutionen för lingvistik
Beáta Megyesi

Medlemmar

Anne Palmér

Docent

Institutionen för nordiska språk, Uppsala universitet

Publikationer

Mer om projektet

Den första versionen av SWEGRAM-verktyget uppstod genom ett samarbete mellan Institutionen för nordiska språk och Institutionen för lingvistik och filologi vid Uppsala universitet. Därefter utvecklades den andra versionen av verktyget vid Institutionen för lingvistik, Stockholms universitet. Finansiering för verktygets utveckling tillhandahölls av SWE-CLARIN-projektet, vilket syftar till att skapa språkdata och verktyg för forskare inom humaniora och samhällsvetenskap. 

Projektets systemutvecklare

SWEGRAM har utvecklats i samarbete med tre systemutvecklare: 

Rex Ruan (2019- ) 

Shifei Chen (2019-2021)

Jesper Näsman (2016-2018)

Vi vill rikta ett stort tack till Eva Pettersson och masterstudenter inskrivna på Språkteknologiprogrammet vid Uppsala universitet mellan 2018 och 2021 för deras värdefulla synpunkter gällande olika aspekter av verktyget.