Clinical Text Mining Group är en kreativ forskargrupp bestående av datavetare, ingenjörer, språkteknologer och läkare. Vi forskar inom artificiell intelligens, språkteknologi och hälsoinformatik.
Forskargruppen tar fram verktyg som kan upptäcka tidiga tecken på cancer. Foto: National Cancer Institute/Unsplash.
Inom Clinical Text Mining Group försöker vi särskilt tolka klinisk text med hjälp av både domänexperter och datorer. Vi arbetar med att skapa framtidens verktyg för hälsopersonal – verktyg i framkant inom datavetenskap och datorlingvistik med hjälp av artificiell intelligens.
Verktygen kan användas för att upptäcka och förutsäga vårdrelaterade infektioner, tidiga symtom på cancer, samt läkemedelsbiverkningar. De kan också användas för att avidentifiera information i patientjournaler som kan avslöja enskilda patienters identitet. Det innebär att patientdata kan användas i AI-tillämpningar utan att riskera patienters integritet.
Vår forskning baseras på data från forskningsinfrastrukturen Health Bank – Swedish Health Record Research Bank som omfattar mer än två miljoner patientjournaler på svenska från åren 2006–2014. Vi har utvecklat ett antal verktyg och skapat en uppsättning lexikaliska resurser.
Clinical Text Mining Group verkar i nära samarbete med Karolinska universitetssjukhuset och Region Stockholm.
Med de stora datamängder som genereras i dag har den personliga integriteten blivit en het fråga. I detta projekt studerar vi hur man kan skapa säkra språk- och datamodeller med hjälp av maskininlärning – utan att röja personuppgifter.
Syftet med detta projekt är att möjliggöra den praktiska användningen av avidentifiering av klinisk text på svenska. Avidentifieringsverktyget HB Deid ska testas inte bara i laboratoriemiljö på Stockholms universitet, utan även på textbaserade patientdata från Region Stockholm.
Hur kan tekniska lösningar hjälpa läkare att ställa bättre diagnoser, göra prognoser och uppskatta sannolikheten för olika utfall? I det här projektet använder vi maskininlärning och språkteknologi för att utveckla prediktionsmodeller för sepsis och covid-19.
De senaste årens genombrott inom AI har drivits av så kallade språkmodeller. De kan vara mycket användbara men utgör också en säkerhetsrisk: De läcker information om sina träningsdata. Detta projekt handlar om att identifiera sådana sårbarheter och föreslå integritetsskyddande tekniker.
Språkteknologi som kan förbättra sjukvården är av intresse för både svenska och chilenska forskare. Hercules Dalianis, professor vid Institutionen för data- och systemvetenskap (DSV), har besökt tre universitet i Chile för att berätta om sin forskning.
”Stora språkmodeller är ett hett tema just nu”, konstaterade Thomas Vakili under sitt licentiatseminarium – som kretsade kring just språkmodeller och stora datamängder.