Databearbetning och -analys

Text mining och textdata

Textdata är ostrukturerad text som kan analyseras som data, det vill säga att den är maskinläsbar och vanligtvis ren text (.txt), inte formaterad. 

Text mining eller text data mining är kvantitativ, automatiserad analys av textdata för att hitta statistiska mönster.

Kommande kurser i text mining och textdata

Svenska textdataset

Voyant

Ett webbaserat verktyg för statistisk textanalys och visualisering.

AntConc

Program for sökningar, konkordanser, kollokationer, klustersökningar/n-gram och korpusjämförelser.

Korp

Ett webbaserat verktyg för lingvistiska analyser i ett stort urval av svenska textkorpusar.