Databearbetning och -analys

OpenRefine

Notepad++

WinMerge

Introduktion till att städa data i OpenRefine

Övningar till Introduktion till att städa data:

 1. Importera .csv-filen och skapa ett projekt
 2. Ändra skiftläge i en kolumn och omvandla värdetypen till datum i kolumnen med datum. För att göra detta, gå till Edit cells > Common transforms.
 3. Testa fasetter för text och tidslinje och testa textfiltret.
 4. Dela en kolumn i två eller flera kolumner.

Övning 1

 1. Importera datasetet Vallonien.
 2. Använd den gröna bocken när du är klar, under Reaktioner i Zoom.

Övning 2

 1. Hitta värden i kolumnen Label som innehåller texten "farm".
 2. Vilket är det vanligaste värdet i kolumnen Province för dessa?

Övning 3

 1. Dela på kolumnen med koordinater.
 2. Byt namn på kolumnerna.

Övning 4

 1. Dela Label med ( till max 2. 
 2. Dela celler (split multi-valued cells) i Label/Label 1 med -
 3. Rensa blanksteg och ändra till gemener.
 4. Sammanfoga celler (join multi-valued cells).

Övning 5

 1. Byt ut text i History så att endast årtalen kvarstår.
 2. Dela celler.
 3. Gör om till värdetypen datum (transform to date).
 4. Testa fasetten tidslinje.