Databearbetning och -analys

OpenRefine

Notepad++

WinMerge

Introduktion till att städa data i OpenRefine

Övningar till Introduktion till att städa data:

  1. Importera .csv-filen och skapa ett projekt
  2. Ändra skiftläge i en kolumn och omvandla värdetypen till datum i kolumnen med datum. För att göra detta, gå till Edit cells > Common transforms.
  3. Testa fasetter för text och tidslinje och testa textfiltret.
  4. Dela en kolumn i två eller flera kolumner.

Övning 1

  1. Importera datasetet Vallonien.
  2. Använd den gröna bocken när du är klar, under Reaktioner i Zoom.

Övning 2

  1. Hitta värden i kolumnen Label som innehåller texten "farm".
  2. Vilket är det vanligaste värdet i kolumnen Province för dessa?

Övning 3

  1. Dela på kolumnen med koordinater.
  2. Byt namn på kolumnerna.

Övning 4

  1. Dela Label med ( till max 2. 
  2. Dela celler (split multi-valued cells) i Label/Label 1 med -
  3. Rensa blanksteg och ändra till gemener.
  4. Sammanfoga celler (join multi-valued cells).

Övning 5

  1. Byt ut text i History så att endast årtalen kvarstår.
  2. Dela celler.
  3. Gör om till värdetypen datum (transform to date).
  4. Testa fasetten tidslinje.