Uppsala University Library
Bibliotekets guider
Databearbetning och -analys
Organisera kvantitativa data
Databearbetning och -analys
Start
Programvara på biblioteken
Referera till programvara
Organisera och bearbeta data
Organisera kvantitativa data
OpenRefine
Notepad++
WinMerge
Introduktion till att städa data i OpenRefine
Transkribera ljud och video
Organisera och annotera bilder
Kvantitativ dataanalys
Statistisk analys
Text mining och textdata
Kvalitativ dataanalys
GIS och geodata
Hitta kartor och geodata
Analysera kartor och geodata
Crowdsourcing
OpenRefine
OpenRefine
Städa data, få en överblick av innehållet med hjälp av fasetter och filter, klustra liknande värden och förbered data för analys.
Cleaning Data with Refine (School of Data)
Notepad++
Notepad++
Textredigeringsprogram med möjlighet att söka (och ersätta text) med reguljära uttryck och i flera filer samtidigt.
WinMerge
WinMerge
Jämför innehåll i filer, t.ex. texter eller bilder, eller hela mappar. Få syn på skillnader och sammanjämka vid behov.
Introduktion till att städa data i OpenRefine
Mjukvara
Dataset
Övningar Umeå
Övningar Vallonien
Användarhandledning
Ladda ner OpenRefine
Fil: Träd som förvaltas av gator och parker
Träd som förvaltas av Gator och parker (csv) men en mindre fil
Träd som förvaltas av Gator och parker, Umeå kommun
Umeå kommuns öppna data om de ca 30 000 träd som förvaltas av Gator och parker
Fil: Valloniens kulturarv
Översatt delmängd
Inventaire du Patrimoine Immobilier Culturel Wallonie
Originalet till datasetet Vallonien
Övningar till Introduktion till att städa data:
Importera .csv-filen och skapa ett projekt
Ändra skiftläge i en kolumn och omvandla värdetypen till datum i kolumnen med datum. För att göra detta, gå till Edit cells > Common transforms.
Testa fasetter för text och tidslinje och testa textfiltret.
Dela en kolumn i två eller flera kolumner.
Övning 1
Importera datasetet Vallonien.
Använd den gröna bocken när du är klar, under Reaktioner i Zoom.
Övning 2
Hitta värden i kolumnen Label som innehåller texten "farm".
Vilket är det vanligaste värdet i kolumnen Province för dessa?
Övning 3
Dela på kolumnen med koordinater.
Byt namn på kolumnerna.
Övning 4
Dela Label med ( till max 2.
Dela celler (split multi-valued cells) i Label/Label 1 med -
Rensa blanksteg och ändra till gemener.
Sammanfoga celler (join multi-valued cells).
Övning 5
Byt ut text i History så att endast årtalen kvarstår.
Dela celler.
Gör om till värdetypen datum (transform to date).
Testa fasetten tidslinje.
OpenRefine användarhandledning
En manual för att installera och använda OpenRefine, inklusive GREL.
Using OpenRefine
av
Ruben Verborgh; Max De Wilde
ISBN: 9781783289080
Publikationsdatum: 2013-09-10
Detaljer om klustringsmetoder i OpenRefine
<<
Föregående:
Organisera och bearbeta data
Nästa:
Transkribera ljud och video >>