Textantworten (offene Nennungen) automatisch zuordnen in R nach Ähnlichkeit

Wie kann man Textantworten automatisch in R codieren, wenn es viele ähnliche, aber nicht exakt gleiche Einträge gibt?

Mit dem R-Paket tidystringdist!

Wie kann man Textantworten automatisch in R codieren, wenn es viele ähnliche, aber nicht exakt gleiche Einträge gibt?

Mit dem R-Paket tidystringdist!

Textantworten (offene Nennungen) codieren mit R: stringr und regex

Oft wird ein großer Teil der Projektzeit nicht für die spannenden Modelle, sondern für die meist etwas weniger spannend empfundene Datenaufbereitung verwendet. Ein typischer Stolperstein dabei ist die Codierung von Textantworten (offene Nennungen). Wie können wir uns diese Arbeit mit R erleichtern? Anhand eines einfachen Beispiels („Warum treiben Sie Sport?“) beginnen wir mit einer Zuordnung … „Textantworten (offene Nennungen) codieren mit R: stringr und regex“ weiterlesen

R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)

R Zertifizierung abgeschlossen: Daten importieren und aufbereiten – Fallbeispiele. Hier gab es im Vergleich zu bisherigen DataCamp-Kursen nichts Wesentlich Neues – dieser Kurs ist sehr praxisorientiert. Datenbereinigung ist nicht so spektakulär wie das Entwickeln fortgeschrittener DataMining-Modelle, aber oft sehr zeitaufwändig. R-Pakete zur Datenbereinigung und Datenaufbereitung Neben etlichen Basisfunktionen kamen überwiegend Pakete von Hadley Wickham zum … „R Zertifizierung: Daten importieren und aufbereiten – Fallbeispiele (DataCamp)“ weiterlesen