Data Mining mit R: Zusammenhänge erkennen, Zielgruppen finden

Beim Data Mining geht es darum, Erkenntnisse aus vorhandenen Daten zu gewinnen – im Gegensatz zum Machine Learning, das darauf abzielt, zuvor traininerte Modelle auf neue Daten anzuwenden. TL; DR: Kurze Zusammenfassung Entscheidungsbäume sind ein mächtiges Werkzeug für Data Mining-Aufgaben. Sind sind in R leicht zu erstellen und besonders gut präsentierbar, wenn sie in interaktiven … „Data Mining mit R: Zusammenhänge erkennen, Zielgruppen finden“ weiterlesen

10 Gründe, RStudio zu verwenden

RStudio ist nicht umsonst eine sehr populäre Entwicklungsumgebung für die freie Software R für Statistik, Datenaufbereitung, Data Mining und Machine Learning. 10 Gründe, RStudio zu nutzen – vielleicht ist auch für erfahrene RStudio-Anwender noch eine Überraschung dabei: 1. Sehr informative, übersichtliche Arbeitsumgebung Die Arbeitsumgebung ist in vier Bereiche unterteilt, die jeweils durch Reiter zusätzlichen Platz … „10 Gründe, RStudio zu verwenden“ weiterlesen

R-Zertifizierung: Objektorientiertes Programmieren in R mit S3 und R6

R-Zertifizierung abgeschlossen: Objektorientiertes Programmieren in R mit S3 und R6. Hier ging es mehr als in den bisherigen Kursen um Grundlagen der Programmierung und tiefer in R-Interna. Wer R zur Datenanalyse nutzt (und das tun die allermeisten, dafür wurde die Sprache geschaffen), stützt sich in aller Regel auf funktionales Programmieren. Der Entwickler der S-Sprache, aus … „R-Zertifizierung: Objektorientiertes Programmieren in R mit S3 und R6“ weiterlesen

R Zertifizierung: R Markdown – DataCamp

Da ich schon mit R Markdown gearbeitet hatte, war mir in diesem Kurs nicht alles neu:   Themen waren unter anderem: Einführung in die Markup-Sprache Markdown (auch HTML ist eine Markup-Sprache; Markdown ist speziell für R-Anwender und wesentlich einfacher und besser lesbar) Mischen von Text, R-Code, Ergebnissen von statistischen Berechnungen sowie Diagrammen Einbau von LaTeX-Formeln … „R Zertifizierung: R Markdown – DataCamp“ weiterlesen

R-Zertifizierung: ggvis – DataCamp

Neuer und weniger bekannt als ggplot2 ist das R-Paket ggvis. Es basiert ebenfalls auf der grammar of graphics, d. h. die Diagramme werden in Schichten aufgebaut, die sehr flexibel anpassbar sind. ggvis verbindet die Stärken von ggplot2 mit shiny und vega. Die Verknüpfung mit shiny ermöglicht interaktive Grafiken. Auch an diesem Paket hat Hadley Wickham … „R-Zertifizierung: ggvis – DataCamp“ weiterlesen

Titanic, Untergang, SPD, Weltkulturerbe und Dresden …

2012 markiert den hundertsten Jahrestag des Titanic-Untergangs. Einige Zahlen: ca. 1.500 Tote beim Untergang am 15.4.1912, ca. 700 Überlebende April 2012: Eröffnung eines Titanic-Zentrums für 97 Mio. Pfund in Belfast/Irland; dort war das Schiff einst gebaut worden Versteigerung der Speisekarte mit dem letzten Mittagsmenü auf dem Schiff für 76.000 Pfund (rund 91.000 Euro) Titanic-Film (1997): … „Titanic, Untergang, SPD, Weltkulturerbe und Dresden …“ weiterlesen