Daten mit R in Blöcken verarbeiten mit iotools: Big Data-Werkzeug

Beim Verarbeiten großen Datenmengen mit R kann man an Grenzen des Arbeitsspeichers stoßen. In R kann das früher geschehen, als man meinen möchte. Wer beispielsweise über 16 GB RAM verfügt und einen 10 GB-Datensatz analysieren möchte, wird feststellen, dass R bei bestimmten Operationen langsam und ineffizient wird. Laut R-Handbuch kann das bereits geschehen, wenn etwa … „Daten mit R in Blöcken verarbeiten mit iotools: Big Data-Werkzeug“ weiterlesen

Statistiker, Mathematiker und Experten für Maschinelles Lernen denken unterschiedlich

Im Zeitalter von Big Data müssen die Fähigkeiten von Statistikern, Mathematikern und Experten für Maschinelles Lernen in immer stärkerem Maße verbunden werden, um „Datenschätze“ zu heben. Dabei kann es sehr hilfreich sein, sich der unterschiedlichen Denkweisen bewusst zu werden, die mit der jeweiligen Ausbildung einhergehen. Die folgende Geschichte veranschaulicht das eindrucksvoll. Arbeiten Statistiker, Data Scientists und … „Statistiker, Mathematiker und Experten für Maschinelles Lernen denken unterschiedlich“ weiterlesen

Muttertag verpasst? Big Data-Cartoon: „Mother of All Data“

Sehr wahrscheinlich ist es auch am vergangenen Sonntag passiert: Söhne und Töchter haben den Muttertag verpasst (oder ignoriert). KDNuggets nahm den Muttertag zum Anlass für einen Big Data-Cartoon: Die Mutter ist hier nicht die biologische Lebensspenderin der Bedröppelten, sondern in bester Big-Brother-is-watching-you (Orwells 1984) die Mother of All Data, die Mutter aller Daten. Diese elegante Formulierung … „Muttertag verpasst? Big Data-Cartoon: „Mother of All Data““ weiterlesen

Big Data Cartoon: Modell aus 7-D-Drucker

KDnuggets greift die Hypes um Big Data und 3-D-Drucker auf und verbindet beides, ganz leicht überspitzt: Es ist manchmal schwierig genug, Big Data zu visualisieren, selbst mit revolutionären 3-D-Druckern. Warum nur bis 4-D denken? Dieser Beitrag ist ein Update zu Weihnachtszeit / Thanksgiving: Big Data Cartoon.

Rededuell: Business Analytics & Big Data – hilfreiches Werkzeug oder Krücke?

Zum Ausklang der Arbeitswoche (für manche zumindest … -:) gibt es heute eine Diskussion zum Thema Business Analytics & Big Data: Hilfreiches Werkzeug oder Krücke für unternehmerischen Sachverstand? Kann ein Business Analytics-System einen Hersteller von Niederschlagsschutzsystemen (manche nennen sie einfach Regenschirme) sinnvoll unterstützen? In welchen Situationen stößt unternehmerischer Sachverstand an Grenzen? Viel Spaß beim Duell „zwischen … „Rededuell: Business Analytics & Big Data – hilfreiches Werkzeug oder Krücke?“ weiterlesen

Meilensteine in der Geschichte der Marktforschung

1932 Erfindung der Likert-Skala 1936 Wettstreit in der Wahlforschung mit dem bemerkenswerten Ergebnis, dass eine Prognose auf Basis von über zwei Millionen Befragten daneben liegt, während ein konkurrierendes Unternehmen mit 50.000 Befragten den US-Wahlsieger Roosevelt korrekt vorhersagt. → Begründung der Stichprobenziehung (vgl. Artikel zu Repräsentativität und Gewichtung) 1941 Erfindung der Fokusgruppen durch Merton und Lazarsfeld … „Meilensteine in der Geschichte der Marktforschung“ weiterlesen

Der Hype um „Big Data“ aus humoristischer Sicht

KDNuggets nimmt den Hype um Big Data aufs Korn: Diagramme als moderne Kunst: „Bog Data“. „Bog“ kann man mit Moor, Sumpf, Morast oder sogar Toilette übersetzen. Ein Anklang ans Slawische war vermutlich nicht beabsichtigt: Bog (Bóg) bedeutet in mehreren slawischen Sprachen Gott. Auch wenn es im Buddhismus eine Verbindung zwischen Gott und Schlamm gibt: über … „Der Hype um „Big Data“ aus humoristischer Sicht“ weiterlesen

SPSS Modeler: Merkmalsauswahl (Feature Selection)

In Data Mining Projekten ist es nicht unwahrscheinlich, dass der Forscher mit einer Vielzahl, vielleicht hunderten oder sogar tausenden, Variablen konfrontiert wird. Wenn klare Vorgaben, zum Beispiel auf Basis einer gut etablierten Theorie, fehlen, kann die Merkmalsauswahl für die Modellbildung ein sehr zeitaufwändiger Prozess sein (vgl. CRISP-DM Prozess = Cross Industry Standard Process for Data Mining). Der … „SPSS Modeler: Merkmalsauswahl (Feature Selection)“ weiterlesen

Trendumfrage: Wichtigste Hightech-Themen 2013

Einige Ergebnisse der jährlichen Trendumfrage des Hightech-Verbands BITKOM; angegeben wird der Anteil der befragten Unternehmen, die das jeweilige Thema nannten (Mehrfachantworten): Cloud Computing: 59% (bereits 2012 Spitzenreiter) mobile Anwendungen: 48% Big Data: 37% IT-Sicherheit: 33% Bring Your Own Device (BYOD): 27% Social Media: 22% Quelle: marktforschung.de