Datenbasis

Die folgenden Daten beruhen auf 3000 Alben von 1010 verschiedenen Bands / Künstlern. Sie stammen von der Webseite https://tsort.info/. Wir verwenden die Version 2-7-0005.

Visualisierung

Inwiefern ist die Punktzahl für Chartplatzierungen in Europa vorhersagbar durch die Punktzahl in den U.S.A.?
Gibt es Unterschiede zwischen den Top 6 Künstlern / Bands?

ggplot(Top6, aes(x = raw_usa, y = raw_eur)) +
  geom_jitter() +
  geom_smooth(color = "darkgreen", method = "loess", se = FALSE) +
  geom_smooth(color = "blue", method = "lm", se = FALSE) +
  facet_wrap(~ artist, nrow = 2, scales = "free") +
  labs(x = "Punkte U.S.A.", y = "Punkte Europa",
       title = "Punkte USA vs. Europa für Top 6 Künstler / Bands",
       caption = "Quelle: tsort.info, Version 2.7.0005")

Regression

Regressionsmodell für die Rolling Stones.

Direkte Ausgabe

Stones <- Top6 %>%
  filter(artist == "The Rolling Stones")
Stones_lm <- lm(raw_eur ~ raw_usa, data = Stones)
summary(Stones_lm)
## 
## Call:
## lm(formula = raw_eur ~ raw_usa, data = Stones)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4463.6 -3332.9  -646.9  1714.3  9057.0 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 4638.44964 1092.53951   4.246 0.000153 ***
## raw_usa       -0.05667    0.16286  -0.348 0.729966    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3980 on 35 degrees of freedom
## Multiple R-squared:  0.003447,   Adjusted R-squared:  -0.02503 
## F-statistic: 0.1211 on 1 and 35 DF,  p-value: 0.73

xtable

Tabelle <- xtable(summary(Stones_lm))
print(Tabelle, type = "html")
Estimate Std. Error t value Pr(>|t|)
(Intercept) 4638.4496 1092.5395 4.25 0.0002
raw_usa -0.0567 0.1629 -0.35 0.7300

texreg::htmlreg

Ein Modell:

htmlreg(Stones_lm, doctype = FALSE)
Statistical models
Model 1
(Intercept) 4638.45***
(1092.54)
raw_usa -0.06
(0.16)
R2 0.00
Adj. R2 -0.03
Num. obs. 37
RMSE 3979.62
p < 0.001, p < 0.01, p < 0.05
htmlreg(Stones_lm, single.row = TRUE, doctype = FALSE)
Statistical models
Model 1
(Intercept) 4638.45 (1092.54)***
raw_usa -0.06 (0.16)
R2 0.00
Adj. R2 -0.03
Num. obs. 37
RMSE 3979.62
p < 0.001, p < 0.01, p < 0.05

Vergleich von zwei Modellen:

Beatles <- Top6 %>%
  filter(artist == "The Beatles")
Beatles_lm <- lm(raw_eur ~ raw_usa, data = Beatles)

htmlreg(list(Stones_lm, Beatles_lm),
        custom.model.names = c("Stones", "Beatles"),
        doctype = FALSE)
Statistical models
Stones Beatles
(Intercept) 4638.45*** 2540.39*
(1092.54) (928.58)
raw_usa -0.06 0.19*
(0.16) (0.08)
R2 0.00 0.14
Adj. R2 -0.03 0.12
Num. obs. 37 33
RMSE 3979.62 3382.10
p < 0.001, p < 0.01, p < 0.05

Regressionsergebnisse als Datensatz

Warum Datensatz? Weil wir hier kompakt die Ergebnisse von insgesamt 6 Modellen gesammelt haben. Bei welchen Künstlern / Bands sind die Zusammenhänge signifikant? Wie sind die Wirkungsrichtungen? Ergebnisse sortiert nach p-Werten.

Direkte Ausgabe

Ergebnisse
##        Künstler_Band Koeffizient      pWert
## 1        The Beatles  0.19278703 0.02921007
## 2            Madonna  0.74404111 0.06273117
## 3                 U2  0.47422004 0.06636111
## 4          Bob Dylan -0.08456933 0.47520575
## 5  Bruce Springsteen  0.14645709 0.50158702
## 6 The Rolling Stones -0.05666535 0.72996576

kable

kable sieht im Word-Format am besten aus. Gibt Matrizen oder Datensätze aus.

kable(Ergebnisse)
Künstler_Band Koeffizient pWert
The Beatles 0.1927870 0.0292101
Madonna 0.7440411 0.0627312
U2 0.4742200 0.0663611
Bob Dylan -0.0845693 0.4752058
Bruce Springsteen 0.1464571 0.5015870
The Rolling Stones -0.0566653 0.7299658

xtable

xtable liefert kompakte Tabellen.

Tabelle <- xtable(Ergebnisse)
print(Tabelle, type = "html")
Künstler_Band Koeffizient pWert
1 The Beatles 0.19 0.03
2 Madonna 0.74 0.06
3 U2 0.47 0.07
4 Bob Dylan -0.08 0.48
5 Bruce Springsteen 0.15 0.50
6 The Rolling Stones -0.06 0.73
print(Tabelle, type = "html", html.table.attributes = "border = 0")
Künstler_Band Koeffizient pWert
1 The Beatles 0.19 0.03
2 Madonna 0.74 0.06
3 U2 0.47 0.07
4 Bob Dylan -0.08 0.48
5 Bruce Springsteen 0.15 0.50
6 The Rolling Stones -0.06 0.73

Interaktive Tabelle: datatable (Paket DT)

datatable(Ergebnisse)

Damit kann man auch ganze Datensätze darstellen …

datatable(Top6)

Interaktive Grafiken

Streudiagramm

pinkfloyd <- albums %>%
    filter(artist == "Pink Floyd")

# Dynamisch: Mouse-Over. Nur in HTML! Benötigt Javascript.
# Zuerst ggplot2 ...

PinkFloyd <- ggplot(pinkfloyd, aes(x = year, y = final_score, label = name, col = final_score)) +
  labs(title = "Pink-Floyd-Alben & ihre Punktzahlen",
       x = "Jahr", y = "Punktzahl") +
  scale_x_continuous(limits = c(1965, 2011)) +
  geom_jitter()

# ... dann plotly
ggplotly(PinkFloyd, tooltip = c("x", "y", "label"))

Diamonds

LS0tDQp0aXRsZTogJ0NoYXJ0LUdlc2NoaWNodGUobik6IFp3aXNjaGVuYmVyaWNodCcNCmF1dGhvcjogJ0t1cnM6IEVpbmbDvGhydW5nIGluIFInDQpkYXRlOiAnQmVyaWNodCBlcnN0ZWxsdDogYHIgU3lzLnRpbWUoKWAnDQpvdXRwdXQ6DQogIGh0bWxfZG9jdW1lbnQ6DQogICAgdG9jOiB5ZXMNCiAgICB0b2NfZmxvYXQ6IHllcw0KICAgIGNvZGVfZm9sZGluZzogaGlkZQ0KICAgIGNvZGVfZG93bmxvYWQ6IHRydWUNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCg0KbGlicmFyeShrbml0cikNCmxpYnJhcnkoeHRhYmxlKQ0KbGlicmFyeShwYW5kZXIpDQpsaWJyYXJ5KHRleHJlZykNCmxpYnJhcnkoRFQpDQpsaWJyYXJ5KGZvcmNhdHMpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShnZ3Bsb3QyKQ0KbGlicmFyeShwbG90bHkpDQoNCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCiMga25pdHI6Om9wdHNfY2h1bmskc2V0KGNvbW1lbnQgPSBOQSkNCg0KbG9hZCgiUmVncmVzc2lvbnNlcmdlYm5pc3NlLlJkYSIpDQpsb2FkKCJBbGJlbi5SZGEiKQ0KYGBgDQoNCg0KYGBge3IgVm9yYmVyZWl0dW5nLCBlY2hvID0gRkFMU0V9DQoNClRvcDYgPC0gYWxidW1zICU+JQ0KICBncm91cF9ieShhcnRpc3QpICU+JQ0KICBzdW1tYXJpc2UoR2VzYW10cHVua3RlID0gc3VtKGZpbmFsX3Njb3JlKSwNCiAgICAgICAgICAgIE4gPSBuKCkpICU+JQ0KICBhcnJhbmdlKGRlc2MoR2VzYW10cHVua3RlKSkgJT4lDQogIGZpbHRlcihhcnRpc3QgIT0gIk9yaWdpbmFsIFNvdW5kdHJhY2siKQ0KDQpUb3A2IDwtIFRvcDYgJT4lDQogIG11dGF0ZShpZCA9IGFzLm51bWVyaWMocm93bmFtZXMoVG9wNikpKSAlPiUNCiAgZmlsdGVyKGlkIDwgNykNCg0KYXJ0aXN0cyA8LSBUb3A2JGFydGlzdA0KDQpUb3A2IDwtIGFsYnVtcyAlPiUNCiAgZmlsdGVyKGFydGlzdCAlaW4lIGFydGlzdHMpICU+JQ0KICBtdXRhdGUoYXJ0aXN0ID0gZmN0X2luZnJlcShhcnRpc3QpKQ0KDQojIFJlZ3Jlc3Npb24gZWluZsO8Z2VuDQoNCiMgQWJzdGVpZ2VuZCBzb3J0aWVyZW4gbmFjaCBwLVdlcnRlbg0KRXJnZWJuaXNzZSA8LSBFcmdlYm5pc3NlICU+JQ0KICBhcnJhbmdlKHBXZXJ0KQ0KDQpgYGANCg0KIyBEYXRlbmJhc2lzDQoNCkRpZSBmb2xnZW5kZW4gRGF0ZW4gYmVydWhlbiBhdWYgYHIgbnJvdyhhbGJ1bXMpYCBBbGJlbiB2b24gYHIgbGVuZ3RoKHVuaXF1ZShhbGJ1bXMkYXJ0aXN0KSlgIHZlcnNjaGllZGVuZW4gQmFuZHMgLyBLw7xuc3RsZXJuLiBTaWUgc3RhbW1lbiB2b24gZGVyIFdlYnNlaXRlIGh0dHBzOi8vdHNvcnQuaW5mby8uIFdpciB2ZXJ3ZW5kZW4gZGllIFZlcnNpb24gKioyLTctMDAwNSoqLg0KDQoNCiMjIFZpc3VhbGlzaWVydW5nDQoNCklud2llZmVybiBpc3QgZGllIFB1bmt0emFobCBmw7xyIENoYXJ0cGxhdHppZXJ1bmdlbiBpbiBFdXJvcGEgdm9yaGVyc2FnYmFyIGR1cmNoIGRpZSBQdW5rdHphaGwgaW4gZGVuIFUuUy5BLj8gICANCkdpYnQgZXMgVW50ZXJzY2hpZWRlIHp3aXNjaGVuIGRlbiBUb3AgNiBLw7xuc3RsZXJuIC8gQmFuZHM/DQoNCmBgYHtyIFZpc3VhbGlzaWVydW5nLCBlY2hvID0gVFJVRX0NCg0KZ2dwbG90KFRvcDYsIGFlcyh4ID0gcmF3X3VzYSwgeSA9IHJhd19ldXIpKSArDQogIGdlb21faml0dGVyKCkgKw0KICBnZW9tX3Ntb290aChjb2xvciA9ICJkYXJrZ3JlZW4iLCBtZXRob2QgPSAibG9lc3MiLCBzZSA9IEZBTFNFKSArDQogIGdlb21fc21vb3RoKGNvbG9yID0gImJsdWUiLCBtZXRob2QgPSAibG0iLCBzZSA9IEZBTFNFKSArDQogIGZhY2V0X3dyYXAofiBhcnRpc3QsIG5yb3cgPSAyLCBzY2FsZXMgPSAiZnJlZSIpICsNCiAgbGFicyh4ID0gIlB1bmt0ZSBVLlMuQS4iLCB5ID0gIlB1bmt0ZSBFdXJvcGEiLA0KICAgICAgIHRpdGxlID0gIlB1bmt0ZSBVU0EgdnMuIEV1cm9wYSBmw7xyIFRvcCA2IEvDvG5zdGxlciAvIEJhbmRzIiwNCiAgICAgICBjYXB0aW9uID0gIlF1ZWxsZTogdHNvcnQuaW5mbywgVmVyc2lvbiAyLjcuMDAwNSIpDQpgYGANCg0KIyBSZWdyZXNzaW9uDQoNClJlZ3Jlc3Npb25zbW9kZWxsIGbDvHIgZGllIFJvbGxpbmcgU3RvbmVzLg0KDQojIyBEaXJla3RlIEF1c2dhYmUNCg0KYGBge3IgUmVncmVzc2lvbl9TdG9uZXNfZGlyZWt0LCBlY2hvID0gVFJVRX0NClN0b25lcyA8LSBUb3A2ICU+JQ0KICBmaWx0ZXIoYXJ0aXN0ID09ICJUaGUgUm9sbGluZyBTdG9uZXMiKQ0KU3RvbmVzX2xtIDwtIGxtKHJhd19ldXIgfiByYXdfdXNhLCBkYXRhID0gU3RvbmVzKQ0Kc3VtbWFyeShTdG9uZXNfbG0pDQpgYGANCg0KIyMgeHRhYmxlDQoNCmBgYHtyIFJlZ3Jlc3Npb25fU3RvbmVzX3h0YWJsZSwgZWNobyA9IFRSVUUsIHJlc3VsdHMgPSAnYXNpcyd9DQpUYWJlbGxlIDwtIHh0YWJsZShzdW1tYXJ5KFN0b25lc19sbSkpDQpwcmludChUYWJlbGxlLCB0eXBlID0gImh0bWwiKQ0KYGBgDQoNCiMjIHRleHJlZzo6aHRtbHJlZw0KDQpFaW4gTW9kZWxsOg0KDQpgYGB7ciBSZWdyZXNzaW9uX1N0b25lc190ZXhyZWcsIGVjaG8gPSBUUlVFLCByZXN1bHRzID0gJ2FzaXMnfQ0KaHRtbHJlZyhTdG9uZXNfbG0sIGRvY3R5cGUgPSBGQUxTRSkNCmh0bWxyZWcoU3RvbmVzX2xtLCBzaW5nbGUucm93ID0gVFJVRSwgZG9jdHlwZSA9IEZBTFNFKQ0KYGBgDQoNClZlcmdsZWljaCB2b24gendlaSBNb2RlbGxlbjoNCg0KYGBge3IgUmVncmVzc2lvbl9jb21wYXJpc29uX3RleHJlZywgZWNobyA9IFRSVUUsIHJlc3VsdHMgPSAnYXNpcyd9DQpCZWF0bGVzIDwtIFRvcDYgJT4lDQogIGZpbHRlcihhcnRpc3QgPT0gIlRoZSBCZWF0bGVzIikNCkJlYXRsZXNfbG0gPC0gbG0ocmF3X2V1ciB+IHJhd191c2EsIGRhdGEgPSBCZWF0bGVzKQ0KDQpodG1scmVnKGxpc3QoU3RvbmVzX2xtLCBCZWF0bGVzX2xtKSwNCiAgICAgICAgY3VzdG9tLm1vZGVsLm5hbWVzID0gYygiU3RvbmVzIiwgIkJlYXRsZXMiKSwNCiAgICAgICAgZG9jdHlwZSA9IEZBTFNFKQ0KYGBgDQoNCg0KIyBSZWdyZXNzaW9uc2VyZ2Vibmlzc2UgYWxzIERhdGVuc2F0eg0KDQpXYXJ1bSBEYXRlbnNhdHo/IFdlaWwgd2lyIGhpZXIga29tcGFrdCBkaWUgRXJnZWJuaXNzZSB2b24gaW5zZ2VzYW10IDYgTW9kZWxsZW4gZ2VzYW1tZWx0IGhhYmVuLg0KQmVpIHdlbGNoZW4gS8O8bnN0bGVybiAvIEJhbmRzIHNpbmQgZGllIFp1c2FtbWVuaMOkbmdlIHNpZ25pZmlrYW50Pw0KV2llIHNpbmQgZGllIFdpcmt1bmdzcmljaHR1bmdlbj8NCkVyZ2Vibmlzc2Ugc29ydGllcnQgbmFjaCBwLVdlcnRlbi4NCg0KIyMgRGlyZWt0ZSBBdXNnYWJlDQoNCmBgYHtyIFJlZ3Jlc3Npb25zdGFiZWxsZV9kaXJla3QsIGVjaG8gPSBUUlVFfQ0KRXJnZWJuaXNzZQ0KYGBgDQoNCiMjIGthYmxlDQoNCmthYmxlIHNpZWh0IGltIFdvcmQtRm9ybWF0IGFtIGJlc3RlbiBhdXMuIEdpYnQgTWF0cml6ZW4gb2RlciBEYXRlbnPDpHR6ZSBhdXMuDQoNCmBgYHtyIFJlZ3Jlc3Npb25zdGFiZWxsZV9rYWJsZSwgZWNobyA9IFRSVUV9DQprYWJsZShFcmdlYm5pc3NlKQ0KYGBgDQoNCiMjIHh0YWJsZQ0KDQp4dGFibGUgbGllZmVydCBrb21wYWt0ZSBUYWJlbGxlbi4NCg0KYGBge3IgUmVncmVzc2lvbnN0YWJlbGxlX3h0YWJsZSwgZWNobyA9IFRSVUUsIHJlc3VsdHMgPSAnYXNpcyd9DQpUYWJlbGxlIDwtIHh0YWJsZShFcmdlYm5pc3NlKQ0KcHJpbnQoVGFiZWxsZSwgdHlwZSA9ICJodG1sIikNCnByaW50KFRhYmVsbGUsIHR5cGUgPSAiaHRtbCIsIGh0bWwudGFibGUuYXR0cmlidXRlcyA9ICJib3JkZXIgPSAwIikNCmBgYA0KDQojIyBJbnRlcmFrdGl2ZSBUYWJlbGxlOiBkYXRhdGFibGUgKFBha2V0IERUKQ0KDQpgYGB7ciBSZWdyZXNzaW9uc3RhYmVsbGVfZGF0YXRhYmxlLCBlY2hvID0gVFJVRSwgcmVzdWx0cyA9ICdhc2lzJ30NCmRhdGF0YWJsZShFcmdlYm5pc3NlKQ0KYGBgDQoNCkRhbWl0IGthbm4gbWFuIGF1Y2ggZ2FuemUgRGF0ZW5zw6R0emUgZGFyc3RlbGxlbiAuLi4NCg0KYGBge3IgRGF0ZW5zYXR6X2RhdGFibGUsIGVjaG8gPSBUUlVFfQ0KZGF0YXRhYmxlKFRvcDYpDQpgYGANCg0KDQojIEludGVyYWt0aXZlIEdyYWZpa2VuDQoNCiMjIFN0cmV1ZGlhZ3JhbW0NCg0KYGBge3IgSW50ZXJha3RpdiwgZWNobyA9IFRSVUV9DQoNCnBpbmtmbG95ZCA8LSBhbGJ1bXMgJT4lDQogICAgZmlsdGVyKGFydGlzdCA9PSAiUGluayBGbG95ZCIpDQoNCiMgRHluYW1pc2NoOiBNb3VzZS1PdmVyLiBOdXIgaW4gSFRNTCEgQmVuw7Z0aWd0IEphdmFzY3JpcHQuDQojIFp1ZXJzdCBnZ3Bsb3QyIC4uLg0KDQpQaW5rRmxveWQgPC0gZ2dwbG90KHBpbmtmbG95ZCwgYWVzKHggPSB5ZWFyLCB5ID0gZmluYWxfc2NvcmUsIGxhYmVsID0gbmFtZSwgY29sID0gZmluYWxfc2NvcmUpKSArDQogIGxhYnModGl0bGUgPSAiUGluay1GbG95ZC1BbGJlbiAmIGlocmUgUHVua3R6YWhsZW4iLA0KICAgICAgIHggPSAiSmFociIsIHkgPSAiUHVua3R6YWhsIikgKw0KICBzY2FsZV94X2NvbnRpbnVvdXMobGltaXRzID0gYygxOTY1LCAyMDExKSkgKw0KICBnZW9tX2ppdHRlcigpDQoNCiMgLi4uIGRhbm4gcGxvdGx5DQpnZ3Bsb3RseShQaW5rRmxveWQsIHRvb2x0aXAgPSBjKCJ4IiwgInkiLCAibGFiZWwiKSkNCg0KYGBgDQoNCiMjIERpYW1vbmRzDQoNCmBgYHtyIGRpYW1vbmRzLCBlY2hvID0gRkFMU0UsIG1lc3NhZ2UgPSBGQUxTRX0NCmxpYnJhcnkocGxvdGx5KQ0KcCA8LSBnZ3Bsb3QoZGF0YSA9IGRpYW1vbmRzLCBhZXMoeCA9IGN1dCwgZmlsbCA9IGNsYXJpdHkpKSArDQogICAgICAgICAgICBnZW9tX2Jhcihwb3NpdGlvbiA9ICJkb2RnZSIpDQpnZ3Bsb3RseShwKQ0KYGBgDQo=