Datenbasis
Die folgenden Daten beruhen auf 3000 Alben von 1010 verschiedenen Bands / Künstlern. Sie stammen von der Webseite https://tsort.info/. Wir verwenden die Version 2-7-0005.
Visualisierung
Inwiefern ist die Punktzahl für Chartplatzierungen in Europa vorhersagbar durch die Punktzahl in den U.S.A.?
Gibt es Unterschiede zwischen den Top 6 Künstlern / Bands?
ggplot(Top6, aes(x = raw_usa, y = raw_eur)) +
geom_jitter() +
geom_smooth(color = "darkgreen", method = "loess", se = FALSE) +
geom_smooth(color = "blue", method = "lm", se = FALSE) +
facet_wrap(~ artist, nrow = 2, scales = "free") +
labs(x = "Punkte U.S.A.", y = "Punkte Europa",
title = "Punkte USA vs. Europa für Top 6 Künstler / Bands",
caption = "Quelle: tsort.info, Version 2.7.0005")
Regression
Regressionsmodell für die Rolling Stones.
Direkte Ausgabe
Stones <- Top6 %>%
filter(artist == "The Rolling Stones")
Stones_lm <- lm(raw_eur ~ raw_usa, data = Stones)
summary(Stones_lm)
##
## Call:
## lm(formula = raw_eur ~ raw_usa, data = Stones)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4463.6 -3332.9 -646.9 1714.3 9057.0
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4638.44964 1092.53951 4.246 0.000153 ***
## raw_usa -0.05667 0.16286 -0.348 0.729966
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3980 on 35 degrees of freedom
## Multiple R-squared: 0.003447, Adjusted R-squared: -0.02503
## F-statistic: 0.1211 on 1 and 35 DF, p-value: 0.73
xtable
Tabelle <- xtable(summary(Stones_lm))
print(Tabelle, type = "html")
|
Estimate
|
Std. Error
|
t value
|
Pr(>|t|)
|
(Intercept)
|
4638.4496
|
1092.5395
|
4.25
|
0.0002
|
raw_usa
|
-0.0567
|
0.1629
|
-0.35
|
0.7300
|
texreg::htmlreg
Ein Modell:
htmlreg(Stones_lm, doctype = FALSE)
Statistical models
|
Model 1
|
(Intercept)
|
4638.45***
|
|
(1092.54)
|
raw_usa
|
-0.06
|
|
(0.16)
|
R2
|
0.00
|
Adj. R2
|
-0.03
|
Num. obs.
|
37
|
RMSE
|
3979.62
|
p < 0.001, p < 0.01, p < 0.05
|
htmlreg(Stones_lm, single.row = TRUE, doctype = FALSE)
Statistical models
|
Model 1
|
(Intercept)
|
4638.45 (1092.54)***
|
raw_usa
|
-0.06 (0.16)
|
R2
|
0.00
|
Adj. R2
|
-0.03
|
Num. obs.
|
37
|
RMSE
|
3979.62
|
p < 0.001, p < 0.01, p < 0.05
|
Vergleich von zwei Modellen:
Beatles <- Top6 %>%
filter(artist == "The Beatles")
Beatles_lm <- lm(raw_eur ~ raw_usa, data = Beatles)
htmlreg(list(Stones_lm, Beatles_lm),
custom.model.names = c("Stones", "Beatles"),
doctype = FALSE)
Statistical models
|
Stones
|
Beatles
|
(Intercept)
|
4638.45***
|
2540.39*
|
|
(1092.54)
|
(928.58)
|
raw_usa
|
-0.06
|
0.19*
|
|
(0.16)
|
(0.08)
|
R2
|
0.00
|
0.14
|
Adj. R2
|
-0.03
|
0.12
|
Num. obs.
|
37
|
33
|
RMSE
|
3979.62
|
3382.10
|
p < 0.001, p < 0.01, p < 0.05
|
Regressionsergebnisse als Datensatz
Warum Datensatz? Weil wir hier kompakt die Ergebnisse von insgesamt 6 Modellen gesammelt haben. Bei welchen Künstlern / Bands sind die Zusammenhänge signifikant? Wie sind die Wirkungsrichtungen? Ergebnisse sortiert nach p-Werten.
Direkte Ausgabe
Ergebnisse
## Künstler_Band Koeffizient pWert
## 1 The Beatles 0.19278703 0.02921007
## 2 Madonna 0.74404111 0.06273117
## 3 U2 0.47422004 0.06636111
## 4 Bob Dylan -0.08456933 0.47520575
## 5 Bruce Springsteen 0.14645709 0.50158702
## 6 The Rolling Stones -0.05666535 0.72996576
kable
kable sieht im Word-Format am besten aus. Gibt Matrizen oder Datensätze aus.
kable(Ergebnisse)
The Beatles |
0.1927870 |
0.0292101 |
Madonna |
0.7440411 |
0.0627312 |
U2 |
0.4742200 |
0.0663611 |
Bob Dylan |
-0.0845693 |
0.4752058 |
Bruce Springsteen |
0.1464571 |
0.5015870 |
The Rolling Stones |
-0.0566653 |
0.7299658 |
xtable
xtable liefert kompakte Tabellen.
Tabelle <- xtable(Ergebnisse)
print(Tabelle, type = "html")
|
Künstler_Band
|
Koeffizient
|
pWert
|
1
|
The Beatles
|
0.19
|
0.03
|
2
|
Madonna
|
0.74
|
0.06
|
3
|
U2
|
0.47
|
0.07
|
4
|
Bob Dylan
|
-0.08
|
0.48
|
5
|
Bruce Springsteen
|
0.15
|
0.50
|
6
|
The Rolling Stones
|
-0.06
|
0.73
|
print(Tabelle, type = "html", html.table.attributes = "border = 0")
|
Künstler_Band
|
Koeffizient
|
pWert
|
1
|
The Beatles
|
0.19
|
0.03
|
2
|
Madonna
|
0.74
|
0.06
|
3
|
U2
|
0.47
|
0.07
|
4
|
Bob Dylan
|
-0.08
|
0.48
|
5
|
Bruce Springsteen
|
0.15
|
0.50
|
6
|
The Rolling Stones
|
-0.06
|
0.73
|
Interaktive Tabelle: datatable (Paket DT)
datatable(Ergebnisse)
Damit kann man auch ganze Datensätze darstellen …
datatable(Top6)
Interaktive Grafiken
Streudiagramm
pinkfloyd <- albums %>%
filter(artist == "Pink Floyd")
# Dynamisch: Mouse-Over. Nur in HTML! Benötigt Javascript.
# Zuerst ggplot2 ...
PinkFloyd <- ggplot(pinkfloyd, aes(x = year, y = final_score, label = name, col = final_score)) +
labs(title = "Pink-Floyd-Alben & ihre Punktzahlen",
x = "Jahr", y = "Punktzahl") +
scale_x_continuous(limits = c(1965, 2011)) +
geom_jitter()
# ... dann plotly
ggplotly(PinkFloyd, tooltip = c("x", "y", "label"))
LS0tDQp0aXRsZTogJ0NoYXJ0LUdlc2NoaWNodGUobik6IFp3aXNjaGVuYmVyaWNodCcNCmF1dGhvcjogJ0t1cnM6IEVpbmbDvGhydW5nIGluIFInDQpkYXRlOiAnQmVyaWNodCBlcnN0ZWxsdDogYHIgU3lzLnRpbWUoKWAnDQpvdXRwdXQ6DQogIGh0bWxfZG9jdW1lbnQ6DQogICAgdG9jOiB5ZXMNCiAgICB0b2NfZmxvYXQ6IHllcw0KICAgIGNvZGVfZm9sZGluZzogaGlkZQ0KICAgIGNvZGVfZG93bmxvYWQ6IHRydWUNCi0tLQ0KDQpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0NCg0KbGlicmFyeShrbml0cikNCmxpYnJhcnkoeHRhYmxlKQ0KbGlicmFyeShwYW5kZXIpDQpsaWJyYXJ5KHRleHJlZykNCmxpYnJhcnkoRFQpDQpsaWJyYXJ5KGZvcmNhdHMpDQpsaWJyYXJ5KGRwbHlyKQ0KbGlicmFyeShnZ3Bsb3QyKQ0KbGlicmFyeShwbG90bHkpDQoNCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gVFJVRSkNCiMga25pdHI6Om9wdHNfY2h1bmskc2V0KGNvbW1lbnQgPSBOQSkNCg0KbG9hZCgiUmVncmVzc2lvbnNlcmdlYm5pc3NlLlJkYSIpDQpsb2FkKCJBbGJlbi5SZGEiKQ0KYGBgDQoNCg0KYGBge3IgVm9yYmVyZWl0dW5nLCBlY2hvID0gRkFMU0V9DQoNClRvcDYgPC0gYWxidW1zICU+JQ0KICBncm91cF9ieShhcnRpc3QpICU+JQ0KICBzdW1tYXJpc2UoR2VzYW10cHVua3RlID0gc3VtKGZpbmFsX3Njb3JlKSwNCiAgICAgICAgICAgIE4gPSBuKCkpICU+JQ0KICBhcnJhbmdlKGRlc2MoR2VzYW10cHVua3RlKSkgJT4lDQogIGZpbHRlcihhcnRpc3QgIT0gIk9yaWdpbmFsIFNvdW5kdHJhY2siKQ0KDQpUb3A2IDwtIFRvcDYgJT4lDQogIG11dGF0ZShpZCA9IGFzLm51bWVyaWMocm93bmFtZXMoVG9wNikpKSAlPiUNCiAgZmlsdGVyKGlkIDwgNykNCg0KYXJ0aXN0cyA8LSBUb3A2JGFydGlzdA0KDQpUb3A2IDwtIGFsYnVtcyAlPiUNCiAgZmlsdGVyKGFydGlzdCAlaW4lIGFydGlzdHMpICU+JQ0KICBtdXRhdGUoYXJ0aXN0ID0gZmN0X2luZnJlcShhcnRpc3QpKQ0KDQojIFJlZ3Jlc3Npb24gZWluZsO8Z2VuDQoNCiMgQWJzdGVpZ2VuZCBzb3J0aWVyZW4gbmFjaCBwLVdlcnRlbg0KRXJnZWJuaXNzZSA8LSBFcmdlYm5pc3NlICU+JQ0KICBhcnJhbmdlKHBXZXJ0KQ0KDQpgYGANCg0KIyBEYXRlbmJhc2lzDQoNCkRpZSBmb2xnZW5kZW4gRGF0ZW4gYmVydWhlbiBhdWYgYHIgbnJvdyhhbGJ1bXMpYCBBbGJlbiB2b24gYHIgbGVuZ3RoKHVuaXF1ZShhbGJ1bXMkYXJ0aXN0KSlgIHZlcnNjaGllZGVuZW4gQmFuZHMgLyBLw7xuc3RsZXJuLiBTaWUgc3RhbW1lbiB2b24gZGVyIFdlYnNlaXRlIGh0dHBzOi8vdHNvcnQuaW5mby8uIFdpciB2ZXJ3ZW5kZW4gZGllIFZlcnNpb24gKioyLTctMDAwNSoqLg0KDQoNCiMjIFZpc3VhbGlzaWVydW5nDQoNCklud2llZmVybiBpc3QgZGllIFB1bmt0emFobCBmw7xyIENoYXJ0cGxhdHppZXJ1bmdlbiBpbiBFdXJvcGEgdm9yaGVyc2FnYmFyIGR1cmNoIGRpZSBQdW5rdHphaGwgaW4gZGVuIFUuUy5BLj8gICANCkdpYnQgZXMgVW50ZXJzY2hpZWRlIHp3aXNjaGVuIGRlbiBUb3AgNiBLw7xuc3RsZXJuIC8gQmFuZHM/DQoNCmBgYHtyIFZpc3VhbGlzaWVydW5nLCBlY2hvID0gVFJVRX0NCg0KZ2dwbG90KFRvcDYsIGFlcyh4ID0gcmF3X3VzYSwgeSA9IHJhd19ldXIpKSArDQogIGdlb21faml0dGVyKCkgKw0KICBnZW9tX3Ntb290aChjb2xvciA9ICJkYXJrZ3JlZW4iLCBtZXRob2QgPSAibG9lc3MiLCBzZSA9IEZBTFNFKSArDQogIGdlb21fc21vb3RoKGNvbG9yID0gImJsdWUiLCBtZXRob2QgPSAibG0iLCBzZSA9IEZBTFNFKSArDQogIGZhY2V0X3dyYXAofiBhcnRpc3QsIG5yb3cgPSAyLCBzY2FsZXMgPSAiZnJlZSIpICsNCiAgbGFicyh4ID0gIlB1bmt0ZSBVLlMuQS4iLCB5ID0gIlB1bmt0ZSBFdXJvcGEiLA0KICAgICAgIHRpdGxlID0gIlB1bmt0ZSBVU0EgdnMuIEV1cm9wYSBmw7xyIFRvcCA2IEvDvG5zdGxlciAvIEJhbmRzIiwNCiAgICAgICBjYXB0aW9uID0gIlF1ZWxsZTogdHNvcnQuaW5mbywgVmVyc2lvbiAyLjcuMDAwNSIpDQpgYGANCg0KIyBSZWdyZXNzaW9uDQoNClJlZ3Jlc3Npb25zbW9kZWxsIGbDvHIgZGllIFJvbGxpbmcgU3RvbmVzLg0KDQojIyBEaXJla3RlIEF1c2dhYmUNCg0KYGBge3IgUmVncmVzc2lvbl9TdG9uZXNfZGlyZWt0LCBlY2hvID0gVFJVRX0NClN0b25lcyA8LSBUb3A2ICU+JQ0KICBmaWx0ZXIoYXJ0aXN0ID09ICJUaGUgUm9sbGluZyBTdG9uZXMiKQ0KU3RvbmVzX2xtIDwtIGxtKHJhd19ldXIgfiByYXdfdXNhLCBkYXRhID0gU3RvbmVzKQ0Kc3VtbWFyeShTdG9uZXNfbG0pDQpgYGANCg0KIyMgeHRhYmxlDQoNCmBgYHtyIFJlZ3Jlc3Npb25fU3RvbmVzX3h0YWJsZSwgZWNobyA9IFRSVUUsIHJlc3VsdHMgPSAnYXNpcyd9DQpUYWJlbGxlIDwtIHh0YWJsZShzdW1tYXJ5KFN0b25lc19sbSkpDQpwcmludChUYWJlbGxlLCB0eXBlID0gImh0bWwiKQ0KYGBgDQoNCiMjIHRleHJlZzo6aHRtbHJlZw0KDQpFaW4gTW9kZWxsOg0KDQpgYGB7ciBSZWdyZXNzaW9uX1N0b25lc190ZXhyZWcsIGVjaG8gPSBUUlVFLCByZXN1bHRzID0gJ2FzaXMnfQ0KaHRtbHJlZyhTdG9uZXNfbG0sIGRvY3R5cGUgPSBGQUxTRSkNCmh0bWxyZWcoU3RvbmVzX2xtLCBzaW5nbGUucm93ID0gVFJVRSwgZG9jdHlwZSA9IEZBTFNFKQ0KYGBgDQoNClZlcmdsZWljaCB2b24gendlaSBNb2RlbGxlbjoNCg0KYGBge3IgUmVncmVzc2lvbl9jb21wYXJpc29uX3RleHJlZywgZWNobyA9IFRSVUUsIHJlc3VsdHMgPSAnYXNpcyd9DQpCZWF0bGVzIDwtIFRvcDYgJT4lDQogIGZpbHRlcihhcnRpc3QgPT0gIlRoZSBCZWF0bGVzIikNCkJlYXRsZXNfbG0gPC0gbG0ocmF3X2V1ciB+IHJhd191c2EsIGRhdGEgPSBCZWF0bGVzKQ0KDQpodG1scmVnKGxpc3QoU3RvbmVzX2xtLCBCZWF0bGVzX2xtKSwNCiAgICAgICAgY3VzdG9tLm1vZGVsLm5hbWVzID0gYygiU3RvbmVzIiwgIkJlYXRsZXMiKSwNCiAgICAgICAgZG9jdHlwZSA9IEZBTFNFKQ0KYGBgDQoNCg0KIyBSZWdyZXNzaW9uc2VyZ2Vibmlzc2UgYWxzIERhdGVuc2F0eg0KDQpXYXJ1bSBEYXRlbnNhdHo/IFdlaWwgd2lyIGhpZXIga29tcGFrdCBkaWUgRXJnZWJuaXNzZSB2b24gaW5zZ2VzYW10IDYgTW9kZWxsZW4gZ2VzYW1tZWx0IGhhYmVuLg0KQmVpIHdlbGNoZW4gS8O8bnN0bGVybiAvIEJhbmRzIHNpbmQgZGllIFp1c2FtbWVuaMOkbmdlIHNpZ25pZmlrYW50Pw0KV2llIHNpbmQgZGllIFdpcmt1bmdzcmljaHR1bmdlbj8NCkVyZ2Vibmlzc2Ugc29ydGllcnQgbmFjaCBwLVdlcnRlbi4NCg0KIyMgRGlyZWt0ZSBBdXNnYWJlDQoNCmBgYHtyIFJlZ3Jlc3Npb25zdGFiZWxsZV9kaXJla3QsIGVjaG8gPSBUUlVFfQ0KRXJnZWJuaXNzZQ0KYGBgDQoNCiMjIGthYmxlDQoNCmthYmxlIHNpZWh0IGltIFdvcmQtRm9ybWF0IGFtIGJlc3RlbiBhdXMuIEdpYnQgTWF0cml6ZW4gb2RlciBEYXRlbnPDpHR6ZSBhdXMuDQoNCmBgYHtyIFJlZ3Jlc3Npb25zdGFiZWxsZV9rYWJsZSwgZWNobyA9IFRSVUV9DQprYWJsZShFcmdlYm5pc3NlKQ0KYGBgDQoNCiMjIHh0YWJsZQ0KDQp4dGFibGUgbGllZmVydCBrb21wYWt0ZSBUYWJlbGxlbi4NCg0KYGBge3IgUmVncmVzc2lvbnN0YWJlbGxlX3h0YWJsZSwgZWNobyA9IFRSVUUsIHJlc3VsdHMgPSAnYXNpcyd9DQpUYWJlbGxlIDwtIHh0YWJsZShFcmdlYm5pc3NlKQ0KcHJpbnQoVGFiZWxsZSwgdHlwZSA9ICJodG1sIikNCnByaW50KFRhYmVsbGUsIHR5cGUgPSAiaHRtbCIsIGh0bWwudGFibGUuYXR0cmlidXRlcyA9ICJib3JkZXIgPSAwIikNCmBgYA0KDQojIyBJbnRlcmFrdGl2ZSBUYWJlbGxlOiBkYXRhdGFibGUgKFBha2V0IERUKQ0KDQpgYGB7ciBSZWdyZXNzaW9uc3RhYmVsbGVfZGF0YXRhYmxlLCBlY2hvID0gVFJVRSwgcmVzdWx0cyA9ICdhc2lzJ30NCmRhdGF0YWJsZShFcmdlYm5pc3NlKQ0KYGBgDQoNCkRhbWl0IGthbm4gbWFuIGF1Y2ggZ2FuemUgRGF0ZW5zw6R0emUgZGFyc3RlbGxlbiAuLi4NCg0KYGBge3IgRGF0ZW5zYXR6X2RhdGFibGUsIGVjaG8gPSBUUlVFfQ0KZGF0YXRhYmxlKFRvcDYpDQpgYGANCg0KDQojIEludGVyYWt0aXZlIEdyYWZpa2VuDQoNCiMjIFN0cmV1ZGlhZ3JhbW0NCg0KYGBge3IgSW50ZXJha3RpdiwgZWNobyA9IFRSVUV9DQoNCnBpbmtmbG95ZCA8LSBhbGJ1bXMgJT4lDQogICAgZmlsdGVyKGFydGlzdCA9PSAiUGluayBGbG95ZCIpDQoNCiMgRHluYW1pc2NoOiBNb3VzZS1PdmVyLiBOdXIgaW4gSFRNTCEgQmVuw7Z0aWd0IEphdmFzY3JpcHQuDQojIFp1ZXJzdCBnZ3Bsb3QyIC4uLg0KDQpQaW5rRmxveWQgPC0gZ2dwbG90KHBpbmtmbG95ZCwgYWVzKHggPSB5ZWFyLCB5ID0gZmluYWxfc2NvcmUsIGxhYmVsID0gbmFtZSwgY29sID0gZmluYWxfc2NvcmUpKSArDQogIGxhYnModGl0bGUgPSAiUGluay1GbG95ZC1BbGJlbiAmIGlocmUgUHVua3R6YWhsZW4iLA0KICAgICAgIHggPSAiSmFociIsIHkgPSAiUHVua3R6YWhsIikgKw0KICBzY2FsZV94X2NvbnRpbnVvdXMobGltaXRzID0gYygxOTY1LCAyMDExKSkgKw0KICBnZW9tX2ppdHRlcigpDQoNCiMgLi4uIGRhbm4gcGxvdGx5DQpnZ3Bsb3RseShQaW5rRmxveWQsIHRvb2x0aXAgPSBjKCJ4IiwgInkiLCAibGFiZWwiKSkNCg0KYGBgDQoNCiMjIERpYW1vbmRzDQoNCmBgYHtyIGRpYW1vbmRzLCBlY2hvID0gRkFMU0UsIG1lc3NhZ2UgPSBGQUxTRX0NCmxpYnJhcnkocGxvdGx5KQ0KcCA8LSBnZ3Bsb3QoZGF0YSA9IGRpYW1vbmRzLCBhZXMoeCA9IGN1dCwgZmlsbCA9IGNsYXJpdHkpKSArDQogICAgICAgICAgICBnZW9tX2Jhcihwb3NpdGlvbiA9ICJkb2RnZSIpDQpnZ3Bsb3RseShwKQ0KYGBgDQo=