Wie ermittelt man Konfidenzintervalle für kategoriale Variablen in Stata?

Stata Logo

Es gibt einen einfachen Stata-Befehl, mit dem man Konfidenzintervalle abrufen kann:

ci Variable

Der Haken daran: Der Befehl ist für metrische Variablen gedacht. Was tun, wenn man ein Konfidenzintervall für einen relativen Anteil ermitteln möchte? Beispiel: Marktanteil einer Kaffeemarke. Nehmen wir an, die Kaffeemarke AA kommt auf einen Marktanteil von 21,7%.

Hier hilft ein einfacher Trick: wir codieren die Variable „binär“ um, und zwar so, dass die Kaffeemarke AA den Wert 1 erhält, alle anderen Marken den Wert 0 (Fehlwerte ggf. ausschließen!).

gen kaffeemarke_binär=0



replace kaffeemarke_binär=1 if kaffeemarke==“aa“
ci kaffeemarke

(Auf die zwei Gleichheitszeichen im if-Teil achten.) Stata liefert uns den Mittelwert von 0,217, an dem wir unschwer den prozentualen Anteil von 21,7% erkennen können. Wir haben also eine metrische Variable, für die auch das Konfidenzintervall angegeben ist.

In SPSS habe ich die gleiche Frage mit dem Hinweis auf Bootstrapping beantwortet; vgl. Artikel Wie ermittelt man Konfidenzintervalle für relative (prozentuale) Anteile?




Freue mich über Kommentare!