Umfrage auswerten: So geht die Datenanalyse

Bild: picture alliance / Zoonar | Khakimullin Aleksandr D9

Leitfaden „Umfrage erstellen“ Schritte 16-19

Nachdem eine Umfrage erstellt und erhoben wurde, erfolgt nun die Aufbereitung und Analyse der gesammelten Daten. So entstehen aus den erhoben Daten Ergebnisse, die bei sorgfältigem Vorgehen Antworten auf die Untersuchungsfragen liefern können. Welche Schritte müssen dabei beachtet werden? 

Schritt 16: Wie starte ich die Auswertung meiner Online-Umfrage?

Wer eine Online-Umfrage erstellt, nutzt dazu in der Regel zumeist ein Online-Umfrage-Tool. In den meisten Fällen ermöglichen diese Tools, die Umfrageergebnisse bzw. -antworten als Excel-Liste zu exportieren.  

Sollten Sie ein solches Tool nicht verwendet haben, ist der erste Schritt, die Ergebnisse der Umfrage in eine Excel-Liste zu übertragen.

Dabei ist der gängige Aufbau, dass jeweils eine Zeile einer befragten Person (einem Fall) zugeordnet wird und dessen Antworten in den Spalten zu finden sind. Jeder Person wird dabei eine fixe fortlaufende Fall-Nummer gegeben.

Schritt 17: Warum die Daten vor der Analyse bereinigt werden sollten

Bevor die Umfragedaten analysiert werden, muss der Datensatz bereinigt werden. Das bedeutet, dass einzelne Werte oder auch Fälle (also alle Antworten einer Person) aus den Datensatz entfernt werden, wenn die Sorge besteht, dass dadurch das Ergebnis verfälscht werden könnte.

Gründe für das Entfernen von Werten / Fällen

Wenn Befragte zu viele Antworten ausgelassen haben, kann dies die Umfrageergebnisse verzerren. Deshalb muss vorab entschieden werden, ob man Personen, die nur wenige Fragen beantwortet haben, ggf. vor der Auswertung aus dem Datensatz entfernt werden.  

Wenn Sie z. B. Personen, die Sport machen, befragen wollen, aber ein Befragter angibt, gar keinen Sport zu machen, ist er für die Umfrage irrelevant und sollte aus dem Datensatz entfernt werden.

Unser Tipp: Dies lässt sich durch das Einstellen von Filtern innerhalb der Umfrage vermeiden.

Bei offenen Fragen, z. B. nach dem Alter oder dem Gehalt einer Person, kann es passieren, dass außergewöhnliche und unrealistisch hohe oder niedrige Werte eingetragen werden. Wenn beispielsweise nach der Anzahl der Fernsehgeräte im Haushalt gefragt wird und bei den Antworten ein Wert von 15 auftaucht, ist dies unrealistisch hoch und deutet daraufhin, dass der Teilnehmer nicht wahrheitsgemäß geantwortet hat. Sollte sich dieser Eindruck bei weiteren Angaben verstärken, sollte ein solcher Fall entfernt werden. 

Eine zu schnelle Beantwortungszeit deutet darauf hin, dass der Befragte unsorgfältig durch die Umfrage gerast ist und beliebige Antworten ausgewählt wurden. In den meisten Umfragetools lässt sich für jeden Teilnehmenden die Bearbeitungszeit nachschauen. 

Wenn ein Befragter immer dieselbe Antwortoption auswählt, z. B. immer die mittlere Ausprägung bei einer Skala, deutet dies ebenfalls darauf hin, dass der Befragte die Umfrage möglichst schnell erledigen wollte und deshalb beliebige Antworten ausgewählt hat. 

Wenn ein Befragter auf verschiedene Fragen Antworten gibt, die nicht zusammenpassen, kann mindestens eine der Antworten nicht der Wahrheit entsprechen. Beispielsweise wenn der Befragte erst angibt, regelmäßig Podcasts zu hören, aber bei einer späteren Frage dann auswählt, im Monat null Stunden Podcasts zu hören.

Bei offenen Fragen ist es möglich, dass Textantworten ohne Sinn eingeben werden. Diese lassen sich dann nicht weiterverwenden und sollten entfernt werden.

Schritt 18: Codieren von Antworten als Pflichtaufgabe

Bevor die Umfrage statistisch ausgewertet werden kann, müssen die Antworten codiert werden. Dabei ordnet man jeder Antwort eine bestimmte Zahl zu. Dies ermöglicht, mit den Antworten statistische Berechnungen durchzuführen.

Beispiel 1

Frage: Bist du Mitglied in einem Sportverein? 

  • Keine Angabe = 0 
  • Ja = 1 
  • Nein = 2

Beispiel 2

Frage: Wie zufrieden bist du mit deinem aktuellen Job? 

  • Keine Angabe = 0 
  • Sehr zufrieden = 1 
  • Eher zufrieden = 2 
  • Eher unzufrieden = 3 
  • Sehr unzufrieden = 4 

Schritt 19: Wie werte ich meine Umfrage-Daten statistisch aus?

Für Anfänger ohne ausgeprägte Statistik- oder Mathekenntnisse eignet sich die deskriptive Statistik zur Auswertung der Umfrage. Deskriptiv bedeutet beschreibend, es werden also keine tiefergehenden statistische Analysen, sondern nur einfache Berechnungen durchgeführt, die bereits einige aussagekräftige Ergebnisse liefern können. Diese Berechnungen lassen sich meist mit Excel oder anderen Statistikprogrammen wie SPSS automatisch durchführen.

Häufigkeiten auswerten 

Der erste Schritt vor weiteren Analysen ist in der Regel die Auswertung der Häufigkeitsverteilung auf die verschiedenen Antwortkategorien. Ich schaue mir dabei an, wie sich die Befragten in Bezug auf eine bestimmte Frage auf die jeweiligen Antworten verteilen. Oftmals stellt das Befragungstool hierfür bereits geeignete Tabellen und Diagramme bereit. Es gibt verschiedene Möglichkeiten, die Häufigkeiten auszuwerten: 

  • Absolute Häufigkeiten: Die Gesamtzahl an Befragten, die eine bestimmte Antwort ausgewählt haben. Wenn von 200 Personen 38 angeben, kein Netflix zu nutzen, dann ist 38 die absolute Häufigkeit. 

  • Relative Häufigkeiten: Hier wird der absolute Wert in Bezug gesetzt zu der Gesamtzahl der Antworten. Für das obige Beispiel beträgt die relative Häufigkeit der Personen, die kein Netflix nutzen 0,19 (38 / 100) 

  • Prozentuale Häufigkeiten: Wenn die relative Häufigkeit in Prozentzahlen angegeben wird. Dafür muss der Wert lediglich mit 100 multipliziert werden Für das Beispiel beträgt die prozentuale Häufigkeit der Befragten, die kein Netflix nutzen somit 19 % (0,19 * 100) 

Statistische Kennwerte: Mittelwert, Modus, Median, Standardabweichung 

Wichtige und relativ einfach auszuwertende Kennzahlen sind der Mittelwert, der Modus, der Median und die Standardabweichung. In Excel oder anderen Statistikprogrammen wie SPSS gibt es meist vorgefertigte Formeln für die Berechnung dieser Kennwerte. Sie können jedoch zum Teil auch recht simpel selbst berechnet werden. 

Mittelwert 
Der Mittelwert wird auch arithmetisches Mittel (AR) oder Durchschnitt genannt. In EXCEL steht zur Berechnung die Formel =MITTELWERT() zur Verfügung. Der Mittelwert wird berechnet, indem alle vorhandenen Werte addiert und durch die Gesamtzahl der Antworten geteilt werden.  

Beispiel: Wie viele Fernsehgeräte befinden Sich im Haushalt? (100 Befragte) 

Der Mittelwert berechnet sich dann wie folgt: (0 * 8 + 1 * 29 + 2 * 40 + 3 * 18 + 4 * 4 + 5 * 1) / 100 = 1,84 

Im Durchschnitt besitzt ein Haushalt also 1,84 Fernsehgeräte. 

Modus 
Der Modus, auch genannt Modalwert, ist der Wert, der unter allen Antwortmöglichkeiten am häufigsten vorkommt. Im obigen Beispiel würde der Modus also 2 betragen, da mit einer Anzahl von 40 die meisten Befragten angegeben haben, zwei Fernsehgeräte im Haushalt zu besitzen. Auch wenn der Modus recht einfach selbst ermittelt werden kann, kann hierzu in Excel auch die Formel =MODALWERT() verwendet werden. 

Median 
Der Median ist der Wert, der genau in der Mitte einer Datenreihe liegt, wenn man diese nach Größe sortiert, sodass genau die Hälfte der Daten über und die Hälfte unter dem Median liegt. Wenn wir uns aus dem obigen Beispiel zur Vereinfachung 11 Fälle rausnehmen: {0, 0, 1, 1, 1, 1, 2, 2, 2, 3, 4}, dann liegt der Median bei 1, da genau 5 Werte darüber und 5 Werte darunter liegen. Wenn die Anzahl der Fälle in einem Datensatz gerade ist, z. B. bei folgenden 10 Fällen {0, 0, 1, 1, 1, 2, 2, 2, 3, 4}, dann liegt die Mitte nun zwischen 1 und 2, deswegen würde der Median 1.5 betragen, also exakt die Mitte zwischen diesen beiden Werten. In Excel kann der Median mit der Formel =MEDIAN() berechnet werden. 

Standardabweichung 
Die Standardabweichung ist ein Maß für die Streuung der Antworten bezogen auf den Mittelwert. Das heißt die Standardabweichung gibt an, wie weit die Antworten im Durchschnitt von dem Mittelwert abweichen. Bei unserem obigen Beispiel besitzt ein Haushalt im Mittel 1,84 Fernsehgeräte. Die Standardabweichung würde in diesem Beispiel ca. 0,94 betragen. Das bedeutet, dass die Anzahl der Fernsehgeräte, die ein Haushalt besitzt, im Durchschnitt um 0,94 von dem Mittelwert 1,84 abweicht. Die Berechnung der Standardabweichung ist schon ein bisschen aufwendiger als bei den vorherigen Kennzahlen. In Excel kann die Formel =STABW.S() zur Berechnung der Standardabweichung verwendet werden. 

Wie werte ich offene Fragen aus? 

Bei offenen Fragen kann es beliebig viele verschiedene Antworten geben. Darum werden offene Fragen qualitativ ausgewertet. Hier empfiehlt es sich, eine Kategorisierung vorzunehmen, indem ähnliche Antworten einem bestimmten Oberbegriff bzw. einer Kategorie zugeordnet werden. Wenn alle freien Antworten einer Kategorie zugeordnet wurden, dann kann ausgewertet werden, welche Kategorie wie häufig genannt wurde. Diese Ergebnisse können dann frei interpretiert werden. 

Weitere Highlights auf marktforschung.de

Editors Choice

alle anzeigen
Bitte warten, Verarbeitung läuft ...