Rundungsfehler in Standardauswertung

Ein häufiges Phänomen in Auswertungen mit %-Werten ist, dass die %-Werte in Summe nicht 100% ergeben, sondern 99%, 98%, 101%, 102% oder sogar noch mehr oder weniger. Als erster Inpuls fasst man schnell den Gedanken: „da kann etwas nicht stimmen!“. „Rechnet das System falsch?“ oder „OU rechnet falsch“.

Es gibt aber wie man so schön sagt „…für alles eine natürliche Erklärung“ 😉

Das Phänomen ist nämlich normal, weil es sich um gerundete Zahlen handelt.

Als Beispiel ergeben die 88% und 13% in nachfolgender Standardauswertung aus dem onlineumfragen.com-System (unter „Auswertung > Standardauswertung“) total stolze 101%.

2017-03-07_01-12-28

Wenn wir die selbe Frage unter „Auswertung > Tabellenbände I“ anschauen, sehen wir die exakten %-Werte von 87,5 und 12,5. Beides ergibt gerundet auf Ganzzahlen mathematisch korrekterweise 88 und 13%, total also 101%.

2017-03-07_01-07-33

Das Phänomen ist bekannt und in sehr vielen Statistiken ganz richtig anzutreffen (manchmal auch 99% statt 100%).

Es gibt krasse Fälle, wenn zum Beispiel eine Frage 167 Antwortvorgaben enthält und davon 166 Antwortvorgaben mit je 0,6% bewertet sind und eine mit 0,4. Dann haben wir gerundet 166 Antwortvorgaben mit je 1% und eine mit 0%, d.h. also total 166% – was absolut korrekt ist!

Es gibt Institute, die hier „von Hand frisieren“, was wissenschaftlich sehr fragwürdig ist. Am besten, man weisst auf den Umstand der Rundung hin oder zeigt die Zahlen mit einer oder zwei Kommastellen (was auch dann nicht ganz genau 100,00% ergibt! Weil z.B. 1/3 = 0,333333, d.h. auch 100,00 ist gerundet).

Ein paar Links zu dem Problem:

http://www.statistik-tutorial.de/forum/ftopic4303.html

http://oooforum.de/viewtopic.php?t=42760

http://forum.chip.de/office/brauche-hilfe-runden-prozent-1411923.html

 

CUSTOMFORMAT – Eigene CSS für stellenweise Formate verwenden

Mit %FETT … FETT% und ähnlichen Steuercodes können Sie Textformate punktuell in Fragen, Antwortvorgaben, Vorwort und vielen anderen Systemtexten einfügen.

Sie können aber auch via CSS völlig eigene Formate definieren (Farben, Abstände, Formen, Schriftarten, etc.) und diese ebenso stellenweise einbauen. Dies funktioniert mit dem Code %CUSTOMFORMAT1 … CUSTOMFORMAT1%

oder

%CUSTOMFORMAT2 … CUSTOMFORMAT2%

oder

%CUSTOMFORMAT3 … CUSTOMFORMAT3%

usw.

Sie brauchen diesen nur in der Frage zu verwenden:

2016-11-08_16-52-32

Und dann unter „Fragebogen > Aussehen/Eigenes Logo“ und dort unter „Eigene CSS“ zu definieren. Zum Beispiel so (alles in der Klammer ist die CSS-Definition):

2016-11-08_16-53-51

Das sieht dann live so aus, wenn Sie den Fragebogen unter „Fragebogen > Ganzen Fragebogen testen“ anschauen.

2016-11-08_16-54-11

Live dann voilà:

2016-11-08_16-54-36

 

 

Eigene Farbschemata für Standardauswertung

Für die Standardauswertung unter „Auswertung > Häufigkeitsverteilung (Standardauswertung) – alle Fragen“ können Sie nebst den vorhandenen Farbschemata auch bis zu drei eigene Farbschemata erstellen.

Klicken Sie dazu unter „Auswertung > Häufigkeitsverteilung (Standardauswertung) – alle Fragen“ einfach neben der Optionsbox „Farbschema“ auf das kleine Icon, um die Farbschemata zu bearbeiten.

21-02-2015 05-32-39

Sie sehen dann die maximal drei eigenen Farbschemata mit Feldern, mit denen Sie Ihre Wunschfarben für jedes Schema festlegen können. Sollten Sie genügend Farben für ein Schema definiert haben, lassen Sie die restlichen Felder einfach leer (kein Wert erfassen oder vorhandenen Wert mit der ENTF-Taste oder DEL-Taste löschen).

Sollten in Ihren Auswertungen irgendwo mehr Werte verwendet werden müssen, als Sie definiert haben, wiederholt sich die Skala einfach wieder von vorne, d.h. es wird z.B. für die zehnte Farbe einfach wieder die erste genommen usw., wenn Sie nur 9 Farben definiert haben.

21-02-2015 05-33-53

Sie können dann auf jede Farbe klicken, um mit einer umfangreichen Farb-Selektions-Box Ihre Farbe entweder intuitiv auszuwählen oder mit HEX-Werten oder RGB-Werten einzugeben. Diese Werte erhalten Sie ggf. von Ihrer Grafik- oder Marketingsabteilung.

21-02-2015 05-34-12

Die Farbschemata können dann jederzeit unter „Eigene 1“, „Eigene 2“ und „Eigene 3“ aufgerufen werden.

Das sieht dann zum Beispiel so aus:

21-02-2015 05-35-39

 

SPSS – Zusatzzeilen: zwei Werte in der selben Variablen auf zwei Variablen auftrennen (Split Variable)

Im SPSS-Export werden als Ausnahme wegen der kompakten Form und der Technik der internen Speichern bei onlineumfragen.com Werte und Texte in Tabellenfragen mit Zusatzzeilen (z.B. „Andere: ____ O1  O2  O3  O4  O5“) in einer Variablen gemeinsam gespeichert, und zwar in der Form:
dies ist der eingegebene Text,4

„dies ist der eingegebene Text“ ist dann der Text, der von den Teilnehmenden eingegeben wurde und die „4“ heisst, dass in der Skala der 4. Radiobutton ausgewählt wurde (entspricht der üblichen Codierung wie bei den oberen normalen Zeilen/Items).

Wie können bei Bedarf nun diese Zellen mit zwei Werten in zwei Zellen mit jeweils einem Wert aufgesplittet werden?

Die SPSS-Syntax dazu lautet anhand einem Beispiel für die Variable 14, die den Text „hallo,5“ enthält:

STRING V14UT1splittext (A100).
IF (CHAR.INDEX(v14UT1,',') >= 1) V14UT1splittext=CHAR.SUBSTR(v14UT1,1,CHAR.INDEX(v14UT1,',')-1).
EXECUTE.
STRING V14UT1splitwert (A100).
IF (CHAR.INDEX(v14UT1,',') >= 1) V14UT1splitwert=CHAR.SUBSTR(v14UT1,CHAR.INDEX(v14UT1,',')).
EXECUTE.

Es werden dadurch zwei neue Variablen erzeugt, die Variable V14UT1splittext, die den Text enthält (im Beispiel „hallo“), und die Variable V14UT1splitwert, die den Wert enthält (hier „5“). Dies kann dann mit allen Variablen durchgeführt werden, die kombiniert gespeichert sind. Die Variablennamen müssen dann jeweils händisch abgepasst werden. Zu den Anweisungen noch im Detail:

STRING V14UT1splittext (A100).

Richtet die neue Variable V14UT1splittext als String-Variable (Texte) ein.

IF (CHAR.INDEX(v14UT1,',') >= 1) V14UT1splittext=CHAR.SUBSTR(v14UT1,1,CHAR.INDEX(v14UT1,',')-1).

Erzeugt in die neue Variable aus der bestehenden Variablen V14UT1 alles, was vor dem Komma steht.

STRING V14UT1splitwert (A100).

Richtet die neue Variable V14UT1splitwert als String-Variable (Texte) ein.

IF (CHAR.INDEX(v14UT1,',') >= 1) V14UT1splitwert=CHAR.SUBSTR(v14UT1,CHAR.INDEX(v14UT1,',')).

Erzeugt in die neue Variable aus der bestehenden Variablen V14UT1 alles, was nach dem Komma steht.

EXECUTE

…führt den Befehl jeweils aus.

 

Usability-Optimierung: Warnung im Menü „Teilnehmer“ bei Sprachversionen

In der Vergangenheit hatten wir ab und zu Unterstützung zu leisten, wenn Kunden mit mehrsprachigen Umfragen aus Versehen oder (natürlich unverschuldetem) Unwissen heraus Einladungsmails aus einer Sprachversion heraus versendet hatten. Dies kann in bestimmten Szenarien ja auch nützlich und beabsichtigt sein, z.B. wenn schon vor dem Versand klar ist, dass bestimmte Teilnehmende ausschliesslich in einer Sprache (und nicht in der „Master“-Sprache sondern in einer Sprache einer Sprachversionsumfrage) befragt werden sollen. Ansonsten ist es empfehlenswert, alle Teilnehmenden immer aus der Masterversion heraus einzuladen. Denn dann erhalten alle Teilnehmenden die Möglichkeit, die Sprache der Befragung selbst über das Sprachmenü auszuwählen und selbst während der Befragung die Sprache zu wechseln. Entscheidender Vorteil zudem: alle Ergebnisse (aller Sprachen) fliessen in den selben zentralen Datenpool, nämlich in die Masterumfrage, zurück. Damit ist es einfach möglich, über alle Sprachen hinweg auszuwerten, wobei eine Auswertung pro Sprache natürlich über Superfilter, Tabellenbände, etc. trotzdem problemlos durchfeführt werden kann; aber eben auch eine Auswertung „over all“. Bei einem Versand von Einladungen aus einer Sprachversion heraus fliessen diese Ergebnisse dann direkt in die Sprachversion und sind somit getrennt von der Masterversion gespeichert und können nicht gemeinsam ausgewertet werden.

Hier haben wir nun ab sofort bei allen Sprachversionen im Menü „Teilnehmer“ (also dort wo versehentlich ein Versand stattfinden könnte, der obige Konsequenzen hat) ein rotes Warnfenster eingebaut, welches auch einen Link zum Lernvideo für mehrsprachige Umfragen enthält. Das Fenster kann natürlich weggeklickt werden, soll aber informieren und Missverständnisse vermeiden.

Vielen herzlichen Dank für die aufmerksamen Rückmeldungen aus unserer Community! Wir lernen täglich und lebenslang – und optimieren das System entsprechend gerne 😉

Tabellenbände mit Split aus metrischer Variable und eigener Klassenbildung

Sie möchten Tabellenbände nutzen und als horizontales Tabellenband nach einer Variablen auswerten, die metrisch skaliert ist, z.B. Alter? Sie haben aber die Frage ohne Altersklassen gestellt und eine offene Zahlenangabe abgefragt? Kein Problem. Sie können für die Auswertung (hier Tabellenbände II) eigene Klassen definieren, nach denen die Antworten „Alter“ klassifiziert werden.

Sie sehen hier (oben) bereits das Ergebnis. Die Altersgruppen sind hier selbst definiert und nicht durch die Frage „Alter“ vorgegeben. Um diese Auswertung zu erzeugen, wählen Sie unter „Auswertung“ den Punkt „Tabellenbände II (nur gültige Prozent mit Signifikanzen)“.

Wählen Sie dann den Link „Für Menü 1: Vergleiche von Subgruppen: hier einfach weiteres Tabellenband anfügen“ und fügen Sie ein Tabellenband an:

Kreuztabelle (Frage der aktuellen Umfrage):
Wie alt sind Sie?
Welche Überschrift soll das Tabellenband erhalten?
Altersgruppen
Optional: Labels für Antworten (in Reihenfolge der Antworten, bitte mit ; trennen). Beispiel: de;fr
0-16;17-25;26-35;36-45;46-55;über 55
Antworten gruppieren (Standard leer, Format: 1,2;3;4,5 oder 0-15;16-25;26-100)
0-16;17-25;26-35;36-45;46-55;55-100

Durch die Angabe der Labels „0-16“ „17-25“ usw. sagen Sie dem System, wie die Spalten benannt werden. Diese Angaben sind rein kosmentisch und haben keine technische Bedeutung. Sie können hier also auch sprechende Namen wie „Kinder“, „Jugendliche“, etc. verwenden, einfach so, wie für Sie am meisten Bedeutung und Klarheit entsteht.

Wichtig und technisch entscheidend ist die letzte Angabe „Antworten gruppieren“. Hier können Sie alle Antworten (eigentlich ja eine grosse Spannbreite von 0 bis z.B. 100 Jahre) in Gruppen einteilen, in dem Sie die in eine Gruppe zusammengehörenden Zahlen immer mit , oder – zusammenschreiben und die einzelnen Gruppen von der nächsten mit dem ; Zeichen abtrennen. Fügen Sie hier keine Leerzeichen oder Buchstaben ein.

Beispiel:

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16;17,18,19,20,21,22,23,24,25;usw...

Statt 0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16 kann auch die Kurzform 0-16 verwendet werden, das System erkennt dann alle Werte zwischen 0 und 16. Wichtig ist, dass die Gruppen durch das Semikolon (;) getrennt werden, die einzelnen Werte aber immer durch Komma (,) oder eben bei Bereichen mit einem Bindestrich (-) geschrieben werden.

Die Erfassung geschieht also so:

Hätten Sie in Wirklichkeit in einer Frage die Antwortvorgaben „Schweiz, Deutschland, Österreich, Frankreich, Luxembourg“ könnten Sie auch zwei Gruppen einrichten mit dem Label

Deutschsprachige Länder;Französischsprachige Länder

und der technischen Gruppenangabe

1,2,3;4,5

Beachten Sie das ; nach der 3, dieses trennt die beiden Gruppen!

Dies würde dann ein Tabellenband mit zwei Spalten „Deutschsprachige Länder“ und „Französischsprachige Länder“ anfügen, in der ersten Spalte werden dann alle Nennungen von Schweiz, Deutschland und Österreich eingezählt, in der zweiten alle von Frankreich und Luxembourg.

Umcodieren des Exports (Excel/SPSS) von Sortierfragen

Wenn Sortierfragen exportiert werden, exportieren wir generell so, dass wir die Spalten als Rangplätze setzen (Spalte 1=Erster Rang, Spalte 2=Zweiter Rang, Spalte 3=Dritter Rang, etc.) und die Inhalte der Zellen dann die Ausprägungen angeben, z.b. 1=Audi, 2=Opel, 3=Mercedes, etc. In einigen Fällen kann es nützlich sein, einen Export aber umzucodieren. Nämlich so, dass die erste Spalte immer die erste Marke meint und die Inhalte der Zellen deren Rangplatz (Platz 1, Platz 2, Patz 3, usw.), die zweite Spalte immer die zweite Marke (z.B. Opel) und für jeden Teilnehmer deren Platz, usw. und die Inhalte der Zellen dann die Rangplätze angeben (1=auf dem ersten Platz, 2=auf dem zweiten Platz, etc.). Beispielsweise können damit dann in Excel oder SPSS durchschnittliche Rangplätze für jede Marke berechnet werden (Mittelwert über Spalte).

Beispiel normaler Export (Standardexport):

Wir möchten aber folgendes haben:

Wir erstellen dazu einen ganz normalen Export in Excel, welcher uns das erste Bild liefert (also die „Normalcodierung“). Dann fügen wir fünf neue Spalten rechts von den bisherigen 5 Spalten ein. Wir haben dann die fünf Spalten (blau, bisherig) und daneben 5 neue Spalten (grün, neu, leer):

Jetzt benötigen wir für die neuen Felder (grün) eine spezielle Formel. Sinn und Zweck der Formel ist es, aus dem grünen Bereich die entsprechenden Rangplätze herauszulesen und in Merkmale umzuwandeln und diese dann in die blauen grünen zu schreiben. Die Formel lautet für die Zelle G2 in obigem Bild:

=WENN(ISTFEHLER(VERGLEICH(1;$B2:$F2;0));"";VERGLEICH(1;$B2:$F2;0))

Wir beginnen innen:

VERGLEICH(1;$B2:$F2;0))

Diese Formel sucht den Wert „1“ im Bereich $B2:$F2 (eigentlich könnte man schreiben B2:F2: der Raum, der die Antworten enthält. Wir schreiben aber zusätzlich das Dollarzeichen, damit Excel den Buchstaben B beim Kopieren in Zellen, die weiter rechts liegen, nicht erhöht. Wenn wir später die Formel von G2 nach H2 in die nächste Spalte kopieren wollen, soll dort der Bereich immer noch B2:F2 lauten. Ohne $ Zeichen würde Excel den Bereich nach C2:G2 abwandeln.) Die Null ganz hinten in der Formel gibt den Vergleichsmodus an. Null heisst hier, der Vergleich soll eine genaue Übereinstimmung ergeben.

Die Formel funktioniert so schon wunderbar und gibt für die Zelle G2 eine #NA zurück. Das ist leider nicht, was wir wollen, liegt aber daran, dass links im Bereich B2:F2 leere Zellen sind (missing values), mit denen die Formel (noch) nicht umgehen kann. Wir verwenden nun den Befehl  ISTFEHLER(formel), der je nachdem ob die Formel in Klammer einen Fehler zurückgibt oder nicht (bei uns jetzt „ja“) entweder 0 (=kein Fehler) oder 1 (Fehler) zurückgibt. Darum herum packen wir jetzt noch eine WENN-Formel, die im Format WENN(Bedingung;JA-Teil;Nein-Teil) bei erfüllter Bedingung den Ja-Teil ausgibt  (Ja-Teil ist „“, also nichts, denn wenn ein Fehler entsteht, soll einfach nichts geschrieben werden) – oder den Nein-Teil, wenn die Bedingung nicht erfüllt ist, also, wenn die Formel in der Mitte keinen Fehler ausgibt. Im Nein-Teil setzen wir dann ebenfalls ein, was ausgegeben werden soll: nochmals unsere Formel von oben.

So, genug erklärt: jetzt einfach die Formel in alle Felder kopieren (mit Copy/Paste).

Voilà! Wir haben nun in den Spalten G bis K jeweils die Werte für die Rangplätze (1=Erster Rang, 2=Zweiter Rang, 3=Dritter Rang, usw.) und als Spalten fixiert die Marken (V55=Audi, V55n1=Opel, V55n2Mercedes, etc.).

Natürlich kann SPSS eine solche Excel-Datei importieren (dazu zum Beispiel mit Merge Cases über die Interne-User-ID mergen). Die Case-Spalte würden wir dann am besten vorher wegschneiden.

Schriftgrösse für Fragen und Antworten in Standardauswertung anpassen

Um die Schriftgrösse von Fragen und Antwortvorgaben in Standardauswertungen anzupassen, wählen Sie in der Standardauswertung im Kasten der Optionen ganz oben auf der Seite den Punkt „Textgrösse“ und wählen Sie dort die Schriftgrösse aus. Diese wird auch für den PDF-Export wie auch für den Export nach Word direkt übernommen.

Spaltensummen für Tabellenfragen in Standardauswertung

Ab sofort steht eine neue Option für die Standardauswertung zur Verfügung. Lassen Sie sich anzeigen, wieviele Antworten gesamthaft (über die ganze Tabellenfrage, sprich alle Items, hinweg) in eine Antwortvorgabe oder einen Skalenwert fallen. Hatten Sie z.B. eine Skala von 1 bis 6, können Sie für jeden Skalenwert (z.B. 1) sehen, wieviele Teilnehmer über alle Items (Zeilen) hinweg mit dem Skalenwert 1 geantwortet haben. Wenn Sie als Skala eine nominale Skala wie zum Beispiel „Kenne ich“, „Kenne ich und nutze ich“, „Kenne ich nicht“ verwenden und als Items verschiedene Produkte abfragen, lässt sich sehr einfach sehen, wieviele Teilnehmer z.B. gesamthaft gar kein Produkt kennen usw.

Die Option lässt sich in der Standardauswertung in der oberen Optionsleiste anwählen. Wählen Sie dazu unter „Spaltenprozente in Tabellenfragen“ die Option „abs. Summen“. In allen Tabellenfragen wird dann automatisch als letzte Zeile der jeweiligen Tabelle die „Spalte Total“ inkl. Anzahl Teilnehmer angezeigt.

Tabellenband – Vergleich beliebiger Subgruppen mit Gesamtergebnis oder anderen Subgruppen

Vergleichen Sie eine von Ihnen erstellte Gruppe, die Sie über die Funktion „Auswertung > Superfilter“ festlegen, z.B. Versandgruppe, Datumsausschnitt aller Befragungsteilnehmer, nur Teilnehmer mit bestimmtem Antwortverhalten etc.  mit anderen angelegten Gruppen (Superfiltern) und/oder dem Gesamtergebnis.

Lassen Sie uns beispielsweise eine bestimmte Versandgruppe erstellen und diese mit dem Gesamtergebnis vergleichen:

  1. Legen Sie die gewünschten Superfilter (nach Gruppen) unter “Auswertung > Super-Filter (Fälle deaktivieren/aktivieren, “Select Cases”) an. (Beispiel: “Neuen Filter erstellen > Teilnehmer (Fälle) deaktivieren, welche die Bedingung nicht erfüllen > g) Filter nach Versand-Gruppe > Versandgruppe gleich „Pretest“ (Filtername eingeben)“)

    sc1

  2. Gehen Sie wieder auf “Auswertung” und wählen Sie “Exklusiv! Tabellenbände (Ergebnisse zum Kopieren, Diagramm-Erstellen und Weiterrechnen in Excel)”
  3. Klicken Sie auf “Für Vergleiche von Subgruppen: hier einfach weiteres Tabellenband anfügen”.
  4. Wählen Sie “Subgruppe entsprechend einem Superfilter (für Profis)” und untenstehend mittels Drop-Down Menü die hinzuzufügende Gruppe aus, und klicken Sie anschliessend auf “jetzt Tabellenband hinzufügen”. Und schon sehen Sie Ihre gewünschte Versand-Gruppe im Vergleich zu den Gesamtergebnissen.

    sc1-1