Variablen definieren

Aus Meinungsklima.de
Zur Navigation springenZur Suche springen

Hier wird zuerst allgemein und dann an einem einfachen Beispiel erklärt, wie man vorgehen muß, wenn man einen Datensatz neu anlegt.

Erstellen der Datenoberfläche

Bevor man Daten eingeben kann, müssen die Variablen definiert werden. Dazu wechselt man zur Variablenansicht. Beim Definieren der Variablen kann man mehrere Einstellungen für die Variablen vornehmen, die das Verhalten von SPSS beim Rechnen mit diesen Variablen steuern und teilweise die Arbeit erheblich erleichtern. Name

Variablennamen in SPSS durften früher maximal acht Zeichen lang sein (in den neuen Versionen ist das anders, aber im Interesse der Übersichtlichkeit und der Abwärtskompatibilität kann es nicht schaden, sich weiterhin an diesen Grundsatz zu halten). Variablennamen sollten möglichst ‚sprechend’ sein, also dem Nutzer einen Anhaltspunkt geben, was in dieser Variable gespeichert wird. Variablennamen wie ‚Wert1’ ‚Wert2’ etc. sind spätestens bei der Auswertung sehr verwirrend.

Typ

Hier wird in einem Auswahlfenster festgelegt, um welchen Typ Variable es sich handelt. Am häufigsten sind numerische Variablen (z.B. 1 für männlich, 2 für weiblich, Alter, Körpergröße etc.). Stringvariablen enthalten Texte. Sie sind sehr schwer auszuwerten. Für numerische Variablen kann man zusätzlich die Zahl der Stellen und der Nachkommastellen angeben. Achtung: Wenn negative Werte vorkommen können (z.B. bei der Bewertung von Politikern auf einer Stapel-Skala), muß für das Minus-Zeichen eine Stelle reserviert werden.

Spaltenformat und Dezimalstellen

Hier werden bei numerischen Variablen die unter ‚Typ’ erwähnten Angaben über die Zahl der Stellen festgelegt.

Variablenlabel

Eine Bezeichnung für die Variable, die auch mehr als acht Zeichen umfassen darf. Bei Auswertungen wird dieses Label mit angegeben, so daß man weiß, worum es in der analysierten Variable überhaupt geht. Beispielsweise kann man der Variable POLPRAEF das Variablenlabel ‚Politische Präferenz’ zuordnen. Das ist dann etwas klarer als der bloße Variablenname.

Wertelabels

Wenn man z.B. eine 1 für männlich und eine 2 für weiblich in den Datensatz einträgt, kann man den Werten in diesem Menü Bezeichnungen zuweisen. Sie werden bei Auswertungen mit ausgegeben. Man muß immer daran denken nach der Eingabe eines Wertelabels ‚Hinzufügen’ zu klicken, sonst funktioniert das Abschließen des Vorgangs mit ‚OK’ nicht richtig.

Fehlende Werte

Hier wird festgelegt, daß bestimmte Werte bei der Analyse nicht berücksichtigt werden sollen. Das ist beispielsweise dann nötig wenn man z.B. 9 für ‚keine Angabe’ verschlüsselt hat und nur mit den Fällen rechnen möchte, in denen eine Angabe gemacht wurde. Dann setzt man die 9 an dieser Stelle als ‚fehlenden Wert’ ein. Speziell bei Mittelwertvergleichen muß darauf geachtet werden, daß Sonderverschlüsselungen (wie 999 := "Alter nicht angegeben") bei der Berechnung der Mittelwerte nicht berücksichtigt werden.

Spalten und Ausrichtung

Mit diesen Einstellungen kann man das Aussehen der großen Datentabelle (‚Datenmatrix’) verändern.

Messniveau

Hier kann man einstellen, welches Datenniveau diese Variable haben soll. SPSS bietet drei Skalenniveaus an:

  • Metrisch. Damit sind Ratioskalen (mit absolutem Nullpunkt, z.B. Alter) und Intervallskalen (mit willkürlichem Nullpunkt, z.B. Grad Celsius) gemeint.
  • Ordinal. Ordinalskalen bringen Werte in eine Reihenfolge, ohne daß gesichert wäre, daß die Abstände zwischen den Skalenpunkten gleich sind. Beispiel: Schulnoten.
  • Nominal. Nominalskalen sind einfache Zuweisungen von Zahlen zu Ausprägungen, z.B. 1 für ‚männlich’ und 2 für ‚weiblich’.

Das Meßniveau bestimmt, wie man mit den Daten der Variable rechnen kann. Manchmal ist es sinnvoll (bzw. wird einfach so gemacht), mehr zu berechnen, als man eigentlich darf. Deshalb ist es nicht verkehrt, das Meßniveau bei allen Variablen auf ‚Metrisch’ stehen zu lassen. Man muß dann lediglich beim Rechnen selbst daran denken, was man mit welchen Daten rechnen kann, und was nicht.

Beispiel

Ein Beispiel für einen sehr einfachen Datensatz, der z.B. aus einem sozialwissenschaftlichen Experiment stammen könnte:

Folgende Daten liegen auf den DIN-A4-Fragebögen vor:

   Gruppe (gehört der Befragte zur Experimentalgruppe A oder zur Kontrollgruppe B?)
   Geschlecht
   Alter
   Meinung über die SPD (fünfteilige Skala)
   Meinung über die CDU (fünfteilige Skala) 

Folgendermaßen kann die Umsetzung in SPSS-Variablen aussehen (wobei hier davon ausgegangen wird, daß Variablennamen nur acht Zeichen lang sein können, wie das bei früheren SPSS-Versionen der Fall war); genannt werden der Variablenname, die Ausprägungen und die empfohlenen Variablenlabels und das (offizielle) Meßniveau:

   GRUPPE: 1=Experimentalgruppe; 2=Kontrollgruppe (Nominalskala)
   SEX: 1=männlich; 2=weiblich; 9=keine Angabe (Nominalskala)
   ALTER: Alter in Jahren (Ratioskala/metrisch)
   SPDMNG: 1=sehr schlechte Meinung über die SPD; 3=ambivalente Meinung über die SPD; 5=sehr gute Meinung über die SPD; 9=keine Angabe (Ordinalskala)
   CDUMNG: 1=sehr schlechte Meinung über die CDU; 3=ambivalente Meinung über die CDU; 5=sehr gute Meinung über die CDU; 9=keine Angabe (Ordinalskala)