Bei der linearen Regression geht es darum, den Wert einer Variable zu prognostizieren aufgrund der Kenntnis des Wertes einer anderen Variablen.
In der Praxis kommen prognostische Fragestellungen häufig vor. Z.B. unterstellt die zentrale Vergabestelle für Studienplätze (ZVS), dass der Studienerfolg sich durch die Abiturnote vorhersagen lässt. Der Numerus-Clausus wird so begründet: ein Abiturient mit guter Durchschnittsnote bewältigt das Studium besser als jemand mit mäßigen Abiturnoten. Ein Beispiel aus der Volkswirtschaft sind Konsumprognosen. Die Entwicklung des Konsums wird prognostiziert unter Zugrundelegung der Entwicklung des durchschnittlich verfügbaren Einkommens.
In der Praxis werden Prognosen oft per Augenschein, ohne statistische Absicherung, vorgenommen. Die statistische Regression liefert dagegen eine Prognose, deren Treffsicherheit bekannt ist, wenn für beide Variablen Ausgangsdaten vorliegen. Basis der Prognose ist der in einer Untersuchung gemessene Zusammenhang zweier Variablen. Zunächst wird eine Gerade gesucht, die die Punktwolke der Messwerte im Streudiagramm möglichst gut repräsentiert. Die y-Koordinaten der Gerade sind die zu schätzenden Werte, die x-Koordinaten die bekannten Werte der anderen Variablen.
In der Burnout-Studie (n = 123) wurden die Variablen Beanspruchung des FPI und Emotionale Erschöpfung der Überdrussskala (TM) erhoben. Die Fragestellung lautet: Wenn jemand bei der Variable Beanspruchung (x-Koordinate), der Einschätzung der eigenen Überforderung, den Wert 3 hat, welcher Wert wäre dann für die Variable Emotionale Erschöpfung (y-Koordinate) in einer anderen Untersuchung zu erwarten? Wie kann man dies mit Hilfe der Regression beantworten?
Quelle:
Burisch, M. (2002). A longitudinal study of burnout: The relative importance of dispositions and experiences. In: Work & Stress, 16, No. 1, 1-17