Lineare Regression schnell und einfach erklärt

Mit "Multivariate Analyseverfahren in der Marktforschung" werden Sie zum Statistik-Profi





Wer im Rahmen eines Markt- oder Meinungsforschungsprojekts mit der statistischen Datenanalyse konfrontiert wird, steht vor vielen Fragen:
  • Wie kann ich Ausreißer in meinem Datensatz schnell identifizieren?
  • Wie gehe ich mit fehlenden Antworten oder Mehrfachantworten um?
  • Unter welchen Bedingungen kann ich eine lineare Regression durchführen?
Diese und viele weitere Fragen werden Ihnen in "Multivariate Analyseverfahren in der Marktforschung" beantwortet. Das Buch führt schnell und sicher in die Grundlagen der statistischen Datenanalyse sowie die Arbeit mit dem Standard-Analyseprogramm SPSS ein, und erläutert, worauf es bei den einzelnen Verfahren wirklich ankommt.




Diese statistischen Verfahren erwarten Sie im Buch:
 
  • Deskriptive Datenanalyse
  • Explorative Datenanalyse
  • Multiple Regression
  • Lineare Regression
  • Faktorenanalyse
  • Varianzanalyse
  • Clusteranalyse
 
Das Buch beantwortet unter anderem folgende Fragen:
 
  • Was sagt der R²-Wert in der Regressionsanalyse aus?
  • Wie sind Konfidenzintervalle richtig  zu interpretieren?
  • Wie funktioniert die Methode der kleinsten Quadrate?
  • Worin besteht der Zielkonflikt in der Faktorenanalyse?
  • Was versteht man unter dem Begriff der Freiheitsgrade?
  • Warum ist der T-Test keine Alternative für die Varianzanalyse?
  • Wie lässt sich das Vorliegen einer Normalverteilung nachweisen?
  • Welche Voraussetzungen gelten für die lineare Regressionsanalyse?
Multivariate Analyseverfahren in der Marktforschung
  

 
Unser Angebot: Bestellen Sie "Multivariate Analyseverfahren in der Marktforschung" noch heute zum absoluten Vorzugspreis von nur 11,90€ (Print-Version) oder 5,90€ (E-Book) auf LuLu.de Klicken sie [hier] um auf eine sichere und verschlüsselte Bestellseite zu gelangen. Jeder Käufer, der das Buch noch 2007 bestellt, erhält zwei Stunden statistische Beratungsdienstleistungen gratis. Kontaktieren Sie nach dem Kauf einfach die Statistikberatung Reinboth, und lassen Sie sich Ihre zwei Gratis-Beratungsstunden gutschreiben (Gegenwert: 49,90€).



Auszug aus Kapitel 3.3: Lineare Regression - Wie interpretiere ich die Konfidenzintervalle um die Koeffizienten?

"Mit den aus dem ersten Kapitel bereits bekannten Konfidenzintervallen (Vertrauensbereichen) lässt sich die Lage eines Parameters in der Grundgesamtheit mit einer bestimmten Wahrscheinlichkeit umreißen.

SPSS gibt in der Koeffizienten-Tabelle automatisch die 95%-Konfidenzintervalle um die Regressionskoeffizienten und die Konstante mit aus, wobei letzteres nicht weiter beachtet werden muss. Die 95%-Konfidenzintervalle um die Regressionskoeffizienten zeigen an, zwischen welchen beiden Grenzwerten der „wahre“ Regressionskoeffizient in der Grundgesamtheit mit 95%iger Sicherheit liegt. Zu beachten sind jeweils der Abstand zwischen Ober- und Untergrenze sowie die Vorzeichen beider Werte.

Ist das Konfidenzintervall um einen dieser Regressionskoeffizienten besonders breit, muss die auf seiner Basis geschätzte Regressionsfunktion als unsicher betrachtet werden. Zu beachten ist, dass die Koeffizienten in teils unterschiedlichen Dimensionen gemessen werden – bei Geldbeträgen von mehreren tausend Euro ist ein breiteres Konfidenzintervall zu erwarten als bei einem Prozentwert.

Diese sehr subjektive Betrachtung der Intervallbreite gibt bedauerlicherweise oft wenig Auskunft über die tatsächliche Relevanz der Regressionskoeffizienten. Viel aufschlussreicher ist das Auftreten bzw. das Nicht-Auftreten eines Vorzeichenwechsels innerhalb des Konfidenzintervalls. Worauf kann ein solcher Vorzeichenwechsel hindeuten?

Liegt der “wahre“ Regressionskoeffizient einer Beispieluntersuchung mit 95%iger Sicherheit zwischen +5 und +10, so mag er in Wirklichkeit 6 oder 7 betragen – auf die Art des Einflusses der unabhängigen Variablen hat dies keine Auswirkung, sondern lediglich auf die Stärke. Im ersten Fall erhöht sich der Wert der abhängigen Variablen um 6, wenn sich der Wert der unabhängigen Variablen um 1 erhöht, im zweiten Fall erhöht sich der Wert der abhängigen Variablen unter gleichen Umständen um 7. In beiden Fällen ist der Einfluss positiv – der Wert der abhängigen Variablen steigt an, wenn auch der Wert der unabhängigen Variablen ansteigt.

Liegt aber der „wahre“ Regressionskoeffizient derselben Beispieluntersuchung mit 95%iger Sicherheit zwischen -5 und +5, so mag er in Wirklichkeit -1 oder +1 betragen – dies aber hat ganz erhebliche Auswirkung auf das Regressionsmodell und die Interpretation des Regressionskoeffizienten, denn einmal steigt der Wert der abhängigen Variablen an und ein-mal sinkt er ab. Ein Vorzeichenwechsel im Konfidenzintervall kann darauf hindeuten, dass ein berechneter Regressionskoeffizient mit einer nicht zu vernachlässigenden Wahrscheinlichkeit ein anderes Vorzeichen aufweisen könnte als der „wahre“ Regressionskoeffizient in der Grundgesamtheit. In einem solchen Fall würde sich der Einfluss der Variablen gewissermaßen „umkehren“ und das gesamte Regressionsmodell würde einen vollkommen falschen Eindruck von den Zusammenhängen vermitteln.

Aus diesem Grund sind Regressionskoeffizienten, deren Konfidenzintervalle einen solchen Vorzeichenwechsel aufweisen, mit Vorsicht zu interpretieren. Idealerweise ist ein Fachexperte zu konsultieren, der zu einer sicheren Aussage darüber gelangen kann, ob der Einfluss der entsprechenden unabhängigen Variablen auf die abhängige Variable ein positiver oder ein negativer sein muss. Nicht zulässig dagegen ist die Vergrößerung der Irrtumswahrscheinlichkeit des Konfidenzintervall. Durch eine solche Vergrößerung (beispielsweise von 95% auf 90%) schrumpft das Intervall und verliert gegebenenfalls den Vorzeichenwechsel – ein solches Vorgehen ist aber als manipulativ und unter dem Gesichtspunkt der methodischen Sorgfalt unangemessen zu betrachten."



Unser Angebot: Bestellen Sie "Multivariate Analyseverfahren in der Marktforschung" noch heute zum absoluten Vorzugspreis von nur 11,90€ (Print-Version) oder 5,90€ (E-Book) auf LuLu.de Klicken sie [hier] um auf eine sichere und verschlüsselte Bestellseite zu gelangen. Jeder Käufer, der das Buch noch 2007 bestellt, erhält zwei Stunden statistische Beratungsdienstleistungen gratis. Kontaktieren Sie nach dem Kauf einfach die Statistikberatung Reinboth, und lassen Sie sich Ihre zwei Gratis-Beratungsstunden gutschreiben (Gegenwert: 49,90€).


Über den Autor
Christian Reinboth Christian Reinboth (Jahgang 1980) studierte Informatik und Wirtschaftswissenschaften an der HS Harz, die er 2005 mit dem Diplomabschluss verliess. Seitdem ist er als Lehrbeauftragter für Marktforschung und SPSS-Datenanalyse tätig und erforscht als Mit-Gründer der HarzOptics GmbH neue Wege der optischen Datenübertragung. Seit 2006 existiert die "Statistikberatung Reinboth", eine freiberufliche Beratungsagentur für Markt- und Meinungsforschung.

Für seine Forschungen im Photonik-Bereich wurde Christian Reinboth 2006 mit dem rennomierten Forschungspreis der IHK Sachsen-Anhalt ausgezeichnet. Mehr als ein dutzend von ihm mitverfasster wissenschaftliche Beiträge sind bislang national und international erschienen. "Multivariate Analyseverfahren in der Marktforschung" ist sein erstes Buch - das zweite, "Möglichkeiten und Grenzen von Online-Befragungen", erscheint 2007 im GRIN-Verlag.
Statistikberatung Reinboth - Lineare Regression und mehr...

Betreiber dieser Webseite ist die Statistikberatung Reinboth. Kontaktdaten und vorgeschriebene Angaben finden Sie im Impressum. Verantwortl. gem. §6 TMDG: Christian Reinboth.