Gegeben ist eine Menge von Punkten in der x-y-Ebene, beispielsweise eine Menge von Messwerten, bei denen ein linearer Zusammenhang vermutet wird, etwa Gewicht (y-Wert) in Abhängigkeit von der Größe (x-Wert).
Gesucht ist eine Gerade, genannt Regressionsgerade, die diesen linearen Zusammenhang der Messwerte bestmöglich wiedergibt.
Bild 1 zeigt eine solche Regressionsgerade, die durch die entsprechenden Punkte führt.
Bild 1: Messwerte und Regressionsgerade
Die Formel für die Berechnung der Steigung m der Regressionsgeraden lautet
m | = |
|
Summiert wird jeweils über i = 0, ..., n-1, wobei n die Anzahl der Werte ist.
Indem statt mit den Summen der xi bzw. yi mit den entsprechenden Mittelwerten x bzw. y gerechnet wird, ergibt sich die Formel
m | = |
|
Es folgt eine Implementierung in der Programmiersprache Python. Vor Aufruf der folgenden Funktionen müssen die Programmbibliotheken numpy und matplotlib importiert werden (siehe unten vor dem Aufruf des Testprogramms).
Unter Benutzung des Moduls stats aus der Bibliothek scipy lässt sich die Regressionsgerade auch folgendermaßen berechnen:
Weiter mit: [up]