Regressionsgerade

Ziel dieses Abschnittes ist es zu erläutern, wie man zu einer gegebenen Datenmenge eine möglichst gut approximierende so genannte Regressionsgerade berechnet.

Ist $(x_i,y_i)$ für $i=1\ldots n$ der gegebene Datensatz, so kann man die Regressionsgerade wie folgt berechnen. Man definiert sich zunächst die Matrix $M$ und den Vektor $y$ gemäß:

\[M=\left(\matrix{ 1&x_1\cr 1&x_2\cr \vdots&\vdots\cr 1&x_4\cr }\right); \qquad y=\left(\matrix{ y_1\cr y_2\cr \vdots\cr y_4\cr }\right) \]

Sodann löst man das Gleichungssystem: \[ M^TM\cdot \left(\matrix{ a \cr b \cr }\right) = M^T y \]

Man beachte, dass $M^TM$ eine $2\times 2$ Matrix ist und dass $M^Ty$ eine $2$-dimensionaler Vektor ist. Nach Lösen des linearen Gleichungssystems sind die Variablen $a$ and $b$ die Paramter der gesuchten Geraden. Diese hat dann die Gleichung

\[ y=a+b \cdot x. \]

Applet

Im folgenden Beispiel wird zu einer gegebenen Menge von Punkten eine Gerade bestimmt, so dass die Summe der Abstandsquadrate in $y$-Richtung minimiert wird. Man kann die roten Punkte ziehen und beobachten, wie sich dabei die Gerade verändert.