Pierwszą rzeczą, którą powinieneś wiedzieć przed przeczytaniem tego wpisu jest to, że związek jest ustalany przez linię prostą, czyli prostą regresję liniową. Dlatego też, jeżeli liczba zmiennych niezależnych jest większa niż jeden, regresję nazywa się regresją wielokrotną. W tym artykule dowiesz się, jak zdefiniować model regresji liniowej wielokrotnej.

Co to jest wielokrotna regresja liniowa (MLR)?
Wielokrotna regresja liniowa próbuje dopasować liniowe lub linearyzowane modele pomiędzy jedną zmienną zależną i więcej niż jedną zmienną niezależną. W tego typu modelach istotne jest testowanie heteroschedastyczności, wieloliniowości i specyfikacji.
Wielokrotna regresja liniowa jest techniką statystyczną stosowaną do przewidywania wyniku zmiennej na podstawie wartości dwóch lub więcej zmiennych. Zmienna, która ma być przewidywana, jest zmienną zależną.
Regresja wieloraka może przybierać dwie formy: regresji liniowej i regresji nieliniowej.
Zmienna zależna
Jest to zmienna, która zmienia się w zależności od wartości innej zmiennej lub zmiennej niezależnej.
Wzór na regresję liniową wielokrotną

W którym:
- Yi: zmienna zależna lub przewidywalna
- β0: punkt przecięcia y, tj. wartość y, gdy zarówno xi, jak i x2 wynoszą 0.
- β1 i β2: współczynniki regresji przedstawiające zmianę w y w odniesieniu do jednostkowej zmiany w xi1 i xi2, odpowiednio.
- Βp: współczynnik nachylenia dla każdej zmiennej niezależnej
- ϵ: losowy składnik błędu (reszta) modelu.
Znaczenie wielokrotnej regresji liniowej
- Prosta regresja liniowa ma duże znaczenie, ponieważ pozwala przewidzieć wartość jednej zmiennej przy wykorzystaniu informacji dostępnych na temat innej zmiennej.
- Regresja wielokrotna jest rodzajem regresji, w której zmienna zależna wykazuje liniową zależność z dwiema lub więcej zmiennymi niezależnymi.
- Regresja liniowa próbuje ustalić, jaki jest związek między dwiema zmiennymi wzdłuż linii prostej.
- Zarówno regresja liniowa, jak i nieliniowa przedstawiają konkretną odpowiedź przy użyciu dwóch lub więcej zmiennych. Regresja nieliniowa jest jednak trudniejsza do przeprowadzenia, ponieważ jest generowana na podstawie założeń wynikających z metody prób i błędów.
Wymagania dotyczące wielokrotnej regresji liniowej
Przed zastosowaniem techniki regresji wielorakiej należy rozważyć następujące wymagania:
Normalność i równomierny rozkład reszt
Aby uzyskać dobry model regresji wielorakiej, nie wystarczy, aby reszty były małe, ponieważ poprawność modelu wymaga rozkładu normalnego o takim samym rozproszeniu każdej kombinacji wartości zmiennych niezależnych.
Liczba zmiennych niezależnych
Zalecaną przez wielu zasadą jest uwzględnienie w modelu co najmniej dwudziestu obserwacji dla każdej zmiennej niezależnej uznanej a priori za interesującą, gdyż niższe liczby mogą prowadzić do braku wniosków i błędów II rodzaju.
Liniowość
Przyjmuje się, że zmienna będąca odpowiedzią na pytanie zależy liniowo od zmiennych objaśniających. Jeżeli odpowiedź nie wydaje się być liniowa, w modelu należy uwzględnić składniki nieliniowe.
Współliniowość
Jeżeli dwie zmienne niezależne są ściśle powiązane i obie są włączone do modelu, jest bardzo prawdopodobne, że żadna z nich nie zostanie uznana za znaczącą, chociaż gdyby tylko jedna z nich została włączona, mogłaby zostać uznana za znaczącą.
Bardzo prostą techniką wykrywania współliniowości jest badanie współczynników modelu w celu sprawdzenia, czy stają się one niestabilne po wprowadzeniu nowej zmiennej.
Obserwacje odstające
Wreszcie, wartości odstające muszą być starannie zidentyfikowane i, jeśli to konieczne, odrzucone, ponieważ mają one duży wpływ na wynik. Czasami są to tylko błędy we wprowadzaniu danych, ale mają one ogromne konsekwencje w analizie.
Mamy nadzieję, że udało nam się rozwiązać bardzo częste pytanie wielu osób na temat tego, czym jest wielokrotna regresja liniowa (MLR)?

Jak zacząć inwestować na giełdzie od podstaw
Jak inwestować na giełdzie od podstaw. Dowiedz się wszystkiego i zdecyduj się na swój styl inwestowania.