Regresja liniowa a regresja logistyczna
W analizie statystycznej ważne jest zidentyfikowanie zależności między zmiennymi, których dotyczy badanie. Czasami może to być jedyny cel samej analizy. Jednym z silnych narzędzi wykorzystywanych do ustalenia istnienia relacji i zidentyfikowania relacji jest analiza regresji.
Najprostszą formą analizy regresji jest regresja liniowa, w której związek między zmiennymi jest zależnością liniową. W kategoriach statystycznych ukazuje związek między zmienną objaśniającą a zmienną odpowiedzi. Na przykład stosując regresję możemy ustalić związek między ceną towaru a jego konsumpcją na podstawie danych zebranych z losowej próby. Analiza regresji wygeneruje funkcję regresji zbioru danych, która jest modelem matematycznym najlepiej dopasowanym do dostępnych danych. Można to łatwo przedstawić za pomocą wykresu punktowego. Graficzna regresja jest równoważna znalezieniu najlepiej dopasowanej krzywej dla danego zbioru danych. Funkcją krzywej jest funkcja regresji. Korzystając z modelu matematycznego, można przewidzieć wykorzystanie towaru dla danej ceny.
Dlatego analiza regresji jest szeroko stosowana w prognozowaniu i prognozowaniu. Służy również do ustalania relacji w danych eksperymentalnych w dziedzinie fizyki, chemii oraz wielu nauk przyrodniczych i inżynieryjnych. Jeśli zależność lub funkcja regresji jest funkcją liniową, wówczas proces ten nazywamy regresją liniową. Na wykresie punktowym można to przedstawić jako linię prostą. Jeśli funkcja nie jest liniową kombinacją parametrów, to regresja jest nieliniowa.
Regresja logistyczna jest porównywalna z regresją wieloczynnikową i tworzy model wyjaśniający wpływ wielu predyktorów na zmienną odpowiedzi. Jednak w regresji logistycznej zmienna wyniku końcowego powinna być kategoryczna (zwykle podzielona; tj. Para możliwych do osiągnięcia wyników, takich jak śmierć lub przeżycie, chociaż specjalne techniki umożliwiają modelowanie bardziej skategoryzowanych informacji). Ciągłą zmienną wynikową można przekształcić w zmienną kategorialną do wykorzystania w regresji logistycznej; Jednak zwijanie zmiennych ciągłych w ten sposób jest przeważnie odradzane, ponieważ zmniejsza dokładność.
W przeciwieństwie do regresji liniowej, w kierunku średniej zmienne predykcyjne w regresji logistycznej nie muszą być liniowo połączone, powszechnie rozłożone ani mieć równą wariancję w każdym klastrze. W rezultacie relacja między predyktorem a zmiennymi wyniku prawdopodobnie nie będzie funkcją liniową.
Jaka jest różnica między regresją logistyczną a regresją liniową?
• W regresji liniowej zakłada się liniową zależność między zmienną objaśniającą a zmienną odpowiedzi, a parametry spełniające model są wyszukiwane w drodze analizy, aby uzyskać dokładną zależność.
• Regresja liniowa jest przeprowadzana dla zmiennych ilościowych, a wynikowa funkcja jest ilościowa.
• W regresji logistycznej wykorzystywane dane mogą być jakościowe lub ilościowe, ale wynik jest zawsze kategoryczny.