Logistická regrese

Logistickou regresí se budeme zabývat podrobněji z několika dobrých důvodů: proměnné, které nejčastěji sesbíráme, mají nominální či ordinální povahu. Čistě kardinálních proměnných je málo a pro lineární regresi tak často nemáme data. Logistická regrese tato omezení nemá. Logistická regrese patří mezi běžné metody, které se lze ještě vysvětlit, pochopit a vcelku bez problému používat. Je součástí všech běžných statistických programů.

V tomto článku představíme základ metody a interpretaci výsledků. Jak se k výsledkům dostat, postupy a pozadí metody představujeme ve zvláštním článku.

V logistické regresi odhadujeme šanci na nějakou událost, která má dichotomickou povahu (tj. dva stavy – respondent kouří nebo nekouří, měl dopravní nehodu nebo neměl). Proměnné, které tuto událost vysvětlují, mohou být kardinální nebo ordinální a nominální. Tato vlastnost metody je velkou výhodou.

Výsledkem analýzy jsou pak koeficienty, které udávají, jak která proměnná ovlivňuje šanci respondenta na ten který stav nezávislé proměnné. Je nutno podotknout, že modelujeme šanci nikoliv známější a představitelnější pravděpodobnost (o rozdílech mezi těmito pojmy viz samostatný a podrobnější článek).

V případě kardinálních proměnných koeficient interpretujeme zhruba takto: koeficient udává, kolikrát se zvýší šance za předpokladu, že se hodnota této proměnné zvýší o jednotku a hodnoty všech ostatních proměnných se nezmění. Konkrétně: v případě věku nám vyjde koeficient 2,0. Každý rok věku navíc tedy zdvojnásobuje šanci, že respondent uvede námi zkoumanou událost.

Interpretace pro nominální a ordinální proměnné je komplikovanější. Koeficientů máme tolik, kolik má proměnná kategorií a poníženo o jednotku: pohlaví má dvě kategorie, ve výsledné tabulce je proto jeden koeficient. Koeficienty pak porovnáváme s referenční kategorií, pro niž koeficient není spočítán.

 

 

V našem případě jsou referenční kategorií muži. Koeficient pro ženy potom znamená, že šance žen žít v nějakém partnerském vztahu je 1,985x větší než šance mužů (data jsou pro věkovou skupinu 15-17 let, proto tato šance není stejná, neboť dívky chodí se staršími chlapci).

Koeficient pro věk je jednodušší. O rok starší respondent má 1,189x větší šanci, že bude mít partnerský vztah než respondent o rok mladší.

Důležité je dívat se tzv. exponované koeficienty beta, která udávají šance (koeficienty v prvním sloupci tabulky udávají změnu tzv. logitu šance). Těmto detailům se věnujeme v dalších článcích.