Zbudowałem model regresji liniowej w Pythonie i miałem docelową zmienną na przykład sprzedaż: 10, 9, 8. Postanowiłem zalogować się zmienną docelową: df["Sales"] = np.log(df["Sales"]), więc mam po tych wartościach NP 3, 2, 1.

Moje pytanie brzmi, jak mogę interpretować wyniki tego modelu, że mój cel był rejestrowany? Ponieważ obecnie mam na przykład interpretację: Jeśli istnieje średnia spadek sprzedaży w nocy przez 1,333, niemniej jednak jest to prawdopodobnie zła interpretacja, ponieważ bez dziennika celu, będę skutkować zdecydowanie wyższą ilością ilościową, taką jak, jeśli jest nocna sprzedaż średnia na przykład 2 589.

Jak mogę interpretować wyniki regresji liniowej po zalogowaniu celu? Ponieważ po cenie dziennika ma naprawdę niskie wartości?

0
bruno845 14 marzec 2021, 13:42

1 odpowiedź

Najlepsza odpowiedź

Twoja transformacja nazywana jest regresją "Log-Level". Oznacza to, że zmienna docelowa była transformowana, a zmienne niezależne pozostały w normalnych skalach.

Model powinien być interpretowany w następujący sposób:

Średnio, zmiana marginalna X_i spowoduje zmianę 100 * B_i procent.

Należy zauważyć, że jeśli przekształciłeś dowolną z zmiennych niezależnych, interpretacja również się zmieni. Na przykład, jeśli zmieniłeś X_i do np.log(df['X_i]) , then you would interpret b_i` jako transformacja dziennika dziennika.

Możesz znaleźć poręczny arkusz oszustwa, który pomoże Ci zapamiętać, jak interpretować modele Oto.

0
Arturo Sbr 14 marzec 2021, 16:31