Ulubione
  1. Strona główna
  2. MODELOWANIE DLA BIZNESU. REGRESJA LOGISTYCZNA, REGRESJA POISSONA, SURVIVAL DATA MINING, CRM, CREDIT SCORING

MODELOWANIE DLA BIZNESU. REGRESJA LOGISTYCZNA, REGRESJA POISSONA, SURVIVAL DATA MINING, CRM, CREDIT SCORING

72,00 zł
64,80 zł
/ szt.
Oszczędzasz 10 % ( 7,20 zł).
Autor: Redakcja naukowa: Ewa Frątczak
Kod produktu: 978-83-8030-307-2
72,00 zł
64,80 zł
/ szt.
Oszczędzasz 10 % ( 7,20 zł).
Dodaj do ulubionych
Łatwy zwrot towaru w ciągu 14 dni od zakupu bez podania przyczyny
MODELOWANIE DLA BIZNESU. REGRESJA LOGISTYCZNA, REGRESJA POISSONA, SURVIVAL DATA MINING, CRM, CREDIT SCORING
MODELOWANIE DLA BIZNESU. REGRESJA LOGISTYCZNA, REGRESJA POISSONA, SURVIVAL DATA MINING, CRM, CREDIT SCORING

 

e-book do wypożyczenia lub zakupu na stronie:

https://www.ibuk.pl

 

[[[separator]]]

 

 

 

 

Czytelnikowi na rynku polskim została udostępniona publikacja Czwarta rewo­lucja przemysłowa autorstwa prof. Klausa Schwaba, założyciela i prezesa Świato­wego Forum Ekonomicznego We wstępie do publikacji, w rekomendacjach, znani ludzie biznesu i innych środowisk, w tym naukowych, zamieścili swoje wypowie­dzi. Dalej zostały przedstawione wybrane dwie z nich.

"Ludzkość stoi na progu największej w dziejach rewolucji, która zmiecie większość obo­wiązujących zasad naszego życia i pracy. Toczący się wykładniczo technologiczny rozwój świata jest już nie do zatrzymania" (Sebastian Kulczyk, CEO Kulczyk Investment).

"Najnowsze technologie, łączące świat cyfrowy, fizyczny i biologiczny, radykalnie zmie­niają naszą cywilizację. Nowe możliwości w medycynie, edukacji czy biznesie popra­wiają bytowanie człowieka na Ziemi i przyczyniają się do mądrzejszego korzystania z jej naturalnych zasobów. Zarazem okazują się potencjalnie bardzo niebezpieczne, otwierając ogromne przestrzenie do cyberprzestępczości czy przyczyniając się do dal­szej polaryzacji społeczeństw. Z tego powodu jednym z najpoważniejszych wyzwań dzisiejszego świata jest to, by dobrze i mądrze przeprowadzić czwartą rewolucję prze­mysłową" (Aleksandra Przegalińska, Akademia Leona Koźmińskiego).

We wstępie do swojej książki Czwarta rewolucja przemysłowa profesor Klaus Schwab pisze m.in.:

"Znajdujemy się na początku przewrotu, który w sposób fundamentalny zmienia sposób, w jaki żyjemy, pracujemy i utrzymujemy kontakty. Spośród różnorakich i fascynują­cych wyzwań, które w związku z tym stoją dzisiaj przed nami, największym i naj­ważniejszym zadaniem jest zrozumieć nową rewolucję technologiczną i odpowiednio ukierunkować jej przebieg. (...)

Jesteśmy świadkami ogromnych zmian we wszystkich branżach; wyłaniają się nowe technologie biznesowe, pojawiają się przełomowe zakłócenia w istniejącym porządku, które rewolucjonizują systemy produkcji, konsumpcji, transportu i dostaw. Na froncie społecznym zachodzi zmiana paradygmatu określającego, jak pracujemy i komunikujemy się, a także jak się wyrażamy, jak przekazujemy informacje i jakich szukamy rozrywek. Przekształceniom ulegają zarówno rządy i instytucje, jak i systemy edukacji, opieki zdrowotnej, transportu oraz wiele innych. Nowe sposoby posługiwania się technolo­gią wpływają na nasze zachowania oraz systemy produkcji i konsumpcji, stwarzają także możliwości wspierania, regeneracji i ochrony środowiska naturalnego, zamiast tworzenia ukrytych kosztów w formie efektów zewnętrznych. Zmiany te pod względem rozmiaru, tempa i zakresu, nie mają sobie równych w historii".

Zmiany te charakteryzują się dużą szybkością, szerokością i głębią oraz wpły­wem na transformację wszystkich systemów. Przed tym procesem stoją uczelnie wyższe, uniwersytety i środowiska akademickie, aby w porę podjąć stosowne dzia­łania i włączyć się w potężną zmianę systemową.

Obecnie modele są podstawą większości, jeśli nie wszystkich, decyzji bizne­sowych. Coraz częściej firmy poszukują analityki jako kluczowego, strategicznego wyróżnika, który umożliwia kierowanie ogromną liczbą decyzji operacyjnych każ­dego dnia. Jednocześnie firmy identyfikują zagrożenia. Według SAS White Paper 2018 jednym z istotniejszych czynników hamujących sukces analizy jest opóź­nienie między tworzeniem a wdrażaniem modeli. Głównym powodem opóźnień we wdrożeniu modeli jest to, że firmy produkują i wdrażają je w dwóch oddziel­nych środowiskach: biznesowym i informatycznym (IT). Analitycy z różnych jed­nostek biznesowych budują modele, a działy IT je wdrażają. Obie grupy polegają innym zestawom procesów, kodów programowania i języków, które utrudniają szybką reakcję na zmieniające się warunki biznesowe. Jeśli firmy chcą usprawnić produkcję modeli, lepszym pomysłem jest automatyzacja powtarzalnych aspek­tów pracy i migracja modeli do procesu ciągłego podejmowania decyzji. Odpo­wiedzią jest fabryka analityczna, czyli połączone dwa środowiska i automatyzacja procesów oraz decyzji.

Znaczącą część analityki dla biznesu stanowią modele predykcyjne. Ocena dokładności predykcyjnej jest ważnym aspektem oceny i porównywania modeli, algorytmów lub technologii, które generują prognozy. Prognozy i projekcje stały się istotną częścią każdego przedsięwzięcia biznesowego i naukowego.

Monografia Modelowanie dla biznesu przedstawia istotę i modelowanie z zakresu analityki biznesowej w wybranych obszarach zastosowań. Autorami lub współ­autorami kolejnych rozdziałów są pracownicy Zakładu Analizy Historii Zdarzeń i Analiz Wielopoziomowych, nasi magistranci lub absolwenci Podyplomowych Studiów "Analizy Statystyczne i Data Mining w Biznesie", za które merytorycznie odpowiada Zakład. Monografia rozpoczyna cykl publikacji Modelowanie dla biz­nesu, serii, która będzie prezentować różnorodne przykłady modelowania bizne­sowego z wykorzystaniem różnych metod analizy, włączając za każdym razem modelowanie predykcyjne.

Rozdział pierwszy jest rozdziałem o regresji logistycznej, modelowaniu, które jest wykorzystywane w sześciu rozdziałach niniejszej monografii. Odpowiedziano w nim na następujące pytania:

1.     Jaka była geneza regresji logistycznej i opartego na niej modelowania?

2.     Jakie są podstawowe różnice pomiędzy regresją liniową a regresją logistyczną?

3.     Jak przebiega estymacja modelu regresji logistycznej (na przykładzie regre­sji binarnej)?

4.     Jak interpretuje się wyniki estymacji parametrów regresji liniowej i regresji logistycznej oraz jakie są różnice?

5.     Jakie są inne rodzaje modelowania regresji logistycznej poza modelem binarnym?

6.     Jakie znaczenie w modelowaniu regresji logistycznej ma kodowanie zmien­nych jakościowych?

7.     Co składa się na proces wnioskowania w modelach regresji logistycznej?

8.     Co oznacza predykcja i model predykcyjny z wykorzystaniem regresji logi­stycznej?

9.     Jakie mierniki i testy wykorzystuje się do oceny zdolności predykcyjnej modelu opartego na regresji logistycznej?

W rozdziale drugim zamieszczono przegląd podstawowych testów i miar do oceny zależności zmiennych jakościowych, których dane empiryczne można zestawić w postaci tablic kontyngencji. Analiza tablic kontyngencji stanowi czę­sto wstępny etap wielu bardziej zaawansowanych analiz, w tym modeli regresji logistycznej. Przegląd testów i miar obejmuje: testy służące do weryfikacji hipotez o niezależności dwóch cech jakościowych (testy asymptotyczne i dokładne) oraz test Cochrana-Mantela-Haenszela i jego różne postacie, w zależności od celu ana­lizy. Kolejno omówiono podstawowe miary asocjacji pomiędzy cechami jakościo­wymi. Konstrukcja tych miar zależy od rodzaju skal pomiarowych, stąd opis miar zależności dotyczy: zmiennych dychotomicznych, nominalnych i porządkowych.Ostatnia część rozdziału ma charakter aplikacyjny, zamieszczono przykłady obliczeń i interpretacji wcześniej opisanych testów i miar na przykładach tablic kontyngencji z zastosowaniem oprogramowania SAS.

Proces budowy modelu regresji logistycznej z binarną zmienną objaśnianą jest tematem rozdziału trzeciego. W pierwszej jego części zaprezentowano model deskryptywny, którego celem jest zrozumienie i poznanie zależności w badanej próbie. Następnie opisano model predykcyjny, który ma na celu możliwie najlepsze różnicowanie obserwacji spoza zakresu danych wykorzystanych do budowy modelu. Omówiono zbiór danych oraz wykorzystane procedury i autorskie makra SAS. Przeprowadzono jednowymiarową analizę zmiennych objaśniających, w tym analizę braków danych oraz sprawdzono moc dyskryminacyjną poszczególnych zmiennych. Przedstawiono algorytm podziału zbioru danych na próbę uczącą i walidacyjną. Przeprowadzono analizy korelacji i współliniowości. Opisano algo­rytm doboru predyktorów do każdego modelu w celu zmniejszenia wymiarowości. Zaprezentowano analizę obserwacji wpływowych i odstających. Finalne modele zostały poddane interpretacji ekonomicznej oraz gruntownej weryfikacji staty­stycznej. Przeprowadzone testy statystyczne uzupełniono o przedstawienie gra­ficzne w stosownych przypadkach.

Rozdział czwarty dotyczy modelowania z wykorzystaniem modelu regresji binarnej i uporządkowanej. Celem analizy było określenie czynników pozwala­jących przewidzieć końcowy wynik meczu piłkarskiego na przykładzie danych z dwóch pełnych sezonów lig angielskiej. Wykorzystując SAS Enterprise Guide 7.1, zbudowano modele regresji binarnej i uporządkowanej zbioru danych liczącego 760 obserwacji. Zaprezentowano kody tworzące modele oraz najważniejsze kody etapu przetwarzania danych. W modelowaniu wykorzystano 119 zmiennych zawierających statystyki meczowe drużyn gospodarzy i gości, statystyki zagrego­wane z całego sezonu poprzedzającego daną obserwację, statystyki zagregowane z meczów u siebie dla gospodarza i z meczów wyjazdowych dla gości oraz atrybuty finansowe i geograficzne. Zaprezentowano statystyki dopasowania oraz jakości predykcyjnej modeli. W modelu binarnym liczba goli strzelonych przez gospo­darzy u siebie w ubiegłym sezonie oraz przewidywania bukmacherów dotyczące danego meczu okazały się najsilniejszymi predyktorami. W modelu uporządko­wanym stracone bramki przez gości w meczach wyjazdowych w ubiegłym sezo­nie oraz typy bukmacherów miały największy wpływ na zmienną odpowiedzi.

W rozdziale piątym do modelowania wykorzystano model regresji Poissona. Pierwszą część rozdziału stanowi wstęp teoretyczny do rozkładu i regresji Poissona oraz opis podstawowej składni procedury GENMOD wykorzystanej do estyma­cji modelu. W kolejnych podrozdziałach są zaprezentowane przykłady estymacji i analizy liczby infekcji. Rozdział zawiera również informacje dotyczące problemu nadmiernej dyspersji często występujących w rzeczywistych zastosowaniach oraz dwa sposoby rozwiązania tego problemu: korekcja wariancji za pomocą parame­tru skali oraz model ujemny dwumianowy. Dokonano porównania obu metod modelowania, wskazując podobieństwa i różnice w estymacji. Uzupełnieniem rozdziału jest analiza obserwacji wpływowych i odstających oraz ich znaczenia w procesie estymacji.

Tematykę zastosowania modeli predykcyjnych j ako narzędzia umożliwiającego zwiększenie efektywności kampanii marketingu bezpośredniego podjęto w roz­dziale szóstym. Pierwsza jego część to wprowadzenie do dziedziny marketingu, w którym zawarto opis podstawowych pojęć i definicji dotyczących podejmowa­nej tematyki. Następnie opisano rolę modeli predykcyjnych w marketingu oraz znaczenie wskaźnika otwarcia dla sukcesu kampanii marketingowych. Przedsta­wiono również podstawy teoretyczne zastosowanych metod - regresji logistycz­nej, sztucznej sieci neuronowej oraz drzewa decyzyjnego. Opisano wykorzystany do modelowania zbiór danych, jak również całościowy proces budowy poszcze­gólnych modeli predykcyjnych, ich porównania oraz wyboru najlepszego pod względem zdolności predykcyjnych. Rozdział zakończono prezentacją praktycz­nego zastosowania finalnego modelu.

W rozdziale siódmym skupiono się na analizie churnu, czyli zjawiska odej­ścia klienta, które jest związane z zakończeniem korzystania ze świadczonej przez firmę usługi, oraz na przykładowych dwóch podejściach stosowanych do jego badania. W części teoretycznej przedstawiono charakterystykę zjawiska churnu, a także możliwe do zastosowania podejścia analityczne, ze szczególnym uwzględnieniem modelu regresji logistycznej oraz modelu survival data mining. W ramach części praktycznej utworzone zostały, na podstawie danych dotyczą­cych churnu w firmie telekomunikacyjnej, dwa modele: model regresji logistycz­nej oraz model survival data mining z perspektywą roczną. Na podstawie części aplikacyjnej dokonano podsumowania uwzględniającego możliwości oraz ogra­niczenia dwóch utworzonych modeli.

Rozdział ósmym zawiera opis procesu implementacji metod credit scoringu w obszarach związanych z zarządzaniem relacjami biznesowymi z klientem kor­poracyjnym oraz motywowaniem pośrednich struktur sprzedaży. Business case, opisany w rozdziale, dotyczy polskiej branży farmaceutycznej, a środowisko dla niego stanowią czasy czwartej rewolucji technologicznej. Klasyczny credit scoring opiera się na mechanizmie transformacji szacowanego prawdopodobieństwa zaj­ścia zdarzenia sukcesu lub porażki do postaci łatwo interpretowalnych punktów scoringowych. Ponadto algorytm umożliwia jednoznaczne wskazanie najistotniej­szych, a przez to najbardziej predyktywnych atrybutów modelowanego zjawiska i podzielnie ich na kategorie określające stopień ryzyka wystąpienia prognozo­wanego zdarzenia. Suma punktów otrzymanych w ramach każdej zmiennej sta­nowi o przynależności podmiotów do określonej grupy ryzyka. Podejście to od dawna wykorzystywane jest z sukcesem w bankowości dla procesów kredytowych, w instytucjach ubezpieczeniowych do wykrywania oszustów oraz w ocenie efek­tywności kampanii marketingowych. Rozdział ósmy składa się trzech głównych
części. Pierwsza stanowi repozytorium wiedzy na temat podstaw teoretycznych i mechanizmów credit scoringu. Wyjaśnione są w nim między innymi pojęcia default, punkt obserwacji, wskaźnik Giniego i tabela ABT. Część druga dedyko­wana jest problematyce segmentacji i optymalizacji strategii biznesowych dla sieci aptecznych. Przedstawiono w niej tradycyjne i ogólnodostępne metody segmen­tacji klientów sieciowych, proponowane przez firmy analityczne zajmujące się rynkiem farmaceutycznym, oraz podejście innowacyjne. Innowacyjność alterna­tywnego sposobu profilowania sieci aptecznych pozwala na wielowymiarowe usze­regowanie klientów według skłonności do zajęcia określonej pozycji w rankingu efektywności dochodowej per apteka. Równolegle w tej części poruszone zostały kwestie związane z jakością i mocą predykcyjną modelu scoringowego w warun­kach skąpej liczby rekordów w modelowanej populacji. Część trzecia poświę­cona została modelowaniu szansy na osiągniecie co najmniej 100% realizacji celu sprzedażowego przez przedstawiciela handlowego, w szczególności przedstawi­ciela medycznego. Opisano w niej aspekt wykorzystania wiedzy o przyszłym roz­kładzie wyników sprzedażowych do celów budowania strategii i ustalania celów taktycznych dla zespołów sprzedażowych na kolejny okres rozliczeniowy. Ponadto wskazano na rolę narzędzi credit scoringu w motywowaniu pracowników. Auto­rzy podkreślili trudną rolę kierownika regionalnego w wyjaśnieniu przypadków, w których model się myli. W rozważanym zastosowaniu konieczność przedysku­towania każdego aspektu uzyskanych ocen cząstkowych stanowi wyzwanie w pra­widłowej interpretacji i aplikacji wyników modelowania zjawiska.

Warszawa, wrzesień 2019 Ewa Frątczak

 

 

 

 

 

 


 

 

[[[separator]]]

 

 

 

Ewa Frątcząk

Przedmowa

 

Ewa Frątcząk

Rozdział 1. Regresja logistyczna - podstawy teorii i modelowania

Wprowadzenie

1.1. Regresja logistyczna - początki

1.2. Regresja logistyczna - podstawy teorii

1.3. Model regresji logistycznej a model regresji liniowej

1.4. Estymacja parametrów modelu regresji logistycznej (na przykładzie regresji binarnej)

1.5. Interpretacja wyników estymacji

1.6. Model uporządkowany i model o postaci wielomianu

1.6.1. Regresja logistyczna - model uporządkowany

1.6.2. Regresja logistyczna o postaci wielomianu - uogólnione logity

1.7. Znaczenie kodowania zmiennych jakościowych w modelach regresji logistycznej

1.8. Istota wnioskowania statystycznego w modelach regresji logistycznej

1.8.1. Ocena istotności oszacowanych parametrów

1.8.2. Ocena dobroci modelu

1.9. Predykcja i modelowanie predykcyjne z wykorzystaniem regresji logistycznej

1.10. Modele predykcyjne - diagnostyka - wybrane miary

1.10.1. Macierz pomyłek

1.10.2. Krzywa ROC i AUC (pole pod krzywą ROC)

1.10.3. Krzywa wzrostu lift

1.10.4. Współczynnik Giniego

1.10.5. Statystyki wpływu (DFBETAS, DIFDEV, DIFCHISQ, LEVERAGE)

Podsumowanie

Bibliografia

 

 

Aleksandra Iwanicka

Rozdział 2. Analiza tablic kontyngencji - ocena zależności cech jakościowych

Wprowadzenie

2.1. Testowanie niezależności na podstawie tablic dwudzielczych

2.1.1. Testy chi-kwadrat: Pearsona i ilorazu wiarygodności

2.1.2. Testy skorygowane i dokładne

2.1.3. Miary zależności oparte na statystyce chi-kwadrat Pearsona

2.2. Testowanie niezależności na podstawie       zbioru tablic dwudzielczych

2.2.1. Statystyka ogólnej asocjacji

2.2.2. Statystyka różnicy średnich w wierszach

2.2.3. Statystyka korelacji

2.3. Pomiar siły asocjacji

2.3.1. Miary asocjacji dla cech dychotomicznych

2.3.2. Miary asocjacji dla cech porządkowych

2.3.3. Miary asocjacji dla cech nominalnych

2.4. Przykłady zastosowań

2.4.1. Badanie związku pomiędzy cechami dychotomicznymi

2.4.2. Badanie zależności pomiędzy cechami nominalnymi

2.4.3. Badanie zależności pomiędzy cechami porządkowymi

2.4.4. Badanie zależności w przypadku stratyfikacji

Podsumowanie

Bibliografia

 

Barbara Szewczak, Wojciech Skwirz

Rozdział 3. Regresja logistyczna - model deskryptywny i model predykcyjny

Wprowadzenie

3.1. Opis procedur SAS

3.1.1. Procedury SAS

3.1.2. Autorskie makra SAS

3.2. Model deskryptywny

3.2.1. Metodyka budowy modelu

3.2.2. Analiza braków danych występujących w zmiennych objaśniających

3.2.3. Analiza korelacji oraz wstępna ocena predykcyjności zmiennych objaśniających

3.2.4. Analiza współliniowości zmiennych objaśniających

3.2.5. Selekcja zmiennych objaśniających

3.2.6. Analiza obserwacji wpływowych i odstających

3.2.7. Finalny model - postać i interpretacja

3.2.8. Interpretacja parametrów modelu

3.2.9. Istotność zmiennych w modelu

3.2.10. Ilorazy szans z modelu

3.2.11. Istotność czynników w modelu

3.2.12. Globalny test na istotność modelu

3.2.13.  Kryteria informacyjne modelu

3.2.14.  Analiza współliniowości zmiennych w modelu

3.2.15.  Statystyki mocy dyskryminacyjnej modelu oraz analizy graficzne

3.2.16.  Finalny model - podsumowanie

3.3. Model predykcyjny

3.3.1. Motywacja do budowy modelu predykcyjnego

3.3.2. Etapy budowy modelu

3.3.3. Finalny model - postać i interpretacja

3.3.4. Porównanie modelu deskryptywnego i modelu predykcyjnego

Bibliografia

Załącznik

 

Mikołaj Tchorzewski

Rozdział 4. Modelowanie wyników ligi piłkarskiej z wykorzystaniem regresji binarnej i regresji uporządkowanej

Wprowadzenie

4.1. Charakterystyka rozgrywek Premier League

4.2. Opis danych

4.3. Zmienne do modelowania

4.3.1. Zmienne zależne dla modeli ligi angielskiej

4.3.2. Wybrane zmienne objaśniające dla modeli ligi angielskiej

4.3.3. Wybrane kody z etapu przetwarzania danych

4.4. Model regresji binarnej - estymacja i interpretacja wyników

4.4.1. Estymacja modelu regresji binarnej

4.4.2. Kod finalnego modelu regresji binarnej

4.4.3. Model regresji binarnej dla Premier League

4.5. Model regresji uporządkowanej - estymacja i interpretacja wyników

4.5.1. Estymacja modelu regresji uporządkowanej

4.5.2. Kod finalnego modelu regresji uporządkowanej

4.5.3. Model regresji uporządkowanej dla Premier League

Podsumowanie

Bibliografia

 

Piotr Rozenbajgier

Rozdział 5. Model regresji Poissona

Wprowadzenie

5.1. Estymacja regresji Poissona w SAS

5.2. Problem nadmiernej dyspersji (overdispersion)

5.3. Rozkład ujemny dwumianowy

Bibliografia

 

Justyna Czaja

Rozdział 6. Modelowanie na użytek kampanii marketingu bezpośredniego

Wprowadzenie

6.1. Marketing bezpośredni - definicje i podstawowe pojęcia

6.2. Rola modeli predykcyjnych w marketingu

6.3. Znaczenie wskaźnika otwarcia dla sukcesu kampanii marketingu bezpośredniego

6.4. Podstawy teoretyczne zastosowanych metod

6.4.1. Model regresji logistycznej - metoda karty scoringowej

6.4.2. Model sztucznej sieci neuronowej

6.4.3. Model drzewa decyzyjnego

6.5. Opis zbioru danych

6.6. Selekcja zmiennych objaśniających do ostatecznych modeli

6.7. Model regresji logistycznej - analiza praktyczna

6.8. Model sztucznej sieci neuronowej - analiza praktyczna

6.9. Model drzewa decyzyjnego - analiza praktyczna

6.10. Porównanie modeli na zbiorze walidacyjnym

6.11. Praktyczne zastosowanie wybranego modelu

Podsumowanie

Bibliografia

 

Adrianna Wołowiec

Rozdział 7. Modelowanie churnu. Regresja logistyczna i survival data mining

7.1. Wprowadzenie do modelowania churnu

7.1.1. Podstawy teoretyczne zagadnienia churnu

7.1.2. Podejścia stosowane w analizie churnu

7.2. Opis zbioru danych

7.3. Model regresji logistycznej

7.3.1. Wstępna analiza i ocena zmiennych objaśniających

7.3.2. Wyniki modelu regresji logistycznej

7.4. Model survival data mining

7.4.1. Podstawy teoretyczne

7.4.2. Wyniki analizy

7.4.3. Ocena jakości modelu

7.5. Podsumowanie wyników

Podsumowanie

Bibliografia

 

Marta Jasiewicz-Badowska, Karol Przanowski, Bartosz Staniów, Krystyna Rup

Rozdział 8. Dynamiczne segmentacje klientów korporacyjnych i zespołów sprzedażowych metodami credit scoringu

Wprowadzenie

8.1. Wprowadzenie do credit scoringu

8.1.1. Początki credit scoringu

8.1.2. Etapy budowy modelu scoringowego

8.1.3. Definicja default

8.1.4. Struktura danych - ABT i próby modelowe

8.1.5. Podział zmiennych na kategorie

8.1.6. Selekcja zmiennych i ich raporty

8.1.7. Ocena kandydatów i wybór finalnego modelu

8.1.8. Wdrożenie modelu i monitorowanie poprawności jego działania

8.2. Segmentacja sieci aptecznych metodami credit scoringu

8.2.1. Zarys specyfiki rynku farmaceutycznego

8.2.2. Wzbogacenie procesu zarządzania sieciami z wykorzystaniem klasycznych modeli scoringowych

8.2.3. Obszar aplikacji modelu

8.2.4. Modelowanie rankingu efektywności per apteka

8.2.5. Interpretacja wybranych zmiennych w modelu

8.2.6. Budowa komplementarnego procesu analitycznego - BI i modelowanie predykcyjne

8.2.7. Szkolenie z podstaw teoretycznych, prezentacja narzędzia oraz obszary do zastosowania jako newralgiczny punkt we wdrożeniach innowacyjnych rozwiązań

8.2.8. Dywersyfikacja strategii biznesowych i komunikacja oparta na porządkowaniu rzeczywistości

8.3. Credit scoring dla przedstawicieli medycznych

8.3.1. Wprowadzenie do uwarunkowań biznesowych w zarządzaniu zespołem sprzedażowym dedykowanym do rynku faramaceutycznego

8.3.2. Credit scoring dla przedstawicieli medycznych - przybliżenie business case

8.3.3. Testy pierwszych modeli - wybór właściwego momentu startu

8.3.4. Aktualizacja modelu dla przedstawicieli medycznych

8.3.5. Interpretacja wybranych zmiennych

8.3.6. Segmentacja PM - rola w zarządzaniu zespołami konsultantów medycznych

Bibliografia

Biogramy

Opis

Wydanie: I
Rok wydania: 2019
Wydawnictwo: Oficyna Wydawnicza
Oprawa: miękka
Format: B5
Liczba stron: 419

 

e-book do wypożyczenia lub zakupu na stronie:

https://www.ibuk.pl

 

Wstęp

 

 

 

 

Czytelnikowi na rynku polskim została udostępniona publikacja Czwarta rewo­lucja przemysłowa autorstwa prof. Klausa Schwaba, założyciela i prezesa Świato­wego Forum Ekonomicznego We wstępie do publikacji, w rekomendacjach, znani ludzie biznesu i innych środowisk, w tym naukowych, zamieścili swoje wypowie­dzi. Dalej zostały przedstawione wybrane dwie z nich.

"Ludzkość stoi na progu największej w dziejach rewolucji, która zmiecie większość obo­wiązujących zasad naszego życia i pracy. Toczący się wykładniczo technologiczny rozwój świata jest już nie do zatrzymania" (Sebastian Kulczyk, CEO Kulczyk Investment).

"Najnowsze technologie, łączące świat cyfrowy, fizyczny i biologiczny, radykalnie zmie­niają naszą cywilizację. Nowe możliwości w medycynie, edukacji czy biznesie popra­wiają bytowanie człowieka na Ziemi i przyczyniają się do mądrzejszego korzystania z jej naturalnych zasobów. Zarazem okazują się potencjalnie bardzo niebezpieczne, otwierając ogromne przestrzenie do cyberprzestępczości czy przyczyniając się do dal­szej polaryzacji społeczeństw. Z tego powodu jednym z najpoważniejszych wyzwań dzisiejszego świata jest to, by dobrze i mądrze przeprowadzić czwartą rewolucję prze­mysłową" (Aleksandra Przegalińska, Akademia Leona Koźmińskiego).

We wstępie do swojej książki Czwarta rewolucja przemysłowa profesor Klaus Schwab pisze m.in.:

"Znajdujemy się na początku przewrotu, który w sposób fundamentalny zmienia sposób, w jaki żyjemy, pracujemy i utrzymujemy kontakty. Spośród różnorakich i fascynują­cych wyzwań, które w związku z tym stoją dzisiaj przed nami, największym i naj­ważniejszym zadaniem jest zrozumieć nową rewolucję technologiczną i odpowiednio ukierunkować jej przebieg. (...)

Jesteśmy świadkami ogromnych zmian we wszystkich branżach; wyłaniają się nowe technologie biznesowe, pojawiają się przełomowe zakłócenia w istniejącym porządku, które rewolucjonizują systemy produkcji, konsumpcji, transportu i dostaw. Na froncie społecznym zachodzi zmiana paradygmatu określającego, jak pracujemy i komunikujemy się, a także jak się wyrażamy, jak przekazujemy informacje i jakich szukamy rozrywek. Przekształceniom ulegają zarówno rządy i instytucje, jak i systemy edukacji, opieki zdrowotnej, transportu oraz wiele innych. Nowe sposoby posługiwania się technolo­gią wpływają na nasze zachowania oraz systemy produkcji i konsumpcji, stwarzają także możliwości wspierania, regeneracji i ochrony środowiska naturalnego, zamiast tworzenia ukrytych kosztów w formie efektów zewnętrznych. Zmiany te pod względem rozmiaru, tempa i zakresu, nie mają sobie równych w historii".

Zmiany te charakteryzują się dużą szybkością, szerokością i głębią oraz wpły­wem na transformację wszystkich systemów. Przed tym procesem stoją uczelnie wyższe, uniwersytety i środowiska akademickie, aby w porę podjąć stosowne dzia­łania i włączyć się w potężną zmianę systemową.

Obecnie modele są podstawą większości, jeśli nie wszystkich, decyzji bizne­sowych. Coraz częściej firmy poszukują analityki jako kluczowego, strategicznego wyróżnika, który umożliwia kierowanie ogromną liczbą decyzji operacyjnych każ­dego dnia. Jednocześnie firmy identyfikują zagrożenia. Według SAS White Paper 2018 jednym z istotniejszych czynników hamujących sukces analizy jest opóź­nienie między tworzeniem a wdrażaniem modeli. Głównym powodem opóźnień we wdrożeniu modeli jest to, że firmy produkują i wdrażają je w dwóch oddziel­nych środowiskach: biznesowym i informatycznym (IT). Analitycy z różnych jed­nostek biznesowych budują modele, a działy IT je wdrażają. Obie grupy polegają innym zestawom procesów, kodów programowania i języków, które utrudniają szybką reakcję na zmieniające się warunki biznesowe. Jeśli firmy chcą usprawnić produkcję modeli, lepszym pomysłem jest automatyzacja powtarzalnych aspek­tów pracy i migracja modeli do procesu ciągłego podejmowania decyzji. Odpo­wiedzią jest fabryka analityczna, czyli połączone dwa środowiska i automatyzacja procesów oraz decyzji.

Znaczącą część analityki dla biznesu stanowią modele predykcyjne. Ocena dokładności predykcyjnej jest ważnym aspektem oceny i porównywania modeli, algorytmów lub technologii, które generują prognozy. Prognozy i projekcje stały się istotną częścią każdego przedsięwzięcia biznesowego i naukowego.

Monografia Modelowanie dla biznesu przedstawia istotę i modelowanie z zakresu analityki biznesowej w wybranych obszarach zastosowań. Autorami lub współ­autorami kolejnych rozdziałów są pracownicy Zakładu Analizy Historii Zdarzeń i Analiz Wielopoziomowych, nasi magistranci lub absolwenci Podyplomowych Studiów "Analizy Statystyczne i Data Mining w Biznesie", za które merytorycznie odpowiada Zakład. Monografia rozpoczyna cykl publikacji Modelowanie dla biz­nesu, serii, która będzie prezentować różnorodne przykłady modelowania bizne­sowego z wykorzystaniem różnych metod analizy, włączając za każdym razem modelowanie predykcyjne.

Rozdział pierwszy jest rozdziałem o regresji logistycznej, modelowaniu, które jest wykorzystywane w sześciu rozdziałach niniejszej monografii. Odpowiedziano w nim na następujące pytania:

1.     Jaka była geneza regresji logistycznej i opartego na niej modelowania?

2.     Jakie są podstawowe różnice pomiędzy regresją liniową a regresją logistyczną?

3.     Jak przebiega estymacja modelu regresji logistycznej (na przykładzie regre­sji binarnej)?

4.     Jak interpretuje się wyniki estymacji parametrów regresji liniowej i regresji logistycznej oraz jakie są różnice?

5.     Jakie są inne rodzaje modelowania regresji logistycznej poza modelem binarnym?

6.     Jakie znaczenie w modelowaniu regresji logistycznej ma kodowanie zmien­nych jakościowych?

7.     Co składa się na proces wnioskowania w modelach regresji logistycznej?

8.     Co oznacza predykcja i model predykcyjny z wykorzystaniem regresji logi­stycznej?

9.     Jakie mierniki i testy wykorzystuje się do oceny zdolności predykcyjnej modelu opartego na regresji logistycznej?

W rozdziale drugim zamieszczono przegląd podstawowych testów i miar do oceny zależności zmiennych jakościowych, których dane empiryczne można zestawić w postaci tablic kontyngencji. Analiza tablic kontyngencji stanowi czę­sto wstępny etap wielu bardziej zaawansowanych analiz, w tym modeli regresji logistycznej. Przegląd testów i miar obejmuje: testy służące do weryfikacji hipotez o niezależności dwóch cech jakościowych (testy asymptotyczne i dokładne) oraz test Cochrana-Mantela-Haenszela i jego różne postacie, w zależności od celu ana­lizy. Kolejno omówiono podstawowe miary asocjacji pomiędzy cechami jakościo­wymi. Konstrukcja tych miar zależy od rodzaju skal pomiarowych, stąd opis miar zależności dotyczy: zmiennych dychotomicznych, nominalnych i porządkowych.Ostatnia część rozdziału ma charakter aplikacyjny, zamieszczono przykłady obliczeń i interpretacji wcześniej opisanych testów i miar na przykładach tablic kontyngencji z zastosowaniem oprogramowania SAS.

Proces budowy modelu regresji logistycznej z binarną zmienną objaśnianą jest tematem rozdziału trzeciego. W pierwszej jego części zaprezentowano model deskryptywny, którego celem jest zrozumienie i poznanie zależności w badanej próbie. Następnie opisano model predykcyjny, który ma na celu możliwie najlepsze różnicowanie obserwacji spoza zakresu danych wykorzystanych do budowy modelu. Omówiono zbiór danych oraz wykorzystane procedury i autorskie makra SAS. Przeprowadzono jednowymiarową analizę zmiennych objaśniających, w tym analizę braków danych oraz sprawdzono moc dyskryminacyjną poszczególnych zmiennych. Przedstawiono algorytm podziału zbioru danych na próbę uczącą i walidacyjną. Przeprowadzono analizy korelacji i współliniowości. Opisano algo­rytm doboru predyktorów do każdego modelu w celu zmniejszenia wymiarowości. Zaprezentowano analizę obserwacji wpływowych i odstających. Finalne modele zostały poddane interpretacji ekonomicznej oraz gruntownej weryfikacji staty­stycznej. Przeprowadzone testy statystyczne uzupełniono o przedstawienie gra­ficzne w stosownych przypadkach.

Rozdział czwarty dotyczy modelowania z wykorzystaniem modelu regresji binarnej i uporządkowanej. Celem analizy było określenie czynników pozwala­jących przewidzieć końcowy wynik meczu piłkarskiego na przykładzie danych z dwóch pełnych sezonów lig angielskiej. Wykorzystując SAS Enterprise Guide 7.1, zbudowano modele regresji binarnej i uporządkowanej zbioru danych liczącego 760 obserwacji. Zaprezentowano kody tworzące modele oraz najważniejsze kody etapu przetwarzania danych. W modelowaniu wykorzystano 119 zmiennych zawierających statystyki meczowe drużyn gospodarzy i gości, statystyki zagrego­wane z całego sezonu poprzedzającego daną obserwację, statystyki zagregowane z meczów u siebie dla gospodarza i z meczów wyjazdowych dla gości oraz atrybuty finansowe i geograficzne. Zaprezentowano statystyki dopasowania oraz jakości predykcyjnej modeli. W modelu binarnym liczba goli strzelonych przez gospo­darzy u siebie w ubiegłym sezonie oraz przewidywania bukmacherów dotyczące danego meczu okazały się najsilniejszymi predyktorami. W modelu uporządko­wanym stracone bramki przez gości w meczach wyjazdowych w ubiegłym sezo­nie oraz typy bukmacherów miały największy wpływ na zmienną odpowiedzi.

W rozdziale piątym do modelowania wykorzystano model regresji Poissona. Pierwszą część rozdziału stanowi wstęp teoretyczny do rozkładu i regresji Poissona oraz opis podstawowej składni procedury GENMOD wykorzystanej do estyma­cji modelu. W kolejnych podrozdziałach są zaprezentowane przykłady estymacji i analizy liczby infekcji. Rozdział zawiera również informacje dotyczące problemu nadmiernej dyspersji często występujących w rzeczywistych zastosowaniach oraz dwa sposoby rozwiązania tego problemu: korekcja wariancji za pomocą parame­tru skali oraz model ujemny dwumianowy. Dokonano porównania obu metod modelowania, wskazując podobieństwa i różnice w estymacji. Uzupełnieniem rozdziału jest analiza obserwacji wpływowych i odstających oraz ich znaczenia w procesie estymacji.

Tematykę zastosowania modeli predykcyjnych j ako narzędzia umożliwiającego zwiększenie efektywności kampanii marketingu bezpośredniego podjęto w roz­dziale szóstym. Pierwsza jego część to wprowadzenie do dziedziny marketingu, w którym zawarto opis podstawowych pojęć i definicji dotyczących podejmowa­nej tematyki. Następnie opisano rolę modeli predykcyjnych w marketingu oraz znaczenie wskaźnika otwarcia dla sukcesu kampanii marketingowych. Przedsta­wiono również podstawy teoretyczne zastosowanych metod - regresji logistycz­nej, sztucznej sieci neuronowej oraz drzewa decyzyjnego. Opisano wykorzystany do modelowania zbiór danych, jak również całościowy proces budowy poszcze­gólnych modeli predykcyjnych, ich porównania oraz wyboru najlepszego pod względem zdolności predykcyjnych. Rozdział zakończono prezentacją praktycz­nego zastosowania finalnego modelu.

W rozdziale siódmym skupiono się na analizie churnu, czyli zjawiska odej­ścia klienta, które jest związane z zakończeniem korzystania ze świadczonej przez firmę usługi, oraz na przykładowych dwóch podejściach stosowanych do jego badania. W części teoretycznej przedstawiono charakterystykę zjawiska churnu, a także możliwe do zastosowania podejścia analityczne, ze szczególnym uwzględnieniem modelu regresji logistycznej oraz modelu survival data mining. W ramach części praktycznej utworzone zostały, na podstawie danych dotyczą­cych churnu w firmie telekomunikacyjnej, dwa modele: model regresji logistycz­nej oraz model survival data mining z perspektywą roczną. Na podstawie części aplikacyjnej dokonano podsumowania uwzględniającego możliwości oraz ogra­niczenia dwóch utworzonych modeli.

Rozdział ósmym zawiera opis procesu implementacji metod credit scoringu w obszarach związanych z zarządzaniem relacjami biznesowymi z klientem kor­poracyjnym oraz motywowaniem pośrednich struktur sprzedaży. Business case, opisany w rozdziale, dotyczy polskiej branży farmaceutycznej, a środowisko dla niego stanowią czasy czwartej rewolucji technologicznej. Klasyczny credit scoring opiera się na mechanizmie transformacji szacowanego prawdopodobieństwa zaj­ścia zdarzenia sukcesu lub porażki do postaci łatwo interpretowalnych punktów scoringowych. Ponadto algorytm umożliwia jednoznaczne wskazanie najistotniej­szych, a przez to najbardziej predyktywnych atrybutów modelowanego zjawiska i podzielnie ich na kategorie określające stopień ryzyka wystąpienia prognozo­wanego zdarzenia. Suma punktów otrzymanych w ramach każdej zmiennej sta­nowi o przynależności podmiotów do określonej grupy ryzyka. Podejście to od dawna wykorzystywane jest z sukcesem w bankowości dla procesów kredytowych, w instytucjach ubezpieczeniowych do wykrywania oszustów oraz w ocenie efek­tywności kampanii marketingowych. Rozdział ósmy składa się trzech głównych
części. Pierwsza stanowi repozytorium wiedzy na temat podstaw teoretycznych i mechanizmów credit scoringu. Wyjaśnione są w nim między innymi pojęcia default, punkt obserwacji, wskaźnik Giniego i tabela ABT. Część druga dedyko­wana jest problematyce segmentacji i optymalizacji strategii biznesowych dla sieci aptecznych. Przedstawiono w niej tradycyjne i ogólnodostępne metody segmen­tacji klientów sieciowych, proponowane przez firmy analityczne zajmujące się rynkiem farmaceutycznym, oraz podejście innowacyjne. Innowacyjność alterna­tywnego sposobu profilowania sieci aptecznych pozwala na wielowymiarowe usze­regowanie klientów według skłonności do zajęcia określonej pozycji w rankingu efektywności dochodowej per apteka. Równolegle w tej części poruszone zostały kwestie związane z jakością i mocą predykcyjną modelu scoringowego w warun­kach skąpej liczby rekordów w modelowanej populacji. Część trzecia poświę­cona została modelowaniu szansy na osiągniecie co najmniej 100% realizacji celu sprzedażowego przez przedstawiciela handlowego, w szczególności przedstawi­ciela medycznego. Opisano w niej aspekt wykorzystania wiedzy o przyszłym roz­kładzie wyników sprzedażowych do celów budowania strategii i ustalania celów taktycznych dla zespołów sprzedażowych na kolejny okres rozliczeniowy. Ponadto wskazano na rolę narzędzi credit scoringu w motywowaniu pracowników. Auto­rzy podkreślili trudną rolę kierownika regionalnego w wyjaśnieniu przypadków, w których model się myli. W rozważanym zastosowaniu konieczność przedysku­towania każdego aspektu uzyskanych ocen cząstkowych stanowi wyzwanie w pra­widłowej interpretacji i aplikacji wyników modelowania zjawiska.

Warszawa, wrzesień 2019 Ewa Frątczak

 

 

 

 

 

 


 

 

Spis treści

 

 

 

Ewa Frątcząk

Przedmowa

 

Ewa Frątcząk

Rozdział 1. Regresja logistyczna - podstawy teorii i modelowania

Wprowadzenie

1.1. Regresja logistyczna - początki

1.2. Regresja logistyczna - podstawy teorii

1.3. Model regresji logistycznej a model regresji liniowej

1.4. Estymacja parametrów modelu regresji logistycznej (na przykładzie regresji binarnej)

1.5. Interpretacja wyników estymacji

1.6. Model uporządkowany i model o postaci wielomianu

1.6.1. Regresja logistyczna - model uporządkowany

1.6.2. Regresja logistyczna o postaci wielomianu - uogólnione logity

1.7. Znaczenie kodowania zmiennych jakościowych w modelach regresji logistycznej

1.8. Istota wnioskowania statystycznego w modelach regresji logistycznej

1.8.1. Ocena istotności oszacowanych parametrów

1.8.2. Ocena dobroci modelu

1.9. Predykcja i modelowanie predykcyjne z wykorzystaniem regresji logistycznej

1.10. Modele predykcyjne - diagnostyka - wybrane miary

1.10.1. Macierz pomyłek

1.10.2. Krzywa ROC i AUC (pole pod krzywą ROC)

1.10.3. Krzywa wzrostu lift

1.10.4. Współczynnik Giniego

1.10.5. Statystyki wpływu (DFBETAS, DIFDEV, DIFCHISQ, LEVERAGE)

Podsumowanie

Bibliografia

 

 

Aleksandra Iwanicka

Rozdział 2. Analiza tablic kontyngencji - ocena zależności cech jakościowych

Wprowadzenie

2.1. Testowanie niezależności na podstawie tablic dwudzielczych

2.1.1. Testy chi-kwadrat: Pearsona i ilorazu wiarygodności

2.1.2. Testy skorygowane i dokładne

2.1.3. Miary zależności oparte na statystyce chi-kwadrat Pearsona

2.2. Testowanie niezależności na podstawie       zbioru tablic dwudzielczych

2.2.1. Statystyka ogólnej asocjacji

2.2.2. Statystyka różnicy średnich w wierszach

2.2.3. Statystyka korelacji

2.3. Pomiar siły asocjacji

2.3.1. Miary asocjacji dla cech dychotomicznych

2.3.2. Miary asocjacji dla cech porządkowych

2.3.3. Miary asocjacji dla cech nominalnych

2.4. Przykłady zastosowań

2.4.1. Badanie związku pomiędzy cechami dychotomicznymi

2.4.2. Badanie zależności pomiędzy cechami nominalnymi

2.4.3. Badanie zależności pomiędzy cechami porządkowymi

2.4.4. Badanie zależności w przypadku stratyfikacji

Podsumowanie

Bibliografia

 

Barbara Szewczak, Wojciech Skwirz

Rozdział 3. Regresja logistyczna - model deskryptywny i model predykcyjny

Wprowadzenie

3.1. Opis procedur SAS

3.1.1. Procedury SAS

3.1.2. Autorskie makra SAS

3.2. Model deskryptywny

3.2.1. Metodyka budowy modelu

3.2.2. Analiza braków danych występujących w zmiennych objaśniających

3.2.3. Analiza korelacji oraz wstępna ocena predykcyjności zmiennych objaśniających

3.2.4. Analiza współliniowości zmiennych objaśniających

3.2.5. Selekcja zmiennych objaśniających

3.2.6. Analiza obserwacji wpływowych i odstających

3.2.7. Finalny model - postać i interpretacja

3.2.8. Interpretacja parametrów modelu

3.2.9. Istotność zmiennych w modelu

3.2.10. Ilorazy szans z modelu

3.2.11. Istotność czynników w modelu

3.2.12. Globalny test na istotność modelu

3.2.13.  Kryteria informacyjne modelu

3.2.14.  Analiza współliniowości zmiennych w modelu

3.2.15.  Statystyki mocy dyskryminacyjnej modelu oraz analizy graficzne

3.2.16.  Finalny model - podsumowanie

3.3. Model predykcyjny

3.3.1. Motywacja do budowy modelu predykcyjnego

3.3.2. Etapy budowy modelu

3.3.3. Finalny model - postać i interpretacja

3.3.4. Porównanie modelu deskryptywnego i modelu predykcyjnego

Bibliografia

Załącznik

 

Mikołaj Tchorzewski

Rozdział 4. Modelowanie wyników ligi piłkarskiej z wykorzystaniem regresji binarnej i regresji uporządkowanej

Wprowadzenie

4.1. Charakterystyka rozgrywek Premier League

4.2. Opis danych

4.3. Zmienne do modelowania

4.3.1. Zmienne zależne dla modeli ligi angielskiej

4.3.2. Wybrane zmienne objaśniające dla modeli ligi angielskiej

4.3.3. Wybrane kody z etapu przetwarzania danych

4.4. Model regresji binarnej - estymacja i interpretacja wyników

4.4.1. Estymacja modelu regresji binarnej

4.4.2. Kod finalnego modelu regresji binarnej

4.4.3. Model regresji binarnej dla Premier League

4.5. Model regresji uporządkowanej - estymacja i interpretacja wyników

4.5.1. Estymacja modelu regresji uporządkowanej

4.5.2. Kod finalnego modelu regresji uporządkowanej

4.5.3. Model regresji uporządkowanej dla Premier League

Podsumowanie

Bibliografia

 

Piotr Rozenbajgier

Rozdział 5. Model regresji Poissona

Wprowadzenie

5.1. Estymacja regresji Poissona w SAS

5.2. Problem nadmiernej dyspersji (overdispersion)

5.3. Rozkład ujemny dwumianowy

Bibliografia

 

Justyna Czaja

Rozdział 6. Modelowanie na użytek kampanii marketingu bezpośredniego

Wprowadzenie

6.1. Marketing bezpośredni - definicje i podstawowe pojęcia

6.2. Rola modeli predykcyjnych w marketingu

6.3. Znaczenie wskaźnika otwarcia dla sukcesu kampanii marketingu bezpośredniego

6.4. Podstawy teoretyczne zastosowanych metod

6.4.1. Model regresji logistycznej - metoda karty scoringowej

6.4.2. Model sztucznej sieci neuronowej

6.4.3. Model drzewa decyzyjnego

6.5. Opis zbioru danych

6.6. Selekcja zmiennych objaśniających do ostatecznych modeli

6.7. Model regresji logistycznej - analiza praktyczna

6.8. Model sztucznej sieci neuronowej - analiza praktyczna

6.9. Model drzewa decyzyjnego - analiza praktyczna

6.10. Porównanie modeli na zbiorze walidacyjnym

6.11. Praktyczne zastosowanie wybranego modelu

Podsumowanie

Bibliografia

 

Adrianna Wołowiec

Rozdział 7. Modelowanie churnu. Regresja logistyczna i survival data mining

7.1. Wprowadzenie do modelowania churnu

7.1.1. Podstawy teoretyczne zagadnienia churnu

7.1.2. Podejścia stosowane w analizie churnu

7.2. Opis zbioru danych

7.3. Model regresji logistycznej

7.3.1. Wstępna analiza i ocena zmiennych objaśniających

7.3.2. Wyniki modelu regresji logistycznej

7.4. Model survival data mining

7.4.1. Podstawy teoretyczne

7.4.2. Wyniki analizy

7.4.3. Ocena jakości modelu

7.5. Podsumowanie wyników

Podsumowanie

Bibliografia

 

Marta Jasiewicz-Badowska, Karol Przanowski, Bartosz Staniów, Krystyna Rup

Rozdział 8. Dynamiczne segmentacje klientów korporacyjnych i zespołów sprzedażowych metodami credit scoringu

Wprowadzenie

8.1. Wprowadzenie do credit scoringu

8.1.1. Początki credit scoringu

8.1.2. Etapy budowy modelu scoringowego

8.1.3. Definicja default

8.1.4. Struktura danych - ABT i próby modelowe

8.1.5. Podział zmiennych na kategorie

8.1.6. Selekcja zmiennych i ich raporty

8.1.7. Ocena kandydatów i wybór finalnego modelu

8.1.8. Wdrożenie modelu i monitorowanie poprawności jego działania

8.2. Segmentacja sieci aptecznych metodami credit scoringu

8.2.1. Zarys specyfiki rynku farmaceutycznego

8.2.2. Wzbogacenie procesu zarządzania sieciami z wykorzystaniem klasycznych modeli scoringowych

8.2.3. Obszar aplikacji modelu

8.2.4. Modelowanie rankingu efektywności per apteka

8.2.5. Interpretacja wybranych zmiennych w modelu

8.2.6. Budowa komplementarnego procesu analitycznego - BI i modelowanie predykcyjne

8.2.7. Szkolenie z podstaw teoretycznych, prezentacja narzędzia oraz obszary do zastosowania jako newralgiczny punkt we wdrożeniach innowacyjnych rozwiązań

8.2.8. Dywersyfikacja strategii biznesowych i komunikacja oparta na porządkowaniu rzeczywistości

8.3. Credit scoring dla przedstawicieli medycznych

8.3.1. Wprowadzenie do uwarunkowań biznesowych w zarządzaniu zespołem sprzedażowym dedykowanym do rynku faramaceutycznego

8.3.2. Credit scoring dla przedstawicieli medycznych - przybliżenie business case

8.3.3. Testy pierwszych modeli - wybór właściwego momentu startu

8.3.4. Aktualizacja modelu dla przedstawicieli medycznych

8.3.5. Interpretacja wybranych zmiennych

8.3.6. Segmentacja PM - rola w zarządzaniu zespołami konsultantów medycznych

Bibliografia

Biogramy

Opinie

Twoja ocena:
Wydanie: I
Rok wydania: 2019
Wydawnictwo: Oficyna Wydawnicza
Oprawa: miękka
Format: B5
Liczba stron: 419

 

e-book do wypożyczenia lub zakupu na stronie:

https://www.ibuk.pl

 

 

 

 

 

Czytelnikowi na rynku polskim została udostępniona publikacja Czwarta rewo­lucja przemysłowa autorstwa prof. Klausa Schwaba, założyciela i prezesa Świato­wego Forum Ekonomicznego We wstępie do publikacji, w rekomendacjach, znani ludzie biznesu i innych środowisk, w tym naukowych, zamieścili swoje wypowie­dzi. Dalej zostały przedstawione wybrane dwie z nich.

"Ludzkość stoi na progu największej w dziejach rewolucji, która zmiecie większość obo­wiązujących zasad naszego życia i pracy. Toczący się wykładniczo technologiczny rozwój świata jest już nie do zatrzymania" (Sebastian Kulczyk, CEO Kulczyk Investment).

"Najnowsze technologie, łączące świat cyfrowy, fizyczny i biologiczny, radykalnie zmie­niają naszą cywilizację. Nowe możliwości w medycynie, edukacji czy biznesie popra­wiają bytowanie człowieka na Ziemi i przyczyniają się do mądrzejszego korzystania z jej naturalnych zasobów. Zarazem okazują się potencjalnie bardzo niebezpieczne, otwierając ogromne przestrzenie do cyberprzestępczości czy przyczyniając się do dal­szej polaryzacji społeczeństw. Z tego powodu jednym z najpoważniejszych wyzwań dzisiejszego świata jest to, by dobrze i mądrze przeprowadzić czwartą rewolucję prze­mysłową" (Aleksandra Przegalińska, Akademia Leona Koźmińskiego).

We wstępie do swojej książki Czwarta rewolucja przemysłowa profesor Klaus Schwab pisze m.in.:

"Znajdujemy się na początku przewrotu, który w sposób fundamentalny zmienia sposób, w jaki żyjemy, pracujemy i utrzymujemy kontakty. Spośród różnorakich i fascynują­cych wyzwań, które w związku z tym stoją dzisiaj przed nami, największym i naj­ważniejszym zadaniem jest zrozumieć nową rewolucję technologiczną i odpowiednio ukierunkować jej przebieg. (...)

Jesteśmy świadkami ogromnych zmian we wszystkich branżach; wyłaniają się nowe technologie biznesowe, pojawiają się przełomowe zakłócenia w istniejącym porządku, które rewolucjonizują systemy produkcji, konsumpcji, transportu i dostaw. Na froncie społecznym zachodzi zmiana paradygmatu określającego, jak pracujemy i komunikujemy się, a także jak się wyrażamy, jak przekazujemy informacje i jakich szukamy rozrywek. Przekształceniom ulegają zarówno rządy i instytucje, jak i systemy edukacji, opieki zdrowotnej, transportu oraz wiele innych. Nowe sposoby posługiwania się technolo­gią wpływają na nasze zachowania oraz systemy produkcji i konsumpcji, stwarzają także możliwości wspierania, regeneracji i ochrony środowiska naturalnego, zamiast tworzenia ukrytych kosztów w formie efektów zewnętrznych. Zmiany te pod względem rozmiaru, tempa i zakresu, nie mają sobie równych w historii".

Zmiany te charakteryzują się dużą szybkością, szerokością i głębią oraz wpły­wem na transformację wszystkich systemów. Przed tym procesem stoją uczelnie wyższe, uniwersytety i środowiska akademickie, aby w porę podjąć stosowne dzia­łania i włączyć się w potężną zmianę systemową.

Obecnie modele są podstawą większości, jeśli nie wszystkich, decyzji bizne­sowych. Coraz częściej firmy poszukują analityki jako kluczowego, strategicznego wyróżnika, który umożliwia kierowanie ogromną liczbą decyzji operacyjnych każ­dego dnia. Jednocześnie firmy identyfikują zagrożenia. Według SAS White Paper 2018 jednym z istotniejszych czynników hamujących sukces analizy jest opóź­nienie między tworzeniem a wdrażaniem modeli. Głównym powodem opóźnień we wdrożeniu modeli jest to, że firmy produkują i wdrażają je w dwóch oddziel­nych środowiskach: biznesowym i informatycznym (IT). Analitycy z różnych jed­nostek biznesowych budują modele, a działy IT je wdrażają. Obie grupy polegają innym zestawom procesów, kodów programowania i języków, które utrudniają szybką reakcję na zmieniające się warunki biznesowe. Jeśli firmy chcą usprawnić produkcję modeli, lepszym pomysłem jest automatyzacja powtarzalnych aspek­tów pracy i migracja modeli do procesu ciągłego podejmowania decyzji. Odpo­wiedzią jest fabryka analityczna, czyli połączone dwa środowiska i automatyzacja procesów oraz decyzji.

Znaczącą część analityki dla biznesu stanowią modele predykcyjne. Ocena dokładności predykcyjnej jest ważnym aspektem oceny i porównywania modeli, algorytmów lub technologii, które generują prognozy. Prognozy i projekcje stały się istotną częścią każdego przedsięwzięcia biznesowego i naukowego.

Monografia Modelowanie dla biznesu przedstawia istotę i modelowanie z zakresu analityki biznesowej w wybranych obszarach zastosowań. Autorami lub współ­autorami kolejnych rozdziałów są pracownicy Zakładu Analizy Historii Zdarzeń i Analiz Wielopoziomowych, nasi magistranci lub absolwenci Podyplomowych Studiów "Analizy Statystyczne i Data Mining w Biznesie", za które merytorycznie odpowiada Zakład. Monografia rozpoczyna cykl publikacji Modelowanie dla biz­nesu, serii, która będzie prezentować różnorodne przykłady modelowania bizne­sowego z wykorzystaniem różnych metod analizy, włączając za każdym razem modelowanie predykcyjne.

Rozdział pierwszy jest rozdziałem o regresji logistycznej, modelowaniu, które jest wykorzystywane w sześciu rozdziałach niniejszej monografii. Odpowiedziano w nim na następujące pytania:

1.     Jaka była geneza regresji logistycznej i opartego na niej modelowania?

2.     Jakie są podstawowe różnice pomiędzy regresją liniową a regresją logistyczną?

3.     Jak przebiega estymacja modelu regresji logistycznej (na przykładzie regre­sji binarnej)?

4.     Jak interpretuje się wyniki estymacji parametrów regresji liniowej i regresji logistycznej oraz jakie są różnice?

5.     Jakie są inne rodzaje modelowania regresji logistycznej poza modelem binarnym?

6.     Jakie znaczenie w modelowaniu regresji logistycznej ma kodowanie zmien­nych jakościowych?

7.     Co składa się na proces wnioskowania w modelach regresji logistycznej?

8.     Co oznacza predykcja i model predykcyjny z wykorzystaniem regresji logi­stycznej?

9.     Jakie mierniki i testy wykorzystuje się do oceny zdolności predykcyjnej modelu opartego na regresji logistycznej?

W rozdziale drugim zamieszczono przegląd podstawowych testów i miar do oceny zależności zmiennych jakościowych, których dane empiryczne można zestawić w postaci tablic kontyngencji. Analiza tablic kontyngencji stanowi czę­sto wstępny etap wielu bardziej zaawansowanych analiz, w tym modeli regresji logistycznej. Przegląd testów i miar obejmuje: testy służące do weryfikacji hipotez o niezależności dwóch cech jakościowych (testy asymptotyczne i dokładne) oraz test Cochrana-Mantela-Haenszela i jego różne postacie, w zależności od celu ana­lizy. Kolejno omówiono podstawowe miary asocjacji pomiędzy cechami jakościo­wymi. Konstrukcja tych miar zależy od rodzaju skal pomiarowych, stąd opis miar zależności dotyczy: zmiennych dychotomicznych, nominalnych i porządkowych.Ostatnia część rozdziału ma charakter aplikacyjny, zamieszczono przykłady obliczeń i interpretacji wcześniej opisanych testów i miar na przykładach tablic kontyngencji z zastosowaniem oprogramowania SAS.

Proces budowy modelu regresji logistycznej z binarną zmienną objaśnianą jest tematem rozdziału trzeciego. W pierwszej jego części zaprezentowano model deskryptywny, którego celem jest zrozumienie i poznanie zależności w badanej próbie. Następnie opisano model predykcyjny, który ma na celu możliwie najlepsze różnicowanie obserwacji spoza zakresu danych wykorzystanych do budowy modelu. Omówiono zbiór danych oraz wykorzystane procedury i autorskie makra SAS. Przeprowadzono jednowymiarową analizę zmiennych objaśniających, w tym analizę braków danych oraz sprawdzono moc dyskryminacyjną poszczególnych zmiennych. Przedstawiono algorytm podziału zbioru danych na próbę uczącą i walidacyjną. Przeprowadzono analizy korelacji i współliniowości. Opisano algo­rytm doboru predyktorów do każdego modelu w celu zmniejszenia wymiarowości. Zaprezentowano analizę obserwacji wpływowych i odstających. Finalne modele zostały poddane interpretacji ekonomicznej oraz gruntownej weryfikacji staty­stycznej. Przeprowadzone testy statystyczne uzupełniono o przedstawienie gra­ficzne w stosownych przypadkach.

Rozdział czwarty dotyczy modelowania z wykorzystaniem modelu regresji binarnej i uporządkowanej. Celem analizy było określenie czynników pozwala­jących przewidzieć końcowy wynik meczu piłkarskiego na przykładzie danych z dwóch pełnych sezonów lig angielskiej. Wykorzystując SAS Enterprise Guide 7.1, zbudowano modele regresji binarnej i uporządkowanej zbioru danych liczącego 760 obserwacji. Zaprezentowano kody tworzące modele oraz najważniejsze kody etapu przetwarzania danych. W modelowaniu wykorzystano 119 zmiennych zawierających statystyki meczowe drużyn gospodarzy i gości, statystyki zagrego­wane z całego sezonu poprzedzającego daną obserwację, statystyki zagregowane z meczów u siebie dla gospodarza i z meczów wyjazdowych dla gości oraz atrybuty finansowe i geograficzne. Zaprezentowano statystyki dopasowania oraz jakości predykcyjnej modeli. W modelu binarnym liczba goli strzelonych przez gospo­darzy u siebie w ubiegłym sezonie oraz przewidywania bukmacherów dotyczące danego meczu okazały się najsilniejszymi predyktorami. W modelu uporządko­wanym stracone bramki przez gości w meczach wyjazdowych w ubiegłym sezo­nie oraz typy bukmacherów miały największy wpływ na zmienną odpowiedzi.

W rozdziale piątym do modelowania wykorzystano model regresji Poissona. Pierwszą część rozdziału stanowi wstęp teoretyczny do rozkładu i regresji Poissona oraz opis podstawowej składni procedury GENMOD wykorzystanej do estyma­cji modelu. W kolejnych podrozdziałach są zaprezentowane przykłady estymacji i analizy liczby infekcji. Rozdział zawiera również informacje dotyczące problemu nadmiernej dyspersji często występujących w rzeczywistych zastosowaniach oraz dwa sposoby rozwiązania tego problemu: korekcja wariancji za pomocą parame­tru skali oraz model ujemny dwumianowy. Dokonano porównania obu metod modelowania, wskazując podobieństwa i różnice w estymacji. Uzupełnieniem rozdziału jest analiza obserwacji wpływowych i odstających oraz ich znaczenia w procesie estymacji.

Tematykę zastosowania modeli predykcyjnych j ako narzędzia umożliwiającego zwiększenie efektywności kampanii marketingu bezpośredniego podjęto w roz­dziale szóstym. Pierwsza jego część to wprowadzenie do dziedziny marketingu, w którym zawarto opis podstawowych pojęć i definicji dotyczących podejmowa­nej tematyki. Następnie opisano rolę modeli predykcyjnych w marketingu oraz znaczenie wskaźnika otwarcia dla sukcesu kampanii marketingowych. Przedsta­wiono również podstawy teoretyczne zastosowanych metod - regresji logistycz­nej, sztucznej sieci neuronowej oraz drzewa decyzyjnego. Opisano wykorzystany do modelowania zbiór danych, jak również całościowy proces budowy poszcze­gólnych modeli predykcyjnych, ich porównania oraz wyboru najlepszego pod względem zdolności predykcyjnych. Rozdział zakończono prezentacją praktycz­nego zastosowania finalnego modelu.

W rozdziale siódmym skupiono się na analizie churnu, czyli zjawiska odej­ścia klienta, które jest związane z zakończeniem korzystania ze świadczonej przez firmę usługi, oraz na przykładowych dwóch podejściach stosowanych do jego badania. W części teoretycznej przedstawiono charakterystykę zjawiska churnu, a także możliwe do zastosowania podejścia analityczne, ze szczególnym uwzględnieniem modelu regresji logistycznej oraz modelu survival data mining. W ramach części praktycznej utworzone zostały, na podstawie danych dotyczą­cych churnu w firmie telekomunikacyjnej, dwa modele: model regresji logistycz­nej oraz model survival data mining z perspektywą roczną. Na podstawie części aplikacyjnej dokonano podsumowania uwzględniającego możliwości oraz ogra­niczenia dwóch utworzonych modeli.

Rozdział ósmym zawiera opis procesu implementacji metod credit scoringu w obszarach związanych z zarządzaniem relacjami biznesowymi z klientem kor­poracyjnym oraz motywowaniem pośrednich struktur sprzedaży. Business case, opisany w rozdziale, dotyczy polskiej branży farmaceutycznej, a środowisko dla niego stanowią czasy czwartej rewolucji technologicznej. Klasyczny credit scoring opiera się na mechanizmie transformacji szacowanego prawdopodobieństwa zaj­ścia zdarzenia sukcesu lub porażki do postaci łatwo interpretowalnych punktów scoringowych. Ponadto algorytm umożliwia jednoznaczne wskazanie najistotniej­szych, a przez to najbardziej predyktywnych atrybutów modelowanego zjawiska i podzielnie ich na kategorie określające stopień ryzyka wystąpienia prognozo­wanego zdarzenia. Suma punktów otrzymanych w ramach każdej zmiennej sta­nowi o przynależności podmiotów do określonej grupy ryzyka. Podejście to od dawna wykorzystywane jest z sukcesem w bankowości dla procesów kredytowych, w instytucjach ubezpieczeniowych do wykrywania oszustów oraz w ocenie efek­tywności kampanii marketingowych. Rozdział ósmy składa się trzech głównych
części. Pierwsza stanowi repozytorium wiedzy na temat podstaw teoretycznych i mechanizmów credit scoringu. Wyjaśnione są w nim między innymi pojęcia default, punkt obserwacji, wskaźnik Giniego i tabela ABT. Część druga dedyko­wana jest problematyce segmentacji i optymalizacji strategii biznesowych dla sieci aptecznych. Przedstawiono w niej tradycyjne i ogólnodostępne metody segmen­tacji klientów sieciowych, proponowane przez firmy analityczne zajmujące się rynkiem farmaceutycznym, oraz podejście innowacyjne. Innowacyjność alterna­tywnego sposobu profilowania sieci aptecznych pozwala na wielowymiarowe usze­regowanie klientów według skłonności do zajęcia określonej pozycji w rankingu efektywności dochodowej per apteka. Równolegle w tej części poruszone zostały kwestie związane z jakością i mocą predykcyjną modelu scoringowego w warun­kach skąpej liczby rekordów w modelowanej populacji. Część trzecia poświę­cona została modelowaniu szansy na osiągniecie co najmniej 100% realizacji celu sprzedażowego przez przedstawiciela handlowego, w szczególności przedstawi­ciela medycznego. Opisano w niej aspekt wykorzystania wiedzy o przyszłym roz­kładzie wyników sprzedażowych do celów budowania strategii i ustalania celów taktycznych dla zespołów sprzedażowych na kolejny okres rozliczeniowy. Ponadto wskazano na rolę narzędzi credit scoringu w motywowaniu pracowników. Auto­rzy podkreślili trudną rolę kierownika regionalnego w wyjaśnieniu przypadków, w których model się myli. W rozważanym zastosowaniu konieczność przedysku­towania każdego aspektu uzyskanych ocen cząstkowych stanowi wyzwanie w pra­widłowej interpretacji i aplikacji wyników modelowania zjawiska.

Warszawa, wrzesień 2019 Ewa Frątczak

 

 

 

 

 

 


 

 

 

 

 

Ewa Frątcząk

Przedmowa

 

Ewa Frątcząk

Rozdział 1. Regresja logistyczna - podstawy teorii i modelowania

Wprowadzenie

1.1. Regresja logistyczna - początki

1.2. Regresja logistyczna - podstawy teorii

1.3. Model regresji logistycznej a model regresji liniowej

1.4. Estymacja parametrów modelu regresji logistycznej (na przykładzie regresji binarnej)

1.5. Interpretacja wyników estymacji

1.6. Model uporządkowany i model o postaci wielomianu

1.6.1. Regresja logistyczna - model uporządkowany

1.6.2. Regresja logistyczna o postaci wielomianu - uogólnione logity

1.7. Znaczenie kodowania zmiennych jakościowych w modelach regresji logistycznej

1.8. Istota wnioskowania statystycznego w modelach regresji logistycznej

1.8.1. Ocena istotności oszacowanych parametrów

1.8.2. Ocena dobroci modelu

1.9. Predykcja i modelowanie predykcyjne z wykorzystaniem regresji logistycznej

1.10. Modele predykcyjne - diagnostyka - wybrane miary

1.10.1. Macierz pomyłek

1.10.2. Krzywa ROC i AUC (pole pod krzywą ROC)

1.10.3. Krzywa wzrostu lift

1.10.4. Współczynnik Giniego

1.10.5. Statystyki wpływu (DFBETAS, DIFDEV, DIFCHISQ, LEVERAGE)

Podsumowanie

Bibliografia

 

 

Aleksandra Iwanicka

Rozdział 2. Analiza tablic kontyngencji - ocena zależności cech jakościowych

Wprowadzenie

2.1. Testowanie niezależności na podstawie tablic dwudzielczych

2.1.1. Testy chi-kwadrat: Pearsona i ilorazu wiarygodności

2.1.2. Testy skorygowane i dokładne

2.1.3. Miary zależności oparte na statystyce chi-kwadrat Pearsona

2.2. Testowanie niezależności na podstawie       zbioru tablic dwudzielczych

2.2.1. Statystyka ogólnej asocjacji

2.2.2. Statystyka różnicy średnich w wierszach

2.2.3. Statystyka korelacji

2.3. Pomiar siły asocjacji

2.3.1. Miary asocjacji dla cech dychotomicznych

2.3.2. Miary asocjacji dla cech porządkowych

2.3.3. Miary asocjacji dla cech nominalnych

2.4. Przykłady zastosowań

2.4.1. Badanie związku pomiędzy cechami dychotomicznymi

2.4.2. Badanie zależności pomiędzy cechami nominalnymi

2.4.3. Badanie zależności pomiędzy cechami porządkowymi

2.4.4. Badanie zależności w przypadku stratyfikacji

Podsumowanie

Bibliografia

 

Barbara Szewczak, Wojciech Skwirz

Rozdział 3. Regresja logistyczna - model deskryptywny i model predykcyjny

Wprowadzenie

3.1. Opis procedur SAS

3.1.1. Procedury SAS

3.1.2. Autorskie makra SAS

3.2. Model deskryptywny

3.2.1. Metodyka budowy modelu

3.2.2. Analiza braków danych występujących w zmiennych objaśniających

3.2.3. Analiza korelacji oraz wstępna ocena predykcyjności zmiennych objaśniających

3.2.4. Analiza współliniowości zmiennych objaśniających

3.2.5. Selekcja zmiennych objaśniających

3.2.6. Analiza obserwacji wpływowych i odstających

3.2.7. Finalny model - postać i interpretacja

3.2.8. Interpretacja parametrów modelu

3.2.9. Istotność zmiennych w modelu

3.2.10. Ilorazy szans z modelu

3.2.11. Istotność czynników w modelu

3.2.12. Globalny test na istotność modelu

3.2.13.  Kryteria informacyjne modelu

3.2.14.  Analiza współliniowości zmiennych w modelu

3.2.15.  Statystyki mocy dyskryminacyjnej modelu oraz analizy graficzne

3.2.16.  Finalny model - podsumowanie

3.3. Model predykcyjny

3.3.1. Motywacja do budowy modelu predykcyjnego

3.3.2. Etapy budowy modelu

3.3.3. Finalny model - postać i interpretacja

3.3.4. Porównanie modelu deskryptywnego i modelu predykcyjnego

Bibliografia

Załącznik

 

Mikołaj Tchorzewski

Rozdział 4. Modelowanie wyników ligi piłkarskiej z wykorzystaniem regresji binarnej i regresji uporządkowanej

Wprowadzenie

4.1. Charakterystyka rozgrywek Premier League

4.2. Opis danych

4.3. Zmienne do modelowania

4.3.1. Zmienne zależne dla modeli ligi angielskiej

4.3.2. Wybrane zmienne objaśniające dla modeli ligi angielskiej

4.3.3. Wybrane kody z etapu przetwarzania danych

4.4. Model regresji binarnej - estymacja i interpretacja wyników

4.4.1. Estymacja modelu regresji binarnej

4.4.2. Kod finalnego modelu regresji binarnej

4.4.3. Model regresji binarnej dla Premier League

4.5. Model regresji uporządkowanej - estymacja i interpretacja wyników

4.5.1. Estymacja modelu regresji uporządkowanej

4.5.2. Kod finalnego modelu regresji uporządkowanej

4.5.3. Model regresji uporządkowanej dla Premier League

Podsumowanie

Bibliografia

 

Piotr Rozenbajgier

Rozdział 5. Model regresji Poissona

Wprowadzenie

5.1. Estymacja regresji Poissona w SAS

5.2. Problem nadmiernej dyspersji (overdispersion)

5.3. Rozkład ujemny dwumianowy

Bibliografia

 

Justyna Czaja

Rozdział 6. Modelowanie na użytek kampanii marketingu bezpośredniego

Wprowadzenie

6.1. Marketing bezpośredni - definicje i podstawowe pojęcia

6.2. Rola modeli predykcyjnych w marketingu

6.3. Znaczenie wskaźnika otwarcia dla sukcesu kampanii marketingu bezpośredniego

6.4. Podstawy teoretyczne zastosowanych metod

6.4.1. Model regresji logistycznej - metoda karty scoringowej

6.4.2. Model sztucznej sieci neuronowej

6.4.3. Model drzewa decyzyjnego

6.5. Opis zbioru danych

6.6. Selekcja zmiennych objaśniających do ostatecznych modeli

6.7. Model regresji logistycznej - analiza praktyczna

6.8. Model sztucznej sieci neuronowej - analiza praktyczna

6.9. Model drzewa decyzyjnego - analiza praktyczna

6.10. Porównanie modeli na zbiorze walidacyjnym

6.11. Praktyczne zastosowanie wybranego modelu

Podsumowanie

Bibliografia

 

Adrianna Wołowiec

Rozdział 7. Modelowanie churnu. Regresja logistyczna i survival data mining

7.1. Wprowadzenie do modelowania churnu

7.1.1. Podstawy teoretyczne zagadnienia churnu

7.1.2. Podejścia stosowane w analizie churnu

7.2. Opis zbioru danych

7.3. Model regresji logistycznej

7.3.1. Wstępna analiza i ocena zmiennych objaśniających

7.3.2. Wyniki modelu regresji logistycznej

7.4. Model survival data mining

7.4.1. Podstawy teoretyczne

7.4.2. Wyniki analizy

7.4.3. Ocena jakości modelu

7.5. Podsumowanie wyników

Podsumowanie

Bibliografia

 

Marta Jasiewicz-Badowska, Karol Przanowski, Bartosz Staniów, Krystyna Rup

Rozdział 8. Dynamiczne segmentacje klientów korporacyjnych i zespołów sprzedażowych metodami credit scoringu

Wprowadzenie

8.1. Wprowadzenie do credit scoringu

8.1.1. Początki credit scoringu

8.1.2. Etapy budowy modelu scoringowego

8.1.3. Definicja default

8.1.4. Struktura danych - ABT i próby modelowe

8.1.5. Podział zmiennych na kategorie

8.1.6. Selekcja zmiennych i ich raporty

8.1.7. Ocena kandydatów i wybór finalnego modelu

8.1.8. Wdrożenie modelu i monitorowanie poprawności jego działania

8.2. Segmentacja sieci aptecznych metodami credit scoringu

8.2.1. Zarys specyfiki rynku farmaceutycznego

8.2.2. Wzbogacenie procesu zarządzania sieciami z wykorzystaniem klasycznych modeli scoringowych

8.2.3. Obszar aplikacji modelu

8.2.4. Modelowanie rankingu efektywności per apteka

8.2.5. Interpretacja wybranych zmiennych w modelu

8.2.6. Budowa komplementarnego procesu analitycznego - BI i modelowanie predykcyjne

8.2.7. Szkolenie z podstaw teoretycznych, prezentacja narzędzia oraz obszary do zastosowania jako newralgiczny punkt we wdrożeniach innowacyjnych rozwiązań

8.2.8. Dywersyfikacja strategii biznesowych i komunikacja oparta na porządkowaniu rzeczywistości

8.3. Credit scoring dla przedstawicieli medycznych

8.3.1. Wprowadzenie do uwarunkowań biznesowych w zarządzaniu zespołem sprzedażowym dedykowanym do rynku faramaceutycznego

8.3.2. Credit scoring dla przedstawicieli medycznych - przybliżenie business case

8.3.3. Testy pierwszych modeli - wybór właściwego momentu startu

8.3.4. Aktualizacja modelu dla przedstawicieli medycznych

8.3.5. Interpretacja wybranych zmiennych

8.3.6. Segmentacja PM - rola w zarządzaniu zespołami konsultantów medycznych

Bibliografia

Biogramy

Napisz swoją opinię
Twoja ocena:
Szybka wysyłka zamówień
Kup online i odbierz na uczelni
Bezpieczne płatności
pixel