Centrum Szkoleniowe SPSS
///
DM 2 - Zrozumienie, ocena jakości i przygotowanie danych do modelowania.
Cel kursu
Ideą kursu jest przekazanie umiejętności zaawansowanej pracy z danymi tym analitykom, którzy chociaż raz musieli wyrzucić swoje modele predykcyjne, bo popełnili błąd na początku analizy. Na szkoleniu uczymy nie tyle jak skrócić czas pracy z danymi, ale jak uczynić tę pracę bardziej skuteczną. Kurs jest więc adresowany do osób, którym zależy na „bezproblemowym” przejściu do modelowania po fazie przygotowania danych.
Dane w analizach data mining mają zwykle swoje źródło w systemach transakcyjnych, które podlegały wielu transformacjom i przekształceniom, na które analityk nie ma wpływu. Z drugiej strony, z punktu widzenia analityka, tworząc modele predykcyjne interesuje nas zrozumienie zachowań osób, których dane transakcyjne są tylko bladym odzwierciedleniem. Z tego zderzenia potrzeb analityków a stanu danych faktycznie dostępnych, wynika szereg nietrywialnych zagadnień i problemów. Jak podejść do tych danych, aby zdecydować czy będą one dla nas przydatne? Czy pozwolą nam lepiej zrozumieć modelowane zjawisko? Czy ich jakość jest wystarczająca, aby je uwzględniać w analizach? Jak to ocenić? Czy użycie wielowymiarowych metod imputacyjnych może nam w tym pomóc? Jak na końcu przekształcić te dane w plik przydatnych danych analitycznych? Czy te zagadnienia są praktyczne? Przypuszczalnie, każdy praktyk powie, że tak. Czy są fascynujące? Raczej nie, ale są krytycznie ważne, aby dobrze przejść projekt data minining.
Profil uczestnika
Szkolenie jest przeznaczone dla praktyków, zajmujących się lub chcących się zajmować modelowaniem zachowań w ramach projektów data mining, którzy uznają za krytyczną umiejętność odpowiedniego podejścia do danych.
Umiejętności zdobywane podczas kursu
- Wiedza na temat sposobów podejścia do oceny przydatności danych do modelowania
- Umiejętność oceny jakości danych i jej wpływu na budowane modele
- Wiedza z zakresu eksploracji danych i pułapek, jakie zwykle pojawiają się w danych
- Zapoznanie z praktycznymi sposobami podnoszenia jakości danych
- Umiejętność przygotowania danych poprzez przekształcanie dostępnych informacji
Program zajęć
- Zrozumienie i przygotowanie danych – wprowadzenie.
- Ocena znaczenia danych i ich dobór.
- Wykorzystanie technik eksploracyjnej analizy danych w zrozumieniu danych.
- Ocena jakości danych.
- Sposoby podnoszenia jakości danych.
- Przetwarzanie danych.
- Przygotowanie danych do modelowania, kryteria dodatkowe:
- ocena współliniowości i sposoby postępowania,
- ocena wpływu nieliniowości na budowane modele i decyzje co do sposobów postępowania,
- zaburzenia w rozkładzie zmiennych,
- zagadnienia normalizacji i standaryzacji danych,
- Postprocessing.
Forma pracy
Autorski program szkoleniowy Predictive Solutions, bazujący na 25 latach doświadczenia pracy z danymi ilościowymi.
Dostarczamy oryginalne podręczniki wydane przez nasze wydawnictwo i materiały kursowe przygotowane przez ekspertów Predictive Solutions.
Kursanci otrzymują imienne certyfikaty uczestnictwa.
Kursy standardowe prowadzone są tylko w formie zdalnej ze względu na sytuację epidemiczną.
Szkolenie trwa 16 godzin lekcyjnych (2 dni po 8 godzin)
Polecane kursy uzupełniające
Dla zainteresowanych budową modeli klasyfikacyjnych typujących klientów do kampanii marketingowych
Porozmawiaj o szkoleniach
Zadzwoń: 797 727 090