DM 2 – Zrozumienie, ocena jakości i przygotowanie danych do modelowania.

Centrum Szkoleniowe SPSS

///

DM 2 - Zrozumienie, ocena jakości i przygotowanie danych do modelowania.

Cel kursu

Ideą kursu jest przekazanie umiejętności zaawansowanej pracy z danymi tym analitykom, którzy chociaż raz musieli wyrzucić swoje modele predykcyjne, bo popełnili błąd na początku analizy. Na szkoleniu uczymy nie tyle jak skrócić czas pracy z danymi, ale jak uczynić tę pracę bardziej skuteczną. Kurs jest więc adresowany do osób, którym zależy na „bezproblemowym” przejściu do modelowania po fazie przygotowania danych.

Dane w analizach data mining mają zwykle swoje źródło w systemach transakcyjnych, które podlegały wielu transformacjom i przekształceniom, na które analityk nie ma wpływu. Z drugiej strony, z punktu widzenia analityka, tworząc modele predykcyjne interesuje nas zrozumienie zachowań osób, których dane transakcyjne są tylko bladym odzwierciedleniem. Z tego zderzenia potrzeb analityków a stanu danych faktycznie dostępnych, wynika szereg nietrywialnych zagadnień i problemów. Jak podejść do tych danych, aby zdecydować czy będą one dla nas przydatne? Czy pozwolą nam lepiej zrozumieć modelowane zjawisko? Czy ich jakość jest wystarczająca, aby je uwzględniać w analizach? Jak to ocenić? Czy użycie wielowymiarowych metod imputacyjnych może nam w tym pomóc? Jak na końcu przekształcić te dane w plik przydatnych danych analitycznych? Czy te zagadnienia są praktyczne? Przypuszczalnie, każdy praktyk powie, że tak. Czy są fascynujące? Raczej nie, ale są krytycznie ważne, aby dobrze przejść projekt data minining.

1

Profil uczestnika

Szkolenie jest przeznaczone dla praktyków, zajmujących się lub chcących się zajmować modelowaniem zachowań w ramach projektów data mining, którzy uznają za krytyczną umiejętność odpowiedniego podejścia do danych.

2

Umiejętności zdobywane podczas kursu

  • Wiedza na temat sposobów podejścia do oceny przydatności danych do modelowania
  • Umiejętność oceny jakości danych i jej wpływu na budowane modele
  • Wiedza z zakresu eksploracji danych i pułapek, jakie zwykle pojawiają się w danych
  • Zapoznanie z praktycznymi sposobami podnoszenia jakości danych
  • Umiejętność przygotowania danych poprzez przekształcanie dostępnych informacji
3

Program zajęć

  1. Zrozumienie i przygotowanie danych – wprowadzenie.
  2. Ocena znaczenia danych i ich dobór.
  3. Wykorzystanie technik eksploracyjnej analizy danych w zrozumieniu danych.
  4. Ocena jakości danych.
  5. Sposoby podnoszenia jakości danych.
  6. Przetwarzanie danych.
  7. Przygotowanie danych do modelowania, kryteria dodatkowe:
    1. ocena współliniowości i sposoby postępowania,
    2. ocena wpływu nieliniowości na budowane modele i decyzje co do sposobów postępowania,
    3. zaburzenia w rozkładzie zmiennych,
    4. zagadnienia normalizacji i standaryzacji danych,
  8. Postprocessing.
4

Forma pracy

Autorski program szkoleniowy Predictive Solutions, bazujący na 25 latach doświadczenia pracy z danymi ilościowymi.

Dostarczamy oryginalne podręczniki wydane przez nasze wydawnictwo i materiały kursowe przygotowane przez ekspertów Predictive Solutions.

Kursanci otrzymują imienne certyfikaty uczestnictwa.

Kursy standardowe prowadzone są tylko w formie zdalnej ze względu na sytuację epidemiczną.

Szkolenie trwa 16 godzin lekcyjnych (2 dni po 8 godzin)

5

Polecane kursy uzupełniające

Dla zainteresowanych budową modeli klasyfikacyjnych typujących klientów do kampanii marketingowych

Porozmawiaj o szkoleniach

Zadzwoń: 797 727 090


Z nami warto!

szkolenia-icon1

Praktyczna wiedza

Aktywnie dostosowujemy programy kursów do zmieniających się realiów i wyzwań badacza.
szkolenia-icon2

Uznani eksperci

Wykładowcy to praktycy analizy danych, których wiedza i praktyka są gwarancją jakości kursów.
icon-spss82px

25 lat doświadczenia

Predictive Solutions to najbardziej doświadczony dostawca programów IBM SPSS i szkoleń.
szkolenia-icon3

Autorski program

Szkolenia Predictive Solutions bazują na 25 latach doświadczenia w pracy z danymi ilościowymi.
szkolenia-icon4

Oryginalne materiały

Każdy uczestnik otrzymuje imienny certyfikat i merytoryczne materiały kursowe w języku polskim.
szkolenia-icon5

5000 przeszkolonych osób

Szkolenia o różnym poziomie zawansowania, od kursów z podstaw statystki do szkoleń z data mining.

Współpracują z nami