Centrum Szkoleniowe SPSS
///
DM 1 - Metodologia prowadzenia projektów, przygotowanie danych i wprowadzenie do modelowania.
Cel kursu
Przeznaczeniem kursu jest wprowadzenie uczestników w obszar analiz data miningowych realizowanych za pomocą PS CLEMENTINE (w tym IBM SPSS Modeler). Jak pokazuje praktyka, praca na danych z wielu źródeł, takich jak: pliki płaskie, bazy danych, czy centralne hurtownie danych wymaga nie tylko sprawnych narzędzi, ale także analityków, którzy potrafią wykorzystać ich potencjał. Łatwe w obsłudze narzędzie, graficzny interfejs i pełna paleta algorytmów predykcyjnych ułatwiają i przyśpieszają pracę. Poprawne pobieranie, łączenie i weryfikacja jakości danych, są kluczowe dla użyteczności kolejnych analiz. Szkolenie ma na celu skrócenie czasu, który wymagany jest do efektywnego wykorzystania jednego z najbardziej znanych na świecie narzędzi do analiz data mining IBM SPSS Modeler. W ramach kursu, uczestnicy zdobędą umiejętności poprawnego zarządzania danymi i przygotowania ich do analiz. Omówione zostaną również najczęściej wykorzystywane techniki modelowania predykcyjnego.
Profil uczestnika
Szkolenie adresowane jest do osób, które zaczynają pracę z dużymi i rozproszonymi zbiorami danych, oraz doświadczonych data scientistów, którzy zdobyte doświadczenie chcą wykorzystać w pracy przy wykorzystaniu PS CLEMENTINE PRO/ IBM SPSS Modeler.
Umiejętności zdobywane podczas kursu
- Podstawy teoretyczne z zakresu drążenia danych
- Realizacja projektów w oparciu o metodologię CRISP DM
- Podstawy obsługi oprogramowania PS CLEMENTINE PRO / IBM SPSS Modeler
- Praktyczne wykorzystanie technik drążenia w określonych zastosowaniach
Program zajęć
- Wprowadzenie do data mining
- Podstawowe informacje dotyczące PS CLEMENTINE PRO / IBM SPSS Modeler
- Pobieranie i integracja danych:
- pobieranie danych z baz danych, plików tekstowych i innych formatów (SPSS, Excel itp.),
- łączenie danych poprzez dodawanie rekordów lub kolumn,
- współpraca z bazami danych (SQL pushback, SQL optimization, In-Database Mining),
- praca z metadanymi.
- Weryfikacja jakości danych.
- braki danych, wartości niepoprawne i nietypowe – wprowadzenie,
- poszukiwanie braków danych i metody ich poprawy,
- identyfikacja wartości niepoprawnych,
- poszukiwanie wartości nietypowych – analiza rozkładów zmiennych.
- Przygotowanie danych:
- podstawy języka skryptowego,
- operacje na rekordach,
- operacje na cechach,
- wyliczanie nowych wartości,
- automatyzacja operacji na danych.
- Badanie zależności pomiędzy zmiennymi:
- Omówienie dostępnych technik modelowania oraz zasad i sposobów ich wykorzystania.
- przykłady analiz koszykowych z wykorzystaniem algorytmów indukcji reguł,
- przykłady budowy modeli klasyfikacyjnych z wykorzystaniem sieci neuronowych,
- omówienie innych podjeść do modelowania i stosowanych algorytmów.
- Porównywanie jakości modeli predykcyjnych:
- ocena dobroci dopasowania modelu,
- wykresy ewaluacyjne.
- Omówienie różnych podejść przy wdrażaniu modeli do procesu produkcyjnego.
Forma pracy
Autorski program szkoleniowy Predictive Solutions, bazujący na 25 latach doświadczenia pracy z danymi ilościowymi.
Dostarczamy oryginalne podręczniki wydane przez nasze wydawnictwo i materiały kursowe przygotowane przez ekspertów Predictive Solutions.
Kursanci otrzymują imienne certyfikaty uczestnictwa.
Kursy standardowe prowadzone są tylko w formie zdalnej ze względu na sytuację epidemiczną.
Wszystkie szkolenia odbywają się na praktycznych use case’ach w formie warsztatów przy użyciu komputerów.
Szkolenie trwa 16 godzin lekcyjnych (2 dni po 8 godzin)
Polecane kursy uzupełniające
Dla zainteresowanych pogłębieniem wiedzy z zakresu przygotowania danych i tworzenia danych analitycznych:
Dla zainteresowanych budową modeli klasyfikacyjnych typujących klientów do kampanii marketingowych:
Porozmawiaj o szkoleniach
Zadzwoń: 797 727 090