IBM SPSS Statistics
///
Analiza danych
IBM SPSS Statistics pozwala na prowadzenie analiz, które mają na celu opis statystyczny, wyjaśnienie zjawisk czy predykcję.
Opis statystyczny
Opis statystyczny danych, w tym prezentacja rozkładów częstości, obliczenie statystyk opisowych, współczynników korelacji pomiędzy zmiennymi itp.Dostępne statystyki opisowe to m.in. miary tendencji centralnej, rozproszenia, statystyki dotyczące rozkładu zmiennych takie jak: skośność i kurtoza. Wstępna eksploracja danych wspomagana jest prezentacją graficzną, która umożliwia np. wykrycie przypadków odstających.
Program umożliwia badanie korelacji pomiędzy zmiennymi ilościowymi za pomocą współczynników korelacji, takich jak współczynnik r Pearsona. Aby analizować siłę związku pomiędzy zmiennymi nominalnymi i porządkowymi, można wykorzystać tabele krzyżowe i dostępne miary siły związku, np. V-Cramera.
Testowanie hipotez statystycznych
Testy parametryczne i nieparametryczne wykorzystywane do testowania istotności dla różnych układów zmiennych w próbach.W programie dostępne są testy parametryczne, takie jak test t Studenta dla jednej próby, jak i prób zależnych i niezależnych oraz szereg testów nieparametrycznych takich jak np.: Chi-kwadrat, U Manna-Whitneya, Kołmogorowa-Smirnowa, McNemara, Kendalla.
W przypadku testów nieparametrycznych program umożliwia automatyczny dobór testów odpowiednich do danych. Wyniki, obok wartości statystyk, prezentują także różnego typu wykresy diagnostyczne.
Predykcja
Szeroka gama analiz predykcyjnych, które umożliwiają przewidywanie wartości zmiennej zależnej na podstawie zestawu zmiennych niezależnych.W programie znajdują się algorytmy analiz predykcyjnych dostosowane do każdego rodzaju danych. Do najpopularniejszych należą modele regresji liniowej i logistycznej, ale w programie znajduje się także model regresji porządkowej, nieliniowej, regresji Coxa, regresji dla danych jakościowych i wiele innych.
Możliwe jest też określenie własnej kombinacji rozkładu i funkcji wiążącej. Program umożliwia także prognozowanie szeregów czasowych.
Klasyfikacja i grupowanie
Algorytmy do grupowania obserwacji w oparciu o podobieństwo dla zadanego zestawu zmiennych i do ich klasyfikacji, gdy istnieje jakościowa zmienna zależna.Program oferuje szereg technik analitycznych, pozwalających na grupowanie podobnych obserwacji. Są to: hierarchiczna analiza skupień, analiza skupień metodą k-średnich, dwustopniowe grupowanie, analiza najbliższego sąsiedztwa.
Jeśli celem analizy jest klasyfikacja nowych obserwacji do istniejących już grup, warto wykorzystać drzewa klasyfikacyjne, wykonać analizę dyskryminacyjną lub użyć sieci neuronowych.
Redukcja wymiarów
Techniki redukcji wymiarów pozwalające na identyfikację tzw. zmiennych ukrytych, wykorzystywanych do wyjaśniania wzorów korelacji w grupie zmiennych.Do technik redukcji danych dostępnych w programie należą: analiza czynnikowa, analiza głównych składowych, prosta i wielowymiarowa analiza korespondencji i inne. Techniki te umożliwiają graficzną prezentację wyników na mapach percepcyjnych i wykorzystywane są np. do pozycjonowania produktów.