Data Mining a OLAP
Zarówno eksploracja danych, jak i OLAP to dwie popularne technologie Business Intelligence (BI). Business Intelligence odnosi się do komputerowych metod identyfikacji i wydobywania przydatnych informacji z danych biznesowych. Eksploracja danych to dziedzina informatyki, która zajmuje się wydobywaniem interesujących wzorców z dużych zbiorów danych. Łączy w sobie wiele metod z zakresu sztucznej inteligencji, statystyki i zarządzania bazami danych. OLAP (przetwarzanie analityczne online), jak sama nazwa wskazuje, jest kompilacją sposobów przeszukiwania wielowymiarowych baz danych.
Eksploracja danych jest również znana jako odkrywanie wiedzy w danych (KDD). Jak wspomniano powyżej, jest to dziedzina informatyki, która zajmuje się wydobywaniem nieznanych wcześniej i interesujących informacji z surowych danych. Ze względu na wykładniczy wzrost ilości danych, szczególnie w obszarach takich jak biznes, eksploracja danych stała się bardzo ważnym narzędziem do przekształcania tego ogromnego bogactwa danych w analizę biznesową, ponieważ ręczne wydobywanie wzorców stało się pozornie niemożliwe w ciągu ostatnich kilku dekad. Na przykład jest obecnie używany do różnych zastosowań, takich jak analiza sieci społecznościowych, wykrywanie oszustw i marketing. Eksploracja danych zwykle obejmuje cztery następujące zadania: grupowanie, klasyfikacja, regresja i asocjacja. Grupowanie to identyfikacja podobnych grup na podstawie nieustrukturyzowanych danych. Klasyfikacja to uczenie się reguł, które można zastosować do nowych danych i zazwyczaj obejmuje następujące kroki: wstępne przetwarzanie danych, projektowanie modelowania, uczenie się / wybór funkcji oraz ocena / walidacja. Regresja to znajdowanie funkcji z minimalnym błędem w modelowaniu danych. A asocjacja szuka relacji między zmiennymi. Eksploracja danych jest zwykle wykorzystywana do odpowiadania na pytania, takie jak główne produkty, które mogą pomóc w uzyskaniu wysokiego zysku w przyszłym roku w Wal-Mart. Eksploracja danych jest zwykle wykorzystywana do odpowiadania na pytania, takie jak główne produkty, które mogą pomóc w uzyskaniu wysokiego zysku w przyszłym roku w Wal-Mart. Eksploracja danych jest zwykle wykorzystywana do odpowiadania na pytania, takie jak główne produkty, które mogą pomóc w uzyskaniu wysokiego zysku w przyszłym roku w Wal-Mart.
OLAP to klasa systemów, które dostarczają odpowiedzi na wielowymiarowe zapytania. Zwykle OLAP jest używany do marketingu, budżetowania, prognozowania i podobnych zastosowań. Jest rzeczą oczywistą, że bazy danych używane dla OLAP są konfigurowane pod kątem złożonych i ad-hoc zapytań z myślą o szybkiej wydajności. Zwykle do wyświetlania danych wyjściowych OLAP używana jest macierz. Wiersze i kolumny są tworzone według wymiarów zapytania. Często używają metod agregacji w wielu tabelach, aby uzyskać podsumowania. Na przykład można go wykorzystać, aby dowiedzieć się o tegorocznej sprzedaży w Wal-Mart w porównaniu do zeszłego roku? Jakie są prognozy sprzedaży w następnym kwartale? Co można powiedzieć o trendzie, patrząc na zmianę procentową?
Chociaż jest oczywiste, że eksploracja danych i OLAP są podobne, ponieważ działają na danych w celu uzyskania informacji, główna różnica wynika ze sposobu, w jaki działają na danych. Narzędzia OLAP zapewniają wielowymiarową analizę danych i podsumowania danych, ale w przeciwieństwie do eksploracji danych skupia się na współczynnikach, wzorcach i wpływach na zbiór danych. To jest umowa OLAP z agregacją, która sprowadza się do obsługi danych poprzez „dodawanie”, ale eksploracja danych odpowiada „dzieleniu”. Inną zauważalną różnicą jest to, że podczas gdy narzędzia do eksploracji danych modelują dane i zwracają przydatne reguły, OLAP będzie przeprowadzać techniki porównywania i kontrastowania w wymiarze biznesowym w czasie rzeczywistym.