|
|
Data Mining
OLAP (On-line Analytical Processing) i Hurtownie Danych to dwie pokrewne technologie. O ile zapytania i raporty do tradycyjnych baz danych pokazują to co aktualnie w nich się znajduje, to OLAP idzie o krok dalej, odpowiadając na pytanie, dlaczego dane są, jakie są. Użytkownik może formułować hipotezę o wpływie relacji poszczególnych czynników na określone zdarzenie jak i weryfikować jej poprawność zadając serię zapytań na danych.
Data Mining różni się od OLAP tym, że zamiast weryfikować poprawność hipotezy, jest stosowany do generowania nowych hipotez.
Hurtownia Danych jest procesem oczyszczania i konsolidowania danych korporacyjnych, jednakże tworzenie Hurtowni Danych nie jest wymogiem w budowie Data Mining. Data Mining może być wykonywane bezpośrednio na bazach transakcyjnych, poprzez przeniesienie ich do bazy danych typu tylko do odczytu (read only).
Data Mining może być zastosowane w celu rozwiązania pięciu typów zadań: klasyfikacja, przewidywanie, szacowanie, klastrowanie i asocjacja. Większość problemów biznesowych może być zgłębionych stosując jedno z tych pięciu zadań, każde z nichmoże być wykonane wykorzystując jeden lub więcej algorytmów Data Mining.
|