Eksploracja danych

Co to jest wyszukiwanie danych:

Eksploracja danych to angielski termin związany z informatyką, którego tłumaczeniem jest eksploracja danych . Składa się z funkcjonalności, która agreguje i porządkuje dane, znajdując w nich odpowiednie wzorce, skojarzenia, zmiany i anomalie .

Termin eksploracja danych pojawił się po raz pierwszy w 1990 r. W społecznościach baz danych. Eksploracja danych to krok analizy procesu znany jako KDD ( Knowledge Discovery in Databases ), którego dosłowne tłumaczenie to „Knowledge Discovery in Databases”.

Eksplorację danych można podzielić na kilka podstawowych kroków: eksploracja, budowanie modelu, definicja wzoru oraz walidacja i weryfikacja.

Eksploracja danych jest stosunkowo niedawną praktyką w świecie informatyki i wykorzystuje wyszukiwanie informacji, sztuczną inteligencję, rozpoznawanie wzorców i techniki statystyczne do poszukiwania korelacji między różnymi danymi, które umożliwiają uzyskanie korzystnej wiedzy dla firmy lub osoby. Dla firmy eksploracja danych może być ważnym narzędziem zwiększającym innowacyjność i rentowność.

Wykorzystanie eksploracji danych jest dość powszechne w dużych bazach danych, a końcowy efekt ich wykorzystania może być wyświetlany za pomocą reguł, hipotez, drzew decyzyjnych, dendrogramów itp.

Dobrze wykonane eksplorowanie danych powinno wykonywać takie zadania, jak: wykrywanie anomalii, uczenie się reguł asocjacyjnych (modelowanie zależności), grupowanie, klasyfikacja, regresja i podsumowanie. Proces eksploracji danych zwykle odbywa się przy użyciu danych zawartych w hurtowni danych .

Istnieje kilka firm i oprogramowania, które zajmują się eksploracją danych, ponieważ identyfikacja wzorców w bazach danych ma coraz większe znaczenie. Jednak identyfikacja odpowiednich standardów nie jest unikalna dla świata komputerów. Ludzki mózg wykorzystuje podobny proces do identyfikacji wzorców i zdobywania wiedzy.

W ostatnich latach eksploracja danych była szeroko stosowana w dziedzinach nauki i inżynierii, takich jak bioinformatyka, genetyka, medycyna, edukacja i elektrotechnika.

Koncepcja eksploracji danych jest często związana z wydobywaniem informacji o zachowaniu ludzi. Z tego powodu w niektórych sytuacjach eksploracja danych rodzi problemy prawne i kwestie związane z prywatnością i etyką. Mimo to wiele osób twierdzi, że eksploracja danych jest etycznie neutralna, ponieważ nie ma implikacji etycznych.

Przykłady wyszukiwania danych rzeczywistych

Eksploracja danych jest często wykorzystywana przez firmy i organizacje do zdobywania wiedzy o użytkownikach / pracownikach / klientach. Na przykład w sektorze publicznym możliwe jest sprawdzenie stanu cywilnego pracownika i wynagrodzenia, które zarabia, aby sprawdzić, czy ma to wpływ na jego życie małżeńskie.

Firmy takie jak sieci supermarketów mogą wykorzystywać te dane krzyżowe do określania produktów, które są kupowane razem. Jeśli klient kupujący produkt X kupuje również produkt Y, dobrym pomysłem może być umieszczenie dwóch produktów w pobliżu, aby ułatwić klientom zakup.