Co je dolování dat?

Velké společnosti o vás ví o víc, než jste si vůbec dokázali představit - je to tak

Data mining je analýza velkého množství dat pro objevování vzoru a znalostí. Ve skutečnosti je dolování dat také známé jako zjišťování dat nebo objevování znalostí.

Data mining využívá statistiky, principy strojového učení (ML), umělé inteligence (AI) a obrovské množství dat (často z databází nebo datových souborů), aby identifikovaly vzory způsobem, který je co nejvíce automatizovaný a užitečný.

Co dělá dolování dat?

Dolování dat má dva hlavní cíle: popis a předpověď. Za prvé, dolování dat popisuje poznatky a poznatky získané analýzou vzorků v datech. Za druhé, dolování dat používá popisy rozpoznaných vzorců dat, které předpovídají budoucí vzory.

Pokud jste např. Procházeli čas na webových stránkách pro nákup knih o tom, jak identifikovat různé typy rostlin, služby dolování dat pracující za zákulisí na této webové stránce zaznamenávají popis vašich vyhledávání v souvislosti s vaším profilem. Jakmile se znovu přihlásíte o dva týdny později, služby pro vyhledávání dat na webu používají popisy vašich předchozích vyhledávání, aby předpověděly vaše aktuální zájmy a nabídly osobní doporučení pro nakupování, které obsahují knihy o identifikaci rostlin.

Jak funguje dolování dat

Dolování dat funguje s použitím algoritmů, sady instrukcí, které říkají počítač nebo zpracovávají úkoly, a objevují různé typy vzorků v rámci dat. Několik různých metod rozpoznávání vzorků použitých při dolování dat zahrnuje analýzu clusterů, detekci anomálií, asociační učení, závislosti dat, rozhodovací stromy, regresní modely, klasifikace, odlehčovací detekci a neuronové sítě.

Zatímco dolování dat může být použito k popisu a předpovídání vzorků ve všech různých druzích dat, použití mnoha lidí se nejčastěji setkává, i když si to neuvědomují, je popisovat vzorce ve vašich nákupních volbách a chování, které předpovídají pravděpodobné budoucí nákupy rozhodnutí.

Například jste se někdy zajímali o to, jak se Facebook vždy zdá, že ví, co jste viděli on-line a zobrazuje vám reklamy ve vašem newsfeedu souvisejícím s jinými stránkami, které jste navštívili, nebo s vyhledáváním na webu? Facebook dolování dat využívá informace uložené ve vašem prohlížeči, které sledují vaše aktivity, jako jsou cookies , spolu s vlastními znalostmi o vašich vzorcích na základě vašeho předchozího využití služby Facebooku k odhalení a předvídání produktů či nabídek, které by vás mohly zajímat.

Jaký druh dat lze dolovat?

V závislosti na službě nebo úložišti (fyzické obchody také využívají dolování dat) lze překládat překvapivé množství údajů o vás a vašich modelech. Údaje shromážděné o vás mohou zahrnovat, jaký typ vozidla budete řídit, kde bydlíte, místa, která jste cestovali, časopisy a noviny, na které jste se přihlásili, a zda jste ženatí. Můžete také zjistit, zda máte nebo nemáte děti, jaké jsou vaše koníčky, jaká skupina se vám líbí, vaše politické sklony, to, co nakupujete online, co nakupujete ve fyzických obchodech (často prostřednictvím karet pro odměnu zákazníků) a veškeré podrobnosti, které sdílíte o svém životě na sociálních médiích.

Například maloobchodníci a módní publikace zaměřené na teenagery používají pohledy z fotografií pro dolování dat v sociálních mediálních službách, jako je Instagram a Facebook, aby předpověděli módní trendy, které přilákají nakupujícím nebo čtenářům. Nálezy zjištěné prostřednictvím dolování dat mohou být tak přesné, že někteří obchodníci mohou dokonce předvídat, zda žena může být těhotná, na základě velmi specifických změn v jejích nákupních volbách. Prodejce Target je údajně tak přesný, když předpovídá těhotenství založené na vzorcích v nákupu historie, že posílá kupony na dětské výrobky mladé dámce, a rozdává své těhotenské tajemství předtím, než jí řekla její rodinu.

Data mining je všude, ale většinu informací zjištěných a analyzovaných o našich nákupních návycích, osobních preferencích, volbách, financích a on-line aktivitách využívají obchody a služby s cílem zvýšit zážitky zákazníků.