Datamining — het hergebruiken van beschikbare data
Data mining is het hergebruiken van beschikbare data. Getracht wordt om op een geautomatiseerde manier patronen en relaties te ontdekken in grote hoeveelheden gegevens. De naam komt voort uit de overeenkomsten tussen het zoeken naar waardevolle bedrijfsinformatie en het graven (mining) naar iets waardevols in een grote berg.
Data mining is gebaseerd op statistiek, machine learning, patroonherkenning, database management en geavanceerde computerberekeningen. Het wordt vaak toegepast op een datawarehouse. Het kan nieuwe informatie opleveren, die zonder de techniek niet gevonden zou zijn. Het geautomatiseerd verwerken van grote hoeveelheden persoonsgegevens kan echter stuiten op barrières met betrekking tot privacy, legaliteit en ethiek.
Data mining maakt een onderdeel uit van een meer omvattend proces dat doorgaans wordt aangeduid als business intelligence.
Data mining wordt vaak toegepast op grote hoeveelheden biologische, chemische en medische data. Deze techniek wordt dan met name toegepast op microarray data of proteïnenmicro-array data. Dit zijn onderzoeksgebieden binnen de de bioinformatica.
Data miners kunnen gebruik maken van de volgende technieken:
- Case Based Redeneren : deze benadering gebruikt cases uit het verleden om er bepaalde patronen in te herkennen.
- Neuraal Computing: deze benadering onderzoekt historische data voor het herkennen van bepaalde patronen.
- Intelligente Agenten: hierbij wordt informatie van het internet gehaald en van databases die op intranet gebaseerd zijn.
- Samengaan Analyses: hierbij wordt gebruik gemaakt van gespecialiseerde algoritmen die grote hoeveelheden data uitzoeken en statistische regels voor bepaalde onderdelen uiten.
Een bekend algoritme voor data mining is het a priori algoritme van Rakesh Agrawal et al. Een andere methode is ComPair.
Verschillende applicaties van Data Mining:
- Bij de Detailhandel wordt het gebruikt voor het voorspellen van verkopen, bepalen van correcte voorraadniveaus en distributieschema’s voor winkels.
- Bij Bankieren wordt het gebruikt voor het voorspellen van het niveau van slechte leningen en bedrieglijke creditcardhouders en welke klanten het beste reageren op nieuwe lening aanbiedingen.
- Bij Productie wordt het gebruikt voor het voorspellen van machinedefecten en het vinden van factoren die de optimalisatie van productiecapaciteit beheersen.
- Bij Verzekering wordt het gebruikt voor het voorspellen van de kosten van claims en het voorspellen welke klanten welke verzekeringspolis kopen.
- Bij Politie wordt het gebruikt voor het volgen van patronen, locaties en gedrag in de criminaliteit en het identificeren van attributen die kunnen assisteren bij het oplossen van criminaliteitszaken.
Zie ook
- Text mining
- Weka
Externe links
Categorie: Informatica
Gerelateerde Artikelen
Database — Digitaal archief, doorzoekbaarheid en privacy
Database — Digitaal archief en privacy Een database, gegevensbank of databank is een digitaal opgeslagen archief, ingericht met het oog op flexibele raadpleging …
Posters en Flyers — Download en verspreid
Posters en Flyers — Download en verspreid Heb je ook nog een goed ontwerp, foto of slogan voor op een poster, mail het dan aan Dit emailadres is beveiligd tegen …
DigiD en SMS ter beveiliging van het Elektronisch patiëntendossier
DigiD, SMS en face-to-face controle voor beveiliging van het Elektronisch Patiëntendossier Categorie: Gezondheidszorg Datum: Zondag 14 December 2008 12:57 Om …