{"id":1410,"date":"2019-02-19T08:10:33","date_gmt":"2019-02-19T08:10:33","guid":{"rendered":"https:\/\/lisdatasolutions.sidnpre.com\/2019\/02\/19\/que-es-el-data-mining\/"},"modified":"2022-08-01T15:39:33","modified_gmt":"2022-08-01T15:39:33","slug":"que-es-el-data-mining","status":"publish","type":"post","link":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/","title":{"rendered":"\u00bfQu\u00e9 es el Data Mining?"},"content":{"rendered":"<p><strong>El Data Mining,<\/strong> tambi\u00e9n conocido como miner\u00eda de datos, <strong>se encarga de descubrir patrones en un conjunto de datos.<\/strong> Para alcanzar este objetivo se aplican t\u00e9cnicas de aprendizaje autom\u00e1tico y de inteligencia artificial. Una de las principales funcionalidades que se buscan en estas t\u00e9cnicas es conseguir tratar la informaci\u00f3n en bruto para dejarla preparada de forma que la informaci\u00f3n quede accesible y lista para ser utilizada por otros sistemas o para ser interpretada por usuarios finales.<\/p>\n<p><strong style=\"font-family: inherit; font-size: 30px; font-style: inherit;\">\u00bfQu\u00e9 t\u00e9cnicas se usan en el <a href=\"https:\/\/www.lisdatasolutions.com\/es\/consultoria-data-science\/\">Data Mining<\/a>?<\/strong><\/p>\n<p>Entre las t\u00e9cnicas utilizadas nos encontramos con<strong> t\u00e9cnicas de clustering<\/strong> como puede ser:<\/p>\n<ul>\n<li>K-means o K-NN<\/li>\n<li>Reducci\u00f3n de variables mediante la t\u00e9cnica de PCA<\/li>\n<li>Clasificaci\u00f3n por par\u00e1metros mediante \u00e1rboles de decisi\u00f3n<\/li>\n<li>Detecci\u00f3n de anomal\u00edas mediante herramientas matem\u00e1ticas como t-statistics<\/li>\n<li>etc.<\/li>\n<\/ul>\n<p><strong>Mediante clustering seremos capaces de agrupar los datos por caracter\u00edsticas comunes<\/strong>, es decir, podremos generar tantos grupos como queramos. Los elementos que est\u00e9n en un mismo grupo mostrar\u00e1n caracter\u00edsticas o patrones comunes.<\/p>\n<p>Gracias a la reducci\u00f3n de variables podremos pasar de problemas complejos a nivel computacional a problemas computacionalmente resolubles.<strong> La idea de esta t\u00e9cnica es quedarse con las variables que realmente aporten informaci\u00f3n al conjunto de datos<\/strong> bas\u00e1ndose en los conocimientos de \u00e1lgebra lineal.<\/p>\n<p>Los \u00e1rboles de decisi\u00f3n son diagramas de construcciones l\u00f3gicas, basados en reglas, que sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva. De esta forma se puede clasificar el conjunto de datos estudiado.<\/p>\n<p>Si bien es cierto que, aunque hemos nombrado estas t\u00e9cnicas, existen muchas otras que se aplican en este tipo de anal\u00edtica avanzada de datos.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_55 counter-hierarchy ez-toc-counter ez-toc-grey ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title \" >Tabla de contenidos<\/p>\n<span class=\"ez-toc-title-toggle\"><a href=\"#\" class=\"ez-toc-pull-right ez-toc-btn ez-toc-btn-xs ez-toc-btn-default ez-toc-toggle\" aria-label=\"Toggle Table of Content\" role=\"button\"><label for=\"item-69e079c0e6198\" ><span class=\"\"><span style=\"display:none;\">Toggle<\/span><span class=\"ez-toc-icon-toggle-span\"><svg style=\"fill: #999;color:#999\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" class=\"list-377408\" width=\"20px\" height=\"20px\" viewBox=\"0 0 24 24\" fill=\"none\"><path d=\"M6 6H4v2h2V6zm14 0H8v2h12V6zM4 11h2v2H4v-2zm16 0H8v2h12v-2zM4 16h2v2H4v-2zm16 0H8v2h12v-2z\" fill=\"currentColor\"><\/path><\/svg><svg style=\"fill: #999;color:#999\" class=\"arrow-unsorted-368013\" xmlns=\"http:\/\/www.w3.org\/2000\/svg\" width=\"10px\" height=\"10px\" viewBox=\"0 0 24 24\" version=\"1.2\" baseProfile=\"tiny\"><path d=\"M18.2 9.3l-6.2-6.3-6.2 6.3c-.2.2-.3.4-.3.7s.1.5.3.7c.2.2.4.3.7.3h11c.3 0 .5-.1.7-.3.2-.2.3-.5.3-.7s-.1-.5-.3-.7zM5.8 14.7l6.2 6.3 6.2-6.3c.2-.2.3-.5.3-.7s-.1-.5-.3-.7c-.2-.2-.4-.3-.7-.3h-11c-.3 0-.5.1-.7.3-.2.2-.3.5-.3.7s.1.5.3.7z\"\/><\/svg><\/span><\/span><\/label><input aria-label=\"Toggle\" aria-label=\"item-69e079c0e6198\"  type=\"checkbox\" id=\"item-69e079c0e6198\"><\/a><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/#Proceso_a_seguir_en_Data_Mining\" title=\"Proceso a seguir en Data Mining\">Proceso a seguir en Data Mining<\/a><\/li><li class='ez-toc-page-1 ez-toc-heading-level-2'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/#%C2%BFPara_que_sirve_el_Data_Mining\" title=\"\u00bfPara qu\u00e9 sirve el Data Mining?\">\u00bfPara qu\u00e9 sirve el Data Mining?<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Proceso_a_seguir_en_Data_Mining\"><\/span><strong>Proceso a seguir en Data Mining<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p><img src=\"https:\/\/www.lisdatasolutions.com\/wp-content\/uploads\/2019\/02\/que_es_mineria_de_datos-1024x575.jpg\" alt=\"Qu\u00e9 es el Data Mining\" width=\"1024\" height=\"575\" \/><\/p>\n<p>Para finalizar un proyecto de data mining con \u00e9xito, es recomendable seguir un gui\u00f3n.<\/p>\n<p>Veamos un ejemplo de procedimiento:<\/p>\n<ul>\n<li><u>Seleccionar el conjunto de datos:<\/u> este conjunto de datos se debe seleccionar de acuerdo con el objetivo fijado y a las variables que tengamos disponibles.<\/li>\n<li><u>An\u00e1lisis del conjunto de datos:<\/u> antes de comenzar, es importante saber a qu\u00e9 datos nos enfrentamos y c\u00f3mo est\u00e1n distribuidos. Por ello, los histogramas y los valores an\u00f3malos ser\u00e1n un buen inicio para conocer nuestros datos.<\/li>\n<li><u>Procesamiento de los datos:<\/u> prepararemos los datos de forma que estos se adapten a las necesidades del algoritmo que se vaya a utilizar.<\/li>\n<li><u>Aplicaci\u00f3n del algoritmo de miner\u00eda de datos:<\/u> tras estudiar el problema, procederemos a aplicar la t\u00e9cnica que mejor se adapte a nuestro problema y a nuestros datos.<\/li>\n<li><u>Obtenci\u00f3n del conocimiento:<\/u> tras la aplicaci\u00f3n del algoritmo seleccionado, obtendremos el resultado. El resultado puede proceder de un algoritmo o de varios, seg\u00fan la complejidad del problema y de la complejidad que queremos dotar a la soluci\u00f3n. Utilizar m\u00e1s o menos algoritmos no mejorar\u00e1 el resultado final. Para un resultado \u00f3ptimo debemos escoger el conjunto de algoritmos que mejor se adapte tanto al problema como a los datos.<\/li>\n<li><u>Evaluaci\u00f3n del resultado final:<\/u> tras obtener los modelos en el paso previo, tendremos que interpretar los resultados obtenidos. Es importante verificar la validez de los resultados finales. De este punto depende que todos los anteriores cobren sentido.<\/li>\n<\/ul>\n<h2><span class=\"ez-toc-section\" id=\"%C2%BFPara_que_sirve_el_Data_Mining\"><\/span><strong>\u00bfPara qu\u00e9 sirve el Data Mining?<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Antes de comenzar el estudio de los datos, tenemos que fijar bien los objetivos que queremos alcanzar. Por eso, es importante saber qu\u00e9 podemos conseguir gracias a la miner\u00eda de datos.<\/p>\n<p>Por ejemplo, en una compa\u00f1\u00eda de telefon\u00eda podemos, mediante un \u00e1rbol de decisi\u00f3n, clasificar los clientes que se han ido de la empresa.<\/p>\n<p>Si estamos ante una empresa que se dedica al suministro de energ\u00eda, podremos realizar, en funci\u00f3n del consumo, una clusterizaci\u00f3n de clientes para segmentarlos. Con ello, conseguiremos generar un prototipo de cliente y cu\u00e1l es su segmento de consumo.<\/p>\n<p>Gracias a estos dos ejemplos, podr\u00edamos enfocar nuestras campa\u00f1as de marketing a un p\u00fablico muy concreto, fij\u00e1ndonos en qu\u00e9 grupo nos da m\u00e1s rentabilidad y por ello enfocando todos nuestros esfuerzos en un p\u00fablico muy concreto. Al conocer a nuestro p\u00fablico objetivo, conoceremos aproximadamente sus gustos y su forma de vida por lo que incidir en \u00e9l ser\u00e1 m\u00e1s sencillo mediante una buena estrategia de marketing.<\/p>\n<p>\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on facebook<br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on google<br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on twitter<br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on linkedin<br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on pinterest<br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on print<br \/>\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\tShare on email<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El Data Mining, tambi\u00e9n conocido como miner\u00eda de datos, se encarga de descubrir patrones en un conjunto de datos. Para alcanzar este objetivo se aplican t\u00e9cnicas de aprendizaje autom\u00e1tico y de inteligencia artificial. Una de las principales funcionalidades que se buscan en estas t\u00e9cnicas es conseguir tratar la informaci\u00f3n en bruto para dejarla preparada de [&hellip;]<\/p>\n","protected":false},"author":21,"featured_media":1411,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"inline_featured_image":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0},"categories":[111,34],"tags":[],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v20.1 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>\u00bfQu\u00e9 es el Data Mining? | LIS Data Solutions<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/\" \/>\n<meta property=\"og:locale\" content=\"es_ES\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"\u00bfQu\u00e9 es el Data Mining? | LIS Data Solutions\" \/>\n<meta property=\"og:description\" content=\"El Data Mining, tambi\u00e9n conocido como miner\u00eda de datos, se encarga de descubrir patrones en un conjunto de datos. Para alcanzar este objetivo se aplican t\u00e9cnicas de aprendizaje autom\u00e1tico y de inteligencia artificial. Una de las principales funcionalidades que se buscan en estas t\u00e9cnicas es conseguir tratar la informaci\u00f3n en bruto para dejarla preparada de [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/\" \/>\n<meta property=\"og:site_name\" content=\"LIS Data Solutions\" \/>\n<meta property=\"article:published_time\" content=\"2019-02-19T08:10:33+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-08-01T15:39:33+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.lisdatasolutions.com\/wp-content\/uploads\/2022\/07\/que_es_el_data_mining.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1200\" \/>\n\t<meta property=\"og:image:height\" content=\"627\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Natalia Andueza\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Escrito por\" \/>\n\t<meta name=\"twitter:data1\" content=\"Natalia Andueza\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tiempo de lectura\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minutos\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/\",\"url\":\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/\",\"name\":\"\u00bfQu\u00e9 es el Data Mining? | LIS Data Solutions\",\"isPartOf\":{\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/#website\"},\"datePublished\":\"2019-02-19T08:10:33+00:00\",\"dateModified\":\"2022-08-01T15:39:33+00:00\",\"author\":{\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/#\/schema\/person\/b2748ac1971664b77f38389a77eb1fc7\"},\"breadcrumb\":{\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/#breadcrumb\"},\"inLanguage\":\"es\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"https:\/\/www.lisdatasolutions.com\/es\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"\u00bfQu\u00e9 es el Data Mining?\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/#website\",\"url\":\"https:\/\/www.lisdatasolutions.com\/es\/\",\"name\":\"LIS Data Solutions\",\"description\":\"\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.lisdatasolutions.com\/es\/?s={search_term_string}\"},\"query-input\":\"required name=search_term_string\"}],\"inLanguage\":\"es\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/#\/schema\/person\/b2748ac1971664b77f38389a77eb1fc7\",\"name\":\"Natalia Andueza\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"es\",\"@id\":\"https:\/\/www.lisdatasolutions.com\/es\/#\/schema\/person\/image\/\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/67d34db2d9aca971aeec85ef05923c86?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/67d34db2d9aca971aeec85ef05923c86?s=96&d=mm&r=g\",\"caption\":\"Natalia Andueza\"}}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"\u00bfQu\u00e9 es el Data Mining? | LIS Data Solutions","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/","og_locale":"es_ES","og_type":"article","og_title":"\u00bfQu\u00e9 es el Data Mining? | LIS Data Solutions","og_description":"El Data Mining, tambi\u00e9n conocido como miner\u00eda de datos, se encarga de descubrir patrones en un conjunto de datos. Para alcanzar este objetivo se aplican t\u00e9cnicas de aprendizaje autom\u00e1tico y de inteligencia artificial. Una de las principales funcionalidades que se buscan en estas t\u00e9cnicas es conseguir tratar la informaci\u00f3n en bruto para dejarla preparada de [&hellip;]","og_url":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/","og_site_name":"LIS Data Solutions","article_published_time":"2019-02-19T08:10:33+00:00","article_modified_time":"2022-08-01T15:39:33+00:00","og_image":[{"width":1200,"height":627,"url":"https:\/\/www.lisdatasolutions.com\/wp-content\/uploads\/2022\/07\/que_es_el_data_mining.png","type":"image\/png"}],"author":"Natalia Andueza","twitter_card":"summary_large_image","twitter_misc":{"Escrito por":"Natalia Andueza","Tiempo de lectura":"4 minutos"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/","url":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/","name":"\u00bfQu\u00e9 es el Data Mining? | LIS Data Solutions","isPartOf":{"@id":"https:\/\/www.lisdatasolutions.com\/es\/#website"},"datePublished":"2019-02-19T08:10:33+00:00","dateModified":"2022-08-01T15:39:33+00:00","author":{"@id":"https:\/\/www.lisdatasolutions.com\/es\/#\/schema\/person\/b2748ac1971664b77f38389a77eb1fc7"},"breadcrumb":{"@id":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/#breadcrumb"},"inLanguage":"es","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.lisdatasolutions.com\/es\/blog\/que-es-el-data-mining\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"https:\/\/www.lisdatasolutions.com\/es\/"},{"@type":"ListItem","position":2,"name":"\u00bfQu\u00e9 es el Data Mining?"}]},{"@type":"WebSite","@id":"https:\/\/www.lisdatasolutions.com\/es\/#website","url":"https:\/\/www.lisdatasolutions.com\/es\/","name":"LIS Data Solutions","description":"","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.lisdatasolutions.com\/es\/?s={search_term_string}"},"query-input":"required name=search_term_string"}],"inLanguage":"es"},{"@type":"Person","@id":"https:\/\/www.lisdatasolutions.com\/es\/#\/schema\/person\/b2748ac1971664b77f38389a77eb1fc7","name":"Natalia Andueza","image":{"@type":"ImageObject","inLanguage":"es","@id":"https:\/\/www.lisdatasolutions.com\/es\/#\/schema\/person\/image\/","url":"https:\/\/secure.gravatar.com\/avatar\/67d34db2d9aca971aeec85ef05923c86?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/67d34db2d9aca971aeec85ef05923c86?s=96&d=mm&r=g","caption":"Natalia Andueza"}}]}},"_links":{"self":[{"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/posts\/1410"}],"collection":[{"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/users\/21"}],"replies":[{"embeddable":true,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/comments?post=1410"}],"version-history":[{"count":1,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/posts\/1410\/revisions"}],"predecessor-version":[{"id":3826,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/posts\/1410\/revisions\/3826"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/media\/1411"}],"wp:attachment":[{"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/media?parent=1410"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/categories?post=1410"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.lisdatasolutions.com\/es\/wp-json\/wp\/v2\/tags?post=1410"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}