-
Tareas de data mining
-
Reglas de Asociación y Patrones Sequenciales.
- Especialmente usadas en Minería de uso y de contenidos.
- Encuentras patrones de compra y perfiles de comportamiento.
-
Algoritmos
- Apriori
- FPGrowth
- EquipAsso
-
Aprendizaje Supervisado (Clasificación).
- Ampliamente usada en data y web mining.
-
Usa conjuntos previos para construir modelos y luego aplicarlos a nuevos datos
- Conjunto de entrenamiento.
- Conjunto de prueba
-
Algoritmos
- Arboles de decisión (C4.5)
- Redes Bayesianas
- Clasificación Basada en Asociación.
-
Aprendizaje No Supervisado (Clustering).
- Organiza los datos en grupos o clusters.
- No necesita entrenamiento previo.
-
Algoritmos
- K-means
- Aprendizaje parcialmente superversido.
-
Web mining
-
Recuperación de Información y Búsqueda Web.
- Se fundamenta en IR
- Encontrar información dentro de extensas colecciones de documentos.
- Debido a las características especiales de la web, las búsquedas web implementan el IR en otro nivel.
- Un factor clave es el tiempo de respuesta.
-
Minería de estructura.
-
Link Analisys.
- Estudia la estructura de los enlaces.
- Algoritmos PageRank y HITS
- Conformación de comunidades en la web.
-
Web Crawling.
- Agentes autonomos que recorren la web en busca de información
- Primer paso para la indexación y busqueda web.
- Existen crawlers universales y crawlers temáticos.
-
Minería de contenido.
-
Extracción de datos estructurados.
-
Muchas páginas usan información estructurada.
- HTML
- XML
- Usan técnicas de aprendizaje supervizado y no supervizado.
-
Integración de la información.
- Debido a la hetereogeneidad de la web se requiere integrar la información.
- Introducción a la Web Semántica.
-
Minería de opinión.
-
Aunque existen muchas páginas estructuradas hay mucha info en texto plano.
- Blogs
- Foros
- Emails
- Introducción a la minería de textos.
-
Minería de uso.
-
Estudia los clicks del usuario y su aplicación.
- E-Commerce
- Business Intelligence
-
Captura y modela
- Patrones de comportamiento
- Perfiles de usuario
-
Aprende de dichos modelos para
- Entender como diferentes segmentos de usuarios recorren un sitio.
- Mejorar la forma y estructura de un sitio.
- Hacer recomendaciones dinámicas de productos y servicios.