Miner铆a de Datos

SIGLA

: INP3430

CAR脕CTER

: OPTATIVO

CR脡DITOS

: 10

PROFESOR

: Denis Parra

MODULOS

: 2

 

I. DESCRIPCI脫N

 

El objetivo de este curso es proporcionar al alumno elementos que le permitan entender las principales teor铆as y pr谩cticas de la emergente 谩rea de Miner铆a de Datos. Al final del curso el alumno deber谩 tener un conocimiento te贸rico y pr谩ctico de las principales t茅cnicas utilizadas actualmente en la creaci贸n de programas capaces de extraer conocimiento relevante desde bases de datos y conocer algunas de las principales aplicaciones donde en la actualidad este tipo de t茅cnicas est谩n teniendo una amplia aceptaci贸n, comprendiendo sus potencialidades y limitaciones. 

 

 

II. OBJETIVOS 

  • Aprender t茅cnicas de clustering para procesamiento de informaci贸n
  • Comprender y aplicar algoritmos de clasificaci贸n
  • Aplicar reglas de asociaci贸n

 

III. CONTENIDOS 

 

  • Introducci贸n El concepto y proceso de Miner铆a de Datos, tipos de problemas en que la Miner铆a de Datos es relevante.
  • Data Warehouse y OLAP
    • Arquitecturas
    • implementaciones
    • aplicaciones en Miner铆a de Datos. 
  • Preparaci贸n de la informaci贸n 
    • Datos ruidosos, 
    • datos faltantes, 
    • reducci贸n de la dimensionalidad y transformaciones, integraci贸n e inconsistencias. 
  • Reducci贸n de la Informaci贸n
    • An谩lisis de las Componentes principales
  • Reglas de asociaci贸n
    • Algoritmo Apriori
  • Clasificaci贸n
    • 脕rboles de Decisi贸n
    • NaiveBayes
    • Razonamiento en Base a casos. 
  • Clustering y medidas de similaridad en distintos tipos de datos. 
    • Clustering particional: K-Means, Mean Shift.
    • Medidas de similaridad para distintos tipos de datos. 
    • Clustering aglomerativo. 

 

  • Selecci贸n de Modelos (Hold Out, Cross Validation.). 
  • Conceptos B谩sicos en Miner铆a de Texto. 

 

IV. METODOLOG脥A

  • Clases expositivas
  • Actividades en clases
  • Trabajos grupales

 

V. EVALUACI脫N 

  • Tareas
  • Controles
  • Trabajo final

 

VI. BIBLIOGRAF脥A 

 

  • Data Mining: Practical Machine Learning Tools and Techniques, Ian H. Witten, Eibe Frank 
  • Data Mining: Concepts and Techniques, Jiawei Han and Micheline Kamber. 
  • Machine Learning, Tom M. Mitchell 
  • Kimball, R. 鈥漈he data warehouse toolkit : the complete guide to dimensional modeling鈥, John Wiley and Sons, 2002. 
  • Inmon, W.H., 鈥滲uilding the DataWarehouse鈥, John Wiley and Sons; 3th edition, 2002. 
  • T. Hastie, R. Tibshirani, and J. Friedman, 鈥漈he Elements of Statistical Learning: Data Mining, Infe- rence, and Prediction鈥, Springer, 2001. 
  • Berry, M. and Linoff, G., 鈥滵ata Mining Techniques for Marketing, Sales and Customer Support鈥, Wiley, 1997. 
  • Berson, A., Thearling, K., and Smith, S. 鈥滲uilding Data Mining Applications for CRM鈥, McGraw Hill, 1999. 
  • Dyche, J., .e-Data: Turning Data into Information with Data Warehousing鈥, Addisson Wesley, 2000. 
Pontificia Universidad Cat贸lica de Chile - Escuela de Ingenier铆a UC - Vicu帽a Mackenna 4860 - Edificio San Agust铆n, 4to. piso - Campus San Joaqu铆n, Macul - Santiago - Chile
Pol铆ticas de privacidad | Mapa del sitio
Optimizado para: Explorer 8.0, Firefox 3.6.17, Chrome 10, Safari 4.1, Opera 11.10 贸 superiores