Informaci贸n sobre

Procesamiento del lenguaje natural

SIGLA

: LET3320

CAR脕CTER

: M脥NIMO

CR脡DITOS

: 10

PROFESOR

: C茅sar Aguilar

MODULOS

: 2

 

I. DESCRIPCI脫N


Este curso presenta una introducci贸n general al procesamiento del lenguaje natural (o PLN), la cual es un 谩rea de investigaci贸n emergente orientada hacia la generaci贸n y uso de herramientas computacionales en el estudio de una lengua. El curso se enfoca en: 鈥 el manejo (semi) automatizado de enormes repositorios de documentos, conocidos como corpus ling眉铆sticos; -el empleo de t茅cnicas estad铆sticas para determinar comportamientos regulares y/o irregulares en fen贸menos observables en corpus; y 鈥 la implementaci贸n de herramientas computacionales para procesar eficientemente palabras y/o frases.

 

II. OBJETIVOS 

Brindar a los estudiantes una panor谩mica general sobre lo que es el PLN, ponderando tanto una descripci贸n te贸rica de sus conceptos y m茅todos principales, as铆 como el aprendizaje de t茅cnicas de programaci贸n para desarrollar herramientas de an谩lisis. 

  • Definir en qu茅 consiste el PLN.
  • Definir sus conceptos y m茅todos b谩sicos.
  • Aprender a usar la librer铆a NLTK, programada en lenguaje Python.
  • Identificar sus principales l铆neas de investigaci贸n.
  • Desarrollar un proyecto basado en alguna de las l铆neas de investigaci贸n revisadas. 

 

III. CONTENIDOS

 

  • Nociones b谩sicas: definici贸n del PLN, gram谩ticas formales, gram谩ticas libres de contexto, n-gramas, corpus ling眉铆sticos, etiquetado ling眉铆stico, chunking y parsing, bases de conocimiento l茅xicas. 
  • Herramientas de an谩lisis: m贸dulos de procesamiento textual de NLTK.
  • T茅cnicas de an谩lisis: probabilidades condicionales, informaci贸n mutua y entrop铆a, precisi贸n & recall
  • L铆neas de investigaci贸n: recuperaci贸n y extracci贸n de informaci贸n, reconocimiento de entidades nombradas, clasificaci贸n de textos, miner铆a de textos, desarrollo de ontolog铆as. 

 

IV. METODOLOG脥A

  • Clases expositivas.
  • Sesiones de taller con computadores para el aprendizaje en el manejo de herramientas.
  • Entrega de evaluaciones parciales.
  • Trabajo final.

 

V. EVALUACI脫N 

  • Controles
  • Trabajos parciales
  • Trabajo final

 

VI. BIBLIOGRAF脥A 

 

  • Bird, Steven, Klein, Ewan y Loper, Edward (2010): Natural Language Processing with Python. Analyzing Text with the Natural Language Toolkit, Sebastropol, Cal., O'Reilly Media. 
  • Clark, Alexander, Fox, Chris and Lappin, Shalom (Eds.) (2010): The Handbook of Computational Linguistics and Natural Language Processing, Oxford, UK, Wiley-Blackwell. 
  • Jurafsky, Daniel y Martin, James (2009): Speech and Language Processing, Second Edtion, New Jersey, Prentice Hall. 
Pontificia Universidad Cat贸lica de Chile - Escuela de Ingenier铆a UC - Vicu帽a Mackenna 4860 - Edificio San Agust铆n, 4to. piso - Campus San Joaqu铆n, Macul - Santiago - Chile
Pol铆ticas de privacidad | Mapa del sitio
Optimizado para: Explorer 8.0, Firefox 3.6.17, Chrome 10, Safari 4.1, Opera 11.10 贸 superiores