Departamento de Informática (UM)

Página de Unidade Curricular

DesignaçãoCódigoCursoRegimeRegente

Fundamentos em Processamento de Linguagem Natural

13547 [ML29ML2900006168]

Mestrado em Humanidades Digitais [MHDIG]

S1

José João Antunes Guimarães Dias Almeida

Objetivos

Esta unidade curricular oferece uma introdução teórica e prática ao Processamento de Linguagem Natural. Em cada uma das partes são estudados fundamentos teóricos e apresentado um conjunto relevante de áreas de aplicação destes conhecimentos.

Programa

1. Introdução aos modelos de língua natural (léxico, sintático, semântico e pragmático)
2. Processamento de linguagens baseado em padrões
2.1. Expressões regulares
2.2. Extração de informação a partir de textos
2.3. Reformatações automáticas
3. Ferramentas de Processamento de Linguagem Natural
3.1. Anotadores morfossintáticos (taggers, treetaggers)
3.2. Gramáticas de dependências
3.3. Bancos de árvores (Treebanks)
3.4. Ferramentas ligadas a dicionários e terminologias
4. Processamento simples de documentos estruturados - Processamento usando XML

Bibliografia

Friedl, Jeffrey (2006). Mastering Regular Expressions. California: O’Reilly Media.

Natural Language Toolkit (NLTK). Disponível em: www.nltk.org.

Rodrigues, Mário & Teixeira, António (2015). Advanced Applications of NLP for performing information extraction. Springer.

Resultados da aprendizagem

Pretende-se que os alunos sejam capazes de:
- aplicar conceitos vários ligados ao Processamento de Linguagem Natural;
- procurar e extrair informação usando expressões regulares;
- escrever pequenos programas guiados por padrões;
- usar algumas ferramentas típicas de Processamento de Linguagem Natural para resolução de problemas específicos.

Método de avaliação

Avaliação contínua:
- 2 trabalhos práticos;
- 1 teste escrito;
- vários trabalhos de casa.

Funcionamento

Turno: TP 1; Docente: José João Antunes Guimarães Dias Almeida; Dep.: DI; Horas: 30.

[ Outras UCs do Departamento ]