Análise e Modelação de Sistemas de Armazenamento e Transporte de Dados
Ano Lectivo: 06/07 (1º semestre)
Sumário das Aulas Teóricas do MSDPA
Aula 1
Tópicos:
- Apresentação da disciplina:
- Equipe docente (experiência e interesses) e contactos;
- Modo de funcionamento das aulas;
- Objectivos e Programa;
- Bibliografia;
- Avaliação: componentes.
- Identificação dos Alunos: seu "background" académico e profissional; interesses e expectativas
- Contextualização de AMSATD no âmbito dos Sistemas de Data Warehousing e do currículo do MSDPA; camadas dum SDW: Fontes de Informação; Zona de Concentração de Dados; Data Warehouse; Ferramentas de Análise e Extracção de Conhecimento.
Aula 2
Tópicos:
- Introdução ao processo central da disciplina SETI: selecção, extracção, transformação e integração de dados
- apresentação do processo como a composição de 3 funções aplicadas a um esquema de selecção:
integra(transforma(extrai(seleccao))).
- discussão dos requisitos e perfil de cada uma dessas 3 funções;
- apresentação do conceito de Representação Intermédia (IR),
necessária para colocar os dados extraídos e gerar a saída após a sua transformação,
e discussão de possíveis implementações.
- comparação deste processo com as tarefas de um compilador (processador de linguagens) e com a
escolha da árvore de sintaxe (abstracta) com atributos para RI.
- Identificação das ferramentas de SETI (ETL) que cada aluno pretende estudar e
calendarização das primeiras apresentações.
- António José: DataStage
- Carla Santos: SQL-Server 2000
- Rui Afonseca: Talent
- José Pedro: Visual-Importer 4.6.7
- Luís Ferros: XML-Spy
- Bruno Nunes: Oracle
- Joel Ribeiro: SQL-Server 2005
- Ibraim: Solonde Integrator (Sybase)
- Sabrina: Business Objects
- Sílvia: Sun tool
- Introdução ao desenvolvimento sistemático de filtros de texto para extracção de informação
de ficheiros de texto não-estruturados
- recurso a um gerador automático de programas em C -- Flex --
a partir da descrição do padrão de texto a filtrar (retirar, ou processar) através de Expressões Regulares.
- programação baseada no princípio da condição-reacção; Sistemas de Produção.
- exemplos: limpeza e tratamento de um ficheiro de códigos postais e localidades.
Aula 3
Tópicos:
- Ferramentas de SETI (ETL)
-- O DataStage da IBM, por António José:
-
enquadramento no suite de Análise de Dados da IBM, apresentação das principais características e funcionalidades,
discussão de um caso-de-estudo.
Aula 4
Tópicos:
- Ferramentas de SETI (ETL)
-- O SQL-Server 2000 da MicroSoft, por Carla Santos,
e o Solonde Integrator, por Ibraim Torres:
-
apresentação das principais características e funcionalidades,
discussão de um caso-de-estudo.
Aula 5
Tópicos:
- Ferramentas de SETI (ETL)
-- O SQL-Server 2005 da MicroSoft, por Joel Ribeiro,
e o Warehouse Builder da Oracle, por Bruno Bernardes-Nunes:
-
apresentação das principais características e funcionalidades,
discussão de um caso-de-estudo.
Aula 6
Tópicos:
- Ferramentas de SETI (ETL)
-- O Talend Open Studio, por Rui Afonseca,
e o Visual-Importer, por José Pedro Pereira Pinto:
-
apresentação das principais características e funcionalidades,
discussão de um caso-de-estudo.
Aula 7
Tópicos:
- Ferramentas de SETI (ETL)
-- O XMLSpy e Companhia da Altova, por Luís Ferros:
-
apresentação das principais características e funcionalidades,
discussão de um caso-de-estudo.
Aula 8
Tópicos:
- Ferramentas de SETI (ETL)
-- O Sunopsis, por Sílvia Soares,
e o Business Object, por Sabrina Cruz:
-
apresentação das principais características e funcionalidades,
discussão de um caso-de-estudo.
Aula 9
Tópicos:
- Desenvolvimento sistemático de filtros de texto para extracção de informação
de ficheiros de texto não-estruturados
- programação baseada no princípio da condição-reacção; Sistemas de Produção.
- recurso a uma linguagem de scripting -- breve introdução ao Perl
por Alberto Simões.
- A anotação de textos para produção de documentos científicos -- breve introdução ao LaTeX.
-
conclusão da matéria e balanço final da disciplina.
author: prh@di.uminho.pt
Last modified: domingo, Março 4, 2007 at 13:02