1. Identificação do Projecto Sistema de Aquisição / Combinação de Dados Multi-fonte 2. Descrição do Projecto Com este projecto pretende-se desenvolver um extractor que permita integrar numa base de dados comum dados provenientes de BD externas e/ou dados recolhidos em documentos anotados (em XML); os dados podem ter origem em 1 fonte (num dos suportes alternativos), ou podem ser oriundos de mais do que uma fonte complementar. O extractor a desenvolver deverá ser genérico podendo ser aplicável a qualquer esquema de base de dados, ou tipo de documento, o que exigirá o desenvolvimento de uma linguagem de especificação apropriada que permita descrever a estrutura das fontes, a estrutura da BD central e o esquema de transferência. O trabalho será testado utilizando uma BD de Histórias de Vida e documentos anotados das entrevistas realizadas no âmbito do Museu Pessoa. 3. Grupos de Trabalho 1 Grupo de Trabalho: 2-3 elementos 4. Duração do Projecto 1 Semestre 5. Grupo em que se enquadra o trabalho gEPL 6. Proponente / Orientador Pedro Rangel Henriques + Fátima Rodrigues 7. Áreas de trabalho Bases de Dados + XML + processamento de linguagens _______________________________________________________________________________________ 1. Identificação do Projecto Pós-Processamento de Conhecimento extraído duma BD com técnicas de Data Mining 2. Descrição do Projecto Este projecto envolve a extracção de conhecimento a partir de uma base de dados usando técnicas de Data Mining, mais concretamente, usando algoritmos de Classificação e Regras de Associação. Estes algoritmos normalmente geram um grande número de regras, pelo que é conveniente desenvolver um filtro que permita seleccionar as mais interessantes por forma a facilitar a sua interpretação pelo Perito. Além disso, também será interessante integrar ambas as formas de conhecimento (Regras de Classificação/Associação), combinando/adicionando regras, com o objectivo do alargar/melhorar o conhecimento obtido. Este conhecimento, extraído pelas operações de mineração referidas, deverá ser armazenado numa base de conhecimento num formato interno abstracto que permita a integração dos resultados e o seu processamento (filtragem, etc) independente do sistema de análise, antes da sua visualização num "browser web". Para isso escolheu-se a notação XML como representação universal, do conhecimento. Este trabalho, que será aplicado à BD do IPS (Instituto Português do Sangue), requer dos alunos a exploração de uma ferramenta de DM (Clementine ou WECA), a definição de um esquema XML para representação interna do conhecimento, e o processamento da BC em XML para filtragem e visualização. 3. Grupos de Trabalho 1 Grupo de Trabalho: 2-3 elementos 4. Duração do Projecto 1 Semestre 5. Grupo em que se enquadra o trabalho gEPL 6. Proponente / Orientador Pedro Rangel Henriques + Magda Joana Silva + Fátima Rodrigues 7. Áreas de trabalho Data Mining + Bases de Dados + XML + Web-engineering _______________________________________________________________________________________ 1. Identificação do Projecto Exposição virtual de Passaportes antigos na sala da Diáspora do Museu da Emigração 2. Descrição do Projecto No contexto do Museu da Emigração e das Comunidades, museu virtual sobre a Internet criado pela Casa da Cultural da Câmara Municipal de Fafe, (pode ser consultado em "www.museu-emigrantes.org"), pretende-se expor, na sala da Diáspora, a avultada colecção (que pertence ao espólio do Museu) de passaportes antigos de Emigrantes Portugueses para o Brasil. O trabalho aqui proposto requer dos alunos a idealização e implementação de uma linguagem XML para anotação dos passaportes de emigrantes, de modo a que, usando um processo de transformação, essa informação seja visualizada em HTML. Também será necessário que o grupo escolha e parametrize um Editor XML que facilite a introdução dos passaportes, devendo usar-se CVS para armazenamento dos documentos anotados. Posteriormente, recorrendo a ferramentas de pesquisa em XML, será criado um sistema de navegação para pesquisar a informação relativa aos passaportes, respondendo a questões como: "Que indivíduos de Fafe emigraram em 1875?"; ou "Qual é o local/ano de onde emigraram mais indivíduos?". 3. Grupos de Trabalho 1 Grupo de Trabalho: 2-3 elementos 4. Duração do Projecto 1 Semestre 5. Grupo em que se enquadra o trabalho gEPL 6. Proponente / Orientador Pedro Rangel Henriques + Fernanda Faria 7. Áreas de trabalho Anotação e Processamento de Documentos: XML, XSL, X-Query + Web-engineering _______________________________________________________________________________________ 1. Identificação do Projecto Normalização semi-automática de Fichas Prosopográficas do Clero Catedralício 2. Descrição do Projecto No contexto do projecto "Fasti Ecclesiae Portugaliae" vai-se criar e disponibilizar à comunidade científica uma base de dados prosopográfica normalizada do clero catedralício português (dignidades e cónegos) da Idade Média baixa (1071 a 1325). Essas fichas prosopográficas são, à partida, recolhidas transcrevendo a informação directamente dos documentos catedralícios consultados nos vários arquivos. Para recolha desses dados e armazenamento das fichas em base de dados já existe uma aplicação (desenvolvida em PHP e My-Sql) cuja interface é realizada via um "browser" da web e que será disponibilizada como ponto de partida. Também já estão criadas as tabelas classificativas com as categorias que irão permitir a normalização das referidas fichas, de modo a fundi-las todas na desejada BDcentral normalizada, a partir da qual serão realizadas posteriormente as várias análises pretendidas. O que se requer neste projecto é o desenvolvimento de uma segunda interface web (usando a tecnologia já citada) que permita aos historiadores consultar as fichas prosopográficas originais e transferi-las para a BDcentral (já criada segundo o esquema desenhado aquando da concepção do sistema SIEP) após a sua edição e normalização. Será preciso, ainda, criar um dicionário de sinónimos que facilite a edição dos campos não categorizáveis. 3. Grupos de Trabalho 1 Grupo de Trabalho: 2-3 elementos 4. Duração do Projecto 1 Semestre 5. Grupo em que se enquadra o trabalho gEPL 6. Proponente / Orientador Pedro Rangel Henriques + Sandra Lopes 7. Áreas de trabalho Web-engineering + PHP + Bases de Dados (My-Sql) _______________________________________________________________________________________ 1. Identificação do Projecto Implementação de um sistema de reescrita e visualização para animação de programas 2. Descrição do Projecto O sistema Alma foi concebido e desenhado para ser um sistema de animação de programas genérico (qualquer tipo de linguagem fonte). Este sistema constrói, de forma automática e sistemática, representações visuais dos fluxos de controlo e de dados de um programa ao longo de uma simulação da sua execução. O sistema usa uma representação interna dos programas própria (a DAST -- Decorated Abstract Syntax Tree) sobre a qual trabalham mecanismos de visualização e de reescrita baseados em regras. O sistema está organizado num Fronte-End (FE) que faz o reconhecimento da lingaugem fonte cria a DAST e um Back-End (BE) que processa a DAST para a apresentar e a re-escrever simulando a sua execução. Neste momento foi já construido um protótipo do Alma e criado um FE para uma linguagem tipo Pascal. O trabalho que se espera dos alunos, relativo ao projecto que aqui se propõe, pode ser dividido em duas fases (que podem decorrer em simultâneo): a) Implementação, em Java, do sistema Alma que suporte regras de reescrita e de visualização responsáveis pela animação de programas imperativos com subprogramas e de programas pertencentes a outros paradigmas (lógico, funcional, etc.). Esta tarefa deverá tomar como ponto de partida o protópio Java que já existe, optimizando o seu funcionamento e completando-o (para tratar os casos não previstos); b) Desenvolvimento de uma interface web para o sistema Alma: edição do texto fonte; inserção de novas regras (visualização e/ou reescrita); inserção de parâmetros de animação; e visualização de resultados. 3. Grupos de Trabalho 2 Grupo de Trabalho: 2 elementos 4. Duração do Projecto 1 Semestre 5. Grupo em que se enquadra o trabalho gEPL 6. Proponente / Orientador Pedro Rangel Henriques + Maria João Varanda 7. Áreas de trabalho Processamento de linguagens + Visualização/Animação + Programação Visual + POO (Java) _______________________________________________________________________________________