Bioinformática


Algoritmos para Análise de Sequências Biológicas (Sem. 1)

Objectivos de aprendizagem

Identificar, descrever e definir os principais conceitos na área da Bioinformática em geral e do processamento
e análise de sequências biológicas em particular;
Identificar e descrever os principais problemas que se colocam ao nível do processamento e análise de
sequências biológicas
Escolher as classes de algoritmos apropriadas para a resolução dos problemas básicos de Bioinformática,
nomeadamente ao nível do processamento e análise de sequências biológicas;
Implementar algoritmos básicos de processamento e análise de sequências biológicas usando linguagens de
programação de scripting e usando repositórios de software de Bioinformática disponíveis.

Conteúdos programáticos

Introdução aos conceitos básicos da Bioinformática e da análise de sequências biológicas;
Algoritmos básicos para o processamento de sequências biológicas de ADN, ARN e proteínas
Algoritmos para procura de padrões (motifs) em sequências; autómatos determinísticos; árvores de sufixos
Algoritmos de alinhamento de sequências: programação dinâmica; algoritmos heurísticos
Pesquisas em bases de dados por sequências similares; algoritmo BLAST
Algoritmos progressivos para alinhamento múltiplo de sequências; o algoritmo ClustalW
Implementação de algoritmos para análise de sequências biológicas usando linguagens de scripting;
Exploração de repositórios de software de Bioinformática e interação com bases de dados de sequências
biológicas por programação

Metodologias de ensino e avaliação

Aulas teóricas onde são lecionados os conceitos e aulas laboratoriais onde os alunos desenvolvem programas
numa linguagem de scripting para implementar algoritmos de análise de sequências e aceder aos repositórios
existentes online. A avaliação é consituída de um teste (70% da classificação) e de fichas individuais ao longo
do semestre (30%).

Bibliografia

H.J. Bockenhauer, D. Bongartz. Algorithmic Aspects of Bioinformatics, Springer, 2007
D. Mount, Bioinformatics: Sequence and genome analysis, 2nd ed., Cold Spring Harbor Laboratory Press, New
York, 2006.
S. Bassi, Python for Bioinformatics, CRC Press, 2009.

Algoritmos Avançados de Bioinformática (Sem. 2)

Objectivos de aprendizagem

1 Identificar e descrever conceitos e problemas avançados na área da Bioinformática
2 Escolher classes de algoritmos apropriadas para a resolução de problemas complexos de Bioinformática,
incluindo métodos de otimização
3 Conhecer as principais alternativas ao nível de metaheurísticas de otimização, nomeadamente na área da
Computação Natural, e suas aplicações em problemas avançados de Bioinformática
4 Implementar algoritmos avançados de Bioinformática, incluindo metaheurísticas, numa linguagem de
programação apropriada

Conteúdos programáticos

1 Algoritmos avançados para análise de sequências: descoberta de motifs, alinhamento múltiplo, análise
filogenética
2 Algoritmos de clustering de dados
3 Métodos de otimização estocásticos e sua aplicação em Bioinformática, incluindo metaheurísticas de
Computação Natural
4 Algoritmos sobre grafos e sua aplicação na modelação celular
5 Implementação de algoritmos avançados de Bioinformática

Metodologias de ensino e avaliação

Aulas teóricas:
Aulas práticas com computador: exploração de ferramentas; programação de algoritmos
Avaliação: teste escrito; trabalho prático de programação em grupo

Bibliografia

- N. C. Jones, P. Pevzner, An Introduction to Bioinformatics Algorithms, MIT Press, 2004
- H.J. Bockenhauer, D. Bongartz. Algorithmic Aspects of Bioinformatics, Springer, 2007
- D. Mount, Bioinformatics: Sequence and genome analysis, 2nd ed., Cold Spring Harbor Laboratory Press, New
York, 2006.

Extração de Conhecimento de Bases de Dados Biológicas (Sem. 2)

Objectivos de aprendizagem

1 Identificar, descrever e definir os principais conceitos relacionados com os processos de extração de
conhecimento, aprendizagem máquina e mineração de dados
2 Seleccionar as metodologias apropriadas e aplicar software disponível na resolução de problemas ao nível da
análise de dados
3 Conhecer e ser capaz de implementar os principais algoritmos relacionados com técnicas de Mineração de
Dados e Aprendizagem Máquina
4 Aplicar as metodologias de extracção de conhecimento no caso específico das bases de dados biológicas

Conteúdos programáticos

1. O processo de extração de conhecimento de bases de dados e conceitos relacionado
2. Mineração de Dados e Aprendizagem Máquina: Modelos e algoritmos de classificação e regressão; árvores
de decisão e regras de classificação; redes neuronais; modelos funcionais; aprendizagem baseada em
instâncias.
3. Avaliação e comparação de modelos e algoritmos
4. Tópicos avançados: conjuntos de modelos, sistemas híbridos, selecção de modelos e meta- aprendizagem,
selecção de atributos
5. Aplicações no campo da Bioinformática: análise de dados de expressão genética, previsão de genes,
previsão da estrutura de proteínas, etc

Metodologias de ensino e avaliação

Aulas teóricas:
Aulas práticas:
Avaliação: teste escrito; trabalhos práticos em grupo

Bibliografia

Análise Inteligente de Dados – Algoritmos e Implementação em Java; M. Rocha, P. Cortez, J. Neves; FCA; 2008
I. Witten, E. Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2nd edition, Morgan
Kaufman, 2005.
T. Mitchell, Machine Learning, McGraw Hill, 1997.

Laboratórios de Bioinformática (Sem. 1)

Objectivos de aprendizagem

1 Identificar e pesquisar informação nas principais bases de dados com informação relevante na área da
Bioinformática
2 Identificar, utilizar e avaliar criticamente as principais ferramentas disponíveis ao nível da Bioinformática
3 Utilizar sistemas de computação científica para resolução de tarefas em Bioinformática, nomeadamente na
análise de dados experimentais
4 Saber definir novas funções em sistemas de computação científica e implementar scripts para resolução de
problemas específicos

Conteúdos programáticos

1. Ferramentas e bases de dados na área da Bioinformática
- bases de dados de sequências primárias e curadas
- ferramentas para Biologia Molecular (primers, enzimas de restrição)
- ferramentas para alinhamentos / homologias de sequências, motifs e análise filogenética
- ferramentas para análise de proteinas
2. Sistemas de computação científica e seu uso na Bioinformática
- introdução ao Matlab
- ferramentas para Engenharia Bioquimica em MatLab
- introdução ao sistema R
- análise de dados com o R/ Bioconductor
- programação de novas funções em Matlab e R

Metodologias de ensino e avaliação

Aulas práticas com uso de computador
Métodos de avaliiação: teste prático e desempenho nas aulas práticas

Bibliografia

d- D. Mount, Bioinformatics: Sequence and genome analysis, Cold Spring Harbor Laboratory Press, 2nd edition,
2005
- A. Baxevanis, F. Ouellete (Eds) Bioinformatics: A Practical Guide to the Analysis of genes and proteins, Wiley,
2004