Este documento descreve o trabalho realizado no âmbito da tese de doutoramento do autor.
O trabalho teve duas grandes linhas orientadoras. A estruturação de documentos, como a maneira de os tornar mais "ricos" e mais "vivos". E, a semântica dos documentos, desde a aparência visual até à interpretação (significado) do seu conteúdo. No fim, estas duas linhas acabaram por convergir na elaboração de um novo modelo de processamento documental.
Ao longo da dissertação, irá ser apresentada uma comparação de modelos de processamento documental, ou publicação electrónica; referir-se-á o processamento dos documentos normais, que são apenas textos, e dos documentos anotados, que têm uma estrutura lógica e um conteúdo. Esta análise será ilustrada com alguns casos práticos que se desenvolveram ao longo deste trabalho.
As vantagens dos documentos estruturados serão apresentadas e os passos para a implementação de um sistema de produção de documentos estruturados serão descritos.
A seguir, apresentar-se-á o conjunto de necessidades e requisitos actuais que se podem colocar a um sistema destes e analisar-se-á aquilo que se designou por "semântica dos documentos". As necessidades identificadas estão relacionadas com o problema da qualidade de conteúdos na publicação electrónica. A qualidade em publicações electrónicas pode ser analisada segundo vários parâmetros, desde o aspecto visual, o linguístico e literário, à correcção da informação (significado, semântica). A tecnologia existente permite de alguma forma automatizar e normalizar todos estes aspectos, excepto o último. Foi no desenvolvimento de uma solução para este problema que se centrou esta dissertação: como adicionar semântica estática (condições contextuais ou invariantes) aos documentos e como processar esta semântica estática de um modo integrado com a tecnologia existente.
São apresentadas duas vias para a solução da especificação e processamento da semântica estática, a primeira segue uma aproximação via modelos abstractos, a outra, uma aproximação via gramáticas de atributos.
No fim, uma das soluções será escolhida e integrada num sistema (S4) que sugere um novo modelo de processamento para documentos estruturados e que explora alguns paradigmas novos neste contexto (adoptam-se para os documentos metodologias utilizadas nas linguagens de programação como consequência de uma hipótese levantada pelo autor, da existência de um paralelismo entre o processamento de documentos e o processamento das linguagens de programação), que vão desde a análise da informação até ao seu tratamento.
A dissertação inclui a apresentação dos passos seguidos na produção do seu próprio texto, uma vez que se adoptaram as soluções defendidas e nela apresentadas.
Este documento foi submetido, pelo autor, à Escola de Engenharia da Universidade do Minho para obtenção do grau de Doutor. Os direitos de cópia do documento encontram-se reservados, portanto, à instituição e autor do mesmo.
À minha família, a Carmen, o David e o pequeno Leonardo, que toleraram as minhas ausências e a minha obsessão durante um largo período de tempo.
Next | ||
Agradecimentos |