Esta dissertação pode ser dividida em duas partes. Na primeira, apresenta-se um estudo da tecnologia existente para trabalhar com documentos estruturados. Na segunda, analisa-se a aplicação da tecnologia a alguns casos reais; identificam-se alguns problemas; e, por fim, propõem-se soluções para a resolução dessas situações.
Antes dessas duas partes centrais, inclui-se alguma informação sobre formalismos e notação utilizados na dissertação (Capítulo 2).
A primeira parte começa por um capítulo (Capítulo 3) onde se expõem os conceitos subjacentes aos documentos estruturados: conteúdo e anotação, linguagem de anotação. A seguir surge um dos capítulos basilares da dissertação (Capítulo 4), onde se apresenta um estudo do SGML, a norma para a definição de linguagens de anotação e criação de documentos estruturados. No capítulo seguinte (Capítulo 5), apresenta-se o ciclo de vida dos documentos estruturados, identificando para cada etapa o estado actual de desenvolvimento e utilização.
Esta primeira parte termina no capítulo onde se começa a discutir a semântica (Capítulo 6). Existe uma norma (DSSSL - [Cla96]) para a especificação da semântica dinâmica que é aqui descrito com algum detalhe. Porém, relativamente à especificação da semântica estática pouco ou nada existe, se excluirmos alguns invariantes estruturais nativos no SGML. Não há nenhuma forma de especificar condições de contexto, ou invariantes, para documentos estruturados. Como aqui já estamos a entrar na parte inovadora desta tese, este assunto é discutido no capítulo seguinte (Capítulo 7), onde começa a segunda parte lógica da tese.
A segunda parte inicia-se, portanto, num capítulo onde se discute a especificação da semântica estática. Nessa discussão surgem dois problemas para os quais se apontam soluções: como garantir a normalização de conteúdos e como associar um tipo de dados ao conteúdo.
Nos dois capítulos seguintes, parte-se para duas soluções de implementação. No primeiro (Capítulo 8), utiliza-se uma abordagem via modelos abstractos e usa-se o ambiente de prototipagem CAMILA [ABNO97] para testar a viabilidade da solução. No segundo, utilizam-se gramáticas de atributos como abordagem ao problema e usa-se um ambiente de geração de compiladores para implementar a solução.
Por fim, a dissertação termina com um capítulo de conclusões onde são incluídas ideias e linhas de investigação para trabalho futuro.
A dissertação possui ainda quatro apêndices. O primeiro descreve a produção da própria dissertação, processo em que se utilizaram a maior parte das metodologias descritas e defendidas ao longo da mesma. O segundo, enumera e descreve sucintamente alguns dos projectos reais onde foram testadas as ideias defendidas nesta dissertação e que muito contribuíram para enriquecer a visão prática que o autor agora tem do assunto. O terceiro, que pode considerar-se um documento destacável, enumera e descreve um conjunto de regras desenvolvidas ao longo desta dissertação para a conversão de DTDs em Gramáticas de Atributos. Por fim, inclui-se um quarto apêndice dedicado às novidades tecnológicas mais recentes: descrevem-se algumas propostas de normas que poderão revolucionar o mundo dos documentos estruturados e, como efeito lateral, a disponibilização de conteúdos na Internet.