Processamento de Documentos

por

José Carlos L. Ramalho


  1. Que problema pretendemos resolver?
  2. Papel da Anotação de textos.
  3. SGML: conceitos e sintaxe.
  4. Que benefícios advêm da utilização do SGML?






O que é um documento?






O que é que fazemos normalmente com os documentos?



Começa a emergir um problema…


Que ferramentas e suportes utilizamos?



Temos um problema !!!


O que é que o mercado oferece?



O que é que necessitamos?



Standard Generalized Markup Language

O que é e porque importa




O que é o SGML?


"O SGML tem a sofisticação necessária… permite a troca de informação em qualquer nível de complexidade entre software, hardware, armazenamento e sistemas de apresentação… sem se preocupar com o nome do fabricante escrito na etiqueta do produto. E faz isto tudo com a autoridade de um standard internacional."






O que é a Anotação de um texto?

Um meio de tornar explícita uma interpretação desse texto.

Exemplo: sinais de pontuação.




A tarefa de anotar num sistema de processamento:

  1. analisar a estrutura da informação e os atributos que a caracterizam
  2. determinar quais as funções de processamento que produzirão o formato desejado para cada elemento
  3. inserir as etiquetas no texto




Exercício: anotar em grupo a página do livro - procurar e marcar os vários elementos constituintes do texto.


Tipos de anotação:


Procedimental - define qual o processamento a ser realizado em determinados pontos do documento.


Caros senhores,

.esp_vert 4

Escrevo-vos a … items:

.indent 4

1. Qual a qualificação necessária

.indent 4

2. Datas

.esp_vert 4

Obrigado


Descritiva - utiliza etiquetas para apenas classificar as componentes do documento.


<abre>Caros senhores,</abre>

<corpo>

Escrevo-vos a … items:

<listan>

<item> Qual a qualificação necessária

<item> Datas …

</lista>

</corpo>

<fecha>Obrigado</fecha>


Funções da Anotação


Linguagem de Anotação



O SGML tem estas características todas … excepto a última

SGML: conceitos


Exemplos:

mail

<!DOCTYPE mail [

<!-- Elements Mins Content (Exceptions) -->

<!ELEMENT mail - - (header, body) >

<!ELEMENT header - - (from, date, to, subject?, cc?) >

<!ELEMENT (from|date|to|subject|cc) - o (#PCDATA) >

<!ELEMENT body - - (#PCDATA) >

]>

<mail>

<header>

<from> Jos&eacute; Carlos Ramalho

<date> 23.04.96

<to> epl

<subject> Mini-palestra

</header>

<body>

Hoje, pelas 17.00h vou falar qualquer coisa de como se fazem estas coisas …

</body>

</mail>


Cartas…

<!DOCTYPE carta [

<!-- Elements Mins Content (Exceptions) -->

<!ELEMENT carta - - (abertura, corpo, fecho) >

<!ELEMENT abertura - o (#PCDATA) >

<!ELEMENT corpo - - (#PCDATA) >

<!ELEMENT fecho - - (cump?, data, ass) >

<!ELEMENT (cump, data, ass) - o (#PCDATA)>

<!ATTLIST carta tipo (pessoal, comercial, parecer) pessoal >

]>

<carta tipo="comercial">

<abertura> Caros senhores,

<corpo> Sendo vosso vizinho, venho manifestar …

</corpo>

<fecho>

<data> 23 de Abril de 1996

<ass> Jos&eacute; Carlos Ramalho

</fecho>

</carta>


Software de/para SGML: o que existe, o que faz



Referências para trabalho