Galeria

SGML xml

De acordo com Moultis e Kirk (2000), a SGML (Standard Generalized Markup
Language – Linguagem de Marcação Generalizada Padrão) foi a linguagem de marcação que
originou tanto a HTML, quanto a XML, sendo ainda utilizada em algumas aplicações.
Sistemas que utilizam esta linguagem são sistemas grandes e complexos, os quais precisam
utilizar grandes especificações.
SGML foi criada no final da década de 60 pelos pesquisadores da IBM Goldfarb,
Mosher e Lorie, com o objetivo de construir um sistema portável, ou seja, um sistema
independente de sistema operacional, formatos de arquivos, etc. O objetivo que os
pesquisadores buscavam era o intercâmbio e manipulação de documentos. Eles optaram por
um sistema de marcação generalizada, que deveria descrever a estrutura do documento e
outros atributos, em vez de especificar o processamento a ser feito sob eles. Essa marcação
também deveria ser rigorosamente definida, a ponto dos sistemas formais pudessem ser
utilizados para processar o documento em questão (ANDERSON et al., 2001).
Em outras palavras, a marcação generalizada não restringe documentos a uma única
aplicação, estilo de formatação ou sistema de processamento. Desde a sua concepção,
portanto, SGML foi uma evolução sobre os sistemas vigentes de editoração eletrônica com
funções de processamento complexas, embutidas na marcação do documento, denominadas
por Goldfarb de sistemas de marcação procedural. Como exemplo destes sistemas podemos
citar o clássico TeX (Technical – Linguagem para Preparação de Documentos) , desenvolvido
por Knuth no final da década de 70 para preparação de textos matemáticos (www.csfaculty.
stanford.edu/~knuth/).
De acordo com Anderson et al. (2001), em 1986, SGML tornou-se um padrão
internacional e foi adotada por várias empresas de porte como padrão para intercâmbio e
armazenamento de documentos. Duas linguagens de marcação baseadas em SGML e
largamente utilizadas são: DocBook, projetada para marcação de documentação técnica e TEI
(Text Encoding Initiative – Iniciativa de codificação de Texto), projetada para marcação de
textos literários.
Como SGML não possui um conjunto pré-definido de tags e de elementos, ela é na
verdade uma meta-linguagem para especificar linguagens de marcação. Ela não possui uma
semântica pré-definida.
A sintaxe de uma linguagem específica de marcação definida usando SGML é
especificada por meio de construções coletadas num documento denominado DTD
(Document Type Definition) ou incluídas diretamente no documento SGML, onde aparecem
declarações de elementos, que especificam para cada elemento da linguagem todas as
possíveis marcações válidas para o elemento, como por exemplo, a ordem e obrigatoriedade
de elementos num documento, quantidade, etc, e declarações de atributos, que especificam,
por exemplo, tipos de valores de atributos e valores default. O DTD define, portanto, uma
gramática para a linguagem de marcação do documento (ANDERSON et al., 2001).
Segundo Moultis e Kirk (2000), o grande problema desta linguagem é o fato dela ser
uma linguagem grande e complexa, já que possui centenas de páginas de especificação. Além
disso, para desenvolver algo nesta linguagem é obrigatória a presença da definição de tipo de
documento, assim como visto anteriormente, o que não é necessário em XML.
XHTML (eXtensible HyperText Markup Language – Linguagem de Marcação de
Texto Extensível) combina XML com HTML. Mais formalmente, XHTML é um XML
reescrito do HTML. Isto se deve ao fato do XHTML seguir a sintaxe XML mas possuir
funcionalidades semelhantes ao HTML, ou seja, possuir o mesmo funcionamento. Dessa
forma, o “XHTML é um subconjunto do XML que foi desenvolvido para se comportar como
HTML, contendo, porém, apenas as coisas mais interessantes” (PROFFITT, ZUPAN, 2001,
P. xv).
Assim como podemos considerar o XML uma versão mais “enxuta” do SGML, o
XHTML pode ser enquadrado com uma versão mais “enxuta”, porém do XML. Isso ocorre
pelo fato do XHTML seguir as normas do XML, mas não utilizar todas as especificações
encontradas neste. Apesar de prover recursos como definição de tipo de documento e folhas
de estilo, a XHTML se comporta como o HTML, podendo assim ser interpretado pelos
navegadores da atualidade (PROFFITT, ZUPAN, 2001).
Essa linguagem foi estabelecida como linguagem de marcação para Web no ano 2000
pela W3C. Ela surgiu pela necessidade de características de meta linguagem em
representações HTML. Com isso, XHTML passou a ser utilizada por muitos desenvolvedores
do mundo, no lugar da HTML 4 (RAY, 2001).
A busca de uma meta linguagem deve-se à crescente necessidade de dados que se auto
descrevem. Utilizando este tipo de dados, os auto descritivos, é possível estabelecer um nível
maior de padronização. Ainda, com essa linguagem, é possível utilizar somente o que é
necessário dos documentos, ou seja, tem-se a liberdade de extrair dos documentos e
representar para o usuário, somente os dados que são considerados relevantes.
Segundo Proffitt e Zupan (2001), essa nova linguagem se aproxima muito do HTML
4, o que facilita o trabalho dos desenvolvedores, os quais já possuem conhecimento sobre tags
descritas em HTML. Contudo, ela oferece a flexibilidade e a portabilidade do XML. Dessa
forma, têm-se uma linguagem de marcação de textos, com características e elementos da meta
linguagem.

Deixe um comentário