XML - entidades de caráter

Este capítulo descreve o XML Character Entities. Antes de entendermos as Entidades de Personagem, vamos primeiro entender o que é uma entidade XML.

Conforme colocado pelo Consórcio W3, a definição de uma entidade é a seguinte -

“A entidade do documento serve como a raiz da árvore da entidade e um ponto de partida para um processador XML”.

Isso significa que as entidades são os marcadores de posição em XML. Eles podem ser declarados no prólogo do documento ou em um DTD. Existem diferentes tipos de entidades e, neste capítulo, discutiremos a Entidade de Personagem.

Ambos, HTML e XML, possuem alguns símbolos reservados para seu uso, os quais não podem ser usados ​​como conteúdo em código XML. Por exemplo,< e >sinais são usados ​​para abrir e fechar tags XML. Para exibir esses caracteres especiais, as entidades de caractere são usadas.

Existem alguns caracteres ou símbolos especiais que não podem ser digitados diretamente no teclado. As entidades de personagem também podem ser usadas para exibir esses símbolos / caracteres especiais.

Tipos de entidades de caráter

Existem três tipos de entidades de caráter -

  • Entidades de personagem predefinidas
  • Entidades de personagem numeradas
  • Entidades de personagem nomeadas

Entidades de personagem predefinidas

Eles são introduzidos para evitar a ambigüidade ao usar alguns símbolos. Por exemplo, uma ambigüidade é observada quando menor que (< ) ou maior que ( > ) o símbolo é usado com a etiqueta de ângulo (<>) As entidades de caracteres são basicamente usadas para delimitar tags em XML. A seguir está uma lista de entidades de caracteres predefinidas da especificação XML. Eles podem ser usados ​​para expressar caracteres sem ambigüidade.

  • E comercial - &amp;

  • Aspas simples - &apos;

  • Maior que - &gt;

  • Menor que - &lt;

  • Aspas duplas - &quot;

Entidades de caractere numérico

A referência numérica é usada para se referir a uma entidade de caractere. A referência numérica pode estar no formato decimal ou hexadecimal. Como existem milhares de referências numéricas disponíveis, elas são um pouco difíceis de lembrar. A referência numérica se refere ao caractere por seu número no conjunto de caracteres Unicode.

A sintaxe geral para referência numérica decimal é -

&# decimal number ;

A sintaxe geral para referência numérica hexadecimal é -

&#x Hexadecimal number ;

A tabela a seguir lista algumas entidades de caracteres predefinidos com seus valores numéricos -

Nome da entidade Personagem Referência decimal Referência hexadecimal
quot " & # 34; & # x22;
amplificador E & # 38; & # x26;
apos ' & # 39; & # x27;
lt < & # 60; & # x3C;
gt > & # 62; & # x3E;

Entidade de personagem nomeada

Como é difícil lembrar os caracteres numéricos, o tipo mais preferido de entidade de caractere é a entidade de caractere nomeado. Aqui, cada entidade é identificada com um nome.

Por exemplo -

  • 'Aacute' representa o caráter maiúsculo com acento agudo.

  • 'ugrave' representa o pequeno com sotaque grave.