<!–
main_leaderboard, all: [728,90][970,90][320,50][468,60]
–>
Conjuntos de caracteres HTML
Neste artigo, discutiremos o conjunto de caracteres HTML. Os navegadores da Web devem reconhecer o conjunto de caracteres usado pelas páginas HTML para exibi-los corretamente.
ASCII para UTF-8
Codificação de caracteres formada com ASCII. Utilizando ASCII, você pode usar 128 caracteres na internet: números (0-9), letras em inglês (AZ) e alguns caracteres especiais: ! $ + – ( ) @ < > no conjunto de caracteres HTML.
O conjunto de caracteres HTML padrão ou conjunto de caracteres HTML para HTML 4 era ISO-8859-1. Um total de 256 códigos de caracteres foram suportados por este conjunto de caracteres. UTF-8 também era suportado em HTML 4. O conjunto de caracteres original para Windows era ANSI (Windows-1252). Existem 32 caracteres extras em ANSI em comparação com ISO-8859-1.
Quase todos os conjuntos de caracteres / caracteres e símbolos HTML são cobertos pelo conjunto de caracteres UTF-8, que é a especificação HTML5!
O atributo HTML charset
Quando se trata de conjunto de caracteres HTML , um navegador da Web deve ser capaz de determinar qual conjunto de caracteres é usado na página HTML .
Existe uma especificação para isso na tag <meta> :
Diferenças entre conjuntos de caracteres
Abaixo está uma comparação entre o conjunto de caracteres HTML e o conjunto de caracteres HTML:
Dormente | ASCII | ANSI | 8859 | UTF-8 | Visão geral |
---|---|---|---|---|---|
87 | C | C | C | C | letra maiúscula latina W |
88 | x | x | x | x | Letra maiúscula latina X |
89 | Y | Y | Y | Y | Letra latina Y maiúscula |
90 | Z | Z | Z | Z | Letra maiúscula latina Z |
91 | [ | [ | [ | [ | Colchete esquerdo |
92 | solidus reverso | ||||
93 | ] | ] | ] | ] | Colchete direito |
94 | ^ | ^ | ^ | ^ | acento circunflexo |
95 | _ | _ | _ | _ | linha baixa |
200 | A | A | A | Letra maiúscula latina E com sepultura | |
32 | Um espaço em branco | ||||
33 | ! | ! | ! | ! | Um ponto de exclamação |
34 | “ | “ | “ | “ | Uma aspa |
35 | # | # | # | # | Um símbolo de número |
36 | $ | $ | $ | $ | símbolo do dólar |
37 | % | % | % | % | símbolo de porcentagem |
38 | & | & | & | & | E comercial |
39 | ' | ' | ' | ' | Apóstrofo |
40 | ( | ( | ( | ( | Parêntese esquerdo |
41 | ) | ) | ) | ) | parêntese direito |
42 | * | * | * | * | um asterisco |
43 | + | + | + | + | Um símbolo de mais |
44 | , | , | , | , | Uma vírgula |
45 | – | – | – | – | Hífen menos |
46 | . | . | . | . | Ponto final (Fim da linha) |
47 | / | / | / | / | solidus |
48 | 0 | 0 | 0 | 0 | Dígito zero (Número 0) |
49 | 1 | 1 | 1 | 1 | Dígito um (Número 1) |
50 | 2 | 2 | 2 | 2 | Dígito dois (Número 2) |
51 | 3 | 3 | 3 | 3 | Dígito três (número 3) |
52 | 4 | 4 | 4 | 4 | Dígito quatro (número 4) |
53 | 5 | 5 | 5 | 5 | Dígito cinco (número 5) |
54 | 6 | 6 | 6 | 6 | D dígito seis (Número 6) |
55 | 7 | 7 | 7 | 7 | Dígito sete (Número 7) |
56 | 8 | 8 | 8 | 8 | Dígito oito (Número 8) |
57 | 9 | 9 | 9 | 9 | Dígito nove (número 9) |
58 | : | : | : | : | dois pontos |
59 | ; | ; | ; | ; | um ponto e vírgula |
60 | < | < | < | < | símbolo menor que |
61 | = | = | = | = | símbolo de igual |
62 | > | > | > | > | símbolo maior que |
63 | ? | ? | ? | ? | Uma interrogação |
64 | @ | @ | @ | @ | Um comercial em |
65 | A | A | A | A | Letra maiúscula latina A |
66 | B | B | B | B | Letra latina maiúscula B |
67 | C | C | C | C | Letra C maiúscula latina |
68 | D | D | D | D | Letra D maiúscula latina |
79 | O | O | O | O | letra maiúscula latina O |
80 | P | P | P | P | Letra P maiúscula latina |
81 | Q | Q | Q | Q | letra Q maiúscula latina |
82 | R | R | R | R | Letra latina R maiúscula |
83 | S | S | S | S | Letra S maiúscula latina |
84 | T | T | T | T | letra maiúscula latina T |
85 | você | você | você | você | Letra latina U maiúscula |
86 | V | V | V | V | Letra maiúscula latina V |
201 | A‰ | A‰ | A‰ | Letra maiúscula latina E com agudo | |
202 | COMO | COMO | COMO | Letra maiúscula latina E com circunflexo | |
203 | A< | A< | A< | Letra maiúscula latina E com trema | |
204 | ÃŒ | ÃŒ | ÃŒ | Letra maiúscula latina I com sepultura | |
216 | A | A | A | Letra maiúscula latina O com traço | |
217 | Ù | Ù | Ù | Letra maiúscula latina U com sepultura | |
218 | Como | Como | Como | Letra maiúscula latina U com agudo | |
219 | A> | A> | A> | U maiúsculo latino com circunflexo | |
220 | Ãœ | Ãœ | Ãœ | Letra maiúscula latina U com trema | |
221 | A | A | A | Letra maiúscula latina Y com agudo | |
222 | þ | þ | þ | Letra maiúscula latina Thorn | |
235 | A" | A" | A" | Letra minúscula latina e com diaeresis | |
236 | ì | ì | ì | Letra minúscula latina i com sepultura | |
237 | A | A | A | Letra minúscula latina i com agudo | |
238 | î | î | î | Letra minúscula latina i com circunflexo | |
69 | E | E | E | E | Letra latina E maiúscula |
70 | F | F | F | F | Letra F maiúscula latina |
71 | G | G | G | G | letra maiúscula latina G |
72 | H | H | H | H | Letra maiúscula latina H |
73 | EU | EU | EU | EU | letra maiúscula latina I |
74 | J | J | J | J | Letra latina J maiúscula |
75 | k | k | k | k | Letra maiúscula latina K |
76 | eu | eu | eu | eu | Letra maiúscula latina L |
77 | M | M | M | M | letra maiúscula latina M |
78 | N | N | N | N | Letra latina N maiúscula |
239 | A | A | A | Letra minúscula latina i com diaeresis | |
240 | ð | ð | ð | letras minúsculas latinas eth | |
241 | ñ | ñ | ñ | Letra minúscula latina n com til | |
242 | ò | ò | ò | Letra minúscula latina o com sepultura | |
243 | ó | ó | ó | Letra latina minúscula o com agudo | |
244 | A | A | A | Letra latina minúscula o com circunflexo | |
245 | õ | õ | õ | Letra latina o com til | |
246 | A¶ | A¶ | A¶ | Letra latina o com diaeresis | |
223 | ß | ß | ß | Letra minúscula latina sustenido s | |
224 | A | A | A | Letra minúscula latina a com sepultura | |
225 | A | A | A | Letra minúscula latina a com agudo | |
226 | ¢ | ¢ | ¢ | Letra latina minúscula a com circunflexo | |
227 | Ã £ | Ã £ | Ã £ | Letra minúscula a latina com til | |
228 | ä | ä | ä | Letra latina minúscula a com trema | |
229 | Ã¥ | Ã¥ | Ã¥ | Letra minúscula latina a com anel acima | |
230 | æ | æ | æ | letra minúscula latina ae | |
231 | A§ | A§ | A§ | Letra c minúscula latina com cedilha | |
232 | A | A | A | Letra minúscula latina e com sepultura | |
233 | é | é | é | Letra minúscula latina e com agudo | |
234 | ê | ê | ê | Letra minúscula latina e com circunflexo | |
254 | ¾ | ¾ | ¾ | Espinho de letras minúsculas latinas | |
255 | A | A | A | Letra latina minúscula y com trema | |
205 | A | A | A | Letra maiúscula latina I com agudo | |
206 | ÃŽ | ÃŽ | ÃŽ | Letra maiúscula latina I com circunflexo | |
207 | A | A | A | Letra maiúscula latina I com trema | |
208 | A | A | A | Letra maiúscula latina Eth | |
209 | A' | A' | A' | Letra maiúscula latina N com til | |
210 | A' | A' | A' | Letra maiúscula latina O com sepultura | |
211 | A" | A" | A" | Letra maiúscula latina O com agudo | |
212 | A" | A" | A" | Letra maiúscula latina O com circunflexo | |
96 | ` | ` | ` | ` | Acento grave |
97 | a | a | a | a | Letra minúscula latina a |
98 | b | b | b | b | letra minúscula latina b |
99 | c | c | c | c | letra minúscula latina c |
100 | d | d | d | d | letra d minúscula latina |
101 | e | e | e | e | letra latina e |
102 | f | f | f | f | letra minúscula latina f |
103 | g | g | g | g | letra minúscula latina g |
104 | h | h | h | h | letra minúscula latina h |
105 | eu | eu | eu | eu | letra minúscula latina i |
106 | j | j | j | j | letra minúscula latina j |
107 | k | k | k | k | letra minúscula latina k |
108 | eu | eu | eu | eu | letra minúscula latina l |
109 | m | m | m | m | letra minúscula latina m |
110 | n | n | n | n | letra minúscula latina n |
111 | o | o | o | o | letra minúscula latina o |
112 | p | p | p | p | Letra p minúscula latina |
113 | q | q | q | q | letra minúscula latina q |
114 | r | r | r | r | letra latina minúscula r |
115 | s | s | s | s | letra minúscula s |
116 | t | t | t | t | letra minúscula latina t |
117 | você | você | você | você | letra latina minúscula u |
118 | v | v | v | v | letra minúscula latina v |
119 | c | c | c | c | letra minúscula latina w |
120 | x | x | x | x | letra minúscula latina x |
121 | y | y | y | y | letra minúscula latina y |
122 | z | z | z | z | letra minúscula latina z |
123 | { | { | { | { | colchete esquerdo |
124 | | | | | | | | | Linha vertical |
125 | } | } | } | } | Colchete direito |
126 | ~ | ~ | ~ | ~ | Til |
127 | DEL | Excluir | |||
128 | € | símbolo do euro | |||
129 | A | A | A | NÃO USADO | |
130 | ‚ | aspas simples de baixo 9 | |||
131 | Æ' | Letra latina f minúscula com gancho | |||
132 | „ | aspas duplas de baixo 9 | |||
133 | ... | reticências horizontais | |||
134 | “ | punhal | |||
135 | ‡ | punhal duplo | |||
136 | ˆ | letra modificadora acento circunflexo | |||
137 | ‰ | sinal por mil | |||
138 | A | Letra S maiúscula latina com caron | |||
139 | ‹ | aspas simples de ângulo apontando para a esquerda | |||
140 | A' | Ligadura maiúscula latina OE | |||
141 | A | A | A | NÃO USADO | |
142 | Ž | Letra maiúscula latina Z com caron | |||
143 | A | A | A | NÃO USADO | |
144 | A | A | A | NÃO USADO | |
145 | ' | Aspas simples esquerdas | |||
146 | ' | Aspas simples direitas | |||
147 | “ | Aspas duplas esquerdas | |||
148 | “ | Aspas duplas à direita | |||
149 | • | Bala | |||
247 | A· | A· | A· | sinal de divisão | |
248 | A | A | A | Letra latina minúscula o com traço | |
249 | ù | ù | ù | Letra latina minúscula u com sepultura | |
250 | ú | ú | ú | Letra latina minúscula u com agudo | |
251 | A" | A" | A" | Letra minúscula latina com circunflexo | |
252 | ¼ | ¼ | ¼ | Letra latina u com trema | |
253 | ¼ | ¼ | ¼ | Letra minúscula latina y com agudo | |
150 | - | travessão | |||
151 | - | travessão | |||
152 | ˜ | pequeno til | |||
153 | № | Sinal de marca registrada | |||
154 | A | Letra latina minúscula s com caron | |||
155 | › | Aspas simples de ângulo apontando para a direita | |||
156 | A" | ligadura pequena latina oe | |||
157 | A | A | A | NÃO USADO | |
158 | ž | Letra minúscula latina z com caron | |||
159 | A | Letra maiúscula latina Y com trema | |||
160 | espaço sem pausa | ||||
161 | A | A | A | ponto de exclamação invertido | |
162 | ¢ | ¢ | ¢ | sinal de centavo | |
163 | £ | £ | £ | sinal de libra | |
164 | ¤ | ¤ | ¤ | sinal de moeda | |
165 | ¥ | ¥ | ¥ | sinal de iene | |
166 | ¦ | ¦ | ¦ | barra quebrada | |
167 | A§ | A§ | A§ | sinal de seção | |
168 | A | A | A | trema | |
169 | © | © | © | sinal de direitos autorais | |
170 | ª | ª | ª | indicador ordinal feminino | |
171 | A" | A" | A" | aspas de ângulo duplo apontando para a esquerda | |
172 | ¬ | ¬ | ¬ | não assine | |
173 | A | A | A | hífen suave | |
174 | ® | ® | ® | sinal registrado | |
175 | A | A | A | macron | |
176 | ° | ° | ° | sinal de grau | |
177 | ± | ± | ± | sinal de mais-menos | |
178 | ² | ² | ² | sobrescrito dois | |
179 | ³ | ³ | ³ | sobrescrito três | |
180 | A | A | A | acento agudo | |
181 | μ | μ | μ | micro sinal | |
182 | A¶ | A¶ | A¶ | sinal de travesseiro | |
183 | A· | A· | A· | ponto do meio | |
184 | A | A | A | cedilha | |
185 | ¹ | ¹ | ¹ | um sobrescrito | |
186 | º | º | º | indicador ordinal masculino | |
187 | A" | A" | A" | aspas de ângulo duplo apontando para a direita | |
188 | ¼ | ¼ | ¼ | fração vulgar um quarto | |
189 | ½ | ½ | ½ | fração vulgar metade | |
190 | ¾ | ¾ | ¾ | fração vulgar três quartos | |
191 | A | A | A | ponto de interrogação invertido | |
192 | € | € | € | Letra maiúscula latina A com sepultura | |
193 | A | A | A | Letra maiúscula latina A com agudo | |
194 | A, | A, | A, | Letra maiúscula latina A com circunflexo | |
195 | Ã | Ã | Ã | Letra maiúscula latina A com til | |
196 | A" | A" | A" | Letra maiúscula latina A com trema | |
197 | A… | A… | A… | Letra maiúscula latina A com anel acima | |
198 | A† | A† | A† | Letra maiúscula latina AE | |
199 | A‡ | A‡ | A‡ | Letra maiúscula latina C com cedilha | |
213 | A• | A• | A• | Letra maiúscula latina O com til | |
214 | A- | A- | A- | Letra maiúscula latina O com trema | |
215 | A- | A- | A- | sinal de multiplicação |
caracteres ASCII:
Quando falamos de charset HTML , os valores 128 a 255 não são usados em ASCII. Os caracteres de controle em ASCII variam de 0 a 31 (e 127).
Para letras, dígitos e símbolos, o ASCII usa valores de 32 a 126.
Conjunto de caracteres ISO-8859-1:
128 a 159 não são operados em ISO-8859-1. De 0 a 127, ISO-8859-1 é idêntico ao ASCII no conjunto de caracteres HTML .
Os valores de 160 a 255 de ISO-8859-1 são idênticos aos de UTF-8 quando se trata de charset HTML .
Caracteres ANSI – Windows 1252:
No que diz respeito ao conjunto de caracteres HTML, os caracteres no intervalo de 128 a 159 são propriedade do ANSI. Os valores de 0 a 127 do ANSI são idênticos aos do ASCII.
Para valores entre 160 e 255, ANSI é idêntico ao UTF-8 quando se trata de conjunto de caracteres HTML .
Conjunto de caracteres UTF-8:
Quando falamos de charset HTML, um valor entre 128 e 159 não é utilizado pelo UTF-8. Mais de dez mil caracteres são suportados em UTF-8, começando com o valor 256.
Para valores de 0 a 127, UTF-8 é idêntico a ASCII.
Para valores entre 160 e 255, UTF-8 é idêntico a ANSI e 8859-1 em conjunto de caracteres HTML .
Benefícios dos Conjuntos de Caracteres HTML
Os conjuntos de caracteres HTML têm vários benefícios que podem melhorar a aparência, a acessibilidade e a clareza do conteúdo em um documento HTML. Aqui estão alguns dos benefícios de usar conjuntos de caracteres HTML:
- Suporte a idiomas: usar o conjunto de caracteres apropriado pode garantir que o conteúdo em diferentes idiomas seja exibido corretamente. Isso ocorre porque idiomas diferentes usam caracteres diferentes e usar o conjunto de caracteres apropriado pode ajudar a garantir que todos os caracteres do idioma sejam exibidos corretamente.
- Suporte a símbolos: Diferentes conjuntos de caracteres incluem vários símbolos e caracteres especiais que podem ser usados para aprimorar a aparência visual do conteúdo e torná-lo mais atraente e legível. Usar os símbolos apropriados pode ajudar a transmitir o significado de forma mais eficaz.
- Compatibilidade: usar um conjunto de caracteres padronizados, como Unicode, garante que o conteúdo seja exibido de forma consistente em diferentes dispositivos e sistemas operacionais. Isso ocorre porque todos os sistemas operacionais e navegadores da Web modernos são projetados para serem totalmente compatíveis com o Unicode.
- Acessibilidade: Conjuntos de caracteres podem ser usados para melhorar a acessibilidade do conteúdo para pessoas com deficiência visual ou outras deficiências. Certos caracteres ou símbolos podem fornecer dicas adicionais ou contexto para ajudar a entender o conteúdo, tornando-o mais fácil de ler e compreender.
- Clareza: Usar o conjunto de caracteres e símbolos apropriados pode melhorar a clareza e a legibilidade do conteúdo. Isso pode tornar mais fácil para os usuários digitalizar e entender rapidamente as informações apresentadas, levando a uma melhor experiência do usuário.
- Consistência: usar um conjunto de caracteres consistente em um documento HTML garante que todos os caracteres sejam exibidos corretamente e ajuda a manter um estilo visual e tom consistentes em todo o conteúdo. Isso pode aumentar o profissionalismo geral e a qualidade do conteúdo.