Antes da introdução do HTML5, definir a codificação de caracteres em um documento com um elemento requeria que você escrevesse a linha um pouco detalhada abaixo. Estes são os elementos Meta Charset se você estivesse usando HTML4 em sua página da web:
O que é importante notar neste codeare as aspas que você vê ao redor do conteúdo atributo: content = ' text / html; charset = iso-8859-1 ' . Como todos os atributos HTML, essas aspas definem o valor do atributo, indicando que a cadeia inteira text / html; charset = iso-8959-1 é o conteúdo deste elemento. Este é um HTML adequado e é assim que esta string foi escrita. Também é pesado e longo e feio! Também não é algo que você provavelmente se lembraria do topo da sua cabeça! Na maioria dos casos, os desenvolvedores da Web precisariam copiar e colar esse código de um site para qualquer novo que estivessem desenvolvendo, porque escrever isso do zero era pedir muito.
HTML5 elimina as "coisas" extras
O HTML5 não apenas adicionou vários novos elementos ao idioma, mas também simplificou bastante a sintaxe do HTML, incluindo o elemento Meta Charset. Com o HTML5, você pode adicionar a codificação de caracteres com a sintaxe muito mais fácil de lembrar para o idioma.META elemento que você vê abaixo:
Compare essa sintaxe simplificada com o que escrevemos no começo deste artigo, a antiga sintaxe usada para HTML4, e você verá como é mais fácil escrever e lembrar que a versão HTML5 realmente é. Em vez de precisar copiar e colar isso de um site existente em um novo site em que você estava trabalhando, isso é absolutamente algo que, como um desenvolvedor da Web de front-end, você poderia lembrar. Essa economia de tempo não é muito, mas quando você considera as outras áreas de sintaxe que o HTML5 simplificou, as economias se somam!
Sempre inclua a codificação de caracteres
Você deve sempre incluir a codificação de caracteres para suas páginas da Web, mesmo que você nunca pretenda usar caracteres especiais. Se você não incluir uma codificação de caracteres, seu site se tornará vulnerável a um ataque de script entre sites usando o UTF-7.
Nesse cenário, um invasor vê que seu site não tem codificação de caracteres definida, por isso engana o navegador, fazendo-o pensar que a codificação de caracteres da página é, na verdade, UTF-7. Em seguida, o invasor injeta scripts codificados em UTF-7 na página da Web e seu site é hackeado. Isso é obviamente problemático para todos os envolvidos, desde sua empresa até seus visitantes. A boa notícia é que é um problema simples de se evitar - apenas certifique-se de adicionar a codificação de caracteres a todas as suas páginas da web.
Onde adicionar codificação de caracteres
A codificação de caracteres para uma página da Web deve ser a primeira linha dos seus HTMLs
Isso garante que o navegador saiba o que a codificação de caracteres é antes de fazer qualquer outra coisa na página além de determinar o tipo de documento e identificar que é uma página HTML. Seu HTML deve ler:…
Usando cabeçalhos HTTP para segurança extra
Você também pode especificar a codificação de caracteres nos cabeçalhos HTTP. Isso é ainda mais seguro do que adicioná-lo à página HTML, mas você precisaria ter acesso às configurações do servidor ou aos arquivos .htaccess, o que significa que talvez seja necessário trabalhar com o provedor de hospedagem do seu site para obter esse tipo de acesso ou fazê-los as mudanças para você. O acesso é realmente o desafio aqui. A alteração em si é simples, portanto, qualquer provedor de hospedagem deve ser capaz de fazer essa alteração para você com relativa facilidade.
Se você estiver usando o Apache, poderá definir o conjunto de caracteres padrão para todo o site, adicionando: AddDefaultCharset UTF-8 para sua raiz .htaccess Arquivo. O conjunto de caracteres padrão do Apache é ISO-8859-1.




