Tag Meta Charset v HTML5

Nastavení kódování znaků v jazyce HTML5

Před zavedením kódu HTML5 nastavte kódování znaků na dokument s elementrequiredyou, abyste napsali poněkud podrobný řádek níže. Jedná se o prvky Meta Charset, pokud jste na své webové stránce použili HTML4:

Co je důležité v tomto kodeře uvést uvozovky, které vidíte kolem atributu content : content = " text / html; charset = iso-8859-1 " . Stejně jako všechny atributy HTML tyto uvozovky určují hodnotu atributu, což znamená, že celý řetězec text / html; charset = iso-8959-1 je obsah tohoto elementu.To je správný HTML a je to jak tento řetězec měl být napsán. Je také nepříjemně dlouhá a ošklivá! Není to také něco, co byste si pravděpodobně pamatovali z vrcholu své hlavy! Ve většině případů by weboví vývojáři museli zkopírovat a vložit tento kód z jednoho webu do nového, který si vyvíjejí, protože to napsal od nuly a ptá se hodně.

HTML5 zkracuje extra & # 34; Stuff & # 34;

HTML5 nejen přidal do jazyka několik nových prvků , ale také značně zjednodušilo syntaxi HTML, včetně prvku Meta Charset. Pomocí HTML5 můžete přidat kódování znaků pomocí mnohem jednodušší zapamatovatelné syntaxe elementu META, který vidíte níže:

Porovnejte tuto zjednodušenou syntaxi s tím, co jsme napsali na začátku tohoto článku, starou syntaxi používanou pro HTML4 a uvidíte, jak je mnohem snazší psát a zapamatovat si verzi HTML5. Místo toho, že byste museli z existujícího webu zkopírovat a vložit do nějakého nového, na kterém jste pracovali, je to naprosto něco, co byste si jako webový vývojář na frontě mohli vzpomenout. Tato úspora času mnoho není moc, ale když zvážíte ostatní oblasti syntaxe, které HTML5 zjednodušuje, úspory se zvyšují!

Vždy zahrňte kódování znaků

Měli byste vždy zahrnout kódování znaků pro vaše webové stránky, a to ani v případě, že jste nikdy neměli nějaké speciální znaky . Pokud nezahrnujete kódování znaků, vaše stránky se stanou zranitelnými útokem skriptování na webu, který používá UTF-7.

V tomto scénáři anattacker vidí, že váš web nemá definované kódování znaků, takže prohlížeč přiměje, aby si myslel, že kódování znaků stránky je vlastně UTF-7. Potom útočník injektuje do webové stránky skripty kódované kódem UTF-7 a vaše stránky jsou hackované. To je zjevně problematické pro všechny zúčastněné, od vaší společnosti až po vaše návštěvníky. Dobrou zprávou je, že je to jednoduchý problém, abyste se vyhnuli - stačí přidat kódování znaků na všechny vaše webové stránky.

Kde lze přidat kódování znaků

Kódování znaků pro webovou stránku by mělo být prvním řádkem prvku vašeho HTML.To zajišťuje, že prohlížeč ví, co je znakové kódování předtím, než dělá cokoliv jiného na stránce, než aby zjistil, že je to doctype a zda je HTML stránky. Váš HTML by měl číst:

...

Použití hlaviček HTTP pro extra zabezpečení

Můžete také zadat kódování znaků v hlavičkách HTTP. Je to ještě bezpečnější než přidání na stránku HTML, ale měli byste mít přístup k konfigurací serverů nebo souborům .htaccess, což znamená, že budete muset pracovat s poskytovateli hostingu webových stránek, abyste získali tento přístup nebo je nechali změny pro vás. Přístup je opravdu výzvou. Samotná změna je jednoduchá, takže jakýkoli poskytovatel hostingu by měl být schopen tuto změnu provést relativně snadno.

Pokud používáte možnost Apache, můžete nastavit výchozí sadu znaků pro celý web přidáním: AddDefaultCharset UTF-8 do kořenového souboru .htaccess . Výchozí znaková sada Apache je ISO-8859-1 .