Как трябва да се кодира с HTML

Този път ще говорим за кодиране в HTML: какво е това, как да се каже на браузъра, и защо трябва да използвате UTF-8, а понякога и Windows-1251. Материалът е предназначен за начинаещи и включва всичко необходимо, за да получите подробен отговор на този въпрос.

Как трябва да се кодира с HTML

Encoding HTML-страници

HTML кодиране на страницата трябва да бъдат посочени, така че браузърът може да показва правилно, съдържаща се в него, информация за текста. Ако вашият браузър не правилно признае кодиращите HTML-страници, вместо текста получаваме "krakozyabriki". Защо се случва това?

Encoding (английски набор от знаци.) - една маса, която е прикрепена тяхното графично представяне на всеки един от героите код. Ако кодиране се определя правилно за всеки код символ, за да се използва неправилно графично изображение.

Кажи на браузъра на HTML-кодиран

Да ви кажа браузър кодиране на HTML страницата, един от следните методи могат да се използват:

Вариант 1: посочете също и кодирането в заглавката на HTTP.

Така например, през конфигурацията на сървъра или съответните функции на език уеб програмиране. Така PHP има функция заглавна () за това. С оглед на проблема, решението може да бъде, както следва:

глава ( "Content-Type: текст / HTML; кодировка = KOI8-R");

Забележка. изпращане на HTTP хедър трябва да се проведе преди оттеглянето на съдържанието на HTML-страници.

Вариант 2: да се уточни кодирането в мета маркер Content-Type

Content-Type мета тагове е поставена в самия HTML-документ, в главата на секцията, като:

Спецификацията на HTML 5, този мета получи намалена формат, например:

Как трябва да се кодира в HTML?

В момента един от най-общоприетите и стандартизирани текстови кодировки, която ви позволява да съхранявате Unicode кодировка стойност е 8-битов UTF-8.

Едно от предимствата му е съвместима с ASCII, което дава печалбата по обем в сравнение с по-напредналите кодиране UTF-16 и UTF-32.

Ето защо, най-добре е да се използва UTF-8.

Но ако говорим за кирилицата, тук можем да получим някои проблеми. Обикновено те не са от решаващо значение и може да бъде решен. Например, можете да откриете често проблем с необходимостта да изтриете знака на BOM WordPpress.

Ето защо Windows-1251 все още продължава да се радва на много широка популярност.

По същество, Windows-1251 е сходна с други 8-битови кодировки (като CP866, KOI8-R и ISO 8859-5) е наличието на почти всички герои, използвани в типографията на руски обикновен текст; тя също така съдържа всички знаци за другите славянски езици: украински, belobolgarskogo, сръбски, македонски и български.

За да обобщим

Така че, ако не планирате да използвате някои готови решения, като блог двигател WordPress, и ще започнем да създават свои собствени уеб сайтове. на Windows-1251 е по-предпочитана. Но е необходимо да се стреми да гарантира, че постепенният преход към UTF-кодиране, те са бъдещето.