Знайте, Intuit, лекция, кодиращ българската азбука

В момента пет различни таблици за кодиране най-често се използват за официално представяне на българската азбука (!):

I. ISO 8859-5 - международен стандарт;
II. Код страница 866 (Microsoft CP866) - използва се в MS-DOS;
III. Код страница 1251 (Microsoft CP1251) за Microsoft Windows;
IV. Въз основа на ГОСТ KOI-8, KOI8-R - се използва в света на Unix;
V. Unicode - се използва в Microsoft Windows, Unix клонинги и Unix.

Основният кодиране ГОСТ В (БДС на СССР) от 1987 се основава на препоръките на ISO, а по-късно става основа за представяне на символи на българските букви в Unicode. Това кодировки и II, III и V всички букви изключение д и Е са подредени по азбучен ред. На практика това кодиране може да се намери само на старите IBM PC съвместими компютри, ЕС-1840 г. и някои принтери. Интернет браузъри обикновено го поддържат заедно с кодирането II-IV.

CP866 кодиране, разработен въз основа на алтернативния кодиране ГОСТ, създаден специално за операционната система MS-DOS, в която рисуване символи се използва често. В този кодиране, тези герои имат същите кодове, както и стандартен IBM PC съвместим компютър.

Алтернативен кодиране ГОСТ, който има два варианта, CP866 съвпада с позициите за буквите от азбуката и бележи българските pseudographics. Basic Encoding стандарт ISO 8859-5 съвпада с единствените всички признаци на българските букви, с изключение на главна буква Y. а

Използване на cp1251 се дължи почти изцяло на влиянието на технологиите за развитие на Microsoft за компютър на компанията. В най-пълно в сравнение с I, II, IV представя символи като ,, №, различни видове котировки и тире и т. П.

Encoding Unicode UCS символи, основани на директория (Universal знаков набор) ISO 10646. UCS стандарт могат да съдържат до 2 31 различни герои. Код UCS -2 - 2-байт, UCS -4 - 4 байта. Се използват като кодове на променлива дължина UTF-8 (Unicode Transfer Format) - 1 6-байт най-съвместими с ASCII, UTF-16, и - 2-байт или 4. Unicode в своите приложения се реализира само частично, изцяло и все още никъде не се поддържа. Linux използва UTF-8.

Широко се използва ASCII кодиране въз основа на:

VI. Въз основа на KOI-7 - може да се използва при липса на кирилица код шрифта получава чрез изваждане на 128 от съответния код KOI8-R, които обикновено се дава код главна буква, фонетично близо до руски.

Кодирания VI не е видим символ за б

По-долу е на маса. който представя всички методи за кодиране на българската азбука. В тази таблица, колона 1 са символ на писма, в колона 2 на имената на буквите в Unicode 3.2 (името с малки букви на кирилица започва с думите на кирилица малка буква и капиталови -.... кирилица главна буква тонове на пълното име на писмо D - на кирилица главна буква DE ) в колона I на V десетичен и шестнадесетичен кодове, съответстващи на таблици за кодиране. и в колона VI - ASCII символи за KOI-7.

Освен по-горе може да се използва, за да се срещне друга администрация кодировки ГОСТ български кодиране също наречен MIC. Interprog или "версия на компютърния център на СССР стария." На компютри, работещи Macintosh OS също така се използва собствената си маса кодиране за българските букви в своите набори от символи са почти идентични с cp1251.

Знайте, Intuit, лекция, кодиращ българската азбука