Съвет Винаги използвайте реклама XML

Основни характеристики за обработка на XML

Уче Ogbuji. Главен консултант, Fourthought, Inc.

Да започнем с това, ние трябва да разберем по отношение. Раздел 2.8 на W3C Препоръки за XML 1.0 и по-специално гласи:

Думата "трябва" е технически термин, RFC 2119, определя, както следва:

Тази дума или прилагателното "ПРЕПОРЪЧВА" означава, че в някои случаи може да има основателни причини за игнориране на тези правила, обаче, изборът на начина, по който всички последици трябва да бъдат разбрани и внимателно преценени.

Основният XML кодиране е Unicode. Всеки герой в XML-документ, е знак Unicode. Ако си спомняте този факт, че не е нужно да се избере. Най-важното, да се каже, факт е, че всички които не са празни елементи трябва да имат отваряне и затваряне маркер. Unicode характер е абстракция, така че трябва да има някакъв механизъм, който да представлява Unicode символи във форма, подходяща за преработка. Тази форма се нарича кодиране. Кодирането на документа е само за удобство, за предаването на документа, но трябва да се разбере, че същността на XML-съдържанието пак е ограничен до Unicode. Превод на до Unicode е задачата на анализатора.

Най-честите кодировки са UTF-8 и UTF-16, които предават Unicode символи, съответно, като последователност от 8-битови и 16-битови стойности. И двете от тези кодове трябва да бъдат подкрепени от анализатора. Ако кодиране не е зададен, XML процесор предполага, че се използва кодиране UTF-8 или UTF-16, в зависимост от наличието или отсъствието в началото на файла специален байт последователност (наречена Byte Поръчка Марк или BOM).

Забележка: File, използвайте UTF-16 трябва да започва с поредица от BOM, дори и ако кодирането е обявен правилно.

Самостоятелен (автономна)

резюмиране