Unicode и кирилица копие
И още един проблем се наблюдава в MS Word.
Забележка.
Тези проблеми обикновено не са на разположение в рамките на "руски" на Windows.
Когато пиша по-долу "Руска на Windows", това не означава само локализирана версия, където вместо бутона "Старт" - "Start". Не, това е, който и да е, дори и на интерфейса Windows на английски, където кирилица е страницата на системата код, което означава, система за код на страницата = "кирилица, 1251".
(Код на страницата System е разгледана подробно на страницата си "Пълен русификация, на системно ниво")
Така че тук не пиша dlinnogo. "Система, в която система кодовата страница = 1251.", аз използвам за такива системи се нарича "Руски на Windows".
Причината за описаните по-горе проблеми е, че тези нови Unicode-програми са много различни по отношение на езикова поддръжка от "старите" програми, които "знае" само "старите" (предишните) кодиране, като "Западна Европа, Code Page 1252" или "на кирилица , Code Page 1251 ".
(Не съм виждал на програмата, но тя се чете - не-Unicode програма)
- свалите файла в Word: получите нечетлив текст ( "безсмислици")
- запазете документа от Word в обикновен текстов файл (.txt): получите най-въпросителни вместо българина (.)
Въпросителни знаци ( ".") Когато копирате текст от български програми Unicode (Word 97+, Internet Explorer, Outlook Express, на MS Outlook, Netscape 7 / Mozilla.) В не-Unicode (Netscape 4.79, UltraEdit, Dreamweaver.).
Това обикновено се случва при никакви руски версия на Windows (тоест, когато System Code Page - не 1251).Преминаване от Unicode в текст не-Unicode се основава на система за код на страницата (код на страницата система), така че под Windows, където системата за кодовата страница - "Западна", се случва следното:
- Набор от символи (знаков набор) "Unicode" съдържа кирилица, но в "Европейски Западна" Кирилицата не е изобщо (има в горната част на таблицата - западноевропейски писма с диакритични знаци).
- Ето защо, когато се опитва да открие съвпадение на Руската писмото в характера Unicode, създаден от символи, "Западна", процедурата в резултат на преобразуване, въведете въпросителен знак ( "?"), Което означава:
"Никой не се намери съответствие набора от символи, който се прекодирано" ( "символ не е открит в мишена кодиране")
Ето защо всеки руски писмо в резултат от тази реализация се заменя със voprositvlny марка, с тази конвенционална "?", Нищо особено в него има :-) (много се питат в конференции, но тъй като на този въпросителен знак, за да получите руски писмо. В никакъв начин, това е редовен характер "?" и нищо повече)
- Копирайте текста от програми Unicode в този прозорец UniPad. UniPad разбира Unicode, така че ще видим нормална кирилица.
Там ще бъдат прекодирано от Unicode текст в не-Unicode -
за Unicode схема ---> "на кирилица (Windows)", ние ясно посочена (като в противен случай ще трябва да се преобразува обратно в "Западна" и кирилицата с изгубените, да се заменят с въпросителни знаци)
Това обикновено се случва при никакви руски версия на Windows, която е мястото, където на кирилица не е System Code Page (код на страницата система).
Unicode-програма "знае", че е налице обработка е текстът на български език (кирилица) и затова се използва за страницата код система до реализация на не-Unicode текст към Unicode.
Така например, в рамките на английската версия на Windows (код на страницата система - "Западна Европа", 1252), системата изглежда изходния код, като че ли е Западна Европа текст, а не кирилицата, и тя се превръща в схема Unicode
"Западна Европа, CP-1252" ---> Unicode
Това, разбира се, с кирилицата се случват лоши неща :)
Например:
В първоначалния текст на не-Unicode е руска буква "г". Нейният код кодирана в "Windows (кирилица), CP-1251" - 228.
Но Unicode програма се приема, че оригиналният текст не е в кирилица набор от символи, и "Западна, CP-1252"! В този кодиране стойност 228 - германско писмо а-умлаут ( "а" с две точки над него).
Ето защо не е тук като прекодиране:
не-Unicode а-умлаут ---> Unicode а-умлаут
и че германското писмо, което виждате - като :-) "безсмислици" - руски, а не "е", след като копирате в програмата на Unicode.
Има две възможни решения на този проблем. В някои случаи не работи много прост метод. 1. ако той не работи, а след това трябва да използвате универсалното няма метод. 2.
метод 1Използвайте следния метод при копиране на текст от български не-Unicode програми (Netscape 4.79, UltraEdit, Dreamweaver.) Към клипборда на Windows:
- Маркирайте текста, който искате
- Преди да. как да копирате, е необходимо, за да превключите клавиатурата на българина.
Това означава, че най-taskbar'e е "RU", когато Ctrl / C преса.
По този начин ли да кажете на системата, която да копира текст - кирилицата, а не "Западна".
Ще видите нормално кирилица!
метод 2
да не копира-Unicode -> Unicode
- Маркирайте и копирайте текста в не-Unicode програма
- Вмъкване на текст в този прозорец UniPad специален начин:
Edit / Paste Като
(Въвеждане показва кодиране ")
В списъка, намерете желаните знакови множества - "Windows CP-1251 (кирилица)" и кликнете върху "OK".
Няма да има преобразуване от не-Unicode текст към Unicode -
схема "на кирилица (Windows-1251)" ---> Unicode, ние ясно посочена (в противен случай системата би си помислил, че оригиналният текст - кодиране "Западна")
Кирилица MS Word 97 и по-късно:
работи с обикновен текст (.txt) файл
- Опитвайки се да свалите файла в Word: безсмислици на екрана вместо krillitsy
- Запази в документ на Word като "Само текст (* .txt)": само "въпросителен знак" вместо българина в файл на диска.
Тези два проблема не са български Windows, си ти, къде кирилица (CP-1251) не е система за код на страницата (код на страницата система).
Решение: Уверете се, че ясно на системата, че това просто не-Unicode текст - е кодиран в "кирилица (Windows-1251)", а не този, който съответства на страницата на системата код.
Подробно описание на решенията на тези 2 проблеми с обикновен текстов файл, (.TXT)
Изтегляне (Open File /) кирилица .TXT в MS Word 97+
Dopistim, имате обикновен текстов файл с кодиране a.txt кирилица 1251 (често се нарича "кирилица (Windows)" или "Windows-1251").
- Инструменти / Настройки / Общи и там да се сложи отметка в "Confirm покръстването на Open" (показване на диалог на реализация, когато File / Open)
- Ако вече имате Netscape версия 4 и по-нова версия, можете да използвате най-простият метод:
използвате Netscape
Ако не разполагате с Netscape, след това тук е друго решение, което изисква по-голям брой стъпки:
Чрез Нетскейп, направете File / Open, изберете "текст (.txt)", тъй като "Тип файлове".Вашият български a.txt файл се зарежда в прозореца на Netscape. Сега трябва да промените кодирането:
- Netscape 6 - View / Character Encoding / кирилица (Windows-1251)
- в Netscape 4.5+ - View / Character Set / кирилица (Windows-1251)
- в Netscape 4.0 х: Виж / Encoding / кирилица (Windows-1251)
Сега на екрана трябва да бъде нормален български текст и можете лесно да го копирате в Word 97.
Спасяването (File / SaveAs) български документ от Word 97+ като "Само текст (.txt)"
Да предположим, че имате прозорец в Word 97 (или по-висока) - български документ и искате да го запазите като обикновен текстов файл a.txt.
Създаден .TXT файл ще съдържа нормален Windows-1251 текста, а не "въпросителни знаци.