Unicode и кирилица копие

И още един проблем се наблюдава в MS Word.

  • при работа с текстови файлове (.txt) в Word 97+ -. "безсмислици" при зареждане на такава документация, Word, както и "въпросителни", вместо на кирилица когато запазвате документ от Word'a като файл .txt ""
  • Забележка.
    Тези проблеми обикновено не са на разположение в рамките на "руски" на Windows.
    Когато пиша по-долу "Руска на Windows", това не означава само локализирана версия, където вместо бутона "Старт" - "Start". Не, това е, който и да е, дори и на интерфейса Windows на английски, където кирилица е страницата на системата код, което означава, система за код на страницата = "кирилица, 1251".
    (Код на страницата System е разгледана подробно на страницата си "Пълен русификация, на системно ниво")

    Така че тук не пиша dlinnogo. "Система, в която система кодовата страница = 1251.", аз използвам за такива системи се нарича "Руски на Windows".

    Причината за описаните по-горе проблеми е, че тези нови Unicode-програми са много различни по отношение на езикова поддръжка от "старите" програми, които "знае" само "старите" (предишните) кодиране, като "Западна Европа, Code Page 1252" или "на кирилица , Code Page 1251 ".

  • Macromedia Dreamweaver - влизане прозорец текст
    (Не съм виждал на програмата, но тя се чете - не-Unicode програма)
  • MS Word 97 проблем (и по-късно) и кирилица .txt файлове -
    • свалите файла в Word: получите нечетлив текст ( "безсмислици")
    • запазете документа от Word в обикновен текстов файл (.txt): получите най-въпросителни вместо българина (.)
  • Въпросителни знаци ( ".") Когато копирате текст от български програми Unicode (Word 97+, Internet Explorer, Outlook Express, на MS Outlook, Netscape 7 / Mozilla.) В не-Unicode (Netscape 4.79, UltraEdit, Dreamweaver.).

    Това обикновено се случва при никакви руски версия на Windows (тоест, когато System Code Page - не 1251).
    Преминаване от Unicode в текст не-Unicode се основава на система за код на страницата (код на страницата система), така че под Windows, където системата за кодовата страница - "Западна", се случва следното:
    • Набор от символи (знаков набор) "Unicode" съдържа кирилица, но в "Европейски Западна" Кирилицата не е изобщо (има в горната част на таблицата - западноевропейски писма с диакритични знаци).
    • Ето защо, когато се опитва да открие съвпадение на Руската писмото в характера Unicode, създаден от символи, "Западна", процедурата в резултат на преобразуване, въведете въпросителен знак ( "?"), Което означава:
      "Никой не се намери съответствие набора от символи, който се прекодирано" ( "символ не е открит в мишена кодиране")

    Ето защо всеки руски писмо в резултат от тази реализация се заменя със voprositvlny марка, с тази конвенционална "?", Нищо особено в него има :-) (много се питат в конференции, но тъй като на този въпросителен знак, за да получите руски писмо. В никакъв начин, това е редовен характер "?" и нищо повече)

  • Причина UniPad и отваряне на нов документ - File / New
  • Сега можете да използвате този прозорец като "спирка", когато копиране:
    • Копирайте текста от програми Unicode в този прозорец UniPad. UniPad разбира Unicode, така че ще видим нормална кирилица.

    Там ще бъдат прекодирано от Unicode текст в не-Unicode -
    за Unicode схема ---> "на кирилица (Windows)", ние ясно посочена (като в противен случай ще трябва да се преобразува обратно в "Западна" и кирилицата с изгубените, да се заменят с въпросителни знаци)

  • Teper, можете да вмъкнете текст в желаната програма (правя Paste), кирилица, не се заменя с въпросителни знаци, защото Система isvestno че текстът - на кирилица набор от символи (Windows), а не в тази, която е страницата система код ( "западната").
  • Това обикновено се случва при никакви руски версия на Windows, която е мястото, където на кирилица не е System Code Page (код на страницата система).
    Unicode-програма "знае", че е налице обработка е текстът на български език (кирилица) и затова се използва за страницата код система до реализация на не-Unicode текст към Unicode.
    Така например, в рамките на английската версия на Windows (код на страницата система - "Западна Европа", 1252), системата изглежда изходния код, като че ли е Западна Европа текст, а не кирилицата, и тя се превръща в схема Unicode
    "Западна Европа, CP-1252" ---> Unicode

    Това, разбира се, с кирилицата се случват лоши неща :)

    Например:
    В първоначалния текст на не-Unicode е руска буква "г". Нейният код кодирана в "Windows (кирилица), CP-1251" - 228.
    Но Unicode програма се приема, че оригиналният текст не е в кирилица набор от символи, и "Западна, CP-1252"! В този кодиране стойност 228 - германско писмо а-умлаут ( "а" с две точки над него).
    Ето защо не е тук като прекодиране:
    не-Unicode а-умлаут ---> Unicode а-умлаут
    и че германското писмо, което виждате - като :-) "безсмислици" - руски, а не "е", след като копирате в програмата на Unicode.

    Има две възможни решения на този проблем. В някои случаи не работи много прост метод. 1. ако той не работи, а след това трябва да използвате универсалното няма метод. 2.

    метод 1
    Използвайте следния метод при копиране на текст от български не-Unicode програми (Netscape 4.79, UltraEdit, Dreamweaver.) Към клипборда на Windows:
    • Маркирайте текста, който искате
    • Преди да. как да копирате, е необходимо, за да превключите клавиатурата на българина.
      Това означава, че най-taskbar'e е "RU", когато Ctrl / C преса.

    По този начин ли да кажете на системата, която да копира текст - кирилицата, а не "Западна".

  • в противен случай - с използване на универсален метод 2
  • В предложената списъка, изберете "камбана" (или би трябвало да бъде)
  • Ще видите нормално кирилица!

    метод 2
    да не копира-Unicode -> Unicode

  • Причина UniPad и отваряне на нов документ - File / New
  • Сега можете да използвате този прозорец като "спирка", когато копиране:
    • Маркирайте и копирайте текста в не-Unicode програма
    • Вмъкване на текст в този прозорец UniPad специален начин:
      Edit / Paste Като
      (Въвеждане показва кодиране ")

    В списъка, намерете желаните знакови множества - "Windows CP-1251 (кирилица)" и кликнете върху "OK".

    Няма да има преобразуване от не-Unicode текст към Unicode -
    схема "на кирилица (Windows-1251)" ---> Unicode, ние ясно посочена (в противен случай системата би си помислил, че оригиналният текст - кодиране "Западна")

    Кирилица MS Word 97 и по-късно:
    работи с обикновен текст (.txt) файл

    • Опитвайки се да свалите файла в Word: безсмислици на екрана вместо krillitsy
    • Запази в документ на Word като "Само текст (* .txt)": само "въпросителен знак" вместо българина в файл на диска.

    Тези два проблема не са български Windows, си ти, къде кирилица (CP-1251) не е система за код на страницата (код на страницата система).

    Решение: Уверете се, че ясно на системата, че това просто не-Unicode текст - е кодиран в "кирилица (Windows-1251)", а не този, който съответства на страницата на системата код.


    Подробно описание на решенията на тези 2 проблеми с обикновен текстов файл, (.TXT)


    Изтегляне (Open File /) кирилица .TXT в MS Word 97+

    Dopistim, имате обикновен текстов файл с кодиране a.txt кирилица 1251 (често се нарича "кирилица (Windows)" или "Windows-1251").

    • Инструменти / Настройки / Общи и там да се сложи отметка в "Confirm покръстването на Open" (показване на диалог на реализация, когато File / Open)
    Има няколко начина за решаване на проблемите на българската .TXT изтегляне в Word 97 от неруски колата с помощта на помощната програма, като междинна стъпка. нека да разгледаме две от тях:
    • Ако вече имате Netscape версия 4 и по-нова версия, можете да използвате най-простият метод:
      използвате Netscape

    Ако не разполагате с Netscape, след това тук е друго решение, което изисква по-голям брой стъпки:

    Чрез Нетскейп, направете File / Open, изберете "текст (.txt)", тъй като "Тип файлове".
    Вашият български a.txt файл се зарежда в прозореца на Netscape. Сега трябва да промените кодирането:
    • Netscape 6 - View / Character Encoding / кирилица (Windows-1251)
    • в Netscape 4.5+ - View / Character Set / кирилица (Windows-1251)
    • в Netscape 4.0 х: Виж / Encoding / кирилица (Windows-1251)

    Сега на екрана трябва да бъде нормален български текст и можете лесно да го копирате в Word 97.


    Спасяването (File / SaveAs) български документ от Word 97+ като "Само текст (.txt)"

    Да предположим, че имате прозорец в Word 97 (или по-висока) - български документ и искате да го запазите като обикновен текстов файл a.txt.

    Създаден .TXT файл ще съдържа нормален Windows-1251 текста, а не "въпросителни знаци.

  • Сега, в на UltraEdit, когато видиш един нормален български текст, можете да го запишете като a.txt чрез файл / SaveAs.