Kak chitat' kirillitsu na Internete i peresylat' po e'lektronnoj pochte: nekotorye sovety i poyasneniya

Windows-1251 KOI8-R Translit     English version (old)


Avtor: Grigorij Naumovets
(E-mail: gri@gilan.uar.net- office ili grmail@grmail.sita.kiev.ua - home).

Dannyj tekst ne pretenduet na vseob^emlyushchuyu rol' i otrazhaet lichnyj opyt avtora. V razdele "Literatura" mozhno najti ssylki na drugie materialy po etomu voprosu. Avtor budet priznatelen za lyubye dopolneniya, ispravleniya ili kommentarii.

Data poslednej redaktsii: 25 oktyabrya 2000 g.
Samaya svezhaya versiya dannogo teksta dolzhna byt' dostupna na http://geocities.datacellar.net/g_naumovets



PRIMEChANIE: V dannom dokumente pod "kirillitsej" podrazumevayutsya glavnym obrazom teksty na russkom ili ukrainskom yazyke. Voprosy, spetsifichnye dlya drugih yazykov, ispol'zuyushchih kirillitsu, zdes' ne zatragivayutsya (naskol'ko ya znayu, teksty na e'tih yazykah chashche vsego predstavleny na Internete v kodirovke Windows-1251).

SODERZhANIE


Vstuplenie

Pri peresylke tekstovyh soobshchenij po e'lektronnoj pochte (v otlichie ot telefaksa) peredayutsya ne izobrazheniya bukv, a ih tsifrovye kody (v konechnom schete, posledovatel'nosti nulej i edinits, podobno tochkam i tire v azbuke Morze). Sistema kodirovaniya bukv i drugih simvolov (t.e. tablitsa sootvetstviya mezhdu bukvami i ih tsifrovymi kodami) nazyvaetsya kodirovkoj ili kodovoj tablitsej (inogda ispol'zuetsya eshcho termin "kodovaya stranitsa"). Pochtovaya programma otpravitelya pol'zuetsya kodovoj tablitsej dlya togo, chtoby preobrazovat' ishodnyj tekst pis'ma v posledovatel'nost' tsifrovyh kodov i v takom vide otpravit' adresatu. Pochtovaya programma adresata, pol'zuyas' svoej kodovoj tablitsej, preobrazuet poluchennye kody v bukvy i drugie simvoly, kotorye i vidit poluchatel'. Esli kodovye tablitsy, ispol'zuemye otpravitelem i poluchatelem, razlichny, mozhet poluchit'sya tak, chto vmesto ishodnogo teksta poluchatel' uvidit u sebya na e'krane lish' bessmyslennyj nabor bukv. Takim obrazom, voznikaet problema soglasovaniya kodirovok -- i reshit' e'tu problemu ne tak uzh prosto, poskol'ku vsemirnaya komp'yuternaya set' Internet soedinyaet sotni millionov komp'yuterov raznyh tipov, raspolozhennyh v raznyh stranah i rabotayushchih s razlichnymi operatsionnymi sistemami. E'ta set' ne sozdavalas' kem-to "sverhu" po zaranee namechennomu planu i edinomu zamyslu -- ona sformirovalas' "snizu" v rezul'tate rosta i srastaniya raznorodnyh lokal'nyh, korporativnyh, regional'nyh komp'yuternyh setej, u kotoryh byli svoi sobstvennye standarty i traditsii. K schast'yu, standart, razrabotannyj dlya kodirovaniya bukv anglijskogo alfavita, bystro stal obshcheprinyatym, i poe'tomu pri peresylke tekstov, zapisannyh "prostoj" (bez diakriticheskih znakov) latinitsej, voprosov po povodu vybora toj ili inoj kodirovki ne voznikaet. Drugim yazykam povezlo men'she, i poe'tomu vyhod za ramki "prostoj latinitsy" porozhdaet "kodirovochnye" problemy. Odnim iz "nevezuchih" yazykov okazalsya i russkij, poskol'ku kodirovki, pridumannye dlya bukv kirillitsy, otlichayutsya osobym raznoobraziem. Chtoby ponyat', kakie iz-za etogo mogut voznikat' problemy i kak ih reshat', nuzhno imet' predstavlenie ob osnovnyh kodovyh tablitsah kirillitsy i o tom, chto mozhet proishodit' s tekstami pri ih obrabotke pochtovymi programmami i pochtovymi serverami.

Kodovaya tablitsa ASCII i naibolee rasprostranennye kodirovki kirillitsy

Dlya kodirovki bukv latinskogo alfavita obshcheprinyatym yavlyaetsya standart ASCII (American Standard Code for Information Interchange - "amerikanskij standartnyj kod obmena informatsiej"). V nem bukvam latinskogo alfavita, a takzhe tsifram, znakam prepinaniya i osnovnym simvolam (sm. tablitsu) sootvetstvuyut tsifrovye kody, desyatichnye znacheniya kotoryh lezhat v diapazone ot 32 do 127 (diapazon kodov 0-31 zanyat spetsial'nymi "upravlyayushchimi" simvolami, takimi, kak perehod na novuyu stroku ili novuyu stranitsu, zvukvoj signal i t.p.). Teksty, zapisannye "prostoj latinitsej", eshcho nazyvayut 7-bitnymi, poskol'ku dlya ih kodirovaniya dostatochno semi dvoichnyh razryadov. (Vozvedenie dvojki v sed'muyu stepen' daet 128, poe'tomu sem'yu dvoichnymi razryadami mozhno zakodirovat' 128 razlichnyh bukv i simvolov). Esli takoj tekst peresylaetsya po e'lektronnoj pochte, to ego kodirovka obychno ukazyvaetsya v sluzhebnyh polyah pis'ma strokoj: Content-Type: text/plain; charset="us-ascii".
ASCII table Bukvy "prostoj latinitsy" i osnovnye simvoly, vhodyashchie v tablitsu ASCII

Dlya kodirovki "natsional'no-spetsifichnyh" bukv i drugih simvolov, vyhodyashchih za ramki tablitsy ASCII, byli zadejstvovany tsifrovye kody v diapazone ot 128 do 255. (Takie kody nazyvayut 8-bitnymi, poskol'ku oni sostoyat uzhe iz vos'mi dvoichnyh razryadov). Ponyatno, chto etot diapazon nedostatochno shirok, chtoby vmestit' nekuyu "universal'nuyu" tablitsu, vklyuchayushchuyu bukvy mnozhestva razlichnyh alfavitov. Bylo razrabotano mnozhestvo 8-bitnyh kodovyh tablits, prednaznachennyh dlya kodirovki bukv razlichnyh yazykov. Bolee togo, dlya mnogih yazykov byli pridumany po neskol'ku kodovyh tablits, razlichayushchihsya, naprimer, v zavisimosti ot operatsionnoj sistemy, kotoroj pol'zovalis' razrabotchiki.

Vazhno ponimat', chto sam po sebe 8-bitnyj kod ne pozvolyaet odnoznachno opredelit' bukvu ili simvol, kotorym on sootvetstvuet -- nuzhno eshcho znat', kakaya imenno kodovaya tablitsa ispol'zovalas' v dannom sluchae dlya kodirovki teksta (podobno tomu kak pri chtenii daty, v kotoroj god zapisan tol'ko dvumya tsiframi, neobhodimo znat', kakoe imenno stoletie podrazumevaetsya). Tak chto "problema 8-bitnyh kodirovok" v nekotorom smysle analogichna "probleme 2000 goda" -- e'konomiya kolichestva razryadov, ispol'zuemyh dlya zapisi daty libo teksta, privodit k neodnoznachnosti ih rasshifrovki.

V operatsionnoj sisteme Windows 3.1/3.11 dlya raboty s russkoyazychnymi tekstami ispol'zovalas' kodovaya stranitsa 1251 (ee nazyvayut takzhe "Windows-1251", libo prosto "kodirovka Windows"). Naprimer, esli nabrat' russkij tekst v MS Word for Windows i sohranit' ego kak "Text Only", to poluchennyj tekstovyj fajl budet zapisan imenno v etoj kodirovke. V posleduyushchih versiyah Windows kirillicheskij tekst zapisyvaetsya libo v kodirovke Windows, libo v kodirovke Unicode (naprimer, vnutri dokumentov MS Word versij 6.0 i 7.0 (95) russkij tekst zapisyvaetsya v kodirovke Windows-1251, a vnutri dokumentov MS Word versij 97 i 2000 -- v kodirovke Unicode). Kodirovka Windows-1251 ispol'zuetsya "starymi" (unasledovannymi eshcho ot Windows 3.1/3.11) shriftami Windows ("novye", t.e. "mnogoyazychnye" shrifty Windows 95/98/2000 osnovany na kodirovke Unicode).

V operatsionnoj sisteme DOS dlya raboty s russkoyazychnymi tekstami naibolee rasprostranena kodovaya stranitsa 866, izvestnaya takzhe pod nazvaniem "modifitsirovannoj al'ternativnoj kodirovki" (uproshchenno ee nazyvayut "Al'ternativnaya" ili "kodirovka DOS"). Pri "russkih" regional'nyh nastrojkah Windows sohranenie teksta iz MS Word for Windows v vide "MS-DOS Text" zapishet tekstovyj fajl imenno v etoj kodirovke. Chtoby pravil'no schityvat' takie fajly v MS Word for Windows, nuzhno vklyuchit' cherez menyu Tools/ Options/ General/ ustanovku "Confirm conversion at open", a pri otkrytii fajla v otvet na zapros programmy ukazyvat' preobrazovanie iz "MS-DOS Text".

V operatsionnyh sistemah semejstva UNIX dlya russkoyazychnyh tekstov obychno ispol'zuetsya kodovaya
stranitsa KOI-8 ("Kod obmena informatsiej 8-bitnyj"). Tochnee govorya, imenem "KOI-8" nazyvayut tseloe semejstvo nemnogo otlichayushchihsya drug ot druga kodovyh stranits - naprimer, russkuyu KOI8-R (RFC 1489) i ukrainskuyu KOI8-U (RFC 2319). Imenno kodirovka KOI-8 (v variante "koi8-r") prinyata kak standartnaya v russkoyazychnyh telekonferentsiyah USENET (naprimer, v gruppah novostej ierarhii relcom.*) i chashche vsego ispol'zuetsya dlya peresylki sooobshchenij na russkom yazyke po e'lektronnoj pochte. Ochen' mnogo poleznoj informatsii ob etoj kodirovke i o tom, kak nastroit' na nee razlichnye programmy, mozhno najti na Web-stranitse Andreya Chernova (http://www.nagual.pp.ru/~ache/koi8.html).
Pod Windows teksty v kodirovke KOI-8 mozhno chitat' i raspechatyvat', ispol'zuya shrifty tipa KOI-8 dlya Windows. Odnako dlya togo, chtoby nabirat' teksty v etoj kodirovke, nuzhno imet' spetsial'nuyu raskladku klaviatury. (Vprochem, pri ispol'zovanii sovremennyh pochtovyh programm, umeyushchih delat' perekodirovku iz Windows-1251 v KOI8-R i obratno, eto vryad li potrebuetsya).

Na komp'yuterah tipa Makintosh ispol'zuetsya svoya sobstvennaya kodirovka kirillitsy, izvestnaya kak
kodovaya stranitsa 10007 (ili prosto "Makintosh") . O russifikatsii Makintosh-sovmestimyh komp'yuterov mozhno prochest', naprimer, na www.relcom.ru/Russification/MacKoi8-r, http://www.friends-partners.org/partners/rusmac/, http://www.hf.uib.no/smi/files/eudtab.html.

Kodirovka kirillitsy ISO-8859-5 (v prostorechii "ISO") izvestna takzhe pod nazvaniem "osnovnaya kodirovka DOS " (hotya fakticheski "osnovnoj" dlya DOS davno uzhe stala "al'ternativnaya" kodirovka 866). Preimushchestvom kodirovki ISO-8859-5 yavlyaetsya strogo alfavitnoe razmeshchenie v nej russkih bukv, udobnoe dlya sortirovki zapisej v bazah dannyh.

"Translit" (transliteratsiya) - eto ne kodovaya stranitsa, eto prosto zamena bukv kirillitsy "foneticheski analogichnymi" latinskimi bukvami i ih kombinatsiyami -- vot takim primerno obrazom. Translit ispol'zuyut kak krajnee sredstvo v tom sluchae, esli na komp'yutere pol'zovatelya (ili adresata pis'ma) net kirillicheskih shriftov ili raskladok klaviatury.

Nizhe pokazany tablitsy razmeshcheniya simvolov v razlichnyh kodirovkah kirillitsy

Kodovaya stranitsa Windows-1251

Kodovaya stranitsa 866 (DOS)

Kodovaya stranitsa KOI8-R

Makintosh-kodirovka kirillitsy

Kodirovka ISO-8859-5


Kodirovka Unicode, kak mozhno dogadat'sya po samomu ee nazvaniyu, predstavlyaet soboj popytku sozdat' EDINUYu kodovuyu tablitsu, v kotoroj nashlos' by mesto dlya bukv i simvolov BCEH chelovecheskih yazykov (sm. http://www.unicode.org). Estestvenno, takaya tablitsa dolzhna byt' dostatochno bol'shoj, poe'tomu dlya kodirovki kazhdogo ee e'lementa otvoditsya uzhe ne 8, a 16 dvoichnyh razryadov, chto pozvolyaet kodirovat' maksimum 65536 e'lementov. Takim obrazom, "unifikatsiya" kodov bukv dostigaetsya za schet dvukratnogo uvelicheniya razmera tekstovyh fajlov. Standart Unicode soglasuetsya so standartom ISO/IEC 10646-1, opredelyayushchim tak nazyvaemyj "Universal'nyj nabor simvolov" - Universal Character Set (UCS) i ego dvuhbajtnoe (dva bajta na kazhdyj simvol) predstavlenie UCS-2; poe'tomu kodirovku Unicode inogda nazyvayut takzhe UCS-2. Odnako protokoly peredachi dannyh po seti Internet i e'lektronnoj pochte ne pozvolyayut peredavat' 16-bitnye simvoly v ishodnom vide; dlya peresylki tekstov, zapisannyh v Unicode, ispol'zuyutsya spetsial'nye 7-bitnye ili 8-bitnye predstavleniya Unicode UTF-7 (RFC2152) ili UTF-8 (RFC2279) (UTF oznachaet "UCS Transformation Format"). Novye versii Veb-brauzerov (i svyazannyh s nimi pochtovyh programm) - naprimer, Netscape Communicator v.4.* ili Microsoft Internet Explorer v.4.* ili 5.*, "ponimayut" kodirovki UTF-7 i UTF-8. Ispol'zovanie takih predstavlenij Unicode mozhet stat' radikal'nym resheniem problemy s "vavilonskoj bashnej" razlichnyh kodirovok, no poka chto  lish' nemnogie pochtovye programmy (naprimer, Outlook Express, Netscape Messenger, chastichno The Bat! i Forte Agent) podderzhivayut ispol'zovanie kodirovok UTF-7 i UTF-8.

Unicode v Windows 95/98/2000 i MS Office 97/2000

Shirokogo rasprostraneniya na Internete kodirovka Unicode poka ne poluchila, odnako v operatsionnoj sisteme Windows 95/98/2000 ona uzhe ispol'zuetsya kak vnutrennyaya kodirovka teksta v takih programmah, kak, naprimer, Internet Explorer, Outlook Express, MS Office 97/2000. ("Chisto" tekstovyj fajl v kodirovke Unicode mozhno, naprimer, zapisat' iz Microsoft Word 97/2000 (Save As / Unicode text ili Save As / Encoded text)). V MS Office 95 i bolee staryh versiyah MS Office vnutrennyaya kodirovka kirillitsy -- Windows-1251. S e'tim razlichiem kodirovok svyazany problemy sovmestimosti shriftov v dokumentah, sozdannyh s pomoshch'yu raznyh versij MS Office.  Microsoft Word 97/2000 korrektno rabotaet tol'ko so shriftami dlya Windows tipa Unicode - t.e. takimi, v kotorye mogut byt' vklyucheny nabory simvolov odnovremenno dlya neskol'kih kodovyh stranits Windows (Western, Cyrillic, Greek, Turkish i t.d.). "Starye" (ne-yunikodovskie) "anglo-russkie" shrifty mozhno preobrazovat' v format Unicode programmoj TTF Converter (ftp://kgb.quarta.com/WinUtil/ttfconv.zip) -- posle etogo ih mozhno ispol'zovat' v Word 97/2000 (hotya, razumeetsya, v nih est' lish' dva script'a - Western i Cyrillic). Odnako dazhe pri ispol'zovanii tol'ko yunikodovskih shriftov vozmozhny problemy s raspechatkoj kirillitsy iz prilozhenij MS Office 97 na nekotoryh printerah. Ob e'tih problemah i ih reshenii mozhno prochest' na Veb-stranitse Pavla Gorodyanskogo (http://ourworld.compuserve.com/homepages/PaulGor/).
Tam zhe est' informatsiya i o tom, kak reshat' problemy s kopirovaniem i vstavkoj teksta mezhdu prikladnymi programmami, ispol'zuyushchimi i ne ispol'zuyushchimi Unicode.
Dlya resheniya problem Word 97 s dokumentami,  sozdannymi v bolee  rannih  versiyah Microsoft Word  s ispol'zovaniem   shriftov, ne vhodyashchih v standartnyj komplekt Microsoft Windows 3.h (naprimer, Baltica, Pragmatica i t. d.) mozhno ispol'zovat' spetsial'nyj konvertor, kotoryj est' na http://www.referats.corbina.ru/referats/00/CYRFONTS.ZIP.
Chto kasaetsya obratnoj sovmestimosti, to, naprimer, spetsial'nuyu programmu-konvertor, pozvolyayushchuyu otkryvat' v Word 6.0 i 7.0 fajly, zapisannye v formate Word 97, mozhno najti na ftp://ftp.microsoft.com/Softlib/MSLFILES/wrd97cnv.exe; odnako nekotorye dokumenty Word97 so slozhnym formatirovaniem ne udaetsya otkryt' v Word 6.0 i 7.0 dazhe s pomoshch'yu etogo konvertora.

Podrobnee o shriftah, kodovyh stranitsah kirillitsy i podderzhke razlichnyh kodirovok v Windows mozhno prochest' na Veb-stranitse Konstantina Kazarnovskogo (http://www.glasnet.ru/~kazarn/fontsmain.htm).


7-bitnye predstavleniya 8-bitnyh tekstov: "Quoted-printable" i "base64"

8-bitnye teksty mozhno peresylat' po e'lektronnoj pochte v svoem ishodnom 8-bitnom vide; pri etom v
sluzhebnyh polyah pis'ma obychno ukazyvaetsya: Content-Transfer-Encoding: 8bit. Odnako nado imet' v vidu, chto ne vse pochtovye servery (osobenno v "7-bitnom" angloyazychnom mire) pravil'no obrabatyvayut 8-bitnye teksty. Nekotorye iz nih voobshche prosto "obrezayut" vos'moj bit, umen'shaya vse 8-bitnye kody na 128. Poe'tomu v sovremennyh pochtovyh programmah predusmotren rezhim preobrazovaniya peresylaemyh 8-bitnyh tekstov v 7-bitnuyu formu  - v raschete na to, chto pochtovaya programma poluchatelya avtomaticheski vypolnit obratnoe preobrazovanie i vosstanovit ishodnyj tekst. (Naprimer, v programme Eudora Pro v.2.2 i 3.* takoj rezhim vklyuchaetsya cherez menyu Tools/ Options/ Sending Mail/ May Use Quoted-Printable). V predstavlenii "quoted-printable" standartnye 7-bitnye simvoly ostavlyayutsya bez izmenenij, a 8-bitnye simvoly zamenyayutsya na posledovatel'nost' iz simvola "=" i pary latinskih bukv i/ili tsifr, izobrazhayushchih ih shestnadtsatirichnyj kod. V rezul'tate otsylaemyj tekst mozhet vyglyadet' primerno tak:
=DD=EB=E5=EA=F2=F0=EE=ED=ED=FB=E5 =F2=E0=E1=EB=E8=F6=FB,
a v sluzhebnyh polyah pis'ma pochtovaya programma ukazhet: Content-Transfer-Encoding: quoted-printable.

Drugim rasprostranennym metodom 7-bitnogo predstavleniya 8-bitnyh tekstov yavlyaetsya "base64". Pri ego ispol'zovanii pochtovaya programma ukazyvaet v sluzhebnyh polyah pis'ma: Content-transfer-encoding: base64.

Sovremennye pochtovye programmy pri poluchenii pis'ma, gde tekst predstavlen v vide base64 ili
quoted-printable, avtomaticheski vosstanovyat ego ishodnuyu 8-bitnuyu formu; tem zhe poluchatelyam, ch'i pochtovye programmy ne podderzhivayut takoe preobrazovanie, pridetsya rasshifrovyvat' tekst s pomoshch'yu spetsial'nyh dekodiruyushchih programm.

Nado imet' v vidu, chto preobrazovanie libo nepreobrazovanie otsylaemyh 8-bitnyh tekstov v 7-bitnuyu formu ne vsegda zavisit ot zhelaniya otpravitelya. Inogda SMTP-server avtomaticheski "zakatyvaet" otpravlyaemye 8-bitnye teksty v 7-bitnuyu formu -- vidimo, predpolagaya, chto pochtovyj server poluchatelya ne smozhet pravil'no obrabotat' 8-bitnye soobshcheniya. Pri etom v zagolovke soobshcheniya poyavlyayutsya strochki tipa
X-MIME-Autoconverted: from 8bit to base64 by [server name]...


Kak nastroit' brauzer dlya prosmotra Web-stranits na russkom yazyke

Prosmatrivaya russkoyazychnye Veb-sajty, mozhno zametit' neskol'ko sposobov resheniya problemy razlichnyh kodirovok kirillitsy, ispol'zuemyh v razlichnyh operatsionnyh sistemah.

Pri odnom podhode, dokument dostupen na Veb-servere v neskol'kih razlichnyh kodirovkah, tak chtoby posetiteli Veb-sajta mogli vybrat' naibolee udobnyj dlya sebya variant. (Pri etom ne obyazatel'no derzhat' na servere otdel'nuyu kopiyu dokumenta dlya kazhdoj kodirovki; na samom dele, server chasto hranit lish' odin ekzemplyar dokumenta v kakoj-nibud' odnoj kodirovke, zato dostup k etomu dokumentu vozmozhen cherez neskol'ko "portov", kotorye vypolnyayut razlichnye perekodirovki). Tak ili inache, na Veb-stranitse est' menyu vybora kodirovki; v eto menyu navernyaka budut vklyucheny kodirovki WIN-1251 i KOI8-R, a inogda i drugie -- DOS (866), ISO-8859-5, Macintosh i "translit".

Drugoj podhod ispol'zuetsya, naprimer, Veb-serverom "Russian Apache", kotoryj pytaetsya opredelit' "rodnuyu" kodirovku obrashchayushchegosya k serveru brauzera i zatem "otdaet" pol'zovatelyu zaprashivaemyj dokument imenno v etoj kodirovke. Pri etom na Veb-stranitse mozhet i ne byt' menyu vybora kodovoj stranitsy. Esli pol'zovatel' rabotaet v operatsionnoj sisteme Windows, to on, skoree vsego, uvidit dokument v kodirovke Win-1251.

Tretij podhod -- sdelat' dokument dostupnym v kakoj-nibud' odnoj kodirovke, v raschete na to, chto pol'zovatel' dolzhen umet' pravil'no nastroit' svoj brauzer dlya chteniya tekstov v etoj kodirovke. Mnogie russkoyazychnye Veb-stranitsy dostupny libo tol'ko v KOI8-R, libo tol'ko v Win-1251.
www.israel.ru/sgt/koi8.html
www.homepage.techno.ru/barsic/antikoi.htm

Esli Vy hotite sozdat' svoyu sobstvennuyu Veb-stranitsu na russkom yazyke, Vy dolzhny znat', kak rabotaet tot server, na kotorom Vy ee hotite razmestit'. Esli etot server delaet perekodirovku, to predpolagaetsya, chto zagruzhat' tuda dokumenty nuzhno v opredelennoj kodirovke - inache oni stanut nechitabel'nymi. Esli zhe server ne delaet nikakoj perekodirovki, to Vy sami mozhete vybirat', v kakoj kodirovke (ili kodirovkah) budet dostupna Vasha Veb-stranitsa.
Imejte takzhe v vidu, chto obychno legche nastroit' na chtenie KOI-8 brauzery, rabotayushchie pod Windows, chem nastroit' na Win-1251 brauzery, rabotayushchie pod Unix. Nekotorye pol'zovateli Unix voobshche s predubezhdeniem otnosyatsya k Veb-stranitsam, dostupnym tol'ko v kodirovke Win-1251 i schitayut, chto vryad li tam mozhet byt' chto-nibud' zasluzhivayushchee vnimaniya.

Dlya chteniya russkoyazychnyh Veb-stranits dostatochno "nauchit'" Vash brauzer ponimat' kodirovki KOI-8 i Windows-1251 - drugie kodirovki kirillitsy vryad li mozhno najti na Internete v kachestve edinstvennogo varianta kodirovki Veb-stranitsy. (Pravda, na Internete mozhno najti mnozhestvo russkoyazychnyh tekstovyh fajlov v kodirovke DOS - no oni obychno prednaznacheny dlya zagruzki, a ne dlya prosmotra v rezhime online).

Nastrojka brauzera Netscape Navigator (versiya 3) na kirillitsu fakticheski svoditsya k ustanovke shriftov nuzhnogo tipa, kotorymi budet izobrazhat'sya ishodnyj tekst. Protsedura nastrojki podrobno opisana Pavlom Gorodyanskim na http://www.relcom.ru/Russification/WinNetscape, i zdes' my ostanovimsya na nej lish' vkrattse.

Dlya nastrojki Netscape Navigator (versiya 3) nuzhno vojti v menyu Options/ General Preferences/ Fonts i
ustanovit' dlya kodirovki "Cyrillic" kirillicheskie shrifty (proportsional'nyj i postoyannoj shiriny) tipa Windows-1251, a dlya kodirovki "Cyrillic (KOI8-R)" shrifty (proportsional'nyj i postoyannoj shiriny) tipa KOI-8. Pri etom chashche vsego problemy voznikayut s ustanovkoj shrifta postoyannoj shiriny tipa KOI-8, poskol'ku byvaet, chto ni odin iz imeyushchihsya shriftov tipa KOI-8 ne raspoznaetsya sistemoj kak shrift postoyannoj shiriny i ne viden v okoshke vybora shriftov. V sluchae takih problem, komplekt "podhodyashchih" shriftov mozhno zagruzit' s toj zhe Web-stranitsy Pavla Gorodyanskogo: http://www.relcom.ru/Russification/WinNetscape/ForWWW.zip. V dal'nejshem nuzhno cherez menyu Options/ Document Encoding vybirat' kodirovku Cyrillic dlya prosmotra Web-stranits v kodirovke Windows-1251 i kodirovku Cyrillic (KOI-8) dlya prosmotra Web-stranits v kodirovke KOI-8.

Esli u Vas vse eshcho ustanovlen Netscape Navigator (versiya 2), davno pora zamenit' ego na bolee "svezhuyu" versiyu. Esli zhe u Vas net takoj vozmozhnosti, mozhno analogichnym obrazom ustanovit' shrifty tipa KOI-8 dlya kodirovki "Latin 2" i shrifty tipa Windows-1251 dlya kodirovki "Korean" (v menyu etoj versii Netscape Navigator'a net kirillicheskih kodirovok) . Posle etogo vybirajte iz menyu Options/ Document Encoding "Latin 2" dlya prosmotra tekstov v kodirovke KOI-8 i "Korean" dlya prosmotra tekstov v kodirovke Windows-1251.


V otlichie ot Netscape Navigator’a, Microsoft Internet Explorer (versiya 3) dlya prosmotra Web-stranits v kodirovkah KOI-8 i Windows-1251 ne nuzhdaetsya v ustanovke kakih-libo spetsial'nyh shriftov. Dostatochno cherez menyu View/ Options/ General/ Font Settings vybrat' kirillicheskij nabor simvolov, a MIME-Encoding ustanovit' na Windows-1251 ili KOI8-R. Pri prosmotre Web-stranits mozhno shchelknut' levoj knopkoj myshi po ikonke, nahodyashchejsya v pravom nizhnem uglu okoshka Internet Explorer’a v.3, i vybrat' nuzhnuyu kodovuyu stranitsu iz vsplyvayushchego menyu. (Esli etoj ikonki ne vidno, skoree vsego, v sisteme ne ustanovlen Multilanguage Support - nuzhnye fajly mozhno zagruzit' s ftp://ftp.microsoft.com/Softlib/MSLFILES/lang.exe). Pri etom Internet Explorer vypolnyaet sootvetstvuyushchuyu perekodirovku ishodnogo teksta.
Tot zhe printsip sohranen i v sleduyushchih versiyah - Internet Explorer v.4 i 5, kotorye, krome Windows-1251 ili KOI8-R, podderzhivayut eshcho neskol'ko kodovyh stranits kirillitsy, a takzhe 7-bitnye i 8-bitnye predstavleniya Unicode UTF-7 i UTF-8. V Internet Explorer v.5 nuzhnaya kodirovka vybiraetsya cherez menyu View/ Encoding (esli nuzhnoj kodirovki net v spiske, nuzhno vybrat' punkt "More"). Shrift, ispol'zuemyj dlya pokaza kirillitsy, vybiraetsya cherez menyu Tools/ Internet Options/ General/ Fonts. Netscape Navigator v.4 (vhodyashchij v komplekt Netscape Communicator) takzhe ne trebuet nalichiya shriftov tipa KOI-8, i mozhet sam "na letu" perekodirovat' dokumenty iz KOI-8. Nuzhnaya kodirovka vybiraetsya cherez menyu View/ Character Set, a shrift, ispol'zuemyj dlya pokaza kirillitsy, vybiraetsya cherez menyu Edit/ Preferences/ Appearance/ Fonts. Nastrojka etogo brauzera dlya chteniya kirillitsy takzhe podrobno opisana Pavlom Gorodyanskim na http://www.relcom.ru/Russification/WinNetscape.
Pozhaluj, obrabotka kirillitsy v Netscape Communicator soprovozhdaetsya bOl'shim kolichestvom oshibok po sravneniyu s MS Internet Explorer. Inogda byvaet, chto kirillitsa na e'krane nechitabel'na dazhe nesmotrya na to, chto vse nastrojki zadany sovershenno pravil'no. Esli takoe sluchaetsya, poprobujte sleduyushchie varianty: HTML-dokumenty s yavnym ukazaniem kodirovki (charset=...)

Esli v zagolovke HTML-dokumenta yavno ukazyvaetsya kodirovka pri pomoshchi stroki tipa
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">
, brauzer dolzhen avtomaticheski vklyuchit' rezhim pokaza dokumenta v dannoj kodirovke. V etom sluchae popytki zadat' kodirovku "vruchnuyu" (cherez menyu brauzera) mogut ne srabatyvat'. Esli pri etom ukazannaya v zagolovke kodirovka ne sootvetstvuet toj, kotoraya fakticheski ispol'zuetsya v tekste, dokument mozhet stat' nechitabel'nym. Voobshche, esli brauzer ne mozhet pravil'no prochest' tekst, poprobujte prosmotret' ishodnyj HTML-kod (cherez menyu View/ Page source i t.p., v zavisimosti ot konkretnogo brauzera). Chasto eto pomogaet ponyat' sut' problemy. V sluchae nepravil'no ukazannoj kodirovki mozhno sohranit' dokument u sebya na diske, a potom otredaktirovat' ego, ispraviv charset libo perekodirovav tekst.
Voobshche govorya, yavnoe ukazanie kodirovki v zagolovke HTML-dokumenta nuzhno ispol'zovat' ochen' vnimatel'no. Pomnite:
1. Luchshe sovsem ne ukazat' charset, chem ukazat' ego nepravil'no.
2. Pri yavno ukazannoj kodirovke dokument mozhet stat' nechitabel'nym v nekotoryh staryh versiyah brauzerov, kotorye ne raspoznayut nazvanie dannoj kodirovki.
3. Esli Vy konvertiruete HTML-dokument s yavnym ukazaniem kodovoj stranitsy v druguyu kodirovku, ne zabud'te ispravit' v zagolovke i nazvanie kodirovki.
4. Ne ukazyvajte kodirovku yavno, esli dokument budet nahodit'sya na servere, kotoryj mozhet ego perekodirovat'.
5. Esli Vasha stranitsa sdelana v kodirovke Win-1251, dazhe s yavnym ukazaniem charset=windows-1251, ne dumajte, chto teper' ona budet chitabel'na absolyutno dlya vseh. Mnogie versii brauzerov, rabotayushchih pod operatsionnoj sistemoj UNIX, ne podderzhivayut e'tu kodirovku.

Krome togo, esli Vy hotite, chtoby russkij tekst na Vashej Veb-stranitse byl chitabelen dlya vseh, nikogda ne ispol'zujte yavnoe zadanie shrifta cherez tag FONT FACE=.... E'to schitaetsya durnym tonom, poskol'ku mozhet sozdat' problemy dlyah teh, u kogo na komp'yutere shrift s takim nazvaniem ne rusifitsirovan (libo ego voobshche net).


Kak nastroit' pochtovuyu programmu dlya perepiski na russkom yazyke

Esli dva cheloveka perepisyvayutsya mezhdu soboj po e'lektronnoj pochte, razumeetsya, oni vprave
ispol'zovat' lyubuyu kodirovku, udobnuyu dlya nih oboih (i priemlemuyu dlya pochtovoj sistemy, cherez kotoruyu ih pis'ma prohodyat). Odnako esli nuzhno otpravit' pis'mo neznakomomu cheloveku ili srazu mnogim adresatam cherez spisok rassylki, to vopros mozhno postavit' shire: kakuyu kodirovku vybrat', chtoby vse smogli prochitat' pis'mo bez vsyakih problem?
K sozhaleniyu, odnoznachnogo otveta na etot vopros ne sushchestvuet -- kakuyu kodirovku ni vybrat', ona mozhet sozdat' problemy dlya nekotoryh kategorij poluchatelej. Rassmotrim plyusy i minusy osnovnyh variantov.

KOI8 -- plyusy: Po slozhivshejsya traditsii, dlya peresylki pisem na russkom yazyke standartom de-fakto stala kodovaya stranitsa KOI8-R, zakreplennaya takzhe i v ustavah russkoyazychnyh telekonferentsij USENET. Pri prohozhdenii cherez pochtovye sistemy, "obrezayushchie" vos'moj bit, tekst v kodirovke KOI-8 hot' i uroduetsya, no ostaetsya vpolne chitabel'nym. Mnogie pochtovye programmy po umolchaniyu otsylayut pis'ma imenno v kodirovke KOI-8 (a mnogie versii Netscape Mail voobshche ne mogut otoslat' pis'mo v drugoj kodirovke s pravil'no prostavlennym v zagolovke charset'om). Mnogie pochtovye sistemy nastroeny imenno na pis'ma, prihodyashchie v kodirovke KOI-8, i avtomaticheski proizvodyat perekodirovku iz KOI-8 v Windows ili DOS; esli kodirovka pis'ma budet drugoj, to v konechnom schete ono budet preobrazovano v "izvrashchennuyu" (nestandartnuyu) kodirovku. Kodirovka KOI-8 yavlyaetsya edinstvenno ponyatnoj dlya mnogih pol'zovatelej, rabotayushchih v operatsionnoj sisteme UNIX.
KOI8 -- minusy: Pis'ma v kodirovke KOI-8 mogut byt' nechitabel'ny dlya neopytnyh pol'zovatelej, rabotayushchih v operatsionnoj sisteme Windows s "tupymi" (ne imeyushchimi vstroennyh sredstv perekodirovki) pochtovymi programmami. Krome togo, v kodovuyu tablitsu koi8-r ne vklyucheny bukvy kirillitsy, spetsifichnye dlya ukrainskogo i belorusskogo yazykov. Dlya perepiski na ukrainskom yazyke vmesto kodirovki koi8-r sleduet ispol'zovat' kodirovku koi8-u -- no, k sozhaleniyu, daleko ne vse pochtovye programmy, podderzhivayushchie kodirovku koi8-r, podderzhivayut takzhe i koi8-u.

Windows-1251 -- plyusy: Pis'ma budut chitabel'ny dlya neopytnyh pol'zovatelej, rabotayushchih v operatsionnoj sisteme Windows s "tupymi" (ne imeyushchimi vstroennyh sredstv perekodirovki) pochtovymi programmami. Mozhno bez problem pisat' po-ukrainski, po-belorusski i na drugih yazykah, ispol'zuyushchih bukvy iz kodovoj tablitsy Windows-1251.
Windows-1251 -- minusy: Mnogie pochtovye sistemy nastroeny imenno na pis'ma, prihodyashchie v kodirovke KOI-8, i avtomaticheski proizvodyat perekodirovku iz KOI-8 v Windows ili DOS; pis'mo, prishedshee v kodirovke Windows-1251, budet preobrazovano v "izvrashchennuyu" (nestandartnuyu) kodirovku. Pis'mo v kodirovke Windows-1251 mozhet byt' nechitabel'nym dlya mnogih pol'zovatelej, rabotayushchih v operatsionnoj sisteme UNIX (pri etom mnogie pol'zovateli UNIX schitayut, chto otpravka pis'ma v kodirovke Windows-1251 yavno demonstriruet nizkuyu kvalifikatsiyu avtora, i nichego zasluzhivayushchego ih vnimaniya v takom pis'me zavedomo byt' ne mozhet). Pri "obrezanii" vos'mogo bita tekst prochest' nel'zya.

Unicode -- plyusy: V tekste pis'ma mozhno ispol'zovat' bukvy iz neskol'kih razlichnyh alfavitov (chto nevozmozhno pri ispol'zovanii 8-bitnyh kodirovok). Vozmozhno, ispol'zovanie Unicode so vremenem obespechit radikal'noe i okonchatel'noe reshenie problemy kodirovok.
Unicode -- minusy: Poka chto lish' nemnogie pochtovye programmy podderzhivayut ispol'zovanie Unicode (naprimer, Outlook Express, Netscape Messenger, chastichno The Bat! i Forte Agent). Adresaty, ispol'zuyushchie drugie pochtovye programmy, mogut imet' bol'shie problemy s chteniem takogo pis'ma.

Translit -- plyusy: E'to universal'nyj sposob obshcheniya, dlya kotorogo ne nuzhny ni rusifitsirovannye raskladki klaviatury, ni russkie e'krannye shrifty, i kotoryj delaet pis'mo garantirovanno chitabel'nym dlya poluchatelya v lyuboj strane mira.
Translit -- minusy: Pis'mo v translite neudobno nabirat' i neudobno chitat'. Ishodnyj tekst koverkaetsya.

V kachestve obshchej rekomendatsii mozhno predlozhit' takoj variant:
1. otpravlyajte pis'ma v kodirovke KOI8-R (na ukrainskom yazyke -- v KOI8-U), pri etom zhelatel'no, chtoby pochtovaya programma pravil'no ukazyvala  v sluzhebnyh polyah pis'ma ispol'zuemuyu kodirovku     ("charset=koi8-r").
2. Esli u adresatov voznikayut problemy s chteniem pisem v kodirovke KOI8-R (KOI8-U), poprobujte kodirovku Windows-1251.
3. Esli i v etom sluchae voznikayut problemy, poprobujte translit libo zapishite tekst pis'ma v fal i prilozhite ego k otpravlyaemomu soobshcheniyu.


Otdel'no rassmotrim vopros o tom, v kakoj forme luchshe otpravlyat' takie pis'ma – 8-bitnoj ili 7-bitnoj (sm. paragraf "7-bitnye predstavleniya 8-bitnyh tekstov").

S odnoj storony, kak uzhe govorilos', ne vse pochtovye servery propuskayut 8-bitnye teksty.
Nekotorye iz nih avtomaticheski preobrazuyut 8-bitnyj tekst v 7-bitnuyu formu (naprimer, v base64), a nekotorye prosto "obrezayut" vos'moj bit. (Mezhdu prochim, interesnaya osobennost' kodirovki KOI-8 zaklyuchaetsya v tom, chto tekst v etoj kodirovke udaetsya prochest' i posle "obrezaniya" vos'mogo bita, poskol'ku bukvy kirillitsy v etoj kodovoj stranitse raspolozheny so sdvigom na 128 ot "foneticheski shodnyh" latinskih bukv). Krome togo, ne sovsem "legal'nym" yavlyaetsya ispol'zovanie 8-bitnogo teksta v pole Subject: i v drugih sluzhebnyh polyah pis'ma, poskol'ku dejstvuyushchie na Internete standarty predpisyvayut predstavlenie teksta v sluzhebnyh polyah pis'ma v 7-bitnoj forme.

S drugoj storony, v stranah byvshego SSSR slozhilas' praktika otsylki pisem v 8-bitnoj forme (vklyuchaya i tekst v pole Subject), i podavlyayushchee bol'shinstvo serverov bez problem propuskaet takie pis'ma. Pri etom mnogie lyudi pol'zuyutsya pochtovymi programmami, kotorye ne mogut avtomaticheski preobrazovat' v ishodnuyu 8-bitnuyu formu tekst, poluchennyj v vide quoted-printable ili base64. Krome togo, v 8-bitnoj forme ob^em peresylaemogo teksta men'she, chem v vide base64 i osobenno quoted-printable. Nakonets, teksty, zakodirovannye v quoted-printable ili base64, mogut ne perekodirovat'sya pri prohozhdenii cherez perekodirovshchiki iz KOI8 v Windows-1251 ili DOS, kotorymi pol'zuetsya adresat (takie perekodirovshchiki mogut stoyat', naprimer, na ego POP3-servere) i v rezul'tate prihodit' k nemu v nepravil'noj kodirovke. Poe'tomu v obshchem sluchae mozhno rekomendovat' otpravlyat' pis'ma v 8-bitnom vide (v tom chisle v pole Subject). Esli vyyasnitsya, chto Vash pochtovyj server ili pochtovyj server poluchatelya "portit" 8-bitnye teksty, poprobujte vklyuchit' rezhim preobrazovaniya teksta v quoted-printable ili base64. Esli Vash adresat ne mozhet rasshifrovat' takie pis'ma, poprobujte poslat' tekst ne v tele pis'ma, a prilozhit' tekstovyj fajl k pis'mu.
Ispol'zovanie russkogo teksta v pole "From" nastoyatel'no ne rekomenduetsya - v etom sluchae mnogie adresaty prosto ne smogut prochest' imya otpravitelya. (Takzhe ne rekomenduetsya prilagat' k soobshcheniyu fajly s russkimi imenami -- pri peresylke e'ti imena mogut okazat'sya iskoverkannymi).


 Rekomendatsiya peresylat' tekst v kodirovke KOI-8 ne otnositsya k sluchayu, kogda tekst otpravlyaetsya ne v "tele" pis'ma, a prilagaetsya k pis'mu v vide otdel'nogo fajla (zakodirovannogo v formate UUencode ili base64). "Telo" pis'ma mozhet perekodirovat'sya pri prohozhdenii cherez raznye pochtovye servery i pochtovye programmy, togda kak s prilagaemymi k pis'mu fajlami etogo ne proishodit. Kodirovku prilagaemyh k pis'mu tekstovyh fajlov obychno imeet smysl vybirat' v zavisimosti ot operatsionnoj sistemy i programmnogo obespecheniya, kotorymi pol'zuetsya Vash adresat. Uchtite, chto pis'ma, tekst kotoryh prilagaetsya v vide otdel'nyh fajlov, menee udobno chitat' i otvechat' na nih, chem na "obychnye" pis'ma. Krome togo, esli Vy hotite napisat' pis'mo ne v vide obychnogo tekstovogo fajla, a, dopustim, kak dokument MS Word, uchtite, chto takie dokumenty gorazdo bol'she po ob^emu i mogut perenosit' komp'yuternye virusy (a sam format MS Word yavlyaetsya priemlemym daleko ne dlya vseh adresatov).


Itak, pis'ma na russkom yazyke, kak pravilo, rekomenduetsya peresylat' v kodirovke KOI-8. Odnako kak eto sdelat', esli Vy rabotaete pod Windows?

Fakticheski, mozhno libo srazu nabirat' pis'ma v kodirovke KOI-8, libo snachala nabirat' ih v toj kodirovke, v kakoj eto udobno delat' (naprimer, Windows-1251 ili DOS), a zatem preobrazovyvat' ih v KOI-8. Tut vozmozhny neskol'ko podhodov:


Chtoby nabirat' tekst v kodirovke KOI-8 v pochtovoj programme, rabotayushchej pod Windows, nuzhno imet' shrifty tipa KOI-8 dlya Windows i pereklyuchatel' klaviatury s sootvetstvuyushchimi raskladkami. Mozhno ispol'zovat' libo "rodnoj" pereklyuchatel' klaviatury Windows95, libo spetsial'nye programmy. Protsedura ustanovki raskladki klaviatury KOI-8 pod Windows95 opisana na Web-stranitse Andreya Chernova <http://www.nagual.pp.ru/~ache/koi8.html> i (gorazdo bolee podrobno) na
<http://www.netsight.net/~ryba/cyrillic/index.html>. Posle togo, kak takaya raskladka ustanovlena, mozhno
dobavit' k pereklyuchatelyu klaviatury eshcho odin yazyk (naprimer, pol'skij ili afrikaans) i nastroit' ego na ispol'zovanie raskladki klaviatury KOI-8. (U Andreya Chernova opisana i protsedura bolee radikal'noj "koizatsii" Windows95, osnovannuyu na podmene sistemnogo fajla gdi.exe. V rezul'tate odnu iz natsional'nyh kodovyh stranits, podderzhivaemyh v shriftah tipa Unicode (naprimer, tsentral'noevropejskuyu), mozhno zamenit' na kodovuyu stranitsu KOI8-R. Posle etogo v sisteme naryadu so shriftami, naprimer, Arial Cyrillic i Times New Roman Cyrillic poyavlyayutsya shrifty Arial KOI8-R i Times New Roman KOI8-R).

Nado skazat', chto pri rabote s "rodnym" pereklyuchatelem klaviatury Windows95 inogda voznikayut problemy. Naprimer, on mozhet ne srabatyvat' v oknah nekotoryh programm; krome togo, on ne pozvolyaet redaktirovat' imeyushchiesya raskladki klaviatury. (Redaktor raskladok klaviatury Windows95 mozhno najti, naprimer, na <http://www.kiarchive.ru/pub/cyrillic/windows/jkbd9542.zip> , no on pozvolyaet redaktirovat' ne vsyakie fajly raskladok). Nakonets, esli prihoditsya pol'zovat'sya bolee chem tremya raskladkami klaviatury, rabotat' s "rodnym" pereklyuchatelem klaviatury Windows95 stanovitsya prosto neudobno, poskol'ku on ne pozvolyaet ispol'zovat' raznye klavishi dlya dostupa k raznym raskladkam.

Esli Vy ispytyvaete neudobstva pri rabote s "rodnym" pereklyuchatelem klaviatury Windows95, imeet smysl ustanovit' spetsial'nye programmy dlya pereklyucheniya klaviatury.


E'ta programma platnaya. Ona pozvolyaet vklyuchat' raznye raskladki klaviatury cherez raznye klavishi bystrogo dostupa, a takzhe nastraivat' raskladki po svoemu vkusu s pomoshch'yu redaktora klaviatury.
No, krome etogo, ona obladaet eshcho odnim vazhnym dostoinstvom. Esli Vy pol'zuetes' amerikanskoj versiej Windows95, u Vas mogut voznikat' problemy pri ustanovke russkoyazychnyh programm (naprimer, russkie bukvy v menyu mogut otobrazhat'sya v vide podcherkivanij ili drugih nechitabel'nyh simvolov). Dlya resheniya e'tih problem ne vsegda dostatochno ustanovit' Multilanguage Support dlya Windows95 i kirillicheskie sistemnye shrifty. Mozhet potrebovat'sya eshche i modifikatsiya nekotoryh sistemnyh fajlov Windows95. Pri ustanovke CyrWin95 e'ta rabota vypolnyaetsya avtomaticheski, i problem s russkoyazychnymi programmami bol'she ne voznikaet.

E'ta programma takzhe platnaya (probnuyu versiyu mozhnoj najti na http://www.smartlinkcorp.com. V otlichie ot pervoj versii ParaWin 95 (v.1), ona pozvolyaet pereklyuchat' i redaktirovat' razlichnye raskladki klaviatury. Indikator ParaWin 95 vyvoditsya na mesto, obychno zanimaemoe na paneli zadach "rodnym" pereklyuchatelem klaviatury Windows95, i vyglyadit ochen' pohozhe, no rabotat' s nim znachitel'no udobnee. ParaWin 95 takzhe ustranyaet bol'shinstvo problem, imeyushchihsya u amerikanskoj versii Windows95 pri rabote s russkoyazychnymi programmami. ParaWin 95 mozhno ispol'zovat' tol'ko pod Windows95, a ParaWin 98 -- i pod Windows95, i pod Windows98. Dlya Windows 2000 ili NT nuzhen ParaWin 2000.

Inogda pri ispol'zovanii ParaWin dlya pereklyucheniya klaviatury v okne sostavleniya novogo soobshcheniya Outlook Express zadacha "podvisaet", i prihoditsya ee snimat' cherez Ctrl-Alt-Del. Vozmozhno, v takih sluchayah stoit ispol'zovat' ParaWin tol'ko dlya rusifikatsii sistemy (esli eto neobhodimo), a dlya pereklyucheniya raskladok klaviatury ustanovit' druguyu programmu -- naprimer, RusLat (www.ruslat.wm.ru).


E'ta programma besplatnaya i dovol'no udobnaya, i mozhet rabotat' kak pod Windows95, tak i pod
Windows 3.*. Ee mozhno najti, naprimer, na <http://www.kiarchive.ru/pub/cyrillic/windows/>. V otlichie ot ParaWin 95 i CyrWin 95, ona ne pozvolyaet "kirillizirovat'" sistemnye fajly Windows95, hotya i vklyuchaet ryad poleznyh sistemnyh shriftov (v tom chisle shrifty tipa DOS-866 dlya Windows). Odnako ona ne rabotaet s temi programmami, kotorye ispol'zuyut shrifty tipa Unicode, i poe'tomu ee mozhno schitat' ustarevshej.

Iz drugih besplatnyh pereklyuchatelej klaviatury mozhno nazvat' RusLat (www.ruslat.wm.ru).


Vmesto togo, chtoby "koizirovat'" Windows, mozhno ispol'zovat' pochtovye programmy, kotorye sami mogut perekodirovat' otpravlyaemyj i poluchaemyj tekst. Takie programmy mogut imet' "vnutrennyuyu" i "vneshnyuyu" kodirovku teksta, otlichayushchiesya drug ot druga. V kachestve "vnutrennej" kodirovki imeet smysl vybrat' tu, v kotoroj udobno nabirat' i redaktirovat' tekst pod ispol'zuemoj operatsionnoj sistemoj (naprimer, 1251 dlya Windows ili 866 dlya DOS), a v kachestve "vneshnej" – tu, kotoraya prinyata dlya peresylki pisem (dlya russkogo yazyka – KOI8-R). Pri otpravke pisem pochtovaya programma dolzhna preobrazovyvat' kodirovku teksta iz "vnutrennej" vo "vneshnyuyu" (naprimer, iz 1251 v KOI8-R), a pri ih poluchenii proizvodit' obratnoe preobrazovanie (sootvetstvenno, iz KOI8-R v 1251).

Est' pochtovye programmy, kotorye vypolnyayut "fiksirovannuyu" perekodirovku teksta (naprimer, iz vse prihodyashchie soobshcheniya iz KOI8-R v 1251, a vse ishodyashchie - iz 1251 v KOI8-R), a est' i takie, u kotoryh est' menyu perekodirovki s podderzhkoj neskol'kih kodovyh stranits.
Pri "fiksirovannoj" perekodirovke dlya togo, chtoby pravil'no perekodirovat' poluchaemye pis'ma, nuzhno znat', v kakoj kodirovke oni prihodyat. V printsipe, zdes' vozmozhny dva osnovnyh podhoda:

Na Web-stranitse Timura Kadysheva <http://blue.iris.mipt.ru/timur/trueway.htm> sdelana popytka
sformulirovat' te trebovaniya, kotorym dolzhny sootvetstvovat' pochtovye programmy i brauzery, chtoby oni mogli polnost'yu vzyat' na sebya zadachu perekodirovki i otpala neobhodimost' v "koizatsii" Windows. 

Tablitsa sravneniya pochtovyh programm

Pochtovaya programma  Perekodirovka teksta soobshcheniya  Ukazanie kirillicheskoj kodirovki (charset'a) v zagolovke  Problemy i kommentarii
Eudora Pro v.2.2 Net 
Neobhodima vneshnyaya perekodirovka ili shrifty koi8
nepravil'no: iso-8859-1 (can be hacked to koi8-r)  Ochen' udobnyj interfejs; 
Problemy s: shriftami tipa Unicode, pereklyuchatelem klaviatury Win95, soobshcheniyami, perepravlennymi iz Netscape, razbitymi na kuski prilozhennymi fajlami; ne ochen' udobna dlya raboty s kirillitsej
Eudora Pro v.3.*, 4.*  Net 
Mozhno ispol'zovat' s koi8-plugin'om dlya perekodirovki win<->koi
nepravil'no: iso-8859-1 
(s plugin'om: koi8-r ili windows-1251)
To zhe, chto i dlya Eudora v.2.*; 
dobavlena podderzhka neskol'kih account'ov, a takzhe plugin'ov, v tom chisle koi8-plugin; u v.4.* est' oshibki v obrabotke kirillitsy, kotorye nuzhno ispravlyat'
Netscape Mail (Mozilla) v.3.*  Vhodyashchie: net
Ishodyashchie: win to koi, koi to koi
Otvety: koi to koi 
nuzhny shrifty koi8; ne ispol'zovat' vneshnyuyu perekodirovku 
koi8-r (mozhet otlichat'sya ot fakticheskoj kodirovki)  Odnourovnevye papki dlya hraneniya pochty; perepravlyaemye soobshcheniya mogut sozdavat' problemy dlya adresatov, ispol'zuyushchih Eudora 2.2; ne ochen' udoben dlya raboty s kirillitsej
Netscape Messenger (Mozilla) v.4.* Vhodyashchie: iz lyuboj v win
Ishodyashchie: win to koi (v zavisimosti ot konkretnoj versii)
shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny
koi8-r (mozhet otlichat'sya ot fakticheskoj kodirovki) Mnogourovnevye papki dlya hraneniya pochty; Vozmozhnost' sozdaniya neskol'kih profilej dlya raznyh pol'zovatelej; kontraintuitivnyj vybor kodirovki dlya ishodyashchih soobshchenij v v.4.0*; 8-bitnyj Subject vklyuchaetsya cherez pravku prefs.js 
MS Internet Mail  Vhodyashchie: koi ili win  to win
Outgoing: win to koi ili win 
shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny
pravil'no: koi8-r ili
Windows-1251
Odnourovnevye papki dlya hraneniya pochty; net vybora kodirovki v rezhime otveta na pis'mo; pis'ma s nepravil'no ukazannoj kodirovkoj mogut byt' nechitabel'ny 
Outlook Express v.4.*, 5.* Vhodyashchie: iz lyuboj kodirovki v Unicode
Ishodyashchie: iz Unicode v lyubuyu kodirovku 
shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny
pravil'no: koi8-r,
Windows-1251 i dr. 
Mnogourovnevye papki dlya hraneniya pochty; vozmozhnost' konfiguratsii neskol'kih account'ov; vozmozhna podderzhka koi8-u; odna iz naibolee udobnyh dlya raboty s kirillitsej pochtovyh programm
The Bat!  Vhodyashchie: iz lyuboj kodirovki v win
Ishodyashchie: iz win v lyubuyu kodirovku 
shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny
pravil'no: koi8-r, koi8-u,
Windows-1251 i dr.
Malen'kaya no ves'ma moshchnaya pochtovaya programma; mnogourovnevye papki dlya hraneniya pochty; vozmozhnost' konfiguratsii neskol'kih account'ov; podderzhka koi8-u; odna iz naibolee udobnyh dlya raboty s kirillitsej pochtovyh programm
Pegasus Mail  Net 
posle nastrojki - fiksirovannaya:
Vhodyashchie: koi to win; Ishodyashchie: win to koi
posle nastrojki shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny
Posle nastrojki: koi8-r  Dovol'no moshchnyj, no interfejs ne ochen' udoben; trebuet nastrojki; mnogourovnevye papki dlya hraneniya pochty; problemy s 8-bitnymi zagolovkami; 
Ne ochen' udoben dlya raboty s kirillitsej
Forte Agent
(not Free!) 
Posle nastrojki: menyu perekodirovok
V zavisimosti ot nastrojki, mozhet ispol'zovat'sya vnutrennyaya libo vneshnyaya perekodirovka
Posle nastrojki: koi8-r, koi8-u i dr.  Odin iz luchshih newsreader'ov, kotoryj mozhet ispol'zovat'sya i kak pochtovaya programma; odnourovnevye papki dlya hraneniya pochty; 
o nastrojke sm. www.glasnet.ru/~kazarn/soft.htm
Eudora "nichego ne znaet" o kirillitse i sama po sebe ne proizvodit nikakoj perekodirovki kirillicheskogo teksta. Poe'tomu dlya chteniya i otpravki pisem v kodirovke KOI-8 prihoditsya libo ustanavlivat' shrifty i raskladki klaviatury tipa KOI-8, libo pol'zovat'sya "vneshnej" perekodirovkoj. Nastrojka etoj pochtovoj programmy dlya perepiski po-russki zaklyuchaetsya v zadanii dlya otobrazheniya teksta kirillicheskih shriftov (tipa koi-8 ili Windows-1251) cherez menyu Tools/ Options/ Fonts & Display. Rezhim preobrazovaniya ishodyashchih 8-bitnyh soobshchenij v 7-bitnuyu formu (quoted-printable) kontroliruetsya cherez menyu Options/ Sending Mail/ May Use Quoted-Printable. Esli 8-bitnyj tekstovyj fajl posylaetsya kak prilozhenie, nado obratit' vnimanie na optsiyu "Put text attachments in body of message" v menyu Tools/ Options/ Attachments : esli ona vklyuchena, tekst budet vstavlen v telo soobshcheniya, a esli vyklyuchena, to prilozhen v vide otdel'nogo fajla.

Problemy.
Pozhaluj, samoe privlekatel'noe v Eudora - ee udobnyj pol'zovatel'skij interfejs; no e'ta pochtovaya programma imeet i ryad nedostatkov:

Stoit otmetit' eshcho odin nedostatok Eudora 2.2, ne svyazannyj s obrabotkoj kirillitsy. Eudora avtomaticheski dekodiruet fajly, prilozhennye k prihodyashchim pis'mam, i sohranyaet ih v zadannom kataloge (obychno v \Eudora\Attach). Pri etom Eudora 2.2 chasto ne mozhet avtomaticheski (po dvojnomu shchelchku myshi) otkryvat' prilozhennyj fajl s dlinnym imenem, soderzhashchim probely (v takih fajlah, naprimer, prihodyat soobshcheniya, perepravlennye iz Netscape Mail), i ego prihoditsya otkryvat' "vruchnuyu", chto dovol'no neudobno. V Eudora v.3.* e'tot nedostatok ispravlen.
Avtomaticheskoe dekodirovanie prilozhennyh dvoichnyh fajlov takzhe neudobno, kogda prihodit fajl v UUencode, "narezannyj" na neskol'ko kusochkov. Pri e'tom pervyj kusochek avtomaticheski dekodiruetsya i sohranyaetsya pod imenem ishodnogo dvoichnogo fajla (fakticheski buduchi lish' ego "ogryzkom"), a ostal'nye kuski ostayutsya neperekodirovannymi. Dlya togo, chtoby vosstanovit' original'nyj fajl, nuzhno zakodirovat' etot "ogryzok" obratno v UUencode, "prikleit'" k nemu po poryadku vse posleduyushchie kuski i potom uzhe dekodirovat' "skleennyj" fajl.

Eshche odin nedostatok Eudora - eto nevozmozhnost' chitat' ili nabirat' pis'ma vo vremya otsydki ili priema pochty.

Vazhnoe preimushchestvo Eudora Pro v.3.* nad predydushchimi versiyami Eudora - eto podderzhka neskol'kih "personalities" s razlichnymi ustanovkami (imya pol'zovatelya, pop3 i smtp server i drugie ustanovki), a takzhe podderzhka dopolnitel'nyh modulej (plugin'ov). Obrabotka kirillitsy v nej idet prakticheski tak zhe, kak i v v.2.2, vklyuchaya ukazanie v zagolovke soobshchenij nevernoj kodirovki iso-8859-1. Odnako v etom sluchae luchshe ne redaktirovat' fajl Eudora.exe, a ispol'zovat' koi8-plugin, razrabotannyj Evgeniem Suroveginym (sm.  www.glasnet.ru/~ebs/koi8plugin.html).  E'tot plugin dobavlyaet v menyu "Edit/ Message plug-ins" komandy dlya perekodirovki teksta iz koi8-r v windows-1251 i naoborot; krome togo, on ukazyvaet kodirovku ishodyashchih soobshchenij kak koi8-r ili windows-1251 vmesto iso-8859-1.
koi8-plugin mozhet ispol'zovat'sya i s Eudora Pro v.4.*; ob oshibkah v obrabotke kirillitsy, kotorye est' v v.4.* i ih ispravlenii mozhno prochest' na www.glasnet.ru/~ebs/koi8plugin.html.

Iz-za svoej nesposobnosti k "vnutrennej" perekodirovke Eudora chasto ispol'zuetsya s pop3/smtp proksi-serverami, kotorye perekodiruyut vhodyashchie i ishodyashchie soobshcheniya na kirillitse iz koi8-r v Windows-1251 i naoborot. Esli ispol'zovat' Eudora v.3.* ili 4.* s koi8-plugin'om, mozhet byt' udobno poluchat' pochtu neperekodirovannoj, a otsylat' soobshcheniya cherez perekodiruyushchij smtp proksi-server. Pri etom vhodyashchie pis'ma mozhno v sluchae neobhodimosti perekodirovat'  koi8-plugin'om, a ishodyashchie budut avtomaticheski perekodirovat'sya proksi-serverom v koi8-r. (Odnako v etom sluchae nuzhno vnimatel'no posmotret' nastrojki koi8-plugin'a - esli ne vyklyuchit' optsiyu "Analyze charset when sending email", to pis'ma mogut uhodit' s ukazaniem v zagolovke kodirovki Windows-1251, no ih tekst posle perekodirovki na smtp-servere budet v koi8-r).
 


E'ta versiya Netscape Mail uzhe ustarela, i davno pora zamenit' ee na bolee novuyu. Ona ne proizvodit nikakoj perekodirovki kirillitsy, i dlya chteniya i otpravki pisem v KOI-8 nuzhny shrifty i raskladki klaviatury tipa KOI-8. Nastrojka - ta zhe, chto i dlya brauzera Netscape Navigator (v.2). Kodirovka kirillitsy v zagolovke ishodyashchih pisem ukazyvaetsya neverno. Nastrojka dlya perepiski na kirillitse analogichna nastrojke brauzera Netscape Navigator (v.3). Esli  Document Encoding v menyu Options ustanovleno na "Cyrillic (Win1251)", ishodyashchie soobshcheniya mozhno nabirat' v kodirovke Windows-1251, pri otpravke oni budut perekodirovany v koi8-r, a v ih zagolovkah budet ukazano "charset=koi8-r". Esli nastrojka Document Encoding ustanovlena na Syrillic (KOI8-R), to ishodyashchie pis'ma nuzhno nabirat' v kodirovke KOI-8. Vhodyashchie pis'ma NE perekodiruyutsya.

Rezhim otpravki pisem v 8-bitnoj forme vklyuchaetsya v Netscape Mail cherez menyu Options/ Mail and News Preferences/ Composition/ Allow 8-bit.

Netscape Mail v.3 ne sleduet ispol'zovat' s pop3/smtp proksi-serverami, perekodiruyushchimi vhodyashchie i ishodyashchie pis'ma iz koi8-r v Windows-1251 i obratno.

Kogda Netscape Mail perenapravlyaet soobshchenie drugomu adresatu (Forward), po umolchaniyu ishodnyj tekst peresylaetsya v vide prilozhennogo fajla s dlinnym imenem, opredelyaemym zagolovkom ishodnogo soobshcheniya. Dlya nekotoryh poluchatelej takie pis'ma sozdayut problemy; oni budut Vam ves'ma priznatel'ny, esli Vy ne prosto nazhmete na knopku "Forward", a perenapravite pis'mo v protsitirovannom vide, ispol'zuya menyu Message/ Forward Quoted.


Dannaya pochtovaya programma vmeste s brauzerom Microsoft Internet Explorer (v.3) vklyuchena v sostav operatsionnoj sistemy Windows95 (versiya OSR2). E'ta programma pozvolyaet ispol'zovat' Windows-1251 v kachestve "vnutrennej" kodirovki, a otpravlyat' pis'ma v kodirovke Windows-1251 ili KOI8-R po vyboru, prichem s ukazaniem pravil'noj kodovoj stranitsy. Kodirovka, v kotoroj Vy chitaete prihodyashchie pis'ma i otpravlyaete ishodyashchie, vybiraetsya cherez menyu View/ Language. (Esli Vy otvechaete na poluchennoe pis'mo, to e'ta nastrojka nedostupna – pis'mo budet otpravleno v toj zhe kodirovke, chto i ishodnoe). Chtoby peresylat' kirillitsu (v tom chisle v pole "Subject") v 8-bitnom vide, v menyu Mail/ Options/ Send nastrojku "Mail Sending Format" nuzhno ustanovit' na "Plain text", pri etom v "Settings" zadat' "Message Format"="MIME" i "Encode text using"="None", a takzhe vklyuchit' optsiyu "Allow 8-bit characters in headers".

Esli Vy pol'zuetes' pochtovoj programmoj Microsoft Internet Mail, to Vam ne nuzhno ni "koizirovat'" Windows, ni rabotat' cherez spetsial'nye perekodiruyushchie proksi-servery.


V otlichie ot Netscape Mail v.3, dlya Netscape Messenger v.4.* ne nuzhny shrifty i raskladki klaviatury tipa koi8. On mozhet sam perekodirovat' soobshcheniya iz razlichnyh kodirovok cherez menyu View/ Encoding ili View/ Character Set. V voprose otsylki soobshchenij est' odna tonkost': chtoby otoslat' pis'mo v kodirovke koi8-r, dlya versij 4.0* nuzhno vybrat' v okne sostavleniya soobshcheniya kodirovku Windows-1251 i nabrat' tekst, ispol'zuya obychnye shrifty i raskladki klaviatury; togda pri otpravke pis'mo budet avtomaticheski perekodirovano v koi8-r. To, chto proizojdet pri vybore v okne sostavleniya pis'ma drugoj kirillicheskoj kodirovki, zavisit ot versii Netscape. Dlya versij 4.0* pri vybore kodirovki koi8-r (ili Western) pochtovaya programa "dumaet", chto tekst uzhe nabran v nuzhnoj perekodirovke, i ne preobrazuet ego iz Win-1251 v koi8-r. (Takim obrazom, poluchaetsya, chto dlya otpravki pis'ma v kodirovke koi8-r nuzhno vybrat' kodirovku Win-1251, zato pri vybore koi8-r pis'mo budet otpravleno v kodirovke Win-1251, no s prostavlennym v zagolovke soobshcheniya charset=koi8-r, chto mozhet vyzyvat' problemy pri chtenii takogo pis'ma).
Dlya versij 4.5*- 4.7* kirillicheskaya kodirovka, vybiraemaya pri sostavlenii pis'ma, ne imeet znacheniya -- v lyubom sluchae pis'mo preobrazuetsya v koi8-r. Takim obrazom, upravlenie kodirovkoj ishodyashchih soobshchenij v Netscape Messenger realizovano "krivo" i nepolno.

Netscape Messenger v.4 ne nuzhno ispol'zovat' s perekodiruyushchimi pop3 i smtp serverami.

Chtoby zastavit' Netscape Messenger v.4.0* otsylat' soobshcheniya v 8-bitnom formate, bez preobrazovaniya v quoted-printable, nuzhno v menyu Edit/ Preferences/ Mail & Newsgroups/ Messages/ ustanovit' pereklyuchatel' "Send messages that use 8-bit characters" v polozhenie "As is".
Krome togo, v menyu Edit/ Preferences/ Mail & Newsgroups/ Formatting/  rekomenduetsya otklyuchit' HTML-formatirovanie ishodyashchih pisem ("Use the plain text editor to compose messages").

Nekotorye problemy i ih reshchenie.

Problema: Netscape Messenger v.4.5*- 4.7* otsylaet Subject zakodirovannym v 7-bitnuyu formu. Kak zastavit' ego otsylat' Subject v obychnom 8-bitnom formate?
Reshenie: E'tu ustanovku nel'zya ispravit' cherez konfiguratsionnye menyu. Pridetsya otkryt' dlya redaktirovaniya konfiguratsionnyj fajl  prefs.js file (on dolzhen byt' v kataloge ...\Netscape\Users\<pol'zovatel'>) i dopisat' tuda sleduyushchuyu stroku:
user_pref("mail.strictly_mime_headers", false);
Imeet smysl takzhe dopisat' stroku
user_pref("mailnews.start_page.enabled", false);
kotoraya otmenyaet avtomaticheskoe obrashchenie Netscape Messenger'a k Netscape NetCenter dlya pokaza privetstvennogo soobshcheniya.

Bolee podrobno nastrojka opisana Pavlom Gorodyanskim na
http://www.relcom.ru/Russification/WinNetscape/.


Outlook Express vklyuchen v sostav Microsoft Internet Explorer v.4.* i 5.*, i ego vozmozhnosti po obrabotke kirillitsy gorazdo moshchnee, chem u MS Internet Mail & News, vklyuchennogo v IE v.3.*.
Nastraivaetsya Outlook Express dlya raboty s kirillitsej cherez menyu Tools/ Options/ Read/ Fonts, Tools/ Options/ Send/ International Settings, Tools/ Options/ Send/ Mail (News) Sending Format (zdes' i dalee nazvaniya menyu ukazany dlya versii 5; v versii 4 oni mogut neskol'ko otlichat'sya). Rekomenduetsya v menyu Tools/ Options/ Send/ International Settings ustanovit' KOI8-R kak kodirovku po umolchaniyu, a v menyu Tools/ Options/ Send/ Mail (News) Sending Format ukazat' "Plain text"; v menyu Tools/ Options/ Send/ Mail (News) Sending Format/ Plain text settings zadat' "Message format" = "MIME", "Encode text using"="None", a takzhe "Allow 8-bit characters in headers". Esli nuzhno otpravlyat' prilozhennye dvoichnye fajly v formate UUencode vmesto MIME/base64, vyberite "Message format" = "Uuencode" vmesto MIME. Odnako pri etom v zagolovke pis'ma mozhet ne prostavlyat'sya kodirovka.
Pri chtenii ili sostavlenii pisem (v tom chisle otvetov), kodirovku teksta legko vybrat' cherez menyu View/ Encoding ili Format/Encoding.

Pri otpravke soobshchenij iz Outlook Express nuzhno pomnit', chto vnutrennej kodirovkoj etoj programmy yavlyaetsya Unicode, i tekst soobshcheniya v printsipe mozhet soderzhat' lyubye simvoly, kotorye est' v Unicode. Kodirovka, v kotoroj soobshchenie budet otpravleno, vybiraetsya cherez menyu Format/Encoding v okne sostavleniya soobshcheniya. Pri preobrazovanii otpravlyaemogo teksta iz Unicode vo "vneshnyuyu" kodirovku vozmozhna situatsiya, kogda nekotoryh simvolov, ispol'zovannyh v tekste pis'ma, vo "vneshnej" kodirovke prosto net. Takie simvoly budut zameneny voprositel'nymi znakami, i peredavaemaya imi informatsiya budet bezvozvratno uteryana. Chasto takaya situatsiya voznikaet, kogda poluchatel' pis'ma, napisannogo latinskimi bukvami, otvechaet na nego (libo perepravlyaet komu-to so svoimi kommentariyami) na kirillitse. Po umolchaniyu kodirovka otveta budet toj zhe, chto i kodirovka ishodnogo pis'ma; esli ishodnoe pis'mo prishlo, naprimer, v kodirovke iso-8859-1 ili us-ascii, to otvet budet otpravlen v toj zhe kodirovke (esli ee ne izmenit' "vruchnuyu"), i vse bukvy kirillitsy budut zameneny voprositel'nymi znakami. Chtoby etogo ne proizoshlo, pri otpravke soobshchenij na kirillitse (osobenno v otvet na chuzhie soobshcheniya) nuzhno proveryat' kodirovku cherez menyu Format/Encoding. Pri sostavlenii novogo soobshcheniya po umolchaniyu obychno vybiraetsya kodirovka KOI8-R; esli otpravlyaetsya tekst na ukrainskom yazyke, to nuzhno ne zabyt' izmenit' e'tu kodirovku na druguyu, v kotoroj est' ukrainskie bukvy (KOI8-U ili Windows-1251), inache oni budut zameneny voprositel'nymi znakami.

Radikal'nym resheniem problemy poteri chasti simvolov pri perehode ot Unicode k vneshnej kodirovke bylo by ispol'zovanie 7- ili 8-bitnyh predstavlenij Unicode UTF-7 ili UTF-8 (pri etom mozhno peresylat' mnogoyazychnye teksty); odnako poka chto e'ti kodirovki podderzhivayutsya lish' nemnogimi pochtovymi programmami (Outlook Express, Netscape Messenger, Forte Agent), da i bol'shinstvo perekodirovshchikov ih "ne ponimayut". Poe'tomu ispol'zovat' UTF-7 ili UTF-8 stoit tol'ko v tom sluchae, kogda vy uvereny, chto vash adresat smozhet ih prochest'.

Razumeetsya, pri ispol'zovanii Outlook Express ne nuzhno podklyuchat'sya k provajderu cherez perekodiruyushchie pop3 i smtp servera - inache pis'mo mozhet byt' perekodirovano lishnij raz.

Nekotorye problemy i resheniya

Problema: Inogda tekst nechitabelen dazhe esli v menyu View/ Language ustanovlena pravil'naya kodirovka.
Reshenie: Poprobujte pereklyuchit'sya na druguyu kodirovku (naprimer, Win-1251 vmesto koi8-r), a potom obratno na pravil'nuyu.

Problema: Nekotorye (ili vse) simvoly kirillitsy (osobenno v pole Subject) pri pechati zamenyayutsya znakami voprosa, hotya na e'krane vidny normal'no.
Reshenie: E'ta problema (i nekotorye drugie) s raspechatkoj kirillitsy mozhet nablyudat'sya dlya nekotoryh beta-versij OE4 i OE5. Ustanovite bolee novuyu versiyu programmy. Mozhno probovat' takzhe razlichnye shrifty, hotya eto i ne vsegda pomogaet. Krome togo, poprobujte v Internet Explorer (menyu Tools/Internet Options/General/Accessibility) vklyuchit' "Ignore font styles specified on Web Pages".

Problema: Inogda OE v.5.0 pokazyvaet russkoyazychnye zagolovki v spiske soobshchenij telekonferentsii v nepravil'noj kodirovke (ne perekodirovannymi iz koi8 v win-1251). Pereklyuchenie kodirovki ne pomogaet.
Reshenie: E'to izvestnaya oshibka v OE v.5.0 (ispravlena v OE v.5.01). Mmetody bor'by s nej v OE v.5.0 ne vsegda e'ffektivny i neskol'ko otdayut "shamanizmom" (sm. sleduyushchij spisok predlagaemyh dejstvij):
- prezhde chem zagruzhat' kakie-libo novye soobshcheniya, zajdite v Inbox ili Outbox i prosmotrite kakoe-nibud' soobshchenie, kotoroe tam uzhe est' (mozhno vklyuchit' optsiyu "When starting, go directly to my Inbox folder" v menyu Tools/ Options/ General);
- v menyu Tools/ Options/ Read/ Fonts zadat' Cyrillic (Windows) kak kodirovku po umolchaniyu;
-v menyu Tools/ Options/ Read/ International Settings zadat' Cyrillic (KOI8-R) kak kodirovku po umolchaniyu i vklyuchit' optsiyu "Use default encoding for all incoming messages".
- v menyu Tools/ Options/ Send/ International Settings zadat' Cyrillic (KOI8-R) kak kodirovku po umolchaniyu.
- vse eto dolzhno pomoch' (hotya inogda mozhet i ne pomoch') tol'ko posle perezagruzki spiska soobshchenij v telekonferentsii (dlya etogo mozhno, naprimer, shchelknut' pravoj knopkoj myshi na nazvanie telekonferentsii v okoshke spisok papok i telekonferentsij, a zatem vybrat' iz kontekstnogo menyu Properties/ Local File/ Reset).
Radikal'noe reshenie problemy -- ustanovit' Outlook Express v.5.01.

Problema: Pri tsitirovanii soobshcheniya, ne kotoroe pishetsya otvet, OE inogda pomechaet tsitiruemyj tekst simvolom tsitirovaniya (">"), a inogda net.
Reshenie: E'to obychno sluchaetsya pri otvete na soobshcheniya, kotorye napisany v formate Rich-Text ili HTML. Poprosite avtora otsylat' soobshcheniya v obychnom tekstovom formate (v Outlook Express 5, dlya etogo nuzhno v menyu Tools/ Options/ Send/ Mail sending format i News sending format zadat' "Plain text").


Pochtovaya programma Pegasus Mail (www.pegasus.usa.com/) nevelika po razmeru i besplatna, no obladaet dovol'no bogatymi vozmozhnostyami. V nej est' mnogo razlichnyh nastroek, kotorye ves'ma privlekatel'ny dlya opytnyh pol'zovatelej, hotya i mogut neskol'ko zaputat' novichkov. Pegasus Mail mozhet ispol'zovat' Windows-1251 kak "vnutrennyuyu" kodirovku i KOI8-R kak "vneshnyuyu". Odnako dlya ego nastrojki nuzhno otredaktirovat' konfiguratsionnye fajly, gde zadany tablitsy perekodirovki. Sm. Veb-stranitsu Andreya Chernova (www.nagual.pp.ru/~ache/koi8.html). O rusifikatsii Pegasusa mozhno prochest' na http://severov.atom.ru/guests/pegasus/.

Pegasus Mail ne pozvolyaet otpravlyat' kirillitsu v pole Subject v 8-bitnom formate. Chtoby otpravit' telo pis'ma v 8-bitnoj forme, nuzhno vklyuchit' optsiyu "Allow 8-bit MIME message encoding" v menyu Tools/ Options/ Advanced Settings/ (pri etom Pegasus Mail mozhet predupredit' Vas, chto otpravka tekstov v 8-bitnom formate "ne vpolne zakonna"). V okoshke "MIME character set" nuzhno zadat' "koi8-r".


The Bat! (www.ritlabs.com/the_bat/)- malen'kaya (instalyatsionnyj fajl zanimaet vsego okolo polutora megabajt) pochtovaya programma s ochen' bogatymi vozmozhnostyami (v tom chisle i po obrabotke kirillitsy). V programme mozhno vklyuchit' menyu na neskol'kih yazykah (v tom chisle na russkom), est' podderzhka neskol'kih account'ov (dostup k kazhdomu iz kotoryh mozhno zashchitit' otdel'nym parolem), mnogourovnevaya sistema papok, nastraivaemye shablony soobshchenij, a takzhe podderzhka vseh osnovnyh kodirovok kirillitsy (koi8-r, Win-1251, DOS-866, ISO-8859-5 i Mac) i dazhe nestandartnyh kodirovok tipa "1251 autoconverted from KOI8" i "KOI8 autoconverted from 1251").
Krome togo, The Bat! podderzhivaet i ukrainskuyu kodirovku koi8-u (s versii 1.18). K bolee rannim versiyam programmy podderzhku koi8-u mozhno dobavit' s pomoshch'yu dopolnitel'noj perekodirovochnoj tablitsy - sm. www.geocities.com/siliconvalley/bay/2294/koi8uxlt.zip).

Pozhaluj, The Bat! - odna iz luchshih pochtovyh programm (esli ne luchshaya) dlya raboty s kirillitsej (dazhe nesmotrya na to, chto podderzhka yunikodovskih kodirovok UTF-8 i UTF-7, vvedennaya nachinaya s versii 1.42, odnostoronnyaya -- t.e. soobshcheniya, prihodyashchie v takom formate, avtomaticheski dekodiruyutsya, no sam The Bat! ne mozhet otpravlyat' soobshcheniya v UTF-8 i UTF-7 i, sootvetstvenno, ne pozvolyaet sostavlyat' "mnogoyazychnye" pis'ma, kak Outlook Express).
The Bat! nastraivaetsya dlya "8-bitnoj" perepiski na kirillitse cherez menyu:
Account/ Properties:
Transport -- 8-bit characters are treated: Without changes.
Options -- Allow 8-bit characters in message headers.
Templates/ New message -- Use character set: Cyrillic (KOI-8).
Options/ Editor preferences/ Display/ Font -- zadat' kirillicheskij shrift.


V stranah byvshego SSSR mnogie vse eshcho rabotayut s e'lektronnoj pochtoj pri pomoshchi programm tipa Bmail/UUPC (ili Demos Mail/UUPC) dlya DOS. E'ti programmy avtomaticheski dozvanivayutsya do pochtovogo servera, otpravlyayut ishodyashchie pis'ma, prinimayut vhodyashchie i srazu zhe avtomaticheski otklyuchayutsya. V sluchae obryva svyazi oni mogut pri sleduyushchem soedinenii prodolzhit' peresylku pis'ma, nachinaya s togo mesta, na kotorom svyaz' prervalas'. Blagodarya etomu, "UUPC"-rezhim otpravki i polucheniya e'lektronnoj pochty mozhet udovletvoritel'no rabotat' i na plohih telefonnyh liniyah (i, krome togo, obychno on znachitel'no deshevle, chem on-line dostup k Internetu).

Esli Vy hotite otpravit' pis'mo adresatu, kotoryj pol'zuetsya programmoj tipa Bmail/UUPC, nado imet' v vidu, chto takie programmy NE ponimayut 7-bitnyh predstavlenij 8-bitnogo teksta v vide quoted-printable ili base64, poe'tomu pis'ma im nuzhno otpravlyat' v 8-bitnoj forme. Krome togo, takie programmy avtomaticheski dekodiruyut lish' fajly-prilozheniya, prilozhennye po metodu UUENCODE.

Voobshche, dlya minimizatsii problem s Bmail, imeet smysl perejti na naibolee svezhuyu versiyu Demos Mail for DOS -- tam est' mnogie vozmozhnosti, kotoryh net v Bmail.

V rannih versiyah programmy Bmail/UUPC (do 5.09g vklyuchitel'no) byla zhestko zalozhena perekodirovka otpravlyaemyh pisem iz DOS-866 v KOI8-R i prinimaemyh – iz KOI8-R v DOS-866. V bolee pozdnih versiyah zalozhena vozmozhnost' vybora tablitsy perekodirovki. Pri etom programma perekodiruet po zadannoj ej tablitse ne vse prinimaemye pis'ma, a tol'ko pis'ma, v sluzhebnyh polyah kotoryh ukazany opredelennye kodovye stranitsy (charset). V rezul'tate pis'ma s nepravil'no ukazannoj kodovoj stranitsej (libo pis'ma tipa "multipart-mixed") chasto popadayut v pochtovyj yashchik neperekodirovannymi. Na praktike chasto byvaet udobnee pol'zovat'sya takoj versiej, kotoraya perekodirovala by vse pis'ma bez ucheta ukazannogo v nih charset’a. Iz novyh versij Bmail/UUPC, s etoj tochki zreniya udobnee vsego versiya 6.18m (ona ne perekodiruet tol'ko tekst v pis'mah tipa "multipart-mixed").

Sovremennye pochtovye programmy tipa Outlook Express, The Bat!, Netscape Messenger, Eudora i t.p. sami po sebe ne podderzhivayut peredachu e'lektronnoj pochty po protokolu UUCP (UUCP oznachaet "Unix-to-Unix Copy Protocol", a UUPC -- realizatsiya UUCP dlya PC), odnako sushchestvuyut spetsial'nye programmy, igrayushchie rol' "shlyuzov" mezhdu protokolami peredachi pochty POP3/SMTP i UUCP. Pri etom mozhno byt' podklyuchennym k provajderu po protokolu UUCP, no dlya chteniya i sostavleniya pisem ispol'zovat' "normal'nuyu" pochtovuyu programmu. Odna iz takih programm-"shlyuzov" -- UUCP Connect (www.novgorod.net/~kvantsoft/), a drugaya -- Mailserver (naskol'ko ya znayu, avtor Mailserver'a prekratil rabotu nad etoj programmoj v 1998 g.; ee poslednyuyu besplatnuyu versiyu mozhno najti zdes': www.geocities.com/g_naumovets/mlsrv212.zip).


Vo vremena, kogda ne bylo pochtovyh programm, sposobnyh samostoyatel'no perekodirovat' tekst, naprimer, iz koi8 v windows-1251 i obratno, nekotorye provajdery ustanovili u sebya spetsial'nye perekodiruyushchie proksi-servery, chtoby pomoch' svoim klientam reshat' problemy s perekodirovkoj kirillitsy i sdelat' nenuzhnoj "koizatsiyu" Windows. Esli ukazat' v nastrojkah pochtovoj programmy takie servery v kachestve POP3- i SMTP-serverov, to prohodyashchaya cherez nih pochta budet avtomaticheski perekodirovat'sya po zadannoj provajderom tablitse. O funktsii takih serverov chasto mozhno dogadat'sya po ih nazvaniyu (naprimer, server pop-1251.gu.net perekodiruet prihodyashchie pis'ma iz koi8-r v Windows-1251, server smtp-1251.gu.net perekodiruet ishodyashchie pis'ma iz Windows-1251 v koi8-r, a server news-1251.gu.net vypolnyaet analogichnuyu perekodirovku pri rabote s telekonferentsiyami).

Odnako esli pis'mo prihodit ne v toj kodirovke, na kotoruyu rasschitan proksi-server (naprimer, Windows-1251 vmesto koi8-r), libo s nepravil'no ukazannoj kodovoj stranitsej (esli dannyj proksi-server obrashchaet vnimanie na pole charset), to ono budet perekodirovano nepravil'no. Poe'tomu tem, kto rabotaet cherez perekodiruyushchij proksi-server, navernyaka pridetsya derzhat' pod rukoj i spetsial'nye perekodiruyushchie programmami, kotorye smogut ispravit' posledstviya nepravil'noj perekodirovki.

Pri rabote s "umnoj" pochtovoj programmoj tipa Outlook Express ili The Bat! ispol'zovat' perekodiruyushchie proksi-servery net nikakogo smysla -- naoborot, eto mozhet tol'ko porodit' pis'ma v "izvrashchennyh" kodirovkah.


Dlya perekodirovki kirillitsy razrabotano mnogo razlichnyh programm. Esli Vy umeete rabotat' s programmami dlya DOS, to mozhno porekomendovat' malen'kuyu programmku pod nazvaniem Recode, kotoruyu mozhno najti, naprimer, na <http://www.kiarchive.ru/pub/archive-tools/msdos/convert/ch ar/>. Krome obychnoj dlya programm takogo roda funktsii preobrazovaniya teksta iz odnoj kodovoj stranitsy kirillitsy v druguyu, e'ta programmka pozvolyaet eshche i vosstanavlivat' ishodnuyu 8-bitnuyu formu teksta, zakodirovannogo po metodu Quoted-printable ili s pomoshch'yu spetsial'nyh komand yazyka HTML (v poslednem sluchae tekst mozhet vyglyadet' primerno tak: "&Acirc;&egrave;&ntilde;&icirc;&ecirc;&icirc;&icirc;&aacute;&eth" i t.p.). E'ta programma osobenno polezna dlya teh, kto pol'zuetsya pochtovymi sistemami tipa Bmail/UUPC.
CP Tuner 97/2000 (www.smartlinkcorp.com) mozhet rabotat' kak plugin dlya Word 7.0 i Word 97, a takzhe kak samostoyatel'naya programma. V nee zalozheny razlichnye shemy perekodirovki teksta (v tom chisle mnogokratnoj), kotorye mogut vstretit'sya na praktike. Esli v menyu CP Tuner 97 Tools/ Options/ vybrat' rezhim "On Decode command: Autodetect the best named scheme and use it", to po kommande Tools/ Decode programma popytaetsya avtomaticheski preobrazovat' tekst v kodirovku Windows 1251. V bol'shinstve sluchaev (vklyuchaya i opisannyj v predydushchem paragrafe), avtomaticheskij rezhim perekodirovki srabatyvaet uspeshno. Esli net, mozhno dobavit' k imeyushchimsya shemam perekodirovki svoi sobstvennye. CP Tuner -- e'to platnaya programma (s www.smartlinkcorp.com mozhno zagruzit' probnuyu versiyu s ogranichennym srokom dejstviya). Odnako v Internete mozhno najti i mnozhestvo besplatnyh perekodirovshchikov (sm., naprimer, www.download.ru), mnogie iz kotoryh po svoim vozmozhnostyam ne ustupayut CP Tuner'u. Po printsipu i vozmozhnostyam Tot-Recode II (http://smartline.ru/recode/) dovol'no shoden s CP Tuner 97 (hotya pol'zovatel'skij interfejs vyglyadit nemnogo inache). Vazhnoe preimushchestvo Tot-Recode II - to, chto on besplaten.
On mozhet takzhe dekodirovat' quoted-printable v 8-bitnyj format (v ruchnom rezhime; udobno sozdat' novuyu shemu, vklyuchayushchuyu preobrazovanie iz QP v 8-bit i iz KOI v Win).
Kak i CP Tuner 97, on mozhet avtomaticheski "transliterirovat'" kirillitsu (t.e. zamenyat' bukvy kirillitsy "foneticheski shodnymi" latinskimi bukvami ili ih kombinatsiyami).

Na www.download.ru mozhno najti i mnozhestvo drugih perekodirovshchikov. Iz nih imeet smysl vybrat' takoj, kotoryj podderzhivaet kodirovki UTF-7 i UTF-8 (naprimer, Russian Anywhere - sm. http://private.peterlink.ru/dll/rus/re.html)

Nekotorye perekodirovshchiki kirillitsy dostupny cherez Internet  -- sm., naprimer, Automatic Online Decoder (www.design.ru/free/decoder) ili Ilya Sandler's Universal Cyrillic Converter (www.friends-partners.org/~isandler/cyrconv/cyrconv.html).

Problemy, spetsifichnye dlya ukrainskogo yazyka

K sozhaleniyu, v standartnuyu kodovuyu stranitsu koi8-r (v otlichie ot Win-1251) ne byli vklyucheny bukvy, spetsifichnye dlya ukrainskogo yazyka. Ukrainskaya versiya koi8 byla izvestna pod nazvaniem koi8-u uzhe na protyazhenii neskol'kih let, no lish' v aprele 1998 g. ona byla ofitsial'no zaregistrirovana v RFC 2319. Do sih por daleko ne vse pochtovye programmy, brauzery, perekodiruyushchie proksi-servery, podderzhivayushchie kodirovku koi8-r, korrektno rabotayut i s koi8-u. (Iz-za etogo poyavilos' dovol'no mnogo ukrainoyazychnyh Veb-stranits, dostupnyh tol'ko v kodirovke Windows-1251).
Nizhe perechisleny nekotorye brauzery, pochtovye programmy i newsreader'y, kotorye mogut rabotat' s kodirovkoj koi8-u: Informatsiyu o KOI8-U mozhno takzhe najti na http://cad.ntu-kpi.kiev.ua/multiling/koi8-u/index.html.
Nizhe pokazano razmeshchenie simvolov v kodovoj tablitse KOI8-U/

Rusifikatsiya Windows98

Dlya togo, chtoby normal'no rabotat' v Windows98 s russkoyazychnymi tekstami i programmami, sovershenno ne obyazatel'no ustanavlivat' russkoyazychnuyu versiyu e'toj operatsionnoj sistemy. Esli vy rabotaete s angloyazychnoj versiej Windows98, prover'te, chtoby byl ustanovlen Multilanguage Support s podderzhkoj kirillitsy (Control Panel/ Add-Remove Programs/ Windows Setup/ Multilanguage Support/ Cyrillic). Esli na paneli zadach net pereklyuchatelya klaviatury, ego mozhno vklyuchit', dobaviv neobhodimye raskladki cherez Control Panel/ Keyboard. E'togo dostatochno dlya togo, chtoby v sisteme poyavilis' kirillicheskie True Type shrifty, i chtoby s nimi mozhno bylo rabotat' v prikladnyh programmah. Odnako mnogie programmy s russkoyazychnym interfejsom ispol'zuyut dlya pokaza nadpisej v menyu ne True Type, a sistemnye shrifty, i takie nadpisi mogut okazat'sya nechitabel'nymi (naprimer, vmesto russkih bukv mogut byt' vidny simvoly podcherkivaniya). Radikal'nyj sposob resheniya etoj problemy -- v protsesse instalyatsii Windows98 v otvet na vopros o regional'nyh nastrojkah vybrat' russkie ili ukrainskie -- pri etom budut ustanovleny kirillicheskie sistemnye shrifty, i posle zaversheniya protsessa ustanovki sistema budet normal'no rabotat' s russkoyazychnymi programmami nezavisimo ot togo, kakie regional'nye nastrojki vklyucheny v dannyj moment -- russkie ili, naprimer, English (US). Odnako esli anglijskaya Windows98 ne byla rusifitsirovana "na kornyu", to dlya ustraneniya problem pri rabote s russkoyazychnymi menyu pridetsya libo pereustanovit' ee nanovo uzhe s russkimi regional'nymi nastrojkami, libo ispol'zovat' kakuyu-nibud' spetsial'nuyu programmu-rusifikator -- naprimer, Parawin98 (www.smartlinkcorp.com), kotoryj pozvolyaet ne tol'ko redaktirovat' raskladki klaviatury, no i izmenit' neobhodimye sistemnye nastrojki i fajly Windows98.


Literatura

Veb-stranitsa Andreya Chernova: "Bibliya" po "koizatsii" razlichnyh operatsionnyh sistem i programmnogo obespecheniya <http://www.nagual.pp.ru/~ache/koi8.html>

How to Russify Netscape Navigator for Windows <http://www.relcom.ru/Russification/WinNetscape> -- WinNetscape Russification Bible by Paul Gorodyanski

Paul Gorodyansky's Web page http://ourworld.compuserve.com/homepages/PaulGor/ - Russification of Netscape, Office 97 and other helpful stuff

Konstantin Kazarnovskii about fonts and languages <http://shlimazl.newmail.ru/fontsmain.htm> -- very educational and well written, definitely worth reading

Lots of helpful information on Russification of various programs and operation systems <http://www.siber.com/sib/russify/>

The Cyrillic Charset Soup - o razlichnyh kodirovkah kirillitsy
<http://czyborra.com/charsets/cyrillic.html>

Cyrillic, Russian, Slavic and East European fonts and tools for Windows
Stranitsa Kristofa Zingera na nemetskom, anglijskom i russkom yazykah
po voprosam kirillizatsii i ukrainizatsii v Windows.
<http://homepages.uni-tuebingen.de/student/christoph.si nger/slovo/>

Win95 Russification FAQ - <http://www.hackzone.ru/rtw95>

WinNT Russification - <http://rwntug.quarta.msk.ru/questions.htm>

Russification of Macintosh computers <http://www.relcom.ru/Russification/MacKoi8-r>

Nastrojka Forte Agent dlya raboty s kirillitsej
<http://www.glasnet.ru/~kazarn/soft.htm>
<http://blue.iris.mipt.ru/timur/agent.htm>

How mailers should handle Cyrillic messages (and how they actually do it) <http://blue.iris.mipt.ru/timur/trueway.htm>

A lot of useful programs for working with Cyrillic texts <http://www.kiarchive.ru/pub/cyrillic/>

Some frequently asked questions about Russification of DOS and Windows <http://www.maths.monash.edu.au/~kig/ruscom/general/rusfaq .html>

Installation of various keyboard layouts for native Windows95 keyboard switcher <http://www.netsight.net/~ryba/cyrillic/index.html>

Internet standards (RFC -- requests for comments) <http://www.rfc-editor.org>
RFC 1489: description of KOI8-R code page
RFC 1521: MIME format for messages sent over the Internet
RFC 1522: MIME format for non-ASCII characters in the message headers
RFC 2319: Ukrainian Character Set KOI8-U
RFC 2152: UTF-7 -- A Mail-Safe Transformation Format of Unicode
RFC 2279: UTF-8, a transformation format of ISO 10646


Blagodarnosti

Avtor blagodaren  Pavlu Gorodyanskomu, Konstantinu Kazarnovskomu, Igoryu Manyuku i Antonu Lobastovu za raz^yasneniya i podskazki. 1