Dannyj tekst ne pretenduet na vseob^emlyushchuyu rol' i otrazhaet lichnyj opyt avtora. V razdele "Literatura" mozhno najti ssylki na drugie materialy po etomu voprosu. Avtor budet priznatelen za lyubye dopolneniya, ispravleniya ili kommentarii.
Data poslednej redaktsii: 25 oktyabrya 2000 g.
Samaya svezhaya versiya dannogo teksta dolzhna byt' dostupna na http://geocities.datacellar.net/g_naumovets
Bukvy "prostoj latinitsy" i osnovnye simvoly, vhodyashchie v tablitsu ASCII |
Vazhno ponimat', chto sam po sebe 8-bitnyj kod ne pozvolyaet odnoznachno opredelit' bukvu ili simvol, kotorym on sootvetstvuet -- nuzhno eshcho znat', kakaya imenno kodovaya tablitsa ispol'zovalas' v dannom sluchae dlya kodirovki teksta (podobno tomu kak pri chtenii daty, v kotoroj god zapisan tol'ko dvumya tsiframi, neobhodimo znat', kakoe imenno stoletie podrazumevaetsya). Tak chto "problema 8-bitnyh kodirovok" v nekotorom smysle analogichna "probleme 2000 goda" -- e'konomiya kolichestva razryadov, ispol'zuemyh dlya zapisi daty libo teksta, privodit k neodnoznachnosti ih rasshifrovki.
V operatsionnoj sisteme Windows 3.1/3.11 dlya raboty s russkoyazychnymi tekstami ispol'zovalas' kodovaya stranitsa 1251 (ee nazyvayut takzhe "Windows-1251", libo prosto "kodirovka Windows"). Naprimer, esli nabrat' russkij tekst v MS Word for Windows i sohranit' ego kak "Text Only", to poluchennyj tekstovyj fajl budet zapisan imenno v etoj kodirovke. V posleduyushchih versiyah Windows kirillicheskij tekst zapisyvaetsya libo v kodirovke Windows, libo v kodirovke Unicode (naprimer, vnutri dokumentov MS Word versij 6.0 i 7.0 (95) russkij tekst zapisyvaetsya v kodirovke Windows-1251, a vnutri dokumentov MS Word versij 97 i 2000 -- v kodirovke Unicode). Kodirovka Windows-1251 ispol'zuetsya "starymi" (unasledovannymi eshcho ot Windows 3.1/3.11) shriftami Windows ("novye", t.e. "mnogoyazychnye" shrifty Windows 95/98/2000 osnovany na kodirovke Unicode).
V operatsionnoj sisteme DOS dlya raboty s russkoyazychnymi tekstami naibolee rasprostranena kodovaya stranitsa 866, izvestnaya takzhe pod nazvaniem "modifitsirovannoj al'ternativnoj kodirovki" (uproshchenno ee nazyvayut "Al'ternativnaya" ili "kodirovka DOS"). Pri "russkih" regional'nyh nastrojkah Windows sohranenie teksta iz MS Word for Windows v vide "MS-DOS Text" zapishet tekstovyj fajl imenno v etoj kodirovke. Chtoby pravil'no schityvat' takie fajly v MS Word for Windows, nuzhno vklyuchit' cherez menyu Tools/ Options/ General/ ustanovku "Confirm conversion at open", a pri otkrytii fajla v otvet na zapros programmy ukazyvat' preobrazovanie iz "MS-DOS Text".
V operatsionnyh sistemah semejstva UNIX dlya russkoyazychnyh tekstov obychno
ispol'zuetsya kodovaya
stranitsa KOI-8 ("Kod obmena informatsiej 8-bitnyj"). Tochnee govorya,
imenem "KOI-8" nazyvayut tseloe semejstvo nemnogo otlichayushchihsya drug ot druga
kodovyh stranits - naprimer, russkuyu KOI8-R (RFC
1489) i ukrainskuyu KOI8-U (RFC
2319). Imenno kodirovka KOI-8 (v variante "koi8-r") prinyata kak standartnaya
v russkoyazychnyh telekonferentsiyah USENET (naprimer, v gruppah novostej ierarhii
relcom.*) i chashche vsego ispol'zuetsya dlya peresylki sooobshchenij na russkom
yazyke po e'lektronnoj pochte. Ochen' mnogo poleznoj informatsii ob etoj kodirovke
i o tom, kak nastroit' na nee razlichnye programmy, mozhno najti na Web-stranitse
Andreya Chernova (http://www.nagual.pp.ru/~ache/koi8.html).
Pod Windows teksty v kodirovke KOI-8 mozhno chitat' i raspechatyvat',
ispol'zuya shrifty tipa KOI-8 dlya Windows. Odnako dlya togo, chtoby nabirat'
teksty v etoj kodirovke, nuzhno imet' spetsial'nuyu raskladku klaviatury.
(Vprochem, pri ispol'zovanii sovremennyh pochtovyh programm, umeyushchih delat'
perekodirovku iz Windows-1251 v KOI8-R i obratno, eto vryad li potrebuetsya).
Na komp'yuterah tipa Makintosh ispol'zuetsya svoya sobstvennaya kodirovka
kirillitsy, izvestnaya kak
kodovaya stranitsa 10007 (ili prosto "Makintosh") . O russifikatsii Makintosh-sovmestimyh
komp'yuterov mozhno prochest', naprimer, na www.relcom.ru/Russification/MacKoi8-r,
http://www.friends-partners.org/partners/rusmac/,
http://www.hf.uib.no/smi/files/eudtab.html.
Kodirovka kirillitsy ISO-8859-5 (v prostorechii "ISO") izvestna takzhe pod nazvaniem "osnovnaya kodirovka DOS " (hotya fakticheski "osnovnoj" dlya DOS davno uzhe stala "al'ternativnaya" kodirovka 866). Preimushchestvom kodirovki ISO-8859-5 yavlyaetsya strogo alfavitnoe razmeshchenie v nej russkih bukv, udobnoe dlya sortirovki zapisej v bazah dannyh.
"Translit" (transliteratsiya) - eto ne kodovaya stranitsa, eto prosto zamena bukv kirillitsy "foneticheski analogichnymi" latinskimi bukvami i ih kombinatsiyami -- vot takim primerno obrazom. Translit ispol'zuyut kak krajnee sredstvo v tom sluchae, esli na komp'yutere pol'zovatelya (ili adresata pis'ma) net kirillicheskih shriftov ili raskladok klaviatury.
Nizhe pokazany tablitsy razmeshcheniya simvolov v razlichnyh kodirovkah kirillitsy
Kodovaya stranitsa Windows-1251
Unicode v Windows 95/98/2000 i MS Office 97/2000
Shirokogo rasprostraneniya na Internete kodirovka Unicode poka ne poluchila,
odnako v operatsionnoj sisteme Windows 95/98/2000 ona uzhe ispol'zuetsya kak
vnutrennyaya kodirovka teksta v takih programmah, kak, naprimer, Internet
Explorer, Outlook Express, MS Office 97/2000. ("Chisto" tekstovyj fajl v
kodirovke Unicode mozhno, naprimer, zapisat' iz Microsoft Word 97/2000 (Save
As / Unicode text ili Save As / Encoded text)). V MS Office
95 i bolee staryh versiyah MS Office vnutrennyaya kodirovka kirillitsy -- Windows-1251.
S e'tim razlichiem kodirovok svyazany problemy sovmestimosti shriftov v dokumentah,
sozdannyh s pomoshch'yu raznyh versij MS Office. Microsoft Word 97/2000
korrektno rabotaet tol'ko so shriftami dlya Windows tipa Unicode - t.e. takimi,
v kotorye mogut byt' vklyucheny nabory simvolov odnovremenno dlya neskol'kih
kodovyh stranits Windows (Western, Cyrillic, Greek, Turkish i t.d.). "Starye"
(ne-yunikodovskie) "anglo-russkie" shrifty mozhno preobrazovat' v format Unicode
programmoj TTF Converter (ftp://kgb.quarta.com/WinUtil/ttfconv.zip)
-- posle etogo ih mozhno ispol'zovat' v Word 97/2000 (hotya, razumeetsya,
v nih est' lish' dva script'a - Western i Cyrillic). Odnako dazhe pri ispol'zovanii
tol'ko yunikodovskih shriftov vozmozhny problemy s raspechatkoj kirillitsy iz
prilozhenij MS Office 97 na nekotoryh printerah. Ob e'tih problemah i ih
reshenii mozhno prochest' na Veb-stranitse Pavla Gorodyanskogo (http://ourworld.compuserve.com/homepages/PaulGor/).
Tam zhe est' informatsiya i o tom, kak reshat' problemy s kopirovaniem
i vstavkoj teksta mezhdu prikladnymi programmami, ispol'zuyushchimi i ne ispol'zuyushchimi
Unicode.
Dlya resheniya problem Word 97 s dokumentami, sozdannymi v bolee
rannih versiyah Microsoft Word s ispol'zovaniem
shriftov, ne vhodyashchih v standartnyj komplekt Microsoft Windows 3.h (naprimer,
Baltica, Pragmatica i t. d.) mozhno ispol'zovat' spetsial'nyj konvertor,
kotoryj est' na http://www.referats.corbina.ru/referats/00/CYRFONTS.ZIP.
Chto kasaetsya obratnoj sovmestimosti, to, naprimer, spetsial'nuyu programmu-konvertor,
pozvolyayushchuyu otkryvat' v Word 6.0 i 7.0 fajly, zapisannye v formate Word
97, mozhno najti na ftp://ftp.microsoft.com/Softlib/MSLFILES/wrd97cnv.exe;
odnako nekotorye dokumenty Word97 so slozhnym formatirovaniem ne udaetsya
otkryt' v Word 6.0 i 7.0 dazhe s pomoshch'yu etogo konvertora.
Podrobnee o shriftah, kodovyh stranitsah kirillitsy i podderzhke razlichnyh
kodirovok v Windows mozhno prochest' na Veb-stranitse Konstantina Kazarnovskogo
(http://www.glasnet.ru/~kazarn/fontsmain.htm).
Drugim rasprostranennym metodom 7-bitnogo predstavleniya 8-bitnyh tekstov yavlyaetsya "base64". Pri ego ispol'zovanii pochtovaya programma ukazyvaet v sluzhebnyh polyah pis'ma: Content-transfer-encoding: base64.
Sovremennye pochtovye programmy pri poluchenii pis'ma, gde tekst predstavlen
v vide base64 ili
quoted-printable, avtomaticheski vosstanovyat ego ishodnuyu 8-bitnuyu formu;
tem zhe poluchatelyam, ch'i pochtovye programmy ne podderzhivayut takoe preobrazovanie,
pridetsya rasshifrovyvat' tekst s pomoshch'yu spetsial'nyh dekodiruyushchih programm.
Nado imet' v vidu, chto preobrazovanie libo nepreobrazovanie otsylaemyh
8-bitnyh tekstov v 7-bitnuyu formu ne vsegda zavisit ot zhelaniya otpravitelya.
Inogda SMTP-server avtomaticheski "zakatyvaet" otpravlyaemye 8-bitnye teksty
v 7-bitnuyu formu -- vidimo, predpolagaya, chto pochtovyj server poluchatelya
ne smozhet pravil'no obrabotat' 8-bitnye soobshcheniya. Pri etom v zagolovke
soobshcheniya poyavlyayutsya strochki tipa
X-MIME-Autoconverted: from 8bit to base64 by [server name]...
Pri odnom podhode, dokument dostupen na Veb-servere v neskol'kih razlichnyh kodirovkah, tak chtoby posetiteli Veb-sajta mogli vybrat' naibolee udobnyj dlya sebya variant. (Pri etom ne obyazatel'no derzhat' na servere otdel'nuyu kopiyu dokumenta dlya kazhdoj kodirovki; na samom dele, server chasto hranit lish' odin ekzemplyar dokumenta v kakoj-nibud' odnoj kodirovke, zato dostup k etomu dokumentu vozmozhen cherez neskol'ko "portov", kotorye vypolnyayut razlichnye perekodirovki). Tak ili inache, na Veb-stranitse est' menyu vybora kodirovki; v eto menyu navernyaka budut vklyucheny kodirovki WIN-1251 i KOI8-R, a inogda i drugie -- DOS (866), ISO-8859-5, Macintosh i "translit".
Drugoj podhod ispol'zuetsya, naprimer, Veb-serverom "Russian Apache", kotoryj pytaetsya opredelit' "rodnuyu" kodirovku obrashchayushchegosya k serveru brauzera i zatem "otdaet" pol'zovatelyu zaprashivaemyj dokument imenno v etoj kodirovke. Pri etom na Veb-stranitse mozhet i ne byt' menyu vybora kodovoj stranitsy. Esli pol'zovatel' rabotaet v operatsionnoj sisteme Windows, to on, skoree vsego, uvidit dokument v kodirovke Win-1251.
Tretij podhod -- sdelat' dokument dostupnym v kakoj-nibud' odnoj kodirovke, v raschete na to, chto pol'zovatel' dolzhen umet' pravil'no nastroit' svoj brauzer dlya chteniya tekstov v etoj kodirovke. Mnogie russkoyazychnye Veb-stranitsy dostupny libo tol'ko v KOI8-R, libo tol'ko v Win-1251.
|
|
Esli Vy hotite sozdat' svoyu sobstvennuyu Veb-stranitsu na russkom yazyke,
Vy dolzhny znat', kak rabotaet tot server, na kotorom Vy ee hotite razmestit'.
Esli etot server delaet perekodirovku, to predpolagaetsya, chto zagruzhat'
tuda dokumenty nuzhno v opredelennoj kodirovke - inache oni stanut nechitabel'nymi.
Esli zhe server ne delaet nikakoj perekodirovki, to Vy sami mozhete vybirat',
v kakoj kodirovke (ili kodirovkah) budet dostupna Vasha Veb-stranitsa.
Imejte takzhe v vidu, chto obychno legche nastroit' na chtenie KOI-8 brauzery,
rabotayushchie pod Windows, chem nastroit' na Win-1251 brauzery, rabotayushchie
pod Unix. Nekotorye pol'zovateli Unix voobshche s predubezhdeniem otnosyatsya
k Veb-stranitsam, dostupnym tol'ko v kodirovke Win-1251 i schitayut,
chto vryad li tam mozhet byt' chto-nibud' zasluzhivayushchee vnimaniya.
Dlya chteniya russkoyazychnyh Veb-stranits dostatochno "nauchit'" Vash brauzer ponimat' kodirovki KOI-8 i Windows-1251 - drugie kodirovki kirillitsy vryad li mozhno najti na Internete v kachestve edinstvennogo varianta kodirovki Veb-stranitsy. (Pravda, na Internete mozhno najti mnozhestvo russkoyazychnyh tekstovyh fajlov v kodirovke DOS - no oni obychno prednaznacheny dlya zagruzki, a ne dlya prosmotra v rezhime online).
Dlya nastrojki Netscape Navigator (versiya 3) nuzhno vojti v menyu Options/
General Preferences/ Fonts i
ustanovit' dlya kodirovki "Cyrillic" kirillicheskie shrifty (proportsional'nyj
i postoyannoj shiriny) tipa Windows-1251, a dlya kodirovki "Cyrillic (KOI8-R)"
shrifty (proportsional'nyj i postoyannoj shiriny) tipa KOI-8. Pri etom chashche
vsego problemy voznikayut s ustanovkoj shrifta postoyannoj shiriny tipa KOI-8,
poskol'ku byvaet, chto ni odin iz imeyushchihsya shriftov tipa KOI-8 ne raspoznaetsya
sistemoj kak shrift postoyannoj shiriny i ne viden v okoshke vybora shriftov.
V sluchae takih problem, komplekt "podhodyashchih" shriftov mozhno zagruzit' s
toj zhe Web-stranitsy Pavla Gorodyanskogo: http://www.relcom.ru/Russification/WinNetscape/ForWWW.zip.
V dal'nejshem nuzhno cherez menyu Options/ Document Encoding vybirat' kodirovku
Cyrillic dlya prosmotra Web-stranits v kodirovke Windows-1251 i kodirovku
Cyrillic (KOI-8) dlya prosmotra Web-stranits v kodirovke KOI-8.
Esli u Vas vse eshcho ustanovlen Netscape Navigator (versiya 2), davno pora zamenit' ego na bolee "svezhuyu" versiyu. Esli zhe u Vas net takoj vozmozhnosti, mozhno analogichnym obrazom ustanovit' shrifty tipa KOI-8 dlya kodirovki "Latin 2" i shrifty tipa Windows-1251 dlya kodirovki "Korean" (v menyu etoj versii Netscape Navigator'a net kirillicheskih kodirovok) . Posle etogo vybirajte iz menyu Options/ Document Encoding "Latin 2" dlya prosmotra tekstov v kodirovke KOI-8 i "Korean" dlya prosmotra tekstov v kodirovke Windows-1251.
Esli v zagolovke HTML-dokumenta yavno ukazyvaetsya kodirovka pri pomoshchi
stroki tipa
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">
, brauzer dolzhen avtomaticheski vklyuchit' rezhim pokaza dokumenta v dannoj
kodirovke. V etom sluchae popytki zadat' kodirovku "vruchnuyu" (cherez menyu
brauzera) mogut ne srabatyvat'. Esli pri etom ukazannaya v zagolovke kodirovka
ne sootvetstvuet toj, kotoraya fakticheski ispol'zuetsya v tekste, dokument
mozhet stat' nechitabel'nym. Voobshche, esli brauzer ne mozhet pravil'no prochest'
tekst, poprobujte prosmotret' ishodnyj HTML-kod (cherez menyu View/ Page
source i t.p., v zavisimosti ot konkretnogo brauzera). Chasto eto pomogaet
ponyat' sut' problemy. V sluchae nepravil'no ukazannoj kodirovki mozhno sohranit'
dokument u sebya na diske, a potom otredaktirovat' ego, ispraviv charset
libo perekodirovav tekst.
Voobshche govorya, yavnoe ukazanie kodirovki v zagolovke HTML-dokumenta
nuzhno ispol'zovat' ochen' vnimatel'no. Pomnite:
1. Luchshe sovsem ne ukazat' charset, chem ukazat' ego nepravil'no.
2. Pri yavno ukazannoj kodirovke dokument mozhet stat' nechitabel'nym
v nekotoryh staryh versiyah brauzerov, kotorye ne raspoznayut nazvanie dannoj
kodirovki.
3. Esli Vy konvertiruete HTML-dokument s yavnym ukazaniem kodovoj stranitsy
v druguyu kodirovku, ne zabud'te ispravit' v zagolovke i nazvanie kodirovki.
4. Ne ukazyvajte kodirovku yavno, esli dokument budet nahodit'sya na
servere, kotoryj mozhet ego perekodirovat'.
5. Esli Vasha stranitsa sdelana v kodirovke Win-1251, dazhe s yavnym ukazaniem
charset=windows-1251,
ne dumajte, chto teper' ona budet chitabel'na absolyutno dlya vseh. Mnogie
versii brauzerov, rabotayushchih pod operatsionnoj sistemoj UNIX, ne
podderzhivayut e'tu kodirovku.
Krome togo, esli Vy hotite, chtoby russkij tekst na Vashej Veb-stranitse byl chitabelen dlya vseh, nikogda ne ispol'zujte yavnoe zadanie shrifta cherez tag FONT FACE=.... E'to schitaetsya durnym tonom, poskol'ku mozhet sozdat' problemy dlyah teh, u kogo na komp'yutere shrift s takim nazvaniem ne rusifitsirovan (libo ego voobshche net).
KOI8 -- plyusy: Po slozhivshejsya traditsii, dlya peresylki pisem na
russkom yazyke standartom de-fakto stala kodovaya stranitsa KOI8-R, zakreplennaya
takzhe i v ustavah russkoyazychnyh telekonferentsij USENET. Pri prohozhdenii
cherez pochtovye sistemy, "obrezayushchie" vos'moj bit, tekst v kodirovke KOI-8
hot' i uroduetsya, no ostaetsya vpolne chitabel'nym. Mnogie pochtovye programmy
po umolchaniyu otsylayut pis'ma imenno v kodirovke KOI-8 (a mnogie versii
Netscape Mail voobshche ne mogut otoslat' pis'mo v drugoj kodirovke s pravil'no
prostavlennym v zagolovke charset'om). Mnogie pochtovye sistemy nastroeny
imenno na pis'ma, prihodyashchie v kodirovke KOI-8, i avtomaticheski proizvodyat
perekodirovku iz KOI-8 v Windows ili DOS; esli kodirovka pis'ma budet drugoj,
to v konechnom schete ono budet preobrazovano v "izvrashchennuyu" (nestandartnuyu)
kodirovku. Kodirovka KOI-8 yavlyaetsya edinstvenno ponyatnoj dlya mnogih pol'zovatelej,
rabotayushchih v operatsionnoj sisteme UNIX.
KOI8 -- minusy: Pis'ma v kodirovke KOI-8 mogut byt' nechitabel'ny
dlya neopytnyh pol'zovatelej, rabotayushchih v operatsionnoj sisteme Windows
s "tupymi" (ne imeyushchimi vstroennyh sredstv perekodirovki) pochtovymi programmami.
Krome togo, v kodovuyu tablitsu koi8-r ne vklyucheny bukvy kirillitsy, spetsifichnye
dlya ukrainskogo i belorusskogo yazykov. Dlya perepiski na ukrainskom yazyke
vmesto kodirovki koi8-r sleduet ispol'zovat' kodirovku koi8-u
-- no, k sozhaleniyu, daleko ne vse pochtovye programmy, podderzhivayushchie kodirovku
koi8-r, podderzhivayut takzhe i koi8-u.
Windows-1251 -- plyusy: Pis'ma budut chitabel'ny dlya neopytnyh
pol'zovatelej, rabotayushchih v operatsionnoj sisteme Windows s "tupymi" (ne
imeyushchimi vstroennyh sredstv perekodirovki) pochtovymi programmami. Mozhno
bez problem pisat' po-ukrainski, po-belorusski i na drugih yazykah, ispol'zuyushchih
bukvy iz kodovoj tablitsy Windows-1251.
Windows-1251 -- minusy: Mnogie pochtovye sistemy nastroeny imenno
na pis'ma, prihodyashchie v kodirovke KOI-8, i avtomaticheski proizvodyat perekodirovku
iz KOI-8 v Windows ili DOS; pis'mo, prishedshee v kodirovke Windows-1251,
budet preobrazovano v "izvrashchennuyu" (nestandartnuyu) kodirovku. Pis'mo v
kodirovke Windows-1251 mozhet byt' nechitabel'nym dlya mnogih pol'zovatelej,
rabotayushchih v operatsionnoj sisteme UNIX (pri etom mnogie pol'zovateli UNIX
schitayut, chto otpravka pis'ma v kodirovke Windows-1251 yavno demonstriruet
nizkuyu kvalifikatsiyu avtora, i nichego zasluzhivayushchego ih vnimaniya v takom
pis'me zavedomo byt' ne mozhet). Pri "obrezanii" vos'mogo bita tekst prochest'
nel'zya.
Unicode -- plyusy: V tekste pis'ma mozhno ispol'zovat' bukvy iz
neskol'kih razlichnyh alfavitov (chto nevozmozhno pri ispol'zovanii 8-bitnyh
kodirovok). Vozmozhno, ispol'zovanie Unicode so vremenem obespechit radikal'noe
i okonchatel'noe reshenie problemy kodirovok.
Unicode -- minusy: Poka chto lish' nemnogie pochtovye programmy
podderzhivayut ispol'zovanie Unicode (naprimer, Outlook Express, Netscape
Messenger, chastichno The Bat! i Forte Agent). Adresaty, ispol'zuyushchie drugie
pochtovye programmy, mogut imet' bol'shie problemy s chteniem takogo pis'ma.
Translit -- plyusy: E'to universal'nyj sposob obshcheniya, dlya kotorogo
ne nuzhny ni rusifitsirovannye raskladki klaviatury, ni russkie e'krannye
shrifty, i kotoryj delaet pis'mo garantirovanno chitabel'nym dlya poluchatelya
v lyuboj strane mira.
Translit -- minusy: Pis'mo v translite neudobno nabirat' i neudobno
chitat'. Ishodnyj tekst koverkaetsya.
V kachestve obshchej rekomendatsii mozhno predlozhit' takoj variant:
1. otpravlyajte pis'ma v kodirovke KOI8-R (na ukrainskom yazyke -- v
KOI8-U), pri etom zhelatel'no, chtoby pochtovaya programma pravil'no ukazyvala
v sluzhebnyh polyah pis'ma ispol'zuemuyu kodirovku
("charset=koi8-r").
2. Esli u adresatov voznikayut problemy s chteniem pisem v kodirovke
KOI8-R (KOI8-U), poprobujte kodirovku Windows-1251.
3. Esli i v etom sluchae voznikayut problemy, poprobujte translit libo
zapishite tekst pis'ma v fal i prilozhite ego k otpravlyaemomu soobshcheniyu.
S odnoj storony, kak uzhe govorilos', ne vse pochtovye servery propuskayut
8-bitnye teksty.
Nekotorye iz nih avtomaticheski preobrazuyut 8-bitnyj tekst v 7-bitnuyu
formu (naprimer, v base64), a nekotorye prosto "obrezayut" vos'moj bit.
(Mezhdu prochim, interesnaya osobennost' kodirovki KOI-8 zaklyuchaetsya v tom,
chto tekst v etoj kodirovke udaetsya prochest' i posle "obrezaniya" vos'mogo
bita, poskol'ku bukvy kirillitsy v etoj kodovoj stranitse raspolozheny so
sdvigom na 128 ot "foneticheski shodnyh" latinskih bukv). Krome togo, ne
sovsem "legal'nym" yavlyaetsya ispol'zovanie 8-bitnogo teksta v pole Subject:
i v drugih sluzhebnyh polyah pis'ma, poskol'ku dejstvuyushchie na Internete standarty
predpisyvayut predstavlenie teksta v sluzhebnyh polyah pis'ma v 7-bitnoj forme.
S drugoj storony, v stranah byvshego SSSR slozhilas' praktika otsylki
pisem v 8-bitnoj forme (vklyuchaya i tekst v pole Subject), i podavlyayushchee
bol'shinstvo serverov bez problem propuskaet takie pis'ma. Pri etom mnogie
lyudi pol'zuyutsya pochtovymi programmami, kotorye ne mogut avtomaticheski preobrazovat'
v ishodnuyu 8-bitnuyu formu tekst, poluchennyj v vide quoted-printable ili
base64. Krome togo, v 8-bitnoj forme ob^em peresylaemogo teksta men'she,
chem v vide base64 i osobenno quoted-printable. Nakonets, teksty, zakodirovannye
v quoted-printable ili base64, mogut ne perekodirovat'sya pri prohozhdenii
cherez perekodirovshchiki iz KOI8 v Windows-1251 ili DOS, kotorymi pol'zuetsya
adresat (takie perekodirovshchiki mogut stoyat', naprimer, na ego POP3-servere)
i v rezul'tate prihodit' k nemu v nepravil'noj kodirovke. Poe'tomu v obshchem
sluchae mozhno rekomendovat' otpravlyat' pis'ma v 8-bitnom vide (v tom chisle
v pole Subject). Esli vyyasnitsya, chto Vash pochtovyj server ili pochtovyj server
poluchatelya "portit" 8-bitnye teksty, poprobujte vklyuchit' rezhim preobrazovaniya
teksta v quoted-printable ili base64. Esli Vash adresat ne mozhet rasshifrovat'
takie pis'ma, poprobujte poslat' tekst ne v tele pis'ma, a prilozhit' tekstovyj
fajl k pis'mu.
Ispol'zovanie russkogo teksta v pole "From" nastoyatel'no ne rekomenduetsya
- v etom sluchae mnogie adresaty prosto ne smogut prochest' imya otpravitelya.
(Takzhe ne rekomenduetsya prilagat' k soobshcheniyu fajly s russkimi imenami
-- pri peresylke e'ti imena mogut okazat'sya iskoverkannymi).
Fakticheski, mozhno libo srazu nabirat' pis'ma v kodirovke KOI-8, libo snachala nabirat' ih v toj kodirovke, v kakoj eto udobno delat' (naprimer, Windows-1251 ili DOS), a zatem preobrazovyvat' ih v KOI-8. Tut vozmozhny neskol'ko podhodov:
Nado skazat', chto pri rabote s "rodnym" pereklyuchatelem klaviatury Windows95 inogda voznikayut problemy. Naprimer, on mozhet ne srabatyvat' v oknah nekotoryh programm; krome togo, on ne pozvolyaet redaktirovat' imeyushchiesya raskladki klaviatury. (Redaktor raskladok klaviatury Windows95 mozhno najti, naprimer, na <http://www.kiarchive.ru/pub/cyrillic/windows/jkbd9542.zip> , no on pozvolyaet redaktirovat' ne vsyakie fajly raskladok). Nakonets, esli prihoditsya pol'zovat'sya bolee chem tremya raskladkami klaviatury, rabotat' s "rodnym" pereklyuchatelem klaviatury Windows95 stanovitsya prosto neudobno, poskol'ku on ne pozvolyaet ispol'zovat' raznye klavishi dlya dostupa k raznym raskladkam.
Esli Vy ispytyvaete neudobstva pri rabote s "rodnym" pereklyuchatelem klaviatury Windows95, imeet smysl ustanovit' spetsial'nye programmy dlya pereklyucheniya klaviatury.
Inogda pri ispol'zovanii ParaWin dlya pereklyucheniya klaviatury v okne
sostavleniya novogo soobshcheniya Outlook Express zadacha "podvisaet", i prihoditsya
ee snimat' cherez Ctrl-Alt-Del. Vozmozhno, v takih sluchayah stoit ispol'zovat'
ParaWin tol'ko dlya rusifikatsii sistemy (esli eto neobhodimo), a dlya pereklyucheniya
raskladok klaviatury ustanovit' druguyu programmu -- naprimer, RusLat (www.ruslat.wm.ru).
Iz drugih besplatnyh pereklyuchatelej klaviatury mozhno nazvat' RusLat
(www.ruslat.wm.ru).
Est' pochtovye programmy, kotorye vypolnyayut "fiksirovannuyu" perekodirovku
teksta (naprimer, iz vse prihodyashchie soobshcheniya iz KOI8-R v 1251, a vse ishodyashchie
- iz 1251 v KOI8-R), a est' i takie, u kotoryh est' menyu perekodirovki
s podderzhkoj neskol'kih kodovyh stranits.
Pri "fiksirovannoj" perekodirovke dlya togo, chtoby pravil'no perekodirovat'
poluchaemye pis'ma, nuzhno znat', v kakoj kodirovke oni prihodyat. V printsipe,
zdes' vozmozhny dva osnovnyh podhoda:
Pochtovaya programma | Perekodirovka teksta soobshcheniya | Ukazanie kirillicheskoj kodirovki (charset'a) v zagolovke | Problemy i kommentarii |
Eudora Pro v.2.2 | Net
Neobhodima vneshnyaya perekodirovka ili shrifty koi8 |
nepravil'no: iso-8859-1 (can be hacked to koi8-r) | Ochen' udobnyj interfejs;
Problemy s: shriftami tipa Unicode, pereklyuchatelem klaviatury Win95, soobshcheniyami, perepravlennymi iz Netscape, razbitymi na kuski prilozhennymi fajlami; ne ochen' udobna dlya raboty s kirillitsej |
Eudora Pro v.3.*, 4.* | Net
Mozhno ispol'zovat' s koi8-plugin'om dlya perekodirovki win<->koi |
nepravil'no: iso-8859-1
(s plugin'om: koi8-r ili windows-1251) |
To zhe, chto i dlya Eudora v.2.*;
dobavlena podderzhka neskol'kih account'ov, a takzhe plugin'ov, v tom chisle koi8-plugin; u v.4.* est' oshibki v obrabotke kirillitsy, kotorye nuzhno ispravlyat' |
Netscape Mail (Mozilla) v.3.* | Vhodyashchie: net
Ishodyashchie: win to koi, koi to koi Otvety: koi to koi nuzhny shrifty koi8; ne ispol'zovat' vneshnyuyu perekodirovku |
koi8-r (mozhet otlichat'sya ot fakticheskoj kodirovki) | Odnourovnevye papki dlya hraneniya pochty; perepravlyaemye soobshcheniya mogut sozdavat' problemy dlya adresatov, ispol'zuyushchih Eudora 2.2; ne ochen' udoben dlya raboty s kirillitsej |
Netscape Messenger (Mozilla) v.4.* | Vhodyashchie: iz lyuboj v win
Ishodyashchie: win to koi (v zavisimosti ot konkretnoj versii) shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny |
koi8-r (mozhet otlichat'sya ot fakticheskoj kodirovki) | Mnogourovnevye papki dlya hraneniya pochty; Vozmozhnost' sozdaniya neskol'kih profilej dlya raznyh pol'zovatelej; kontraintuitivnyj vybor kodirovki dlya ishodyashchih soobshchenij v v.4.0*; 8-bitnyj Subject vklyuchaetsya cherez pravku prefs.js |
MS Internet Mail | Vhodyashchie: koi ili win to win
Outgoing: win to koi ili win shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny |
pravil'no: koi8-r ili
Windows-1251 |
Odnourovnevye papki dlya hraneniya pochty; net vybora kodirovki v rezhime otveta na pis'mo; pis'ma s nepravil'no ukazannoj kodirovkoj mogut byt' nechitabel'ny |
Outlook Express v.4.*, 5.* | Vhodyashchie: iz lyuboj kodirovki v Unicode
Ishodyashchie: iz Unicode v lyubuyu kodirovku shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny |
pravil'no: koi8-r,
Windows-1251 i dr. |
Mnogourovnevye papki dlya hraneniya pochty; vozmozhnost' konfiguratsii neskol'kih account'ov; vozmozhna podderzhka koi8-u; odna iz naibolee udobnyh dlya raboty s kirillitsej pochtovyh programm |
The Bat! | Vhodyashchie: iz lyuboj kodirovki v win
Ishodyashchie: iz win v lyubuyu kodirovku shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny |
pravil'no: koi8-r, koi8-u,
Windows-1251 i dr. |
Malen'kaya no ves'ma moshchnaya pochtovaya programma; mnogourovnevye papki dlya hraneniya pochty; vozmozhnost' konfiguratsii neskol'kih account'ov; podderzhka koi8-u; odna iz naibolee udobnyh dlya raboty s kirillitsej pochtovyh programm |
Pegasus Mail | Net
posle nastrojki - fiksirovannaya: Vhodyashchie: koi to win; Ishodyashchie: win to koi posle nastrojki shrifty koi8 ili vneshnyaya perekodirovka ne nuzhny |
Posle nastrojki: koi8-r | Dovol'no moshchnyj, no interfejs ne ochen' udoben; trebuet nastrojki; mnogourovnevye
papki dlya hraneniya pochty; problemy s 8-bitnymi zagolovkami;
Ne ochen' udoben dlya raboty s kirillitsej |
Forte Agent
(not Free!) |
Posle nastrojki: menyu perekodirovok
V zavisimosti ot nastrojki, mozhet ispol'zovat'sya vnutrennyaya libo vneshnyaya perekodirovka |
Posle nastrojki: koi8-r, koi8-u i dr. | Odin iz luchshih newsreader'ov, kotoryj mozhet ispol'zovat'sya i kak pochtovaya
programma; odnourovnevye papki dlya hraneniya pochty;
o nastrojke sm. www.glasnet.ru/~kazarn/soft.htm |
Problemy.
Pozhaluj, samoe privlekatel'noe v Eudora - ee udobnyj pol'zovatel'skij
interfejs; no e'ta pochtovaya programma imeet i ryad nedostatkov:
Eshche odin nedostatok Eudora - eto nevozmozhnost' chitat' ili nabirat' pis'ma vo vremya otsydki ili priema pochty.
Vazhnoe preimushchestvo Eudora Pro v.3.* nad predydushchimi versiyami
Eudora - eto podderzhka neskol'kih "personalities" s razlichnymi ustanovkami
(imya pol'zovatelya, pop3 i smtp server i drugie ustanovki), a takzhe podderzhka
dopolnitel'nyh modulej (plugin'ov). Obrabotka kirillitsy v nej idet prakticheski
tak zhe, kak i v v.2.2, vklyuchaya ukazanie v zagolovke soobshchenij nevernoj
kodirovki iso-8859-1. Odnako v etom sluchae luchshe ne redaktirovat' fajl
Eudora.exe, a ispol'zovat' koi8-plugin, razrabotannyj Evgeniem Suroveginym
(sm. www.glasnet.ru/~ebs/koi8plugin.html).
E'tot plugin dobavlyaet v menyu "Edit/ Message plug-ins" komandy dlya perekodirovki
teksta iz koi8-r v windows-1251 i naoborot; krome togo, on ukazyvaet kodirovku
ishodyashchih soobshchenij kak koi8-r ili windows-1251 vmesto iso-8859-1.
koi8-plugin mozhet ispol'zovat'sya i s Eudora Pro v.4.*; ob oshibkah
v obrabotke kirillitsy, kotorye est' v v.4.* i ih ispravlenii mozhno prochest'
na www.glasnet.ru/~ebs/koi8plugin.html.
Iz-za svoej nesposobnosti k "vnutrennej" perekodirovke Eudora chasto
ispol'zuetsya s pop3/smtp proksi-serverami, kotorye perekodiruyut vhodyashchie
i ishodyashchie soobshcheniya na kirillitse iz koi8-r v Windows-1251 i naoborot.
Esli ispol'zovat' Eudora v.3.* ili 4.* s koi8-plugin'om, mozhet byt' udobno
poluchat' pochtu neperekodirovannoj, a otsylat' soobshcheniya cherez perekodiruyushchij
smtp proksi-server. Pri etom vhodyashchie pis'ma mozhno v sluchae neobhodimosti
perekodirovat' koi8-plugin'om, a ishodyashchie budut avtomaticheski perekodirovat'sya
proksi-serverom v koi8-r. (Odnako v etom sluchae nuzhno vnimatel'no posmotret'
nastrojki koi8-plugin'a - esli ne vyklyuchit' optsiyu "Analyze charset when
sending email", to pis'ma mogut uhodit' s ukazaniem v zagolovke kodirovki
Windows-1251, no ih tekst posle perekodirovki na smtp-servere budet v koi8-r).
Rezhim otpravki pisem v 8-bitnoj forme vklyuchaetsya v Netscape Mail cherez menyu Options/ Mail and News Preferences/ Composition/ Allow 8-bit.
Netscape Mail v.3 ne sleduet ispol'zovat' s pop3/smtp proksi-serverami, perekodiruyushchimi vhodyashchie i ishodyashchie pis'ma iz koi8-r v Windows-1251 i obratno.
Kogda Netscape Mail perenapravlyaet soobshchenie drugomu adresatu (Forward), po umolchaniyu ishodnyj tekst peresylaetsya v vide prilozhennogo fajla s dlinnym imenem, opredelyaemym zagolovkom ishodnogo soobshcheniya. Dlya nekotoryh poluchatelej takie pis'ma sozdayut problemy; oni budut Vam ves'ma priznatel'ny, esli Vy ne prosto nazhmete na knopku "Forward", a perenapravite pis'mo v protsitirovannom vide, ispol'zuya menyu Message/ Forward Quoted.
Esli Vy pol'zuetes' pochtovoj programmoj Microsoft Internet Mail, to
Vam ne nuzhno ni "koizirovat'" Windows, ni rabotat' cherez spetsial'nye perekodiruyushchie
proksi-servery.
Netscape Messenger v.4 ne nuzhno ispol'zovat' s perekodiruyushchimi pop3 i smtp serverami.
Chtoby zastavit' Netscape Messenger v.4.0* otsylat' soobshcheniya v 8-bitnom
formate, bez preobrazovaniya v quoted-printable, nuzhno v menyu Edit/ Preferences/
Mail & Newsgroups/ Messages/ ustanovit' pereklyuchatel' "Send
messages that use 8-bit characters" v polozhenie "As is".
Krome togo, v menyu Edit/ Preferences/ Mail & Newsgroups/ Formatting/
rekomenduetsya otklyuchit' HTML-formatirovanie ishodyashchih pisem ("Use the plain
text editor to compose messages").
Nekotorye problemy i ih reshchenie.
Problema: Netscape Messenger v.4.5*- 4.7* otsylaet Subject zakodirovannym
v 7-bitnuyu formu. Kak zastavit' ego otsylat' Subject v obychnom 8-bitnom
formate?
Reshenie: E'tu ustanovku nel'zya ispravit' cherez konfiguratsionnye
menyu. Pridetsya otkryt' dlya redaktirovaniya konfiguratsionnyj fajl prefs.js
file (on dolzhen byt' v kataloge ...\Netscape\Users\<pol'zovatel'>)
i dopisat' tuda sleduyushchuyu stroku:
user_pref("mail.strictly_mime_headers", false);
Imeet smysl takzhe dopisat' stroku
user_pref("mailnews.start_page.enabled", false);
kotoraya otmenyaet avtomaticheskoe obrashchenie Netscape Messenger'a k Netscape
NetCenter dlya pokaza privetstvennogo soobshcheniya.
Bolee podrobno nastrojka opisana Pavlom Gorodyanskim na
http://www.relcom.ru/Russification/WinNetscape/.
Pri otpravke soobshchenij iz Outlook Express nuzhno pomnit', chto vnutrennej kodirovkoj etoj programmy yavlyaetsya Unicode, i tekst soobshcheniya v printsipe mozhet soderzhat' lyubye simvoly, kotorye est' v Unicode. Kodirovka, v kotoroj soobshchenie budet otpravleno, vybiraetsya cherez menyu Format/Encoding v okne sostavleniya soobshcheniya. Pri preobrazovanii otpravlyaemogo teksta iz Unicode vo "vneshnyuyu" kodirovku vozmozhna situatsiya, kogda nekotoryh simvolov, ispol'zovannyh v tekste pis'ma, vo "vneshnej" kodirovke prosto net. Takie simvoly budut zameneny voprositel'nymi znakami, i peredavaemaya imi informatsiya budet bezvozvratno uteryana. Chasto takaya situatsiya voznikaet, kogda poluchatel' pis'ma, napisannogo latinskimi bukvami, otvechaet na nego (libo perepravlyaet komu-to so svoimi kommentariyami) na kirillitse. Po umolchaniyu kodirovka otveta budet toj zhe, chto i kodirovka ishodnogo pis'ma; esli ishodnoe pis'mo prishlo, naprimer, v kodirovke iso-8859-1 ili us-ascii, to otvet budet otpravlen v toj zhe kodirovke (esli ee ne izmenit' "vruchnuyu"), i vse bukvy kirillitsy budut zameneny voprositel'nymi znakami. Chtoby etogo ne proizoshlo, pri otpravke soobshchenij na kirillitse (osobenno v otvet na chuzhie soobshcheniya) nuzhno proveryat' kodirovku cherez menyu Format/Encoding. Pri sostavlenii novogo soobshcheniya po umolchaniyu obychno vybiraetsya kodirovka KOI8-R; esli otpravlyaetsya tekst na ukrainskom yazyke, to nuzhno ne zabyt' izmenit' e'tu kodirovku na druguyu, v kotoroj est' ukrainskie bukvy (KOI8-U ili Windows-1251), inache oni budut zameneny voprositel'nymi znakami.
Radikal'nym resheniem problemy poteri chasti simvolov pri perehode ot Unicode k vneshnej kodirovke bylo by ispol'zovanie 7- ili 8-bitnyh predstavlenij Unicode UTF-7 ili UTF-8 (pri etom mozhno peresylat' mnogoyazychnye teksty); odnako poka chto e'ti kodirovki podderzhivayutsya lish' nemnogimi pochtovymi programmami (Outlook Express, Netscape Messenger, Forte Agent), da i bol'shinstvo perekodirovshchikov ih "ne ponimayut". Poe'tomu ispol'zovat' UTF-7 ili UTF-8 stoit tol'ko v tom sluchae, kogda vy uvereny, chto vash adresat smozhet ih prochest'.
Razumeetsya, pri ispol'zovanii Outlook Express ne nuzhno podklyuchat'sya k provajderu cherez perekodiruyushchie pop3 i smtp servera - inache pis'mo mozhet byt' perekodirovano lishnij raz.
Nekotorye problemy i resheniya
Problema: Inogda tekst nechitabelen dazhe esli v menyu View/ Language
ustanovlena pravil'naya kodirovka.
Reshenie: Poprobujte pereklyuchit'sya na druguyu kodirovku (naprimer,
Win-1251 vmesto koi8-r), a potom obratno na pravil'nuyu.
Problema: Nekotorye (ili vse) simvoly kirillitsy (osobenno v pole
Subject) pri pechati zamenyayutsya znakami voprosa, hotya na e'krane vidny normal'no.
Reshenie: E'ta problema (i nekotorye drugie) s raspechatkoj kirillitsy
mozhet nablyudat'sya dlya nekotoryh beta-versij OE4 i OE5. Ustanovite bolee
novuyu versiyu programmy. Mozhno probovat' takzhe razlichnye shrifty, hotya eto
i ne vsegda pomogaet. Krome togo, poprobujte v Internet Explorer (menyu
Tools/Internet Options/General/Accessibility) vklyuchit' "Ignore
font styles specified on Web Pages".
Problema: Inogda OE v.5.0 pokazyvaet russkoyazychnye zagolovki
v spiske soobshchenij telekonferentsii v nepravil'noj kodirovke (ne perekodirovannymi
iz koi8 v win-1251). Pereklyuchenie kodirovki ne pomogaet.
Reshenie: E'to izvestnaya oshibka v OE v.5.0 (ispravlena v OE v.5.01).
Mmetody bor'by s nej v OE v.5.0 ne vsegda e'ffektivny i neskol'ko otdayut
"shamanizmom" (sm. sleduyushchij spisok predlagaemyh dejstvij):
- prezhde chem zagruzhat' kakie-libo novye soobshcheniya, zajdite v Inbox
ili Outbox i prosmotrite kakoe-nibud' soobshchenie, kotoroe tam uzhe est' (mozhno
vklyuchit' optsiyu "When starting, go directly to my Inbox folder" v
menyu Tools/ Options/ General);
- v menyu Tools/ Options/ Read/ Fonts zadat' Cyrillic (Windows)
kak kodirovku po umolchaniyu;
-v menyu Tools/ Options/ Read/ International Settings zadat'
Cyrillic
(KOI8-R) kak kodirovku po umolchaniyu i vklyuchit' optsiyu "Use default
encoding for all incoming messages".
- v menyu Tools/ Options/ Send/ International Settings zadat'
Cyrillic
(KOI8-R) kak kodirovku po umolchaniyu.
- vse eto dolzhno pomoch' (hotya inogda mozhet i ne pomoch') tol'ko posle
perezagruzki spiska soobshchenij v telekonferentsii (dlya etogo mozhno, naprimer,
shchelknut' pravoj knopkoj myshi na nazvanie telekonferentsii v okoshke spisok
papok i telekonferentsij, a zatem vybrat' iz kontekstnogo menyu Properties/
Local File/ Reset).
Radikal'noe reshenie problemy -- ustanovit' Outlook Express v.5.01.
Problema: Pri tsitirovanii soobshcheniya, ne kotoroe pishetsya otvet,
OE inogda pomechaet tsitiruemyj tekst simvolom tsitirovaniya (">"), a inogda
net.
Reshenie: E'to obychno sluchaetsya pri otvete na soobshcheniya, kotorye
napisany v formate Rich-Text ili HTML. Poprosite avtora otsylat' soobshcheniya
v obychnom tekstovom formate (v Outlook Express 5, dlya etogo nuzhno v menyu
Tools/
Options/ Send/ Mail sending format i News sending format zadat'
"Plain text").
Pegasus Mail ne pozvolyaet otpravlyat' kirillitsu v pole Subject v 8-bitnom formate. Chtoby otpravit' telo pis'ma v 8-bitnoj forme, nuzhno vklyuchit' optsiyu "Allow 8-bit MIME message encoding" v menyu Tools/ Options/ Advanced Settings/ (pri etom Pegasus Mail mozhet predupredit' Vas, chto otpravka tekstov v 8-bitnom formate "ne vpolne zakonna"). V okoshke "MIME character set" nuzhno zadat' "koi8-r".
Pozhaluj, The Bat! - odna iz luchshih pochtovyh programm (esli ne luchshaya)
dlya raboty s kirillitsej (dazhe nesmotrya na to, chto podderzhka yunikodovskih
kodirovok UTF-8 i UTF-7, vvedennaya nachinaya s versii 1.42, odnostoronnyaya
-- t.e. soobshcheniya, prihodyashchie v takom formate, avtomaticheski dekodiruyutsya,
no sam The Bat! ne mozhet otpravlyat' soobshcheniya v UTF-8 i UTF-7 i, sootvetstvenno,
ne pozvolyaet sostavlyat' "mnogoyazychnye" pis'ma, kak Outlook Express).
The Bat! nastraivaetsya dlya "8-bitnoj" perepiski na kirillitse cherez
menyu:
Account/ Properties:
Transport -- 8-bit characters are treated: Without changes.
Options -- Allow 8-bit characters in message headers.
Templates/ New message -- Use character set: Cyrillic (KOI-8).
Options/ Editor preferences/ Display/ Font -- zadat' kirillicheskij
shrift.
Esli Vy hotite otpravit' pis'mo adresatu, kotoryj pol'zuetsya programmoj tipa Bmail/UUPC, nado imet' v vidu, chto takie programmy NE ponimayut 7-bitnyh predstavlenij 8-bitnogo teksta v vide quoted-printable ili base64, poe'tomu pis'ma im nuzhno otpravlyat' v 8-bitnoj forme. Krome togo, takie programmy avtomaticheski dekodiruyut lish' fajly-prilozheniya, prilozhennye po metodu UUENCODE.
Voobshche, dlya minimizatsii problem s Bmail, imeet smysl perejti na naibolee svezhuyu versiyu Demos Mail for DOS -- tam est' mnogie vozmozhnosti, kotoryh net v Bmail.
V rannih versiyah programmy Bmail/UUPC (do 5.09g vklyuchitel'no) byla zhestko zalozhena perekodirovka otpravlyaemyh pisem iz DOS-866 v KOI8-R i prinimaemyh – iz KOI8-R v DOS-866. V bolee pozdnih versiyah zalozhena vozmozhnost' vybora tablitsy perekodirovki. Pri etom programma perekodiruet po zadannoj ej tablitse ne vse prinimaemye pis'ma, a tol'ko pis'ma, v sluzhebnyh polyah kotoryh ukazany opredelennye kodovye stranitsy (charset). V rezul'tate pis'ma s nepravil'no ukazannoj kodovoj stranitsej (libo pis'ma tipa "multipart-mixed") chasto popadayut v pochtovyj yashchik neperekodirovannymi. Na praktike chasto byvaet udobnee pol'zovat'sya takoj versiej, kotoraya perekodirovala by vse pis'ma bez ucheta ukazannogo v nih charset’a. Iz novyh versij Bmail/UUPC, s etoj tochki zreniya udobnee vsego versiya 6.18m (ona ne perekodiruet tol'ko tekst v pis'mah tipa "multipart-mixed").
Sovremennye pochtovye programmy tipa Outlook Express, The Bat!, Netscape Messenger, Eudora i t.p. sami po sebe ne podderzhivayut peredachu e'lektronnoj pochty po protokolu UUCP (UUCP oznachaet "Unix-to-Unix Copy Protocol", a UUPC -- realizatsiya UUCP dlya PC), odnako sushchestvuyut spetsial'nye programmy, igrayushchie rol' "shlyuzov" mezhdu protokolami peredachi pochty POP3/SMTP i UUCP. Pri etom mozhno byt' podklyuchennym k provajderu po protokolu UUCP, no dlya chteniya i sostavleniya pisem ispol'zovat' "normal'nuyu" pochtovuyu programmu. Odna iz takih programm-"shlyuzov" -- UUCP Connect (www.novgorod.net/~kvantsoft/), a drugaya -- Mailserver (naskol'ko ya znayu, avtor Mailserver'a prekratil rabotu nad etoj programmoj v 1998 g.; ee poslednyuyu besplatnuyu versiyu mozhno najti zdes': www.geocities.com/g_naumovets/mlsrv212.zip).
Odnako esli pis'mo prihodit ne v toj kodirovke, na kotoruyu rasschitan proksi-server (naprimer, Windows-1251 vmesto koi8-r), libo s nepravil'no ukazannoj kodovoj stranitsej (esli dannyj proksi-server obrashchaet vnimanie na pole charset), to ono budet perekodirovano nepravil'no. Poe'tomu tem, kto rabotaet cherez perekodiruyushchij proksi-server, navernyaka pridetsya derzhat' pod rukoj i spetsial'nye perekodiruyushchie programmami, kotorye smogut ispravit' posledstviya nepravil'noj perekodirovki.
Pri rabote s "umnoj" pochtovoj programmoj tipa Outlook Express ili The Bat! ispol'zovat' perekodiruyushchie proksi-servery net nikakogo smysla -- naoborot, eto mozhet tol'ko porodit' pis'ma v "izvrashchennyh" kodirovkah.
Na www.download.ru mozhno najti i mnozhestvo drugih perekodirovshchikov. Iz nih imeet smysl vybrat' takoj, kotoryj podderzhivaet kodirovki UTF-7 i UTF-8 (naprimer, Russian Anywhere - sm. http://private.peterlink.ru/dll/rus/re.html)
How to Russify Netscape Navigator for Windows <http://www.relcom.ru/Russification/WinNetscape> -- WinNetscape Russification Bible by Paul Gorodyanski
Paul Gorodyansky's Web page http://ourworld.compuserve.com/homepages/PaulGor/ - Russification of Netscape, Office 97 and other helpful stuff
Konstantin Kazarnovskii about fonts and languages <http://shlimazl.newmail.ru/fontsmain.htm> -- very educational and well written, definitely worth reading
Lots of helpful information on Russification of various programs and operation systems <http://www.siber.com/sib/russify/>
The Cyrillic Charset Soup - o razlichnyh kodirovkah kirillitsy
<http://czyborra.com/charsets/cyrillic.html>
Cyrillic, Russian, Slavic and East European fonts and tools for Windows
Stranitsa Kristofa Zingera na nemetskom, anglijskom i russkom yazykah
po voprosam kirillizatsii i ukrainizatsii v Windows.
<http://homepages.uni-tuebingen.de/student/christoph.si
nger/slovo/>
Win95 Russification FAQ - <http://www.hackzone.ru/rtw95>
WinNT Russification - <http://rwntug.quarta.msk.ru/questions.htm>
Russification of Macintosh computers <http://www.relcom.ru/Russification/MacKoi8-r>
Nastrojka Forte Agent dlya raboty s kirillitsej
<http://www.glasnet.ru/~kazarn/soft.htm>
<http://blue.iris.mipt.ru/timur/agent.htm>
How mailers should handle Cyrillic messages (and how they actually do it) <http://blue.iris.mipt.ru/timur/trueway.htm>
A lot of useful programs for working with Cyrillic texts <http://www.kiarchive.ru/pub/cyrillic/>
Some frequently asked questions about Russification of DOS and Windows <http://www.maths.monash.edu.au/~kig/ruscom/general/rusfaq .html>
Installation of various keyboard layouts for native Windows95 keyboard switcher <http://www.netsight.net/~ryba/cyrillic/index.html>
Internet standards (RFC -- requests for comments) <http://www.rfc-editor.org>
RFC 1489: description
of KOI8-R code page
RFC 1521: MIME
format for messages sent over the Internet
RFC 1522: MIME
format for non-ASCII characters in the message headers
RFC 2319: Ukrainian
Character Set KOI8-U
RFC 2152: UTF-7
-- A Mail-Safe Transformation Format of Unicode
RFC 2279: UTF-8,
a transformation format of ISO 10646