Конституция Армении: Статья 18.1
Конституция Армении (Статья 18.1) закрепляет «исключительную миссию Армянской Апостольской Святой Церкви как национальной церкви в духовной жизни армянского народа, в деле развития его национальной культуры и сохранения его национальной самобытности»:
КОИ-8

КОИ-8

Материал из Википедии — свободной энциклопедии
(перенаправлено с «KOI8-R»)

8-би́тный код для обме́на и обрабо́тки информа́ции (сокр.КОИ-8) — восьмибитнаякодовая страница, являющаяся расширением кодировки КОИ-7 (объединением наборов Н0 и Н1) и вследствие этого совместимая с ISO 646 IRV (ASCII[a]), предназначенная для обмена и обработки информации с возможностью использования латинского и русского алфавитов. КОИ-8 была стандартизована в паре с ДКОИ в ГОСТ 19768—74[1], утратившем силу 1 июля 1993 года, и в настоящее время не определена ни в одном из действующих стандартов[b]. Один из вариантов КОИ-8 — KOI8-R — был широко распространён как основная русская кодировка в Unix-подобных операционных системах и в электронной почте, однако с конца 2000-х годов он постепенно выходит из употребления в связи с распространением Юникода.

Окно настройки экрана в Mandrake Linux 7.1, демонстрирующее отображение кириллицы в отсутствие кириллического шрифта благодаря использованию кодировки koi8

Разработчики КОИ-8 разместили буквы русского алфавита в верхней половине кодовой таблицы так, чтобы их позиции совпадали с позициями фонетически аналогичных им латинских букв в нижней половине таблицы, поэтому русские буквы расположены не в алфавитном порядке. Благодаря этому при обнулении старшего (восьмого) бита символов текста, написанного в КОИ-8 (в частности, из-за прохождения через семибитную среду), получается относительно читаемый текст, подобный транслиту; так, например, слова «Русский Текст» превращаются в «rUSSKIJ tEKST».

Существует несколько расширенных вариантов КОИ-8 с поддержкой различных кириллических алфавитов; тем не менее, основной диапазон кодовых позиций кириллицы (0xC00xFF), содержащий 32 русские буквы (все кроме Ё) в обоих регистрах (строчные и прописные), во всех вариантах остаётся неизменным. Поддержка русского алфавита реализована в KOI8-R, украинского — в KOI8-U, белорусского — в KOI8-RU, таджикского — в KOI8-T.

В 1990-х годах KOI8-R фактически стала стандартом кодирования русской кириллицы в Unix-подобных операционных системах и в электронной почте. Автор данной кодировки (RFC 1489) Андрей Чернов в начале 1990-х годов работал в компании «Демос» (сеть «Релком») и непосредственно участвовал в запуске и наладке первого Интернет-канала между Россией и западными странами. KOI8-R в итоге стала первой стандартизованной русской кодировкой в Интернете.

IETF утвердил несколько RFC по расширенным вариантам КОИ-8, впоследствии зарегистрированным IANA в своём списке[3]:

  • RFC 1489 — KOI8-R (с поддержкой русского алфавита);
  • RFC 2319 — KOI8-U (с поддержкой украинского алфавита);
  • RFC 1345 — ISO-IR-111 (с ошибкой в расположении основного диапазона).

В Microsoft Windows KOI8-R присвоен идентификатор 20866, KOI8-U — 21866[4].

Кодовые таблицы

Нижние половины кодовых таблиц (позиции 0x000x7F) полностью совпадают с ASCII. Числа под символами обозначают их шестнадцатеричный код в Юникоде.

KOI8-R (русская)

KOI8-U (русско-украинская)

Здесь и далее приводятся только те строки кодовой таблицы, которые отличаются от KOI8-R.

KOI8-RU (русско-белорусско-украинская)

KOI8-C (центральноазиатская)

KOI8-T (таджикская)

KOI8-O, KOI8-S (русская дореформенная орфография)

ISO-IR-111, KOI8-E

KOI8-Unified, KOI8-F

Кодировка KOI8-F предложена компанией Fingertip Software[5]. Неразрывный пробел размещён сразу в двух кодовых позициях — 0x9A и 0xA0.

KOI8-M

Кодировка KOI8-M представляет собой кодировку KOI8-R с символами псевдографики, расположенными в порядке, как в первоначальной (разработанной в ВЦ АН СССР) версии альтернативной кодировки.

Некириллические варианты КОИ-8

В некоторых странах — членах СЭВ создавались модификации КОИ-8 для национальных вариантов латиницы. Основная идея была та же — при «срезании» старшего бита текст должен оставаться более или менее понятным.

Примечания

Комментарии

  1. Согласно ГОСТ 19768—74, в КОИ-8 в кодовой позиции 0x24 расположен знак валюты (¤), а не знак доллара ($). При создании расширений была произведена обратная замена, требуемая для полной совместимости с ASCII.
  2. В действующем сейчас ГОСТ Р 34.303—92[2] определены другие кодировки КОИ-8 (Н1, Н2 и В1), не имеющие отношения к данной.

Источники

  1. ГОСТ 19768—74 «Машины вычислительные и системы обработки данных. Коды 8-битные для обмена и обработки информации» // Машины вычислительные, системы обработки и аппаратура передачи данных. ГОСТ 19767—74 — ГОСТ 19769—74, ГОСТ 13052—74. — М.: Изд-во стандартов, 1974. — С. 26—34. — 43 с. — (Государственные стандарты СССР). — 10 000 экз. — [Архивировано 12 апреля 2025 года.]
  2. ГОСТ Р 34.303—92 (ИСО 4873—86) «Информационная технология. Наборы 8-битных кодированных символов. 8-битный код обмена и обработки информации».
  3. Internet Assigned Numbers Authority. Character Sets (англ.). Дата обращения: 18 ноября 2024. Архивировано 16 ноября 2024 года.
  4. Microsoft Corporation. Code Page Identifiers (англ.). Дата обращения: 29 января 2025. Архивировано 26 января 2025 года.
  5. KOI8 Unified (англ.). Fingertip Software. Дата обращения: 11 февраля 2020. Архивировано из оригинала 9 мая 2008 года.

Ссылки

.0.1.2.3.4.5.6.7.8.9.A.B.C.D.E.F
8.
2500

2502

250C

2510

2514

2518

251C

2524

252C

2534

253C

2580

2584

2588

258C

2590
9.
2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265
NBSP
00A0

2321
°
00B0
²
00B2
·
00B7
÷
00F7
A.
2550

2551

2552
ё
0451

2553

2554

2555

2556

2557

2558

2559

255A

255B

255C

255D

255E
B.
255F

2560

2561
Ё
0401

2562

2563

2564

2565

2566

2567

2568

2569

256A

256B

256C
©
00A9
C.ю
044E
а
0430
б
0431
ц
0446
д
0434
е
0435
ф
0444
г
0433
х
0445
и
0438
й
0439
к
043A
л
043B
м
043C
н
043D
о
043E
D.п
043F
я
044F
р
0440
с
0441
т
0442
у
0443
ж
0436
в
0432
ь
044C
ы
044B
з
0437
ш
0448
э
044D
щ
0449
ч
0447
ъ
044A
E.Ю
042E
А
0410
Б
0411
Ц
0426
Д
0414
Е
0415
Ф
0424
Г
0413
Х
0425
И
0418
Й
0419
К
041A
Л
041B
М
041C
Н
041D
О
041E
F.П
041F
Я
042F
Р
0420
С
0421
Т
0422
У
0423
Ж
0416
В
0412
Ь
042C
Ы
042B
З
0417
Ш
0428
Э
042D
Щ
0429
Ч
0427
Ъ
042A