����� 3. ���������

����������

������� � ���������
�������� ASCII
�������� ISO
�������� CP866
�������� CP1251
�������� ���8
�������� UNICODE
�������� ���������
���������� ����
���������� ����
����������� ����
���������� ����
������� ����
�������� ����
����������� ����
��������� ����

���������, ��� ��������� ���������� ������������� ���������� ��������. �� ���������� � ������ ����� ������, ��������, ����������� ���������, ��� ��������� � ��� �����, � ����� ��� ����������� � ���������� ��������� XI �., � ��� ����� ��� ������������ �����, ������� ����������� ��������� � IX �., �� ����� ��������� �������������� ���������� ���������� ��������, ������ ��� ����� �� ������� ��. ������� � ������� ����������� ��� �� ����� (�������), � ���������. �� ����� �� ���������, ��� ��. ������ ��� ���� �� ��� �������� (�������), ��������� ������������ ���������, ���� �� ������� ������� ��������� ������� ���ͣ�, ��� ��, ��� ��������� �������� ���� �� ���������� ����� ������� �� �������� ������������.

������������� ������� ������ ������ ��������� ��� ������ ������. ������ �ޣ��� �������� ���� ������, �� ����������� �� � ������ ������� �ݣ �� �������� ������������? �� ����� ������������� �������� ��������� ����� �� ������� �������, � ������ ����� ���������� ������ ������, ������� ����� � �. � ����������� ��������� � ����������� ���������� �������.

����� ������̣����, ������ � ������ �������� � ���������� ������ �������� ������ � ���������� � ��. ��������� ���������� ������� � �������, ���� � ����� �� ������ ���� ��������� ��������� � ��������. ������ ����� ��������� �� �������� � ���������� �������, ��� � ����� ������ ���� �������� ���������� ������. � ����� ����� �� ������, ��� ��� ����������� � ���� ��� � ������ģ����� ���������� ���������� �������, ������ �� ��������� ��������� ������, ��� ������ ������ ������ ������� ������ � ��������. ���� ������������ ������ ����� ����������� ������ ����� �� ����� ��������. ��� ������ �������� � ���, ��� ���������� ������ ����ң� ��. ������, � ��� ����� ��� ��. ������� ����������� ��� ���� ������, ��� ��� ������ ����� ����������� ������ � ��� �� ����� ������ � ����� �������� ��� �����. � ��� �� ����� ��� ��� ��������� ������� �� ����� ���������� ������ � ������ �������� �� ���������� ���� ���� �� �� ��������������, ��� ������� ����� �� ����, � ��� ������: ��� ��������� ������������ � �������������, ��� ��������� � ���������; ��� �������� ��������� ������������� � ������ ��� �� ����� ������� �� ������� ������� �� ��������� �����. � ���������� � ���� ��������� �� ������� ������ ������ ������� ��������.

�� ��� ��� �� ��ۣ� ������, ��� ������ ��� ������������� ��������� � ���������. ������ ������� ������, ����� ������� ����� � ��������� ���� ���� ���������� �����. ��� ��������� ���� ���������� ����, �� ������� ����, � ����� �����, � ������, ��� ������� ţ ���������� ������ ��������� �������� �������, �������� ����� ��� ������������ ��������� ����������� � ���������. �� ��� ����� ������ ������ ������������ ��� ����, ������� ��������� � ��������� ��������: � ��� ��������� ��������� ��������� ������; ����� ������ ���� ��������, ��� ��������� �� ���� ���� ������ �� ��������������� ����� ���������. �ݣ ������� ������ ������ � ���������, ������� ����� ����������, �� ������ ������ ������ �� ������� �� �� ����� ��������� �������. ������������ ����� ������, ��� ��������� �������������� �� ������� � �������, ������������� � ��������� ������, ��������� �� ������ �� ������ � ������������ ������ � ��������, ������� � �����-�� ����� ���� � �����. ������ ������� ��������, ��� ������������� ��������� ��� ������ �������, ������� ��������� ��������� ���� �����. ����� ���������� ���� ���� ���� ����� � �������� ������� ��������� ���������� � �� ���� ���������� ������ ����� � �������� ������� ��������� ���������� ����� ��������� ���������.

����� �������� ������������, ������� ������� ������������ ������, ������� ����� �������� ������ ����������� �� ������� ����� ��������, ��� ����������� ���������, ��������� ���������� � ��., � ������ ��� ������������ ������� ��������������� �� ���ͣ� ����� ��������.

���, ��� ��������, ������������� �� �������� ������, ���� ����� � ����� �����. ������� �������������, ��� �� ������ ������ � ��������� ������, �������, ��� � ������ ������������������, �������� ��� �������� � ����� ��������������. ������ � 1699 ���� ���������� ���� ������������� ������� ����� ���� ��������� ��� ��������� "����������� ������ ��������", ��� � ����������� ������ ������������ ������������� �������� � ���������� ����� �������. ����� ����������� � ������ ������������� ������� ���� �� ���������. ��� �� ������ ����� ("������� ������� �������� ������������ �� ����� �������� ������", �.-���������, 1876) ������� ������� �������� ����� � ������ ��� ������ ����� � �������������� ��������� ������ ��� �������� �������.

��� ����� ������ � ���������� ����� �����, ������� ��� �����ڣ� � ������ � 1708 �., �� ���� ����� ������� ��� �� ������ �������, � ��� � 1710 ���� �������� ��� ���������. ���� �� ���������� ������ ���� ������� ����������� 1735 �. �� ������������ �������� ����; ��� �������� � ���������: ����� "����" ���� �������, � �� ţ ����� ������� "�����"; �������� ���� ���� "���" � "V" (�����), ���� ������� ��� ��������� ����� � ������ ������� ���� ����������; ���������� ���� ����� "�", � ����� ������� �������������� ��� ������ � ������ "�"; ������� ����� ����������� ��������� ��������� �����, ����� �_���� � ���_��, �������� ���������. ������� � 1758 �. ����������� ����� ��������; ��� ������� ���� ��������� �����ģ���� ��� �������� "���������� ���������" � ��� ������������� �� ����� �������� ���� ������ ��� ������������ ����������� ��� ���������� ����� ��������� �������� � ��������. ����� ���� "�" ����������� ���������� ����� �������: "�", "i", "y", � ������: "�" ����������� ������ ����� ����������, "i"— ����� �������� � � ����������� ������, ����� ���������, ��� �� ����� � ������� "y". ����� ���� ����� ����� ����� ���� "�" ��� �����, ������� ����� ���� ������������ ����������� "�"; ���� ��������� ���� ��� �������� � ���ģ� � ������������ ����������.

� ��� ��� ��� �� ����������� ������� � ������� ������, ���� ��������� �ޣ��� ��������� ������������ �������� ţ � ������ ������������. ��� ������ ����� ���� �������� �������� �� ��, ��� ������� ������, ��� � ������ ������ ������� �� ������ �������� ����������� ������ �����, � �����������, ���� ������ ����� ���������� ����� ������������� �������� ����� � — ��� �ݣ ������ — ������������ ������� ������� �������. ������� �ޣ��� ��������� � ��������� ����������� ���� ��������, � ����������� �� � ��������������, �.�. ����������� �������.

������� ������ ���� �� ���� �������� ��������� �� ������� �������� ����� � ���� ���������� �������. �������� ������� ����������� ���������, ����� ��� ����� ����������� � ����� ������, �������; ������� �� ������ ������������� �� ��������� ������ �ݣ � ��������, � ţ �ף� � ���������� ����������� � � ������ ��� ���������� ��������.

������� � ���������

����� �������� � �������� ������� ��������� ������, ������� � ����������� ����������� ������ ����� �������� �� �� ������ ��������. �� ���� ������ ���������� ������ ������ ����� ���������� ������������� ������ ������������ ������� ��� ������ �������������� ������ ��������. ����� ������������ ���� ���������� ��������, ������� ������� �������� ����������, ���������� ����������.

�������� ASCII

�� ����� �������� ����������� ������������ ������ ����� �� ����������� ������������� ����������� ������������� ���������� � ���������� �� ������ ������, �������� �� �����������. ������� �������� ���������� ���������� ���� (� ���������� �� � ��������) ASCII (������������ ����������� ��� ��� ��������������� ������).

�������� ASCII (��� ASCII � 7-�� ������) �������� � ���� 128 ���������� ��������. ��� �������������� �� �������, ������� ASCII ���������� ��� ���������� ���������� �������, � �� ��� ���������� ������� ����������, ������� ����� ������� �������������� � ������ ���������� �����. ������� �������� ������ ������������� ������������� ���������� ��� (0-127). ������������ ���������� �������� ������������ ��, ������� ������� �� ���������� ������� �������, � ���������� ������������. ������ ������ �������� ���� �� ��������, �������������� 7� ������, ����� ��� ������� ������ ������������� � ��������� ����� (�������� � �������� ���� �������� �������� � �������� �������� � �������� �����).

ASCII � 7 ������ ���� ��������� �� ASCII � 8 ������ (��� ����������� ASCII). � ���� ��������� �������� �������� ������������� ����� �� 0 �� 255. ������� ���� (0-127) — ������ ������ ASCII, � �� ����� ��� ������� ������ ��������� �ݣ 128 ��������. ��� ��� ��� ��������� ������� ���������� � ASCII (������ ��� �ݣ �������� 8 ��� � ���� ��������� ������������� ������� ASCII), ��� ��������� ����� ������ ��������������.

�������� ISO

�������� ASCII � 8 ������ �� ���������� ���������� ������� �������� ������� ���������. ������� ������������� ����������� �� �������������� (ISO) ����� ��������������� �� ����������� ��������� ����������, ��������� ��� ��������� ISO 8859-X. ��� ��������� ������������ ����� ������������ 8-�� ������ ���������, ��� ������� �������� ������ ��������� (������� � ������ 0-127) ������������� ASCII, � ������� �������� ���������� ������� ��� ��������� ������. ��������, ��������� ������� �������� ���������� ���:

  • 8859-0 — ����� ����������� �������� (��� ���������� Latin 0)

  • 8859-1 — ������, ��������� ������� (����� ��������� ��� Latin 1)

  • 8859-2 — ��������� ������

  • 8859-5 — ���������

  • 8859-8 — ����

Latin 1 ������� �������� ������� ���������� ��������� �������, ������� �� �������� ������ ����������� ��������, �� ������������ � ��������� ����������� ������ (�������� umlauts, ����������� �������������� ����� � �.�.).

������ ���������� ���������� ������������ ASCII — ��� ��� ���������� ������� �������� IBM (��������� �� ����� ������������ ��������, ������� ������� ��� ��������� ��� ����� ������������ �����������). ��� ��������� � ������� �������� ������� ������� �������� ����������������� �������.

����������� �����������, ������� �� ������ ������� ������������� � ��������, ������������ 8-� ��� ASCII-������ (�� ���� �� ���������� �� ��� �����-�� ����� ���������� ����) ���������� ����� 8-�� ������� (�������� �� ����� 8-�� ������� ������������ ����������� �������� ������������� � ���� ����� "�"� � �������� ������������ �������). ��������� ����� ������ ���������, ������������� ��� ASCII � 7 ������ � ������, � �� ��� ������ 8-�� ���, ����� �������� ����������� � ������� � ����������� ���� ASCII. ����������� ��������, ������, �������� �������� � ����������� ASCII �� ��������� ��� ��� ����� ��������� ������� ����������������. �������� ���������� ���������, � ���� ��������� �� ���������������.

��� ���������� � ���, ��� ��������� ��ϣ ����� 8-�� ������ ����������� �����������, ���������� � ������� “Locale ��������� ����������������”.

��� ��� � ����������� ������ ������� ����������� 8-� ������, �� ��� �������� ������� ��������� ASCII �ݣ ������. ������ �������� ����� �������� � ASCII — ��� ������ �������� ������ ����������� ASCII ����������. ������ ��� ��������� � ���� ������� � ASCII.

�������� ISO 8859-5 ��� ���������� ��� �������� ��� ���������. �� ���������[3] �� ��� ���������� ��� �������� �� �������� �������� ���������, ���������� � ����, �� ������������, ��� ���� ������������� ���������� � ��������� ����� ���������, ��� ��� ������ ���������� ���������� � ����������� ���������. � ���������� Internet ����� ��������� ��������� KOI8-R (������ “�������� ���8”). ��������� ISO 8859-5 ������������ �������� ����������, ���������� ����������� ����������� � ������������ ��������� ������������� ����������. � �������� ����������, ��� �������, ��������� ������� ���� ������, �������, ���������� �� ���� OpenVMS � �.�.

��������� ���� ��������� ������ � ����-����������� ������������ — ��������� ISO 8859-5 �������� ���������� ��������� �� ������� ���� � ��������� � ������.

�������� CP866

�������������� ��������� — ��� �� ����� IBM ������� ��������, ��� ��� ������������� ����������� ������� � ������� �������� ������� ������� ���� �������� �� ���������, �������� ����������������� ������� �����������. �������������, ��� �� ������� ��� ��������, ������������ ��� ������ ��������� ����, � ����� ���������� ������� ��������� � ���. CP866 ��� �ݣ ��� � ����������� ��������� � ����� MS-DOS � OS/2[4]����� ����� ����� � �������� ������� fat, vfat ���������� � ���� ���������.

��� ��������� ���� ����������� � �� �� ����, ��� �������� ������� � ���� ���� ��������� ������ IBM PC. ����� �� �� ������� ��� �.�. �������, ���������� �� ����������� ����� ������ � PC ����� "����������� ����������� ������������ ���".

�������� CP1251

������� �������� Microsoft CP1251 ��� ������� Microsoft ��������� ����� �������� ��� ��������� ��������� � Windows. ��������� � ����, ��� �� ���������� � ���-���� �ݣ.

������, � ��������� �������, ��������, � �������� �, ��������, � ���������� ��������, cp1251 �������� ����������� ���������� ��� Linux � ��� e-mail.

�������� ���8

�������� ���8 � ������� �� CP866CP1251, ��� ���������� �������� �����.

�ݣ ��� ���Σ��� � ��̣��� �������. ������ ��� �������� ������ �� ����������� (7-�� ������) ASCII. 8-�� ��� ������� ������� �������� �� ��, ��� �� ��� ����������� ������, ��� ������ �����. ������ ����� �� ���� ������ ����� 8-�� ������� (������ ������� �������� 8-�� ��� � ��������). ������������ ���8 ��������� ����� ����������� ������. ��� ��������� ������� ������� ��������� � ������� ����� ����������� ASCII ������� ����� �������, ��� ������� ������������� �������� ������������� �� ������������ �������� � ���������� �������� � ������ ����� �������. ��� ��������, ��� ���� � ������, ���������� � ���8, ������� ������� ��� ������� �������, �� �� ��� �ݣ ����� "�����������"� �����, ���� �� � ������� ����������� ���������!

������� ��������, ��� KOI8-R �������� ������ ��� ������� �������, � ��� ��������� ��� ������ ���������� ������� KOI8: KOI8-U.

����� ������� ��������� KOI8-R ��������� �ݣ � ���������� ���������. �� ��������� ���8 ���������� � ������� ţ ������������ � �������� ������������, ���� ����� ������ ������������ ������������ ����������� ���� ������� ������ � �������� � ����������� ���8. � ��������� ����� � �������� ������������ ��������� CP1251.

�� �����������, ��� KOI8-R ������ ���� ���������� ���������� ��� ������� ��������� � Internet. ������ �. ������ �������� �������� ����� ������, ����� ������� ��������. �� - ����� RFC 1489 ("Registration of a Cyrillic Character Set").

�������� UNICODE

UNICODE — ��������� ���������� ��������� ISO 10646, ��������� ����� �����, �.�. ������ 256 �������� UNICODE ��������� �������� Latin-1 (ISO 8859-1). � ��������� ����� ������������ ����� 40.000 ������� �� ��������� 65.535 (2 ����� �� �����), � �� �������������� ��������� ����������� �����. ��������� ������������ ��������� — �������� ������� ������ EURO — ��������� � �������� 1998 �. ������� ��������������� �� ������� ����������� ���� ��������� ���������, ������� ���������������� ��������� — �� ����, ��������� ���� ��������, ����� ������ ������������ �� ������� � ���������, ����� ������� �� ��������, � �������������� ������-������������� ������ (����������� — `man 7 utf-8').

�������, ��� ������� �� ��������� ���� �������� �� 4 �����, �� ���� 2147418112 �������� — ���� �� ������.

��������� ��� ���� ������ ����� ���������� �� ������ http://www.unicode.org.

���������� ����� �������� UNICODE ����� �����: http://charts.unicode.org/ .



[3] ��� ����� ��������� �� �����������.

[4] ������� MS-DOS ����, OS/2 ����, �������� �� ��, ��� �������� ��� � ��� ���� ���������� ���� � ţ ������ :).