❗ Вебсайт в стадии бета-тестирования. Возможны ошибки.

Область и блок символов

Область Юникода

В Юникоде нет точно определённых областей. Под областью понимают символы одного типа, размещённые в одной плоскости.

Область Юникода — символы одного типа, размещённые в одной плоскости Юникода.

Описание и диапазоны областей дрейфуют от одной версии Юникода к другой по мере появления новых символов или письменностей.

Области, в свою очередь, делят на блоки символов. В отличие от области блок нормативно определён и структурирован. Полный список нормативных блоков приведён в файле Blocks.txt в базе данных символов (Unicode Character Database).

В Юникоде нет определённого порядка распределения письменности. Хотя порядок областей распределения письменности имеет некоторый географический смысл, но эта корреляция весьма расплывчатая. Символы одного письма, например русского, можно встретить в различных блоках.

Блок Юникода

Блок (Block) — непрерывный именованный диапазон кодовых точек, используемый для структуризации и распределения символов.

Названия блоков уникальные. Между блоками нет пересечений и дублирования. Точный список наименований блоков для каждой версии стандарта указан в файле Blocks.txt в базе данных Юникода.

Диапазон для каждого определённого блока указан полем 0 в файле Blocks.txt Диапазоны блоков не перекрывают друг друга. Ни одна кодовая точка не расположена в нескольких блоках.

Диапазон блока определён как непрерывная последовательность кодовых точек.

Каждый диапазон блока содержит:

  • начальное значение для которого MOD 16 = 0;
  • конечное значение для которого MOD 16 = 15.

Диапазон блока всегда включает полный столбцы кодовых точек для отображения кодовой таблицы. Начало и конец блока никогда не расположены в середине столбца.

Наименование блока служит свойством этого блока.

Основная многоязычная плоскость

Основная многоязычная плоскость (Basic Multilingual Plane, BMP) содержит множество блоков. Для управления вебсайтами и написания текстов на русском языке полезны блоки:

  • основная латиница (0000 –& 007F);
  • дополнение к латинице —  (0080 –& 00FF);
  • кириллица (0400 –& 04FF);
  • основная пунктуация (2000 –& 206F);
  • надстрочные и подстрочные знаки (2070 –& 209F), математические операторы и буквы;
  • знаки валют (20A0 –& 20CF);
  • буквоподобные символы (2100 –& 214F);
  • числовые формы (2150 –& 218F);
  • стрелки (2190 –& 21FF);
  • математические операторы (2200 –& 22FF);
  • разные технические знаки (2300 –& 23FF);
  • пиктограммы управляющих символов (2400 –& 243F);
  • обрамлённые буквы и цифры (2460 –& 24FF);
  • псевдографика (2500 –& 257F);
  • блочные элементы (2580 –& 259F);
  • геометрические фигуры (25A0 –& 25FF);
  • украшение (Dingbats) (2700 –& 27BF);
  • разные математические символы — A (27C0 –& 27EF);
  • дополнительные стрелки — A (27F0 –& 27FF);
  • дополнительные стрелки — B (2900 –& 297F);
  • разные математические символы —  (2980 –& 29FF);
  • дополнительные математические операторы (2A00 –& 2AFF);
  • разные символы и стрелки (2B00 –& 2BFF).

Дополнительная многоязычная плоскость

Дополнительная многоязычная плоскость (Supplementary Multilingual Plane, SMP). Для управления вебсайтами и написания текстов на русском языке полезны блоки:

  • эмотиконы (1F600 –& 1F64F);
  • дополнительные стрелки (1F800 –& 1F8FF);
  • математические символы (1D400 –& 1D7FF);
  • латинский алфавит и цифры, заключенные в квадрат, круг (1F100 –& 1F1FF);
  • пиктограммы (1F300 –& 1F5FF);
  • эмотиконы (1F600 –& 1F64F);
  • орнаменты (1F650 –& 1F67F);
  • транспортные и картографические символы (1F680 –& 1F6FF);
  • геометрические символы (1F780 –& 1F7FF);
  • дополнительные стрелки (1F800 –& 1F8FF);
  • дополнительные символы и пиктограммы (1F900 –& 1F9FF);
  • символы и пиктограммы. Дополнение А (1FA70 –& 1FAFF).