Область и блок символов
Область Юникода
В Юникоде нет точно определённых областей. Под областью понимают символы одного типа, размещённые в одной плоскости.
Область Юникода — символы одного типа, размещённые в одной плоскости Юникода.
Описание и диапазоны областей дрейфуют от одной версии Юникода к другой по мере появления новых символов или письменностей.
Области, в свою очередь, делят на блоки символов. В отличие от области блок нормативно определён и структурирован. Полный список нормативных блоков приведён в файле Blocks.txt в базе данных символов (Unicode Character Database).
В Юникоде нет определённого порядка распределения письменности. Хотя порядок областей распределения письменности имеет некоторый географический смысл, но эта корреляция весьма расплывчатая. Символы одного письма, например русского, можно встретить в различных блоках.
Блок Юникода
Блок (Block) — непрерывный именованный диапазон кодовых точек, используемый для структуризации и распределения символов.
Названия блоков уникальные. Между блоками нет пересечений и дублирования. Точный список наименований блоков для каждой версии стандарта указан в файле Blocks.txt в базе данных Юникода.
Диапазон для каждого определённого блока указан полем 0 в файле Blocks.txt Диапазоны блоков не перекрывают друг друга. Ни одна кодовая точка не расположена в нескольких блоках.
Диапазон блока определён как непрерывная последовательность кодовых точек.
Каждый диапазон блока содержит:
- начальное значение для которого MOD 16 = 0;
- конечное значение для которого MOD 16 = 15.
Диапазон блока всегда включает полный столбцы кодовых точек для отображения кодовой таблицы. Начало и конец блока никогда не расположены в середине столбца.
Наименование блока служит свойством этого блока.
Основная многоязычная плоскость
Основная многоязычная плоскость (Basic Multilingual Plane, BMP) содержит множество блоков. Для управления вебсайтами и написания текстов на русском языке полезны блоки:
- основная латиница (0000 –& 007F);
- дополнение к латинице — (0080 –& 00FF);
- кириллица (0400 –& 04FF);
- основная пунктуация (2000 –& 206F);
- надстрочные и подстрочные знаки (2070 –& 209F), математические операторы и буквы;
- знаки валют (20A0 –& 20CF);
- буквоподобные символы (2100 –& 214F);
- числовые формы (2150 –& 218F);
- стрелки (2190 –& 21FF);
- математические операторы (2200 –& 22FF);
- разные технические знаки (2300 –& 23FF);
- пиктограммы управляющих символов (2400 –& 243F);
- обрамлённые буквы и цифры (2460 –& 24FF);
- псевдографика (2500 –& 257F);
- блочные элементы (2580 –& 259F);
- геометрические фигуры (25A0 –& 25FF);
- украшение (Dingbats) (2700 –& 27BF);
- разные математические символы — A (27C0 –& 27EF);
- дополнительные стрелки — A (27F0 –& 27FF);
- дополнительные стрелки — B (2900 –& 297F);
- разные математические символы — (2980 –& 29FF);
- дополнительные математические операторы (2A00 –& 2AFF);
- разные символы и стрелки (2B00 –& 2BFF).
Дополнительная многоязычная плоскость
Дополнительная многоязычная плоскость (Supplementary Multilingual Plane, SMP). Для управления вебсайтами и написания текстов на русском языке полезны блоки:
- эмотиконы (1F600 –& 1F64F);
- дополнительные стрелки (1F800 –& 1F8FF);
- математические символы (1D400 –& 1D7FF);
- латинский алфавит и цифры, заключенные в квадрат, круг (1F100 –& 1F1FF);
- пиктограммы (1F300 –& 1F5FF);
- эмотиконы (1F600 –& 1F64F);
- орнаменты (1F650 –& 1F67F);
- транспортные и картографические символы (1F680 –& 1F6FF);
- геометрические символы (1F780 –& 1F7FF);
- дополнительные стрелки (1F800 –& 1F8FF);
- дополнительные символы и пиктограммы (1F900 –& 1F9FF);
- символы и пиктограммы. Дополнение А (1FA70 –& 1FAFF).