Изменение № 2 ГОСТ Р ИСО/МЭК 19794-5-2006 Автоматическая идентификация. Идентификация биометрическая. Форматы обмена биометрическими данными. Часть 5. Данные изображения лица Утверждено и введено в действие Приказом Федерального агентства по техническому регулированию и метрологии от 25.07.2013 № 444-ст Дата введения - 2013-10-01 Введение дополнить абзацем (после второго): «Также настоящий стандарт устанавливает требования к формату обмена биометрическими данными для хранения трехмерных изображений лица». Раздел 3 дополнить ссылкой: «ИСО/МЭК 15948:2004 Информационные технологии. Компьютерная графика и обработка изображения. Мобильная сетевая графика (PNG). Функциональная спецификация». Подраздел 4.16 изложить в новой редакции: «4.16 двухмерное изображение (2D image): Двухмерное представление яркости и/или текстуры объекта в определенных условиях освещения». Раздел 4 дополнить подразделами - 4.24 - 4.34: «4.24 трехмерное изображение (3D image): Представление поверхности в трехмерном пространстве. 4.25 трехмерная карта точек (3D point map): Трехмерная сеть точек, представляющая объект съемки, в которой каждая точка записывается с помощью значений координат х, у и z в трехмерном пространстве. 4.26 трехмерное представление вершин (3D vertex representation): Представление, использующее трехмерные координаты вершин и треугольники между ними для кодирования трехмерной поверхности. 4.27 антропометрическая точка (anthropometric landmark): Контрольная точка на лице, используемая для распознавания и классификации людей. 4.28 код антропометрической точки (anthropometric landmark code): Код, состоящий из двух частей, который уникальным образом идентифицирует антропометрическую точку. 4.29 прямоугольная система координат (Cartesian coordinate system): Трехмерная прямоугольная система координат. 4.30 цилиндрическая система координат (cylindrical coordinate system): Трехмерная система координат, описывающая положение точки в пространстве с помощью трех координат радиуса, азимута и высоты. 4.31 карта глубины (range image): Числовая матрица, кодирующая точки поверхности в трехмерном пространстве, в которой координаты ячейки кодируют положение точки (первые две координаты), а значение в этой ячейке кодирует третью координату. 4.32 формат PNG (PNG format): Стандарт сжатия изображения без потерь, спецификация которого установлена в ИСО/МЭК 15948. 4.33 текстура (texture): Двухмерное представление яркости и/или цвета объекта съемки в определенных условиях освещения. 4.34 матрица текстурной проекции (texture projection matrix): Матрица с размером 3´4 для преобразования трехмерной координаты поверхности из прямоугольной системы координат в двухмерную координату текстурного изображения, в котором используются трехмерные однородные координаты точки в трехмерном пространстве, а также двухмерные однородные координаты точки в двухмерном пространстве. Примечание - Более подробная информация приведена в [13]». Подраздел 5.1 изложить в новой редакции: «5.1 Общие положения Формат записи изображения лица, определенный настоящим стандартом, предназначен для хранения данных изображения лица в записи биометрических данных. Каждая запись должна относиться к одному и тому же индивиду, содержать не менее одного изображения лица и может дополнительно включать геометрические представления лица (карты глубины, трехмерные карты точек, трехмерные представления вершин). Данная запись встраивается в блок биометрических данных, соответствующий требованиям ЕСФОБД. Структура записи представлена на рисунках 2 и 3 (рисунки 2 и 3 помещены на вкладках). Рисунок 2 - Формат записи изображения лица Примечание - Под каждым полем указано значение размера поля в байтах. Белые прямоугольники обозначают обязательные поля или блоки. Светло-серые прямоугольники обозначают обязательные поля, требования к значениям которых не установлены. Темносерые прямоугольники обозначают необязательные поля. Следует обратить внимание на то, что блок информации о трехмерном изображении и блок данных трехмерного изображения являются обязательными для трехмерных типов. Рисунок
3 - Блок информации о трехмерном изображении и три возможных блока данных
трехмерного изображения, Примечание - Под каждым полем указано значение размера поля в байтах. Белые прямоугольники обозначают обязательные поля или блоки, светло-серые прямоугольники обозначают обязательные поля, требования к значениям которых не установлены, а темно-серые - необязательные для заполнения поля. Для соответствия данному формату заголовок и вся структура данных должны соответствовать требованиям ЕСФОБД, а данные изображения лица кодироваться в формате JPEG или JPEG2000. В настоящем стандарте при ссылках на элементы формата записи изображения лица «поле» обозначает минимальную область данных, например, поле типа изображения лица или поле типа данных изображения; «блок» - группу полей, например блок информации о лице или блок информации об изображении; а «запись» - биометрическую запись, которая состоит из заголовка записи изображения лица и одной или более областей данных записи изображения лица. Все данные представлены в двоичном формате за исключением полей идентификатора формата и номера версии стандарта, являющихся строками ASCII с нулевым символом на конце. В формате не используются разделители записей или отметки полей. Разграничение полей осуществляется только путем подсчета байтов. Структура записи изображения лица организована следующим образом: а) заголовок записи изображения лица фиксированного размера (14 байтов), содержащий информацию о записи, включая число представлений изображений лица и длину всей записи в байтах; б) блок данных записи изображения лица для каждого изображения лица, содержащий: - блок информации о лице, фиксированного размера (20 байтов), в котором определяются различимые характеристики объекта, например пол; - несколько (или ни одного) блоков контрольных точек фиксированного размера (8 байтов), определяющих двухмерные или трехмерные контрольные точки на лице; - блок информации об изображении фиксированного размера (12 байтов), в котором определяются цифровые параметры изображения, например тип изображения лица и его горизонтальные и вертикальные размеры; - данные изображения, состоящие из блоков данных, которые кодированы в формате JPEG или JPEG2000; - блок информации о трехмерном изображении (92 байта) для типов изображения лица, содержащих информацию о трехмерном изображении лица (с описанием свойств этих данных); - блок данных трехмерного изображения для типов изображения лица, содержащих информацию о трехмерном изображении лица (с описанием трехмерной геометрии лица). В одной записи ЕСФОБД могут быть определены несколько изображений (трехмерных представлений) одного и того же биометрического объекта. Это обеспечивается включением нескольких блоков данных записи изображения лица после заголовка записи изображения лица и перед блоком подписи ЕСФОБД. Блоки данных записи изображения лица, содержащие данные двухмерного изображения, можно сохранять совместно с блоками данных записи изображения лица, содержащими также и данные трехмерного изображения. Структура такого встраивания изображена на рисунке 3а. Рисунок
3а - Встраивание нескольких двухмерных и трехмерных изображений Подраздел 5.4. Таблицу 2 изложить в новой редакции: «Таблица 2 - Блок заголовка записи изображения лица
Пункт 5.4.2 изложить в новой редакции: «5.4.2 Номер версии стандарта Поле номера версии стандарта (4 байта) должно содержать три символа строки ASCII с нулевым символом на конце. Первый и второй символы обозначают номер версии стандарта, третий символ - номер поправки или изменения данной редакции. Номер данной версии стандарта ИСО/МЭК 19794-5 должен быть 0´30323000; «020» - номер версии 2, номер поправки/изменения 0». Подраздел 5.6 с пунктами 5.6.1 - 5.6.3 изложить в новой редакции: «5.6 Блок контрольной точки Необязательный для заполнения блок контрольной точки (8 байтов) определяет тип, код и положение контрольной точки на изображении лица. Число блоков контрольной точки определяется в поле «Число контрольных точек» блока информации о лице. Структура такого блока представлена в таблице 8. Таблица 8 - Блок контрольной точки
Контрольные точки могут указываться как контрольные точки стандарта MPEG-4 в соответствии с ИСО/МЭК 14496-2 (приложение С) или как антропометрические точки с двухмерными или трехмерными координатами. Определение антропометрических точек и их взаимосвязь с набором контрольных точек MPEG-4 приводятся в 5.6.5. Горизонтальное и вертикальное положения контрольных точек указываются в координатах текстурного изображения или в прямоугольной системе координат (см. 5.9.2.1). Поле типа контрольной точки (1 байт) определяет тип контрольной точки, записанной в блоке контрольной точки. Это поле должно иметь значение 0´01 для обозначения двухмерной контрольной точки стандарта MPEG-4 в соответствии с ИСО/МЭК 14496-2 (приложение С), представленной двухмерными координатами в системе координат изображения. Поле должно иметь значение 0´02 для обозначения контрольной точки как двухмерной антропометрической контрольной точки, представленной двухмерными координатами в системе координат изображения. Значение 0´03 для этого поля устанавливается для обозначения трехмерной антропометрической контрольной точки, представленной своими координатами в трехмерной системе координат. Все другие значения поля зарезервированы для будущего определения новых типов контрольных точек. Таблица 8а - Тип контрольной точки
Поле кода контрольной точки (1 байт) определяет контрольную точку, записанную в блоке контрольной точки. Для типа контрольной точки 0´01 в этом блоке должны быть сохранены коды контрольных точек MPEG-4, указанные в 5.6.3 в соответствии с ИСО/МЭК 14496-2:2004 (приложение С) и определенные как контрольные точки MPEG-4 или дополнительные контрольные точки глаз и ноздрей из 5.6.4. Для типов контрольных точек 0´02 или 0´03 в этом блоке записываются коды контрольных точек, определенных в 5.6.5. 5.6.3 Контрольные точки MPEG-4 Коды, присвоенные контрольным точкам в соответствии с ИСО/МЭК 14496-2 (приложение С) показаны на рисунке 6. Код каждой контрольной точки задается условными обозначениями в формате «А.В». Значение А является основным, а значение В - дополнительным. Кодировка контрольной точки производится записью значения (1 байт), полученного по формуле А* 16 + В. Код каждой контрольной точки, показанной на рисунке 7, задается основным значением А и дополнительным значением В. Например, код для левого угла левого глаза задается основным значением 3 и дополнительным значением 7». Наименование и подрисуночную надпись рисунка 6 изложить в новой редакции (рисунок 6 остается без изменений): «• - Контрольные точки, имеющие соответствующие им антропометрические точки ° - Другие контрольные точки Рисунок 6 - Коды контрольных точек MPEG-4 по ИСО/МЭК 14496-2». Наименование рисунка 7 изложить в новой редакции (рисунок 7 остается без изменений): «Рисунок 7 - Контрольные точки центров глаз и ноздрей, определяемые относительно середины отрезков между контрольными точками MPEG-4». Пункт 5.6.4 изложить в новой редакции (таблица 9 остается без изменений): «5.6.4 Контрольные точки центров глаз и ноздрей Контрольные точки центров глаз 12.1 (левого) и 12.2 (правого) определяются как середины отрезков, соединяющих углы глаз (3.7, 3.11) и (3.8, 3.12) соответственно. Контрольная точка центра левой ноздри 12.3 имеет такую же горизонтальную координату, как середина отрезка, соединяющего контрольные точки носа (9.1, 9.15), и такую же вертикальную координату, как середина отрезка, соединяющего контрольные точки носа (9.3, 9.15). Контрольная точка центра левой ноздри 12.4 имеет такую же горизонтальную координату, как середина отрезка, соединяющего контрольные точки носа (9.2, 9.15), и такую же вертикальную координату, как середина отрезка, соединяющего контрольные точки носа (9.3, 9.15). Контрольные точки центров глаз и ноздрей изображены на рисунке 7, а их значения приведены в таблице 9». Раздел 5 дополнить пунктами - 5.6.5 - 5.6.7: «5.6.5 Антропометрические точки Антропометрические точки расширяют модель MPEG-4 новыми точками, которые уже давно используются в криминалистике и антропологии для идентификации человека с помощью двух изображений лица или изображения лица и черепа. На рисунке 7а и в таблице 9а приводится определение антропометрических точек. Набор точек представляет собой черепно-лицевые контрольные точки на голове и лице. Последние используются в криминалистике для идентификации по принципу «Лицо с лицом» или «Череп с лицом». Некоторые из этих точек имеют эквиваленты в MPEG-4, другие - не имеют. Рисунок 7а - Антропометрические точки, которые имеют (красные)
и не имеют (синие) Таблица 9а - Определения антропометрических точек
Антропометрическая точка имеет следующий формат: «А.В», «А» определяет область на изображения лица, которой принадлежит эта контрольная точка, например нос, рот и т. д. «В» определяет отдельную точку в определенной параметром «А» области лица. Если контрольная точка имеет два симметричных образования (левое и правое), правое образование всегда имеет большее и четное значение параметра «А». В результате все контрольные точки на левой части изображения лица имеют нечетные дополнительные коды, а на правой - четные. Параметры «А» и «В» имеют значения в диапазоне от 1 до 15. Поэтому код А* 16 + В записывается в поле кода контрольной точки размером 1 байт. 5.6.6 Трехмерные антропометрические точки Ошибка определения положения трехмерной антропометрической точки должна составлять не более 3 мм. Точка должна находиться от ближайшей точки поверхности на расстоянии не более 3 мм. Точкой на поверхности считается вершина, точка на ребре или точка на грани поверхности. 5.6.7 Z координата Это поле не используется, если тип контрольной точки относится к контрольным точкам MPEG-4 или двухмерным антропометрическим точкам. Если тип контрольной точки относится к трехмерным антропометрическим точкам, это поле вместе с положением по горизонтали и положением по вертикали обозначает контрольную точку в трехмерной прямоугольной системе координат. Метрические координаты трехмерных контрольных точек вычисляются путем умножения X, Y и Z координат на постоянный коэффициент масштаба, равный 0,02 мм. Поле типа контрольной точки кодирует тип контрольной точки и определяет способ интерпретации Z координаты». Пункт 5.7.1 изложить в новой редакции: «5.7.1 Тип изображения лица Поле типа изображения лица, согласно таблице 10, должно содержать информацию о типе изображения лица, записанного в блоке данных изображения и, при наличии, в блоке данных трехмерного изображения. Фронтальный тип изображения лица является полным фронтальным, условным фронтальным, либо полным фронтальным трехмерным или условным фронтальным трехмерным типом изображения лица. Поэтому не используется отдельное значение «фронтальный». Таблица 10 - Коды типов изображения лица
Основной тип изображения лица определен в разделе 6. Фронтальный, полный фронтальный и условный фронтальный типы изображения лица определены в разделах 7, 8 и 9 соответственно. Для данных типов изображения лица используется понятие «наследование». Например, фронтальный тип изображения лица наследует все требования, установленные для основного типа изображения лица, что означает, что фронтальный тип изображения лица подчиняется всем нормативным требованиям, установленным для основного типа изображения лица. Структура наследования типов изображения лица показана на рисунке 8. Взаимосвязь определена стрелками, идущими от дочерних элементов к родительским. Рисунок 8 - Типы двухмерных изображений лица и их наследование Примечание - Нормативные требования к основному, фронтальному, полному фронтальному и условному фронтальному типов изображения лица приведены в разделах 6, 7, 8 и 9 соответственно. Если двухмерная запись, отвечающая требованиям основного, полного фронтального или условного фронтального типов изображений соответственно, содержит трехмерные данные, это определяется установкой единицы для старшего бита поля типа изображения лица, в результате чего код типа изображения лица задается в диапазоне от 0´80 до 0´82. Трехмерные типы изображения лица приведены в разделах 10, 11 и 12 соответственно». Раздел 5 дополнить подразделами - 5.9 с пунктами 5.9.1 - 5.9.14, подпунктами 5.9.2.1, 5.9.2.2 и 5.10 с пунктами 5.10.1 - 5.10.8: «5.9 Блок информации о трехмерном изображении Блок информации о трехмерном изображении состоит из следующих полей: длина блока информации о трехмерном изображении, тип системы координат, матрица текстурной проекции, масштаб, смещение, тип трехмерного представления, вспомогательные данные трехмерного изображения, зарезервированное для будущего использования поле, тип источника трехмерного изображения, тип устройства получения трехмерного изображения, синхронность получения двухмерного и трехмерного изображения, синхронность получения текстурной карты и трехмерного изображения, продолжительность получения трехмерного изображения, продолжительность получения текстурной карты, тип текстурной карты и спектр текстурной карты. 5.9.1 Длина блока информации о трехмерном изображении Данное поле (4 байта) определяет размер блока информации о трехмерном изображении и данных трехмерного изображения, включая необязательные поля и блоки (при их наличии). 5.9.2 Тип системы координат Исходные данные трехмерного изображения регистрируются в собственной системе координат устройства. С использованием значений внутренних параметров устройства получения трехмерного изображения данные трехмерного изображения могут быть преобразованы в метрические мировые координаты. Однако у этого способа имеется два недостатка: - происходит потеря периодической структуры данных, созданной устройством получения трехмерного изображения, что приводит, например, к различиям в расстояниях между точками ввода данных; - для обеспечения периодичности структуры в мировой системе координат требуется интерполяция. При этом исходные данные не сохраняются. Это может быть вполне приемлемо для многих приложений, однако настоящий стандарт предназначен в том числе и для сохранения исходных данных. По этой причине настоящим стандартом предусмотрено несколько способов хранения данных трехмерного изображения в различных представлениях. Все представления поддерживают прямоугольную систему координат. Представление карты глубины дополнительно поддерживает цилиндрическую систему координат. В дальнейшем применение системы координат может быть ограничено для различных типов изображения лица (разделы 10 - 12 и подраздел А.7). Преобразование в метрические мировые координаты определено соответствующими коэффициентами пересчета и неявными правилами (например, используемыми в типе трехмерной антропометрической точки), определенными в настоящем стандарте (см. 5.9.2.1 и 5.9.2.2). Поле типа системы координат (1 байт) определяет систему координат данных трехмерного изображения посредством значений, указанных в таблице 14а. Таблица 14а - Тип системы координат
Различные системы координат определяются в 5.9.2.1 и 5.9.2.2. 5.9.2.1 Прямоугольная система координат (рисунок 8а) В прямоугольной системе координат начало отсчета данных, полученных с датчика, обычно используется в качестве начала отсчета системы координат. Преобразование прямоугольных координат в метрические прямоугольные координаты производится следующим образом:
Для некоторых типов изображения лица началом отсчета системы прямоугольных координат является нос, т.е. контрольная точка prn, определенная в таблице 9а. Примечание - Для определенных типов изображения лица определяются ограничения в отношении положения головы. Фронтальное положение определяется Франкфуртской горизонталью FH (см. приложение Г) в качестве плоскости XOZ и вертикальной плоскостью симметрии в качестве плоскости YOZ с осью Z, направленной в сторону взгляда лица. Кроме того, между антропометрическими точками и системой координат существует точное соотношение, определяемое: - требованиями к анатомическому расположению соответствующего двухмерного изображения лица; - соответствием между трехмерной картой глубины и соответствующим двухмерным изображением лица после применения матрицы текстурной проекции. Рисунок 8а - Пример прямоугольной системы координат 5.9.2.2 Цилиндрическая система координат (рисунок 8б) Точка в цилиндрической системе координат задается координатами α, h, r. Угол α и ось h определяются таким образом, что они составляют правостороннюю систему координат. Преобразование цилиндрических координат в метрические прямоугольные координаты производится следующим образом:
Масштаб Х, Масштаб Y, Масштаб Z, Смещение Х, Смещение Y и Смещение Z являются обязательными постоянными величинами для преобразования. Масштаб Х измеряется в радианах. Масштаб Y, Масштаб Z, Смещение X, Смещение Y и Смещение Z измеряются в миллиметрах. Следует обратить внимание на то, что большие значения полей Масштаб X Масштаб Y или Масштаб Z указывают на низкое разрешение в соответствующем измерении. Обычно начало отсчета данных, полученных с датчика, используется в качестве начала отсчета системы цилиндрических координат. Для определенных типов изображения лица началом отсчета системы цилиндрических координат является нос, т. е. контрольная точка prn, определенная в таблице 9а. Кроме того, между антропометрическими точками и системой координат существует точное соотношение, определяемое: - требованиями к анатомическому расположению соответствующего двухмерного изображения лица; - соответствием между трехмерной картой глубины и соответствующим двухмерным изображением лица после применения матрицы текстурной проекции. Преобразование из цилиндрической в прямоугольную систему координат производится с помощью преобразования, определенного в 5.9.2.2, а затем с помощью преобразования, обратного преобразованию, определенному в 5.9.2.1. Рисунок 8б - Пример цилиндрической системы координат Примечание - FH означает Франкфуртскую горизонталь в соответствии с приложением Г. 5.9.3 Матрица текстурной проекции Матрица текстурной проекции Р (размер 3´4, тип float, 48 байт) предназначена для отображения данных трехмерного изображения на текстурное двухмерное изображение блока данных изображения. Матрица записывается по рядам, начиная с верхнего левого угла. Проецирование точки в трехмерном пространстве [X, Y, Z] на текстурное изображение блока данных изображения производится умножением матрицы текстурной проекции Р на так называемые однородные трехмерные координаты точки [13]:
Однородные трехмерные координаты являются вектором четырех чисел [X, Y, Z, 1]Т. В данном случае X, Y, Z- это координаты точки в метрической прямоугольной системе координат. В результате умножения получается вектор [х, у, w]Т так называемых однородных двухмерных координат со вспомогательной координатой w. Для того чтобы получить двухмерные координаты пикселей текстурного изображения, следует разделить первые две координаты однородных двухмерных координат на соответствующую третью координату w. Таким образом, [x:w, y:w] - это результирующие координаты пикселей текстурного изображения, связанного с определенной трехмерной точкой [X, Y, Z]Т. Получаемые координаты являются значениями с плавающей точкой. В настоящем стандарте не регламентируются правила округления или интерполяции полученных значений до целочисленных значений координат пикселей. При использовании цилиндрической системы координат для проецирования данных трехмерного изображения на текстуру требуется преобразовать трехмерные данные сначала в метрическую прямоугольную систему координат. В случае наложения на текстуру проецируется первая трехмерная точка по линии взгляда (ближайшая к наблюдателю). В следующих двух блоках хранятся все параметры, необходимые для расчета метрических значений глубины на основе данных трехмерного изображения. 5.9.4 Масштабирование и смещение Как указано в 5.9.2.1 и 5.9.2.2, Масштаб Х, Масштаб Y, Масштаб Z, Смещение Х, Смещение Y, Смещение Z применяются в преобразовании цифровых координат в метрические. Это относится ко всем трехмерным представлениям, описанным в настоящем стандарте. Значения этих полей определены в физических единицах - миллиметрах. Масштаб Х имеет размерность физических единиц «мм» при использовании прямоугольных координат, а при использовании цилиндрических координат - «радианы». Каждый параметр является обязательным значением с плавающей точкой длиной в четыре байта. Большие значения полей Масштаб Х, Масштаб Y или Масштаб Z указывают на низкое разрешение в соответствующем измерении. Для различных типов изображений могут быть ограничены верхние пределы значений полей Масштаб Х, Масштаб Y и Масштаб Z (разделы 10 - 12 и А.7). Масштаб Х, Масштаб Y в карте глубины представляют пространственное разрешение, а в карте точек - интервалы квантования трехмерного пространства. Масштаб Z в любом из этих представлений определяет интервал квантования. 5.9.5 Тип трехмерного представления Поле типа трехмерного представления (1 байт) определяет тип представления, кодирующего данные трехмерного изображения (таблица 14б). Таблица 14б - Тип трехмерного представления
5.9.6 Вспомогательные данные трехмерного изображения Маска вспомогательных данных трехмерного изображения - это битовая маска размером в один байт. При этом биты в каждой позиции маски, перечисленные в таблице 14в, должны быть установлены в значение 1, если имеется соответствующая информация о трехмерном изображении, и в значение 0 - если такая информация отсутствует. Поэтому битовая маска, состоящая из одних нулей, указывает на отсутствие каких-либо опций. Позиция маски начинается с нуля (с младшего значащего бита). Маска указывает, присутствует ли в записи карта ошибок/ошибки в вершинах и/или текстурная карта. Таблица 14в - Вспомогательные данные трехмерного изображения
5.9.7 Тип источника трехмерного изображения По аналогии с полем тип источника в блоке информации об изображении лица, в котором содержится информация об источнике данных изображения лица, поле тип источника трехмерного изображения (1 байт) должно использоваться для указания типа источника, использованного для получения данных о трехмерном изображении. Кроме того, самый старший разряд (Most Significant Bit, MSB) определяет то, какая технология сканирования используется для данного типа источника: активная или пассивная (таблица 14г). Таблица 14г - Тип источника трехмерного изображения
5.9.8 Тип устройства получения трехмерного изображения Поле типа устройства получения трехмерного изображения (2 байта) описывает уникальный для производителя идентификатор типа устройства получения трехмерного изображения. Значение, состоящее из одних нулей, является допустимым и означает, что тип устройства получения трехмерного изображения не определен. Разработчики приложений могут получить значение этого кода у производителя. 5.9.9 Синхронность получения двухмерного и трехмерного изображения Обязательное поле синхронности получения двухмерного и трехмерного изображения (2 байта) определяет временную взаимосвязь между данными трехмерного изображения и двухмерным изображением блока данных изображения. Поле не содержит ссылки на необязательное текстурное изображение блока данных трехмерного изображения. Значение равно разнице во времени между началом процесса получения двухмерного изображения и началом процесса получения трехмерного изображения, указанной в миллисекундах (мс). Допускаются положительные и отрицательные значения. В настоящем стандарте отрицательная разница во времени означает, что процесс получения трехмерного изображения начался раньше процесса получения двухмерного изображения. Разница во времени, выраженная в миллисекундах (мс), указывается в системе дополнения до двух. Таким образом, значение 0´8001 определяет максимальную по модулю отрицательную разницу во времени минус 32767 мс, а значение 0´7FFF соответствует максимальной положительной разнице во времени плюс 32767 мс. Значение 0´8000 является допустимым и указывает, что синхронность получения трехмерного изображения не определена (таблица 14д). Таблица 14д - Синхронность получения двухмерного и трехмерного изображения
5.9.10 Синхронность получения текстурной карты и трехмерного изображения Обязательное поле синхронности получения текстурной карты и трехмерного изображения (2 байта) определяет временную взаимосвязь между данными трехмерного изображения и текстурными данными текстурной карты необязательное поле блока данных трехмерного изображения. Значение равно разнице во времени между началом процесса получения текстурной карты и началом процесса получения трехмерного изображения, указанное в миллисекундах (мс). Примечание - Поле не имеет отношения к синхронности между получением двухмерного изображения в блоке данных изображения и данными трехмерного изображения. Допускаются положительные и отрицательные значения. В настоящем стандарте отрицательная разница во времени означает, что получение трехмерного изображения началось раньше получения двухмерного изображения. Разница во времени, выраженная в миллисекундах (мс), указывается в системе дополнения до двух. Таким образом, значение 0´8001 определяет максимальную по модулю отрицательную разницу во времени минус 32767 мс, а значение 0´7FFF соответствует максимальной положительной разнице во времени 32767 мс. Значение 0´8000 является допустимым и указывает, что синхронность получения текстурной карты и трехмерного изображения не определена (таблица 14е). Таблица 14е - Синхронность получения текстурной карты и трехмерного изображения
5.9.11 Продолжительность получения трехмерного изображения Продолжительность получения трехмерного изображения существенно различается при использовании различных методов сканирования и может напрямую повлиять на качество данных (при движении объекта регистрации во время получения данных). Поле продолжительности получения трехмерного изображения (2 байта) определяет значение интервала времени между началом процесса получения трехмерного изображения и его окончанием, выраженное в миллисекундах (мс). Значение 0´FFFF является допустимым и указывает, что поле не определено (таблица 14ж). Таблица 14ж - Продолжительность получения трехмерного изображения
5.9.12 Продолжительность получения текстурной карты Текстурная карта (необязательное поле) записи трехмерного изображения может быть получена как одновременно, так и не одновременно с данными трехмерного изображения. Поле продолжительности получения текстурной карты (2 байта) определяет значение интервала времени между началом и окончанием получения текстурной карты, выраженное в миллисекундах (мс). Значение 0´FFFF является допустимым и указывает, что поле не определено (таблица 14и). Примечание - Значение поля продолжительности получения текстурной карты не является временем, необходимым для получения двухмерного изображения блока данных изображения. Таблица 14и - Продолжительность получения текстурной карты
5.9.13 Тип текстурной карты Поле типа текстурной карты (1 байт) определяет тип кодирования блока текстурной карты. Если в поле вспомогательных данных трехмерного изображения задано наличие текстурной карты в записи, то следует указать формат JPEG (ИСО/МЭК 10918-1 и рекомендации МСЭ-ТТ.81), либо формат JPEG 2000 (ИСО/МЭК 15444-1) или формат PNG (ИСО/МЭК 15948:2004). Для формата JPEG данные должны быть отформатированы в соответствии со стандартом формата обмена файлами JPEG (JPEG File Interchange Format, JFIF), версия 1.02. Если в поле вспомогательных данных трехмерного изображения указано, что для записи не задано наличие текстурной карты, тип текстурной карты должен иметь значение «не определено» (таблица 14к). Таблица 14к- Коды типов текстурной карты
5.9.14 Спектр текстурной карты Поле спектра текстурной карты (1 байт) определяет значение спектра, в котором получена текстурная карта, указанная в 5.10.8. В то время как для получения двухмерного изображения лица всегда используется видимый диапазон спектра, при получении текстурной карты условия могут быть иными. Если в поле вспомогательных данных трехмерного изображения указано, что в записи присутствует текстурная карта, то следует также указать значение поля спектра текстурной карты. Если в поле вспомогательных данных трехмерного изображения задано, что в записи текстурная карта отсутствует, спектр текстурной карты должен иметь значение «не определено» (таблица 14л). Таблица 14л - Коды типов текстурной карты
5.10 Блок данных трехмерного изображения Блок данных трехмерного изображения содержит данные трехмерного представления. Предусмотрено три варианта хранения данных трехмерного изображения: карта глубины, трехмерная карта точек или данные вершин. Допускается запись дополнительной информации в поле карты ошибок и ошибок в вершинах, а также в поле текстурной карты. Карты глубины предназначены для кодирования значений глубины от определенной точки ракурса до проекции объекта на плоскость или цилиндрическую поверхность. Карта глубины допускает кодирование только одного значения глубины на пиксель, что ограничивает топологическую сложность кодируемой поверхности. Тем не менее, для изображений лица, особенно фронтальных изображений лица, такое представление является хорошей аппроксимацией. В меньшей степени карта глубины подходит для кодирования информации о глубине при отсутствии фронтального положения. Кроме того, данные карты глубины (в отличие от данных трехмерной карты точек) в большей степени подвергаются обработке (сглаживание, изменение шага дискретизации, интерполяция и т.д.). Трехмерная карта точек в большей степени подходит для обмена и хранения необработанных данных трехмерного изображения, полученных от устройства получения трехмерного изображения. Сохранение данных в их первичной форме может привести к увеличению объема хранимых данных. Поле данных вершин определяет трехмерные точки с непостоянным шагом дискретизации, что обычно приводит к разреженному кодированию. Ввиду того, что выборка точек вершин при представлении данных вершин является вариативной, полученный результат может иметь форму либо очень компактных представлений, либо очень точных представлений при использовании большого числа вершин. Поле типа трехмерного представления (см. 5.9.5) определяет формат данных трехмерного изображения, который применялся в фактической записи. 5.10.1 Разрядность карты глубины Поле разрядности карты глубины (1 байт) определяет число бит, используемых для представления каждого пикселя карты глубины (таблица 14м). Это поле предусмотрено для быстрого и простого доступа к данной информации, поскольку разрядность глубины можно также получить из заголовка записи PNG. Таблица 14м - Коды разрядности карты глубины
5.10.2 Карта глубины Поле карты глубины содержит данные глубины в двухмерном формате. Карта глубины должна храниться в формате PNG (ИСО/МЭК 15948). Формат PNG обеспечивает сжатие без потерь как для 8-битных, так и для 16-битных данных изображения в градациях серого. Разрядность данных в PNG изображении записывается в заголовок PNG и указывается в поле разрядности карты глубины (см. 5.10.1). Разрядность карты глубины (8 бит или 16 бит) должна быть определена из заголовка PNG записи. Размер поля карты глубины является переменным, поскольку зависит от алгоритма сжатия. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины. Эти значения указаны в заголовке PNG записи. Значение пикселя 0´FF в случае 8-битного кодирования и 0´FFFF в случае 16-битного кодирования изображения указывает на отсутствие данных о глубине. 5.10.3 Ширина и высота трехмерной карты точек Поля определяют ширину и высоту трехмерной карты точек, в которой хранятся данные трехмерного изображения. Оба поля (2 байта) могут иметь значения в диапазоне от 0 до 65535. 5.10.4 Трехмерная карта точек Трехмерная карта точек предназначена для записи исходных данных, полученных с трехмерного сканера. Карта представляет собой трехканальное изображение, сжатое без потерь в формате PNG, с 16-битным кодированием каждого канала. Первый канал содержит значения X, второй - Y, а третий - Z координат точек. Значение (X, Y, Z) = (0´FFFF, 0´FFFF, 0´FFFF) означает недействительную трехмерную точку. Координаты определяются в произвольной прямоугольной системе координат. Информация о связности точек явным образом не сохраняется. Для действительных значений координаты соседних пикселей соответствуют соседним точкам на поверхности лица. Блок данных вершин переменной длины содержит блок координат вершин, необязательный блок нормалей вершины, необязательный блок ошибок в вершине и необязательный блок текстурных координат. Каждый из указанных блоков содержит наборы значений характеристик вершин. Число вершин определено в поле числа вершин (2 байта). Координаты каждой вершины определяются ее X координатой, Y координатой и Z координатой в соответствии с 2-байтными полями X координаты вершины, Y координаты вершины и Z координаты вершины соответственно. Значения определяют местоположение с фиксированной точностью в соответствии с 10.3.2. Если флаг нормали равен 0´01, то соответствующий вектор нормали в каждой вершине должен быть определен в 2-байтовых полях координат Нормаль X, Нормаль Y, Нормаль Z. Необязательное поле ошибки в вершине (1 байт) содержит дополнительную информацию о вершине в соответствии с описанием в таблице 14п (см. 5.10.7 настоящего стандарта). Если в поле вспомогательных данных трехмерного изображения задано наличие карты ошибок, то поле ошибки в вершине должно быть определено для каждой вершины. Необязательные поля текстурной координаты X и текстурной координаты Y определяют соответствующие X- и Y-позиции пикселя на текстурной карте, при этом значение (0,0) соответствует верхнему левому углу. Если в поле вспомогательных данных трехмерного изображения определено наличие текстурной карты, то текстурная координата X и текстурная координата Y должны быть определены для каждой вершины. Число треугольных граней определяется в соответствующем поле числа треугольных граней (4 байта). Трехмерное представление вершин позволяет определять дополнительные нормали для вершин. Наличие нормалей определяется значением в поле флага нормали (1 байт). Таблица 14н - Коды флагов нормали
5.10.6 Данные треугольных граней Поле данных треугольных граней переменной длины содержит список параметров треугольных граней. Число описаний треугольных граней задается в поле числа треугольных граней (см. 5.10.5). Каждая треугольная грань задается тремя 2-байтовыми индексами вершин в списке данных вершин, образующих треугольную грань. Для определения внешней стороны треугольной грани порядок расположения индексов вершин должен соответствовать движению против часовой стрелки. Необязательное поле карты ошибок содержит информацию о способе обработки данных трехмерного изображения до его записи в форме трехмерного представления. Карта ошибок кодируется в формате PNG как 8-битное изображение в градациях серого. Размер карты (в байтах) является переменным, поскольку он зависит от эффективности алгоритма сжатия изображения. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины, в том случае, если они связаны с картой глубины, либо размеры, равные произведению ширины трехмерной карты точек на высоту трехмерной карты точек в том случае, если они связаны с трехмерной картой точек. Значения пикселя t в диапазоне от 0 до 200 зарезервированы для будущего использования. Значения t, равные 201 и более, определяют потенциальный или исправленный дефект данных трехмерного изображения либо соответствующего изображения текстуры (таблица 14п). Более полная информация об использовании значений в пикселях для трехмерного представления вершин приведена в 5.10.5.
Текстурная карта необязательное поле должна использоваться только для хранения текстурных данных изображения лица, которые получены с помощью сканирующего устройства во время получения трехмерного изображения и поэтому могут отличаться по своей геометрии от стандартных двухмерных изображений лица, сохраненных в блоке данных изображения в той же записи. Текстурная карта не заменяет обязательное двухмерное изображение лица в блоке данных изображения. Чтобы соответствовать настоящему стандарту, изображения лица в блоке данных изображения любого типа трехмерного изображения должны отвечать соответствующим требованиям настоящего стандарта, указанным в разделах 5 - 9. Более подробная информация представлена в разделах 10, 11 и 12. Формат текстурной карты указывается в поле типа текстурной карты. Карта может быть представлена как 8-битное или 16-битное изображение в градациях серого, либо как 24-битное цветное изображение. Размер карты (в байтах) является переменным, поскольку зависит от эффективности алгоритма сжатия. Несжатые данные имеют размеры, равные произведению высоты карты глубины на ширину карты глубины, в том случае, если они связаны с картой глубины, либо размеры, равные произведению ширины трехмерной карты точек на высоту трехмерной карты точек в том случае, если они связаны с трехмерной картой точек. Несжатые данные имеют переменные размеры, если они связаны с трехмерным представлением вершин». Пункт 7.2.2 изложить в новой редакции: «7.2.2 Требования к положению головы Качество работы автоматизированных систем распознавания лиц зависит от положения головы. Положение головы должно быть фронтальным. Необходимо, чтобы поворот и наклон головы были не более 5° от фронтального положения (см. 5.5.8). Для изображений с отклонением головы в плоскости камеры системами автоматического распознавания лица может проводиться постобработка. Поэтому отклонение головы должно быть не более 8° (см. 5.5.8). На рисунке 8в представлен пример отклонения головы ±8°. Рисунок 8в - Пример отклонения головы ±8° В соответствии с рекомендациями для фронтального типа изображения лица (см. А.2.2) поворот головы должен быть не более 5° по вертикали от фронтального положения (см. 5.5.8). Такое ограничение накладывается на положение головы индивида для всех приложений, использующих данный формат». Пункты 8.3.1 - 8.3.6 изложить в новой редакции: В пунктах 8.3.2 - 8.3.6 установлен минимальный набор требований к соотношениям размеров лица и всего изображения, что обеспечивает нахождение всей головы и контура плеч в поле изображения. Требования данного подраздела могут быть выполнены для изображений с горизонтальной и вертикальной ориентацией кадра. Портретное изображение с контуром головы и нанесенными размерами А, В, ВВ, СС и DD, которые рассмотрены далее, показано на рисунке 9. Видимым должно быть изображение головы от подбородка до макушки (см. 8.3.5) и по всему горизонтальному размеру (см. 8.3.4). Дополнительные требования к размерам изображения головы, установленные для проездных документов, приведены в А.3.2. Примечание - Для цифровых изображений должны выполняться нормативные требования к минимальному расстоянию между центрами глаз (см. 8.4.1) и к минимальному размеру головы. В А.3.1.1 более подробно рассмотрен вопрос о связи между частотой пространственной дискретизации и требованиями 8.3.2 - 8.3.6. 8.3.2 Требования к положению лица по горизонтали Серединные по горизонтали точки рта и переносицы должны лежать на воображаемой вертикали АА, совпадающей с осью симметрии лица. Воображаемая линия ВВ определяется как линия, проходящая через центр правого и левого глаза. Точка пересечения линий АА и ВВ - центр изображения лица (точка М). Значение координаты Х точки M должно находиться между 45 % и 55 % горизонтального размера изображения. 8.3.3 Требования к положению лица по вертикали Значение координаты Y точки М должно находиться между 30 % и 50 % вертикального размера изображения. Допускается исключение для детей младше 11 лет, в этом случае предельное верхнее значение составляет 60 % (то есть точка центра головы находится ниже на изображениях детей младше 11 лет). Примечание - Начало отсчета системы координат - верхний левый угол изображения. Рисунок
9 - Геометрические характеристики изображения лица полного Примечание - Рисунок является дериватом документа AAMVA DL/ID-2000. 8.3.4 Требования к горизонтальному размеру головы на изображении Горизонтальный размер головы определяют как расстояние между двумя воображаемыми вертикальными линиями, проходящими через верхнюю и нижнюю доли уха в месте прилегания ушной раковины к голове. Горизонтальный размер головы обозначен СС на рисунке 9. Для гарантии того, что изображение будет полностью включать лицо, горизонтальный размер головы СС должен находиться в диапазоне от 50 % до 75 % ширины изображения (А). 8.3.5 Требования к вертикальному размеру головы на изображении Вертикальный размер головы DD определяют как расстояние по вертикали между основанием подбородка и макушкой согласно рисунку 9. Макушка головы является верхушкой головы, волосы не учитываются. Для гарантии того, что изображение будет полностью включать лицо, вертикальный размер головы DD должен находиться в диапазоне от 60 % до 90 % высоты изображения (В). Допускается исключение для детей младше 11 лет, в этом случае предельное нижнее значение составляет 50 %. 8.3.6 Обобщенные требования к фотографированию В таблице 15 сведены требования к фотографированию для изображений лица полного фронтального типа, установленные в 8.3.1 - 8.3.5. Таблица 15 - Обобщенные требования к фотографированию для изображений лица полного фронтального типа
На рисунке 8г представлен стандартный пример изображения для паспорта. Внешний прямоугольник обозначает максимальные размеры головы, определенные в соответствии с требованиями 8.3.4 и 8.3.5. Внутренний прямоугольник представляет минимальные размеры головы, рассчитанные исходя из размеров изображения. Рисунок
8г - Пример изображения с минимальными и максимальными размерами Стандарт дополнить разделами - 10, 11, 12 (с подразделами 10.1 - 10.3, 11.1 - 11.4, 12.1 - 12.4, с пунктами 10.2.1, 10.2.2, 10.3.1, 10.3.2, 11.5.1 - 11.5.3, 11.6.1, 11.6.2, 11.7.1): «10 Основной трехмерный тип изображения10.1 Требования наследования для основного трехмерного типа изображения Основной трехмерный тип изображения - это базовый класс всех трехмерных типов изображения лица. Все трехмерные типы изображения лица должны отвечать требованиям настоящего раздела. Основной трехмерный тип изображения наследует все требования основного типа изображения лица. Все обязательные (не являющиеся дополнительными) поля блока информации о трехмерном изображении должны быть определены. При этом некоторые обязательные поля могут оставаться неопределенными, если было задано соответствующее значение. См. определение отдельных полей для получения более подробной информации. 10.2 Требования к основному трехмерному типу изображения с использованием представления трехмерной карты точек 10.2.1 Требования к типу системы координат Значение поля типа системы координат для основного трехмерного типа изображения с использованием представления трехмерной карты точек должно равняться 0´00, то есть необходимо использовать прямоугольную систему координат. 10.2.2 Требования к масштабированию и смещению Для основного трехмерного типа изображения с использованием представления трехмерной карты точек используются фиксированные значения масштабирования и смещения. Предусмотрено использование следующих значений: Масштаб Х = Масштаб Y = Масштаб Z = 0,02 мм; Смещение Х = Смещение Y = Смещение Z = -655,34 мм. 10.3 Требования к основному трехмерному типу изображения с использованием трехмерного представления вершин 10.3.1 Требования к типу системы координат Значение поля типа системы координат для основного трехмерного типа изображения с использованием трехмерного представления вершин должно равняться 0´00, то есть должна использоваться прямоугольная система координат. 10.3.2 Требования к масштабированию и смещению Для основного трехмерного типа изображения с использованием трехмерного представления вершин применяются фиксированные значения масштабирования и смещения. Предусмотрено использование следующих значений: Масштаб Х = Масштаб Y = Масштаб Z = 0,02 мм; Смещение Х = Смещение Y = Смещение Z = -655,34 мм. 11 Полный фронтальный трехмерный тип изображения лицаПолный фронтальный трехмерный тип изображения лица должен отвечать следующим требованиям. 11.1 Требования наследования Полный фронтальный трехмерный тип изображения лица наследует требования основного типа трехмерного изображения, указанные в 10.1. Кроме того, он наследует все требования полного фронтального типа изображения. 11.2 Требования к типу системы координат Значение поля типа системы координат для полного фронтального трехмерного типа изображения должно равняться 0´00, то есть следует использовать прямоугольную систему координат. Началом отсчета системы координат является нос, то есть контрольная точка prn в соответствии с определением в таблице 9а. 11.3 Требования к положению головы в трехмерном представлении Поворот и наклон головы должны быть не более 5° от фронтального положения (5.5.6 и 5.5.8). Для изображений с отклонением головы в плоскости камеры системами автоматического распознавания лица может проводиться постобработка. Поэтому отклонение головы должно быть не более 8°. Указанные ограничения относятся ко всем приложениям, использующим настоящий формат. 11.4 Требования к калибровке точности текстурной проекции Калибровка точности устройства получения изображения должна быть настолько высокой, чтобы среднее значение рассогласования между текстурой полного фронтального двухмерного изображения и данными трехмерного изображения после проекции с использованием матрицы текстурной проекции составляло менее 1 мм. Примечание - Данное значение не является показателем точности, полученной при движении устройства или объекта. Показатель наблюдаемого эффекта - синхронность получения двухмерного и трехмерного изображения (см. 5.9.9). 11.5 Требования к полному фронтальному трехмерному типу изображения с использованием карты глубины 11.5.1 Требования к масштабированию Разрешение сохраненных данных глубины в значительной степени зависит от значения Масштаба Z. В целях сохранения качества установлено максимальное значение Масштаба Z, равное 1 мм для полного фронтального трехмерного типа изображения. По этой же причине установлены максимальные значения Масштаба Х и Масштаба Y, равные 1 мм для полного фронтального трехмерного типа изображения в прямоугольной системе координат. Следует отметить, что в любом случае Масштаб Х и Масштаб Y описывают частоту дискретизации, а не частоту физических измерений датчика. 11.5.2 Требования к охвату лица Данные трехмерного изображения должны охватывать минимальные прямоугольные размеры [-l,75w, l,75w] ´ [-l,75w, 2,55w] («внешнюю область») в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центр глаз) в соответствии с 5.6.4. На рисунке 11 показан пример изображения лица с выделенной внешней областью. Рисунок
11 - Пример двухмерного изображения с минимальным охватом лица 11.5.3 Требования к недействительным точкам в трехмерном изображении Не более 50 % пикселей на карте глубины в области, определенной в подразделе 11.5, могут иметь нулевое значение, указывающее на недействительное значение глубины. Во «внутренней области», определенной как [-l,5w, l,5w] ´ [-l,8w, l,8w] в прямоугольной системе координат с началом отсчета в контрольной точке prn, не более 20 % пикселей могут иметь нулевое значение, указывающее на недействительное значение глубины. В этом случае w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. На рисунке 12 показан пример изображения лица с выделенной внутренней областью. Рисунок 12 - Пример двухмерного изображения с выделенной внутренней областью 11.6 Требования к полному фронтальному трехмерному типу изображения с использованием представления трехмерной карты точек 11.6.1 Требования к ширине и высоте карты точек Разрешение трехмерной карты точек находится в прямой зависимости от ширины и высоты трехмерной карты точек. Чтобы обеспечить обмен данными трехмерного изображения высокого разрешения, минимальные размеры типов полных фронтальных трехмерных изображений с использованием представления трехмерной карты точек должны быть равны следующим значениям: - минимальная ширина трехмерной карты точек - 140 пикселей; - минимальная высота трехмерной карты точек - 170 пикселей. 11.6.2 Требования к охвату лица Для биометрического сравнения особенно важно, чтобы во внешней области, в соответствии с определением в 11.5, было достаточное число точек измерения. Для полного фронтального трехмерного типа изображений с использованием трехмерной карты точек не менее 70 % точек должны иметь Х и Y координаты со значением -l,75w £ Х £ l,75w и -l,75w £ Y £ 2,55w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. 11.7 Требования к полному фронтальному трехмерному типу изображения с использованием трехмерного представления вершин 11.7.1 Требования к охвату лица Для биометрического сравнения особенно важно, чтобы во внутренней области, определенной в соответствии с 11.5, было достаточное число точек измерения. Для полного фронтального трехмерного типа изображений с использованием представления вершин не менее 1000 точек должны иметь X и Y координаты со значением -l,5w £ X £ l,5w и -l,8w £ Y £ l,8w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. Наряду с этим должна быть как минимум одна вершина на квадратный сантиметр, спроецированная на плоскость внутренней области с покрытием 80 % внутренней области. 12 Условный фронтальный трехмерный тип изображения лицаУсловный фронтальный трехмерный тип изображения лица должен отвечать следующим требованиям. 12.1 Требования наследования Условный фронтальный трехмерный тип изображения лица наследует все требования, установленные для основного типа изображения лица и требования для полного фронтального типа изображения лица в соответствии с подразделами 11.2 - 11.6. Кроме того, он наследует все требования условного фронтального типа изображения. 12.2 Требования к условному фронтальному трехмерному типу изображения с использованием представления карты глубины Условный фронтальный трехмерный тип изображения лица с использованием представления карты глубины наследует все требования полного фронтального трехмерного изображения с использованием представления карты глубины в соответствии с 11.7. 12.3 Требования к условному фронтальному трехмерному типу изображения с использованием представления трехмерной карты точек Условный фронтальный трехмерный тип изображения лица с использованием представления трехмерной карты точек наследует все требования полного фронтального трехмерного изображения с использованием представления трехмерной карты точек в соответствии с 11.8. 12.4 Требования к условному фронтальному трехмерному типу изображения с использованием представления вершин Условный фронтальный трехмерный тип изображения лица с использованием представления вершин наследует все требования полного фронтального трехмерного изображения с использованием представления вершин в соответствии с 11.9». Раздел А.2 дополнить пунктом - А.2.2а (перед пунктом А.2.2): «А.2.2а Требование к положению головы Положение головы должно быть фронтальным. Отклонение от фронтального положения головы должно быть не более 5° в направлениях поворота, наклона и отклонения (см. 5.5.8)». Пункт А.3.1.1 дополнить абзацем: «Если бумажные фотографии были отсканированы при разрешении 120 точек на сантиметр (300 dpi), то требование минимального расстояния между центрами глаз в 90 пикселей соответствует расстоянию примерно в 8 мм между глазами. Аналогично для фотографий, отсканированных при разрешении 120 точек на сантиметр (300 dpi), требование минимального расстояния между центрами глаз в 120 пикселей соответствует расстоянию примерно в 10 мм между глазами». Пункт А.3.2.3 изложить в новой редакции: «А.3.2.3 Обобщенные рекомендации к фотографированию Для удобства в таблице 17 перечислены требования к геометрическим параметрам и положению головы, рассмотренные в А.2.2а, А.3.2.1, А.3.2.2. Таблица 17 - Обобщенные рекомендации к фотографированию для полных фронтальных типов изображений лица для проездных документов
Приложение А дополнить разделами - А.5, А.6, А.7, А.8, А.9: «А.5 Экспериментальные исследования по регистрации полных фронтальных изображений для проездных документов. Спецификации и данные, используемые для анализа В данном приложении представлены исследования, результатом которых явилось обоснование допустимых отклонений в отношении расстояния между центрами глаз, положения лица по горизонтали и вертикали, отношения горизонтального размера головы к ширине изображения и вертикального размера головы к высоте изображения. А.5.1 Спецификации и данные, используемые для анализа Для анализа использовались параметры и допустимые отклонения, являющиеся либо: 1) строгими допустимыми отклонениями в соответствии с требованиями настоящего стандарта и рекомендаций ИКАО (Международная организация гражданской авиации) [8]; 2) с увеличенными допустимыми отклонениями в соответствии с требованиями рекомендаций ИКАО [9] для приложений регистрации паспортных изображений. Данными для исследований послужили паспортные фотографии граждан 4 государств, использующих электронные паспорта в большом количестве. Все указанные изображения были применены в выданных электронных паспортах. Целью исследования являлось определение соответствия стандартных паспортных фотографий требованиям настоящего стандарта, в частности, требованиям к: 1) положению лица; 2) количеству пикселей между центрами глаз; 3) положению лица по горизонтали; 4) положению лица по вертикали; 5) отношению горизонтального размера головы к ширине изображения; 6) отношению вертикального размера головы к высоте изображения. Таблица 19 - Базы изображений, использованные для анализа
Полученные данные по базам изображений далее сравнивались друг с другом и с допустимыми значениями, которые определены в настоящем стандарте. А.5.2 Результаты исследований А.5.2.1 Расстояние между центрами глаз В соответствии с требованиями настоящего стандарта размер головы для полного фронтального изображения должен быть не менее 180 пикселей, что соответствует расстоянию между центрами глаз приблизительно в 90 пикселей (см. 8.4.1). На рисунке 21 представлено распределение расстояний между центрами глаз для четырех исследуемых баз данных. Практически во всех случаях выполняется требование к горизонтальному размеру головы. Среднее расстояние между центрами глаз составляет 123,4 пикселя. А.5.2.2 Положение лица по горизонтали Согласно требованиям настоящего стандарта значение координаты X (точка Мх) точки М центра лица должно находиться между 45 % и 55 % ширины изображения (см. 8.3.2). На рисунке 22 представлено распределение положения лица по горизонтали (Мx/А) для четырех исследуемых баз данных. Среднее значение положения лица по горизонтали для 7128 изображений составляет 49 % ширины изображения. Требованию к положению лица по горизонтали удовлетворяет 95,4 % исследуемых паспортных фотографий. А.5.2.3 Положение лица по вертикали В соответствии с требованиями настоящего стандарта значение координаты Y (точка Мy) точки М центра лица должно находиться между 30 % и 50 % высоты изображения В (см. 8.3.3), с исключением для детей младше 11 лет. На рисунке 23 представлено распределение (1 - Му/В) для четырех исследуемых баз данных. Среднее значение положения лица по вертикали (1 - Му/В) (положения глаз по вертикали, то есть положения горизонтальной линии, проходящей через центры глаз) для 7128 изображений составляет 56 % высоты изображения. Это соответствует значению координаты Y точки М (Мy), равному 44 % высоты изображения. А.5.2.4 Отношение горизонтального размера головы к ширине изображения В соответствии с требованиями настоящего стандарта для отображения лица на изображении целиком ширина головы СС должна находиться в диапазоне от 50 % до 75 % ширины изображения (см. 8.3.4). На рисунке 24 представлено распределение отношения горизонтального размера головы к ширине изображения для четырех исследуемых баз данных. Среднее значение отношения горизонтального размера головы к ширине изображения для 7128 изображений составляет 0,62. Для большинства изображений выполняется требование к отношению горизонтального размера головы к ширине изображения. А.5.2.5 Отношение вертикального размера головы к высоте изображения В соответствии с требованиями настоящего стандарта для отображения лица на изображении целиком на изображении полного фронтального типа на лицо от макушки до подбородка (DD) должно приходиться от 60 % до 90 % вертикальной длины изображения (В) (см. 8.3.5). На рисунке 25 представлено распределение отношения вертикального размера головы к высоте изображения для четырех исследуемых баз данных. Среднее значение отношения вертикального размера головы к высоте изображения для 7128 изображений составляет 0,73. Требованию к отношению вертикального размера головы к высоте изображения отвечают 98,2 % исследуемых паспортных фотографий Рисунок 21
- Нормированное распределение расстояния между центрами глаз на Рисунок
22 - Нормированное распределение положения лица по горизонтали на Рисунок
23 - Распределение положения лица по вертикали (1 - Мy/B) на исследуемых Рисунок
24 - Распределение отношения горизонтального размера головы к ширине Рисунок
25 - Распределение отношения горизонтального размера головы к высоте А.5.3 Обсуждение ошибок исследования Данное исследование основано исключительно на измерениях, выполненных автоматизированным программным обеспечением контроля качества изображений (QA-SW). Так называемая проверка экспериментальными данными, то есть анализ измеренных вручную значений, для всех исследуемых изображений не проводилась. Такая проверка проводилась на ранней стадии исследования, где было обнаружено, что используемое программное обеспечение контроля качества является достаточно точным и способно представить надежную статистику для данного исследования. Дополнительное исследование для сравнения программного обеспечения контроля качества, используемого в настоящем исследовании, с другими программными комплексами контроля качества на большом количестве паспортных фотографий показало следующие отклонения: - QA-SW расстояние между центрами глаз: +5 %; - QA-SW положение лица по горизонтали: ±1 %; - QA-SW положение лица по вертикали: ±1 %; - QA-SW отношение горизонтального размера головы к ширине изображения: ±1 %; - QA-SW отношение вертикального размера головы к высоте изображения: ±1 %. Таким образом, погрешность определения параметров составляет 1 %, за исключением параметра «расстояние между центрами глаз», который может иметь немного большее значение, чем в действительности. А.5.4 Выводы Проведенные исследования касаются геометрических параметров лица на паспортных фотографиях, имеющих большое значение при проведении биометрического сравнения. Результаты исследований основаны на статистической оценке результатов автоматизированного анализа изображений, выполненного с помощью программного обеспечения контроля качества. Даже при ошибках программного обеспечения на отдельных изображениях выводы, основанные на объединении результатов по приблизительно 7200 изображениям, являются достоверными. Таким образом, вышеприведенный анализ показал, что требования, установленные настоящим стандартом, являются достижимыми при использовании современных технологий и существующих приложений. Таблица 20 и рисунок 26 демонстрируют результаты данного исследования. Так как использованные для него изображения были получены от четырех стран, где электронные паспорта выдаются в большом количестве, настоящие результаты можно рассматривать в качестве показательных для сферы применения данного анализа. Таблица 20 - Сводные сведения соответствия выборки изображений требованиям, определенным в настоящем стандарте
Рисунок
26 - Соответствие исследуемых паспортных фотографий требованиям А.6 Экспериментальные исследования влияния расстояния между центрами глаз и положения головы (отклонения) на эффективность биометрического сравнения А.6.1 Расстояние между центрами глаз Расстояние между центрами глаз (то есть пространственное разрешение изображения) является наиболее важным критерием для успешного распознавания лица. Для оценки влияния расстояния между центрами глаз при распознавании лица проведены исследования на изображениях с различным разрешением с использованием современного алгоритма сравнения лиц. На рисунке 27 показано увеличение вероятности правильной верификации при увеличении расстояния между центрами глаз. Данные результаты применимы для оценки эффективности поиска «один- ко-многим» (ранговая статистика). Зависимость эффективности от расстояния между центрами глаз Рисунок
27 - Зависимость вероятности правильной верификации от расстояния А.6.2 Положение головы (отклонение) В автоматизированных системах распознавания лиц эффективно проводится коррекция угла отклонения изображения лица. На рисунке 28 показана эффективность распознавания лица при повороте изображений на плоскости (вокруг оси отклонения). Для тестирования была использована база данных «Color Feret» (994 эталонных и 736 тестовых изображений). На первом этапе все изображения (тестовые и эталонные) были повернуты таким образом, чтобы угол отклонения головы был равен нулю. При проведении тестирования все тестовые изображения были повернуты на +5°, а все эталонные - на -5°, затем наоборот. Такая же обработка выполнена для +10°, -10°, +15° и -15° соответственно. Таким образом, разница углов отклонения образцов изображений и изображений галереи составила 0°, 10°, 20° и 30°. На рисунке 29 представлены примеры изображений с различными значениями угла отклонения. Оценка снижения эффективности работы алгоритма при повороте изображения в плоскости проводилась относительно значения вероятности правильной верификации при ВЛД = 0,1 % и угле отклонения, равном нулю, то есть все значения вероятности правильной верификации были нормализованы по этому значению. Необходимо отметить, что тестирование включает худший сценарий, так как максимальным значением разницы углов отклонения, при котором соблюдается требование настоящего стандарта, является ±10°. Таким образом, влияние на эффективность работы алгоритма при углах отклонения в пределах требования настоящего стандарта будет значительно меньше. Очевидно, что до ±8° значимого снижения эффективности не наблюдается. Данные результаты применимы для оценки эффективности поиска «один-ко-многим» (ранговая статистика с рангом, равным 1). Как правило, разработчики программного обеспечения автоматического распознавания лиц имеют возможность проводить настройку допустимых значений для поворота изображений на плоскости. Программный продукт, использованный при данном тестировании, был настроен на допуск 10° отклонения для одного изображения, т. е. на максимальную разность угла отклонения в 20°, что явилось причиной снижения эффективности при тестах на ±15°. Зависимость эффективности от угла отклонения головы Рисунок
28 - Зависимость вероятности правильной верификации Рисунок
29 - Примеры изображений с отклонением головы. А.7 Рекомендации для полного фронтального трехмерного типа изображения лица Помимо требований раздела 11 для полного фронтального трехмерного типа изображения лица рекомендуется выполнять следующие требования. А.7.1 Рекомендации для двухмерного изображения лица полного фронтального трехмерного типа изображения Необходимо следовать рекомендациям для полного фронтального типа изображения лица. А.7.2 Замечания по совместимости В настоящее время существует большое количество реализаций, соответствующих основному стандарту. Для областей применения, где важна совместимость, рекомендуется записывать двухмерную часть изображения лица полного фронтального трехмерного изображения в качестве полного фронтального изображения в той же записи изображения лица. Это обеспечивает безопасное считывание записи полного фронтального изображения, что обеспечивает функциональную совместимость. А.7.3 Требования к положению головы для полного фронтального трехмерного типа изображения Угол отклонения головы должен быть не более 5° (см. 5.5.8). А.7.4 Требования к синхронности получения двухмерного и трехмерного изображений Поле синхронности получения двухмерного и трехмерного изображений должно быть определено и не может быть заполнено значением 0´FFFF (не определено). А.7.5 Требования к продолжительности получения трехмерного изображения Поле продолжительности получения трехмерного изображения должно быть определено и не может быть заполнено значением 0´FFFF (не определено). А.7.6 Рекомендации для полного фронтального трехмерного типа изображения с использованием представления карты глубины А.7.6.1 Требования к масштабированию Разрешение записанных данных глубины в значительной степени зависит от Масштаба Z Для обеспечения качества для полного фронтального трехмерного типа изображения должно быть установлено максимальное значение Масштаба Z равное 0,8 мм. По этой же причине следует установить максимальные значения Масштаба Х и Масштаба Y, равные 0,8 мм, для полного фронтального трехмерного типа изображения с использованием представления карты глубины в прямоугольной системе координат. А.7.6.2 Требования к недействительным точкам карты глубины Не более 20 % пикселей карты глубины в области, определенной в 11.5, могут иметь нулевое значение, определяющее недействительное значение глубины. Кроме того, во «внутренней области», определенной как [-l,5w, l,5w] ´ [-l,8w, l,8w] в прямоугольной системе координат с началом отсчета в контрольной точке prn, не более 10 % пикселей могут иметь нулевое значение, определяющее недействительное значение глубины. Здесь w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. А.7.7 Рекомендации для полного фронтального трехмерного типа изображения с использованием представления трехмерной карты точек А.7.7.1 Требования к ширине и высоте трехмерной карты точек В качестве рекомендации для трехмерных типов изображений с использованием представления трехмерной карты точек необходимо, чтобы минимальные размеры трехмерной карты точек составляли следующие значения: - минимальная ширина трехмерной карты точек - 175 пикселей; - минимальная высота трехмерной карты точек - 213 пикселей. А.7.7.2 Требования к охвату лица В качестве рекомендации для трехмерных типов изображений с использованием представления трехмерной карты точек необходимо, чтобы не менее 90 % точек имели X и Y координаты со значением -l,75w £ Х £ l,75w и -l,75w £ Y £ 2,55w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. А.7.8 Рекомендации для полного фронтального трехмерного типа изображения с использованием трехмерного представления вершин А.7.8.1 Требования к охвату лица В качестве рекомендации для трехмерных типов изображений с использованием представления вершин необходимо, чтобы не менее 1500 точек имели X и Y координаты со значением -l,5w £ X £ l,5w и -l,8w £ Y £ l,8w в прямоугольной системе координат с началом отсчета в контрольной точке prn, где w - это расстояние между контрольными точками 12.1 и 12.2 (центры глаз) в соответствии с 5.6.4. Кроме того, 90 % площади внутреннего региона должно отвечать условию, при котором на каждый квадратный сантиметр плоскости внутреннего региона будет приходиться как минимум одна спроецированная точка. А.8 Рекомендации для условного фронтального трехмерного типа изображений Помимо требований раздела 12, для фронтального трехмерного типа изображения лица рекомендуется выполнять следующие требования. А.8.1 Рекомендации для двухмерного изображения лица условного фронтального трехмерного типа изображения Необходимо следовать рекомендациям для условного фронтального типа изображения лица. А.8.2 Замечания по совместимости В настоящее время существует большое количество реализаций, соответствующих основному стандарту. Таким образом, для областей применения, где важна совместимость, рекомендуется записывать двухмерную часть изображения лица условного фронтального трехмерного изображения в качестве условного фронтального изображения в той же записи изображения лица. Это обеспечивает безопасное считывание записи условного фронтального изображения, что обеспечивает функциональную совместимость. А.8.3 Требования к положению головы для условного фронтального трехмерного типа изображения Угол отклонения головы должен быть не более 5° (см. 5.5.8). А.8.4 Требования к синхронности получения двухмерного и трехмерного изображений Поле синхронности получения двухмерного и трехмерного изображений должно быть определено и не может быть заполнено значением 0´FFFF (не определено). А.8.5 Требования к продолжительности получения трехмерного изображения Поле продолжительности получения трехмерного изображения должно быть определено и не может быть заполнено значением 0´FFFF (не определено). А.8.6 Рекомендации для условного фронтального трехмерного типа изображения с использованием представления карты глубины Необходимо следовать рекомендациям, приведенным в подразделе А.7.6. А.8.7 Рекомендации для условного фронтального трехмерного типа изображения с использованием представления трехмерной карты точек Требуется следовать рекомендациям, приведенным в А.7.7. А.8.8 Рекомендации для условного фронтального трехмерного типа изображения с использованием трехмерного представления вершин Необходимо следовать рекомендациям, приведенным в А.7.8. А.9 Краткое изложение обязательных требований и рекомендаций для трехмерных типов изображений А.9.1 Нормативная система координат и требования к положению головы для основного трехмерного типа изображения Требования приведены в таблице А.3.
А.9.2 Нормативная система координат и требования к положению головы для полного фронтального трехмерного типа изображения Требования приведены в таблице А.4
А.9.3 Нормативная система координат и требования к положению головы для условного фронтального трехмерного типа изображения Требования приведены в таблице А.5
А.9.4 Рекомендуемая система координат и требования к положению головы для полного фронтального трехмерного типа изображения Требования приведены в таблице А.6.
А.9.5 Рекомендуемая система координат и требования к положению головы для условного фронтального трехмерного типа изображения Требования приведены в таблице А.7.
Стандарт дополнить приложением - Г: «Приложение Г
|