Читать книгу Журнал PC Magazine/RE №04/2010 - PC Magazine/RE - Страница 4

Новости
Новости и комментарии: pcmag.ru/news
Cognitive Passport: бумажный паспорт цифрового века

Оглавление

Вахтеры на проходной, графические акселераторы NVIDIA, системная интеграция – что тут может быть общего? Чтобы ответить на этот вопрос, не нужно привлекать логический аппарат теории фантастической общности, созданной в НИИ Чародейства и волшебства из книги «Понедельник начинается в субботу».

Связующим звеном стал пакет Cognitive Passport компании Cognitive Technologies. Решение предназначается для сканирования и распознавания паспортных данных на проходных. Задача не столь простая, как может показаться. Главная проблема OCR при работе с паспортами – высокая степень зашумленности изображения. Мало того, что оригиналы часто не отличаются высоким качеством, паспорт еще и не всегда хорошо сканируется из-за ламината, голографических и штриховых вклеек и вкладок, водяных знаков и защитных узоров. Эта задача тем не менее была в целом решена, и Cognitive Passport в своем сегменте рынка пользуется заслуженной популярностью, хотя простор для улучшений оставался.

В марте 2010 г. Cognitive Technologies объявила о выпуске новой версии, Cognitive Passport API 2.0. Одно из основных ее отличий – интеграция с графическими акселераторами NVIDIA. Как известно, сегодня эти устройства используются не только для вывода красивых картинок в играх, но и для решения вполне конкретных прикладных задач. NVIDIA предоставляет набор API для запуска расчетных задач на вычислительных мощностях ГП, что значительно ускоряет процессы обработки данных.

Выигрыш в производительности – огромный. В частности, если говорить о компании Cognitive Technologies, технология NVIDIA CUDA используется для ускорения расчетов, связанных с распознаванием данных в сложных условиях: на гербовом фоне, с графическими элементами, при обработке нескольких типов документов одновременно, включая биометрию. По оценкам разработчиков, скорость в отдельных случаях возросла на два порядка. Впрочем, итоговая производительность системы увеличилась не столь значительно – примерно в три раза. Причина понятна – ввод данных с паспортов предполагает не только вычисления. Фактически две трети времени уходит на прочие операции (ввод-вывод, служебные функции и др.).

При этом собственно ускорение считывания и распознавания – далеко не главное. В 90 % случаев скорость считывания одного паспорта на проходной не столь и важна (она становится критичной разве что при потоковом сканировании большого количества документов). Запас быстродействия позволяет реализовать более сложные алгоритмы обработки, например такие, о которых раньше никто и не думал из-за отсутствия мощностей (например, на ходу выявлять признаки подделки).

Среди прочих новшеств в Cognitive Passport API 2.0 – технология Cognitive PullOut, комплекс алгоритмов, позволяющий определять зоны документов на изображении, идентифицировать их и распознавать несколько документов за один проход. При этом система автоматически определяет тип документа, например паспорт гражданина РФ, водительское удостоверение и т. д. Если документ положили на сканер неровно, он все равно будет распознан без потерь в точности. Система позволяет обрабатывать как оригиналы, так и ксерокопии документов, причем и копии, и оригиналы могут вводиться в одном потоке.

Журнал PC Magazine/RE №04/2010

Подняться наверх