20.06.2019

Рукописный распознаватель с открытым кодом. PenReader: лучшая программа для распознавания рукописного текста. Работа с приложением


Распознавание рукописного ввода - это способность компьютера получать и интерпретировать рукописный ввод. Распознавание текста может производиться «офлайновым» методом из уже написанного на бумаге текста (см. оптическое распознавание символов) или «онлайновым» методом считыванием движений кончика ручки, к примеру по поверхности специального компьютерного экрана.

Энциклопедичный YouTube

  • 1 / 5

    Интерфейс онлайнового распознавания обычно состоит из:

    • ручки или стилуса, которым пользователь осуществляет ввод
    • поверхности, чувствительной к касаниям, которая может быть интегрирована с дисплеем
    • программного обеспечения, которое интерпретирует движения стилуса по пишущей поверхности, переводя получившиеся линии в цифровой текст

    Распознавание рукописного ввода широко используется в КПК . Первым КПК, который был способен распознавать рукописный ввод, является Apple Newton .

    Устройства

    Серийные устройства, в которых в качестве альтернативы традиционному вводу с помощью клавиатуры использовался ввод рукописного текста появились в начале 1980-х. Это были, например, терминалы с рукописным вводом, такие как Pencept Penpad и Inforite point-of-sale terminal . С расширением рынка персональных компьютеров появились несколько коммерческих продуктов, призванных заменить клавиатуру и мышь на персональных компьютерах единственной системой, предоставляемые PenCept , CIC and others. Первым, находящимся в открытой продаже, планшетным компьютером был GRiDPad от GRiD Systems, выпущенный в сентябре 1989. Его операционная система была основана на MS-DOS .

    В начале 90-х производители аппаратного обеспечения, включая NCR , IBM и EO, выпустили планшетные компьютеры с операционной системой PenPoint, разработанной GO Corp. PenPoint использовала рукописный ввод повсюду и обеспечивала совместимость со сторонним программным обеспечением. Планшетный компьютер IBM был первым использующим ThinkPad и распознавание рукописного текста IBM. Эта система распознавания была позже портирована в Microsoft Windows for Pen Computing и IBM"s Pen для OS/2 . Ни одна из этих технологий не имела коммерческого успеха.

    Развитие электроники позволили вычислительной мощности, необходимой для распознавания рукописного ввода, умещаться в меньшие размеры, чем у планшетных компьютеров, и использовать распознавание рукописного текста в качестве средства ввода для PDA . Первым PDA , обеспечивающим письменный ввод, был Apple Newton , который продемонстрировал общественности достоинства такого рода пользовательского интерфейса. Однако устройство не было коммерчески удачным вследствие несовершенства программного обеспечения, которое должно было пытаться изучить манеру письма пользователя. После разрыва с Apple Newton , технология была портирована в Mac OS X 10.2 и более поздние в виде технологии Inkwell (Macintosh).

    Современная система распознавания рукописного текста включается в операционные системы Microsoft , используемые на планшетных компьютерах (см. Windows XP Tablet PC Edition и Windows Vista). Она основана на TDNN-классификаторе, названном «Inferno», созданном в Microsoft . Позже версия CalliGrapher, распознающего рукописных ввод программного обеспечения, используемого в Newton OS 2.0, была включена в качестве вторичного распознавателя. Новое поколение CalliGrapher в настоящее время разрабатывается для Windows Mobile корпорацией PhatWare.

    Технология распознавания рукописного ввода «третьего поколения» riteScript, разработанная корпорацией EverNote в 2000-2004, включается в ritePen and EverNote. ritePen также включает технологию, позволяющую комбинировать riteScript со встроенным распознаванием рукописного текста Windows Vista , чтобы улучшить точность распознавания каждого движка распознавания рукописного текста.

    Хотя распознавание рукописного текста - средство ввода, к которому уже привыкла общественность, оно ещё не достигло широкого распространения в настольных компьютерах и ноутбуках. Все ещё считается [ ] , что ввод с помощью клавиатуры быстрее и надежнее. Сейчас существует множество PDA, поддерживающих иногда и естественный рукописный почерк, но точность все ещё не является очень высокой, из-за чего некоторые люди находят даже простую экранную клавиатуру более эффективной.

    Офлайновое распознавание

    Этот вид распознавания считается более сложным по сравнению с онлайновым. Для офлайного распознавания требуется обучение системы распознавания человеком или готовая обучающая выборка. Подобный механизм реализован в ABBYY FineReader . Качество распознавания можно повысить, используя структурированные документы (формы). Кроме того, можно улучшить качество, уменьшив диапазон возможных вводимых символов. Применяется в сферах деятельности, где необходимо обрабатывать большое количество рукописных документов, к примеру, в страховых компаниях.

    Иногда перед владельцем персонального компьютера возникает довольно сложная по своим особенностям задача - перевести рукописный текст в цифровой формат. Конечно, можно выполнить эту работу и вручную. Однако такой метод актуален только при условии, что объем незначительный. Но что же делать пользователю, если у него на руках целый масштабный фолиант? Существует ли оперативное распознавание рукописного текста?

    Конечно же, современные компьютерные технологии уже далеко ушли от того уровня, который закрепился несколько лет назад. Умельцы каждый день создают десятки новых программ, которые способствуют облегчению выполнения разного рода задач. При этом такие утилиты могут распространяться как платно, так и совершенно безвозмездно. Разница будет заключаться в надежности а также возможности устранения каких-либо возникающих сложностей и неполадок через техническую продержку данного программного обеспечения. Распознавание рукописного текста на сегодняшний день не представляет собой особой проблемы. С этой задачей легко справляются сразу несколько удобных утилит.

    Наиболее известной и популярной является программа для распознавания рукописного текста под названием Fine Reader. Для того чтобы пользователь смог её применить, ему понадобится сканер. К слову сказать, этот прибор пригодится в любом случае, какую бы утилиту вы не выбрали. Ведь для того чтобы программа могла начать работу, ей нужна какая-то исходная информация о тексте. Наиболее простым способом является создание скана. Хотя некоторые программы способны осуществлять распознавание рукописного текста и при наличии обычной цифровой фотографии любого формата, предварительно загруженной в компьютер. Помните, чем лучше будет качество (разрешение) снимка, тем более качественно утилита выполнит свою работу. Fine Reader вполне можно найти в интернете и скачать без каких-либо финансовых вложений. Работать с этой программой довольно просто, так как она имеет простой и удобный интерфейс. Однако конечный результат может иметь существенные погрешности. Это будет зависеть от качества скана, а также почерка исходника.

    Другая программа распознавания рукописного текста, на которую стоит обратить свое внимание, называется Pen Reader. Она придется по вкусу владельцам планшетных ПК. Её принцип кардинально отличается от предыдущей утилиты. В данном случае вы получаете возможность просто писать на сенсорном дисплее, словно ручкой. При этом текст будет с высокой скоростью и точностью (порядка 97%) переводиться в файл стандартного расширения. Данная программа распространяется только за отдельную плату и создана специально для ОС Windows. Особенно удобно ею пользоваться студентам, которые сразу могут писать лекции в виде текстовых электронных файлов. Кроме того, Pen Reader «понимает» даже самый сложный почерк.

    Распознавание рукописного текста может быть осуществлено и такой утилитой, как Cunei Form. Она работает на большинстве операционных систем, а также способна довольно четко переводить в цифровой формат журналы, газеты, слова, набранные на печатной машинке, файлы OCR и многое другое. Данная программа имеет расширенный ряд опций, с помощью которых пользователь может отрегулировать практически все настройки. Количество иностранных языков, на которых происходит распознавание рукописного текста, превышает 20 штук. При всем утилиты полностью русифицирован, а сама она распространяется в сети совершенно бесплатно. Вот такие вот бескорыстные умельцы иногда встречаются на просторах всемогущего интернета. Благодаря им пользователи получают возможность без каких-либо затрат и финансовых вложений легко и просто перевести практически любую рукопись в цифровой формат.

    Достаточно значимый процент деловых и офисных документов содержит рукописный текст. Согласно исследованиям , эти данные играют ключевую роль и в обязательном порядке попадают в учетные системы путем ручного ввода. Предприятия не пытаются автоматизировать эту работу, в результате, ввод данных отнимает много ресурсов и времени. Почему? Рукописный текст, также как и печатный, можно извлекать из документов, получая при этом максимальную точность. Предлагаемое решение Form Xtra Capture , как нельзя лучше, подходит для этих задач. Теперь распознавание рукописного текста, цифр, образов полностью автоматизировано.


    Привычные многим программы для распознавания текста отличаются от решений по извлечению данных. И на то есть свои причины. Учетным программам нужны данные, а не редактируемые формы с различными графическими элементами (таблицы, рамки, линии, засечки и логотипы). Для автоматизации ввода требуется подготовительный этап — настройка, где пользователь указывает какую информацию извлекать, как ее обрабатывать, распознавать и экспортировать. Для более детального ознакомления с основными этапами работы (в т.ч. и настройки) системы смотрите схему работы . Мы же сосредоточимся на распознавании рукописного текста в документах, выделяя важные особенности:

    • Использование контекстной информации
    • Использование регулярных выражений

      Регулярные выражения — крайне полезный инструмент, который можно использовать для распознавания сложных последовательностей символов.

    • Использование псевдонимов

      Ошибки в проектировании документа могут приводить к неопределенности при ее заполнении. В результате вместо одного варианта написания появляется множество альтернативных вариантов, которые тоже являются правильными. Для примера: Харкiв , мХаркiв (точка находится в ячейке с буквой "м"), м.Харкiв (точка находится в отдельной ячейке). Более того, специфика различных регионов Украины позволяет смело предположить, что люди заполняют документы на родном языке, игнорируя требования и основной язык документа. Пример: Харьков , гХарьков , г.Харьков . Использование псевдонимов (alias) позволяет преобразовать все ответы распознавателя к единственно правильному ответу.

    • Использование скриптов (бизнес-правил)

      Скрипты применяют в качестве логического инструмента при распознавании. Они используют теории имплекации (if, else) или сценариев (use, case) для определения следующего корректного ответа или подтверждения достоверности одного или нескольких полей. Распространенной областью применения является автоматическое заполнение полей с поиском в базе данных (например, если код 00123, то имя, адрес и телефон автоматически должны быть х, у, z).

    • Алгоритмы голосования

      Достаточно часто к извлекаемому рукописному полю предъявляют повышенные требования к точности распознавания. В подобных случаях имеется возможность распознавать одно и тоже поле разными способами или движками (ABBYY FineReader Engee, CuneiForm и прочие), а после, сравнивать ответы для нахождения истины.