Для чего нужен finereader

ABBYY Finereader: что это за программа

ABBYY FineReader на руссском языке идеально подходит тем, кто работает с текстами, которые были сфотографированы, а также старыми печатными изданиями после оцифровки. Даже если понадобится перевести конспект в электронный вид, это программа тоже очень поможет. Производителем софта является российская компания ABBYY. С 2009 года эта программа постоянно удостаивается различных международных наград и премий.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Особенности программы

Abby FineReader – это специальная утилита, которая используется для сканированных бумажных документов и дальнейшего распознавания текста. Программа использует в работе передовые технологические решения по распознаванию и содержит почти 200 словарей на разных языках, которые используют латиницу, кириллицу, а также арабские, армянские знаки, иероглифы.

Программа имеет такие особенности:

Таким образом, утилита дает возможность качество и быстро получить текст со сфотографированного или отсканированного документа, при этом, не изменяя последовательность страниц и структуру текста. Получаемый файл можно сохранить в разных форматах, просматривать его, редактировать при необходимости, искать в его содержимом необходимую информацию, а также прикреплять документ к электронным письмам.

СРОЧНО!

Успейте разобраться в ФСБУ 5/2019 «Запасы», пока вас не оштрафовали. Самый простой способ – короткий, но полный курс повышения квалификации от гуру бухгалтерского учета Сергея Верещагина

Источник

На пути к профессиональному использованию современных OCR. Understanding FineReader

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderЯ занимаюсь разработкой технологий, используемых в продуктах распознавания текста компании ABBYY. Самым известным продуктом (а точнее – семейством продуктов), использующим эти технологии, является FineReader.

Чем занимается программа FineReader?

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

А чем занимается пользователь?

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderОбычно почти ничем — сперва заказывает работу, а потом её принимает. Иногда пользователя что-то не устраивает в результате автоматической обработки, но в таких случаях типичный пользователь смиренно думает «Не повезло. »

К сожалению, далеко не все знают, что помимо окна «Задача», которое показывается и при запуске, есть другие способы управлять работой программы. Они помогают с помощью человеческого интеллекта преодолеть недостатки и ограничения (иногда принципиальные) искусственного интеллекта программы.

С чего начать?

Начать нужно с привычки сохранять результат работы не только в виде документа в целевом формате, но и как документ FineReader, содержащий результаты проделанной работы. Это позволяет работать с большим документом не несколько часов подряд в один подход, а когда удобно и сколько угодно раз, возвращаться к распознанному и вычитанному документу для экспериментов с настройками сохранения и так далее. Все действия с документом FineReader собраны в Меню «Файл».

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Нет ничего практичнее хорошей теории, или из чего состоит «распознавание»

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderГлядя на лаконичные названия задач, например, «Сканировать в PDF», трудно вообразить, сколько всего происходит в промежутке между «Сканировать» и «PDF» (то есть на месте одной буквы «в»). Давайте посмотрим, сколько.
Задача «преобразования документов из растрового представления в редактируемое» (не просто «распознавания») включает следующие основные этапы:

Зачем так много модулей (подсистем)?

Для начала необходимо заметить, что перечислены только основные, а не все. Подсистема сканирования, например, не день и не два писалась, а многие месяцы и даже, возможно, годы. Впрочем, вернёмся к вопросу, обозначенному выше.

Во-первых, проект «Технологии распознавания» и много сложных продуктов на его основе разрабатываются уже не первое десятилетие большими коллективами людей — их работу просто необходимо делить организационно и технологически на части, чтобы разрабатывать каждую более-менее независимо — конечно же, детально описав интерфейсы и правила взаимодействия модулей, чтобы выход предыдущего модуля в цепочке стыковался со входом следующего.

Во-вторых, некоторые продукты могут использовать не все из перечисленных стадий обработки (и реализующих их подсистем), а только некоторые. Например, модуль «Распознаватель» имеет собственные подмодули для обработки печатного и рукописного текста, а его «печатный» под-модуль – ещё и свои под-под-модули для обработки языков со сложной письменностью. Похожая ситуация с модулем разпознавания штрихкодов и кодеками некоторых форматов изображений – некоторые продукты обходятся без них.

Какой результат и зачем нужен пользователю?

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderНе озадачившись вовремя этим вопросом, можно остаться недовольным даже полностью правильным результатом OCR в узком смысле – когда вроде все буквы найдены и правильно распознаны, но в целом что-то в результате печалит.
Перечислю некоторые из популярных сценариев использования FineReader с особенностями каждого сценария.

Преобразование архива документов-изображений в электронный вид, с максимальным сохранением внешнего вида страниц, но добавлением возможности поиска и копирования небольших фрагментов текста.

Этот сценарий обычно использует сохранение обработанного документа в PDF с видимым изображением страницы (не всегда в полностью оригинальном виде, но по возможности максимально похожим на него) и добавлением «невидимого» распознанного текста, который в PDF-просмотрщиках можно искать, выделять и копировать. На нашем жаргоне этот режим сохранения в PDF называется «Текст под изображением», он наиболее популярен, но это лишь один из 4 режимов сохранения в PDF (на остальных остановлюсь подробнее в статье про сохранение). Ценители формата DjVu также могут использовать аналогичный режим сохранения.

Важное достоинство режима «Текст под изображением» в том, что он требует минимальных знаний о структуре сохраняемого текста, привязывая символы к нужным местам результирующей страницы просто по координатам на исходном изображении. Поэтому неважно, если таблицы не были правильно автоматически детектированы в оригинале (развалившись на кучу текстовых областей), или текст немного нелогично выделился в текстовые области – в результирующем PDF найдётся всё или почти всё, лишь бы символы правильно распознались и собрались в слова.

Создание документа в формате любого из популярных текстовых редакторов (Microsoft Word или OpenOffice/LibreOffice Writer), более-менее похожего на оригинал — для последующего редактирования и/или переиспользования значительных фрагментов в новых документах.

При сохранении в форматы RTF и DOCX (для Word) и ODT (для Writer) поддержаны 4 режима сохранения, отличающихся балансом «точное сохранение вида простота редактирования и копирования содержимого». Я ещё напишу подробнее об их различиях, но общим требованием для разумного вида результата обработки является разумность разметки всех элементов документа в FR — областей и их свойств.

Создание электронной книги на базе сканированной бумажной книги.

Во многом похож на предыдущий, но в силу упрощённой модели документа в форматах электронных книг, ограничений средств их редактирования и показа после FineReader, иногда требует больше внимания к некоторым мелочам.

Источник

Как пользоваться программой ABBYY FineReader

Один из популярнейших функционалов по работе со сканированием и обработкой файлов различного типа — Файн Ридер. Функционал программного продукта был разработан российской компанией ABBYY, он позволяет не только распознавать, но и обрабатывать документы (переводить, менять форматы и другое). Многие пользователи могут только установить, а как пользоваться ABBYY FineReader, сразу разобраться не могут. На многие вопросы вы сможете найти ответы в этой статье.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Программа позволяет сканировать и распознавать текст — и не только

Что представляет собой приложение от ABBYY?

Чтобы подробно разобраться, что это за программа ABBYY FineReader 12, необходимо подробно рассмотреть все её возможности. Первой и самой простой функцией является сканирование документа. Существует два варианта сканирования: с распознаванием и без него. В случае обычного сканирования печатного листа вы получите изображение, которое сканировали в указанной папке на вашем компьютерном устройстве.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Поместите документ в сканер для того, чтобы перевести его в электронный вид

Вы должны самостоятельно решить, для чего нужен FineReader именно вам, так как утилита имеет значительный функционал, например, вы можете самостоятельно выбрать в каком цвете хотите получить изображение, есть возможность перевести все фото в чёрно-белый. В чёрно-белом цвете распознавание происходит быстрее, качество обработки возрастает.

Если же вас интересует функция распознавания текста ABBYY FineReader, перед сканированием вам нужно нажать специальную кнопку. В этом случае есть несколько вариантов получения информации. Стандартно на ваш экран выведется распознанный кусок листа, который вы сможете скопировать или отредактировать вручную.

Если вы выберите другие функции, то сможете сразу получить файл Word-документом или Excel-таблицей. Выбирать функции очень просто, меню интуитивно понятно, легко настраивается благодаря тому, что все нужные вам кнопки перед глазами.

Несколько режимов работы

Чтобы полностью разобраться, как пользоваться ABBYY FineReader 12, необходимо попробовать два режима работы «Тщательный» и «Быстрое распознавание». Второй режим подходит для высококачественных изображений, а первый — для низкокачественных файлов. Режим «Тщательный» в 3–5 раз дольше обрабатывает файлы.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

На иллюстрации показан результат работы программы — распознавание текста с изображения

Какие ещё есть функции?

Распознавание текста в программе ABBYY FineReader не единственная полезная функция. Для большего удобства пользователей имеется возможность переводить документ в необходимые пользователю форматы (pdf, doc, xls и др.).

Изменение текста

Чтобы понять, как в Файн Ридере изменить текст, пользователю необходимо открыть вкладку «Сервис» — «Проверка». После этого откроется окно, которое позволит редактировать шрифт, менять символы, цвета и др. Если вы редактируете изображение, то стоит открыть «Редактор изображений», он практически полностью соответствует простой рисовалке Paint, но сделать минимальные правки позволит.

Теперь вы знаете, для каких целей служит программа FineReader, и сможете правильно её применять у себя дома или в офисе. Функционал приложения огромен, воспользуйтесь им и вы сможете убедиться в незаменимости этого программного продукта при обработке документов и файлов во время офисной работы.

Источник

Abbyy FineReader — Файн Ридер скачать бесплатно на русском

Abbyy FineReader – это широко известная программа для сканирования документов и распознавания текста. На сегодняшний день она является наиболее популярной благодаря понятному и удобному интерфейсу, большому набору всевозможных функций, связанный со сканированием и работой с готовым документом, а также удобством в использовании.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

При помощи программы Файн Ридер можно:

Сканировать любой документ через ваш сканер и после распознать и сохранить для дальнейшего редактирования на компьютере, отправить по электронной почте, сохранить на флешке и т.д. Так же можно переводить изображения, сканы, PDF-файлы, фотографии в другие форматы, например, конвертировать их в таблицы и тексты без необходимости набирать текст заново. При этом распознаются многие форматы изображений, а форматирование текста часто остаётся не тронутым.

Файн Ридер программа для сканирования документов умеет работать со всеми сканерами включая самые популярные такие как Canon (Кэнон), HP, Kyocera (Куосера), Samsung (Самсунг) и другие.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Программа для сканирования может сохранить документ в редакторы — Word (Ворд), Excel (Эксель), OpenOffice, Adobe Acrobat а так же экспортировать файлы в облачные хранилища по вашему выбору.

НазваниеЯзыкРейтинг:Загрузки
Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderAbbyy FineReader 10На РусскомХорошо
8/10
Скачать бесплатно >>
Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderAbbyy FineReader 11На РусскомОчень хорошо
9.7/10
Скачать бесплатно >>
Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderAbbyy FineReader 12На РусскомОчень хорошо
9.7/10
Скачать бесплатно >>
Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderAbbyy FineReader 14На РусскомОчень хорошо
9.8/10
Скачать бесплатно >>
Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereaderAbbyy FineReader 15На РусскомОчень хорошо
9.8/10
Скачать бесплатно >>

Помимо широкого функционала эта программа для скана выпускается более, чем на 170 языках мира, в том числе и на русском. Скорость и эффективность работы, особенно в самой новой версии Abbyy FineReader, удивительны. А улучшенный редактор изображений позволяет сделать предварительную обработку сканов и фотографий.

Можно по своему желанию добавить или снизить яркость и контрастность, скорректировать погрешности, допущенные камерой. Это позволит как можно точнее распознать текст и области рисунков. Удобный и понятный даже впервые столкнувшемуся с программой человеку интерфейс, делает её незаменимым помощником как на рабочем месте, так и дома.

Как сканировать и распознать документ:

Если программа на русском все достаточно просто и понятно, версия скачанная с нашего сайта бесплатна.

На верхней панели достаточно большие значки основных функций, на скрине ниже 11 версия но и в других все примерно одинаково изменены лишь сами значки.

Для того чтоб распознать нужно сначала сканировать со сканера документ либо загрузить картинку например с текстом, после нажать на кнопочку Распознать.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

После распознания и корректировки можно сохранять документ в редактируемый а также желаемый формат например ПДФ (PDF).

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Настройки Файн Ридер программы:

При обычном использовании например только распознать или только сканировать углубленные настройки вообще не нужны.

Из углубленных функций можно воспользоватся редактором языков если у вас текст который нужно распознать не Русский.

Источник

Обзор Abbyy FineReader 12 Professional

История Abbyy FineReader насчитывает уже более 20 лет. Юбилейный 2013 г. компания отметила выпуском полновесного (по сравнению с Express Edition от 2009 г.) Abbyy FineReader Pro для Mac, а через пару месяцев, в феврале 2014 г., свой «подарок» получили и пользователи Windows — Abbyy FineReader 12 Professional и Corporate. Напомню, что предыдущая версия появилась еще в 2011 г., а два с половиной года срок немалый — давайте разбираться, насколько существенны изменения.

Общая информация

Системные требования для новой версии совершенно не изменились. Платформой может служить Windows или Windows Server начиная от XP и 2003 соответственно. Аппаратные запросы по нынешним временам и подавно скромны: процессор любой разрядности с частотой от 1 ГГц, оперативной памяти не менее 1 ГБ плюс по 512 МБ на каждое вычислительное ядро и т. п. Несколько увеличилась только потребность в дисковом пространстве — теперь для установки требуется не 700, а 850 МБ (плюс, по-прежнему, еще 700 МБ для рабочих файлов).

Естественно, речь идет о минимальных требованиях; полностью возможности Abbyy FineReader 12 Professional раскроются только на сравнительно современных системах. В частности, напомню, что программа умеет эффективно распараллеливать обработку отдельных страниц, задействует при этом все процессорные ядра и загружает любой процессор почти на 100%. А вот к оперативной памяти она действительно не жадная, и даже остается 32-разрядной.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Не претерпела изменений и процедура установки: минимум вопросов и опций. В комплекте с Abbyy FineReader 12 Professional по-прежнему идет Abbyy Screenshot Reader, который становится работоспособным только после регистрации пользователя.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

После этого также откроется доступ к техподдержке.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Даже на основе этой скромной информации можно предположить, что перед нами результат эволюции. Соответственно, в дальнейшем я сосредоточусь на описании изменений по сравнению с предыдущей версией, которые условно можно разделить на две основные группы: работа с программой (интерфейс, вспомогательные инструменты, удобство использования) и OCR (качество и производительность собственно распознавания).

Работа с программой

Abbyy FineReader 12 Professional демонстрирует некоторые доработки в части пользовательского интерфейса. Это сразу же заметно на окне Задачи, которое по умолчанию открывается при запуске программы. Оно, очевидно, имитирует концепцию плиток Windows 8.x и адаптировано для управления пальцами, тем более, что в программе также поддерживаются и основные жесты вроде прокрутки и масштабирования. На деле же, изменения коснулись только «фасада», да и то отчасти — рядом с плитками соседствуют обычные элементы управления и в процессе настройки любого сценария придется иметь дело со стандартными диалоговыми окнами. Работать с ними пальцами довольно проблематично, особенно на экранах 8-10″, которые становятся популярными у Windows-планшетов.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Представить же, что пользователь такого планшета, оснащенного камерой, может захотеть быстро «на ходу» ввести какой-то печатный документ, действительно несложно. Между тем вся история Windows, начиная с первой редакции Tablet PC, подтверждает бессмысленность адаптации к сенсорному управлению стандартного настольного интерфейса. По-видимому, для этих целей гораздо правильнее создавать специальную оболочку, соответствующую всем канонам Metro, но использующую тот же «движок». Примером подобного решения служит Internet Explorer из Windows 8.x. К тому же, у Abbyy даже имеется некий задел в виде Abbyy FineReader Touch для Windows 8, который использует облачный сервис компании.

Если же отвлечься от сенсорного ввода, то найдутся еще изменения данного класса — от вполне ожидаемого обновления окон открытия/сохранения документов, которые, среди прочего, обеспечивают простой доступ к облачным хранилищам (при наличии в системе соответствующего агента и его папки), до нескольких более важных и полезных.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Обработка страниц в Abbyy FineReader 12 Professional теперь выполняется в фоновом режиме. Это подразумевает отсутствие прежнего модального окна со статусом операций (теперь данную роль играет строка статуса внизу экрана) и, соответственно, наличие доступа к интерфейсу. Таким образом пользователь имеет возможность работать с программой параллельно процессу распознавания (если он, конечно достаточно длительный), к примеру, копировать фрагменты полученного текста или даже корректировать разметку страниц — последние при этом будут поставлены в очередь и обработаны заново.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

В отличие от прежней версии, также не происходит перелистывания страниц по мере распознавания или при начальной загрузке документа, если автоматическое распознавание отключено. В Abbyy FineReader 12 Professional документ загружается и разбивается на страницы практически мгновенно, а их эскизы строятся только по мере ручного пролистывания в левой панели. Кроме всего прочего, тем самым экономятся вычислительные ресурсы, причем, довольно ощутимо на больших многостраничных документах.

Остальные изменения данного класса не столь интересны, хотя и могут пригодиться в каких-то сценариях, поэтому о них кратко.

Если нужно не обработать документ целиком, а лишь процитировать отдельные места, то можно отключить все автоматические операции и выбирать необходимые фрагменты любых типов, сразу же копируя их в буфер обмена — при этом анализ и распознавание будут выполняться на лету.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

В окне Проверка добавились инструменты для простого форматирования текста и вставки специальных символов, набор которых с клавиатуры может быть неочевидным.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Для получения результата с более простой структурой, чем у оригинала, можно отключать воссоздание колонтитулов, сносок и других элементов макета. Это может пригодиться, к примеру, при подготовке электронных книг.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Продолжая об электронных книгах — в Abbyy FineReader 12 Professional поддерживаются форматы EPUB 2.0.1 и 3.0.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Расширены параметры преобразования в XLSX, к примеру, появилась возможность очищать форматирование или сохранять картинки.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

При сохранении результирующих документов в PDF с текстовым слоем теперь можно воспользоваться новой технологией Abbyy Precise Scan, которая заключается в сглаживании символов на оригинальных изображениях страниц. Доступна она, кстати, только в цветном режиме.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Эффект от ее работы достаточно заметен, хотя и не всегда, скажем так, «академичен». Впрочем, читабельность сглаженных символов в любом случае должна быть выше, а в данном примере оригинал действительно очень низкого качества.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Теперь давайте разберемся, какие улучшения произошли в механизмах собственно распознавания.

Разработчики сообщают об очередном этапе совершенствования технологии ADRT, которая, напомню, анализирует и воссоздает логическую структуру документа. Декларируется, что она стала работать гораздо точнее, особенно с таблицами, списками, диаграммами. Продемонстрировать это адекватными примерами не так просто, но не невозможно. Вот, к примеру, результаты распознавания (с настройками по умолчанию) одной и той же страницы в Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу).

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Старая версия выделила и обработала только основной текстовый блок, возможно, из-за низкого качества оригинала сочтя остальные элементы «мусором». Новая, напротив, корректно опознала список и попыталась его воссоздать. Результат, правда, не идеален: то что распознаны не все маркеры можно, опять же, отнести на качество изображения, но программа, по-видимому, все же не поняла, что перед ней содержание, иначе не интерпретировала бы цифры как буквы. Тем не менее, прогресс налицо и на более качественных оригиналах подобных претензий, возможно, не было бы.

А вот как обрабатывается «неявная» таблица без разделительных линий — Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу).

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Хорошо видно, что старая версия, в отличие от новой, вообще не увидела здесь табличной структуры и ограничилась набором несвязанных между собой текстовых блоков. Не поленитесь щелкнуть на изображениях и сравнить результаты распознавания — у Abbyy FineReader 12 Professional он близок к идеалу.

К сожалению, так происходит не всегда и уже на соседних страницах Abbyy FineReader 12 Professional показал результаты, аналогичные Abbyy FineReader 11 Professional. Хотя именно ADRT должна была бы отследить одинаковые «шапки» и понять, что перед ней своеобразная перетекающая таблица.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Но все равно хорошо заметно, что обновленные алгоритмы обращают внимание на большее количество деталей чем ранее. В процессе тестирования Abbyy FineReader 12 Professional наблюдалась, к примеру, даже попытка интерпретировать как таблицу картинку с упорядоченным размещением на нем текстовой информации. Гораздо чаще также новая версия пытается воссоздавать различные диаграммы и схемы на основе фонового рисунка, а не из отдельных графических и текстовых блоков.

Есть еще несколько новинок, призванных повысить в Abbyy FineReader 12 Professional качество распознавания. Как известно, одной из предпосылок для этого является качество оригинала, особенно если он получен с помощью не сканера, а фотокамеры. Именно поэтому в свое время в FineReader появились средства предварительной обработки оригиналов. В новой версии их список расширен, добавились обрезка по краям страниц, осветление и выравнивание яркости фона, удаление цветных элементов. Последнее может пригодиться, к примеру, для обработки документов с печатями и штампами. Кроме того, теперь пользователь может подключать различные методы индивидуально.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Улучшена также языковая поддержка. Во-первых, появился русский алфавит с ударениями, во-вторых, декларируется повышение качества распознавания китайского, японского и корейского (до 20%), арабского (до 60%), иврита (до 10%) — достигнуто это, по-видимому, за счет совершенствования и дополнительной тренировки классификаторов.

Для чего нужен finereader. Смотреть фото Для чего нужен finereader. Смотреть картинку Для чего нужен finereader. Картинка про Для чего нужен finereader. Фото Для чего нужен finereader

Ну и наконец, один из наиболее животрепещущих вопросов для многих читателей: выросла ли скорость работы программы? Аргументированно ответить на этот вопрос, тем более с цифрами, не так-то просто — слишком много языков, каждый из которых имеет свои нюансы; слишком велико разнообразие оригиналов; слишком много неизвестных нам факторов влияния на работу алгоритмов. Поэтому даже сами разработчики достаточно сдержанно говорят о росте производительности Abbyy FineReader 12 Professional на 10-15%.

Оба документа распознавались в цветном режиме, а второй также и в черно-белом, что имело целью имитировать процесс подготовки электронной книги. Все настройки по умолчанию оставлялись без изменений, за исключением набора языков и, соответственно, режимов работы. В качестве тестового полигона использовался ПК с процессором i5-3450 и 8 ГБ памяти. Результаты представлены в следующей таблице:

ДокументFineReader 11 ProfessionalFineReader 12 Professional
Первый прогонПовторные прогоныПервый прогонПовторные прогоны
Буклет0:150:110:130:09
PDF-книга (цветной режим)2:302:052:051:40
PDF-книга (ч/б режим)2:091:451:401:20

Как видно, для PDF ускорение даже превышает обещанные 15% — возможно, это как раз один из особых случаев, хорошо подходящих для последних оптимизаций в алгоритмах распознавания. При этом надо иметь в виду, что программы, вообще говоря, проделали разный объем работы. Взгляните хотя бы на иллюстрации выше к обработке таблиц — трудно сказать, какой из версий пришлось сложнее.

Что касается количества ошибок, то оно у обеих версий практически совпадало, хотя было заметно, что иногда сомнения вызывают разные фрагменты и символы — это, по-видимому, является свидетельством тренировки алгоритмов. В любом случае, большинство неуверенно распознанных символов абсолютно корректно идентифицировалось с помощью словарей, а «грубые» ошибки (некорректная интерпретация специальных и декоративных символов, текста на графике и пр.) совпадали. Так что разницу и вовсе можно считать исчезающей.

Другой вопрос, насколько подобное повышение производительности вообще имеет значение? По-видимому, выигрыш в полминуты на 138 страницах, которые все равно нужно проверять и, возможно, корректировать, немногого стоит. Если работы, подобные тестовым заданиям, предполагается выполнять от случая к случаю, то о производительности можно точно не переживать. Другое дело, если речь идет об автономной обработке больших объемов документов, которая доступна в Abbyy FineReader 12 Corporate. В таком случае экономия 15% времени уже вполне ощутима.

Резюме

Несмотря на то, что новый Abbyy FineReader 12 Professional не обещал ничего революционного, по крайней мере несколько изменений в нем заслуживают всяческой похвалы. Прежде всего, это усовершенствования технологии ADRT в части распознавания таблиц, диаграмм и вообще логической структуры страниц, что в некоторых случаях позволяет получать кардинально лучшие результаты, а также фоновый режим обработки, который открывает новые возможности для интерактивной работы с большими документами.

Других изменений также немало, хотя они и менее значимы. Движение в сторону поддержки сенсорного управления сегодня безусловно оправдано, однако путь выбран порочный — обеспечить в одном интерфейсе одинаково удобную работу мышью и пальцами вряд ли возможно. Впрочем, пока Windows-планшеты только пытаются пробиться на рынок, и у разработчиков из Abbyy еще есть время.

Как обычно, ответ на вопрос «стоит ли менять старую версию на новую?» зависит от ситуации. В любом случае стоит учитывать, что жизненный цикл у FineReader достаточно продолжительный, и если какое-то из описанных улучшений играет для вас сколько-нибудь существенную роль, то за 2-3 года затраты на обновление наверняка окупятся — если не материально, то морально. Решить же для себя этот вопрос окончательно поможет пробная версия.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *