0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Вектор модернизации: обзор обновленного ABBYY FineReader 12

Блог Евгения Крыжановского

Я научу вас ремонтировать свой компьютер!

Вектор модернизации: обзор обновленного ABBYY FineReader 12

Наверное, сегодня уже не осталось пользователей, которые бы не были знакомы с системой оптического распознавания текстов FineReader. За 21 год своего существования на рынке программного обеспечения, данный продукт от ABBYY смог завоевать доверие более 20 миллионов пользователей по всему миру.

Так же задал новые направления развития и стандарты качества решений класса Optical Character Recognition (OCR).

Приложение уже успело прочно войти в компьютерную терминологию. Об этом свидетельствует ставшее для многих привычным выражение «распознать через FineReader». С каждым годом система подтверждает свою востребованность на рынке современного электронного документооборота. В этом нет ничего удивительного, ведь специалисты ABBYY уделяют разрабатываемому программному продукту максимум внимания и стараются совершенствовать его, внедряя все новые технологии.

Смена поколений FineReader

Начиная с двенадцатой версии, разработчики добавили в программу распознавание русского языка со знаками ударения, а также значительно улучшили движок системы. В результате удалось увеличить скорость распознавания символов, а значит и скорость обработки документов. По результатам тестов, проводимых ABBYY, по сравнению с предыдущей версией производительность FineReader 12 выросла на 10-15%. Кроме того, данный программный продукт позволяет воссоздавать и сохранять структуру таблиц на 40 %, а диаграмм и графиков на 33%.

Также FineReader 12 прекрасно справляется с текстами на иврите, арабском, китайском и японском языках. Такую возможность удалось реализовать за счет использования адаптивной технологии распознавания документов или ADRT (Adaptive Document Recognition Technology). Данная технология играет ключевую роль при проведении предварительного анализа изображений и их последующей сборки в единый документ. Программисты уделили внимание и интерфейсу приложения от ABBYY.

Теперь он стал более организованным, в нем появились новые диалоги для сохранения и открытия файлов. Интерфейс программы выполнен в единой стилистике с Windows 8. Он адаптирован для использования на устройствах с сенсорными экранами. Помимо появления укрупненных элементов управления, FineReader получил также поддержку multi-touch. Данная возможность теперь позволяет пользователям планшетных компьютеров легко и быстро менять масштаб документа, открытого в программе, а также перелистывать страницы и выполнять прочие операции, связанные с движениями пальцев.

Серьезные изменения коснулись и механизмов обработки многостраничных документов и извлечения отдельных фрагментов текста. Раньше данные операции выполнялись достаточно долгое время и могли заблокировать пользователю доступ к интерфейсу программы. В новой же версии FineReader все действия выполняются в фоновом режиме. Вы можете просматривать документ, выполнять коррекцию области распознавания, менять порядок страниц, использовать меню программы и выполнять другие действия, пока система обрабатывает загруженный в нее документ.

В обновленной версии FineReader больше нет необходимости ждать, пока произойдет распознавание целиком всего документа. Теперь вы сразу можете перейти к нужному вам фрагменту и выделить необходимый элемент, например, таблицу или картинку.

В двенадцатую версию также были добавлены новые инструменты для предварительной обработки графических файлов. Данные инструменты позволяют улучшить качество исходных изображений. Также в программе появились средства для автоматической обрезки фото, позволяющие исправить геометрические искажения, а также инструменты для выравнивания цвета и яркости фона.

Можно также удалять следы пометок и печатей на черно-белых документах. Используя возможности встроенного редактора изображений программы FineReader, можно легко изменить разрешение обрабатываемых фотографий, а также устранять перекосы строк, менять ориентацию страниц и выполнять другие действия. Все настройки можно выполнять в автоматическом режиме.

Улучшения коснулись и набора инструментов, предназначенного для ручного корректирования результата распознавания текста. В программе появилась возможность вручную корректировать формируемый текст в окне «Проверка». Здесь можно указать начертание и размер шрифта, добавлять специальные символы, используя таблицу Unicode. Для реализации удобства работы с большими объемами текста в программу был добавлен переход между словами. Выполняется он при помощи специальных «горячих» клавиш.

В меню настроек FineReader12 также появилась возможность отключения генерации элементов структуры, таких как сноски, колонтитулы, оглавление, нумерация списков. При отключении распознавания данных структурных элементов, перевод документов в электронный вид осуществляется намного быстрее. Также такая организация процесса позволяет избежать проблем при последующей обработке текста сторонними программными продуктами и приложениями, такими, как конвертор в e-book или системы перевода.

Пользователь также может самостоятельно выбирать режим распознавания текста: с приоритетом качества или с приоритетом скорости. При использовании первого режима на распознавание текста уходит намного больше времени, зато результат имеет очень высокое качество. Данный режим рекомендуется использовать для распознавания сложных цветных документов, содержащих различные элементы оформления. При использовании второго режима документы обрабатываются быстрее до 50%. Данный режим рекомендуется применять для распознавания документов большого объема, имеющих простое оформление и хорошее качество печати.

В двенадцатой версии Finereader изменения коснулись и сохранения обработанных документов, а также их конвертирования. Одним из наиболее значительных нововведений можно назвать появление функции создания файлов EPub, которые соответствуют стандартам спецификации 3.0 и 2.0.1. Кроме того, FineReader 12 отличается тесной интеграцией с SkyDrive, Dropbox и Google Drive. Перечисленные облачные хранилища теперь всегда под рукой: они отображаются прямо в окне сохранения документов.

Теперь при сохранении документов в формате PDF можно использовать новую технологию – Precise Scan. Данная технология позволяет улучшить внешний вид сканированных документов при помощи сглаживания изображения символов. Кроме того, данная технология позволяет устранить эффект пикселизации при увеличении масштаба отображения документа. Также в новой версии FineReader стали доступны новые опции сохранения изображений при сохранении документов в формате XLSX.

Каждая страница документа теперь может сохраняться на отдельном листе Excel. В корпоративной версии программы также поддерживается опция экспорта в Microsoft Office 365 и SharePoint Online. Это положительно сказывается на скорости работы программы.

Вот мы и перечислили все отличительные особенности обновленной версии программы FineReader. Данный программный продукт определенно заслуживает внимания тех пользователей, которые профессионально занимаются оцифровкой бумажной документации. На рынке программа присутствует в двух редакциях: Professional и Corparate. Она позволяет осуществлять распознавание текста на 190 мировых языках, полностью совместима с наиболее распространенными моделями МФУ и сканеров, а также позволяет распознавать текст, снятый на камеру смартфона или фотоаппарата.

Для обеспечения корректной работы данного программного продукта необходимо использовать персональный компьютер, работающий на базе операционной системы Windows, имеющий тактовую частоту процессора 1 ГГц и свыше и объем оперативной памяти не менее 1Гб. Для пользователей, предпочитающих продукцию компании Apple, существует версия FineReader Pro для Mac.

Приобрести обновленную программу можно в онлайн-маркете store.abbyy.ru. Стоимость коробочной версии программного продукта составляет 4990 рублей. Стоимость редакции Corporate варьируется в зависимости от числа лицензий, приобретаемых корпоративными клиентами. Те, кто использовал предыдущую версию программы FineReader, могут существенно сэкономить, купив только набор обновлений программы. Сберечь финансы также позволит приобретение годовой лицензии на использование программного продукта.

Запись опубликована 24.09.2015 автором katrinas11 в рубрике Программы. Отблагодари меня, поделись ссылкой с друзьями в социальных сетях:

Вектор модернизации: обзор обновленного ABBYY FineReader 12 11.06.2014 11:01

Система оптического распознавания текстов FineReader в представлении не нуждается и широко известна во всем мире. За 21 год своего существования на рынке (первая версия программы увидела свет в 1993 году) флагманский продукт ABBYY сумел не только завоевать доверие более чем 20 миллионов пользователей, но и задать новые стандарты качества и направления развития решений класса Optical Character Recognition (OCR). Успело приложение закрепиться и в компьютерной терминологии, о чем свидетельствует прочно вошедшее в обиход и ставшее привычным для многих людей выражение «распознать с помощью FineReader». Система из года в год демонстрирует свою востребованность на рынке электронного документооборота, и нет ничего удивительного в том, что специалисты ABBYY стараются уделять максимум внимания продукту и совершенствованию задействованных в нем технологий.

ABBYY FineReader: смена поколений

В новой, двенадцатой по счету версии OCR-пакета разработчики добавили поддержку распознавания русского языка с ударениями и внесли ряд улучшений в движок системы, в результате чего удалось добиться увеличения скорости обработки документов, точности определения их структуры и распознавания символов. По результатам проведенных ABBYY тестов, FineReader 12 демонстрирует возросшую на 10–15% производительность по сравнению с предыдущей редакцией продукта, точнее воссоздает и сохраняет структуру таблиц (на 40%), диаграмм и графиков (на 33%) плюс лучше справляется с текстами, написанными на иврите, арабском, а также китайском, японском и корейском языках. Все это стало возможным благодаря доработкам адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), играющей ключевую роль в процессе предварительного анализа изображений и последующей сборки обработанных данных в единое целое.

Не остался без внимания программистов компании ABBYY интерфейс приложения — он стал более «собранным», получил новые диалоги открытия и сохранения файлов, выполнен в единой с Windows 8 стилистике и адаптирован для устройств с сенсорными экранами. FineReader 12 получил не только укрупненные элементы управления, но и поддержку мультитач-жестов, позволяющих пользователям планшетных компьютеров быстро изменять масштаб открытого в программе документа, пролистывать страницы и выполнять прочие операции простым движением пальцев.

Пользовательский интерфейс ABBYY FineReader 12

Серьезно изменились механизмы обработки многостраничных документов и средства извлечения из них фрагментов текста. Операции, которые раньше могли выполняться достаточно длительное время и блокировали доступ пользователя к интерфейсу программы, в новой версии FineReader выполняются в фоновом режиме. Теперь можно просматривать документ, корректировать области распознавания, изменять порядок страниц, заходить в меню программы и выполнять прочие действия, не дожидаясь, пока OCR-система обработает загруженный файл.

Читать еще:  11-11: Memories Retold — мы не уснем

В обновленном FineReader нет необходимости дожидаться распознавания всего документа целиком. Можно сразу перейти к нужной странице, выделить необходимую область (картинки, текст, таблицы) и нажать «Копировать». Программа автоматически распознает содержимое и сохранит его в буфер обмена.

В FineReader 12 реализована удобная работа с многостраничными документами и фрагментами текста

Для улучшения качества исходных изображений в FineReader 12 добавлены новые инструменты предобработки графических файлов. В программе появились средства автоматической обрезки фотографий с исправлением геометрических искажений, выравнивания яркости и цвета фона, а также удаления следов печатей и пометок на черно-белых изображениях. Возможности встроенного редактора изображений позволяют изменить разрешение обрабатываемых фотографий, устранить перекосы строк, поменять ориентацию страниц и многое другое, причем все эти настройки можно сделать автоматическими.

Улучшения в предобработке изображений

Усовершенствованиям подвергся также инструментарий для ручной корректировки результатов распознавания. Появилась возможность корректировать форматирование текста в окне «Проверка» — указывать тип шрифта, его размер и начертание, вставлять специальные символы из таблицы Unicode. Для удобства работы с большими объемами текста был добавлен переход между словами с помощью «горячих» клавиш клавиатуры.

Улучшения в окне «Проверка»

В настройках двенадцатой версии FineReader появилась возможность отключать генерацию таких элементов структуры, как колонтитулы, сноски, содержание, нумерованные списки. Деактивация распознавания определенных структурных составляющих позволяет ускорить перевод документов в электронный вид и избежать проблем при их последующей обработке сторонними продуктами (например, системами перевода или конверторами в e-book). Кроме того, пользователь может выбрать один из двух режимов распознавания — с приоритетом скорости или качества. Первый режим позволяет обрабатывать документы до 50% быстрее и рекомендуется для распознавания больших объемов документов с простым оформлением и хорошим качеством печати. Второй режим требует больше времени, но обеспечивает лучшее качество распознавания. Он пригоден для распознавания сложных документов, содержащих текст на цветном фоне, таблицы и прочие элементы оформления.

Настройки OCR-движка FineReader 12

Претерпели изменения в FineReader 12 также инструменты сохранения обработанных документов и их конвертирования в различные форматы. Из наиболее значимых новшеств можно отметить функцию создания файлов EPub, соответствующих стандартам спецификации 2.0.1 или 3.0, а также тесную интеграцию с Google Drive, Dropbox и SkyDrive — теперь перечисленные облачные хранилища отображаются в диалоге сохранения файлов и всегда находятся под рукой. При сохранении в PDF стало возможным использование новой технологии Precise Scan, улучшающей внешний вид отсканированного документа посредством сглаживания изображения символов и устраняющей эффект пикселизации при увеличении масштаба страницы. При конвертации документов в формат XLSX отныне доступны опции сохранения картинок, удаления форматирования текста, а также сохранения каждой страницы документа на отдельном листе Excel. Кроме того, в корпоративной версии FineReader отныне поддерживается экспорт непосредственно в SharePoint Online и Microsoft Office 365, что тоже положительным образом отражается на скорости работы с программой.

Улучшения при сохранении в PDF

Таковы основные отличительные особенности обновленной линейки FineReader, определенно заслуживающей внимания тех, кто часто занимается оцифровкой бумажных документов. Программа представлена на рынке в редакциях Professional и Corporate, распознает документы на 190 мировых языках, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и позволяет распознавать текст, полученный с фотоаппарата или встроенной камеры смартфона. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта (для обладателей компьютеров Apple предусмотрен FineReader Pro для Mac).

Обновленная линейка OCR-решений уже доступна в онлайн-маркете store.abbyy.ru, торговых сетях партнеров компании и в виде ознакомительных версий на сайте ABBYY. Рекомендованная розничная цена коробочной версии FineReader 12 Professional составляет 4 990 рублей, электронной версии — 4 490 рублей. Стоимость Corporate-редакции продукта варьируется в зависимости от количества приобретаемых корпоративными заказчиками лицензий. Пользователи предыдущих сборок FineReader могут сэкономить, приобретя соответствующий набор обновлений. Также сберечь финансы можно, ограничившись годовой лицензией на продукт.

И последнее. Прилагаемый к FineReader 12 Professional лицензионный договор допускает использование одной копии приложения на одном стационарном компьютере и одном портативном ПК при условии, что оба устройства принадлежат приобретшему продукт пользователю. Таким образом, программу можно установить и на рабочий ноутбук, и на домашний компьютер, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.

Обзор Abbyy FineReader 12 Professional

История Abbyy FineReader насчитывает уже более 20 лет. Юбилейный 2013 г. компания отметила выпуском полновесного (по сравнению с Express Edition от 2009 г.) Abbyy FineReader Pro для Mac, а через пару месяцев, в феврале 2014 г., свой «подарок» получили и пользователи Windows — Abbyy FineReader 12 Professional и Corporate. Напомню, что предыдущая версия появилась еще в 2011 г., а два с половиной года срок немалый — давайте разбираться, насколько существенны изменения.

Общая информация

Системные требования для новой версии совершенно не изменились. Платформой может служить Windows или Windows Server начиная от XP и 2003 соответственно. Аппаратные запросы по нынешним временам и подавно скромны: процессор любой разрядности с частотой от 1 ГГц, оперативной памяти не менее 1 ГБ плюс по 512 МБ на каждое вычислительное ядро и т. п. Несколько увеличилась только потребность в дисковом пространстве — теперь для установки требуется не 700, а 850 МБ (плюс, по-прежнему, еще 700 МБ для рабочих файлов).

Естественно, речь идет о минимальных требованиях; полностью возможности Abbyy FineReader 12 Professional раскроются только на сравнительно современных системах. В частности, напомню, что программа умеет эффективно распараллеливать обработку отдельных страниц, задействует при этом все процессорные ядра и загружает любой процессор почти на 100%. А вот к оперативной памяти она действительно не жадная, и даже остается 32-разрядной.

Не претерпела изменений и процедура установки: минимум вопросов и опций. В комплекте с Abbyy FineReader 12 Professional по-прежнему идет Abbyy Screenshot Reader, который становится работоспособным только после регистрации пользователя.

После этого также откроется доступ к техподдержке.

Даже на основе этой скромной информации можно предположить, что перед нами результат эволюции. Соответственно, в дальнейшем я сосредоточусь на описании изменений по сравнению с предыдущей версией, которые условно можно разделить на две основные группы: работа с программой (интерфейс, вспомогательные инструменты, удобство использования) и OCR (качество и производительность собственно распознавания).

Работа с программой

Abbyy FineReader 12 Professional демонстрирует некоторые доработки в части пользовательского интерфейса. Это сразу же заметно на окне Задачи, которое по умолчанию открывается при запуске программы. Оно, очевидно, имитирует концепцию плиток Windows 8.x и адаптировано для управления пальцами, тем более, что в программе также поддерживаются и основные жесты вроде прокрутки и масштабирования. На деле же, изменения коснулись только «фасада», да и то отчасти — рядом с плитками соседствуют обычные элементы управления и в процессе настройки любого сценария придется иметь дело со стандартными диалоговыми окнами. Работать с ними пальцами довольно проблематично, особенно на экранах 8-10″, которые становятся популярными у Windows-планшетов.

Представить же, что пользователь такого планшета, оснащенного камерой, может захотеть быстро «на ходу» ввести какой-то печатный документ, действительно несложно. Между тем вся история Windows, начиная с первой редакции Tablet PC, подтверждает бессмысленность адаптации к сенсорному управлению стандартного настольного интерфейса. По-видимому, для этих целей гораздо правильнее создавать специальную оболочку, соответствующую всем канонам Metro, но использующую тот же «движок». Примером подобного решения служит Internet Explorer из Windows 8.x. К тому же, у Abbyy даже имеется некий задел в виде Abbyy FineReader Touch для Windows 8, который использует облачный сервис компании.

Если же отвлечься от сенсорного ввода, то найдутся еще изменения данного класса — от вполне ожидаемого обновления окон открытия/сохранения документов, которые, среди прочего, обеспечивают простой доступ к облачным хранилищам (при наличии в системе соответствующего агента и его папки), до нескольких более важных и полезных.

Обработка страниц в Abbyy FineReader 12 Professional теперь выполняется в фоновом режиме. Это подразумевает отсутствие прежнего модального окна со статусом операций (теперь данную роль играет строка статуса внизу экрана) и, соответственно, наличие доступа к интерфейсу. Таким образом пользователь имеет возможность работать с программой параллельно процессу распознавания (если он, конечно достаточно длительный), к примеру, копировать фрагменты полученного текста или даже корректировать разметку страниц — последние при этом будут поставлены в очередь и обработаны заново.

В отличие от прежней версии, также не происходит перелистывания страниц по мере распознавания или при начальной загрузке документа, если автоматическое распознавание отключено. В Abbyy FineReader 12 Professional документ загружается и разбивается на страницы практически мгновенно, а их эскизы строятся только по мере ручного пролистывания в левой панели. Кроме всего прочего, тем самым экономятся вычислительные ресурсы, причем, довольно ощутимо на больших многостраничных документах.

Остальные изменения данного класса не столь интересны, хотя и могут пригодиться в каких-то сценариях, поэтому о них кратко.

Если нужно не обработать документ целиком, а лишь процитировать отдельные места, то можно отключить все автоматические операции и выбирать необходимые фрагменты любых типов, сразу же копируя их в буфер обмена — при этом анализ и распознавание будут выполняться на лету.

В окне Проверка добавились инструменты для простого форматирования текста и вставки специальных символов, набор которых с клавиатуры может быть неочевидным.

Для получения результата с более простой структурой, чем у оригинала, можно отключать воссоздание колонтитулов, сносок и других элементов макета. Это может пригодиться, к примеру, при подготовке электронных книг.

Продолжая об электронных книгах — в Abbyy FineReader 12 Professional поддерживаются форматы EPUB 2.0.1 и 3.0.

Расширены параметры преобразования в XLSX, к примеру, появилась возможность очищать форматирование или сохранять картинки.

При сохранении результирующих документов в PDF с текстовым слоем теперь можно воспользоваться новой технологией Abbyy Precise Scan, которая заключается в сглаживании символов на оригинальных изображениях страниц. Доступна она, кстати, только в цветном режиме.

Эффект от ее работы достаточно заметен, хотя и не всегда, скажем так, «академичен». Впрочем, читабельность сглаженных символов в любом случае должна быть выше, а в данном примере оригинал действительно очень низкого качества.

Теперь давайте разберемся, какие улучшения произошли в механизмах собственно распознавания.

Разработчики сообщают об очередном этапе совершенствования технологии ADRT, которая, напомню, анализирует и воссоздает логическую структуру документа. Декларируется, что она стала работать гораздо точнее, особенно с таблицами, списками, диаграммами. Продемонстрировать это адекватными примерами не так просто, но не невозможно. Вот, к примеру, результаты распознавания (с настройками по умолчанию) одной и той же страницы в Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу).

Читать еще:  Акустическая система Altec Lansing ADA880

Старая версия выделила и обработала только основной текстовый блок, возможно, из-за низкого качества оригинала сочтя остальные элементы «мусором». Новая, напротив, корректно опознала список и попыталась его воссоздать. Результат, правда, не идеален: то что распознаны не все маркеры можно, опять же, отнести на качество изображения, но программа, по-видимому, все же не поняла, что перед ней содержание, иначе не интерпретировала бы цифры как буквы. Тем не менее, прогресс налицо и на более качественных оригиналах подобных претензий, возможно, не было бы.

А вот как обрабатывается «неявная» таблица без разделительных линий — Abbyy FineReader 11 Professional (вверху) и Abbyy FineReader 12 Professional (внизу).

Хорошо видно, что старая версия, в отличие от новой, вообще не увидела здесь табличной структуры и ограничилась набором несвязанных между собой текстовых блоков. Не поленитесь щелкнуть на изображениях и сравнить результаты распознавания — у Abbyy FineReader 12 Professional он близок к идеалу.

К сожалению, так происходит не всегда и уже на соседних страницах Abbyy FineReader 12 Professional показал результаты, аналогичные Abbyy FineReader 11 Professional. Хотя именно ADRT должна была бы отследить одинаковые «шапки» и понять, что перед ней своеобразная перетекающая таблица.

Но все равно хорошо заметно, что обновленные алгоритмы обращают внимание на большее количество деталей чем ранее. В процессе тестирования Abbyy FineReader 12 Professional наблюдалась, к примеру, даже попытка интерпретировать как таблицу картинку с упорядоченным размещением на нем текстовой информации. Гораздо чаще также новая версия пытается воссоздавать различные диаграммы и схемы на основе фонового рисунка, а не из отдельных графических и текстовых блоков.

Есть еще несколько новинок, призванных повысить в Abbyy FineReader 12 Professional качество распознавания. Как известно, одной из предпосылок для этого является качество оригинала, особенно если он получен с помощью не сканера, а фотокамеры. Именно поэтому в свое время в FineReader появились средства предварительной обработки оригиналов. В новой версии их список расширен, добавились обрезка по краям страниц, осветление и выравнивание яркости фона, удаление цветных элементов. Последнее может пригодиться, к примеру, для обработки документов с печатями и штампами. Кроме того, теперь пользователь может подключать различные методы индивидуально.

Улучшена также языковая поддержка. Во-первых, появился русский алфавит с ударениями, во-вторых, декларируется повышение качества распознавания китайского, японского и корейского (до 20%), арабского (до 60%), иврита (до 10%) — достигнуто это, по-видимому, за счет совершенствования и дополнительной тренировки классификаторов.

Ну и наконец, один из наиболее животрепещущих вопросов для многих читателей: выросла ли скорость работы программы? Аргументированно ответить на этот вопрос, тем более с цифрами, не так-то просто — слишком много языков, каждый из которых имеет свои нюансы; слишком велико разнообразие оригиналов; слишком много неизвестных нам факторов влияния на работу алгоритмов. Поэтому даже сами разработчики достаточно сдержанно говорят о росте производительности Abbyy FineReader 12 Professional на 10-15%.

Подобные цифры обычно получаются по результатам обработки достаточно больших массивов документов и, соответственно, представляют собой нечто вроде «средней температуры по больнице». Поэтому полезно подробнее изучить какие-нибудь показательные частные случаи, к примеру, подобные двум следующим:

  • отсканированные в цвете с разрешением 300 dpi 10 страниц полноцветного буклета формата A4. Качество хорошее, языки русский и английский, макет сложный;
  • PDF с графическими изображениями 138 страниц книги, содержащей небольшое количество цветных и черно-белых иллюстраций, несколько таблиц. Качество низкое (начиная, по-видимому, со «слепой» печати в бумажной книге), языки украинский и русский, макет простой.

Оба документа распознавались в цветном режиме, а второй также и в черно-белом, что имело целью имитировать процесс подготовки электронной книги. Все настройки по умолчанию оставлялись без изменений, за исключением набора языков и, соответственно, режимов работы. В качестве тестового полигона использовался ПК с процессором i5-3450 и 8 ГБ памяти. Результаты представлены в следующей таблице:

Вектор модернизации: обзор обновленного ABBYY FineReader 12

Система оптического распознавания текстов FineReader в представлении не нуждается и широко известна во всем мире. За 21 год своего существования на рынке (первая версия программы увидела свет в 1993 году) флагманский продукт ABBYY сумел не только завоевать доверие более чем 20 миллионов пользователей, но и задать новые стандарты качества и направления развития решений класса Optical Character Recognition (OCR). Успело приложение закрепиться и в компьютерной терминологии, о чем свидетельствует прочно вошедшее в обиход и ставшее привычным для многих людей выражение «распознать с помощью FineReader». Система из года в год демонстрирует свою востребованность на рынке электронного документооборота, и нет ничего удивительного в том, что специалисты ABBYY стараются уделять максимум внимания продукту и совершенствованию задействованных в нем технологий.

ABBYY FineReader: смена поколений

В новой, двенадцатой по счету версии OCR-пакета разработчики добавили поддержку распознавания русского языка с ударениями и внесли ряд улучшений в движок системы, в результате чего удалось добиться увеличения скорости обработки документов, точности определения их структуры и распознавания символов. По результатам проведенных ABBYY тестов, FineReader 12 демонстрирует возросшую на 10-15% производительность по сравнению с предыдущей редакцией продукта, точнее воссоздает и сохраняет структуру таблиц (на 40%), диаграмм и графиков (на 33%) плюс лучше справляется с текстами, написанными на иврите, арабском, а также китайском, японском и корейском языках. Все это стало возможным благодаря доработкам адаптивной технологии распознавания документов ADRT (Adaptive Document Recognition Technology), играющей ключевую роль в процессе предварительного анализа изображений и последующей сборки обработанных данных в единое целое.

Не остался без внимания программистов компании ABBYY интерфейс приложения — он стал более «собранным», получил новые диалоги открытия и сохранения файлов, выполнен в единой с Windows 8 стилистике и адаптирован для устройств с сенсорными экранами. FineReader 12 получил не только укрупненные элементы управления, но и поддержку мультитач-жестов, позволяющих пользователям планшетных компьютеров быстро изменять масштаб открытого в программе документа, пролистывать страницы и выполнять прочие операции простым движением пальцев.

Пользовательский интерфейс ABBYY FineReader 12

Серьезно изменились механизмы обработки многостраничных документов и средства извлечения из них фрагментов текста. Операции, которые раньше могли выполняться достаточно длительное время и блокировали доступ пользователя к интерфейсу программы, в новой версии FineReader выполняются в фоновом режиме. Теперь можно просматривать документ, корректировать области распознавания, изменять порядок страниц, заходить в меню программы и выполнять прочие действия, не дожидаясь, пока OCR-система обработает загруженный файл.

В обновленном FineReader нет необходимости дожидаться распознавания всего документа целиком. Можно сразу перейти к нужной странице, выделить необходимую область (картинки, текст, таблицы) и нажать «Копировать». Программа автоматически распознает содержимое и сохранит его в буфер обмена.

В FineReader 12 реализована удобная работа с многостраничными документами и фрагментами текста

Для улучшения качества исходных изображений в FineReader 12 добавлены новые инструменты предобработки графических файлов. В программе появились средства автоматической обрезки фотографий с исправлением геометрических искажений, выравнивания яркости и цвета фона, а также удаления следов печатей и пометок на черно-белых изображениях. Возможности встроенного редактора изображений позволяют изменить разрешение обрабатываемых фотографий, устранить перекосы строк, поменять ориентацию страниц и многое другое, причем все эти настройки можно сделать автоматическими.

Улучшения в предобработке изображений

Усовершенствованиям подвергся также инструментарий для ручной корректировки результатов распознавания. Появилась возможность корректировать форматирование текста в окне «Проверка» — указывать тип шрифта, его размер и начертание, вставлять специальные символы из таблицы Unicode. Для удобства работы с большими объемами текста был добавлен переход между словами с помощью «горячих» клавиш клавиатуры.

Улучшения в окне «Проверка»

В настройках двенадцатой версии FineReader появилась возможность отключать генерацию таких элементов структуры, как колонтитулы, сноски, содержание, нумерованные списки. Деактивация распознавания определенных структурных составляющих позволяет ускорить перевод документов в электронный вид и избежать проблем при их последующей обработке сторонними продуктами (например, системами перевода или конверторами в e-book). Кроме того, пользователь может выбрать один из двух режимов распознавания — с приоритетом скорости или качества. Первый режим позволяет обрабатывать документы до 50% быстрее и рекомендуется для распознавания больших объемов документов с простым оформлением и хорошим качеством печати. Второй режим требует больше времени, но обеспечивает лучшее качество распознавания. Он пригоден для распознавания сложных документов, содержащих текст на цветном фоне, таблицы и прочие элементы оформления.

Настройки OCR-движка FineReader 12

Претерпели изменения в FineReader 12 также инструменты сохранения обработанных документов и их конвертирования в различные форматы. Из наиболее значимых новшеств можно отметить функцию создания файлов EPub, соответствующих стандартам спецификации 2.0.1 или 3.0, а также тесную интеграцию с Google Drive, Dropbox и SkyDrive — теперь перечисленные облачные хранилища отображаются в диалоге сохранения файлов и всегда находятся под рукой. При сохранении в PDF стало возможным использование новой технологии Precise Scan, улучшающей внешний вид отсканированного документа посредством сглаживания изображения символов и устраняющей эффект пикселизации при увеличении масштаба страницы. При конвертации документов в формат XLSX отныне доступны опции сохранения картинок, удаления форматирования текста, а также сохранения каждой страницы документа на отдельном листе Excel. Кроме того, в корпоративной версии FineReader отныне поддерживается экспорт непосредственно в SharePoint Online и Microsoft Office 365, что тоже положительным образом отражается на скорости работы с программой.

Улучшения при сохранении в PDF

Таковы основные отличительные особенности обновленной линейки FineReader, определенно заслуживающей внимания тех, кто часто занимается оцифровкой бумажных документов. Программа представлена на рынке в редакциях Professional и Corporate, распознает документы на 190 мировых языках, совместима со всеми популярными моделями сканеров и многофункциональных устройств (МФУ) и позволяет распознавать текст, полученный с фотоаппарата или встроенной камеры смартфона. Для корректной работы пакета необходим функционирующий под управлением Windows компьютер с тактовой частотой процессора 1 ГГц или выше и объемом оперативной памяти не менее одного гигабайта (для обладателей компьютеров Apple предусмотрен FineReader Pro для Mac).

Обновленная линейка OCR-решений уже доступна в онлайн-маркете store.abbyy.ru, торговых сетях партнеров компании и в виде ознакомительных версий на сайте ABBYY. Рекомендованная розничная цена коробочной версии FineReader 12 Professional составляет 4 990 рублей, электронной версии — 4 490 рублей. Стоимость Corporate-редакции продукта варьируется в зависимости от количества приобретаемых корпоративными заказчиками лицензий. Пользователи предыдущих сборок FineReader могут сэкономить, приобретя соответствующий набор обновлений. Также сберечь финансы можно, ограничившись годовой лицензией на продукт.

Читать еще:  ArmA 2 – приключения американцев в Черноруссии

И последнее. Прилагаемый к FineReader 12 Professional лицензионный договор допускает использование одной копии приложения на одном стационарном компьютере и одном портативном ПК при условии, что оба устройства принадлежат приобретшему продукт пользователю. Таким образом, программу можно установить и на рабочий ноутбук, и на домашний компьютер, не нарушая тем самым условий лицензионного соглашения с компанией ABBYY.

ABBYY сообщила о выходе FineReader 12 для ОС Windows

Поделитесь в соцсетях:

Компания ABBYY объявила о выпуске новой версии программного обеспечения ABBYY FineReader 12, предназначенного для распознавания текста, а также перевода изображений документов и любых типов PDF-файлов в электронные редактируемые форматы. Разработчик отмечает, что в новой версии под порядковым номером 12 появилась возможность мгновенной работы с текстом, в то время как распознавание выполняется в фоновом режиме. Иначе говоря, для того чтобы начать работать с файлом, теперь не нужно ждать пока FineReader обработает весь документ.

Кроме того, FineReader 12 лучше распознает деловые документы, работает быстрее и содержит инструменты, которые позволяют значительно улучшить качество изображения цифровых копий.

Новая версия программы умеет автоматически обрезать изображения по границам страниц, устранять желтый или серый фон, характерный для старых документов или фотографий, сделанных смартфоном, и удалять штампы и пометки ручкой, которые часто встречаются при работе с деловой документацией.

Благодаря внесенным в технологию ADRT (Adaptive Document Recognition Technology) изменениям распознавание таблиц улучшено на 40%, а диаграмм и графиков – на 33% (результаты внутреннего тестирования ABBYY). Разработчик также сообщает, что в режиме распознавания с приоритетом скорости документы обрабатываются на 40-50% быстрее, чем в режиме с приоритетом качества, используемом по умолчанию.

Новый ABBYY FineReader поддерживает 190 языков, причем для 48 из них, включая украинский, предусмотрена словарная поддержка. В последней версии также добавлено распознавание русского текста с ударениями.

ABBYY FineReader 12 является сертифицированным программным обеспечением для операционной системы Windows 8/8.1 и поддерживает базовые жесты для сенсорных экранов, такие как прокрутка и изменение масштаба.

Программное обеспечение поставляется в двух версиях – Professional и Corporate. Рекомендованная стоимость версии Professional составляет 969 грн. Продажи версии Corporate для корпоративных пользователей начнутся через несколько недель. Стоит отметить, что при обновлении с предыдущих версий программы предоставляется скидка в размере 40%.

Обзор и установка ABBYY FineReader 12 Professional – программа для сканирования и распознавания текста

Рассмотрение программы для сканирования и распознавания текста с изображения ABBYY FineReader 12 Professional, а также ее установка на операционную систему Windows 7.

Практически каждый пользователь компьютера сталкивался с такой задачей как сканирование, книги или журнала для последующего распознавания текста, или просто распознавание текста с изображения, например с фотографии. И, наверное, самой популярной (и, наверное, лучшей) из программ такого рода является продукт нашей Российской компании ABBYY, а именно программа FineReader.

На сегодняшний день последней версией этого продукта является FineReader 12, поэтому сегодня мы будем рассматривать особенности программы ABBYY FineReader 12 Professional, а также установим пробную версию этой программы на операционную систему Windows 7.

Построить нашу сегодняшнюю статью я хочу следующим образом, сначала мы поговорим об особенностях, преимуществах этой программы, затем разберем системные требования компьютера и ОС, на которую будет производиться установка данной программы, а также подробно рассмотрим установку FineReader 12 Professional и ограничения пробной версии. Так как программа популярная, поэтому ею практически каждый хоть раз, но пользовался, будь то у себя дома, будь то у знакомого или, например, у себя на работе, поэтому рассматривать, как именно можно сканировать и распознавать текст мы не будем, тем более что подробная инструкция есть на официальном сайте, да, кстати, скачать пробную версию можно также на официальном сайте, на данный момент страница программы следующая — http://www.abbyy.ru/download/finereader/

На этой странице можно скачать и инструкцию (Руководство пользователя) и пробную версию самой программы, для этого справа жмем скачать, затем нас попросят ввести адрес своей электронной почты, соответственно мы вводим (действующую) так как именно на нее придет ссылка для скачивания программы. После ввода email жмем «Отправить» потом выйдет сообщение «Спасибо за интерес к продуктам ABBYY, На указанный Вами e-mail был выслана ссылка для скачивания программы». И можете сразу проверять свой почтовый ящик, на который Вам придет сообщение со ссылкой на скачивание, Вы соответственно переходите по этой ссылке, и начинается скачивание продукта. Соответственно если Вам понравится это программа, то Вы ее можете приобрести здесь же сайте компании ABBYY. Теперь, где взять эту программу Вы знаете, давайте поговорим об ее особенностях и преимуществах.

Особенности и преимущества ABBYY FineReader 12 Professional

ABBYY FineReader – это программа для распознавания текста с изображения, без необходимости перепечатки всего текста, а также с возможностью сканирование документов со сканера.

В области создания такого рода программ компания ABBYY является мировым лидером и имеет не малое количество наград, что соответственно программе FineReader дает огромное преимущества перед конкурентами.

Еще отличительной особенностью программы FineReader является то, что она с высокой точностью распознает текст на изображениях, который в последствии практически не нужно форматировать, что, наверное, является главным ее преимуществом.

Компания ABBYY выпускает FineReader с поддержкой уже 190 языков мира, это также дает преимущества над всеми конкурентами, причем во всем мире. Она также поддерживает множество форматов для сохранения результатов распознавания, например, Word, Excel, OpenOffice и другие. Еще поддерживает огромное множество форматов изображения, с которых она может распознать текст, такие как: JPEG, BMP, PNG, TIFF, GIF, PDF, DJVU, PCX, DCX и другие.

Помимо всего прочего как по мне она имеет достаточно удобный, интуитивно понятный интерфейс, поэтому пользоваться этой программой сможет каждый, даже начинающий пользователь компьютера.

Как было сказано выше, сегодня доступна уже 12 версия, поэтому давайте поговорим о нововведениях этой версии, и ее преимуществах над предыдущей 11 версией.

Во-первых, конечно же, стоит отметить то, что в 11 версии была поддержка 188 языков, а теперь 190 (может, кто-то ждал момент, когда же локализуют FineReader под его язык:)).

Во-вторых, как заявляют разработчики, увеличилась скорость распознавания, к тому же добавлены такие функции как: распознавание страниц в фоновом режиме, мгновенное открытие многостраничных документов, автоматическое обрезание лишних частей изображения, удаление печатей и пометок на офисных документах для улучшения качества распознавания, добавлена возможность отключения таких элементов структуры как сноски, колонтитулы, оглавление, также добавлены инструменты для форматирования текста в окне проверки результатов.

Еще по заявлению разработчиков некоторая часть существующего функционала была улучшена и оптимизирована, в общем, изменений достаточно.

Ограничения пробной версии ABBYY FineReader 12 Professional

После скачивания пробной версии программы FineReader 12 (ее размер 351 мегабайт) и последующей ее установки на компьютер она будет действовать 30 дней, также она позволит Вам распознать всего 100 страниц и сохранить результаты за раз не более 3 страниц из документа. На самом деле Вам этого будет достаточно, чтобы оценить и понять достоинства этой программы.

И в случае если Вас устроит эта программа, Вы ее можете приобрести там же на официальном сайте и затем активировать ее. Если говорить о стоимости то ABBYY FineReader 12 Professional лицензируется в двух видах, это по подписке, т.е. годовая лицензия, и бессрочная лицензия, т.е. раз и навсегда.

На данный момент:

  • Годовая лицензия стоит — 1990 руб. (версия для скачивания).
  • Бессрочная лицензия стоит – 4990 руб. (коробочная версия) и 4490 руб. (версия для скачивания).

Какая подойдет именно Вам решать соответственно Вам, стоимость как видите не такая уж и высокая, тем более, если Вы активно что-то сканируете, фотографируете, а затем распознаете текст.

Системные требования для установки ABBYY FineReader 12 Professional

ABBYY FineReader 12 Professional поддерживает следующее операционные системы: Windows XP, Windows Vista, Windows 7, Windows 8/8.1, Windows Server 2003/2008/2008 R2/2012/2012 R2.

Как заявляют разработчики, для установки FineReader 12 Professional требуется компьютер с тактовой частотой процессора 1 ГГц или выше, объемом ОЗУ 1024 Мб и свободным местом на диске 850 Мб. Также рекомендовано Интернет соединение, для активации программного продукта и монитор с разрешением не менее 1280×1024 точек.

Установка ABBYY FineReader 12 Professional на ОС Windows 7

Шаг 1

После скачивания программы у Вас появится файл ABBYY_FineReader_12_Professional.exe, который мы соответственно и запускаем, например двойным кликом. В последствии у нас откроется окно для распаковки файлов установки, жмем «Install»

Шаг 2

Затем появится уже непосредственное меню для установки, если вы приобрели коробочную версию, то меню диска будет выглядеть точно так же. Жмем «Установка ABBYY FineReader 12»

Шаг 3

Затем необходимо выбрать язык программы, по умолчанию установщик определил правильно, поэтому сразу жмем «ОК»

Шаг 4

На следующем этапе необходимо прочитать и согласиться с условиями лицензионного соглашения, жмем «Я принимаю» и «Далее»

Шаг 5

Потом, так как мы начинающие пользователи, выбираем режим установки «Обычная» и жмем «Далее»

Шаг 6

На этом шаге нам предстоит выбрать так, сказать первоначальные настройки, я для примера, проставил галки следующем образом, и нажал «Установить»

И вот пошла установка

Шаг 7

Установка длится не долго примерно минут 5, и в заключении появится окно с сообщением о завершении установки, жмем «Готово»

Шаг 8

Все установка завершена, и теперь на рабочем столе появится ярлык для запуска программы, мы соответственно запускаем программу

Каждый раз при запуске, у пробной версии будет появляться окно с предложением приобрести лицензию, но мы пока тока пробуем, поэтому жмем «Запустить программу»

И вот, наконец, у нас откроется сама программа, и мы можем любоваться, как я говорил ранее, отличным интерфейсом.

На этом предлагаю закончить, еще раз напомню, что подробное руководство пользователя можете скачать на сайте компании ABBYY. Ну, все пока! Удачи!

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector