Emc captiva что это
EMC Captiva 7.0 трансформирует процесс корпоративного вода документов
Корпорация EMC представила EMC Captiva 7.0. — решение для преобразования бумажных документов, факсов и другой неструктурированной информации в цифровые данные, используемые корпоративными приложениями. Как сообщили CNews в компании, Captiva 7.0 представляет новые функции, такие как Captiva Designer, Captiva Desktop, а также усовершенствования Captiva Advanced Recognition.
По информации EMC, Captiva 7.0 повышает эффективность работы оператора благодаря новому настраиваемому, гибкому десктоп-клиенту для выполнения широкого круга задач. Captiva Desktop — это новый клиент для операторов ввода; его легко кастомизировать для любых типов задач ввода, включая анализ качества изображения, сборку документа, высокоскоростной ввод и индексирование данных, высокоскоростную коррекцию и валидацию данных. С помощью поддержки шаблонов форм, повторяющих изображение бумажного документа, Captiva Desktop оптимизирует рабочую среду оператора для ускорения индексации по контексту.
По словам разработчиков, Captiva Advanced Recognition используется в случае предъявления более сложных требований к решениями для корпоративного ввода. Он включает патентуемую технологию текстовой классификации, которая повышает показатель точности входящих документов. В отличие от других аналогичных продуктов, где правила классификации полностью определяются администратором при запуске проекта, Captiva автоматически изучает обрабатываемые документы, интеллектуально определяя слова и выражения для последующего использования при классификации документов. «Используя этот подход, получивший название Production Auto Learning, совместно с методом классификации на основе образов, Captiva сокращает время на разработку проекта и повышает эффективность работы оператора, обеспечивая повышение точности до 20% по сравнению с правилами и шаблонами, создаваемыми экспертами вручную», — утверждают в EMC.
Captiva Designer представляет собой новый унифицированный инструмент для ИТ-разработчиков и администраторов, созданный для упрощения настройки, развертывания и текущего сопровождения проектов корпоративного ввода. Модуль позволяет проектной команде легко создавать формы для ввода данных и правила валидации, обеспечивая возможность создания полей формы средствами графического проектирования, а также средствами проверки для повышения удобства использования индексирования по контексту и валидации.
По информации EMC, Captiva Designer обеспечивает экономию времени за счет быстрого определения профилей конфигурации (тип документов, обработка образов, распознавание и экспорт) для повторного использования в нескольких процессах и позволяет осуществить миграцию до уровня промышленно эксплуатируемой системы одним нажатием кнопки. Благодаря этому Captiva позволяет внедрять корпоративные конфигурации — включая серверные и клиентские настройки — за считанные минуты и даже секунды, утверждают разработчики.
Captiva оптимизирована для использования в «облаке» и доступна в EMC OnDemand, модели развертывания частного «облака» для приложений корпоративного класса.
«Captiva 7 действительно изменяет подход к корпоративному вводу документов. Она предоставляет заказчикам и партнерам решение, которое можно внедрить в гораздо более сжатые сроки, и являет собой гибкое и мощное решение по интеллектуальному вводу, — заявил Рохит Гай (Rohit Ghai), вице-президент по продуктам, Information Intelligence Group, корпорации EMC. — Повышая производительность до совершенно нового уровня, Captiva реализует современный подход к вводу документов, отвечающий актуальным требованиям организаций».
Набор облачных приложений EMC Captiva трансформирует возможности сканирования из веб-приложений благодаря своей широкой совместимости и простоте
Изготовители оборудования и разработчики ПО широко используют инструментарий EMC Captiva Cloud Toolkit после его появления в конце 2011 г. Крупные изготовители сканеров и МФУ, включая Avision, Brother, Canon, Epson, Fujitsu, HP, Kodak, Panasonic, Plustek и Visioneer, поставляют устройства, поддерживающие эти новые веб-приложения со встроенной функциональностью сканирования.
Captiva Cloud Toolkit обеспечивает широкую поддержку веб-браузеров и платформ веб-разработки, значительно снижая барьеры к присоединению физических документов к облачным и веб-приложениям и бизнес-процессам. Бизнес-приложения с веб-функциональностью, использующие этот инструментарий, работают со всеми стандартными платформами веб-браузеров, включая Windows Internet Explorer, Mozilla Firefox и Google Chrome, и не требуют дополнительного ПО для их запуска, такого как ActiveX, или встраиваемые модули браузеров. С помощью Captiva Cloud Toolkit разработчики могут быстро создавать рабочие бизнес-приложения с веб-функционалом встроенного сканирования, совместимые с существующими корпоративными веб-браузерами и платформами разработки, такими как HTML5, Microsoft Silverlight, JavaScript и Adobe Flash.
Разработчики, желающие оценить Captiva Cloud Toolkit, могут загрузить бесплатную пробную версию SDK по ссылке www.emc.com/cloudtoolkit.
Сэм Ёшида (Sam Yoshida), вице-президент по маркетингу, Business Imaging Solutions, Canon U.S.A
“Сочетание технологии высококачественных сканеров Canon imageFORMULA и инструментария EMC Captiva Cloud Toolkit предоставляет нашим заказчикам расширенное решение по оцифровке документов, позволяющее пользователям сканировать документы прямо из веб-приложений без загрузки какого-либо дополнительного ПО”.
Юки Учида (Yuki Uchida), вице-президент по развитию нового бизнеса, Ricoh Americas Corporation
“У нас давнее партнерство с EMC и большой опыт использования ее технологий сканирования Documentum и Captiva, и с этим новым инструментарием Captiva Cloud Toolkit мы делаем большой шаг вперед. Нас поразило, как он прост в применении, а также насколько обширный устройств, которые он поддерживает. Включая функционал веб-сканирования в облачную услугу управления документами Ricoh, DocumentMall на основе Documentum, мы можем предложить существенную новые возможности нашим заказчикам”.
Цитата представителя EMC:
Рохит Гай (Rohit Ghai), вице-президент по продуктам, EMC Information Intelligence Group
“EMC Captiva утвердила свое лидерство в оцифровке документов, предоставив заказчикам решения по оцифровке документов корпоративного класса и поставляя технологию оцифровки партнерам для ее расширения. С новым набором приложений Captiva мы предоставляем наибольшие удобства разработкам для встраивания функционала распределенного сканирования в бизнес-приложения. Мы рады предложить рынку этот ценный функционал”.
О промышленных системах массового ввода, обработки образов и распознавания текста EMC Captiva InputAccel и Kofax Capture
База данных состоит из непосредственно реляционной базы данных и директории на файловой системе, обычно расаширенной по сети, в которой хранятся артефакты пошаговой обработки документов.
Сервер производит маршрутизацию документов по шагам и модулям.
Неуправляемые модули работают в фоновом режиме без участия пользователя, например, модуль распознавания.
Клиентские модули, такие как ‘Сканирование’ или ‘Индексация’ — основной интерфейс пользователя системы.
Администрирование производится в модуле Batch Administrator для Kofax или Administrative console для Captiva.
Для обоих систем имеет место масштабирование, как вертикальное, так и горизонтальное. Сервисы могут быть запущены на одном компьютере или разнесены по разным с целью увеличить производительность, запущены многократно (в рамках доступных лицензий), именно поэтому на этой схеме Recognition service отделен от остальных сервисов, т.к. требуется больше всего ресурсов.
Качество входного образа может быть низким (минимальное типовое требование 300dpi, 1 bit per pexel – black&white), содержать артефакты, пятна, размытости и прочие шумы, поэтому обычно применяют предобработку, которая может значительно изменить качество изображения и повысить качество распознавания. EMC использует компоненты PixTools, Kofax применяет свою разработку VirtualReScan.
Исходное изображение до обработки
Изображение после обработки
Важный шаг – Классификация (определение принадлежности к типу и форме заранее настроенного документа). Определяться документ может либо по графическому содержимому, либо по наличию ключевых слов или смешанным образом. Также возможно произвести классификацию «в коде» — например, когда документ был получен через веб сервис через учетную систему и его тип заранее известен.
Для распознавания текста могут быть использованы разные движки распознавания, которые поставляются вместе с базовым комплектом с продуктами, однако в большинстве своем и там и там используется движок от компании Abbyy, т.к. он дает высокое качество распознавания русского печатного текста. Рукописный ввод распознаванию поддается с большим трудом, поэтому обычно такие документы, если они и есть, не распознаются, а на них индексируется ограниченное число полей оператором.
Важно заметить, что базовый комплект Captiva InputAccel, а также Kofax Capture позволяет индексировать только строго формальные документы, например банковские анкеты, где заранее нанесены поля для текста и при извлечении мы всегда будем достоверно знать где что искать. Для обработки слабо- и неструктурированных документов необходимо использовать дополнительные модули Captiva Dispatcher или Kofax Transformation Modules. При этом происходит полностраничное распознавание текста и в большинстве случаев используется принцип нахождения полей по регулярным выражениям в совокупности с положением «якорных» участков (якорные слова также могут обнаруживать по регулярным выражениям или жестким шаблонам). Эти же модули необходимы, если вы собираетесь обрабатывать табличные части документов, это, кстати, самый страшный сон разработчика и по возможности мы стараемся отказываться от таблиц.
Сравнение компонентов систем
Emc Captiva | Kofax | Что делает |
---|---|---|
InputAccel Server | Серверный процесс, управляет жизненным циклом процесса (батча) | |
KNS, не обязательно если весь процесс будет идти на одной машине, не требует IIS | Работа по сети | |
InputAccel | Kofax Capture | Базовые процессы, возможность распознавать только строго структурированные документы, т.е. строгие формы, анкеты и т.д. |
Dispatcher | KTM | Настройка шаблонов распознавания для полуструктурированных документов и нешаблонных текстов (вся российская фин.первичка) |
FreeForm Designer | Нет, встроено в KTM | Дизайнер для настройки сложных правил распознавания |
Administation Console, Web application, требует IIS | Нет, нет такой необходимости, встроено в Capture | Приложение для настройки сервера, управления процессами и батчами, лицензирования и т.п. |
eInput | KFS | Возможность работы через браузер |
Лицензирование у продуктов примерно одинаковое, все лицензии конкурирующие, т.е на количество активных подключений. Вы покупаете объем страниц в год, которые вы собираетесь обработать, такая лицензия бывает возобновляемая (счетчик сбрасывается раз в год) и невозобновляемая. Также необходимо дополнительно покупать лицензии на модули, например в поставке Captiva только одно место сканировщика и все остальные нужно приобрести отдельно.
На территории России в большинстве своем распространена система EMC Captiva, Kofax используется довольно редко.
Если вам будет интересно продолжение, то я могу подробно описать процесс разработки и настройки процессов и шаблонов распознавания на базе платформы EMC Captiva.
EMC Captiva Cloud Toolkit
31 июля 2012 года корпорация EMС объявила, что набор облачных приложений EMC Captiva трансформирует поддержку сканирования в корпоративной среде, предоставляя разработчикам простой способ расширения функциональности сканирования в веб-приложениях, и обеспечивает распознавание информации со всех аппаратов, сканирующих документы, и многофункциональных устройств (МФУ), поддерживающих стандарты ISIS и TWAIN.
Изготовители оборудования и разработчики ПО широко используют инструментарий EMC Captiva Cloud Toolkit после его появления в конце 2011 г. Крупные изготовители сканеров и МФУ, включая Avision, Brother, Canon, Epson, Fujitsu, HP, Kodak, Panasonic, Plustek и Visioneer, поставляют устройства, поддерживающие эти новые веб-приложения со встроенной функциональностью сканирования.
Captiva Cloud Toolkit обеспечивает широкую поддержку веб-браузеров и платформ веб-разработки, значительно снижая барьеры к присоединению физических документов к облачным и веб-приложениям и бизнес-процессам. Бизнес-приложения с веб-функциональностью, использующие этот инструментарий, работают со всеми стандартными платформами веб-браузеров, включая Windows Internet Explorer, Mozilla Firefox и Google Chrome, и не требуют дополнительного ПО для их запуска, такого как ActiveX, или встраиваемые модули браузеров. С помощью Captiva Cloud Toolkit разработчики могут быстро создавать рабочие бизнес-приложения с веб-функционалом встроенного сканирования, совместимые с существующими корпоративными веб-браузерами и платформами разработки, такими как HTML5, Microsoft Silverlight, JavaScript и Adobe Flash.
emc captiva cloud service
EMC Captiva — интеллектуальное программное обеспечение, делающее гораздо больше, чем просто сканирование и преобразование бумажных документов в электронный вид, пригодный для использования другими приложениями.
Помогая снизить количество ручных операций при работе с бумажными документами, Captiva минимизирует ошибки обработки, повышает точность данных и ускоряет бизнес-процессы, делая информацию мгновенно доступной в репозиториях контента, таких как как EM Documentum, EMC ApplicationXtender и Microsoft SharePoint.
Captiva дает возможность обрабатывать тысячи и даже миллионы документов в день и используется компаниями из различных отраслей по всему миру.
EMC Captiva входит в продуктовую линейку EMC Documentum.
Файл emc.captiva.webtoolkithost.exe из EMC Corporation является частью EMC Captiva Cloud Toolkit. emc.captiva.webtoolkithost.exe, расположенный в C:Program FilesEMC CaptivaCaptiva Cloud RuntimeEmc.Captiva.WebToolkitHost.exe с размером файла 13920 байт, версия файла 1.0.0.461, подпись 5f3ab9f57f2a6ef17a8a503df36c2854.
В вашей системе запущено много процессов, которые потребляют ресурсы процессора и памяти. Некоторые из этих процессов, кажется, являются вредоносными файлами, атакующими ваш компьютер.
Чтобы исправить критические ошибки emc.captiva.webtoolkithost.exe,скачайте программу Asmwsoft PC Optimizer и установите ее на своем компьютере
1- Очистите мусорные файлы, чтобы исправить emc.captiva.webtoolkithost.exe, которое перестало работать из-за ошибки.
2- Очистите реестр, чтобы исправить emc.captiva.webtoolkithost.exe, которое перестало работать из-за ошибки.
3- Настройка Windows для исправления критических ошибок emc.captiva.webtoolkithost.exe:
Всего голосов ( 77 ), 20 говорят, что не будут удалять, а 57 говорят, что удалят его с компьютера.
Управление бумажными документами обходится дорого, снижает производительность и приводит к напрасной трате времени и ресурсов. Интеллектуальный корпоративный ввод позволяет преодолеть эти проблемы. Решение EMC Captiva обеспечивает поддержку в масштабах всего предприятия и приносит реальную пользу для многих направлений бизнеса внутри организации. Оно позволяет установить контроль над огромным объемом и сложностью бумажных документов в ваше рабочем пространстве за счет автоматической классификации документов и извлечения данных, преобразования бумаг в управляемую электронную информацию и генерации аудиторского следа.
С помощью EMC Captiva вы достигаете более строгого соответствия требованиям регуляторов и стратегического управления, а также снижаете риски —
начиная с упрощения управления и контроля канцелярии и
до перемещения документов в Microsoft SharePoint и ускорения процессов,
которые по-прежнему зависят от бумажных документов.
Интеллектуальный корпоративный ввод позволяет вам уменьшить операционные затраты, повысить
точность информации и оптимизировать бизнес-процессы — предприятие станет более гибким и оперативным,
а вы сможете сосредоточиться на предоставлении услуг.
Далее
Stop paper from slowing down your business.
Capture, connect, and go.
Intelligent enterprise capture does more than transform your paper documents into digital information. It helps you lower costs and minimize risks, and connects you with the information you need to get your job done. It’s time to take control and accelerate your business. Go with EMC Captiva.
EMC Live Webcast
Looking for the latest techniques and technologies for managing paper and electronic records?
Recorded Webcast: Managing Paper and Electronic Records: A Strategy for Compliance