Журнал для профессионалов. Новые технологии. Традиции. Опыт. Подписной индекс в каталоге Роспечати 81774. В каталоге почта России 63482.
Планы мероприятий
Документы
Дайджест
Новости
Новый ABBYY FineReader XIX распознаёт средневековые тексты
Компания ABBYY выпустила FineReader XIX, позволяющий распознавать тексты, датируемые XVII-XIX вв. Теперь создание электронных архивов исторических документов стало возможным.

Российская компания ABBYY объявляет о выходе FineReader XIX — OCR-системы, впервые сделавшей доступным распознавание документов, написанных на старых европейских языках, в том числе набранных готическими шрифтами.

Программа ABBYY FineReader XIX совмещает все возможности FineReader Corporate Edition с новой технологией распознавания старых европейских текстов. Программа призвана помогать там, где существует потребность в компьютерной обработке исторических документов и в создании современных архивов: в библиотеках, исторических фондах, в крупнейших университетах и исследовательских центрах по всему миру.

ABBYY создаёт первую систему распознавания старых европейских текстов.

ABBYY FineReader XIX обеспечивает распознавание старых европейских текстов, набранных старинными шрифтами, с учётом особенностей старинных алфавитов, вышедшей из употребления орфографии и морфологии.

Дополнительно к 177 языкам, используемым в системе FineReader, программа поддерживает 5 старых европейских языков: английский, немецкий, французский, испанский и итальянский. В арсенале системы — способность обрабатывать популярные в прошлом шрифты Fraktur и Schwabacher и большое количество готических («ломаных») шрифтов.

Во время работы над ABBYY FineReader XIX разработчики провели специальное обучение системы: более чем 2500 примеров было подобрано для каждого символа готического шрифта. Созданная технология распознавания была протестирована на 31000 страниц оригинального текста из различных источников. Специальные языковые модели для распознавания старых европейских языков были созданы совместно с партнёром ABBYY — новосибирской компанией ATAPY Software. В ходе разработки проанализировано 10 словарей и более 100 книг, изданных в период с 1750 по 1930 год. В систему добавлено 159 грамматических моделей, не использующихся в современных европейских языках. FineReader XIX учитывает особенности старых европейских алфавитов (с 1600 года) и умеет распознавать вышедшие из употребления символы, например, удлинённое «s» в ранних английских и французских алфавитах.

ABBYY FineReader XIX — инструмент историка и архивиста.

Понимание необходимости создания цифровых архивов уникальных исторических текстов, часто хранящихся в виде ветхих книг и документов, привело к созданию программы FineReader XIX. С её выпуском преобразование исторических материалов в электронный вид с сохранением возможности полнотекстового поиска стало реальностью. Это означает, что исторические документы и подлинники книг, сохраняя свою художественную ценность, становятся значительно доступнее в роли источников информации.

ABBYY FineReader XIX является одним из ключевых компонентов проекта «METAe». Основная цель этого проекта, который объединяет крупнейшие библиотеки Европы и софтверные компании, — создание ПО для архивации и систематизации книг и документов, представляющих историческую ценность. «Успешность «METAe» доказывает способность решить важную проблему в истории человечества — сохранить ветхие исторические документы и обеспечить их доступность для электронного архивирования и автоматического анализа. Мы всегда готовы участвовать в подобных проектах. Мы надеемся, что и нашим российским партнёрам FineReader XIX придется по душе», - сказал Юрий Корюкин, директор по корпоративным проектам ABBYY Россия.

«Я думаю, созданная компанией ABBYY технология распознавания старых европейских текстов — это важный шаг для развития гуманитарных наук, как на Западе, так и в России. Ведь наши фонды содержат большую коллекцию документов, книг, газет, журналов XVII–XIX вв. Работа с бумажными источниками такого «возраста» и их перепечатка — это очень трудоёмкий процесс. А с появлением возможности сканировать и оперативно распознавать исторические документы мы сможем применить к ним все современные инструменты систематизации, анализа и поиска информации» - прокомментировал выход FineReader XIX Михаил Дмитриевич Афанасьев, директор Государственной Публичной Исторической Библиотеки России.

Системные требования и возможности.

FineReader XIX поддерживает операционные системамы Windows 2003, XP, 2000 и NT 4.0. Система располагает всеми возможностями FineReader 7.0 Corporate Edition, такими как точное сохранение оформления, распознавание многоязычных документов на 177 языках, открытие и распознавание PDF-файлов, полнотекстовый поиск с учётом морфологии, автоматическая сетевая установка. Распознанный текст можно сохранить в различных форматах: Microsoft Word, Microsoft Excel, Text, Rich Text Format, Microsoft Word XML и другие.


--------------------------------------------------------------------------------

Группа компаний ABBYY
Российская компания ABBYY — один из ведущих мировых производителей программного обеспечения в области лингвистики, семантики, обработки текстов и систем оптического распознавания символов. Наиболее известные программные продукты ABBYY - система распознавания документов ABBYY FineReader и семейство электронных словарей ABBYY Lingvo. По результатам независимого опроса авторитетного российского журнала "Мир ПК", продукты ABBYY в 2004 году уже в седьмой раз завоевали награду "Лучший продукт года" в своих номинациях. Электронный словарь ABBYY Lingvo стал победителем в номинации «Электронные словари», а ABBYY FineReader был вновь признан лучшим продуктом в номинации «Системы оптического распознавания символов».

Продукты ABBYY:
Семейство электронных словарей ABBYY Lingvo состоит из трёх версий: многоплатформенные англо-русский и многоязычный словари, многоязычный словарь для начинающих изучение иностранных языков — ABBYY Lingvo Первый шаг. Программы линейки ABBYY FineReader позволяют автоматизировать ввод в компьютер печатных документов, текстов и таблиц. Система ABBYY FormReader предназначена для распознавания форм, анкет и бланков, заполненных печатными буквами от руки. Система ABBYY FineReader Банк автоматизирует ввод в компьютер платёжных документов. ABBYY PDF Transformer — простая и полезная утилита, позволяющая преобразовать любой PDF-документ в удобные и привычные форматы. ABBYY R&M Engine — инструментарий разработчика, позволяющий интегрировать полнотекстовой поиск и лингвистические технологии во внешние приложения. С момента своего выхода ABBYY FineReader завоевал более 100 наград (на октябрь 2004) в сравнительных тестах авторитетных международных компьютерных изданий.
Группа компаний ABBYY имеет штаб-квартиру — ABBYY Software House — в Москве, и офисы в разных странах мира: ABBYY Ukraine (Киев, Украина), ABBYY USA (Фримонт, Калифорния), ABBYY Europe (Мюнхен, Германия), ABBYY UK (Бишопс Стортфорд, Англия), ABBYY Россия (Москва). Для получения более полной информации посетите сайт компании по адресу www.ABBYY.ru
Тема номера

№ 8 (482)'25
Рубрики:
Рубрики:

Анонсы
Актуальные темы