Нейросети «Яндекса» расшифруют архивные записи со сложной дореволюционной орфографией

На сервисе «Яндекса» «Поиск по архивам» можно расшифровать записи со сложной дореволюционной орфографией. В открытом доступе — свыше 2,5 млн страниц исторических документов с текстовой расшифровкой. Сервис справляется с расшифровкой за пару секунд. Об этом RB.RU рассказали в пресс-службе компании.

Нейросети «Яндекса» расшифруют архивные записи со сложной дореволюционной орфографией

Новый алгоритм, построенный на основе системы оптического распознавания символов, учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов.

Первым представленным в сервисе фондом стал Главархив Москвы — именно на его материалах разработчики обучали нейросеть. Теперь база пополнилась документами из архивов Оренбургской и Новгородской областей. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться. 

«Поиск по архивам» повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье.

Среди документов — метрические книги, исповедные ведомости, ревизские сказки с результатами переписи населения XVIII – начала XX веков. 

Записи можно найти по каталогу или через строку поиска. Есть фильтры по годам, архивам, фондам и описям. Рядом со сканом каждой страницы отображается построчная расшифровка, сделанная нейросетями «Яндекса». Если навести курсор на нужный фрагмент, он сразу подсветится и на цифровой копии.

RB.RU готовит большое обновление — и мы хотим учесть пожелания и интересы вас, наших читателей. Если вы готовы поделиться своим мнением об RB.RU, переходите по ссылке, чтобы заполнить короткую анкету.

Источник: rb.ru

Понравилась новость? Поделитесь с друзьями:
AdMarket News