Ru En
Нейросети "Яндекса" расшифровали рукописные архивы Московской области на 300 тыс. страниц

Нейросети "Яндекса" расшифровали рукописные архивы Московской области на 300 тыс. страниц

30.03.2023

Метрические книги на 300 тыс. страниц из Центрального государственного архива Московской области (документы XVIII - начала XX веков) были расшифрованы нейронными сетями "Яндекса", сообщили в пресс-службе IT-компании в среду.

Документы были обработаны алгоритмом на базе системы оптического распознавания символов. Благодаря применяемым методам рукописи преобразовываются в печатный текст, и в базе можно находить отдельные слова: такие, как упоминания фамилий и населенных пунктов.

За два месяца с запуска сервиса "Поиск по архивам" в январе 2023 года количество расшифрованных нейросетями страниц увеличилось вдвое, с 2,5 до 5 млн. Среди прочего в базу вошли материалы из Главархива Москвы (700 тыс. страниц) и впервые опубликованные в открытом доступе описи из архива Республики Мордовия.


Нейросети "Яндекса" расшифровали рукописные архивы Московской области на 300 тыс. страниц