Нейросети "Яндекса" расшифровали рукописные архивы Московской области на 300 тыс. страниц
Метрические книги на 300 тыс. страниц из Центрального государственного архива Московской области (документы XVIII - начала XX веков) были расшифрованы нейронными сетями "Яндекса", сообщили в пресс-службе IT-компании в среду.
Документы были обработаны алгоритмом на базе системы оптического распознавания символов. Благодаря применяемым методам рукописи преобразовываются в печатный текст, и в базе можно находить отдельные слова: такие, как упоминания фамилий и населенных пунктов.
За два месяца с запуска сервиса "Поиск по архивам" в январе 2023 года количество расшифрованных нейросетями страниц увеличилось вдвое, с 2,5 до 5 млн. Среди прочего в базу вошли материалы из Главархива Москвы (700 тыс. страниц) и впервые опубликованные в открытом доступе описи из архива Республики Мордовия.
Нейросети "Яндекса" расшифровали рукописные архивы Московской области на 300 тыс. страниц