Когда страницы шепчут: искусственный слух для старых дневников
Наталья медленно переворачивает лист: края бумаги хрупкие, чернила местами выцвели, в одном углу — следы от чая. Перед ней — стопка дореволюционных краеведческих дневников, записанных руками людей с разным образованием, разной аккуратностью и с собственными орфографическими привычками. Её задача кажется простой — оцифровать и распознать текст — но в каждом слове скрыт целый пласт истории: диалектные окончания, забытые топонимы, сокращения, пометки на полях, исправления авторской руки. Наталья понимает, что стандартная OCR-цепочка здесь бессильна: она стирает нюансы, «исправляет» орфографию, теряет слои…