📷 Переименование скриншотов страниц учебника
🏠 Readme → 🧭 agents.md → 📄 page-screenshot-renaming.md
🎯 Задача
В каталогах modules/pages/lesson N/ лежат PNG со скриншотами разворотов/страниц учебника. Имена вида Screenshot …
нужно заменить на {номер_страницы}.png, где номер — тот, что напечатан в колонтитуле на самой странице (часто
слева или справа внизу рядом с «ΕΛΛΗΝΙΚΑ Α’»).
⚠️ Ограничения автоматики
- Один только OCR (в т.ч. Tesseract по «нижней полосе» или по цветному прямоугольнику) часто ошибается: номер может
быть слева или справа, в тексте встречаются другие цифры (упражнения, адреса, номера автобусов), иногда
теряется цифра «1» в «14» / «16».
- Нельзя полагаться на порядок по времени в имени файла без проверки — страницы могут сниматься не подряд.
✅ Рекомендуемый порядок действий
- Зафиксировать соответствие «файл → номер страницы» надёжным способом: просмотр изображений (в т.ч. с увеличением
колонтитула) или проверенная таблица от человека.
- Проверить непрерывность по уроку там, где ожидается подряд идущий диапазон (например 14–22, 24–37): выбросы —
повод перепроверить сомнительные файлы.
- Переименовать в два этапа внутри каждой папки
lesson N, чтобы не затереть файлы при коллизии имён:
- сначала перенести все целевые файлы во временную папку с уникальными именами (например
0001.png, 0002.png…);
- затем раздать им имена
{номер}.png и удалить временную папку.
- Обновить ссылки в репозитории, если где-то использовались старые имена файлов (
grep по старым Screenshot или
по путям).
🧰 Вспомогательно
- Пример скрипта с явной таблицей соответствий и двухфазным
переносом: scripts/apply_page_renames.py (шаблон процесса; при новых скриншотах
таблицу нужно обновить вручную после проверки номеров).
🔁 Переходы
- 🧭 AGENTS.md — общие правила оформления и навигации по репо.