Разработана в рамках хакатона ГУАП
Картинки (сканы текстов) для обучения и тестирования необходимо загрузить отдельно:
https://disk.yandex.ru/d/Yu3wUYX7xdqXHQ
https://disk.yandex.ru/d/HSJXmD9HXelQUQ
https://disk.yandex.ru/d/Rz1uawh-DMEhhQ
https://disk.yandex.ru/d/nI2TnkqbSw2usA
Распаковать в data/imgs/
- В скрипте
neural.pyустановитьUSE_SAVED_MODEL = False - По желанию поменять настройки
NUMBER_OF_IMAGES_FOR_EVALUATE,CHUNK_SIZE,TEST_CHUNK_SIZE,X_RESOLUTION,Y_RESOLUTION - Запустить
neural.py. Ждать. - После завершения обучения, модель будет сохранена в папку с проектом
- В скрипте
neural.pyустановитьUSE_SAVED_MODEL = True - Значения
X_RESOLUTIONиY_RESOLUTIONдолжны совпадать с теми, что использовались при обучении модели - По желанию поменять
TEST_CHUNK_SIZE - Запустить
neural.py - Если происходит ошибка при загрузке модели, скачайте архив модели отдельно https://disk.yandex.ru/d/wq5tr0HpJ_NH_Q и распакуйте его в папку с проектом
После обучения модели или загрузки уже обученной:
- Если
INTERACTIVE_MODE = True, тестовые картинки будут отображаться по одной, а в консоль будет выводиться результат классификации данной картинки - Если
INTERACTIVE_MODE = False, на вход нейросети будут поданы все тестовые картинки. Будет создан файлtestAnswers.csv, куда будут записаны результаты классификация тестовых картинок.
getSmallData.pyберет из датасета некоторое количество картинок для тренировки (TRAIN_IMAGES_COUNT) и тестирования (TEST_IMAGES_COUNT). Картинки копируются в папкуPATH_TO_SMALL_DATA. Это удобно при тестировании разных настрок модели нейросети, чтобы загрузка и обучение на маленьком датасете происходили быстрее