Skip to content

Нейросеть для классификации текста (рукописный или печатный)

Notifications You must be signed in to change notification settings

thegreenshark/hackathon-neural

Repository files navigation

Нейросеть для классификации текста (рукописный или печатный)

Разработана в рамках хакатона ГУАП

Картинки с текстом

Картинки (сканы текстов) для обучения и тестирования необходимо загрузить отдельно:
https://disk.yandex.ru/d/Yu3wUYX7xdqXHQ
https://disk.yandex.ru/d/HSJXmD9HXelQUQ
https://disk.yandex.ru/d/Rz1uawh-DMEhhQ
https://disk.yandex.ru/d/nI2TnkqbSw2usA
Распаковать в data/imgs/

Использование нейросети

Обучение

  • В скрипте neural.py установить USE_SAVED_MODEL = False
  • По желанию поменять настройки NUMBER_OF_IMAGES_FOR_EVALUATE, CHUNK_SIZE, TEST_CHUNK_SIZE, X_RESOLUTION, Y_RESOLUTION
  • Запустить neural.py. Ждать.
  • После завершения обучения, модель будет сохранена в папку с проектом

Уже обученная модель

  • В скрипте neural.py установить USE_SAVED_MODEL = True
  • Значения X_RESOLUTION и Y_RESOLUTION должны совпадать с теми, что использовались при обучении модели
  • По желанию поменять TEST_CHUNK_SIZE
  • Запустить neural.py
  • Если происходит ошибка при загрузке модели, скачайте архив модели отдельно https://disk.yandex.ru/d/wq5tr0HpJ_NH_Q и распакуйте его в папку с проектом

Результаты работы нейросети

После обучения модели или загрузки уже обученной:

  • Если INTERACTIVE_MODE = True, тестовые картинки будут отображаться по одной, а в консоль будет выводиться результат классификации данной картинки
  • Если INTERACTIVE_MODE = False, на вход нейросети будут поданы все тестовые картинки. Будет создан файл testAnswers.csv, куда будут записаны результаты классификация тестовых картинок.

Вспомогательные скрипты

  • getSmallData.py берет из датасета некоторое количество картинок для тренировки (TRAIN_IMAGES_COUNT) и тестирования (TEST_IMAGES_COUNT). Картинки копируются в папку PATH_TO_SMALL_DATA. Это удобно при тестировании разных настрок модели нейросети, чтобы загрузка и обучение на маленьком датасете происходили быстрее

About

Нейросеть для классификации текста (рукописный или печатный)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •