Whisper.cpp: полный бенчмарк производительности на русском языке для устаревшего оборудования (Intel Core i5-460M) #3753
di-halt
started this conversation in
Show and tell
Replies: 1 comment
-
|
You should include large-v2, I think large-v2 is better then large-v3-turbo/large-v3 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Uh oh!
There was an error while loading. Please reload this page.
-
Whisper.cpp: полный бенчмарк производительности на русском языке для устаревшего оборудования (Intel Core i5-460M)
1. Введение
В этом отчёте представлены результаты тестирования
whisper.cppна русскоязычных аудиофайлах с использованием процессора Intel Core i5-460M (Arrandale) 2010 года выпуска. Цель — определить оптимальную конфигурацию модели и квантования для транскрибации русского языка на старом оборудовании.2. Окружение для тестирования
whisper.cpp(сборка с-march=native -O3)3. Тестовые аудиофайлы и эталонные тексты
tz_easy.wavtz_medi.wavtz_hard.wav4. Результаты тестирования (от лучшего качества к худшему)
4.1. Файл
tz_easy.wav(чистая речь)GGML_ASSERT, несовместим.4.2. Файл
tz_medi.wav(речь + тихая музыка)4.3. Файл
tz_hard.wav(песня)5. Иерархия квантования по скорости (от быстрого к медленному)
На основе всех тестов (включая
jfk.wav,tz_easy,tz_medi,tz_hard) выстроена чёткая иерархия:q4_0q4_0лучше.q4_0, качество то же. Не нужен.base.6. Финальные рекомендации для русского языка на i5-460M
tiny-mlq4_0base-mlq4_0large-v3-turboq4_0large-v3-ruq4_07. Выводы
q4_0— единственный рекомендуемый формат квантования для старых CPU. Он быстрее и компактнее всех аналогов при том же качестве.large-v3-ruдаёт эталонное качество, но очень медленный.large-v3-turbo— оптимальный выбор для сложных/музыкальных файлов на русском языке.q5_0,q5_1,q2_k— не использовать никогда на данном оборудовании.Beta Was this translation helpful? Give feedback.
All reactions