18.03.2025

Надежное распознавание речи посредством широкомасштабного слабого контроля

Авторы
Алек Рэдфорд, Чон Ук Ким, Тао Сюй, Грег Брокман, Кристин Макливи, Илья Суцкевер
Дата публикации
2023/7/3
Конференция
Международная конференция по машинному обучению
Страницы
28492-28518
Издатель
ПМЛР
Описание
Мы изучаем возможности систем обработки речи, обученных просто предсказывать большие объемы транскрипций аудио в Интернете. При масштабировании до 680 000 часов многоязычного и многозадачного надзора полученные модели хорошо обобщаются до стандартных контрольных показателей и часто конкурентоспособны с предыдущими полностью контролируемыми результатами без необходимости какой-либо специфической тонкой настройки набора данных. По сравнению с людьми модели приближаются к их точности и надежности. Мы выпускаем модели и код вывода, которые послужат основой для дальнейшей работы над надежной обработкой речи.

https://www.online-documents.ru/?attachment_id=6077

radford23a

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.