Я хотел бы использовать API веб-речи в Google Chrome для распознавания речи, исходящей из HTML5 <video>
на веб-странице. Есть ли способ использовать Web Speech API с аудиовходом, поступающим откуда-то еще, кроме пользовательского микрофона?
На MDN (https://developer.mozilla.org/en-US/docs/Web/API/Web_Speech_API) говорится:
Доступ к распознаванию речи осуществляется через интерфейс SpeechRecognition, который обеспечивает возможность распознавания голосового контекста с аудиовхода (как правило, через службу распознавания речи по умолчанию устройства)
Но в нем четко не указано, может ли этот аудиовход поступать откуда-то еще, кроме пользовательского микрофона, или если он должен поступать исключительно из пользовательского микрофона.
Я собираюсь ответить самому себе. Может быть, это может помочь другим, у кого был такой же допрос.
После дальнейших исследований я увидел, что вопрос был заполнен проектом Chronium в 2014 году, чтобы сделать это возможным: проблема 408940. Он также был добавлен в статус платформы Chrome как предлагаемая функция.
К сожалению, реализация не была завершена, и функциональность была удалена. (Удалено в марте 2017 года, см. Выпуск 701229 в проекте Chronium).