Я редактировал код диалога, чтобы он работал для моего проекта.
тогда я редактировал код диалога:
package dialog;
import edu.cmu.sphinx.api.Configuration;
import edu.cmu.sphinx.api.SpeechResult;
import edu.cmu.sphinx.api.StreamSpeechRecognizer;
import java.io.File;
import java.io.FileInputStream;
import java.io.InputStream;
public class EmployeeCode {
private static final String ACOUSTIC_MODEL = "resource:/edu/cmu/sphinx/models/en-us/en-us";
private static final String DICTIONARY_PATH = "models/language/TAR0779/0779.dic";
private static final String LANGUAGE_MODEL = "models/language/TAR0779/0779.lm";
public static void main(String[] args) throws Exception {
System.out.println("Loading models...");
Configuration configuration = new Configuration();
configuration.setAcousticModelPath(ACOUSTIC_MODEL);
configuration.setDictionaryPath(DICTIONARY_PATH);
configuration.setLanguageModelPath(LANGUAGE_MODEL);
StreamSpeechRecognizer lmRecognizer = new StreamSpeechRecognizer(configuration);
InputStream stream = new FileInputStream(new File("/Users/ha/NetBeansProjects/Dialog/WAV/sample1.wav"));
lmRecognizer.startRecognition(stream);
SpeechResult result;
while ((result = lmRecognizer.getResult()) != null)
{
System.out.println("You said: " + result.getHypothesis() + '\n');
} /* else
{
System.out.println("There is no stream.");
} */
lmRecognizer.stopRecognition();
}
}
после запуска выход:
run: Загрузка моделей... Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: * + NSN + 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: * + SPN + Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AA Apr 16, 2015 2: 04: 10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AE 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AO Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AW Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: B Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: CH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: D Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: DH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: EH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Группа: ER Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: EY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: F Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: G Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: HH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: IH Apr 16, 2015 2:04: 10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: IY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getU nit INFO: CI Unit: JH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: K 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: L Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: M 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: N 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: NG Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: OW 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Группа: OY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: P 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: R Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: S Apr 16, 2015 2:04:10 PM edu.cmu.sph inx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: SH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: T 16 апреля 2015 г. 2:04: 10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: TH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: UH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: UW 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: V Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: W Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist. acoustic.UnitManager getUnit INFO: CI Unit: Y Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: Z Apr 16, 2015 2:04:10 PM edu. cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: ZH Apr 16, 2015 2:04:11 PM edu.cmu.sphinx.frontend.AutoCepstrum initDataProcessors INFO: Ceps trum компонент автоматически настроен следующим образом: autoCepstrum {MelFrequencyFilterBank, Denoise, DiscreteCosineTransform2, Lifter} 16 апреля 2015 г. 2:04:11 edu.cmu.sphinx.linguist.dictionary.TextDictionary выделить INFO: Загрузка словаря из: файла: моделей/Язык /TAR0779/0779.dic 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.dictionary.TextDictionary выделить INFO: Загрузка словаря наполнителя из: jar: file: /Users/ha/Downloads/sphinx4-data -1.0-20150223.210601-7-sources.jar!/Edu/cmu/sphinx/models/en-us/en-us/noisedict 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Загрузка акустической модели с фиксированным состоянием из: jar: file: /Users/ha/Downloads/sphinx4-data-1.0-20150320.210601-7-sources.jar!/Edu/cmu/sphinx/models/en-us/en-us 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: пул означает записи: 16128 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Пул дисперсии Записи: 16128 16 апреля, 2015 2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool transition_matrices Записи: 42 апреля 16, 2015 2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate. Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianWeights logInfo INFO: гауссовские веса: mix_weights. Записи: 15378 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx. linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Context Independent Unit Записи: 42 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.HMMManager logInfo INFO: HMM Manager: 137095 hmms Apr 16, 2015 2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.TiedStateAcousticModel logInfo INFO: CompositeSenoneSequences: 0 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.linguist.acoustic.HMMPool dumpInfo INFO: Max CI Units 43 16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.linguist.acoustic.HMMPool dumpInfo INFO: Размер таблицы единиц 79507 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.util. TimerPool showTimesShortTitle INFO: # ----------------------------- Timers---------------------------------------- Apr 16, 2015 2:04:13 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Имя Count CurTime MinTime MaxTime AvgTime TotTime
16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
16 апреля 2015 г. 14:04:17 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: На этот раз Аудио: 0.95s Proc: 3.15s Скорость: 3.32 X в реальном времени 16 апреля 2015 г. 2:04:17 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Audio: 0.95s Proc: 3.15s 3.32 X в реальном времени 16 апреля 2015 г. 14:04:17 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 212.50 Mb Бесплатно: 70.12 Mb 16 апреля 2015 г. 2:04:17 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 142.38 Mb Средняя: 142.38 Mb Макс: 142.38 Mb Вы сказали: ЧТО ТАКОЕ
16 апреля 2015 г. 14:04:20 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: на этот раз Аудио: 0.96s Proc: 2.45s Скорость: 2.55 X в реальном времени 16 апреля 2015 г. 2:04:20 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Audio: 1.91s Proc: 5.60s 2.93 X в реальном времени Apr 16, 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 237.00 Mb Бесплатно: 141.00 Мб 16 апреля 2015 г. 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 96.00 Mb Средняя: 119.19 Mb Макс: 142.38 Mb Вы сказали: MANY MEN
16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: на этот раз Аудио: 1429182208.00s Proc: 1.19s Скорость: 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Audio: 1429182208.00s Proc: 6.79s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Всего: 247.50 Mb Бесплатно: 144.35 Mb Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 103.15 Mb Среднее: 113.84 Mb Макс: 142.38 Mb Вы сказали: MANY
Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # --------------------------- - Timers---------------------------------------- Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Имя Count CurTime MinTime MaxTime AvgTime TotTime
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Оценка 586 0.0000s 0.0000s 0.2270s 0.0031s 1.8140s
16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Prune 2043 0.0000s 0.0000s 0.0020s 0.0000s 0.0280s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Grow 2051 0.0000s 0.0000s 0.9200s 0.0025s 5.1330s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Frontend 298 0.0000s 0.0000s 0.2100s 0.0009s 0.2640s
16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Аудио: 1429182208.00s Proc: 6.79s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu.cmu. sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 247.50 Mb Бесплатно: 141.87 Mb Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 105.63 Mb Средняя: 111.79 Mb Макс.: 142.38 Mb BUILD SUCCESSFUL (общее время: 28 секунд)
Правильный результат должен быть: какова минимальная зарплата.
мой wav файл: https://www.mediafire.com/?khgyc9bhltz0z3b
Как повысить точность моего wav файла?
заранее спасибо
private static final String ACOUSTIC_MODEL = "models/acoustic/wsj";
Это неправильно, вам нужно использовать модель по умолчанию en-us
Я удалил много строк пропущенной фонетической транскрипции для слов в моем корпусе
Тело должно быть текстовым файлом, а не RTF файлом. Вам нужно попытаться снова создать языковую модель и словарь.