Sphinx4: как повысить точность распознавания wav-файла в диалоговом окне

1

Я редактировал код диалога, чтобы он работал для моего проекта.

  1. Я создал текстовый файл с некоторыми из возможных предложений, которые будут использоваться в моей работе. Я добавил ссылку в разделе комментариев.
  2. Я выполнил шаги по http://cmusphinx.sourceforge.net/wiki/tutoriallm, чтобы создать мою модель языка с помощью веб-службы.
  3. тогда я редактировал код диалога:

    package dialog;
    
    import edu.cmu.sphinx.api.Configuration;
    import edu.cmu.sphinx.api.SpeechResult;
    import edu.cmu.sphinx.api.StreamSpeechRecognizer;
    import java.io.File;
    import java.io.FileInputStream;
    import java.io.InputStream;
    
    public class EmployeeCode {
    
    private static final String ACOUSTIC_MODEL = "resource:/edu/cmu/sphinx/models/en-us/en-us";
    private static final String DICTIONARY_PATH = "models/language/TAR0779/0779.dic";
    private static final String LANGUAGE_MODEL = "models/language/TAR0779/0779.lm";
    
    
    public static void main(String[] args) throws Exception {
    
        System.out.println("Loading models...");
    
        Configuration configuration = new Configuration();
        configuration.setAcousticModelPath(ACOUSTIC_MODEL);
        configuration.setDictionaryPath(DICTIONARY_PATH);
        configuration.setLanguageModelPath(LANGUAGE_MODEL);
    
        StreamSpeechRecognizer lmRecognizer = new StreamSpeechRecognizer(configuration);
    
        InputStream stream = new FileInputStream(new File("/Users/ha/NetBeansProjects/Dialog/WAV/sample1.wav"));
    
        lmRecognizer.startRecognition(stream);
        SpeechResult result;    
    
        while ((result = lmRecognizer.getResult()) != null)
        {
            System.out.println("You said: " + result.getHypothesis() + '\n');
        } /* else
        {
            System.out.println("There is no stream.");  
        } */
    
        lmRecognizer.stopRecognition();
    
    }
    

    }

  4. после запуска выход:

    run: Загрузка моделей... Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: * + NSN + 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: * + SPN + Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AA Apr 16, 2015 2: 04: 10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AE 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: AH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AO Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AW Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: AY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: B Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: CH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: D Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: DH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: EH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Группа: ER Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: EY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: F Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: G Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: HH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: IH Apr 16, 2015 2:04: 10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: IY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getU nit INFO: CI Unit: JH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: K 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: L Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: M 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: N 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: NG Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: OW 16 апреля 2015 г. 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Группа: OY Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: P 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: R Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: S Apr 16, 2015 2:04:10 PM edu.cmu.sph inx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: SH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: T 16 апреля 2015 г. 2:04: 10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: TH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Единица: UH Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: UW 16 апреля 2015 г. 2:04:10 edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: V Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: W Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist. acoustic.UnitManager getUnit INFO: CI Unit: Y Apr 16, 2015 2:04:10 PM edu.cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: Z Apr 16, 2015 2:04:10 PM edu. cmu.sphinx.linguist.acoustic.UnitManager getUnit INFO: CI Unit: ZH Apr 16, 2015 2:04:11 PM edu.cmu.sphinx.frontend.AutoCepstrum initDataProcessors INFO: Ceps trum компонент автоматически настроен следующим образом: autoCepstrum {MelFrequencyFilterBank, Denoise, DiscreteCosineTransform2, Lifter} 16 апреля 2015 г. 2:04:11 edu.cmu.sphinx.linguist.dictionary.TextDictionary выделить INFO: Загрузка словаря из: файла: моделей/Язык /TAR0779/0779.dic 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.dictionary.TextDictionary выделить INFO: Загрузка словаря наполнителя из: jar: file: /Users/ha/Downloads/sphinx4-data -1.0-20150223.210601-7-sources.jar!/Edu/cmu/sphinx/models/en-us/en-us/noisedict 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Загрузка акустической модели с фиксированным состоянием из: jar: file: /Users/ha/Downloads/sphinx4-data-1.0-20150320.210601-7-sources.jar!/Edu/cmu/sphinx/models/en-us/en-us 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: пул означает записи: 16128 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Пул дисперсии Записи: 16128 16 апреля, 2015 2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool transition_matrices Записи: 42 апреля 16, 2015 2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate. Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.GaussianWeights logInfo INFO: гауссовские веса: mix_weights. Записи: 15378 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.Pool logInfo INFO: Pool senones Записи: 5126 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx. linguist.acoustic.tiedstate.Sphinx3Loader logInfo INFO: Context Independent Unit Записи: 42 16 апреля 2015 г. 2:04:12 edu.cmu.sphinx.linguist.acoustic.tiedstate.HMMManager logInfo INFO: HMM Manager: 137095 hmms Apr 16, 2015 2:04:12 PM edu.cmu.sphinx.linguist.acoustic.tiedstate.TiedStateAcousticModel logInfo INFO: CompositeSenoneSequences: 0 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.linguist.acoustic.HMMPool dumpInfo INFO: Max CI Units 43 16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.linguist.acoustic.HMMPool dumpInfo INFO: Размер таблицы единиц 79507 16 апреля 2015 г. 2:04:13 edu.cmu.sphinx.util. TimerPool showTimesShortTitle INFO: # ----------------------------- Timers---------------------------------------- Apr 16, 2015 2:04:13 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Имя Count CurTime MinTime MaxTime AvgTime TotTime
    16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
    16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
    16 апреля 2015 г. 14:04:13 edu.cmu.sphinx.util.Timer showTimesShort INFO: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
    16 апреля 2015 г. 14:04:17 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: На этот раз Аудио: 0.95s Proc: 3.15s Скорость: 3.32 X в реальном времени 16 апреля 2015 г. 2:04:17 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Audio: 0.95s Proc: 3.15s 3.32 X в реальном времени 16 апреля 2015 г. 14:04:17 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 212.50 Mb Бесплатно: 70.12 Mb 16 апреля 2015 г. 2:04:17 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 142.38 Mb Средняя: 142.38 Mb Макс: 142.38 Mb Вы сказали: ЧТО ТАКОЕ

    16 апреля 2015 г. 14:04:20 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: на этот раз Аудио: 0.96s Proc: 2.45s Скорость: 2.55 X в реальном времени 16 апреля 2015 г. 2:04:20 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Audio: 1.91s Proc: 5.60s 2.93 X в реальном времени Apr 16, 2015 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 237.00 Mb Бесплатно: 141.00 Мб 16 апреля 2015 г. 2:04:20 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 96.00 Mb Средняя: 119.19 Mb Макс: 142.38 Mb Вы сказали: MANY MEN

    16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioUsage INFO: на этот раз Аудио: 1429182208.00s Proc: 1.19s Скорость: 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu. cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Audio: 1429182208.00s Proc: 6.79s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Всего: 247.50 Mb Бесплатно: 144.35 Mb Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 103.15 Mb Среднее: 113.84 Mb Макс: 142.38 Mb Вы сказали: MANY

    Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # --------------------------- - Timers---------------------------------------- Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.util.TimerPool showTimesShortTitle INFO: # Имя Count CurTime MinTime MaxTime AvgTime TotTime
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить AM 1 3.0410s 3.0410s 3.0410s 3.0410s 3.0410s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Загрузить словарь 1 0.0520s 0.0520s 0.0520s 0.0520s 0.0520s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Оценка 586 0.0000s 0.0000s 0.2270s 0.0031s 1.8140s
    16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Prune 2043 0.0000s 0.0000s 0.0020s 0.0000s 0.0280s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Grow 2051 0.0000s 0.0000s 0.9200s 0.0025s 5.1330s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Frontend 298 0.0000s 0.0000s 0.2100s 0.0009s 0.2640s
    16 апреля 2015 г. 2:04:21 edu.cmu.sphinx.util.Timer showTimesShort INFO: Компиляция 1 1.8290s 1.8290s 1.8290s 1.8290s 1.8290s
    16 апреля 2015 г. 14:04:21 edu.cmu.sphinx.instrumentation.SpeedTracker showAudioSummary INFO: Total Time Аудио: 1429182208.00s Proc: 6.79s 0.00 X в реальном времени 16 апреля 2015 г. 2:04:21 edu.cmu. sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Mem Total: 247.50 Mb Бесплатно: 141.87 Mb Apr 16, 2015 2:04:21 PM edu.cmu.sphinx.instrumentation.MemoryTracker calculateMemoryUsage INFO: Используется: Это: 105.63 Mb Средняя: 111.79 Mb Макс.: 142.38 Mb BUILD SUCCESSFUL (общее время: 28 секунд)

Правильный результат должен быть: какова минимальная зарплата.

мой wav файл: https://www.mediafire.com/?khgyc9bhltz0z3b

Как повысить точность моего wav файла?

заранее спасибо

  • 0
    вот мой корпус: mediafire.com/?boil55ly65551k6
  • 0
    вот мой новый корпус: mediafire.com/?boil55ly65551k6
Показать ещё 1 комментарий
Теги:
netbeans
wav
sphinx4

1 ответ

1

private static final String ACOUSTIC_MODEL = "models/acoustic/wsj";

Это неправильно, вам нужно использовать модель по умолчанию en-us

Я удалил много строк пропущенной фонетической транскрипции для слов в моем корпусе

Тело должно быть текстовым файлом, а не RTF файлом. Вам нужно попытаться снова создать языковую модель и словарь.

  • 0
    Спасибо за ваш ответ @ Николай-Шмырев. Я отредактировал код в моем вопросе, и вывод изменился тоже. не могли бы вы мне помочь?
  • 0
    Я понятия не имею, что вы там испортили, я предлагаю вам снова начать с чистого демо и внести свои изменения.
Показать ещё 18 комментариев

Ещё вопросы

Сообщество Overcoder
Наверх
Меню