Реклама на сайте

Наши партнеры:

Ежедневный журнал Портал Credo.Ru Сайт Сергея Григорьянца

Agentura.Ru - Спецслужбы под контролем

© Agentura.Ru, 2000-2013 гг. Пишите нам  Пишите нам

Hепрерывное распознавание речи

Основной техникой для многих систем распознавания речи является статистический метод, называемый скрытым марковским моделированием (HMM). Такие системы разрабатываются в многих центрах и способны на "хорошее распознавание слов речи...не используя тренировку распознавания акустической речи" (87) Данный результат был получен тестированием системы на данных, полученных из мнистерства обороны США, содержащих записи тысяч телефонных переговоров. В масштабах ограниченного тестирования вероятность правильно обнаруженных 22 ключевых слов варьировалась от 45 до 60% при условии допущения 10 ложных положительных результатов на ключевой слово в час. Таким образом, если 1000 ключевых слов была использована во время часового переговора, будет по крайней мере 300 пропущенных ключевых слов и 220 ложных обнаружений.

Примерно в то же время (Февраль 1990) канадское агенство выдало компьютерной компании в Монреале первый из серии контрактов на разработку систем распознавания слов для (88) Целью проекта было разработать распознаватель слов, работающий в условиях шумных телефонных линий. Три года спустя, агенство сообщило, что "опыт показал нам, что безотносительно к условиям связи, распознавание слов остается сложной проблемой". Ключевая проблема, знакомая многим людям, состоит в том, что одно слово само по себе может быть легко неправильно воспринято, тогда как в непрерывном разговоре его значение выводится из контекста разговора. Агенство заключило в 1993 году, что "вероятно наиболее эффективным способом разработки надежной системы распознавания слов будет разработка систем распознавания непрерывного разговора с большим словарем".

Система непрерывного распознавания речи требует быстрого мощного процессора. Из-за отсутствия тренировки и нечеткости выделенного сигнала из перехваченных телефонных переговоров, скорее всего даже лучшие алгоритмы и быстрые процессоры, чем используемые сейчас, будут давать худшие результаты, чем получаемые в современных хорошо обученных коммерческих системах. Другой проблемой является то, что равспознавание речи является не совсем подходящим средством для более полезной цели - распознаванию тем.

В 1993 году после неудачной попытке создать распознаватель слов, канадское агенство предложило "обойти" проблему путем попытки разработать систему распознавания тем переговоров. Агенство сообщило, что "предварительные эксперименты, о которых сообщалось на встрече американских поставщиков для министерства обороны...указывают на то, что это позволит решить проблему". Они предложили разработать "действующую систему распознавания тем" к 1995 году. Однако попытка провалилась. Четыре года спустя, они все еще экспериментировали в попытках создать разпознаватель тем переговоров. (89) Однако, они получили контракт на дальнейшие исследования. Одним из предложенных методов был Н-грамм анализ, разработанный NSA.