Компьютерный форум
Правила
Вернуться   Компьютерный форум > Форум программистов > Теория программирования > Информационные технологии
Перезагрузить страницу Распознование звука и речи
Ответ
 
Опции темы Опции просмотра
  (#1 (permalink)) Старый
iversonNV iversonNV вне форума
Новичок
 
Сообщений: 2
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Регистрация: 09.06.2006
По умолчанию Распознование звука и речи - 06.11.2008, 14:30

Вот только занялся темой АРР, а уже надо иметь что-то на руках.
Может кто-нибудь посоветовать, где можно посмотреть на исходники простой программы для распознования звука (речи было бы слишком круто).
Или посоветуйте с чего можно начать.
Ответить с цитированием
  (#2 (permalink)) Старый
Влад Влад вне форума
Специалист
 
Сообщений: 3,884
Сказал(а) спасибо: 1
Поблагодарили 25 раз(а) в 25 сообщениях
Регистрация: 27.06.2002
Адрес: Санкт-Петербург
По умолчанию 06.11.2008, 15:07

Можешь начать с чтения форума по речевым технологиям на Исходниках.ру. Там есть и ссылки на полезную литературу.


The difference between theory and practice is that in theory, there is no difference between theory and practice, but in practice, there is.
Ответить с цитированием
  (#3 (permalink)) Старый
Fuud Fuud вне форума
Member
 
Сообщений: 4,076
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Регистрация: 03.09.2004
По умолчанию 01.04.2009, 18:21

А начать с написания функции "корреляция" и матлаба - так как на нем уже многое есть.
Ответить с цитированием
  (#4 (permalink)) Старый
Evgenijj Evgenijj вне форума
Member
 
Сообщений: 16
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Регистрация: 03.05.2009
По умолчанию 23.05.2009, 13:12

1. Разложить звук на спектр в определенный момент времени.
2. Сделать спектрограмму в памяти.
3. Сравнить шаблон звука/фонемы со спектрограммой, сдвигая шаблон по времени и добиваясь максимального соответствия.
4. Фонемы перевести в алфавит.
5. Текст пропустить через словарь для исправления.
Ответить с цитированием
  (#5 (permalink)) Старый
Fuud Fuud вне форума
Member
 
Сообщений: 4,076
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Регистрация: 03.09.2004
По умолчанию 23.05.2009, 21:21

Что-то не верю я в третий пункт. Поскольку не известна амплитуда (нормировать?), все равно придется прогонять корреляцию. Зачем это делать на спектре?
Ответить с цитированием
Ads.
  (#6 (permalink)) Старый
Винитарх Винитарх вне форума
Специалист
 
Аватар для Винитарх
 
Сообщений: 7,963
Сказал(а) спасибо: 2
Поблагодарили 303 раз(а) в 303 сообщениях
Регистрация: 01.03.2003
Адрес: Краснодар
По умолчанию 20.12.2009, 00:10

Чё бред понаписали со спектрами какими-то? Теория давно известна:
Речь -> (Фонемы+Просодия) -> (Аллофоны+Мелодика+Ритмика+Энергетика) -> Орфортекст -> Смысл.
Трудность в том, что для русского языка существует 480 гласных аллофонов и 8880 согласных аллофонов. Поэтому напрямую решить задачу (вплоть до получения орфотекста) пока не получается - не хватает мощи у компов. Так что ждём ещё лет десять, имхо.
Ответить с цитированием
Ads
Ответ

Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Trackbacks are Вкл.
Pingbacks are Вкл.
Refbacks are Выкл.


Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
Автоматическое увеличение пауз в аудиозаписи речи Tolias Софт и программы 0 20.03.2012 21:35
Программа распознавания русской речи - Комбат denis47 Вопросы начинающих программистов 7 28.11.2010 12:05
Слышимость мозга(Распознавание без речи) Zmey_999 Новости 0 04.12.2008 23:53
Распознование символов без нейронов Azamat Информационные технологии 11 01.12.2007 14:12
Исходники для программы на распознование графических образов damian C++ Builder 2 14.11.2005 13:22
Модуль синтеза речи SpeachAPI-4 klim555 C++ Builder 1 07.09.2005 16:02
Алгоритмы кодирования речи imported_Rulezz Алгоритмы 1 16.12.2004 18:19
Алгоритм сжатия речи - АДИКМ Katti Алгоритмы 0 16.12.2004 17:22
Алгоритм распознования русской речи Shah Delphi 1 24.10.2004 07:25
Распознование текста с помощью нейронных сетей Andrey_bae Delphi 0 05.05.2004 12:17
Создание синтезатора речи Microsoft Speech API Cyber C++ Builder 1 19.10.2003 18:17
Написание синтезатора речи Cyber C++ Builder 3 21.06.2003 13:13



Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.
Нardforum.ru - компьютерный форум и программирование, форум программистов