ݺߣ

ݺߣShare a Scribd company logo
Експериментална система за разпознаване  на отделни думи в българския език   Дипломант: Лиляна Шаркова Фак. № ... Научен ръководител: Проф. дмн Георги Тотков Пловдивски университет „Паисий Хилендарски“ Факултет по математика и информатика Катедра „Компютърна информатика“
Цел на дипломната работа Целта на дипломната работа е да се проучи състоянието на съвременните системи за разпознаване на реч, да се изберат подходящи алгоритми и да се реализира експериментална система за разпознаване на отделни думи в българския език.
Решени са следните задачи: Проучване на състоянието на съвременните системи за разпознаване на реч; Избор на подходящи алгоритми ; Реализиране; Проектиране на структура на системата и програмиране; Експерименти; Анализ.
Преглед на проблемната област Алгоритми за разпознаване на реч Динамично програмиране –  Dynamic Time Warping ; Невронни мрежи; Скрити модели на Марков;
Скрит модел на Марков Модел на цели думи  О -   възможни наблюдения А - преходни вероятности { b i }  - наблюдавани вероятности π  – начална вероятност
Проектиране на системата Постановка на задачата последователност от входни данни; речник от  N  на брой думи. Задача на системата: Да разбере на коя дума принадлежат входните данни.
Проектиране на системата Избор на алгоритми за: извличане на характеристиките анализ на Фурие, прозорец на Хеминг,  MFCC моделите на думите СММ обучение на системата   Витерби сегментация разпознаване на дума Възходящ алгоритъм
Структура на системата. Обучение
Структура на системата. Разпознаване
Работа с  wav -файл 1. Запис на сигнал в  wav - файл 2. Отваряне на  wav -файл 3. Извличане на същинските данни от  wav - файла Библиотека  WaveLib
Извличане на спектрални характеристики Времето, за което сигнала се обработва се нарича прозорец, а данните в прозореца се наричат фрейм (кадър).
Предварителна обработка на сигнала Премахване на тишина; Прозорец на Хеминг: намаляване на грешките от произволното сегментиране на данни;  Повишава стабилността; Подобрява резултатите. Бързо преобразувание на Фурие;
Изместените по Мел скалата кепстрални коефициенти. Характеристични вектори БПФ Мел филтри Log[  ] Дискретна косинусова трансформация ИМКК
Обучение на модели Преди да започне да разпознава думи системата трябва да бъде обучена.  Алгоритъм на Баум-Уелч; Алгоритъм за сегментация по К - средна стойност (Витерби сегментация) -  изисква много по-малко изчисления.
Витерби сегментация Първоначален избор на клъстери  –  Алгоритъм за групиране по К-средна стойност.  Пресмятане на  π i  и  a ij , вектор на средната стойност и ковариантна матрица,  b j  за всяко състояние.
Витерби сегментация
Намираме оптималната поредица състояния - Алгоритъм на Витерби Ако има разместване на вектори с характеристики в Стъпка 3, използвайки новата поредица повтаряме действията от Стъпка 2; иначе, спираме. В текстов файл записваме  преизчислените  началните вероятности, преходните вероятности и средните стойности. Витерби сегментация
Разпознаване. Възходящ алгоритъм Предоставяме наблюдения на модела и той ни връща число; Резултатът е показател, за това доколко модела и данните от  wav -файла се доближават; За произнесена дума се смята тази с най-добър резултат.
Разпознаване. Експерименти и анализ. Експерименти  с множество от думи  {‘да’, ’не’}  : 6 записа на думата ‘ да ’   11 записа на думата  ‘ не ’ Резултат: Успешно са разпознати 9 от произнесените думи. Извод: За да може системата да дава по-точни резултати при разпознаване е необходимо е да бъдат предоставени по-големи множества от данни за обучение.
Благодаря за вниманието!
Ad

Recommended

POT
Proyecto Final Sociedad de la Información Campaña Web 2.0 UTPL 2009
Byron Ochoa
DOCX
Toby Cochran Resume New
Toby Cochran
PDF
Challenges of Agro-Ecological Soil Management Capitalizing on Soil Life and C...
FAO
PPTX
LEM Process Example
buckydodd
PDF
etourism2
Maziar Yari
PDF
Cytation 3 single sheet english
Maziar Yari
PPTX
PNPM-MP Sultra
yantonurdianto
PPTX
Linked In PowerPoint 2015
Tony Reynes
PPTX
Trabajo u imagen i
Alejandro Ajá
PPTX
dernismoBarretos
ribeiro_rodrigo
PPTX
Winphone
mirasbek
PDF
Series de Investigación Iberoamericana en Museología, III SIAM (Madrid, 2011...
Cristina Yáñez
PPTX
Korinthe studie 19
André Piet
PDF
Present continuous questions
Henrique Semeghini
PPT
Intro to ergonomics 2016
UHSUniversity
PDF
Processing and integrating soil map information from different regions into C...
FAO
PPTX
Ec442 tema: estadísticas de impuestos comparación con américa latina y europa
Presidencia de la República del Ecuador

More Related Content

Viewers also liked (10)

PPTX
Trabajo u imagen i
Alejandro Ajá
PPTX
dernismoBarretos
ribeiro_rodrigo
PPTX
Winphone
mirasbek
PDF
Series de Investigación Iberoamericana en Museología, III SIAM (Madrid, 2011...
Cristina Yáñez
PPTX
Korinthe studie 19
André Piet
PDF
Present continuous questions
Henrique Semeghini
PPT
Intro to ergonomics 2016
UHSUniversity
PDF
Processing and integrating soil map information from different regions into C...
FAO
PPTX
Ec442 tema: estadísticas de impuestos comparación con américa latina y europa
Presidencia de la República del Ecuador
Trabajo u imagen i
Alejandro Ajá
dernismoBarretos
ribeiro_rodrigo
Winphone
mirasbek
Series de Investigación Iberoamericana en Museología, III SIAM (Madrid, 2011...
Cristina Yáñez
Korinthe studie 19
André Piet
Present continuous questions
Henrique Semeghini
Intro to ergonomics 2016
UHSUniversity
Processing and integrating soil map information from different regions into C...
FAO
Ec442 tema: estadísticas de impuestos comparación con américa latina y europa
Presidencia de la República del Ecuador

Експериментална система за разпознаване на отделни думи в българския език

  • 1. Експериментална система за разпознаване на отделни думи в българския език Дипломант: Лиляна Шаркова Фак. № ... Научен ръководител: Проф. дмн Георги Тотков Пловдивски университет „Паисий Хилендарски“ Факултет по математика и информатика Катедра „Компютърна информатика“
  • 2. Цел на дипломната работа Целта на дипломната работа е да се проучи състоянието на съвременните системи за разпознаване на реч, да се изберат подходящи алгоритми и да се реализира експериментална система за разпознаване на отделни думи в българския език.
  • 3. Решени са следните задачи: Проучване на състоянието на съвременните системи за разпознаване на реч; Избор на подходящи алгоритми ; Реализиране; Проектиране на структура на системата и програмиране; Експерименти; Анализ.
  • 4. Преглед на проблемната област Алгоритми за разпознаване на реч Динамично програмиране – Dynamic Time Warping ; Невронни мрежи; Скрити модели на Марков;
  • 5. Скрит модел на Марков Модел на цели думи О - възможни наблюдения А - преходни вероятности { b i } - наблюдавани вероятности π – начална вероятност
  • 6. Проектиране на системата Постановка на задачата последователност от входни данни; речник от N на брой думи. Задача на системата: Да разбере на коя дума принадлежат входните данни.
  • 7. Проектиране на системата Избор на алгоритми за: извличане на характеристиките анализ на Фурие, прозорец на Хеминг, MFCC моделите на думите СММ обучение на системата Витерби сегментация разпознаване на дума Възходящ алгоритъм
  • 10. Работа с wav -файл 1. Запис на сигнал в wav - файл 2. Отваряне на wav -файл 3. Извличане на същинските данни от wav - файла Библиотека WaveLib
  • 11. Извличане на спектрални характеристики Времето, за което сигнала се обработва се нарича прозорец, а данните в прозореца се наричат фрейм (кадър).
  • 12. Предварителна обработка на сигнала Премахване на тишина; Прозорец на Хеминг: намаляване на грешките от произволното сегментиране на данни; Повишава стабилността; Подобрява резултатите. Бързо преобразувание на Фурие;
  • 13. Изместените по Мел скалата кепстрални коефициенти. Характеристични вектори БПФ Мел филтри Log[ ] Дискретна косинусова трансформация ИМКК
  • 14. Обучение на модели Преди да започне да разпознава думи системата трябва да бъде обучена. Алгоритъм на Баум-Уелч; Алгоритъм за сегментация по К - средна стойност (Витерби сегментация) - изисква много по-малко изчисления.
  • 15. Витерби сегментация Първоначален избор на клъстери – Алгоритъм за групиране по К-средна стойност. Пресмятане на π i и a ij , вектор на средната стойност и ковариантна матрица, b j за всяко състояние.
  • 17. Намираме оптималната поредица състояния - Алгоритъм на Витерби Ако има разместване на вектори с характеристики в Стъпка 3, използвайки новата поредица повтаряме действията от Стъпка 2; иначе, спираме. В текстов файл записваме преизчислените началните вероятности, преходните вероятности и средните стойности. Витерби сегментация
  • 18.
  • 19. Разпознаване. Възходящ алгоритъм Предоставяме наблюдения на модела и той ни връща число; Резултатът е показател, за това доколко модела и данните от wav -файла се доближават; За произнесена дума се смята тази с най-добър резултат.
  • 20. Разпознаване. Експерименти и анализ. Експерименти с множество от думи {‘да’, ’не’} : 6 записа на думата ‘ да ’ 11 записа на думата ‘ не ’ Резултат: Успешно са разпознати 9 от произнесените думи. Извод: За да може системата да дава по-точни резултати при разпознаване е необходимо е да бъдат предоставени по-големи множества от данни за обучение.