ݺߣ

ݺߣShare a Scribd company logo
ОТ РАСПОЗНАВАНИЯ РЕЧИ
К ПОНИМАНИЮ СКАЗАННОГО
2
От распознавания речи
к пониманию сказанного
Как компьютер
распознает речь
Что значит компьютерное
понимание речи, и в чем
это выражается
Почему без понимания
нет качественного
распознавания
Преимущества
технологии ЦРТ
3
≈ 1800 – Семен Николаевич Корсаков
Изобрел механические устройства, работающие на
основе перфокарт, способные выполнять простейшие
задачи информационного поиска и классификации.
≈ 1900 – Андрей Андреевич Марков
Разработал теорию стохастических дискретных
процессов, теперь известных как «Марковские цепи».
200 лет машинному обучению?
4
Гипотеза Ньюэлла-Саймона
Человек действует осмысленно, когда он выполняет
символьные вычисления и логические операции. К
таким процедурам способен и компьютер – значит, ИИ
возможен.
Противники ИИ
Если вы моделируете дождь, это не значит, что вы
промокнете. ИИ — это лишь модель, которая может
выполнять некоторые задачи лучше, чем человек.
Для настоящего ИИ необходима цивилизация машин.
Возможен ли искусственный
интеллект?
5
𝒇 𝒕 =
𝒂 𝟎
𝟐
+ ෍
𝒏=𝟏
∞
(𝒂 𝒏 𝐜𝐨𝐬 𝒏𝝎𝒕 + 𝒃 𝒏 𝐬𝐢𝐧 𝒏𝝎𝒕)
Речь — физический сигнал
6
Акустическая модель
7
МАМА МЫЛА .?.
МАМА МЫЛА .?.
МАМА МЫЛА .?.
50% … РАМУ
40% … ПОСУДУ
10% … ЛАМУ
Особенности языковой модели русского языка
 свободный порядок слов — сложно построить статистические
модели языка, основанные на анализе частотности совместного
употребления слов
 большое количество словоформ — существенно увеличивается
размер словаря, что приводит к увеличению количества ошибок
распознавания
Языковая модель
Языковая
модель
8
Акустические
признаки
Акустические
модели
Декодер
Языковые
модели
Звук
Текст
Система распознавания речи
9
Формы компьютерного понимания речи
Выполнение команд
Ранжирование документов
Извлечение знаний:
 аннотирование
 классификация
 кластеризация
 извлечение понятий и установление связей
……
Компьютерное понимание речи
10
Как понимание влияет на распознавание
Знание темы повышает точность распознавания,
помогает компьютеру увереннее принимать решение в
пользу той или иной гипотезы
Снятие омонимий различного рода, например:
луг – лук, молод – молот, три (числ.) – три (гл.)
Компьютерное понимание речи
11
 Технология ориентирована на распознавание спонтанной
слитной речи
 Используются алгоритмы предобработки речевого
сигнала: нормирование спектра, шумоочистка и пр.
 Распознавание речи в телефонном канале, в офисном
шуме
 Учет региональных акцентов и диалектов русского языка
 Утилиты для самостоятельного обучения языковой
модели на предметную область заказчика
 Опыт распознавания речи в различных сферах:
телекоммуникации, медицина, безопасность, СМИ
Распознавание речи ЦРТ
12
Александр Белозерчик
Руководитель отдела развития продуктов ЦРТ
a.belozerchick@speechpro.com
СПАСИБО ЗА ВНИМАНИЕ!

More Related Content

От распознавания речи к пониманию сказанного

  • 1. ОТ РАСПОЗНАВАНИЯ РЕЧИ К ПОНИМАНИЮ СКАЗАННОГО
  • 2. 2 От распознавания речи к пониманию сказанного Как компьютер распознает речь Что значит компьютерное понимание речи, и в чем это выражается Почему без понимания нет качественного распознавания Преимущества технологии ЦРТ
  • 3. 3 ≈ 1800 – Семен Николаевич Корсаков Изобрел механические устройства, работающие на основе перфокарт, способные выполнять простейшие задачи информационного поиска и классификации. ≈ 1900 – Андрей Андреевич Марков Разработал теорию стохастических дискретных процессов, теперь известных как «Марковские цепи». 200 лет машинному обучению?
  • 4. 4 Гипотеза Ньюэлла-Саймона Человек действует осмысленно, когда он выполняет символьные вычисления и логические операции. К таким процедурам способен и компьютер – значит, ИИ возможен. Противники ИИ Если вы моделируете дождь, это не значит, что вы промокнете. ИИ — это лишь модель, которая может выполнять некоторые задачи лучше, чем человек. Для настоящего ИИ необходима цивилизация машин. Возможен ли искусственный интеллект?
  • 5. 5 𝒇 𝒕 = 𝒂 𝟎 𝟐 + ෍ 𝒏=𝟏 ∞ (𝒂 𝒏 𝐜𝐨𝐬 𝒏𝝎𝒕 + 𝒃 𝒏 𝐬𝐢𝐧 𝒏𝝎𝒕) Речь — физический сигнал
  • 7. 7 МАМА МЫЛА .?. МАМА МЫЛА .?. МАМА МЫЛА .?. 50% … РАМУ 40% … ПОСУДУ 10% … ЛАМУ Особенности языковой модели русского языка  свободный порядок слов — сложно построить статистические модели языка, основанные на анализе частотности совместного употребления слов  большое количество словоформ — существенно увеличивается размер словаря, что приводит к увеличению количества ошибок распознавания Языковая модель Языковая модель
  • 9. 9 Формы компьютерного понимания речи Выполнение команд Ранжирование документов Извлечение знаний:  аннотирование  классификация  кластеризация  извлечение понятий и установление связей …… Компьютерное понимание речи
  • 10. 10 Как понимание влияет на распознавание Знание темы повышает точность распознавания, помогает компьютеру увереннее принимать решение в пользу той или иной гипотезы Снятие омонимий различного рода, например: луг – лук, молод – молот, три (числ.) – три (гл.) Компьютерное понимание речи
  • 11. 11  Технология ориентирована на распознавание спонтанной слитной речи  Используются алгоритмы предобработки речевого сигнала: нормирование спектра, шумоочистка и пр.  Распознавание речи в телефонном канале, в офисном шуме  Учет региональных акцентов и диалектов русского языка  Утилиты для самостоятельного обучения языковой модели на предметную область заказчика  Опыт распознавания речи в различных сферах: телекоммуникации, медицина, безопасность, СМИ Распознавание речи ЦРТ
  • 12. 12 Александр Белозерчик Руководитель отдела развития продуктов ЦРТ a.belozerchick@speechpro.com СПАСИБО ЗА ВНИМАНИЕ!