Александр Белозерчик, ЦРТ, руководитель отдела развития продуктов
- Как компьютер распознает речь;
- Что значит компьютерное понимание речи и в чем это выражается;
- Почему без понимания нет качественного распознавания.
2. 2
От распознавания речи
к пониманию сказанного
Как компьютер
распознает речь
Что значит компьютерное
понимание речи, и в чем
это выражается
Почему без понимания
нет качественного
распознавания
Преимущества
технологии ЦРТ
3. 3
≈ 1800 – Семен Николаевич Корсаков
Изобрел механические устройства, работающие на
основе перфокарт, способные выполнять простейшие
задачи информационного поиска и классификации.
≈ 1900 – Андрей Андреевич Марков
Разработал теорию стохастических дискретных
процессов, теперь известных как «Марковские цепи».
200 лет машинному обучению?
4. 4
Гипотеза Ньюэлла-Саймона
Человек действует осмысленно, когда он выполняет
символьные вычисления и логические операции. К
таким процедурам способен и компьютер – значит, ИИ
возможен.
Противники ИИ
Если вы моделируете дождь, это не значит, что вы
промокнете. ИИ — это лишь модель, которая может
выполнять некоторые задачи лучше, чем человек.
Для настоящего ИИ необходима цивилизация машин.
Возможен ли искусственный
интеллект?
7. 7
МАМА МЫЛА .?.
МАМА МЫЛА .?.
МАМА МЫЛА .?.
50% … РАМУ
40% … ПОСУДУ
10% … ЛАМУ
Особенности языковой модели русского языка
свободный порядок слов — сложно построить статистические
модели языка, основанные на анализе частотности совместного
употребления слов
большое количество словоформ — существенно увеличивается
размер словаря, что приводит к увеличению количества ошибок
распознавания
Языковая модель
Языковая
модель
9. 9
Формы компьютерного понимания речи
Выполнение команд
Ранжирование документов
Извлечение знаний:
аннотирование
классификация
кластеризация
извлечение понятий и установление связей
……
Компьютерное понимание речи
10. 10
Как понимание влияет на распознавание
Знание темы повышает точность распознавания,
помогает компьютеру увереннее принимать решение в
пользу той или иной гипотезы
Снятие омонимий различного рода, например:
луг – лук, молод – молот, три (числ.) – три (гл.)
Компьютерное понимание речи
11. 11
Технология ориентирована на распознавание спонтанной
слитной речи
Используются алгоритмы предобработки речевого
сигнала: нормирование спектра, шумоочистка и пр.
Распознавание речи в телефонном канале, в офисном
шуме
Учет региональных акцентов и диалектов русского языка
Утилиты для самостоятельного обучения языковой
модели на предметную область заказчика
Опыт распознавания речи в различных сферах:
телекоммуникации, медицина, безопасность, СМИ
Распознавание речи ЦРТ