Центр речевых технологий

Инновации на службе ЖКХ

Опубликовано в номере:
PDF версия
В Санкт-Петербурге разработана и внедрена технология автоматического сбора показаний счетчиков по телефону. Созданная специалистами «Центра речевых технологий», система автоматически распознает речь человека и переводит ее в текст, фиксируя всю необходимую информацию.

Технология гибридного синтеза речи

Специалистами компании «Центр речевых технологий» была разработана новая технология гибридного синтеза речи, объединившая в себе достоинства подхода Unit Selection и HMM-синтеза и практически исключающая их недостатки. Синтез речи VitalVoice использует сложные лингвистические алгоритмы анализа текста и обработки выходного сигнала, что позволяет достичь максимального приближения к реальной речи (рис.).

В словаре VitalVoice содержится более 300 фразеологизмов, с помощью которых синтезатор понимает, что, например, выражение «ни пуха ни пера» — это единая смысловая конструкция с особой интонацией.

Особое внимание уделяется интонации и паузам, ведь именно эти параметры во многом обеспечивают естественность голоса. Блок лингвистической обработки позволяет автоматически расшифровывать множество вариантов сокращений, используемых в текстах на русском языке.

Технология гибридного синтеза речи

 

Ты мне слово, я тебе два

В основе системы лежат технологии синтеза и распознавания речи, успешно используемые во многих продуктах ЦРТ. «Потребитель» задает абоненту вопросы, распознает его ответы и заносит полученную информацию в базу данных. Для подтверждения данных система повторяет «услышанное» и просит абонента подтвердить правильность информации ответом «да/нет». При необходимости внести изменения система попросит собеседника повторить номер договора или показания счетчиков. Диалог абонента с системой максимально приближен по удобству к общению с оператором контактного центра: система сама подсказывает, что и в какой момент необходимо произнести.

Чтобы синтезированная речь звучала натурально, необходимо решить целый комплекс задач, связанных как с обеспечением естественности голоса на уровне тембра, плавности звучания и интонации, так и с правильной расстановкой ударений, расшифровкой сокращений, чисел, аббревиатур и специальных знаков. Особое внимание уделяется и расстановке пауз в синтетической речи. Технология синтеза речи VitalVoice, созданная специалистами «Центра речевых технологий», позволяет обеспечить максимальную естественность голоса, что особенно важно для пожилых людей, для которых общение с подобного рода системой будет в новинку.

 

От теории к практике

«Потребитель» чрезвычайно работоспособен: прием звонков может происходить круглосуточно, по 15 каналам связи. В день возможна обработка до 100 000 вызовов. При этом телефонные линии для абонентов никогда не будут заняты. Сбытовой компании не требуется создавать call-центр для приема показаний или веб-портал с личными кабинетами, а значит, экономия средств при автоматизации всего процесса будет весьма значительна.

В случае использования в домохозяйствах двухрежимных счетчиков (дневное и ночное время) или при необходимости для абонента продиктовать дополнительную информацию (например, адрес дома), система дорабатывается в соответствии с пожеланием заказчика. Это означает, что каждая компания, берущая систему на вооружение, может разработать свой индивидуальный алгоритм разговора абонента с системой.

Внедрение подобной системы требует предварительной работы не только на территории компании-заказчика, но и «подготовки почвы» для непосредственных участников процесса — потребителей электроэнергии и других ресурсов.

 

Распознавание слитной речи

Технология распознавания слитной речи на большом словаре (large vocabulary continuous speech recognition, LVCSR) наиболее близка к мечте о взаимодействии человека и машины: все, что сказано, дословно преобразуется в текст. Поэтому иногда эта технология так и называется STT — speech to text.

Задача полноценного распознавания слитной речи не решена нигде в мире, однако достоверность распознавания уже достаточно высока для использования технологии на практике. Потенциальная сфера применения технологии в коммерческих целях довольно широка.

Первая версия системы автоматического сбора показаний счетчиков по телефону была разработана в ЦРТ еще несколько лет назад. Одним из толчков к началу активной работы над системой стало вступление в силу в сентябре 2012 г. Постановления Правительства РФ, обязывающего потребителей в период с 23 по 25 число текущего месяца передавать показания индивидуальных приборов учета ресурсов в управляющую компанию. Естественно, что компании, осуществляющие обслуживание населения, не были готовы к тому, чтобы за такое короткое время принять показания у десятка тысяч домохозяйств. Когда в ЦРТ стали поступать первые запросы на решение задачи оперативного и наименее трудоемкого способа сбора показаний, функционал системы был доработан с учетом необходимых требований.

распознование слитой речи

 

От мала до велика

Востребованность «Потребителя» во многом зависит не от величины города или региона, а от размеров непосредственно компании, которая берет систему на вооружение: значение будут иметь размеры обслуживаемого ею домохозяйства, количество потребителей ресурсов, а также то, могут ли жители передавать показания физически, т. е. на специальных бланках. Особенно это важно в отдаленных от районных центров небольших населенных пунктах. Если обслуживаемые одной компанией домохозяйства «раскиданы» на большой территории, собрать показания по телефону — самый простой и удобный способ.

Именно поэтому сфера применения системы не ограничивается крупными городами: уже сейчас с уверенностью можно сказать, что и регионы будут заинтересованы в возможности упростить задачу сбора показаний — в первую очередь для своих жителей, которые смогут предоставлять необходимую информацию удаленно. Такой вариант подачи данных значительно облегчит жизнь людям, которым затруднительно выходить из дома. Срок окупаемости системы в зависимости от масштаба развертывания составляет от полугода до десяти месяцев.

Не стоит забывать и о том, что Россия — многонациональная страна. Именно поэтому специалисты «Центра речевых технологий» параллельно трудятся над разработкой таких языков, как казахский, татарский, украинский, а также над реализацией английского языка для «Потребителя», что позволит говорить об использовании системы за рубежом.

Применение инновационных технологий призвано сделать нашу жизнь проще, и специалисты компании ЦРТ всецело используют этот принцип в разработке новых продуктов. «Потребитель» — система, внедрение которой не только позволит сэкономить значительную часть денежных средств, необходимых для организации полноценного центра по приему показаний домовых счетчиков от населения, но и значительно упростит сам процесс для самих потребителей ресурсов.

Для тех, кто хочет испытать «Потребитель» в действии, в ЦРТ развернуты демонстрационные стенды, с помощью которых любой желающий сможет проверить, как работает система. Достаточно позвонить в компанию и попросить перевести вызов на демо-стенд системы «Потребитель». Также примеры работы системы (демо-стенды) размещены на сайте ЦРТ www.speechpro.ru в разделе «Системы голосового самообслуживания». На странице системы «Потребитель» указаны телефоны, позвонив по которым, можно попробовать самостоятельно сдать показания счетчиков.


О компании

ООО «Центр речевых технологий» (ЦРТ) — российская компания с более чем 20-летней историей. Сегодня ЦРТ является ведущим мировым разработчиком инновационных систем в сфере высококачественной записи, обработки и анализа аудиовидеоинформации, синтеза и распознавания речи. Создаваемые в ЦРТ биометрические решения обеспечивают высокую точность распознавания личности по голосу и изображению лица в реальном времени. Эти решения находят успешное применение в государственном и коммерческом секторе, от небольших экспертных лабораторий до сложных систем безопасности национального масштаба.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *