Будущее и голосовые технологии

6/16/2021
Нравится? Поддержите нас!
Будем рады вашим донатам на любую сумму

Вы: *****, расскажи мне про голосовые технологии!

Оно: (читать с выражением робота

— Согласно последним исследованиям (Canalys) за последний год мировой рынок «умных» колонок вырос почти в полтора раза. Россию эта тенденция тоже не обошла стороной — по сравнению с 2019 годом объем продаж устройств этого типа увеличился на 38%. Эксперты по всему миру прогнозируют, что  2021 год станет годом голосовых технологий, как, впрочем, и всё ближайшее десятилетие. 

Давайте разберемся, что это такое: 

Голосовые технологии можно рассматривать через три составляющие:

  • синтез речи — технология, которая дает возможность воспроизвести текст как можно более похожим на естественный человеческий голос.
  • системы распознавания речи — позволяют преобразовывать человеческую речь в компьютерную форму.
  • интерфейсная система — для совместного использования систем синтеза и распознавания речи нужно иметь программу, которая должна понимать, когда следует синтезировать, а когда распознавать полученную извне информацию — интерфейс.

Сейчас самые используемые голосовые интерфейсы — это Alexa от Amazon, Siri от Apple, OK Google и Алиса от Яндекса (только в России и странах СНГ) — они стали частью умного дома, используются в смартфонах и ПК. Потенциальный спектр использования голосовых технологий шире — от персональных помощников до промышленных роботов. 

В основе голосовых технологий лежит машинное обучение, и чем больше данных мы передаем ИИ, тем умнее он становится.

Как голосовые технологии влияют на нашу жизнь

Скорость и доступность. Дело в том, что в среднем человек может написать 40 слов в минуту, а произнести до 150. Голосовые технологии позволяют существенно улучшить качество жизни людей с инвалидностью и позволяют быстро получать проверенную информацию о том, что нужно делать в той или иной экстренной ситуации. 

Автоматизация процессов. Голосовые технологии могут  освободить людей от тяжелой, низкооплачиваемой работы; так, например, по мнению экспертов в самое ближайшее время сотрудников call-центров заменят роботы. Но с тем, насколько это хорошие новости, можно поспорить.

Гигиена. Пандемия заставила серьезно задуматься о необходимости внедрения бесконтактных голосовых технологий в общественных местах. Говорящие кофейные и билетные автоматы, управление лифтом с помощью голоса и многое другое - все это совсем скоро может стать нашей реальностью. 

Общение. Во время изоляции сотни тысяч людей скачали приложение Replika, которое умеет общаться на почти естественном языке, дружить, и разработано, чтобы помогать справиться со стрессом. Как знать, может быть уже в самое ближайшее время фильм Спайка Джонза «Она» про роман между писателем и его операционной системой покажется нам такой уж утопией.

Голосовые технологии в образовании

Работает это прежде всего через голосовых помощников на основе искусственного интеллекта (ИИ). Alexa, Google Assistant и Siri постепенно становятся частью учебного процесса во всем мире.

Персонализация и равные возможности. Самая важная особенность голосовых помощников заключается в том, что их можно настроить и обучить в соответствии с индивидуальным потребностями и особенностями учащегося. Так, например, для тех, кто лучше воспринимает информацию на слух, помощник совершенно незаменимая вещь:  исследования показывают, что если сконцентрироваться на содержании материала, это может улучшить и облегчить понимание.

А ещё голосовые технологии помогают преодолеть языковой барьер. Считается, что общение с носителями — это лучший способ выучить язык, потому что так набирается активный словарный запас и запоминается произношение. Но не все могут позволить себе общение с носителем, поездку в языковой лагерь, а кто-то просто стесняется говорить с другими на иностранном. 

У интровертов и застенчивых учеников появляется возможность задавать вопросы голосовому помощнику и не переживать о том, как они при этом будут выглядеть и что о них подумают другие. 

Наибольшую пользу от повсеместного внедрения голосовых получат студенты, с дислексией или другими нарушениями обучаемости, как например СДВГ — они смогут воспроизводить текст заданий, книг и давать собственные ответы вслух, используя программы преобразования речи в текст и обратно. Например программа Read & Write и Penfriend даже помогает писать, используя функции предсказания слов и фонетической проверки орфографии.

Ну а про образовательные подкасты вы уже и так знаете. Кстати, будем признательны  за  рекомендации.

онлайн
Мастерство Midjourney
Курс по практическому применению нейросетей в работе и творчестве
Узнать больше
Подпишитесь на наш канал в Telegram!
И узнавайте первыми о новых курсах и стипендиях

Рекомендуемые курсы

AI-Революция. Как мы в ней оказались? Как мы к ней пришли?

На наших глазах происходит революция генеративного ИИ — как так получилось и что именно происходит?

6/3/2023

Stable Diffusion 2.0 новая версия нейросети

Команда stability.ai анонсировала выход Stable Diffusion 2.0. Рассказываем самое интересное.

25/11/2022

AI-генераторы в Пражской медиашколе

Исследования и проекты участников курса AI-Генераторы

8/11/2022
Всё поёт: мастерская по Adobe Audition и работе со звуком
Вы научитесь основам звукозаписи и работе со звуком, узнаете как использовать библиотеки, чем звук для YouTube отличается от звука для VR; получите представление о саунд-дизайне и звукорежиссуре.
Программа
Smm. Полная комплектация
Программа для тех, кто хочет ясно увидеть структуру, потрогать руками и понять принципы работы маркетинга в социальных сетях.
Программа курса
Как придумать и запустить подкаст
Подкасты пока мало кто умеет делать, но о них точно много говорят. Каждый подкаст – это маленькое медиа, очень демократичное и одновременно требующее знаний и навыков. Мы хотим, чтобы хороших русскоязычных подкастов стало намного больше. Чтобы это получилось, студия «Либо/Либо» проведет для вас новый курс.
Программа курса