Как зовут всех голосовых помощников Сбера, в чем их отличия – описание
Сбер во время проведения СберКонф презентовал семейство виртуальных ассистентов, которое получило название «Салют». К его характерным особенностям относят открытую площадку получения навыков, объединение с экосистемой, диалоговую платформу с 3 героями и финансовые навыки. При этом далеко не каждому пользователю известно, как конкретно зовут голосовых помощников Сбера и в чем заключаются их отличия.
СОДЕРЖАНИЕ СТАТЬИ:
Как зовут голосовых помощников
Салют считается первым в мире семейством ассистентов, которое позволяет подобрать персонажа, наиболее близкого по духу. Он будет отличаться собственным именем, голосом, характером, манерой общения. В общей сложности в семейство входят 3 помощника – Сбер, Афина и Джой. Они способны поддержать беседу, помогут найти ответы на вопросы, закажут еду или запишут к врачу, переведут финансы или внесут платеж за мобильную связь.
Выбор того или иного персонажа осуществляется на стадии знакомства с системой ассистентов. Впоследствии юзер может поменять помощника. Для этого ему требуется воспользоваться такими командами, как «Позови Сбера/Афину/Джой» или «Смени персонаж».
Технологии, на которых базируются рассматриваемые продукты, созданы в SberDevices. Для этого использовались инновационные научные исследования и компоненты, созданные в компаниях экосистемы Сбера. Система анализа речи базируется на нейросетях и трансформерах, которые мгновенно распознают слова юзера и могут определять эмоциональный окрас и интонацию.
Синтез речи тоже является собственным продуктом Сбера. Технология нейросетевого синтеза речи базируется на рекуррентно-сверточной архитектуре, которая называется Tacotron/Tacotron-2. С помощью этой системы удается осуществлять управление ударениями, скоростью, интонациями, смысловыми акцентами. Также она дает возможность придавать речи тот или иной эмоциональный окрас или применять особые голосовые эффекты. За счет этого включенность в контакт с юзером переходит на совершенно новый уровень.
Блок понимания естественной речи задействует инновационные нейросетевые модели на базе усовершенствованных многослойных трансформерных архитектур. При общении с пользователем нейросеть способна не только выбрать готовое предложение из библиотеки, но и составить новую фразу из слов или их компонентов. С таким помощником значительно интереснее общаться, поскольку он может удивлять.
В гаджетах и ассистентах, которые предлагаются SberDevices, удалось реализовать и современные технологии машинного зрения. Управлять гаджетами, оснащенными камерой, можно при помощи жестов. К тому же юзеры могут получить доступ к динамичным играм, которые базируются на движениях. Этого удается достичь за счет многослойной сверточной нейронной сети. Она функционирует непосредственно на устройстве. Для этого в состав самых продвинутых девайсов входит особый нейросетевой процессор. Он помогает распознавать ключевые слова, которые дают возможность активировать устройство.
Чтобы решить перечисленные проблемы, необходимы значительные вычислительные мощности. Добиться требуемых результатов удалось за счет создания суперкомпьютера Кристофари от SberCloud.
Сбер
Этот помощник представляет собой лава-шар зеленого цвета, который имеет мужской голос. Он обращается к юзеру на «вы». В образе этого ассистента собраны лучшие характеристики современного парня, который работает в области инновационных технологий. Ему присуще хорошее чувство юмора, открытый ненавязчивый характер и прекрасный кругозор. На первый взгляд, этот ассистент выглядит незаменимым.
Речь этого героя синтезирована на базе голоса Даниила Щебланова – актера дубляжа. В РФ он занимается озвучкой Райана Гослинга. Примечательно, что система нейросетевого синтеза речи представляет собой свою разработку Сбера. Она базируется на применении рекуррентно-сверточной архитектуры Tacotron/Tacotron-2.
Афина
Этот ассистент выглядит как лава-шар голубого цвета. Он имеет женский голос. Афина воплощена в образе спокойной юной девушки, которая помогает юзеру структурировать задачи. Этот голосовой помощник не дает пользователю возможности лениться. Она хочет видеть в юзере максимально продуктивного человека.
Интересной особенностью помощницы считается то, что она предпочитает мировую классику и артхаусное кино. Если принять эту особенность во внимание, можно будет вести с ассистентом интересную беседу. Речь Афины создана на базе голоса телеведущей Анастасии Чернобровиной.
Это более совершенная версия сети GPT-2. Во время общения с человеком она способна даже складывать из слов и их частей новое предложение.
Джой
Этот помощник является лава-шаром оранжевого цвета, который имеет женский голос. Джой обращается к юзеру на «ты». По сути, это свободный и достаточно эмоциональный ассистент, который отличается характером экстраверта. Однако важно учитывать, что Джой прекрасно ощущает границы юзера и уважает их.
Технология, которая используется для анализа речи, базируется на сверточных нейронных сетях и трансформерах. Она может быстро и качественно распознавать слова юзера и определять интонации. Также помощник способен воспринимать эмоциональный окрас.
Навыки ассистентов
Ассистенты Сбера работают на базе облачных технологий при помощи самого мощного в РФ суперкомпьютера Кристофари. Его создали разработчики Nvidia. Голосовые помощники имеют много навыков, которые допустимо загружать из библиотеки программ SmartMarket. Однако уже на начальном этапе юзерам доступен весьма обширный функционал. Он включает следующее:
- Перевод денег, оплата мобильной связи, заказ и оплата снеков, запись юзера к врачу или в салон красоты.
- Инициирование видеозвонка, включение музыкальных треков или фильмов, помощь в приготовлении пищи, поиск общей справочной информации.
- Установка будильника и таймера, определение точного времени в разных городах, предоставление прогноза погоды.
- Распознавание одежды персонажей фильмов и предоставление предложений о покупке оригиналов или аналогов.
Где живет Салют
Ассистенты интегрированы в умные девайсы Сбера – SberBox и SberPortal. В компании планируется объединить все опции сервисов экосистемы в общем окне.
Голосовые помощники Сбера характеризуются обширным функционалом. При этом они отличаются по характеру речи и стилю общения. Это поможет каждому юзеру выбрать подходящий вариант.