Новости

Google Cloud обновляет интеллектуальные речевые инструменты для предприятий

руководство

Руководство по искусственному интеллекту, от машинного обучения и общего ИИ до нейронных сетей.

Google Cloud в четверг объявил, что обновляет свои продукты преобразования текста в речь, добавляя больше голоса и больше языков. Google также улучшил качество своих инструментов транскрипции для преобразования речи в текст и обеспечивает доступ к некоторым их функциям. Обновления должны помочь разработчикам создавать интеллектуальные голосовые приложения, которые могут охватить миллионы людей и работать более эффективно.

Что касается преобразования текста в речь, Google примерно удвоил количество голосов, доступных со времени его последнего обновления в августе. Добавлена ​​поддержка семи новых языков или вариантов, включая датский, португальский / португальский, русский, польский, словацкий, украинский и норвежский букмол. все в бета-версии. Теперь продукт поддерживает 21 язык.

На этих новых языках Google добавил 31 новый голос WaveNet и 24 новых стандартных голоса. Google говорит, что теперь поддерживает в общей сложности 106 голосов.

WaveNet. это глубокая нейронная сеть для генерации необработанного звука, которая создает голоса, которые звучат более естественно, чем стандартные голоса «текст в речь». Технология была создана DeepMind, AI-компанией Google, приобретенной в 2014 году.

«Благодаря уникальному доступу к технологии WaveNet на базе облачных TPU Google мы можем создавать новые голоса и языки быстрее и проще, чем обычно в отрасли»,. сказал менеджер по продукту Google Дэн Аарон в своем блоге.

Основным конкурентом Google в сфере услуг преобразования текста в речь является сервис Polly от Amazon Web Services, который в соответствии с его веб-сайтом в настоящее время обеспечивает 58 голосов.

В дополнение к добавлению новых голосов функция профилей Google Text-to-Speech Device теперь общедоступна. Это позволяет клиентам оптимизировать воспроизведение звука на различных типах оборудования, таких как наушники для мультимедийных приложений, таких как подкасты.

Между тем, для Speech-to-Text Google выводит на рынок модели премиум-класса для видео и улучшенных телефонов, которые были выпущены в бета-версии в прошлом году. В модели видео, основанной на технологии, аналогичной той, которую YouTube использует для автоматического создания субтитров, теперь на 64% меньше ошибок транскрипции, объявила Google. Улучшенная модель телефона теперь имеет на 62% меньше ошибок.

Google удалось улучшить модели, потребовав от клиентов, которые пользовались услугами премиум-класса, обмениваться данными об использовании с помощью регистрации данных. Начиная с сегодняшнего дня, клиенты могут использовать расширенную модель телефона, не переключаясь на обмен данными, в то время как те, кто подписывается, платят по более низкой ставке. Цены также ниже для всех пользователей видео-моделей премиум-класса, и те, кто выберет обмен данными, получат дополнительную скидку.

Google также объявляет об общей доступности многоканального распознавания, которое помогает API речи в тексте различать несколько аудиоканалов. Это полезно для сценариев, в которых участвуют несколько человек, например, для проведения анализа собраний.

Смотрите так же

Обновление авторских прав в ЕС с таргетингом на Go... Обновление было отмечено интенсивным лоббированием со стороны технологических компаний, включая Google и Facebook Google YouTube и Instagram Facebook должны будут установить фильтры В прошлом месяце законодатели ЕС одобрили Еврокомиссию Предложение было направлено на защиту креативной индустрии Европы На следующей неделе страны ЕС намерены согл...
Google Duo может скоро получить отчет о веб-версии... Google Duo может скоро получить веб-версию: Сообщить На данный момент неизвестно, сколько функций из мобильной версии Duo будет включено в веб-версию. Штат сотрудников Обновлено: 29 января 2019 18:08 IST По сообщениям, Google планирует в ближайшие недели запустить веб-версию своего приложения для видеозвонков под названием Google Duo. ...
Google настроился на изменение общего меню на Andr... Google настроен на «Редизайн» меню совместного доступа на Android для обеспечения более быстрого опыта Исправление, вероятно, будет частью следующего обновления Android Pie или ранней бета-версии Android Q Особенности Android Engineering VP Дейв Берк продемонстрировал переработанное меню совместного доступа Берк сказал, что исправление яв...