News
Лента
News
Вторник
Апрель 23
Вся лента

Подразделение Google AI разработало функциональную модель диаризации звукового потока и описало в новую систему искусственного интеллекта, которая эффективно маркирует говорящих.

Диаризация — процесс разделения входящего аудиопотока на сегменты по принадлежности к тому или иному говорящему — дается машинам сложнее, чем людям, и обучать этому умению алгоритмы сложнее, чем кажется. Надежная система диаризации должна распознавать высказывания новых участников диалога, чтобы дать ответ на вопрос: «Кто сейчас говорит?».

Новый подход основан на математическом представлении слов и фраз говорящего рекуррентной нейронной сетью — разновидностью нейросети, которая использует свое внутреннее состояние для обработки входной последовательности. Каждый говорящий начинает с собственной копии рекуррентной сети, которая отслеживает появление новых фраз и позволяет системе обучаться, обмениваясь информацией, пишет Hightech+ со ссылкой на VentureBeat.

!
Этот текст доступен на   Հայերեն
Распечатать
Читать также:
Все
Жанна Андреасян обещает: Формат, статус и степень автономии научных институтов будут обсуждаться
Сегодня значительная часть финансирования в …
Канадские ученые научились получать нефтепродукты из отходов резины и пластика
В основе новой технологии лежит процесс быстрого пиролиза…
Армения и Саудовская Аравия обсудили вопросы сотрудничества в сфере информационных технологий
Они обозначили основные направления взаимодействия…
В Киргизии по решению властей частично заблокировали TikTok
Несколько дней назад Государственный комитет национальной безопасности республики направил в министерство цифрового…
Live Science: создан дрон, способный запоминать человека и преследовать его
Беспилотник использует «модель обнаружения объектов» ИИ на основе встроенной камеры…
Команда Армении прошла в финал Международной студенческой олимпиады по программированию
15 апреля состоялась официальная церемония открытия…
Самое