Tinkoff.AI Speech

3 презентации

Вы давно этого ждали! Наш главный митап, посвященный DL в речевых технологиях.

Мы собрали экспертов в области обработки речи, чтобы рассказать о разработке на стыке исследований и продукта. О том, как мы делаем Voice Conversion, о SOTA архитектурах для распознавания речи в потоковом режиме, а так же о переводах в видео – как стоит решать эту задачу и насколько это вообще хорошо получается делать сегодня.

Следите за новостями на канале «Желтый AI» и задавайте вопросы спикерам в телеграм-чате мероприятия.

Дата и время

20 апреля 2023, 19:00 (МСК)

Место проведения

Онлайн

Доклады

Как работает Voice Conversion в Тинькофф

Расскажем, как мы превратили наш рисерч в полноценный продукт и с какими трудностями мы столкнулись. Поговорим про текущие ограничения работы у нашей технологии, и куда мы планируем двигаться дальше. Поделимся хайлайтами наших последних наработок, включая быстрое добавление новых спикеров в модель.

Артем Грибуль

Тинькофф

Перевод видео

— Это отдельная задача или стэк решений для распознавания, перевода и синтеза?
— Лучше использовать end-to-end подходы или каскады алгоритмов?
— И вообще, пригодно ли это к использованию?
На эти вопросы я постараюсь дать ответы.

Сергей Дуканов

Яндекс

Потоковый Conformer для задач автоматического распознавания речи

Наш доклад посвящен архитектуре Conformer - комбинации Transformer и сверточных слоев. Расскажем:
— как мы используем Transformer в потоковом режиме и достигаем высокой точности в задаче автоматического распознавания речи;
— наш путь от этапа исследования до интеграции в продукт;
— с какими проблемами столкнулись и как их обошли;

Александр Мисевич