Команда NineNineSix из Кыргызстана разработала KaniTTS — технологию, которая превращает текст в живой голос на шести языках. Об этом сообщили в Парке высоких технологий.
KaniTTS создает реалистичную, эмоциональную речь и генерирует 15 секунд звука всего за одну секунду. Модель уже говорит на английском, немецком, корейском, арабском, китайском и испанском языках. В скором времени появятся кыргызский и японский. Технология по качеству и скорости сопоставима с решениями Google и OpenAI, а установить ее можно бесплатно.
Разработчики Уланбек Абдуразаков, Денис Павлов и Нурсултан Бакашов выложили проект в открытый доступ на платформе Hugging Face, где его скачали уже более 15 тысяч раз.
KaniTTS может работать в чат-ботах, играх, подкастах и образовательных платформах.
«Мы хотели, чтобы голосовой AI стал доступным каждому, а не только крупным компаниям», — отметили в NineNineSix.
Проект, созданный при поддержке Парка высоких технологий Кыргызстана, уже получил внимание международного сообщества разработчиков.