Стартап NineNineSix из Кыргызстана представил передовую технологию синтеза речи KaniTTS

Кыргызстанский стартап NineNineSix представил KaniTTS — передовую модель синтеза речи, способную генерировать реалистичный голос в реальном времени. С поддержкой нескольких языков и открытым исходным кодом, она предназначена для использования в голосовых ассистентах, играх и образовательных приложениях, демонстрируя потенциал кыргызской IT-индустрии на мировом уровне.

В Биш­ке­ке стар­тап NineNineSix пред­ста­вил KaniTTS — новую модель син­те­за речи, кото­рая по сво­им харак­те­ри­сти­кам сопо­ста­ви­ма с реше­ни­я­ми таких гиган­тов, как ElevenLabs, OpenAI, Google, Microsoft и Hume.Ai. Эта инфор­ма­ция была озву­че­на в Пар­ке высо­ких тех­но­ло­гий Кыр­гыз­ста­на.

KaniTTS отли­ча­ет­ся высо­кой реа­ли­стич­но­стью и эмо­ци­о­наль­ной выра­зи­тель­но­стью речи, что дела­ет её одной из самых пере­до­вых open-source раз­ра­бо­ток в сфе­ре гене­ра­ции голо­са. Коман­да раз­ра­бот­чи­ков, состо­я­щая из Улан­бе­ка Абду­ра­за­ко­ва, Дени­са Пав­ло­ва и Нур­сул­та­на Бака­шо­ва, уже доби­лась зна­чи­тель­ных успе­хов — модель была ска­ча­на более 15 тысяч раз на плат­фор­ме Hugging Face, где раз­ра­бот­чи­ки могут делить­ся и запус­кать свои ИИ-моде­ли.

Уни­каль­ность KaniTTS заклю­ча­ет­ся в её спо­соб­но­сти не толь­ко пре­об­ра­зо­вы­вать текст в речь, но и пони­мать смысл, инто­на­цию, пау­зы и эмо­ции, что дела­ет зву­ча­ние мак­си­маль­но есте­ствен­ным. Одним из клю­че­вых досто­инств моде­ли явля­ет­ся её ско­рость: она гене­ри­ру­ет 15 секунд зву­ка все­го за одну секун­ду. Это поз­во­ля­ет исполь­зо­вать её в раз­лич­ных при­ло­же­ни­ях, от голо­со­вых асси­стен­тов до игр и обра­зо­ва­тель­ных про­грамм, при этом рабо­та про­ис­хо­дит на обыч­ных потре­би­тель­ских ком­пью­те­рах с видео­кар­та­ми NVIDIA RTX 5080.

На дан­ный момент KaniTTS под­дер­жи­ва­ет англий­ский, немец­кий, корей­ский, араб­ский, китай­ский и испан­ский язы­ки, а в пла­нах коман­ды — доба­вить кыр­гыз­ский и япон­ский. Модель доступ­на для сво­бод­но­го исполь­зо­ва­ния с откры­тым исход­ным кодом, что поз­во­ля­ет раз­ра­бот­чи­кам и иссле­до­ва­те­лям по все­му миру вно­сить свои улуч­ше­ния.

По сло­вам пред­ста­ви­те­лей NineNineSix, цель созда­ния KaniTTS заклю­ча­лась в демо­кра­ти­за­ции досту­па к голо­со­во­му ИИ, предо­став­ляя воз­мож­ность не толь­ко круп­ным ком­па­ни­ям, но и неболь­шим коман­дам и иссле­до­ва­те­лям исполь­зо­вать пере­до­вые тех­но­ло­гии, кото­рые ранее были доступ­ны лишь за боль­шие день­ги. В буду­щем коман­да пла­ни­ру­ет внед­рить тех­но­ло­гию кло­ни­ро­ва­ния голо­сов, поз­во­ля­ю­щую созда­вать син­те­ти­че­ские копии темб­ра и инто­на­ций для озву­чи­ва­ния тек­ста.

Запуск KaniTTS стал зна­чи­мым собы­ти­ем для IT-эко­си­сте­мы Кыр­гыз­ста­на, под­чер­ки­вая спо­соб­ность стра­ны раз­ра­ба­ты­вать тех­но­ло­гии миро­во­го уров­ня. Это дости­же­ние демон­стри­ру­ет, что Кыр­гыз­стан может не толь­ко исполь­зо­вать, но и фор­ми­ро­вать буду­щее в сфе­ре искус­ствен­но­го интел­лек­та. Парк высо­ких тех­но­ло­гий отме­тил, что KaniTTS явля­ет­ся при­ме­ром того, как талант и амби­ции могут при­ве­сти к созда­нию инно­ва­ци­он­ных реше­ний.

При­ме­не­ние KaniTTS охва­ты­ва­ет раз­лич­ные сфе­ры, вклю­чая вир­ту­аль­ных асси­стен­тов, игро­вую инду­стрию, медиа-кон­тент, под­ка­сты и обра­зо­ва­тель­ные плат­фор­мы, а так­же тех­но­ло­гии, улуч­ша­ю­щие доступ­ность для людей с нару­ше­ни­я­ми зре­ния.

Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x