11:10 | 04.03.25 | Նորություններ | 583
Հայկական Podcastle-ը ներկայացրել է AI-ով աշխատող տեքստը խոսքի վերածող (Text-to-Speech) գործիքն իր նոր Asyncflow v1.0 մոդելով։
Այն առաջարկում է ավելի քան 450 AI ձայն եւ ծրագրավորողներին հարմար API՝ հեշտ ինտեգրման համար։
Այժմ Podcastle-ի միջոցով հնարավոր է պարզ հրահանգներով ստեղծել անսահմանափակ ձայնային տարբերակներ։ Մոդելը ընդամենը 3 վայրկյան աուդիոյով կարող է կրկնօրինակել ձայնը՝ փոխանցելով բոլոր բնութագրերը՝ բարձրություն, ռիթմ, տեմբր, ինտոնացիա, շեշտադրություն։ Սա թույլ է տալիս ստեղծել անհատականացված ձայնային տարբերակներ՝ տարբեր տրամադրություններով ու ոճերով։
«Ի սկզբանե մենք ցանկանում էինք մշակել հզոր Text-to-Speech մոդել։ Սակայն դրա ծախսերը շատ բարձր էին։ Վերջին մեծ լեզվային մոդելների զարգացումների շնորհիվ մենք նախորդ տարի կարողացանք հասնել առաջընթացի եւ ստեղծել բարձրորակ ձայնային մոդել՝ առանց հսկայական տվյալների անհրաժեշտության»,- նշել է Podcastle-ի հիմնադիր Արտո Երիցյանը Techcrunch-ի հետ զրույցում։
Asyncflow v1.0 մոդելի բոլոր գործառույթները տեսնել եւ փորձարկել կարող եք այստեղ։