photo © Podcastle

Podcastle-ը թողարկել է տեքստից խոսք AI մոդել՝ ավելի քան 450 ձայնով

Հայկական Podcastle-ը ներկայացրել է AI-ով աշխատող տեքստը խոսքի վերածող (Text-to-Speech) գործիքն իր նոր Asyncflow v1.0 մոդելով։

Այն առաջարկում է ավելի քան 450 AI ձայն եւ ծրագրավորողներին հարմար API՝ հեշտ ինտեգրման համար։

Այժմ Podcastle-ի միջոցով հնարավոր է պարզ հրահանգներով ստեղծել անսահմանափակ ձայնային տարբերակներ։ Մոդելը ընդամենը 3 վայրկյան աուդիոյով կարող է կրկնօրինակել ձայնը՝ փոխանցելով բոլոր բնութագրերը՝ բարձրություն, ռիթմ, տեմբր, ինտոնացիա, շեշտադրություն։ Սա թույլ է տալիս ստեղծել անհատականացված ձայնային տարբերակներ՝ տարբեր տրամադրություններով ու ոճերով։

«Ի սկզբանե մենք ցանկանում էինք մշակել հզոր Text-to-Speech մոդել։ Սակայն դրա ծախսերը շատ բարձր էին։ Վերջին մեծ լեզվային մոդելների զարգացումների շնորհիվ մենք նախորդ տարի կարողացանք հասնել առաջընթացի եւ ստեղծել բարձրորակ ձայնային մոդել՝ առանց հսկայական տվյալների անհրաժեշտության»,- նշել է Podcastle-ի հիմնադիր Արտո Երիցյանը Techcrunch-ի հետ զրույցում։

Asyncflow v1.0 մոդելի բոլոր գործառույթները տեսնել եւ փորձարկել կարող եք այստեղ։