11:10 | 04.03.25 | Նորություններ | 583

    Podcastle-ը թողարկել է տեքստից խոսք AI մոդել՝ ավելի քան 450 ձայնով

    Հայկական Podcastle-ը ներկայացրել է AI-ով աշխատող տեքստը խոսքի վերածող (Text-to-Speech) գործիքն իր նոր Asyncflow v1.0 մոդելով։

    Այն առաջարկում է ավելի քան 450 AI ձայն եւ ծրագրավորողներին հարմար API՝ հեշտ ինտեգրման համար։

    Այժմ Podcastle-ի միջոցով հնարավոր է պարզ հրահանգներով ստեղծել անսահմանափակ ձայնային տարբերակներ։ Մոդելը ընդամենը 3 վայրկյան աուդիոյով կարող է կրկնօրինակել ձայնը՝ փոխանցելով բոլոր բնութագրերը՝ բարձրություն, ռիթմ, տեմբր, ինտոնացիա, շեշտադրություն։ Սա թույլ է տալիս ստեղծել անհատականացված ձայնային տարբերակներ՝ տարբեր տրամադրություններով ու ոճերով։

    «Ի սկզբանե մենք ցանկանում էինք մշակել հզոր Text-to-Speech մոդել։ Սակայն դրա ծախսերը շատ բարձր էին։ Վերջին մեծ լեզվային մոդելների զարգացումների շնորհիվ մենք նախորդ տարի կարողացանք հասնել առաջընթացի եւ ստեղծել բարձրորակ ձայնային մոդել՝ առանց հսկայական տվյալների անհրաժեշտության»,- նշել է Podcastle-ի հիմնադիր Արտո Երիցյանը Techcrunch-ի հետ զրույցում։

    Asyncflow v1.0 մոդելի բոլոր գործառույթները տեսնել եւ փորձարկել կարող եք այստեղ։