11:11 | 20.10.16 | Հարցազրույցներ | exclusive 20786

YerevaNN-ը ՀՀ-ում կզարգացնի արհեստական ինտելեկտի եւ մեքենայական ուսուցման ուղղությունները

Օրերս Երեւանում պաշտոնապես գրանցվել է մեքենայական ուսուցման (machine learning) խնդիրներով զբաղվող YerevaNN գիտակրթական հիմնադրամը:

Վերջինս աջակցելու է ԵՊՀ-ի մոտակայքում գտնվող արհեստական բանականության ուսումնասիրությամբ զբաղվող համանուն հետազոտական լաբորատորիայի աշխատանքներին, որի ուղղություններն են պատկերներ գեներացնող ալգորիթմների (generative models) ուսումնասիրությունը, բնական լեզվի մշակման (natural language processing) գործիքների ադապտացումը հայերենին եւ բժշկական տվյալների բազաների անալիզը նեյրոնային ցանցերի միջոցով:

Հիմնադրամը նպատակ ունի խթանել արհեստական ինտելեկտի վերաբերյալ բարձրակարգ հետազոտությունները եւ մեքենայական ուսուցման ու հարակից թեմաների որակյալ դասավանդումը Հայաստանում:  

Հիմնադրամի հոգաբարձուների խորհրդում են Teamable ընկերության համահիմանդիր Վազգեն Հակոբջանյանը, Fimetech-ի հիմնադիր Գոռ Վարդանյանը, Arminova Technologies-ի հիմնադիր Ռուբեն Մեսչյանը:

Itel.am- ը զրուցել է YerevaNN հիմնադրամի հիմնադիր Հրանտ Խաչատրյանի հետ:

- Նոր գրանցված հիմնադրամն ինչպե՞ս է աջակցելու Հայաստանում արհեստական բանականության եւ մեքենայական ուսուցման հետազոտական աշխատանքների զարգացմանը:

- Ամբողջ աշխարհում այսօր մեծ խնդիր է ծրագրավորողներին գիտության մեջ պահելը, քանի որ համալսարաններն ու ակադեմիական հաստատությունները չեն կարողանում մրցակցել խոշոր ընկերությունների հետ, եւ առաջին հերթին՝ աշխատավարձերի հարցում: Հայաստանում այս խնդիրը հասել է ծայրահեղության: Գիտաշխատողների եւ ծրագրավորողների աշխատավարձերը երկրի համապատասխանաբար ամենացածր եւ ամենաբարձր աշխատավարձերից են:

Հիմնադրամի հիմնական առաքելությունը գիտությամբ զբաղվել ցանկացող ուսանողների համար մրցունակ աշխատանքային պայմանների ապահովումն է: Մենք ստեղծել ենք հետազոտական լաբորատորիա, որտեղ ուսանողներն աշխատում են բացառապես հետազոտական նախագծերի վրա եւ մեծ արագությամբ հարստացնում են իրենց մասնագիտական գիտելիքները:

Լաբորատորիայում աշխատող երեք ուսանողները՝ Տիգրան Գալստյանը, Կարեն Համբարձումյանը եւ Հրայր Հարությունյանը, սովորում են ԵՊՀ-ում: Հետագայում, երբ նրանք դառնան դասախոսներ, մեքենայական ուսուցման դասավանդումը ՀՀ բուհերում կդառնա ավելի համակարգված, եւ ոլորտը զարգացման նոր թափ կստանա:

- Լաբորատորիան արդեն մեկ ու կես տարվա պատմություն ունի: Ի՞նչ արդյունքների մասին կարող ենք խոսել այս պահին:

- Առաջին ձեռքբերումն այն է, որ մի խումբ ուսանողներ մանրամասն ծանոթացան մեքենայական ուսուցման սկզբունքներին եւ խոր գիտելիքներ կուտակեցին մեքենայական ուսուցման մի տեսակի վերաբերյալ, որ կոչվում է նեյրոնային ցանցեր: Եթե հաշվի առնենք, որ այս թեմաները, ըստ էության, չէին դասավանդվում բուհերում, սա բավական կարեւոր նվաճում էր:

Հաջորդ էական ձեռքբերումն այն էր, որ կարողացանք հասկանալ, թե ովքեր են աշխարհում այս ոլորտի առաջատարները, ինչ խնդիրներով են զբաղվում, եւ թե որ գիտական խմբերին ու գիտաժողովներին է պետք հետեւել գիտության այս ճյուղի զարգացումը հասկանալու համար: Սա նույնպես բավական բարդ էր, քանի որ մենք չունեինք մեզ ուղղորդող գիտական ղեկավար: Սա մեզ հնարավորություն տվեց փորձել ներգրավվել միջազգային գիտական հանրությանը:

Ինչ վերաբերում է մեր իրականացրած նախագծերին, ապա կարող եմ առանձնացնել եւս երեքը: 2015թ. Սթենֆորդի համալսարանի եւ Metamind ընկերության հետազոտողները տպագրեցին հոդված, որտեղ նկարագրված էր նեյրոնային ցանցերի մի նոր տարատեսակ (Dynamic memory networks), որը կարողանում է կարդալ պարզ տեքստեր եւ պատասխանել այդ տեքստերի վերաբերյալ հարցերին: Հեղինակները մանրամասն նկարագրել էին նեյրոնային ցանցի աշխատանքը, սակայն չէին տեղադրել աշխատող կոդ: 2016թ․ փետրվարին մենք իրականացրինք այդ ալգորիթմը եւ կոդը բաց տեղադրեցինք ինտերնետում: Այս ամիսների ընթացքում բազմաթիվ արձագանքներ ստացանք տարբեր ծրագրավորողների եւ հետազոտողների կողմից, որոնք օգտագործում են մեր կոդն իրենց խնդիրների համար կամ հիմնվելով մեր իրականացման վրա` ստեղծում են իրենց տարբերակները:

Երկրորդը կապված է հայերեն «տրանսլիտի» խնդրի հետ: Հայտնի է, թե ինչ մեծ խնդիր է համացանցում, հատկապես սոցիալական ցանցերում կուտակված լատինատառ հայերեն բովանդակությունը, որը ոչ միայն տհաճ է կարդալ, այլեւ դժվար է մշակել գոյություն ունեցող ծրագրային միջոցներով: Օրինակ, ինչպես գիտեք, Facebook-ն ունի ավտոմատ թարգմանության հնարավորություն, որը սակայն երբեք չի աշխատի լատինատառ հայերենի համար, քանի որ այդպիսի լեզու այդ այբուբենով գոյություն չունի: Անհրաժեշտ է նախ լատինատառը վերածել հայատառի: Մենք ցույց տվեցինք, որ LSTM կոչվող նեյրոնային ցանցերը կարող են այս խնդիրը լուծել մեծ ճշտությամբ եւ հրապարակեցինք կոդը: Այս ուղղությամբ աշխատանքները շարունակվում են:

Երրորդ, ոչ պակաս կարեւոր ձեռքբերումը նեյրոնային ցանցերի ու հարակից թեմաների դասավանդումն է ԵՊՀ-ում՝ արտալսարանային դասերի ձեւաչափով: Արդեն չորրորդ կիսամյակն է, որ ԵՊՀ ուսանողական գիտական ընկերության հետ համատեղ կազմակերպվում են այս դասընթացները: Հուսով ենք, որ ապագայում այս դասընթացները կհղկվեն ու կընդգրկվեն ՀՀ բուհերի ծրագրերում:

- Uber ընկերության Առաջատար տեխնոլոգիաների կենտրոնի ինժեներական գծով տնօրեն Րաֆֆի Գրիգորյանը նախորդ շաբաթ Երեւանում նշել էր, որ Հայաստանը՝ իր կրթական համակարգով, 5 տարվա ընթացքում կարող է մաս կազմել արհեստական բանականության եւ մեքենայական ուսուցման (Machine Learning) լուծումներ առաջարկող շուկային: Որքանո՞վ է, ըստ ձեզ, դա իրատեսական:

- Մեքենայական ուսուցման ոլորտում մրցունակ լինելը պահանջում է էապես ավելի խոր մաթեմատիկական գիտելիքներ, քան ծրագրավորման շատ այլ ճյուղերում: Այդ գիտելիքների զգալի մասը դասավանդվում են Հայաստանի բուհերում, սակայն ուսանողները հաճախ արհամարհում են այդ դասընթացները: Մի պատճառն այն է, որ ցանկացած ուսանող ունի մի քանի ծանոթ, որոնք չեն սովորել մաթեմատիկա, բայց աշխատում են որպես ծրագրավորող եւ հայտարարում են, որ ծրագրավորման համար մաթեմատիկա պետք չէ: Մյուս կողմից, դասախոսները բավարար չափով չեն ներկայացնում մաթեմատիկայի այս կամ այն ուղղության կիրառությունը ժամանակակից ծրագրավորման մեջ, առավել եւս մեքենայական ուսուցման ոլորտում:

Այս խնդիրների հաղթահարման դեպքում շատ ավելի շատ ուսանողներ կունենան բավարար գիտելիքներ մեքենայական ուսուցման մասնագետ դառնալու համար: Այդ դեպքում, կարծում եմ, կարճ ժամանակում կստեղծվեն մեքենայական ուսուցման ծառայություններ տրամադրող ընկերություններ, առավել եւս, որ համաշխարհային շուկայում պահանջարկը շատ մեծ է: Կալիֆոռնիայում մեքենայական ուսուցման մասնագետներն այնքան «թանկ» են, որ բոլոր նորաստեղծ ստարտափները փորձում են մասնագետներ փնտրել Կալիֆոռնիայից դուրս: Ինձ հայտնի է այս բնույթի առնվազն մի ընկերություն Հայաստանում՝ DataMotus-ը: Այս ուղղությամբ որոշ քայլեր փորձում է անել նաեւ վերջերս հիմնադրված ArmDataLab-ը:

- Որքանո՞վ են հայկական տեխնոլոգիական ստարտափները հետաքրքրված արհեստական բանականության եւ մեքենայական ուսուցման ուղղություններով:

- Հայաստանյան մի շարք ընկերություններ արդեն կիրառում են մեքենայական ուսուցման տարրեր՝ իրենց ծրագրային լուծումներում: Վերջերս PicsArt-ը հնարավորություն ստեղծեց լուսանկարները ձեւափոխել հայտնի գեղարվեստական աշխատանքների ոճով: Դա նեյրոնային ցանցերի տիպիկ կիրառություն է: Teamable ընկերությունում մեքենայական ուսուցումը կիրառում են որոնման համակարգի որակը բարձրացնելու համար: FimeTech ընկերությունը վերջերս թողարկեց ChessFimee ծրագիրը, որը նեյրոնային ցանցերի միջոցով կարողանում է ճանաչել շախմատի տախտակի վրա պատկերված քարերը: Հետաքրքրությունը մեծ է, եւ, իմ տպավորությամբ, դանդաղ, սակայն հաստատուն տեմպերով աճում է:

Հրանտ Խաչատրյանի հետ զրուցել է Նարինե Դանեղյանը