10:41 | 24.11.10 | Интервью | exclusive 9751

«Armenian PowerSpell 2011 решил новый комплекс задач»

Интервью автора программы Armenian PowerSpell Армана Бошяна и директора ООО «Саак Партев–Папян» (официального дистрибютора программы) Айка Папяна агентству Медиамакс и порталу Itel.am

- На днях поступила в продажу новая версия программы по проверке орфографии, грамматики и пунктуации армянского языка Armenian PowerSpell 2011. Новая версия программы намного превосходит своего предшественника по возможностям, но хотелось бы узнать, в чем вы видите основной прорыв, сделанный в версии «2011»?

Арман Бошян. - Главный прорыв, по-моему заключается в том, что никогда еще не было cделано столь масштабного исследования о реальном состоянии дел в армянском языке. На нашем сервере скопилась статистика об около 2 млн ошибок на 1 млн страниц, сделанных пользователями предыдущей версии программы, анализ которых позволил нам понять, в каком направлении развиваться. Если Armenian PowerSpell 2009 был главным образом проверщиком орфографии, то PowerSpell 2011 решил комплекс задач, выйдя далеко за пределы простого «спелл-чекера».

Не секрет, что нами используется множество иноязычных слов, имеющих аналоги в армянском языке, которые, однако, приживаются с большим трудом. Возьмем хотя бы слово «հեռուստացույց»  (телевизор), которое многие из наших сограждан произносят и пишут с русской транслитерацией. Согласитесь, не каждый «спелл-чекер» любезно предложит пользователю, который написал, скажем, «տելեվիզռ», не просто заменить его на «հեռուստացույց», но и, на худой конец, подказать, что написать «տելեվիզոր» было б хотя бы грамотнее.

Как видете, мы решили не менять реальное положение дел, а просто улучшить его, чтобы те слова, которых нет (или еще нет) в языке хотя бы не писались так, как того хочется конкретному пользователю. Примеров транслитерации множество. Версия «2009» предлагала пользователям армянские аналоги слов, и то всего в 200 случаях, а «2011»-ая, помимо этого, еще и проверяет грамотность написания слова в транслитерации: если оно, скажем, английское «marketing», то правильная армянская транслитерация  будет не «մարկետինգ», а «մարքեթինգ» и т.д.

Аналогичным образом решается проблема терминов, большинства которых в армянском языке либо не существует, либо они подходят больше для сочинения анекдотов, нежели для применения в нормальной лексике. Для решения этой проблемы нам удалось собрать и стандартизировать около 5000 таких терминов из разных областей науки, экономики, математики, медицины.

Еще одна распространенная среди пользователей ошибка –  раздельное написание слов, которые следует писать слитно, например, «մինչ դեռ», «նույն իսկ» и т.д. Предыдущая версия программы не распознавала эту ошибку, поскольку в отдельности каждое из этих слов написано правильно. Теперь же программа анализирует сразу 3 слова в качестве одной связки, помогая исправить эту ошибку.

Анализ последовательности слов позволил также решить проблему таких специфических ошибок, когда в результате опечатки получается правильное словочетание, как, например, «կենտրոնական բանտ» (центральная тюрьма) вместо «կենտրոնական բանկ» (центральный банк) или «այդ իսկ պատառով» (именно этим ломтиком) вместо «այդ իսկ պատճառով» (именно по этой причине). Программа в таких случаях спрашивает пользователя, не хочет ли он вместо этого словосочетания применить другое, предлагая при этом ввести собственные правила для словосочетаний, когда дается строгое соответствие одного слова другому. Уверен, эта функция важна для компаний и госструктур.

Скажу также, что словарь новой версии программы пополнился почти на 300 тыс. слов, которых сейчас уже 850 тыс., что, по нашим оценкам, обеспечивает 99%-ное покрытие языка и является, на мой взгляд, колоссальным национальным достоянием.

- В своем прошлогоднем интервью нашему агентству мы выразили надежду, что следующая версия Armenian Powerspell станет полноценным инструментом для проверки армянской грамматики. Можно ли констатировать, что ваша цель достигнута?

Арман Бошян. - Если у предыдущей версии было 50 случаев анализа простейшей грамматики и пунктуации, то в новой – целых 500. То есть, программа проверяет грамматику и пунктуацию везде за исключением тех случаев, когда требуется смысловой анализ сложного предложения. Решение смысловых задач – следующий шаг в развитии Armenian PowerSpell.

Наиболее распространенные грамматические ошибки – неправильное склонение слов – решение которых дается в новой программе. Большие трудности у пользователей возникают также с пунктуацией, особенно, с примением «знака пояснения» («բութ»), отсутствующего в русском и английском. Предыдущая версия полностью игнорировала подобные ошибки, а в новой есть система обучающих напоминаний, взятых из учебников. В случае пунктуационной ошибки всплывают напонимания, объясняющие, почему в данном случае должен быть применен тот или иной знак.

Анализируя специфику 2 млн ошибок, мы поняли, что у большинства пользователей русское образование. Поэтому мы планируем добавить в интерфейс программы также русский язык, чтобы облегчить работу русскоязычного пользователя.

Хочу также обратиться к еще одной распространенной ошибке: пропущенным словам в тексте, из-за чего математическое моделирование предложения становится невозможным. PowerSpell 2011 решает эту проблему частично, подсказывая пользователю, что написанное им предложение труднопонимаемо.

- Печатающие на армянском с использованием кодировки Unicode сталкиваются с “багом” самого текстового редактора: Word автоматически делает заглавной первую букву слова, следующего после знака «.», который в армянском обозначает двоеточие.

Арман Бошян. - Программа распознает эту ошибку, которая, как вы отметили, заложена в кодировании, применяемом в Microsoft. Вообще, специфика армянского языка сильно затрудняет его математическое моделирование. Возьмем хоть букву «եւ» («ев»). Программе практически невозможно объяснить, где писать «ев» одной («եւ»), а где – двумя буквами («եվ»).

- Известно, что развитие программы затрудняло распространение ее пиратских копий. Как удалось произвести необходимый объем инвестиций в разработку новой версии?

Айк Папян. - Инвестиции в разработку новой версии обеспечили продажи Armenian PowerSpell 2009, успех которой был феноменальным. В числе наших клиентов порядка 2000 организаций, а география распространения превысила 10 стран. Это при том, что мы не рассматривали иностранные рынки в качестве приоритетных.

Думаю, успех предыдущех версии программы обусловлен ее большой востребованностью и проведенной нами маркетинговой кампанией, в частности, участием в технологических выставках и бизнес-форумах.

В знак благодарности нашим клиентам, мы решили, что не будем продавать им новую версию программы, а просто подарим годовую лицензию на пользование ею.

- Кстати, о маркетинговой и ценовой политике: какие изменения она претерпевает с выходом в свет новой версии?

Айк Папян. - Для новых пользователей стоимость первого года пользования программы составляет 14 тыс., после чего цена ежегодной подписки составит 11 тыс. драмов. Специальные предложения разработаны для тех корпоративных клиентов, которые устанавливают программу на большое число компьютеров. Для них подключение каждой единицы, естественно, обходится дешевле. Что же касается PowerSpell 2009, то она также продолжит продаваться, но уже по цене 8 тыс. драмов (ранее годовая лицензия программы стоила 9 тыс. драмов).

В настоящее время мы активно расширяем сеть партнеров, у которых можно приобрести продукт, работаем над облегчаем системы оплаты. Большинство пользователей скачивает программу на сайте www.powerspell.am, поэтому мы разместили на сайте подробную инструкцию установки продукта с учетом специфики систем безопасности компьютеров, которые могут принять программу за вредоностное ПО и, таким образом, затруднить ее установку.   

Что касается распространения программы за рубежом, здесь мы скорее всего заключим так называемые “вендорские соглашения”, чтобы дистрибуцией PowerSpell занимались компании, хорошо знакомые с конкретными рынками сбыта. Хочу подчеркнуть, что мы открыты для сотрудничества в области дистрибуции программы.

Отмечу также, что вместе с Armenian PowerSpell 2011 поступила в продажу еще одна наша программа – Armenian PowerConverter - представляющая собой конвертер документов на армянском из кодировки ANSI в Unicode, полностью сохраняющий оформление документа. Бессрочная лицензия на пользование этим инструментом стоит 20 тыс драмов.

В настоящее время ведется параллельная разработка армяно-русско-английского словаря Armenian PowerDictionary и программы по обработке переносов армянских текстов PowerWordWrap. После того, как они поступят в продажу, мы планируем включить все 4 программы в пакет Armenian PowerOffice и продавать по единой лицензии.