Статті

Приятно поговорить с умным ноутбуком


Билл Гейтс предсказывает, что вскоре традиционные средства управления компьютером уйдут в прошлое. Украинские ученые одни из тех, кто работает над воплощением этого прогноза в жизнь: сейчас они готовятся отучить пользователей от мышки и клавиатуры. Теперь устройством ввода информации станет звук.
Пользователи будут общаться с компьютером, как с человеком: говорить ему, что найти, перевести, напечатать.
Обучают компьютер распознавать украинскую речь в Международном научно-учебном центре информационных технологий и систем при НАН Украины и Минобразования. Исследования проходят в рамках государственной научно-технической программы «Образный компьютер».

Компьютер пойдет на голос

За последние 20 лет произошел огромный прогресс в вычислительной технике, но сейчас развитие этих систем фактически дошло до физического барьера: нынешними методами невозможно кардинально усовершенствовать компьютер. Качественный скачок должен произойти за счет принципиального изменения подхода к организации общения человека и механизма.
Украинский «Образный компьютер» – часть мировой тенденции безклавиатурного развития компьютеров. Билл Гейтс, покидая пост руководителя корпорации «Майкрософт», заявил, что в будущем клавиатуры выйдут из числа обязательных атрибутов ПК: их заменят сенсорные экраны и технологии распознавания голоса. Уже через 5 лет, по мнению Гейтса, количество голосовых поисковых интернет-запросов превысит обычные текстовые поисковики.

Ассоциации к слову «майдан»

Ученые принялись реализовывать то, о чем давно уже писали и пишут научные фантасты, – искусственный интеллект. Компьютер должен слышать и понимать речь, общаться, выстраивать логические цепочки, искать не по ключевым словам, как сейчас, а по ассоциативным связям. То есть если вы ищете «оранжевая революция», то компьютер также должен находить все связанное со словом «майдан».
Первые успешные шаги в этом направлении сделаны в Киеве еще в 1960-х годах: подход, предложенный тогда инженером Тарасом Винцюком, лежит в основе наиболее успешных в мире современных алгоритмов распознавания. Сейчас ученые научили компьютер распознавать не только отдельные слова и фразы, но и переводить их на другие языки.

СЛОЖНОСТИ ПЕРЕВОДА

«Мы создали 12 тематических электронных разговорников, – рассказал «24» руководитель разработчиков систем распознавания звука Николай Сажок. – Сказал человек компьютеру «Здравствуйте, я рад вас видеть» на украинском языке, он это распознал и тут же перевел на английский. В наших планах выпустить подобные словари на небольших устройствах».
Научить компьютер распознавать человеческую речь – сложнейшая задача. У каждого из нас своя интонация, скорость речи, тембр голоса и т. д. «Распознавание делится на два этапа: обучение компьютера (нужно ввести базу данных звуков, акустических образов каждой фонемы, а их в украинском языке 58) и собственно само машинное распознавание», – объясняет Николай Сажок.
Два года назад 35-летний ученый получил президентский грант для одаренной молодежи. После выплаты всех налогов сумма составила 50 тыс. грн. Затем он собрал свыше 100 записей голосов людей в разных уголках Украины, чтобы создать звуковые образы некоего стандартного украинца.
Разнообразие диалектов украинского языка, несомненно, усложняет задачу распознавания голоса. Разница в говоре закарпатца и киевлянина существенна даже для человека, не говоря уже о машине. Выход из положения только один – заставить всех разговаривать с компьютером на литературном украинском языке.

Программа пишет диктант

Кроме тематических словарей, разработана и программа «Фонетический стенограф», которая теоретически должна узнавать любую тематику. Распознавание проходит следующим образом. Вы надиктовываете компьютеру слова. Он их получает в виде осциллограмм и начинает обрабатывать. Вначале он видит фонемы, от них переходит к последовательности слогов и на этой основе старается восстановить слово. А затем уже из слов составляет предложение.
Если тематический словарь дает допустимые 5% брака, то общий – в разы больше. К завершению действия программы «Образный компьютер» в 2010 г. ученые обещают усовершенствовать ее и надеются, что им удастся найти инвестора, который профинансировал бы выпуск электронных тематических словарей-разговорников на отдельных устройствах размером с диктофон. Ведь не будет же человек постоянно ходить с ноутбуком и просить его перевести то или иное словосочетание.
«Аналогов нашей разработке, безусловно, много, и многими из них можно пользоваться, – соглашается Сажок. – Но они не понимают украинский язык, а воспринимают английский и некоторые другие. Никто, кроме нас, компьютер украинскому не научит».

Ця стаття є передруком статті Ярослава Загоруя Приятно поговорить с умным ноутбуком.