Математики из МФТИ и Академии наук сделали большой шаг в создании алгоритмов, которые распознают речь таким же образом, как это делает человек. Их выводы были представлены в журнале Programming and Computer Software.
"Мы поняли, описали и смоделировали момент зарождения языка. Дальше нам нужно снабдить идентификаторами образы, действия и эмоциональные оценки. И нужно это вот для чего. У человека нет USB-разъемов, и считать базу знаний или записать ее никакой возможности нет. Поэтому язык — единственный способ в природе передать знания", — рассказывает Александр Жданов, профессор МФТИ и сотрудник ИТМиВТ РАН.
В последние годы, благодаря развитию математики и росту вычислительных мощностей компьютеров, у ученых появилась возможность "собирать" сложные нейросети, системы искусственного интеллекта, способные исполнять нетривиальные задачи и даже "мыслить" креативно, создавая новые образцы искусства и технологий.
К примеру, только за последние два года ученые создали ИИ, способные распознавать даже самую невнятную речь, обыграть человека в "непросчитываемую" древнекитайскую игру Го, отыскивать важнейшие события в истории по газетам, писать сценарии к компьютерным играм и раскрашивать фотографии и видеоролики под Ван Гога, и рисовать свои собственные картины.
У всех подобных нейросетей, как отмечает Жданов, есть один большой недостаток – мы не совсем до конца понимаем, как они обучаются и работают. Более того, как показывают наблюдения за процессом их обучения и их типичные ошибки, они "мыслят" не так, как это делает человек. Это не позволяет использовать их для изучения тайн сознания и действительно "естественной" имитации беседы или других взаимодействий с человеком.
Одной из причин этого, как сегодня считают многие ученые, является то, что фактически все современные нейросети не умеют "дообучаться", менять принципы работы прямо во время исполнения своих прямых обязанностей. Подобное умение — отличительная черта их природных "кузин" в мозге людей и других высших живых существ.
Как передает пресс-служба МФТИ, группа Жданова на протяжении последних десяти лет занимается изучением принципов работы мозга, созданием набора математических формул, описывающих процессы, которые происходят в его нервных клетках.
В отличие от традиционных нейросетей, где задачу распознавания какого-то образа или слова решает вся сеть, "виртуальный мозг" Жданова и его коллег состоит из множества "автономных" нервных клеток, способных к обучению и анализу воспринимаемых данных. Это усложняет ее конструкцию, но позволяет ей самообучаться и реагировать на стимулы так, как это делают реальные нейроны.
Эту черту подобных виртуальных нейронов, как выяснили Жданов и его коллеги, можно использовать и для создания систем распознавания речи, работающих так же, как это делают соответствующие центры в мозге человека.
В соответствии с их идеей, набор из большого числа подобных виртуальных нервных клеток будет формировать ассоциативные связи между теми предметами, которые он наблюдает или воспринимает, и какими-то другими событиями, которые происходят в этот же момент времени.
К примеру, если робот будет двигаться через лабиринт с препятствиями, и каждый его поворот будет сопровождаться фразами "поверни налево/направо", через некоторое время он будет ассоциировать эти звуки, преобразованные нейронами в особые шаблоны активации, с реальным действием.
Через некоторое время, как показали Жданов и его коллеги, робот начинает реагировать уже только на слова и их отдельные компоненты, а также их произвольные комбинации, самостоятельно и спонтанно обучаясь ими пользоваться. Подобным образом, как считают ученые, происходит формирование речевых навыков у детей и людей, не знающих того или иного языка.
По информации https://ria.ru/science/20180711/1524378746.html
Обозрение "Terra & Comp".