Страница «372. Искусственный интеллект учится сотрудничеству лучше людей» от 06.06.2017 19:37 преобразована в запись рубрик сайта.
Макаров
Компьютер впервые обучился кооперации в играх, целью которых является достижение наилучшего результата для всех игроков. Это оказалось на порядок сложнее, чем обучить машину побеждать в соревновательных играх, таких как шахматы или шашки. Но именно этот фактор в будущем поможет в разы улучшить взаимодействие человека и искусственного интеллекта.
Двадцать лет назад суперкомпьютер победил тогдашнего действующего чемпиона мира по шахматам Гарри Каспарова. Совсем недавно исследователи ИИ разработали программы, которые могут побеждать людей в более требовательных к вычислительной технике играх, таких как го и покер. Но это все игры типа «победитель получает все», в которых один игрок выигрывает, а остальные проигрывают. Исследования не были рассчитаны на совместные игры, целью которых является кооперация игроков для оптимизации результатов для всех участников — даже если логика говорит о том, что игрок может улучшить свой личный результат, «предав» других игроков.
Классическая теория игр предполагает «дилемму заключенного», где двум людям предъявлено обвинение в преступлении. Каждому может быть назначено наказание, скажем в 1 год, если оба останутся верны друг другу и не признают своей вины. Если один выдаст другого, то он попадет на свободу, в то время как другой останется в тюрьме надолго. Если оба обвиняют друг друга, то оба же и получат срок, но более длительный, к примеру 2 года. Индивидуальная стратегия предполагает предательство и риск, а коллективная — неизбежное, пусть и краткое заключение.
Якоб Крандалл, компьютерный ученый из Университета Бригама Янга в Прово, штат Юта, и его коллеги хотели посмотреть, смогут ли машины научиться играть в такие игры. Таким образом, исследователи заставили людей и компьютеры вместе играть компьютерные версии стратегических игр, в том числе и «генератор переменного тока». Команды состояли из двух человек, двух компьютеров или одного человека и одного компьютера. Исследователи протестировали 25 различных алгоритмов машинного обучения — программ ИИ, которые могут улучшить их производительность, автоматически отыскивая корреляции между ходами и результатами.