3 декабря 2019, 06:33 10 мин.

Чемпион по самой сложной настольной игре бросил спорт – потому что компьютер научился мыслить и творить

Автор

326

На прошлой неделе южнокорейский мастер игры в го и один из самых титулованных игроков в мире Ли Седоль объявил о завершении карьеры и сделал драматичное заявление: «После того, как искусственный интеллект начал играть в го, я понял, что не стану лучшим, даже если возглавлю рейтинг за счет безумных усилий. Теперь есть сущность, которую не одолеть».

Ли говорил о компьютере AlphaGo – разработке компании DeepMind, которую пять лет назад за 650 миллионов долларов купил Google. Машине кореец проиграл еще в 2016-м, но с тех пор искусственный интеллект стал только сильнее. А вообще победу компьютера над человеком в го считают настоящим прорывом, который потенциально может привести к масштабным изменения в мире.

Го долго не давалась компьютерам: все ходы не просчитать, нужны интуиция и абстрактное мышление

Программисты уже давно проверяют мощь искусственного интеллекта в сложных играх с лучшими из людей. Разработанный IBM компьютер Deep Blue обыграл Гарри Каспарова в шахматы еще в 1997 году. Перед матчем Каспаров думал: «Это просто машина. Машины глупые». Но после поражения признавался: «Я чувствовал – чуял, – что за столом был новый тип разума».

Чтобы победить Каспарова, Deep Blue использовал грубую вычислительную силу: после каждого хода программа просчитывала все возможные варианты развития событий и принимала решение на основе этих данных.

Но с го такой подход не работает из-за объема данных, которые нужно обрабатывать. В го игроки по очереди ставят черные и белые камни на доску 19 на 19. Задача игры – занять как можно больше территории, при этом запирая камни противника, не давая ему получить преимущество. В целом го похожа на знакомую многим по школе игру в точки – только сложнее.

Из-за размера доски уже для первого хода, который делают черные камни, возможен 361 вариант (в шахматах – всего 20). Соответственно, с каждым ходом древо потенциальных расстановок только разрастается. После первых двух ходов в шахматах существует 400 возможных развитий событий, в го – 129 960. В блоге Google, разработавшего AlphaGo, писали, что в целом количество возможных комбинаций больше, чем атомов во вселенной. Математик Джон Тромп подсчитал, что это будет 171-значное число.

Поэтому от людей в игре в го требуется не только интеллект и способность к расчетам, но и мощное абстрактное мышление, сильная интуиция – качества, которые слабо развиты у компьютеров. Один из разработчиков AlphaGo Демис Хассабис рассказывал: «Это очень интуитивная игра. Мастера го часто говорят, что сделали тот или иной ход, потому что он казался правильным». По его словам, у мастеров развивается особое эстетическое чувство, и хорошая позиция просто выглядит красиво.

Несмотря на то, что процессоры с каждым годом становятся все мощнее и быстрее, поиск ходов на древе возможностей помог искусственному интеллекту достичь в го только уровня сильного любителя. Компьютеры обыгрывали людей, но только получив фору в несколько камней.

В 2014-м Дэвид Фотланд, один из первопроходцев го для компьютеров, рассказывал, что программы сталкиваются с той же проблемой, что и люди: «Многие игроки достигают определенного любительского пика и не могут стать сильнее. Чтобы преодолеть это плато, нужно сделать какой-то ментальный скачок, и у программ возникают те же проблемы. Нужно смотреть на всю доску, а не только на локальные битвы».

Чтобы преодолеть этот интеллектуальный барьер и симулировать интуицию и эстетическое чувство профессионалов, разработчики AlphaGo подключили нейросети (сети процессоров и софта, симулирующие работу нейронов человеческого мозга) и алгоритмы глубинного обучения.

Сначала в нейросети AlphaGo скормили базу данных человеческих игр, в которую входило примерно 30 миллионов ходов. После этого он научился правильно предсказывать ход человека в 57% случаев, хотя предыдущий рекорд ИИ составлял 44%. Затем разработчики научили AlphaGo играть против самого себя – так компьютер научился еще лучше выделять максимально выгодные ходы и разрабатывать новые стратегии.

Все это помогло рационализировать процессы, на которых работал обыгравший Каспарова Deep Blue. Теперь система не просто разыгрывает все возможные комбинации, а умеет сосредотачиваться на наиболее перспективных вариантах развития событий. Кроме того, она ориентируется даже в ситуациях, с которыми еще никогда не сталкивалась. А такие из-за масштабности го оставались. За счет нового механизма AlphaGo обыграл всех ранее созданных компьютерных игроков (при этом давая им фору в четыре камня) и начал побеждать людей-профессионалов.

В октябре 2015-го AlphaGo разгромил двукратного чемпиона Европы француза Фань Хуэя. Они сыграли пять партий, никто не получал фору, и компьютер выиграл все пять. Это был первый случай, когда машина победила профессионального человека. После матча Хуэй рассказывал, что многому научился, и эти знания помогли ему прибавить и подняться в международном рейтинге.

А в 2016-м AlphaGo играл с Ли Седолем и победил 4:1. Этот матч, который только в Китае смотрели 60 миллионов человек, получился историческим по ряду причин.

Компьютер научился играть творчески, но креативность человека сбила алгоритм

Во-первых, как и Каспаров, Ли оказался не готов к тому, как хорошо играет компьютер. По его собственному признанию, первую партию он проиграл из-за этого.

Во-вторых, во второй партии компьютер продемонстрировал приобретенную креативность. В историю го этот момент вошел, как «Ход 37». Многим комментаторам он показался ошибкой – казалось, что ход машины никак не был связан со всем, что она делала раньше.

Но эксперты оценили. Фань Хуэй, работавший судьей на матче, потом рассказывал: «Это не человеческий ход. Я никогда не видел такой ход в исполнении человека. Так красиво». Обратите внимание на эстетический эпитет.

Ли после матча наоборот утверждал, что это был не компьютерный ход: «Я думал, что меня ждет очень эффективная машина, которая будет из сохраненных данных высчитывать лучший ход для каждой конкретной ситуации. Но некоторые ходы мне показались очень творческими. Они показывали красоту го, которую способны создавать только люди».

Этот ход подчеркнул проделанный искусственным интеллектом путь от простого перебора возможностей к мышлению. AlphaGo заточен на довольно консервативную игру, и если вероятность победы с небольшим преимущество составит 95%, а вероятность разгрома – 80%, компьютер выбирает первый путь.

Но Ход 37 не был консервативным. Разработчики AlphaGo позже посмотрели логи, чтобы понять, почему машина его выполнила. Оказалось, она понимала: вероятность того, что человек так поставит свой камень, составляла 1 к 10 000. Но AlphaGo принял такое решение, потому что посчитал его оптимальным для решения поставленной задачи. А еще потому, что оно поставило Ли в тупик – он на 15 минут отошел от стола и долго думал над ответом.

В целом кореец потом рассказывал, что по ходу второй партии у него никогда не было ощущения, что он ведет игру.

В-третьих, Ли в четвертой партии показал, что человеческая креативность может нарушать работу алгоритмов. К тому моменту он летел 0:3 и уже, чуть не плача, извинялся за то, что не смог побороться с компьютером. В какой-то момент он посчитал, что компьютер превосходит его в умении выполнять ходы, которые постепенно приводят к небольшому преимуществу. Поэтому на 78-м ходу после получаса размышлений он сам пошел на прием, вероятность которого, по оценкам AlphaGo, составляла 1 к 10 000.

В итоге машина не смогла к этому адаптироваться, допустила несколько ошибок, и за следующие 10 ходов вероятность ее победы, по ее собственным расчетам, упала с 70% до меньше 50% и выше этой отметки уже не поднималась. Комментаторы назвали действия Ли божественными.

Разработчики AlphaGo учли поражение и Ход 78, продолжили работу над алгоритмом и в 2017-м отправили обновленную систему играть с мастерами го онлайн. Результат? 60 побед, ноль поражений и одна ничья, которая случилась, потому что человек отключился от интернета. Своего предшественника модернизированный AlphaGo вынес в 100 партиях из 100, используя при этом куда меньше оборудования и вычислительных мощностей.

До искусственного разума еще далеко, хотя победа в го и прорыв

Не у всех победы компьютера вызывают такую же драматичную реакцию, как у Ли. Многие, наоборот, видят в них возможность для сотрудничества, которое в итоге принесет пользу человеку. Например, один из сильнейших игроков в мире Не Вэйпин, проиграв AlphaGo в интернете, сказал: «Го – не такая простая игра, как нам казалось. Людям еще многое в ней нужно исследовать. И бог го прислал эту машину, чтобы она помогла людям это сделать».

Другой китайский гроссмейстер Кэ Цзе тоже указывал на возможные прорывы: «Я полтора года изучал программы, теорию и применял все это на практике. Люди тысячелетиями развивались в игре, но теперь компьютеры говорят, что люди ничего не понимают. Думаю, вообще никто даже близко не приблизился к пониманию основ го».

Сейчас этот компьютер считается лучшим игроком в го в мире и, возможно, когда-нибудь приблизится к пониманию основ игры. Но у разработчиков другие цели. Команда DeepMind подчеркивает, что их искусственный интеллект не заточен только под го, а в будущем сможет решать совершенно не связанные с игрой задачи.

В целом специалисты указывают, что потенциально искусственный интеллект может привести к прорывам в робототехнике, научных исследованиях (вплоть до лекарства от рака), а в повседневной жизни могут появиться, например, не допускающие ошибок финансовые советники на основе ИИ и доступные всем беспилотные машины. А еще обещают, что нейросети будут писать музыку и книги не хуже людей.

С другой стороны, обещанные прорывы пока не наступают. Люди по-прежнему сами сидят за рулем, а американские политики обвиняют Россию в информационных диверсиях – хотя Марк Цукерберг больше года назад обещал Конгрессу, что искусственный интеллект решит проблему фэйковых новостей.

Более того, та же самая DeepMind, которая за счет разработки AlphaGo стала одним из лидеров в сфере искусственного интеллекта, с каждым годом несет все большие убытки: 154 миллиона долларов в 2016-м, 341 млн – в 2017-м, 572 млн – в 2018-м. Поэтому у некоторых экспертов есть опасения, что если в ближайшее время искусственный интеллект не совершит монетизируемый прорыв, пузырь может лопнуть и в эту сферу просто перестанут вкладывать деньги.

В целом консенсус такой: искусственный интеллект пока очень далек от того, что было показано в «Терминаторе», а мир все же в разы сложнее игры в го. До создания человекоподобных роботов еще очень далеко, потому что компьютеры сейчас даже не могут вести осознанный разговор и решать многие задачи, которые без проблем даются детям.

Но карьеру Ли Седоля компьютер уже завершил. Правда, не совсем. Кореец все еще консультирует разработчиков AlphaGo, а в декабре сыграет с корейским компьютером HanDol. Но в свою победу Ли не верит: «Даже с форой в два камня мне кажется, что я проиграю. Сейчас я даже не слежу за новостями го».

Звучит трагично.

Великая Французская революция началась на (почти) теннисном корте. Там буржуазия бросила вызов королю

Шахматы – великая настолка СССР: моду задал Ленин, а играли даже в космосе и во время войны

Фото: Gettyimages.ru/Google, Kim Min-Hee-Pool, Justin Sullivan; REUTERS/Peter Morgan; farrar-tanner.co.uk

почитать

122 комментария

С диалогами

Руслан Русанов

2 декабря 2019, 20:25

Да, немного странная фамилия для преимущественно мусульманской страны.

+299

Пользователь заблокирован

2 декабря 2019, 20:26

Го бухать.
Хоть тут пока мы фору этой железяке дадим

+216

Мятный Жмых

2 декабря 2019, 21:54

Прикладное применение AlphaGo.
> Ожидание - победа над раком, беспилотные автомобили.
> Реальность - реклама от Гугла станет еще более таргетированной.

+122

Какой же AlphaGo крутой!

+97

Андрей Савинов

2 декабря 2019, 21:01

Старый ии будет рассказывать молодому молодому внуку как когда то нагибал мешки с костями?

+83

Roman Moguchiy

2 декабря 2019, 21:28

«Тяжёлоатлет Иванов закончил карьеру, узнав, что автомобиль может поднять больше и увезти дальше».

+66

2 декабря 2019, 21:09

Не станет. Точнее, не в ближайшее время. Пока что наука даже не знает, что такое сознание. ИИ на данный момент всего лишь имитирует некоторые рутинные процедуры, которые людям тяжко делать. Но он не понимает.
Никого же не парит, что грузовик и подъёмный кран может поднять многотонный груз, тогда как лучшие из людей пару-тройку сотен кг. Это всего лишь расширение наших возможностей, без которых нельзя, например, строить большие сооружения. То же самое ИИ. Всего лишь расширение наших возможностей.

+52

AntOn

2 декабря 2019, 20:23

Разгромила чемпиона Европы француза Фэньхуэя ....
————-
Я завис и мне нужна перезагрузка

Сергей Новослов

2 декабря 2019, 21:06

Alpha Go: Мне нужна твоя одежда

+36

2 декабря 2019, 21:40

Вообще-то во Франции мусульманского населения ~6% - в 2 раза меньше чем в России.

+35

Mikhail Pakhomov

2 декабря 2019, 21:10

Ну то есть компьютер как бы помнил все зарегистрированные игры человечества и потом выбирал оптимальные ходы с помощью вычислительных мощностей. Логично, что один человек даже гениальный не сможет победить опыт сотен тысяч накопленный на десятилетия

+33

2 декабря 2019, 23:15

А новый ИИ в каждую годовщину победы будет писать "Спасибо деду за победу!"

+28

daimon13

2 декабря 2019, 21:26

Специально для вас сделали AlphaZero. Этому показали правила и посадили играть с самим собой. Через 4 часика он обыграл AlphaGo.

+24

Рамон Футу

3 декабря 2019, 00:00

скажи это Бендеру, у которого свой лунный модуль, с блэкджеком и шлюхами!

+20

a2wai

2 декабря 2019, 20:41

АльфаГо играет в лоб, примерно такой же подход Дипмайнд использовали для разрботки бота в Старкрафте и бот закономерно разлетелся в пух и прах от всех, кто играл против него нестандартные стратегии и тем самым смущал бота, не понимавшего, что делать.

2 декабря 2019, 21:38

Кс го не такая и сложная

+18

Джонатан Блантраун

3 декабря 2019, 10:45

Проверил твою инфу. Абсолютно все цифры гонево. Не сиди на расистских сайтах

+12

Максим Боровиков

2 декабря 2019, 20:32

Очень интересно, спасибо за материал.
Возможно, через лет 100 это эпизод будут вспоминать как важную веху..

Григорий Ефимов

2 декабря 2019, 22:41

Спасибо за интересную статью. Понимаю переживания Седоля, он хочет быть лучшим в этой игре без звездочки, а получается только лучший среди людей. Но все таки это нормальное развитие технологий, и не стоит из-за этого так убиваться. Помню, как после победы компьютера над Каспаровым читал статью на тему компьютеров в шахматах, и там автор высказал очень дельную мысль. Да, компьютер уже сейчас побеждает (пусть и не без труда) чемпиона мира, а скоро, с таким развитием, будет побеждать любого легко. Но это уже неважно - потому что с компьютером уже никто не будет играть. Какой смысл? Так и произошло, и шахматы от победы компьютера не то чтобы загнулись. Да, они не в таком почете, как в 20 веке, но дело тут далеко не только в победе компа. И интерес к ним все еще очень большой. Вот и здесь - единственной ничьей добился человек, который отключил интернет)) Если это спорт - то нет смысла соревноваться с машиной. Как правильно здесь написали - никто же не бегает наперегонки с автомобилем.

+11

2 декабря 2019, 21:11

Сложность на порядок выше. Я как-то пытался в онлайне сыграть - очень и очень тяжело, не сравнить с шахматами (которые, к слову, тоже нельзя назвать легкой игрой).

+10

gOld_Men

3 декабря 2019, 01:29

судя по комментам в сети у некоторых людей как раз интеллект на уровне лягушки)

Mizuntrope88

2 декабря 2019, 22:33

Ты тупее китайского тетриса.

_q53_

2 декабря 2019, 21:37

Нейросети не так работают. Они не "помнят", а формируют деревья коэффициентов для оценки ситуаций с которыми раньше не встречались. По примерно такому же принципу работает и человеческий мозг. Просто сейчас мощностей хватает на машину с интеллектом приблизительно лягушки. Но лет через 10 можно уже будет браться за интеллект человека.

Но текст интересный, спасибо за него автору.

king23kong

2 декабря 2019, 20:47

Первый раз слышу об этой игре, но прочитал с огромным удовольствием. Спасибо огромное за труд, было очень интересно!

Genie86

2 декабря 2019, 22:54

"Чукча и геолог собирают камушки на берегу океана. Вдруг видят направляющегося к ним голодного белого медведя. Ружья нет.
Чукча хватает лыжи и начинает их надевать. Геолог:
- Бесполезно. Все равно ты не сможешь бежать быстрее медведя.
- А мне и не надо бежать быстрее медведя. Мне надо бежать быстрее тебя!"
_________________________

ИИ не нужно быть абсолютным мастером в чем-либо, не нужно достигать совершенства, не нужно просчитывать все ходы в го... ИИ, чтобы вытеснить человека, достаточно всего лишь обойти человека. А теперь посмотрите вокруг, на людей, что нас окружают: действительно ли сложно обойти в чем-либо 99% людей? Людей, строчащих однотипные отчеты между просмотрами вконтакте и ютуба; людей, которые крутят баранку или выдают пакеты на кассе?

Я работаю в науке, и несмотря на всю сложность этого процесса, ИИ достаточно легко заменит собой абсолютное большинство ученых. Несмотря на человеческие моменты вдохновения, остальные 95% времени ИИ будет на порядок эффективнее.

Результат AphaGo показывает, что если же задаться целью и натренировать ИИ на определенную узкую задачу, то ИИ без проблем уделает даже лучших из людей (в чем-либо). Проходят времена, когда чтобы добиться успеха, нужно было "бежать быстрее" другого человека.

Интуиция и эстетика хода у игроков го связаны с тем, что определенные ходы являются более выигрышными, и мы на бессознательном уровне их запоминаем и воспроизводим. Только вот нейросеть умеет делать ровно то же самое, но быстрее и эффективнее...

3 декабря 2019, 13:39

Как у вас с головой, всё нормально?
Он утверждает, что во Франции у мусульман коф. рождаемости 8.1(!!!). Хотя, даже в стране, с самым высоким уровнем рождаемости(Нигере) этот показатель равняется на 2019 год в районе 7 находится (или 6.49 если брать во вниманию твою ссылку) О ЧЕМ можно вести разговор с человеком, который НАСТОЛЬКО далёк от демографии, что пишет такую чушь?
У "мусульман" во Франции TFR равняется приблизительно 2.6 . В Германии, у турков было вовсе 1.8

2 декабря 2019, 23:07

а разве с человеком не так?

Перефразируя: проблема ИИ в том, что это не "халява", им заниматься еще нужно, обучать и т.д. "Халявы" в природе не бывает: хотите какой-то положительный результат - надо вкладываться. Другое дело, что обучить ИИ (один раз) проще и дешевле, чем множество человек. И ИИ вполне может самообучаться, что как раз и указали в статье: он играл сам с собой, тренируясь.

Проблема ИИ лишь в неумении ставить перед собой цели (отсутствует целеполагание). Но это проблема только для ИИ, человеку только в радость пока, что ИИ еще не научился ставить перед собой цели.

Mikhail Sinaiskiy

2 декабря 2019, 23:01

Как же банально это звучит.

2 декабря 2019, 21:22

Я какой-то пессимист) слава роботам! смерть всем человекам!)
Лет пятьдесят назад не могли даже подумать, что программа обыграет человека в шахматы, когда это случилось, то подумали "ну ладно, го есть, там человека никто не обыграет - слишком много вариантов" - и вот. Глядя за таким прогрессом, как нейросети обманывают друг друга не хуже, а то и лучше людей(что гораздо сложнее, ибо сражаешься с равным, а среди человеков всегда лохи найдутся(я себя не исключаю из их числа)) и учатся друг у друга...
Вариант со всякими Скайнетами и ядерными ударами - это глупо, конечно. Но есть вариант, когда человечество машинам станет попросту не нужно. Мы в них нуждаемся, а они в нас - нет, представляете? Машины добывают какой-нибудь уран и везут его на АЭС, или ГЭС строят для себя под руководством распределенного овермайнда. Чтобы батарейки подзаряжать.
Ну и всё такое. Пока нереальный вариант, но мало ли.
Вариант похуже был у Кинга в "Грузовиках". Спойлерить не буду, тем более, что книженция небольшая, но, как почти всегда у Кинга - никаких хеппи-эндов :)