Повелители из Google нагнув Корейцев в ГО, идут нагибать их в Starcraft 2

**morda911** · 12.03.2016, 00:10

Сообщение от Ved

В том же, в чем и в шахматах, компьютер не может просчитать все варианты, чтобы однозначно решить, какой ход с большей вероятностью приведет к победе, а какой нет.

Это невозможность предсказать будущие ходы. Информация о текущей позиции там исчерпывающая, как в шахматах. Разве нет? Неполная информация - например, покер, где в текущей позиции есть неизвестные составляющие. Типа так: https://ru.wikipedia.org/wiki/%D0%98...B8%D0%B5%D0%B9

- - - Добавлено - - -

Сообщение от NoTimeToWait

Невозможность оценить ценность того или иного хода в конкретном случае.

Это не определение игр с неполной информацией. Данный термин подразумевает исчерпывающую информацию о текущей позиции. Она полная и одинаковая и всех игроков.

**NoTimeToWait** · 12.03.2016, 00:13

Сообщение от morda911

Это невозможность предсказать будущие ходы. Информация о текущей позиции там исчерпывающая, как в шахматах. Разве нет? Неполная информация - например, покер, где в текущей позиции есть неизвестные составляющие. Типа так: https://ru.wikipedia.org/wiki/%D0%98...B8%D0%B5%D0%B9

- - - Добавлено - - -

Это не определение игр с неполной информацией. Данный термин подразумевает исчерпывающую информацию о текущей позиции. Она полная и одинаковая и всех игроков.

Да, но речь и не шла про данное понятие, верно? Речь лишь шла о том, что игроки играют обладая неполными знаниями о ситуации на доске. То, что была использована искаженная терминология - не противоречит сути сказанного

Сообщение от morda911

"Неполность" знаний в шахматах и ск2 (sc:bw) сильно разная. Кстати, а в чём неполность знаний в Го? Часть позиции скрыта или как?

чуть ранее ты писал. Насколько я вижу, речь о ситуационных знаниях

**BlackMokona** · 12.03.2016, 07:55

Сообщение от morda911

"Неполность" знаний в шахматах и ск2 (sc:bw) сильно разная. Кстати, а в чём неполность знаний в Го? Часть позиции скрыта или как?

- - - Добавлено - - -

В этих статьях это математически точно доказано или там частное мнение какого-то человека?

- - - Добавлено - - -

Серьёзно? Нифига себе. А где я пишу, что это изи каточка?
Но раз сложность именно в этом, следует ли понимать так, что полный перебор - слишком изи, чтобы пробовать и, появись завтра новость, что он таки случился, то ты бы не удивился?

Математически, мнение огромного количества народа.

Стандартный пример из вики

В течение долгого времени считалось, что компьютерное го имеет существенные различия по сравнению с компьютерными шахматами, поскольку методы, основанные на быстром поиске по сравнению с человеческим опытом, объединённые с относительно низким знанием предметной области не будут эффективны для го. Поэтому большие усилия в области компьютерного го были потрачены на объединение экспертных знаний с локальным поиском для нахождения ответа на вопросы тактической природы игры. Результатом этих усилий были программы, способные находить хорошие решения в некоторых локальных ситуациях, но имевшие явные слабости в полной обработке игры. Кроме того, эти классические программы с увеличением мощности аппаратуры мало получали в плане силы игры и поэтому развитие этой области было в целом медленным. Поэтому считалось, что программа, хорошо играющая в го, может быть создана только в далёком будущем и только с помощью накопленных к тому времени общих знаний в области искусственного интеллекта. Даже написание программы, способной определить победителя в законченной игре, воспринималось как нетривиальная задача.

**morda911** · 12.03.2016, 09:32

Сообщение от NoTimeToWait

Да, но речь и не шла про данное понятие, верно?

Нет, не верно. Потому что в шахматах и го у игроках полное, одинаковое знание, а в ск2 и ск:бв - нет. Если к понятию "полная информация" притягивать знание будущих ходов, то исчезает смысл самой игры, очевидно.

- - - Добавлено - - -

Сообщение от BlackMokona

Математически, мнение огромного количества народа

Не увидел математического доказательства, разве что "миллионы мух не могут ошибаться". Раньше про шахматы то же самое говорили, про интуицию. Как сейчас помню, собирался в утром в универ и услышал по ящику что deep blue натянул Каспарова. Во энтузиазму было. Сейчас то же самое пишут про го. В чём принципиальная разница? В количестве вариантов? Вот с ск:бв разница и правда принципиальная: неполная информация.

- - - Добавлено - - -

Сообщение от Ved

Да, офк, но мы же говорили про другое.

Мы говорили про отличие го от ск2 и ск:бв. Для алгоритма нет разницы, действительно?

**RobosergTV** · 12.03.2016, 09:44

Сообщение от morda911

Раньше про шахматы то же самое говорили, про интуицию.

По этому и говорили, что просчитать все возможные ходы не мог даже ПК, человек уж тем более. Вот и имелось в виду, что человек использует эвристику, для обычного человека известную как "интуиция"

- - - Добавлено - - -

Сообщение от morda911

Вот с ск:бв разница и правда принципиальная: неполная информация.

Именно потому, стратегия еще более сложная задача, чем го или шахматы.

**morda911** · 12.03.2016, 10:28

Сообщение от RobosergTV

По этому и говорили, что просчитать все возможные ходы не мог даже ПК, человек уж тем более. Вот и имелось в виду, что человек использует эвристику, для обычного человека известную как "интуиция"

Не думал, что доживу до цитирования самого себя:

Сообщение от morda911

И человек не может. Из этого следует, что для того, чтобы обыграть одного непросчитывающего, другому не требуется просчитывать все возможные комбинации. Большая работа, но не чудо.

Не понимаю царящего безграничного восторга и оптимизма

Сообщение от RobosergTV

Именно потому, стратегия еще более сложная задача, чем го или шахматы.

Задача иной категории: Игра с неполной информацией (определение смотри выше по ветке)

**BlackMokona** · 12.03.2016, 10:36

Сообщение от morda911

Нет, не верно. Потому что в шахматах и го у игроках полное, одинаковое знание, а в ск2 и ск:бв - нет. Если к понятию "полная информация" притягивать знание будущих ходов, то исчезает смысл самой игры, очевидно.

- - - Добавлено - - -

Не увидел математического доказательства, разве что "миллионы мух не могут ошибаться". Раньше про шахматы то же самое говорили, про интуицию. Как сейчас помню, собирался в утром в универ и услышал по ящику что deep blue натянул Каспарова. Во энтузиазму было. Сейчас то же самое пишут про го. В чём принципиальная разница? В количестве вариантов? Вот с ск:бв разница и правда принципиальная: неполная информация.

- - - Добавлено - - -

Мы говорили про отличие го от ск2 и ск:бв. Для алгоритма нет разницы, действительно?

Количество вариантов больше настолько, и длинна планирования, что попытаться сыграть мускулами без шансов. Требуется именно понимание игры, а не сделай триллион рассчётов с отбрасыванием любого бреда, с данными дебьютов и эндшпилей заранее просчитаных. Тем более в ГО и того и другого нет, из-за оссобеностей игры.

**Or2dox** · 12.03.2016, 10:39

Не вижу принципиальной разницы между программированием ИИ для шахмат или для ск.
По сути любой ИИ в современном понимании в основе своей все равно остается примитивным набором сравнений и конструкций if.
Как компьютер играет в шахматы - есть объективные критерии оценки позиции - положение пешек и фигур, преимущество по материалу, уязвимость позиции короля и т.п. Так вот, по сути он просто берет текущую позицию и начинает от нее просчитывать все возможные варианты развития событий на 1-2-3-10 ходов вперед и в конце концов выбирает тот ход, который в максимальном (в идеале во всех) количестве вариантов приведет к лучшей позиции. Нет необходимости просчитывать всю партию до конца, можно ограничиться определенной глубиной если известны критерии оценки получающихся позиции. Насколько я понимаю с этим связана и сложность Го для компьютера - там критерии оценки позиции гораздо более сложные, чем в шахматах.

Мне кажется, все то же самое можно спроецировать и на ск - есть объективные критерии оценки позиции в данный момент (с учетом не полных знаний о действиях противника), есть варианты действий в данной позиции, есть миллионы реплеев про-игроков. Дальше анализ, например, противник поставил раннюю третью, возможные варианты ответов и их предпочтительность на основе тех самых миллионов реплеев и известных исходов игр. С шахматами в этом плане проще - они не меняются, а в ск2 - любой патч может потребовать нового сбора большой статистики (тех самых миллионов реплеев), поэтому логичен выбор ск1, который уже давно не меняется.

**BlackMokona** · 12.03.2016, 10:41

Сообщение от Or2dox

Не вижу принципиальной разницы между программированием ИИ для шахмат или для ск.
По сути любой ИИ в современном понимании в основе своей все равно остается примитивным набором сравнений и конструкций if.
Как компьютер играет в шахматы - есть объективные критерии оценки позиции - положение пешек и фигур, преимущество по материалу, уязвимость позиции короля и т.п. Так вот, по сути он просто берет текущую позицию и начинает от нее просчитывать все возможные варианты развития событий на 1-2-3-10 ходов вперед и в конце концов выбирает тот ход, который в максимальном (в идеале во всех) количестве вариантов приведет к лучшей позиции. Нет необходимости просчитывать всю партию до конца, можно ограничиться определенной глубиной если известны критерии оценки получающихся позиции. Насколько я понимаю с этим связана и сложность Го для компьютера - там критерии оценки позиции гораздо более сложные, чем в шахматах.

Мне кажется, все то же самое можно спроецировать и на ск - есть объективные критерии оценки позиции в данный момент (с учетом не полный знаний о действиях противника), есть варианты действий в данной позиции, есть миллионы реплеев про-игроков. Дальше анализ, например, противник поставил раннюю третью, возможные варианты ответов и их предпочтительность на основе тех самых миллионов реплеев и известных исходов игр. С шахматами в этом плане проще - они не меняются, а в ск2 - любой патч может потребовать нового сбора большой статистики (тех самых миллионов реплеев), поэтому логичен выбор ск1, который уже давно не меняется.

Ноуп, смотри как АльфаГо работает
https://geektimes.ru/post/270248/

Алгоритм

Го давно считается игрой, обучить в которую искусственный интеллект затруднительно из-за огромного пространства поиска и сложности выбора ходов. Го принадлежит к классу игр с совершенной информацией, то есть игроки знают обо всех ходах, которые ранее совершили другие игроки. Решение задачи поиска исхода игры связано с вычислениями функции оптимального значения в дереве поиска, содержащем приблизительно bd возможных ходов. Здесь b — это количество корректных ходов в каждой из позиций, а d — длина игры. Для шахмат эти значения составляют b ≈ 35 и d ≈ 80, и полный поиск не представляется возможным. Поэтому позиции фигур оцениваются, а потом оценка учитывается при поиске. В 1996 году компьютер впервые выиграл в шахматы у чемпиона, а с 2005 года ни один чемпион уже не в состоянии выиграть у компьютера.

Для го b ≈ 250, d ≈ 150. Возможных позиций камней на стандартной доске более, чем в гугол (10^100) раз больше, чем в шахматах. Число возможных позиций больше, чем атомов во Вселенной. Осложняет ситуацию то, что предсказать ценность состояний трудно из-за сложности игры. Два игрока размещают камни двух цветов на доске определённого размера, стандартное поле — это 19×19 линий. Правила варьируются деталями, но основная цель игры проста: нужно отгородить на доске камнями своего цвета территорию большего, чем соперник, размера.

Существующие программы умеют играть в го на уровне любителей. Они используют поиск в дереве Монте-Карло для оценки ценности каждого состояния в дереве поиска. Также в программы заложены политики, которые предсказывают ходы сильных игроков.

В последнее время глубинные свёрточные нейронные сети смогли добиться хороших результатов в распознавании лиц и классификации изображений. В Google ИИ даже самостоятельно научился играть в 49 старых игр Atari. В AlphaGo похожие нейросети истолковывают положение камней на доске, чем помогают оценить и выбрать ходы. В Google исследователи применили следующий подход: они использовали сети ценности (value networks) и сети политики (policy networks). Затем эти глубинные нейросети обучаются как на множестве партий людей, так и на игре против своих копий. Новым является также поиск, объединяющий метод Монте-Карло с сетями политики и ценности.

Нейросети натренировывали в нескольких стадиях машинного обучения. Сначала проводилось контролируемое обучение сети политики прямо с помощью ходов игроков-людей. Другая сеть политики подвергалась обучению с подкреплением. Вторая играла с первой и оптимизировала её, чтобы политика сдвигалась к выигрышу, а не просто предсказаниям ходов. Наконец, проводилось обучение с подкреплением сети ценности, которая предсказывает победителя игр, в которые играют сети политики. Конечный результат — это AlphaGo, комбинация метода Монте-Карло и сетей политики и ценности. Был достигнут результат корректного предсказания следующего хода в 57 % случаев. До AlphaGo лучший результат составлял 44 %.

В качестве входных данных для обучения использовались 160 тыс. игр с 29,4 млн позиций с сервера KGS. Брались партии игроков с шестого по девятый дан. Миллион позиций был выделен для тестов, а собственно обучение велось на 28,4 млн позиций.
Для работы алгоритмов нужны на несколько порядков большие вычислительные мощности, чем при традиционном поиске. AlphaGo представляет из себя асинхронную многопоточную программу, которая выполняет симуляцию на ядрах центрального процессора и запускает сети политики и ценности на видеочипах. Финальная версия выглядела как 40-поточное приложение, запускаемое на 48 процессорах (вероятно, имелись в виду отдельные ядра или даже гиперпоточность) и 8 графических ускорителях. Также была создана распределённая версия AlphaGo, которая использует несколько машин, 40 потоков поиска, 1202 ядер и 176 видеоускорителей.

Полностью с отчётом DeepMind можно ознакомиться в документе.

**morda911** · 12.03.2016, 10:45

Сообщение от BlackMokona

Требуется именно понимание игры

Ты хочешь сказать, что нейросеть понимает (в человеческом значении смысла этого слова) игру?

**BlackMokona** · 12.03.2016, 10:46

Сообщение от morda911

Ты хочешь сказать, что нейросеть понимает (в человеческом значении смысла этого слова) игру?

Именно так

Человек это тоже нейросетка

**В.К.** · 12.03.2016, 10:54

Flash on DeepMind: "I think I can win"

**Or2dox** · 12.03.2016, 10:58

Сообщение от BlackMokona

Ноуп, смотри как АльфаГо работает
https://geektimes.ru/post/270248/

Что ноуп? Не вижу в общем-то противоречий - все сводится к получению критериев анализа позиции на основе миллионов реплеев. Только в данном случае работу выполняет нейронная сеть.
Я, кстати, по нейронным сетям диплом писал, обучал свою прогнозировать курс доллара (по сути делать экстраполяцию имеющихся данных). Интересная вещь, но спорная сама по себе. Потому что принципы и механизмы человеческого мышления еще не до конца изучены и поняты. Получается что мы не знаем как работает мозг, но пытаемся скопировать принцип его работы (ну собственно нейронная сеть).

**morda911** · 12.03.2016, 11:01

Сообщение от BlackMokona

Именно так. Человек это тоже нейросетка

Когда эта сетка пройдёт хотя бы полноценный тест Тьюринга, без такой вот гомосятины: "Тест Тьюринга считался пройденным, если компьютеру удалось бы вводить собеседника (человека) в заблуждение на протяжении хотя бы 30 % суммарного времени.", тогда это будет справедливо. А пока что из описанного тобой "Ноуп, смотри как АльфаГо работает" никакого понимания, в человеческом смысле, не прослеживается.

**RobosergTV** · 12.03.2016, 11:07

Сообщение от morda911

Не понимаю царящего безграничного восторга и оптимизма

Видимо потому, что ты в этой области мало что понимаешь

- - - Добавлено - - -

Сообщение от morda911

никакого понимания, в человеческом смысле, не прослеживается.

С каких это пор интеллект должен равняться на человеческий? Это очень эгоистично и не дальновидно.

- - - Добавлено - - -

Сообщение от morda911

Игра с неполной информацией (определение смотри выше по ветке)

Я все это знаю давно давно и слежу за ИИ уже давным давно.

**morda911** · 12.03.2016, 11:14

Сообщение от RobosergTV

Видимо потому, что ты в этой области мало что понимаешь

Именно поэтому я сижу на форуме ск2ча, где всегда компетентно и, не спрыгивая с темы в растекание мысией по древу, объяснят.

Сообщение от RobosergTV

С каких это пор интеллект должен равняться на человеческий? Это очень эгоистично и не дальновидно.

С тех пор, как написали фразу "требуется понимание игры". Если под словом "понимание" имелось в виду нечто, отличающееся от общепризнанного, то какой тогда смысл в употреблении этого слова?

**Kepa** · 12.03.2016, 11:31

Только что закончилась третья игра, счет 3-0.

Было интересно узнать что следующей целью будет скбв (гугл этим тонко дали понять, что Ke Jie, лучшего игрока в го на данный момент, они, видимо, за соперника уже не считают

), но, предполагаю, что скбв для исственного ИИ будет задачей более сложной чем ГО (хотя для человека наоборот) ввиду долгих периодов "слепого" выбора. Ну и очень актуален вопрос ограничения апм, иначе это скатится до банальных дабл бараков за Т и перфект микро.

**morda911** · 12.03.2016, 11:38

Сообщение от Kepa

но, предполагаю, что скбв для исственного ИИ будет задачей более сложной чем ГО (хотя для человека наоборот) ввиду долгих периодов "слепого" выбора. Ну и очень актуален вопрос ограничения апм, иначе это скатится до банальных дабл бараков за Т и перфект микро.

Ну вот, а мне уже третью страницу "объясняют", что это практически то же самое.

**NoTimeToWait** · 12.03.2016, 11:43

Сообщение от morda911

Нет, не верно. Потому что в шахматах и го у игроках полное, одинаковое знание, а в ск2 и ск:бв - нет. Если к понятию "полная информация" притягивать знание будущих ходов, то исчезает смысл самой игры, очевидно.

Пожалуйста, прекрати использовать искаженную терминологию. Ты путаешь себя и других. "Полное знание" не тождественно "полной информации". Насколько я понимаю, ты отталкиваешься от определения игр с полной информацией. В этом моменте ты прав и здесь я не спорю с тобой. Го действительно игра с полной информацией. Однако, игроки обладая полной информацией, не обладают полным знанием о текущей ситуации на игровой достке в каждый отдельный момент времени. Поскольку го - фактически игра о количестве захваченной территории, полное знание заключалось бы в полной оценке территорий обоих соперников в каждый отдельный момент времени. Однако, это не возможно на данный момент даже с полной информацией. Например, присутствие одновременно нескольких ко ситуаций на доске если я не ошибаюсь делают задачу экспоненциально сложной и следовательно нерешаемой существующими алгоритмами на компьютерах любой мощности и сложности. Т.е. без изобретения новых алгоритмов, ситуационная задача остается нерешаемой, а значит, получение полного знания из полной информации на данный момент невозможно

**BlackMokona** · 12.03.2016, 12:26

Сообщение от Or2dox

Что ноуп? Не вижу в общем-то противоречий - все сводится к получению критериев анализа позиции на основе миллионов реплеев. Только в данном случае работу выполняет нейронная сеть.
Я, кстати, по нейронным сетям диплом писал, обучал свою прогнозировать курс доллара (по сути делать экстраполяцию имеющихся данных). Интересная вещь, но спорная сама по себе. Потому что принципы и механизмы человеческого мышления еще не до конца изучены и поняты. Получается что мы не знаем как работает мозг, но пытаемся скопировать принцип его работы (ну собственно нейронная сеть).

Главная проблема, что в мозгу человека просто нейронов на много порядков больше, чем в самой крутой нейросетке. Сейчас борьба на этом поле слона и моськи, и то, что моська шаг за шагом громит слона всё в новых дисциплинах весьма занимательна.

Когда эта сетка пройдёт хотя бы полноценный тест Тьюринга, без такой вот гомосятины: "Тест Тьюринга считался пройденным, если компьютеру удалось бы вводить собеседника (человека) в заблуждение на протяжении хотя бы 30 % суммарного времени.", тогда это будет справедливо. А пока что из описанного тобой "Ноуп, смотри как АльфаГо работает" никакого понимания, в человеческом смысле, не прослеживается.

Когда она пройдёт полноценный тест Тьюринга без всякой гомосятины, большинство будет считать, что данный тест не отображает действительности и решается тупым перебором

Тема: Повелители из Google нагнув Корейцев в ГО, идут нагибать их в Starcraft 2

Опции темы

Информация о теме

Пользователи, просматривающие эту тему

Похожие темы

Какой первый матрас купить? Есть ли повелители матрасов на ск2тв?

Google запилил музыкальный сервис в Google Play.

Google <3 StarCraft

Ваши права