Chat:Ru/2020-06-24
tutubalin: видимо, у крестиков сильно большое преимущество над ноликами
tutubalin: или бага где-то )
Uljahn: такое может быть, если есть эвристики или разный коэффициент эксплорейшна
Uljahn: tomatoes: а у тебя - из-за эффекта горизонта, наверное
tomatoes: с преимуществом крестиков ещё надо проверить, у меня тогда менялись
735487: нашел у себя баг в крестиках :)
735487: капец у меня против рекурса полно игр когда мы оба за нолики выигрываем ))
Hamibar: ого томатос уже и карлисо порекал. грац
vrabosh: а кто нить по тактике пробывал играть?
vrabosh: например ходишь в центор, противник вверх влево, ты играешь от талкиваясь от того, что хочешь захватить диагональ с права на лево.
vrabosh: т.е. по диагонали не ходишь, а кидаешь противника в друиге клетки.. такое работает?
735487: это все эвристики а их в крестиках мало у кого есть
vrabosh: это надо красиво запрограммить, чтоб удобно было тестировать эвристику
Uljahn: vrabosh: я думал о таком варианте, это как раз ближе к ИИ, т.е. стратегическая оценка положения на доске
Uljahn: можно как-то масочками поиграться, выявлять линии, которые сопернику будет сложно заблокировать
Uljahn: при этом надо не давать противнику выиграть
Uljahn: в идеале обучить нейронку, а то на эвристиках медленно будет
735487: выведи формулу будет быстро :)
Uljahn: я и говорю про формулу, она может быть сильно нелинейная, а нам точное значение не сильно нужно
Uljahn: если она вообще существует
735487: полюбому существует
735487: вопрос только сколько в ней слагаемых
Uljahn: может оказаться, что сравнимо с количеством состояний))
Uljahn: нам не нужна точная формула, достаточно аппроксимации нейронкой, чтобы оценивать стейты на некоторой глубине, тогда и миник можно будет оживить, или в MCTS улучшить селекшн
Uljahn: можно даже будет "убийцу MCTS" натренить, которая будет глубже исследовать ветки, у которых низкий рейтинг по UCT
Uljahn: это при условии, что заданного ограничениями размера хватит, чтобы что-то выучить
vrabosh: у когото получилось 3х3 крестики обучить?
tomatoes: https://xkcd.com/832/
735487: чет не понял. это типа правда?
735487: или это для 3 на 3?
tomatoes: 3 на 3
tomatoes: похоже чат снова ломается, только после ф5 грузятся сообщения
vrabosh: о чем эта картинка говорит?
tomatoes: "optimal tic tac toe moves"
vrabosh: это просто база данных ходов
vrabosh: в ии же проде как подругому?
vrabosh: типа коэфициенты перемножаются и получается магия)
Uljahn: какая магия в перемножении матриц?
vrabosh: ну типа чтоб сказал хотябы для 3х3 пральный ход идти туда иль нет
Uljahn: что есть правильный ход?
vrabosh: Ну что, давайте в шашки?)
vrabosh: а что дает пазл недели?
gybson_samara: шашки, хммм
vrabosh: тоже самое почти
gybson_samara: штош, давно я не брал в руки шашки