Chat:Ru/2021-05-22

From CG community
Jump to navigation Jump to search

BorisZ: с одновременными ходами как коллизии разрешают интересно

BorisZ: если две головы одновременно на одну клетку шагнули - оба проиграли?

miklla: от одного упоминания слова TRON у меня настроение поднимается :)

735487: BorisZ: с одновременными ходами как коллизии разрешают интересно, в раиках очень часто коллизии рандомно разрешают. считают что кто то один на микротик первее ходит и решают рандомом

miklla: в back to the code можно сквозь друг друга проходить

YurkovAS: сделал duct, а он играет немного хуже, чем обычный мктс: 40% побед

YurkovAS: улучшить не получается, все похоже на обычный мктс или смитсимакс

miklla: если что, советую делать ход с самой большой вероятностью с шансом 100% вместо вероятностного распределения ходов

YurkovAS: miklla это ты про последний контест?

miklla: duct mcts ведь выдаёт вероятностное распределение ходов?

miklla: просто я им н разу не пользовался

miklla: но я пользовался другими алгоритмами для игр с одновременными ходами в других игр, в них вышеописанный лайфхак бустил ботов

YurkovAS: ох, хз, он как мктс - сначала поиграет во все ходы, а потом исследует глубже лучший, но иногда и плохие ходы немного поисследует

miklla: я имею ввиду на выходе алгоритма

miklla: ему выход - идеальный ход или вероятностное распределение твого хода?

YurkovAS: на выходе получается 2 числа: кол-во визитов и кол-во побед обычно выбираем ту, где больше визитов

YurkovAS: наверное это вероятность.

miklla: значит duct выдаёт идеальный ход? неожиданно

YurkovAS: если поделить кол-во побед на кол-во визитов и будет число от -1 до 1

YurkovAS: он дерево достраивает постепенно, но доигрывает рандомными ходами

YurkovAS: и вот эта формула ucb-1 делает так, чтобы лучшие ходы выбирались чаще, но и плохие иногда переигрывал

YurkovAS: не знаю как объяснить, я и в терминах то не силен

miklla: гугл говорит, что есть DUCT(mix) и DUCT(max), вот я имел ввиду, что итоговый выбор хода должен быть по max

YurkovAS: понял, спасибо, прочитаю еще раз.

miklla: хм, есть статья, где у них экспериментально mix лучше, чем max работает, но хз

miklla: всё-таки у них там полные решения, а не эвристики