Chat:Ru/2021-05-23
YurkovAS: улучшить не получается, все похоже на обычный мктс или смитсимакс
miklla: если что, советую делать ход с самой большой вероятностью с шансом 100% вместо вероятностного распределения ходов
YurkovAS: miklla это ты про последний контест?
miklla: duct mcts ведь выдаёт вероятностное распределение ходов?
miklla: просто я им н разу не пользовался
miklla: но я пользовался другими алгоритмами для игр с одновременными ходами в других игр, в них вышеописанный лайфхак бустил ботов
YurkovAS: ох, хз, он как мктс - сначала поиграет во все ходы, а потом исследует глубже лучший, но иногда и плохие ходы немного поисследует
miklla: я имею ввиду на выходе алгоритма
miklla: ему выход - идеальный ход или вероятностное распределение твого хода?
YurkovAS: на выходе получается 2 числа: кол-во визитов и кол-во побед обычно выбираем ту, где больше визитов
YurkovAS: наверное это вероятность.
miklla: значит duct выдаёт идеальный ход? неожиданно
YurkovAS: если поделить кол-во побед на кол-во визитов и будет число от -1 до 1
YurkovAS: он дерево достраивает постепенно, но доигрывает рандомными ходами
YurkovAS: и вот эта формула ucb-1 делает так, чтобы лучшие ходы выбирались чаще, но и плохие иногда переигрывал
YurkovAS: не знаю как объяснить, я и в терминах то не силен
miklla: гугл говорит, что есть DUCT(mix) и DUCT(max), вот я имел ввиду, что итоговый выбор хода должен быть по max
YurkovAS: понял, спасибо, прочитаю еще раз.
miklla: хм, есть статья, где у них экспериментально mix лучше, чем max работает, но хз
miklla: всё-таки у них там полные решения, а не эвристики