Chat:Ru/2021-12-17
wlesavo: ага, это все с противником на wait было, почему то включение противника ухудшает досих пор
wlesavo: ща мины в симу добавил, может хватит этого на легенду
wlesavo: да, ставить мины в симе определенно помогает, со сломанной симой только мешали, поэтому отключал
aangairbender: YurkovAS а ты что заслал?
YurkovAS: понятно. до серебра добрался с минимаксом, думаю там еще куча багов, надо оценочную улучшать и много экпериментировать еще.
YurkovAS: и мины еще не юзал
wlesavo: до серебра по логике там можно на очень простых эвристиках добраться, у меня было что-то типа едь к ближайшей бочке если бочек нет тарань соперника + стрельба на ход вперед или по текущей позиции если скорость соперника 0
YurkovAS: да, тут много всяких мелочей: настроил брутал тестер и буду потихоньку экспериментировать
YurkovAS: не простая игра, как я думал, есть проще игры. зато если получится добраться до леги, то можно что-то такое же типа FB запилить
wlesavo: для меня самая большая загадка почему в МС сима опонента так плохо заводится. не исключено что баги конечно, но подозреваю что там что-то фундаментальное
wlesavo: YurkovAS а у тебя стрельба в минике есть?
YurkovAS: да, тупо 1 выстрел - в противника
wlesavo: в текущую позицию?
YurkovAS: минимакс сразу сдулся, когда добавил 2+ кораблика, т.к. там много ходов, пришлось пока оставить из всех 4 лучших только. и тогда он успевает 3 хода прогнать
YurkovAS: двигую противника вперед и расчитываю где будет попадание. да там пока все очень сырое, на скоряк сделал, особо не тестил (ну в брутал тестере только)
wlesavo: у меня в мс на глубину 6-7 было что-то в духе 4к роллаутов, в каждом роллауте все корабли параллельно движутся. сейчас чуть наоптимизировал и стало в районе 20к роллаутов при 6ти кораблях, я думаю может если в легу пройду попробую интересное что-нибудь сделать типа одновременного конкурирующего SA для всех кораблей
wlesavo: одно радует, винрейт на сабмите против босса хороший и я его не пушу а потихонечку опускаю))
YurkovAS: во - роллаутов? а можешь посчитать кол-во симуляций? 1 тик игры
wlesavo: на 6 где то умножить можно, если одни тик одного корабля то еще на 6
YurkovAS: уже давно хотел тебе предложить заменить MC на SA или эвалюционный - т.к. он должен быть точно лучше
wlesavo: ну тут видишь, оказалось дело было в том что я правила читать не умею, я уверен был что уж на голду мс должно хватить и все баг искал
YurkovAS: это нормально
aangairbender: что за SA?
wlesavo: симуляция отжига
aangairbender: отжиг - это га без кросовера?
Uljahn: га без га
YurkovAS: отжиг, это типа ГА с 1 решением, которое мы пытаемся улучшить N попыток, при этом позволяем его даже ухудшить, но потом в итоге оно может улучшиться. Ну и если после всего оно всетаки стало лучше, то сохраняем к себе и опять повторяем такое же
YurkovAS: только не N попыток, а там температура и немного другое поведение
aangairbender: понял, спасибо
wlesavo: я обычно делаю жадный SA, по сути это просто эволюционная часть SA без собственно возможности ухудшения, в большинстве случаев оно работает не хуже, в самом SA очень тонкая настройка гиперпараметров нужна, котораая не всегда того стоит
YurkovAS: + за эвалюционный, у меня SA всегда был хуже в итоге, да и редко когда ГА был лучше эвалюционного
aangairbender: sa как-то расшифровуется?
Uljahn: simulated annealing
aangairbender: как думаете, тут смитсимакс не заведётся?
YurkovAS: скорее всего нет, хотя, раз там 20к роллаутов, а столько в ксб, то может быть
Uljahn: можно глянуть постмортемы, посмотреть кто что пробовал и с какими результатами
Uljahn: смитсимакса тогда ещё не изобрели, но могут быть похожие идеи
Uljahn: типа DUCT
YurkovAS: я с ним столько раз экспериментировал, а в итоге у меня он только нормально работал в ксб и pcr. тут главное чтобы мотивация не пропала после неудачного прикручивания, т.к. не быстро это
Uljahn: у меня и флудфил не с первого раза завёлся :(
aangairbender: у меня здесь сейчас флудфил залит (я его бфсом называю(
wlesavo: Uljahn жиза, у меня флудфил постоянно с багами
YurkovAS: в маленьких картах до 64бит, можно бфс сделать через avx - дает заметное ускорение, т.к. он потом двигает всех следующих и чем дальше, тем быстрее обход
wlesavo: у меня даже на сетах в питоне не сразу получается написать, а ты говоришь avx :smiley:
aangairbender: а что такое weighted Monte Carlo search?
Uljahn: похоже, что выборка действий для симуляции не равновероятная, а взвешенная, т.е. какие-то действия более вероятны
Uljahn: но это не точно, надо копать
aangairbender: YurkovAS ты писал что настроил brutaltester. Это ты со своим рефери или кодингеймовым?
YurkovAS: в брутал тестере есть табличка, вроде нижний
YurkovAS: https://github.com/kevinsandow/cg-referee-coders-of-the-caribbean
YurkovAS: если не заработает, собирай 8-й явой
aangairbender: я все же решил почитать ПМы и не пожалел. Узнал много нового
wlesavo: а я когда пошел читать понял что все примерно тоже самое делаю но почему то все еще сидел в серебре :slight_smile:
YurkovAS: конечно, лучше сделать по ПМ-ам и забраться в топ, чем приходить раз в год, дойти до вершины дерева и думать, что в след. году уж точно в топ зайду
aangairbender: ну я писал себе смитсимакс, а потом прочитал и бросил)
wlesavo: ахахах, 5 человек в легу запушил