Chat:Ru/2020-06-02
Uljahn: ahah https://www.sciencemag.org/news/2020/05/eye-catching-advances-some-ai-fields-are-not-real
Uljahn: свежие замеры древнейших нейронных архитектур на свежем железе не уступают новейшим лол
tutubalin: Uljahn самым древнейшим нейронным архитектурам сотни миллионов лет )
Uljahn: они на железе не работают, вроде
amurushkin: типа все это время выезжали только за счет железа и нифига не продвинулись?
Uljahn: продвинулись, но не так сильно, как расписывают в статьях
BorisZ: все новые архитектуры, новые хитрые функции - это как тусование старых фич и кручение констант
Uljahn: +
BorisZ: нет новых фич - нет прорыва
BorisZ: зато в массы вышли технологии, это может даже более важно
BorisZ: раньше была забава каких-то яйцеголовых, а сейчас каждый может
BorisZ: может и перейдет количество в качество
Uljahn: ну да, маркетинг в науке тоже нужен, чтобы хайповать
Uljahn: всегда приятнее верить в деда мороза или в ИИ, чем если тебе скажут, что всё это сказки
Uljahn: Automaton2000: без воздуха пустота - вот и весь космос
Automaton2000: agade wants to practice automatonnn's russian
tutubalin: Илон Маск в 2014: "Скорость развития искусственного интеллекта невероятно высокая. Есть риск, что что-то серьёзно опасное случится в течении 5 лет, максимум десяти".
tutubalin: Илон Маск в 2020: https://www.youtube.com/watch?v=FrveYIwPArM
Uljahn: бесит эта истерия, ещё вокруг GPT-2 нагнетали в своё время: "Мы выложим в свободный доступ куцую сетку, чтобы вы могли поиграться, а большую выкладывать не будет, потому что боимся, как бы чего плохого не вышло"
Uljahn: Automaton2000 созадёт скайнет в гараже и завхватывает мир
Automaton2000: в том то и дело
tutubalin: ну через пять-десять лет не мы будем изучать нейронки, а нейронки будут изучать нас
Beard: они не смогут, ведь к тому времени мы сожжём все вышки с интернетом
BorisZ: Маск спасет интернет - запустит спутники старлинк
BorisZ: трава у дома прикольно сделали, и момент очень удачный главное )
Uljahn: на общих планах обработку не разглядеть
Uljahn: с помощью тех же GAN научились игры имитировать по реплеям
Uljahn: https://blogs.nvidia.com/blog/2020/05/22/gamegan-research-pacman-anniversary/
Uljahn: кстати не уверен, что в ситуациях, которых не было в обучающей выборке, они не будут генерить нерелевантную фигню
Uljahn: все эти GAN по сути не далеко ушли от Automaton2000
Automaton2000: а что если кто-то сгенерит случайный токен и получит валидный чужой токен?
Uljahn: https://thesecatsdonotexist.com/ котики курильщика, Automaton2000
Automaton2000: а у меня и у кубера
wlesavo: некоторые конечно особенно реалистично выглядят https://d2ph5fj80uercy.cloudfront.net/06/cat4562.jpg
ilt: а как можно посмотреть в последнем сабмите сколько игр упало по таймауту?
Uljahn: скриптик писать надо
Uljahn: https://www.codingame.com/playgrounds/53705/contest-tools-and-workflow/introduction
Uljahn: вот мануал
BorisZ: я вручную смотрю проигрыши
BorisZ: грубо говоря 100 игр, половина - поражения, на полоску в реплее наводишь - таймаут всплывает
ilt: я в крестиках подрезал лимиты, но место ухудшилось
BorisZ: можно cgbenchmark поставить - там сразу видно
ilt: 220 долго высматривать сколько было таймаутов
BorisZ: но и руками за пару минут можно посмотреть
ilt: 220 игр
BorisZ: только поражения смотреть надо же
BorisZ: если победил значит не было )
Uljahn: или у обоих
BorisZ: да иобычно если есть таймаут то не 1 на 1000 а один на 20 - быстро находится так как много их
ilt: процент побед вырос, а место ухудшилось :worried:
Uljahn: посмотри на cgstat кому сливаешь много из тех, кто ниже тебя
BorisZ: по одному сабмиту нельзя сказать что ухудшилось или улучшилось, особенно если плотность большая
BorisZ: плю-минус одно очко рейтинга - нормальный разброс, а мест это может быть и 100 и 200 если народу дофига
Uljahn: ну, в голде крестиков рандом сильный, +-50 мест легко
BorisZ: c cgstat не очень удобно имхо, обновляется долго да и не очень надежный критерий
BorisZ: в середине лиги наверное должна быть плотность больше, по краям меньше
BorisZ: да, про 100 мест это я загнул, может для гонок только так может быть
BorisZ: 1 очко - примерно 150 мест в середине голды CSB
ilt: а такое поведение МСST нормально?
ilt: 1 5 3 visit 182737 2 6 0 visit 655 3 3 1 visit 584
ilt: это первый ход и первые три решения
Uljahn: расшифруй
ilt: 5-3 это ход
ilt: visit это число посещений из ноды
Uljahn: маловато что-то для второго и третьего
ilt: да вот и я тоже думаю
Uljahn: в формуле UCT есть коэффициент, который определяет соотношение exploration/exploitation, и который зависит от диапазона наград
Uljahn: у тебя какой диапазон?
amurushkin: почему хода только 3?
Uljahn: сколько за проигрыш/выигрыш начисляется?
ilt: ход 4 4 вообще в списке отсутствует
Uljahn: первые три решения? я думал там больше список
amurushkin: ходы должны быть все возможные
ilt: первые 3
ilt: там 81
amurushkin: 81 их тоже не может быть
amurushkin: ты правильно правила закодил?
ilt: 1.41
ilt: на первом ходе может быть
Uljahn: за проигрыш 0 даёшь или -1?
amurushkin: а ну допустим. на первом ходу многие и не запускают mcts
amurushkin: вообще на 1 ходу не должно быть такой большой разницы в visits. что то не то
ilt: за проигрыш 0
amurushkin: а за ничью?
Uljahn: 0.5 очевидно
Uljahn: ничьи редкость
Uljahn: в голде
ilt: не за ничью тоже 0
amurushkin: это ошибка
Uljahn: всё равно не должно так сильно влиять
Uljahn: дебажь формулу
amurushkin: у него скорее всего косяк там где он ноду выбирает
amurushkin: сначала рандомно берешь непосещенные?
ilt: да
amurushkin: распечатай для 2 хода например значения формулы UCT и кол-во визитов. может будет что то яснее
ilt: http://chat.codingame.com/pastebin/85f94650-0d46-4a44-a2a8-6b013c3ac0e4
Uljahn: подёргай константу, посмотри, будет ли меняться распределение визитов
Uljahn: или может у тебя число посещений неправильно считает
ilt: меняется число визитов
ilt: повышаю константу становится более распределенным
Uljahn: может, у тебя под корень константа затесалась? или типа того)
amurushkin: у тебя 3 элемент имеет UCT больше а визитов меньше чем у второго. явно не то что то при выборе
ilt: такое не всегда бывает, но иногда бывает
ilt: буду исследовать что тут не так
Uljahn: выводи score тоже
amurushkin: проверь формулу еще
ilt: с формулой вроде все ок, поражение тоже влияет но на выбор нод когда противник ходит
Uljahn: у тебя полный MCTS, т.е. дерево тоже строишь? я вот начал с UCB1 без дерева, так тестировать проще
Uljahn: формула-то одна и та же
ilt: да полный
Uljahn: может, в нодах данные корраптятся? хотя в джяве это маловероятно
Uljahn: о, так ты меня уже догнал
Uljahn: починил, значит?
ilt: нет только лимит сделал меньше
ilt: меньше по таймауту стал вылетать
ilt: вообще неоптимизированная версия стояло на 80 позиций выше тебя
ilt: роллаутов стало больше а результат хуже
ilt: видимо есть какой-то предел когда количество перейдет в качество
ilt: я его еще не достиг
amurushkin: не помешало бы еще ничьи и проигрыши по разному оценивать
ilt: да тут я потестирую формулу
Uljahn: а рандом проверял? хорошо распределяет?
ilt: проверял когда-то давно, претензий не было
ilt: я давно fastrand написал
tutubalin: проверь на Practically Random
tutubalin: он не такой жёсткий, как BigCrush, но зато даёт результаты быстрее