Chat:Ru/2020-06-02

From CG community
Jump to navigation Jump to search

Uljahn: ahah https://www.sciencemag.org/news/2020/05/eye-catching-advances-some-ai-fields-are-not-real

Uljahn: свежие замеры древнейших нейронных архитектур на свежем железе не уступают новейшим лол

tutubalin: Uljahn самым древнейшим нейронным архитектурам сотни миллионов лет )

Uljahn: они на железе не работают, вроде

amurushkin: типа все это время выезжали только за счет железа и нифига не продвинулись?

Uljahn: продвинулись, но не так сильно, как расписывают в статьях

BorisZ: все новые архитектуры, новые хитрые функции - это как тусование старых фич и кручение констант

Uljahn: +

BorisZ: нет новых фич - нет прорыва

BorisZ: зато в массы вышли технологии, это может даже более важно

BorisZ: раньше была забава каких-то яйцеголовых, а сейчас каждый может

BorisZ: может и перейдет количество в качество

Uljahn: ну да, маркетинг в науке тоже нужен, чтобы хайповать

Uljahn: всегда приятнее верить в деда мороза или в ИИ, чем если тебе скажут, что всё это сказки

Uljahn: Automaton2000: без воздуха пустота - вот и весь космос

Automaton2000: agade wants to practice automatonnn's russian

tutubalin: Илон Маск в 2014: "Скорость развития искусственного интеллекта невероятно высокая. Есть риск, что что-то серьёзно опасное случится в течении 5 лет, максимум десяти".


tutubalin: Илон Маск в 2020: https://www.youtube.com/watch?v=FrveYIwPArM

Uljahn: бесит эта истерия, ещё вокруг GPT-2 нагнетали в своё время: "Мы выложим в свободный доступ куцую сетку, чтобы вы могли поиграться, а большую выкладывать не будет, потому что боимся, как бы чего плохого не вышло"

Uljahn: Automaton2000 созадёт скайнет в гараже и завхватывает мир

Automaton2000: в том то и дело

tutubalin: ну через пять-десять лет не мы будем изучать нейронки, а нейронки будут изучать нас

Beard: они не смогут, ведь к тому времени мы сожжём все вышки с интернетом

BorisZ: Маск спасет интернет - запустит спутники старлинк

BorisZ: трава у дома прикольно сделали, и момент очень удачный главное )

Uljahn: на общих планах обработку не разглядеть

Uljahn: с помощью тех же GAN научились игры имитировать по реплеям

Uljahn: https://blogs.nvidia.com/blog/2020/05/22/gamegan-research-pacman-anniversary/

Uljahn: кстати не уверен, что в ситуациях, которых не было в обучающей выборке, они не будут генерить нерелевантную фигню

Uljahn: все эти GAN по сути не далеко ушли от Automaton2000

Automaton2000: а что если кто-то сгенерит случайный токен и получит валидный чужой токен?

Uljahn: https://thesecatsdonotexist.com/ котики курильщика, Automaton2000

Automaton2000: а у меня и у кубера

wlesavo: некоторые конечно особенно реалистично выглядят https://d2ph5fj80uercy.cloudfront.net/06/cat4562.jpg

ilt: а как можно посмотреть в последнем сабмите сколько игр упало по таймауту?

Uljahn: скриптик писать надо

Uljahn: https://www.codingame.com/playgrounds/53705/contest-tools-and-workflow/introduction

Uljahn: вот мануал

BorisZ: я вручную смотрю проигрыши

BorisZ: грубо говоря 100 игр, половина - поражения, на полоску в реплее наводишь - таймаут всплывает

ilt: я в крестиках подрезал лимиты, но место ухудшилось

BorisZ: можно cgbenchmark поставить - там сразу видно

ilt: 220 долго высматривать сколько было таймаутов

BorisZ: но и руками за пару минут можно посмотреть

ilt: 220 игр

BorisZ: только поражения смотреть надо же

BorisZ: если победил значит не было )

Uljahn: или у обоих

BorisZ: да иобычно если есть таймаут то не 1 на 1000 а один на 20 - быстро находится так как много их

ilt: процент побед вырос, а место ухудшилось :worried:

Uljahn: посмотри на cgstat кому сливаешь много из тех, кто ниже тебя

BorisZ: по одному сабмиту нельзя сказать что ухудшилось или улучшилось, особенно если плотность большая

BorisZ: плю-минус одно очко рейтинга - нормальный разброс, а мест это может быть и 100 и 200 если народу дофига

Uljahn: ну, в голде крестиков рандом сильный, +-50 мест легко

BorisZ: c cgstat не очень удобно имхо, обновляется долго да и не очень надежный критерий

BorisZ: в середине лиги наверное должна быть плотность больше, по краям меньше

BorisZ: да, про 100 мест это я загнул, может для гонок только так может быть

BorisZ: 1 очко - примерно 150 мест в середине голды CSB

ilt: а такое поведение МСST нормально?

ilt: 1 5 3 visit 182737 2 6 0 visit 655 3 3 1 visit 584

ilt: это первый ход и первые три решения

Uljahn: расшифруй

ilt: 5-3 это ход

ilt: visit это число посещений из ноды

Uljahn: маловато что-то для второго и третьего

ilt: да вот и я тоже думаю

Uljahn: в формуле UCT есть коэффициент, который определяет соотношение exploration/exploitation, и который зависит от диапазона наград

Uljahn: у тебя какой диапазон?

amurushkin: почему хода только 3?

Uljahn: сколько за проигрыш/выигрыш начисляется?

ilt: ход 4 4 вообще в списке отсутствует

Uljahn: первые три решения? я думал там больше список

amurushkin: ходы должны быть все возможные

ilt: первые 3

ilt: там 81

amurushkin: 81 их тоже не может быть

amurushkin: ты правильно правила закодил?

ilt: 1.41

ilt: на первом ходе может быть

Uljahn: за проигрыш 0 даёшь или -1?

amurushkin: а ну допустим. на первом ходу многие и не запускают mcts

amurushkin: вообще на 1 ходу не должно быть такой большой разницы в visits. что то не то

ilt: за проигрыш 0

amurushkin: а за ничью?

Uljahn: 0.5 очевидно

Uljahn: ничьи редкость

Uljahn: в голде

ilt: не за ничью тоже 0

amurushkin: это ошибка

Uljahn: всё равно не должно так сильно влиять

Uljahn: дебажь формулу

amurushkin: у него скорее всего косяк там где он ноду выбирает

amurushkin: сначала рандомно берешь непосещенные?

ilt: да

amurushkin: распечатай для 2 хода например значения формулы UCT и кол-во визитов. может будет что то яснее

ilt: http://chat.codingame.com/pastebin/85f94650-0d46-4a44-a2a8-6b013c3ac0e4

Uljahn: подёргай константу, посмотри, будет ли меняться распределение визитов

Uljahn: или может у тебя число посещений неправильно считает

ilt: меняется число визитов

ilt: повышаю константу становится более распределенным

Uljahn: может, у тебя под корень константа затесалась? или типа того)

amurushkin: у тебя 3 элемент имеет UCT больше а визитов меньше чем у второго. явно не то что то при выборе

ilt: такое не всегда бывает, но иногда бывает

ilt: буду исследовать что тут не так

Uljahn: выводи score тоже

amurushkin: проверь формулу еще

ilt: с формулой вроде все ок, поражение тоже влияет но на выбор нод когда противник ходит

Uljahn: у тебя полный MCTS, т.е. дерево тоже строишь? я вот начал с UCB1 без дерева, так тестировать проще

Uljahn: формула-то одна и та же

ilt: да полный

Uljahn: может, в нодах данные корраптятся? хотя в джяве это маловероятно

Uljahn: о, так ты меня уже догнал

Uljahn: починил, значит?

ilt: нет только лимит сделал меньше

ilt: меньше по таймауту стал вылетать

ilt: вообще неоптимизированная версия стояло на 80 позиций выше тебя

ilt: роллаутов стало больше а результат хуже

ilt: видимо есть какой-то предел когда количество перейдет в качество

ilt: я его еще не достиг

amurushkin: не помешало бы еще ничьи и проигрыши по разному оценивать

ilt: да тут я потестирую формулу

Uljahn: а рандом проверял? хорошо распределяет?

ilt: проверял когда-то давно, претензий не было

ilt: я давно fastrand написал

tutubalin: проверь на Practically Random

tutubalin: он не такой жёсткий, как BigCrush, но зато даёт результаты быстрее