На прошлых сезонах нельзя напрямую проверить, так как они были использованы при обучении модели, данные по броскам ведутся не так давно всего 2 сезона. Про НХЛ интересно, теоретически это возможно, но проблема с данными, их обработка самая трудозатратная часть. У НХЛ правда плюс что очень много ресурсов этим занимается. При этом модель все равно тогда придется переобучать, так как отличается специфика.
Дом до какого-то момента веса для своих моделей публиковал на самом деле, но они для нашей лиги естественно не применимы, поэтому я их получал на основе своей выборки по КХЛ. От Дома тут по сути базовый подход с системой рейтингов (он сам не с бейсбола взял) дальше регрессионный анализ и в путь. Play-by-play кстати тоже есть, не как у НХЛ, конечно, но ценной информации довольно много.
В целом логика правильная, единственное для Северстали получается -10-(-4), то есть -6. Северсталь в том сезоне по разнице шайб, была на порядок лучше Куньлуня, но по оборонительным метрикам, которые у меня учитываются оказались сильно хуже, то есть да, модель ожидает для такой статистики худшую разницу шайб, а для Куньлуня наоборот. Возможно это связано со стилем игры, тут тяжело сказать, в 80% случаев попадание довольно точное идет между рейтингом и разницей.
Да, спасибо за замечания. Исправил, там как раз не отображались учтены Спунер с Гейджем, оба пока котируются в плюсе, но проблема именно в визуализации в цифрах они были учтены изначально.
Очень не хватает актуальной базы составов типа dailyfaceoff, на которую можно было бы подвязаться при моделировании. При отсутствии оной такие изменения вносятся вручную, быстро все изменения не отразить и скорее всего даже сегодняшние составы через неделю могут быть не самыми точными
В НХЛ сразу несколько сайтов считают xG. Например, moneypuck
moneypuck.com/stats.htm
На прошлых сезонах нельзя напрямую проверить, так как они были использованы при обучении модели, данные по броскам ведутся не так давно всего 2 сезона.
Про НХЛ интересно, теоретически это возможно, но проблема с данными, их обработка самая трудозатратная часть. У НХЛ правда плюс что очень много ресурсов этим занимается. При этом модель все равно тогда придется переобучать, так как отличается специфика.
Дом до какого-то момента веса для своих моделей публиковал на самом деле, но они для нашей лиги естественно не применимы, поэтому я их получал на основе своей выборки по КХЛ. От Дома тут по сути базовый подход с системой рейтингов (он сам не с бейсбола взял) дальше регрессионный анализ и в путь. Play-by-play кстати тоже есть, не как у НХЛ, конечно, но ценной информации довольно много.
Только откорректировал)
В целом логика правильная, единственное для Северстали получается -10-(-4), то есть -6. Северсталь в том сезоне по разнице шайб, была на порядок лучше Куньлуня, но по оборонительным метрикам, которые у меня учитываются оказались сильно хуже, то есть да, модель ожидает для такой статистики худшую разницу шайб, а для Куньлуня наоборот. Возможно это связано со стилем игры, тут тяжело сказать, в 80% случаев попадание довольно точное идет между рейтингом и разницей.
Да, спасибо за замечания. Исправил, там как раз не отображались учтены Спунер с Гейджем, оба пока котируются в плюсе, но проблема именно в визуализации в цифрах они были учтены изначально.
Да, откуда-то лишнее предложение с Ак Барса заскочило, спасибо за наблюдение
Исправил, спасибо
Очень не хватает актуальной базы составов типа dailyfaceoff, на которую можно было бы подвязаться при моделировании. При отсутствии оной такие изменения вносятся вручную, быстро все изменения не отразить и скорее всего даже сегодняшние составы через неделю могут быть не самыми точными
Опечатка, конечно, Локхарт входит в топ-30 по защитным метрикам