Да, модель исходит из того, что все живы-здоровы, но через неделю он сам по себе топ-10 должен выпасть. А так конечно надо отслеживать и вручную вносить прогнозы по травмированным
На прошлых сезонах нельзя напрямую проверить, так как они были использованы при обучении модели, данные по броскам ведутся не так давно всего 2 сезона. Про НХЛ интересно, теоретически это возможно, но проблема с данными, их обработка самая трудозатратная часть. У НХЛ правда плюс что очень много ресурсов этим занимается. При этом модель все равно тогда придется переобучать, так как отличается специфика.
Дом до какого-то момента веса для своих моделей публиковал на самом деле, но они для нашей лиги естественно не применимы, поэтому я их получал на основе своей выборки по КХЛ. От Дома тут по сути базовый подход с системой рейтингов (он сам не с бейсбола взял) дальше регрессионный анализ и в путь. Play-by-play кстати тоже есть, не как у НХЛ, конечно, но ценной информации довольно много.
В целом логика правильная, единственное для Северстали получается -10-(-4), то есть -6. Северсталь в том сезоне по разнице шайб, была на порядок лучше Куньлуня, но по оборонительным метрикам, которые у меня учитываются оказались сильно хуже, то есть да, модель ожидает для такой статистики худшую разницу шайб, а для Куньлуня наоборот. Возможно это связано со стилем игры, тут тяжело сказать, в 80% случаев попадание довольно точное идет между рейтингом и разницей.
Да, спасибо за замечания. Исправил, там как раз не отображались учтены Спунер с Гейджем, оба пока котируются в плюсе, но проблема именно в визуализации в цифрах они были учтены изначально.
Да, модель исходит из того, что все живы-здоровы, но через неделю он сам по себе топ-10 должен выпасть. А так конечно надо отслеживать и вручную вносить прогнозы по травмированным
Денис Костин тоже неплох)
Поправил, спасибо
В НХЛ сразу несколько сайтов считают xG. Например, moneypuck
moneypuck.com/stats.htm
На прошлых сезонах нельзя напрямую проверить, так как они были использованы при обучении модели, данные по броскам ведутся не так давно всего 2 сезона.
Про НХЛ интересно, теоретически это возможно, но проблема с данными, их обработка самая трудозатратная часть. У НХЛ правда плюс что очень много ресурсов этим занимается. При этом модель все равно тогда придется переобучать, так как отличается специфика.
Дом до какого-то момента веса для своих моделей публиковал на самом деле, но они для нашей лиги естественно не применимы, поэтому я их получал на основе своей выборки по КХЛ. От Дома тут по сути базовый подход с системой рейтингов (он сам не с бейсбола взял) дальше регрессионный анализ и в путь. Play-by-play кстати тоже есть, не как у НХЛ, конечно, но ценной информации довольно много.
Только откорректировал)
В целом логика правильная, единственное для Северстали получается -10-(-4), то есть -6. Северсталь в том сезоне по разнице шайб, была на порядок лучше Куньлуня, но по оборонительным метрикам, которые у меня учитываются оказались сильно хуже, то есть да, модель ожидает для такой статистики худшую разницу шайб, а для Куньлуня наоборот. Возможно это связано со стилем игры, тут тяжело сказать, в 80% случаев попадание довольно точное идет между рейтингом и разницей.
Да, спасибо за замечания. Исправил, там как раз не отображались учтены Спунер с Гейджем, оба пока котируются в плюсе, но проблема именно в визуализации в цифрах они были учтены изначально.
Да, откуда-то лишнее предложение с Ак Барса заскочило, спасибо за наблюдение