2 мин.
0

Как данные помогают заранее увидеть риск травмы у футболиста

В спортивной подготовке травмы приводят к пропуску тренировок, нарушению плана подготовки и снижению готовности спортсменов к соревнованиям. На командном уровне травматизм влияет на состав, игровую согласованность и устойчивость выступлений. На уровне спортивной организации усложняется планирование участия в турнирах и возрастает нагрузка на медицинское сопровождение.

Риск травмы определяется множеством параметров: тренировочной нагрузкой, историей травм, физической подготовленностью, качеством сна, уровнем стресса, питанием и соблюдением разминки. Вклад отдельных факторов меняется при разных сочетаниях нагрузки, восстановления, анамнеза травм и физической подготовленности.

В рамках выпускной квалификационной работы была разработана и оценена интерпретируемая модель прогнозирования риска травмы у футболистов на основе открытых спортивных данных. В качестве основы исследования использован открытый набор University Football Injury Prediction Dataset, содержащий сведения о 800 университетских футболистах.

В работе были построены и сопоставлены модели машинного обучения для прогнозирования риска травмы: логистическая регрессия, наивный байесовский классификатор, метод ближайших соседей, метод опорных векторов, случайный лес, градиентный бустинг, ExtraTrees, HistGradientBoosting и многослойный перцептрон.

Результаты вычислительного эксперимента показали высокую прогностическую информативность набора признаков. Наилучшие тестовые метрики получили наивный байесовский классификатор и логистическая регрессия. В роли базовой интерпретируемой модели использовалась логистическая регрессия, а в качестве основной модели прототипа была выбрана ExtraTrees. Выбор ансамбля связан с учетом нелинейных зависимостей между признаками и с возможностью объяснять индивидуальный прогноз через SHAP.

Анализ факторов риска показал устойчивую картину. Наибольший вклад в рост вероятности травмы связан с уровнем стресса, временем реакции и числом ранее перенесенных травм. Снижение риска связано с большей продолжительностью сна, лучшими показателями равновесия, гибкости, силы, ловкости, качества питания и соблюдения разминки. Совпадение ключевых факторов в линейной и нелинейной постановках усиливает доверие к полученным выводам.

Практическим результатом работы стал прототип сервиса, обеспечивающий ввод характеристик спортсмена, расчет вероятности повышенного риска, выделение индивидуальных факторов риска и вывод кратких комментариев по признакам, требующим внимания. Применение сервиса допустимо и на индивидуальном уровне, и на уровне команды – при ротации состава, ограничении нагрузки и распределении восстановительных мероприятий в условиях турнирного календаря.

SHAP-анализ показывает вклад признаков в прогноз модели оценки риска травмы футболиста. Наибольшее влияние оказали уровень стресса, время реакции, история травм, качество сна и показатели физической подготовки.