5 мин.

Как Спортс” работает со статистикой. Откуда берутся данные и что мы с ними делаем?

Разговор изнутри.

Статистика пронизывает абсолютно все виды спорта, за которыми мы привыкли следить. Данные в том или ином виде – давно база для всего, что происходит на Спортсе”.

Продакт-менеджер нашей статистической команды Юра Еремичев и лид команды бэкенда Макс Купцов пришли в подкаст «Коллеги, добрый день!», чтобы подробно рассказать про задачи, сложности, основные челленджи и особенности статистических продуктов Спортса’‘.

Очень советуем послушать подкаст целиком на ВидеоСпортсе’’, а тут – несколько самых любопытных деталей.

Откуда берутся данные

Нам помогают поставщики спортивной статистики – отдельные компании, которые профессионально этим занимаются. Они собирают данные и продают за большие деньги букмекерам или спортивным медиа.

Наша задача – интеграция этих данных на сайт. Поставщиков очень много по разным видам спорта, у них у всех собственные форматы. Например, у одного написано «Реал Мадрид», у другого – «Мадрид», у третьего – просто набор непонятных на первый взгляд ID. Нам это все надо между собой подружить, агрегировать и красиво показать на сайте. 

Как технически устроена работа с данными

Когда мы на сайте показываем онлайн-тизер с матчем и счетом – кажется, что все просто. Но на самом деле за этим стоит с полсотни микросервисов, которые должны все это правильно обрабатывать.

Специфика спортивных нагрузок в том, что основной трафик приходит во время перерывов в играх или после матчей. Это моменты, когда люди сразу бегут смотреть статистику, обсуждать и писать комменты – нагрузка растет.

Справляться с нагрузкой на сайт при больших событиях нам помогает, что лет семь назад мы перешли на микросервисную архитектуру. Старый бэкенд уже не вывозил, поэтому распиливание здорового монолита на кучу микросервисов позволило избегать многих проблем.

Почему покрытие данными разных матчей неоднородное

В первую очередь, все упирается в экономику: просто может не быть бизнес-интереса к определенным соревнованиям.

Еще распространенный сценарий – картинка и ее качество. В турнирах с низким покрытием могут быть проблемы с банальным доступом к трансляциям.

Что нас выделяет на фоне конкурентов

Мы фокусируемся в основном на домашних рынках. У поставщиков неоднородное покрытие – соответственно, мы должны разбираться сами. Сейчас работаем над тем, чтобы увеличивать покрытие в турнирах, где статистики меньше всего у конкурентов. Например, недавно мы с помощью партнеров углубили покрытие по Второй лиге. Теперь можно зайти в онлайны матчей и посмотреть детальную статистику.

Спортс” – агрегатор статистики. Мы содержим данные из разных источников: по России идем к одному поставщику, по международным турнирам – ко второму, а для некоторых соревнований сами становимся поставщиками. Например, для Медиалиги.

Отдельно отметим скорость. С учетом того, что у поставщиков нет некоторых данных, которые есть у нас, мы можем влиять не только на полноту, но и на скорость доставки до пользователя. И в некоторых сценариях на секунды, но опережать конкурентов: быстрее отправлять пуши.

Мы – медиа, поэтому одним сценарием потребления статистики не ограничиваемся. Она у нас тесна вплетена в потребление контента, в разные другие страницы и даже сервисы. У нас есть креативная студия «Сирена», там запускают целые игровые проекты на основе наших данных. И это придает проектам дополнительную ценность. Это не статистика в сыром виде, а целые игровые механики, основанные на ней.

Куда идет спортивная статистика на Спортсе”

Во-первых, мы стремимся расширять покрытие. У нас есть необходимость покрывать самые разные интересы: будь то «Барселона», «Крылья Советов» или российская Вторая лига. Статистикой по Второй лиге мы обогатились, на подходе – Первая лига и Кубок России в более полном объеме относительно текущего.

Второе – собираемся и дальше обновлять страницы со статистикой старого образца. И технически изнутри, и визуально для пользователей. В прошлом и начале этого года мы модернизировали хоккей и теннис. До конца года и в начале следующего мы хотим сделать то же самое с баскетболом: сделать новую верстку, пополнить объемы данных.

Третье – обогатим страницы, которые уже есть. В футболе, например, говорим о фичах с инфографикой: карты ударов, тепловые карты и прочие улучшения, благодаря которым у пользователей будет больше понимания, что именно происходит на поле.

А еще мы, конечно, постоянно работаем над устойчивостью. Естественно, тут никак без внешних факторов, на которые не повлиять, но мы делаем все, чтобы у пользователей были только позитивные впечатления от нас как от источника статистики.

Спортс” изнутри: как устроены модерация, авторизация и защита ваших данных?

Вакансии и внутренняя кухня компании
24 комментария
По дате
Лучшие
Актуальные
>Мы фокусируемся в основном на домашних рынках
Инфа по ФНЛ посмешище. Сейчас зайдешь посмотреть лучших бомбардиров ФНЛ, там игроки с одним голом и пятью сыгранными матчами
https://www.sports.ru/football/tournament/1liga/stat/
У вас крайне плохая статистика, простите, например в фэнтези есть кол-во перехватов, но где этот показатель посмотреть? Ответ: нигде. Отдельное меню в приложении есть, но выглядит ужасно, CJM до каких-то менее очевидных вещей - дикий. Из того что есть, все время какие-то баги вылезают, которые месяцами не исправляются.

Хвалиться нечем.
Не по статистике, но для меня до сих пор большая загадка - почему у тренеров в профиле нет их тренерской карьеры
Буквально на днях хотелось посмотреть статистику сборной Германии в отборе к ЧМ, с кем и как играли. Поиск непонятный, пишешь сборная Германии, вылезает миллион разного. Но самое удивительное - раздел прошедшие/предстоящие матчи. Есть два раздела по сыгранным: 2024 и 2025/2026, в 2025/2026 нет никаких данных. Это сборная Германии по футболу и отбор к ЧМ. Спортс и Статистика это антонимы.
Ответ babajaro
>Мы фокусируемся в основном на домашних рынках Инфа по ФНЛ посмешище. Сейчас зайдешь посмотреть лучших бомбардиров ФНЛ, там игроки с одним голом и пятью сыгранными матчами https://www.sports.ru/football/tournament/1liga/stat/
Над этим прямо сейчас работаем как раз
Смотрю статистику только по футболу, раньше была даже по второй лиге, а теперь и по ФНЛ не делаете.
Возможно, сами данные у "Спортса" от хороших источников, но по визуалу, как мне кажется, он сильно уступает тому же "Чемпионату".
Ну а чтоб найти что-то в архиве...
В общем, у главного конкурента неоспоримое преимущество в плане интерфейса и простоты.
Вся статистика -- это кто вышел, забил и гол передачи. В нескольких лигах. Что вы тут продаете?
Раньше всегда можно кликнуть на матч НХЛ, чтобы посмотреть +/- игроков, теперь зачем-то спрятали один из самых важных показателей. Нужно кликать сначала на статистику, а потом еще и между командами перемещаться

Еще непонятно, почему при клике на результат матча НБА можно перейти на другие матчи дня, а в НХЛ это так не работает, нет в шапке блока с матч-центром, очень странное решение
Особенно заметно, что нет раздел "какие данные мы анализируем")) никакие )))