Ставки на спорт могут быть чем-то большим, нежели просто интуицией. Вы могли бы иметь лучшие шансы, добавив надлежащий анализ данных и прогнозное моделирование.
Традиционные методы
Для начала давайте рассмотрим традиционную статистику на спортивном сайте Вулканбет.
Представьте, что сегодня финальная игра сезона. Команда А встретится с командой С. Какая команда, по вашему мнению, имеет больше шансов на победу в чемпионате? На кого бы вы делали ставки? Ниже приведены записи игр плей-офф с участием команды A и команды C.
Спортивные сайты, часто предоставляют такую статистику:
W – Всего побед, L – Всего потерь, T – Всего ничьих
Традиционный метод ранжирования команд – это процент выигрышей, т. е. Процент побед от общего числа игр. В этом случае команда А будет связана с командой С, поскольку у них обоих одинаковый процент выигрыша в 50%. Но если присмотреться к игровым данным, команда C обыграла команду B (7–0) больше, чем команда A – команду B (1 – 0). Таким образом, команда C должна иметь больше шансов победить команду A на этот раз.
Легко изучать каждый результат, когда есть небольшое количество игр. Но когда команд и игр много, нам нужен систематический способ анализа данных. Как мы можем учесть такие детали, как различия в целях по сравнению с прошлыми играми, чтобы получить лучший рейтинг команд?
А что, если эта финальная игра состоится на родине команды А? Хозяева обычно выигрывают у гостевой команды. С этой дополнительной информацией какая команда, по вашему мнению, имеет больше шансов на победу сейчас? Как мы учитываем преимущество дома при оценке игры?
Статистический метод – шаг за шагом
Чтобы ответить на поставленные выше вопросы, мы строим статистическую модель, используя данные НХЛ. Вы можете применять модель и для других видов спорта. Алгоритм, используемый для моделирования рейтингов, называется скорректированной системой оценок плюс / минус. Вы можете прочитать подробное описание системы здесь. Или просто выполните это, выполнив три шага ниже.
Шаг 1. Загрузить данные в формате CSV
Данные состоят из 640 строк, которые включают результаты игр в период со 2 октября 2019 года по 3 января 2020 года. В них есть пять переменных: date, visitor, visitor_goals, home и home_goals.
Например, в приведенной ниже строке записана игра 6 декабря 2019 года. «Монреаль Канадиенс» (выездная команда) сыграл против «Нью-Йорк Рейнджерс» (домашняя команда) с итоговым счетом 2–1.
Шаг № 2: Преобразование данных
Добавить новые функции
Сначала мы создаем переменную goal_difference как разницу между home_goals и visitor_goals. Он больше 0, когда команда хозяев побеждает, и меньше 0, когда команда хозяев проигрывает, а 0, когда две команды играют вничью.
Шаг № 3: Построить прогнозную модель
Мы используем модель регрессии гребня в качестве демонстрации.
Это модель линейной регрессии с дополнительным членом в качестве штрафа. Из-за мультиколлинеарности между независимыми переменными традиционная линейная регрессия не дает стабильных результатов.
Подходит модель регрессии гребня Мы используем функцию goal_difference в качестве целевой переменной.
Какие еще советы помогут улучшить результаты?
Конечно, еще есть куда улучшить результаты наших прогнозов.
Совет № 1: Рассмотрите расписание команды в последние дни
Вы можете добавить переменные, учитывая недавнее расписание команд. Играли ли команды в игры или отдыхали в последние дни? Команда много путешествовала за пределами дома?
Совет № 2: Взвесьте результаты игры
Ситуация в команде всегда меняется в течение сезона. Поэтому последние игры должны быть более информативными по сравнению с предыдущими. Добавление индикатора для этого поможет.
Совет № 3: Используйте разные модели
Мы использовали модель регрессии гребня в качестве примера. Тем не менее, для лучших результатов вы можете протестировать и объединить другие модели машинного обучения / статистики, такие как нейронные сети, GBM.
Совет № 4: Добавьте свое собственное мнение
Модели не могут включать всю информацию. Как опытный любитель спорта, вы должны иметь ценные знания. Объединение статистических методов и вашего опыта имеет решающее значение для более точных прогнозов.
Ставки на спорт – отличный способ попрактиковаться в науке о данных, развлекаясь. Больше информации можно узнать по ссылке https://phis.org.ru/bukmekerskie-kontory-bukmekerskaya-kontora-vulkanbet.html
Подписывайтесь на Ukrnews24.net в Telegram, чтобы быть в курсе самых интересных событий.
Последние новости