Рецензия на стратегию ставок на теннис от Breakpointer

Сегодня мы хотим привести вам в оригинале стратегию ставок на теннис от гандикаппера Breakpointer, которой он великодушно решил поделиться с посетителями нашего блога, а также дать нашу рецензию и прокомментировать наше мнение по поводу создания подобной теннисной модели.

В поддержку модели Breakpointer мы заметим, что действительно, быстрый анализ данных за несколько лет в мужском теннисе ATP, явно показывает, что большинство статистических показателей выполняется из года в год. Это применимо и к другим стабильным спортивным лигам, не только к теннису. Единственное, что нужно следить за глобальными изменениями правил и принципов лиги. Наглядный пример – когда в баскетбол добавили линию 3-очковых бросков, статистика собранная за предыдущие годы стала бесполезной. Но подобные нововведения случаются раз в десятилетия. Для тенниса максимальный стратегический риск составляет возможность внесения изменений в подсчёт рейтинговых баллов ATP, что сильно повлияет на мотивацию спортсменов. Кроме этого, Breakpointer не указывает список своих гипотез, без которого сложно оценить эффективность модели со стороны, но применяя его подход, убирающий человеческий фактор, список конкретных гипотез сложно всё же проверить на опыте, что показывает статистика, то и применяем. В целом существенных минусов в логике мы не нашли и выражаем уважение Breakpointer за проделанную работу на благо индустрии ставок на спорт в рунете.

Оригинальный текст гандикаппера Breakpointer:

Здравствуйте!
В этой статье я хочу поделиться опытом создания теннисной модели.
Самый первый шаг в построении модели – выбор букмекера с сильной линией для анализа событий. В своих расчётах я использую открывающуюся линию Pinnacle. Это принципиально важно, потому что только используя «правильную» линию можно получить достоверные результаты на дистанции. Отдельно стоит учитывать результативность модели с использованием прочих БК. Например, результативность модели ROI = 10 %, с учётом прочих БК даст ROI = 12%. После этого нужно начинать собирать статистику на игроков попарно – то есть на каждый предстоящий матч день за днём. Причём чем больше – тем лучше. Никогда не знаешь, какая статистика будет действительно ценной, а какая нет. В моей модели используется по 20 статистических параметров на каждого игрока (на сайте ATP можно найти практически всю исчерпывающую информацию). Excel отлично подходит для построения и проверки модели.

Имея достаточно статистики, коэффициентов и исходов матчей, можно приступать собственно к моделированию.
В своей модели я отказался от вычисления вероятности событий и пошёл по другому пути – построение гипотез. Гипотезы применительно к модели – это вопросы «а что будет, если…?». Например, есть такой критерий (конкретное значение статистического показателя) как количество выигранных матчей из 10 последних. Что будет, если ставить на андердога, если он выиграл минимум 5,6 или 9 из 10 матчей? Или какое преимущество по эйсам должно быть у овердога, чтобы ставить на него? Имея в базе хотя бы 1000 матчей, можно заметить, что при использовании определённых критериев ставить выгоднее. Таким образом, нужно проверять влияние всех статистических критериев на результат, пока ваша модель не станет приносить доход. Ставить нужно, если все критерии соблюдаются. Если хоть один статистический показатель не подходит под критерий, ставка пропускается.

Этот способ моделирования представляет собой постепенное отсечение «фоновой» статистической информации от модели и выявление ключевых комбинаций критериев до тех пор, пока в ней не останется лишь значимая, реально влияющая на вероятность исхода информация. По сути, это значит нахождение неучтённых в коэффициентах статистических факторов, то есть преимущества над линией.

В построении и функционировании модели можно выделить несколько этапов:

Сбор данных. Лучше сразу начать собирать максимум данных, несущественные потом можно будет отбросить, а неучтённые изначально данные будет сложно восстановить.

Построение гипотез. Проверка влияния критериев на доходность модели.

Тестирование. Проверка модели на способность «предсказывать» с прибылью как прошедшие ставки, так и будущие.

Кризис. Рано или поздно в течение первого года настанет момент, когда протестированная модель начнёт давать отрицательный результат. Это время для анализа модели и поиска новых гипотез. Данный этап можно избежать, если вы строите модель на достаточном количестве событий – база данных должна содержать всю необходимую статистику минимум за 2 года.

Стабильность. Модель даёт устойчивую прибыль при ретроспективном и перспективном анализе. За каждый год модель должна давать примерно одинаковый результат.

Калибровка. Подстройка критериев для максимизации прибыли и минимизации дисперсии.

Принципы построения модели:

Автоматизация принятия решений. В модели от человека ничего не зависит. Если все критерии сходятся – ставим, нет – пропускаем.

Количественная формализованность. Вся статистика должна быть выражена в цифрах, чтобы её можно количественно измерить и сравнить. Например, влияние критериев wild card, домашний турнир, левша или правша игрок – не подходят.

Принцип «чёрного ящика». Со временем система настолько усложнится, что вы уже с трудом будете разбираться в том, как она работает. Как говорится, книга получилась умнее автора. На вход «чёрного ящика» подаётся статистическая информация, на выходе ответ – ставить или нет.

Регрессионное тестирование. Модель должна позволять работать с данными за несколько предыдущих лет для выявления закономерностей, установления оптимальных значений критериев и исправления ошибок.

Определения рабочего диапазона коэффициентов. Оптимальный по показателям (дисперсия, количество ставок, ROI) диапазон коэффициентов. Я, например не рассматриваю события с коэффициентом ниже 1,45 и выше обратного ему.

Приоритет долгосрочных и среднесрочных статистических данных над краткосрочными. Нередко БК дают «странные» коэффициенты из-за недавних громких побед или поражений игроков, несмотря на их среднесрочную форму.

Принцип «Бритвы Оккама». «Не следует привлекать новые сущности без крайней на то необходимости». Применительно к моделированию это значит, что не стоит увлекаться форами, тоталами, точным счётом и т.д. Это даст примерно такую же прибыль, как и ставки на победителя, но уровень сложности системы увеличится в разы.

Учёт движения линий. Анализируйте коэффициенты открытия и закрытия БК, тенденции в их динамике. Учитывайте, у каких БК линия сильная, а у каких – слабая. Могу сказать, например, что у БК «Марафон» на данный момент линия на теннис даже не слабая, а просто «кривая».

Ранжирование. Некоторые статистические показатели нужно сравнивать не как абсолютные величины, а как соотношение рейтингов.

Лучше всего прогнозируется одиночный мужской теннис уровня ATP.
Средние результаты модели (линия Pinnacle):
Овердоги (1,45-1,94) ROI =11%, точность 68%, (в «норме» овердоги выигрывают 60% матчей),
Андердоги (1,95-3,00) ROI =21%, точность 52%, (в «норме» андердоги выигрывают 40% матчей),
В среднем (1,45-3,00) ROI =15%, точность 62%,
В год получается примерно 700 ставок.

Несомненный плюс моделирования – экономия времени и нервов. После создания успешно работающей модели можно тратить на бэттинг 30-60 минут в день и иметь стабильную прибыль, но несколько лет скрупулёзного ковыряния в статистических завалах может многих отпугнуть. Выбор за вами.
Надеюсь, кто-то найдёт для себя что-нибудь интересное в этом тексте.


7 коммент. про “Рецензия на стратегию ставок на теннис от Breakpointer

  1. Моделировать нужно сам матч , учитывая ВСЕ возможные условия,аспекты и особенности того или иного игрока. Халявки в этом деле не будет

  2. Sizif – я не согласен! Я как раз очень впечатлён статьёй этого человека. Во-первых, по грамотности материала я не сомневаюсь, что он действительно достиг таких высот именно в статистическом анализе. А во-вторых – чел же говорит… пошёл по пути гипотез. Если x5x7 не возражает, я так же сошлюсь на американские виды спорта. Ведь вне зависимости от того, кто против кого играет, кто травмирован и т.п в каждом конкретном матче, средние статистические показатели выполняются из года в год. Чем больше выборка, тем ближе к средним. Я согласен, подход гипотез звучит мутно, но в этом есть глубокий смысл! если задуматься :)))

  3. что-то в этом есть….. вот кто мог подумать, что Вавринка переиграет Джокича….. После того, КАК Джок ЗАБИЛ Надаля и Маррея в лучшем матче Маррея за историю на грунте….. а посмотрите на статистику. Вавринка играл на последних шлемах с Джокичем 5 сетов 2 раза, причем забил в финале ранее, а в этом году поборолся. а ведь это было на харде. а на грунте наоборот сила Вавринки увеличивается…. вообще что статистика именно говорила не за Джока…. и КЭФ был под 8 на Вавринку….анализ конкретного матча и турнира говорил за Джока, но анализ долгосрочной статистики тупо говорил за Вавринку….. по крайней мере за близкий матч…. как видим, статистика была сильнее!

  4. Странно, что о таком гандикаппере в интернете нет ни одного упоминания… Местные статейки давно попахивают рекламой

  5. Во-первых, тут нет ничего странного. Про большинство гандикапперов в интернете нет упоминаний. Зачем? :) А во-вторых, мы лишь используем никнейм, который человек брал для комментариев на нашем сайте, может он где-то и есть под другим никнеймом. Так или иначе, мы его не знаем, и даём рецензию со стороны!

  6. Автору статьи респект,чувствуется профессиональный и грамотный подход.Это для меня как взгляд под другим углом,очень интересный подход и я уверен,что тут есть великая идея!!!

  7. Интересная статья. Примерно аналогичным способом я пытаюсь анализировать футбольные матчи с недавних пор. У меня есть конкретные критерии, под которые должно попадать событие. Думаю, что иду в правильном направлении. Не хватает выдержки так как мало событий ( до 20 в месяц ), мешает азарт. Основная идея – выиграет тот, кто выигрывает. Коридор коэфициентов немного другой, на андердоги не ставлю. С теннисом не знаком.

Leave a Reply

Your email address will not be published. Required fields are marked *