Что о футболе знают топ клубы и не знаете вы ? Рассказываем про xG #1

тактика

Предисловие

С развитием технологий по подсчету и анализу статистику на свет стало появляться бесчисленное количество моделей оценки различных аспектов игры с помощью конкретных фактов и данных. Сегодня мы поговорим про, пожалуй, самую распространенную модель, которая используется аналитиками лучших клубов мира, для оценки выступления команд и игроков по отдельности. На повестке дня Expected Goals. Так же появилось и много доступной информации про xG в открытом доступе. Это подхлестнуло интерес к данной модели, так прошлой весной издательство The Guardian вышло со статьей про xG на первой странице, так же недавно новостной ресурс BBC опубликовал статью про xG . Наверняка вы видели подобные картинки на футбольных сайтах : 

Разбираемся откуда это все берется на основании метологии xG от Michael Caley.

Expected Goals

Я создал данную модель несколько ранее и она уже претерпела ряд изменений. Основным способом улучшения  своего метода я считаю просмотр большего количества футбольных матчей и последующее обсуждение их с коллегами. Чем больше я вижу процесс создания опасных моментов и их предотвращение, и чем больше я слушаю разбирающихся людей говорящих про это, тем более эффективно я могу построить свой метод.

Моим основным вопросом на протяжении всего времени работы с этой системой был вопрос : “ Имеет ли это футбольный смысл ?“. Очень просто найти значительный эффект, когда вы делаете регрессию, но это еще не значит, что это действительная находка для нашей системы. Всегда когда я искал регрессии отдельных показателей я прежде всего считал своим долгом заранее удостоверится в непосредственной взаимосвязи отдельных показателей и реального положения дел на поле. Вероятно это привело к ошибкам в математике, но я надеюсь, что это так же значит, что логика системы может быть передана максимально ясно.

Моей целью было создать минимальное количество формул, но разделить опасные моменты и создать различные формулы, если это действительно имело футбольный смысл, например когда моменты имели серьезные отличия между собой. В конце концов я закончил имея 6 разновидностей ударов и 6 уравнений. Они таковы :

  • Удары с прямых штрафных ударов
  • Удары после обводки вратаря
  • Удары головой после навеса
  • Удары головой НЕ после навеса
  • Удары НЕ головой после навеса
  • Удары НЕ головой НЕ после навеса ( или самые обычные удары ) 
  • ( Я так же должен отметить, что понятие “Удар” так же включает в себя то, что Opta называет “ chances missed “, когда должен был быть удар, но игрок его не нанес по различным причинам и удар не был зарегистрирован. Я включил и подобные моменты тоже.)

    Логика распределения их на разные категории состоит в том, что каждый удар имеет разную траекторию, разную зависимость между вероятностью забить гол и дистанцией до ворот, и угол между мячом и воротами. Для ударов после навесов угол с воротами не так важен как для других разновидностей ударов. После навеса сложно плотно ударить по мячу и поэтому угол не так важен, ведь в большинстве случаев если вам удалось плотно попасть по мячу после навеса, то скорее всего голкипер уже ничего сделать не сможет независимо от угла. Конечно даже в данном случае угол с воротами имеет значение, но оно несоизмеримо мало со значением других факторов. Так же, удары головой имеют различный траектории в зависимости от дистанции и от того были ли он совершены после навеса. Намного проще добить головой мяч с нескольких метров после отскока, чем забить с той же дистанции после навеса. Но вот если подобная ситуация произойдет на более значительной дистанции, например возле 11-метровой отметки, то игроку уже будет недостаточно силы одной только шеи для нанесения опасного удара по воротам после отскока, в то время при ударе после навеса с 11 метров игрок может использовать естественный импульс мяча для придания мячу большей скорости. В таком случае удар после навеса с 11 метров выглядит куда опаснее удара после отскока с той же дистанции. 

    После определения этих 6 категорий мы должны приложить к ним и  другие факторы.

    Угол и дистанция 

    Это конечно же самое сердце любой xG системы. Забить намного легче, если находишься ближе к воротам и так же легче забить когда ты прямо перед воротами, чем когда ты наносишь удар с угла. Но моделирование этих эффектов — своего рода безумие.

    Позвольте мне показать вам проклятие моего существования. Да, действительно, проклятие. Это стоило мне последние два-три года. Эта диаграмма, показывающая вероятность того, что удар ( не головой и не после навеса ) конвертируется в гол в зависимости от положения на поле.

    Вероятность гола в данном случае зависит от двух факторов. Первый — дистанция до ворот, второй — угол с воротами. Быть в 10 метрах от ворот под углом в 45 градусов значительно хуже, чем быть в 10 метрах от ворот под прямым углом к ним. Но здесь есть опаска. Темно красная зона разрастается только по центру перед воротами. Зоны по бокам от ворот очень быстро становятся мало опасными для нанесения удара из них. Но многие опасные удары были нанесены из этих самых крайних участков, которые просто не попали в цель. 

    Я перепробовал очень много способов создания единой формулы для этой формы. Но понял, что сделать это не возможно в какой либо простой манере. Выборка ударов играет большую роль. Игрок, находясь на крайней границе штрафной с боков, примет решение пробить только, если лучших вариантов просто нет, а вот если игрок получит мяч во вратарской и даже если пробить — не лучший вариант, то все равно скорее всего далее последует удар. Или например если игрок с мячом приближается к воротам под острым углом, то скорее всего он попытается отдать пас в центр, но если например вратарь вышел из ворот или никого из игроков в центре нет, то игрок скорее всего пробьет. Таким образом принятие решений игроком является третим ключевым фактором. Из-за этого уравнение становится неряшливым.

    Соответственно вместо использования одного термина для обозначения дистанции, моя формула включает в себя целых пять. А именно : дистанция до ворот, обратная дистанция до ворот, относительный угол до ворот и обратное ему значение, и обратная величина произведения угла и расстояния.

    Для подсчета значения относительного угла до ворот, я сравниваю конкретный удар с ударом с прямого угла к воротам. Другими словами если игрок бьющий по мячу находится на одинаковом расстоянии до обоих штанг, то относительный угол равен 1. А если игрок находится не по центру, то мы находим его угол к ближайшей штанге. Например, если игрок находится под углом в 45 градусов к ближайшей штанге, то относительный угол до ворот равен 0.5.

    Я обнаружил, что разные комбинации дистанций и углов были необходимы для каждой из шести различных категорий. Именно по этому я их и разделил. 

    Далее мы добавим другие факторы. Наибольшей проблемой всех xG систем от Opta является отсутствие данных по позициям защитников. Это ситуация говорит о том, что если защита не оказывает сопротивление атаке, то момент опаснее. И поэтому большинство следующих факторов направлены на определение позиции защитников исходя из отдаленных факторов, ведь данных о положении защитников нет.

    Следующая часть уже скоро …

    Источники :

    Opta 

    Michael Caley xG method

    Источник: http://www.sports.ru/

    Оставить ответ