MSN時代のバルセロナのゴール期待値を算出する

スポーツアナリティクス Advent Calendar 2019の2日目の記事です。

いきなりですが、以下のシュート動画をご覧ください(再生時間:1分32秒~)。

15/16シーズンのバルセロナ対セルタ戦において、スアレスが決めた決勝点のシーンです。

La Liga公式コンテンツが含まれているため、ブログ内で視聴できません。YouTubeに飛んでご覧ください。

サポーター視点だと確実にゴールを決めて欲しい場面ではありますが、客観的に見ると決して易しくはなく、評価が難しいシュートです。

位置的には決めやすそうですが、DFとGKからプレッシャーを受けているため、ワンタッチでのシュートが求められる状況です。

これって一体どれくらい難しいシュートだったのでしょう…?結構気になりませんか?

というわけで、今回のテーマは「シュートの成功確率を予測する」になります…!

本記事では、分析の問題設定と結果について紹介します。

分析手法の詳細まで解説していると長くなるため、後日別パートでUPすることにしました。

シュートを定量的に評価する”Expected Goals (xG)”

産業界でデータ分析が流行していますが、サッカー界にもその流れが押し寄せています。

現在ではシュートの成功確率を評価する指標が存在し、”Expected Goals (xG)と呼ばれています。

xGとは、シュートが得点につながる確率を0~1の範囲で表したものです。

xGが0.3のシュートは、30%の確率でゴールに繋がることを意味します。

xGはシュートの角度や距離、使用部位など、様々なパラメータを考慮に入れて算出されます。

MSN時代のバルセロナのxGを算出する

「xG算出にトライしてみよう!」

ということで、StatsBombが提供しているオープンデータを利用し、MSN時代のバルセロナのシュートを分析してみました。

La Ligaの全シュートを分析したいところですが、データはメッシが出場した試合に限定されているため、彼が出場した試合のみ対象とします。

実はデータの中にStatsBombが算出したxGの値も含まれているのですが、それを可視化するだけでは面白くないため、独自に算出モデルを作成しました。

どのシーズンを分析するか迷いましたが、メッシ、スアレス、ネイマールの3選手(MSN)で公式戦131ゴールという大記録を打ち立てた15/16シーズンを選びました。

ルイス・エンリケ政権2年目であり、MSNの威力が最も発揮されたシーズンです。

一時的にメッシの欠場やネイマールの不調などがあったものの、それを補うようにスアレスが得点を量産し、得点王となったシーズンです。

機械学習を用いたアプローチ

それでは算出方法を解説していきます。

今回は機械学習を用い、シュートデータからxGを算出しました。

機械学習とは、データの特徴をコンピュータが自動で掴み、課題を実行することを指します。簡単に言うと”AI”のことです。

今回の場合、データは「バルセロナの過去のシュート情報」であり、課題は「15/16シーズンのシュートの成功確率を予測する」となります。

StatsBomb提供のシュートデータは以下のようになってます。

コメント 2019-12-02 130250

画像には一部しか写っていませんが、10年間にわたる5,600本ものシュートデータが収められており、パラメータも30個以上あります。

AIに04/05~14/15シーズンのシュートデータを学習させた後、15/16シーズンの全シュートに対して成功確率を予測させました。

機械学習の手法であるLightGBMというモデルを使用したのですが、詳細は後日ということで、さっさと結果に移ります!

メッシが出場した33試合におけるゴール数とAIが予測したxGの合計を以下に示しました。

コメント 2019-12-02 134928

合計ゴール数が95点であるのに対し、予測xGの合計が95.95と、誤差を1点以内に収めることができました。

StatsBombが算出したxGの合計より誤差が少ないことから、モデルの予測性能は悪くないはずです。

MSNの破壊力

それではxGを使って選手やシュートを分析していきましょう。

まずは選手評価ですが、横軸にシュート1本あたりの平均xG縦軸に決定率をプロットしたものが下図になります。

コメント 2019-12-02 194323

重要なのは、点が黄色の点線の上側に位置するのか、それとも下側に位置するのかです。

メッシとネイマールは点線の下側に位置する一方、スアレスは上側に位置しています。

これは、スアレスは期待された以上の決定率を残し、優れたパフォーマンスを発揮していたことを意味します。

グラフはスアレスの決定率が予測値より10%ほど高いことを示しており、彼のシュート能力の非凡さが伺えます。

実際にこの年のスアレスはシーズンを通して好調であり、自己最高の40得点を記録しています。

もちろんメッシやネイマールが劣った選手というわけではありません。

より多くゴールを決めていてもおかしくないものの、メッシ出場の33試合でそれぞれ26点、16点という得点ペースは驚嘆に値します。

2人の凄さを物語るデータをさらに提示しましょう。

下図は、各選手のキーパスによって生まれたシュートのxG、つまりExpected Assists (xA)の合計を横軸に、アシスト数を縦軸にプロットしたものです。

コメント 2019-12-02 195349

ご覧の通り、メッシとネイマールで多くのゴールチャンスを創出していたことがわかります。

アシスト数だけ見るとネイマールは他の2人より劣っているように思えますが、実際はメッシと同程度のチャンス創出を行っています。

MSNが凄いのは皆の知るところですが、「一体どれくらい凄いのか」「従来のスタッツに現れない凄みは何か」まで踏み込み、より正確な分析ができるのがxGの魅力です。

15/16シーズンのベストゴール(?)

さて、今まで小難しい話をして参りましたが、最後はビジュアルの力に頼ってもっと分かりやすく話をしたいと思います。

xGはシュート1本1本に対して算出されるため、最も成功確率が低かったゴールを知ることができます。

今回は対戦相手や試合状況に関する情報は考慮に入れていないため、純粋な「ベストゴール」とはいきませんが、「最も成功確率が低かったゴール」として、トップ3を紹介していきます!

3位:メッシのFK弾

  • 再生時間:1分25秒~
  • 試合:26節 バルセロナ vs セビージャ
  • スコア:2 – 1
  • xG : 0.071

3位はメッシのフリーキックです。

23m付近やや左めの位置から、ゴール右上に突き刺した貴重な同点弾。

xGの値は0.071であり、100本に7本しか決まらないシュートになります。

19/20シーズンのメッシはFK成功率が高く話題となっていますが、15/16シーズンでも4本のFKを沈めており、どれも素晴らしいキックでした。

2位:ラキティッチのスーパーミドル 

  • 再生時間:1分0秒~
  • 試合:15節 バルセロナ vs デポルティーボ
  • スコア:2-2
  • xG:0.069

2位はMFラキティッチのミドル弾。これは紛うことなきスーパーゴール!

27mというシュート距離の長さや、15°というポスト間角度の小ささが影響したのでしょう。

1位:スアレスのヘディング弾

  • 再生時間:9秒~
  • 試合:6節 バルセロナ vs ラス・パルマス
  • スコア:2 – 1
  • xG:0.063

映えある1位はスアレスのヘッド!

シュート距離も短く角度もあるのでそこまで難しく見えませんが、ヘディングでのシュートであること、DFからプレッシャーを受けていること、クロスを受けてのシュートであることなどから、低いxGが算出されたのだと予想しています。

おわりに

以上、上位3つのシュートを紹介しました。

「xGは高いけど決まらなかったシュート(QBKとか宇宙開発とか…)」も当然出せるのですが、映像が参照しづらいですし、バルサファンがよく思わない可能性もあるので、今回はやめておきます()

ちなみに冒頭の答え合わせですが、スアレスによるワンタッチシュートのxGは0.17でした!

読んで頂きありがとうございました。

次回の記事はこちら↓

バルセロナのシュートデータを可視化する バルセロナのゴール期待値をLightGBMで予測する

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です