サッカーデータ分析が踏み込むAI活用の未来(前編)。民主化の出発点は「共通言語」にある
フットボリスタ編集部も協力した、2025シーズンのJリーグをスタッツとともに振り返るレポート『J STATS REPORT 2025』が注目を集めたように、ますますファン・サポーターやサッカー関係者にとって、身近な存在となりつつあるサッカーデータ分析。あらためてその現在と未来を、サッカーのプレー評価やスポーツに関わるAI技術を研究する名古屋大学の藤井慶輔氏に、前中後編の全3回に分けて読み解いてもらった。前編では土台として、データと現場、研究の間にある課題を探りながら、さらなる民主化に必要な共通の「言語」と「道具」について考える。
サッカーの世界は、テクノロジーとデータ活用の進展によって着実に変わりつつある。国内外のトップクラブの中には、試合が終わってすぐに様々なデータが整理され、複数の指標とともに映像へ紐づけられ、次の準備の議論に入っていくチームもある。筆者自身が欧州クラブの現場に常駐してその全貌を知っているわけではないが、公開されている事例や研究、そして現場の人々との対話を追うほどに、「データ活用」が特別な取り組みではなく、日々の仕事の一部として組み込まれつつあることは確かだと感じる。一方で、同じ競技をしているはずの育成年代や地域リーグでは、分析といえば映像を見返しての振り返りが中心で、数値はGPSを導入していれば走行距離やスプリント回数など、という場合も多い。さらにメディアやファンの側では、xG(ゴール期待値)のような指標が広がったとはいえ、「何が起きたか」から「なぜそうなったか」へ踏み込むための共通言語はまだ十分ではない。
ここで取り上げたいのは、「大量データをどう活用するか」という話よりも、もう一段手前の問いである。つまり、誰が、どの粒度で、どんなコストで、サッカーデータを「使える」状態になるのか。言い換えれば、サッカーデータ分析の民主化はどうすれば進むのか、である。AIへの期待は大きいが、目的が曖昧なまま技術だけを取り入れても成果には結びつかない。データの質、前処理、評価の設計、そして現場の文脈を理解して説明責任を担う人間の役割がそろって初めて、データは意思決定の材料になる。全3回(前中後編)の本稿は「すぐ勝つための必殺技」を語るものではなく、時間はかかっても、判断の質と学習の速度を底上げする「土台」をどう作るかを考える内容としたい。
本稿では、プロ、アマ(チュア)、メディアといった異なる立場が何を「使える」と感じるのかを整理し、(断片的ではあるが)欧州で機能している仕組みから学べる要点を拾い上げながら、筆者が所属する大学などの研究機関がどこに貢献できるのかを考える。あわせて後半では、議論を抽象論で終わらせないために、筆者らが整備しているOpenSTARLab [1]の取り組みと、オープンアクセスで読める 『Machine Learning in Sports』(スポーツAIの書籍)[2] を例に、共通言語や再現可能な道具をどのように共有すれば「使える人」を増やせるのかまで考えたい。例えば、欧州では博士号取得後や IT 企業からプロサッカークラブのデータ職に就く事例が多く見られるが、それがなぜ可能なのか、なぜ日本では少ないのかについても考察したい。前編は本稿全体の土台として、データと現場の間にある課題を分解し、次回以降の議論につながる共通言語を紹介する回である。中編ではAIによる予測を軸に、得点や危険度、次のプレーといった「起こりそうな未来」を確率として扱う考え方を紹介し、後編では強化学習を手がかりに「もし別の選択をしていたら?」という反実仮想の提案へ、最新の知見をまじえながら踏み込んでいく予定である。
「ビッグデータ活用」の前に必要な「積み上げ」
データの話になると、つい「もっと多くの試合を」「もっと正確なトラッキングを」と、量や解像度に目が向きやすい。もちろんデータの量や質は重要だ。しかし、それだけではサッカーの現場で起きている本質的な違いを説明できない。なぜなら、データ活用は導入した翌週から勝敗が変わるような特効薬ではなく、同じデータ量でも「使える組織」と「使えない組織」が分かれる可能性があるからだ。効果が出るまでには、試合の準備やレビューの仕方、議論の粒度、担当者の育成といった「積み上げ」が必要で、どうしても時間がかかる。
では、時間をかけて何が得られるのか。第一に、意思決定の質が上がる。感覚や経験を否定するのではなく、同じ映像を見たときに議論が主観だけの空中戦になりにくくなる。第二に、再現性が生まれる。担当者が変わっても、毎試合のレビューが同じ手順で回り、比較できる形で蓄積される。第三に、人材育成が進む。新人アナリストや若手コーチが、どこから学び、何を見ればよいかの「型」を持てる。こうした土台が整うほど、小さな改善が連鎖し、結果として現場が学習する速度が上がっていくことが期待される。
その土台を分けるのは、技術力だけではない。データを集める人、整える人、分析する人、意思決定する人が分業できているか。分析の目的が共有されているか。試合後にレビューへ入るまでの流れが設計されているか。こうした運用設計と組織設計が揃って初めて、データは現場で機能する。民主化を考えるうえでも、この時間の掛かる土台作りをどう支え、どう共有するかが中心課題になる。
プロ、アマ、メディア…「誰が」データを使うのか
同じサッカーでも、データを使う目的と制約は立場によって大きく異なる。ここを混ぜると議論が発散しやすい。プロチームが欲しいのは、見栄えのよい指標やランキングではなさそうである。試合準備、試合中の判断、試合後レビュー、スカウティング、育成、練習設計、負荷管理など、意思決定の場面で「何を変えるべきか」を示す材料である。重要なのは、分析結果が映像と行き来でき、再現可能で、コーチや選手が理解できる形式になっていることだ。例えば「この局面は危険だった」という抽象的な結論だけでは足りない場合がある。「どのスペースが」「どのタイミングで」「誰の立ち位置が」「どの選択肢を減らしたのか」といった粒度までの説明が必要がある場合もあるし、そうではなく全体的な傾向が知りたい場合もある。
アマや育成年代では、プロのように選手全員の位置情報がなくても価値は出る。むしろ多くの現場では、分析担当者がいない、時間がない、動画編集すら時間を確保するのが難しい、という制約が先に立つ。ここで求められるのは、完璧なモデルではなく、現場の会話が変わる小さな成功だ。例えば、映像クリップの整理と簡単なラベル(タグ)付け、あるいは「局面」を共通言語として切り出すテンプレートだけでも、選手へのフィードバックの質は変わり得る。民主化の第一歩は、この場合最先端モデルの導入よりも、低コストで継続できる仕組み作りにあると言っても良い。
メディアやファンにとって、指標は競技理解を助ける翻訳装置である。xGが普及したのは、サッカーの得点という希少な事象を「確率」に置き換え、議論の共通基準を作ったからだ。しかし指標が広がるほど、誤用も増える可能性がある。数字が強い物語を作ってしまう場合には、「その指標が何を見ていて、何を見ていないか」をセットで語れることが重要になる。民主化とは、数字がひとり歩きしない状態を含んでいることが望ましい。
イベントとトラッキング。データの種類と分析の目的とは?
……
Profile
藤井 慶輔
名古屋大学大学院情報学研究科 准教授。主にスポーツ科学と機械学習の研究に従事し、両領域での論文や受賞多数。2025年、令和7年度文部科学大臣表彰 若手科学者賞を受賞し、著書 Machine Learning in Sportsが発刊。京都大学にて博士号取得後(人間・環境学)、理化学研究所革新知能統合研究センター研究員などを経て、現在に至る。【X: https://x.com/keisuke_fj】【note: https://note.com/keisuke_fj】【HP:https://sites.google.com/view/keisuke198619jp】
