ロコガイド テックブログ

「地域のくらしを、かしこく、たのしく」する、株式会社ロコガイドの社員がいろいろな記事を書いています。

「地域のくらしを、かしこく、たのしく」する、株式会社ロコガイドの社員がいろいろな記事を書いています。

セイバーメトリクスから学ぶサービス開発

f:id:hatuyuki4:20210409110409p:plain

はじめに

こんにちは @hatuyuki4です。普段はiOSアプリを開発しているモバイルアプリエンジニアです。プロ野球が好きで、特に楽天イーグルスを応援しています(宮城出身)。最近は野球好きが講じて、セイバーメトリクスの本をいくつか読みました。セイバーメトリクスは、野球を統計学的に分析する非常におもしろい試みなのです。しかしこのアプローチは野球だけではなく、様々な問題解決にも応用できます。

というわけで今回は、セイバーメトリクスの考え方の紹介と、それのサービス開発への応用事例について書きたいと思います。

セイバーメトリクスの考え方

統計学によるデータ分析と聞くと難しいように感じますが、セイバーメトリクスの発端は非常にシンプルです。それは「どうすれば勝利を増やせるか、データから分析してみよう」というものです。その考え方を段階的に分けると以下のようなものになります。

1.勝利という明確な目的を設定する
2.勝利に最も関連する得失点差を考察する
3.得点、失点に最も関連のある指標で選手を評価する
4.選手を評価する指標から、その選手と関係ない要素を排除する

1.勝利という明確な目的を設定する

セイバーメトリクスの目的は勝利を増やし、球団経営に役立てることです。勝利という明確なゴールがあるので、難解な議論がブレずに建設的に行なえます。どのようなタイプの選手が勝利に貢献しているのかという、データ分析の方向性を明確にできるからです。

どのようなタイプの選手がより勝利に貢献しているのかがわかれば、選手獲得、年俸の査定、育成の方針など様々な分野に活用できます。世間や他球団での評価は低いけど実は勝利への貢献度が高い選手を獲得することで、リーグ最低クラスの年俸総額で最高勝率を叩き出したアスレチックの実話は、マネーボールというタイトルで映画化もされました。

2.勝利に最も関連する得失点差を考察する

野球というスポーツの勝利条件は1試合での得点が失点よりも多いことであるので、勝利と得失点は非常に大きな関係があります。セイバーメトリクスの創始者であるビル・ジェームズは勝率と得失点差に強い相関があることを導きました。これをピタゴラス勝率と呼んだりします。

得失点差が勝利に影響するなんて当たり前じゃないかと思われるかもしれませんが、ここが明確になっていることが非常に重要です。これにより、分析する対象を得点を増やすこと失点を減らすことにフォーカスできるからです。参考

f:id:hatuyuki4:20210409100958p:plain:w500

3.得点、失点に最も関連のある指標で選手を評価する

分析の対象が絞れたら、今一度野球のルールを分解していきます。野球とは3つのアウトを取られるまでに、ランナーを本塁へ返せば得点となります。なのでいかにアウトにならずに出塁するかが重要になります。その出塁は、ヒットである必要性はありません。

打者の評価には打率(ヒットを打つ確率)が重視されてきましたが、得点との関係では打率よりも四球による出塁を含めた出塁率のほうが高くなります。またシングルヒットではランナーが返ってくるまでに4本のヒットが必要ですが、ホームランを打てば1本で得点が生まれるので、長打率も重要になってきます。出塁率と長打率を足し合わせたOPSは、シンプルながら得点と関連性が高く、打者を評価するうえで重要な指標となっています。以下の図からも、チーム打率よりもチームOPSの方が得点と強い相関があることが分かります参考

f:id:hatuyuki4:20210409101026p:plain

4.選手を評価する指標から、その選手と関係ない要素を排除する

失点に焦点を絞って投手を評価しようとしても、その投手の実力以外の要素が大きく関わってくることがあります。例えば投手を評価する一般的な指標である防御率(一試合で失点する割合)は味方の守備力に大きく左右されます。守備についている人が一流のプロか、素人レベルかで考えれば、全く同じ投手が投げても失点数が大きく変わることは容易に想像できます。

つまり、投手がどれだけ失点減少に貢献しているのかを純粋に評価しようとした場合、他の野手の影響を極力排除する必要があります。そのためセイバーメトリクスではFIP(Fielding Independent Pitching)直訳すると守備から独立した投球内容という指標を重視したりします。参考

セイバーメトリクスを参考にするメリット

今まで野球の話をつらつらと書いてきましたが、ただ野球の話をしたいわけではありません。セイバーメトリクスの考え方がサービス開発を始め、あらゆる問題解決の参考になるからです。

問題解決のアプローチ方法が普遍的

さきほど、セイバーメトリクスの考え方を以下のように書きました。

1.勝利という明確な目的を設定する
2.勝利に最も関連する得失点差を考察する
3.得点、失点に最も関連のある指標で選手を評価する
4.選手を評価する指標から、その選手と関係ない要素を排除する

この考え方自体は野球に限った話ではなく、抽象化すると以下のように置き換えることができます。

1.明確なゴールを設定する
2.ゴールに最も関連する中間指標を考察する
3.中間指標に影響のある要因を分析する
4.効果測定から、関係しない他の要素を排除する

セイバーメトリクスは扱う対象が野球と特殊ですが、問題解決のアプローチとしては普遍的です。なのでそのアプローチを抽象化すると、様々な問題解決の参考にできます。

事象が限定されているので、シンプルに考えられる

組織が抱える問題をデータによって分析しようと思っても、現実に存在する問題はあらゆる事象が関わってきていて複雑で、どこから着手すればいいのか迷ってしまうこともあります。セイバーメトリクスは目的が勝利と明確で、扱う対象も野球のルール内に限定されていてるので、シンプルに考えることができます。

シンプルで具体的なモデルがあると、それを他の問題に当てはめて考えることができます。この問題の勝利に該当するのはなんだろう、得点に該当するのはなんだろうと考えていくと、掴みどころのなかった問題を整理することができます。

具体的な実例があるのでデータ分析の参考にしやすい

現在ではあらゆる組織がデータ分析を行い、意思決定に利用しています。しかしその中に社外秘のデータが含まれていたら、そのデータを使った具体的な分析方法が他社に公開されることはありません。そのためデータ分析を行う身近な具体例というのは意外と少なく、データ分析の話をする際は抽象的になりがちです。

しかしセイバーメトリクスはメジャーリーグや日本のプロ野球を対象としているので、公式記録に残るデータはすべて開示されています。さらに日本だけではなく、世界中のアナリストがどのように分析を行えばより正確に評価できるか研鑽しているので、参考にする上での信頼性も高いです。データ分析を学ぶ上で、ここまで参考になる具体例は多くないですね。

実例

あまりに野球の話が続いたので、弊社で取り組んだ事例について紹介します。弊社では年初からクーポン利用率改善の取り組みを行っています。その取り組みを先程あげた問題解決のアプローチに当てはめると以下のようになります。

1.明確なゴールを設定する(クーポン利用数)
2.ゴールに最も関連する中間指標を考察する(クーポンカードクリック率)
3.中間指標に影響のある要因を分析する(今回の検証対象)
4.効果測定から、関係しない他の要素を排除する(検証を行う上での注意事項)

最終的な目的はクーポン利用数の向上です。そしてクーポン利用数には、クーポンの詳細を表示するクーポンカードクリック率が密接に関係しているのがわかっています。今回はこのクリック率にクーポンを投稿している店舗の業態が影響しているのか、というのを調査しました。

f:id:hatuyuki4:20210409101045p:plain:w500

今回は、トップのヘッダーに現在地からもっとも近いクーポンをシンプルなバナー形式で表示するという検証を行いました。クーポンカードのクリック率にはクーポンの値引率やクーポン画像のクリエイティブなど、様々な要因が関連してきます。それらを極力排除したいと思い、あえて画像や値引率を表示しない形式で検証を行いました。これにより、純粋に店舗名によるクーポンのクリック率の影響度を計測できます。

実際に計測した結果は以下のようになります。

f:id:hatuyuki4:20210409101100p:plain:w500

これにより、クーポンを投稿する業態によってユーザの興味がどれくらい変わるのかというのが測定できました。これだけでユーザが最も興味のあるクーポンを推し量るのは難しいですが、出塁率と長打率を足し合わせたOPSが得点と密接に関係していたように、他の指標と組み合わせることでより強力な関係性を見つけ出せるかもしれません。

まとめ

セイバーメトリクスを題材にした映画、マネーボールの中でアナリストのピーター・ブランドはこのようなことを言いました。

球団は金で選手を買うべきではなく勝利を買うべきだ

なかなか本質をついた素晴らしいセリフですね。業務に追われていると、明確な目標を忘れてしまうこともありますが、最終的なゴールを忘れてはいけません。

開発者も機能を実装をするのではなく、目的を実装するように心がけたいですね。

最後に: 2021年は楽天が優勝すると思います。

参考

BaseBall Geeks

野球×統計は最強のバッテリーである - セイバーメトリクスとトラッキングの世界

プロ野球を統計学と客観分析で考えるセイバーメトリクス・リポート

Free-PhotosによるPixabayからの画像