ホーム » データサイエンス » 数理モデル » 事業開発リターンをどうモデリングするか?

事業開発リターンをどうモデリングするか?

――確率分布モデルの整理と実務への示唆

1. なぜリターン分布のモデル化が必要か

事業開発のリターンは株式や不動産と比べても特異です。

  • 損失は最大で投資額(ROI = -1)
  • 成功時の上振れはほぼ無限大(厚い尾)
  • 成功確率は分野やフェーズにより大きく変動

このため「平均 ROI ○%」だけでは不十分で、リスク(失敗確率)とリターンのばらつきを同時に扱う数理モデルが求められます。

注意:極値理論やパレート分布で出てくる「平均値」は、閾値を超えた部分だけの尾部条件付き平均であり、全体の期待倍率(ROI+1 の平均)とは異なります。全体期待倍率を得るには「失敗」「通常の成功」「大当たり」を確率で重み付けして合成する必要があります。


2. 代表的な確率分布モデル

(1) 単純対数正規

  • ROI+1 を対数正規分布とみなす。
  • 右スキューは表現できるが、失敗点(ROI=-1)を無視するため楽観的すぎる。

数式

ROI $r$ を考えるとき、総倍率 $M = 1+r$ が対数正規に従うと仮定。

$$M \sim \text{LogNormal}(\mu,\sigma^2)$$

確率密度関数:

$$f_M(m) = \frac{1}{m\sigma \sqrt{2\pi}} \exp\!\left( -\frac{(\ln m – \mu)^2}{2\sigma^2} \right), \quad m>0$$

全体期待倍率は $E[M] = e^{\mu+\tfrac{1}{2}\sigma^2}$。

(2) ハードル+対数正規(おすすめのベースライン)

  • 確率 p で「全損(r=-1)」、確率 1-p で「成功時は LogNormal(μ,σ²)-1」。
  • 失敗の山と成功の右スキューを両立。
  • パラメータ解釈が直感的:
    • p = 失敗確率
    • e^μ = 成功時の中央値(ROI+1の中央値)
    • σ = 成功時のばらつき

数式

「失敗確率 $p$ で全損($r=-1$)」「成功時は対数正規」:

$$r \sim \begin{cases} -1 & \text{w.p. } p \\ \text{LogNormal}(\mu,\sigma^2)-1 & \text{w.p. } (1-p) \end{cases}$$

全体期待倍率は $E[M]=(1-p)\, e^{\mu+\tfrac{1}{2}\sigma^2}$。

(3) 一般化ガンマ

  • ガンマ・対数正規・ワイブルを内包する柔軟分布。
  • パラメータ解釈はやや複雑で、失敗点を別処理する必要あり。

数式

パラメータ $\alpha, d, p >0$ を用いる定義の一例(Stacy, 1962):

$$f(x;\alpha,d,p) = \frac{p}{\alpha^d \Gamma(d/p)} x^{d-1} \exp!\left[-\left(\frac{x}{\alpha}\right)^p \right], \quad x>0$$

  • $p=1$ → ガンマ分布
  • $d=p$ → ワイブル分布
  • $d \to \infty$ で正規近似、など柔軟性を持つ。

(4) パレート混合 / 極値理論

  • 成功時の大当たりを Pareto や GPD(一般化パレート分布)でモデル化。
  • 「めったにないが極端に大きい」リターンを精密に捉える。
  • 注意:尾部平均は「閾値超過部分の条件付き平均」であり、全体期待倍率を直接表すものではない。

数式

4.1. LN+Pareto 混合

閾値 $u$ で分布を切り替えるハイブリッド型:

$$f(x) = \begin{cases} (1-\pi)\, f_{\text{LN}}(x;\mu,\sigma), & x \leq u \\ \pi\, f_{\text{Pareto}}(x;u,\alpha), & x > u \end{cases}$$

4.2. EVT-GPD(一般化パレート分布)

閾値 $u$ を超えた超過分 $y=x-u$ の分布:

$$f(y;\xi,\beta) = \frac{1}{\beta}\left(1+\xi \frac{y}{\beta}\right)^{-\frac{1}{\xi}-1}, \quad y \geq 0$$

  • 形状パラメータ ξ:尾の厚さ
  • 尾部推定に特化。全体期待値は「基礎分布+尾部+失敗確率」を組み合わせて初めて算出できる。

(5) 複合モデル(成功確率 × 規模)

  • Step1: 成功するかどうか(Bernoulli)
  • Step2: 成功時の規模(LogNormalやPareto)
  • → 全体期待値は両方を確率加重した合成値で計算される。

数式

  • ステップ1:成功/失敗

$$Z \sim \text{Bernoulli}(\pi)$$

  • ステップ2:成功時の規模

$$M \mid Z=1 \sim \text{LogNormal}(\mu,\sigma^2)$$

  • ROI:

$$r = \begin{cases} -1 & Z=0 \\ M-1 & Z=1 \end{cases}$$

これは「ハードル+対数正規」の一般形と考えられ、$\pi=1-p$ に対応。


3. モデルの比較(精度 × シンプルさ)

モデルシンプルさ(パラメータ数)精度・表現力全体期待値の扱いやすさ向いている場面
単純対数正規◎(2)直接計算可ざっくりの全体像
ハードル+対数正規○(3)直接計算可(失敗を含める)ベースライン分析
一般化ガンマ△(3)計算可能だが解釈は複雑部分損含む幅広い近似
LN+Pareto混合△(4+)尾部平均は条件付き、全体期待値は要合成VC投資型の厚尾分析
EVT-GPD×(3)尾部専用(全体平均には不十分)テールリスク管理
二段階モデル△(4)確率加重で全体期待値を算出成功確率と規模の分解分析

4. ケース別パラメータ例(参考レンジ)

4.1 ハードル+対数正規モデル

事業タイプごとに「ハードル+対数正規モデル」のパラメータを当てはめると、次のようなイメージになります。

ケース失敗確率 p成功時中央値 (≈ e^μ)σ(log空間SD)コメント
VC的スタートアップ0.7~0.92.5~3.5倍1.0~1.5多くが失敗、ただし一部が10倍〜100倍になる厚尾。ファンド分散前提。
大企業の新規事業0.3~0.61.4~1.6倍0.5~0.8既存資産・顧客基盤を活用できるため成功率はやや高め。上振れ幅は限定的。
既存事業の改良0.1~0.31.15~1.25倍0.2~0.4失敗は少なく安定。ただし成功しても改善幅は小さい。

4.2 EVT-GPD のパラメータ

閾値超過部分を表すためのパラメータ。尾部の条件付き平均を与えるが、全体期待倍率を表すには失敗や通常成功部分を合成する必要がある。

ケース失敗確率の全体像尾の特徴形状 ξ(shape)尺度 β(scale、倍率ベース)閾値 u(倍率ベース)
VC的スタートアップ多数が失敗、成功するとごく一部が10倍〜100倍極端に厚い尾0.5〜1.03〜105倍前後
大企業の新規事業成功しても数倍止まり中程度の尾0.2〜0.41〜32倍前後
既存事業の改良成功しても+20〜30%程度薄い尾(有界に近い)0〜0.10.2〜0.51.1〜1.2倍

5. 実務的な活用方法

  1. まずはハードル+対数正規で全体像を把握
    • 「失敗確率」「成功時中央値」「成功時のばらつき」を3つの数字で示す。
  2. テール(大当たり)の影響が重要なら LN+Pareto や EVT に拡張
    • ファンド型の投資判断、リスク管理に有効。
  3. 説明変数を入れて成功確率や規模を分解
    • 市場規模、開発工数、チーム経験などを説明変数として導入すれば、戦略設計に直結。

6. 戦略上の示唆

  • 期待値ベースでは VC 型投資が有利に見えるが、分散が極端に大きく単発勝負では危険。
  • 幾何平均成長率(ケリー基準)で見ると、最適な再投資比率は期待値最大化より低めに出る。
  • 安定キャッシュフロー型(改良)と厚尾型(VC)を組み合わせるハイブリッド戦略が合理的。

7. まとめ

  • 事業開発のリターンは「失敗点+厚尾」という特殊な分布を持つ。
  • 精度とシンプルさのバランスでは 「ハードル+対数正規モデル」 が最も実務的。
  • VC的 / 大企業新規 / 既存改良でパラメータは大きく異なるが、p, μ, σ の3つで直感的に整理できる。
  • 極値理論やパレートでの「平均」は尾部条件付き平均であり、全体期待値とは異なることを常に意識する必要がある。