構造方程式モデリング (SEM) の統計学的基盤:理論、識別性、推定の計算的・統計的課題、そして応用展望
構造方程式モデリング (SEM) の統計学的基盤:理論、識別性、推定の計算的・統計的課題、そして応用展望
構造方程式モデリング (Structural Equation Modeling, SEM) は、社会科学、心理学、教育学、経営学、疫学など、幅広い分野で複雑な変数間の関係性を分析するための強力な統計的手法として広く利用されています。SEMは、観測変数と潜在変数を組み合わせ、パス図として表現される理論モデルに基づき、変数間の直接効果、間接効果、相関関係などを同時に推定することを可能にします。単なる回帰分析や因子分析の組み合わせに留まらず、より柔軟で洗練されたモデリングを可能にするSEMですが、その深い理解には統計学的な基盤の把握が不可欠です。特に、モデルの識別性、適切な推定法の選択、そして適合度評価の解釈は、SEMを研究に適用する上で避けて通れない重要な課題となります。本稿では、専門家の皆様に向けて、SEMの統計学的基盤、特に理論、識別性、推定の計算的・統計的課題、そして応用展望について深く掘り下げて解説いたします。
SEMの理論的基盤:共分散構造モデルとしての定式化
SEMは、基本的に観測変数の共分散行列が、モデルパラメータの関数として表現されると仮定する共分散構造モデルの枠組みで捉えられます。基本的な線形SEMは、潜在変数間の構造モデルと、観測変数が潜在変数によって測定される測定モデルに分解できます。これを数式で表現すると、潜在変数ベクトル $\eta$ と $\xi$、観測変数ベクトル $y$ と $x$ を用いて、以下のようなリセル・ゴールマン方程式(あるいはそれに類する表現)で表されることが多いです。
測定モデル: $y = \Lambda_y \eta + \epsilon$ $x = \Lambda_x \xi + \delta$
構造モデル: $\eta = B \eta + \Gamma \xi + \zeta$
ここで、$\Lambda_y, \Lambda_x, B, \Gamma$ はモデルの係数行列、$\epsilon, \delta, \zeta$ は誤差項ベクトルです。これらの誤差項は互いに無相関であり、特定の変数とも無相関であるといった仮定が置かれます。モデルのパラメータ集合 $\theta$ は、これらの係数行列の非ゼロ要素や、誤差項および潜在変数間の共分散行列の要素から構成されます。
SEMの根本は、モデルから期待される観測変数ベクトル $[y', x']'$ の共分散行列 $\Sigma(\theta)$ が、標本から得られた観測変数ベクトル $[y', x']'$ の共分散行列 $S$ にどれだけ近くなるかを評価し、その近さを最大化(または距離を最小化)するパラメータ $\theta$ を推定することにあります。つまり、$\Sigma(\theta) = \text{Cov}([y', x']')$ となるような関数形式をモデルが規定し、推定は $\Sigma(\theta)$ と $S$ の間の「距離」を最小化する $\theta$ を見つける問題となります。
モデルの識別性:推定可能なパラメータを見極める
SEMにおける最も基本的かつ重要な問題の一つが識別性 (Identification) です。モデルが識別可能であるとは、観測変数から得られる共分散行列 $\Sigma_0$ から、モデルの真のパラメータ値 $\theta_0$ が一意に決定できることを意味します。もしモデルが識別可能でない(未識別、Underidentified)場合、複数の異なるパラメータ値の組み合わせが同じ期待共分散行列を生成してしまうため、パラメータの推定値は安定せず、解釈不能となります。
識別性の確認は一般に容易ではありません。パラメータの数 $t$ が観測変数の共分散行列に含まれる独立した情報量(例えば、観測変数数 $p$ の場合、$p(p+1)/2$)以下であるという必要条件 ($t \le p(p+1)/2$) はありますが、これは十分条件ではありません。特定のモデル構造が識別性を満たすかどうかの確認には、パスルールの適用(これは構造モデル部分に限られることが多い)や、より厳密にはモデルのヤコビ行列のランク条件、あるいは期待情報行列が正定値であることなどが理論的に用いられますが、複雑なモデルでは解析的に行うのは困難な場合があります。
未識別の原因としては、例えば潜在変数とその測定尺度の関係における尺度の固定(例: 因子負荷量を1つ1に固定するか、因子の分散を1に固定するか)が適切でない場合、あるいは構造モデルにおいて推定すべきパスが多すぎる場合などが挙げられます。未識別モデルをソフトウェアで推定しようとすると、推定アルゴリズムが収束しない、あるいは非常に大きな標準誤差を持つパラメータが出力されるといった問題が生じます。
推定法:多様なアプローチとその統計的性質
SEMのパラメータ推定には、様々な統計的推定法が用いられます。最も代表的なのは最尤法 (Maximum Likelihood, ML) です。観測変数が多変量正規分布に従うと仮定した場合、ML推定量は一致性、漸近正規性、そして漸近有効性を持つ望ましい性質を持ちます。ML推定は、モデルから期待される共分散行列 $\Sigma(\theta)$ と標本共分散行列 $S$ との間の、対数尤度に基づく距離関数 $F_{ML}(S, \Sigma(\theta))$ を最小化することで行われます。この最小化には、フィッシャーのスコアリング法やニュートン・ラフソン法などの反復アルゴリズムが用いられます。
しかし、実データが多変量正規分布に従わない場合、ML推定量の標準誤差やカイ二乗検定統計量は正確でなくなります。この課題に対処するため、以下のようないくつかのロバストな推定法が開発されています。
- ロバストML推定: ML推定量を計算し、その後、標準誤差とカイ二乗検定統計量に対して多変量正規性の仮定緩和に基づく補正を行います。Satorra-Bentler補正やYuan-Bentler補正などが知られており、多くの統計ソフトウェアで利用可能です。
- 一般化最小二乗法 (GLS): 特定の重み行列 $W$ を用いて、$(S - \Sigma(\theta))' W^{-1} (S - \Sigma(\theta))$ のような二次形式の距離関数を最小化します。漸近的に最適な重み行列は期待共分散行列の関数となりますが、通常は標本共分散行列の推定値を用いて計算されます。正規性の仮定下ではMLと同様の性質を持ちますが、計算負荷はMLより高い場合があります。
- 重み付け最小二乗法 (WLS) / 対角重み付け最小二乗法 (DWLS): 特にカテゴリーデータや順序データに対して用いられる推定法です。観測変数のペアワイズポリコリック/ポリシリアル相関行列などの推定値とその漸近共分散行列を用いて推定を行います。DWLSは完全な漸近共分散行列ではなく対角成分のみを用いるため、WLSに比べて計算負荷が小さいですが、大規模なデータでは有効な選択肢となります。これらの方法は、観測変数が正規分布から大きく逸脱する場合や、離散的な場合に適しています。
モデル評価と適合度:モデルの妥当性を問う
推定されたモデルがデータにどれだけ適合しているかを評価するために、適合度指標 (Goodness-of-Fit Indices) が用いられます。最も基本的な適合度評価は、モデルから期待される共分散行列 $\Sigma(\hat{\theta})$ と標本共分散行列 $S$ との間の差異に基づいたカイ二乗検定です。これは「モデルがデータに完全に適合している」という帰無仮説 H0: $\Sigma(\theta_0) = \Sigma_0$ を検定しますが、現実の大規模データではわずかなモデルの不一致でも検出されてしまい、有用性が限られることが多いため、他の適合度指標も併用されます。
主要な適合度指標とその解釈上の注意点には、以下のようなものがあります。
- RMSEA (Root Mean Square Error of Approximation): 母集団におけるモデルの近似誤差を表す指標であり、値が小さいほど良い適合を示します(例: 0.05以下が良い、0.08以下は許容範囲)。モデルの複雑さに対してペナルティを課すため、異なる複雑さのモデル間で比較する際に有用です。しかし、標本サイズに敏感である点に注意が必要です。
- CFI (Comparative Fit Index), TLI (Tucker-Lewis Index): 基準モデル(通常、観測変数間に相関がないと仮定したモデル)と比較して、提案モデルがどれだけデータへの適合度を改善したかを示す指標です。0から1の範囲をとり、1に近いほど良い適合を示します(例: 0.90以上または0.95以上が良い適合とみなされることが多い)。TLIはモデルの複雑さに対してペナルティを課しますが、CFIは課しません。
- SRMR (Standardized Root Mean Square Residual): 観測された共分散とモデルから期待される共分散の残差の平均の平方根を標準化した指標です。値が小さいほど良い適合を示します(例: 0.08以下が良いとみなされることが多い)。残差共分散に直接着目しており、特にパスの大きさではなくモデル構造全体の適合を評価する際に有用です。
これらの指標には特定のカットオフ値が提案されていますが、これらはあくまでガイドラインであり、分野や研究目的によって適切な基準は異なり得ます。また、これらの指標はモデルの全体的な適合度を示しますが、個々のパラメータの推定値の解釈やモデルの理論的妥当性を代替するものではありません。適合度指標の解釈にあたっては、指標間の特性の違いを理解し、多角的な視点からモデルを評価することが重要です。
応用上の課題と最新動向
SEMの応用は多岐にわたりますが、実際の研究では様々な課題に直面します。例えば、非線形関係のモデリング、縦断データにおける変化のモデリング(潜在成長モデルなど)、複数群間でのモデルの等価性検定(測定不変性、構造不変性)、混合モデルを用いた異質性の考慮などが挙げられます。これらの複雑なモデルを扱う場合、識別性の問題はより深刻になりやすく、適切な推定法やソフトウェアの選択が重要になります。
また、欠測データの処理もSEMにおける重要な課題です。ML推定法は、欠測メカニズムがMissing At Random (MAR) であるという仮定の下で、利用可能な全ての情報を用いた最尤推定(Full Information Maximum Likelihood, FIML)を行うことができ、統計的に望ましい性質を持ちます。他の手法としては、多重代入法 (Multiple Imputation) を用いて欠測値を補完し、補完された複数のデータセットでSEM推定を行うアプローチもあります。
近年では、ベイジアンSEMへの関心も高まっています。ベイジアンアプローチは、特に小規模データでの推定や、複雑なモデルにおける識別性の問題に対して、MCMC法などを用いてパラメータの事後分布を得ることで、異なる視点からの解析を可能にします。また、ベイズ因子を用いたモデル比較も、頻度論的なカイ二乗検定とは異なるアプローチを提供します。
さらに、SEMと因果推論の関連も活発に議論されています。SEMのパスは因果効果として解釈されることが多いですが、これはモデルに課される仮定(例: 誤差項の無相関)が満たされる場合に限られます。操作変数法や傾向スコアマッチングなどの因果推論手法とSEMを組み合わせることで、より頑健な因果効果の推定を目指す研究も進んでいます。
教育上の説明のコツ
SEMの統計学的基盤を専門家以外の聴衆や学生に説明する際には、いくつかの工夫が考えられます。
- 共分散構造モデル: 「データに含まれる変数間のバラツキや関連性のパターン(共分散行列)が、私たちが考えた理論モデル(パス図)に含まれる少数の基本的なパラメータ(矢印の強さや分散など)によってどれだけ上手く説明できるか」という問題として提示すると、直感的に理解しやすくなります。
- 識別性: 「パラメータが推定できるかどうか」という問題として説明し、「探偵が手がかり(観測データ)から犯人(真のパラメータ)を特定しようとするが、手がかりが少なすぎたり、複数の犯人が同じ手がかりを残したりする場合に、特定できない状態」に例えると、概念が伝わりやすくなります。未識別モデルを推定しようとした際のエラーメッセージや異常な出力例を示すのも有効です。
- 推定法: ML法は「モデルがデータを生成する確率が最も高くなるようなパラメータを探す方法」として、WLS/DWLSは「特に〇〇のようなデータの場合に、よりデータの特徴を反映した重みをつけて推定する方法」として説明し、それぞれの適用条件やメリット・デメリットを具体的に示すことが重要です。
- 適合度指標: カイ二乗検定は「理論モデルがデータに完璧に合っているか」を問う厳しいテストであり、他の指標は「完璧ではないにしても、どの程度良い近似になっているか」を評価するものだと説明します。各指標がデータとモデルのどの側面に注目しているかを明確にすることで、複数の指標を見る必要性が理解されます。
具体的な研究例や、広く知られている理論モデル(例: ピアソンの知能モデル、ビッグファイブパーソナリティモデルなど)をSEMの枠組みでどう分析するかを示すことも、理解を深める上で非常に有効です。
まとめと今後の展望
構造方程式モデリング (SEM) は、その柔軟性と視覚的なモデル表現能力から、幅広い分野で利用される強力なツールです。しかし、その適切な適用には、共分散構造モデルとしての理論的基盤、モデルの識別性、多様な推定法の統計的性質、そして適合度評価の限界と解釈といった統計学的な深い理解が不可欠です。
未識別の問題は常に注意が必要であり、複雑なモデルを構築する際には、モデル構造の理論的妥当性に加えて、統計的な識別性についても慎重に検討する必要があります。推定法はデータの性質(正規性、離散性、欠測など)に応じて適切に選択し、その推定量が持つ統計的性質を理解しておくことが、結果の正しい解釈につながります。適合度指標はモデル評価の重要な一部ですが、それだけでモデルの妥当性を判断するのではなく、理論的な根拠、パラメータ推定値の有意性、および解釈可能性と合わせて総合的に評価することが求められます。
今後の展望としては、大規模データや複雑なデータ構造(例: ネットワークデータ、テキストデータ)へのSEMの応用、機械学習手法との融合、さらには因果推論の枠組みにおけるSEMの役割の深化などが考えられます。SEMの統計学的基盤に関する議論は、これらの新しい応用領域においても、モデルの信頼性と解釈可能性を担保するために、引き続き重要なテーマであり続けるでしょう。
専門家の皆様におかれましても、SEMを自身の研究や教育で活用される際には、その表面的な適用に留まらず、本稿で論じたような統計学的な基盤に立ち返り、モデルの妥当性を深く吟味していただければ幸いです。