Skip to content

MLリスクとガバナンス

TL;DR

MLガバナンスは、モデル意思決定を説明可能で制御可能に保つ運用システムです。単なるコンプライアンス文書ではありません。リスク階層、モデル文書、リネージ、承認ゲート、アクセス制御、監査ログ、スライス監視、人間の上書き、インシデント対応、廃止を含みます。


リスク階層

階層必要な制御
内部推薦、開発者向けランキング基本リネージ、所有者、監視
マーケティング個人化、サポート振り分け実験レビュー、ガードレール、スライス監視
不正保留、価格、違反執行人間の上書き、監査ログ、ロールバック、ポリシー承認
重大信用、雇用、医療、法的アクセス判断形式的レビュー、説明可能性、厳格なデータ統制、定期監査

低リスクモデルを過剰手続きで止めず、高影響モデルを普通のコード変更として出さないために階層化します。


ガバナンス制御プレーン

必要なメタデータ、昇格ゲート、監査ログ、レジストリ状態をプラットフォームに組み込むほど、運用は安定します。


モデル文書

項目問い
intended useどの意思決定を支援するか、誰が使うか
非対象用途どこで使ってはいけないか
学習データデータ、期間、ラベル、除外条件
特徴量特徴量グループ、機微属性の代理可能性
評価指標、スライス、ガードレール
制限既知の失敗ケース、低信頼領域
人間の制御レビュー、上書き、エスカレーション、異議申立
監視ドリフト、品質、公平性/スライス、事業ガードレール
所有者チーム、オンコール、レビュー周期

文書はWikiではなく、モデル成果物と一緒にバージョン管理します。


データと特徴量リスク

リスク制御
機微属性年齢、健康、正確な位置データ分類と特徴量許可リスト
代理特徴量郵便番号が保護属性の代理になるスライス評価とレビュー
ラベルバイアス過去の執行ラベルが過去ポリシーを反映ラベル監査と人間レビュー
同意ミスマッチ別目的で集めたデータの利用データ利用契約
保持違反許可期間を超えた学習データ保持データセット期限と削除ワークフロー

フィーチャーストアと学習パイプラインは、分類、所有者、保持メタデータを扱うべきです。


Human-in-the-Loop

パターン使う条件障害モード
手動レビューキュー信頼度が低い、または高影響負荷下でレビューが形骸化
人間の上書き緊急制御が必要上書きが監査されない
異議申立ユーザーが判断に異議を唱える申立データがモデル改善に戻らない
二段階アクションモデルが推薦し人間が決定レイテンシと人員コスト
自動判断 + 監査低リスク高ボリューム静かなバイアスや品質劣化

人間レビューも容量、品質、レイテンシを持つシステムです。


監査ログ

高影響判断には以下を残します。

  • リクエストと判断時刻。
  • モデル版とポリシー版。
  • 入力特徴量または承認済み参照。
  • 予測、しきい値、最終アクション。
  • 人間レビュー担当者と上書き理由。
  • 実験またはロールアウト割当。
  • 下流結果と異議申立結果。

監査ログはインシデント分析と再学習の材料でもあります。


障害モード

所有者不明モデル

本番で動いているが元チームがいない状態です。

対策: 所有者メタデータ、古いモデルアラート、レビュー周期、廃止計画。

ポリシーが重みに隠れる

事業や安全性の方針がモデル内部に暗黙化され、レビューできません。

対策: 高影響ポリシーは再ランキング、しきい値、ルールとして明示します。

指標だけの承認

集計AUCは改善したが、重要スライスやガードレールが悪化します。

対策: 昇格前にスライスチェックとガードレール承認を必須にします。

廃止経路がない

古いモデルが移行リスクを理由に残り続けます。

対策: experimental、shadow、canary、production、deprecated、retired のレジストリ状態を持たせます。


運用メトリクス

分類メトリクス
ガバナンスリスク階層別モデル数、期限切れレビュー、文書欠落
データ機微特徴量利用、保持違反、所有者設定率
判断上書き率、異議申立率、レビューキュー遅延
品質スライス指標、キャリブレーション、偽陽性/偽陰性
インシデント検知時間、モデル無効化時間、影響判断数
ライフサイクル古いモデル年齢、廃止率、ロールバック率

重要なポイント

  1. ガバナンスは文書置き場ではなく本番制御システム。
  2. 高影響判断ほどモデル外の制御が必要。
  3. リネージ、監査ログ、所有者は信頼性要件。
  4. 明示的なポリシー層は重みに隠れたポリシーよりレビューしやすい。
  5. 廃止経路のないモデルは運用負債になる。

参考文献

  1. Model Cards for Model Reporting
  2. Datasheets for Datasets
  3. NIST AI Risk Management Framework
  4. Hidden Technical Debt in Machine Learning Systems

MITライセンスの下で公開。Babushkaiコミュニティが構築。