研究機関との因果推論に関する共同研究プロジェクト(LLM), 2024年10月~2025年12月
医療系大規模データを対象とした因果推論において、大規模言語モデル(LLM)の適用可能性を検証するためのPoC(概念実証)を実施した。特に、データ機密性の制約下におけるローカルおよびドメイン特化型LLMの活用を前提とした設計とした。
プロジェクトの目的自体は所与であったが、研究プログラムの形式化および精緻化は主に私が担った。中心的な論点は、時間性などの項目固有のシグナルが介入下における因果効果推定にどのように寄与するかを分析し、異なる推定手法を共通の評価枠組みの下で整合的に比較可能とすることであった。この枠組みに基づき、複数の因果推論手法を統合したプロトタイプを構築した。
役割としては、研究設計とプロジェクトマネジメントを兼務した。研究面では、高次元データからの対象構造の選定、手法ごとに整合的なグラウンドトゥルースの定義、評価指標の設計など、問題設定を操作可能な形に落とし込んだ。実行面では、トレーサビリティおよび再現性を重視した実験パイプラインを設計し、AIエンジニアへのタスク配分および進行管理を行い、定期的な技術レビューを通じて反復的に改善を行った。
また、成果物の統合と最終調整を担い、研究機関側からのレビューへの対応・応答を行った。本PoCにより、因果推論の方法論的側面とドメイン固有の課題の双方に関して構造的に解釈可能な知見が得られ、後続の研究展開の基盤を形成した。