← AI時代における「集中」の再定義 / 参考資料

人間-AI協調のHCI研究と作業設計の原則

人間とAIの協調作業に関するHCI（ヒューマン・コンピュータ・インタラクション）研究と作業設計の原則について調査した資料。Microsoft/GoogleのHAIガイドライン、自動化レベルと人間パフォーマンスの関係、信頼の較正、Automation Surprise、分散認知、適応的自動化、人間中心AIフレームワークに関する知見をまとめている。

主要な発見

1. Human-AI Interaction（HAI）ガイドライン

Microsoft 18 Guidelines for Human-AI Interaction（Amershi et al., 2019）

20年以上のHAI研究を統合し、CHI 2019で発表された18のガイドライン。49人のデザイン実務者による20のAI製品に対する評価で検証された。4つのフェーズに分類される。

Initially（初期段階）

G1: システムができることを明確にする（Make clear what the system can do）
G2: システムがどの程度うまくできるかを明確にする（誤り率の提示）

During Interaction（インタラクション中）

G3: コンテキストに基づいてタイミングを調整する
G4: 文脈に関連する情報を表示する
G5: 社会規範に合致させる
G6: 社会的バイアスを軽減する

When Wrong（誤りが発生した場合）

G7: 効率的な呼び出しをサポートする
G8: 効率的な却下をサポートする
G9: 効率的な修正をサポートする
G10: 不確実な場合はサービスの範囲を絞る
G11: なぜそうしたかを明確にする（説明可能性）

Over Time（時間経過に伴い）

G12: 最近のインタラクションを記憶する
G13: ユーザー行動から学習する
G14: 更新・適応は慎重に行う
G15: 粒度の細かいフィードバックを促す
G16: ユーザーアクションの帰結を伝える
G17: グローバルな制御を提供する
G18: 変更をユーザーに通知する

（出典: Amershi, S. et al., “Guidelines for Human-AI Interaction,” CHI 2019, https://dl.acm.org/doi/10.1145/3290605.3300233 / Microsoft HAX Toolkit: https://www.microsoft.com/en-us/haxtoolkit/ai-guidelines/ ）

AI協働作業への示唆: 特にG9（効率的な修正）、G11（理由の説明）、G14（慎重な適応）は、AIエージェントの成果物をレビューする人間にとって重要。AIの出力を容易に修正でき、なぜその結果になったかを理解でき、AIの動作が予測可能であることが、効果的な協働の基盤となる。

Google PAIR People + AI Guidebook

Googleの People + AI Research チームが作成したガイドブック。2019年に公開され、2023年に生成AI時代に対応して更新（トラフィックが560%増加）。6つの章で構成される。

User Needs + Success Definition: ユーザーニーズの理解と成功基準の定義
Data Collection + Evaluation: 必要なデータの特定、調達、AIの堅牢性チューニング
Mental Models: ユーザーがAIシステムの仕組みを理解するための支援。「ユーザーがシステムの能力と限界の明確なメンタルモデルを持てば、いつどのように信頼すべきかを理解できる」
Explainability + Trust: 部分的説明、段階的開示、モデル信頼度表示等を通じた信頼構築
Feedback + Control: フィードバック・制御メカニズムの設計
Errors + Graceful Failure: エラーの定義、診断、コミュニケーション戦略

（出典: Google PAIR, People + AI Guidebook, https://pair.withgoogle.com/guidebook/ ）

日本政府「人間中心のAI社会原則」（2019年3月）

3つの基本理念と7つの基本原則で構成される。

3つの基本理念: 人間の尊厳、多様性・包摂性、持続可能性

7つの基本原則:

人間中心の原則
教育・リテラシーの原則
プライバシー確保の原則
セキュリティ確保の原則
公正競争確保の原則
公平性、説明責任及び透明性の原則
イノベーションの原則

（出典: 内閣府統合イノベーション戦略推進会議, https://www8.cao.go.jp/cstp/ai/aigensoku.pdf ）

EU AI Act Article 14: 人間の監視（Human Oversight）

高リスクAIシステムに対する人間の監視要件を規定。

AIシステムの関連する能力と限界を適切に理解できること
システムの出力に自動的に依存する/過度に依存する傾向に気づけること
AIシステムの出力を正しく解釈できること
特定の状況でAIシステムを使用しない/出力を無視する決定ができること

（出典: EU AI Act Article 14, https://artificialintelligenceact.eu/article/14/ ）

2. 自動化のレベルと人間のパフォーマンス

Parasuraman-Sheridan-Wickens モデル（2000年）

4つの機能タイプ: 情報取得（Information Acquisition）、情報分析（Information Analysis）、意思決定・行動選択（Decision and Action Selection）、行動実行（Action Implementation）

10段階の自動化レベル:

レベル1: 人間が全て手動で行う
レベル2-4: コンピュータが選択肢を提示、人間が選択
レベル5-7: コンピュータが推奨し、人間が承認/拒否
レベル8-9: コンピュータが実行し、事後通知
レベル10: 完全自動（人間はループ外）

（出典: Parasuraman, R., Sheridan, T.B. & Wickens, C.D. (2000). “A model for types and levels of human interaction with automation.” IEEE Transactions on Systems, Man, and Cybernetics, 30(3), 286-297. https://ieeexplore.ieee.org/document/844354 ）

Onnasch-Wickens メタ分析と「Lumberjack Effect」（2014年）

18の実験データに基づくメタ分析で以下を発見:

通常運用時: 自動化レベル（DOA）の上昇に伴い、パフォーマンス向上・ワークロード低下
故障時: DOAが高いほど、故障時のパフォーマンス低下と状況認識（SA）の喪失が深刻
Lumberjack Effect（きこり効果）: 「木が高いほど倒れたときの衝撃が大きい」— 高い自動化の恩恵が大きいほど、故障時の損害も大きいというトレードオフ

（出典: Onnasch, L., Wickens, C.D., Li, H. & Manzey, D. (2014). “Human Performance Consequences of Stages and Levels of Automation.” Human Factors, 56(3), 476-488. https://journals.sagepub.com/doi/10.1177/0018720813501549 ）

Bainbridgeの「自動化の皮肉」（1983年）

自動化に関する古典的かつ最も引用される論文の一つ（2016年時点で1800以上の被引用数）。

核心的な主張:

自動化設計者は、できない部分だけを人間に残す（leftover allocation）
しかし残された部分こそが、最も難しく、最もまれに発生する介入タスク
人間は日常的にそのスキルを実践する機会がないため、スキルが劣化する
監視の限界: 「高度に動機づけられた人間でさえ、ほとんど何も起こらない情報源への視覚的注意を約30分以上持続することは人間には不可能」

（出典: Bainbridge, L. (1983). “Ironies of Automation.” Automatica, 19(6), 775-779. https://www.sciencedirect.com/science/article/abs/pii/0005109883900468 ）

AI時代のDeskilling（スキル劣化）問題

パイロットの自動操縦への過度な依存で手動飛行スキルが測定可能なレベルで劣化（航空安全での長年の知見）
Microsoft Researchとカーネギーメロン大学の2025年調査: 知識労働者はAIがタスクを認知的に容易にしたと報告する一方、研究者は「問題解決の専門性をシステムに譲渡し、回答の収集・統合という機能的タスクに集中するようになった」ことを発見
制御研究: AIに作業を委任した学習者は、タスクに直接従事した者と比較して、深い概念的理解の指標で劣った

（出典: “The Great Forgetting: How AI Tools Are Quietly Eroding Skills”, WebProNews; “How AI Automation Is Quietly De-Skilling White-Collar Workers”, Inc.com; CACM “The AI Deskilling Paradox” ）

Fitts List（MABA-MABA）とその限界

1951年にFittsが発表した「人間が得意なこと/機械が得意なこと」の分類。しかしAI時代には大幅に陳腐化:

現代のAIは検出、知覚、長期記憶においてFittsが「人間が優位」としていた分野でも人間を凌駕
合意された代替フレームワークは依然として存在せず、「機械ができないことを人間に割り当てる」という leftover principle への回帰リスクがある

（出典: Roth, E.M. et al. (2019). “Function Allocation Considerations in the Era of Human Autonomy Teaming.” Journal of Cognitive Engineering and Decision Making, 13(4). https://journals.sagepub.com/doi/full/10.1177/1555343419878038 ）

3. 信頼の較正（Trust Calibration）

Lee & See モデル（2004年）

信頼と自動化に関する最も影響力のある論文の一つ。

適切な信頼の2要素: (1) 信頼の較正（calibration）— 自動化の能力に見合った程度に信頼する、(2) 信頼の分解能（resolution）— 自動化の能力に影響する条件の変化に敏感であること
過信（overtrust）→ misuse（濫用）: AIの推奨を無批判に受け入れる
不信（distrust）→ disuse（不使用）: 信頼性の高いAIの支援も拒否する

（出典: Lee, J.D. & See, K.A. (2004). “Trust in Automation: Designing for Appropriate Reliance.” Human Factors, 46(1), 50-80. https://journals.sagepub.com/doi/10.1518/hfes.46.1.50_30392 ）

自動化バイアスの系統的レビュー（Goddard et al., 2012）

医療分野: 臨床医が自分の正しい判断を覆して意思決定支援システムの誤ったアドバイスに従ったケースは 6-11%
4つの医療研究のメタ分析: 誤ったアドバイスに従うリスク比 1.26（95% CI 1.11-1.44）— AIを使用する群で不正解率が 26% 上昇
影響因子: タスク経験の浅さ → 自動化への依存増加、ユーザー自信 → 依存を逆に低下、システムへの信頼 → 「過度依存の最も強い要因」、高いワークロード・時間圧 → ヒューリスティックな自動化依存増加

（出典: Goddard, K. et al. (2012). “Automation bias: a systematic review of frequency, effect mediators, and mitigators.” JAMIA, 19(1), 121-127. https://pmc.ncbi.nlm.nih.gov/articles/PMC3240751/ ）

信頼較正の実験的知見（COBALT研究）

年齢とセンサーデータの両方が見える場合: 自動化選択の精度 82%
部分的情報のみの場合: 精度は 67-77% に低下
高透明性条件から低透明性条件への転移で 20% のパフォーマンス利益を長期的に保持
集中的な早期障害（frontloading）: 同じ頻度のランダム分散障害と比較して 60% 以上の信頼損傷 — 信頼が安定する前の初頭効果を悪用

（出典: de Visser, E.J. et al. (2021). “Adaptive Cognitive Mechanisms to Maintain Calibrated Trust and Reliance in Automation.” Frontiers in Robotics and AI. https://pmc.ncbi.nlm.nih.gov/articles/PMC8181412/ ）

適切な依存（Appropriate Reliance）の測定指標

RAIR（Relative AI Reliance）: 人間が自分の誤った判断をAIの正しいアドバイスに修正した割合（1に近いほど適切）
RSR（Relative Self-Reliance）: AIが誤りの場合に自分の判断を維持した割合（1に近いほど適切）
専門性が高い → 自己信頼が高く、AIへの信頼は低い（より批判的なスタンス）
信頼性向は正確なAI推奨への依存と関連し、自己信頼は自分の正しい判断の維持と関連

（出典: Schemmer, M. et al. (2023). “Appropriate Reliance on AI Advice,” https://arxiv.org/pdf/2302.02187; Tandfonline 2025 study on expertise, trust, and self-confidence ）

4. Automation Surprise と状況認識

Endsleyの状況認識（SA）3レベルモデル（1995年）

レベル1（知覚）: 環境内の関連要素の知覚
レベル2（理解）: 知覚データを現在の目標の文脈で統合・理解
レベル3（予測）: 理解に基づく将来の状態の予測

（出典: Endsley, M.R. (1995). “Toward a Theory of Situation Awareness in Dynamic Systems.” Human Factors, 37(1), 32-64. https://journals.sagepub.com/doi/10.1518/001872095779049543 ）

Out-of-the-Loop問題（Endsley & Kiris, 1995）

完全自動化条件と半自動化条件の両方で、手動条件と比較して状況認識が低下
レベル2 SA（理解）が特に負の影響を受けるが、レベル1 SA（知覚）は影響なし
完全自動化は中間レベルの自動化よりもSA低下が大きい
原因: 能動的処理から受動的処理への移行が、SA低下の最も大きな要因
制御レベルがSA喪失を緩和する主要因子 — 中間レベルの自動化で、オペレータを能動的意思決定ループに残すことでSAが高く維持された

（出典: Endsley, M.R. & Kiris, E.O. (1995). “The Out-of-the-Loop Performance Problem and Level of Control in Automation.” Human Factors, 37(2), 381-394. https://journals.sagepub.com/doi/10.1518/001872095779064555 ）

Bainbridgeの監視限界（1983年）

「ほとんど何も起こらない情報源への視覚的注意を約30分以上持続することは人間には不可能」
これはAIエージェントの出力を監視・レビューする作業に直接関連する重要な知見

（出典: Bainbridge, 1983, 前掲）

AI協働作業への示唆: AIエージェントが数分〜30分作業した成果物をレビューする場合、人間は「受動的監視者」ではなく「能動的レビュアー」であるべき。単にAIの出力を眺めるのではなく、具体的な観点を持って能動的に検証する構造が必要。中間的な自動化レベル（AIが提案し人間が承認する）が、完全自動化よりも状況認識を維持しやすい。

5. 共同認知（Joint Cognition）/ 分散認知

Hutchinsの分散認知理論

Edwin Hutchinsが提唱。認知は個人の頭の中だけでなく、人、道具（artefact）、社会的・物質的環境にまたがって分散している。米海軍艦艇USSパラウでの航海実務のフィールドスタディに基づく。

コンピュータは「人間の認知機能の特定の側面を模倣できる」特殊なアーティファクトクラス
知能は単一のエンティティにあるのではなく、システム内の他の認知コンポーネントとの相互作用にもある
表象（representation）は認知の媒体であり、外部表象は人間とAIの共生を支える基盤

（出典: Hutchins, E. (1995). “Cognition in the Wild.” MIT Press; Hollan, J., Hutchins, E. & Kirsh, D. (2000). “Distributed cognition.” ACM TOCHI, 7(2), 174-196. https://dl.acm.org/doi/10.1145/353485.353487 ）

Hollnagel & Woodsの共同認知システム（JCS）

人間と機械を単一の認知システムの相互依存的コンポーネントとして概念化。ゲシュタルト原理のように、システム全体はその部分の合計以上。

JCSの10の核心概念:

認知的相互依存（Cognitive Interdependence）
状況認識（Situational Awareness）
信頼較正（Trust Calibration）
分散認知（Distributed Cognition）
ワークロード分配
レジリエンス
コミュニケーション
透明性
エラー管理
共同作用（Coagency）

Human-AI Joint Cognitive Systems（HAIJCS）への拡張:

倫理と使いやすさを基盤的支柱に
AIを単なるツールではなく、能動的なチームメイトとして位置づけ
人間中心AIの原則を維持し、人間の権限を保持
マルチモーダルインターフェースで共有状況認識を支援

（出典: Hollnagel, E. & Woods, D.D. (2005). “Joint Cognitive Systems: Foundations of Cognitive Systems Engineering.” CRC Press; PMC article on From JCS to HAIJCS: https://pmc.ncbi.nlm.nih.gov/articles/PMC12969357/ ）

人間-AI相補性（Complementarity）のフレームワーク

相補性の2つの源泉:

情報の非対称性: 人間だけがアクセスできる文脈情報、AIだけが持つ大規模データ
能力の非対称性: AIはパターン認識、人間は少数サンプルからの学習と因果推論

実証データ（不動産評価タスク）:

条件	人間のみ	AIのみ	人間+AIチーム
画像なし	$251,282	$163,080	$160,095
画像あり	$200,510	$163,080	$148,009

文脈情報（家の画像）がある場合、チームパフォーマンスは有意に改善
固有の相補性効果: $14,468 → $27,860に増加
人間が相補性ポテンシャルの 45% を実現（画像あり）vs 34%（画像なし）

別の研究での最適配分結果:

人間のみ: 68% 精度
AIのみ: 77% 精度
AIによる増強: 80% 精度
自動化+増強+人的資源再配分の組み合わせ: 88% 精度

（出典: Hemmer, P. et al. (2024). “Complementarity in human-AI collaboration.” European Journal of Information Systems. https://arxiv.org/html/2404.00029v1; Roles of AI in Collaboration with Humans, Management Science, https://pubsonline.informs.org/doi/10.1287/mnsc.2024.05684 ）

6. 適応的自動化（Adaptive Automation）

概念と方法

適応的自動化（AA）は、人間の認知状態に応じて自動化レベルを動的に変更するアプローチ。3つのトリガー戦略がある:

クリティカルイベント戦略: 特定のイベント発生時に自動化レベルを変更
パフォーマンス測定戦略: 行動指標に基づく
神経生理学的測定戦略: EEG、ECG、GSRなどの生理指標からリアルタイムに精神的ワークロードを推定

（出典: NASA TM-2006-214504, “Adaptive and Adaptable Automation Design”; Kaber & Endsley (2004), “The effects of level of automation and adaptive automation on human performance.” ）

EEG基盤の適応的自動化（航空管制、2016年）

ワークロード検出精度: オフラインで 75 +/- 10%（10分割交差検証）
高負荷/低負荷判別の閾値: 0.48 +/- 0.07
高負荷時にAA起動: 低負荷時の誤作動なく、高負荷期間にのみ有意に高頻度で起動（p = 0.04）
パフォーマンス改善: AA有効条件で反応時間が有意に改善（p = 0.045）
ワークロード低減: 高難度シナリオでEEGワークロード指標が有意に低下（p = 0.04）
主観的ワークロード: 有意傾向（p = 0.068）

（出典: Arico, P. et al. (2016). “Adaptive Automation Triggered by EEG-Based Mental Workload Index.” Frontiers in Human Neuroscience, 10, 539. https://pmc.ncbi.nlm.nih.gov/articles/PMC5080530/ ）

方向依存的効果（2026年の最新研究）

低→高ワークロード遷移: 共有権限配分がパフォーマンスを支援
高→低ワークロード遷移: 人間主導の権限配分がより効果的で、主観的疲労も低い

（出典: Tandfonline (2026), “Effects of Human-Automation Authority Allocation on Multitasking Performance under Workload Conditions.” https://www.tandfonline.com/doi/full/10.1080/10447318.2026.2647133 ）

手術支援への応用

アイトラッキングとEEGセンサーの融合で 77.9% の精度でワークロード監視
安全でないワークロードレベルを検出して支援を自動開始
外科タスクのパフォーマンス改善と知覚ワークロード低下に貢献

（出典: PMC, “An Adaptive Human-Robotic Interaction Architecture for Augmenting Surgery Performance”, https://pmc.ncbi.nlm.nih.gov/articles/PMC11558698/ ）

7. 人間中心AI（Human-Centered AI: HCAI）

Shneidermanの2次元HCAIフレームワーク

Ben Shneiderman（メリーランド大学）が提唱する、自動化と人間制御を二項対立ではなく2次元で捉えるフレームワーク。

核心的主張: 高い自動化と高い人間の制御は同時に達成できる。

3つの柱:

置換ではなく増幅（Amplification Over Replacement）: AIは人間の能力を強化すべきであり、排除すべきではない
状況に応じた制御評価: 完全人間制御、完全機械自律、ハイブリッドのどれが最適かは文脈依存
極端の回避: 過度な人間制御（ボトルネック）も過度な機械自律（説明責任の欠如）も問題

4つのデザインメタファー:

Supertools（スーパーツール）: ユーザーが能動的に制御する強力なツール。例: スライダーで音楽推薦を操作、チェックボックスでEC検索を絞り込む
Telebots（テレボット）: 人間の意図の遠隔延長。「コンピュータは人間ではなく、人間はコンピュータではない」ことを認め、それぞれの特徴を活かしたシナジーを追求
Active Appliances（アクティブ家電）: ルーティンタスクを自動化しつつ、オーバーライド機能を維持するシステム
Information-Abundant Displays（情報豊富なディスプレイ）: 大量のデータを可視化するダッシュボード

（出典: Shneiderman, B. (2022). “Human-Centered AI.” Oxford University Press; Shneiderman, B. (2020). “Human-Centered Artificial Intelligence.” International Journal of Human-Computer Interaction, 36(6). https://arxiv.org/abs/2002.04087 / https://bdtechtalks.com/2022/03/21/human-centered-ai-ben-shneiderman/ ）

意味のある人間の関与（Meaningful Human Control: MHC）

2つの必要条件（Santoni de Sio & van den Hoven, 2018）:

Tracking条件: システムが設計者・運用者の道徳的理由と環境の事実の両方に応答する
Tracing条件: 結果を設計・運用チェーンの少なくとも一人の人間に遡及できる

Variable Autonomy（可変自律性）: 自律レベルを動的に調整可能なシステムとして設計することで、説明責任、責任、透明性を確保しつつMHCを実現する

（出典: Santoni de Sio, F. & van den Hoven, J. (2018). “Meaningful Human Control over Autonomous Systems.” Frontiers in Robotics and AI, 5

. https://www.frontiersin.org/journals/robotics-and-ai/articles/10.3389/frobt.2018.00015/full ）

監督制御からチーミングへの進化

伝統的な監督的人間制御（SHC: Sheridan, 1992）の5機能 — 計画、教示、監視、介入、学習 — は、基盤モデルベースのAIには不十分。

SHCの限界:

状況認識の喪失（Out-of-the-loop問題）
非決定論的な振る舞い（基盤モデルの予測不能な出力）
解釈可能性のギャップ
過信のダイナミクス
オペレータの主体性の喪失

Human-Machine Teaming（HMT）への移行のための4要件:

共有メンタルモデル: タスク、役割、能力、運用境界の共通理解
効果的なコミュニケーションチャネル: 信頼度、限界、発見した情報を双方向にフィードバック
コミットメントメカニズム: 予測可能性を高めるための行動のロックイン
慣習（Convention）の構築: 反復的なインタラクションによるチーム固有の期待・暗黙のルール・相互理解

（出典: “Human control of AI systems: from supervision to teaming.” AI and Ethics, 2024. https://pmc.ncbi.nlm.nih.gov/articles/PMC12058881/ ）

認知増幅 vs 認知委任（Cognitive Amplification vs Delegation）

4つの操作的指標:

*CAI（Cognitive Amplification Index）**: AIが人間の専門性を維持しつつハイブリッドパフォーマンスを向上させているか
D（Dependency Ratio）: 人間がAIにどの程度依存しているか
HRI（Human Reliance Index）: AIへの依存度
HCDR（Human Cognitive Drift Rate）: 時間経過に伴う人間の専門性の劣化

核心的発見: 「短期的なハイブリッド能力の最大化は、必ずしも長期的な人間の認知的能力の保存を保証しない」

55%の皮質活動低下: AI支援下の執筆中に皮質活動が最大55%低下し、それに伴い記憶統合が損なわれる「認知的負債（cognitive debt）」が報告されている

（出典: “Cognitive Amplification vs Cognitive Delegation in Human-AI Systems,” 2026. https://arxiv.org/abs/2603.18677; Frontiers in Psychology, “Cognitive offloading or cognitive overload?”, 2025 ）

AI協働コード開発への適用

LLM支援コードレビューは「感情的・社会的影響の管理」から「認知負荷、正確性、コンテキスト整合性の管理」へと焦点を移す
AIアシスタンスとの共同プログラミングはコードの速度と品質に正の影響をもたらすが、シニアリティとタスク種別で大きく異なる
人間同士の協働は「認知的エージェンシー」を維持するが、AI支援は「認知的オフローディング」を引き起こしうる

（出典: “Engagement in Code Review: Emotional, Behavioral, and Cognitive Dimensions in Peer vs. LLM Interactions,” 2024. https://arxiv.org/html/2512.05309; “Human-in-the-Loop Pair Programming with AI,” IJIRSET 2024 ）

意外な発見・注目すべき点

1. Lumberjack Effectの直感に反するトレードオフ

自動化のメリットが大きいほど、故障時の損害も大きいという非直感的な関係。AIエージェントの出力品質が高く信頼できるほど、人間のレビュー能力が低下し、AIが誤った際の影響が深刻化するパラドックス。

2. 信頼較正における「初期障害の集中（Frontloading）」の破壊的効果

ランダムに分散した障害よりも、初期に集中した障害の方が60%以上の信頼損傷をもたらす。AIエージェントとの協働開始初期にAIが失敗すると、その後の信頼回復が極めて困難になることを示唆。

3. 認知増幅 vs 認知委任の定量的フレームワークの登場

2026年発表の研究で、人間-AIシステムが「認知的に持続可能」かどうかを測る操作的指標が初めて提案された。短期的なパフォーマンス向上と長期的なスキル維持のトレードオフを定量評価できる可能性。

4. AI支援下での55%の皮質活動低下

AI支援による執筆中の皮質活動が最大55%低下し、短期的効率と引き換えに深い記憶統合が損なわれるという「認知的負債」の概念。知識労働者のAI協働における深刻な懸念。

5. 相補性の具体的数値

人間のみ68%、AIのみ77%に対し、最適な役割配分で88%を達成。単純な組み合わせではなく、自動化+増強+人的資源再配分の戦略的組み合わせが鍵。

6. 監督制御から「チーミング」への移行提唱

伝統的なSheridan型の監視・介入モデルが基盤モデル時代には不十分とする2024年の研究。共有メンタルモデル、双方向コミュニケーション、コミットメントメカニズム、慣習構築の4要件は、Claude Code等のAIエージェントとの協働にも直接適用可能。

7. 適応的自動化が現実のタスクで機能する証拠

航空管制シミュレーションでEEGベースの適応的自動化が75%の精度でワークロードを検出し、パフォーマンス改善が統計的に有意であった。将来的に、AIエージェントが人間の疲労度を検知して自律度を調整することが技術的に可能。

情報の信頼性に関する注記

高信頼性: Parasuraman et al. (2000)、Endsley (1995)、Bainbridge (1983)、Lee & See (2004)、Shneiderman (2020/2022)、Onnasch et al. (2014) はいずれも査読付き学術論文で、被引用数も極めて高い（数千件規模）。
中信頼性: Google PAIR Guidebook、Microsoft HAX Toolkitは企業発のガイドラインだが、学術的な裏付けがあり広く引用されている。EU AI Act Article 14は法的文書として確定。
検証が必要: 認知的負債（55%の皮質活動低下）の報告はFrontiers in Psychologyの2025年論文に基づくが、具体的な実験条件の詳細は未確認。Cognitive Amplification vs Delegationのフレームワーク（2026年）は極めて新しく、学術コミュニティでの検証はこれから。
deskilling: AI時代のスキル劣化に関する多くの主張は理論的・観察的であり、大規模な縦断研究のエビデンスはまだ限られている（Macnamara et al., 2024は実験を報告していない理論論文と明記）。

未解明・追加調査候補

AIエージェントの「説明可能性」の最適粒度: AIが数分〜30分の作業を行った後、どの程度の詳細さで作業過程を説明すべきか。過度な説明は認知負荷を上げ、不足した説明は信頼較正を妨げる。
長期的なdeskilling縦断研究: AIコーディングアシスタントを長期使用した開発者のスキル変化を追跡する縦断研究は未発見。
複数AIエージェントの並列管理: 人間が複数のAIエージェントを同時に監督する場合の認知負荷と最適な管理数に関するHCI研究。
適応的自動化のAIエージェントへの適用: 現在のEEGベースの研究は航空管制・手術に限定。知識労働×AIエージェントの文脈での適応的自動化は未開拓。
チーミングモデルの実装: Sheridan型監視からHMTへの移行が提唱されているが、AIコーディングエージェントの文脈での具体的なUIパターンや作業フローの設計研究はほぼ存在しない。
信頼較正のインターフェースデザイン: AIの信頼度・不確実性をどのように表示すれば人間の適切な依存（RAIRとRSRの両方を最大化）を促進できるかの実践的研究。