論文の概要: The Human-AI Hybrid Delphi Model: A Structured Framework for Context-Rich, Expert Consensus in Complex Domains
- arxiv url: http://arxiv.org/abs/2508.09349v1
- Date: Tue, 12 Aug 2025 21:24:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.696447
- Title: The Human-AI Hybrid Delphi Model: A Structured Framework for Context-Rich, Expert Consensus in Complex Domains
- Title(参考訳): Human-AI Hybrid Delphi Model:複雑なドメインにおけるコンテキストリッチ、エキスパートコンセンサスのための構造化フレームワーク
- Authors: Cathy Speed, Ahmed A. Metwally,
- Abstract要約: 本研究では,専門家のコンセンサス向上を目的としたHuman-AI Hybrid Delphi (HAH-Delphi) フレームワークの導入と評価を行う。
HAH-Delphiフレームワークは、高品質でコンテキストに敏感なコンセンサスを生成するためのフレキシブルでスケーラブルなアプローチを提供する。
- 参考スコア(独自算出の注目度): 0.4143603294943439
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Expert consensus plays a critical role in domains where evidence is complex, conflicting, or insufficient for direct prescription. Traditional methods, such as Delphi studies, consensus conferences, and systematic guideline synthesis, offer structure but face limitations including high panel burden, interpretive oversimplification, and suppression of conditional nuance. These challenges are now exacerbated by information overload, fragmentation of the evidence base, and increasing reliance on publicly available sources that lack expert filtering. This study introduces and evaluates a Human-AI Hybrid Delphi (HAH-Delphi) framework designed to augment expert consensus development by integrating a generative AI model (Gemini 2.5 Pro), small panels of senior human experts, and structured facilitation. The HAH-Delphi was tested in three phases: retrospective replication, prospective comparison, and applied deployment in two applied domains (endurance training and resistance and mixed cardio/strength training). The AI replicated 95% of published expert consensus conclusions in Phase I and showed 95% directional agreement with senior human experts in Phase II, though it lacked experiential and pragmatic nuance. In Phase III, compact panels of six senior experts achieved >90% consensus coverage and reached thematic saturation before the final participant. The AI provided consistent, literature-grounded scaffolding that supported divergence resolution and accelerated saturation. The HAH-Delphi framework offers a flexible, scalable approach for generating high-quality, context-sensitive consensus. Its successful application across health, coaching, and performance science confirms its methodological robustness and supports its use as a foundation for generating conditional, personalised guidance and published consensus frameworks at scale.
- Abstract(参考訳): 専門家の合意は、証拠が複雑で矛盾し、直接処方薬に不十分な領域において重要な役割を果たす。
デルファイ研究、コンセンサス会議、体系的なガイドライン合成といった伝統的な手法は、高いパネル負担、解釈過剰化、条件付きニュアンスの抑制を含む、構造的だが顔の制限を提供する。
これらの課題は、情報過負荷、証拠の断片化、専門家のフィルタリングに欠ける公開ソースへの依存の増大によって悪化している。
本研究では、ジェニーニ2.5 Pro(ジェニーニ2.5 Pro)、シニアヒューマンエキスパートの小さなパネル、構造化ファシリテーションを統合することにより、専門家のコンセンサス開発を強化するために設計されたHuman-AI Hybrid Delphi(HAH-Delphi)フレームワークを紹介し、評価する。
HAH-Delphiは,2つの適用領域(耐久トレーニングと抵抗性,混合心/強度トレーニング)での再現性,予測比較,応用展開の3段階でテストされた。
AIは第1フェーズで専門家の結論の95%を再現し、第2フェーズでは上級人間の専門家と95%の方向性の合意を示したが、経験的および実用的ニュアンスに欠けていた。
第3フェーズでは、6人の上級専門家からなるコンパクトパネルが90%以上のコンセンサスを達成し、最終参加者の前に主題的な飽和に達した。
AIは、ばらつきの解決と飽和の加速をサポートする、一貫した文学的な足場を提供する。
HAH-Delphiフレームワークは、高品質でコンテキストに敏感なコンセンサスを生成するためのフレキシブルでスケーラブルなアプローチを提供する。
健康、コーチング、パフォーマンス科学にまたがるその成功例は、その方法論的堅牢性を確認し、条件付き、パーソナライズされたガイダンスと、大規模に公開されたコンセンサスフレームワークを生成するための基盤としての使用をサポートする。
関連論文リスト
- Scalable Delphi: Large Language Models for Structured Risk Estimation [43.395199275016665]
本研究では,Large Language Models (LLMs) が,構造化専門家の誘引にスケーラブルなプロキシとして機能するかどうかを検討する。
対象量は通常観測不可能であるため,必要な条件に基づいて評価フレームワークを開発する。
我々は,AIによるサイバーセキュリティリスクの領域において,3つの能力ベンチマークと独立した人間によるライセンス研究を用いて評価を行った。
論文 参考訳(メタデータ) (2026-02-09T16:52:03Z) - Towards a Science of Collective AI: LLM-based Multi-Agent Systems Need a Transition from Blind Trial-and-Error to Rigorous Science [70.3658845234978]
大規模言語モデル(LLM)はマルチエージェントシステム(MAS)の機能を大幅に拡張した。
この急速な進歩にもかかわらず、この分野はいまだに実証的な試行錯誤に大きく依存している。
このボトルネックは、帰属の曖昧さに起因している。
本稿では,協調運転要因を体系的に同定する要因帰属パラダイムを提案する。
論文 参考訳(メタデータ) (2026-02-05T04:19:52Z) - MedAD-R1: Eliciting Consistent Reasoning in Interpretible Medical Anomaly Detection via Consistency-Reinforced Policy Optimization [46.65200216642429]
我々はMedADの最初の大規模マルチモーダル・マルチセンタベンチマークであるMedAD-38Kを紹介し、構造化された視覚質問応答(VQA)ペアとともに、CoT(Chain-of-Thought)アノテーションを特徴付ける。
提案するモデルであるMedAD-R1は、MedAD-38Kベンチマーク上での最先端(SOTA)性能を実現し、強いベースラインを10%以上上回った。
論文 参考訳(メタデータ) (2026-02-01T07:56:10Z) - Federated Customization of Large Models: Approaches, Experiments, and Insights [50.70334261194185]
本稿では, 完全微調整, 効率的な微調整, プロンプトエンジニアリング, プレフィックスチューニング, 知識蒸留, 検索強化生成など, 一般的な大規模モデルのカスタマイズ技術について概説する。
我々は,連合学習環境にプレフィックスチューニングを適用した最初の試みである,フェデレートプレフィックスチューニングの実験を行った。
論文 参考訳(メタデータ) (2026-01-02T01:45:52Z) - Enhancing the QA Model through a Multi-domain Debiasing Framework [1.7802147489386633]
本研究では,SQuAD(Stanford Question Answering dataset) v1.1とAddSentとAddOneSentの対立データセットを用いたELECTRA小モデルの評価を行った。
我々は,知識蒸留,デバイアス技術,ドメイン拡張を取り入れたマルチドメインデバイアスフレームワークを開発した。
論文 参考訳(メタデータ) (2026-01-01T08:39:07Z) - ATLAS: A High-Difficulty, Multidisciplinary Benchmark for Frontier Scientific Reasoning [118.46980291324148]
ATLASは、約800のオリジナルの問題からなる大規模で、高精度で、学際横断的な評価スイートである。
主な特徴は次のとおりである。 テストデータの漏洩を防ぐために新しく作成されたり、実質的に適応されたすべての質問を含む、高いオリジン性と汚染抵抗。
先行モデルに関する予備的な結果は、ATLASが先進的な科学的推論能力の差別化に有効であることを証明している。
論文 参考訳(メタデータ) (2025-11-18T11:13:06Z) - RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark [71.3555284685426]
本稿では,双方向機能相乗効果を評価するためのベンチマークであるRealUnifyを紹介する。
RealUnifyは、10のカテゴリと32のサブタスクにまたがる、細心の注意を払ってアノテートされた1000のインスタンスで構成されている。
現在の統一モデルは、効果的な相乗効果を達成するのに依然として苦労しており、アーキテクチャの統一だけでは不十分であることを示している。
論文 参考訳(メタデータ) (2025-09-29T15:07:28Z) - AdaFusion: Prompt-Guided Inference with Adaptive Fusion of Pathology Foundation Models [49.550545038402184]
本稿では,新しいプロンプト誘導推論フレームワークであるAdaFusionを提案する。
本手法は,多様なモデルからタイルレベルの特徴を圧縮・整列する。
AdaFusionは、分類タスクと回帰タスクの両方にわたって、個々のPFMを一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-07T07:09:31Z) - Mind the XAI Gap: A Human-Centered LLM Framework for Democratizing Explainable AI [3.301842921686179]
我々は,専門家や非専門家のニーズに合わせて,透明性と人間中心の説明を保証する枠組みを導入する。
本フレームワークは,専門家以外の専門家が理解可能な1つの応答説明と専門家への技術的情報にカプセル化されている。
論文 参考訳(メタデータ) (2025-06-13T21:41:07Z) - Silence is Not Consensus: Disrupting Agreement Bias in Multi-Agent LLMs via Catfish Agent for Clinical Decision Making [80.94208848596215]
提案する概念は「Catfish Agent」である。これは、構造的不満を注入し、無声な合意に反するように設計された役割特化LDMである。
組織心理学において「ナマズ・エフェクト」にインスパイアされたカマズ・エージェントは、より深い推論を促進するために、新たなコンセンサスに挑戦するように設計されている。
論文 参考訳(メタデータ) (2025-05-27T17:59:50Z) - DuCos: Duality Constrained Depth Super-Resolution via Foundation Model [56.88399488384106]
ラグランジアン双対性理論に基づく新しい深度超解像フレームワークであるDuCosを紹介する。
DuCosは、ファンデーションモデルをプロンプトとして、さまざまなシナリオにおける一般化を著しく改善した最初の企業だ。
論文 参考訳(メタデータ) (2025-03-06T07:36:45Z) - Developmental Support Approach to AI's Autonomous Growth: Toward the Realization of a Mutually Beneficial Stage Through Experiential Learning [0.0]
本研究では,AI自体の倫理的発展を支援する「AI開発支援」アプローチを提案する。
我々は,経験,内観,分析,仮説形成のサイクルに基づく学習フレームワークを構築した。
論文 参考訳(メタデータ) (2025-02-27T06:12:20Z) - Imitate, Explore, and Self-Improve: A Reproduction Report on Slow-thinking Reasoning Systems [92.89673285398521]
o1のような推論システムは、複雑な推論タスクを解く際、顕著な能力を示した。
推論モデルをトレーニングするために、模倣、探索、自己改善のフレームワークを導入します。
提案手法は,産業レベルの推論システムと比較して競争性能が向上する。
論文 参考訳(メタデータ) (2024-12-12T16:20:36Z) - Diversifying the Mixture-of-Experts Representation for Language Models with Orthogonal Optimizer [59.43462055143123]
The Mixture of Experts (MoE)は、ディープラーニングにおいて非常に成功したテクニックとして登場した。
本研究では,MoEの専門家が多様性の専門化や欠如に失敗した同質表現問題に光を当てた。
我々は,各専門家が他の専門家に分散された部分空間への方向を更新するように促す訓練戦略を交互に提案する。
論文 参考訳(メタデータ) (2023-10-15T07:20:28Z) - Harnessing Collective Intelligence Under a Lack of Cultural Consensus [0.1813006808606333]
CCT(Cultural Consensus Theory)は、異なるコンセンサス・コンセンサス・コンセンサス(コンセンサス・コンセンサス・コンセンサス・コンセンサス・コンセンサス)を検出するための統計的枠組みを提供する。
我々は、事前訓練されたディープニューラルネットワーク埋め込みと、それらのエンティティに関するコンセンサス信念を、回答者の1つ以上のサブセットにマッピングする潜在構造で拡張する。
iDLC-CCTはコンセンサスの度合いをよりよく予測し、サンプル外エンティティによく一般化し、スパースデータでも有効であることがわかった。
論文 参考訳(メタデータ) (2023-09-18T14:05:04Z) - Artificial Intelligence Nomenclature Identified From Delphi Study on Key
Issues Related to Trust and Barriers to Adoption for Autonomous Systems [5.175660172780059]
クロスディシプリンティングチームは、複雑な機械学習の課題に協力しています。
文学における基本的な定義のコンセンサスを見つけることは、より根本的な問題である。
論文 参考訳(メタデータ) (2022-10-14T16:54:20Z) - Towards Fine-grained Human Pose Transfer with Detail Replenishing
Network [96.54367984986898]
ヒューマン・ポーズ・トランスファー(HPT)は、ファッションデザイン、メディア制作、オンライン広告、バーチャルリアリティーにおいて大きな可能性を秘めている研究分野である。
既存のHPT手法は、詳細不足、内容の曖昧さ、スタイルの不整合という3つの根本的な問題に悩まされることが多い。
我々は、より難易度が高く実用的なHPTセッティングを開発し、よりセマンティックな忠実さと詳細な補充に焦点を当てた、FHPT(F Fine-fine Human Pose Transfer)と呼ばれる。
論文 参考訳(メタデータ) (2020-05-26T03:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。