論文の概要: Voting Protocols as Coordination Mechanisms for Role-Constrained Multi-Agent Tutoring Systems
- arxiv url: http://arxiv.org/abs/2606.08030v1
- Date: Sat, 06 Jun 2026 07:46:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.675153
- Title: Voting Protocols as Coordination Mechanisms for Role-Constrained Multi-Agent Tutoring Systems
- Title(参考訳): 役割制約付きマルチエージェントテュータリングシステムのコーディネーション機構としての投票プロトコル
- Authors: Eric S. Qiu, Joyce Gill,
- Abstract要約: 投票プロトコルが4つの役割制約型教育エージェント間の協力関係をどう形成するかを検討する。
1200以上のシミュレーションインタラクションにおいて,エージェントの議論や投票プロトコルのタイプが頻繁に変化し,結果が最終的に勝つことがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agentic tutoring systems introduce a coordination challenge: multiple agents may propose different but reasonable interventions, yet only one response can be delivered to the learner. In this paper, we study how voting protocols shape cooperation among four role-constrained pedagogical agents responsible for scaffolding, misconception, motivation, and metacognition. We compare four voting protocols -- simple, ranked, cumulative, and approval voting -- across two simulated tutoring environments on SciQ and HumanEval benchmarks. Rather than using voting as a simple aggregation step, we use it to analyze how collective decision rules shape coordination under partial pedagogical conflict. Across 1,200 simulated interactions, we find that agent deliberation and voting protocol type frequently change which response ultimately wins, showing that both meaningfully shape the collective decision. Different voting rules also produce distinct coordination behaviors, and even brief tutoring turns show measurable learning gains in simulated students. Overall, we show that protocol choice is associated with distinct coordination patterns among role-specialized pedagogical agents.
- Abstract(参考訳): 複数のエージェントは異なるが合理的な介入を提案できるが、学習者には1つの応答しか提供できない。
本稿では,足場,誤解,モチベーション,メタ認知に責任を持つ4つの役割制約型教育エージェント間の投票プロトコルの連携について検討する。
我々は、SciQとHumanEvalベンチマークの2つのシミュレートされたチューリング環境(SciQとHumanEvalのベンチマーク)で、単純な、ランク付けされた、累積的な、そして承認投票の4つの投票プロトコルを比較した。
投票を単純な集計ステップとして使うのではなく、部分的な教育的対立の下で、集団的な決定規則がどのように協調を形作るかを分析するために使用する。
1200件のシミュレートされたインタラクションにおいて,エージェントの議論と投票プロトコルのタイプは,いずれの応答が最終的に勝利するかを頻繁に変更し,両者が有意義に集団決定を形作ることを示す。
異なる投票規則は、異なる協調行動も生み出す。
全体として、プロトコルの選択は、役割特異的な教育エージェント間の異なる協調パターンと関連していることを示す。
関連論文リスト
- Coordination Matters: Evaluation of Cooperative Multi-Agent Reinforcement Learning [1.9806597528054068]
プロセスレベルの診断でリターンを補うコーディネート・アウェア評価の視点を提案する。
制御されたコミットメント制約付き空間的タスク割り当てテストベッドSTATを用いて、この視点をインスタンス化する。
この結果から, 冗長配置の相違, 代入の多様性, タスク補完効率の相違など, 同様のリターン傾向が, 協調機構の相違を反映できることが示唆された。
論文 参考訳(メタデータ) (2026-05-07T16:50:53Z) - Self-Evolving Coordination Protocol in Multi-Agent AI Systems: An Exploratory Systems Feasibility Study [0.0]
自己進化コーディネーションプロトコル(SECP)
SECP: 限定的で、外部から検証された自己修正を可能にする調整プロトコル。
本稿では,自己進化コーディネーションプロトコルの探索システムの実現可能性について述べる。
論文 参考訳(メタデータ) (2026-02-02T14:45:04Z) - Let's Roleplay: Examining LLM Alignment in Collaborative Dialogues [11.888786446094057]
本稿では,多人数共同作業におけるパートナーとしての大規模言語モデルの有効性に,異なるアライメント手法がどのような影響を与えるかを検討する。
ロールプレイ手法を用いて、協調作業会話における異なる訓練された摩擦剤の介入を評価する。
以上の結果から, 摩擦認識アプローチは, 共通基盤への収束, あるいはタスク関連命題の一致, タスク結果の正当性の両方において, 共通のアライメントベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-09-07T00:58:10Z) - When Disagreements Elicit Robustness: Investigating Self-Repair Capabilities under LLM Multi-Agent Disagreements [56.29265568399648]
我々は、不一致が早期のコンセンサスを防ぎ、探索されたソリューション空間を拡張することを主張する。
タスククリティカルなステップの相違は、ソリューションパスのトポロジによってコラボレーションを損なう可能性がある。
論文 参考訳(メタデータ) (2025-02-21T02:24:43Z) - Multi-agent cooperation through learning-aware policy gradients [53.63948041506278]
利己的な個人はしばしば協力に失敗し、マルチエージェント学習の根本的な課題を提起する。
本稿では,学習型強化学習のための,偏見のない高導出性ポリシー勾配アルゴリズムを提案する。
我々は, 受刑者のジレンマから, 自己関心のある学習エージェントの間でどのように, いつ, 協力関係が生じるかの新たな説明を得た。
論文 参考訳(メタデータ) (2024-10-24T10:48:42Z) - Bidirectional Decoding: Improving Action Chunking via Guided Test-Time Sampling [51.38330727868982]
動作チャンキングが学習者と実証者の間の分岐にどのように影響するかを示す。
動作チャンキングをクローズドループ適応でブリッジするテスト時間推論アルゴリズムである双方向デコーディング(BID)を提案する。
提案手法は、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させる。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z) - CoRec: An Easy Approach for Coordination Recognition [8.618336635685859]
パイプラインモデル座標RECognizer(CoRec)を提案する。
コーディネータと共役境界検出器の2つの構成要素から構成される。
実験によると、CoRecは下流タスクに肯定的な影響を与え、最先端のOpen IEモデルの収量を改善する。
論文 参考訳(メタデータ) (2023-11-30T17:11:27Z) - Ask-AC: An Initiative Advisor-in-the-Loop Actor-Critic Framework [41.04606578479283]
本稿では,Ask-ACと呼ばれる新しいアドバイザリ・イン・ザ・ループアクター・クリティカル・フレームワークを提案する。
Ask-ACの中心には2つの補完的なコンポーネント、すなわちアクションリクエスタとアダプティブステートセレクタがある。
定常環境および非定常環境における実験結果から,提案手法はエージェントの学習効率を大幅に向上させることが示された。
論文 参考訳(メタデータ) (2022-07-05T10:58:11Z) - Curriculum-Driven Multi-Agent Learning and the Role of Implicit
Communication in Teamwork [24.92668968807012]
難解なマルチエージェントコーディネーションタスクを解決するためのカリキュラム駆動型学習戦略を提案する。
我々は、創発的な暗黙のコミュニケーションが、優れた調整レベルを実現する上で大きな役割を果たすと主張している。
論文 参考訳(メタデータ) (2021-06-21T14:54:07Z) - Self-supervised Text-independent Speaker Verification using Prototypical
Momentum Contrastive Learning [58.14807331265752]
モーメントの対比学習によって話者埋め込みがより良く学習できることを示す。
自己監視フレームワークを、データのごく一部しかラベル付けされない半監視シナリオに一般化します。
論文 参考訳(メタデータ) (2020-12-13T23:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。