論文の概要: Enhancing LLM Problem Solving via Tutor-Student Multi-Agent Interaction
- arxiv url: http://arxiv.org/abs/2604.08931v1
- Date: Fri, 10 Apr 2026 03:56:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.673234
- Title: Enhancing LLM Problem Solving via Tutor-Student Multi-Agent Interaction
- Title(参考訳): チュータ拘束型マルチエージェントインタラクションによるLLM問題解決の強化
- Authors: Nurullah Eymen Özdemir, Erhan Oztop,
- Abstract要約: 同一のLarge Language Model (LLM) からインスタンス化された2つのエージェントが非対称な役割を割り当てる自律的符号化問題領域を提案する。
提案するフレームワーク(PETITE)では,相補的な役割を通じて相互作用を構造化することにより,一つのモデルからより良い問題解決性能を抽出することを目的としている。
その結果,比較的少ないトークンを消費しながら,類似あるいは高い精度が得られることがわかった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Human cognitive development is shaped not only by individual effort but by structured social interaction, where role-based exchanges such as those between a tutor and a learner, enable solutions that neither could achieve alone. Inspired by these developmental principles, we ask the question whether a tutor-student multi-agent system can create a synergistic effect by pushing Large Language Model (LLM) beyond what it can do within existing frameworks. To test the idea, we adopt autonomous coding problem domain where two agents instantiated from the same LLM assigned asymmetric roles: a student agent generates and iteratively refines solutions, while a tutor agent provides structured evaluative feedback without access to ground-truth answers. In our proposed framework (PETITE), we aim to extract better problem-solving performance from one model by structuring its interaction through complementary roles, rather than relying on stronger supervisory models or heterogeneous ensembles. Our model is evaluated on the APPS coding benchmark against state-of-the-art approaches of Self-Consistency, Self-Refine, Multi-Agent Debate, and Multi-Agent Review. The results show that our model achieves similar or higher accuracy while consuming significantly fewer tokens. These results suggest that developmentally grounded role-differentiated interaction structures provide a principled and resource-efficient paradigm for enhancing LLM problem-solving through structured peer-like interactions. Index Terms- Peer Tutoring, Scaffolding, Large Language Models, Multi-Agent Systems, Code Generation
- Abstract(参考訳): 人間の認知発達は、個人の努力だけでなく、教師と学習者の間の役割ベースの交流によって構成された社会的相互作用によって形成され、どちらも単独では達成できないソリューションを可能にしている。
これらの発展原理に触発されて,既存のフレームワークでできることを超えて,大規模言語モデル(LLM)を推し進めることで,教師と学生のマルチエージェントシステムが相乗効果を生み出すことができるのか,という疑問を提起する。
学生エージェントがソリューションを生成し、反復的に洗練する一方、チューターエージェントは、地味な答えにアクセスせずに構造化された評価フィードバックを提供する。
提案フレームワークは,より強力な監督モデルやヘテロジニアスアンサンブルに頼るのではなく,補完的な役割を通じて相互作用を構造化することで,一つのモデルからより優れた問題解決性能を抽出することを目的としている。
本モデルは, 自己整合性, 自己定義性, マルチエージェント・ディベート, マルチエージェント・レビューの最先端アプローチに対するAPPS符号化ベンチマークで評価した。
その結果,本モデルでは,トークンの消費が著しく少ないのに対して,類似あるいは高い精度を実現していることがわかった。
これらの結果から, 発達的基盤を持つ役割微分相互作用構造は, 構造化されたピアライクな相互作用を通して, LLM問題の解決を促進するために, 原理的かつ資源効率のよいパラダイムを提供することが示された。
指標項-ピアチュータ、スキャフォールディング、大言語モデル、マルチエージェントシステム、コード生成
関連論文リスト
- Interactive Learning for LLM Reasoning [31.453846641515472]
本稿では,大規模言語モデルの独立した問題解決能力を高めるために,マルチエージェントインタラクションが有効かどうかを検討する。
動的インタラクションと知覚を統合した新しいコラーニングフレームワークであるIRRを紹介する。
ILRはシングルエージェント学習を一貫して上回り、最強のベースラインよりも最大5%向上した。
論文 参考訳(メタデータ) (2025-09-30T14:21:31Z) - Agentic Workflow for Education: Concepts and Applications [7.875055566698523]
本研究では,自己回帰,ツールの実行,タスク計画,マルチエージェント協調からなる4成分モデルであるエージェント・フォー・教育(AWE)を紹介した。
AWEは、教師の作業量を削減し、教育の質を高め、より広範な教育革新を可能にする、有望な道を提供する。
論文 参考訳(メタデータ) (2025-09-01T14:39:48Z) - MLE-Dojo: Interactive Environments for Empowering LLM Agents in Machine Learning Engineering [57.156093929365255]
自律型大規模言語モデル(LLM)エージェントを体系的に強化し、評価し、改善するためのガイムスタイルのフレームワーク。
MLE-Dojoは、現実的なエンジニアリングシナリオを反映した、多様でオープンなMLEタスクを慎重にキュレートする。
完全に実行可能な環境は、教師付き微調整と強化学習の両方を通して包括的なエージェントトレーニングをサポートする。
論文 参考訳(メタデータ) (2025-05-12T17:35:43Z) - ReMA: Learning to Meta-think for LLMs with Multi-Agent Reinforcement Learning [53.817538122688944]
Reinforced Meta-thinking Agents (ReMA) を導入し,Large Language Models (LLMs) の推論からメタ思考行動を求める。
ReMAは、推論プロセスを2つの階層的なエージェントに分解する。戦略上の監視と計画を生成するハイレベルなメタ思考エージェントと、詳細な実行のための低レベルな推論エージェントである。
単ターン実験による実験結果から、ReMAは複雑な推論タスクにおいて単エージェントRLベースラインよりも優れることが示された。
論文 参考訳(メタデータ) (2025-03-12T16:05:31Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z) - Collaboration Dynamics and Reliability Challenges of Multi-Agent LLM Systems in Finite Element Analysis [3.437656066916039]
インターエイジェントダイナミクスが推論の品質と信頼性にどのように影響するかは、まだ不明である。
線形弾性有限要素解析(FEA)のためのAutoGenベースのマルチエージェントフレームワークを用いたこれらのメカニズムについて検討する。
1,120のコントロールされたトライアルから、コラボレーションの有効性は、チームのサイズよりも機能的な相補性に依存することが分かりました。
論文 参考訳(メタデータ) (2024-08-23T23:11:08Z) - Large Language Model-based Human-Agent Collaboration for Complex Task
Solving [94.3914058341565]
複雑なタスク解決のためのLarge Language Models(LLM)に基づくヒューマンエージェントコラボレーションの問題を紹介する。
Reinforcement Learning-based Human-Agent Collaboration method, ReHACを提案する。
このアプローチには、タスク解決プロセスにおける人間の介入の最も急進的な段階を決定するために設計されたポリシーモデルが含まれている。
論文 参考訳(メタデータ) (2024-02-20T11:03:36Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Multi-Agent Interactions Modeling with Correlated Policies [53.38338964628494]
本稿では,マルチエージェントインタラクションモデリング問題をマルチエージェント模倣学習フレームワークに実装する。
相関ポリシー(CoDAIL)を用いた分散型適応模倣学習アルゴリズムの開発
様々な実験により、CoDAILはデモレーターに近い複雑な相互作用をより良く再生できることが示されている。
論文 参考訳(メタデータ) (2020-01-04T17:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。