論文の概要: PartnerMAS: An LLM Hierarchical Multi-Agent Framework for Business Partner Selection on High-Dimensional Features
- arxiv url: http://arxiv.org/abs/2509.24046v1
- Date: Sun, 28 Sep 2025 19:39:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.606206
- Title: PartnerMAS: An LLM Hierarchical Multi-Agent Framework for Business Partner Selection on High-Dimensional Features
- Title(参考訳): PartnerMAS: ビジネスパートナー選択のための高次元機能のためのLLM階層型マルチエージェントフレームワーク
- Authors: Lingyao Li, Haolun Wu, Zhenkun Li, Jiabei Hu, Yu Wang, Xiaoshan Huang, Wenyue Hua, Wenqian Wang,
- Abstract要約: 評価を3層に分割する階層型マルチエージェントフレームワークを提案する。戦略を設計するプランナーエージェント,役割特異的評価を行う専門エージェント,アウトプットを統合するスーパーバイザエージェントである。
140のケースで、PartnerMASはシングルエージェントと議論ベースのマルチエージェントベースラインを一貫して上回り、最大10-15%のマッチレートを達成する。
- 参考スコア(独自算出の注目度): 23.788838112113257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-dimensional decision-making tasks, such as business partner selection, involve evaluating large candidate pools with heterogeneous numerical, categorical, and textual features. While large language models (LLMs) offer strong in-context reasoning capabilities, single-agent or debate-style systems often struggle with scalability and consistency in such settings. We propose PartnerMAS, a hierarchical multi-agent framework that decomposes evaluation into three layers: a Planner Agent that designs strategies, Specialized Agents that perform role-specific assessments, and a Supervisor Agent that integrates their outputs. To support systematic evaluation, we also introduce a curated benchmark dataset of venture capital co-investments, featuring diverse firm attributes and ground-truth syndicates. Across 140 cases, PartnerMAS consistently outperforms single-agent and debate-based multi-agent baselines, achieving up to 10--15\% higher match rates. Analysis of agent reasoning shows that planners are most responsive to domain-informed prompts, specialists produce complementary feature coverage, and supervisors play an important role in aggregation. Our findings demonstrate that structured collaboration among LLM agents can generate more robust outcomes than scaling individual models, highlighting PartnerMAS as a promising framework for high-dimensional decision-making in data-rich domains.
- Abstract(参考訳): ビジネスパートナーの選択のような高次元の意思決定タスクには、不均一な数値、カテゴリー、テキストの特徴を持つ大きな候補プールの評価が含まれる。
大規模言語モデル(LLM)はコンテキスト内推論機能を強く提供しますが、単一エージェントや議論スタイルのシステムは、そのような設定でスケーラビリティと一貫性に苦しむことが多いのです。
評価を3層に分割する階層型マルチエージェントフレームワークであるPartnerMASを提案する。
体系的評価を支援するため,多種多様なコーパス属性と地道シンジケートを特徴とするベンチャーキャピタル共同投資のベンチマークデータセットも導入した。
140のケースで、PartnerMASはシングルエージェントと議論ベースのマルチエージェントベースラインを一貫して上回り、最大10~15倍のマッチレートを達成する。
エージェント推論の分析によると、プランナーはドメインインフォームドプロンプトに最も反応し、スペシャリストは補完的な特徴カバレッジを生成し、管理者はアグリゲーションにおいて重要な役割を果たす。
その結果,LLMエージェント間の構造化された協調は,個々のモデルをスケールするよりもロバストな結果をもたらすことが示され,PartnerMASはデータリッチドメインにおける高次元意思決定のフレームワークとして有望であることがわかった。
関連論文リスト
- AlphaAgents: Large Language Model based Multi-Agents for Equity Portfolio Constructions [1.1957417530954946]
複雑な課題を解決するための,有望なアプローチとして,マルチエージェントコラボレーションが登場している。
本研究は、株式調査・ポートフォリオ管理における株式選択を支援するために、ロールベースのマルチエージェントシステムの適用について検討する。
論文 参考訳(メタデータ) (2025-08-15T01:49:56Z) - Beyond Brainstorming: What Drives High-Quality Scientific Ideas? Lessons from Multi-Agent Collaboration [59.41889496960302]
本稿では,構造化マルチエージェントの議論が独創的思考を超えうるかどうかを考察する。
研究提案を作成するための協調型マルチエージェントフレームワークを提案する。
エージェントベースのスコアリングと,新規性,戦略的ビジョン,統合深度といった領域にわたるヒューマンレビューを備えた包括的プロトコルを採用している。
論文 参考訳(メタデータ) (2025-08-06T15:59:18Z) - Deep Research Agents: A Systematic Examination And Roadmap [109.53237992384872]
Deep Research (DR) エージェントは複雑な多ターン情報研究タスクに取り組むように設計されている。
本稿では,DRエージェントを構成する基礎技術とアーキテクチャコンポーネントの詳細な分析を行う。
論文 参考訳(メタデータ) (2025-06-22T16:52:48Z) - MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents [59.825725526176655]
大規模言語モデル(LLM)は、自律的なエージェントとして顕著な能力を示している。
既存のベンチマークでは、単一エージェントタスクにフォーカスするか、狭いドメインに限定されており、マルチエージェントのコーディネーションと競合のダイナミクスを捉えていない。
多様な対話シナリオにまたがってLLMベースのマルチエージェントシステムを評価するためのベンチマークであるMultiAgentBenchを紹介する。
論文 参考訳(メタデータ) (2025-03-03T05:18:50Z) - Cooperative Strategic Planning Enhances Reasoning Capabilities in Large Language Models [37.899581994741865]
本稿では,新しい協調型マルチエージェント推論フレームワーク(CoPlanner)を提案する。
コプラナーは2つのLSMエージェント(計画エージェントと推論エージェント)から構成される。
以上の結果から,計画エージェントからの指導とエージェント間の効果的な協力が,CoPlannerの優れた性能に寄与することが示唆された。
論文 参考訳(メタデータ) (2024-10-25T23:32:48Z) - COMMA: A Communicative Multimodal Multi-Agent Benchmark [15.329501174451677]
マルチモーダルマルチエージェントシステムの協調性能を評価するための新しいパズルベンチマークであるCOMMAを紹介する。
GPT-4oのような強力なプロプライエタリモデルや、o4-miniのような推論モデルなど、最先端モデルの驚くべき弱点が明らかになった。
R1-OnevisionやLLaVA-CoTのような多くの思考推論モデルは、エージェントとエージェントのコラボレーションにおいて、ランダムなベースラインよりも優れている。
論文 参考訳(メタデータ) (2024-10-10T02:49:47Z) - Large Multimodal Agents: A Survey [78.81459893884737]
大規模言語モデル(LLM)は、テキストベースのAIエージェントのパワーで優れたパフォーマンスを実現している。
LLMを利用したAIエージェントをマルチモーダルドメインに拡張することに焦点を当てた、新たな研究トレンドがある。
本総説は, この急速に発展する分野において, 今後の研究に有用な洞察とガイドラインを提供することを目的としている。
論文 参考訳(メタデータ) (2024-02-23T06:04:23Z) - Cooperation, Competition, and Maliciousness: LLM-Stakeholders Interactive Negotiation [52.930183136111864]
我々は,大言語モデル(LLM)を評価するためにスコーラブルネゴシエーション(scorable negotiations)を提案する。
合意に達するには、エージェントは強力な算術、推論、探索、計画能力を持つ必要がある。
我々は、新しいゲームを作成し、進化するベンチマークを持つことの難しさを増大させる手順を提供する。
論文 参考訳(メタデータ) (2023-09-29T13:33:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。