論文の概要: A Multi-Agent System for Generating Actionable Business Advice
- arxiv url: http://arxiv.org/abs/2601.12024v1
- Date: Sat, 17 Jan 2026 12:07:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.425348
- Title: A Multi-Agent System for Generating Actionable Business Advice
- Title(参考訳): 行動可能なビジネスアドバイザを生成するマルチエージェントシステム
- Authors: Kartikey Singh Bhandari, Tanish Jain, Archit Agrawal, Dhruv Kumar, Praveen Kumar, Pratik Narang,
- Abstract要約: 顧客のレビューには、製品の弱点とユーザニーズのアンメットに関する豊富なシグナルが含まれている。
既存の分析手法が記述的タスクを超えて動くことは滅多にない。
規範的意思決定支援のための多エージェントLLMベースのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 6.322241356158281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Customer reviews contain rich signals about product weaknesses and unmet user needs, yet existing analytic methods rarely move beyond descriptive tasks such as sentiment analysis or aspect extraction. While large language models (LLMs) can generate free-form suggestions, their outputs often lack accuracy and depth of reasoning. In this paper, we present a multi-agent, LLM-based framework for prescriptive decision support, which transforms large scale review corpora into actionable business advice. The framework integrates four components: clustering to select representative reviews, generation of advices, iterative evaluation, and feasibility based ranking. This design couples corpus distillation with feedback driven advice refinement to produce outputs that are specific, actionable, and practical. Experiments across three service domains and multiple model families show that our framework consistently outperform single model baselines on actionability, specificity, and non-redundancy, with medium sized models approaching the performance of large model frameworks.
- Abstract(参考訳): 顧客のレビューには、製品の弱点や未完成のユーザニーズに関する豊富なシグナルが含まれているが、既存の分析手法は、感情分析やアスペクト抽出といった記述的なタスクを超えることは滅多にない。
大きな言語モデル(LLM)は自由形式の提案を生成することができるが、その出力は精度と推論の深さを欠くことが多い。
本稿では,大規模レビューコーパスを実用的なビジネスアドバイスに変換する,多エージェントLLMに基づく規範的意思決定支援フレームワークを提案する。
このフレームワークは4つのコンポーネントを統合している: 代表的なレビューを選択するクラスタリング、アドバイスの生成、反復評価、実行可能性に基づくランキング。
この設計は、コーパス蒸留とフィードバック駆動のアドバイス精製を結合して、特定の、実行可能な、実用的な出力を生成する。
3つのサービスドメインと複数のモデルファミリにわたる実験により、我々のフレームワークは、大きなモデルフレームワークのパフォーマンスに近づいた中規模のモデルで、アクション容易性、特異性、および非冗長性の単一モデルベースラインを一貫して上回ります。
関連論文リスト
- Talk, Snap, Complain: Validation-Aware Multimodal Expert Framework for Fine-Grained Customer Grievances [14.30884038757821]
既存の苦情分析へのアプローチは、つぶやきや製品レビューのような、一過性の短いコンテンツに大きく依存している。
本稿では,このマルチモーダル設定に適した,エキスパートルーティング付きバリデーション・アウェア・ラーナーであるVALORを紹介する。
微粒なアスペクト重大さとラベルを付加したマルチモーダル・クレーム・データセット上でVALORを評価した。
論文 参考訳(メタデータ) (2025-11-18T17:29:28Z) - Structural Reward Model: Enhancing Interpretability, Efficiency, and Scalability in Reward Modeling [23.919163488129985]
Structure Reward Model (SRM) はサイドブランチと補助機能ジェネレータを統合したモジュラーフレームワークである。
粒度の細かい寸法を導入することで、RMは解釈可能で効率的な評価、ターゲット診断、最適化を可能にします。
論文 参考訳(メタデータ) (2025-09-29T18:09:25Z) - RefactorCoderQA: Benchmarking LLMs for Multi-Domain Coding Question Solutions in Cloud and Edge Deployment [20.416910591388618]
本稿では,Large Language Models (LLM) の性能を評価するためのベンチマークであるRefactorCoderQAを紹介する。
我々の微調整モデルであるRefactorCoder-MoEは最先端のパフォーマンスを実現し、オープンソースと商用のベースラインを76.84%で上回りました。
論文 参考訳(メタデータ) (2025-09-12T17:44:22Z) - Scalable and Interpretable Contextual Bandits: A Literature Review and Retail Offer Prototype [2.7624021966289605]
本稿では、CMAB(Contextual Multi-Armed Bandit)手法のレビューを行い、スケーラブルで解釈可能なオファー選択のための実験的なフレームワークを提案する。
アプローチは製品カテゴリレベルでコンテキストをモデル化し、オファーが複数のカテゴリにまたがり、類似のオファー間での知識伝達を可能にする。
論文 参考訳(メタデータ) (2025-05-22T17:13:01Z) - Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models [51.067146460271466]
視覚生成モデルの評価には時間を要するし、計算コストもかかる。
本研究では,効率的,動的,多ラウンドな評価に人間的な戦略を用いる評価エージェントフレームワークを提案する。
1)効率性、2)多様なユーザニーズに合わせた迅速な評価、3)1つの数値スコア以上の説明可能性、4)さまざまなモデルやツールのスケーラビリティ。
論文 参考訳(メタデータ) (2024-12-10T18:52:39Z) - UltraEval: A Lightweight Platform for Flexible and Comprehensive Evaluation for LLMs [74.1976921342982]
本稿では,ユーザフレンドリな評価フレームワークであるUltraEvalを紹介し,その軽量性,包括性,モジュール性,効率性を特徴とする。
その結果のコンポーザビリティにより、統一された評価ワークフロー内で、さまざまなモデル、タスク、プロンプト、ベンチマーク、メトリクスを自由に組み合わせることができる。
論文 参考訳(メタデータ) (2024-04-11T09:17:12Z) - Domain-Expanded ASTE: Rethinking Generalization in Aspect Sentiment Triplet Extraction [67.54420015049732]
Aspect Sentiment Triplet extract (ASTE) は感情分析における課題であり、人間の感情に対するきめ細かい洞察を提供することを目的としている。
既存のベンチマークは2つのドメインに限定されており、目に見えないドメイン上でのモデルパフォーマンスを評価しない。
各種ドメインのサンプルに注釈を付けることでドメイン拡張ベンチマークを導入し,ドメイン内設定とドメイン外設定の両方でモデルの評価を可能にする。
論文 参考訳(メタデータ) (2023-05-23T18:01:49Z) - RADDLE: An Evaluation Benchmark and Analysis Platform for Robust
Task-oriented Dialog Systems [75.87418236410296]
我々はraddleベンチマーク、コーパスのコレクション、および様々なドメインのモデルのパフォーマンスを評価するためのツールを紹介します。
RADDLEは強力な一般化能力を持つモデルを好んで奨励するように設計されている。
先行学習と微調整に基づく最近の最先端システムの評価を行い,異種ダイアログコーパスに基づく基礎的な事前学習が,ドメインごとの個別モデルをトレーニングするよりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-29T08:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。