論文の概要: HabitatAgent: An End-to-End Multi-Agent System for Housing Consultation
- arxiv url: http://arxiv.org/abs/2604.00556v1
- Date: Wed, 01 Apr 2026 06:59:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.882872
- Title: HabitatAgent: An End-to-End Multi-Agent System for Housing Consultation
- Title(参考訳): HabitatAgent:住宅コンサルティングのためのエンドツーエンドマルチエージェントシステム
- Authors: Hongyang Yang, Yanxin Zhang, Yang She, Yue Xiao, Hao Wu, Yiyang Zhang, Jiapeng Hou, Rongshan Zhang,
- Abstract要約: エンド・ツー・エンド・エンド・ハウジングのためのLLMを利用した初のマルチエージェントアーキテクチャであるHabitatAgentを紹介する。
HabitatAgentには、メモリ、検索、生成、検証の4つの特別なエージェントの役割がある。
エンド・ツー・エンドの正当性プロトコルを用いて、HabitatAgentを100の実際のユーザコンサルテーションシナリオで評価する。
- 参考スコア(独自算出の注目度): 8.894547553174196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Housing selection is a high-stakes and largely irreversible decision problem. We study housing consultation as a decision-support interface for housing selection. Existing housing platforms and many LLM-based assistants often reduce this process to ranking or recommendation, resulting in opaque reasoning, brittle multi-constraint handling, and limited guarantees on factuality. We present HabitatAgent, the first LLM-powered multi-agent architecture for end-to-end housing consultation. HabitatAgent comprises four specialized agent roles: Memory, Retrieval, Generation, and Validation. The Memory Agent maintains multi-layer user memory through internal stages for constraint extraction, memory fusion, and verification-gated updates; the Retrieval Agent performs hybrid vector--graph retrieval (GraphRAG); the Generation Agent produces evidence-referenced recommendations and explanations; and the Validation Agent applies multi-tier verification and targeted remediation. Together, these agents provide an auditable and reliable workflow for end-to-end housing consultation. We evaluate HabitatAgent on 100 real user consultation scenarios (300 multi-turn question--answer pairs) under an end-to-end correctness protocol. A strong single-stage baseline (Dense+Rerank) achieves 75% accuracy, while HabitatAgent reaches 95%.
- Abstract(参考訳): 住宅選択は、高くてほとんど不可逆な決定問題である。
住宅選択のための意思決定支援インターフェースとして住宅相談について検討する。
既存の住宅プラットフォームと多くのLCMベースのアシスタントは、このプロセスをランキングやレコメンデーションに還元することが多く、不透明な推論、不安定なマルチ制約処理、事実性の保証が制限される。
エンド・ツー・エンド・エンド・ハウジングのためのLLMを利用した初のマルチエージェントアーキテクチャであるHabitatAgentを紹介する。
HabitatAgentには、メモリ、検索、生成、検証の4つの特別なエージェントの役割がある。
メモリエージェントは、制約抽出、メモリ融合、検証ゲート更新のための内部ステージを通じて多層ユーザメモリを維持し、検索エージェントはハイブリッドベクトルグラフ検索(GraphRAG)を行い、生成エージェントはエビデンス参照のレコメンデーションと説明を生成し、バリデーションエージェントは多層検証と対象の修復を行う。
これらのエージェントは、エンド・ツー・エンドの住宅コンサルティングのための監査可能で信頼性の高いワークフローを提供する。
エンド・ツー・エンドの正当性プロトコルを用いて、HabitatAgentを100個の実ユーザコンサルテーションシナリオ(300個のマルチターン質問-回答ペア)で評価する。
強いシングルステージベースライン(Dense+Rerank)は75%の精度を達成する一方、HabitatAgentは95%に達する。
関連論文リスト
- AgentSelect: Benchmark for Narrative Query-to-Agent Recommendation [39.61543921719145]
AgentSelectは、エージェントの選択をナラティブクエリからエージェントへのレコメンデーションとして再設計するベンチマークである。
異種評価アーティファクトを、統一された正のみの相互作用データに変換する。
AgentSelectは、エージェントレコメンデーションのための最初の統一データと評価インフラストラクチャを提供する。
論文 参考訳(メタデータ) (2026-03-04T06:17:51Z) - AgentArk: Distilling Multi-Agent Intelligence into a Single LLM Agent [57.10083973844841]
AgentArkは、マルチエージェントダイナミクスを単一のモデルの重みに蒸留する新しいフレームワークである。
各種モデル,タスク,スケーリング,シナリオの3つの階層的蒸留戦略について検討する。
シミュレーションからトレーニングへ計算の負担をシフトさせることで、蒸留されたモデルは、複数のエージェントの強い推論と自己補正性能を示しながら、一つのエージェントの効率を保ちます。
論文 参考訳(メタデータ) (2026-02-03T19:18:28Z) - DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - AgentPRM: Process Reward Models for LLM Agents via Step-Wise Promise and Progress [71.02263260394261]
大規模言語モデル(LLM)は、マルチターン意思決定タスクにおいて依然として課題に直面している。
プロセス報酬モデル(PRM)を構築し、各意思決定を評価し、エージェントの意思決定プロセスを導く。
AgentPRMは、シーケンシャルな決定と最終的な目標への貢献の間の相互依存の両方をキャプチャする。
論文 参考訳(メタデータ) (2025-11-11T14:57:54Z) - AgentAsk: Multi-Agent Systems Need to Ask [26.13279490836716]
大規模言語モデル(LLM)上に構築されたマルチエージェントシステムは、協調的な分業による問題解決能力の向上を約束する。
我々はAgentAskを提案する。AgentAskは軽量でプラグ・アンド・プレイの明確化モジュールで、すべてのエージェント間メッセージを潜在的な障害点として扱い、エラーの伝播を抑えるのに必要最小限の質問を挿入する。
AgentAskは、公開マルチエージェント実装の精度と堅牢性を継続的に改善し、オーバーヘッドを最小限に抑え、レイテンシと余分なコストを5%以下に抑える。
論文 参考訳(メタデータ) (2025-10-08T22:36:05Z) - MALT: Improving Reasoning with Multi-Agent LLM Training [67.76186488361685]
MALT(Multi-Agent LLM Training)は、推論プロセスを生成、検証、改善ステップに分割する、新しいポストトレーニング戦略である。
MATH、GSM8K、CSQAでは、MALTは、それぞれ15.66%、7.42%、9.40%の相対的な改善で同じベースラインLLMを上回っている。
論文 参考訳(メタデータ) (2024-12-02T19:30:36Z) - Multi-LLM QA with Embodied Exploration [55.581423861790945]
未知環境における質問応答におけるマルチエンボディードLEMエクスプローラ(MELE)の利用について検討する。
複数のLSMベースのエージェントが独立して家庭用環境に関する質問を探索し、回答する。
各問合せに対して1つの最終回答を生成するために,異なるアグリゲーション手法を解析する。
論文 参考訳(メタデータ) (2024-06-16T12:46:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。