論文の概要: WebExpert: domain-aware web agents with critic-guided expert experience for high-precision search
- arxiv url: http://arxiv.org/abs/2604.06177v1
- Date: Tue, 03 Feb 2026 08:13:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-19 19:09:11.372187
- Title: WebExpert: domain-aware web agents with critic-guided expert experience for high-precision search
- Title(参考訳): WebExpert: 高精度検索のための専門家経験を批判するドメイン対応Webエージェント
- Authors: Yuelin Hu, Zhengxue Cheng, Ronghua Wu, Qunshan Gu, Hongwei Hu, Wei Liu, Qiao Liang, Li Song,
- Abstract要約: WebExpertは、ファイナンス、バイオメディシン、医薬品のためのドメイン対応のWebエージェントである。
WebExpertは最強のブラウジングベースラインに対して、Answer Exact Match (EM)を1.5-3.6pp改善した。
- 参考スコア(独自算出の注目度): 16.504236124750737
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Specialized web tasks in finance, biomedicine, and pharmaceuticals remain challenging due to missing domain priors: queries drift, evidence is noisy, and reasoning is brittle. We present WebExpert, a domain-aware web agent that we implement end-to-end, featuring : (i) sentence-level experience retrieval with topic merging and rule distillation, (ii) schemalight facet induction that bootstraps time,region,policy,industry facets from weak supervision instead of static hand-written lexicons, and (iii) preference-optimized planning that jointly improves query planning and retrieval via pairwise preference learning alongside a coverage-aware objective. At inference, a lightweight experience gate biases decoding toward active facets with fallback under low-retrieval confidence. On GAIA, GPQA, HLE, and WebWalkerQA, WebExpert improves Answer Exact Match (EM) by 1.5-3.6 pp over the strongest browsing baseline and reduces page hops. Analysis shows consistent gains and ablations on retrieval, topic merging, facet induction, and preference-aware training.
- Abstract(参考訳): 金融、バイオメディシン、医薬品の専門的なウェブタスクは、クエリードリフト、エビデンス、および推論が不安定なドメインプライオリティの欠如により、依然として困難なままである。
We present WebExpert, a domain-aware web agent that we implement end-to-end, featured :
一 話題の融合及び規則蒸留による文レベルの経験検索
二 静的な手書き辞書の代わりに、時間、地域、政治、産業の面を監督の弱い面からブートストラップするスキーマライトファセット誘導
三 調査対象を意識した一対の選好学習による問合せ計画と検索を共同で改善する選好最適化計画。
推測では、ライトウェイトな経験ゲートは、低検索信頼の下でフォールバックしたアクティブフェースに向けてデコードする。
GAIA、GPQA、HLE、WebWalkerQAでは、WebExpertは最強のブラウジングベースラインで1.5-3.6ppでAnswer Exact Match(EM)を改善し、ページホップを減らす。
分析は、検索、トピックマージ、ファセット誘導、嗜好認識トレーニングにおいて、一貫した利得と改善を示す。
関連論文リスト
- WebArbiter: A Principle-Guided Reasoning Process Reward Model for Web Agents [31.554790282560443]
本稿では、報酬モデリングをテキスト生成として定式化するWebPRMであるWebArbiterを紹介する。
WebArbiterは、好みの判断で結論付ける構造化された正当化を生成し、タスク完了に最も寄与するアクションを識別する。
論文 参考訳(メタデータ) (2026-01-29T15:39:50Z) - PRISMA: Reinforcement Learning Guided Two-Stage Policy Optimization in Multi-Agent Architecture for Open-Domain Multi-Hop Question Answering [26.994531058178982]
大規模コーパスに対する現実世界のオープンドメイン問題への回答は、レトリーバル・拡張ジェネレーション(RAG)システムにおいて重要な課題である。
近年の研究では、検索強化推論プロセスのエンドツーエンド最適化に強化学習(RL)を採用している。
PRISMAはPlan-Retrieve-Inspect-Memoizeアーキテクチャを特徴とする分離誘導型フレームワークである。
論文 参考訳(メタデータ) (2026-01-09T01:38:38Z) - Towards Context-aware Reasoning-enhanced Generative Searching in E-commerce [61.03081096959132]
そこで本稿では,複雑な状況下でのテキストバウンダリングを改善するための,文脈対応推論強化型生成検索フレームワークを提案する。
提案手法は,強力なベースラインに比べて優れた性能を示し,検索に基づく推薦の有効性を検証した。
論文 参考訳(メタデータ) (2025-10-19T16:46:11Z) - WebCoT: Enhancing Web Agent Reasoning by Reconstructing Chain-of-Thought in Reflection, Branching, and Rollback [78.55946306325914]
有効なWebエージェントに必要な重要な推論スキルを同定する。
我々はエージェントの推論アルゴリズムを連鎖論理に再構成する。
このアプローチは、複数のベンチマークで大幅に改善される。
論文 参考訳(メタデータ) (2025-05-26T14:03:37Z) - DM-Adapter: Domain-Aware Mixture-of-Adapters for Text-Based Person Retrieval [47.018491164452094]
テキストベースの人物検索(TPR)は、きめ細かな課題として注目されている。
TPRの以前のフルモデル微調整は計算コストが高く、過度に適合する傾向がある。
新しいDomain-Aware Mixture-of-Adapter (DM-Adapter)は最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-03-06T06:41:38Z) - PromptAgent: Strategic Planning with Language Models Enables
Expert-level Prompt Optimization [60.00631098364391]
PromptAgentは、エキスパートレベルのプロンプトを、専門家による手工芸品と同等の品質で作成する最適化手法である。
PromptAgentは人間のような試行錯誤の探索にインスパイアされ、専門家レベルの正確な洞察と詳細な指示を誘導する。
PromptAgentを3つの実践領域にまたがる12のタスクに適用する。
論文 参考訳(メタデータ) (2023-10-25T07:47:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。