論文の概要: Web-CogReasoner: Towards Knowledge-Induced Cognitive Reasoning for Web Agents
- arxiv url: http://arxiv.org/abs/2508.01858v1
- Date: Sun, 03 Aug 2025 17:17:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.091652
- Title: Web-CogReasoner: Towards Knowledge-Induced Cognitive Reasoning for Web Agents
- Title(参考訳): Web-CogReasoner: Webエージェントのための知識による認知推論を目指して
- Authors: Yuhan Guo, Cong Guo, Aiwen Sun, Hongliang He, Xinyu Yang, Yue Lu, Yingji Zhang, Xuntao Guo, Dong Zhang, Jianzhuang Liu, Jiang Duan, Yijia Xiao, Liangjian Wen, Hai-Ming Xu, Yong Dai,
- Abstract要約: 我々は,Webエージェントの能力を,知識コンテンツ学習と認知プロセスの2つの重要な段階に分解する。
知識獲得を容易にするため,14の現実世界のウェブサイトから収集した構造化リソースであるWeb-CogDatasetを構築した。
この基盤の上に構築し、新しい知識駆動型チェーン・オブ・ソート(CoT)推論フレームワークを通じてこれらのプロセスを運用する。
- 参考スコア(独自算出の注目度): 49.88380945341337
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal large-scale models have significantly advanced the development of web agents, enabling perception and interaction with digital environments akin to human cognition. In this paper, we argue that web agents must first acquire sufficient knowledge to effectively engage in cognitive reasoning. Therefore, we decompose a web agent's capabilities into two essential stages: knowledge content learning and cognitive processes. To formalize this, we propose Web-CogKnowledge Framework, categorizing knowledge as Factual, Conceptual, and Procedural. In this framework, knowledge content learning corresponds to the agent's processes of Memorizing and Understanding, which rely on the first two knowledge types, representing the "what" of learning. Conversely, cognitive processes correspond to Exploring, grounded in Procedural knowledge, defining the "how" of reasoning and action. To facilitate knowledge acquisition, we construct the Web-CogDataset, a structured resource curated from 14 real-world websites, designed to systematically instill core knowledge necessary for web agent. This dataset serves as the agent's conceptual grounding-the "nouns" upon which comprehension is built-as well as the basis for learning how to reason and act. Building on this foundation, we operationalize these processes through a novel knowledge-driven Chain-of-Thought (CoT) reasoning framework, developing and training our proposed agent, the Web-CogReasoner. Extensive experimentation reveals its significant superiority over existing models, especially in generalizing to unseen tasks where structured knowledge is decisive. To enable rigorous evaluation, we introduce the Web-CogBench, a comprehensive evaluation suite designed to assess and compare agent performance across the delineated knowledge domains and cognitive capabilities. Our code and data is open sourced at https://github.com/Gnonymous/Web-CogReasoner
- Abstract(参考訳): マルチモーダルな大規模モデルはWebエージェントの開発を著しく進歩させ、人間の認知に似たデジタル環境との認識と相互作用を可能にしている。
本稿では,Webエージェントが認知的推論を効果的に行うには,まず十分な知識を習得する必要があると論じる。
そこで我々は,Webエージェントの能力を,知識コンテンツ学習と認知プロセスの2つの重要な段階に分解する。
これを形式化するために,Web-CogKnowledge Frameworkを提案し,知識をFactual,Conceptual,Proceduralに分類する。
この枠組みでは、知識コンテンツ学習は、学習の「何」を表す最初の2つの知識タイプに依存する、エージェントの記憶と理解のプロセスに対応する。
逆に認知過程は、手続き的知識に基づく探索と対応し、推論と行動の「方法」を定義する。
知識獲得を容易にするために,Webエージェントに必要なコア知識を体系的に注入するように設計された,14の現実世界のWebサイトからキュレートされた構造化リソースであるWeb-CogDatasetを構築した。
このデータセットは、エージェントの概念的基盤として機能し、理解が構築される"名詞"と、推論と行動の方法を学ぶための基盤となる。
この基盤を基盤として、我々はこれらのプロセスを新しい知識駆動型チェーン・オブ・ソート(CoT)推論フレームワークを通じて運用し、提案するエージェントであるWeb-CogReasonerを開発し、訓練する。
大規模な実験は、既存のモデルよりも顕著な優位性を示し、特に構造化知識が決定的な未確認タスクに一般化する。
厳密な評価を可能にするために,Web-CogBenchを紹介した。これは,エージェントの性能を,記述された知識領域と認知能力で評価・比較するための総合的な評価スイートである。
私たちのコードとデータはhttps://github.com/Gnonymous/Web-CogReasonerでオープンソース化されています。
関連論文リスト
- Cognitive Duality for Adaptive Web Agents [3.0069922338220825]
本稿では,システム1とシステム2の認知過程を高速に分解する原理を提案する。
高速直感的な処理とタスクの複雑さに基づいた意図的な推論を適応的に切り替えるモジュール型エージェントアーキテクチャであるCogniWebに,このフレームワークを実装した。
論文 参考訳(メタデータ) (2025-08-07T07:05:22Z) - KnowCoder-V2: Deep Knowledge Analysis [64.63893361811968]
我々は、深い知識分析能力を持つ深層研究を支援するtextbfKnowledgeable textbfDeep textbfResearch (textbfKDR) フレームワークを提案する。
大規模なドメイン関連データをオフラインで体系的な知識にプリプロセスするために、独立した知識組織フェーズを導入する。
そして、オンラインの方法で複雑な知識計算を行うための、新たな推論ステップによって、ディープリサーチを拡張します。
論文 参考訳(メタデータ) (2025-06-07T18:01:25Z) - Enhanced Question-Answering for Skill-based learning using Knowledge-based AI and Generative AI [2.6699230340282796]
我々は、テレロジカル、因果、構成原理を具現化した説明を生成するインテリジェントエージェントであるIvyを紹介する。
これにより、学習者はオンライン環境において効果的な問題解決に不可欠なスキルを包括的に理解することが可能になる。
論文 参考訳(メタデータ) (2025-04-10T05:25:52Z) - Beyond Factuality: A Comprehensive Evaluation of Large Language Models
as Knowledge Generators [78.63553017938911]
大規模言語モデル(LLM)は、下流の知識集約タスクのための情報検索技術より優れている。
しかし、コミュニティの懸念は、この無検閲の知識を使用することの事実と潜在的意味について多岐にわたる。
本研究では,6つの重要な視点から生成した知識を評価するために設計されたCONNERを紹介する。
論文 参考訳(メタデータ) (2023-10-11T08:22:37Z) - Worth of knowledge in deep learning [3.132595571344153]
我々は、知識の価値を評価するために、解釈可能な機械学習にインスパイアされたフレームワークを提案する。
我々の研究結果は、依存、相乗効果、置換効果を含む、データと知識の複雑な関係を解明する。
我々のモデルに依存しないフレームワークは、様々な共通ネットワークアーキテクチャに適用でき、ディープラーニングモデルにおける事前知識の役割を包括的に理解することができる。
論文 参考訳(メタデータ) (2023-07-03T02:25:19Z) - Learning by Applying: A General Framework for Mathematical Reasoning via
Enhancing Explicit Knowledge Learning [47.96987739801807]
本稿では,既存のモデル(バックボーン)を明示的な知識学習によって原則的に拡張する枠組みを提案する。
LeApでは,新しい問題知識表現パラダイムで知識学習を行う。
LeApはすべてのバックボーンのパフォーマンスを改善し、正確な知識を習得し、より解釈可能な推論プロセスを実現する。
論文 参考訳(メタデータ) (2023-02-11T15:15:41Z) - Anti-Retroactive Interference for Lifelong Learning [65.50683752919089]
我々は脳のメタラーニングと連想機構に基づく生涯学習のパラダイムを設計する。
知識の抽出と知識の記憶という2つの側面から問題に取り組む。
提案した学習パラダイムが,異なるタスクのモデルを同じ最適に収束させることができることを理論的に分析した。
論文 参考訳(メタデータ) (2022-08-27T09:27:36Z) - A Data-Driven Study of Commonsense Knowledge using the ConceptNet
Knowledge Base [8.591839265985412]
汎用人工知能(AI)の実現における重要なフロンティアとして,コモンセンス知識と推論の獲得が認められている。
本稿では,コンセプションネットの知識基盤を実証的かつ構造的に分析することにより,コモンセンス知識のより深い理解を可能にする体系的な研究を提案し,実施する。
最先端の教師なしグラフ表現学習(「埋め込み」)とクラスタリング技術を用いて、慎重に設計された3つの研究課題に関する詳細な実験結果から、ConceptNet関係の深いサブ構造を明らかにする。
論文 参考訳(メタデータ) (2020-11-28T08:08:25Z) - Online Structured Meta-learning [137.48138166279313]
現在のオンラインメタ学習アルゴリズムは、グローバルに共有されたメタラーナーを学ぶために限られている。
この制限を克服するオンライン構造化メタラーニング(OSML)フレームワークを提案する。
3つのデータセットの実験は、提案フレームワークの有効性と解釈可能性を示している。
論文 参考訳(メタデータ) (2020-10-22T09:10:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。