Fugu-MT 論文翻訳(概要): AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback

論文の概要: AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback

arxiv url: http://arxiv.org/abs/2402.01469v1
Date: Fri, 2 Feb 2024 14:56:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-05 14:54:07.925064
Title: AMOR: A Recipe for Building Adaptable Modular Knowledge Agents Through Process Feedback
Title（参考訳）: AMOR: プロセスフィードバックによる適応型モジュール型知識エージェント構築のためのレシピ
Authors: Jian Guan, Wei Wu, Zujie Wen, Peng Xu, Hongning Wang, Minlie Huang
Abstract要約: オープンソースの大規模言語モデル(LLM)に基づくエージェントフレームワークAMORを提案する。 AMORは有限状態マシン(FSM)上に推論ロジックを構築し、自律的な実行と非絡み合ったモジュールの遷移によって問題を解決する。この推論とフィードバックの枠組みに基づき、2段階の微調整(ウォームアップと適応)によりAMORを開発する。
参考スコア（独自算出の注目度）: 97.23214809357526
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The notable success of large language models (LLMs) has sparked an upsurge in building language agents to complete various complex tasks. We present AMOR, an agent framework based on open-source LLMs, which reasons with external knowledge bases and adapts to specific domains through human supervision to the reasoning process. AMOR builds reasoning logic over a finite state machine (FSM) that solves problems through autonomous executions and transitions over disentangled modules. This allows humans to provide direct feedback to the individual modules, and thus naturally forms process supervision. Based on this reasoning and feedback framework, we develop AMOR through two-stage fine-tuning: warm-up and adaptation. The former fine-tunes the LLM with examples automatically constructed from various public datasets and enables AMOR to generalize across different knowledge environments, while the latter tailors AMOR to specific domains using process feedback. Extensive experiments across multiple domains demonstrate the advantage of AMOR to strong baselines, thanks to its FSM-based reasoning and process feedback mechanism.
Abstract（参考訳）: 大規模言語モデル(LLMs)の顕著な成功は、様々な複雑なタスクを完了させる言語エージェントの構築の急激な増加をもたらした。本稿では,オープンソースllmに基づくエージェントフレームワークamorを提案する。このフレームワークは,外部知識ベースを理由とし,推論プロセスに対する人間の監督を通じて,特定のドメインに適応する。 AMORは有限状態マシン(FSM)上に推論ロジックを構築し、自律的な実行と非絡み合ったモジュールの遷移によって問題を解決する。これにより、個々のモジュールに直接フィードバックを与え、プロセスの監視を自然に形成することができる。この推論とフィードバックの枠組みに基づき、2段階の微調整(ウォームアップと適応)によりAMORを開発する。前者は、様々な公開データセットからサンプルを自動構築し、AMORが様々な知識環境をまたいで一般化できるようにし、後者はプロセスフィードバックを使用して特定のドメインにAMORを調整した。複数のドメインにわたる大規模な実験は、FSMベースの推論とプロセスフィードバック機構のおかげで、AMORの強力なベースラインへの優位性を実証している。

関連論文リスト

BAR: A Backward Reasoning based Agent for Complex Minecraft Tasks [15.48158268901061]
タスクを完了するには、LLM(Big Language Model)ベースのエージェントを計画によって簡単に実行可能なステップに分解する必要がある。既存の研究は主にエージェントの初期状態から次にどのステップを実行するべきかを推測することで計画を実行する。実世界のシナリオに基づいて複雑なタスクをシミュレートする仮想環境であるMinecraftでこの問題を研究することを提案する。
論文参考訳（メタデータ） (2025-05-20T08:35:35Z)
SocialGPT: Prompting LLMs for Social Relation Reasoning via Greedy Segment Optimization [70.11167263638562]
社会的関係推論は、友人、配偶者、同僚などの関係カテゴリを画像から識別することを目的としている。まず、VFM(Vision Foundation Models)の知覚能力と、モジュラーフレームワーク内でのLLM(Large Language Models)の推論能力を組み合わせた、シンプルだが巧妙な名前のフレームワークを提示する。
論文参考訳（メタデータ） (2024-10-28T18:10:26Z)
The Compressor-Retriever Architecture for Language Model OS [20.56093501980724]
オペレーティングシステム(OS)のコアコンポーネントとして言語モデルを用いるという概念について検討する。このようなLM OSを実現する上で重要な課題は、寿命の長いコンテキストを管理し、セッション間のステートフルネスを確保することだ。本稿では,生涯のコンテキスト管理のために設計されたモデル非依存アーキテクチャであるコンプレッサー・レトリバーを紹介する。
論文参考訳（メタデータ） (2024-09-02T23:28:15Z)
Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。 LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文参考訳（メタデータ） (2024-06-09T21:58:32Z)
Enhancing Open-Domain Task-Solving Capability of LLMs via Autonomous Tool Integration from GitHub [79.31134731122462]
オープンドメインのタスク解決能力を評価するためにOpenActベンチマークを導入します。我々は,オープンドメインの進化するクエリに,GitHubから専門ツールを自律的に統合することで対処できる,新しいLLMベースのエージェントシステムであるOpenAgentを紹介する。
論文参考訳（メタデータ） (2023-12-28T15:47:30Z)
Knowledge Plugins: Enhancing Large Language Models for Domain-Specific Recommendations [50.81844184210381]
本稿では,大規模言語モデルをDOmain固有のKnowledgEで拡張し,実践的アプリケーション,すなわちDOKEの性能を向上させるためのパラダイムを提案する。このパラダイムはドメイン知識抽出器に依存し,1)タスクに効果的な知識を準備すること,2)特定のサンプルごとに知識を選択すること,3)LLMで理解可能な方法で知識を表現すること,の3つのステップで動作する。
論文参考訳（メタデータ） (2023-11-16T07:09:38Z)
Adapting Large Language Models for Content Moderation: Pitfalls in Data Engineering and Supervised Fine-tuning [79.53130089003986]
大規模言語モデル(LLM)は、様々なドメインでタスクを処理するための実現可能なソリューションとなっている。本稿では、コンテンツモデレーションのためにプライベートにデプロイ可能なLLMモデルを微調整する方法を紹介する。
論文参考訳（メタデータ） (2023-10-05T09:09:44Z)
External Reasoning: Towards Multi-Large-Language-Models Interchangeable Assistance with Human Feedback [0.0]
本稿では、外部リポジトリからの知識の選択的統合により、LLM(Large Language Models)を拡張できることを提案する。このアプローチの中心は、複数のLLMインターチェンジ支援に基づくTextbf外部推論のためのタイレッドポリシーの確立である。結果は、Crefcomparisonにおける最先端のパフォーマンスを示し、ChatPDF.comを含む既存のソリューションを上回った。
論文参考訳（メタデータ） (2023-07-05T17:05:32Z)
Inner Monologue: Embodied Reasoning through Planning with Language Models [81.07216635735571]
大規模言語モデル(LLM)は自然言語処理以外の領域に適用できる。具体化された環境でのLLMの計画には、何をすべきかだけでなく、どのように、いつ行うべきかを考える必要がある。環境フィードバックを活用することで、LLMはロボット制御シナリオにおいてよりリッチな処理と計画を行うことができる内部モノローグを形成することができる。
論文参考訳（メタデータ） (2022-07-12T15:20:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。