Fugu-MT 論文翻訳(概要): IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction

論文の概要: IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction

arxiv url: http://arxiv.org/abs/2408.10455v5
Date: Thu, 19 Dec 2024 05:45:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 18:44:15.759659
Title: IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction
Title（参考訳）: IDEA: 大規模言語モデルエージェントの誘導, 推論, アブダクションによるルール学習能力の向上
Authors: Kaiyu He, Mian Zhang, Shuo Yan, Peilin Wu, Zhiyu Zoey Chen,
Abstract要約: 対話型環境下での大規模言語モデルのルール学習能力を評価するためにRULEARNを導入する。誘導, 誘引, アブダクションのプロセスを統合する新しい推論フレームワークであるIDEAを提案する。 5つの代表的なLCMを含むIDEAフレームワークの評価は,ベースラインよりも大幅に改善されている。
参考スコア（独自算出の注目度）: 3.961279440272764
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While large language models (LLMs) have been thoroughly evaluated for deductive and inductive reasoning, their proficiency in holistic rule learning in interactive environments remains less explored. We introduce RULEARN, a novel benchmark to assess the rule-learning abilities of LLM agents in interactive settings. In RULEARN, agents strategically interact with simulated environments to gather observations, discern patterns, and solve complex problems. To enhance the rule-learning capabilities for LLM agents, we propose IDEA, a novel reasoning framework that integrates the process of Induction, Deduction, and Abduction. The IDEA agent generates initial hypotheses from limited observations through abduction, devises plans to validate these hypotheses or leverages them to solve problems via deduction, and refines previous hypotheses through induction, dynamically establishing and applying rules that mimic human rule-learning behaviors. Our evaluation of the IDEA framework, which involves five representative LLMs, demonstrates significant improvements over the baseline. Furthermore, our study with human participants reveals notable discrepancies in rule-learning behaviors between humans and LLMs. We believe our benchmark will serve as a valuable and challenging resource, and IDEA will provide crucial insights for the development of LLM agents capable of human-like rule learning in real-world scenarios. Our code and data is publicly available.
Abstract（参考訳）: 大規模言語モデル (LLM) は帰納的推論や帰納的推論のために徹底的に評価されているが, 対話型環境における全体論的ルール学習の習熟度は未だ明らかになっていない。対話型環境下でのLLMエージェントのルール学習能力を評価するための新しいベンチマークであるRULEARNを紹介する。 RULEARNでは、エージェントはシミュレートされた環境と戦略的に相互作用し、観察、パターンの識別、複雑な問題の解決を行う。 LLMエージェントのルール学習能力を高めるために,誘導,誘引,アブダクションのプロセスを統合する新しい推論フレームワークであるIDEAを提案する。 IDEAエージェントは、誘拐によって限られた観測から初期仮説を生成し、これらの仮説を検証または活用し、推論を介して問題を解決し、誘導によって以前の仮説を洗練し、人間のルール学習行動を模倣するルールを動的に確立し、適用する計画を立てる。 5つの代表的なLCMを含むIDEAフレームワークの評価は,ベースラインよりも大幅に改善されている。さらに、本研究は、人間とLLM間のルール学習行動に顕著な相違があることを明らかにした。 IDEAは実世界のシナリオで人間のようなルール学習が可能なLLMエージェントの開発に重要な洞察を提供するでしょう。私たちのコードとデータは公開されています。

関連論文リスト

Inferring Latent Intentions: Attributional Natural Language Inference in LLM Agents [33.140424265055145]
帰属推論は、大きな言語モデルにとって批判的だが未探索の能力である。帰納的意図推論のためのエージェントの能力を評価するために,NLIを社会心理学の原則で拡張するフレームワークであるAttributional NLIを紹介する。この結果は,高度な推論能力を持つエージェントの開発において,ATt-NLIが果たす役割を裏付けるものである。
論文参考訳（メタデータ） (2026-01-13T17:18:38Z)
On LLM-Based Scientific Inductive Reasoning Beyond Equations [51.61971971921903]
LLMに基づく科学的帰納的推論の課題について提案する。我々は, LLMの帰納的推論能力を評価するために, SIRBench-V1 という新しいベンチマークを導入した。
論文参考訳（メタデータ） (2025-09-12T10:11:52Z)
A MIND for Reasoning: Meta-learning for In-context Deduction [3.4383794581359184]
In-context Deduction (MIND) のためのメタラーニングを提案する。以上の結果から,MINDは1.5Bから7Bまでの小さなLMの一般化を著しく改善することが示された。注目すべきは、このタスクにおいてMINDで微調整された小さなモデルは、GPT-4oやo3-miniのような最先端のLLMよりも優れていることである。
論文参考訳（メタデータ） (2025-05-20T13:00:48Z)
MoRE-LLM: Mixture of Rule Experts Guided by a Large Language Model [54.14155564592936]
大規模言語モデル(MoRE-LLM)によるルールエキスパートの混合を提案する。 MoRE-LLMは、トレーニング中の局所的なルールベースのサロゲートの発見と、それらの分類タスクの利用を操縦する。 LLMはルールを修正・コンテキスト化することで、ルールのドメイン知識の整合性を高める役割を担います。
論文参考訳（メタデータ） (2025-03-26T11:09:21Z)
MIRAGE: Evaluating and Explaining Inductive Reasoning Process in Language Models [19.81485079689837]
帰納的および帰納的段階における大規模言語モデルの能力を評価する。モデルが正しい帰納的規則を使わずに常に正しい推論を行う傾向があることが分かる。帰納的推論プロセスでは、モデルは機能空間における現在のテスト例に近い観察された事実に焦点を当てる傾向があります。
論文参考訳（メタデータ） (2024-10-12T14:12:36Z)
Cognitive LLMs: Towards Integrating Cognitive Architectures and Large Language Models for Manufacturing Decision-making [51.737762570776006]
LLM-ACTRは、ヒトに適応し、多目的な意思決定を提供する新しいニューロシンボリックアーキテクチャである。我々のフレームワークは、ACT-Rの内部決定過程の知識を潜在神経表現として抽出し、組み込む。デザイン・フォー・マニュファクチャリング・タスクに関する我々の実験は、タスク性能の向上と基礎的意思決定能力の向上を両立させたものである。
論文参考訳（メタデータ） (2024-08-17T11:49:53Z)
Metacognitive Myopia in Large Language Models [0.0]
大規模言語モデル(LLM)は、文化的に固有のステレオタイプ、クラウドの道徳的判断、あるいは多数派の肯定的な評価を強化する潜在的に有害なバイアスを示す。認知・生態的枠組みとしてメタ認知ミオピアを提案する。我々の理論的枠組みは, メタ認知, 監視, 制御の2つの要素が欠如していることが, メタ認知性ミオピアの5つの症状を引き起こすことを示唆している。
論文参考訳（メタデータ） (2024-08-10T14:43:57Z)
Unveiling the Misuse Potential of Base Large Language Models via In-Context Learning [61.2224355547598]
大規模言語モデル(LLM)のオープンソース化は、アプリケーション開発、イノベーション、科学的進歩を加速させる。我々の調査は、この信念に対する重大な監視を露呈している。我々の研究は、慎重に設計されたデモを配置することにより、ベースLSMが悪意のある命令を効果的に解釈し実行できることを実証する。
論文参考訳（メタデータ） (2024-04-16T13:22:54Z)
Explaining Large Language Models Decisions Using Shapley Values [1.223779595809275]
大規模言語モデル(LLM)は、人間の行動や認知過程をシミュレートするエキサイティングな可能性を開いた。しかし, LLMを人体用スタンドインとして活用する妥当性は, いまだに不明である。本稿では,モデルの出力に対する各プロンプト成分の相対的寄与を定量化するために,シェープリー値に基づく新しい手法を提案する。
論文参考訳（メタデータ） (2024-03-29T22:49:43Z)
Characterizing Truthfulness in Large Language Model Generations with Local Intrinsic Dimension [63.330262740414646]
大規模言語モデル(LLM)から生成されたテキストの真偽を特徴付ける方法と予測法について検討する。モデルアクティベーションの局所固有次元 (LID) を用いて, 内部アクティベーションを調査し, LLMの真偽を定量化する。
論文参考訳（メタデータ） (2024-02-28T04:56:21Z)
LLM-driven Imitation of Subrational Behavior : Illusion or Reality? [3.2365468114603937]
既存の作業は、複雑な推論タスクに対処し、人間のコミュニケーションを模倣する大規模言語モデルの能力を強調している。そこで本研究では,LLMを用いて人工人体を合成し,サブリレーショナル・エージェント・ポリシーを学習する手法を提案する。我々は,4つの単純なシナリオを通して,サブリレータリティをモデル化するフレームワークの能力について実験的に評価した。
論文参考訳（メタデータ） (2024-02-13T19:46:39Z)
Enhancing Ethical Explanations of Large Language Models through Iterative Symbolic Refinement [5.108863224378874]
本稿では,ハイブリッド・ニューロシンボリック・テクニックが倫理的説明の論理的妥当性とアライメントをいかに向上させるかを検討する。本稿では,大規模言語モデルと外部の後方鎖型ソルバを統合した導出型フレームワーク Logic-Explainer を提案する。経験的分析により、Logic-Explainerは、コンテキスト内学習法とChain-of-Thoughtを通じて生成された説明を改善することができることを示した。
論文参考訳（メタデータ） (2024-02-01T16:39:51Z)
Phenomenal Yet Puzzling: Testing Inductive Reasoning Capabilities of Language Models with Hypothesis Refinement [92.61557711360652]
言語モデル(LM)は、しばしば帰納的推論に不足する。我々は,反復的仮説修正を通じて,LMの帰納的推論能力を体系的に研究する。本研究は, LMの誘導的推論過程と人間とのいくつかの相違点を明らかにし, 誘導的推論タスクにおけるLMの使用の可能性と限界に光を当てる。
論文参考訳（メタデータ） (2023-10-12T17:51:10Z)
SALMON: Self-Alignment with Instructable Reward Models [80.83323636730341]
本稿では,基本言語モデルと人間の監督を最小限に整合させる新しいアプローチ,すなわちSALMONを提案する。私たちはDromedary-2という名のAIアシスタントを開発しており、コンテキスト内学習には6つの例と31の人間定義原則しかありません。
論文参考訳（メタデータ） (2023-10-09T17:56:53Z)
Towards LogiGLUE: A Brief Survey and A Benchmark for Analyzing Logical Reasoning Capabilities of Language Models [56.34029644009297]
大規模言語モデル(LLM)は、形式的知識表現(KR)システムの様々な制限を克服する能力を示した。 LLMは誘導的推論において最も優れているが、誘導的推論では最も効果が低い。モデルの性能を評価するため,シングルタスクトレーニング,マルチタスクトレーニング,および「チェーンオブ思考」知識蒸留細調整技術について検討した。
論文参考訳（メタデータ） (2023-10-02T01:00:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。