Fugu-MT 論文翻訳(概要): Explicit Planning Helps Language Models in Logical Reasoning

論文の概要: Explicit Planning Helps Language Models in Logical Reasoning

arxiv url: http://arxiv.org/abs/2303.15714v1
Date: Tue, 28 Mar 2023 03:55:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-29 16:30:38.858649
Title: Explicit Planning Helps Language Models in Logical Reasoning
Title（参考訳）: 論理推論における言語モデルを支援する明示的計画法
Authors: Hongyu Zhao, Kangrui Wang, Mo Yu, Hongyuan Mei
Abstract要約: 言語モデルを用いて多段階論理推論を行う新しいシステムを提案する。本システムでは,明示的な計画手法を推論手順に組み込むことで,各ステップでより深い推論決定を行うことができる。
参考スコア（独自算出の注目度）: 27.254178310589086
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Language models have been shown to perform remarkably well on a wide range of natural language processing tasks. In this paper, we propose a novel system that uses language models to perform multi-step logical reasoning. Our system incorporates explicit planning into its inference procedure, thus able to make more informed reasoning decisions at each step by looking ahead into their future effects. In our experiments, our full system significantly outperforms other competing systems. On a multiple-choice question answering task, our system performs competitively compared to GPT-3-davinci despite having only around 1.5B parameters. We conduct several ablation studies to demonstrate that explicit planning plays a crucial role in the system's performance.
Abstract（参考訳）: 言語モデルは、幅広い自然言語処理タスクで驚くほどよく機能することが示されている。本稿では,多段階論理推論を行うために言語モデルを用いた新しいシステムを提案する。本システムでは,明示的な計画手法を推論手順に組み込むことで,各ステップにおける推論決定をより情報的に行うことができる。私たちの実験では、システム全体が他の競合システムを大幅に上回っています。複数選択質問応答タスクでは,約1.5Bのパラメータしか持たないにもかかわらず,GPT-3-davinciと競合する。我々は,明示的な計画がシステムの性能に重要な役割を担っていることを示すため,いくつかのアブレーション研究を行う。

関連論文リスト

An Empirical Study on the Effects of System Prompts in Instruction-Tuned Models for Code Generation [4.76360912129794]
システムプロンプトがコードアシスタントに与える影響を系統的に評価する。システムプロンプト制約の特異性の増加は単調に正しさを向上しないことがわかった。より大規模なコード特化モデルでは、ゼロショット生成に対するパフォーマンスの低下がほとんどない。
論文参考訳（メタデータ） (2026-02-16T22:11:21Z)
World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning [60.100794160682646]
そこで本稿では,嗜好学習による状態予測と行動選択を協調的に最適化する新たな学習フレームワークを提案する。人間のアノテーションを使わずに軌道や段階的な選好データを自動的に収集するために,試行錯誤による広範囲な探索のための木探索機構を導入する。提案手法は,Qwen2-VL (7B), LLaVA-1.6 (7B), LLaMA-3.2 (11B) に適用した場合, 既存の手法と GPT-4o を著しく上回っている。
論文参考訳（メタデータ） (2025-03-13T15:49:56Z)
Heuristic-enhanced Candidates Selection strategy for GPTs tackle Few-Shot Aspect-Based Sentiment Analysis [1.5020330976600738]
本論文は、ヒューリスティック・エンハンスド・候補選択戦略を設計し、それに基づくオール・イン・ワン(AiO)モデルを提案する。このモデルは2段階で動作し、PLMの精度と一般化の能力を同時に調節する。実験の結果,提案手法は複数のサブタスクに適応し,GPTを直接利用する手法よりも優れていた。
論文参考訳（メタデータ） (2024-04-09T07:02:14Z)
PARADISE: Evaluating Implicit Planning Skills of Language Models with Procedural Warnings and Tips Dataset [0.0]
PARADISE は,wikiHow をベースとした実践的な手続きテキスト上で,Q&A 形式を用いた帰納的推論タスクである。計画の暗黙的な知識を与えられた目標からのみ推論するモデルの能力をテストすることを目的として、中間的なステップを除く、目標に直接関連した警告およびヒント推論タスクを含む。我々の実験は、微調整言語モデルとゼロショットプロンプトを利用して、ほとんどのシナリオにおいて、大規模言語モデルに対するタスク固有小モデルの有効性を明らかにした。
論文参考訳（メタデータ） (2024-03-05T18:01:59Z)
Guiding Language Model Reasoning with Planning Tokens [122.43639723387516]
大規模言語モデル(LLM)は、最近、複雑な推論タスクを実行する能力に対して、かなりの関心を集めている。より構造的なチェーン・オブ・シークレット・ステップの創出を促す階層的な生成手法を提案する。提案手法では、トレーニング可能なパラメータ(0.001%)の無視可能な増加が必要であり、完全な微調整か、よりパラメータ効率の良いスキームで適用することができる。
論文参考訳（メタデータ） (2023-10-09T13:29:37Z)
On the Planning, Search, and Memorization Capabilities of Large Language Models [0.0]
タスク計画における最先端の大規模言語モデル(GPT-4)の可能性について検討する。大規模言語モデルが計画問題の解決に優れている領域を特定し,適用性を制限する制約を明らかにする。
論文参考訳（メタデータ） (2023-09-05T00:19:31Z)
PlaSma: Making Small Language Models Better Procedural Knowledge Models for (Counterfactual) Planning [77.03847056008598]
PlaSmaは、手続き的な知識と(制約のある)言語計画能力を持つ小さな言語モデルを実現するための、新しい2段階のアプローチである。我々は,小言語モデルにおけるコモンセンス知識を高めるための記号的手続き的知識蒸留法と,より構造化された正確な推論を容易にする推論時アルゴリズムを開発する。
論文参考訳（メタデータ） (2023-05-31T00:55:40Z)
Large Language Models in the Workplace: A Case Study on Prompt Engineering for Job Type Classification [58.720142291102135]
本研究では,実環境における職種分類の課題について検討する。目標は、英語の求職が卒業生やエントリーレベルの地位に適切かどうかを判断することである。
論文参考訳（メタデータ） (2023-03-13T14:09:53Z)
Reframing Instructional Prompts to GPTk's Language [72.69833640335519]
本稿では,モデル設計者が言語モデルに対して効果的なプロンプトを作成するためのリフレーミング手法を提案する。その結果、リフレーミングはサンプルの複雑さを減らしながら、数ショットの学習性能を14%向上させることがわかった。 GPT3では、大規模なデータセットでモデルやプロンプトをチューニングすることは不可能である。
論文参考訳（メタデータ） (2021-09-16T09:44:43Z)
CINS: Comprehensive Instruction for Few-shot Learning in Task-oriented Dialog Systems [56.302581679816775]
本稿では,タスク固有の命令でPLMを利用する包括的インストラクション(CINS)を提案する。命令のスキーマ(定義、制約、プロンプト)と、ToDの3つの重要な下流タスクに対するカスタマイズされた実現を設計する。これらのToDタスクに対して,小さな検証データを用いた現実的な数ショット学習シナリオで実験を行った。
論文参考訳（メタデータ） (2021-09-10T03:23:06Z)
Making Pre-trained Language Models Better Few-shot Learners [11.90626040104822]
最近のGPT-3モデルは、自然言語プロンプトといくつかのタスクデモンストレーションを入力コンテキストとして活用することで、驚くべき数ショットパフォーマンスを実現します。これらの知見に触発されて,より実用的なシナリオで,微調整が計算効率のよい小型言語モデルを用いて,小数点学習の研究を行った。 LM-BFF - 少数の注釈付き例で、言語モデルの微調整のためのシンプルで補完的な技術のスイート - 言語モデルのより良い少数ショット微調整を提示します。
論文参考訳（メタデータ） (2020-12-31T17:21:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。