論文の概要: Toward Zero-Shot Instruction Following
- arxiv url: http://arxiv.org/abs/2308.03795v2
- Date: Thu, 25 Jan 2024 21:08:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-29 18:12:37.655137
- Title: Toward Zero-Shot Instruction Following
- Title(参考訳): ゼロショット教育へ向けて
- Authors: Renze Lou, Wenpeng Yin
- Abstract要約: 本研究は,ゼロショット型タスク定義の存在を前提として,ゼロショット型タスク定義の存在を前提として,ゼロショット型タスク一般化のためのより現実的な設定を提案する。
定義からタスクの監督をよりよく学習するために、第1に、定義における臨界文を自動的に見つけ出すための戦略と、第2に、それらの臨界部分が定義に強調されている場合に、モデルに高い確率で金の出力を生成するよう強制するランク付け目的の2つを提案する。
- 参考スコア(独自算出の注目度): 16.028793194888593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work proposes a challenging yet more realistic setting for zero-shot
cross-task generalization: zero-shot instruction following, presuming the
existence of a paragraph-style task definition while no demonstrations exist.
To better learn the task supervision from the definition, we propose two
strategies: first, to automatically find out the critical sentences in the
definition; second, a ranking objective to force the model to generate the gold
outputs with higher probabilities when those critical parts are highlighted in
the definition. The joint efforts of the two strategies yield state-of-the-art
performance on the Super-NaturalInstructions. Our code is available on GitHub.
- Abstract(参考訳): 本研究は,ゼロショット型タスク定義の存在を前提として,ゼロショット型タスク定義の存在を前提として,ゼロショット型タスク一般化のためのより現実的な設定を提案する。
定義からタスク監督をより良く学ぶために、我々は2つの戦略を提案する: まず、定義のクリティカルな文を自動的に見つけ出す; 第二に、これらの重要な部分が強調されたときに、モデルにより高い確率で金の出力を生成するように強制するランキングの目的。
2つの戦略の共同作業は、超自然教育における最先端のパフォーマンスをもたらす。
コードはgithubから入手できます。
関連論文リスト
- Zero-Shot Generalization during Instruction Tuning: Insights from Similarity and Granularity [84.12126298229866]
命令チューニング中のゼロショット一般化は非常に早い時期に行われることを示す。
また、「タスク」の制約を伴わずに、命令チューニング中に非常によく似た、きめ細かなトレーニングデータに遭遇することで、より一般化できることを示す。
インストラクションチューニング中のゼロショット一般化は、インスタンスレベルでのトレーニングとテストデータ間の類似性に基づく一般化の形式であることを示す。
論文 参考訳(メタデータ) (2024-06-17T16:40:21Z) - Rethinking Object Saliency Ranking: A Novel Whole-flow Processing
Paradigm [22.038715439842044]
本稿では、その「重要順」によって、有能な物体のランク付けに完全にフォーカスすることを目的とした、有能なランキングのための新しいパラダイムを提案する。
提案手法は、広く使われているSALICONの既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-12-06T01:51:03Z) - STEPS: A Benchmark for Order Reasoning in Sequential Tasks [16.52934509949172]
データ構築とタスクの定式化について述べ、重要な大規模言語モデル(LLM)のほとんどをベンチマークする。
1)シーケンシャルタスクにおける行動順序の常識的推論は,ゼロショットプロンプトや少数ショットインコンテキスト学習によって解決することが困難である。
論文 参考訳(メタデータ) (2023-06-07T13:58:55Z) - Did You Read the Instructions? Rethinking the Effectiveness of Task
Definitions in Instruction Learning [74.70157466822612]
教科学習におけるタスク定義の役割を体系的に研究する。
タスク出力を記述する内容を削除すると,モデルの性能が大幅に低下することがわかった。
本稿では,モデルのタスク命令の活用を支援するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2023-06-01T21:11:24Z) - Learning Rational Subgoals from Demonstrations and Instructions [71.86713748450363]
本稿では,新しい目標を達成するための効率的な長期計画を支援する有用なサブゴール学習フレームワークを提案する。
我々のフレームワークの中核は合理的なサブゴール(RSG)の集合であり、基本的には環境状態上の二項分類器である。
目標記述が与えられた場合、学習したサブゴールと派生した依存関係は、A*やRTといった既成の計画アルゴリズムを促進する。
論文 参考訳(メタデータ) (2023-03-09T18:39:22Z) - Unsupervised Task Graph Generation from Instructional Video Transcripts [53.54435048879365]
本研究では,実世界の活動を行う指導ビデオのテキスト書き起こしを提供する環境について考察する。
目標は、これらの重要なステップ間の依存関係関係と同様に、タスクに関連する重要なステップを特定することです。
本稿では,命令調整言語モデルの推論能力とクラスタリングとランキングコンポーネントを組み合わせたタスクグラフ生成手法を提案する。
論文 参考訳(メタデータ) (2023-02-17T22:50:08Z) - Task Phasing: Automated Curriculum Learning from Demonstrations [46.1680279122598]
報酬ドメインを疎結合にするために強化学習を適用することは、ガイド信号が不十分なため、非常に難しい。
本稿では,実演を用いてカリキュラムのシーケンスを自動的に生成する手法を提案する。
3つのスパース報酬領域に対する実験結果から,我々のタスク・ファスリング・アプローチは,パフォーマンスに関して最先端のアプローチよりも優れていることが示された。
論文 参考訳(メタデータ) (2022-10-20T03:59:11Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Skill Induction and Planning with Latent Language [94.55783888325165]
我々は、ゴールがハイレベルなサブタスク記述のシーケンスを生成するアクションシーケンスの生成モデルを定式化する。
本稿では、このモデルを、主に注釈のないデモを用いて、名前付きハイレベルなサブタスクのシーケンスに解析する方法について述べる。
訓練されたモデルでは、自然言語コマンドの空間はスキルのライブラリを索引付けする;エージェントはこれらのスキルを使って、新しい目標に適した高いレベルの命令シーケンスを生成する。
論文 参考訳(メタデータ) (2021-10-04T15:36:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。