Fugu-MT 論文翻訳(概要): Differentiable Instruction Optimization for Cross-Task Generalization

論文の概要: Differentiable Instruction Optimization for Cross-Task Generalization

arxiv url: http://arxiv.org/abs/2306.10098v1
Date: Fri, 16 Jun 2023 17:49:34 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-22 00:13:43.600872
Title: Differentiable Instruction Optimization for Cross-Task Generalization
Title（参考訳）: クロスタスク一般化のための微分インストラクション最適化
Authors: Masaru Isonuma, Junichiro Mori, Ichiro Sakata
Abstract要約: 学習可能な命令を導入し、二段階最適化を利用して勾配勾配で最適化する。実験の結果,学習した命令は命令の多様性を高め,一般化能力を向上させることがわかった。
参考スコア（独自算出の注目度）: 7.8120734120667
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Instruction tuning has been attracting much attention to achieve generalization ability across a wide variety of tasks. Although various types of instructions have been manually created for instruction tuning, it is still unclear what kind of instruction is optimal to obtain cross-task generalization ability. This work presents instruction optimization, which optimizes training instructions with respect to generalization ability. Rather than manually tuning instructions, we introduce learnable instructions and optimize them with gradient descent by leveraging bilevel optimization. Experimental results show that the learned instruction enhances the diversity of instructions and improves the generalization ability compared to using only manually created instructions.
Abstract（参考訳）: インストラクションチューニングは様々なタスクにまたがる一般化能力を達成するために多くの注目を集めている。様々な命令が手動で作成されているが、クロスタスクの一般化能力を得るのにどのような命令が最適かはいまだ不明である。本研究は、一般化能力に関するトレーニング命令を最適化する命令最適化を提案する。命令を手動でチューニングする代わりに,学習可能な命令を導入し,二段階最適化を用いて勾配降下を最適化する。実験の結果、学習した命令は命令の多様性を高め、手作りの命令のみを使うよりも一般化能力を向上させることがわかった。

関連論文リスト

RAISE: Reinforenced Adaptive Instruction Selection For Large Language Models [48.63476198469349]
本稿では,タスクオブジェクト駆動型命令選択フレームワークRAISEを提案する。 RAISEは命令の微調整プロセス全体を最適化に組み込んでいる。モデルの性能改善に対する命令の期待される影響に基づいて,各ステップで命令を選択する。
論文参考訳（メタデータ） (2025-04-09T21:17:52Z)
Aligning Instruction Tuning with Pre-training [81.4748965653345]
そこで我々は,AITP(Aligning Instruction Tuning with Pre-training)を提案する。 8つのベンチマークで3つの完全にオープンな大規模言語モデル(LLM)上で,AITPによる一貫したパフォーマンス向上を示す。
論文参考訳（メタデータ） (2025-01-16T08:27:40Z)
Instruction Following without Instruction Tuning [87.72635104686275]
命令チューニングに比較して不十分な2種類の適応(チューニング)があるが、それでも命令に従うことができる。我々は、事前訓練されたモデルを用いて、エキスパート製品における指示に従うルールベースの言語モデルを手書きで支援する。
論文参考訳（メタデータ） (2024-09-21T22:36:22Z)
From Symbolic Tasks to Code Generation: Diversification Yields Better Task Performers [1.6958018695660049]
コードに関連するタスクを超えて、より多様な命令セットがコード生成のパフォーマンスを向上させることを示す。我々の観察から,命令調整セットのより多様な意味空間が,命令に従う能力とタスクの実行能力を大幅に向上させることが示唆された。
論文参考訳（メタデータ） (2024-05-30T07:54:07Z)
Instruction Matters: A Simple yet Effective Task Selection for Optimized Instruction Tuning of Specific Tasks [51.15473776489712]
本稿では,命令情報のみを利用してタスクを識別する,シンプルで効果的なタスク選択手法を提案する。提案手法は,タスク間のペア転送可能性の複雑な測定や,対象タスクのためのデータサンプルの作成を必要とする従来の手法に比べて,はるかに効率的である。実験の結果、命令のみに選択されたタスクセットのトレーニングにより、P3、Big-Bench、NIV2、Big-Bench Hardといったベンチマークのパフォーマンスが大幅に改善された。
論文参考訳（メタデータ） (2024-04-25T08:49:47Z)
Chain-of-Instructions: Compositional Instruction Tuning on Large Language Models [15.444719480373001]
チェーン・オブ・インストラクション(CoI)と呼ばれる新しい構成命令の概念を提案する。従来の単一命令タスクの解法とは異なり,提案手法では各サブタスクを段階的に解き,最終的な解答に到達するまで解き明かす。 CoIチューニングは、複数のサブタスクからなる命令と、多言語要約のような目に見えない複合タスクを扱うモデルの能力を改善する。
論文参考訳（メタデータ） (2024-02-18T10:10:40Z)
Instruction Diversity Drives Generalization To Unseen Tasks [1.9059113568275998]
一般化は、タスク毎に非常に少数の例が提供されているにもかかわらず、一度に十分なタスクセットが提供されると現れる。一般化は、タスク毎に非常に少数の例が提供されているにもかかわらず、一度に十分なタスクセットが提供されると現れる。
論文参考訳（メタデータ） (2024-02-16T18:47:21Z)
Instructive Decoding: Instruction-Tuned Large Language Models are Self-Refiner from Noisy Instructions [26.192531184689763]
本稿では,インストラクティブ・デコーディング(Instructive Decoding, ID)を提案する。 IDは、元の命令の操作されたバージョンから生成された予測を利用して、逆方向の予測のためにロジットを調整する。ランダムな単語を介して意味的ノイズを挿入するものから、逸脱した応答を誘発する「オポジット」のような他のものまで、このようなノイズの多い命令のスペクトルにわたって実験を行う。
論文参考訳（メタデータ） (2023-11-01T02:31:35Z)
From Language Modeling to Instruction Following: Understanding the Behavior Shift in LLMs after Instruction Tuning [63.63840740526497]
そこで本研究では,本質的な変化に着目した事前学習モデルの調整方法について検討する。次に、事前訓練されたモデルと命令調整されたモデルから導かれた説明を比較することで、命令チューニングの影響について研究する。この結果から,指導指導の3つの重要な影響が明らかになった。
論文参考訳（メタデータ） (2023-09-30T21:16:05Z)
Instruction-following Evaluation through Verbalizer Manipulation [64.73188776428799]
本稿では,動詞操作と呼ばれる新しい指示追従評価プロトコルを提案する。モデルにタスクラベルを、異なる範囲のモデル先行と整合した単語で言語化するように指示する。異なる家族や規模にわたるモデルの指示追従能力は、より自然な話し手の性能によって著しく異なることが観察された。
論文参考訳（メタデータ） (2023-07-20T03:54:24Z)
Counterfactual Cycle-Consistent Learning for Instruction Following and Generation in Vision-Language Navigation [172.15808300686584]
本稿では,2つのタスクを同時に学習し,それぞれのトレーニングを促進するために本質的な相関性を利用するアプローチについて述べる。提案手法は,様々な追従モデルの性能を改善し,正確なナビゲーション命令を生成する。
論文参考訳（メタデータ） (2022-03-30T18:15:26Z)
Reverse engineering learned optimizers reveals known and novel mechanisms [50.50540910474342]
学習は最適化問題を解決するために自らを訓練できるアルゴリズムである。実験の結果は,学習の動作方法に関するそれまでの曖昧な理解を解明し,今後の学習を解釈するためのツールを確立するのに役立つ。
論文参考訳（メタデータ） (2020-11-04T07:12:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。