Fugu-MT 論文翻訳(概要): Privacy-Preserving Instructions for Aligning Large Language Models

論文の概要: Privacy-Preserving Instructions for Aligning Large Language Models

arxiv url: http://arxiv.org/abs/2402.13659v1
Date: Wed, 21 Feb 2024 09:45:08 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-22 16:09:34.748918
Title: Privacy-Preserving Instructions for Aligning Large Language Models
Title（参考訳）: 大規模言語モデルアライメントのためのプライバシ保護命令
Authors: Da Yu, Peter Kairouz, Sewoong Oh, Zheng Xu
Abstract要約: 本稿では,データアノテーションとモデル微調整における実命令を置き換えるための合成命令を提案する。形式的な差分プライバシーは、プライベートな微調整されたジェネレータを使用して合成命令を生成することで保証される。教師付き微調整では、プライベートな合成命令で訓練されたモデルは、Vicunaのような主要なオープンソースモデルよりも優れている。
参考スコア（独自算出の注目度）: 49.93731975101761
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Service providers of large language model (LLM) applications collect user instructions in the wild and use them in further aligning LLMs with users' intentions. These instructions, which potentially contain sensitive information, are annotated by human workers in the process. This poses a new privacy risk not addressed by the typical private optimization. To this end, we propose using synthetic instructions to replace real instructions in data annotation and model fine-tuning. Formal differential privacy is guaranteed by generating those synthetic instructions using privately fine-tuned generators. Crucial in achieving the desired utility is our novel filtering algorithm that matches the distribution of the synthetic instructions to that of the real ones. In both supervised fine-tuning and reinforcement learning from human feedback, our extensive experiments demonstrate the high utility of the final set of synthetic instructions by showing comparable results to real instructions. In supervised fine-tuning, models trained with private synthetic instructions outperform leading open-source models such as Vicuna.
Abstract（参考訳）: 大規模言語モデル(LLM)アプリケーションのサービスプロバイダは、ユーザ命令を野放しに収集し、LLMをさらにユーザーの意図に合わせるために使用する。機密情報を含む可能性のあるこれらの命令は、その過程で人間の作業員によって注釈付けされる。これにより、一般的なプライベート最適化で対処されない新たなプライバシーリスクが生じる。そこで本研究では,データアノテーションとモデル微調整における実命令を置き換えるための合成命令を提案する。形式的な差分プライバシーは、プライベートな微調整された発電機を使用して合成命令を生成することで保証される。所望の実用性を達成する上で重要なのが,合成命令と実命令の分布をマッチングする新しいフィルタリングアルゴリズムである。人間のフィードバックによる微調整と強化学習の両方において,実際の命令に匹敵する結果を示し,合成命令の最終セットの高有用性を示す実験を行った。教師付き微調整では、プライベートな合成命令でトレーニングされたモデルは、vicunaのような主要なオープンソースモデルよりも優れています。

関連論文リスト

FineInstructions: Scaling Synthetic Instructions to Pre-Training Scale [56.03294218908334]
大規模言語モデル(LLM)は通常、自己監督型の"次の単語を予測する"目的を通じて事前訓練される。モデルをユーザにとって有用なものにするために、命令と応答の教師付きトレーニング例からなる、はるかに少ない量の「インストラクションチューニング」データに基づいて、さらに訓練されている。本稿では,インターネット規模の事前学習文書の知識を,数十億の合成指導と解答訓練ペアに変換する手法を提案する。
論文参考訳（メタデータ） (2026-01-29T18:58:47Z)
From Real to Synthetic: Synthesizing Millions of Diversified and Complicated User Instructions with Attributed Grounding [33.009759731505746]
我々は、SynthQuestionsと呼ばれる100万の命令のデータセットを構築します。トレーニングされたモデルが、いくつかの共通ベンチマークで主要なパフォーマンスを達成することを実証する。
論文参考訳（メタデータ） (2025-06-04T14:00:47Z)
CodecLM: Aligning Language Models with Tailored Synthetic Data [51.59223474427153]
命令追従能力のための高品質な合成データを適応的に生成するフレームワークであるCodecLMを紹介する。まず、ターゲットの指示分布をキャプチャするために、オンザフライで生成された簡潔なキーワードであるメタデータにシード命令をエンコードする。また、デコード中に自己論理とコントラストフィルタを導入し、データ効率の良いサンプルを調整する。
論文参考訳（メタデータ） (2024-04-08T21:15:36Z)
Can LLMs Generate Human-Like Wayfinding Instructions? Towards Platform-Agnostic Embodied Instruction Synthesis [51.04181562775778]
本稿では,ロボットエージェントの「ウェイフィンディング指示」を自動的に合成する手法を提案する。提案アルゴリズムは,LLMの条件付けにコンテキスト内学習を用い,わずかな参照を用いて命令を生成する。我々は,Matterport3D,AI Habitat,ThreeDWorldなど,複数のシミュレーションプラットフォームにアプローチを実装した。
論文参考訳（メタデータ） (2024-03-18T05:38:07Z)
Instructive Decoding: Instruction-Tuned Large Language Models are Self-Refiner from Noisy Instructions [26.192531184689763]
本稿では,インストラクティブ・デコーディング(Instructive Decoding, ID)を提案する。 IDは、元の命令の操作されたバージョンから生成された予測を利用して、逆方向の予測のためにロジットを調整する。ランダムな単語を介して意味的ノイズを挿入するものから、逸脱した応答を誘発する「オポジット」のような他のものまで、このようなノイズの多い命令のスペクトルにわたって実験を行う。
論文参考訳（メタデータ） (2023-11-01T02:31:35Z)
Instruct and Extract: Instruction Tuning for On-Demand Information Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。 InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。 InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文参考訳（メタデータ） (2023-10-24T17:54:25Z)
Evaluating the Zero-shot Robustness of Instruction-tuned Language Models [23.488398944358643]
新規な(観測されていない)が適切な命令表現を用いることで、モデル性能は一貫して低下することがわかった。本稿では,ソフトプロンプトの埋め込みパラメータを導入することで,この問題を軽減するための簡単な手法を提案する。本手法は命令調整モデルのロバスト性を常に改善することを示す。
論文参考訳（メタデータ） (2023-06-20T03:48:51Z)
Enhancing Large Language Models Against Inductive Instructions with Dual-critique Prompting [55.15697111170836]
本稿では,大規模言語モデル(LLM)のテクスト誘導的指示に対する行動を明らかにするとともに,その真しさと有用性を高める。広範囲な人的・自動的な評価の結果,帰納的命令処理において LLM に共通する脆弱性が発見された。異なる帰納的スタイルがモデルに同じエラーを識別する能力に影響を及ぼし、基礎となる仮定の複雑さがモデルの性能にも影響を及ぼす。
論文参考訳（メタデータ） (2023-05-23T06:38:20Z)
Recommendation as Instruction Following: A Large Language Model Empowered Recommendation Approach [83.62750225073341]
我々は、大規模言語モデル(LLM)による指示としてレコメンデーションを考える。まず、ユーザの好み、意図、タスクフォーム、コンテキストを自然言語で記述するための一般的な命令形式を設計する。そして、39の命令テンプレートを手動で設計し、大量のユーザ個人化された命令データを自動的に生成する。
論文参考訳（メタデータ） (2023-05-11T17:39:07Z)
Self-Instruct: Aligning Language Models with Self-Generated Instructions [76.42871502364697]
Self-Instructは、事前訓練された言語モデルの命令フォロー機能を改善するためのフレームワークである。私たちのパイプラインは、言語モデルから命令、入力、および出力のサンプルを生成し、その後、元のモデルを微調整するためにそれらを使用する前に、無効または類似のサンプルをフィルタします。さらなる評価のために、新規タスクのエキスパートによる指示のセットをキュレートし、GPT3とセルフインストラクトのチューニングが既存の公開インストラクションデータセットを大きなマージンで向上することを示す。
論文参考訳（メタデータ） (2022-12-20T18:59:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。