Fugu-MT 論文翻訳(概要): A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors

論文の概要: A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors

arxiv url: http://arxiv.org/abs/2406.10203v1
Date: Fri, 14 Jun 2024 17:38:21 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-17 12:37:07.693784
Title: A Fundamental Trade-off in Aligned Language Models and its Relation to Sampling Adaptors
Title（参考訳）: 言語モデルにおける基本的トレードオフと適応子サンプリングとの関係
Authors: Naaman Tan, Josef Valvoda, Anej Svete, Tianyu Liu, Yanxia Qin, Kan Min-Yen, Ryan Cotterell,
Abstract要約: 汎用言語モデルとその整列バージョンが与えられた場合、一般的な言語モデルの下では、平均報酬と平均ログライクな文字列の間にトレードオフが存在する。この問題を形式的に処理し、サンプリングアダプタの選択が、報酬と交換する可能性の選択を可能にすることを実証する。
参考スコア（独自算出の注目度）: 50.046717886067555
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The relationship between the quality of a string and its probability $p(\boldsymbol{y})$ under a language model has been influential in the development of techniques to build good text generation systems. For example, several decoding algorithms have been motivated to manipulate $p(\boldsymbol{y})$ to produce higher-quality text. In this work, we examine the probability--quality relationship in language models explicitly aligned to human preferences, e.g., through Reinforcement Learning through Human Feedback (RLHF). We find that, given a general language model and its aligned version, for corpora sampled from an aligned language model, there exists a trade-off between the average reward and average log-likelihood of the strings under the general language model. We provide a formal treatment of this issue and demonstrate how a choice of sampling adaptor allows for a selection of how much likelihood we exchange for the reward.
Abstract（参考訳）: 文字列の品質と確率$p(\boldsymbol{y})$との関係は、優れたテキスト生成システムを構築する技術の開発に影響を与えている。例えば、いくつかの復号アルゴリズムは、より高品質なテキストを生成するために$p(\boldsymbol{y})$を操作する動機付けがなされている。本研究では,RLHF(Reinforcement Learning through Human Feedback)を通して,言語モデルにおける確率-品質の関係について検討する。汎用言語モデルとそのコーパスモデルからサンプル化したコーパスについて,汎用言語モデルに基づく文字列の平均報酬と平均ログ類似度との間にはトレードオフがあることが判明した。この問題を形式的に処理し、サンプリングアダプタの選択が、報酬と交換する可能性の選択を可能にすることを実証する。

関連論文リスト

Do Language Models Have Bayesian Brains? Distinguishing Stochastic and Deterministic Decision Patterns within Large Language Models [2.5812117322021644]
特定の条件下では、言語モデルがほぼ決定論的意思決定を示すことが示される。このことは、サンプリング仮定に挑戦し、人間のような先入観を抽出する以前の手法を損なう。本稿では,ギブズサンプリングにおける決定論的決定パターンの識別方法を提案する。
論文参考訳（メタデータ） (2025-06-12T01:23:22Z)
Reverse-Engineering the Reader [43.26660964074272]
本稿では,線形回帰器のパラメータを暗黙的に最適化するために,言語モデルを微調整する新しいアライメント手法を提案する。単語をテストケースとして使用し、複数のモデルサイズとデータセットにわたる手法を評価する。ダウンストリームNLPタスクにおける心理測定パワーとモデルの性能の逆関係と、ホールドアウトテストデータにおけるその難易度を見出した。
論文参考訳（メタデータ） (2024-10-16T23:05:01Z)
Reuse Your Rewards: Reward Model Transfer for Zero-Shot Cross-Lingual Alignment [39.94156255629528]
ゼロショット・クロスランガルアライメントのための簡単なアプローチを評価する。言語間の整列モデルは、非整列モデルよりも人間の方が好まれる。異なる言語報酬モデルでは、同言語報酬モデルよりも優れた整列モデルが得られることがある。
論文参考訳（メタデータ） (2024-04-18T16:52:36Z)
Chain of Hindsight Aligns Language Models with Feedback [62.68665658130472]
我々は,その極性に関係なく,任意の形式のフィードバックから学習し,最適化が容易な新しい手法であるChain of Hindsightを提案する。我々は、あらゆる種類のフィードバックを文のシーケンスに変換し、それをモデルを微調整するために使用する。そうすることで、モデルはフィードバックに基づいて出力を生成するように訓練され、負の属性やエラーを特定し修正する。
論文参考訳（メタデータ） (2023-02-06T10:28:16Z)
Quark: Controllable Text Generation with Reinforced Unlearning [68.07749519374089]
大規模言語モデルは、しばしばユーザの期待に合わない振る舞いを学ぶ。本稿では,(不必要な)特性を定量化する報酬関数を最適化するアルゴリズムQuarkを紹介する。未学習の毒性、ネガティブな感情、反復について、我々の実験はQuarkが強いベースラインと最先端の強化学習法の両方より優れていることを示している。
論文参考訳（メタデータ） (2022-05-26T21:11:51Z)
Training Language Models with Natural Language Feedback [51.36137482891037]
3段階学習アルゴリズムを用いてモデル出力の言語フィードバックから学習する。合成実験において、まず言語モデルがフィードバックを正確に組み込んで改良を行うかどうかを評価する。人間の手書きフィードバックのサンプルは100程度しかなく, 学習アルゴリズムはGPT-3モデルを微調整し, ほぼ人間レベルの要約を行う。
論文参考訳（メタデータ） (2022-04-29T15:06:58Z)
On the probability-quality paradox in language generation [76.69397802617064]
我々は情報理論レンズを用いて言語生成を分析する。人間の言語は自然文字列上の分布のエントロピーに近い量の情報を含むべきであると仮定する。
論文参考訳（メタデータ） (2022-03-31T17:43:53Z)
Typical Decoding for Natural Language Generation [76.69397802617064]
本稿は,高確率テキストが退屈あるいは反復的である理由について考察する。典型的なサンプリングでは,品質面での競争性能が期待できる。
論文参考訳（メタデータ） (2022-02-01T18:58:45Z)
Towards Zero-Shot Multilingual Synthetic Question and Answer Generation for Cross-Lingual Reading Comprehension [20.570539023748424]
本稿では,多言語質問と解答ペアを大規模に生成する簡単な方法を提案する。これらの合成サンプルは、ターゲット言語上の多言語QAモデルのゼロショット性能を改善するために使用できる。
論文参考訳（メタデータ） (2020-10-22T19:59:37Z)
Comparison of Interactive Knowledge Base Spelling Correction Models for Low-Resource Languages [81.90356787324481]
低リソース言語に対する正規化の推進は、パターンの予測が難しいため、難しい作業である。この研究は、ターゲット言語データに様々な量を持つニューラルモデルとキャラクタ言語モデルの比較を示す。我々の利用シナリオは、ほぼゼロのトレーニング例によるインタラクティブな修正であり、より多くのデータが収集されるにつれてモデルを改善する。
論文参考訳（メタデータ） (2020-10-20T17:31:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。