論文の概要: Trading Off Diversity and Quality in Natural Language Generation
- arxiv url: http://arxiv.org/abs/2004.10450v1
- Date: Wed, 22 Apr 2020 09:12:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-10 18:04:24.832832
- Title: Trading Off Diversity and Quality in Natural Language Generation
- Title(参考訳): 自然言語生成における多様性と品質の取引
- Authors: Hugh Zhang, Daniel Duckworth, Daphne Ippolito, Arvind Neelakantan
- Abstract要約: 応答品質と多様性の両方を同時に最大化することを目的とした多目的最適化問題としてデコーディングをキャストした。
我々のフレームワークは、品質・多様性のスペクトル全体に沿って、デコード手法の大規模な評価を行うことができる。
我々は,この知見を活用して,グローバルな正規化温度サンプリングを精度よく近似するEmphselective sampleと呼ばれるアルゴリズムを作成し,評価する。
- 参考スコア(独自算出の注目度): 12.672685374008259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For open-ended language generation tasks such as storytelling and dialogue,
choosing the right decoding algorithm is critical to controlling the tradeoff
between generation quality and diversity. However, there presently exists no
consensus on which decoding procedure is best or even the criteria by which to
compare them. We address these issues by casting decoding as a multi-objective
optimization problem aiming to simultaneously maximize both response quality
and diversity. Our framework enables us to perform the first large-scale
evaluation of decoding methods along the entire quality-diversity spectrum. We
find that when diversity is a priority, all methods perform similarly, but when
quality is viewed as more important, the recently proposed nucleus sampling
(Holtzman et al. 2019) outperforms all other evaluated decoding algorithms. Our
experiments also confirm the existence of the `likelihood trap', the
counter-intuitive observation that high likelihood sequences are often
surprisingly low quality. We leverage our findings to create and evaluate an
algorithm called \emph{selective sampling} which tractably approximates
globally-normalized temperature sampling.
- Abstract(参考訳): ストーリーテリングや対話のようなオープンな言語生成タスクでは、生成品質と多様性のトレードオフを制御するために適切な復号アルゴリズムを選択することが重要である。
しかし、現在、どの復号処理が最適か、あるいは比較する基準について合意が得られていない。
応答品質と多様性の両方を同時に最大化することを目的とした多目的最適化問題としてデコーディングをキャストすることで、これらの問題に対処する。
提案手法は,品質・多様性スペクトル全体に沿ってデコード法を初めて大規模に評価することを可能にする。
多様性が優先される場合、全ての手法が同様に動作するが、品質がより重要であると判断された場合、最近提案された核サンプリング(Holtzman et al. 2019)は、他の評価された復号アルゴリズムよりも優れている。
また,「類似トラップ」の存在も確認し,高い確率列が驚くほど低品質であることの反直感的観察を行った。
我々はこの結果を利用して,グローバル正規化温度サンプリングを気軽に近似するアルゴリズム \emph{selective sampling} の作成と評価を行った。
関連論文リスト
- Illuminating the Diversity-Fitness Trade-Off in Black-Box Optimization [9.838618121102053]
現実世界のアプリケーションでは、ユーザーは1つの高品質なソリューションよりも構造的に多様な設計選択を好むことが多い。
本稿では, この課題に対する新たな視点として, 与えられたしきい値を超えるペア距離の一定数の解を同定する問題を考察する。
論文 参考訳(メタデータ) (2024-08-29T09:55:55Z) - Batch Bayesian Optimization for Replicable Experimental Design [56.64902148159355]
多くの実世界の設計問題は、大規模で異質な観測ノイズのため、複数の実験条件を並列に評価し、各条件を複数回再現する。
本稿では,3つのアルゴリズムを含むReplicable Experimental Designフレームワークのバッチトンプソンサンプリングを提案する。
我々は,アルゴリズムの有効性を,精密農業とAutoMLの2つの実世界の応用例で示す。
論文 参考訳(メタデータ) (2023-11-02T12:46:03Z) - Best-$k$ Search Algorithm for Neural Text Generation [118.02691398555781]
本稿では,品質と多様性のバランスをとる決定論的探索アルゴリズムを提案する。
提案アルゴリズムはパラメータフリーで、軽量で、効率的で、使いやすくなっている。
論文 参考訳(メタデータ) (2022-11-22T00:26:13Z) - Follow the Wisdom of the Crowd: Effective Text Generation via Minimum
Bayes Risk Decoding [27.454582992694974]
本稿では,ベイズリスク最小化に基づく復号法群である群集サンプリングについて述べる。
群衆のサンプリングは、最小限のリスクを持つ候補者のプールから候補者を選ぼうとする。
実験により, 群集サンプリングにより, 広範囲にわたる3~7ROUGE点とBLEU点の改善が得られた。
論文 参考訳(メタデータ) (2022-11-14T18:57:37Z) - An Analysis of the Effects of Decoding Algorithms on Fairness in
Open-Ended Language Generation [77.44921096644698]
本稿では,復号化アルゴリズムがLMフェアネスに与える影響を体系的に分析する。
公平さ、多様性、品質のトレードオフを分析します。
論文 参考訳(メタデータ) (2022-10-07T21:33:34Z) - Relevance-guided Unsupervised Discovery of Abilities with
Quality-Diversity Algorithms [1.827510863075184]
本稿では,その課題に適した行動特性を自律的に発見する品質多様性アルゴリズムであるRelevance-guided Unsupervised Discovery of Abilitiesを紹介する。
我々は、ロボットが完全な感覚データに基づいて自律的にその能力を発見しなければならない、シミュレーションされたロボット環境に対するアプローチを評価する。
論文 参考訳(メタデータ) (2022-04-21T00:29:38Z) - On Decoding Strategies for Neural Text Generators [73.48162198041884]
言語生成タスクと復号化戦略の相互作用について検討する。
生成したテキストの属性の変化をデコード戦略とタスクの両方の関数として測定する。
以上の結果から,これまで観察された結果と意外な結果の両方が明らかとなった。
論文 参考訳(メタデータ) (2022-03-29T16:25:30Z) - Determinantal Beam Search [75.84501052642361]
ビームサーチは、ニューラルシーケンスモデルをデコードするためのゴーツー戦略である。
複数のソリューションを要求するユースケースでは、多様あるいは代表的なセットがしばしば望まれる。
ビームサーチを一連の部分決定問題として繰り返し行うことにより、アルゴリズムを多種多様なサブセット選択プロセスに変換することができる。
論文 参考訳(メタデータ) (2021-06-14T13:01:46Z) - Quality-Diversity Optimization: a novel branch of stochastic
optimization [5.677685109155078]
マルチモーダル最適化アルゴリズムは、複数のことができる検索空間で最も高いピークを検索します。
品質多様性アルゴリズムは、進化的計算ツールボックスに最近追加されたもので、単一の局所光学系を探索するだけでなく、検索空間を照らそうとする。
論文 参考訳(メタデータ) (2020-12-08T09:52:50Z) - Consistency of a Recurrent Language Model With Respect to Incomplete
Decoding [67.54760086239514]
逐次言語モデルから無限長のシーケンスを受信する問題について検討する。
不整合に対処する2つの対策として、トップkと核サンプリングの一貫性のある変種と、自己終端の繰り返し言語モデルを提案する。
論文 参考訳(メタデータ) (2020-02-06T19:56:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。