論文の概要: Evaluating the Evaluation of Diversity in Natural Language Generation
- arxiv url: http://arxiv.org/abs/2004.02990v3
- Date: Sun, 24 Jan 2021 09:49:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 06:46:06.240749
- Title: Evaluating the Evaluation of Diversity in Natural Language Generation
- Title(参考訳): 自然言語生成における多様性の評価
- Authors: Guy Tevet, Jonathan Berant
- Abstract要約: 本稿では,自然言語生成システムにおける多様性指標を評価するためのフレームワークを提案する。
当社のフレームワークは,NLGシステムの改善に向けた重要なステップである,さまざまな多様性指標の理解を促進することができる。
- 参考スコア(独自算出の注目度): 43.05127848086264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite growing interest in natural language generation (NLG) models that
produce diverse outputs, there is currently no principled method for evaluating
the diversity of an NLG system. In this work, we propose a framework for
evaluating diversity metrics. The framework measures the correlation between a
proposed diversity metric and a diversity parameter, a single parameter that
controls some aspect of diversity in generated text. For example, a diversity
parameter might be a binary variable used to instruct crowdsourcing workers to
generate text with either low or high content diversity. We demonstrate the
utility of our framework by: (a) establishing best practices for eliciting
diversity judgments from humans, (b) showing that humans substantially
outperform automatic metrics in estimating content diversity, and (c)
demonstrating that existing methods for controlling diversity by tuning a
"decoding parameter" mostly affect form but not meaning. Our framework can
advance the understanding of different diversity metrics, an essential step on
the road towards better NLG systems.
- Abstract(参考訳): 多様な出力を生成する自然言語生成(NLG)モデルへの関心が高まっているが、現在、NLGシステムの多様性を評価するための原則的な方法はない。
本稿では,多様性指標を評価するフレームワークを提案する。
このフレームワークは、提案した多様性指標と、生成したテキストの多様性のいくつかの側面を制御する単一のパラメータとの相関を計測する。
例えば、多様性パラメータは、クラウドソーシングワーカーに低あるいは高レベルの多様性を持つテキストを生成するよう指示するために使われるバイナリ変数かもしれない。
フレームワークの有用性を以下に示す。
(a)人間から多様性判断を引き出すためのベストプラクティスを確立すること。
b)人間がコンテンツの多様性を推定する際の自動測定値を大幅に上回ることを示すこと、
(c)「復号パラメータ」をチューニングすることで多様性を制御できる既存の手法は形に大きく影響するが意味はないことを示す。
当社のフレームワークは,NLGシステムの改善に向けた重要なステップである,さまざまな多様性指標の理解を促進することができる。
関連論文リスト
- Improving Structural Diversity of Blackbox LLMs via Chain-of-Specification Prompting [28.971248570622603]
そこで本研究では,ユーザが生成したテキストから,興味のある多様性を捉えた特徴までをマッピングする,構造的多様性と呼ばれる多様性指標を提案する。
実験では,詩文やコード領域の構造的多様性に対して,CoSはいくつかのベースラインに比べて多様性を著しく向上させることを示した。
論文 参考訳(メタデータ) (2024-08-12T14:34:06Z) - Enhancing LLM-Based Human-Robot Interaction with Nuances for Diversity Awareness [0.0]
本稿では,大規模言語モデル(LLM)の機能を活用した多様性を考慮した自律会話システムを提案する。
このシステムは、背景、性格、年齢、性別、文化といった要因を考慮して、多様な人口や個人に適応する。
システムの性能を評価するため,制御と実環境の両方の実験を行い,幅広い性能指標を測定した。
論文 参考訳(メタデータ) (2024-06-25T13:15:36Z) - Improving Demonstration Diversity by Human-Free Fusing for Text-to-SQL [51.48239006107272]
本稿では,テキスト・ツー・ダイバーシティ研究における実証の多様性を計測し,改善する方法について論じる。
我々は,高多様性のデモンストレーションプールを構築するために,デモ(Fused)のために反復的に融合することを提案する。
本手法は,複数の主流データセットにラベルを付けることなく,平均3.2%と5.0%の改善を実現する。
論文 参考訳(メタデータ) (2024-02-16T13:13:18Z) - Improving Diversity of Demographic Representation in Large Language
Models via Collective-Critiques and Self-Voting [19.79214899011072]
本稿では,生成的大言語モデルにおける表現の多様性を形式化する。
評価データセットを提示し、人や文化軸に沿って生成された反応の多様性を測定する指標を提案する。
LLMは多様性の概念を理解し、その目標に対して自身の反応を推論し、批判することができる。
論文 参考訳(メタデータ) (2023-10-25T10:17:17Z) - Diversify Question Generation with Retrieval-Augmented Style Transfer [68.00794669873196]
本稿では,検索型スタイル転送のためのフレームワーク RAST を提案する。
本研究の目的は,多様なテンプレートのスタイルを質問生成に活用することである。
多様性報酬と一貫性報酬の重み付けを最大化する新しい強化学習(RL)ベースのアプローチを開発する。
論文 参考訳(メタデータ) (2023-10-23T02:27:31Z) - Exploring Diversity in Back Translation for Low-Resource Machine
Translation [85.03257601325183]
バックトランスフォーメーションは、ニューラルマシントランスフォーメーションシステムの性能を改善するために最も広く使われている手法の1つである。
近年の研究では、生成された翻訳の「多様性」を増大させることにより、この手法の有効性を高めることを目指している。
この研究は、トレーニングデータの多様性を理解し、それを語彙的多様性と構文的多様性に分割する、より微妙なフレームワークを推し進めている。
論文 参考訳(メタデータ) (2022-06-01T15:21:16Z) - Semantic Diversity in Dialogue with Natural Language Inference [19.74618235525502]
本稿では,対話生成における多様性向上に2つの重要な貢献をする。
まず、自然言語推論(NLI)を用いて、会話に対するモデル応答の集合のセマンティック多様性を測定する新しいメトリクスを提案する。
第2に,多様性閾値生成と呼ばれる新世代の手法を用いて,サンプル化された応答集合のセマンティック多様性を反復的に改善する方法を実証する。
論文 参考訳(メタデータ) (2022-05-03T13:56:32Z) - Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。
本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文 参考訳(メタデータ) (2020-11-26T21:09:38Z) - Random Network Distillation as a Diversity Metric for Both Image and
Text Generation [62.13444904851029]
我々は、どんな種類のデータにも、どんな種類のデータにも、自然にも適用できる新しい多様性指標を開発した。
私たちはこのメトリクスを画像とテキストの両方で検証し、デプロイします。
論文 参考訳(メタデータ) (2020-10-13T22:03:52Z) - Informed Sampling for Diversity in Concept-to-Text NLG [8.883733362171034]
本稿では,言語生成モデルが確実に生成できる多様性のレベルを探索するために,Imitation Learningアプローチを提案する。
具体的には、任意のタイミングでどの単語が高品質な出力につながるかを識別するように訓練されたメタ分類器を用いて復号処理を強化する。
論文 参考訳(メタデータ) (2020-04-29T17:43:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。