論文の概要: A survey of diversity quantification in natural language processing: The why, what, where and how
- arxiv url: http://arxiv.org/abs/2507.20858v1
- Date: Mon, 28 Jul 2025 14:12:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.15033
- Title: A survey of diversity quantification in natural language processing: The why, what, where and how
- Title(参考訳): 自然言語処理における多様性の定量化に関する調査--なぜ,何,どこで,どのようにして
- Authors: Louis Estève, Marie-Catherine de Marneffe, Nurit Melnik, Agata Savary, Olha Kanishcheva,
- Abstract要約: 我々は過去6年間のACLアンソロジーの論文を「多様性」または「多様性」のタイトルで調査した。
NLPでなぜ、どこで、どこで、どのように多様性が測定されるかという、統一された分類を提唱した。
本研究は,NLPにおける多様性のより優れた形式化に向けての道を開くものであると考えている。
- 参考スコア(独自算出の注目度): 2.5833049611832273
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The concept of diversity has received increased consideration in Natural Language Processing (NLP) in recent years. This is due to various motivations like promoting and inclusion, approximating human linguistic behavior, and increasing systems' performance. Diversity has however often been addressed in an ad hoc manner in NLP, and with few explicit links to other domains where this notion is better theorized. We survey articles in the ACL Anthology from the past 6 years, with "diversity" or "diverse" in their title. We find a wide range of settings in which diversity is quantified, often highly specialized and using inconsistent terminology. We put forward a unified taxonomy of why, what on, where, and how diversity is measured in NLP. Diversity measures are cast upon a unified framework from ecology and economy (Stirling, 2007) with 3 dimensions of diversity: variety, balance and disparity. We discuss the trends which emerge due to this systematized approach. We believe that this study paves the way towards a better formalization of diversity in NLP, which should bring a better understanding of this notion and a better comparability between various approaches.
- Abstract(参考訳): 近年,自然言語処理(NLP)において多様性の概念が注目されている。
これは、促進と包摂、人間の言語行動の近似、システムの性能向上など、様々な動機によるものである。
しかしながら、多様性はしばしばNLPのアドホックな方法で対処され、この概念がより理論化された他の領域への明示的なリンクはほとんどない。
我々は過去6年間のACLアンソロジーの論文を「多様性」または「多様性」のタイトルで調査した。
多様性が定量化され、しばしば高度に専門化され、一貫性のない用語を使用する、幅広い設定が見つかる。
NLPでなぜ、どこで、どこで、どのように多様性が測定されるかという、統一された分類を提唱した。
多様性対策は、多様性、バランス、格差の3つの次元を持つエコロジーと経済の統一された枠組み(Stirling, 2007)の上に置かれている。
この体系化されたアプローチによって出現する傾向について論じる。
本研究は、NLPにおける多様性のより優れた形式化に向けての道のりを歩み、この概念をよりよく理解し、様々なアプローチ間の互換性を向上するであろうと信じている。
関連論文リスト
- Evaluating the Diversity and Quality of LLM Generated Content [72.84945252821908]
品質閾値を満たす出力間の効果的な意味的多様性を測定するための枠組みを導入する。
嗜好調整モデルでは語彙的および構文的多様性が低下するが、SFTやベースモデルよりも効果的な意味的多様性が得られる。
これらの発見は、多種多様な高品質な出力を必要とするアプリケーションに重要な意味を持つ。
論文 参考訳(メタデータ) (2025-04-16T23:02:23Z) - What is "Typological Diversity" in NLP? [7.58293347591642]
いくつかの軸に沿って言語選択の多様性を近似する指標を導入する。
歪んだ言語選択は、過度に見積もられた多言語のパフォーマンスをもたらす可能性があることを示す。
論文 参考訳(メタデータ) (2024-02-06T18:29:39Z) - Diversify Question Generation with Retrieval-Augmented Style Transfer [68.00794669873196]
本稿では,検索型スタイル転送のためのフレームワーク RAST を提案する。
本研究の目的は,多様なテンプレートのスタイルを質問生成に活用することである。
多様性報酬と一貫性報酬の重み付けを最大化する新しい強化学習(RL)ベースのアプローチを開発する。
論文 参考訳(メタデータ) (2023-10-23T02:27:31Z) - Exploring Diversity in Back Translation for Low-Resource Machine
Translation [85.03257601325183]
バックトランスフォーメーションは、ニューラルマシントランスフォーメーションシステムの性能を改善するために最も広く使われている手法の1つである。
近年の研究では、生成された翻訳の「多様性」を増大させることにより、この手法の有効性を高めることを目指している。
この研究は、トレーニングデータの多様性を理解し、それを語彙的多様性と構文的多様性に分割する、より微妙なフレームワークを推し進めている。
論文 参考訳(メタデータ) (2022-06-01T15:21:16Z) - Semantic Diversity in Dialogue with Natural Language Inference [19.74618235525502]
本稿では,対話生成における多様性向上に2つの重要な貢献をする。
まず、自然言語推論(NLI)を用いて、会話に対するモデル応答の集合のセマンティック多様性を測定する新しいメトリクスを提案する。
第2に,多様性閾値生成と呼ばれる新世代の手法を用いて,サンプル化された応答集合のセマンティック多様性を反復的に改善する方法を実証する。
論文 参考訳(メタデータ) (2022-05-03T13:56:32Z) - What can phylogenetic metrics tell us about useful diversity in
evolutionary algorithms? [62.997667081978825]
系統的多様性指標(英: Phylogenetic diversity metrics)は、生物学で広く用いられる指標の分類である。
ほとんどの場合、系統学的指標は他の多様性指標と有意に異なる振る舞いをする。
論文 参考訳(メタデータ) (2021-08-28T06:49:14Z) - Diversity in Sociotechnical Machine Learning Systems [2.9973947110286163]
近年,機械学習(ML)研究における社会文化的多様性への関心が高まっている。
我々は、科学哲学と異なる多様性概念の分類を示し、これらの概念の根底にある明確な根拠を解明する。
多様性がグループパフォーマンスに寄与するメカニズムの概要を提供する。
論文 参考訳(メタデータ) (2021-07-19T21:26:38Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Evaluating the Evaluation of Diversity in Natural Language Generation [43.05127848086264]
本稿では,自然言語生成システムにおける多様性指標を評価するためのフレームワークを提案する。
当社のフレームワークは,NLGシステムの改善に向けた重要なステップである,さまざまな多様性指標の理解を促進することができる。
論文 参考訳(メタデータ) (2020-04-06T20:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。