Fugu-MT 論文翻訳(概要): Improving Diversity of Demographic Representation in Large Language Models via Collective-Critiques and Self-Voting

論文の概要: Improving Diversity of Demographic Representation in Large Language Models via Collective-Critiques and Self-Voting

arxiv url: http://arxiv.org/abs/2310.16523v1
Date: Wed, 25 Oct 2023 10:17:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-26 15:22:26.102417
Title: Improving Diversity of Demographic Representation in Large Language Models via Collective-Critiques and Self-Voting
Title（参考訳）: 集団批判と自己投票による大規模言語モデルにおける人口動態の多様性の改善
Authors: Preethi Lahoti, Nicholas Blumm, Xiao Ma, Raghavendra Kotikalapudi, Sahitya Potluri, Qijun Tan, Hansa Srinivasan, Ben Packer, Ahmad Beirami, Alex Beutel, Jilin Chen
Abstract要約: 本稿では,生成的大言語モデルにおける表現の多様性を形式化する。評価データセットを提示し、人や文化軸に沿って生成された反応の多様性を測定する指標を提案する。 LLMは多様性の概念を理解し、その目標に対して自身の反応を推論し、批判することができる。
参考スコア（独自算出の注目度）: 19.79214899011072
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A crucial challenge for generative large language models (LLMs) is diversity: when a user's prompt is under-specified, models may follow implicit assumptions while generating a response, which may result in homogenization of the responses, as well as certain demographic groups being under-represented or even erased from the generated responses. In this paper, we formalize diversity of representation in generative LLMs. We present evaluation datasets and propose metrics to measure diversity in generated responses along people and culture axes. We find that LLMs understand the notion of diversity, and that they can reason and critique their own responses for that goal. This finding motivated a new prompting technique called collective-critique and self-voting (CCSV) to self-improve people diversity of LLMs by tapping into its diversity reasoning capabilities, without relying on handcrafted examples or prompt tuning. Extensive empirical experiments with both human and automated evaluations show that our proposed approach is effective at improving people and culture diversity, and outperforms all baseline methods by a large margin.
Abstract（参考訳）: 生成型大規模言語モデル(llms)にとって重要な課題は多様性である: ユーザのプロンプトが過小に指定されている場合、モデルは応答を生成しながら暗黙的な仮定に従う可能性がある。本稿では,ジェネレーティブLLMにおける表現の多様性を形式化する。評価データセットを提案し,人や文化軸に沿った生成応答の多様性を測定する指標を提案する。 LLMは多様性の概念を理解し、その目標に対して自身の反応を推論し、批判することができる。この発見は、集団批判と自己投票(CCSV)と呼ばれる新たなプロンプト手法を動機付け、手作りの例や迅速なチューニングに頼ることなく、多様性推論能力を活用することでLLMの多様性を自己改善する。人間と自動評価による広範な実験の結果,提案手法は,人間と文化の多様性向上に有効であり,すべてのベースライン手法を大差で上回っていることがわかった。

関連論文リスト

Evaluating the Diversity and Quality of LLM Generated Content [72.84945252821908]
品質閾値を満たす出力間の効果的な意味的多様性を測定するための枠組みを導入する。嗜好調整モデルでは語彙的および構文的多様性が低下するが、SFTやベースモデルよりも効果的な意味的多様性が得られる。これらの発見は、多種多様な高品質な出力を必要とするアプリケーションに重要な意味を持つ。
論文参考訳（メタデータ） (2025-04-16T23:02:23Z)
NoveltyBench: Evaluating Language Models for Humanlike Diversity [21.6078675947446]
NoveltyBenchは、言語モデルが複数の異なる高品質な出力を生成する能力を評価するために設計されたベンチマークである。我々は20の指導的言語モデルを評価し、現在の最先端システムは人間の書き手よりも著しく多様性が低いことを発見した。
論文参考訳（メタデータ） (2025-04-07T16:14:23Z)
Exploring Robustness of LLMs to Paraphrasing Based on Sociodemographic Factors [7.312170216336085]
我々は、SocialIQAデータセットを拡張して、社会デマログラフィー要因に基づく多様なパラフレーズセットを作成する。人口統計に基づく言い回しが言語モデルの性能に大きな影響を及ぼすことがわかった。
論文参考訳（メタデータ） (2025-01-14T17:50:06Z)
One fish, two fish, but not the whole sea: Alignment reduces language models' conceptual diversity [2.5975241792179378]
研究者は大規模言語モデル(LLM)を人間の行動研究の代替として使用することを提案した。トレーニング後のアライメント(RLHFまたはRLAIF)がモデルの内部多様性に影響を及ぼすかどうかが議論されている。我々は、シミュレーションされた個体の内部変動と集団レベルの変動を関連づけることで、合成合成LLMの「人口」の概念的多様性を測定する新しい方法を用いる。
論文参考訳（メタデータ） (2024-11-07T04:38:58Z)
Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。 CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文参考訳（メタデータ） (2024-11-01T01:51:31Z)
Capturing Bias Diversity in LLMs [1.9685736810241874]
本稿では,Large Language Models (LLMs) の拡張について,その出力の多様性を付加して検討する。性別,年齢,人種など,特定の人口特性のバイアスを反映したGPTモデルの複数のカスタムインスタンスを開発することにより,我々はBiasGPTと呼ぶ,よりニュアンスで代表的なAI対話のためのフレームワークを提案し,開発し,評価する。本稿では、実験を通じて、より包括的なAI技術の可能性を開くことができる様々なバイアスを埋め込むGPTモデルの能力を実証する。
論文参考訳（メタデータ） (2024-10-09T17:07:50Z)
PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文参考訳（メタデータ） (2024-07-17T08:13:22Z)
The Factuality Tax of Diversity-Intervened Text-to-Image Generation: Benchmark and Fact-Augmented Intervention [61.80236015147771]
我々は多様性の介入とT2Iモデルにおける人口統計学的事実性とのトレードオフを定量化する。 DoFaiRの実験では、多様性指向の指示によって、性別や人種の異なる集団の数が増加することが明らかになった。本研究では,歴史における世代ごとのジェンダーや人種構成について,言語化された事実情報を反映したFact-Augmented Intervention (FAI)を提案する。
論文参考訳（メタデータ） (2024-06-29T09:09:42Z)
Improving Diversity of Commonsense Generation by Large Language Models via In-Context Learning [28.654890118684957]
生成コモンセンス推論 (Generative Commonsense Reasoning, GCR) は、コモンセンス知識を用いて状況を理解するためのモデルを必要とする。生成の多様性は、モデルが様々な常識的知識事実を使用する能力を反映しているため、同様に重要である。そこで本研究では,LLMの世代を多様化し,その品質を保ちながら簡便な手法を提案する。
論文参考訳（メタデータ） (2024-04-25T17:52:39Z)
Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment [84.32768080422349]
人間の好みの調整は、大きな言語モデルが誤解を招くか有害なコンテンツを生成するのを防ぐ。本研究では, 微調整後のLLMの最終性能と線形相関を示唆し, 即時多様性の新たな定式化を提案する。
論文参考訳（メタデータ） (2024-03-17T07:08:55Z)
On the steerability of large language models toward data-driven personas [98.9138902560793]
大規模言語モデル(LLM)は、特定のグループや集団の意見が不足している偏りのある応答を生成することが知られている。本稿では, LLM を用いて特定の視点の制御可能な生成を実現するための新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-08T19:01:13Z)
Improving Factuality and Reasoning in Language Models through Multiagent Debate [95.10641301155232]
複数の言語モデルインスタンスが共通の最終回答に到達するために、複数のラウンドで個別の応答と推論プロセスを提案し、議論する言語応答を改善するための補完的なアプローチを提案する。以上の結果から,本手法は様々なタスクにおける数学的・戦略的推論を著しく向上させることが示唆された。我々のアプローチは、既存のブラックボックスモデルに直接適用され、調査するすべてのタスクに対して、同じ手順とプロンプトを使用することができる。
論文参考訳（メタデータ） (2023-05-23T17:55:11Z)
Measuring and Improving Semantic Diversity of Dialogue Generation [21.59385143783728]
生成した応答のセマンティックな多様性を測定するための新しい自動評価指標を提案する。提案手法は,既存の語彙レベルの多様性指標よりも,応答の多様性に関する人間の判断をよりよく捉えていることを示す。また、生成した応答のセマンティックな多様性を改善するための、シンプルで効果的な学習方法を提案する。
論文参考訳（メタデータ） (2022-10-11T18:36:54Z)
Evaluating the Evaluation of Diversity in Natural Language Generation [43.05127848086264]
本稿では,自然言語生成システムにおける多様性指標を評価するためのフレームワークを提案する。当社のフレームワークは,NLGシステムの改善に向けた重要なステップである,さまざまな多様性指標の理解を促進することができる。
論文参考訳（メタデータ） (2020-04-06T20:44:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。