論文の概要: Evaluating Pluralism in LLMs through Latent Perspectives
- arxiv url: http://arxiv.org/abs/2606.13254v1
- Date: Thu, 11 Jun 2026 12:11:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.778401
- Title: Evaluating Pluralism in LLMs through Latent Perspectives
- Title(参考訳): 後期視点によるLCMの多元性評価
- Authors: Laura Majer, Jan Šnajder, Martin Tutek,
- Abstract要約: LLM生成テキストの多元的ギャップを特定するのに適した視点の教師なし抽出のためのドメインに依存しない多層フレームワークを導入し実装する。
以上の結果から,いくつかのモデルやプロンプト技術は幅広い視点を網羅するに近づいているものの,希少な視点は相変わらず過小評価され続けていることが示唆された。
- 参考スコア(独自算出の注目度): 3.4155322317700576
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The growing need to represent diverse perspectives has increased interest in pluralistic LLM generation. Although difficult to operationalize, identifying perspectives expressed in text would provide clear guidance on pluralistic alignment and more clearly articulate the pluralistic gap in LLM generation. While models have been shown to reduce the diversity of training data and generate homogeneously, this has been demonstrated primarily on multiple-choice questionnaires or using high-level characteristics of free-form text. In this paper, we introduce and implement a domain-agnostic multi-layered framework for unsupervised extraction of perspectives suitable for identifying the pluralistic gap in LLM-generated text. We evaluate our framework on book reviews, a highly opinionated dataset representing diverse perspectives, and compare various prompts and models. Our results show that while some models and prompting techniques come close to covering a broad spectrum of perspectives, rarer perspectives remain disproportionately underrepresented, resulting in distributions that diverge from human text.
- Abstract(参考訳): 多様な視点で表現する必要性が高まるにつれ、多元的LLM生成への関心が高まっている。
操作は難しいが、テキストで表される視点を特定することは、多元的アライメントの明確なガイダンスを提供し、LLM生成における多元的ギャップをより明確に表現する。
モデルはトレーニングデータの多様性を減らし、均一に生成することが示されているが、これは主に複数項目のアンケートや、自由形式のテキストの高レベルな特徴を用いて実証されている。
本稿では,LLM生成テキストの多元的ギャップを特定するのに適した視点を教師なしで抽出するためのドメインに依存しない多層フレームワークを提案し,実装する。
書評の枠組みは,多様な視点を表わす高度に評価されたデータセットであり,様々なプロンプトやモデルと比較する。
以上の結果から,いくつかのモデルやプロンプト技術は幅広い視点を網羅するに近づいているが,稀な視点は相変わらず表現不足であり,その結果,人間の文章から分岐する分布が生じることが示唆された。
関連論文リスト
- Bridging Lexical Ambiguity and Vision: A Mini Review on Visual Word Sense Disambiguation [0.0]
Visual Word Sense Disambiguationは、視覚言語タスクにおける語彙的曖昧性に取り組むのに役立つ。
VWSDは、最小のテキスト入力で曖昧な単語の正しい意味を見つけるために視覚的手がかりを使用する。
2016年から2025年にかけての研究では、特徴ベース、グラフベース、コントラスト埋め込み技術によるVWSDの成長について検討した。
論文 参考訳(メタデータ) (2026-02-01T12:36:01Z) - Multi-Novelty: Improve the Diversity and Novelty of Contents Generated by Large Language Models via inference-time Multi-Views Brainstorming [3.591342811819669]
LLM(Large Language Models)は、正確で流動的なテキストを生成するのに顕著な習熟度を示す。
彼らはしばしば多様性と斬新さと闘い、反復的あるいは過度に決定論的反応をもたらす。
多様な視点でインプットプロンプトを強化する新しい手法である推論時マルチビューブレインストーミング手法を導入する。
論文 参考訳(メタデータ) (2025-02-18T10:04:20Z) - ViLBias: Detecting and Reasoning about Bias in Multimodal Content [6.710013984078675]
ViLBiasは、マルチモーダルニュースにおけるバイアスの検出と推論のためのフレームワークである。
データセットは40,945のテキストペアで構成されている。
その結果,テキストによる画像の検出精度は3~5%向上した。
論文 参考訳(メタデータ) (2024-12-22T15:05:30Z) - Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。
CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。
本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-01T01:51:31Z) - Multi-modal Instruction Tuned LLMs with Fine-grained Visual Perception [63.03288425612792]
マルチモーダル参照から画素単位のオブジェクト認識と自然言語記述を生成できる汎用MLLMモデルであるbfAnyRefを提案する。
本モデルでは,領域レベルの参照表現生成とセグメンテーションの多様さを含む,複数のベンチマークにおける最先端結果を実現する。
論文 参考訳(メタデータ) (2024-03-05T13:45:46Z) - Exploring Precision and Recall to assess the quality and diversity of LLMs [82.21278402856079]
我々はtextscLlama-2 や textscMistral のような大規模言語モデル (LLM) のための新しい評価フレームワークを提案する。
このアプローチにより、コーパスの整合を必要とせず、生成したテキストの品質と多様性を微妙に評価できる。
論文 参考訳(メタデータ) (2024-02-16T13:53:26Z) - How Far Can We Extract Diverse Perspectives from Large Language Models? [16.16678226707335]
大規模言語モデル(LLM)が主観的トピックに対する多様な視点を生成できることを示す。
本稿では,様々な意見の根拠となる基準に基づくプロンプト手法を提案する。
本手法は,タスク主観性の度合いに応じて,LLMが多種多様な意見を生成可能であることを示す。
論文 参考訳(メタデータ) (2023-11-16T11:23:38Z) - OCRBench: On the Hidden Mystery of OCR in Large Multimodal Models [122.27878464009181]
テキスト関連視覚タスクにおいて, GPT4V や Gemini などの大規模マルチモーダルモデルの包括的評価を行った。
OCRBenchには29のデータセットがあり、最も包括的なOCR評価ベンチマークが利用できる。
論文 参考訳(メタデータ) (2023-05-13T11:28:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。