論文の概要: Ex Ante Evaluation of AI-Induced Idea Diversity Collapse
- arxiv url: http://arxiv.org/abs/2605.06540v1
- Date: Thu, 07 May 2026 16:38:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:12.004417
- Title: Ex Ante Evaluation of AI-Induced Idea Diversity Collapse
- Title(参考訳): AIによる理想的多様性の崩壊の指数的評価
- Authors: Nafis Saami Azad, Raiyan Abdul Baten,
- Abstract要約: 本稿では,AIによるヒトの多様性崩壊をベンチマークするための人間関係フレームワークを提案する。
コングリゲート可能な資源としてアイデアをモデル化することにより、ソースレベルの集団化が流通内比較から特定可能であることを示す。
例えば、$ge1$は必要のないパリティ条件であり、露出依存冗長コストで採用ゲームに$$を接続することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creative AI systems are typically evaluated at the level of individual utility, yet creative outputs are consumed in populations: an idea loses value when many others produce similar ones. This creates an evaluation blind spot, as AI can improve individual outputs while increasing population-level crowding. We introduce a human-relative framework for benchmarking AI-induced human diversity collapse without requiring human-AI interaction data, providing an ex ante protocol to estimate crowding risk from model-only generations and matched unaided human baselines. By modeling ideas as congestible resources, we show that source-level crowding is identifiable from within-distribution comparisons, yielding an excess-crowding coefficient $Δ$ and a human-relative diversity ratio $ρ$. We show that $ρ\ge1$ is the no-excess-crowding parity condition and connect $Δ$ to an adoption game with exposure-dependent redundancy costs. Across short stories, marketing slogans, and alternative-uses tasks, three frontier LLMs fall below parity across crowding kernels. Estimates stabilize with feasible model-only sample sizes. Importantly, generation-protocol variants show that crowding can be reduced through targeted design, making diversity collapse an actionable, development-time evaluation target for population-aware creative AI.
- Abstract(参考訳): 創造的なAIシステムは一般的に個々のユーティリティのレベルで評価されるが、創造的なアウトプットは集団で消費される。
これにより、AIは人口レベルの群衆を増やしながら、個々のアウトプットを改善することができるため、評価の盲点が生まれる。
我々は,人間とAIのインタラクションデータを必要としない,AIによる人間の多様性崩壊のベンチマークを行うための,人間関係のフレームワークを紹介した。
共役資源としてアイデアをモデル化することにより、ソースレベルの集団化は、分布内比較から特定可能であり、過剰な共役係数$Δ$と人間相対多様性比$ρ$が得られることを示す。
我々は,$ρ\ge1$が余剰なパーティ条件であることを示し,露出依存冗長コストを持つ採用ゲームに$Δ$を接続する。
短いストーリー、マーケティングスローガン、代替用途タスクを含む3つのLLMは、群がったカーネルで同等以下になる。
推定値はモデルのみのサンプルサイズで安定する。
重要なのは、ジェネレーションプロトコールの変種は、ターゲット設計によって群集を減らし、多様性の崩壊を、人口を意識したクリエイティブAIのための実用的な開発時間評価ターゲットとすることを示している。
関連論文リスト
- Incentives shape how humans co-create with generative AI [3.182696575286433]
創造的な執筆作業において、AIの均質化力を仲介するインセンティブが示される。
その結果、生成AIの効果は技術そのものだけでなく、その利用を取り巻く行動戦略やインセンティブ構造にも依存していることが明らかとなった。
論文 参考訳(メタデータ) (2026-04-04T00:18:51Z) - The Novelty Bottleneck: A Framework for Understanding Human Effort Scaling in AI-Assisted Work [4.726153739634646]
新規性ボトルネックと呼ばれるメカニズムを分離した人間とAIのコラボレーションモデルを提案する。
モデルはタスクが原子的な決定に分解されると仮定する。
私たちの貢献は、人間の努力が線形にスケールしなければならないという証拠ではありません。
論文 参考訳(メタデータ) (2026-03-28T22:50:13Z) - Epistemic diversity across language models mitigates knowledge collapse [0.4941630596191806]
生態学にインスパイアされた私たちは、AIエコシステムの多様性、すなわちモデル間の多様性が、このような崩壊を緩和できるかどうかを尋ねる。
モデル性能に対する多様性の影響を調べるため,言語モデルにまたがるトレーニングデータを分割し,10回の自己学習イテレーションで得られたエコシステムを評価する。
以上の結果から,少数の多様なモデルのみを含む生態系は,完全かつ真の分布のリッチな混合を表現できないことが示唆された。
論文 参考訳(メタデータ) (2025-12-17T02:03:28Z) - Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond) [90.45301024940329]
言語モデル(LM)は、多様で人間らしい創造的コンテンツを生成するのに苦労することが多い。
Infinity-Chatは26万の多様な実世界のオープンエンドユーザクエリからなる大規模データセットである。
本研究では, LMのモード崩壊について大規模に検討し, 人工Hivemind効果が明らかとなった。
論文 参考訳(メタデータ) (2025-10-27T03:16:21Z) - DisCo: Reinforcement with Diversity Constraints for Multi-Human Generation [60.741022906593685]
DisCoは、マルチヒューマン世代におけるアイデンティティの多様性を直接最適化する最初のRLベースのフレームワークである。
グループ相対ポリシー最適化によるDisCo微粒フローマッチングモデル。
DiverseHumans Testsetでは、DisCoは98.6のユニークな顔の精度とほぼ完璧なグローバルアイデンティティスプレッドを実現している。
論文 参考訳(メタデータ) (2025-10-01T19:28:51Z) - Generative Models, Humans, Predictive Models: Who Is Worse at High-Stakes Decision Making? [10.225573060836478]
大規模な生成モデル(LM)は、これまで予測モデルや人間によって行われていた意思決定タスクに既に使用されている。
我々は、高い意思決定タスクである再帰的予測において、人気のあるLMをテストに投入した。
論文 参考訳(メタデータ) (2024-10-20T19:00:59Z) - AI and the Problem of Knowledge Collapse [0.0]
特定の知識モードへのアクセスコストを削減することにより、AIが公衆の理解をパラドックス的に損なう可能性のある条件を特定する。
学習者やイノベーターのコミュニティが従来の手法を使うか、割引されたAI支援プロセスに頼るというシンプルなモデルを提供する。
我々のデフォルトモデルでは、AI生成コンテンツに対する20%の割引は、ディスカウントがない場合よりも真実から2.3倍の信条を生成する。
論文 参考訳(メタデータ) (2024-04-04T15:06:23Z) - Exploring the Robustness of Human Parsers Towards Common Corruptions [99.89886010550836]
我々は,LIP-C,ATR-C,Pascal-Person-Part-Cという3つの汚職堅牢性ベンチマークを構築し,人間の解析モデルのリスク許容度を評価する。
データ強化戦略に触発されて、一般に破損した条件下で頑健性を高めるための新しい異種強化機構を提案する。
論文 参考訳(メタデータ) (2023-09-02T13:32:14Z) - Regularizing Variational Autoencoder with Diversity and Uncertainty
Awareness [61.827054365139645]
変分オートエンコーダ(VAE)は、償却変分推論に基づいて潜伏変数の後部を近似する。
よりディバースで不確実な潜在空間を学習するための代替モデルDU-VAEを提案する。
論文 参考訳(メタデータ) (2021-10-24T07:58:13Z) - AvgOut: A Simple Output-Probability Measure to Eliminate Dull Responses [97.50616524350123]
機能エンジニアリングなしで、どの発話やトークンが退屈であるかを動的に認識する対話モデルを構築します。
最初のモデルMinAvgOutは、各バッチの出力分布を通して、ダイバーシティスコアを直接最大化する。
第2のモデルであるラベルファインチューニング(LFT)は、多様性スコアによって連続的にスケールされたラベルをソースシーケンスにプリペイドし、多様性レベルを制御する。
3つ目のモデルであるRLは強化学習を採用し、多様性スコアを報奨信号として扱う。
論文 参考訳(メタデータ) (2020-01-15T18:32:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。