論文の概要: Lighting Up or Dimming Down? Exploring Dark Patterns of LLMs in Co-Creativity
- arxiv url: http://arxiv.org/abs/2604.04735v1
- Date: Mon, 06 Apr 2026 15:03:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.238167
- Title: Lighting Up or Dimming Down? Exploring Dark Patterns of LLMs in Co-Creativity
- Title(参考訳): ライティングアップかダイミングダウンか?-コクリーティビティにおけるLCMの暗パターンを探る
- Authors: Zhu Li, Jiaming Qu, Yuan Chang,
- Abstract要約: 我々は,ヒトとAIの共創造性の5つの「暗黒パターン」について検討する: サイコフィナンシー,トーン・ポーシング,モラル化,死のループ,アンコリング。
予備的な結果は、特にセンシティブなトピックにおいて、Sycophancyはほぼユビキタスである(91.7%のケース)ことを示唆している。
この研究は、これらの暗いパターン、しばしば安全アライメントの副産物は、必然的に創造的な探究を狭める可能性があることを示唆している。
- 参考スコア(独自算出の注目度): 15.854854496840076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly acting as collaborative writing partners, raising questions about their impact on human agency. In this exploratory work, we investigate five "dark patterns" in human-AI co-creativity -- subtle model behaviors that can suppress or distort the creative process: Sycophancy, Tone Policing, Moralizing, Loop of Death, and Anchoring. Through a series of controlled sessions where LLMs are prompted as writing assistants across diverse literary forms and themes, we analyze the prevalence of these behaviors in generated responses. Our preliminary results suggest that Sycophancy is nearly ubiquitous (91.7% of cases), particularly in sensitive topics, while Anchoring appears to be dependent on literary forms, surfacing most frequently in folktales. This study indicates that these dark patterns, often byproducts of safety alignment, may inadvertently narrow creative exploration and proposes design considerations for AI systems that effectively support creative writing.
- Abstract(参考訳): 大規模言語モデル(LLM)は、協力的な執筆パートナーとしての役割を担い、人事機関への影響について疑問を呈している。
本研究では,人間とAIの共創造性の5つの「暗黒パターン」を探索し,創造的プロセスを抑制・歪曲する微妙なモデル行動について考察する: サイコフィケーション,トーンポーシング,モラル化,死のループ,アンコリング。
様々な文体やテーマにまたがる筆記アシスタントとしてLLMを誘導する一連の制御セッションを通じて,これらの行動が生成した応答の頻度を分析する。
我々の予備的な結果は、特にセンシティブな話題において、シコファンシーはほぼユビキタス(症例の91.7%)であり、アンチョーリングは文学形式に依存しており、民俗学において最も頻繁に取り上げられていることを示唆している。
この研究は、これらの暗いパターン、しばしば安全アライメントの副産物は、必然的に創造的な探索を狭くし、創造的な執筆を効果的に支援するAIシステムの設計上の考慮を提案することを示唆している。
関連論文リスト
- Living the Novel: A System for Generating Self-Training Timeline-Aware Conversational Agents from Novels [50.43968216132018]
文芸作品が没入的で多文字の会話体験に変換されるエンド・ツー・エンドシステムを提案する。
このシステムはLLM駆動文字の2つの基本的な課題を解決するために設計されている。
論文 参考訳(メタデータ) (2025-12-08T11:57:46Z) - Decoding the Black Box: Discerning AI Rhetorics About and Through Poetic Prompting [0.0]
この研究は、創造的なテキストプロンプト、特にPetry Prompt Patternsは、プロンプトエンジニアのツールボックスに便利な追加かもしれないことを示唆している。
この論文は、著名な詩人の3つのモデルの記述と評価を評価するために詩的なプロンプトを使用する。
論文 参考訳(メタデータ) (2025-12-04T20:41:39Z) - Writing in Symbiosis: Mapping Human Creative Agency in the AI Era [7.321985748280817]
LLM(Large Language Models)の普及は、説得力と創造性を持つ機械との共生関係がますます高まっているときに、それが人間であることの意味について批判的な疑問を提起する。
本稿では,創造的執筆における人間とAIの共進化のパターンを考察し,人間工芸とエージェンシーが機械能力とどのように適応しているかを考察する。
論文 参考訳(メタデータ) (2025-11-28T22:12:53Z) - Eliciting Language Model Behaviors with Investigator Agents [93.34072434845162]
言語モデルは、自由形式のテキストで促されるとき、複雑で多様な振る舞いを示す。
本研究の目的は,特定の対象行動を引き起こすプロンプトを探索することである。
我々は調査員モデルを訓練し、ランダムに目的とする振る舞いを、それらを引き出す出力の多様な分布にマッピングする。
論文 参考訳(メタデータ) (2025-02-03T10:52:44Z) - Integrating Dark Pattern Taxonomies [0.0]
過去10年間で、悪質で挑発的なデザインが複数のドメインに拡張された。
本稿では,ネットワーク解析ツールや手法に頼って,有向グラフとして既存の要素を合成する。
そうすることで、ダークパターンの相互接続性は、コミュニティ検出によってより明確になる。
論文 参考訳(メタデータ) (2024-02-26T17:26:31Z) - Affective and Dynamic Beam Search for Story Generation [50.3130767805383]
面白い物語を生成するために、AffGen(Affective Story Generator)を提案する。
AffGenはDynamic Beam SizeとAffective Re rankという2つの新しいテクニックを採用している。
論文 参考訳(メタデータ) (2023-10-23T16:37:14Z) - Getting Trapped in Amazon's "Iliad Flow": A Foundation for the Temporal Analysis of Dark Patterns [17.59481743387609]
本稿では,Amazon Primeの"Iliad Flow"を事例として,ユーザジャーニーにおけるダークパターンの相互作用を説明する。
我々はこのケーススタディを用いて、時間的暗黒パターン分析(TADP)の方法論の基礎を定めている。
論文 参考訳(メタデータ) (2023-09-18T10:12:52Z) - Re-Reading Improves Reasoning in Large Language Models [87.46256176508376]
既成のLarge Language Models (LLM) の推論能力を高めるため, 単純で汎用的で効果的なプロンプト手法であるRe2を導入する。
CoT (Chain-of-Thought) など、ほとんどの思考を刺激する手法とは異なり、Re2 は質問を2回処理することで入力に焦点を移し、理解プロセスを強化する。
提案手法の有効性と汎用性を検証するため,14のデータセットにまたがる広範囲な推論ベンチマークでRe2を評価した。
論文 参考訳(メタデータ) (2023-09-12T14:36:23Z) - Visual Adversarial Examples Jailbreak Aligned Large Language Models [66.53468356460365]
視覚入力の連続的かつ高次元的な性質は、敵対的攻撃に対する弱いリンクであることを示す。
我々は、視力統合されたLLMの安全ガードレールを回避するために、視覚的敵の例を利用する。
本研究は,マルチモダリティの追求に伴う敵のエスカレーションリスクを浮き彫りにする。
論文 参考訳(メタデータ) (2023-06-22T22:13:03Z) - Language Generation Models Can Cause Harm: So What Can We Do About It?
An Actionable Survey [50.58063811745676]
この研究は、言語生成モデルから潜在的脅威や社会的害に対処するための実践的な方法の調査を提供する。
言語生成者のさまざまなリスク・ハームを検知・改善するための戦略の構造化された概要を提示するために、言語モデルリスクのいくつかの先行研究を取り上げる。
論文 参考訳(メタデータ) (2022-10-14T10:43:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。