論文の概要: Cultural Alien Sampler: Open-ended art generation balancing originality and coherence
- arxiv url: http://arxiv.org/abs/2510.20849v1
- Date: Tue, 21 Oct 2025 09:32:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 09:00:15.267358
- Title: Cultural Alien Sampler: Open-ended art generation balancing originality and coherence
- Title(参考訳): 文化異端者:独創性とコヒーレンスを兼ね備えたオープンエンドアート世代
- Authors: Alejandro H. Artiles, Hiromu Yakura, Levin Brinkmann, Mar Canet Sola, Hassan Abu Alhaija, Ignacio Serna, Nasim Rahaman, Bernhard Schölkopf, Iyad Rahwan,
- Abstract要約: 本稿では,文化的な典型から構成的適合を分離する概念選択手法である文化異性サンプリング(CAS)を紹介する。
CASは、コヒーレンスが高く、典型性が低い組み合わせをターゲットにしており、学習慣行や組み込み文化の文脈から逸脱しながら内部の一貫性を維持するアイデアを生み出している。
- 参考スコア(独自算出の注目度): 77.30507101341111
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In open-ended domains like art, autonomous agents must generate ideas that are both original and internally coherent, yet current Large Language Models (LLMs) either default to familiar cultural patterns or sacrifice coherence when pushed toward novelty. We address this by introducing the Cultural Alien Sampler (CAS), a concept-selection method that explicitly separates compositional fit from cultural typicality. CAS uses two GPT-2 models fine-tuned on WikiArt concepts: a Concept Coherence Model that scores whether concepts plausibly co-occur within artworks, and a Cultural Context Model that estimates how typical those combinations are within individual artists' bodies of work. CAS targets combinations that are high in coherence and low in typicality, yielding ideas that maintain internal consistency while deviating from learned conventions and embedded cultural context. In a human evaluation (N = 100), our approach outperforms random selection and GPT-4o baselines and achieves performance comparable to human art students in both perceived originality and harmony. Additionally, a quantitative study shows that our method produces more diverse outputs and explores a broader conceptual space than its GPT-4o counterpart, demonstrating that artificial cultural alienness can unlock creative potential in autonomous agents.
- Abstract(参考訳): アートのようなオープンエンドのドメインでは、自律的なエージェントは、オリジナルと内部の一貫性の両方を持つアイデアを生成する必要があります。
そこで本稿では, コンポジション適合を文化的特徴と明確に分離する概念選択手法であるCAS(Cultural Alien Sampler)を導入することにより, この問題に対処する。
CASは、WikiArtのコンセプトに基づいて微調整された2つのGPT-2モデルを使用している。
CASは、コヒーレンスが高く、典型性が低い組み合わせをターゲットにしており、学習慣行や組み込み文化の文脈から逸脱しながら内部の一貫性を維持するアイデアを生み出している。
人間の評価(N = 100)において,提案手法はランダム選択とGPT-4oベースラインより優れ,独創性と調和の両面において,人間の美術学生に匹敵する性能を発揮する。
さらに、定量的研究により、我々の手法はより多様なアウトプットを生成し、GPT-4oよりも広い概念空間を探索し、人工的な文化的異性は自律エージェントの創造性を解き放つことを実証した。
関連論文リスト
- Beyond Instrumental and Substitutive Paradigms: Introducing Machine Culture as an Emergent Phenomenon in Large Language Models [9.785535924216765]
本研究は,TextbfMachine Cultureを創発的で異なる現象として提案する。
私たちは8つのマルチモーダルタスクで2ドル(Model Origin: US vs. China)の2ドル(Prompt Language: English vs. Chinese)のファクターデザインを採用しました。
LLMは人間の文化をシミュレートするのではなく、創発的な機械文化を示すと結論付けている。
論文 参考訳(メタデータ) (2026-01-23T13:11:28Z) - CALM: Culturally Self-Aware Language Models [22.309957211042597]
CALMは、文化的自己認識を持つ言語モデルを支援するために設計された新しいフレームワークである。
タスクのセマンティクスを、明示的な文化的概念や潜伏した文化的シグナルから切り離す。
結果として得られた統一表現は、文化的に根ざした内的アイデンティティ状態を構築するためのモデル本来の知識と融合する。
論文 参考訳(メタデータ) (2026-01-07T00:28:33Z) - Reasoning Shapes Alignment: Investigating Cultural Alignment in Large Reasoning Models with Cultural Norms [31.988103618954536]
本稿では,文化規範と整合する強力な推論能力をモデルに活用する,文化規範に基づく文化的アライメント(CNCA)フレームワークを提案する。
2つのアライメントパラダイムについて検討する: コンテキスト内アライメント法と微調整に基づく手法で、改良されたChain-of-Thoughtトレーニングデータを通じて規範を内部化する。
本研究は、文化的に情報を得たアライメント戦略により、推論モデルが多種多様な人間の価値をよりよく反映する可能性を強調した。
論文 参考訳(メタデータ) (2025-11-17T13:29:22Z) - CAIRe: Cultural Attribution of Images by Retrieval-Augmented Evaluation [61.130639734982395]
本稿では,画像の文化的関連度を評価する新しい評価指標であるCAIReを紹介する。
本フレームワークは,イメージ内の実体と概念を知識ベースに基盤として,実情報を用いて各文化ラベルに対して独立した評価を行う。
論文 参考訳(メタデータ) (2025-06-10T17:16:23Z) - From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test [50.51344198689069]
我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好に対処するために,モデルの内部表現空間に直接,文化固有の意味的関連性を直接埋め込む革新的なアプローチであるCultureSteerを提案する。
論文 参考訳(メタデータ) (2025-05-24T07:05:10Z) - CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.90288681622152]
大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。
既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。
本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文 参考訳(メタデータ) (2025-04-09T13:40:13Z) - Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。
我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。
本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文 参考訳(メタデータ) (2024-11-18T11:55:38Z) - Beyond Aesthetics: Cultural Competence in Text-to-Image Models [34.98692829036475]
CUBEは、テキスト・ツー・イメージ・モデルの文化的能力を評価するための最初のベンチマークである。
CUBEは、異なる地理的文化圏の8か国に関連する文化的アーティファクトをカバーしている。
CUBE-CSpaceは、文化的多様性を評価する基盤となる文化的アーティファクトのより大きなデータセットである。
論文 参考訳(メタデータ) (2024-07-09T13:50:43Z) - From Local Concepts to Universals: Evaluating the Multicultural Understanding of Vision-Language Models [10.121734731147376]
視覚言語モデルの性能は、西欧文化のイメージに最適以下である。
様々なベンチマークが、モデルの文化的傾向をテストするために提案されているが、それらは限られた範囲の文化をカバーしている。
我々はGlobalRGベンチマークを導入し、普遍性を越えた検索と文化的な視覚的接地という2つの課題からなる。
論文 参考訳(メタデータ) (2024-06-28T23:28:28Z) - Extrinsic Evaluation of Cultural Competence in Large Language Models [53.626808086522985]
本稿では,2つのテキスト生成タスクにおける文化能力の評価に焦点をあてる。
我々は,文化,特に国籍の明示的なキューが,そのプロンプトに乱入している場合のモデル出力を評価する。
異なる国におけるアウトプットのテキスト類似性とこれらの国の文化的価値との間には弱い相関関係がある。
論文 参考訳(メタデータ) (2024-06-17T14:03:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。