論文の概要: Training Emergent Joint Associations: A Reinforcement Learning Approach to Creative Thinking in Language Models
- arxiv url: http://arxiv.org/abs/2511.17876v1
- Date: Sat, 22 Nov 2025 02:10:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.48869
- Title: Training Emergent Joint Associations: A Reinforcement Learning Approach to Creative Thinking in Language Models
- Title(参考訳): 創発的共同研究会:言語モデルにおける創造的思考への強化学習アプローチ
- Authors: Mukul Singh, Ananya Singha, Aishni Parab, Pronita Mehrotra, Sumit Gulwani,
- Abstract要約: 連想的思考は人間の創造性と問題解決の基礎的な要素である。
本稿では、連想的思考原理によって導かれる強化学習が、多種多様な生成タスクにおけるモデルの性能を高めることができるかどうかを考察する。
- 参考スコア(独自算出の注目度): 9.943285575387849
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Associative thinking--the ability to connect seemingly unrelated ideas--is a foundational element of human creativity and problem-solving. This paper explores whether reinforcement learning (RL) guided by associative thinking principles can enhance a model's performance across diverse generative tasks, including story writing, code generation, and chart creation. We introduce a reinforcement learning framework that uses a prompt-based evaluation mechanism, incorporating established divergent thinking metrics from creativity research. A base language model is fine-tuned using this framework to reward outputs demonstrating higher novelty through higher degrees of conceptual connectivity. Interestingly, the experimental results suggest that RL-based associative thinking-trained models not only generate more original and coherent stories but also exhibit improved abstraction and flexibility in tasks such as programming and data visualization. Our findings provide initial evidence that modeling cognitive creativity principles through reinforcement learning can yield more adaptive and generative AI.
- Abstract(参考訳): 連想的思考 — 一見無関係な考えを結び付ける能力 — は、人間の創造性と問題解決の基本的な要素である。
本稿では、連想的思考原理によって導かれる強化学習(RL)が、ストーリーライティング、コード生成、チャート作成を含む多種多様な生成タスクにおいて、モデルの性能を高めることができるかどうかを考察する。
本稿では,創造性研究から確立された多様な思考指標を取り入れた,素早い評価機構を用いた強化学習フレームワークを提案する。
基本言語モデルは、このフレームワークを使用して微調整され、概念接続の高次化を通じて、より高い新規性を示す出力を報酬する。
興味深いことに、実験結果は、RLに基づく連想的思考訓練モデルが、よりオリジナルで一貫性のあるストーリーを生成するだけでなく、プログラミングやデータ視覚化といったタスクにおける抽象化と柔軟性の向上も示している。
我々の発見は、強化学習によって認知的創造性原則をモデル化することで、より適応的で生成的なAIが得られるという最初の証拠を提供する。
関連論文リスト
- Combinatorial Creativity: A New Frontier in Generalization Abilities [14.121904952399975]
大規模言語モデル(LLM)における創造性のスケーリング挙動について検討する。
固定的な計算予算では、創造力に最適なモデル深さと幅が存在することが分かりました。
LLMは新たな科学的アイデアの創出に長けつつ,現実的な実現性確保に苦慮しているため,創造性アルゴリズムの基本的な新規性・実用性トレードオフ特性によって説明できる可能性が示唆された。
論文 参考訳(メタデータ) (2025-09-25T11:48:37Z) - Probing and Inducing Combinational Creativity in Vision-Language Models [52.76981145923602]
VLM(Vision-Language Models)の最近の進歩は、それらのアウトプットが組合せの創造性を反映しているかという議論を引き起こしている。
本稿では,創造的プロセスを3つのレベルに分解するIEIフレームワークを提案する。
このフレームワークを検証するために、IEIフレームワークに従って注釈付けされた666人のアーティストによる視覚マッシュアップの高品質データセットであるCreativeMashupをキュレートする。
論文 参考訳(メタデータ) (2025-04-17T17:38:18Z) - Embodied-R: Collaborative Framework for Activating Embodied Spatial Reasoning in Foundation Models via Reinforcement Learning [58.86928947970342]
Embodied-Rは、知覚のための大規模視覚言語モデルと推論のための小規模言語モデルを組み合わせたフレームワークである。
わずか5kのエボダイドビデオサンプルのトレーニングの後、Embodied-Rと3B LMは最先端のマルチモーダル推論モデルと一致した。
Embodied-Rは、体系的分析や文脈統合のような創発的な思考パターンも示している。
論文 参考訳(メタデータ) (2025-04-17T06:16:11Z) - OpenVLThinker: Complex Vision-Language Reasoning via Iterative SFT-RL Cycles [91.88062410741833]
我々はOpenVLThinkerを紹介した。OpenVLThinkerはオープンソースの大規模視覚言語モデル(LVLM)の1つである。
OpenVLThinker-7Bは、数学的および一般的な推論を必要とする6つのベンチマークで一貫して性能を向上することを示す。
論文 参考訳(メタデータ) (2025-03-21T17:52:43Z) - LLMs can Realize Combinatorial Creativity: Generating Creative Ideas via LLMs for Scientific Research [5.564972490390789]
本稿では,Large Language Models (LLM) を用いた創造性理論を明示的に実装するフレームワークを提案する。
このフレームワークは、クロスドメイン知識発見のための一般化レベル検索システムと、アイデア生成のための構造化プロセスを備えている。
OAG-Benchデータセットの実験は、我々のフレームワークの有効性を実証し、実際の研究成果と整合したアイデアを生成するためのベースラインアプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2024-12-18T18:41:14Z) - Can AI Be as Creative as Humans? [84.43873277557852]
理論的には、AIは人間の創造者によって生成されたデータに適切に適合できるという条件の下で、人間と同じくらい創造的になれることを証明しています。
AIの創造性に関する議論は、十分な量のデータに適合する能力の問題に縮小されている。
論文 参考訳(メタデータ) (2024-01-03T08:49:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。