論文の概要: Exploration vs. Fixation: Scaffolding Divergent and Convergent Thinking for Human-AI Co-Creation with Generative Models
- arxiv url: http://arxiv.org/abs/2512.18388v1
- Date: Sat, 20 Dec 2025 14:58:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.313782
- Title: Exploration vs. Fixation: Scaffolding Divergent and Convergent Thinking for Human-AI Co-Creation with Generative Models
- Title(参考訳): 探索対固定:世代モデルを用いた人間とAIのコクレーションのための多様性と収束思考の共有
- Authors: Chao Wen, Tung Phung, Pronita Mehrotra, Sumit Gulwani, Tomohiro Nagashima, Adish Singla,
- Abstract要約: 本稿では,プロセス指向の人間とAIの共創パラダイムを提案する。
我々のパラダイムは、初期の散逸した思考段階における概念概念の高レベルな探索と、後の収束した思考フレーズにおける変化の低レベルな探索の両方である。
本稿では、HAIExploreと広く使われている線形チャットインタフェース(ChatGPT)を比較して、クリエイティブな画像生成を行う。
- 参考スコア(独自算出の注目度): 26.911618039280665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative AI has begun to democratize creative work, enabling novices to produce complex artifacts such as code, images, and videos. However, in practice, existing interaction paradigms often fail to support divergent exploration: users tend to converge too quickly on early ``good enough'' results and struggle to move beyond them, leading to premature convergence and design fixation that constrains their creative potential. To address this, we propose a structured, process-oriented human-AI co-creation paradigm including divergent and convergent thinking stages, grounded in Wallas's model of creativity. To avoid design fixation, our paradigm scaffolds both high-level exploration of conceptual ideas in the early divergent thinking phase and low-level exploration of variations in the later convergent thinking phrase. We instantiate this paradigm in HAIExplore, an image co-creation system that (i) scaffolds divergent thinking through a dedicated brainstorming stage for exploring high-level ideas in a conceptual space, and (ii) scaffolds convergent refinement through an interface that externalizes users' refinement intentions as interpretable parameters and options, making the refinement process more controllable and easier to explore. We report on a within-subjects study comparing HAIExplore with a widely used linear chat interface (ChatGPT) for creative image generation. Our findings show that explicitly scaffolding the creative process into brainstorming and refinement stages can mitigate design fixation, improve perceived controllability and alignment with users' intentions, and better support the non-linear nature of creative work. We conclude with design implications for future creativity support tools and human-AI co-creation workflows.
- Abstract(参考訳): 生成AIは創造的な仕事の民主化を始めており、初心者はコード、画像、ビデオなどの複雑なアーティファクトを作成できる。
しかし、実際には、既存の相互作用パラダイムは、しばしば分岐探索をサポートするのに失敗する。ユーザは、早期の ‘ ` good enough'' 結果にあまりにも早く収束しすぎ、それらを超えて動くのに苦労する傾向にあり、創造的なポテンシャルを制限する早すぎる収束と設計の定着につながる。
そこで我々は,ワラスの創造性モデルに基づく,多元的・収束的思考段階を含む構造化されたプロセス指向の人間-AI共創パラダイムを提案する。
設計の固定を避けるため,本パラダイムは,初期の散逸した思考段階における概念概念の高レベルな探索と,後の収束した思考フレーズにおける変化の低レベルな探索の両方を行う。
私たちはこのパラダイムを、画像の共同作成システムであるHAIExploreでインスタンス化する。
一 概念空間における高位観念を探求するための専用の脳鳴りの段階を通して考えを散逸させる足場
二 利用者の精錬意図を解釈可能なパラメータとオプションとして外部化するインタフェースを通じて精錬を収束させ、精錬プロセスをより制御しやすく、探索しやすくする。
本稿では、HAIExploreと広く使われている線形チャットインタフェース(ChatGPT)を比較して、クリエイティブな画像生成を行う。
本研究は,創造的プロセスをブレインストーミングと改良段階に明確に足場化することで,デザインの修正を緩和し,ユーザの意図に合わせた制御性と整合性を向上し,創造的作業の非線形性をより良く支援できることを示す。
今後のクリエイティビティ支援ツールと人間とAIの共創ワークフローの設計上の意味を結論づける。
関連論文リスト
- VLM-Guided Adaptive Negative Prompting for Creative Generation [21.534474554320823]
創造的生成(Creative generation)とは、ユーザの意図を反映する新しい、驚き、価値あるサンプルを事前に想像できない形で合成することである。
本稿では,VLM-Guided Adaptive Negative-Promptingを提案する。
創造的ノベルティにおいて,計算オーバーヘッドの無視による一貫した向上を示す。
論文 参考訳(メタデータ) (2025-10-12T17:34:59Z) - ThematicPlane: Bridging Tacit User Intent and Latent Spaces for Image Generation [49.805992099208595]
ThematicPlaneは,ユーザが高レベルのセマンティック概念をナビゲートし操作できるシステムである。
このインターフェースは、暗黙の創造意図とシステム制御のギャップを埋める。
論文 参考訳(メタデータ) (2025-08-08T06:57:14Z) - Large Language Models as Innovators: A Framework to Leverage Latent Space Exploration for Novelty Discovery [19.394116388173885]
大規模言語モデル(LLM)は、しばしば新規かつ関連する出力を生成するのに苦労する。
本稿では,モデルに依存しない潜在空間の創造性を実現するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-18T12:54:28Z) - Scaffolding Recursive Divergence and Convergence in Story Ideation [19.650585665200254]
RevergerはAIを活用したクリエイティビティ支援ツール(CST)で、ユーザーがストーリーを変更するための概念的な方向のバリエーションを想像するのに役立つ。
分散のために、ユーザは調査対象の高レベルな方向を収集し、それらを具体的なバリエーションに合成することができる。
収束のために、ユーザは調査対象の高レベルな方向を収集し、それらを具体的なバリエーションに合成することができる。
論文 参考訳(メタデータ) (2025-07-04T05:25:19Z) - Thinking with Generated Images [30.28526622443551]
我々は,大規模マルチモーダルモデル(LMM)が視覚的推論にどのように関与するかを変換する,新しいパラダイムであるThinking with Generated Imagesを紹介する。
我々のアプローチは、AIモデルが人間の創造的、分析的、戦略的思考を特徴づける視覚的想像力や反復的な洗練に関わり得ることを可能にする。
論文 参考訳(メタデータ) (2025-05-28T16:12:45Z) - Cooking Up Creativity: Enhancing LLM Creativity through Structured Recombination [46.79423188943526]
本稿では,LLM(Large Language Models)の創造性を高める新しいアプローチを提案する。
自然言語と構造化表現の翻訳にLLMを適用し,その中心となる創造的飛躍を行う。
我々は、創造的なレシピを生成するモデルであるDishCOVERを用いて、料理分野における我々のアプローチを実証する。
論文 参考訳(メタデータ) (2025-04-29T11:13:06Z) - Probing and Inducing Combinational Creativity in Vision-Language Models [52.76981145923602]
VLM(Vision-Language Models)の最近の進歩は、それらのアウトプットが組合せの創造性を反映しているかという議論を引き起こしている。
本稿では,創造的プロセスを3つのレベルに分解するIEIフレームワークを提案する。
このフレームワークを検証するために、IEIフレームワークに従って注釈付けされた666人のアーティストによる視覚マッシュアップの高品質データセットであるCreativeMashupをキュレートする。
論文 参考訳(メタデータ) (2025-04-17T17:38:18Z) - Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。
我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。
本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文 参考訳(メタデータ) (2024-11-18T11:55:38Z) - A Novel Idea Generation Tool using a Structured Conversational AI (CAI) System [0.0]
本稿では、初心者デザイナーを支援する創造的アイデア生成ツールとして、対話型AIを活用したアクティブなアイデア生成インタフェースを提案する。
これは動的でインタラクティブで文脈に応答するアプローチであり、人工知能(AI)における自然言語処理(NLP)の領域から大きな言語モデル(LLM)を積極的に巻き込む。
このようなAIモデルとアイデアの統合は、連続的な対話ベースのインタラクション、コンテキストに敏感な会話、多彩なアイデア生成の促進に役立つ、アクティブな理想化(Active Ideation)シナリオと呼ばれるものを生み出します。
論文 参考訳(メタデータ) (2024-09-09T16:02:27Z) - ConceptLab: Creative Concept Generation using VLM-Guided Diffusion Prior
Constraints [56.824187892204314]
我々は創造的なテキスト・画像生成の課題を提示し、幅広いカテゴリの新しいメンバーを創り出そうとする。
本稿では, 先行拡散の出力空間上での最適化プロセスとして, 創造的生成問題を定式化できることを示す。
我々は、最適化問題に新たな制約を適応的に付加する質問応答型視覚言語モデル(VLM)を導入し、よりユニークな生成物を発見するようモデルに促す。
論文 参考訳(メタデータ) (2023-08-03T17:04:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。