論文の概要: From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains
- arxiv url: http://arxiv.org/abs/2603.07184v1
- Date: Sat, 07 Mar 2026 12:50:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:13.999559
- Title: From State Changes to Creative Decisions: Documenting and Interpreting Traces Across Creative Domains
- Title(参考訳): 状態変化から創造的決定へ:創造的ドメイン間のトレースの文書化と解釈
- Authors: Xiaohan Peng, Sotiris Piliouras, Carl Abou Saada Nujaim,
- Abstract要約: 既存のアプローチは、より高いレベルの創造的な動きを定義する意図や関係を保存することなく、状態変化を記録する。
我々は、ステートフルなGenAIアーティファクト管理のためのノードベースのインターフェース、可視化オーサリングにおける高レベルの創造的な動きとしての視覚的キューの語彙、セマンティックヒストリーを直接相互作用状態に組み込むプログラミングモデル、の3つの補完的アプローチを提案する。
- 参考スコア(独自算出の注目度): 1.2744523252873352
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Analyzing creative activity traces requires capturing activity at appropriate granularity and interpreting it in ways that reflect the structure of creative practice. However, existing approaches record state changes without preserving the intent or relationships that define higher-level creative moves. This decoupling manifests differently across domains: GenAI tools lose non-linear exploration structure, visualization authoring obscures representational intent, and programmatic environments flatten interaction boundaries. We present three complementary approaches: a node-based interface for stateful GenAI artifact management, a vocabulary of visual cues as higher-level creative moves in visualization authoring, and a programming model that embeds semantic histories directly into interaction state.
- Abstract(参考訳): クリエイティブなアクティビティトレースを分析するには、適切な粒度でアクティビティをキャプチャし、クリエイティブなプラクティスの構造を反映した方法で解釈する必要がある。
しかし、既存のアプローチは、より高いレベルの創造的な動きを定義する意図や関係を保存することなく、状態の変化を記録する。
GenAIツールは、非線形探索構造を失い、曖昧な表現意図を記述した視覚化、相互作用境界をフラットにするプログラム環境である。
我々は、ステートフルなGenAIアーティファクト管理のためのノードベースのインターフェース、可視化オーサリングにおける高レベルの創造的な動きとしての視覚的キューの語彙、セマンティックヒストリーを直接相互作用状態に組み込むプログラミングモデル、の3つの補完的アプローチを提案する。
関連論文リスト
- Geospatial-Reasoning-Driven Vocabulary-Agnostic Remote Sensing Semantic Segmentation [13.743073097114461]
オープンボキャブラリセマンティックセグメンテーションはリモートセンシングにおける有望な研究方向として浮上している。
本研究では,Geospatial Reasoning Chain-of-Thought(GR-CoT)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-09T02:09:21Z) - Beyond Pixels: Visual Metaphor Transfer via Schema-Driven Agentic Reasoning [56.24016465596292]
視覚的メタファーは、抽象概念をインパクトのある視覚的レトリックに変換するために、クロスドメインなセマンティックフュージョンを用いて、人間の創造性の高階形式を構成する。
本稿では,参照画像から「創造的本質」を自律的に分離し,その抽象論理をユーザ特定対象に再物質化する,視覚メタファー伝達(VMT)の課題を紹介する。
提案手法は, メタファーの整合性, アナロジーの適切性, 視覚的創造性においてSOTAのベースラインを著しく上回り, 広告・メディアにおける高度にインパクトのある創造的アプリケーションを自動化するための道を開いた。
論文 参考訳(メタデータ) (2026-02-01T17:01:36Z) - VLM-Guided Adaptive Negative Prompting for Creative Generation [21.534474554320823]
創造的生成(Creative generation)とは、ユーザの意図を反映する新しい、驚き、価値あるサンプルを事前に想像できない形で合成することである。
本稿では,VLM-Guided Adaptive Negative-Promptingを提案する。
創造的ノベルティにおいて,計算オーバーヘッドの無視による一貫した向上を示す。
論文 参考訳(メタデータ) (2025-10-12T17:34:59Z) - Explainability-in-Action: Enabling Expressive Manipulation and Tacit Understanding by Bending Diffusion Models in ComfyUI [6.349140286855134]
我々は、Sch"onの「反省的行動(reflection-in-action)」と似た、長期的、ハンズオンなエンゲージメントに根ざした説明可能性へのクラフトベースのアプローチを提案する。
生成モデルの異なる部分をインタラクティブに操作することで、アーティストは各コンポーネントが出力にどのように影響するかについての直感を発達させることができることを実証する。
論文 参考訳(メタデータ) (2025-08-10T05:19:30Z) - ThematicPlane: Bridging Tacit User Intent and Latent Spaces for Image Generation [49.805992099208595]
ThematicPlaneは,ユーザが高レベルのセマンティック概念をナビゲートし操作できるシステムである。
このインターフェースは、暗黙の創造意図とシステム制御のギャップを埋める。
論文 参考訳(メタデータ) (2025-08-08T06:57:14Z) - Leveraging Foundation Models for Multimodal Graph-Based Action Recognition [2.066890710233268]
動的視覚符号化のためのビデオMAEとコンテキストテキスト埋め込みのためのBERTを統合したグラフベースのフレームワークを提案する。
提案手法は,多様なベンチマークデータセット上で,最先端のベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-05-21T07:15:14Z) - Structure-Guided Image Completion with Image-level and Object-level Semantic Discriminators [97.12135238534628]
複雑な意味論やオブジェクトの生成を改善するために,セマンティック・ディミネータとオブジェクトレベル・ディミネータからなる学習パラダイムを提案する。
特に、セマンティック・ディミネーターは、事前学習された視覚的特徴を利用して、生成された視覚概念の現実性を改善する。
提案手法は, 生成品質を著しく向上させ, 各種タスクの最先端化を実現する。
論文 参考訳(メタデータ) (2022-12-13T01:36:56Z) - Audio-Adaptive Activity Recognition Across Video Domains [112.46638682143065]
ドメイン間のばらつきが少なく、どのアクティビティが起こっていないかを確実に示すことができるので、ドメイン適応のためにアクティビティサウンドを活用します。
視覚特徴表現を識別的に調整するオーディオ適応型エンコーダと学習方法を提案する。
また、アクターシフトという新たなタスクを対応するオーディオ・ビジュアル・データセットで導入し、アクターの出現が劇的に変化する状況において、我々の手法に挑戦する。
論文 参考訳(メタデータ) (2022-03-27T08:15:20Z) - A Dependency Syntactic Knowledge Augmented Interactive Architecture for
End-to-End Aspect-based Sentiment Analysis [73.74885246830611]
エンドツーエンドABSAのためのマルチタスク学習を用いた対話型アーキテクチャを新たに提案する。
このモデルは、よく設計された依存性関係埋め込みグラフ畳み込みネットワーク(DreGcn)を活用することで、構文知識(依存性関係と型)を完全に活用することができる。
3つのベンチマークデータセットの大規模な実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-04-04T14:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。