論文の概要: Attention of a Kiss: Exploring Attention Maps in Video Diffusion for XAIxArts
- arxiv url: http://arxiv.org/abs/2509.05323v2
- Date: Tue, 09 Sep 2025 12:40:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-10 14:38:26.987535
- Title: Attention of a Kiss: Exploring Attention Maps in Video Diffusion for XAIxArts
- Title(参考訳): キスの注意:XAIxArtの動画拡散における注意マップの探索
- Authors: Adam Cole, Mick Grierson,
- Abstract要約: 本研究は, 生成ビデオモデルにおいて, クロスアテンションマップを抽出し, 可視化する手法を提案する。
本ツールは,テキスト・ビデオ生成における注意の時間的・空間的挙動を解釈可能なウィンドウとして提供する。
- 参考スコア(独自算出の注目度): 0.03437656066916039
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents an artistic and technical investigation into the attention mechanisms of video diffusion transformers. Inspired by early video artists who manipulated analog video signals to create new visual aesthetics, this study proposes a method for extracting and visualizing cross-attention maps in generative video models. Built on the open-source Wan model, our tool provides an interpretable window into the temporal and spatial behavior of attention in text-to-video generation. Through exploratory probes and an artistic case study, we examine the potential of attention maps as both analytical tools and raw artistic material. This work contributes to the growing field of Explainable AI for the Arts (XAIxArts), inviting artists to reclaim the inner workings of AI as a creative medium.
- Abstract(参考訳): 本稿では,ビデオ拡散変換器の注意機構について,芸術的,技術的検討を行う。
そこで本研究では,アナログ映像信号を操作して新たな視覚美学を創出する初期の映像アーティストに触発され,生成ビデオモデルにおける相互注意マップの抽出と可視化を行う手法を提案する。
オープンソースのWanモデルに基づいて構築されたこのツールは,テキスト・ビデオ生成における注意の時間的・空間的挙動を解釈可能なウィンドウを提供する。
探索調査と芸術ケーススタディを通じて,分析ツールおよび原材料としての注目マップの可能性について検討した。
この研究は、XAIxArts(Explainable AI for the Arts)の成長に寄与し、アーティストにAIの内部動作を創造的な媒体として再生するよう呼びかけている。
関連論文リスト
- From Sound to Sight: Towards AI-authored Music Videos [6.8291397456847625]
ユーザが指定した、ボーカルまたは楽器の曲から、音楽ビデオを自動的に生成するための2つの新しいパイプラインを提案する。
音楽ビデオ制作者のマニュアルにインスパイアされた我々は、潜在機能に基づく技術がいかに音声を分析できるかを実験した。
次に、生成モデルを用いて、対応するビデオクリップを生成する。
論文 参考訳(メタデータ) (2025-08-20T13:54:53Z) - ArtistAuditor: Auditing Artist Style Pirate in Text-to-Image Generation Models [61.55816738318699]
本稿では,テキスト・画像生成モデルにおける新しいデータ利用監査手法を提案する。
ArtistAuditorは、多彩なスタイルの表現を得るためにスタイル抽出器を使用し、アートワークをアーティストのスタイルのサンプリングとして扱う。
6つのモデルとデータセットの組み合わせによる実験結果は、ArtistAuditorが高いAUC値を達成可能であることを示している。
論文 参考訳(メタデータ) (2025-04-17T16:15:38Z) - Generative AI for Film Creation: A Survey of Recent Advances [9.778792224015275]
Generative AI(GenAI)は、アーティストにテキスト・ツー・イメージや画像・ビデオ拡散、ニューラル・ラディアンス・フィールド、アバター生成、そして3D合成などのツールを提供する。
本稿では,近年のAI駆動映画から,これらの技術が映画製作に採用されていることを明らかにする。
3D生成の利用の増加や、実際の映像とAI生成要素の統合といった、新たなトレンドを強調します。
論文 参考訳(メタデータ) (2025-04-11T06:54:29Z) - Diffusion-Based Visual Art Creation: A Survey and New Perspectives [51.522935314070416]
本調査は,拡散に基づく視覚芸術創造の新たな領域を探求し,その発展を芸術的,技術的両面から検討する。
本研究は,芸術的要件が技術的課題にどのように変換されるかを明らかにし,視覚芸術創造における拡散法の設計と応用を強調した。
我々は、AIシステムが芸術的知覚と創造性において人間の能力をエミュレートし、潜在的に増強するメカニズムに光を当てることを目指している。
論文 参考訳(メタデータ) (2024-08-22T04:49:50Z) - State of the Art on Diffusion Models for Visual Computing [191.6168813012954]
本稿では,拡散モデルの基本数学的概念,実装の詳細,および一般的な安定拡散モデルの設計選択を紹介する。
また,拡散に基づく生成と編集に関する文献の急速な発展を概観する。
利用可能なデータセット、メトリクス、オープンな課題、社会的意味について議論する。
論文 参考訳(メタデータ) (2023-10-11T05:32:29Z) - Text-Guided Synthesis of Eulerian Cinemagraphs [81.20353774053768]
テキスト記述からシネマグラフを作成する完全自動化された方法であるText2Cinemagraphを紹介する。
連続した動きと反復的なテクスチャを示す流れの川や漂流する雲などの流体要素のシネマグラフに焦点を当てる。
論文 参考訳(メタデータ) (2023-07-06T17:59:31Z) - Inspire creativity with ORIBA: Transform Artists' Original Characters
into Chatbots through Large Language Model [4.984601297028257]
この研究は、イラストアートと人工知能(AI)の交差点を掘り下げる
創造的なプロセスと著者の境界に対するAIの影響を調べることで、創造的な分野における人間とAIの相互作用を強化することを目指している。
論文 参考訳(メタデータ) (2023-06-16T11:25:44Z) - Pathway to Future Symbiotic Creativity [76.20798455931603]
そこで本研究では, 5クラス階層の創造システムを分類し, 擬人アーティストから機械アーティストへの創造の道筋を示す。
芸術創造においては、機械は欲求、感謝、感情を含む人間の精神状態を理解する必要があるが、機械の創造的能力と限界も理解する必要がある。
我々は、人間互換のAIシステムが「ループ内人間」の原理に基づいているべきだという哲学を取り入れた、未来のマシンアーティストを構築するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-18T15:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。