論文の概要: Studies for : A Human-AI Co-Creative Sound Artwork Using a Real-time Multi-channel Sound Generation Model
- arxiv url: http://arxiv.org/abs/2510.25228v1
- Date: Wed, 29 Oct 2025 07:05:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.198056
- Title: Studies for : A Human-AI Co-Creative Sound Artwork Using a Real-time Multi-channel Sound Generation Model
- Title(参考訳): 実時間マルチチャンネル音場生成モデルを用いた人間とAIのコクレーティブ・サウンドワークに関する研究
- Authors: Chihiro Nagashima, Akira Takahashi, Zhi Zhong, Shusuke Takahashi, Yuki Mitsufuji,
- Abstract要約: 研究は、音響アーティストのエヴァラと共同で開発された、再生音のインスタレーションである。
この作品は「新しい形式のアーカイブ」という概念に基づいている。
本稿では,音声生成AIモデルを音響アート作成プロセスに効果的に組み込むためのHuman-AI共創フレームワークを提案する。
- 参考スコア(独自算出の注目度): 32.684356791049986
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores the integration of AI technologies into the artistic workflow through the creation of Studies for, a generative sound installation developed in collaboration with sound artist Evala (https://www.ntticc.or.jp/en/archive/works/studies-for/). The installation employs SpecMaskGIT, a lightweight yet high-quality sound generation AI model, to generate and playback eight-channel sound in real-time, creating an immersive auditory experience over the course of a three-month exhibition. The work is grounded in the concept of a "new form of archive," which aims to preserve the artistic style of an artist while expanding beyond artists' past artworks by continued generation of new sound elements. This speculative approach to archival preservation is facilitated by training the AI model on a dataset consisting of over 200 hours of Evala's past sound artworks. By addressing key requirements in the co-creation of art using AI, this study highlights the value of the following aspects: (1) the necessity of integrating artist feedback, (2) datasets derived from an artist's past works, and (3) ensuring the inclusion of unexpected, novel outputs. In Studies for, the model was designed to reflect the artist's artistic identity while generating new, previously unheard sounds, making it a fitting realization of the concept of "a new form of archive." We propose a Human-AI co-creation framework for effectively incorporating sound generation AI models into the sound art creation process and suggest new possibilities for creating and archiving sound art that extend an artist's work beyond their physical existence. Demo page: https://sony.github.io/studies-for/
- Abstract(参考訳): 本稿では、音響アーティストのEvala(https://www.ntticc.or.jp/en/archive/works/studies-for/)と共同で開発された再生音のインスタレーションであるStudio for(Science for)の作成を通じて、AI技術の芸術ワークフローへの統合について検討する。
このインスタレーションでは、軽量ながら高品質な音生成AIモデルであるSpecMaskGITを使用して、リアルタイムで8チャンネルの音を生成し再生し、3ヶ月の展覧会で没入的な聴覚体験を作り出す。
この作品は「新しい形式のアーカイブ」という概念に基づいており、アーティストの芸術様式を保存しつつ、新たなサウンド要素を連続的に生成することで、アーティストの過去のアート作品を超えて拡張することを目的としている。
この投機的手法は、エヴァラの過去のサウンドアートワークの200時間以上からなるデータセット上でAIモデルをトレーニングすることで、容易である。
本研究は,AIを用いたアート創造における重要な要件に対処することにより,(1)アーティストのフィードバックの統合の必要性,(2)アーティストの過去の作品から派生したデータセット,(3)予期せぬ新しいアウトプットを確実に取り入れること,の3つの側面の意義を明らかにする。
研究において、このモデルはアーティストの芸術的アイデンティティを反映し、以前は聞こえていなかった新しい音を発生させ、「新しい形式のアーカイブ」という概念を適当に実現させるように設計された。
本稿では,音生成AIモデルを効果的に音響アート作成プロセスに組み込むためのHuman-AI共同制作フレームワークを提案する。
デモページ: https://sony.github.io/studies-for/
関連論文リスト
- ArtistAuditor: Auditing Artist Style Pirate in Text-to-Image Generation Models [61.55816738318699]
本稿では,テキスト・画像生成モデルにおける新しいデータ利用監査手法を提案する。
ArtistAuditorは、多彩なスタイルの表現を得るためにスタイル抽出器を使用し、アートワークをアーティストのスタイルのサンプリングとして扱う。
6つのモデルとデータセットの組み合わせによる実験結果は、ArtistAuditorが高いAUC値を達成可能であることを示している。
論文 参考訳(メタデータ) (2025-04-17T16:15:38Z) - Expertise elevates AI usage: experimental evidence comparing laypeople and professional artists [1.5296069874080693]
生成AIを用いて芸術家と一般人の芸術的能力を比較する。
平均して、アーティストは彼らの通常の作品よりも忠実でクリエイティブなアウトプットを生み出した。
AIはコンテンツ作成を楽にするかもしれないが、専門家の専門知識は依然として価値がある。
論文 参考訳(メタデータ) (2025-01-21T18:53:21Z) - Equivalence: An analysis of artists' roles with Image Generative AI from Conceptual Art perspective through an interactive installation design practice [16.063735487844628]
本研究では、アーティストが高度なテキストから画像生成AIモデルとどのように相互作用するかを検討する。
この枠組みを実証するために,「等価性」と題されたケーススタディでは,ユーザの音声入力を連続的に変化する絵画に変換する。
この研究は、アーティストの役割に対する理解を深め、画像生成AIで作成されたアートに固有の創造的側面に対する深い評価を促進することを目的としている。
論文 参考訳(メタデータ) (2024-04-29T02:45:23Z) - CreativeSynth: Cross-Art-Attention for Artistic Image Synthesis with Multimodal Diffusion [73.08710648258985]
レイアウト、視点、形状、意味といった重要な絵の属性は、しばしばスタイル転送によって伝達され、表現されない。
大規模な事前訓練された画像生成モデルは、大量の高品質な画像を合成できることを実証している。
我々の主要なアイデアは、スタイルを現実の世界に移すのではなく、多モーダルな意味情報を合成ガイドとしてアートに組み込むことである。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - Pathway to Future Symbiotic Creativity [76.20798455931603]
そこで本研究では, 5クラス階層の創造システムを分類し, 擬人アーティストから機械アーティストへの創造の道筋を示す。
芸術創造においては、機械は欲求、感謝、感情を含む人間の精神状態を理解する必要があるが、機械の創造的能力と限界も理解する必要がある。
我々は、人間互換のAIシステムが「ループ内人間」の原理に基づいているべきだという哲学を取り入れた、未来のマシンアーティストを構築するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-18T15:12:02Z) - Generating Music and Generative Art from Brain activity [0.0]
本研究は,脳-コンピュータインタフェース(BCI)を用いた生成アート作成のための計算システムを提案する。
生成されたアートワークは、脳信号と幾何学、色、空間的位置の概念を使って、自律的な構築に複雑さを与えます。
論文 参考訳(メタデータ) (2021-08-09T19:33:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。