論文の概要: An investigation of AI integration in sound designer workflows and experiences
- arxiv url: http://arxiv.org/abs/2605.27174v1
- Date: Tue, 26 May 2026 15:28:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.382191
- Title: An investigation of AI integration in sound designer workflows and experiences
- Title(参考訳): 音響デザイナーのワークフローと体験におけるAI統合の検討
- Authors: Nelly Garcia, Joshua Reiss,
- Abstract要約: 人工知能は、プロのオーディオ制作にますます統合されている。
しかし、開発者が作成するツールと、音響デザイナーを実践する要件の間には、ギャップが続きます。
本研究は,76名の実践者を対象にした混合手法による調査と,20名の専門職を対象としたセミ構造化インタビューを通じて,このギャップについて検討する。
- 参考スコア(独自算出の注目度): 1.7188280334580195
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Artificial intelligence is increasingly being integrated into professional audio production workflows, yet a gap persists between the tools developers produce and the requirements of practising sound designers. This paper investigates this gap through a mixed-methods study comprising a survey of 76 practitioners and follow-up semi-structured interviews with 20 industry professionals. Results were analysed using descriptive statistical analysis and thematic analysis to identify patterns across both datasets. Five themes emerged from our analysis: Context, Workflow, Potential, Risks, and Right Use. Our work indicates that current AI tools perform adequately in fast-consumption media contexts but lack the narrative sophistication required for high-end sound design (films, immersive experiences etc). Practitioners demonstrate a preference for assistive, task-specific applications, particularly in audio restoration and library management, over end-to-end generative systems. This work contributes to the on-going discussion on the use of AI and AI-enhanced tools in the creative industries. We report on the current status of the field from the point of view of sound designers and creative audio practitioners, and offer a set of recommendation for sound technologist and developers based on our findings to guide the development of more informed AI tools for sound design.
- Abstract(参考訳): 人工知能は、プロのオーディオ制作ワークフローにますます統合されているが、デベロッパーが作るツールと、音響デザイナーを実践する要件との間にはギャップが持続している。
本研究は,76名の実践者を対象にした混合手法による調査と,20名の専門職を対象としたセミ構造化インタビューを通じて,このギャップについて検討する。
結果は、記述的統計分析とテーマ分析を用いて分析され、両方のデータセットにまたがるパターンを特定した。
私たちの分析から、コンテキスト、ワークフロー、可能性、リスク、適切な使用という、5つのテーマが生まれました。
我々の研究は、現在のAIツールが高速消費メディアの文脈で適切に機能することを示しているが、ハイエンドなサウンドデザイン(フィルム、没入感のある体験など)に必要な物語の洗練は欠如している。
実践者は、特にオーディオ復元とライブラリ管理において、エンドツーエンドの生成システムよりも補助的なタスク固有のアプリケーションを好む。
この研究は、クリエイティブ産業におけるAIとAI強化ツールの使用に関する現在進行中の議論に寄与している。
我々は,音設計者や創造的オーディオ実践者の立場から現場の現状を報告し,その知見に基づいて,音響技術者や開発者に対して,音設計のためのより情報のあるAIツールの開発を指導する一連の勧告を提示する。
関連論文リスト
- Audio-Visual Intelligence in Large Foundation Models [123.78167820053545]
オーディオ・ビジュアル・インテリジェンス(AVI)は人工知能の中心的フロンティアとして登場した。
急激な進歩にもかかわらず、文学は断片化され、多種多様なタスク、一貫性のない、異質な評価慣行にまたがっている。
この調査は、大規模な基盤モデルのレンズを通して、AVIに関する最初の包括的なレビューを提供する。
論文 参考訳(メタデータ) (2026-05-05T17:59:16Z) - Towards Agentic Intelligence for Materials Science [73.4576385477731]
この調査は、コーパスキュレーションからプレトレーニングから、シミュレーションと実験プラットフォームに面した目標条件付きエージェントまで、ユニークなパイプライン中心の視点を推し進める。
コミュニティをブリッジし、参照の共有フレームを確立するために、まず、AIと材料科学をまたいだ用語、評価、ワークフローの段階を整列する統合レンズを提示する。
論文 参考訳(メタデータ) (2026-01-29T23:48:43Z) - Prompting in Practice: Investigating Software Developers' Use of Generative AI Tools [17.926187565860232]
生成人工知能(GenAI)ツールの統合は、ソフトウェア開発を根本的に変えた。
本研究は,ソフトウェア技術者がGenAIツールをプロフェッショナルな実践に統合する方法について,体系的な調査を行ったものである。
我々は、開発プロセス全体でAIの使用パターンを理解するために、アクティブなGenAIユーザ72人を含む91人のソフトウェアエンジニアを調査した。
論文 参考訳(メタデータ) (2025-10-07T15:02:22Z) - Workflow-Based Evaluation of Music Generation Systems [0.0]
本研究では,8つのオープンソースシステムを用いて,現代音楽制作における音楽生成システム(MGS)の探索的評価を行う。
選択されたシステムは、シンボリックおよびオーディオベースの音楽生成アプローチの両方において、アーキテクチャの多様性を表す。
発見によると、これらのシステムは、主に人間の専門知識を置き換えるのではなく、補完的なツールとして機能する。
論文 参考訳(メタデータ) (2025-06-11T13:07:47Z) - Data Analysis in the Era of Generative AI [56.44807642944589]
本稿では,AIを活用したデータ分析ツールの可能性について考察する。
我々は、大規模言語とマルチモーダルモデルの出現が、データ分析ワークフローの様々な段階を強化する新しい機会を提供する方法について検討する。
次に、直感的なインタラクションを促進し、ユーザ信頼を構築し、AI支援分析ワークフローを複数のアプリにわたって合理化するための、人間中心の設計原則を調べます。
論文 参考訳(メタデータ) (2024-09-27T06:31:03Z) - AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models [92.92233932921741]
AV-SUPERBベンチマークは,音声・視覚・バイモーダル融合表現の汎用的評価を可能にする。
我々は,最近の5つの自己教師型モデルを評価し,これらのモデルがすべてのタスクに一般化されないことを示す。
我々は,AudioSetを用いた中間タスクの微調整と音声イベント分類によって表現が改善されることを実証した。
論文 参考訳(メタデータ) (2023-09-19T17:35:16Z) - Dynamic-SUPERB: Towards A Dynamic, Collaborative, and Comprehensive Instruction-Tuning Benchmark for Speech [107.81472531864195]
テキスト言語モデルは、よく整形された命令が与えられたときに、目に見えないタスクに一般化する際、顕著なゼロショット能力を示している。
ゼロショット方式で複数のタスクを実行するための命令チューニングを活用できるユニバーサル音声モデルを構築するためのベンチマークであるDynamic-SUPERBを提案する。
論文 参考訳(メタデータ) (2023-09-18T06:43:30Z) - Adoption of AI Technology in the Music Mixing Workflow: An Investigation [0.0]
本研究は、音楽の混合におけるAIの現状と、異なるユーザグループによる採用について検討する。
我々の研究結果によると、AIミキシングツールはプロセスを簡単にするが、プロアンジェは正確な制御とカスタマイズのオプションを求める。
この研究は、異なるユーザーグループのための効果的なAI混合ツールを設計するための戦略を提供し、今後の方向性を概説している。
論文 参考訳(メタデータ) (2023-04-06T22:47:59Z) - Experiences with the Introduction of AI-based Tools for Moderation
Automation of Voice-based Participatory Media Forums [0.5243067689245634]
我々は、空白またはノイズの多い音声をフィルタリングするAIツールを導入し、音声認識を使ってテキストで音声メッセージを書き起こし、自然言語処理技術を使って音声書き起こしからメタデータを抽出する。
本稿では,これらのツールの導入による時間とコスト削減の点から,AIベースの自動化のワークフローへの受容性に対するモデレーターのフィードバックについて述べる。
我々の研究は、いくつかのルーチンタスクの自動化にAIを使用する場合のケーススタディを形成しており、特に、発展途上国における音声技術の使用に関わる他の研究者や実践者には特に関係がある。
論文 参考訳(メタデータ) (2021-08-09T17:50:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。