論文の概要: Reviewing Intelligent Cinematography: AI research for camera-based video production
- arxiv url: http://arxiv.org/abs/2405.05039v2
- Date: Mon, 23 Dec 2024 11:38:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-24 15:51:28.606448
- Title: Reviewing Intelligent Cinematography: AI research for camera-based video production
- Title(参考訳): インテリジェントシネマトグラフィーのレビュー:カメラによるビデオ制作のためのAI研究
- Authors: Adrian Azzarelli, Nantheera Anantrasirichai, David R Bull,
- Abstract要約: 本稿では,エンターテイメント目的のリアルカメラコンテンツ取得の文脈において,人工知能(AI)研究の総合的なレビューを行う。
我々は、生成AI、オブジェクト検出、自動カメラキャリブレーション、および3Dコンテンツ取得に関する技術的背景を提供する。
最終章では、IC研究の幅広い範囲について論じ、創造産業に影響を及ぼすためのこの分野の有意義な可能性について要約する。
- 参考スコア(独自算出の注目度): 9.158626732325915
- License:
- Abstract: This paper offers the first comprehensive review of artificial intelligence (AI) research in the context of real camera content acquisition for entertainment purposes and is aimed at both researchers and cinematographers. Addressing the lack of review papers in the field of intelligent cinematography} (IC) and the breadth of related computer vision research, we present a holistic view of the IC landscape while providing technical insight, important for experts across disciplines. We provide technical background on generative AI, object detection, automated camera calibration and 3-D content acquisition, with references to assist non-technical readers. The application sections categorize work in terms of four production types: General Production, Virtual Production, Live Production and Aerial Production. Within each application section, we (1) sub-classify work according to research topic and (2) describe the trends and challenges relevant to each type of production. In the final chapter, we address the greater scope of IC research and summarize the significant potential of this area to influence the creative industries sector. We suggest that work relating to virtual production has the greatest potential to impact other mediums of production, driven by the growing interest in LED volumes/stages for in-camera virtual effects (ICVFX) and automated 3-D capture for virtual modeling of real world scenes and actors. We also address ethical and legal concerns regarding the use of creative AI that impact on artists, actors, technologists and the general public.
- Abstract(参考訳): 本稿では,エンターテイメント目的の実際のカメラコンテンツ取得の文脈における人工知能(AI)研究の総合的レビューを行い,研究者と撮影者の両方を対象としている。
インテリジェント・シネマトグラフィー(IC)の分野におけるレビュー論文の欠如と、関連するコンピュータビジョン研究の広さに対処し、ICの展望を概観するとともに、専門分野の専門家にとって重要な技術的洞察を提供する。
我々は、生成AI、オブジェクト検出、自動カメラキャリブレーション、および3Dコンテンツ取得に関する技術的背景を提供する。
応用部門は、General Production、Virtual Production、Live Production、Aerial Productionの4つの生産タイプで分類される。
各出願部門において,(1)研究トピックによる作業のサブ分類を行い,(2)生産の種類別の動向と課題について述べる。
最終章では、IC研究の幅広い範囲について論じ、創造産業に影響を及ぼすためのこの分野の有意義な可能性について要約する。
実世界のシーンやアクターの仮想モデリングのための3次元自動キャプチャー(ICVFX)やLEDボリューム/ステージへの関心が高まり、仮想制作に関連する作業が他の生産媒体に影響を与える可能性が最も高いことを示唆する。
また、アーティスト、俳優、技術者、一般大衆に影響を及ぼす創造的AIの使用に関する倫理的および法的懸念にも対処する。
関連論文リスト
- ChatCam: Empowering Camera Control through Conversational AI [67.31920821192323]
ChatCamは、ユーザーとの会話を通じてカメラの動きをナビゲートするシステムである。
そこで本研究では,テキスト条件付きカメラ軌道生成のためのGPTに基づく自己回帰モデルであるCineGPTを提案する。
また、正確なカメラ軌道配置を保証するアンカー決定器も開発した。
論文 参考訳(メタデータ) (2024-09-25T20:13:41Z) - Generative AI in Industrial Machine Vision -- A Review [0.0]
生成AIは、パターン認識能力を改善することによって、有望な可能性を実証する。
マシンビジョンにおける生成AIの応用は、データの多様性、計算要求、堅牢な検証方法の必要性により、まだ初期段階にある。
PRISMAガイドラインに基づく文献レビューを行い、産業機械ビジョンにおける生成AIに関する1200以上の論文を分析した。
論文 参考訳(メタデータ) (2024-08-20T12:14:18Z) - Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [129.08019405056262]
人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
MLMとWMは、その顕著な知覚、相互作用、推論能力のために、大きな注目を集めている。
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-07-09T14:14:47Z) - A Comprehensive Taxonomy and Analysis of Talking Head Synthesis: Techniques for Portrait Generation, Driving Mechanisms, and Editing [8.171572460041823]
トーキングヘッド合成は、特定のコンテンツによって駆動される静止画像からポートレートビデオを生成する高度な方法である。
本調査は,3つの重要な領域 – ポートレート生成,駆動機構,編集技術 – に分類し,その技術を体系的にレビューする。
論文 参考訳(メタデータ) (2024-06-15T08:14:59Z) - Recent Trends in 3D Reconstruction of General Non-Rigid Scenes [104.07781871008186]
コンピュータグラフィックスやコンピュータビジョンにおいて、3次元幾何学、外観、実際のシーンの動きを含む現実世界のモデルの再構築が不可欠である。
これは、映画産業やAR/VRアプリケーションに有用な、フォトリアリスティックなノベルビューの合成を可能にする。
この最新技術レポート(STAR)は、モノクロおよびマルチビュー入力による最新技術の概要を読者に提供する。
論文 参考訳(メタデータ) (2024-03-22T09:46:11Z) - A Disruptive Research Playbook for Studying Disruptive Innovations [11.619658523864686]
本稿では、説得力があり社会的に関係のある研究課題を定式化するためのガイドを提供するための研究プレイブックを提案する。
私たちは、AIとAR/VRの2つの破壊的なテクノロジの影響を疑問視するために使用することができることを示しています。
論文 参考訳(メタデータ) (2024-02-20T19:13:36Z) - A Survey on Generative AI and LLM for Video Generation, Understanding, and Streaming [26.082980156232086]
生成人工知能(Generative AI)と大規模言語モデル(LLM)は、ビデオ技術の分野を変えつつある。
この論文は、高度にリアルなビデオ制作におけるこれらの技術の革新的利用を強調している。
ビデオストリーミングの分野では、LLMがより効率的でユーザ中心のストリーミング体験にどのように貢献するかを論じる。
論文 参考訳(メタデータ) (2024-01-30T14:37:10Z) - State of the Art on Diffusion Models for Visual Computing [191.6168813012954]
本稿では,拡散モデルの基本数学的概念,実装の詳細,および一般的な安定拡散モデルの設計選択を紹介する。
また,拡散に基づく生成と編集に関する文献の急速な発展を概観する。
利用可能なデータセット、メトリクス、オープンな課題、社会的意味について議論する。
論文 参考訳(メタデータ) (2023-10-11T05:32:29Z) - Deep Learning for Event-based Vision: A Comprehensive Survey and Benchmarks [55.81577205593956]
イベントカメラはバイオインスパイアされたセンサーで、ピクセルごとの強度の変化を非同期に捉える。
深層学習(DL)はこの新興分野に導入され、その可能性のマイニングに活発な研究努力にインスピレーションを与えている。
論文 参考訳(メタデータ) (2023-02-17T14:19:28Z) - A Survey on Deep Learning Technique for Video Segmentation [147.0767454918527]
ビデオセグメンテーションは幅広い応用において重要な役割を果たしている。
ディープラーニングベースのアプローチは、ビデオセグメンテーションに特化しており、魅力的なパフォーマンスを提供している。
論文 参考訳(メタデータ) (2021-07-02T15:51:07Z) - Understanding and Creating Art with AI: Review and Outlook [12.614901374282868]
人工知能(AI)に関連する技術は、視覚芸術における研究と創造的実践の変化に強い影響を与える。
本稿では,AIとアートの2つの側面を総合的にレビューする:1)AIはアート分析に使用され,デジタル化されたアートコレクションに使用される;2)AIは創造的な目的に使用され,新しいアート作品を生成する。
アートの創造におけるAIの役割に関して、AIアートの様々な実践的・理論的側面に対処し、それらのトピックを詳細に扱った関連作品を統合します。
論文 参考訳(メタデータ) (2021-02-18T01:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。