Fugu-MT 論文翻訳(概要): A Photogrammetry-based Framework to Facilitate Image-based Modeling and Automatic Camera Tracking

論文の概要: A Photogrammetry-based Framework to Facilitate Image-based Modeling and Automatic Camera Tracking

arxiv url: http://arxiv.org/abs/2012.01044v1
Date: Wed, 2 Dec 2020 09:26:37 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-25 03:46:34.825478
Title: A Photogrammetry-based Framework to Facilitate Image-based Modeling and Automatic Camera Tracking
Title（参考訳）: 画像ベースモデリングと自動カメラトラッキングを実現するフォトグラムベースフレームワーク
Authors: Sebastian Bullinger, Christoph Bodensteiner, Michael Arens
Abstract要約: 本研究では,Blenderを拡張してSfM(Structure from Motion)とMVS(Multi-View Stereo)技術を利用して彫刻やカメラ,モーショントラッキングなどの画像ベースモデリングタスクを実現するフレームワークを提案する。 SfMを適用することで、機能トラックを手動で定義したり、画像データを取得するために使用されるカメラを校正したりすることなく、カメラの動きを判断できます。 MVSでは、Blenderの組み込みツールでは実現不可能な、密集したシーンモデルを自動的に計算できます。
参考スコア（独自算出の注目度）: 11.84274417463238
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose a framework that extends Blender to exploit Structure from Motion (SfM) and Multi-View Stereo (MVS) techniques for image-based modeling tasks such as sculpting or camera and motion tracking. Applying SfM allows us to determine camera motions without manually defining feature tracks or calibrating the cameras used to capture the image data. With MVS we are able to automatically compute dense scene models, which is not feasible with the built-in tools of Blender. Currently, our framework supports several state-of-the-art SfM and MVS pipelines. The modular system design enables us to integrate further approaches without additional effort. The framework is publicly available as an open source software package.
Abstract（参考訳）: 本研究では,Blenderを拡張してSfM(Structure from Motion)とMVS(Multi-View Stereo)技術を利用して彫刻やカメラ,モーショントラッキングなどの画像ベースモデリングタスクを実現するフレームワークを提案する。 SfMを適用することで、機能トラックを手動で定義したり、画像データを取得するために使用されるカメラを校正したりすることなく、カメラの動きを判断できます。 MVSでは、Blenderの組み込みツールでは実現不可能な高密度シーンモデルを自動的に計算できます。現在、我々のフレームワークはいくつかの最先端のSfMとMVSパイプラインをサポートしている。モジュラーシステム設計により、追加の努力なしに、さらなるアプローチを統合できます。このフレームワークはオープンソースソフトウェアパッケージとして公開されている。

関連論文リスト

Towards Understanding Camera Motions in Any Video [80.223048294482]
我々は、カメラモーション理解の評価と改善を目的とした大規模なデータセットとベンチマークであるCameraBenchを紹介する。 CameraBenchは、厳格な品質管理プロセスを通じて専門家によって注釈付けされた3,000の多様なインターネットビデオで構成されている。私たちの貢献の1つは、撮影者との共同で設計されたカメラモーションプリミティブの分類である。
論文参考訳（メタデータ） (2025-04-21T18:34:57Z)
FRAME: Floor-aligned Representation for Avatar Motion from Egocentric Video [52.33896173943054]
ヘッドマウントのボディフェイスステレオカメラを備えたエゴセントリックなモーションキャプチャーは、VRやARアプリケーションには不可欠だ。既存の方法は、合成事前学習と、現実の環境で滑らかで正確な予測を生成するのに苦労している。本稿では、デバイスポーズとカメラフィードを組み合わせて、最先端のボディポーズ予測を行う、シンプルで効果的なアーキテクチャFRAMEを提案する。
論文参考訳（メタデータ） (2025-03-29T14:26:06Z)
Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions [78.65431951506152]
自由形運動制御のための合成データセット(SynFMC)を提案する。提案したSynFMCデータセットは、さまざまなオブジェクトと環境を含み、特定のルールに従ってさまざまな動きパターンをカバーしている。さらに,物体とカメラの動きの独立的あるいは同時制御を可能にするFMC(Free-Form Motion Control)を提案する。
論文参考訳（メタデータ） (2025-01-02T18:59:45Z)
Instruction-based Image Manipulation by Watching How Things Move [35.44993722444448]
命令ベースの複雑な操作が可能なモデルであるInstructMoveをトレーニングする新しいデータセットを作成します。本モデルでは,ポーズの調整,要素の並べ替え,カメラ視点の変更などのタスクにおいて,最先端の性能を示す。
論文参考訳（メタデータ） (2024-12-16T18:56:17Z)
RoMo: Robust Motion Segmentation Improves Structure from Motion [46.77236343300953]
本稿では,固定世界フレームを移動中のシーンの構成要素を特定するために,映像に基づくモーションセグメンテーションの新たなアプローチを提案する。我々の単純かつ効果的な反復法であるRoMoは、光フローとエピポーラキューと事前訓練されたビデオセグメンテーションモデルを組み合わせたものである。さらに重要なのは、市販のSfMパイプラインとセグメンテーションマスクを組み合わせることで、ダイナミックなコンテンツを持つシーンに対する最先端のカメラキャリブレーションを新たに確立し、既存の手法を実質的なマージンで上回ることだ。
論文参考訳（メタデータ） (2024-11-27T01:09:56Z)
Generating 3D-Consistent Videos from Unposed Internet Photos [68.944029293283]
カメラパラメータなどの3Dアノテーションを使わずに,スケーラブルな3D対応ビデオモデルをトレーニングする。その結果,映像やマルチビューインターネット写真などの2次元データのみを用いて,シーンレベルの3D学習をスケールアップできることが示唆された。
論文参考訳（メタデータ） (2024-11-20T18:58:31Z)
Framer: Interactive Frame Interpolation [73.06734414930227]
Framerのターゲットは、ユーザのクリエイティビティに応じて、2つのイメージ間のスムーズな遷移フレームを生成することだ。提案手法は,選択したキーポイントの軌道を調整し,遷移過程のカスタマイズを支援する。ここでは,キーポイントと軌道を自動的に推定するモジュールを導入する。
論文参考訳（メタデータ） (2024-10-24T17:59:51Z)
MotionCom: Automatic and Motion-Aware Image Composition with LLM and Video Diffusion Prior [51.672193627686]
MotionComは、トレーニングなしのモーションアウェア拡散に基づく画像合成である。ターゲットオブジェクトを動的にコヒーレントな結果で新しいシーンにシームレスに統合することを可能にする。
論文参考訳（メタデータ） (2024-09-16T08:44:17Z)
Mono-ViFI: A Unified Learning Framework for Self-supervised Single- and Multi-frame Monocular Depth Estimation [11.611045114232187]
最近の方法では、既存のカメラビュー間でのみビュー合成が行われており、ガイダンスが不十分である。フローベースビデオフレーム作成(VFI)により、より仮想的なカメラビューを合成しようと試みる。多フレーム推論では、MaryDepthのような明示的な幾何ベースのメソッドで発生する動的オブジェクトの問題を横取りするために、機能融合パラダイムに戻ります。シングルフレームとマルチフレームの奥行きを双方向に接続するために,Mono-ViFIという自己教師型学習フレームワークを構築した。
論文参考訳（メタデータ） (2024-07-19T08:51:51Z)
BlenderAlchemy: Editing 3D Graphics with Vision-Language Models [4.852796482609347]
ビジョンベースの編集生成器と状態評価器が協力して、目標を達成するための正しいアクションのシーケンスを見つける。人間のデザインプロセスにおける視覚的想像力の役割に触発されて、視覚言語モデルの視覚的推論能力を「想像された」参照画像で補う。
論文参考訳（メタデータ） (2024-04-26T19:37:13Z)
Moonshot: Towards Controllable Video Generation and Editing with Multimodal Conditions [94.03133100056372]
Moonshotは、画像とテキストのマルチモーダル入力を同時に処理する新しいビデオ生成モデルである。モデルは、パーソナライズされたビデオ生成、画像アニメーション、ビデオ編集など、様々な生成アプリケーションに容易に再利用できる。
論文参考訳（メタデータ） (2024-01-03T16:43:47Z)
DynIBaR: Neural Dynamic Image-Based Rendering [79.44655794967741]
複雑な動的シーンを描写したモノクロ映像から新しいビューを合成する問題に対処する。我々は,近傍のビューから特徴を集約することで,新しい視点を合成するボリューム画像ベースのレンダリングフレームワークを採用する。動的シーンデータセットにおける最先端手法の大幅な改善を示す。
論文参考訳（メタデータ） (2022-11-20T20:57:02Z)
A Portable Multiscopic Camera for Novel View and Time Synthesis in Dynamic Scenes [42.00094186447837]
ダイナミックなシーンにおける新しいビューと時間合成のための専用モデルを備えた携帯型マルチスコープカメラシステムを提案する。私たちのゴールは、ポータブルなマルチスコープカメラを使って、いつでもあらゆる視点から、ダイナミックなシーンの高品質な画像をレンダリングすることです。
論文参考訳（メタデータ） (2022-08-30T17:53:17Z)
Enhanced Frame and Event-Based Simulator and Event-Based Video Interpolation Network [1.4095425725284465]
固定オフセットに任意の数のセンサを配置したカメラリグによって記録されたリアルなシーンを生成できる,新しい高度なイベントシミュレータを提案する。これには、現実的な画質低下効果を持つフレームベースの新しいイメージセンサモデルと、より正確な特性を持つ拡張DVSモデルが含まれる。我々のシミュレータによって生成されたデータは、我々の新しいモデルをトレーニングするために利用でき、その結果、アートの状況よりも同等またはより良い品質の公開データセット上の再構成画像が生成される。
論文参考訳（メタデータ） (2021-12-17T08:27:13Z)
IVS3D: An Open Source Framework for Intelligent Video Sampling and Preprocessing to Facilitate 3D Reconstruction [0.8029049649310211]
iVS3Dは、画像シーケンスのインテリジェントな前処理のためのフレームワークである。われわれのソフトウェアは、ビデオ全体を特定のフレームレートにダウンできる。モジュールアーキテクチャのおかげで、追加のアルゴリズムでプラグインを開発し、統合するのは簡単です。
論文参考訳（メタデータ） (2021-10-22T14:31:04Z)
Learning Monocular Depth in Dynamic Scenes via Instance-Aware Projection Consistency [114.02182755620784]
本稿では,複数の動的物体の6-DoF動作,エゴモーション,深度を,監督なしで一眼レフカメラで明示的にモデル化する,エンドツーエンドのジョイントトレーニングフレームワークを提案する。筆者らのフレームワークは,最先端の深度・動き推定法より優れていた。
論文参考訳（メタデータ） (2021-02-04T14:26:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。