論文の概要: TaCOS: Task-Specific Camera Optimization with Simulation
- arxiv url: http://arxiv.org/abs/2404.11031v3
- Date: Tue, 05 Nov 2024 06:21:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-06 14:55:56.712097
- Title: TaCOS: Task-Specific Camera Optimization with Simulation
- Title(参考訳): TaCOS: シミュレーションによるタスク特異的カメラ最適化
- Authors: Chengyang Yan, Donald G. Dansereau,
- Abstract要約: 本稿では,特定の視覚タスクでカメラを協調設計するエンド・ツー・エンドの最適化手法を提案する。
仮想環境におけるカメラをシミュレートするために,コンピュータグラフィックス技術と物理カメラ特性を利用する。
実験により,本手法は市販の市販品よりも優れたカメラを設計できることが実証された。
- 参考スコア(独自算出の注目度): 2.3020018305241337
- License:
- Abstract: The performance of perception tasks is heavily influenced by imaging systems. However, designing cameras with high task performance is costly, requiring extensive camera knowledge and experimentation with physical hardware. Additionally, cameras and perception tasks are mostly designed in isolation, whereas recent methods that jointly design cameras and tasks have shown improved performance. Therefore, we present a novel end-to-end optimization approach that co-designs cameras with specific vision tasks. This method combines derivative-free and gradient-based optimizers to support both continuous and discrete camera parameters within manufacturing constraints. We leverage recent computer graphics techniques and physical camera characteristics to simulate the cameras in virtual environments, making the design process cost-effective. We validate our simulations against physical cameras and provide a procedurally generated virtual environment. Our experiments demonstrate that our method designs cameras that outperform common off-the-shelf options, and more efficiently compared to the state-of-the-art approach, requiring only 2 minutes to design a camera on an example experiment compared with 67 minutes for the competing method. Designed to support the development of cameras under manufacturing constraints, multiple cameras, and unconventional cameras, we believe this approach can advance the fully automated design of cameras.
- Abstract(参考訳): 知覚タスクの性能は画像システムに大きく影響されている。
しかし、高いタスク性能を持つカメラを設計するにはコストがかかり、カメラの知識と物理ハードウェアの実験が必要である。
さらに、カメラと知覚タスクは独立して設計されているのに対し、カメラとタスクを共同で設計する最近の手法では性能が向上している。
そこで本研究では,特定の視覚タスクでカメラを協調設計する新たなエンドツーエンド最適化手法を提案する。
この方法は、微分自由度と勾配に基づく最適化を組み合わせ、製造制約内で連続カメラパラメータと離散カメラパラメータの両方をサポートする。
我々は,最近のコンピュータグラフィックス技術と物理カメラ特性を活用し,仮想環境におけるカメラのシミュレーションを行い,設計プロセスのコスト効率を向上する。
我々は物理カメラに対してシミュレーションを検証し、手続き的に生成された仮想環境を提供する。
実験により,本手法は市販の市販品よりも優れたカメラを設計し,最先端の手法と比較して効率よくカメラを設計し,実例実験でカメラを設計するのに要する時間は2分,競合する手法では67分であった。
製造制約下でのカメラ開発,複数台のカメラ,従来と異なるカメラの開発を支援するために設計されたこの手法は,カメラの完全自動設計を推し進める可能性がある。
関連論文リスト
- Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering [54.468355408388675]
カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。
カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。
IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
論文 参考訳(メタデータ) (2024-09-11T08:36:49Z) - CinePreGen: Camera Controllable Video Previsualization via Engine-powered Diffusion [29.320516135326546]
CinePreGenは、エンジン駆動の拡散で強化された視覚前処理システムである。
グローバルなカメラ調整からローカルなカメラ調整まで、ダイナミックなコントロールを提供する新しいカメラとストーリーボードインターフェースを備えている。
論文 参考訳(メタデータ) (2024-08-30T17:16:18Z) - Microsaccade-inspired Event Camera for Robotics [42.27082276343167]
低反応時間と安定したテクスチャを同時に維持できるイベントベース認識システムの設計を行う。
回転するくさびプリズムの幾何学的光学は、追加の回転運動のアルゴリズムによる補償を可能にする。
様々な実世界の実験では、ロボット工学が低レベルと高レベルの両方の視覚タスクに対して知覚を促進する可能性を実証している。
論文 参考訳(メタデータ) (2024-05-28T02:49:46Z) - VICAN: Very Efficient Calibration Algorithm for Large Camera Networks [49.17165360280794]
ポースグラフ最適化手法を拡張する新しい手法を提案する。
我々は、カメラを含む二部グラフ、オブジェクトの動的進化、各ステップにおけるカメラオブジェクト間の相対変換について考察する。
我々のフレームワークは従来のPGOソルバとの互換性を維持しているが、その有効性はカスタマイズされた最適化方式の恩恵を受けている。
論文 参考訳(メタデータ) (2024-03-25T17:47:03Z) - Optimizing Camera Configurations for Multi-View Pedestrian Detection [21.89117952343898]
本研究では,トランス方式のカメラ構成生成器を特徴とする新しいソリューションを提案する。
強化学習を用いて、このジェネレータは、アクション空間内の広大な組み合わせを自律的に探索し、最も高い検出精度を与える構成を探索する。
複数のシミュレーションシナリオにおいて、トランスフォーマーモデルによって生成された構成は、人間の専門家が設計したランダム検索、最適化、構成よりも一貫して優れています。
論文 参考訳(メタデータ) (2023-12-04T18:59:02Z) - EasyHeC: Accurate and Automatic Hand-eye Calibration via Differentiable
Rendering and Space Exploration [49.90228618894857]
我々は、マーカーレスでホワイトボックスであり、より優れた精度とロバスト性を提供するEasyHeCと呼ばれる手眼校正の新しいアプローチを導入する。
我々は,2つの重要な技術 – レンダリングベースのカメラポーズの最適化と整合性に基づく共同空間探索 – を利用することを提案する。
本評価は,合成および実世界のデータセットにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-05-02T03:49:54Z) - Infrastructure-based Multi-Camera Calibration using Radial Projections [117.22654577367246]
パターンベースのキャリブレーション技術は、カメラの内在を個別にキャリブレーションするために使用することができる。
Infrastucture-based calibration techniqueはSLAMやStructure-from-Motionで事前に構築した3Dマップを用いて外部情報を推定することができる。
本稿では,インフラストラクチャベースのアプローチを用いて,マルチカメラシステムをスクラッチから完全にキャリブレーションすることを提案する。
論文 参考訳(メタデータ) (2020-07-30T09:21:04Z) - DeProCams: Simultaneous Relighting, Compensation and Shape
Reconstruction for Projector-Camera Systems [91.45207885902786]
本稿では,ProCamsの測光および幾何学的マッピングを学習するために,DeProCamsという新しいエンドツーエンドトレーニングモデルを提案する。
DeProCamsは、プロジェクターカメライメージマッピングを、シェーディング属性推定、粗い直接光推定、フォトリアリスティックなニューラルレンダリングの3つのサブプロセスに明示的に分解する。
私たちの実験では、DeProCamsは、期待できる品質と完全に差別化可能な従来の芸術よりも明確な優位性を示している。
論文 参考訳(メタデータ) (2020-03-06T05:49:16Z) - Redesigning SLAM for Arbitrary Multi-Camera Systems [51.81798192085111]
SLAMシステムにより多くのカメラを追加することで、堅牢性と精度が向上するが、視覚的なフロントエンドの設計は大幅に複雑になる。
本研究では,任意のマルチカメラ装置で動作する適応SLAMシステムを提案する。
これらの修正を応用した最先端の視覚慣性計測装置を試作し, 改良したパイプラインが広い範囲のカメラ装置に適応可能であることを示す実験結果を得た。
論文 参考訳(メタデータ) (2020-03-04T11:44:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。