論文の概要: Beyond Bayer: Task-Optimal Sensor Co-Design for Robust Autonomous-Driving Segmentation
- arxiv url: http://arxiv.org/abs/2606.24096v1
- Date: Tue, 23 Jun 2026 03:22:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.753803
- Title: Beyond Bayer: Task-Optimal Sensor Co-Design for Robust Autonomous-Driving Segmentation
- Title(参考訳): Beyond Bayer:ロバストな自動運転セグメンテーションのためのタスク最適センサーの共同設計
- Authors: Reeshad Khan, John Gauch,
- Abstract要約: センサの自由度は密接な予測にどのような効果があるかを分解する。
スペクトルカラー・フィルター・アレイの重みを学習することが主要なレバーである。
ACDCの霧, 夜, 雨, 雪に対するロバスト性を検証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robust perception underpins autonomous driving, and most recent progress comes from scaling the model-larger backbones, foundation models, and cooperative multi-agent fusion. We pursue a complementary, upstream question: what should the camera itself measure? Using a differentiable RAW-to-task pipeline, we decompose which sensor degrees of freedom benefit dense prediction. Learning the spectral colour-filter-array (CFA) weights is the dominant lever, improving mIoU by +0.017 (KITTI-360) and +0.023 (ACDC) over a fixed camera. In contrast, point-spread-function (optics) co-design is net-negative (-0.020 mIoU on KITTI-360) - a consequence of the data-processing inequality, which also bounds the task information that any downstream model, however large or cooperative, can recover. Noise co-optimisation is marginal, and counter to intuition enlarging the CFA tile beyond 2x2 consistently hurts, as the filters are confined to the rank three sRGB input. Because the intervention is at the sensor, the gains are model-agnostic; we validate robustness on ACDC's fog, night, rain, and snow, and conclude with a simple recipe: learn the 2x2 CFA weights and keep an identity PSF.
- Abstract(参考訳): ロバスト知覚は自律運転の基盤となり、最も最近の進歩はモデル大のバックボーン、基礎モデル、協調的マルチエージェント融合のスケーリングである。
私たちは、補足的で上流の質問を追求しています。
RAW-to-taskパイプラインを微分可能とし、どのセンサ自由度が密度予測に役立つかを分解する。
スペクトルカラーフィルタアレイ (CFA) の重みを学習することは、mIoU を+0.017 (KITTI-360) と +0.023 (ACDC) で固定カメラで改善する支配的なレバーである。
対照的に、ポイントスプレッド関数(光学)の共設計はネット陰性(KITTI-360上では-0.020 mIoU)であり、データ処理の不等式の結果である。
ノイズの共最適化は限界であり、CFAタイルを2x2を超えて拡大する直感に逆らうと、フィルタがランク3のsRGB入力に制限されるため、常に悪くなる。
ACDCの霧、夜、雨、雪に対する堅牢性を検証し、2x2のCFA重みを学習し、アイデンティティPSFを保持するという簡単なレシピで結論付ける。
関連論文リスト
- CrossFlow: One-Step Generation Across Latent and Pixel Spaces [61.08358796319721]
CrossFlowは、ノイズの多い遅延入力を直接ピクセル空間イメージにマッピングする、クロススペースフローの定式化である。
クラス条件のImageNet-1kの$256times256$では、CrossFlow-XLは1つの関数評価で1.62 FIDを達成する。
論文 参考訳(メタデータ) (2026-06-18T09:10:28Z) - Learning to Sense for Driving: Joint Optics-Sensor-Model Co-Design for Semantic Segmentation [0.0]
従来の自律走行パイプラインは、下流の認識からカメラ設計を分離する。
本稿では,光学,センサモデリング,軽量セマンティックセグメンテーションネットワークを統合したタスク駆動型協調設計フレームワークを提案する。
提案システムは,現実的な携帯電話スケールレンズモデル,学習可能なカラーフィルタアレイ,ポアソン・ガウス雑音処理,量子化処理を統合している。
論文 参考訳(メタデータ) (2025-12-23T22:28:30Z) - iGaussian: Real-Time Camera Pose Estimation via Feed-Forward 3D Gaussian Splatting Inversion [62.09575122593993]
iGaussianは2段階のフィードフォワードフレームワークで、直接3Dガウス変換によるリアルタイムカメラポーズ推定を実現する。
NeRF Synthetic, Mip-NeRF 360, T&T+DB データセットの実験結果から, 従来の手法に比べて大幅な性能向上が得られた。
論文 参考訳(メタデータ) (2025-11-18T05:22:22Z) - Continuous Cost Aggregation for Dual-Pixel Disparity Extraction [3.1153758106426603]
本稿では,Dual-Pixel (DP) 画像の連続的コスト集約手法を提案する。
提案アルゴリズムは、画像パスに沿ってパラボラ係数を集約し、コストのマッチングにパラボラを適合させる。
デジタル一眼レフカメラと電話カメラのDPデータを用いた実験により,提案手法がDP差分推定における最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2023-06-13T17:26:50Z) - End-to-End Lidar-Camera Self-Calibration for Autonomous Vehicles [0.0]
CaLiCaはLidarとピンホールカメラのためのエンドツーエンドの自己校正ネットワークである。
我々は1パスの推論で0.028ピクセルの再投影誤差で0.154デグと0.059mの精度を達成した。
論文 参考訳(メタデータ) (2023-04-24T19:44:23Z) - TransFusion: Robust LiDAR-Camera Fusion for 3D Object Detection with
Transformers [49.689566246504356]
そこで本研究では,LiDAR-カメラ融合に対するソフトアソシエーション機構による堅牢な解であるTransFusionを提案する。
TransFusionは大規模データセット上で最先端のパフォーマンスを実現する。
提案手法を3次元トラッキングタスクに拡張し,nuScenesトラッキングのリーダーボードにおける第1位を達成する。
論文 参考訳(メタデータ) (2022-03-22T07:15:13Z) - Learning Enriched Illuminants for Cross and Single Sensor Color
Constancy [182.4997117953705]
ネットワークをトレーニングするためのクロスセンサ自己教師型トレーニングを提案する。
センサに依存しない方法で人工発光体をランダムにサンプリングすることでネットワークを訓練する。
実験により、我々のクロスセンサモデルとシングルセンサーモデルは、他の最先端手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-03-21T15:45:35Z) - EPMF: Efficient Perception-aware Multi-sensor Fusion for 3D Semantic Segmentation [62.210091681352914]
自律運転やロボティクスなど,多くのアプリケーションを対象とした3次元セマンティックセマンティックセグメンテーションのためのマルチセンサフュージョンについて検討する。
本研究では,知覚認識型マルチセンサフュージョン(PMF)と呼ばれる協調融合方式について検討する。
本稿では,2つのモードから特徴を分離して抽出する2ストリームネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-21T10:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。