論文の概要: Dual-Integrated Low-Latency Single-Lens Infrared Computational Imaging for Object Detection
- arxiv url: http://arxiv.org/abs/2605.21964v1
- Date: Thu, 21 May 2026 03:50:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.082269
- Title: Dual-Integrated Low-Latency Single-Lens Infrared Computational Imaging for Object Detection
- Title(参考訳): Dual-Integrated Low-Latency Single-Lens Infrared Computational Imaging for Object Detection
- Authors: Xuquan Wang, Guishuo Yang, Dapeng Yan, Yujie Xing, Xuanyu Qian, Kai Zhang, Xiong Dun, Jiande Sun, Zhanshan Wang, Xinbin Cheng,
- Abstract要約: 本稿では、赤外線再構成と物体検出を統合した低遅延フレームワークであるPDI-Netについて述べる。
PDI-Netはトレーニング中に教師付きU-Netを使用し、セミU-Netエンコーダは推論中にYOLOベースの検出器と直接機能を共有する。
物理インフォームド光劣化シミュレーションパイプラインも, トレーニングと検証のために開発された。
- 参考スコア(独自算出の注目度): 21.844840334351346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computational imaging enables compact infrared systems, but deep-learning pipelines that combine image reconstruction and object detection often introduce substantial inference latency. Most existing acceleration strategies compress the reconstruction network while overlooking physical priors from the optical path, leaving a trade-off between accuracy and speed. We present Physics-aware Dual-Integrated Network (PDI-Net), a low-latency framework that integrates infrared reconstruction with object detection and further embeds optical priors into the learning process. PDI-Net uses a supervised U-Net during training, while a semi-U-Net encoder shares features directly with a YOLO-based detector during inference, avoiding full image reconstruction. To bridge the gap between fidelity-oriented reconstruction features and detection-oriented semantics, we introduce a physics-aware large-small bridge (PALS-Bridge), which uses field-dependent point spread function priors to adaptively modulate multiscale convolutional branches. A physics-informed optical degradation simulation pipeline is also developed for training and validation. The method is deployed on a single-lens infrared camera, reducing system weight by about 50% compared with traditional multi-lens designs. On the M3FD benchmark under low-SNR conditions, PDI-Net reduces inference time by 84.06% compared with the Rec+Det with pruning strategy while improving mAP@0.5:0.95 by 5.07%. These results demonstrate compact, low-latency computational infrared imaging for real-time object detection on resource-constrained platforms.
- Abstract(参考訳): コンピュータイメージングは小型の赤外線システムを実現するが、画像再構成とオブジェクト検出を組み合わせたディープラーニングパイプラインは大きな推論遅延をもたらすことが多い。
既存のアクセラレーション戦略の多くは、光学経路から物理的先行点を見下ろしながら再構成ネットワークを圧縮し、精度と速度のトレードオフを残している。
我々は、物体検出と赤外線再構成を統合し、さらに学習プロセスに光プリエントを組み込む低レイテンシフレームワークであるPDI-Netを提案する。
PDI-Netはトレーニング中に教師付きU-Netを使用し、セミU-Netエンコーダは推論中にYOLOベースの検出器と直接機能を共有する。
本研究では,多スケールの畳み込み分岐を適応的に変調するために,フィールド依存の点展開関数を用いた物理対応大型橋 (PALS-Bridge) を導入する。
物理インフォームド光劣化シミュレーションパイプラインも, トレーニングと検証のために開発された。
この方法はシングルレンズの赤外線カメラに展開され、従来のマルチレンズの設計と比較してシステム重量を約50%削減する。
低SNR条件下でのM3FDベンチマークでは、PDI-NetはmAP@0.5:0.95を5.07%改善しながらプルーニング戦略のRec+Detと比較して推論時間を84.06%短縮する。
これらの結果は、リソース制約されたプラットフォーム上でのリアルタイム物体検出のための、コンパクトで低レイテンシな計算赤外画像を示す。
関連論文リスト
- UHD Low-Light Image Enhancement via Real-Time Enhancement Methods with Clifford Information Fusion [51.51707075741303]
幾何学的特徴融合に基づく新しいリアルタイムUHD低照度拡張ネットワークを提案する。
本手法は,1台のコンシューマグレードデバイス上での4K/8K画像に対するミリ秒レベルの推論を実現する。
論文 参考訳(メタデータ) (2026-04-10T13:47:04Z) - IrisNet: Infrared Image Status Awareness Meta Decoder for Infrared Small Targets Detection [92.56025546608699]
IrisNetは、入力赤外線画像ステータスに検出戦略を適用する、新しいメタ学習フレームワークである。
提案手法は,赤外線画像特徴量とデコーダパラメータ全体の動的マッピングを確立する。
NUDT-SIRST、NUAA-SIRST、IRSTD-1Kデータセットの実験は、我々のIrisNetの優位性を示している。
論文 参考訳(メタデータ) (2025-11-25T13:53:54Z) - It's Not the Target, It's the Background: Rethinking Infrared Small Target Detection via Deep Patch-Free Low-Rank Representations [5.326302374594885]
本稿では、LRRNetと呼ばれる新しいエンドツーエンドIRSTDフレームワークを提案する。
乱れシーンの物理的圧縮性に着想を得て,本手法は圧縮・再構成・減算パラダイムを採用する。
複数の公開データセットの実験により、LRRNetは検出精度、堅牢性、計算効率の点で38の最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2025-06-12T07:24:45Z) - DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing [55.366556355538954]
本稿では,動的フレームワーク内で従来のスパース再構築を再現する動的反復収縮閾値ネットワーク(DISTA-Net)を提案する。
DISTA-Netは、密接な空間を持つ赤外線小ターゲットのアンミックスのために特別に設計された最初のディープラーニングモデルである。
私たちはこの分野におけるさらなる研究を促進するために、最初のオープンソースエコシステムを確立しました。
論文 参考訳(メタデータ) (2025-05-25T13:52:00Z) - ISTD-YOLO: A Multi-Scale Lightweight High-Performance Infrared Small Target Detection Algorithm [0.3749861135832073]
ISTD-YOLOは、改良されたYOLOv7に基づく軽量赤外線小目標検出アルゴリズムである。
ISTD-YOLOは検出効果を効果的に改善し、全ての指標を効果的に改善する。
論文 参考訳(メタデータ) (2025-04-19T13:19:54Z) - RFWNet: A Lightweight Remote Sensing Object Detector Integrating Multiscale Receptive Fields and Foreground Focus Mechanism [10.997183129304409]
本研究では,マルチスケールの受容場とフォアグラウンドの焦点機構を統合した,効率的かつ軽量なRSODアルゴリズムを提案する。
総合的な実験の結果、RFWNetの平均精度は95.3%、平均精度は73.2%に達した。
論文 参考訳(メタデータ) (2025-03-01T16:02:15Z) - Infrared Small-Dim Target Detection with Transformer under Complex
Backgrounds [155.388487263872]
変換器を用いた赤外線小径目標検出手法を提案する。
画像特徴の相互作用情報をより広い範囲で学習するために,変換器の自己認識機構を採用する。
最小限のターゲットの機能を学習するための機能拡張モジュールも設計しています。
論文 参考訳(メタデータ) (2021-09-29T12:23:41Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z) - A Single Stream Network for Robust and Real-time RGB-D Salient Object
Detection [89.88222217065858]
我々は、深度マップを用いて、RGBと深度の間の早期融合と中核融合を誘導する単一ストリームネットワークを設計する。
このモデルは、現在の最も軽量なモデルよりも55.5%軽く、32 FPSのリアルタイム速度で384倍の384ドルの画像を処理している。
論文 参考訳(メタデータ) (2020-07-14T04:40:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。