論文の概要: An end-to-end CNN framework for polarimetric vision tasks based on
polarization-parameter-constructing network
- arxiv url: http://arxiv.org/abs/2004.08740v1
- Date: Sun, 19 Apr 2020 01:33:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-12 00:12:42.094671
- Title: An end-to-end CNN framework for polarimetric vision tasks based on
polarization-parameter-constructing network
- Title(参考訳): 偏光パラメータ構築ネットワークに基づく偏光視覚タスクのためのエンドツーエンドCNNフレームワーク
- Authors: Yong Wang, Qi Liu, Hongyu Zu, Xiao Liu, Ruichao Xie, Feng Wang
- Abstract要約: 偏光情報を処理するには、偏光画像間の画素演算が重要である。
本稿では,偏光視覚タスクのためのエンドツーエンドCNNフレームワークを提案する。
R-CNNをタスクネットワークとしてより高速にすることで、既存の手法と比較して、オブジェクト検出タスクにおいて平均精度(mAP)がはるかに高いことを示す。
- 参考スコア(独自算出の注目度): 19.622145287600386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Pixel-wise operations between polarimetric images are important for
processing polarization information. For the lack of such operations, the
polarization information cannot be fully utilized in convolutional neural
network(CNN). In this paper, a novel end-to-end CNN framework for polarization
vision tasks is proposed, which enables the networks to take full advantage of
polarimetric images. The framework consists of two sub-networks: a
polarization-parameter-constructing network (PPCN) and a task network. PPCN
implements pixel-wise operations between images in the CNN form with 1x1
convolution kernels. It takes raw polarimetric images as input, and outputs
polarization-parametric images to task network so as to complete a vison task.
By training together, the PPCN can learn to provide the most suitable
polarization-parametric images for the task network and the dataset. Taking
faster R-CNN as task network, the experimental results show that compared with
existing methods, the proposed framework achieves much higher
mean-average-precision (mAP) in object detection task
- Abstract(参考訳): 偏光情報の処理には,偏光画像間の画素分割操作が重要である。
このような操作の欠如のため、偏極情報は畳み込みニューラルネットワーク(CNN)で完全に利用することはできない。
本稿では,ネットワークがポラリメトリック画像の利点を最大限に活用できる,新しい偏光ビジョンタスクのためのエンド・ツー・エンドのcnnフレームワークを提案する。
このフレームワークは、偏光パラメータ構築ネットワーク(PPCN)とタスクネットワークの2つのサブネットワークで構成されている。
PPCNは1x1畳み込みカーネルを持つCNN形式の画像間の画素演算を実装している。
生のポラリメトリック画像を入力として、タスクネットワークに偏光パラメトリック画像を出力してバイソンタスクを完了させる。
共にトレーニングすることで、PPCNはタスクネットワークとデータセットに最適な偏光パラメトリック画像を提供することを学ぶことができる。
R-CNNをタスクネットワークとして高速にすることで、既存の手法と比較して、オブジェクト検出タスクにおける平均精度(mAP)がはるかに高いことを示す。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Rotation Equivariant Proximal Operator for Deep Unfolding Methods in Image Restoration [62.41329042683779]
本稿では, 回転対称性を組み込んだ高精度な回転同変近位ネットワークを提案する。
本研究は, 回転対称性の先行を深く展開する枠組みに効果的に組み込む, 高精度な回転同変近位ネットワークを提案する。
論文 参考訳(メタデータ) (2023-12-25T11:53:06Z) - Unleashing the Power of Depth and Pose Estimation Neural Networks by
Designing Compatible Endoscopic Images [12.412060445862842]
内視鏡画像の特性を詳細に解析し、画像とニューラルネットワークの互換性を改善する。
まず,完全な画像情報の代わりに部分的な画像情報を入力するMask Image Modelling (MIM) モジュールを導入する。
第2に、画像とニューラルネットワークの互換性を明確に向上させるために、内視鏡画像を強化する軽量ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-14T02:19:38Z) - TEC-Net: Vision Transformer Embrace Convolutional Neural Networks for
Medical Image Segmentation [20.976167468217387]
医用画像セグメンテーション(TEC-Net)のための畳み込みニューラルネットワークを取り入れた視覚変換器を提案する。
ネットワークには2つの利点がある。第1に、動的変形可能な畳み込み(DDConv)はCNNブランチで設計されており、固定サイズの畳み込みカーネルを用いた適応的特徴抽出の難しさを克服するだけでなく、異なる入力が同じ畳み込みカーネルパラメータを共有する欠陥を解決する。
実験の結果,提案するTEC-Netは,CNNやTransformerネットワークを含むSOTA法よりも医用画像のセグメンテーションが優れていることがわかった。
論文 参考訳(メタデータ) (2023-06-07T01:14:16Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - Low-Energy Convolutional Neural Networks (CNNs) using Hadamard Method [0.0]
畳み込みニューラルネットワーク(CNN)は、オブジェクト認識と検出の潜在的アプローチである。
畳み込み操作の代替として,アダマール変換に基づく新しいアプローチを示す。
この方法は、入力画像サイズよりもカーネルサイズが小さい場合、他のコンピュータビジョンタスクに役立ちます。
論文 参考訳(メタデータ) (2022-09-06T21:36:57Z) - Weakly-supervised fire segmentation by visualizing intermediate CNN
layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。
我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。
CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-16T11:56:28Z) - OSLO: On-the-Sphere Learning for Omnidirectional images and its
application to 360-degree image compression [59.58879331876508]
全方向画像の表現モデルの学習について検討し、全方向画像の深層学習モデルで使用される数学的ツールを再定義するために、HEALPixの球面一様サンプリングの特性を利用することを提案する。
提案したオン・ザ・スフィア・ソリューションは、等方形画像に適用された類似の学習モデルと比較して、13.7%のビットレートを節約できる圧縮ゲインを向上させる。
論文 参考訳(メタデータ) (2021-07-19T22:14:30Z) - Combining pretrained CNN feature extractors to enhance clustering of
complex natural images [27.784346095205358]
本稿では,画像クラスタリング(IC)における事前学習CNN機能の利用に関する知見を提供することを目的とする。
そこで本研究では,IC問題をマルチビュークラスタリング(MVC)問題として再構成することを提案する。
次に、MVC問題を効果的に解くためにエンドツーエンドに訓練されたマルチインプットニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-01-07T21:23:04Z) - Learning Deep Interleaved Networks with Asymmetric Co-Attention for
Image Restoration [65.11022516031463]
本稿では,高品質(本社)画像再構成のために,異なる状態の情報をどのように組み合わせるべきかを学習するディープインターリーブドネットワーク(DIN)を提案する。
本稿では,各インターリーブノードにアタッチメントされた非対称なコアテンション(AsyCA)を提案し,その特性依存性をモデル化する。
提案したDINはエンドツーエンドで訓練でき、様々な画像復元タスクに適用できる。
論文 参考訳(メタデータ) (2020-10-29T15:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。