論文の概要: CRRS: Concentric Rectangles Regression Strategy for Multi-point
Representation on Fisheye Images
- arxiv url: http://arxiv.org/abs/2303.14639v1
- Date: Sun, 26 Mar 2023 06:19:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 18:29:32.448960
- Title: CRRS: Concentric Rectangles Regression Strategy for Multi-point
Representation on Fisheye Images
- Title(参考訳): CRRS:魚眼画像の多点表現のための同心長方形回帰戦略
- Authors: Xihan Wang, Xi Xu, Yu Gao, Yi Yang, Yufeng Yue and Mengyin Fu
- Abstract要約: 本研究では,同心性矩形回帰戦略(CRRS)を提案する。
CRRSは精度と安定性の両方でトレーニング性能を向上させることができる。
- 参考スコア(独自算出の注目度): 28.970767317386635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern object detectors take advantage of rectangular bounding boxes as a
conventional way to represent objects. When it comes to fisheye images,
rectangular boxes involve more background noise rather than semantic
information. Although multi-point representation has been proposed, both the
regression accuracy and convergence still perform inferior to the widely used
rectangular boxes. In order to further exploit the advantages of multi-point
representation for distorted images, Concentric Rectangles Regression
Strategy(CRRS) is proposed in this work. We adopt smoother mean loss to
allocate weights and discuss the effect of hyper-parameter to prediction
results. Moreover, an accurate pixel-level method is designed to obtain
irregular IoU for estimating detector performance. Compared with the previous
work for muti-point representation, the experiments show that CRRS can improve
the training performance both in accurate and stability. We also prove that
multi-task weighting strategy facilitates regression process in this design.
- Abstract(参考訳): 現代の物体検出器は、オブジェクトを表現する従来の方法として長方形の境界ボックスを利用する。
魚眼画像に関して言えば、長方形の箱は意味的な情報よりも背景ノイズが多い。
マルチポイント表現は提案されているが、回帰精度と収束度は広く使われている矩形箱よりも劣っている。
本研究では,歪み画像に対する多点表現の利点をさらに活用するために,同心矩形回帰戦略(crrs)を提案する。
重み付けにスムースな平均損失を採用し,予測結果に対するハイパーパラメータの効果について検討した。
さらに、検出器性能を推定するための不規則なIoUを得るために、正確な画素レベル法が設計されている。
従来のミューティポイント表現と比較すると、CRRSは精度と安定性の両方でトレーニング性能を向上させることができる。
また,マルチタスク重み付け戦略がこの設計において回帰プロセスを促進することを証明した。
関連論文リスト
- Perceptual-Distortion Balanced Image Super-Resolution is a Multi-Objective Optimization Problem [23.833099288826045]
画素ベースの回帰損失を用いた単一画像超解法(SISR)モデルのトレーニングは、高い歪みメトリクススコアを得ることができる。
しかし、高周波の詳細の回復が不十分なため、しばしばぼやけた画像が生じる。
本稿では,Multi-Objective Optimization(MOO)をSISRモデルのトレーニングプロセスに組み込んで,知覚品質と歪みのバランスをとる手法を提案する。
論文 参考訳(メタデータ) (2024-09-05T02:14:04Z) - Towards Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling [11.129453244307369]
FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両領域間のギャップを狭める効果的なアプローチを提案する。
主に、イントラサンプルとインターサンプルの両方を共有する統一的な相互情報共有を促進する。
論文 参考訳(メタデータ) (2024-06-17T13:49:12Z) - Rolling Shutter Correction with Intermediate Distortion Flow Estimation [55.59359977619609]
本稿では,グローバルシャッタ(GS)からRSへの歪み流を直接推定することにより,ローリングシャッタ(RS)歪み画像を補正することを提案する。
既存の手法は通常、RSからGSへの非歪流を用いて補正を行う。
本稿では,歪み流を直接推定し,後方ワープ操作でRS像を補正する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-09T14:40:54Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Geometric-aware Pretraining for Vision-centric 3D Object Detection [77.7979088689944]
GAPretrainと呼ばれる新しい幾何学的事前学習フレームワークを提案する。
GAPretrainは、複数の最先端検出器に柔軟に適用可能なプラグアンドプレイソリューションとして機能する。
BEVFormer法を用いて, nuScenes val の 46.2 mAP と 55.5 NDS を実現し, それぞれ 2.7 と 2.1 点を得た。
論文 参考訳(メタデータ) (2023-04-06T14:33:05Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Optimization for Oriented Object Detection via Representation Invariance
Loss [2.501282372971187]
主流の回転検出器は、回転物体を表すために指向境界ボックス(OBB)または四方境界ボックス(QBB)を使用する。
回転物体に対する境界ボックス回帰を最適化するために,Representation Invariance Loss (RIL)を提案する。
本手法は,リモートセンシングデータセットとシーンテキストデータセットの実験において,一貫性と大幅な改善を実現する。
論文 参考訳(メタデータ) (2021-03-22T07:55:33Z) - Deep Probabilistic Feature-metric Tracking [27.137827823264942]
画素単位の深度特徴写像と深度特徴量不確実性写像を学習するための新しいフレームワークを提案する。
CNNは、より高速で信頼性の高い収束のための深い初期ポーズを予測する。
実験により,TUM RGB-Dデータセットと3次元剛性物体追跡データセットの最先端性能が示された。
論文 参考訳(メタデータ) (2020-08-31T11:47:59Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Progressively Guided Alternate Refinement Network for RGB-D Salient
Object Detection [63.18846475183332]
我々は,RGB-Dの高次物体検出のための効率的かつコンパクトなディープネットワークを開発することを目指している。
そこで本研究では,改良のための改良ネットワークを提案する。
我々のモデルは、既存の最先端のアプローチよりも大きなマージンで優れています。
論文 参考訳(メタデータ) (2020-08-17T02:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。