論文の概要: IF-Net: An Illumination-invariant Feature Network
- arxiv url: http://arxiv.org/abs/2008.03897v1
- Date: Mon, 10 Aug 2020 04:32:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 22:48:26.635203
- Title: IF-Net: An Illumination-invariant Feature Network
- Title(参考訳): IF-Net:イルミネーション不変の特徴ネットワーク
- Authors: Po-Heng Chen, Zhao-Xu Luo, Zu-Kuan Huang, Chun Yang, Kuan-Wen Chen
- Abstract要約: 重要な照明条件下で頑健で汎用的な記述子を生成することを目的としたIF-Netを提案する。
いくつかのデータセットスケジューリング手法について検討し,マッチング精度を向上させるための分離学習手法を提案する。
我々は,公開パッチマッチングベンチマークに対するアプローチを評価し,いくつかの最先端手法と比較し,最良の結果を得た。
- 参考スコア(独自算出の注目度): 14.45346476195114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature descriptor matching is a critical step is many computer vision
applications such as image stitching, image retrieval and visual localization.
However, it is often affected by many practical factors which will degrade its
performance. Among these factors, illumination variations are the most
influential one, and especially no previous descriptor learning works focus on
dealing with this problem. In this paper, we propose IF-Net, aimed to generate
a robust and generic descriptor under crucial illumination changes conditions.
We find out not only the kind of training data important but also the order it
is presented. To this end, we investigate several dataset scheduling methods
and propose a separation training scheme to improve the matching accuracy.
Further, we propose a ROI loss and hard-positive mining strategy along with the
training scheme, which can strengthen the ability of generated descriptor
dealing with large illumination change conditions. We evaluate our approach on
public patch matching benchmark and achieve the best results compared with
several state-of-the-arts methods. To show the practicality, we further
evaluate IF-Net on the task of visual localization under large illumination
changes scenes, and achieves the best localization accuracy.
- Abstract(参考訳): 特徴ディスクリプタマッチングは、画像ステッチ、画像検索、ビジュアルローカライゼーションなど多くのコンピュータビジョンアプリケーションにとって重要なステップである。
しかし、しばしば性能を低下させる多くの実用的な要因に影響される。
これらの要因のうち、照明のバリエーションが最も影響力があり、特に以前の記述者学習はこの問題に焦点を絞ったものではない。
本稿では,重要な照明変化条件下でロバストで汎用的な記述子を生成するif-netを提案する。
重要なトレーニングデータの種類だけでなく、提示した順序も分かるのです。
そこで本研究では,複数のデータセットスケジューリング手法を調査し,マッチング精度を向上させるための分離学習手法を提案する。
また,大規模な照明条件に対処するデクリプタの生成能力を高めるためのトレーニングスキームとともに,ROI損失と強陽性のマイニング戦略を提案する。
提案手法を公開パッチマッチングベンチマークで評価し,いくつかの最先端手法と比較した。
実用性を示すために,大照明下での視像定位課題であるif-netをさらに評価し,最適な定位精度を実現する。
関連論文リスト
- ALEN: A Dual-Approach for Uniform and Non-Uniform Low-Light Image Enhancement [6.191556429706728]
不適切な照明は、情報損失や画質の低下を招き、監視などの様々な応用に影響を及ぼす可能性がある。
現在のエンハンスメント技術は、しばしば特定のデータセットを使用して低照度画像を強化するが、様々な現実世界の条件に適応する際の課題は残る。
アダプティブ・ライト・エンハンスメント・ネットワーク (ALEN) を導入し、その主なアプローチは、ローカル照明とグローバル照明の強化が必要であるかどうかを決定するための分類機構を使用することである。
論文 参考訳(メタデータ) (2024-07-29T05:19:23Z) - Debiasing Multimodal Large Language Models [61.6896704217147]
LVLM(Large Vision-Language Models)は、コンピュータビジョンや自然言語処理において欠かせないツールとなっている。
本研究は,入力画像に先行するLarge Language Models (LLM) の影響を主に受け,生成したコンテンツに有意なバイアスが生じることを示す。
これらのバイアスを是正し、視覚情報に対するモデルの焦点をリダイレクトするために、我々は2つの単純で訓練のない戦略を導入する。
論文 参考訳(メタデータ) (2024-03-08T12:35:07Z) - Fiducial Focus Augmentation for Facial Landmark Detection [4.433764381081446]
本稿では,モデルによる顔構造理解を高めるために,新しい画像強調手法を提案する。
我々は,Deep Canonical correlation Analysis (DCCA) に基づく損失を考慮した,シームズアーキテクチャに基づくトレーニング機構を採用している。
提案手法は,様々なベンチマークデータセットにおいて,最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2024-02-23T01:34:00Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Enhancing Deformable Local Features by Jointly Learning to Detect and
Describe Keypoints [8.390939268280235]
局所特徴抽出は、画像マッチングや検索といった重要なタスクに対処するためのコンピュータビジョンにおける標準的なアプローチである。
鍵点を共同で検出・記述する新しい変形認識ネットワークであるDALFを提案する。
提案手法は、変形可能なオブジェクト検索と、非剛性な3次元表面登録という、2つの実世界のアプリケーションの性能を向上させる。
論文 参考訳(メタデータ) (2023-04-02T18:01:51Z) - Low-light Image Enhancement by Retinex Based Algorithm Unrolling and
Adjustment [50.13230641857892]
本稿では,低照度画像強調(LIE)問題に対する新たなディープラーニングフレームワークを提案する。
提案フレームワークは,大域的明るさと局所的明るさ感度の両方を考慮したアルゴリズムアンロールと調整ネットワークに着想を得た分解ネットワークを含む。
一連の典型的なLIEデータセットの実験では,既存の手法と比較して,定量的かつ視覚的に,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-12T03:59:38Z) - Learning Deep Context-Sensitive Decomposition for Low-Light Image
Enhancement [58.72667941107544]
典型的なフレームワークは、照明と反射を同時に推定することであるが、特徴空間にカプセル化されたシーンレベルの文脈情報を無視する。
本研究では,空間スケールにおけるシーンレベルのコンテキスト依存を生かした,コンテキスト依存型分解ネットワークアーキテクチャを提案する。
チャネル数を減らして軽量なCSDNet(LiteCSDNet)を開発する。
論文 参考訳(メタデータ) (2021-12-09T06:25:30Z) - Revisiting The Evaluation of Class Activation Mapping for
Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。
説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文 参考訳(メタデータ) (2021-04-20T21:34:24Z) - Interpretable Detail-Fidelity Attention Network for Single Image
Super-Resolution [89.1947690981471]
本研究では,スムースとディテールを段階的に分割・収束的に処理する,目的・解釈可能なディテール・ファイダリティ・アテンション・ネットワークを提案する。
特に,詳細推論において顕著な解釈可能な特徴表現のためのヘシアンフィルタを提案する。
実験により,提案手法は最先端手法よりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-09-28T08:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。