論文の概要: Weakly Supervised Instance Attention for Multisource Fine-Grained Object
Recognition with an Application to Tree Species Classification
- arxiv url: http://arxiv.org/abs/2105.10983v2
- Date: Tue, 25 May 2021 20:35:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:46:11.910003
- Title: Weakly Supervised Instance Attention for Multisource Fine-Grained Object
Recognition with an Application to Tree Species Classification
- Title(参考訳): 多元細粒オブジェクト認識のための弱教師付き例注意と木種分類への応用
- Authors: Bulut Aygunes, Ramazan Gokberk Cinbis, Selim Aksoy
- Abstract要約: 比較的小さなオブジェクトを分類するマルチソース手法を提案する。
提案手法は,並列分岐を用いた単一ソース深部注目モデルを用いて,オブジェクトの局所化と分類を行う。
以上の結果から,40種類の木に対する認識精度は53%と高い結果が得られた。
- 参考スコア(独自算出の注目度): 9.668407688201361
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Multisource image analysis that leverages complementary spectral, spatial,
and structural information benefits fine-grained object recognition that aims
to classify an object into one of many similar subcategories. However, for
multisource tasks that involve relatively small objects, even the smallest
registration errors can introduce high uncertainty in the classification
process. We approach this problem from a weakly supervised learning perspective
in which the input images correspond to larger neighborhoods around the
expected object locations where an object with a given class label is present
in the neighborhood without any knowledge of its exact location. The proposed
method uses a single-source deep instance attention model with parallel
branches for joint localization and classification of objects, and extends this
model into a multisource setting where a reference source that is assumed to
have no location uncertainty is used to aid the fusion of multiple sources in
four different levels: probability level, logit level, feature level, and pixel
level. We show that all levels of fusion provide higher accuracies compared to
the state-of-the-art, with the best performing method of feature-level fusion
resulting in 53% accuracy for the recognition of 40 different types of trees,
corresponding to an improvement of 5.7% over the best performing baseline when
RGB, multispectral, and LiDAR data are used. We also provide an in-depth
comparison by evaluating each model at various parameter complexity settings,
where the increased model capacity results in a further improvement of 6.3%
over the default capacity setting.
- Abstract(参考訳): 補完スペクトル、空間、構造情報を利用するマルチソース画像解析は、オブジェクトを多くの類似したサブカテゴリの1つに分類することを目的とした、きめ細かいオブジェクト認識の恩恵を受ける。
しかし、比較的小さなオブジェクトを含むマルチソースタスクでは、最小の登録エラーでさえ分類プロセスに高い不確実性をもたらす可能性がある。
入力画像は,与えられたクラスラベルを持つオブジェクトが近傍に存在し,その正確な位置を知らずに,期待される対象位置周辺の大きな近傍に対応するという,弱い教師付き学習視点からこの問題にアプローチする。
提案手法では,オブジェクトの同時配置と分類に並列分岐を持つ単一ソースのディープインスタンスアテンションモデルを使用し,このモデルを複数ソースに拡張することで,位置不確実性のないと仮定された参照ソースを用いて,確率レベル,ロジットレベル,特徴レベル,画素レベルという4つのレベルにおける複数のソースの融合を支援する。
その結果,RGB,マルチスペクトル,LiDARデータを用いた場合の最高性能ベースラインよりも5.7%向上し,40種類の木を認識した場合の精度が53%向上した。
また,様々なパラメータの複雑性設定において,各モデルを評価することで,モデルのキャパシティが増加すると,デフォルトキャパシティ設定よりも6.3%向上する。
関連論文リスト
- Enhanced Semantic Segmentation for Large-Scale and Imbalanced Point Clouds [6.253217784798542]
小型の物体は、発生頻度が低いため、アンダーサンプリングや誤分類される傾向がある。
本稿では,大規模かつサンプル不均衡なクラウドシーンを対象としたマルチラテラルカスケーディングネットワーク(MCNet)を提案する。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - GLCONet: Learning Multi-source Perception Representation for Camouflaged Object Detection [23.872633359324098]
我々はGLCONetと呼ばれる新しいグローバルローカル協調最適化ネットワークを提案する。
本稿では、まず、局所的な詳細とグローバルな長距離関係を同時にモデル化するための協調最適化戦略を設計する。
実験により、異なるバックボーンを持つGLCONet法は、画像中の潜在的に重要なピクセルを効果的に活性化できることが示されている。
論文 参考訳(メタデータ) (2024-09-15T02:26:17Z) - Hierarchical Attention and Parallel Filter Fusion Network for Multi-Source Data Classification [33.26466989592473]
マルチソースデータ分類のための階層的注意と並列フィルタ融合ネットワークを提案する。
提案手法は,各データセットの総合精度(OA)の91.44%と80.51%を達成する。
論文 参考訳(メタデータ) (2024-08-22T23:14:22Z) - Few-shot Object Localization [37.347898735345574]
本稿では,Few-Shot Object Localization (FSOL) という新しいタスクを定義する。
限られたサンプルで正確な位置決めを実現することを目的としている。
本課題は、少数のラベル付きサポートサンプルを利用して、対応する画像内のオブジェクトの位置情報をクエリすることで、一般化されたオブジェクトのローカライゼーションを実現する。
実験の結果,FSOLタスクにおけるアプローチの大幅な性能向上が示され,さらなる研究のための効率的なベンチマークが確立された。
論文 参考訳(メタデータ) (2024-03-19T05:50:48Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Auto-Transfer: Learning to Route Transferrable Representations [77.30427535329571]
本稿では,適切なターゲット表現にソース表現をルートする方法を自動学習する,新しい対向型マルチアームバンディット手法を提案する。
最先端の知識伝達手法と比較すると,5%以上の精度向上が期待できる。
論文 参考訳(メタデータ) (2022-02-02T13:09:27Z) - Multi-Source Domain Adaptation for Object Detection [52.87890831055648]
我々は、Divide-and-Merge Spindle Network (DMSN)と呼ばれる、より高速なR-CNNベースのフレームワークを提案する。
DMSNはドメイン非ネイティブを同時に強化し、識別力を維持することができる。
擬似目標部分集合の最適パラメータを近似する新しい擬似学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-30T03:17:20Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。