論文の概要: Learning ordered pooling weights in image classification
- arxiv url: http://arxiv.org/abs/2007.01243v2
- Date: Thu, 10 Jun 2021 16:38:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 14:27:18.184104
- Title: Learning ordered pooling weights in image classification
- Title(参考訳): 画像分類における順序付きプール重みの学習
- Authors: J.I.Forcen, Miguel Pagola, Edurne Barrenechea and Humberto Bustince
- Abstract要約: Bag-of-Wordsは、畳み込みニューラルネットワークやBag-of-Wordsメソッドのようなコンピュータビジョンシステムにおいて重要なステップである。
本稿では,Bag-of-Wordsフレームワークと畳み込みニューラルネットワークを用いて,OWA集約演算子の重み付けを学習する手法を提案する。
- 参考スコア(独自算出の注目度): 9.030769176986057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spatial pooling is an important step in computer vision systems like
Convolutional Neural Networks or the Bag-of-Words method. The spatial pooling
purpose is to combine neighbouring descriptors to obtain a single descriptor
for a given region (local or global). The resultant combined vector must be as
discriminant as possible, in other words, must contain relevant information,
while removing irrelevant and confusing details. Maximum and average are the
most common aggregation functions used in the pooling step. To improve the
aggregation of relevant information without degrading their discriminative
power for image classification, we introduce a simple but effective scheme
based on Ordered Weighted Average (OWA) aggregation operators. We present a
method to learn the weights of the OWA aggregation operator in a Bag-of-Words
framework and in Convolutional Neural Networks, and provide an extensive
evaluation showing that OWA based pooling outperforms classical aggregation
operators.
- Abstract(参考訳): 空間プーリングは畳み込みニューラルネットワークやバガ・オブ・ワードズ法のようなコンピュータビジョンシステムにおいて重要なステップである。
空間プールの目的は、隣接するディスクリプタを組み合わせて、指定された地域(ローカルまたはグローバル)の1つのディスクリプタを取得することである。
結果の組合せベクトルは可能な限り識別可能でなければならず、言い換えれば、関連する情報を含み、無関係で紛らわしい詳細を取り除く必要がある。
最大および平均は、プーリングステップで使用される最も一般的な集約関数である。
画像分類における識別力を低下させることなく,関連情報の集約を改善するために,順序付き重み付け演算子(OWA)に基づく簡易かつ効果的な手法を提案する。
本稿では,owaアグリゲーション演算子の重みを,単語のバッグ・オブ・ワードの枠組みと畳み込みニューラルネットワークで学習する手法を提案し,owaベースのプールが古典的アグリゲーション演算子よりも優れていることを示す。
関連論文リスト
- ENADPool: The Edge-Node Attention-based Differentiable Pooling for Graph Neural Networks [19.889547537748395]
グラフニューラルネットワーク(GNN)は、グラフ分類のための強力なツールである。
GNNにとって重要な操作の1つは、ノード表現から効果的な埋め込みを学習できるダウンサンプリングまたはプールである。
We propose a new Hierarchical pooling operation、すなわち Edge-Node Attention-based Differentiable Pooling (ENADPool)を提案する。
論文 参考訳(メタデータ) (2024-05-16T16:08:49Z) - Optimal Transport Aggregation for Visual Place Recognition [9.192660643226372]
SALADは,NetVLADの局所的特徴のソフトアサインを最適な輸送問題としてクラスタに再配置する。
SALADでは,機能間クラスタ関係とクラスタ間クラスタ関係の両方を考慮するとともに,非形式的と考えられる特徴を選択的に破棄する'ダストビン'クラスタも導入する。
我々のシングルステージ手法は、パブリックなVPRデータセットの単一ステージベースラインを超えるだけでなく、2段階の手法を超越し、コストを大幅に高めに再ランク付けする。
論文 参考訳(メタデータ) (2023-11-27T15:46:19Z) - SQLNet: Scale-Modulated Query and Localization Network for Few-Shot
Class-Agnostic Counting [71.38754976584009]
CAC(class-agnostic counting)タスクは、最近、任意のクラスの全てのオブジェクトを、入力画像にいくつかの例を付与してカウントする問題を解くために提案されている。
我々は、スケール変調クエリーおよびローカライズネットワーク(Net)と呼ばれる、新しいローカライズベースのCACアプローチを提案する。
クエリとローカライゼーションの段階において、模範者のスケールを完全に探求し、各オブジェクトを正確に位置付けし、その近似サイズを予測することで、効果的なカウントを実現している。
論文 参考訳(メタデータ) (2023-11-16T16:50:56Z) - Distributed Learning over Networks with Graph-Attention-Based
Personalization [49.90052709285814]
分散ディープラーニングのためのグラフベースパーソナライズアルゴリズム(GATTA)を提案する。
特に、各エージェントのパーソナライズされたモデルは、グローバルな部分とノード固有の部分で構成される。
グラフ内の各エージェントを1つのノードとして扱うことにより、ノード固有のパラメータを特徴として扱うことにより、グラフアテンション機構の利点を継承することができる。
論文 参考訳(メタデータ) (2023-05-22T13:48:30Z) - DeepCut: Unsupervised Segmentation using Graph Neural Networks
Clustering [6.447863458841379]
本研究では,従来のクラスタリング手法を置き換える軽量グラフニューラルネットワーク(GNN)を提案する。
既存の手法とは異なり、GNNはローカル画像特徴と生特徴とのペアワイズ親和性の両方を入力として取ります。
画像セグメンテーションGNNを訓練するための自己教師付き損失関数として,古典的クラスタリングの目的を定式化する方法を実証する。
論文 参考訳(メタデータ) (2022-12-12T12:31:46Z) - Higher-order Clustering and Pooling for Graph Neural Networks [77.47617360812023]
グラフニューラルネットワークは、多数のグラフ分類タスクにおいて最先端のパフォーマンスを達成する。
HoscPoolはクラスタリングベースのグラフプーリング演算子で、階層的に高階情報をキャプチャする。
グラフ分類タスクにおいてHoscPoolを評価し,そのクラスタリングコンポーネントを地層構造を持つグラフ上で評価する。
論文 参考訳(メタデータ) (2022-09-02T09:17:10Z) - Meta Clustering Learning for Large-scale Unsupervised Person
Re-identification [124.54749810371986]
メタクラスタリング学習(MCL)と呼ばれる「大規模タスクのための小さなデータ」パラダイムを提案する。
MCLは、第1フェーズのトレーニングのためにコンピューティングを節約するためにクラスタリングを介して、未ラベルデータのサブセットを擬似ラベル付けするのみである。
提案手法は計算コストを大幅に削減すると同時に,従来よりも優れた性能を実現している。
論文 参考訳(メタデータ) (2021-11-19T04:10:18Z) - Ordinal Pooling [26.873004843826962]
通常のプーリングは、シーケンス内のプール領域の要素を並べ替え、シーケンス内の順序に基づいて各要素に異なる重みを割り当てる。
実験により、ネットワークがプーリング層内で異なるタイプのプール操作を行うのが有利であることが示唆された。
論文 参考訳(メタデータ) (2021-09-03T14:33:02Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Diversity-Aware Weighted Majority Vote Classifier for Imbalanced Data [1.2944868613449219]
多様性を考慮したアンサンブル学習に基づくアルゴリズム DAMVI を提案する。
本稿では, 予測保守作業, クレジットカード不正検出, ウェブページ分類, 医療応用に関する最先端モデルに関して, 提案手法の効率性を示す。
論文 参考訳(メタデータ) (2020-04-16T11:27:50Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。