論文の概要: Directed Variational Cross-encoder Network for Few-shot Multi-image
Co-segmentation
- arxiv url: http://arxiv.org/abs/2010.08800v1
- Date: Sat, 17 Oct 2020 14:38:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 11:55:11.616321
- Title: Directed Variational Cross-encoder Network for Few-shot Multi-image
Co-segmentation
- Title(参考訳): 可変クロスエンコーダネットワークによる多視点複数画像合成
- Authors: Sayan Banerjee, S Divakar Bhat, Subhasis Chaudhuri, Rajbabu Velmurugan
- Abstract要約: 本稿では,クラスメタラーニング戦略を用いたマルチイメージ・コセグメンテーションのための新しいフレームワークを提案する。
提案するDVICEネットワークと,iCosegやMSRCといった小さなデータセットと協調して発生する小さなサンプルサイズ問題に対処するために,新たな数ショット学習手法を併用した。
- 参考スコア(独自算出の注目度): 13.802318682861838
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a novel framework for multi-image co-segmentation
using class agnostic meta-learning strategy by generalizing to new classes
given only a small number of training samples for each new class. We have
developed a novel encoder-decoder network termed as DVICE (Directed Variational
Inference Cross Encoder), which learns a continuous embedding space to ensure
better similarity learning. We employ a combination of the proposed DVICE
network and a novel few-shot learning approach to tackle the small sample size
problem encountered in co-segmentation with small datasets like iCoseg and
MSRC. Furthermore, the proposed framework does not use any semantic class
labels and is entirely class agnostic. Through exhaustive experimentation over
multiple datasets using only a small volume of training data, we have
demonstrated that our approach outperforms all existing state-of-the-art
techniques.
- Abstract(参考訳): 本稿では,クラス非依存なメタラーニング戦略を用いて,新しいクラスに対して少量のトレーニングサンプルしか与えない新しいクラスを一般化し,マルチイメージ共同セグメンテーションのための新しいフレームワークを提案する。
我々はDVICE(Directed Variational Inference Cross Encoder)と呼ばれる新しいエンコーダデコーダネットワークを開発した。
提案するDVICEネットワークと,iCosegやMSRCといった小さなデータセットと協調して発生する小さなサンプルサイズ問題に対処するために,新たな数ショット学習手法を併用した。
さらに、提案するフレームワークはセマンティッククラスラベルを一切使用せず、完全にクラスに依存しない。
少数のトレーニングデータのみを使用して、複数のデータセットを徹底的に実験することで、我々のアプローチが既存の最先端技術を上回ることを実証した。
関連論文リスト
- LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Multi-scale and Cross-scale Contrastive Learning for Semantic
Segmentation [5.281694565226513]
セグメンテーションネットワークによって抽出されたマルチスケール特徴の識別能力を高めるために,コントラスト学習を適用した。
まず、エンコーダのマルチスケール表現を共通の特徴空間にマッピングすることにより、教師付き局所言語制約の新しい形式をインスタンス化する。
論文 参考訳(メタデータ) (2022-03-25T01:24:24Z) - Learning What Not to Segment: A New Perspective on Few-Shot Segmentation [63.910211095033596]
近年では、FSS ( few-shot segmentation) が広く開発されている。
本稿では,問題を緩和するための新鮮で直接的な知見を提案する。
提案されたアプローチのユニークな性質を踏まえて、より現実的で挑戦的な設定にまで拡張する。
論文 参考訳(メタデータ) (2022-03-15T03:08:27Z) - Query Adaptive Few-Shot Object Detection with Heterogeneous Graph
Convolutional Networks [33.446875089255876]
Few-shot Object Detection (FSOD) は、いくつかの例を使って見えないオブジェクトを検出することを目的としている。
異種グラフ畳み込みネットワークを用いた新しいFSODモデルを提案する。
論文 参考訳(メタデータ) (2021-12-17T22:08:15Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - MFNet: Multi-class Few-shot Segmentation Network with Pixel-wise Metric
Learning [34.059257121606336]
この研究は、まだほとんど探索されていない分野である少数ショットセマンティックセマンティックセグメンテーションに焦点を当てている。
まず,マルチウェイ符号化とデコードアーキテクチャを提案する。このアーキテクチャは,マルチスケールクエリ情報とマルチクラスサポート情報を1つのクエリ支援埋め込みに効果的に融合する。
標準ベンチマーク PASCAL-5i と COCO-20i による実験により, 数発のセグメンテーションにおいて, 本手法の利点が明らかに示された。
論文 参考訳(メタデータ) (2021-10-30T11:37:36Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。