論文の概要: Few-shot Visual Reasoning with Meta-analogical Contrastive Learning
- arxiv url: http://arxiv.org/abs/2007.12020v1
- Date: Thu, 23 Jul 2020 14:00:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 11:35:43.428552
- Title: Few-shot Visual Reasoning with Meta-analogical Contrastive Learning
- Title(参考訳): メタ・アナロジカル・コントラスト学習によるビジュアル推論
- Authors: Youngsung Kim, Jinwoo Shin, Eunho Yang, Sung Ju Hwang
- Abstract要約: 本稿では,類似推論に頼って,数ショット(または低ショット)の視覚推論問題を解くことを提案する。
両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
- 参考スコア(独自算出の注目度): 141.2562447971
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While humans can solve a visual puzzle that requires logical reasoning by
observing only few samples, it would require training over large amount of data
for state-of-the-art deep reasoning models to obtain similar performance on the
same task. In this work, we propose to solve such a few-shot (or low-shot)
visual reasoning problem, by resorting to analogical reasoning, which is a
unique human ability to identify structural or relational similarity between
two sets. Specifically, given training and test sets that contain the same type
of visual reasoning problems, we extract the structural relationships between
elements in both domains, and enforce them to be as similar as possible with
analogical learning. We repeatedly apply this process with slightly modified
queries of the same problem under the assumption that it does not affect the
relationship between a training and a test sample. This allows to learn the
relational similarity between the two samples in an effective manner even with
a single pair of samples. We validate our method on RAVEN dataset, on which it
outperforms state-of-the-art method, with larger gains when the training data
is scarce. We further meta-learn our analogical contrastive learning model over
the same tasks with diverse attributes, and show that it generalizes to the
same visual reasoning problem with unseen attributes.
- Abstract(参考訳): 人間は少数のサンプルを観察することで論理的推論を必要とする視覚パズルを解くことができるが、同じタスクで同様のパフォーマンスを得るためには、最先端の深い推論モデルのために大量のデータをトレーニングする必要がある。
本研究では,2つの集合間の構造的・関係的類似性を識別するユニークな人間的能力である類似推論を用いて,このような数ショット(または低ショット)の視覚的推論問題を解くことを提案する。
具体的には、同じタイプの視覚的推論問題を含むトレーニングとテストセットについて、両領域の要素間の構造的関係を抽出し、類似学習と可能な限り類似するように強制する。
我々は、トレーニングとテストサンプルの関係に影響を与えないという仮定のもと、同じ問題のクエリをわずかに修正したこのプロセスを繰り返し適用する。
これにより、単一のサンプルであっても、2つのサンプル間の関係的な類似性を効果的に学習することができる。
RAVENデータセット上での本手法の有効性を検証し, トレーニングデータが少ない場合, 最先端の手法より優れることを示す。
さらに,異なる属性を持つ同じタスクに対して類似のコントラスト学習モデルをメタラーニングし,未知の属性を持つ同じ視覚的推論問題に一般化することを示す。
関連論文リスト
- CKD: Contrastive Knowledge Distillation from A Sample-wise Perspective [48.99488315273868]
本研究では,試料内およびサンプル間制約によるサンプルワイドアライメント問題として定式化できる,対照的な知識蒸留手法を提案する。
本手法は, 数値を考慮し, 同一試料中のロジット差を最小化する。
CIFAR-100, ImageNet-1K, MS COCOの3つのデータセットについて総合的な実験を行った。
論文 参考訳(メタデータ) (2024-04-22T11:52:40Z) - Pooling Image Datasets With Multiple Covariate Shift and Imbalance [22.53402104452306]
カテゴリー論の観点からこの問題がいかに単純かつ効果的な解をもたらすかを示す。
提案手法の有効性を,実データを用いた広範囲な実験により示す。
論文 参考訳(メタデータ) (2024-03-05T02:20:33Z) - Investigate the Essence of Long-Tailed Recognition from a Unified
Perspective [11.080317683184363]
深層認識モデルは、カテゴリ間の重い不均衡なサンプル数のために、長い尾のデータ分布に悩まされることが多い。
本研究では,長い尾の認識が標本数とカテゴリの類似性の両方に悩まされていることを示す。
論文 参考訳(メタデータ) (2021-07-08T11:08:40Z) - Visual analogy: Deep learning versus compositional models [3.2435333321661983]
視覚アナロジーにおけるヒューマンパフォーマンスと代替計算モデルの性能を比較した。
人間の推論者は、すべての問題タイプに対して高い精度を達成したが、いくつかの条件でより多くの誤りを犯した。
部分表現に基づく合成モデルは、深層学習モデルではなく、人間の推論と類似した質的な性能を生んだ。
論文 参考訳(メタデータ) (2021-05-14T20:56:02Z) - An Empirical Comparison of Instance Attribution Methods for NLP [62.63504976810927]
本研究は,トレーニングサンプルの重要性に関して,異なるインスタンス属性が一致した度合いを評価する。
単純な検索メソッドは、グラデーションベースの方法によって識別されたものと異なるトレーニングインスタンスを生成する。
論文 参考訳(メタデータ) (2021-04-09T01:03:17Z) - An Empirical Study on Measuring the Similarity of Sentential Arguments
with Language Model Domain Adaptation [0.0]
データセットはさまざまなトピックの専門知識を使ってアノテートされなければならず、ラベル付きデータによる教師付き学習が高価になる。
最初に,事前学習した言語モデルを,自己教師あり学習を用いて関心領域に適用した。
我々は、異なるドメインから取られた文間の類似度を測定するタスクにモデルを微調整した。
論文 参考訳(メタデータ) (2021-02-19T08:05:46Z) - Towards Visually Explaining Similarity Models [29.704524987493766]
本稿では,画像類似度予測のための勾配に基づく視覚的注意を生成する手法を提案する。
学習した機能の埋め込みにのみ依存することにより、我々のアプローチがCNNベースの類似性アーキテクチャのあらゆる種類に適用可能であることを示す。
得られたアテンションマップは、単に解釈可能性だけでなく、新たなトレーニング可能な制約でモデル学習プロセス自体に注入可能であることを示す。
論文 参考訳(メタデータ) (2020-08-13T17:47:41Z) - Pairwise Supervision Can Provably Elicit a Decision Boundary [84.58020117487898]
類似性学習は、パターンのペア間の関係を予測することによって有用な表現を引き出す問題である。
類似性学習は、決定境界を直接引き出すことによって二項分類を解くことができることを示す。
論文 参考訳(メタデータ) (2020-06-11T05:35:16Z) - Memory-Augmented Relation Network for Few-Shot Learning [114.47866281436829]
本研究では,新しい距離学習手法であるメモリ拡張リレーショナルネットワーク(MRN)について検討する。
MRNでは、作業状況と視覚的に類似したサンプルを選択し、重み付け情報伝搬を行い、選択したサンプルから有用な情報を注意深く集約し、その表現を強化する。
我々は、MRNが祖先よりも大幅に向上し、他の数発の学習手法と比較して、競争力や性能が向上することを示した。
論文 参考訳(メタデータ) (2020-05-09T10:09:13Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。