論文の概要: Evaluating the Progress of Deep Learning for Visual Relational Concepts
- arxiv url: http://arxiv.org/abs/2001.10857v3
- Date: Mon, 13 Sep 2021 15:19:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 21:20:42.639175
- Title: Evaluating the Progress of Deep Learning for Visual Relational Concepts
- Title(参考訳): ビジュアルリレーショナル概念のための深層学習の進歩の評価
- Authors: Sebastian Stabinger, Peer David, Justus Piater, and Antonio
Rodr\'iguez-S\'anchez
- Abstract要約: 難しいタスクが認知心理学のリレーショナルな概念と結びついていることを示します。
我々は,この角度から提示されていなくても,関係概念学習に関連する研究をレビューする。
将来のデータセットをリレーショナル推論でテストシステムにもっと関連付けるためのステップを推奨します。
- 参考スコア(独自算出の注目度): 0.6999740786886536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional Neural Networks (CNNs) have become the state of the art method
for image classification in the last ten years. Despite the fact that they
achieve superhuman classification accuracy on many popular datasets, they often
perform much worse on more abstract image classification tasks. We will show
that these difficult tasks are linked to relational concepts from cognitive
psychology and that despite progress over the last few years, such relational
reasoning tasks still remain difficult for current neural network
architectures.
We will review deep learning research that is linked to relational concept
learning, even if it was not originally presented from this angle. Reviewing
the current literature, we will argue that some form of attention will be an
important component of future systems to solve relational tasks.
In addition, we will point out the shortcomings of currently used datasets,
and we will recommend steps to make future datasets more relevant for testing
systems on relational reasoning.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)は,過去10年間で画像分類の最先端技術となっている。
多くの一般的なデータセットで超人的な分類精度を達成しているにもかかわらず、より抽象的な画像分類タスクでははるかに悪い結果になることが多い。
これらの困難なタスクが認知心理学のリレーショナル概念と関連していることを示すとともに、ここ数年の進歩にもかかわらず、現在のニューラルネットワークアーキテクチャでは、このようなリレーショナル推論タスクは依然として難しいままである。
我々は,この角度から提示されていなくても,関係概念学習に関連する深層学習研究をレビューする。
現在の文献を振り返ってみると、関係性タスクを解決するための将来のシステムの重要な要素として、何らかの注意が向けられるだろうと論じる。
さらに、現在使用されているデータセットの欠点を指摘し、リレーショナル推論でシステムをテストする上で、将来のデータセットをより関連付けるためのステップを推奨します。
関連論文リスト
- Development of Skip Connection in Deep Neural Networks for Computer Vision and Medical Image Analysis: A Survey [6.2299272077865675]
スキップ接続はディープニューラルネットワークのアーキテクチャにおいて重要な役割を担っている。
このサーベイは、ディープニューラルネットワークにおけるスキップ接続の開発に関する包括的な概要と展望を提供する。
コンピュータビジョンにおけるスキップ接続を利用したセミナー論文、ソースコード、モデル、データセットを要約する。
論文 参考訳(メタデータ) (2024-05-02T20:43:58Z) - Look-Ahead Selective Plasticity for Continual Learning of Visual Tasks [9.82510084910641]
タスク境界において,タスクが終了し,他のタスク開始時に発生する新しいメカニズムを提案する。
CIFAR10やTinyImagenetなどのコンピュータビジョンデータセットのベンチマークで提案手法を評価する。
論文 参考訳(メタデータ) (2023-11-02T22:00:23Z) - Feature Forgetting in Continual Representation Learning [48.89340526235304]
表現は、平凡な連続学習においても「破滅的な忘れ」に苦しめられることはないが、その特徴についてはほとんど知られていない。
連続的な学習における表現を評価するためのプロトコルを考案し、それを用いて連続的な表現学習の基本的傾向の概要を示す。
特徴忘れ問題を研究するために、ニューラルネットワークにおける特徴忘れの頻度を識別し視覚化する合成データセットを作成する。
論文 参考訳(メタデータ) (2022-05-26T13:38:56Z) - Deep transfer learning for image classification: a survey [4.590533239391236]
画像分類のベストプラクティスは、大量のラベル付きデータに基づいて大きな深層モデルをトレーニングできることである。
これらのシナリオでは、トランスファーラーニングはパフォーマンスを改善するのに役立つ。
画像分類におけるトランスファーラーニングの適用の新たな分類法を提案する。
論文 参考訳(メタデータ) (2022-05-20T00:03:39Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Neural Architecture Search for Dense Prediction Tasks in Computer Vision [74.9839082859151]
ディープラーニングは、ニューラルネットワークアーキテクチャエンジニアリングに対する需要の高まりにつながっている。
ニューラルネットワーク検索(NAS)は、手動ではなく、データ駆動方式でニューラルネットワークアーキテクチャを自動設計することを目的としている。
NASはコンピュータビジョンの幅広い問題に適用されている。
論文 参考訳(メタデータ) (2022-02-15T08:06:50Z) - Deep Long-Tailed Learning: A Survey [163.16874896812885]
ディープ・ロングテール・ラーニング(Deep Long-tailed Learning)は、長いテールのクラス分布に追従する多数の画像から、優れたパフォーマンスのディープモデルをトレーニングすることを目的としている。
長い尾を持つクラス不均衡は、現実的な視覚認識タスクにおいて一般的な問題である。
本稿では,近年の長期学習の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2021-10-09T15:25:22Z) - What Is Considered Complete for Visual Recognition? [110.43159801737222]
我々は、学習・バイ・圧縮という新しいタイプの事前学習タスクを提唱する。
計算モデルは、コンパクトな特徴を用いて視覚データを表現するように最適化されている。
セマンティックアノテーションは、利用可能であれば、弱い監督の役割を担います。
論文 参考訳(メタデータ) (2021-05-28T16:59:14Z) - Gradient Projection Memory for Continual Learning [5.43185002439223]
過去のタスクを忘れずに継続的に学習する能力は、人工学習システムにとって望ましい属性です。
ニューラルネットワークは,従来のタスクにとって重要と考えられる勾配部分空間に直交方向の勾配を向けることで,新しいタスクを学習する手法を提案する。
論文 参考訳(メタデータ) (2021-03-17T16:31:29Z) - Learning Contact Dynamics using Physically Structured Neural Networks [81.73947303886753]
ディープニューラルネットワークと微分方程式の接続を用いて、オブジェクト間の接触ダイナミクスを表現するディープネットワークアーキテクチャのファミリを設計する。
これらのネットワークは,ノイズ観測から不連続な接触事象をデータ効率良く学習できることを示す。
以上の結果から,タッチフィードバックの理想化形態は,この学習課題を扱いやすくするための重要な要素であることが示唆された。
論文 参考訳(メタデータ) (2021-02-22T17:33:51Z) - Saliency Prediction with External Knowledge [27.75589849982756]
外部知識から学習した意味関係を符号化するグラフを構築するグラフセマンティック・サリエンシ・ネットワーク(GraSSNet)を開発した。
次にSpatial Graph Attention Networkが開発され、学習したグラフに基づいてSalliency機能を更新する。
実験により,提案モデルが外部知識から正当性を予測することを学習し,正当性ベンチマークを4つのベンチマークで比較した。
論文 参考訳(メタデータ) (2020-07-27T20:12:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。