論文の概要: Deep Learning Methods for Abstract Visual Reasoning: A Survey on Raven's
Progressive Matrices
- arxiv url: http://arxiv.org/abs/2201.12382v1
- Date: Fri, 28 Jan 2022 19:24:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 14:38:51.929252
- Title: Deep Learning Methods for Abstract Visual Reasoning: A Survey on Raven's
Progressive Matrices
- Title(参考訳): 抽象的視覚推論のための深層学習法:レイブンの進行行列に関する調査
- Authors: Miko{\l}aj Ma{\l}ki\'nski and Jacek Ma\'ndziuk
- Abstract要約: 私たちは最も一般的なタスクタイプであるRavenのプログレッシブマトリックス(RPM)に注目し、RPMを解決するために適用される学習方法とディープニューラルネットワークのレビューを提供します。
本稿は,RPM研究の発見から実世界の問題がいかに恩恵を受けるかを示すことによって,論文を締めくくっている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Abstract visual reasoning (AVR) domain encompasses problems solving which
requires the ability to reason about relations among entities present in a
given scene. While humans, generally, solve AVR tasks in a ``natural'' way,
even without prior experience, this type of problems has proven difficult for
current machine learning systems. The paper summarises recent progress in
applying deep learning methods to solving AVR problems, as a proxy for studying
machine intelligence. We focus on the most common type of AVR tasks -- the
Raven's Progressive Matrices (RPMs) -- and provide a comprehensive review of
the learning methods and deep neural models applied to solve RPMs, as well as,
the RPM benchmark sets. Performance analysis of the state-of-the-art approaches
to solving RPMs leads to formulation of certain insights and remarks on the
current and future trends in this area. We conclude the paper by demonstrating
how real-world problems can benefit from the discoveries of RPM studies.
- Abstract(参考訳): 抽象視覚推論(AVR)ドメインは、特定のシーンに存在するエンティティ間の関係を推論する能力を必要とする問題を解決する。
人間は一般に「自然」な方法でAVRタスクを解くが、従来の経験がなくてもこのような問題は現在の機械学習システムでは難しいことが証明されている。
本稿では,AVR問題に対するディープラーニング手法の適用の最近の進歩を,機械学習研究のプロキシとして要約する。
我々は、最も一般的なタイプのAVRタスク(Raven's Progressive Matrices (RPM))に焦点を当て、RPMを解決するために適用される学習方法と深層ニューラルネットワークの包括的なレビューとRPMベンチマークセットを提供する。
RPMを解くための最先端のアプローチのパフォーマンス分析は、この分野の現在と将来のトレンドに関する特定の洞察と発言の定式化につながる。
本論文は,rpm研究の発見から実世界の問題がどのように恩恵を受けるかを示すことで結論づける。
関連論文リスト
- Robust Neural Information Retrieval: An Adversarial and Out-of-distribution Perspective [111.58315434849047]
ニューラルネットワーク検索モデル(IR)モデルの堅牢性は、大きな注目を集めている。
我々は、IRの堅牢性を多面的概念とみなし、敵攻撃、アウト・オブ・ディストリビューション(OOD)シナリオ、パフォーマンスのばらつきに対してその必要性を強調している。
我々は,既存の手法,データセット,評価指標について詳細な議論を行い,大規模言語モデルの時代における課題や今後の方向性に光を当てる。
論文 参考訳(メタデータ) (2024-07-09T16:07:01Z) - A Unified View of Abstract Visual Reasoning Problems [0.0]
タスクの統一的なビューを導入し、各インスタンスは、パネルの数、場所、役割に関する前提のない単一のイメージとしてレンダリングされる。
統一された視点の主な利点は、様々なタスクに適用可能な普遍的な学習モデルを開発する能力である。
Raven's Progressive Matrices と Visual Analogy Problems の4つのデータセットで実施された実験は、提案されたタスクの統一表現が、最先端のディープラーニング(DL)モデルや、より広範に、現代のDL画像認識方法に挑戦していることを示している。
論文 参考訳(メタデータ) (2024-06-16T20:52:44Z) - Black-box Adversarial Attacks against Dense Retrieval Models: A
Multi-view Contrastive Learning Method [115.29382166356478]
本稿では,敵探索攻撃(AREA)タスクを紹介する。
DRモデルは、DRモデルによって取得された候補文書の初期セットの外側にあるターゲット文書を取得するように、DRモデルを騙すことを目的としている。
NRM攻撃で報告された有望な結果は、DRモデルに一般化されない。
マルチビュー表現空間における対照的な学習問題として,DRモデルに対する攻撃を形式化する。
論文 参考訳(メタデータ) (2023-08-19T00:24:59Z) - Guided Depth Map Super-resolution: A Survey [88.54731860957804]
誘導深度マップ超解像(GDSR)は、高分解能(HR)深度マップを低分解能(LR)観測から2枚のHRカラー画像の助けを借りて再構成することを目的としている。
近年,特に強力な深層学習技術を用いて,斬新で効果的なアプローチが多数提案されている。
この調査は、GDSRの最近の進歩に関する包括的調査を提示する試みである。
論文 参考訳(メタデータ) (2023-02-19T15:43:54Z) - Computational Models of Solving Raven's Progressive Matrices: A
Comprehensive Introduction [3.686658694960549]
Ravenのプログレッシブマトリックス(RPM)テストは、AIシステムにとって大きな課題となる。
RPMの解法には、1960年代から多くの計算モデルが存在する。
本稿では RPM を解くための計算モデルをオールインワンで提示する。
論文 参考訳(メタデータ) (2023-02-08T18:09:01Z) - Learning to Solve Vehicle Routing Problems: A Survey [0.0]
本稿では,学習パラダイム,解構造,基礎モデル,アルゴリズムの分類について述べる。
本稿は,現代の交通システムにおける課題を克服するため,学習型ソリューションの導入に向けた今後の研究の方向性について概説する。
論文 参考訳(メタデータ) (2022-05-05T05:48:16Z) - Retrieval-Enhanced Machine Learning [110.5237983180089]
本稿では,いくつかの既存モデルを含む汎用的な検索強化機械学習フレームワークについて述べる。
REMLは情報検索の慣例に挑戦し、最適化を含む中核領域における新たな進歩の機会を提示している。
REMLリサーチアジェンダは、情報アクセス研究の新しいスタイルの基礎を築き、機械学習と人工知能の進歩への道を開く。
論文 参考訳(メタデータ) (2022-05-02T21:42:45Z) - A Review of Emerging Research Directions in Abstract Visual Reasoning [0.0]
入力形態,隠蔽規則,目標課題,認知機能,主な課題の5次元に沿ってタスクを分類する分類法を提案する。
この調査で取り上げられた視点は、共有された異なる性質に関する問題を特徴づけることを可能にし、タスクを解くための既存のアプローチについて統一された視点を提供する。
そのうちの1つは、機械学習の文献において、異なるタスクが独立して検討されていることを示しており、これは人間の知性を測定するためにタスクが使用される方法とは対照的である。
論文 参考訳(メタデータ) (2022-02-21T14:58:02Z) - Knowledge as Invariance -- History and Perspectives of
Knowledge-augmented Machine Learning [69.99522650448213]
機械学習の研究は転換点にある。
研究の関心は、高度にパラメータ化されたモデルのパフォーマンス向上から、非常に具体的なタスクへとシフトしている。
このホワイトペーパーは、機械学習研究におけるこの新興分野の紹介と議論を提供する。
論文 参考訳(メタデータ) (2020-12-21T15:07:19Z) - A Comprehensive Survey of Machine Learning Applied to Radar Signal
Processing [7.758302353877527]
現代のレーダーシステムには、精度、堅牢性、リアルタイム能力の面で高い要求がある。
従来のレーダー信号処理(RSP)手法は、そのような要求を満たす際にいくつかの制限を示してきた。
機械学習(ML)の急速な発展、特にディープラーニングにより、レーダー研究者はRSP関連の問題を解決する際にこれらの新しい手法を統合するようになった。
論文 参考訳(メタデータ) (2020-09-29T00:30:52Z) - Video Super Resolution Based on Deep Learning: A Comprehensive Survey [87.30395002197344]
深層学習に基づく33の最先端ビデオ超解像法(VSR)を包括的に検討した。
そこで本研究では,フレーム間情報を利用した分類手法を提案し,その手法を6つのサブカテゴリに分類する。
いくつかのベンチマークデータセットにおける代表的VSR法の性能を要約し比較する。
論文 参考訳(メタデータ) (2020-07-25T13:39:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。