論文の概要: DAReN: A Collaborative Approach Towards Reasoning And Disentangling
- arxiv url: http://arxiv.org/abs/2109.13156v1
- Date: Mon, 27 Sep 2021 16:10:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-28 19:44:32.664871
- Title: DAReN: A Collaborative Approach Towards Reasoning And Disentangling
- Title(参考訳): DAReN: Reasoning and Disentanglingに向けたコラボレーションアプローチ
- Authors: Pritish Sahu, Vladimir Pavlovic
- Abstract要約: 本稿では,2つのタスクを協調的に改善するために,帰納的バイアスの弱い形式を活用する,エンドツーエンドの共同表現推論学習フレームワークを提案する。
GM-RPMの原理に基づくDAReN(Disentangling based Abstract Reasoning Network)を用いてこれを実現した。
- 参考スコア(独自算出の注目度): 27.50150027974947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational learning approaches to solving visual reasoning tests, such as
Raven's Progressive Matrices (RPM),critically depend on the ability of the
computational approach to identify the visual concepts used in the test (i.e.,
the representation) as well as the latent rules based on those concepts (i.e.,
the reasoning). However, learning of representation and reasoning is a
challenging and ill-posed task,often approached in a stage-wise manner (first
representation, then reasoning). In this work, we propose an end-to-end joint
representation-reasoning learning framework, which leverages a weak form of
inductive bias to improve both tasks together. Specifically, we propose a
general generative graphical model for RPMs, GM-RPM, and apply it to solve the
reasoning test. We accomplish this using a novel learning framework
Disentangling based Abstract Reasoning Network (DAReN) based on the principles
of GM-RPM. We perform an empirical evaluation of DAReN over several benchmark
datasets. DAReN shows consistent improvement over state-of-the-art (SOTA)
models on both the reasoning and the disentanglement tasks. This demonstrates
the strong correlation between disentangled latent representation and the
ability to solve abstract visual reasoning tasks.
- Abstract(参考訳): Raven's Progressive Matrices (RPM) のような視覚的推論テストの解法に対する計算学習のアプローチは、テストで使用される視覚的概念(つまり表現)を識別する計算手法の能力と、それらの概念(すなわち推論)に基づいた潜在的規則(英語版)に依存している。
しかし、表現と推論の学習は困難で不適切なタスクであり、しばしば段階的にアプローチされる(最初の表現、次に推論)。
本研究では,両タスクを協調的に改善するために,帰納的バイアスの弱い形式を活用する,エンドツーエンドの連立表現推論学習フレームワークを提案する。
具体的には,rpmsのための汎用生成グラフィカルモデルgm-rpmを提案し,その解法として適用する。
gm-rpmの原理に基づいた新しい学習フレームワークであるdisentangling based abstract reasoning network (daren) を用いてこれを実現する。
いくつかのベンチマークデータセットに対して,DAReNを実証評価する。
DAReNは、推論と非絡み合いタスクの両方において、最先端(SOTA)モデルに対して一貫した改善を示す。
このことは、非絡み合った潜在表現と抽象的な視覚的推論タスクを解く能力との強い相関を示す。
関連論文リスト
- On the Diagram of Thought [12.304069891580658]
大規模言語モデル(LLM)における反復推論をモデル化するフレームワークであるDiagram of Thought(DoT)を紹介する。
DoTは提案、批評、洗練、検証を結合的なDAG構造に整理し、モデルが複雑な推論経路を探索できるようにする。
我々は、トポス理論を用いてDoTフレームワークを形式化し、論理的一貫性と推論過程の健全性を保証する数学的基盤を提供する。
論文 参考訳(メタデータ) (2024-09-16T07:01:41Z) - Black-box Adversarial Attacks against Dense Retrieval Models: A
Multi-view Contrastive Learning Method [115.29382166356478]
本稿では,敵探索攻撃(AREA)タスクを紹介する。
DRモデルは、DRモデルによって取得された候補文書の初期セットの外側にあるターゲット文書を取得するように、DRモデルを騙すことを目的としている。
NRM攻撃で報告された有望な結果は、DRモデルに一般化されない。
マルチビュー表現空間における対照的な学習問題として,DRモデルに対する攻撃を形式化する。
論文 参考訳(メタデータ) (2023-08-19T00:24:59Z) - Deep Non-Monotonic Reasoning for Visual Abstract Reasoning Tasks [3.486683381782259]
本稿では,視覚的抽象的推論課題を解決するための非単調な計算手法を提案する。
このアプローチを使ってディープラーニングモデルを実装し、RavenのProgressive MatricesテストにインスパイアされたデータセットであるRAVENデータセットでそれをテストしました。
論文 参考訳(メタデータ) (2023-02-08T16:35:05Z) - Synergies between Disentanglement and Sparsity: Generalization and
Identifiability in Multi-Task Learning [79.83792914684985]
我々は,最大スパース基底予測器が不整合表現をもたらす条件を提供する新しい識別可能性の結果を証明した。
この理論的な結果から,両レベル最適化問題に基づくアンタングル表現学習の実践的アプローチを提案する。
論文 参考訳(メタデータ) (2022-11-26T21:02:09Z) - Drawing out of Distribution with Neuro-Symbolic Generative Models [49.79371715591122]
ドローイング・アウト・オブ・ディストリクト(英: Drawing out of Distribution)は、ストローク・ベース・ドローイングの神経象徴的生成モデルである。
DooDは画像を直接操作するが、監視や高価なテストタイム推論は必要ない。
我々は、データとタスクをまたいだ一般化能力について、DooDを評価した。
論文 参考訳(メタデータ) (2022-06-03T21:40:22Z) - elBERto: Self-supervised Commonsense Learning for Question Answering [131.51059870970616]
本稿では、市販QAモデルアーキテクチャと互換性のあるコモンセンスフレームワークの自己教師型双方向表現学習を提案する。
このフレームワークは5つの自己教師型タスクから構成されており、リッチコモンセンスを含むコンテキストから追加のトレーニング信号を完全に活用するようモデルに強制する。
elBERtoは、単純な語彙的類似性比較が役に立たないような、アウト・オブ・パラグラフや非エフェクトな問題に対して、大幅に改善されている。
論文 参考訳(メタデータ) (2022-03-17T16:23:45Z) - One-shot Visual Reasoning on RPMs with an Application to Video Frame
Prediction [1.0932251830449902]
Raven's Progressive Matrices (RPM) は人間の視覚的推論能力を評価するために頻繁に用いられる。
本稿では,現実の視覚認識とそれに続く論理的推論タスクの課題に対処するために,ワンショットの人間理解可能なReaSoner(Os-HURS)を提案する。
論文 参考訳(メタデータ) (2021-11-24T06:51:38Z) - Probing as Quantifying the Inductive Bias of Pre-trained Representations [99.93552997506438]
本稿では,特定のタスクに対する表現の帰納的バイアスを評価することを目的とした,探索のための新しいフレームワークを提案する。
トークン、アーク、文レベルの一連のタスクに我々のフレームワークを適用します。
論文 参考訳(メタデータ) (2021-10-15T22:01:16Z) - Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and
Execution [97.50813120600026]
時空間推論は人工知能(AI)の課題である
最近の研究は、この種の抽象的推論タスクに焦点を当てている -- Raven's Progressive Matrices (RPM)
ニューロシンボリックな確率的アブダクションと実行学習者(PrAE)を提案する。
論文 参考訳(メタデータ) (2021-03-26T02:42:18Z) - Raven's Progressive Matrices Completion with Latent Gaussian Process
Priors [42.310737373877714]
Raven's Progressive Matrices (RPM) はヒトIQテストで広く用いられている。
本稿では,複数のガウス過程を潜在変数の事前として用いる,深い潜在変数モデルを提案する。
連続的に変化する複数の視覚概念を持つRPM型データセット上で,提案モデルの評価を行った。
論文 参考訳(メタデータ) (2021-03-22T17:48:44Z) - Multi-Label Contrastive Learning for Abstract Visual Reasoning [0.0]
Ravenのプログレッシブマトリクスを解く最先端のシステムは、大量のパターンベースのトレーニングとデータセットのバイアスを利用する。
人間は、解決すべきRPM(または一般的には視覚的推論タスク)の根底にあるルールや概念の識別に集中する。
本稿では,新しいトレーニングアルゴリズムに加えて,最先端性能に寄与する重要な要因であるRPMのスパースルール符号化方式を提案する。
論文 参考訳(メタデータ) (2020-12-03T14:18:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。