論文の概要: Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks
- arxiv url: http://arxiv.org/abs/2505.13391v1
- Date: Mon, 19 May 2025 17:32:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 14:57:11.771279
- Title: Advancing Generalization Across a Variety of Abstract Visual Reasoning Tasks
- Title(参考訳): 抽象的視覚推論タスクの多種多様な一般化の促進
- Authors: Mikołaj Małkiński, Jacek Mańdziuk,
- Abstract要約: 正規化群畳み込みモデル(PoNG)の経路について述べる。
PoNGは、グループ畳み込み、正規化、並列設計を特徴とする、新しいニューラルアーキテクチャである。
実験では,提案モデルが既存の文献手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The abstract visual reasoning (AVR) domain presents a diverse suite of analogy-based tasks devoted to studying model generalization. Recent years have brought dynamic progress in the field, particularly in i.i.d. scenarios, in which models are trained and evaluated on the same data distributions. Nevertheless, o.o.d. setups that assess model generalization to new test distributions remain challenging even for the most recent models. To advance generalization in AVR tasks, we present the Pathways of Normalized Group Convolution model (PoNG), a novel neural architecture that features group convolution, normalization, and a parallel design. We consider a wide set of AVR benchmarks, including Raven's Progressive Matrices and visual analogy problems with both synthetic and real-world images. The experiments demonstrate strong generalization capabilities of the proposed model, which in several settings outperforms the existing literature methods.
- Abstract(参考訳): 抽象的視覚的推論(AVR)ドメインは、モデル一般化を研究するための様々な類推に基づくタスクスイートを提供する。
近年、この分野、特に同じデータ分布でモデルが訓練され、評価されるシナリオにおいて、ダイナミックな進歩をもたらしている。
それでも、新しいテスト分布に対するモデルの一般化を評価する o.o.d. のセットアップは、最新のモデルでも難しいままである。
AVRタスクの一般化を促進するために,グループ畳み込み,正規化,並列設計を特徴とするニューラルアーキテクチャPoNG(Pathways of Normalized Group Convolution model)を提案する。
我々はRavenのProgressive Matricesや、合成画像と実世界の画像の両方における視覚的類似問題を含む、幅広いAVRベンチマークについて検討する。
実験では,提案モデルが既存の文献手法より優れていることを示す。
関連論文リスト
- Generalization Error Analysis for Selective State-Space Models Through the Lens of Attention [2.8998926117101367]
状態空間モデル(SSM)は、シーケンスモデリングタスクのためのトランスフォーマーの魅力的な代替品として登場した。
本稿では,マンバモデルの背後にあるコアアーキテクチャコンポーネントである選択SSMの理論的一般化分析について述べる。
論文 参考訳(メタデータ) (2025-02-03T16:05:31Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - A-I-RAVEN and I-RAVEN-Mesh: Two New Benchmarks for Abstract Visual Reasoning [0.0]
抽象的な視覚的推論領域におけるディープニューラルネットワークの一般化と知識再利用能力について検討する。
本稿では,Attributeless-I-RAVEN (A-I-RAVEN) について紹介する。
I-RAVEN-Meshはラインベースパターンからなる新しいコンポーネント構造でRPMを強化したデータセットである。
論文 参考訳(メタデータ) (2024-06-16T20:26:38Z) - Improving Generalization of Neural Vehicle Routing Problem Solvers Through the Lens of Model Architecture [9.244633039170186]
本稿では,ESF(Scaling Factor)とDS(Distributed-Specific)デコーダを提案する。
ESFは、様々な大きさのVRPを解く際に、トレーニング中に発見された慣れ親しんだものに対して、モデルの注意重みパターンを調整する。
DSデコーダは、複数の補助光デコーダを通して複数のトレーニング分布パターンのVRPを明示的にモデル化し、モデル表現空間を拡大する。
論文 参考訳(メタデータ) (2024-06-10T09:03:17Z) - Representer Point Selection for Explaining Regularized High-dimensional
Models [105.75758452952357]
本稿では,高次元表現器と呼ぶサンプルベース説明のクラスを紹介する。
私たちのワークホースは、一般化された高次元モデルに対する新しい代表者定理である。
提案手法の実証的性能について,実世界の2進分類データセットと2つの推薦システムデータセットを用いて検討した。
論文 参考訳(メタデータ) (2023-05-31T16:23:58Z) - SimSCOOD: Systematic Analysis of Out-of-Distribution Generalization in
Fine-tuned Source Code Models [58.78043959556283]
本研究は,Low-Rank Adaptation (LoRA)ファインチューニング手法を含む,異なる微調整手法によるモデルの挙動について検討する。
解析の結果、LoRAファインチューニングは様々なシナリオにおけるフルファインチューニングよりも、OODの一般化性能が大幅に向上していることが判明した。
論文 参考訳(メタデータ) (2022-10-10T16:07:24Z) - Trajectory-wise Multiple Choice Learning for Dynamics Generalization in
Reinforcement Learning [137.39196753245105]
本稿では,動的一般化のためのマルチヘッドダイナミックスモデルを学習するモデルベース強化学習アルゴリズムを提案する。
文脈学習は,過去の経験から得られる動的情報からコンテキスト潜在ベクトルにエンコードする。
提案手法は,最先端のRL法と比較して,様々な制御タスクにおいて優れたゼロショット一般化性能を示す。
論文 参考訳(メタデータ) (2020-10-26T03:20:42Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。