Fugu-MT 論文翻訳(概要): Ancestral Mamba: Enhancing Selective Discriminant Space Model with Online Visual Prototype Learning for Efficient and Robust Discriminant Approach

論文の概要: Ancestral Mamba: Enhancing Selective Discriminant Space Model with Online Visual Prototype Learning for Efficient and Robust Discriminant Approach

arxiv url: http://arxiv.org/abs/2503.22729v1
Date: Wed, 26 Mar 2025 08:36:05 GMT
ステータス: 翻訳完了
システム内更新日: 2025-04-01 19:35:56.742218
Title: Ancestral Mamba: Enhancing Selective Discriminant Space Model with Online Visual Prototype Learning for Efficient and Robust Discriminant Approach
Title（参考訳）: Ancestral Mamba: 効率的かつロバストな識別アプローチのためのオンライン視覚プロトタイプ学習による選択的識別空間モデルの実現
Authors: Jiahao Qin, Feng Liu, Lu Zong,
Abstract要約: Ancestral Mambaは、オンラインプロトタイプ学習を選択的識別空間モデルに統合する新しいアプローチである。 APAは、モデルがプロトタイプを継続的に適応し、祖先の知識に基づいて新しい課題に取り組むことを可能にする。 MFは目標とするフィードバックメカニズムとして機能し、挑戦的なクラスに集中し、表現を洗練します。
参考スコア（独自算出の注目度）: 5.755715236558973
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the realm of computer graphics, the ability to learn continuously from non-stationary data streams while adapting to new visual patterns and mitigating catastrophic forgetting is of paramount importance. Existing approaches often struggle to capture and represent the essential characteristics of evolving visual concepts, hindering their applicability to dynamic graphics tasks. In this paper, we propose Ancestral Mamba, a novel approach that integrates online prototype learning into a selective discriminant space model for efficient and robust online continual learning. The key components of our approach include Ancestral Prototype Adaptation (APA), which continuously refines and builds upon learned visual prototypes, and Mamba Feedback (MF), which provides targeted feedback to adapt to challenging visual patterns. APA enables the model to continuously adapt its prototypes, building upon ancestral knowledge to tackle new challenges, while MF acts as a targeted feedback mechanism, focusing on challenging classes and refining their representations. Extensive experiments on graphics-oriented datasets, such as CIFAR-10 and CIFAR-100, demonstrate the superior performance of Ancestral Mamba compared to state-of-the-art baselines, achieving significant improvements in accuracy and forgetting mitigation.
Abstract（参考訳）: コンピュータグラフィックスの領域では、新しい視覚パターンに適応し、破滅的な忘れを緩和しながら、静止しないデータストリームから継続的に学習する能力が最も重要である。既存のアプローチは、しばしば、動的グラフィックスタスクの適用性を妨げ、進化する視覚概念の本質的な特徴を捉え、表現するのに苦労する。本稿では,オンラインのプロトタイプ学習を選択的識別空間モデルに統合し,効率的で堅牢なオンライン連続学習を実現する新しいアプローチであるAncestral Mambaを提案する。このアプローチの主要なコンポーネントは、学習したビジュアルプロトタイプを継続的に洗練し構築するAncestral Prototype Adaptation(APA)と、挑戦的なビジュアルパターンに適応するためのターゲットフィードバックを提供するMamba Feedback(MF)です。 APAはモデルがプロトタイプを継続的に適応し、祖先の知識に基づいて新しい課題に取り組み、MFは目標とするフィードバックメカニズムとして機能し、挑戦するクラスに集中し、表現を洗練します。 CIFAR-10やCIFAR-100のようなグラフィック指向データセットに関する大規模な実験は、最先端のベースラインと比較して、Ancestral Mambaの優れた性能を示し、精度を大幅に向上し、緩和を忘れている。

関連論文リスト

IN45023 Neural Network Design Patterns in Computer Vision Seminar Report, Summer 2025 [0.0]
本報告では,コンピュータビジョンにおけるキーデザインパターンの進化を,影響力のある6つの論文から分析する。本稿では,残差接続を導入したResNetについて概説する。我々は、画像パッチのシーケンスにTransformer ar- chitectureを適用することで、新しいパラダイムを確立したビジョントランスフォーマー(ViT)について検討する。
論文参考訳（メタデータ） (2025-07-31T09:08:11Z)
Disentangled World Models: Learning to Transfer Semantic Knowledge from Distracting Videos for Reinforcement Learning [93.58897637077001]
本稿では,オフラインからオンラインまでの潜水蒸留とフレキシブルなゆがみ制約を通したビデオから,セマンティックな違いを学習し,理解することを試みる。動作自由なビデオ予測モデルを非干渉正規化によりオフラインでトレーニングし、注意をそらすビデオから意味的知識を抽出する。オンライン環境での微調整には、事前学習されたモデルからの知識を活用し、世界モデルに絡み合った制約を導入する。
論文参考訳（メタデータ） (2025-03-11T13:50:22Z)
Few-Shot Class-Incremental Model Attribution Using Learnable Representation From CLIP-ViT Features [1.534667887016089]
本研究は、持続的に出現する生成モデルに対処する新しい戦略を提案する。我々は、MA問題にFSCILのメカニズムを適用して、新しい生成AIモデルを明らかにする。画像毎のCLIP-ViTブロックの重み付け和を計算するための適応統合モジュール(AIM)を提案する。
論文参考訳（メタデータ） (2025-03-11T08:05:26Z)
A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文参考訳（メタデータ） (2024-08-01T07:40:00Z)
Prompt-Driven Contrastive Learning for Transferable Adversarial Attacks [42.18755809782401]
PDCL-Attackと呼ばれる新しいトランスファー攻撃法を提案する。テキストのセマンティック表現力を利用して効果的なプロンプト駆動型特徴ガイダンスを定式化する。
論文参考訳（メタデータ） (2024-07-30T08:52:16Z)
Emotic Masked Autoencoder with Attention Fusion for Facial Expression Recognition [1.4374467687356276]
本稿では,MAE-Face self-supervised learning (SSL) 法と多視点融合注意機構を組み合わせた表現分類手法を提案する。我々は、重要な顔の特徴を強調表示して、そのような機能がモデルのガイドとして機能するかどうかを判断することを目的とした、実装が容易でトレーニングなしのフレームワークを提案する。 Aff-wild2データセットにおけるモデル性能の改善により,本手法の有効性が検証された。
論文参考訳（メタデータ） (2024-03-19T16:21:47Z)
Data-efficient Large Vision Models through Sequential Autoregression [58.26179273091461]
限られたデータセットに基づいて,効率的な自己回帰に基づく視覚モデルを構築する。このモデルは,高レベル・低レベルのセマンティック理解の両方にまたがる視覚的タスクにおいて,その習熟度をいかに達成するかを実証する。我々の経験的評価は、モデルが様々なタスクに適応する際の機敏さを強調し、パラメータフットプリントの大幅な削減を図った。
論文参考訳（メタデータ） (2024-02-07T13:41:53Z)
Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文参考訳（メタデータ） (2023-12-22T14:40:55Z)
ReCoRe: Regularized Contrastive Representation Learning of World Model [21.29132219042405]
対照的な教師なし学習と介入不変正規化器を用いて不変特徴を学習する世界モデルを提案する。提案手法は,現状のモデルベースおよびモデルフリーのRL法より優れ,iGibsonベンチマークで評価された分布外ナビゲーションタスクを大幅に改善する。
論文参考訳（メタデータ） (2023-12-14T15:53:07Z)
Generative Model-based Feature Knowledge Distillation for Action Recognition [11.31068233536815]
本稿では,軽量学生モデルの学習のための生成モデルを用いた,革新的な知識蒸留フレームワークについて紹介する。提案手法の有効性は,多種多様な人気データセットに対する総合的な実験によって実証される。
論文参考訳（メタデータ） (2023-12-14T03:55:29Z)
SgVA-CLIP: Semantic-guided Visual Adapting of Vision-Language Models for Few-shot Image Classification [84.05253637260743]
本稿では,セマンティック誘導視覚適応(SgVA)と呼ばれる新しいフレームワークを提案する。 SgVAは、視覚特異的のコントラスト損失、クロスモーダルのコントラスト損失、暗黙の知識蒸留を包括的に利用することで、識別的なタスク固有の視覚特徴を生成する。 13のデータセットの最先端の結果は、適応された視覚的特徴が、クロスモーダルな特徴を補完し、少数の画像分類を改善することを実証している。
論文参考訳（メタデータ） (2022-11-28T14:58:15Z)
Imposing Consistency for Optical Flow Estimation [73.53204596544472]
プロキシタスクによる一貫性の導入は、データ駆動学習を強化することが示されている。本稿では,光フロー推定のための新しい,効果的な整合性戦略を提案する。
論文参考訳（メタデータ） (2022-04-14T22:58:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。