論文の概要: Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery
- arxiv url: http://arxiv.org/abs/2308.13801v1
- Date: Sat, 26 Aug 2023 07:55:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 18:58:23.588761
- Title: Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery
- Title(参考訳): 強化学習に基づく新しいクラス発見のためのマルチモーダル特徴融合ネットワーク
- Authors: Qiang Li, Qiuyang Ma, Weizhi Nie, Anan Liu
- Abstract要約: 本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
- 参考スコア(独自算出の注目度): 47.28191501836041
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: With the development of deep learning techniques, supervised learning has
achieved performances surpassing those of humans. Researchers have designed
numerous corresponding models for different data modalities, achieving
excellent results in supervised tasks. However, with the exponential increase
of data in multiple fields, the recognition and classification of unlabeled
data have gradually become a hot topic. In this paper, we employed a
Reinforcement Learning framework to simulate the cognitive processes of humans
for effectively addressing novel class discovery in the Open-set domain. We
deployed a Member-to-Leader Multi-Agent framework to extract and fuse features
from multi-modal information, aiming to acquire a more comprehensive
understanding of the feature space. Furthermore, this approach facilitated the
incorporation of self-supervised learning to enhance model training. We
employed a clustering method with varying constraint conditions, ranging from
strict to loose, allowing for the generation of dependable labels for a subset
of unlabeled data during the training phase. This iterative process is similar
to human exploratory learning of unknown data. These mechanisms collectively
update the network parameters based on rewards received from environmental
feedback. This process enables effective control over the extent of exploration
learning, ensuring the accuracy of learning in unknown data categories. We
demonstrate the performance of our approach in both the 3D and 2D domains by
employing the OS-MN40, OS-MN40-Miss, and Cifar10 datasets. Our approach
achieves competitive competitive results.
- Abstract(参考訳): 深層学習技術の発達により、教師あり学習は人間を上回るパフォーマンスを達成した。
研究者は様々なデータモダリティに対応する多数のモデルを設計し、監督されたタスクで優れた結果を得た。
しかし、複数の分野におけるデータの指数的な増加に伴い、ラベルなしデータの認識と分類が次第にホットトピックになりつつある。
本稿では,オープンセット領域における新しいクラス発見を効果的に解決するために,人間の認知過程をシミュレートする強化学習フレームワークを用いた。
我々は,マルチモーダル情報から特徴を抽出・融合し,機能空間をより包括的に理解することを目的とした,メンバ・ツー・リードのマルチエージェントフレームワークを展開した。
さらに,本手法は,モデルトレーニングを強化する自己指導型学習の導入を促進する。
厳密な制約条件からゆるやかな制約条件のクラスタリング手法を用いて,トレーニング期間中にラベルなしデータのサブセットに対する信頼可能なラベルの生成を可能にした。
この反復的なプロセスは、未知のデータの探索的学習に似ている。
これらのメカニズムは、環境フィードバックから受け取った報酬に基づいてネットワークパラメータをまとめて更新する。
このプロセスは、探索学習の範囲を効果的に制御し、未知のデータカテゴリにおける学習の精度を確保する。
我々は,os-mn40,os-mn40-miss,cifar10を用いた3次元領域と2次元領域の両方において,このアプローチの性能を示す。
我々のアプローチは競争力のある結果をもたらす。
関連論文リスト
- Multi-Stage Knowledge Integration of Vision-Language Models for Continual Learning [79.46570165281084]
蒸留法における人間の学習過程をエミュレートするマルチステージ知識統合ネットワーク(MulKI)を提案する。
Mulkiは、イデオロギーの排除、新しいイデオロギーの追加、イデオロギーの排除、コネクティクスの作りという4つの段階を通じてこれを達成している。
提案手法は,下流タスク間の連続学習をサポートしながら,ゼロショット能力の維持における大幅な改善を示す。
論文 参考訳(メタデータ) (2024-11-11T07:36:19Z) - Efficient Cluster Selection for Personalized Federated Learning: A
Multi-Armed Bandit Approach [2.5477011559292175]
フェデレートラーニング(FL)は、データプライバシを優先する、マシンラーニングモデルのための分散トレーニングアプローチを提供する。
本稿では,マルチアームバンディット(MAB)アプローチに触発された動的アッパー信頼境界(dUCB)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-29T16:46:50Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Rank Flow Embedding for Unsupervised and Semi-Supervised Manifold
Learning [9.171175292808144]
本稿では,教師なしおよび半教師付きシナリオに対するランクフロー埋め込み (RFE) という新しい多様体学習アルゴリズムを提案する。
RFEは文脈に敏感な埋め込みを計算し、それはランクベースの処理フローに従って洗練される。
生成された埋め込みは、より効果的な教師なし検索や半教師付き分類に利用することができる。
論文 参考訳(メタデータ) (2023-04-24T21:02:12Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Clustering augmented Self-Supervised Learning: Anapplication to Land
Cover Mapping [10.720852987343896]
本稿では,自己教師型学習のためのクラスタリングに基づくプレテキストタスクを用いて,土地被覆マッピングの新しい手法を提案する。
社会的に関係のある2つのアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-08-16T19:35:43Z) - Multimodal Clustering Networks for Self-supervised Learning from
Unlabeled Videos [69.61522804742427]
本稿では,共通のマルチモーダル埋め込み空間を学習する自己監督型トレーニングフレームワークを提案する。
インスタンスレベルのコントラスト学習の概念をマルチモーダルクラスタリングステップで拡張し,モダリティ間の意味的類似性を捉える。
結果として得られる埋め込みスペースは、見えないデータセットや異なるドメインからでも、すべてのモダリティにわたるサンプルの検索を可能にする。
論文 参考訳(メタデータ) (2021-04-26T15:55:01Z) - Multi-Pretext Attention Network for Few-shot Learning with
Self-supervision [37.6064643502453]
補助的なサンプルに依存しない自己教師付き学習のための,新しい拡張不要な手法を提案する。
さらに,従来の拡張信頼手法とGCを組み合わせるために,特定の注意機構を利用するマルチテキスト注意ネットワーク(MAN)を提案する。
miniImageNetおよびtieredImageNetデータセット上でMANを幅広く評価し、提案手法が最新(SOTA)関連手法より優れていることを実証した。
論文 参考訳(メタデータ) (2021-03-10T10:48:37Z) - Sense and Learn: Self-Supervision for Omnipresent Sensors [9.442811508809994]
我々は、生の知覚データから表現や特徴学習のためのSense and Learnというフレームワークを提案する。
これは、面倒なラベル付けプロセスに人間が関与することなく、注釈のないデータから、高レベルで広範囲に有用な特徴を学習できる補助的なタスクで構成されている。
提案手法は、教師付きアプローチと競合する結果を達成し、ネットワークを微調整し、ほとんどの場合、下流タスクを学習することでギャップを埋める。
論文 参考訳(メタデータ) (2020-09-28T11:57:43Z) - Learning From Multiple Experts: Self-paced Knowledge Distillation for
Long-tailed Classification [106.08067870620218]
我々は,LFME(Learning From Multiple Experts)と呼ばれる自己評価型知識蒸留フレームワークを提案する。
提案するLFMEフレームワークは,複数の'Experts'からの知識を集約して,統一された学生モデルを学ぶ。
提案手法は,最先端の手法に比べて優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-06T12:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。