論文の概要: Color as the Impetus: Transforming Few-Shot Learner
- arxiv url: http://arxiv.org/abs/2507.22136v1
- Date: Tue, 29 Jul 2025 18:09:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.796829
- Title: Color as the Impetus: Transforming Few-Shot Learner
- Title(参考訳): インペトゥスとしての色彩:数ショット学習者の変形
- Authors: Chaofei Qi, Zhitai Liu, Jianbin Qiu,
- Abstract要約: 人間は生まれながらのメタラーニング能力を持ち、部分的には例外的な色の知覚に起因している。
そこで我々は,チャネル間特徴抽出と対話型学習を利用したバイオインスパイアされたメタラーニングフレームワークであるColorSense Learnerを提案する。
- 参考スコア(独自算出の注目度): 18.73626982790281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans possess innate meta-learning capabilities, partly attributable to their exceptional color perception. In this paper, we pioneer an innovative viewpoint on few-shot learning by simulating human color perception mechanisms. We propose the ColorSense Learner, a bio-inspired meta-learning framework that capitalizes on inter-channel feature extraction and interactive learning. By strategically emphasizing distinct color information across different channels, our approach effectively filters irrelevant features while capturing discriminative characteristics. Color information represents the most intuitive visual feature, yet conventional meta-learning methods have predominantly neglected this aspect, focusing instead on abstract feature differentiation across categories. Our framework bridges the gap via synergistic color-channel interactions, enabling better intra-class commonality extraction and larger inter-class differences. Furthermore, we introduce a meta-distiller based on knowledge distillation, ColorSense Distiller, which incorporates prior teacher knowledge to augment the student network's meta-learning capacity. We've conducted comprehensive coarse/fine-grained and cross-domain experiments on eleven few-shot benchmarks for validation. Numerous experiments reveal that our methods have extremely strong generalization ability, robustness, and transferability, and effortless handle few-shot classification from the perspective of color perception.
- Abstract(参考訳): 人間は生まれながらのメタラーニング能力を持ち、部分的には例外的な色の知覚に起因している。
本稿では,人間の色知覚機構をシミュレートすることで,数ショット学習の革新的視点を開拓する。
そこで我々は,チャネル間特徴抽出と対話型学習を利用したバイオインスパイアされたメタラーニングフレームワークであるColorSense Learnerを提案する。
異なるチャネル間で異なる色情報を戦略的に強調することにより、識別特性を捉えながら、無関係な特徴を効果的にフィルタリングする。
色情報は最も直感的な視覚的特徴を示すが、従来のメタラーニング手法はこの側面をほとんど無視し、カテゴリ間の抽象的特徴分化に焦点を当てている。
我々のフレームワークは、シナジスティックなカラーチャネル相互作用によってギャップを埋め、より優れたクラス内共通性抽出とより大きなクラス間差を可能にする。
さらに,知識蒸留に基づくメタディストレータであるColorSense Distillerを導入する。
バリデーションのために、私たちは11のスクリーンショットベンチマークで、粗大できめ細かな、そしてクロスドメインな実験を行いました。
多数の実験により,本手法は極端に強い一般化能力,堅牢性,伝達性を有し,色知覚の観点からは無作為な分類が可能であることが明らかとなった。
関連論文リスト
- Teaching Humans Subtle Differences with DIFFusion [36.30462318766868]
本稿では、生成モデルを利用して、カテゴリ間の最小限の識別特徴を自動的に発見・可視化するシステムを提案する。
本手法は,データ不足の領域においても,クラス間の微妙なターゲット変換を施した対物的可視化を生成する。
論文 参考訳(メタデータ) (2025-04-10T18:04:22Z) - Color in Visual-Language Models: CLIP deficiencies [1.0159205678719043]
この研究は、現在人工知能において最も影響力のあるVML(ビジュアル言語モデル)であるCLIP(Contrastive Language- Image Pre-training)において、色がどのようにコード化されているかを探る。
a)色の概念にあまり関係のない無彩色刺激に対する明確な偏見、(b)他の視覚情報よりもテキストを優先する傾向である。
論文 参考訳(メタデータ) (2025-02-06T19:38:12Z) - High-Discriminative Attribute Feature Learning for Generalized Zero-Shot Learning [54.86882315023791]
一般化ゼロショット学習(HDAFL)のための高識別属性特徴学習(High-Discriminative Attribute Feature Learning)という革新的な手法を提案する。
HDAFLは複数の畳み込みカーネルを使用して、画像の属性と高い相関性を持つ識別領域を自動的に学習する。
また、属性間の識別能力を高めるために、Transformerベースの属性識別エンコーダを導入する。
論文 参考訳(メタデータ) (2024-04-07T13:17:47Z) - The Influences of Color and Shape Features in Visual Contrastive
Learning [0.0]
本稿では,個々の画像特徴(色や形状など)がモデル性能に与える影響について検討する。
実験結果から、教師付き表現と比較して、コントラスト表現は類似した色を持つオブジェクトとクラスタリングする傾向にあることが示された。
論文 参考訳(メタデータ) (2023-01-29T15:10:14Z) - ColorSense: A Study on Color Vision in Machine Visual Recognition [57.916512479603064]
視覚認識ベンチマークから,前景や背景色ラベルの非自明なアノテーション110,000点を収集する。
色識別のレベルがマシン認識モデルの性能に与える影響を実証することにより、データセットの使用を検証した。
その結果,分類や局所化などの物体認識タスクは,色覚バイアスの影響を受けやすいことが示唆された。
論文 参考訳(メタデータ) (2022-12-16T18:51:41Z) - Name Your Colour For the Task: Artificially Discover Colour Naming via
Colour Quantisation Transformer [62.75343115345667]
そこで本研究では,色空間を定量化しつつ,画像上での認識を維持しつつ,色空間を定量化する新しい色量子化変換器CQFormerを提案する。
人工色システムと人間の言語における基本色用語との一貫性のある進化パターンを観察する。
我々のカラー量子化法は、画像記憶を効果的に圧縮する効率的な量子化法も提供する。
論文 参考訳(メタデータ) (2022-12-07T03:39:18Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Intriguing Properties of Contrastive Losses [12.953112189125411]
コントラスト学習の3つの興味深い特性について検討する。
複数のオブジェクトが存在する画像に対して、インスタンスベースのコントラスト学習がうまく学習できるかどうかを検討する。
対照的な学習では、学習しやすい共有機能のいくつかは、競合する機能の集合の学習を抑え、さらに完全に阻止することができる。
論文 参考訳(メタデータ) (2020-11-05T13:19:48Z) - Understanding Brain Dynamics for Color Perception using Wearable EEG
headband [0.46335240643629344]
生の脳波信号の特徴から一次色を検出するマルチクラス分類モデルを設計した。
本手法では,連続モードウェーブレット変換から得られる信号帯電力のスペクトルパワー特性,統計特性,相関特性を用いる。
提案手法は, 対象物内分類において, 80.6%の精度が得られた。
論文 参考訳(メタデータ) (2020-08-17T05:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。