論文の概要: QuIC: A Quantum-Inspired Interaction Classifier for Revitalizing Shallow CNNs in Fine-Grained Recognition
- arxiv url: http://arxiv.org/abs/2601.02189v1
- Date: Mon, 05 Jan 2026 15:09:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.234344
- Title: QuIC: A Quantum-Inspired Interaction Classifier for Revitalizing Shallow CNNs in Fine-Grained Recognition
- Title(参考訳): QuIC: 微粒化認識における浅部CNNの活性化のための量子インスピレーション型相互作用分類器
- Authors: Cheng Ying Wu, Yen Jui Chang,
- Abstract要約: QuICは軽量なプラグイン・アンド・プレイモジュールで、機能ディメンションを爆発させることなく、安定したシングルステージのエンドツーエンドトレーニングをサポートする。
これはVGG16のTop-1精度を20%近く向上させ、ResNet18の最先端アテンション機構(SE-Block)を上回っている。
- 参考スコア(独自算出の注目度): 1.2747974581480312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deploying deep learning models for Fine-Grained Visual Classification (FGVC) on resource-constrained edge devices remains a significant challenge. While deep architectures achieve high accuracy on benchmarks like CUB-200-2011, their computational cost is often prohibitive. Conversely, shallow networks (e.g., AlexNet, VGG) offer efficiency but fail to distinguish visually similar sub-categories. This is because standard Global Average Pooling (GAP) heads capture only first-order statistics, missing the subtle high-order feature interactions required for FGVC. While Bilinear CNNs address this, they suffer from high feature dimensionality and instability during training. To bridge this gap, we propose the Quantum-inspired Interaction Classifier (QuIC). Drawing inspiration from quantum mechanics, QuIC models feature channels as interacting quantum states and captures second-order feature covariance via a learnable observable operator. Designed as a lightweight, plug-and-play module, QuIC supports stable, single-stage end-to-end training without exploding feature dimensions. Experimental results demonstrate that QuIC significantly revitalizes shallow backbones: it boosts the Top-1 accuracy of VGG16 by nearly 20% and outperforms state-of-the-art attention mechanisms (SE-Block) on ResNet18. Qualitative analysis, including t-SNE visualization, further confirms that QuIC resolves ambiguous cases by explicitly attending to fine-grained discriminative features and enforcing compact intra-class clustering.
- Abstract(参考訳): リソース制約のあるエッジデバイスにFGVC(Fen-Grained Visual Classification)のためのディープラーニングモデルをデプロイすることは、依然として大きな課題である。
深層アーキテクチャはCUB-200-2011のようなベンチマークで高い精度を達成するが、計算コストはしばしば禁止されている。
逆に、浅いネットワーク(例えばAlexNet、VGG)は効率性を提供するが、視覚的に類似したサブカテゴリを区別することができない。
これは、標準のGlobal Average Pooling (GAP) ヘッドが、FGVCに必要な微妙な高次機能相互作用を欠いているためである。
Bilinear CNNはこれに対処するが、トレーニング中に高機能な次元と不安定さに悩まされる。
このギャップを埋めるために、Quantum-inspired Interaction Classifier (QuIC)を提案する。
量子力学からインスピレーションを得たQuICモデルは、相互作用する量子状態としてチャネルを特徴付け、学習可能な可観測作用素を介して2階特徴共分散をキャプチャする。
軽量でプラグアンドプレイのモジュールとして設計されたQuICは、機能ディメンションを爆発させることなく、安定したシングルステージのエンドツーエンドトレーニングをサポートする。
実験の結果、QuICは浅い背骨を著しく活性化し、VGG16のTop-1精度を20%近く向上させ、ResNet18上での最先端の注意機構(SE-Block)より優れていた。
t-SNE可視化を含む定性的分析は、QuICがきめ細かい識別特徴に明示的に参加し、コンパクトなクラス内クラスタリングを強制することによって、あいまいなケースを解決することを確認している。
関連論文リスト
- Dual-Qubit Hierarchical Fuzzy Neural Network for Image Classification: Enabling Relational Learning via Quantum Entanglement [27.317371900372127]
本稿では,2量子階層型ファジィニューラルネットワーク(DQ-HFNN)を提案する。
一対の絡み合った量子ビットに特徴対をエンコードし、単一のファジィモデルをジョイントファジィ表現に拡張する。
ノイズのある条件下での実験では、ノイズに対して堅牢であり、ノイズの多い中間スケールの量子デバイスに実装される可能性があることが示唆されている。
論文 参考訳(メタデータ) (2025-12-15T12:35:53Z) - Latent Representation Learning in Heavy-Ion Collisions with MaskPoint Transformer [2.6610943214001765]
本稿では,トランスフォーマーベースのオートエンコーダについて,自己教師付き事前学習と教師付き微調整という2段階のパラダイムで学習した。
エンコーダはラベルのないHICデータから直接潜在表現を学習し、コンパクトで情報豊富な特徴空間を提供する。
その結果,HICにおける特徴学習の汎用的かつ堅牢な基盤として2段階の枠組みを確立し,クォークグルーオンプラズマ特性のより強力な解析への扉を開くことができた。
論文 参考訳(メタデータ) (2025-10-08T06:27:10Z) - Quantum Graph Attention Network: A Novel Quantum Multi-Head Attention Mechanism for Graph Learning [0.0]
量子グラフ注意ネットワーク(Quantum Graph Attention Network、QGAT)は、変動量子回路をアテンション機構に統合するハイブリッドグラフニューラルネットワークである。
複雑な構造的依存関係を捕捉するQGATの有効性を示し、帰納的シナリオにおける一般化を改善した。
実験により、量子埋め込みは特徴や構造的ノイズに対するロバスト性を高め、実世界のノイズデータを扱う利点を示唆している。
論文 参考訳(メタデータ) (2025-08-25T03:25:48Z) - Hybrid Quantum-Classical Feature Extraction approach for Image Classification using Autoencoders and Quantum SVMs [0.0]
NISQ時代の量子コンピュータには、ノイズ、スケーラビリティ、読み出し時間、ゲート操作時間などの制限がある。
複雑なデータセットが量子機械学習パイプラインの全体的な効率に与える影響を軽減するために、戦略を考案する必要がある。
本稿では,ResNet10にインスパイアされた畳み込みオートエンコーダを用いた古典的特徴抽出手法を適用し,データセットの次元性を低減し,意味のある特徴を抽出する。
論文 参考訳(メタデータ) (2024-10-24T15:02:05Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - Problem-Dependent Power of Quantum Neural Networks on Multi-Class
Classification [83.20479832949069]
量子ニューラルネットワーク(QNN)は物理世界を理解する上で重要なツールとなっているが、その利点と限界は完全には理解されていない。
本稿では,多クラス分類タスクにおけるQCの問題依存力について検討する。
我々の研究はQNNの課題依存力に光を当て、その潜在的なメリットを評価するための実践的なツールを提供する。
論文 参考訳(メタデータ) (2022-12-29T10:46:40Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Widening and Squeezing: Towards Accurate and Efficient QNNs [125.172220129257]
量子化ニューラルネットワーク(QNN)は、非常に安価な計算とストレージオーバーヘッドのため、業界にとって非常に魅力的なものだが、その性能は、完全な精度パラメータを持つネットワークよりも悪い。
既存の手法の多くは、より効果的なトレーニング技術を利用して、特にバイナリニューラルネットワークの性能を高めることを目的としている。
本稿では,従来の完全精度ネットワークで高次元量子化機能に特徴を投影することで,この問題に対処する。
論文 参考訳(メタデータ) (2020-02-03T04:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。