論文の概要: QPredSGG: Hybrid Quantum Predicate Learning for Long-Tailed Scene Graph Generation
- arxiv url: http://arxiv.org/abs/2606.04689v1
- Date: Wed, 03 Jun 2026 10:15:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.677432
- Title: QPredSGG: Hybrid Quantum Predicate Learning for Long-Tailed Scene Graph Generation
- Title(参考訳): QPredSGG: 時系列グラフ生成のためのハイブリッド量子述語学習
- Authors: Prerana Ramkumar, Nouhaila Innan, Muhammad Shafique,
- Abstract要約: シーングラフ生成(SGG)は、オブジェクトとその相互作用に対する関係推論を必要とする。
古典的なSGGモデルは、しばしばデータセット統計に依存し、頻繁な関係に対するバイアスのある予測をもたらす。
本研究は,古典的述語ヘッドであるCausal Feature Enhancement Network (CFEN) を,重み付きクロスエントロピーを用いて学習した量子述語ヘッド (QP-Head) に置き換えることで,SGGのためのハイブリッド量子述語分類器を導入する。
- 参考スコア(独自算出の注目度): 2.417944170423441
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scene Graph Generation (SGG) requires relational reasoning over objects and their interactions, but performance is often limited by severe long-tail predicate imbalance. Classical SGG models frequently rely on dataset statistics, leading to biased predictions toward frequent relations rather than fine-grained semantic predicates. Although existing debiasing strategies improve mean recall, predicate classification in current frameworks still often depends on large classical decision modules with high parameter cost. This work introduces a hybrid quantum predicate classifier for SGG by replacing the classical predicate head in Causal Feature Enhancement Network (CFEN) with a Quantum Predicate Head (QP-Head) trained using weighted cross-entropy. To the best of our knowledge, this is among the first studies to evaluate a hybrid quantum architecture for scene graph predicate classification on Visual Genome 150. We study the effect of qubit count, encoding strategy, entangling structure, and circuit depth on relational prediction. The best 4-qubit QP-Head uses Amplitude Embedding and Strongly Entangling Layers to compress 4096-dimensional pair features into a 16-dimensional quantum-compatible representation, corresponding to a 256$\times$ reduction. It achieves an mR@100 of 57.25%, compared with 41.1% for the classical CFEN reference, while using only 96 trainable quantum parameters. Scaling to 8 qubits maintains strong long-tail performance, reaching an mR@100 of 55.38% with 384 quantum parameters, while the depth analysis shows a trade-off between expressibility and runtime overhead. These results suggest that compact hybrid quantum predicate heads can support parameter-efficient long-tail relational classification in complex visual reasoning tasks.
- Abstract(参考訳): シーングラフ生成(SGG)は、オブジェクトとその相互作用に対する関係推論を必要とするが、非常に長い尾の述語の不均衡によって性能が制限されることが多い。
古典的なSGGモデルは、しばしばデータセット統計に頼り、微粒なセマンティックな述語ではなく、頻繁な関係に対する偏りのある予測をもたらす。
既存のデバイアスング戦略は平均的リコールを改善するが、現在のフレームワークにおける述語分類は依然としてパラメータコストの高い大規模な古典的決定モジュールに依存していることが多い。
本研究は,古典的述語ヘッドであるCausal Feature Enhancement Network (CFEN) を,重み付きクロスエントロピーを用いて学習した量子述語ヘッド (QP-Head) に置き換えることで,SGGのためのハイブリッド量子述語分類器を導入する。
我々の知る限り、これはVisual Genome 150のシーングラフ述語分類のためのハイブリッド量子アーキテクチャを評価する最初の研究である。
本研究では, 量子ビット数, 符号化戦略, エンタングリング構造, 回路深さが関係予測に与える影響について検討する。
最良の4量子QPヘッドは、振幅埋め込みと強いエンタングリング層を使用して、4096次元の対の機能を16次元の量子互換表現に圧縮し、256$\times$ reductionに対応する。
mR@100 は 57.25% であり、古典的な CFEN 参照では 41.1% であり、96 個の量子パラメータしか使用していない。
8量子ビットへのスケーリングは強力なロングテール性能を維持し、55.38%のmR@100に達し、384の量子パラメータを持つ。
これらの結果から,コンパクトなハイブリッド量子述語ヘッドは,複雑な視覚的推論タスクにおけるパラメータ効率のよいロングテールリレーショナル分類をサポートできることが示唆された。
関連論文リスト
- Neural QAOA$^{2}$: Differentiable Joint Graph Partitioning and Parameter Initialization for Quantum Combinatorial Optimization [3.7086487199744127]
本稿では,グラフ分割と初期パラメータを協調的に生成するエンドツーエンドの微分可能なフレームワークであるNeural QAOA$2$を提案する。
生成的評価ネットワーク(generative Evaluative Network, GEN)を統合することにより, 微分可能な量子評価器を高忠実度性能サロゲートとして利用する。
183 QUBO、Ising、MaxCutのインスタンス(21から1000変数)の実験は、勾配駆動のアプローチがベースラインを大きく上回ることを示した。
論文 参考訳(メタデータ) (2026-05-13T06:43:10Z) - Bridge the Gap between Classical and Quantum Neural Networks with Residual Connections [0.0]
本稿では,古典的残差学習と量子的残差学習のギャップを埋めるために,HQRN(Hybrid Quantum Residual Network)を導入する。
我々の結果は古典的残差学習と量子的残差学習のギャップを埋め、深層量子アーキテクチャのためのスケーラブルな経路を築き上げた。
論文 参考訳(メタデータ) (2026-04-17T02:07:10Z) - QuIC: A Quantum-Inspired Interaction Classifier for Revitalizing Shallow CNNs in Fine-Grained Recognition [1.2747974581480312]
QuICは軽量なプラグイン・アンド・プレイモジュールで、機能ディメンションを爆発させることなく、安定したシングルステージのエンドツーエンドトレーニングをサポートする。
これはVGG16のTop-1精度を20%近く向上させ、ResNet18の最先端アテンション機構(SE-Block)を上回っている。
論文 参考訳(メタデータ) (2026-01-05T15:09:18Z) - VQC-MLPNet: An Unconventional Hybrid Quantum-Classical Architecture for Scalable and Robust Quantum Machine Learning [50.95799256262098]
変分量子回路(VQC)は量子機械学習を約束するが、表現性、訓練性、耐雑音性の課題に直面している。
本稿では,VQCが学習中に古典多層パーセプトロンの第一層重みを生成するハイブリッドアーキテクチャであるVQC-MLPNetを提案する。
論文 参考訳(メタデータ) (2025-06-12T01:38:15Z) - Quantum Graph Transformer for NLP Sentiment Classification [0.0]
本稿では,量子自己保持機構を統合したハイブリッドグラフアーキテクチャであるQuantum Graph Transformer (QGT)を提案する。
QGTは、既存の量子自然言語処理(QNLP)モデルよりも高い精度または同等の精度を達成する。
これらの結果は、グラフベースのQNLP技術が、効率的でスケーラブルな言語理解を促進する可能性を強調している。
論文 参考訳(メタデータ) (2025-06-09T16:55:41Z) - Quantum Transfer Learning for MNIST Classification Using a Hybrid Quantum-Classical Approach [0.0]
我々は、MNIST桁の画像を低次元の特徴空間に圧縮する画像分類のためのハイブリッド量子古典モデルを実装した。
オートエンコーダは、各28タイムs28$イメージ(784ピクセル)を64次元潜在ベクトルに圧縮する。
これらの特徴を5量子ビット量子状態にマッピングする。
論文 参考訳(メタデータ) (2024-08-05T22:16:27Z) - Unifying (Quantum) Statistical and Parametrized (Quantum) Algorithms [65.268245109828]
我々はカーンズのSQオラクルとヴァリアントの弱い評価オラクルからインスピレーションを得ます。
評価クエリから学習するための非条件の下限を出力する,広範かつ直感的なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-26T18:23:21Z) - Pre-training Tensor-Train Networks Facilitates Machine Learning with Variational Quantum Circuits [70.97518416003358]
変分量子回路(VQC)は、ノイズの多い中間スケール量子(NISQ)デバイス上での量子機械学習を約束する。
テンソルトレインネットワーク(TTN)はVQC表現と一般化を向上させることができるが、結果として得られるハイブリッドモデルであるTTN-VQCは、Polyak-Lojasiewicz(PL)条件による最適化の課題に直面している。
この課題を軽減するために,プレトレーニングTTNモデルとVQCを組み合わせたPre+TTN-VQCを導入する。
論文 参考訳(メタデータ) (2023-05-18T03:08:18Z) - GHN-Q: Parameter Prediction for Unseen Quantized Convolutional
Architectures via Graph Hypernetworks [80.29667394618625]
我々は,未知の量子化CNNアーキテクチャのパラメータの予測にグラフハイパーネットを用いることを初めて検討した。
我々は、CNNの探索空間の縮小に着目し、GHN-Qが実際に8ビットの量子化されたCNNの量子化-ロバストパラメータを予測できることを見出した。
論文 参考訳(メタデータ) (2022-08-26T08:00:02Z) - PCPL: Predicate-Correlation Perception Learning for Unbiased Scene Graph
Generation [58.98802062945709]
本稿では,適切な損失重みを適応的に求めるための新しい述語相関知覚学習手法を提案する。
我々のPCPLフレームワークは、文脈特徴をよりよく抽出するグラフエンコーダモジュールも備えています。
論文 参考訳(メタデータ) (2020-09-02T08:30:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。