論文の概要: ViG-LRGC: Vision Graph Neural Networks with Learnable Reparameterized Graph Construction
- arxiv url: http://arxiv.org/abs/2509.18840v1
- Date: Tue, 23 Sep 2025 09:25:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.798115
- Title: ViG-LRGC: Vision Graph Neural Networks with Learnable Reparameterized Graph Construction
- Title(参考訳): ViG-LRGC:学習可能な再パラメータグラフ構築による視覚グラフニューラルネットワーク
- Authors: Ismael Elsharkawi, Hossam Sharara, Ahmed Rafea,
- Abstract要約: Vision Graph Neural Networks (ViG) は、ノードのグラフとしてのイメージの扱いを提案する。
課題は、各層にノード間の関係を最もよく表すノードのグラフを構築することである。
視覚グラフニューラルネットワークのためのLRGC(Learningable Reparameterized Graph Construction)を提案する。
提案手法は、ImageNet-1kベンチマークデータセットにおいて、同じ大きさの最先端のViGモデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.15293427903448023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image Representation Learning is an important problem in Computer Vision. Traditionally, images were processed as grids, using Convolutional Neural Networks or as a sequence of visual tokens, using Vision Transformers. Recently, Vision Graph Neural Networks (ViG) have proposed the treatment of images as a graph of nodes; which provides a more intuitive image representation. The challenge is to construct a graph of nodes in each layer that best represents the relations between nodes and does not need a hyper-parameter search. ViG models in the literature depend on non-parameterized and non-learnable statistical methods that operate on the latent features of nodes to create a graph. This might not select the best neighborhood for each node. Starting from k-NN graph construction to HyperGraph Construction and Similarity-Thresholded graph construction, these methods lack the ability to provide a learnable hyper-parameter-free graph construction method. To overcome those challenges, we present the Learnable Reparameterized Graph Construction (LRGC) for Vision Graph Neural Networks. LRGC applies key-query attention between every pair of nodes; then uses soft-threshold reparameterization for edge selection, which allows the use of a differentiable mathematical model for training. Using learnable parameters to select the neighborhood removes the bias that is induced by any clustering or thresholding methods previously introduced in the literature. In addition, LRGC allows tuning the threshold in each layer to the training data since the thresholds are learnable through training and are not provided as hyper-parameters to the model. We demonstrate that the proposed ViG-LRGC approach outperforms state-of-the-art ViG models of similar sizes on the ImageNet-1k benchmark dataset.
- Abstract(参考訳): 画像表現学習はコンピュータビジョンにおいて重要な問題である。
従来、画像はグリッドとして処理され、畳み込みニューラルネットワークや視覚トークンのシーケンスとして、ビジョントランスフォーマーを使用して処理されていた。
近年、ビジョングラフニューラルネットワーク(ViG)は、より直感的な画像表現を提供するノードのグラフとしてのイメージの扱いを提案している。
課題は、ノード間の関係を最もよく表現し、ハイパーパラメーター検索を必要としない各層にノードのグラフを構築することである。
文献のViGモデルは、グラフを作成するためにノードの潜伏した特徴で動作する非パラメータ化および非学習可能な統計手法に依存している。
これは各ノードに最適な近傍を選ばないかもしれない。
k-NNグラフ構築からハイパーグラフ構築および類似部分グラフ構築に至るまで、これらの手法は学習可能なハイパーパラメータフリーグラフ構築方法を提供する能力に欠ける。
これらの課題を克服するために、視覚グラフニューラルネットワークのためのLearningable Reparameterized Graph Construction (LRGC)を提案する。
LRGCは各ノード間のキー・クエリ・アテンションを適用し、エッジ選択にソフト・スレッショルド・リパラメトリゼーションを使用する。
学習可能なパラメータを使って近所を選択すると、文献で以前に導入されたクラスタリングやしきい値設定によって引き起こされるバイアスが取り除かれる。
さらにLRGCは、トレーニングによってしきい値が学習可能であり、モデルに対するハイパーパラメータとして提供されないため、各レイヤのしきい値をトレーニングデータにチューニングすることができる。
提案手法は、ImageNet-1kベンチマークデータセットにおいて、同じ大きさの最先端のViGモデルよりも優れていることを示す。
関連論文リスト
- Vision Graph Prompting via Semantic Low-Rank Decomposition [10.223578525761617]
Vision GNN (ViG) は、画像をグラフ構造として表現することで、優れた性能を示す。
下流タスクにViGを効率的に適応させるためには、視覚的プロンプトのようなパラメータ効率の良い微調整技術がますます不可欠になっている。
視覚グラフ構造に適した新しいフレームワークであるビジョングラフプロンプティング(VGP)を提案する。
論文 参考訳(メタデータ) (2025-05-07T04:29:29Z) - Revisiting Graph Neural Networks on Graph-level Tasks: Comprehensive Experiments, Analysis, and Improvements [54.006506479865344]
グラフレベルグラフニューラルネットワーク(GNN)のための統一評価フレームワークを提案する。
このフレームワークは、さまざまなデータセットにわたるGNNを評価するための標準化された設定を提供する。
また,表現性の向上と一般化機能を備えた新しいGNNモデルを提案する。
論文 参考訳(メタデータ) (2025-01-01T08:48:53Z) - GIMS: Image Matching System Based on Adaptive Graph Construction and Graph Neural Network [7.556253645434246]
本稿では,距離と動的しきい値の類似性に基づくフィルタリング機構を利用する,革新的な適応グラフ構築手法を提案する。
また、トランスフォーマーのグローバルな認識能力を組み合わせて、グラフ構造の表現を強化する。
システム全体のマッチング性能は平均3.8x-40.3x向上した。
論文 参考訳(メタデータ) (2024-12-24T07:05:55Z) - Training Graph Neural Networks on Growing Stochastic Graphs [114.75710379125412]
グラフニューラルネットワーク(GNN)は、ネットワーク化されたデータの意味のあるパターンを活用するために、グラフ畳み込みに依存している。
我々は,成長するグラフ列の極限オブジェクトであるグラフオンを利用して,非常に大きなグラフ上のGNNを学習することを提案する。
論文 参考訳(メタデータ) (2022-10-27T16:00:45Z) - Vision GNN: An Image is Worth Graph of Nodes [49.3335689216822]
本稿では,画像をグラフ構造として表現し,視覚タスクのためのグラフレベルの特徴を抽出するビジョンGNN(ViG)アーキテクチャを提案する。
画像のグラフ表現に基づいて、すべてのノード間で情報を変換、交換するViGモデルを構築します。
画像認識および物体検出タスクに関する大規模な実験は、我々のViGアーキテクチャの優位性を実証している。
論文 参考訳(メタデータ) (2022-06-01T07:01:04Z) - Neural Graph Matching for Pre-training Graph Neural Networks [72.32801428070749]
グラフニューラルネットワーク(GNN)は、構造データのモデリングにおいて強力な能力を示している。
GMPTと呼ばれる新しいグラフマッチングベースのGNN事前学習フレームワークを提案する。
提案手法は,完全自己指導型プレトレーニングと粗粒型プレトレーニングに適用できる。
論文 参考訳(メタデータ) (2022-03-03T09:53:53Z) - ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network [72.16255675586089]
本稿では、入力グラフと下流タスクに基づいて最適な曲率を適応的に学習する適応曲率探索ハイパーボリックグラフニューラルネットワークACE-HGNNを提案する。
複数の実世界のグラフデータセットの実験は、競争性能と優れた一般化能力を備えたモデル品質において、顕著で一貫したパフォーマンス改善を示す。
論文 参考訳(メタデータ) (2021-10-15T07:18:57Z) - Iterative Deep Graph Learning for Graph Neural Networks: Better and
Robust Node Embeddings [53.58077686470096]
グラフ構造とグラフ埋め込みを協調的かつ反復的に学習するための、エンドツーエンドのグラフ学習フレームワーク、すなわち、IDGL(Iterative Deep Graph Learning)を提案する。
実験の結果,提案したIDGLモデルは,最先端のベースラインを一貫して上回る,あるいは一致させることができることがわかった。
論文 参考訳(メタデータ) (2020-06-21T19:49:15Z) - Optimal Transport Graph Neural Networks [31.191844909335963]
現在のグラフニューラルネットワーク(GNN)アーキテクチャは、集約グラフ表現に平均または総和ノードを埋め込む。
本稿では,パラメトリックプロトタイプを用いたグラフ埋め込み計算モデルOT-GNNを紹介する。
論文 参考訳(メタデータ) (2020-06-08T14:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。