論文の概要: Graph Recognition via Subgraph Prediction
- arxiv url: http://arxiv.org/abs/2601.15133v1
- Date: Wed, 21 Jan 2026 16:07:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.450662
- Title: Graph Recognition via Subgraph Prediction
- Title(参考訳): グラフ予測によるグラフ認識
- Authors: André Eberhard, Gerhard Neumann, Pascal Friederich,
- Abstract要約: 画像中のグラフを認識するためのtextbfSubgraph textbfPrediction (textbfGraSP) を用いた textbfGraph 認識法を開発した。
提案手法は多種多様なグラフとその図面で動作し,タスク固有の変更を伴わずにタスク間を移動可能であることを示す。
- 参考スコア(独自算出の注目度): 22.88151704820881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite tremendous improvements in tasks such as image classification, object detection, and segmentation, the recognition of visual relationships, commonly modeled as the extraction of a graph from an image, remains a challenging task. We believe that this mainly stems from the fact that there is no canonical way to approach the visual graph recognition task. Most existing solutions are specific to a problem and cannot be transferred between different contexts out-of-the box, even though the conceptual problem remains the same. With broad applicability and simplicity in mind, in this paper we develop a method, \textbf{Gra}ph Recognition via \textbf{S}ubgraph \textbf{P}rediction (\textbf{GraSP}), for recognizing graphs in images. We show across several synthetic benchmarks and one real-world application that our method works with a set of diverse types of graphs and their drawings, and can be transferred between tasks without task-specific modifications, paving the way to a more unified framework for visual graph recognition.
- Abstract(参考訳): 画像分類、オブジェクト検出、セグメンテーションなどのタスクが大幅に改善されているにもかかわらず、画像からのグラフの抽出としてモデル化された視覚的関係の認識は依然として難しい課題である。
これは主に、視覚グラフ認識タスクにアプローチする標準的な方法がないという事実に起因していると考えています。
既存の解の多くは問題に特有であり、概念的問題が同じであるにもかかわらず、最初から異なる文脈間で移動することはできない。
本稿では,広範に適用性と簡易性を念頭において,画像中のグラフを認識するための方法として, \textbf{S}ubgraph \textbf{P}rediction (\textbf{GraSP}) を用いた \textbf{Gra}ph 認識法を提案する。
提案手法は,様々な種類のグラフとその図面に対応し,タスク固有の修正を伴わずにタスク間を移動可能であり,視覚グラフ認識のためのより統一されたフレームワークへの道を開くことができる。
関連論文リスト
- SCENIR: Visual Semantic Clarity through Unsupervised Scene Graph Retrieval [1.51422963961219]
本稿では,グラフオートエンコーダに基づく教師なし検索フレームワークSCENIRを提案する。
提案モデルは,既存のビジョンベース,マルチモーダル,教師付きGNNアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2025-05-21T11:56:09Z) - A Graph-Based Framework for Interpretable Whole Slide Image Analysis [86.37618055724441]
我々は,全スライディング画像を生物学的にインフォームドされたグラフ表現に変換するフレームワークを開発した。
我々のアプローチは、任意の格子ではなく、自然構造を尊重する組織領域からグラフノードを構築する。
がんのステージングと生存予測の課題に強いパフォーマンスを示す。
論文 参考訳(メタデータ) (2025-03-14T20:15:04Z) - SelfGraphVQA: A Self-Supervised Graph Neural Network for Scene-based
Question Answering [0.0]
シーングラフはマルチモーダル画像解析の有用なツールとして登場した。
理想化されたアノテートシーングラフを利用する現在の手法は、画像から抽出された予測シーングラフを使用する場合、一般化に苦慮している。
本稿では,事前学習したシーングラフ生成器を用いて,入力画像からシーングラフを抽出する。
論文 参考訳(メタデータ) (2023-10-03T07:14:53Z) - EPIC: Graph Augmentation with Edit Path Interpolation via Learnable Cost [12.191001329584502]
本稿では,グラフデータセットを新たに拡張するEPIC (Edit Path Interpolation via learnable Cost)を提案する。
不規則な領域にある2つのグラフの間を補間するために、EPICは2つのグラフ間の変換プロセスを表す編集パスを構築する。
我々のアプローチは多くのタスクにおいて既存の拡張テクニックよりも優れています。
論文 参考訳(メタデータ) (2023-06-02T07:19:07Z) - Coarse-to-Fine Contrastive Learning in Image-Text-Graph Space for
Improved Vision-Language Compositionality [50.48859793121308]
対照的に訓練された視覚言語モデルは、視覚と言語表現学習において顕著な進歩を遂げた。
近年の研究では、対象、属性、関係性に対して構成的推論を行う能力に厳しい制限が強調されている。
論文 参考訳(メタデータ) (2023-05-23T08:28:38Z) - A Broader Picture of Random-walk Based Graph Embedding [2.6546685109604304]
ランダムウォークに基づくグラフ埋め込みは、多くのグラフ関連下流タスクに対する効果的なソリューションをサポートする。
本研究では,ランダムウォークプロセス,類似関数,埋め込みアルゴリズムという3つのコンポーネントからなるランダムウォークグラフ埋め込みの分析フレームワークを開発する。
自己共分散類似度に基づく埋め込みは,ドット製品ランキングと組み合わせてリンク予測を行う場合,ポイントワイズ・ミューチュアル・インフォメーション類似度に基づく最先端手法を最大100%向上させることを示す。
論文 参考訳(メタデータ) (2021-10-24T03:40:16Z) - Learning to Generate Scene Graph from Natural Language Supervision [52.18175340725455]
シーングラフと呼ばれる画像内の局所化オブジェクトとその関係をグラフィカルに表現するために,画像と文のペアから学習する最初の方法の1つを提案する。
既製のオブジェクト検出器を利用してオブジェクトのインスタンスを識別し、ローカライズし、検出された領域のラベルとキャプションから解析された概念をマッチングし、シーングラフを学習するための"擬似ラベル"を作成する。
論文 参考訳(メタデータ) (2021-09-06T03:38:52Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Image-Graph-Image Translation via Auto-Encoding [4.847617604851614]
この研究は、外部の監視を必要とせず、画像から画像への変換タスクを学習する最初の畳み込みニューラルネットワークを示す。
私たちは、ボトルネックがグラフのノードとエッジをエンコードする、完全に異なる自動エンコーダに基づいた自己監視アプローチを初めて提示しました。
論文 参考訳(メタデータ) (2020-12-10T21:01:32Z) - Graph Edit Distance Reward: Learning to Edit Scene Graph [69.39048809061714]
本研究では,これまで検討されていないユーザ指示に従ってシーングラフを編集する手法を提案する。
具体的には,テキストから得られるセマンティクスとしてシーングラフの編集を学習するために,グラフ編集距離再帰(Graph Edit Distance Reward)を提案する。
テキスト編集画像検索の文脈において,CSSおよびCRIRデータセットにおける本手法の有効性を検証する。
論文 参考訳(メタデータ) (2020-08-15T04:52:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。