論文の概要: Beyond Pixels: Vector-to-Graph Transformation for Reliable Schematic Auditing
- arxiv url: http://arxiv.org/abs/2602.11678v1
- Date: Thu, 12 Feb 2026 07:50:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-13 21:07:25.706261
- Title: Beyond Pixels: Vector-to-Graph Transformation for Reliable Schematic Auditing
- Title(参考訳): ピクセルを超えて: 信頼性の高いスキーマ監査のためのベクトルからグラフへの変換
- Authors: Chengwei Ma, Zhen Tian, Zhou Zhou, Zhixian Xu, Xiaowei Zhu, Xia Hua, Si Shi, F. Richard Yu,
- Abstract要約: 本稿では,CAD図をノードがコンポーネントを表現し,エッジが接続を符号化するプロパティグラフに変換するVector-to-Graph(V2G)パイプラインを提案する。
電気的コンプライアンスチェックの診断ベンチマークでは、V2Gは全てのエラーカテゴリで大きな精度向上を達成し、MLLMのリードは確率レベルに近づいたままである。
- 参考スコア(独自算出の注目度): 34.54168175788343
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multimodal Large Language Models (MLLMs) have shown remarkable progress in visual understanding, yet they suffer from a critical limitation: structural blindness. Even state-of-the-art models fail to capture topology and symbolic logic in engineering schematics, as their pixel-driven paradigm discards the explicit vector-defined relations needed for reasoning. To overcome this, we propose a Vector-to-Graph (V2G) pipeline that converts CAD diagrams into property graphs where nodes represent components and edges encode connectivity, making structural dependencies explicit and machine-auditable. On a diagnostic benchmark of electrical compliance checks, V2G yields large accuracy gains across all error categories, while leading MLLMs remain near chance level. These results highlight the systemic inadequacy of pixel-based methods and demonstrate that structure-aware representations provide a reliable path toward practical deployment of multimodal AI in engineering domains. To facilitate further research, we release our benchmark and implementation at https://github.com/gm-embodied/V2G-Audit.
- Abstract(参考訳): MLLM(Multimodal Large Language Models)は視覚的理解において顕著な進歩を見せている。
最先端モデルでさえ、そのピクセル駆動のパラダイムは推論に必要な明示的なベクトル定義関係を捨てるため、エンジニアリング・スキーマにおけるトポロジと記号論理を捉えることに失敗する。
これを解決するために、CAD図をプロパティグラフに変換するVector-to-Graph(V2G)パイプラインを提案する。
電気的コンプライアンスチェックの診断ベンチマークでは、V2Gは全てのエラーカテゴリで大きな精度向上を達成し、MLLMのリードは確率レベルに近づいたままである。
これらの結果は、画素ベースの手法の体系的不適切さを強調し、構造認識表現が工学領域におけるマルチモーダルAIの実践的展開に向けた信頼性の高い経路を提供することを示した。
さらなる研究を容易にするため、ベンチマークと実装をhttps://github.com/gm-embodied/V2G-Auditで公開します。
関連論文リスト
- Plain Transformers are Surprisingly Powerful Link Predictors [57.01966734467712]
リンク予測はグラフ機械学習における中核的な課題であり、リッチで複雑なトポロジ的依存関係をキャプチャするモデルを必要とする。
グラフニューラルネットワーク(GNN)が標準的なソリューションであるのに対して、最先端のパイプラインは明示的な構造やメモリ集約的なノードの埋め込みに依存していることが多い。
本報告では,手作りのプリミティブに置き換えるエンコーダのみのプレーントランスであるPENCILについて,サンプリングしたローカルサブグラフに注目する。
論文 参考訳(メタデータ) (2026-02-02T02:45:52Z) - Integrating Artificial Intelligence and Mixed Integer Linear Programming: Explainable Graph-Based Instance Space Analysis in Air Transportation [0.0]
本稿では,複合整数線形プログラミング(MILP)と人工知能(AI)の統合を解析し,説明可能性を伴う航空輸送における複雑な最適化課題に対処する。
この研究は、MILPインスタンスから構造的特徴埋め込みを抽出するためのグラフニューラルネットワーク(GNN)の使用を検証することを目的としている。
論文 参考訳(メタデータ) (2025-12-01T14:03:29Z) - Explainable Attention-Guided Stacked Graph Neural Networks for Malware Detection [2.6436521007616114]
本稿では,グラフベースのマルウェア検出と説明のための新しいスタックングアンサンブルフレームワークを提案する。
本フレームワークは,マルウェアの行動に関する洞察に富んだ解釈を提供しながら,分類性能を向上させる。
論文 参考訳(メタデータ) (2025-08-13T13:33:02Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Scalable Graph Generative Modeling via Substructure Sequences [50.32639806800683]
本稿では,グラフ生成用トランスフォーマー事前学習フレームワークである生成グラフパターンマシン(G$2$PM)を紹介する。
G$2$PMはグラフインスタンス(ノード、エッジ、グラフ全体)をサブ構造のシーケンスとして表現する。
それは、一般化可能かつ伝達可能な表現を学ぶために、シーケンスに関する生成的事前学習を採用する。
論文 参考訳(メタデータ) (2025-05-22T02:16:34Z) - Efficient Environmental Claim Detection with Hyperbolic Graph Neural Networks [1.7259898169307608]
我々は、トランスフォーマーベースモデルの軽量かつ効果的な代替手段として、グラフニューラルネットワーク(GNN)とハイパーボリックグラフニューラルネットワーク(HGNN)について検討する。
以上の結果から,我々のグラフベースモデル,特にポインカー空間(P-HGNN)におけるHGNNは,環境クレーム検出の最先端技術よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-02-19T11:04:59Z) - Graph Structure Refinement with Energy-based Contrastive Learning [56.957793274727514]
グラフの構造と表現を学習するための生成訓練と識別訓練のジョイントに基づく教師なし手法を提案する。
本稿では,ECL-GSR(Energy-based Contrastive Learning)によるグラフ構造再構成(GSR)フレームワークを提案する。
ECL-GSRは、主要なベースラインに対するサンプルやメモリの少ない高速なトレーニングを実現し、下流タスクの単純さと効率性を強調している。
論文 参考訳(メタデータ) (2024-12-20T04:05:09Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - Software Vulnerability Detection via Deep Learning over Disaggregated
Code Graph Representation [57.92972327649165]
この研究は、コードコーパスから安全でないパターンを自動的に学習するためのディープラーニングアプローチを探求する。
コードには解析を伴うグラフ構造が自然に認められるため,プログラムの意味的文脈と構造的規則性の両方を利用する新しいグラフニューラルネットワーク(GNN)を開発する。
論文 参考訳(メタデータ) (2021-09-07T21:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。