論文の概要: Topo-R1: Detecting Topological Anomalies via Vision-Language Models
- arxiv url: http://arxiv.org/abs/2603.13054v1
- Date: Fri, 13 Mar 2026 15:05:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:12.144682
- Title: Topo-R1: Detecting Topological Anomalies via Vision-Language Models
- Title(参考訳): Topo-R1:視覚言語モデルによる位相異常の検出
- Authors: Meilong Xu, Qingqiao Hu, Xiaoling Hu, Shahira Abousamra, Xin Yu, Weimin Lyu, Kehan Qi, Dimitris Samaras, Chao Chen,
- Abstract要約: トポロジカルな正確性は、血管、神経線維、道路網などの構造にとって重要である。
我々は,様々なトポロジ的異常を検証可能なアノテーションで合成する自動データキュレーションパイプラインを開発した。
次に、トポロジを意識した視覚言語モデルを実現するフレームワークであるTopo-R1を紹介する。
- 参考スコア(独自算出の注目度): 42.86510112477789
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Topological correctness is crucial for tubular structures such as blood vessels, nerve fibers, and road networks. Existing topology-preserving methods rely on domain-specific ground truth, which is costly and rarely transfers across domains. When deployed to a new domain without annotations, a key question arises: how can we detect topological anomalies without ground-truth supervision? We reframe this as topological anomaly detection, a structured visual reasoning task requiring a model to locate and classify topological errors in predicted segmentation masks. Vision-Language Models (VLMs) are natural candidates; however, we find that state-of-the-art VLMs perform nearly at random, lacking the fine-grained, topology-aware perception needed to identify sparse connectivity errors in dense structures. To bridge this gap, we develop an automated data-curation pipeline that synthesizes diverse topological anomalies with verifiable annotations across progressively difficult levels, thereby constructing the first large-scale, multi-domain benchmark for this task. We then introduce Topo-R1, a framework that endows VLMs with topology-aware perception via two-stage training: supervised fine-tuning followed by reinforcement learning with Group Relative Policy Optimization (GRPO). Central to our approach is a topology-aware composite reward that integrates type-aware Hungarian matching for structured error classification, spatial localization scoring, and a centerline Dice (clDice) reward that directly penalizes connectivity disruptions, thereby jointly incentivizing semantic precision and structural fidelity. Extensive experiments demonstrate that Topo-R1 establishes a new paradigm for annotation-free topological quality assessment, consistently outperforming general-purpose VLMs and supervised baselines across all evaluation protocols.
- Abstract(参考訳): トポロジカルな正確性は血管、神経線維、道路網などの管状構造にとって重要である。
既存のトポロジ保存法はドメイン固有の真実に依存しており、ドメイン間での転送は高価で稀である。
アノテーションなしで新しいドメインにデプロイすると、重要な疑問が生じる。
我々はこれを、予測されたセグメンテーションマスクのトポロジ的誤りを特定し分類するモデルを必要とする構造的視覚推論タスクであるトポロジカル異常検出(topological anomaly detection)として再構成した。
VLM(Vision-Language Models)は自然候補であるが,高密度構造におけるスパース接続誤差を識別するために必要な微粒なトポロジ認識を欠いて,最先端のVLMがほぼランダムに動作することを発見した。
このギャップを埋めるため、我々は様々なトポロジカルな異常を段階的に困難なレベルで検証可能なアノテーションで合成する自動データキュレーションパイプラインを開発し、このタスクのための最初の大規模マルチドメインベンチマークを構築した。
次に,2段階の訓練によってVLMにトポロジカルな認識を与えるフレームワークであるTopo-R1を紹介し,さらにグループ相対政策最適化(GRPO)による強化学習を行った。
提案手法の中心となるのは,構造的誤り分類,空間的局所化スコア,および接続障害を直接ペナルティ化する中心的Dice(clDice)報酬と,意味的精度と構造的忠実度を併用したトポロジ対応複合報酬である。
Topo-R1は、アノテーションのないトポロジカルな品質評価のための新しいパラダイムを確立し、すべての評価プロトコルにおいて汎用的なVLMと教師付きベースラインを一貫して上回っている。
関連論文リスト
- HAAF: Hierarchical Adaptation and Alignment of Foundation Models for Few-Shot Pathology Anomaly Detection [10.649984141835189]
階層型適応アライメントフレームワーク(HAAF)を提案する。
中心となるのは、シーケンシャルなキャリブレーション順序を強制するクロスレベルスケールアライメント機構である。
デュアルブランチ推論戦略は、セマンティックスコアと幾何学的プロトタイプを統合して、数ショット設定での安定性を確保する。
論文 参考訳(メタデータ) (2026-01-24T10:31:21Z) - FedTopo: Topology-Informed Representation Alignment in Federated Learning under Non-I.I.D. Conditions [35.0734004020033]
FedTopo - Topological-Guided Block Screening (TGBS)とTopological Embedding (TE)を統合するフレームワーク
Fashion-MNIST、CIFAR-10、CIFAR-100の4つの非I.D.パーティションによる実験は、FedTopoが収束を加速し、強いベースラインよりも精度を向上させることを示している。
論文 参考訳(メタデータ) (2025-11-16T14:40:58Z) - Noise & pattern: identity-anchored Tikhonov regularization for robust structural anomaly detection [58.535473924035365]
異常検出は自動産業検査において重要な役割を担い、他の均一な視覚パターンの微妙な欠陥や稀な欠陥を識別することを目的としている。
自己教師型オートエンコーダを用いて, 破損した入力の修復を学習する構造的異常検出に取り組む。
構造欠陥を模倣した画像に人工的破壊を注入する汚職モデルを導入する。
論文 参考訳(メタデータ) (2025-11-10T15:48:50Z) - MATCH: Multi-faceted Adaptive Topo-Consistency for Semi-Supervised Histopathology Segmentation [15.740955468843035]
本稿では,関係するトポロジ的特徴を頑健に識別し,保存する半教師付きセグメンテーションフレームワークを提案する。
この一貫性機構は、生物学的に意味のある構造と過渡的およびノイズのある人工物とを区別するのに役立つ。
空間重なりとグローバルな構造アライメントを統合する新しいマッチング戦略を導入する。
論文 参考訳(メタデータ) (2025-10-02T00:08:28Z) - Topology-Aware Modeling for Unsupervised Simulation-to-Reality Point Cloud Recognition [63.55828203989405]
我々はオブジェクトポイントクラウド上でSim2Real UDAのための新しいTopology-Aware Modeling (TAM)フレームワークを紹介する。
提案手法は,低レベルの高周波3次元構造を特徴とするグローバル空間トポロジを利用して,領域間隙を緩和する。
本稿では,クロスドメイン・コントラスト学習と自己学習を組み合わせた高度な自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-26T11:53:59Z) - Towards Training-free Anomaly Detection with Vision and Language Foundation Models [17.991678161890174]
異常検出は、産業品質検査のような現実世界の応用に有用である。
論理的および構造的異常検出のトレーニングを必要としない新しいマルチモーダルフレームワークであるLogSADを紹介する。
論文 参考訳(メタデータ) (2025-03-24T04:07:59Z) - Relation Matters: Foreground-aware Graph-based Relational Reasoning for
Domain Adaptive Object Detection [81.07378219410182]
我々は、FGRR(Fearground-aware Graph-based Reasoning)というドメインDのための新しい汎用フレームワークを提案する。
FGRRはグラフ構造を検出パイプラインに組み込んで、ドメイン内およびドメイン間フォアグラウンドオブジェクト関係を明示的にモデル化する。
実験の結果、提案したFGRRは4つのDomainDベンチマークの最先端よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-06-06T05:12:48Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - Towards Uncovering the Intrinsic Data Structures for Unsupervised Domain
Adaptation using Structurally Regularized Deep Clustering [119.88565565454378]
Unsupervised Domain Adapt (UDA) は、ターゲットドメイン上のラベルなしデータの予測を行う分類モデルを学ぶことである。
本稿では,対象データの正規化判別クラスタリングと生成クラスタリングを統合する構造的正規化深層クラスタリングのハイブリッドモデルを提案する。
提案するH-SRDCは, インダクティブ設定とトランスダクティブ設定の両方において, 既存の手法よりも優れている。
論文 参考訳(メタデータ) (2020-12-08T08:52:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。