Fugu-MT 論文翻訳(概要): CurveBench: A Benchmark for Exact Topological Reasoning over Nested Jordan Curves

論文の概要: CurveBench: A Benchmark for Exact Topological Reasoning over Nested Jordan Curves

arxiv url: http://arxiv.org/abs/2605.14068v1
Date: Wed, 13 May 2026 19:46:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-15 21:45:34.484487
Title: CurveBench: A Benchmark for Exact Topological Reasoning over Nested Jordan Curves
Title（参考訳）: CurveBench:Nested Jordan曲線に対するトポロジカル推論のベンチマーク
Authors: Amirreza Mohseni, Mona Mohammadi, Morteza Saghafian, Naser Talebizadeh Saradari,
Abstract要約: 視覚入力からの階層的トポロジ的推論のためのベンチマークであるCurveBenchを紹介する。各画像は、平面領域間の包接関係をコードするルート木で注釈付けされる。タスクの視覚的単純さにもかかわらず、最も評価の高いモデルであるGemini 3.1 Proは、textbf71.1%のツリー生成精度しか達成していない。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce CurveBench, a benchmark for hierarchical topological reasoning from visual input. CurveBench consists of \textbf{756 images} of pairwise non-intersecting Jordan curves across easy, polygonal, topographic-inspired, maze-like, and dense counting configurations. Each image is annotated with a rooted tree encoding the containment relations between planar regions. We formulate the task as structured prediction: given an image, a model must recover the full rooted containment tree induced by the curves. Despite the visual simplicity of the task, the strongest evaluated model, Gemini 3.1 Pro, achieves only \textbf{71.1\%} tree-generation accuracy on CurveBench-Easy and \textbf{19.1\%} on CurveBench-Hard. We further demonstrate benchmark utility through RLVR-style fine-tuning of open-weight vision-language models. Our trained Qwen3-VL-8B model improves over \texttt{Qwen-3-VL-8B-Thinking} from \textbf{2.8\%} to \textbf{33.3\%} tree-generation accuracy on CurveBench-Easy, exceeding GPT-5.4 and Claude Opus 4.5 under our evaluation protocol. The remaining gap, especially on CurveBench-Hard, shows that exact topology-aware visual reasoning remains far from solved.
Abstract（参考訳）: 視覚入力からの階層的トポロジ的推論のためのベンチマークであるCurveBenchを紹介する。 CurveBench は、容易で多角形、地形にインスパイアされた、迷路のような、密度の高い数え上げ構成にまたがる対の非交差ヨルダン曲線の \textbf{756 画像からなる。各画像は、平面領域間の包接関係をコードするルート木で注釈付けされる。構造的予測としてタスクを定式化する: 画像が与えられた場合、モデルは曲線によって誘導される全根包接木を復元しなければならない。タスクの視覚的単純さにもかかわらず、最も評価の高いモデルであるGemini 3.1 Proは、CurveBench-Easy上では \textbf{71.1\%}ツリー生成精度とCurveBench-Hard上では \textbf{19.1\%}ツリー生成精度しか達成していない。さらに、RLVRスタイルのオープンウェイト視覚言語モデルの微調整により、ベンチマークユーティリティを実証する。トレーニングされたQwen3-VL-8Bモデルでは,評価プロトコルでGPT-5.4を超え,Claude Opus 4.5を超える木生成精度を, \textbf{2.8\%} から \textbf{33.3\%} に改善した。残りのギャップ、特にCurveBench-Hardは、正確な位相対応の視覚的推論がまだ解けていないことを示している。

関連論文リスト

BareBones: Benchmarking Zero-Shot Geometric Comprehension in VLMs [0.688204255655161]
$textbfBareBones$は、純粋な幾何学的形状理解をストレステストするために設計されたゼロショットベンチマークである。 WTP-ベンチ(WTP-Bench)は、境界輪郭のみからクラス間の幾何学的概念を識別するようモデルに強制する、極端できめ細かな視覚パズルである。
論文参考訳（メタデータ） (2026-04-12T08:46:27Z)
Mapper-GIN: Lightweight Structural Graph Abstraction for Corrupted 3D Point Cloud Classification [10.923484372424598]
Mapper-GINは、ポイントクラウドをMapperを使ってオーバーラップするリージョンに分割する軽量パイプラインである。汚職ベンチマークのModelNet40-Cでは、Mapper-GINは0.5Mパラメータで競合し、安定した精度を実現している。以上の結果から,領域グラフ構造は3次元視覚認識において,効率的かつ解釈可能な頑健さの源となることが示唆された。
論文参考訳（メタデータ） (2026-02-05T10:30:40Z)
CAGE: Continuity-Aware edGE Network Unlocks Robust Floorplan Reconstruction [24.09888364478496]
我々は,点-雲密度マップから直接ベクトルフロアプランを再構築する堅牢なフレームワークであるCAGEを提案する。 CAGEは最先端のパフォーマンスを達成し、F1スコアは99.1%(部屋)、91.7%(コーナー)、89.3%(角度)である。
論文参考訳（メタデータ） (2025-09-18T22:10:37Z)
GC-Bench: An Open and Unified Benchmark for Graph Condensation [54.70801435138878]
我々は,グラフ凝縮の性能を解析するための総合的なグラフ凝縮ベンチマーク (GC-Bench) を開発した。 GC-Benchは、グラフ凝縮の特徴を以下の次元で体系的に研究している。我々は,再現性のある研究を容易にするために,異なるGC手法を訓練し,評価するための簡易ライブラリを開発した。
論文参考訳（メタデータ） (2024-06-30T07:47:34Z)
DeepRicci: Self-supervised Graph Structure-Feature Co-Refinement for Alleviating Over-squashing [72.70197960100677]
グラフ構造学習(GSL)はグラフニューラルネットワーク(GNN)を改良したグラフで強化する上で重要な役割を果たしている。 GSLソリューションは、通常、タスク固有の監督(ノード分類)による構造改善に焦点を当てるか、GNN自体の固有の弱点を見落としている。本稿では,典型的なGNNにおけるオーバー・スカッシングの問題を効果的に緩和する,自己教師付きグラフ構造-機能共分法について検討する。
論文参考訳（メタデータ） (2024-01-23T14:06:08Z)
Graph Signal Sampling for Inductive One-Bit Matrix Completion: a Closed-form Solution [112.3443939502313]
グラフ信号解析と処理の利点を享受する統合グラフ信号サンプリングフレームワークを提案する。キーとなる考え方は、各ユーザのアイテムのレーティングをアイテムイットグラフの頂点上の関数(信号)に変換することである。オンライン設定では、グラフフーリエ領域における連続ランダムガウス雑音を考慮したベイズ拡張(BGS-IMC)を開発する。
論文参考訳（メタデータ） (2023-02-08T08:17:43Z)
Machine learning algorithms for three-dimensional mean-curvature computation in the level-set method [0.0]
レベルセット法のためのデータ駆動平均曲率解法を提案する。提案方式は, 現在の粒子界面再構成よりも高精度な平均曲率推定を行うことができる。
論文参考訳（メタデータ） (2022-08-18T20:19:22Z)
ExpressivE: A Spatio-Functional Embedding For Knowledge Graph Completion [78.8942067357231]
ExpressivEは、一対の実体を点として埋め込み、仮想三重空間に超平行グラフとして関係を埋め込む。我々は、ExpressivEが最先端のKGEと競合し、W18RRでさらに優れています。
論文参考訳（メタデータ） (2022-06-08T23:34:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。