Fugu-MT 論文翻訳(概要): OsmLocator: locating overlapping scatter marks with a non-training generative perspective

論文の概要: OsmLocator: locating overlapping scatter marks with a non-training generative perspective

arxiv url: http://arxiv.org/abs/2312.11146v2
Date: Fri, 22 Dec 2023 15:44:10 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-25 17:47:40.474831
Title: OsmLocator: locating overlapping scatter marks with a non-training generative perspective
Title（参考訳）: OsmLocator:非学習的生成的視点による重なり合う散乱点の探索
Authors: Yuming Qiu, Aleksandra Pizurica, Qi Ming, Nicolas Nadisic
Abstract要約: 重複するマークの配置には、テクスチャの欠如、文脈の少ない情報、ハロー形状、小さなサイズなど、多くの困難がある。ここでは、クラスタリングに基づく再視覚化の最適化問題として、非学習的生成の観点から定式化する。特に,異なるマーカーと様々な重なり合いの重なり合いを持つ何百もの散乱画像を含む2023というデータセットを構築し,提案手法を既存の手法と比較した。
参考スコア（独自算出の注目度）: 48.50108853199417
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Automated mark localization in scatter images, greatly helpful for discovering knowledge and understanding enormous document images and reasoning in visual question answering AI systems, is a highly challenging problem because of the ubiquity of overlapping marks. Locating overlapping marks faces many difficulties such as no texture, less contextual information, hallow shape and tiny size. Here, we formulate it as a combinatorial optimization problem on clustering-based re-visualization from a non-training generative perspective, to locate scatter marks by finding the status of multi-variables when an objective function reaches a minimum. The objective function is constructed on difference between binarized scatter images and corresponding generated re-visualization based on their clustering. Fundamentally, re-visualization tries to generate a new scatter graph only taking a rasterized scatter image as an input, and clustering is employed to provide the information for such re-visualization. This method could stably locate severely-overlapping, variable-size and variable-shape marks in scatter images without dependence of any training dataset or reference. Meanwhile, we propose an adaptive variant of simulated annealing which can works on various connected regions. In addition, we especially built a dataset named SML2023 containing hundreds of scatter images with different markers and various levels of overlapping severity, and tested the proposed method and compared it to existing methods. The results show that it can accurately locate most marks in scatter images with different overlapping severity and marker types, with about 0.3 absolute increase on an assignment-cost-based metric in comparison with state-of-the-art methods. This work is of value to data mining on massive web pages and literatures, and shedding new light on image measurement such as bubble counting.
Abstract（参考訳）: 散乱画像におけるマークの自動定位は、膨大な文書画像の発見と理解に大いに役立ち、視覚的質問応答aiシステムにおける推論は、重複するマークの普遍性のため、非常に難しい問題である。重複するマークの配置には、テクスチャの欠如、文脈の少ない情報、ハロー形状、小さなサイズなど、多くの困難がある。本稿では,非学習的な生成的視点からクラスタリングに基づく再可視化に関する組合せ最適化問題として,目的関数が最小値に達した場合のマルチ変数の状態を見つけ,散乱マークの同定を行う。目的関数は、2値化散乱画像とそれに対応するクラスタリングに基づいて生成された再視覚化の差に基づいて構成される。基本的に、再視覚化は、ラスタ化された散乱画像を入力としてのみ新しい散乱グラフを生成し、再視覚化のための情報を提供するためにクラスタリングを用いる。この方法は、トレーニングデータセットや参照に依存することなく、散乱画像に重なり合い、可変サイズ、可変形状のマークを安定的に配置することができる。一方,本研究では,様々な接続領域で動作するシミュレートアニーリングの適応型を提案する。さらに,sml2023というデータセットを特に構築し,異なるマーカーと重なり合う重大さのさまざまなレベルを持つ数百の散乱画像を用いて,提案手法をテストし,既存の手法と比較した。その結果,重複重畳度やマーカータイプが異なる散乱画像において,割当コストに基づく測定値に対して0.3 % の絶対値の増加を,最先端法と比較して精度良く検出できることがわかった。この研究は、巨大なウェブページや文献のデータマイニングに価値があり、バブル計数などの画像計測に新たな光を当てている。

関連論文リスト

Semi-supervised segmentation of land cover images using nonlinear canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文参考訳（メタデータ） (2024-01-22T17:56:07Z)
A Locality-based Neural Solver for Optical Motion Capture [37.28597049192196]
ノイズの多いマーカーデータから、マーカーと関節を異なるタイプのノードとして扱う異種グラフニューラルネットワークを提案する。本手法は,隠蔽マーカー位置誤差の予測精度の観点から,最先端手法よりも優れていることを示す。
論文参考訳（メタデータ） (2023-09-01T12:40:17Z)
Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2023-09-01T11:15:50Z)
Self-similarity Driven Scale-invariant Learning for Weakly Supervised Person Search [66.95134080902717]
自己相似性駆動型スケール不変学習(SSL)という新しいワンステップフレームワークを提案する。本稿では,ネットワークを前景と学習スケール不変の機能に集中させるための,マルチスケール・エクステンプラー・ブランチを提案する。 PRWおよびCUHK-SYSUデータベースの実験により,本手法の有効性が示された。
論文参考訳（メタデータ） (2023-02-25T04:48:11Z)
Correlation Verification for Image Retrieval [15.823918683848877]
相関検証ネットワーク (CVNet) という新しい画像検索手法を提案する。 CVNetは、様々な画像対から多様な幾何マッチングパターンを学習しながら、高密度特徴相関を画像類似性に圧縮する。提案するネットワークは,有意なマージンを有する複数の検索ベンチマークにおいて,最先端の性能を示す。
論文参考訳（メタデータ） (2022-04-04T13:18:49Z)
Digging Into Self-Supervised Learning of Feature Descriptors [14.47046413243358]
強力な機能記述子に繋がる一連の改善を提案する。強負の採鉱において, 対面内からバッチ内への探索空間の増大が一貫した改善をもたらすことを示す。合成ホモグラフィ変換,色強調,フォトリアリスティック画像スタイリングの組み合わせが有用であることを示す。
論文参考訳（メタデータ） (2021-10-10T12:22:44Z)
Spatial-spectral Hyperspectral Image Classification via Multiple Random Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文参考訳（メタデータ） (2021-03-25T09:31:41Z)
Data Augmentation for Object Detection via Differentiable Neural Rendering [71.00447761415388]
注釈付きデータが乏しい場合、堅牢なオブジェクト検出器を訓練することは困難です。この問題に対処する既存のアプローチには、ラベル付きデータからラベル付きデータを補間する半教師付き学習が含まれる。オブジェクト検出のためのオフラインデータ拡張手法を導入し、新しいビューでトレーニングデータを意味的に補間する。
論文参考訳（メタデータ） (2021-03-04T06:31:06Z)
Multi-temporal and multi-source remote sensing image classification by nonlinear relative normalization [17.124438150480326]
emカーネル化により,異なるドメインのデータを非線形に整列する手法を検討する。我々は,超スペクトルイメージングのためのシャドウイングに不変なモデルを作成する作業に加えて,多時間的および多元的超高分解能分類タスクにおいてkemaのテストに成功した。
論文参考訳（メタデータ） (2020-12-07T08:46:11Z)
High-Order Information Matters: Learning Relation and Topology for Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文参考訳（メタデータ） (2020-03-18T12:18:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。