論文の概要: Image Patch-Matching with Graph-Based Learning in Street Scenes
- arxiv url: http://arxiv.org/abs/2311.04617v1
- Date: Wed, 8 Nov 2023 11:35:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-09 16:00:39.134770
- Title: Image Patch-Matching with Graph-Based Learning in Street Scenes
- Title(参考訳): ストリートシーンにおけるグラフ学習による画像パッチマッチング
- Authors: Rui She, Qiyu Kang, Sijie Wang, Wee Peng Tay, Yong Liang Guan, Diego
Navarro Navarro and Andreas Hartmannsgruber
- Abstract要約: 本稿では,グラフに基づく学習を併用した特徴量学習モデルと距離学習モデルを提案する。
いくつかのストリートシーンデータセットを用いてモデルを評価し,提案手法が最先端のマッチング結果を実現することを示す。
- 参考スコア(独自算出の注目度): 31.27416414119136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Matching landmark patches from a real-time image captured by an on-vehicle
camera with landmark patches in an image database plays an important role in
various computer perception tasks for autonomous driving. Current methods focus
on local matching for regions of interest and do not take into account spatial
neighborhood relationships among the image patches, which typically correspond
to objects in the environment. In this paper, we construct a spatial graph with
the graph vertices corresponding to patches and edges capturing the spatial
neighborhood information. We propose a joint feature and metric learning model
with graph-based learning. We provide a theoretical basis for the graph-based
loss by showing that the information distance between the distributions
conditioned on matched and unmatched pairs is maximized under our framework. We
evaluate our model using several street-scene datasets and demonstrate that our
approach achieves state-of-the-art matching results.
- Abstract(参考訳): 車載カメラが捉えたリアルタイム画像のランドマークパッチと、画像データベース内のランドマークパッチとをマッチングすることは、自動運転のための様々なコンピュータ認識タスクにおいて重要な役割を果たす。
現在の手法は関心領域の局所的マッチングに重点を置いており、通常環境内のオブジェクトに対応するイメージパッチ間の空間的近傍関係を考慮していない。
本稿では,空間近傍情報をキャプチャするパッチやエッジに対応するグラフ頂点を持つ空間グラフを構築する。
本稿では,グラフ学習を用いた特徴量と距離学習モデルを提案する。
本研究では,一致対と不一致対を条件とした分布間の情報距離を最大化することにより,グラフベース損失の理論的基礎を提供する。
いくつかのストリートシーンデータセットを用いてモデルを評価し,提案手法が最先端のマッチング結果を実現することを示す。
関連論文リスト
- RobustMat: Neural Diffusion for Street Landmark Patch Matching under
Challenging Environments [26.423254820086296]
オンボードカメラが撮影したランドマークのパッチと、別の時間に撮影した他のランドマークのパッチとを一致させたり、ストリートシーンの画像データベースに保存したりするのに役立ちます。
我々は、ニューラルネットワークの微分方程式から摂動に頑健性をもたらすRobustMatというアプローチを提案する。
提案手法は,複数の街路景観データセットを用いて評価し,環境変動下での最先端のマッチング結果を実現することを実証した。
論文 参考訳(メタデータ) (2023-11-07T11:37:20Z) - Learnable Graph Matching: A Practical Paradigm for Data Association [74.28753343714858]
これらの問題に対処するための一般的な学習可能なグラフマッチング法を提案する。
提案手法は,複数のMOTデータセット上での最先端性能を実現する。
画像マッチングでは,一般的な屋内データセットであるScanNetで最先端の手法より優れている。
論文 参考訳(メタデータ) (2023-03-27T17:39:00Z) - Self Supervised Clustering of Traffic Scenes using Graph Representations [2.658812114255374]
本稿では,手動ラベリングを使わずに自己管理されたトラフィックシーンをクラスタリングするデータ駆動方式を提案する。
セマンティックシーングラフモデルを用いて、トラフィックシーンの一般的なグラフ埋め込みを作成し、シームズネットワークを用いて低次元の埋め込み空間にマッピングする。
新たなアプローチのトレーニングプロセスにおいて、カルテシア空間の既存の交通シーンを拡張し、正の類似性サンプルを生成する。
論文 参考訳(メタデータ) (2022-11-24T22:52:55Z) - Image Aesthetics Assessment Using Graph Attention Network [17.277954886018353]
画像美学評価のためのグラフニューラルネットワークに基づく2段階のフレームワークを提案する。
まず、入力画像がグラフとしてモデル化され、元のアスペクト比と解像度を維持する特徴グラフ表現を提案する。
次に,この特徴グラフを用いて,視覚的注意を用いて入力画像の異なる領域間の意味的関係をキャプチャするグラフニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-26T12:52:46Z) - BI-GCN: Boundary-Aware Input-Dependent Graph Convolution Network for
Biomedical Image Segmentation [21.912509900254364]
セグメント化タスクにグラフ畳み込みを適用し,改良されたtextitLaplacianを提案する。
本手法は,大腸内視鏡像におけるポリープの分画と光ディスク,光カップのカラーファンドス画像における画期的なアプローチよりも優れていた。
論文 参考訳(メタデータ) (2021-10-27T21:12:27Z) - Modelling Neighbor Relation in Joint Space-Time Graph for Video
Correspondence Learning [53.74240452117145]
本稿では、ラベルなしビデオから信頼できる視覚対応を学習するための自己教師付き手法を提案する。
接続時空間グラフでは,ノードがフレームからサンプリングされたグリッドパッチであり,2種類のエッジによってリンクされる。
学習した表現は、様々な視覚的タスクにおいて最先端の自己監督手法よりも優れています。
論文 参考訳(メタデータ) (2021-09-28T05:40:01Z) - Enhancing Social Relation Inference with Concise Interaction Graph and
Discriminative Scene Representation [56.25878966006678]
我々はtextbfSocial rtextbfElation (PRISE) における textbfPractical textbfInference のアプローチを提案する。
人の対話的特徴と全体主義的な場面の識別的特徴を簡潔に学習する。
PRISEはPIPAデータセットにおけるドメイン分類の改善を6.8$%で達成している。
論文 参考訳(メタデータ) (2021-07-30T04:20:13Z) - Disentangled Motif-aware Graph Learning for Phrase Grounding [48.64279161780489]
画像中のフレーズ接地のための新しいグラフ学習フレームワークを提案する。
モチーフを認識した文脈情報を表現に組み込むために,不連続グラフネットワークを考案する。
私たちのモデルはFlickr30K EntitiesとReferIt Gameベンチマークで最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-04-13T08:20:07Z) - Spatial-spectral Hyperspectral Image Classification via Multiple Random
Anchor Graphs Ensemble Learning [88.60285937702304]
本稿では,複数のランダムアンカーグラフアンサンブル学習(RAGE)を用いた空間スペクトルHSI分類手法を提案する。
まず、各選択されたバンドのより記述的な特徴を抽出し、局所的な構造と領域の微妙な変化を保存するローカルバイナリパターンを採用する。
次に,アンカーグラフの構成に適応隣接代入を導入し,計算複雑性を低減した。
論文 参考訳(メタデータ) (2021-03-25T09:31:41Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。