論文の概要: Scalable Self-Supervised Representation Learning from Spatiotemporal
Motion Trajectories for Multimodal Computer Vision
- arxiv url: http://arxiv.org/abs/2210.03289v1
- Date: Fri, 7 Oct 2022 02:41:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-10 12:40:26.905746
- Title: Scalable Self-Supervised Representation Learning from Spatiotemporal
Motion Trajectories for Multimodal Computer Vision
- Title(参考訳): 多モードコンピュータビジョンのための時空間運動軌跡からのスケーラブルな自己教師あり表現学習
- Authors: Swetava Ganguli, C. V. Krishnakumar Iyer, Vipul Pandey
- Abstract要約: 本稿では,GPSトラジェクトリから地理的位置の表現を学習するための自己教師付きラベルなし手法を提案する。
到達可能性埋め込みは意味論的に意味のある表現であり,精度・リコール曲線(AUPRC)測定値の領域を用いて測定すると,性能が4~23%向上することを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Self-supervised representation learning techniques utilize large datasets
without semantic annotations to learn meaningful, universal features that can
be conveniently transferred to solve a wide variety of downstream supervised
tasks. In this work, we propose a self-supervised method for learning
representations of geographic locations from unlabeled GPS trajectories to
solve downstream geospatial computer vision tasks. Tiles resulting from a
raster representation of the earth's surface are modeled as nodes on a graph or
pixels of an image. GPS trajectories are modeled as allowed Markovian paths on
these nodes. A scalable and distributed algorithm is presented to compute
image-like representations, called reachability summaries, of the spatial
connectivity patterns between tiles and their neighbors implied by the observed
Markovian paths. A convolutional, contractive autoencoder is trained to learn
compressed representations, called reachability embeddings, of reachability
summaries for every tile. Reachability embeddings serve as task-agnostic,
feature representations of geographic locations. Using reachability embeddings
as pixel representations for five different downstream geospatial tasks, cast
as supervised semantic segmentation problems, we quantitatively demonstrate
that reachability embeddings are semantically meaningful representations and
result in 4-23% gain in performance, as measured using area under the
precision-recall curve (AUPRC) metric, when compared to baseline models that
use pixel representations that do not account for the spatial connectivity
between tiles. Reachability embeddings transform sequential, spatiotemporal
mobility data into semantically meaningful tensor representations that can be
combined with other sources of imagery and are designed to facilitate
multimodal learning in geospatial computer vision.
- Abstract(参考訳): 自己教師付き表現学習技術は意味的アノテーションを使わずに大規模なデータセットを用いて意味のある普遍的な特徴を学習する。
本研究では,下流の地理空間コンピュータビジョンタスクを解決するために,ラベルのないGPS軌道から地理的位置の表現を学習するための自己教師付き手法を提案する。
地球表面のラスタ表現から生じるタイルは、画像のグラフまたはピクセル上のノードとしてモデル化される。
GPS軌道はこれらのノード上で許容されるマルコフ経路としてモデル化される。
拡張性のある分散アルゴリズムは、観測されたマルコフ経路によって暗示されるタイルとその隣人間の空間的接続パターンの到達可能性要約と呼ばれるイメージライクな表現を計算する。
畳み込み型契約型オートエンコーダは、各タイルの到達可能性サマリーの到達可能性埋め込みと呼ばれる圧縮表現を学ぶために訓練される。
到達可能性埋め込みは、地理的位置のタスクに依存しない特徴表現として機能する。
5つの異なる下流の空間的タスクのピクセル表現としての到達可能性埋め込みを用いて、タイル間の空間的接続を考慮しないピクセル表現を用いたベースラインモデルと比較して、到達可能性埋め込みは意味的に意味のある表現であり、auprc(precision-recall curve)メトリックの下の領域で測定されるように、パフォーマンスが4-23%向上することを示す。
到達可能性埋め込みは、シーケンシャルで時空間的なモビリティデータを意味的に意味のあるテンソル表現に変換し、他の画像ソースと組み合わせることができ、地理空間コンピュータビジョンにおけるマルチモーダル学習を容易にするように設計されている。
関連論文リスト
- Context-Enhanced Multi-View Trajectory Representation Learning: Bridging the Gap through Self-Supervised Models [27.316692263196277]
MVTrajは、軌道表現学習のための新しい多視点モデリング手法である。
GPSから道路網、関心点まで多様な文脈知識を統合し、軌跡データのより包括的な理解を提供する。
実世界のデータセットに対する大規模な実験により、MVTrajは様々な空間ビューに関連するタスクにおいて、既存のベースラインを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-10-17T03:56:12Z) - Temporal Embeddings: Scalable Self-Supervised Temporal Representation
Learning from Spatiotemporal Data for Multimodal Computer Vision [1.4127889233510498]
移動活動時系列に基づいて景観を階層化する新しい手法を提案する。
ピクセルワイズ埋め込みは、タスクベースのマルチモーダルモデリングに使用できるイメージライクなチャネルに変換される。
論文 参考訳(メタデータ) (2023-10-16T02:53:29Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - DenseGAP: Graph-Structured Dense Correspondence Learning with Anchor
Points [15.953570826460869]
2つの画像間の密接な対応を確立することは、基本的なコンピュータビジョンの問題である。
我々は、アンカーポイントに条件付きグラフ構造化ニューラルネットワークを用いたDense対応学習のための新しいソリューションであるDenseGAPを紹介する。
提案手法は,ほとんどのベンチマークにおいて対応学習の最先端化を図っている。
論文 参考訳(メタデータ) (2021-12-13T18:59:30Z) - Reachability Embeddings: Scalable Self-Supervised Representation
Learning from Markovian Trajectories for Geospatial Computer Vision [0.0]
ラベルのないGPSトラジェクトリから地理的位置の表現を学習するための自己教師付き手法を提案する。
スケーラブルで分散されたアルゴリズムは、リーチビリティ・サマリーと呼ばれるイメージライクな表現を計算するために提示される。
到達可能性埋め込みは意味的に意味のある表現であり、結果として性能が4~23%向上することを示す。
論文 参考訳(メタデータ) (2021-10-24T20:10:22Z) - Spatial-Temporal Correlation and Topology Learning for Person
Re-Identification in Videos [78.45050529204701]
クロススケール空間時空間相関をモデル化し, 識別的, 堅牢な表現を追求する新しい枠組みを提案する。
CTLはCNNバックボーンとキーポイント推定器を使用して人体から意味的局所的特徴を抽出する。
グローバルな文脈情報と人体の物理的接続の両方を考慮して、多スケールグラフを構築するためのコンテキスト強化トポロジーを探求する。
論文 参考訳(メタデータ) (2021-04-15T14:32:12Z) - Geography-Aware Self-Supervised Learning [79.4009241781968]
異なる特徴により、標準ベンチマークにおけるコントラスト学習と教師あり学習の間には、非自明なギャップが持続していることが示される。
本稿では,リモートセンシングデータの空間的整合性を利用した新しいトレーニング手法を提案する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションにおけるコントラスト学習と教師あり学習のギャップを埋めるものである。
論文 参考訳(メタデータ) (2020-11-19T17:29:13Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z) - Weakly-Supervised Semantic Segmentation by Iterative Affinity Learning [86.45526827323954]
弱教師付きセマンティックセグメンテーションは、トレーニングのためにピクセル単位のラベル情報が提供されないため、難しい課題である。
このようなペア関係を学習するための反復アルゴリズムを提案する。
本稿では,提案アルゴリズムが最先端手法に対して好適に動作することを示す。
論文 参考訳(メタデータ) (2020-02-19T10:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。