論文の概要: Multi-modal Data based Semi-Supervised Learning for Vehicle Positioning
- arxiv url: http://arxiv.org/abs/2410.20680v1
- Date: Tue, 15 Oct 2024 15:04:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-03 08:19:27.528581
- Title: Multi-modal Data based Semi-Supervised Learning for Vehicle Positioning
- Title(参考訳): 車両位置決めのためのマルチモーダルデータに基づく半教師付き学習
- Authors: Ouwen Huan, Yang Yang, Tao Luo, Mingzhe Chen,
- Abstract要約: 基地局によって車両位置が決定される屋外位置決めシステムを考える。
事前訓練段階では、画像から得られる方位角をラベルなしCSIデータのラベルとみなす。
下流トレーニング段階では、正確な車両位置をラベルとしてみなす小さなラベル付きデータセットを用いてモデルを再訓練する。
- 参考スコア(独自算出の注目度): 18.798918043936855
- License:
- Abstract: In this paper, a multi-modal data based semi-supervised learning (SSL) framework that jointly use channel state information (CSI) data and RGB images for vehicle positioning is designed. In particular, an outdoor positioning system where the vehicle locations are determined by a base station (BS) is considered. The BS equipped with several cameras can collect a large amount of unlabeled CSI data and a small number of labeled CSI data of vehicles, and the images taken by cameras. Although the collected images contain partial information of vehicles (i.e. azimuth angles of vehicles), the relationship between the unlabeled CSI data and its azimuth angle, and the distances between the BS and the vehicles captured by images are both unknown. Therefore, the images cannot be directly used as the labels of unlabeled CSI data to train a positioning model. To exploit unlabeled CSI data and images, a SSL framework that consists of a pretraining stage and a downstream training stage is proposed. In the pretraining stage, the azimuth angles obtained from the images are considered as the labels of unlabeled CSI data to pretrain the positioning model. In the downstream training stage, a small sized labeled dataset in which the accurate vehicle positions are considered as labels is used to retrain the model. Simulation results show that the proposed method can reduce the positioning error by up to 30% compared to a baseline where the model is not pretrained.
- Abstract(参考訳): 本稿では、チャネル状態情報(CSI)データと車両位置決めのためのRGB画像とを併用したマルチモーダルデータに基づく半教師付き学習(SSL)フレームワークを設計する。
特に、車両位置が基地局(BS)によって決定される屋外位置決めシステムを考える。
複数のカメラを装備したBSは、大量のラベル付きCSIデータと、少数のラベル付きCSIデータと、カメラによって撮影された画像を集めることができる。
収集画像には車両の一部情報(例えば車両の方位角)が含まれているが、ラベルのないCSIデータと方位角の関係と、BSと撮像された車両との距離は両方とも不明である。
そのため、画像はラベルのないCSIデータのラベルとして直接使用できず、位置決めモデルを訓練する。
ラベルのないCSIデータや画像を活用するために,事前学習段階と下流トレーニング段階からなるSSLフレームワークを提案する。
事前学習段階では、画像から得られる方位角をラベルなしのCSIデータのラベルとみなして位置決めモデルを事前訓練する。
下流トレーニング段階では、正確な車両位置をラベルとしてみなす小さなラベル付きデータセットを用いてモデルを再訓練する。
シミュレーションの結果,モデルが事前学習されていないベースラインと比較して,提案手法は位置決め誤差を最大30%低減できることがわかった。
関連論文リスト
- Multi-modal Image and Radio Frequency Fusion for Optimizing Vehicle Positioning [17.246504417591588]
車両位置決めフレームワークは、チャネル状態情報(CSI)と画像と共に車両を共同でローカライズする。
ラベル付きデータセットに重み付き損失関数を導入し,重み付き損失の計算にメタラーニングアルゴリズムを適用した。
シミュレーションの結果,提案手法はベースラインに比べて最大61%の精度で位置決め誤差を低減できることがわかった。
論文 参考訳(メタデータ) (2024-10-15T15:41:12Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - CSP: Self-Supervised Contrastive Spatial Pre-Training for
Geospatial-Visual Representations [90.50864830038202]
ジオタグ付き画像の自己教師型学習フレームワークであるContrastive Spatial Pre-Training(CSP)を提案する。
デュアルエンコーダを用いて画像とその対応する位置情報を別々に符号化し、コントラスト目的を用いて画像から効果的な位置表現を学習する。
CSPは、様々なラベル付きトレーニングデータサンプリング比と10~34%の相対的な改善で、モデル性能を大幅に向上させる。
論文 参考訳(メタデータ) (2023-05-01T23:11:18Z) - A Fine-Grained Vehicle Detection (FGVD) Dataset for Unconstrained Roads [29.09167268252761]
本研究では,自動車に搭載された移動カメラから捉えた,野生におけるファイングラインド車両検出データセットについて紹介する。
シーンイメージは5502枚あり、3レベル階層に整理された複数の車両の210個の細粒度ラベルがある。
以前の分類データセットには、さまざまな種類の車も含まれていたが、FGVDデータセットでは、二輪車、オートリックショー、トラックを分類するための新しいクラスラベルが導入されている。
論文 参考訳(メタデータ) (2022-12-30T06:50:15Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - Prefix Conditioning Unifies Language and Label Supervision [84.11127588805138]
学習した表現の一般化性を低減することにより,データセットのバイアスが事前学習に悪影響を及ぼすことを示す。
実験では、この単純な手法により、ゼロショット画像認識精度が向上し、画像レベルの分布シフトに対するロバスト性が向上することを示した。
論文 参考訳(メタデータ) (2022-06-02T16:12:26Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - TICaM: A Time-of-flight In-car Cabin Monitoring Dataset [10.845284058153837]
TICaMは、単一の広角深度カメラを使用して車両内部の監視のための飛行中キャビンモニタリングデータセットです。
運転中の動作の総括的リストを記録し,マルチモーダルなラベル付き画像を提供する。
実際の記録に加えて,同種の画像とアノテーションを用いた車内キャビン画像の合成データセットを提供する。
論文 参考訳(メタデータ) (2021-03-22T10:48:45Z) - Identifying Mislabeled Images in Supervised Learning Utilizing
Autoencoder [0.0]
画像分類において、不正確なラベルは、分類モデルも不正確なものとなる可能性がある。
本稿では,分類ネットワークをトレーニングする前に,教師なしの手法をトレーニングデータに適用する。
このアルゴリズムは実験データセットの67%以上の不正ラベル付きデータを検出および削除することができる。
論文 参考訳(メタデータ) (2020-11-07T03:09:34Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - Vehicle Position Estimation with Aerial Imagery from Unmanned Aerial
Vehicles [4.555256739812733]
この研究は、航空画像から正確な車両の位置を推定する過程を記述する。
この目的のために最先端のディープニューラルネットワークMask-RCNNが適用される。
平均20cmの精度は、飛行高度100m、フルHD解像度、フレーム単位の検出で達成できる。
論文 参考訳(メタデータ) (2020-04-17T12:29:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。