論文の概要: VOMTC: Vision Objects for Millimeter and Terahertz Communications
- arxiv url: http://arxiv.org/abs/2409.09330v1
- Date: Sat, 14 Sep 2024 06:18:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 21:19:23.551563
- Title: VOMTC: Vision Objects for Millimeter and Terahertz Communications
- Title(参考訳): VOMTC:ミリ・テラヘルツ通信のための視覚オブジェクト
- Authors: Sunwoo Kim, Yongjun Ahn, Daeyoung Park, Byonghyo Shim,
- Abstract要約: ミリ・テラヘルツ通信(VOMTC)のための視覚オブジェクトと呼ばれる大規模視覚データセットを提案する。
VOMTCデータセットは、ベースステーション(BS)に取り付けられたカメラから得られた20,232対のRGBと奥行き画像からなる。
VOMTC訓練対象検出器を用いたビームフォーミング技術は,従来のビームフォーミング技術より優れていることを示す。
- 参考スコア(独自算出の注目度): 29.670122146586614
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in sensing and computer vision (CV) technologies have opened the door for the application of deep learning (DL)-based CV technologies in the realm of 6G wireless communications. For the successful application of this emerging technology, it is crucial to have a qualified vision dataset tailored for wireless applications (e.g., RGB images containing wireless devices such as laptops and cell phones). An aim of this paper is to propose a large-scale vision dataset referred to as Vision Objects for Millimeter and Terahertz Communications (VOMTC). The VOMTC dataset consists of 20,232 pairs of RGB and depth images obtained from a camera attached to the base station (BS), with each pair labeled with three representative object categories (person, cell phone, and laptop) and bounding boxes of the objects. Through experimental studies of the VOMTC datasets, we show that the beamforming technique exploiting the VOMTC-trained object detector outperforms conventional beamforming techniques.
- Abstract(参考訳): 近年のセンサーとコンピュータビジョン(CV)技術は、6G無線通信の領域において、ディープラーニング(DL)ベースのCV技術の適用の扉を開いた。
この新興技術の応用が成功するためには、無線アプリケーション(例えば、ラップトップや携帯電話などの無線デバイスを含むRGB画像)に適した、資格あるビジョンデータセットを持つことが不可欠である。
本研究の目的は、ミリメートル・テラヘルツ通信(VOMTC)のための視覚オブジェクトと呼ばれる大規模視覚データセットを提案することである。
VOMTCデータセットは、ベースステーション(BS)に取り付けられたカメラから得られた20,232対のRGBと深度画像で構成され、それぞれに3つの代表的なオブジェクトカテゴリ(人、携帯電話、ラップトップ)とオブジェクトのバウンディングボックスをラベル付けする。
VOMTCデータセットの実験的研究を通じて、VOMTC訓練対象検出器を利用したビームフォーミング技術が従来のビームフォーミング技術より優れていることを示す。
関連論文リスト
- PCB-Vision: A Multiscene RGB-Hyperspectral Benchmark Dataset of Printed
Circuit Boards [11.658030498915535]
PCB-Vision」はRGB-ハイパースペクトルプリント基板(PCB)ベンチマークデータセットであり、53枚の高分解能画像とそれに対応する高分解能ハイパースペクトルデータ立方体を可視・近赤外域(VNIR)の範囲で組み合わせた。
提案したデータセットについて,U-Net,Atention U-Net,Residual U-Net,LinkNet,DeepLabv3+など,いくつかの最先端(SOTA)モデルのパフォーマンスとともに,広範な統計的調査を行った。
論文 参考訳(メタデータ) (2024-01-12T12:00:26Z) - Federated Multi-View Synthesizing for Metaverse [52.59476179535153]
メタバースは没入型エンターテイメント、教育、ビジネスアプリケーションを提供すると期待されている。
無線ネットワーク上のバーチャルリアリティ(VR)伝送は、データと計算集約である。
我々は,メタバースにおける無線コンテンツ配信のために,効率的な合成,記憶,通信資源を提供する,新しい多視点合成フレームワークを開発した。
論文 参考訳(メタデータ) (2023-12-18T13:51:56Z) - Multi-Modal Dataset Acquisition for Photometrically Challenging Object [56.30027922063559]
本稿では,3次元視覚タスクにおける現在のデータセットの限界について,精度,サイズ,リアリズム,および光度に挑戦する対象に対する適切な画像モダリティの観点から検討する。
既存の3次元認識と6次元オブジェクトポーズデータセットを強化する新しいアノテーションと取得パイプラインを提案する。
論文 参考訳(メタデータ) (2023-08-21T10:38:32Z) - Vehicle Cameras Guide mmWave Beams: Approach and Real-World V2V
Demonstration [13.117333069558812]
ミリ波(mmWave)とテラヘルツ(THz)の細いビームの正確な整列は、5Gの信頼性と高いデータレートを満足し、無線通信システムを超えたものに不可欠である。
車両に装着した360度カメラの画像を用いて将来のビームを予測するための,V2Vシナリオのためのディープラーニングソリューションを開発した。
論文 参考訳(メタデータ) (2023-08-20T20:43:11Z) - DensePose From WiFi [86.61881052177228]
WiFi信号の位相と振幅を24のヒト領域内の紫外線座標にマッピングするディープニューラルネットワークを開発した。
本モデルでは,複数の被験者の密集したポーズを,画像に基づくアプローチと同等の性能で推定することができる。
論文 参考訳(メタデータ) (2022-12-31T16:48:43Z) - A Strong Transfer Baseline for RGB-D Fusion in Vision Transformers [0.0]
単視点3Dオブジェクト認識のためのRGB-Dドメインで事前学習したViTを転送するためのレシピを提案する。
我々の適応したViTsは、ワシントン州で95.1%の精度で評価され、このベンチマークで新しい最先端の結果が得られた。
論文 参考訳(メタデータ) (2022-10-03T12:08:09Z) - Global Context Vision Transformers [78.5346173956383]
我々は,コンピュータビジョンのパラメータと計算利用を向上する新しいアーキテクチャであるGC ViT(Global context vision transformer)を提案する。
本稿では,ViTにおける帰納バイアスの欠如に対処し,アーキテクチャにおける可溶性逆残差ブロックを改良して活用することを提案する。
提案したGC ViTは,画像分類,オブジェクト検出,セマンティックセマンティックセグメンテーションタスクにまたがる最先端の処理結果を実現する。
論文 参考訳(メタデータ) (2022-06-20T18:42:44Z) - A Survey on RGB-D Datasets [69.73803123972297]
本稿では,深度情報を含む画像データセットをレビューし,分類した。
アクセス可能なデータを含む203のデータセットを収集し、それらをシーン/オブジェクト、ボディ、医療の3つのカテゴリに分類しました。
論文 参考訳(メタデータ) (2022-01-15T05:35:19Z) - Network-Aware 5G Edge Computing for Object Detection: Augmenting
Wearables to "See'' More, Farther and Faster [18.901994926291465]
本稿では,VIS4IONと呼ばれる強力なスマートウェアラブルにおいて,物体検出のための5G無線オフロードの詳細なシミュレーションと評価を行う。
現行のVIS4IONシステムは、高解像度カメラ、視覚処理、触覚とオーディオのフィードバックを備えた電子ブックバッグである。
本稿では,カメラデータをモバイルエッジクラウドにアップロードして,リアルタイムなオブジェクト検出と検出結果をウェアラブルに送信することを検討する。
論文 参考訳(メタデータ) (2021-12-25T07:09:00Z) - Applying Deep-Learning-Based Computer Vision to Wireless Communications:
Methodologies, Opportunities, and Challenges [100.45137961106069]
ディープラーニング(DL)はコンピュータビジョン(CV)分野で大きな成功を収めている。
本稿では,無線通信におけるDLベースのCVの適用について紹介する。
論文 参考訳(メタデータ) (2020-06-10T11:37:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。