論文の概要: WAIR-D: Wireless AI Research Dataset
- arxiv url: http://arxiv.org/abs/2212.02159v1
- Date: Mon, 5 Dec 2022 10:59:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 19:36:35.104068
- Title: WAIR-D: Wireless AI Research Dataset
- Title(参考訳): WAIR-D: ワイヤレスAI研究データセット
- Authors: Yourui Huangfu and Jian Wang and Shengchen Dai and Rong Li and Jun
Wang and Chongwen Huang and Zhaoyang Zhang
- Abstract要約: 本稿では,2つのシナリオからなる無線AI研究データセット(WAIR-D)について述べる。
シナリオ1は、疎開されたユーザ機器(UE)を備えた10,000の環境を含み、シナリオ2は、密落したUEを備えた100の環境を含む。
トレーニングされたAIモデルが優れた一般化能力を持っていることを保証し、微調整は特定の環境で容易に行うことができる。
- 参考スコア(独自算出の注目度): 20.535443650889825
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is a common sense that datasets with high-quality data samples play an
important role in artificial intelligence (AI), machine learning (ML) and
related studies. However, although AI/ML has been introduced in wireless
researches long time ago, few datasets are commonly used in the research
community. Without a common dataset, AI-based methods proposed for wireless
systems are hard to compare with both the traditional baselines and even each
other. The existing wireless AI researches usually rely on datasets generated
based on statistical models or ray-tracing simulations with limited
environments. The statistical data hinder the trained AI models from further
fine-tuning for a specific scenario, and ray-tracing data with limited
environments lower down the generalization capability of the trained AI models.
In this paper, we present the Wireless AI Research Dataset (WAIR-D)1, which
consists of two scenarios. Scenario 1 contains 10,000 environments with
sparsely dropped user equipments (UEs), and Scenario 2 contains 100
environments with densely dropped UEs. The environments are randomly picked up
from more than 40 cities in the real world map. The large volume of the data
guarantees that the trained AI models enjoy good generalization capability,
while fine-tuning can be easily carried out on a specific chosen environment.
Moreover, both the wireless channels and the corresponding environmental
information are provided in WAIR-D, so that extra-information-aided
communication mechanism can be designed and evaluated. WAIR-D provides the
researchers benchmarks to compare their different designs or reproduce results
of others. In this paper, we show the detailed construction of this dataset and
examples of using it.
- Abstract(参考訳): 高品質なデータサンプルを持つデータセットは、人工知能(AI)、機械学習(ML)、および関連する研究において重要な役割を果たす。
しかし、AI/MLは以前からワイヤレス研究で導入されてきたが、研究コミュニティで一般的に使われているデータセットはほとんどない。
共通のデータセットがなければ、無線システムのために提案されたAIベースの手法は、従来のベースラインと、さらには相互に比較することが難しい。
既存のワイヤレスAI研究は通常、限られた環境で統計モデルやレイトレーシングシミュレーションに基づいて生成されたデータセットに依存している。
統計データは、トレーニングされたAIモデルを特定のシナリオのさらなる微調整から妨げ、限られた環境を持つレイトレーシングデータは、トレーニングされたAIモデルの一般化能力を低下させる。
本稿では,2つのシナリオからなる無線AI研究データセット(WAIR-D)について述べる。
シナリオ1は、疎開されたユーザ機器(UE)を備えた10,000の環境を含み、シナリオ2は、密落したUEを備えた100の環境を含む。
環境は、現実世界の地図で40以上の都市からランダムに拾い上げられている。
トレーニングされたAIモデルが優れた一般化能力を持っていることを保証し、微調整は特定の環境で容易に行うことができる。
さらに、無線チャネルと対応する環境情報の両方をWAIR-Dで提供し、外部情報支援通信機構を設計・評価することができる。
WAIR-Dは、研究者のベンチマークで異なるデザインを比較したり、他の人の結果を再現する。
本稿では,このデータセットの詳細な構成と使用例を示す。
関連論文リスト
- Multimodal Dataset from Harsh Sub-Terranean Environment with Aerosol
Particles for Frontier Exploration [55.41644538483948]
本稿では, エアロゾル粒子を用いた過酷で非構造的な地下環境からのマルチモーダルデータセットを提案する。
ロボットオペレーティング・システム(ROS)フォーマットのすべてのオンボードセンサーから、同期された生データ計測を含んでいる。
本研究の焦点は、時間的・空間的なデータの多様性を捉えることだけでなく、取得したデータに厳しい条件が及ぼす影響を示すことである。
論文 参考訳(メタデータ) (2023-04-27T20:21:18Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy [2.9005223064604078]
本稿では,自律飛行に適したスケーラブルなAerial Synthetic Data Augmentation (ASDA) フレームワークを提案する。
ASDAは、シーンとデータ拡張を自動的に実行する2つのスクリプト可能なパイプラインを備えた中央データ収集エンジンを拡張している。
多様なデータセットを自動生成する手法の有効性を実証する。
論文 参考訳(メタデータ) (2022-11-10T04:37:41Z) - A Synthetic Dataset for 5G UAV Attacks Based on Observable Network
Parameters [3.468596481227013]
本稿では,5G以降のネットワークにおける無人航空機(UAV)攻撃のための最初の合成データセットを提案する。
このデータの主な目的は、UAV通信セキュリティのためのディープネットワーク開発を可能にすることである。
提案したデータセットは、都市環境において、静的または移動中のUAV攻撃者が認証されたUAVをターゲットにする際のネットワーク機能に関する洞察を提供する。
論文 参考訳(メタデータ) (2022-11-05T15:12:51Z) - FairGen: Fair Synthetic Data Generation [0.3149883354098941]
本稿では,GANアーキテクチャに依存しないより公平な合成データを生成するパイプラインを提案する。
合成データを生成する場合、ほとんどのGANはトレーニングデータに存在するバイアスを増幅するが、これらのバイアスを誘発するサンプルを除去することで、GANは本質的に真の情報的サンプルに重点を置いている、と我々は主張する。
論文 参考訳(メタデータ) (2022-10-24T08:13:47Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Choose, not Hoard: Information-to-Model Matching for Artificial
Intelligence in O-RAN [8.52291735627073]
Open Radio Access Network (O-RAN) は、ネットワーク基盤要素がオープンで標準化されたインターフェースを介して通信する新興パラダイムである。
重要な要素は、人工知能(AI)ベースのコントローラであるRAN Intelligent Controller(RIC)である。
本稿では、異なるRICにおける複数のAIモデルインスタンスの作成について紹介し、議論し、評価し、トレーニングのためにいくつかの(またはすべての)場所の情報を活用する。
論文 参考訳(メタデータ) (2022-08-01T15:24:27Z) - ProcTHOR: Large-Scale Embodied AI Using Procedural Generation [55.485985317538194]
ProcTHORは、Embodied AI環境の手続き的生成のためのフレームワークである。
ナビゲーション、アレンジメント、アーム操作のための6つの具体化されたAIベンチマークに対して、最先端の結果を実証する。
論文 参考訳(メタデータ) (2022-06-14T17:09:35Z) - Robust Semi-supervised Federated Learning for Images Automatic
Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。
異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。
本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文 参考訳(メタデータ) (2022-01-03T16:49:33Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Federated Visual Classification with Real-World Data Distribution [9.564468846277366]
我々は,FedAvg(Federated Averaging)アルゴリズムのベンチマークを用いて,実世界のデータ分布が分散学習に与える影響を特徴付ける。
種別とランドマーク分類のための2つの新しい大規模データセットを導入し,ユーザ毎のデータ分割を現実的に行う。
また、2つの新しいアルゴリズム(FedVC、FedIR)も開発しています。
論文 参考訳(メタデータ) (2020-03-18T07:55:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。