論文の概要: Wireless Dataset Similarity: Measuring Distances in Supervised and Unsupervised Machine Learning
- arxiv url: http://arxiv.org/abs/2601.01023v1
- Date: Sat, 03 Jan 2026 01:15:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.948319
- Title: Wireless Dataset Similarity: Measuring Distances in Supervised and Unsupervised Machine Learning
- Title(参考訳): 無線データセットの類似性:監視・教師なし機械学習における距離の測定
- Authors: João Morais, Sadjad Alikhani, Akshay Malhotra, Shahab Hamidi-Rad, Ahmed Alkhateeb,
- Abstract要約: 本稿では,無線データセット間の類似度を測定するためのタスク・アンド・モデル対応フレームワークを提案する。
データセットの選択/拡張、シミュレーション・トゥ・リアル(sim2real)比較、新しいデプロイメントへのモデルトレーニング/適応に関する決定などのアプリケーションを可能にする。
- 参考スコア(独自算出の注目度): 15.036550722400085
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a task- and model-aware framework for measuring similarity between wireless datasets, enabling applications such as dataset selection/augmentation, simulation-to-real (sim2real) comparison, task-specific synthetic data generation, and informing decisions on model training/adaptation to new deployments. We evaluate candidate dataset distance metrics by how well they predict cross-dataset transferability: if two datasets have a small distance, a model trained on one should perform well on the other. We apply the framework on an unsupervised task, channel state information (CSI) compression, using autoencoders. Using metrics based on UMAP embeddings, combined with Wasserstein and Euclidean distances, we achieve Pearson correlations exceeding 0.85 between dataset distances and train-on-one/test-on-another task performance. We also apply the framework to a supervised beam prediction in the downlink using convolutional neural networks. For this task, we derive a label-aware distance by integrating supervised UMAP and penalties for dataset imbalance. Across both tasks, the resulting distances outperform traditional baselines and consistently exhibit stronger correlations with model transferability, supporting task-relevant comparisons between wireless datasets.
- Abstract(参考訳): 本稿では、無線データセット間の類似度を測定するためのタスク・アンド・モデル対応フレームワークを紹介し、データセットの選択・拡張、シミュレーション・トゥ・リアル(シム2リアル)比較、タスク固有の合成データ生成、新しいデプロイメントへのモデルトレーニング・適応に関する決定の報知などの応用を可能にする。
2つのデータセットが小さな距離を持つ場合、一方で訓練されたモデルが他方でうまく機能するべきである。
自動エンコーダを用いて、教師なしタスク、チャネル状態情報(CSI)圧縮にフレームワークを適用する。
UMAP埋め込みに基づくメトリクスと、ワッサーシュタインとユークリッド距離を組み合わせることで、データセット距離とトレーニング・オン・ワン/テスト・オン・アン・タスク性能の0.85以上のPearson相関が得られる。
また、このフレームワークを畳み込みニューラルネットワークを用いたダウンリンクにおける教師ありビーム予測に適用する。
そこで本研究では,教師付きUMAPと,データセットの不均衡に対する罰則を統合することで,ラベル認識距離を導出する。
両方のタスクにおいて、結果として得られる距離は従来のベースラインより優れ、一貫してモデル転送可能性との強い相関を示し、無線データセット間のタスク関連比較をサポートする。
関連論文リスト
- Cross-Learning from Scarce Data via Multi-Task Constrained Optimization [70.90607489166648]
本稿では,データ不足を克服するマルチタスク・エンフクロス学習フレームワークを提案する。
我々はこの結合推定を制約付き最適化問題として定式化する。
本研究では, 画像分類や伝染病の伝播を含む実データを用いて, クロスラーニング手法の有効性を示す。
論文 参考訳(メタデータ) (2025-11-17T18:35:59Z) - Detect Anything via Next Point Prediction [51.55967987350882]
Rex-Omniは最先端の物体認識性能を実現する3BスケールのMLLMである。
COCOやLVISのようなベンチマークでは、Rex-Omniは回帰ベースのモデルに匹敵するパフォーマンスを得る。
論文 参考訳(メタデータ) (2025-10-14T17:59:54Z) - What is the Right Notion of Distance between Predict-then-Optimize Tasks? [35.842182348661076]
OTD$3$は、機能やラベルに加えて下流の決定を組み込んだ、新しいデータセット距離である。
提案した距離は,3つの予測列最適化タスク間でのモデル伝達可能性を正確に予測できることを示す。
論文 参考訳(メタデータ) (2024-09-11T04:13:17Z) - Cross-domain Learning Framework for Tracking Users in RIS-aided Multi-band ISAC Systems with Sparse Labeled Data [55.70071704247794]
統合センシング・通信(ISAC)は6G通信において重要であり、再構成可能なインテリジェントサーフェス(RIS)の急速な発展によって促進される
本稿では,複数の帯域にまたがるマルチモーダルCSIインジケータを協調的に活用し,クロスドメイン方式で追跡機能をモデル化するX2Trackフレームワークを提案する。
X2Trackの下では、トランスフォーマーニューラルネットワークと逆学習技術に基づいて、トラッキングエラーを最小限に抑える効率的なディープラーニングアルゴリズムを設計する。
論文 参考訳(メタデータ) (2024-05-10T08:04:27Z) - Improving Transferability for Cross-domain Trajectory Prediction via
Neural Stochastic Differential Equation [41.09061877498741]
外部要因とデータ取得戦略によるデータセット間での相違がある。
大規模データセットでトレーニングされたモデルの熟練した性能は、他の小規模データセットでの転送可能性に制限がある。
本稿では,ニューラル微分方程式(NSDE)の連続的利用に基づく不一致の緩和手法を提案する。
提案手法の有効性は,一般的なベンチマークデータセットであるnuScenes,Argoverse,Lyft,InterinterAction,Open Motionデータセット上で,最先端の軌道予測モデルに対して検証される。
論文 参考訳(メタデータ) (2023-12-26T06:50:29Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Collaborative Learning with a Drone Orchestrator [79.75113006257872]
インテリジェントな無線デバイス群は、ドローンの助けを借りて共有ニューラルネットワークモデルを訓練する。
提案したフレームワークは,トレーニングの大幅な高速化を実現し,ドローンホバリング時間の平均24%と87%の削減を実現している。
論文 参考訳(メタデータ) (2023-03-03T23:46:25Z) - Wasserstein Task Embedding for Measuring Task Similarities [14.095478018850374]
異なるタスク間の類似度を測定することは、幅広い機械学習問題において重要である。
最適輸送理論を活用し、教師付き分類のための新しいタスク埋め込みを定義する。
提案手法の組込みは, 関連する手法と比較して, タスクの比較を著しく高速化することを示した。
論文 参考訳(メタデータ) (2022-08-24T18:11:04Z) - Geometric Dataset Distances via Optimal Transport [15.153110906331733]
本稿では, (i) モデルに依存しない, (ii) トレーニングを伴わない, (iii) ラベル集合が完全に不連結であり, (iv) 理論的な足場が固い場合でも, データセットを比較できる,という,データセット間の距離の代替概念を提案する。
この距離は最適な輸送に依存しており、リッチな幾何学的認識、解釈可能な対応およびよく理解された性質を提供する。
以上の結果から,この新たな距離は,データセットの有意義な比較を提供し,様々な実験環境やデータセット間での伝達学習困難度と相関関係があることが示唆された。
論文 参考訳(メタデータ) (2020-02-07T17:51:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。