論文の概要: On What We Can Learn from Low-Resolution Data
- arxiv url: http://arxiv.org/abs/2605.12168v1
- Date: Tue, 12 May 2026 14:16:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.911712
- Title: On What We Can Learn from Low-Resolution Data
- Title(参考訳): 低解像度データから何が学べるか
- Authors: Theresa Dahl Frehr, Niels Henrik Pontoppidan, Hiba Nassar, Tommy Sonne Alstrøm,
- Abstract要約: 小型のウェアラブルデバイスは、高解像度データの保存と送信に必要な帯域幅やエネルギー容量が不足している可能性がある。
その結果、異なるソースから収集されたデータセットは、高解像度と低解像度のサンプルの混合からなり得る。
我々は,データポイントの影響が分解能によってどのように変化するかを特徴付ける,Kulback-Leiblerの発散に基づく理論的解析を行う。
我々は、視覚変換器と畳み込みニューラルネットワークの両方を用いて、トレーニングセットに低解像度のデータを追加することで、高解像度データが不足している場合に、一貫して性能を改善することを実証的に実証した。
- 参考スコア(独自算出の注目度): 2.2632495210933135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Artificial intelligence systems typically rely on large, centrally collected datasets, a premise that does not hold in many real-world domains such as healthcare and public institutions. In these settings, data sharing is often constrained by storage, privacy, or resource limitations. For example, small wearable devices may lack the bandwidth or energy capacity needed to store and transmit high-resolution data, leading to aggregation during data collection and thus a loss of information. As a result, datasets collected from different sources may consist of a mixture of high- and low-resolution samples. Despite the prevalence of this setting, it remains unclear how informative low-resolution data is when models are ultimately evaluated on high-resolution inputs. We provide a theoretical analysis based on the Kullback-Leibler divergence that characterises how the influence of a datapoint changes with resolution, and derive bounds that relate the relative contribution of high- and low-resolution observations to the information lost under downsampling. To support this analysis, we empirically demonstrate, using both a vision transformer and a convolutional neural network, that adding low-resolution data to the training set consistently improves performance when high-resolution data is scarce.
- Abstract(参考訳): 人工知能システムは一般的に、医療や公共機関のような現実世界の多くの領域にはない、大規模な、中央集権的なデータセットに依存している。
これらの設定では、データ共有はストレージ、プライバシ、リソース制限によって制限されることが多い。
例えば、小型のウェアラブルデバイスは、高解像度データの保存と送信に必要な帯域幅やエネルギー容量が不足しているため、データ収集中に集約され、情報が失われる可能性がある。
その結果、異なるソースから収集されたデータセットは、高解像度と低解像度のサンプルの混合からなり得る。
この設定の頻度にもかかわらず、高解像度入力でモデルが最終的に評価される場合、低解像度データがどの程度情報的であるかは、いまだ不明である。
我々は,データポイントの影響が解像度とどのように変化するかを特徴付けるKulback-Leibler分散に基づく理論的解析を行い,高分解能および低分解能観測の相対的寄与とダウンサンプリングで失われた情報との相関関係を導出する境界について述べる。
この分析を支援するために、視覚変換器と畳み込みニューラルネットワークの両方を用いて、トレーニングセットに低分解能データを追加することにより、高分解能データが不足している場合の性能が一貫して改善されることを実証的に示す。
関連論文リスト
- GO-GenZip: Goal-Oriented Generative Sampling and Hybrid Compression [50.76941829813458]
現在のネットワークデータテレメトリパイプラインは、複数の分散ソースから中央アグリゲータへの、きめ細かいキーパフォーマンス指標(KPI)の巨大なストリームで構成されている。
本研究は、目標指向の観点からネットワークテレメトリを再設計する、ジェネレーティブAI(GenAI)駆動サンプリングとハイブリッド圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-20T16:33:15Z) - Optimal Transport-based Domain Alignment as a Preprocessing Step for Federated Learning [0.48342038441006796]
Federated Learning(FL)は、機械学習のサブフィールドであり、ローカルデータを中央サーバと共有することを避ける。
FLでは、局所的に訓練されたモデルと不均衡なデータセットを融合させることで、グローバルモデルアグリゲーションの性能が低下する可能性がある。
本稿では,エッジデバイスに沿ったデータの分布差を最小化してデータセットを整列する,最適なトランスポートベースの前処理アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-04T15:35:55Z) - Federated Impression for Learning with Distributed Heterogeneous Data [19.50235109938016]
フェデレートラーニング(FL)は、データを共有することなく、クライアント間で分散データセットから学習できるパラダイムを提供する。
FLでは、データ収集プロトコルや患者人口の多様さにより、異なる保健所のデータに準最適収束が一般的である。
我々は,グローバル情報を表す合成データをフェデレーションとして復元することで,破滅的な忘れを緩和するFedImpresを提案する。
論文 参考訳(メタデータ) (2024-09-11T15:37:52Z) - Analysis and Optimization of Wireless Federated Learning with Data
Heterogeneity [72.85248553787538]
本稿では、データの不均一性を考慮した無線FLの性能解析と最適化と、無線リソース割り当てについて述べる。
ロス関数の最小化問題を、長期エネルギー消費と遅延の制約の下で定式化し、クライアントスケジューリング、リソース割り当て、ローカルトレーニングエポック数(CRE)を共同で最適化する。
実世界のデータセットの実験により、提案アルゴリズムは学習精度とエネルギー消費の点で他のベンチマークよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-04T04:18:01Z) - From Contextual Data to Newsvendor Decisions: On the Actual Performance of Data-Driven Algorithms [8.89658755359509]
本研究では,過去データの価値・品質・量が,文脈的ニューズベンダーの問題を分析することによって,パフォーマンスに与える影響について検討する。
データ駆動型アルゴリズムの性能は、文脈に依存した最悪の最悪の後悔という概念を用いて分析する。
論文 参考訳(メタデータ) (2023-02-16T17:03:39Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Enhancing ensemble learning and transfer learning in multimodal data
analysis by adaptive dimensionality reduction [10.646114896709717]
マルチモーダルデータ分析では、すべての観測が同じレベルの信頼性や情報品質を示すわけではない。
この問題を克服するために,次元削減のための適応的アプローチを提案する。
多様な研究分野で得られたマルチモーダルデータセットのアプローチをテストします。
論文 参考訳(メタデータ) (2021-05-08T11:53:12Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z) - On Robustness and Transferability of Convolutional Neural Networks [147.71743081671508]
現代の深層畳み込みネットワーク(CNN)は、分散シフトの下で一般化しないとしてしばしば批判される。
現代画像分類CNNにおける分布外と転送性能の相互作用を初めて検討した。
トレーニングセットとモデルサイズを増大させることで、分散シフトロバスト性が著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-16T18:39:04Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。