論文の概要: Stop Preaching and Start Practising Data Frugality for Responsible Development of AI
- arxiv url: http://arxiv.org/abs/2602.19789v1
- Date: Mon, 23 Feb 2026 12:46:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.814719
- Title: Stop Preaching and Start Practising Data Frugality for Responsible Development of AI
- Title(参考訳): 責任あるAI開発のためのデータフルガリティの予見と実践の停止
- Authors: Sophia N. Wilson, Guðrún Fjóla Guðmundsdóttir, Andrew Millard, Raghavendra Selvan, Sebastian Mair,
- Abstract要約: このポジションペーパーでは、機械学習コミュニティは、AI開発に責任を持つために、説教から実践へと移行しなければならない、と論じている。
我々は、ImageNet-1Kの下流でのエネルギー利用と炭素排出量を推定する。
次に,データフレジャリティが実用的かつ有益であることを示す実証的証拠を提示し,コアセットベースのサブセット選択により,精度を損なうことなくトレーニングエネルギー消費量を大幅に削減できるとともに,データセットバイアスを軽減できることを示した。
- 参考スコア(独自算出の注目度): 5.138012450471437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This position paper argues that the machine learning community must move from preaching to practising data frugality for responsible artificial intelligence (AI) development. For long, progress has been equated with ever-larger datasets, driving remarkable advances but now yielding increasingly diminishing performance gains alongside rising energy use and carbon emissions. While awareness of data frugal approaches has grown, their adoption has remained rhetorical, and data scaling continues to dominate development practice. We argue that this gap between preach and practice must be closed, as continued data scaling entails substantial and under-accounted environmental impacts. To ground our position, we provide indicative estimates of the energy use and carbon emissions associated with the downstream use of ImageNet-1K. We then present empirical evidence that data frugality is both practical and beneficial, demonstrating that coreset-based subset selection can substantially reduce training energy consumption with little loss in accuracy, while also mitigating dataset bias. Finally, we outline actionable recommendations for moving data frugality from rhetorical preach to concrete practice for responsible development of AI.
- Abstract(参考訳): このポジションペーパーでは、機械学習コミュニティは、人工知能(AI)開発に責任を負うために、説教から実践的なデータ実践へと移行しなければならないと論じている。
長い間、進歩はずっと大きなデータセットに匹敵し、目覚ましい進歩を導いてきたが、今ではエネルギー消費の増加や二酸化炭素排出量の増加とともに、パフォーマンスの上昇がますます減少している。
データフリガルアプローチに対する認識は高まっているが、その採用は修辞的であり、データスケーリングが開発プラクティスを支配し続けている。
我々は、この説教と実践のギャップは、継続するデータスケーリングが実質的かつ過小評価される環境への影響を伴うため、閉鎖されなければならないと論じる。
そこで我々は,ImageNet-1Kの下流利用に伴うエネルギー利用と炭素排出量の指標推定を行った。
次に,データフレジャリティが実用的かつ有益であることを示す実証的証拠を提示し,コアセットベースのサブセット選択により,精度を損なうことなくトレーニングエネルギー消費量を大幅に削減できるとともに,データセットバイアスを軽減できることを示した。
最後に、修辞的な説教から、AIの責任ある開発のための具体的な実践へ、データの虚偽性を動かすための実行可能な推奨事項を概説する。
関連論文リスト
- On the Dangers of Bootstrapping Generation for Continual Learning and Beyond [8.530455607001828]
本稿では,合成データが学習目的に有意なバイアスやばらつきをもたらすことを示す統計分析を行った。
この劣化を定量化し、最先端のGER法が潜在空間におけるアライメントを維持できないことを示す。
論文 参考訳(メタデータ) (2025-12-05T15:16:30Z) - Learning More with Less: A Generalizable, Self-Supervised Framework for Privacy-Preserving Capacity Estimation with EV Charging Data [84.37348569981307]
自己教師付き事前学習に基づく第一種能力推定モデルを提案する。
我々のモデルは一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-10-05T08:58:35Z) - Misinformation by Omission: The Need for More Environmental Transparency in AI [9.456892974946884]
我々は、AIの環境影響に関する一般の理解を形作る神話と誤解を探求する。
我々は、誤解を明確にし、これらの害を緩和する上で、データの透明性の重要性について論じる。
論文 参考訳(メタデータ) (2025-06-18T15:49:22Z) - Responsible Data Stewardship: Generative AI and the Digital Waste Problem [0.0]
生成AIシステムは、テキスト、画像、オーディオ、ビデオモダリティにまたがる、前例のない合成データの生成レベルを可能にする。
デジタルムダ(Digital waste)とは、特定の目的(あるいは即時)を果たすことなく、リソースを消費するデータをいう。
本稿では,デジタル廃棄物を(生産的な)AI開発における倫理的命令として導入し,環境の持続可能性を責任あるイノベーションの核として位置づける。
論文 参考訳(メタデータ) (2025-05-27T20:07:22Z) - Breaking Resource Barriers in Speech Emotion Recognition via Data Distillation [64.36799373890916]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす。
モノのインターネットにおけるエッジデバイスの出現は、複雑なディープラーニングモデルを構築する上での課題を示している。
本研究では,IoTアプリケーションにおけるSERモデルの効率的な開発を容易にするためのデータ蒸留フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-21T13:10:46Z) - Transductive Reward Inference on Graph [53.003245457089406]
本稿では,グラフ上の情報伝達の文脈特性に基づく報酬推定手法を提案する。
利用可能なデータと限定的な報酬アノテーションの両方を活用して、報酬伝達グラフを構築します。
構築したグラフをトランスダクティブな報酬推定に使用し,非競合データに対する報酬を推定する。
論文 参考訳(メタデータ) (2024-02-06T03:31:28Z) - Revisiting Plasticity in Visual Reinforcement Learning: Data, Modules and Training Stages [56.98243487769916]
ニューラルネットワークが新しいデータで進化する能力である塑性は、高性能でサンプル効率のよい視覚強化学習に不可欠である。
本稿では,批評家の可塑性レベルに基づいてリプレイ率を動的に調整するAdaptive RRを提案する。
論文 参考訳(メタデータ) (2023-10-11T12:05:34Z) - Data-Centric Green AI: An Exploratory Empirical Study [6.4265933507484]
データ中心のアプローチがAIエネルギー効率に与える影響について検討する。
以上の結果から,データセットの変更を排他的に行うことで,エネルギー消費を大幅に削減できることが示唆された。
我々の研究成果は、グリーンAIをさらに有効化し民主化するためのデータ中心技術に焦点を当てた研究課題である。
論文 参考訳(メタデータ) (2022-04-06T12:22:43Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。