論文の概要: Data-Driven Breakthroughs and Future Directions in AI Infrastructure: A Comprehensive Review
- arxiv url: http://arxiv.org/abs/2505.16771v1
- Date: Thu, 22 May 2025 15:12:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.385108
- Title: Data-Driven Breakthroughs and Future Directions in AI Infrastructure: A Comprehensive Review
- Title(参考訳): AIインフラストラクチャにおけるデータ駆動のブレークスルーと今後の方向性: 総合的なレビュー
- Authors: Beyazit Bestami Yuksel, Ayse Yilmazer Metin,
- Abstract要約: 本稿では,過去15年間の人工知能(AI)の大きなブレークスルーを包括的に合成する。
計算リソース、データアクセス、アルゴリズム革新の収束をトレースすることで、AIの進化における重要なインフレクションポイントを特定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a comprehensive synthesis of major breakthroughs in artificial intelligence (AI) over the past fifteen years, integrating historical, theoretical, and technological perspectives. It identifies key inflection points in AI' s evolution by tracing the convergence of computational resources, data access, and algorithmic innovation. The analysis highlights how researchers enabled GPU based model training, triggered a data centric shift with ImageNet, simplified architectures through the Transformer, and expanded modeling capabilities with the GPT series. Rather than treating these advances as isolated milestones, the paper frames them as indicators of deeper paradigm shifts. By applying concepts from statistical learning theory such as sample complexity and data efficiency, the paper explains how researchers translated breakthroughs into scalable solutions and why the field must now embrace data centric approaches. In response to rising privacy concerns and tightening regulations, the paper evaluates emerging solutions like federated learning, privacy enhancing technologies (PETs), and the data site paradigm, which reframe data access and security. In cases where real world data remains inaccessible, the paper also assesses the utility and constraints of mock and synthetic data generation. By aligning technical insights with evolving data infrastructure, this study offers strategic guidance for future AI research and policy development.
- Abstract(参考訳): 本稿では,過去15年間の人工知能(AI)の大きなブレークスルーを包括的に合成し,歴史的,理論的,技術的視点を統合する。
計算リソース、データアクセス、アルゴリズム革新の収束をトレースすることで、AIの進化における重要なインフレクションポイントを特定する。
この分析では、GPUベースのモデルトレーニングの有効化、ImageNetによるデータ中心シフトの起動、Transformerによるアーキテクチャの簡略化、GPTシリーズによるモデリング機能の拡張などが強調されている。
この論文は、これらの進歩を孤立したマイルストーンとして扱うのではなく、より深いパラダイムシフトの指標として捉えている。
サンプルの複雑さやデータ効率といった統計的学習理論の概念を適用することで、研究者はどのようにしてブレークスルーをスケーラブルなソリューションに翻訳し、なぜこの分野がデータ中心のアプローチを採用する必要があるのかを説明する。
プライバシーの懸念の高まりと規制の厳格化に対応して、フェデレーションラーニング、プライバシ向上技術(PET)、データアクセスとセキュリティを再構築するデータサイトのパラダイムといった、新たなソリューションを評価する。
実世界のデータがアクセス不能な場合、モックデータと合成データ生成の利便性と制約も評価する。
この研究は、技術的な洞察を進化するデータインフラストラクチャと整合させることで、将来のAI研究と政策開発のための戦略的ガイダンスを提供する。
関連論文リスト
- Rethinking Data Protection in the (Generative) Artificial Intelligence Era [115.71019708491386]
現代の(生産的な)AIモデルやシステムに生じる多様な保護ニーズを捉える4段階の分類法を提案する。
当社のフレームワークは、データユーティリティとコントロールのトレードオフに関する構造化された理解を提供し、AIパイプライン全体にわたっています。
論文 参考訳(メタデータ) (2025-07-03T02:45:51Z) - DeepInnovation AI: A Global Dataset Mapping the AI innovation from Academic Research to Industrial Patents [2.8191246153416243]
DeepInnovationAIは3つの構造化ファイルを含む包括的なグローバルデータセットである。
DeepInnovationAIは、研究者、政策立案者、業界リーダーがトレンドを予測し、コラボレーションの機会を特定することを可能にする。
論文 参考訳(メタデータ) (2025-03-12T10:56:02Z) - Empowering Edge Intelligence: A Comprehensive Survey on On-Device AI Models [16.16798813072285]
人工知能(AI)技術の急速な進歩により、エッジと端末デバイスへのAIモデルの展開が増加している。
この調査は、オンデバイスAIモデルの現状、技術的な課題、今後のトレンドを包括的に調査する。
論文 参考訳(メタデータ) (2025-03-08T02:59:51Z) - CS-PaperSum: A Large-Scale Dataset of AI-Generated Summaries for Scientific Papers [3.929864777332447]
CS-PaperSumは、31の上位コンピュータサイエンスカンファレンスから91,919件の大規模データセットである。
我々のデータセットは、自動文献分析、研究トレンド予測、AIによる科学的発見を可能にする。
論文 参考訳(メタデータ) (2025-02-27T22:48:35Z) - Deep Learning, Machine Learning, Advancing Big Data Analytics and Management [26.911181864764117]
人工知能、機械学習、ディープラーニングの進歩は、ビッグデータ分析と管理の変革を触媒している。
本研究は,これらの技術の理論的基礎,方法論的進歩,実践的実装について考察する。
研究者、実践家、データ愛好家は、現代のデータ分析の複雑さをナビゲートするツールを利用できる。
論文 参考訳(メタデータ) (2024-12-03T05:59:34Z) - Survey and Taxonomy: The Role of Data-Centric AI in Transformer-Based Time Series Forecasting [36.31269406067809]
データ中心のAIは、AIモデルのトレーニング、特にトランスフォーマーベースのTSFモデルの効率的なトレーニングに不可欠である、と私たちは主張する。
我々は、データ中心のAIの観点から、これまでの研究成果をレビューし、トランスフォーマーベースのアーキテクチャとデータ中心のAIの将来の開発のための基礎的な作業を行うつもりです。
論文 参考訳(メタデータ) (2024-07-29T08:27:21Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Rethinking Architecture Design for Tackling Data Heterogeneity in
Federated Learning [53.73083199055093]
注意に基づくアーキテクチャ(例えばTransformers)は、分散シフトに対してかなり堅牢であることを示す。
我々の実験は、畳み込みネットワークをトランスフォーマーに置き換えることによって、過去のデバイスを壊滅的に忘れることを大幅に減らせることを示した。
論文 参考訳(メタデータ) (2021-06-10T21:04:18Z) - Convergence of Artificial Intelligence and High Performance Computing on
NSF-supported Cyberinfrastructure [3.4291439418246177]
人工知能(AI)アプリケーションは、産業や技術におけるビッグデータの課題に対して、トランスフォーメーションソリューションを推進している。
AIは、統計的および数学的厳密性を備えたコンピューティングパラダイムへと進化し続けており、トレーニング、検証、テストのためのシングルGPUソリューションがもはや不十分であることが明らかになっている。
この実現により、AIとハイパフォーマンスコンピューティングの融合が加速し、監視時間の短縮が図られている。
論文 参考訳(メタデータ) (2020-03-18T18:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。