論文の概要: Changes from Classical Statistics to Modern Statistics and Data Science
- arxiv url: http://arxiv.org/abs/2211.03756v1
- Date: Sun, 30 Oct 2022 21:35:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 23:45:23.413248
- Title: Changes from Classical Statistics to Modern Statistics and Data Science
- Title(参考訳): 古典統計学から現代統計学・データ科学へ
- Authors: Kai Zhang, Shan Liu, and Momiao Xiong
- Abstract要約: ユークリッドの仮定は非ユークリッドのデータには適さない。
我々は、統計学とAIを結婚し、現代統計学の統一理論を開発し、次世代のAIとデータサイエンスを推進することが期待されている。
- 参考スコア(独自算出の注目度): 24.38352029124892
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A coordinate system is a foundation for every quantitative science,
engineering, and medicine. Classical physics and statistics are based on the
Cartesian coordinate system. The classical probability and hypothesis testing
theory can only be applied to Euclidean data. However, modern data in the real
world are from natural language processing, mathematical formulas, social
networks, transportation and sensor networks, computer visions, automations,
and biomedical measurements. The Euclidean assumption is not appropriate for
non Euclidean data. This perspective addresses the urgent need to overcome
those fundamental limitations and encourages extensions of classical
probability theory and hypothesis testing , diffusion models and stochastic
differential equations from Euclidean space to non Euclidean space. Artificial
intelligence such as natural language processing, computer vision, graphical
neural networks, manifold regression and inference theory, manifold learning,
graph neural networks, compositional diffusion models for automatically
compositional generations of concepts and demystifying machine learning
systems, has been rapidly developed. Differential manifold theory is the
mathematic foundations of deep learning and data science as well. We urgently
need to shift the paradigm for data analysis from the classical Euclidean data
analysis to both Euclidean and non Euclidean data analysis and develop more and
more innovative methods for describing, estimating and inferring non Euclidean
geometries of modern real datasets. A general framework for integrated analysis
of both Euclidean and non Euclidean data, composite AI, decision intelligence
and edge AI provide powerful innovative ideas and strategies for fundamentally
advancing AI. We are expected to marry statistics with AI, develop a unified
theory of modern statistics and drive next generation of AI and data science.
- Abstract(参考訳): 座標系はあらゆる定量的科学、工学、医学の基礎である。
古典物理学と統計学はデカルト座標系に基づいている。
古典的な確率および仮説検定理論はユークリッドデータにのみ適用できる。
しかし、現実世界の現代のデータは、自然言語処理、数学的公式、ソーシャルネットワーク、輸送とセンサーネットワーク、コンピュータビジョン、自動化、バイオメディカル測定から来ている。
ユークリッドの仮定は非ユークリッドのデータには適さない。
この観点はこれらの基本的な制限を克服する緊急の必要性に対処し、古典的確率論と仮説テストの拡張、拡散モデル、ユークリッド空間から非ユークリッド空間への確率微分方程式を奨励する。
自然言語処理、コンピュータビジョン、グラフィカルニューラルネットワーク、多様体回帰と推論理論、多様体学習、グラフニューラルネットワーク、自動合成概念生成のための構成拡散モデル、および機械学習システムなどの人工知能が急速に発展してきた。
微分多様体理論は、深層学習とデータ科学の数学的基礎でもある。
我々は、データ分析のパラダイムを古典ユークリッドデータ分析からユークリッドデータ分析と非ユークリッドデータ分析にシフトさせ、現代の実データ集合の非ユークリッドジオメトリを記述、推定、推論するためのより革新的な方法を開発する必要がある。
ユークリッドデータと非ユークリッドデータ、複合AI、意思決定インテリジェンス、エッジAIの統合分析のための一般的なフレームワークは、AIを根本的に前進させるための強力な革新的なアイデアと戦略を提供する。
我々は、統計学とAIを結婚し、現代統計学の統一理論を開発し、次世代のAIとデータサイエンスを推進することが期待されている。
関連論文リスト
- Beyond Euclid: An Illustrated Guide to Modern Machine Learning with Geometric, Topological, and Algebraic Structures [3.5357133304100326]
現代の機械学習は、本質的に非ユークリッド的なリッチな構造化されたデータに遭遇する。
そのような非ユークリッドデータから知識を抽出するには、より広範な数学的視点が必要である。
我々は最近の進歩を直感的な統合フレームワークに統合するグラフィカルな分類法を提案する。
論文 参考訳(メタデータ) (2024-07-12T17:48:36Z) - A Triumvirate of AI Driven Theoretical Discovery [0.0]
近い将来、AIに取って代わられる危険はないが、人間の専門知識とAIアルゴリズムのハイブリッドは、理論的な発見の不可欠な部分になる、と我々は主張する。
論文 参考訳(メタデータ) (2024-05-30T11:57:00Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Stretched and measured neural predictions of complex network dynamics [2.1024950052120417]
微分方程式のデータ駆動近似は、力学系のモデルを明らかにする従来の方法に代わる有望な方法である。
最近、ダイナミックスを研究する機械学習ツールとしてニューラルネットワークが採用されている。これは、データ駆動型ソリューションの検出や微分方程式の発見に使用できる。
従来の統計学習理論の限界を超えてモデルの一般化可能性を拡張することは可能であることを示す。
論文 参考訳(メタデータ) (2023-01-12T09:44:59Z) - A Survey of Deep Learning for Mathematical Reasoning [71.88150173381153]
我々は過去10年間の数学的推論とディープラーニングの交差点における重要なタスク、データセット、方法についてレビューする。
大規模ニューラルネットワークモデルの最近の進歩は、新しいベンチマークと、数学的推論にディープラーニングを使用する機会を開放している。
論文 参考訳(メタデータ) (2022-12-20T18:46:16Z) - Neurocompositional computing: From the Central Paradox of Cognition to a
new generation of AI systems [120.297940190903]
AIの最近の進歩は、限られた形態のニューロコンフォメーションコンピューティングの使用によってもたらされている。
ニューロコンポジションコンピューティングの新しい形式は、より堅牢で正確で理解しやすいAIシステムを生み出します。
論文 参考訳(メタデータ) (2022-05-02T18:00:10Z) - EINNs: Epidemiologically-Informed Neural Networks [75.34199997857341]
本稿では,疫病予測のための新しい物理インフォームドニューラルネットワークEINNを紹介する。
メカニスティックモデルによって提供される理論的柔軟性と、AIモデルによって提供されるデータ駆動表現性の両方を活用する方法について検討する。
論文 参考訳(メタデータ) (2022-02-21T18:59:03Z) - Modeling Item Response Theory with Stochastic Variational Inference [8.369065078321215]
項目応答理論(IRT)のための変分ベイズ推論アルゴリズムを提案する。
この手法を5つの大規模項目応答データセットに適用すると、欠落したデータを出力する際の高いログ可能性と高い精度が得られる。
アルゴリズムの実装はオープンソースであり、簡単に利用できる。
論文 参考訳(メタデータ) (2021-08-26T05:00:27Z) - An Extensible Benchmark Suite for Learning to Simulate Physical Systems [60.249111272844374]
我々は、統一されたベンチマークと評価プロトコルへの一歩を踏み出すために、一連のベンチマーク問題を導入する。
本稿では,4つの物理系と,広く使用されている古典的時間ベースおよび代表的なデータ駆動手法のコレクションを提案する。
論文 参考訳(メタデータ) (2021-08-09T17:39:09Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Learning Theory for Inferring Interaction Kernels in Second-Order
Interacting Agent Systems [17.623937769189364]
推定器の強い一貫性と最適非パラメトリック min-max 収束率を確立する完全学習理論を開発する。
推定器を構築するための数値アルゴリズムは並列化可能であり、高次元問題に対してよく機能し、複雑な力学系上で実証される。
論文 参考訳(メタデータ) (2020-10-08T02:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。