論文の概要: Mathematical Computation on High-dimensional Data via Array Programming and Parallel Acceleration
- arxiv url: http://arxiv.org/abs/2506.22929v1
- Date: Sat, 28 Jun 2025 15:42:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.633535
- Title: Mathematical Computation on High-dimensional Data via Array Programming and Parallel Acceleration
- Title(参考訳): アレープログラミングと並列加速度による高次元データの数学的計算
- Authors: Chen Zhang,
- Abstract要約: 本研究では,空間完全性に基づく並列計算アーキテクチャを提案し,高次元データを分散処理のための次元非依存構造に分解する。
このフレームワークは、データマイニングと並列最適化機械学習メソッドのシームレスな統合を可能にし、統一システム内の医療や自然画像などのさまざまなデータタイプにわたる科学的計算をサポートする。
- 参考スコア(独自算出の注目度): 6.920979776722456
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: While deep learning excels in natural image and language processing, its application to high-dimensional data faces computational challenges due to the dimensionality curse. Current large-scale data tools focus on business-oriented descriptive statistics, lacking mathematical statistics support for advanced analysis. We propose a parallel computation architecture based on space completeness, decomposing high-dimensional data into dimension-independent structures for distributed processing. This framework enables seamless integration of data mining and parallel-optimized machine learning methods, supporting scientific computations across diverse data types like medical and natural images within a unified system.
- Abstract(参考訳): ディープラーニングは自然画像や言語処理に優れているが、高次元データへの応用は次元的呪文による計算上の課題に直面している。
現在の大規模データツールは、ビジネス指向の記述統計に重点を置いており、高度な分析のための数学的統計学を欠いている。
本研究では,空間完全性に基づく並列計算アーキテクチャを提案し,高次元データを分散処理のための次元非依存構造に分解する。
このフレームワークは、データマイニングと並列最適化機械学習メソッドのシームレスな統合を可能にし、統一システム内の医療や自然画像などのさまざまなデータタイプにわたる科学的計算をサポートする。
関連論文リスト
- RV-Syn: Rational and Verifiable Mathematical Reasoning Data Synthesis based on Structured Function Library [58.404895570822184]
RV-Synは、新しい数学的合成手法である。
このライブラリからPython形式の関数を組み合わせることで、グラフをソリューションとして生成する。
構築したグラフに基づいて,解誘導論理認識問題生成を実現する。
論文 参考訳(メタデータ) (2025-04-29T04:42:02Z) - An Incremental Non-Linear Manifold Approximation Method [0.0]
本研究では, GMRA(Geometric Multi-Resolution Analysis) フレームワークを用いて, ストリーミングデータに対する漸進的非線形次元低減法を開発した。
提案手法は,クラスタマップ,PCAベクトル,ウェーブレット係数を漸進的に更新することで,リアルタイムなデータ解析と可視化を可能にする。
論文 参考訳(メタデータ) (2025-04-12T03:54:05Z) - A Novel Approach for Intrinsic Dimension Estimation [0.0]
実生活データは、その性質から複雑で非線形な構造を持つ。
低次元空間におけるデータセットのほぼ最適な表現を見つけることは、機械学習タスクの成功を改善するための適切なメカニズムを提供する。
本研究では,高効率で頑健な内在次元推定手法を提案する。
論文 参考訳(メタデータ) (2025-03-12T15:42:39Z) - Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models [64.28420991770382]
Data-Juicer 2.0は、テキスト、画像、ビデオ、オーディオのモダリティにまたがるデータ処理オペレーターがバックアップするデータ処理システムである。
データ分析、アノテーション、基礎モデルポストトレーニングなど、より重要なタスクをサポートする。
さまざまな研究分野やAlibaba Cloud PAIのような現実世界の製品で広く採用されている。
論文 参考訳(メタデータ) (2024-12-23T08:29:57Z) - Enabling High Data Throughput Reinforcement Learning on GPUs: A Domain Agnostic Framework for Data-Driven Scientific Research [90.91438597133211]
我々は、強化学習の適用において重要なシステムのボトルネックを克服するために設計されたフレームワークであるWarpSciを紹介する。
我々は、CPUとGPU間のデータ転送の必要性を排除し、数千のシミュレーションを同時実行可能にする。
論文 参考訳(メタデータ) (2024-08-01T21:38:09Z) - Computing with Residue Numbers in High-Dimensional Representation [7.736925756277564]
本稿では,Residue Hyperdimensional Computingを紹介した。Residue Hyperdimensional Computingは乱高次元ベクトル上で定義される代数学と残余数系を統一する計算フレームワークである。
代数演算をベクトル要素上の成分的に並列化可能な演算で行うことが可能な方法で、剰余数を高次元ベクトルとして表現する方法を示す。
論文 参考訳(メタデータ) (2023-11-08T18:19:45Z) - Privacy-Preserving Graph Machine Learning from Data to Computation: A
Survey [67.7834898542701]
我々は,グラフ機械学習のプライバシ保護手法の見直しに重点を置いている。
まずプライバシ保護グラフデータを生成する方法を検討する。
次に,プライバシ保護情報を送信する方法について述べる。
論文 参考訳(メタデータ) (2023-07-10T04:30:23Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Understanding High Dimensional Spaces through Visual Means Employing
Multidimensional Projections [0.0]
データ視覚化分野における関連する2つのアルゴリズムは、t分散近傍埋め込み(t-SNE)とLSP(Last-Square Projection)である。
これらのアルゴリズムは、データセットへの影響を含む、いくつかの数学的機能を理解するために使用することができる。
本稿では,多次元投影アルゴリズムの視覚的結果を用いて,それらの数学的枠組みのパラメータを理解・微調整する方法について述べる。
論文 参考訳(メタデータ) (2022-07-12T20:30:33Z) - Semi-Parametric Inducing Point Networks and Neural Processes [15.948270454686197]
半パラメトリック誘導点ネットワーク(SPIN)は、推論時間におけるトレーニングセットを計算効率よくクエリすることができる。
SPINは、ポイントメソッドにインスパイアされたデータポイント間のクロスアテンションメカニズムを通じて、線形複雑性を実現する。
実験では,SPINはメモリ要件を低減し,様々なメタラーニングタスクの精度を向上し,重要な実用的問題である遺伝子型計算における最先端性能を向上させる。
論文 参考訳(メタデータ) (2022-05-24T01:42:46Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。