論文の概要: mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon
- arxiv url: http://arxiv.org/abs/2603.04035v2
- Date: Fri, 06 Mar 2026 04:14:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:43.990431
- Title: mlx-vis: GPU-Accelerated Dimensionality Reduction and Visualization on Apple Silicon
- Title(参考訳): mlx-vis: Apple Silicon上でのGPUによる次元削減と可視化
- Authors: Han Xiao,
- Abstract要約: mlx-visは6つの次元削減メソッドとk-nearestの隣のグラフをMLXで完全に実装したPythonライブラリである。
このライブラリは UMAP, t-SNE, PaCMAP, TriMap, DREAMS, CNE, NNDescent などを提供し,それぞれが fit_transform インターフェースを統一して Metal GPU 上で実行される。
70,000点のFashion-MNISTでは、すべてのメソッドが2.1-3.8秒で完全に埋め込み、800フレームのアニメーションをM3 Ultraで1.4秒でレンダリングする。
- 参考スコア(独自算出の注目度): 5.943245848892104
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: mlx-vis is a Python library that implements six dimensionality reduction methods and a k-nearest neighbor graph algorithm entirely in MLX, Apple's array framework for Apple Silicon. The library provides UMAP, t-SNE, PaCMAP, TriMap, DREAMS, CNE, and NNDescent, all executing on Metal GPU through a unified fit_transform interface. Beyond embedding computation, mlx-vis includes a GPU-accelerated circle-splatting renderer that produces scatter plots and smooth animations without matplotlib, composing frames via scatter-add alpha blending on GPU and piping them to hardware H.264 encoding. On Fashion-MNIST with 70,000 points, all methods complete embedding in 2.1-3.8 seconds and render 800-frame animations in 1.4 seconds on an M3 Ultra, with the full pipeline from raw data to rendered video finishing in 3.6-5.2 seconds. The library depends only on MLX and NumPy, is released under the Apache 2.0 license, and is available at https://github.com/hanxiao/mlx-vis.
- Abstract(参考訳): mlx-visは、AppleのApple Silicon向けの配列フレームワークであるMLXで、6つの次元削減メソッドとk-nearestの隣のグラフアルゴリズムを実装するPythonライブラリである。
このライブラリは UMAP, t-SNE, PaCMAP, TriMap, DREAMS, CNE, NNDescent などを提供し,それぞれが fit_transform インターフェースを統一して Metal GPU 上で実行される。
埋め込み計算以外にも、mlx-visにはGPUアクセラレーションされた円分割レンダラーがあり、マットプロットを使わずにスムーズなプロットやスムーズなアニメーションを生成する。
70,000点のFashion-MNISTでは、すべてのメソッドが2.1-3.8秒で埋め込み、800フレームのアニメーションをM3 Ultra上で1.4秒でレンダリングする。
ライブラリはMLXとNumPyのみに依存しており、Apache 2.0ライセンスでリリースされており、https://github.com/hanxiao/mlx-vis.comから入手できる。
関連論文リスト
- mlx-snn: Spiking Neural Networks on Apple Silicon via MLX [1.1597621848542221]
AppleのMLXフレームワーク上に構築された最初のスパイクニューラルネットワーク(SNN)ライブラリであるmlx-snnを紹介する。
mlx-snnは6つのニューロンモデル、4つの代理勾配関数、4つのスパイク符号化方法、完全なバックプロパゲーション・スルータイムトレーニングパイプラインを提供する。
mlx-snnはMITライセンス下でオープンソースで、PyPIで利用可能である。
論文 参考訳(メタデータ) (2026-03-03T21:25:36Z) - Native LLM and MLLM Inference at Scale on Apple Silicon [0.8122270502556375]
MLX をネイティブに構築した Apple Silicon 上で,効率的な LLM と MLLM 推論のためのフレームワーク vllm-mlx を提案する。
テキストモデルでは、Qwen3-0.6BからNemotron-30Bまでの範囲で、ラマよりも21%から87%高いスループットを達成する。
マルチモーダルモデルでは,入力形式によらず,同一画像をコンテンツハッシュで識別することで,冗長な視覚符号化を不要とするコンテンツベースキャッシングを導入する。
論文 参考訳(メタデータ) (2026-01-27T03:11:02Z) - torch-sla: Differentiable Sparse Linear Algebra with Adjoint Solvers and Sparse Tensor Parallelism for PyTorch [0.2960141730774496]
オープンソースのPyTorchライブラリであるTorchslaは、GPUを加速し、スケーラブルで、微分可能なスパース線形代数を可能にする。
torchslaは複数のバックエンド(SciPy、cuDSS、PyTorch-native)をサポートし、エンドツーエンドの微分可能なシミュレーションのためにPyTorch Autogradとシームレスに統合される。
論文 参考訳(メタデータ) (2026-01-20T14:06:01Z) - MeshSplatting: Differentiable Rendering with Opaque Meshes [59.240722437975755]
メッシュベースの再構成手法であるMeshSplattingを提案する。
Mip-NeRF360では、メッシュベースの新規ビュー合成のために現在の最先端のMiLoよりもPSNRを+0.69dB向上させる。
論文 参考訳(メタデータ) (2025-12-07T12:31:04Z) - scipy.spatial.transform: Differentiable Framework-Agnostic 3D Transformations in Python [49.015684860172975]
三次元剛体変換、すなわち回転と変換は、現代の微分可能な機械学習パイプラインの中心である。
SciPyのspace$.$diffモジュールは、厳格にテストされたPython実装である。
我々はSciPyの空間$.$transform機能を完全にオーバーホールし、Python配列APIを実装する任意の配列ライブラリと互換性を持たせる。
論文 参考訳(メタデータ) (2025-11-22T18:52:34Z) - Minute-Long Videos with Dual Parallelisms [57.22737565366549]
Diffusion Transformer (DiT)ベースのビデオ拡散モデルは、大規模に高品質なビデオを生成するが、長いビデオの処理遅延とメモリコストは禁じられている。
我々はDualParalと呼ばれる新しい分散推論戦略を提案する。
1つのGPUでビデオ全体を生成する代わりに、時間フレームとモデルレイヤの両方をGPU間で並列化します。
論文 参考訳(メタデータ) (2025-05-27T11:55:22Z) - VoGE: A Differentiable Volume Renderer using Gaussian Ellipsoids for
Analysis-by-Synthesis [62.47221232706105]
本稿では,ガウス再構成カーネルをボリュームプリミティブとして利用するVoGEを提案する。
本稿では,VoGEを用いて効率よくレンダリングを行うために,体積密度集約と粗大な描画戦略に関する近似クローズフォーム解を提案する。
VoGEは、オブジェクトポーズ推定、形状/テクスチャフィッティング、推論など、様々な視覚タスクに適用された場合、SoTAより優れている。
論文 参考訳(メタデータ) (2022-05-30T19:52:11Z) - Mesh Convolution with Continuous Filters for 3D Surface Parsing [101.25796935464648]
本稿では、3次元トライアングルメッシュから効果的な幾何学的特徴学習のための一連のモジュラー演算を提案する。
メッシュ畳み込みは球面調和を正規直交基底として利用し、連続畳み込みフィルタを生成する。
さらに,PicassoNet++という3次元表面の知覚解析のための新しい階層型ニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-03T09:16:49Z) - Picasso: A CUDA-based Library for Deep Learning over 3D Meshes [46.8917772877766]
複雑な実世界の3dメッシュ上でディープラーニングを行うための,新たなモジュールからなるライブラリであるpicassoを提案する。
我々は,ネットワーク解像度の低減を図るために,GPU加速メッシュデシメーションを設計する。
S3DIS上での競合セグメンテーション結果を用いた提案モジュールの有効性を実証する。
論文 参考訳(メタデータ) (2021-03-28T08:04:50Z) - Kernel Operations on the GPU, with Autodiff, without Memory Overflows [5.669790037378094]
KeOpsライブラリは、数学的公式によってエントリが与えられるテンソルに対して、高速でメモリ効率のよいGPUサポートを提供する。
KeOpsは、カーネルおよび幾何学的アプリケーションのためのテンソル中心ライブラリの大きなボトルネックであるメモリ消費を緩和する。
KeOpsは、最適化されたC++/CUDAスキームと、Python(NumpyとPyTorch)、Matlab、Rのバインダーを組み合わせる。
論文 参考訳(メタデータ) (2020-03-27T08:54:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。