論文の概要: Synthetic Datasets for Machine Learning on Spatio-Temporal Graphs using PDEs
- arxiv url: http://arxiv.org/abs/2502.04140v1
- Date: Thu, 06 Feb 2025 15:20:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-07 14:33:44.787169
- Title: Synthetic Datasets for Machine Learning on Spatio-Temporal Graphs using PDEs
- Title(参考訳): PDEを用いた時空間グラフを用いた機械学習のための合成データセット
- Authors: Jost Arndt, Utku Isil, Michael Detzel, Wojciech Samek, Jackie Ma,
- Abstract要約: 我々は、部分微分方程式(PDE)に基づく合成データセットを作成し、機械学習における時間グラフモデリングを支援する。
より正確には、疫学、大気粒子、津波波の分野で異なる種類の災害や危険をモデル化するための3つの方程式を提示する。
このようなデータセットは、疫学データセット上で複数の機械学習モデルをベンチマークすることで、どのように使用できるかを示す。
- 参考スコア(独自算出の注目度): 9.57024497531179
- License:
- Abstract: Many physical processes can be expressed through partial differential equations (PDEs). Real-world measurements of such processes are often collected at irregularly distributed points in space, which can be effectively represented as graphs; however, there are currently only a few existing datasets. Our work aims to make advancements in the field of PDE-modeling accessible to the temporal graph machine learning community, while addressing the data scarcity problem, by creating and utilizing datasets based on PDEs. In this work, we create and use synthetic datasets based on PDEs to support spatio-temporal graph modeling in machine learning for different applications. More precisely, we showcase three equations to model different types of disasters and hazards in the fields of epidemiology, atmospheric particles, and tsunami waves. Further, we show how such created datasets can be used by benchmarking several machine learning models on the epidemiological dataset. Additionally, we show how pre-training on this dataset can improve model performance on real-world epidemiological data. The presented methods enable others to create datasets and benchmarks customized to individual requirements. The source code for our methodology and the three created datasets can be found on https://github.com/github-usr-ano/Temporal_Graph_Data_PDEs.
- Abstract(参考訳): 多くの物理過程は偏微分方程式(PDE)によって表される。
このようなプロセスの現実的な測定は、しばしば不規則に分散した空間で収集され、グラフとして効果的に表現できるが、現在存在するデータセットはごくわずかである。
本研究の目的は、PDEに基づくデータセットの作成と活用により、データ不足問題に対処しつつ、時間グラフ機械学習コミュニティにPDEモデリングの分野の進歩を実現することである。
本研究では、PDEに基づく合成データセットを作成し、異なるアプリケーションのための機械学習における時空間グラフモデリングをサポートする。
より正確には、疫学、大気粒子、津波波の分野で異なる種類の災害や危険をモデル化するための3つの方程式を提示する。
さらに、これらのデータセットが、疫学データセット上で複数の機械学習モデルをベンチマークすることでどのように使用できるかを示す。
さらに,本データセットの事前学習により,実世界の疫学データのモデル性能が向上することを示す。
提案された方法では,個々の要件に合わせてカスタマイズされたデータセットとベンチマークを作成することが可能になる。
私たちの方法論と3つの生成されたデータセットのソースコードは、https://github.com/github-usr-ano/Temporal_Graph_Data_PDEsで確認できます。
関連論文リスト
- Time-Varying Graph Learning for Data with Heavy-Tailed Distribution [15.576923158246428]
グラフモデルは、ネットワーク上で定義されたデータ構造をキャプチャする効率的なツールを提供する。
このようなモデルを学ぶための現在の方法論は、データ内の外れ値に対する堅牢性に欠けることが多い。
本稿では,重み付きデータを効率的に表現できる時間変化グラフモデルの学習問題に対処する。
論文 参考訳(メタデータ) (2024-12-31T19:09:57Z) - ST-FiT: Inductive Spatial-Temporal Forecasting with Limited Training Data [59.78770412981611]
現実世界のアプリケーションでは、ほとんどのノードはトレーニング中に利用可能な時間データを持っていないかもしれない。
この問題に対処するために,ST-FiTというフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-14T17:51:29Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - PlasmoData.jl -- A Julia Framework for Modeling and Analyzing Complex Data as Graphs [0.0]
複雑なデータセットのモデリングと解析を容易にするため,グラフ理論の概念を用いたオープンソースのJuliaフレームワークであるPlasmoData.jlを提案する。
私たちのフレームワークの中核は、DataGraphと呼ばれる一般的なデータモデリング抽象化です。
本稿では,データオブジェクトをグラフとして表現するために,抽象化とソフトウェアの実装をどのように利用できるかを示す。
論文 参考訳(メタデータ) (2024-01-21T05:04:38Z) - Temporal Graph Benchmark for Machine Learning on Temporal Graphs [54.52243310226456]
テンポラルグラフベンチマーク(TGB)は、困難で多様なベンチマークデータセットのコレクションである。
各データセットをベンチマークし、共通のモデルのパフォーマンスがデータセット間で大きく異なることを発見した。
TGBは、再現可能でアクセス可能な時間グラフ研究のための自動機械学習パイプラインを提供する。
論文 参考訳(メタデータ) (2023-07-03T13:58:20Z) - Elliptic PDE learning is provably data-efficient [7.097838977449412]
PDE学習は物理と機械学習を組み合わせて未知の物理システムを実験データから復元する。
我々の研究は、PDE学習に必要な入出力トレーニングペアの数に関する理論的保証を提供する。
具体的には、ランダム化された数値線形代数とPDE理論を利用して、入力出力データから3次元楕円型PDEの解演算子を復元する証明可能なデータ効率のアルゴリズムを導出する。
論文 参考訳(メタデータ) (2023-02-24T20:51:23Z) - Data Distillation: A Survey [32.718297871027865]
ディープラーニングは、膨大な数の大規模および多言語データセットのキュレーションにつながった。
個々のタスクで人間に近いパフォーマンスを持つにもかかわらず、大規模なデータセットでパラメータハングリーモデルをトレーニングすることは、多面的な問題を引き起こす。
データ蒸留アプローチは、元のデータセットの効果的なドロップイン置換として機能する、簡潔なデータ要約を合成することを目的としている。
論文 参考訳(メタデータ) (2023-01-11T02:25:10Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Score-based Generative Modeling of Graphs via the System of Stochastic
Differential Equations [57.15855198512551]
本稿では,連続時間フレームワークを用いたグラフのスコアベース生成モデルを提案する。
本手法は, トレーニング分布に近い分子を生成できるが, 化学価数則に違反しないことを示す。
論文 参考訳(メタデータ) (2022-02-05T08:21:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。