論文の概要: Multivariate Temporal Regression at Scale: A Three-Pillar Framework Combining ML, XAI, and NLP
- arxiv url: http://arxiv.org/abs/2504.02151v1
- Date: Wed, 02 Apr 2025 21:53:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-04 12:58:24.947954
- Title: Multivariate Temporal Regression at Scale: A Three-Pillar Framework Combining ML, XAI, and NLP
- Title(参考訳): スケールにおける多変量時間回帰:ML, XAI, NLPを組み合わせた3ピラーフレームワーク
- Authors: Jiztom Kavalakkatt Francis, Matthew J Darr,
- Abstract要約: 本稿では,高次元データの解析のハードルについて述べる。
データ分析における従来の手法は、しばしば入力変数間の直接接続に注目し、データ内のより複雑な関係を見逃す可能性がある。
我々は、合成データの役割と、情報を異なるセンサー間で冗長にする方法を考える。
- 参考スコア(独自算出の注目度): 1.331812695405053
- License:
- Abstract: The rapid use of artificial intelligence (AI) in processes such as coding, image processing, and data prediction means it is crucial to understand and validate the data we are working with fully. This paper dives into the hurdles of analyzing high-dimensional data, especially when it gets too complex. Traditional methods in data analysis often look at direct connections between input variables, which can miss out on the more complicated relationships within the data. To address these issues, we explore several tested techniques, such as removing specific variables to see their impact and using statistical analysis to find connections between multiple variables. We also consider the role of synthetic data and how information can sometimes be redundant across different sensors. These analyses are typically very computationally demanding and often require much human effort to make sense of the results. A common approach is to treat the entire dataset as one unit and apply advanced models to handle it. However, this can become problematic with larger, noisier datasets and more complex models. So, we suggest methods to identify overall patterns that can help with tasks like classification or regression based on the idea that more straightforward approaches might be more understandable. Our research looks at two datasets: a real-world dataset and a synthetic one. The goal is to create a methodology that highlights key features on a global scale that lead to predictions, making it easier to validate or quantify the data set. By reducing the dimensionality with this method, we can simplify the models used and thus clarify the insights we gain. Furthermore, our method can reveal unexplored relationships between specific inputs and outcomes, providing a way to validate these new connections further.
- Abstract(参考訳): コーディングや画像処理、データ予測といったプロセスにおける人工知能(AI)の急速な利用は、私たちが取り組んでいるデータを完全に理解し、検証することが不可欠であることを意味します。
本稿では,高次元データの解析のハードルについて述べる。
データ分析における従来の手法は、しばしば入力変数間の直接接続に注目し、データ内のより複雑な関係を見逃す可能性がある。
これらの問題に対処するために、特定の変数を除去して影響を確かめたり、統計分析を用いて複数の変数間の接続を見つけるなど、いくつかの試験手法について検討する。
また、合成データの役割や、情報を異なるセンサー間で冗長にする方法についても検討する。
これらの分析は典型的に非常に計算的に要求され、結果を理解するのに多くの人的努力を必要とする。
一般的なアプローチは、データセット全体をひとつの単位として扱い、それを扱うための高度なモデルを適用することである。
しかし、より大きくノイズの多いデータセットやより複雑なモデルでは、この問題が問題になる可能性がある。
そこで我々は、より単純なアプローチの方がより理解しやすいという考えに基づいて、分類や回帰といったタスクに役立つ全体的なパターンを特定する方法を提案する。
我々の研究は、現実世界のデータセットと合成データセットの2つのデータセットに注目している。
目標は、予測につながるグローバルスケールの重要な機能を強調し、データセットの検証や定量化を容易にする方法論を作成することです。
この方法で次元を小さくすることで、使用するモデルを単純化し、得られた洞察を明確にすることができる。
さらに,本手法は,特定の入力と結果の未探索な関係を明らかにすることで,これらの新たな接続をさらに検証する手段を提供する。
関連論文リスト
- Explaining Categorical Feature Interactions Using Graph Covariance and LLMs [18.44675735926458]
本稿では,Counter Trafficking Data Collaborativeからのグローバルな合成データセットに焦点を当てる。
2002年から2022年にかけて20,000件以上の匿名化された記録があり、それぞれのレコードに多くの分類学的特徴がある。
本稿では,重要な分類的特徴の相互作用を分析し,抽出するための高速でスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2025-01-24T21:41:26Z) - D3A-TS: Denoising-Driven Data Augmentation in Time Series [0.0]
本研究は,分類と回帰問題に対する時系列におけるデータ拡張のための異なる手法の研究と分析に焦点をあてる。
提案手法は拡散確率モデルを用いており、近年画像処理の分野で成功している。
その結果、この手法が、分類と回帰モデルを訓練するための合成データを作成する上で、高い有用性を示している。
論文 参考訳(メタデータ) (2023-12-09T11:37:07Z) - On Inductive Biases for Machine Learning in Data Constrained Settings [0.0]
この論文は、データ制約された設定で表現力のあるモデルを学ぶという問題に対する異なる答えを探求する。
ニューラルネットワークを学ぶために、大きなデータセットに頼るのではなく、データ構造を反映した既知の関数によって、いくつかのモジュールを置き換えるつもりです。
我々のアプローチは「帰納的バイアス」のフードの下に置かれており、これは探索するモデルの空間を制限する手元にあるデータの仮説として定義することができる。
論文 参考訳(メタデータ) (2023-02-21T14:22:01Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Deep Learning and Handheld Augmented Reality Based System for Optimal
Data Collection in Fault Diagnostics Domain [0.0]
本稿では,最小限のデータを用いて故障診断を行う新しいヒューマン・マシン・インタラクション・フレームワークを提案する。
必要なデータの最小化は、障害の診断におけるデータ駆動モデルの実践可能性を高める。
提案するフレームワークは,各障害条件のインスタンスが1つしかない新しいデータセットに対して,100%以上の精度とリコールを提供する。
論文 参考訳(メタデータ) (2022-06-15T19:15:26Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z) - Visual Neural Decomposition to Explain Multivariate Data Sets [13.117139248511783]
多次元データセットにおける変数間の関係を調べることは、データアナリストとエンジニアにとって共通の課題である。
本稿では,入力変数と対象変数との相関関係を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-09-11T15:53:37Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。