論文の概要: Multivariate Temporal Regression at Scale: A Three-Pillar Framework Combining ML, XAI, and NLP
- arxiv url: http://arxiv.org/abs/2504.02151v2
- Date: Thu, 05 Jun 2025 19:56:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:42.921183
- Title: Multivariate Temporal Regression at Scale: A Three-Pillar Framework Combining ML, XAI, and NLP
- Title(参考訳): スケールにおける多変量時間回帰:ML, XAI, NLPを組み合わせた3ピラーフレームワーク
- Authors: Jiztom Kavalakkatt Francis, Matthew J Darr,
- Abstract要約: 本稿では、機械学習(ML)、説明可能なAI(XAI)、自然言語処理(NLP)を統合することで、時間データにおける実行可能な関係の発見を加速する新しいフレームワークを提案する。
提案手法では,ML駆動プルーニングを用いて,低品質サンプルの識別と緩和,重要な特徴の相互作用を検証するためのXAIベースの解釈可能性,将来的なコンテキスト検証のためのNLPを組み合わせ,動作可能な洞察を明らかにするのに必要な時間を40~60%削減する。
- 参考スコア(独自算出の注目度): 1.331812695405053
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a novel framework that accelerates the discovery of actionable relationships in high-dimensional temporal data by integrating machine learning (ML), explainable AI (XAI), and natural language processing (NLP) to enhance data quality and streamline workflows. Traditional methods often fail to recognize complex temporal relationships, leading to noisy, redundant, or biased datasets. Our approach combines ML-driven pruning to identify and mitigate low-quality samples, XAI-based interpretability to validate critical feature interactions, and NLP for future contextual validation, reducing the time required to uncover actionable insights by 40-60%. Evaluated on real-world agricultural and synthetic datasets, the framework significantly improves performance metrics (e.g., MSE, R2, MAE) and computational efficiency, with hardware-agnostic scalability across diverse platforms. While long-term real-world impacts (e.g., cost savings, sustainability gains) are pending, this methodology provides an immediate pathway to accelerate data-centric AI in dynamic domains like agriculture and energy, enabling faster iteration cycles for domain experts.
- Abstract(参考訳): 本稿では、機械学習(ML)、説明可能なAI(XAI)、自然言語処理(NLP)を統合することで、高次元時間データにおける実行可能な関係の発見を加速する新しいフレームワークを提案する。
従来の手法は複雑な時間的関係を認識できないことが多く、ノイズ、冗長、偏りのあるデータセットにつながる。
提案手法では,ML駆動プルーニングを用いて,低品質サンプルの識別と緩和,重要な特徴の相互作用を検証するためのXAIベースの解釈可能性,将来的なコンテキスト検証のためのNLPを組み合わせ,動作可能な洞察を明らかにするのに必要な時間を40~60%削減する。
実世界の農業および合成データセットに基づいて評価されたこのフレームワークは、様々なプラットフォームにわたるハードウェアに依存しないスケーラビリティにより、パフォーマンスメトリクス(例えば、MSE、R2、MAE)と計算効率を大幅に改善する。
この方法論は、農業やエネルギーといった動的ドメインにおいて、データ中心のAIを加速するための直接的な経路を提供するもので、ドメインの専門家にとってより速いイテレーションサイクルを可能にする。
関連論文リスト
- Explaining Categorical Feature Interactions Using Graph Covariance and LLMs [18.44675735926458]
本稿では,Counter Trafficking Data Collaborativeからのグローバルな合成データセットに焦点を当てる。
2002年から2022年にかけて20,000件以上の匿名化された記録があり、それぞれのレコードに多くの分類学的特徴がある。
本稿では,重要な分類的特徴の相互作用を分析し,抽出するための高速でスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2025-01-24T21:41:26Z) - D3A-TS: Denoising-Driven Data Augmentation in Time Series [0.0]
本研究は,分類と回帰問題に対する時系列におけるデータ拡張のための異なる手法の研究と分析に焦点をあてる。
提案手法は拡散確率モデルを用いており、近年画像処理の分野で成功している。
その結果、この手法が、分類と回帰モデルを訓練するための合成データを作成する上で、高い有用性を示している。
論文 参考訳(メタデータ) (2023-12-09T11:37:07Z) - On Inductive Biases for Machine Learning in Data Constrained Settings [0.0]
この論文は、データ制約された設定で表現力のあるモデルを学ぶという問題に対する異なる答えを探求する。
ニューラルネットワークを学ぶために、大きなデータセットに頼るのではなく、データ構造を反映した既知の関数によって、いくつかのモジュールを置き換えるつもりです。
我々のアプローチは「帰納的バイアス」のフードの下に置かれており、これは探索するモデルの空間を制限する手元にあるデータの仮説として定義することができる。
論文 参考訳(メタデータ) (2023-02-21T14:22:01Z) - Detection of Interacting Variables for Generalized Linear Models via
Neural Networks [0.0]
本稿では,一般化線形モデル(GLM)に付加されるべき相互作用を見つけるプロセスを自動化するアプローチを提案する。
提案手法はニューラルネットワークとモデル固有の相互作用検出法に依存しており,Friedman H-StatisticやSHAP値といった従来の手法よりも高速に計算することができる。
数値解析では,人工的に生成したデータとオープンソースデータに対するアプローチの結果について述べる。
論文 参考訳(メタデータ) (2022-09-16T16:16:45Z) - A Survey of Learning on Small Data: Generalization, Optimization, and
Challenge [101.27154181792567]
ビッグデータの一般化能力を近似した小さなデータについて学ぶことは、AIの究極の目的の1つである。
この調査はPACフレームワークの下でのアクティブサンプリング理論に従い、小さなデータにおける学習の一般化誤差とラベルの複雑さを分析した。
効率的な小さなデータ表現の恩恵を受けるかもしれない複数のデータアプリケーションについて調査する。
論文 参考訳(メタデータ) (2022-07-29T02:34:19Z) - Deep Learning and Handheld Augmented Reality Based System for Optimal
Data Collection in Fault Diagnostics Domain [0.0]
本稿では,最小限のデータを用いて故障診断を行う新しいヒューマン・マシン・インタラクション・フレームワークを提案する。
必要なデータの最小化は、障害の診断におけるデータ駆動モデルの実践可能性を高める。
提案するフレームワークは,各障害条件のインスタンスが1つしかない新しいデータセットに対して,100%以上の精度とリコールを提供する。
論文 参考訳(メタデータ) (2022-06-15T19:15:26Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z) - Visual Neural Decomposition to Explain Multivariate Data Sets [13.117139248511783]
多次元データセットにおける変数間の関係を調べることは、データアナリストとエンジニアにとって共通の課題である。
本稿では,入力変数と対象変数との相関関係を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-09-11T15:53:37Z) - Relation-Guided Representation Learning [53.60351496449232]
本稿では,サンプル関係を明示的にモデル化し,活用する表現学習手法を提案する。
私たちのフレームワークは、サンプル間の関係をよく保存します。
サンプルをサブスペースに埋め込むことにより,本手法が大規模なサンプル外問題に対処可能であることを示す。
論文 参考訳(メタデータ) (2020-07-11T10:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。