論文の概要: Tempo: Helping Data Scientists and Domain Experts Collaboratively Specify Predictive Modeling Tasks
- arxiv url: http://arxiv.org/abs/2502.10526v1
- Date: Fri, 14 Feb 2025 19:44:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:09:33.858523
- Title: Tempo: Helping Data Scientists and Domain Experts Collaboratively Specify Predictive Modeling Tasks
- Title(参考訳): Tempo: データサイエンティストとドメインエキスパートが協調して予測モデリングタスクを特定するのを支援する
- Authors: Venkatesh Sivaraman, Anika Vaishampayan, Xiaotong Li, Brian R Buck, Ziyong Ma, Richard D Boyce, Adam Perer,
- Abstract要約: 我々は、データサイエンティストとドメインエキスパートがモデル仕様について協力するのを支援する対話型システムであるTempoを開発した。
データサイエンティストは、事前処理の選択についてより透明性の高い仕様を迅速にプロトタイプできる。
ドメインエキスパートは、モデルが期待通りに振る舞うことを検証するために、データサブグループ内のパフォーマンスを評価することができる。
- 参考スコア(独自算出の注目度): 14.099791384467274
- License:
- Abstract: Temporal predictive models have the potential to improve decisions in health care, public services, and other domains, yet they often fail to effectively support decision-makers. Prior literature shows that many misalignments between model behavior and decision-makers' expectations stem from issues of model specification, namely how, when, and for whom predictions are made. However, model specifications for predictive tasks are highly technical and difficult for non-data-scientist stakeholders to interpret and critique. To address this challenge we developed Tempo, an interactive system that helps data scientists and domain experts collaboratively iterate on model specifications. Using Tempo's simple yet precise temporal query language, data scientists can quickly prototype specifications with greater transparency about pre-processing choices. Moreover, domain experts can assess performance within data subgroups to validate that models behave as expected. Through three case studies, we demonstrate how Tempo helps multidisciplinary teams quickly prune infeasible specifications and identify more promising directions to explore.
- Abstract(参考訳): 一時的な予測モデルは、医療、公共サービス、その他の領域における意思決定を改善する可能性があるが、意思決定者を支援するのに失敗することが多い。
以前の文献では、モデル行動と意思決定者の期待の多くの不一致は、モデル仕様の問題、すなわち、どのように、いつ、誰が予測されるかという問題に起因している。
しかし、予測タスクのモデル仕様は、非データ科学者の利害関係者が解釈し、批判することが非常に困難である。
この課題に対処するため、私たちは、データサイエンティストとドメインエキスパートがモデル仕様を共同で反復するのを支援するインタラクティブなシステムであるTempoを開発しました。
Tempoのシンプルで正確な時間的クエリ言語を使うことで、データサイエンティストは、事前処理の選択に関する透明性の高い仕様を迅速にプロトタイプできる。
さらに、ドメインエキスパートは、データサブグループ内のパフォーマンスを評価し、モデルが期待通りに振る舞うことを検証することができる。
3つのケーススタディを通じて、Tempoが複数の学際的なチームに対して、実現不可能な仕様を迅速に証明し、探索するより有望な方向を特定する方法を示します。
関連論文リスト
- XForecast: Evaluating Natural Language Explanations for Time Series Forecasting [72.57427992446698]
時系列予測は、特に正確な予測に依存するステークホルダーにとって、意思決定を支援する。
伝統的に説明可能なAI(XAI)メソッドは、機能や時間的重要性を基盤とするものであり、専門家の知識を必要とすることが多い。
時系列データにおける複雑な因果関係のため,予測NLEの評価は困難である。
論文 参考訳(メタデータ) (2024-10-18T05:16:39Z) - Temporal receptive field in dynamic graph learning: A comprehensive analysis [15.161255747900968]
本稿では,動的グラフ学習における時間受容領域の包括的解析について述べる。
その結果,適切な時間的受容場を選択すれば,モデルの性能が大幅に向上することが示された。
一部のモデルでは、過度に大きなウィンドウがノイズを発生させ、精度を低下させる。
論文 参考訳(メタデータ) (2024-07-17T07:46:53Z) - A Reliable Framework for Human-in-the-Loop Anomaly Detection in Time Series [17.08674819906415]
HILADは、人間とAIの動的かつ双方向なコラボレーションを促進するために設計された、新しいフレームワークである。
ビジュアルインターフェースを通じて、HILADはドメインの専門家に、大規模な予期せぬモデルの振る舞いを検出し、解釈し、修正する権限を与えます。
論文 参考訳(メタデータ) (2024-05-06T07:44:07Z) - A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1255811066468]
時系列およびS時間データにおける拡散モデルの使用について概観し、それらをモデル、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。
我々は拡散モデルを無条件型と条件付き型に分類し、時系列とS時間データを別々に議論する。
本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文 参考訳(メタデータ) (2024-04-29T17:19:40Z) - Third-Party Language Model Performance Prediction from Instruction [59.574169249307054]
言語モデルに基づく命令フォローシステムは、最近、多くのベンチマークタスクのパフォーマンスが向上している。
ユーザは、応答が正確かどうかを判断することなく、命令付きモデルを容易に促すことができる。
本稿では,タスク上での指示追従システムの評価から得られたメトリックを予測するために,別のモデルを訓練した第三者のパフォーマンス予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-19T03:53:47Z) - Towards Unifying Diffusion Models for Probabilistic Spatio-Temporal Graph Learning [26.57090339778029]
本稿では,タスクを共用依存関係を持つ条件情報に基づく予測として,統一的確率論的視点でモデル化することを提案する。
本提案では,タスクを一様に処理するための統一時空間拡散モデル(USTD)を提案する。
USTDは、共有時間エンコーダとアテンションベースのデノナイジングデコーダからなる、全体的設計である。
論文 参考訳(メタデータ) (2023-10-26T12:48:43Z) - Are Metrics Enough? Guidelines for Communicating and Visualizing
Predictive Models to Subject Matter Experts [7.768301998812552]
本稿では,コミュニケーションのギャップを理解するために,課題の専門家とデータ科学者の双方による反復的研究について述べる。
モデルの強みと弱みを伝達するための共通媒体として可視化を利用する一連のコミュニケーションガイドラインを導出する。
論文 参考訳(メタデータ) (2022-05-11T19:40:24Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Model-Attentive Ensemble Learning for Sequence Modeling [86.4785354333566]
シーケンスモデリング(MAES)のためのモデル・アテンティブ・アンサンブル・ラーニングを提案する。
MAESは、異なるシーケンスダイナミクスの専門家を専門とし、予測を適応的に重み付けるために、注目ベースのゲーティングメカニズムを利用する時系列の専門家の混合物です。
MAESが時系列シフトを受けるデータセットの人気シーケンスモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2021-02-23T05:23:35Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。