論文の概要: rTisane: Externalizing conceptual models for data analysis increases
engagement with domain knowledge and improves statistical model quality
- arxiv url: http://arxiv.org/abs/2310.16262v1
- Date: Wed, 25 Oct 2023 00:32:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-26 17:26:49.352777
- Title: rTisane: Externalizing conceptual models for data analysis increases
engagement with domain knowledge and improves statistical model quality
- Title(参考訳): rTisane: データ分析の概念モデルの外部化はドメイン知識への関与を高め、統計モデルの品質を向上させる
- Authors: Eunice Jun, Edward Misback, Jeffrey Heer, Ren\'e Just
- Abstract要約: 統計モデルは、変数とその関係に関するアナリストのドメイン知識を正確に反映すべきである。
最近のツールにより、アナリストはこれらの仮定を表現し、結果の統計モデルを作成することができる。
アナリストが何を表現したいのか、外部化が統計モデルの品質に与える影響は、まだ不明だ。
- 参考スコア(独自算出の注目度): 11.156807472212165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Statistical models should accurately reflect analysts' domain knowledge about
variables and their relationships. While recent tools let analysts express
these assumptions and use them to produce a resulting statistical model, it
remains unclear what analysts want to express and how externalization impacts
statistical model quality. This paper addresses these gaps. We first conduct an
exploratory study of analysts using a domain-specific language (DSL) to express
conceptual models. We observe a preference for detailing how variables relate
and a desire to allow, and then later resolve, ambiguity in their conceptual
models. We leverage these findings to develop rTisane, a DSL for expressing
conceptual models augmented with an interactive disambiguation process. In a
controlled evaluation, we find that rTisane's DSL helps analysts engage more
deeply with and accurately externalize their assumptions. rTisane also leads to
statistical models that match analysts' assumptions, maintain analysis intent,
and better fit the data.
- Abstract(参考訳): 統計モデルは、変数とその関係に関するアナリストのドメイン知識を正確に反映すべきである。
最近のツールでは、アナリストがこれらの仮定を表現し、結果の統計モデルを作成することができるが、アナリストが何を表現したいのか、外部化が統計モデルの品質にどのような影響を及ぼすのかは不明だ。
本稿ではこれらのギャップに対処する。
まず、ドメイン固有言語(DSL)を用いてアナリストの探索的研究を行い、概念モデルを表現する。
我々は、変数がどう関連しているか、そしてその概念モデルにおける曖昧さを許可したいという願望を詳述する選好を観察し、後に解決する。
対話的曖昧化プロセスで拡張された概念モデルを表現するためのDSLであるrTisaneを開発した。
制御された評価では、rTisaneのDSLがアナリストの仮定をより深く、正確に外部化するのに役立ちます。
rTisaneはまた、アナリストの仮定と一致し、分析意図を維持し、データに適合する統計モデルをもたらす。
関連論文リスト
- Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト・イズ・キー (Context is Key) (CiK) は、時系列予測ベンチマークであり、様々な種類のテキストコンテキストと数値データをペアリングする。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
実験では、文脈情報の導入の重要性を強調し、LLMに基づく予測モデルを用いた場合の驚くべき性能を示すとともに、それらの重要な欠点を明らかにした。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - XForecast: Evaluating Natural Language Explanations for Time Series Forecasting [72.57427992446698]
時系列予測は、特に正確な予測に依存するステークホルダーにとって、意思決定を支援する。
伝統的に説明可能なAI(XAI)メソッドは、機能や時間的重要性を基盤とするものであり、専門家の知識を必要とすることが多い。
時系列データにおける複雑な因果関係のため,予測NLEの評価は困難である。
論文 参考訳(メタデータ) (2024-10-18T05:16:39Z) - Reliability and Interpretability in Science and Deep Learning [0.0]
この記事では、従来の科学的モデルとDeep Neural Network(DNN)モデルの比較に焦点を当てる。
DNNモデルの複雑さは、その信頼性と長期的進歩の予測を妨げていると論じている。
また、解釈可能性が、統計分析だけでは理解できないあらゆるモデルの信頼性を評価するための前提条件であることも明らかにした。
論文 参考訳(メタデータ) (2024-01-14T20:14:07Z) - Incorporating Domain Knowledge in Deep Neural Networks for Discrete
Choice Models [0.5801044612920815]
本稿では,DCMにおけるデータ駆動型アプローチの可能性を拡張するフレームワークを提案する。
これには、必要な関係を表す擬似データサンプルと、その実現度を測定する損失関数が含まれる。
ケーススタディは、このフレームワークの個別選択分析の可能性を示している。
論文 参考訳(メタデータ) (2023-05-30T12:53:55Z) - Are Neural Topic Models Broken? [81.15470302729638]
トピックモデルの自動評価と人的評価の関係について検討する。
ニューラルトピックモデルは、確立された古典的手法と比較して、両方の点においてより悪くなる。
論文 参考訳(メタデータ) (2022-10-28T14:38:50Z) - A Prescriptive Learning Analytics Framework: Beyond Predictive Modelling
and onto Explainable AI with Prescriptive Analytics and ChatGPT [0.0]
本研究では、透過的な機械学習と、規範的分析を可能にする技術の両方を統合する新しいフレームワークを提案する。
本研究は,プログラムノンコンプリートにおけるリスク学習者を特定するために,予測モデルを用いて提案手法を実証するものである。
論文 参考訳(メタデータ) (2022-08-31T00:57:17Z) - A Visual Analytics System for Improving Attention-based Traffic
Forecasting Models [25.975369237248316]
我々は,ディープラーニングモデルによる予測の仕方を探ることのできる視覚分析システムを開発した。
このシステムは、動的時間ゆらぎ(DTW)と、計算時間依存性分析のためのグランガー因果性テストを含む。
本稿では,AttnAnalyzerがモデル動作を効果的に探索し,モデル性能を向上させるための3つのケーススタディを提案する。
論文 参考訳(メタデータ) (2022-08-08T18:15:40Z) - Measuring Causal Effects of Data Statistics on Language Model's
`Factual' Predictions [59.284907093349425]
大量のトレーニングデータが、最先端のNLPモデルの高性能化の大きな理由の1つである。
トレーニングデータがどのように予測に影響を及ぼすかを記述するための言語を,因果的フレームワークを通じて提供する。
我々のフレームワークは、高価なモデルの再訓練の必要性を回避し、観測データのみに基づいて因果効果を推定することができる。
論文 参考訳(メタデータ) (2022-07-28T17:36:24Z) - Temporal Relevance Analysis for Video Action Models [70.39411261685963]
まず,CNNに基づく行動モデルにより捉えたフレーム間の時間的関係を定量化する手法を提案する。
次に、時間的モデリングがどのように影響を受けるかをよりよく理解するために、包括的な実験と詳細な分析を行います。
論文 参考訳(メタデータ) (2022-04-25T19:06:48Z) - Using Shape Metrics to Describe 2D Data Points [0.0]
本稿では,2次元データを記述するために形状計測を用いて,解析をより説明しやすく解釈可能にすることを提案する。
これは、説明可能性の権利が不可欠である医療コミュニティにおける応用において特に重要である。
論文 参考訳(メタデータ) (2022-01-27T23:28:42Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。