論文の概要: Tisane: Authoring Statistical Models via Formal Reasoning from
Conceptual and Data Relationships
- arxiv url: http://arxiv.org/abs/2201.02705v1
- Date: Fri, 7 Jan 2022 23:21:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-11 17:34:49.247800
- Title: Tisane: Authoring Statistical Models via Formal Reasoning from
Conceptual and Data Relationships
- Title(参考訳): Tisane: 概念とデータ関係からの形式的推論による統計モデルのオーサリング
- Authors: Eunice Jun, Audrey Seo, Jeffrey Heer, Ren\'e Just
- Abstract要約: チサン (Tisane) は、混合効果と無効果の一般線形モデルを作成するための混合開始系である。
3人の研究者によるケーススタディでは、Tisaneが過去のミスを避けながら目標や仮定に集中するのに役立ちます。
- 参考スコア(独自算出の注目度): 17.060365020149966
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Proper statistical modeling incorporates domain theory about how concepts
relate and details of how data were measured. However, data analysts currently
lack tool support for recording and reasoning about domain assumptions, data
collection, and modeling choices in an integrated manner, leading to mistakes
that can compromise scientific validity. For instance, generalized linear
mixed-effects models (GLMMs) help answer complex research questions, but
omitting random effects impairs the generalizability of results. To address
this need, we present Tisane, a mixed-initiative system for authoring
generalized linear models with and without mixed-effects. Tisane introduces a
study design specification language for expressing and asking questions about
relationships between variables. Tisane contributes an interactive compilation
process that represents relationships in a graph, infers candidate statistical
models, and asks follow-up questions to disambiguate user queries to construct
a valid model. In case studies with three researchers, we find that Tisane
helps them focus on their goals and assumptions while avoiding past mistakes.
- Abstract(参考訳): 適切な統計モデリングは、概念がどのように関連しているかとデータの計測方法の詳細についてドメイン理論を取り入れている。
しかし、現在データアナリストは、ドメインの仮定、データ収集、モデリングの選択を統合的に記録および推論するためのツールサポートを欠いているため、科学的妥当性を損なう可能性がある。
例えば、一般化線形混合影響モデル(GLMM)は複雑な研究の質問に答えるのに役立つが、ランダム効果を省略することは結果の一般化を損なう。
そこで,本研究では一般化線形モデルを作成するための混合イニシアティブシステム tisane を提案する。
tisane氏は変数間の関係を表現し、質問するための研究設計仕様言語を紹介している。
Tisaneは、グラフ内の関係を表すインタラクティブなコンパイルプロセスを提供し、候補となる統計モデルを推論し、ユーザクエリを曖昧にするためにフォローアップ質問を行い、有効なモデルを構築する。
3人の研究者によるケーススタディでは、Tisaneが過去のミスを避けながら目標や仮定に集中するのに役立ちます。
関連論文リスト
- Ablation Based Counterfactuals [7.481286710933861]
ABC (Ablation Based Counterfactuals) は、モデル再訓練ではなくモデルアブレーションに依存する反ファクト解析を行う手法である。
拡散モデルの集合を用いてこのようなモデルを構築する方法を示す。
次に、このモデルを用いて、完全な対物的景観を列挙することで、トレーニングデータ属性の限界を研究する。
論文 参考訳(メタデータ) (2024-06-12T06:22:51Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Debiasing Multimodal Models via Causal Information Minimization [65.23982806840182]
我々は、マルチモーダルデータのための因果グラフにおいて、共同創設者から生じるバイアスを研究する。
ロバストな予測機能は、モデルがアウト・オブ・ディストリビューションデータに一般化するのに役立つ多様な情報を含んでいる。
これらの特徴を共同設立者表現として使用し、因果理論によって動機づけられた手法を用いてモデルからバイアスを取り除く。
論文 参考訳(メタデータ) (2023-11-28T16:46:14Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Discovering Mixtures of Structural Causal Models from Time Series Data [23.18511951330646]
基礎となる因果モデルを推測するために, MCD と呼ばれる一般的な変分推論に基づくフレームワークを提案する。
このアプローチでは、データ可能性のエビデンス-ローバウンドを最大化するエンドツーエンドのトレーニングプロセスを採用しています。
本研究では,本手法が因果発見タスクにおける最先端のベンチマークを上回ることを実証する。
論文 参考訳(メタデータ) (2023-10-10T05:13:10Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Sharing pattern submodels for prediction with missing values [12.981974894538668]
機械学習の多くのアプリケーションでは欠落値は避けられず、トレーニング中もテスト時にも課題が提示される。
パターンサブモデル(パターンサブモデル)と呼ばれる別の手法を提案する。これは、テスト時に欠落した値に対して、予測を堅牢にし、パターンサブモデルの予測力を維持または改善させる。
論文 参考訳(メタデータ) (2022-06-22T15:09:40Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Causal Inference with Deep Causal Graphs [0.0]
パラメトリック因果モデリング技術は、カウンターファクト推定の機能を提供することはめったにない。
Deep Causal Graphsは、因果分布をモデル化するニューラルネットワークに必要な機能の抽象的な仕様である。
複雑な相互作用をモデル化する上で,その表現力を示し,機械学習の説明可能性と公正性を示す。
論文 参考訳(メタデータ) (2020-06-15T13:03:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。