論文の概要: Why we should respect analysis results as data
- arxiv url: http://arxiv.org/abs/2204.09959v1
- Date: Thu, 21 Apr 2022 08:34:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 16:22:33.843300
- Title: Why we should respect analysis results as data
- Title(参考訳): 分析結果をデータとして尊重すべき理由
- Authors: Joana M Barros, Lukas A Widmer, Mark Baillie, Simon Wandel
- Abstract要約: 臨床研究データの解析も結果の形でデータを生成するのが一般的である。
知見を文脈に組み込んだ分析は科学的研究の基盤となっているが、分析結果はしばしばデータソースとして無視される。
本稿では,分析結果標準と共通データモデルを組み合わせた「一度計算し,何度も使用」する手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development and approval of new treatments generates large volumes of
results, such as summaries of efficacy and safety. However, it is commonly
overlooked that analyzing clinical study data also produces data in the form of
results. For example, descriptive statistics and model predictions are data.
Although integrating and putting findings into context is a cornerstone of
scientific work, analysis results are often neglected as a data source. Results
end up stored as "data products" such as PDF documents that are not machine
readable or amenable to future analysis. We propose a solution to "calculate
once, use many times" by combining analysis results standards with a common
data model. This analysis results data model re-frames the target of analyses
from static representations of the results (e.g., tables and figures) to a data
model with applications in various contexts, including knowledge discovery.
Further, we provide a working proof of concept detailing how to approach
analyses standardization and construct a schema to store and query analysis
results.
- Abstract(参考訳): 新しい治療法の開発と承認は、有効性と安全性の要約のような大量の結果を生み出す。
しかし、臨床研究データの解析も結果の形でデータを生成するのが一般的である。
例えば、記述統計とモデル予測はデータである。
分析結果を文脈に統合することは科学的研究の基盤であるが、分析結果はしばしばデータソースとして無視される。
結果がPDFドキュメントなどの“データ製品”として格納され、マシンが読みやすく、将来の分析に適さない。
分析結果標準と共通データモデルを組み合わせて,「一度だけ計算し,何度も使用する」解決策を提案する。
この分析の結果、データモデルは、結果の静的表現(例えば、表や図)から、知識発見を含むさまざまなコンテキストのアプリケーションを含むデータモデルへの分析のターゲットを再構築する。
さらに,分析の標準化へのアプローチを詳述し,分析結果を保存・照会するためのスキーマを構築するための概念実証を行う。
関連論文リスト
- Bayesian Federated Inference for Survival Models [0.0]
がん研究において、全体的な生存と進行の自由生存は、しばしばコックスモデルで分析される。
異なる医療センターのデータセットをマージすることは役に立つかもしれないが、厳格なプライバシー法とロジスティックな困難のために、これは必ずしも可能ではない。
近年,一般化線形モデルに対するベイズ連邦推論(BFI)戦略が提案されている。
論文 参考訳(メタデータ) (2024-04-26T15:05:26Z) - Fusion of Gaussian Processes Predictions with Monte Carlo Sampling [61.31380086717422]
科学と工学において、私たちはしばしば興味のある変数の正確な予測のために設計されたモデルで作業します。
これらのモデルが現実の近似であることを認識し、複数のモデルを同じデータに適用し、結果を統合することが望ましい。
論文 参考訳(メタデータ) (2024-03-03T04:21:21Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - Using causal inference to avoid fallouts in data-driven parametric
analysis: a case study in the architecture, engineering, and construction
industry [0.7566148383213173]
実世界の実装における意思決定プロセスは、データ駆動モデルへの依存の高まりに影響を受けています。
本研究では,データ駆動手法,経験的ドメイン知識,第一原理シミュレーションの相乗パターンについて検討した。
論文 参考訳(メタデータ) (2023-09-11T13:54:58Z) - Utility Assessment of Synthetic Data Generation Methods [0.0]
完全合成データを生成する方法が,その実用性に相違があるかどうかを考察する。
ボード上の他の方法よりもパフォーマンスがよい方法がいくつかあります。
機械学習モデルのトレーニングに合成データを使用する場合、分類タスクに対して有望な結果が得られる。
論文 参考訳(メタデータ) (2022-11-23T11:09:52Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Similarities and Differences between Machine Learning and Traditional
Advanced Statistical Modeling in Healthcare Analytics [0.6999740786886537]
機械学習と統計モデリングは、同様の数学的原理に基づいて補完的である。
優れたアナリストとデータサイエンティストは、技術と適切な応用の両方に精通しているべきです。
論文 参考訳(メタデータ) (2022-01-07T14:36:46Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - Competency Problems: On Finding and Removing Artifacts in Language Data [50.09608320112584]
複雑な言語理解タスクでは、すべての単純な特徴相関が突発的であると論じる。
人間バイアスを考慮したコンピテンシー問題に対するデータ作成の難しさを理論的に分析します。
論文 参考訳(メタデータ) (2021-04-17T21:34:10Z) - Categorical exploratory data analysis on goodness-of-fit issues [0.6091702876917279]
我々はCategorical Exploratory Data Analysis (CEDA)と呼ばれるデータ分析パラダイムを活用することを提案する。
CEDAは、複数の重要な分散的な側面を通じて、各データがモデル形状に適合するか、どのように一致するかを明らかにします。
我々は,CEDAをデータサイエンス教育におけるデータ分析の第一の方法として活用することの利点を,グラフィック表示により明らかにする。
論文 参考訳(メタデータ) (2020-11-19T06:11:06Z) - Performance metrics for intervention-triggering prediction models do not
reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。
振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。
予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文 参考訳(メタデータ) (2020-06-02T16:26:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。