論文の概要: Can I trust my fake data -- A comprehensive quality assessment framework
for synthetic tabular data in healthcare
- arxiv url: http://arxiv.org/abs/2401.13716v1
- Date: Wed, 24 Jan 2024 08:14:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-26 16:47:26.307357
- Title: Can I trust my fake data -- A comprehensive quality assessment framework
for synthetic tabular data in healthcare
- Title(参考訳): 医療における表データ合成のための総合的品質評価フレームワーク
- Authors: Vibeke Binz Vallevik, Aleksandar Babic, Serena Elizabeth Marshall,
Severin Elvatun, Helga Br{\o}gger, Sharmini Alagaratnam, Bj{\o}rn Edwin,
Narasimha Raghavan Veeraragavan, Anne Kjersti Befring, Jan Franz Nyg{\aa}rd
- Abstract要約: プライバシー上の懸念と規制上の要求に応えて、合成データの使用が提案されている。
医療におけるAI応用のためのSDの品質保証のための概念的枠組みを提案する。
現実のアプリケーションをサポートするために必要なステージを提案する。
- 参考スコア(独自算出の注目度): 33.855237079128955
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ensuring safe adoption of AI tools in healthcare hinges on access to
sufficient data for training, testing and validation. In response to privacy
concerns and regulatory requirements, using synthetic data has been suggested.
Synthetic data is created by training a generator on real data to produce a
dataset with similar statistical properties. Competing metrics with differing
taxonomies for quality evaluation have been suggested, resulting in a complex
landscape. Optimising quality entails balancing considerations that make the
data fit for use, yet relevant dimensions are left out of existing frameworks.
We performed a comprehensive literature review on the use of quality evaluation
metrics on SD within the scope of tabular healthcare data and SD made using
deep generative methods. Based on this and the collective team experiences, we
developed a conceptual framework for quality assurance. The applicability was
benchmarked against a practical case from the Dutch National Cancer Registry.
We present a conceptual framework for quality assurance of SD for AI
applications in healthcare that aligns diverging taxonomies, expands on common
quality dimensions to include the dimensions of Fairness and Carbon footprint,
and proposes stages necessary to support real-life applications. Building trust
in synthetic data by increasing transparency and reducing the safety risk will
accelerate the development and uptake of trustworthy AI tools for the benefit
of patients. Despite the growing emphasis on algorithmic fairness and carbon
footprint, these metrics were scarce in the literature review. The overwhelming
focus was on statistical similarity using distance metrics while sequential
logic detection was scarce. A consensus-backed framework that includes all
relevant quality dimensions can provide assurance for safe and responsible
real-life applications of SD.
- Abstract(参考訳): 医療におけるAIツールの安全な採用を保証するには、トレーニング、テスト、検証に十分なデータにアクセスする必要がある。
プライバシの懸念と規制要件に応じて、合成データの使用が提案されている。
合成データは、実データ上でジェネレータをトレーニングして、同様の統計特性を持つデータセットを生成することによって生成される。
品質評価のために異なる分類体系でメトリクスを競合させることが提案され、複雑な景観をもたらす。
品質の最適化には、データの利用に適合する考慮事項のバランスが伴うが、関連する次元は既存のフレームワークから除外される。
本研究は,表型医療データと深層生成法を用いたsdの範囲内におけるsdの品質評価指標の利用について,総合的な文献レビューを行った。
これとチーム全体の経験に基づいて、品質保証の概念的なフレームワークを開発しました。
適用性はオランダ国立がん登録簿の実践例と比較された。
本稿では,医療におけるaiアプリケーションにおけるsdの品質保証のための概念的枠組みを提案し,公平性と炭素フットプリントの次元を含む共通品質次元を拡張し,実生活アプリケーションをサポートするために必要な段階を提案する。
透明性を高め、安全性のリスクを減らすことで、合成データへの信頼を構築することは、患者のために信頼できるAIツールの開発と獲得を促進する。
アルゴリズムの公正さと炭素フットプリントに重点を置いているにもかかわらず、これらの指標は文献レビューでは乏しかった。
主眼は, 逐次論理検出が不十分な間, 距離メトリクスを用いた統計的類似性であった。
関連するすべての品質ディメンションを含む合意に基づくフレームワークは、sdの安全かつ責任ある実生活アプリケーションを保証することができる。
関連論文リスト
- Privacy-Preserving SAM Quantization for Efficient Edge Intelligence in Healthcare [9.381558154295012]
Segment Anything Model (SAM) はインテリジェントなイメージセグメンテーションに優れている。
SAMはリソース制限されたエッジデバイスにデプロイする上で大きな課題となる。
本研究では,原データなしで量子化パラメータを学習・校正する DFQ-SAM という,SAM のためのデータフリー量子化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-14T10:43:35Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [69.4501863547618]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に着目し, 完全性, 幻覚, 不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z) - Scorecards for Synthetic Medical Data Evaluation and Reporting [2.8262986891348056]
医療におけるAI駆動ツールのトレーニングおよびテストにおける合成医療データ(SMD)の利用の増加には、その品質を評価するための体系的なフレームワークが必要である。
本稿では,医療応用のユニークな要件を満たすために設計された評価フレームワークについて概説する。
人工的に生成されたデータセットに付随する総合的なレポートとして機能するスコアカードの概念を導入する。
論文 参考訳(メタデータ) (2024-06-17T02:11:59Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - Statistical properties and privacy guarantees of an original
distance-based fully synthetic data generation method [0.0]
この研究は、多段階のフレームワークを用いて、公開リリース可能な合成データを生成する技術的実現可能性を示す。
新たな多段階合成データ生成フレームワークを用いて生成したデータの質を評価することで,Open-CESPイニシアチブの技術的,概念的健全性を実証した。
論文 参考訳(メタデータ) (2023-10-10T12:29:57Z) - Privacy-Preserving Medical Image Classification through Deep Learning
and Matrix Decomposition [0.0]
近年,医学領域において深層学習(DL)ソリューションが広く研究されている。
医療関連データの利用は厳格に規制されており、病院の外部で医療記録を処理するためには、堅牢なデータ保護措置が必要である。
本稿では, 特異値分解(SVD)と主成分分析(PCA)を用いて, DL解析に使用する前に, 医用画像の難読化を行う。
保護されたデータから関連する情報を抽出するDLアルゴリズムの能力は、難読化フレームに基づく血管造影ビュー分類のタスクに基づいて評価される。
論文 参考訳(メタデータ) (2023-08-31T08:21:09Z) - QI2 -- an Interactive Tool for Data Quality Assurance [63.379471124899915]
欧州委員会による計画されたAI法では、データ品質に関する法的要件が規定されている。
複数のデータ品質面におけるデータ品質保証プロセスをサポートする新しいアプローチを導入する。
論文 参考訳(メタデータ) (2023-07-07T07:06:38Z) - Non-Imaging Medical Data Synthesis for Trustworthy AI: A Comprehensive
Survey [6.277848092408045]
データ品質は、医療において信頼できるAIを開発する上で重要な要素である。
高品質なデータセットへのアクセスは、データ取得の技術的困難によって制限される。
医療データの大規模な共有は、厳格な倫理的制約によって妨げられている。
論文 参考訳(メタデータ) (2022-09-17T13:34:17Z) - Privacy-preserving medical image analysis [53.4844489668116]
医用画像におけるプライバシ保護機械学習(PPML)のためのソフトウェアフレームワークであるPriMIAを提案する。
集合型学習モデルの分類性能は,未発見データセットの人間専門家と比較して有意に良好である。
グラデーションベースのモデル反転攻撃に対するフレームワークのセキュリティを実証的に評価する。
論文 参考訳(メタデータ) (2020-12-10T13:56:00Z) - GO FIGURE: A Meta Evaluation of Factuality in Summarization [131.1087461486504]
本稿では,現実性評価指標を評価するメタ評価フレームワークGO FIGUREを紹介する。
10個の実測値のベンチマーク分析により、我々のフレームワークが堅牢で効率的な評価を提供することが明らかとなった。
また、QAメトリクスは、ドメイン間の事実性を測定する標準的なメトリクスよりも一般的に改善されているが、パフォーマンスは、質問を生成する方法に大きく依存していることも明らかにしている。
論文 参考訳(メタデータ) (2020-10-24T08:30:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。