論文の概要: Healthsheet: Development of a Transparency Artifact for Health Datasets
- arxiv url: http://arxiv.org/abs/2202.13028v1
- Date: Sat, 26 Feb 2022 01:05:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 10:39:50.980145
- Title: Healthsheet: Development of a Transparency Artifact for Health Datasets
- Title(参考訳): healthsheet: 健康データセットのための透明性アーティファクトの開発
- Authors: Negar Rostamzadeh, Diana Mincu, Subhrajit Roy, Andrew Smart, Lauren
Wilcox, Mahima Pushkarna, Jessica Schrouff, Razvan Amironesei, Nyalleng
Moorosi, Katherine Heller
- Abstract要約: 健康に配慮したアンケートデータシートであるHealthsheetを紹介した。
ケーススタディとして、公開可能な3つの医療データセットと連携しています。
- 参考スコア(独自算出の注目度): 13.57051456780329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning (ML) approaches have demonstrated promising results in a
wide range of healthcare applications. Data plays a crucial role in developing
ML-based healthcare systems that directly affect people's lives. Many of the
ethical issues surrounding the use of ML in healthcare stem from structural
inequalities underlying the way we collect, use, and handle data. Developing
guidelines to improve documentation practices regarding the creation, use, and
maintenance of ML healthcare datasets is therefore of critical importance. In
this work, we introduce Healthsheet, a contextualized adaptation of the
original datasheet questionnaire ~\cite{gebru2018datasheets} for
health-specific applications. Through a series of semi-structured interviews,
we adapt the datasheets for healthcare data documentation. As part of the
Healthsheet development process and to understand the obstacles researchers
face in creating datasheets, we worked with three publicly-available healthcare
datasets as our case studies, each with different types of structured data:
Electronic health Records (EHR), clinical trial study data, and
smartphone-based performance outcome measures. Our findings from the
interviewee study and case studies show 1) that datasheets should be
contextualized for healthcare, 2) that despite incentives to adopt
accountability practices such as datasheets, there is a lack of consistency in
the broader use of these practices 3) how the ML for health community views
datasheets and particularly \textit{Healthsheets} as diagnostic tool to surface
the limitations and strength of datasets and 4) the relative importance of
different fields in the datasheet to healthcare concerns.
- Abstract(参考訳): 機械学習(ML)アプローチは、幅広い医療アプリケーションで有望な結果を示している。
データは、人々の生活に直接影響を与えるMLベースの医療システムの開発において重要な役割を果たす。
医療におけるMLの使用に関する倫理的問題の多くは、データの収集、使用、処理方法の根底にある構造的不平等に起因する。
したがって、mlヘルスケアデータセットの作成、使用、保守に関するドキュメンテーションプラクティスを改善するためのガイドラインの開発が極めて重要である。
そこで本研究では,健康に特有なアプリケーションに対して,オリジナルのデータシートアンケート ~\cite{gebru2018datasheets} を文脈順応したhealthsheetを提案する。
一連の半構造化インタビューを通じて、医療データドキュメントにデータシートを適用する。
Healthsheetの開発プロセスの一環として、研究者がデータシートを作成する上で直面する障害を理解するために、我々は3つの公開可能な医療データセットをケーススタディとして、それぞれ異なるタイプの構造化データであるElectronic Health Records(EHR)、臨床試験データ、スマートフォンベースのパフォーマンス結果測定に取り組みました。
インタビュアー研究から得られた知見とケーススタディから
1)データシートは医療のためにコンテキスト化されるべきである。
2)データシートなどのアカウンタビリティプラクティスの採用のインセンティブにもかかわらず,これらのプラクティスの広範な使用には一貫性が欠如していること。
3) 健康コミュニティのためのMLは、データセットの制限と強度を明らかにするための診断ツールとして、データシート、特に‘textit{Healthsheets’をどう見ているか。
4) 医療上の問題に対するデータシートの異なる分野の重要性。
関連論文リスト
- The METRIC-framework for assessing data quality for trustworthy AI in
medicine: a systematic review [0.0]
信頼できるAIの開発は特に医学において重要である。
ディープラーニング(DL)におけるデータ品質(トレーニング/テスト)の重要性に焦点を当てる。
本稿では,医療訓練データのための特化データ品質フレームワークであるMETRICフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-21T09:15:46Z) - Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである*
Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。
Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文 参考訳(メタデータ) (2023-10-28T12:08:03Z) - SDOH-NLI: a Dataset for Inferring Social Determinants of Health from
Clinical Notes [13.991819517682574]
社会的および行動的健康決定因子(SDOH)は、健康結果を形成する上で重要な役割を果たす。
このタスクにNLPメソッドを使うことの進歩は、高品質な公開ラベル付きデータの不足によって妨げられている。
本稿では,公開ノートをベースとした新たなデータセットであるSDOH-NLIを紹介する。
論文 参考訳(メタデータ) (2023-10-27T19:09:30Z) - An Analysis on Large Language Models in Healthcare: A Case Study of
BioBERT [0.0]
本稿では,大規模言語モデル,特にBioBERTを医療に応用するための包括的調査を行う。
この分析は、医療領域のユニークなニーズを満たすために、BioBERTを微調整するための体系的な方法論を概説している。
本論文は、倫理的考察、特に患者のプライバシーとデータセキュリティを徹底的に検討する。
論文 参考訳(メタデータ) (2023-10-11T08:16:35Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - The Design and Implementation of a National AI Platform for Public
Healthcare in Italy: Implications for Semantics and Interoperability [62.997667081978825]
イタリア国立衛生局は、その技術機関を通じて人工知能を採用している。
このような広大なプログラムには、知識領域の形式化に特別な注意が必要である。
AIが患者、開業医、健康システムに与える影響について疑問が投げかけられている。
論文 参考訳(メタデータ) (2023-04-24T08:00:02Z) - Development and validation of a natural language processing algorithm to
pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。
臨床文献のコーパスを12種類に分類した。
私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文 参考訳(メタデータ) (2023-03-23T17:17:46Z) - Machine Learning for Multimodal Electronic Health Records-based
Research: Challenges and Perspectives [22.230972071321357]
電子健康記録は患者の健康史に関する豊富な情報を含んでいる。
構造化されたデータに頼ることは 患者の包括的情報を反映するのに 不十分かもしれない
多くの研究が、構造化されていない自由テキストデータも取り入れることで、より正確な結果を得ようとしている。
論文 参考訳(メタデータ) (2021-11-09T01:19:11Z) - How to Leverage Multimodal EHR Data for Better Medical Predictions? [13.401754962583771]
電子健康記録(EHR)データの複雑さは、ディープラーニングの適用の課題である。
本稿では,まずEHRから臨床ノートを抽出し,これらのデータを統合する方法を提案する。
2つの医療予測タスクの結果、異なるデータを持つ融合モデルが最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-29T13:26:05Z) - VBridge: Connecting the Dots Between Features, Explanations, and Data
for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。
我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。
症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文 参考訳(メタデータ) (2021-08-04T17:34:13Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。