Fugu-MT 論文翻訳(概要): Healthsheet: Development of a Transparency Artifact for Health Datasets

論文の概要: Healthsheet: Development of a Transparency Artifact for Health Datasets

arxiv url: http://arxiv.org/abs/2202.13028v1
Date: Sat, 26 Feb 2022 01:05:55 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-04 10:39:50.980145
Title: Healthsheet: Development of a Transparency Artifact for Health Datasets
Title（参考訳）: healthsheet: 健康データセットのための透明性アーティファクトの開発
Authors: Negar Rostamzadeh, Diana Mincu, Subhrajit Roy, Andrew Smart, Lauren Wilcox, Mahima Pushkarna, Jessica Schrouff, Razvan Amironesei, Nyalleng Moorosi, Katherine Heller
Abstract要約: 健康に配慮したアンケートデータシートであるHealthsheetを紹介した。ケーススタディとして、公開可能な3つの医療データセットと連携しています。
参考スコア（独自算出の注目度）: 13.57051456780329
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Machine learning (ML) approaches have demonstrated promising results in a wide range of healthcare applications. Data plays a crucial role in developing ML-based healthcare systems that directly affect people's lives. Many of the ethical issues surrounding the use of ML in healthcare stem from structural inequalities underlying the way we collect, use, and handle data. Developing guidelines to improve documentation practices regarding the creation, use, and maintenance of ML healthcare datasets is therefore of critical importance. In this work, we introduce Healthsheet, a contextualized adaptation of the original datasheet questionnaire ~\cite{gebru2018datasheets} for health-specific applications. Through a series of semi-structured interviews, we adapt the datasheets for healthcare data documentation. As part of the Healthsheet development process and to understand the obstacles researchers face in creating datasheets, we worked with three publicly-available healthcare datasets as our case studies, each with different types of structured data: Electronic health Records (EHR), clinical trial study data, and smartphone-based performance outcome measures. Our findings from the interviewee study and case studies show 1) that datasheets should be contextualized for healthcare, 2) that despite incentives to adopt accountability practices such as datasheets, there is a lack of consistency in the broader use of these practices 3) how the ML for health community views datasheets and particularly \textit{Healthsheets} as diagnostic tool to surface the limitations and strength of datasets and 4) the relative importance of different fields in the datasheet to healthcare concerns.
Abstract（参考訳）: 機械学習(ML)アプローチは、幅広い医療アプリケーションで有望な結果を示している。データは、人々の生活に直接影響を与えるMLベースの医療システムの開発において重要な役割を果たす。医療におけるMLの使用に関する倫理的問題の多くは、データの収集、使用、処理方法の根底にある構造的不平等に起因する。したがって、mlヘルスケアデータセットの作成、使用、保守に関するドキュメンテーションプラクティスを改善するためのガイドラインの開発が極めて重要である。そこで本研究では,健康に特有なアプリケーションに対して,オリジナルのデータシートアンケート ~\cite{gebru2018datasheets} を文脈順応したhealthsheetを提案する。一連の半構造化インタビューを通じて、医療データドキュメントにデータシートを適用する。 Healthsheetの開発プロセスの一環として、研究者がデータシートを作成する上で直面する障害を理解するために、我々は3つの公開可能な医療データセットをケーススタディとして、それぞれ異なるタイプの構造化データであるElectronic Health Records(EHR)、臨床試験データ、スマートフォンベースのパフォーマンス結果測定に取り組みました。インタビュアー研究から得られた知見とケーススタディから 1)データシートは医療のためにコンテキスト化されるべきである。 2)データシートなどのアカウンタビリティプラクティスの採用のインセンティブにもかかわらず,これらのプラクティスの広範な使用には一貫性が欠如していること。 3) 健康コミュニティのためのMLは、データセットの制限と強度を明らかにするための診断ツールとして、データシート、特に‘textit{Healthsheets’をどう見ているか。 4) 医療上の問題に対するデータシートの異なる分野の重要性。

関連論文リスト

Datasheets for Healthcare AI: A Framework for Transparency and Bias Mitigation [0.0]
トレーニングデータセットにおけるバイアス、データ不完全性、不正確性は、不公平な結果をもたらし、既存の格差を増幅する。透明性を促進し,規制要件との整合性を確保するためのデータセットドキュメンテーションフレームワークを提案する。この発見は、責任あるAI開発を促進する上で、データセットドキュメンテーションの重要性を強調している。
論文参考訳（メタデータ） (2025-01-09T23:36:34Z)
Self-Supervised Learning for Graph-Structured Data in Healthcare Applications: A Comprehensive Review [1.5778541636044452]
このレビューは、医療におけるグラフ構造化データに自己教師付き学習(SSL)を活用することを目指す研究者と実践者の両方にとって、貴重なリソースになることを目的としている。私たちの知る限りでは、この研究は、医療におけるグラフデータに適用されたSSLに関する文献の包括的なレビューとして、初めてのものである。
論文参考訳（メタデータ） (2024-11-28T10:51:12Z)
A Survey of Medical Vision-and-Language Applications and Their Techniques [48.268198631277315]
医療ビジョン・アンド・ランゲージモデル(MVLM)は、複雑な医療データを解釈するための自然言語インタフェースを提供する能力から、大きな関心を集めている。本稿では,MVLMの概要と適用した各種医療課題について概観する。また、これらのタスクに使用するデータセットについても検討し、標準化された評価指標に基づいて異なるモデルの性能を比較した。
論文参考訳（メタデータ） (2024-11-19T03:27:05Z)
Large Language Model Benchmarks in Medical Tasks [11.196196955468992]
本稿では,医療用大規模言語モデル(LLM)タスクに使用される様々なベンチマークデータセットについて調査する。調査では、データセットをモダリティで分類し、その重要性、データ構造、LLMの開発への影響について論じている。この論文は、言語多様性、構造化オミクスデータ、および合成に対する革新的なアプローチを含むデータセットの必要性を強調している。
論文参考訳（メタデータ） (2024-10-28T11:07:33Z)
FEDMEKI: A Benchmark for Scaling Medical Foundation Models via Federated Knowledge Injection [83.54960238236548]
FEDMEKIはデータのプライバシーを守るだけでなく、医療基盤モデルの能力を高める。 FEDMEKIは、医療ファンデーションモデルに対して、直接データを公開することなく、幅広い医療知識から学ぶことを可能にする。
論文参考訳（メタデータ） (2024-08-17T15:18:56Z)
When Raw Data Prevails: Are Large Language Model Embeddings Effective in Numerical Data Representation for Medical Machine Learning Applications? [8.89829757177796]
大規模言語モデルの最後の隠れ状態からベクター表現が医療診断および予後に有効であることを示す。我々は,異常な生理的データを表すため,ゼロショット設定の命令調整LDMに着目し,それらのユーティリティを特徴抽出器として評価する。医学MLタスクでは生データの特徴が依然として有効であることが示唆されているが、ゼロショットLSM埋め込みは競争力のある結果を示している。
論文参考訳（メタデータ） (2024-08-15T03:56:40Z)
A Comprehensive Survey on Evaluating Large Language Model Applications in the Medical Industry [2.1717945745027425]
大規模言語モデル(LLM)は、言語理解と生成の高度な能力で様々な産業に影響を与えている。この包括的調査は、医療におけるLSMの広範な適用と必要な評価を概説する。本調査は,臨床環境,医療用テキストデータ処理,研究,教育,公衆衛生への意識といった分野におけるLCM応用の詳細な分析を行うために構成されている。
論文参考訳（メタデータ） (2024-04-24T09:55:24Z)
The METRIC-framework for assessing data quality for trustworthy AI in medicine: a systematic review [0.0]
信頼できるAIの開発は特に医学において重要である。ディープラーニング(DL)におけるデータ品質(トレーニング/テスト)の重要性に焦点を当てる。本稿では,医療訓練データのための特化データ品質フレームワークであるMETRICフレームワークを提案する。
論文参考訳（メタデータ） (2024-02-21T09:15:46Z)
Clairvoyance: A Pipeline Toolkit for Medical Time Series [95.22483029602921]
時系列学習は、データ駆動の*クリニカルな意思決定支援のパンとバターである* Clairvoyanceは、ソフトウェアツールキットとして機能する、統合されたエンドツーエンドのオートMLフレンドリなパイプラインを提案する。 Clairvoyanceは、臨床時系列MLのための包括的で自動化可能なパイプラインの生存可能性を示す最初のものである。
論文参考訳（メタデータ） (2023-10-28T12:08:03Z)
Interpretable Medical Diagnostics with Structured Data Extraction by Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2023-06-08T09:12:28Z)
Development and validation of a natural language processing algorithm to pseudonymize documents in the context of a clinical data warehouse [53.797797404164946]
この研究は、この領域でツールやリソースを共有する際に直面する困難を浮き彫りにしている。臨床文献のコーパスを12種類に分類した。私たちは、ディープラーニングモデルと手動ルールの結果をマージして、ハイブリッドシステムを構築します。
論文参考訳（メタデータ） (2023-03-23T17:17:46Z)
How to Leverage Multimodal EHR Data for Better Medical Predictions? [13.401754962583771]
電子健康記録(EHR)データの複雑さは、ディープラーニングの適用の課題である。本稿では,まずEHRから臨床ノートを抽出し,これらのデータを統合する方法を提案する。 2つの医療予測タスクの結果、異なるデータを持つ融合モデルが最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2021-10-29T13:26:05Z)
VBridge: Connecting the Dots Between Features, Explanations, and Data for Healthcare Models [85.4333256782337]
VBridgeは、臨床医の意思決定ワークフローに機械学習の説明をシームレスに組み込むビジュアル分析ツールである。我々は,臨床医がMLの特徴に慣れていないこと,文脈情報の欠如,コホートレベルの証拠の必要性など,3つの重要な課題を特定した。症例スタディと専門医4名のインタビューを通じて, VBridgeの有効性を実証した。
論文参考訳（メタデータ） (2021-08-04T17:34:13Z)
MIMO: Mutual Integration of Patient Journey and Medical Ontology for Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文参考訳（メタデータ） (2021-07-20T07:04:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。