論文の概要: Privacy in Image Datasets: A Case Study on Pregnancy Ultrasounds
- arxiv url: http://arxiv.org/abs/2602.07149v1
- Date: Fri, 06 Feb 2026 19:47:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.471444
- Title: Privacy in Image Datasets: A Case Study on Pregnancy Ultrasounds
- Title(参考訳): 画像データセットにおけるプライバシ:妊娠超音波の事例研究
- Authors: Rawisara Lohanimit, Yankun Wu, Amelia Katirai, Yuta Nakashima, Noa Garcia,
- Abstract要約: この研究は妊娠中の超音波画像の存在を探索し、機密性の高い個人情報を蓄積し、しばしばオンラインで共有される。
妊娠中の超音波画像を取得し, 名前や位置情報など, 何千もの個人情報を検知する。
その結果,複数の画像にリスクの高い情報があり,再識別や偽造が可能であることがわかった。
- 参考スコア(独自算出の注目度): 18.713340629300102
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rise of generative models has led to increased use of large-scale datasets collected from the internet, often with minimal or no data curation. This raises concerns about the inclusion of sensitive or private information. In this work, we explore the presence of pregnancy ultrasound images, which contain sensitive personal information and are often shared online. Through a systematic examination of LAION-400M dataset using CLIP embedding similarity, we retrieve images containing pregnancy ultrasound and detect thousands of entities of private information such as names and locations. Our findings reveal that multiple images have high-risk information that could enable re-identification or impersonation. We conclude with recommended practices for dataset curation, data privacy, and ethical use of public image datasets.
- Abstract(参考訳): 生成モデルの台頭により、インターネットから収集された大規模なデータセットの使用が増加し、多くの場合、データキュレーションが最小あるいは無くなった。
これにより、機密情報や個人情報の扱いに関する懸念が高まる。
本研究では, 妊娠中の超音波画像の存在を探索し, 機密性の高い個人情報を蓄積し, オンラインで共有されることも多い。
CLIP埋め込み類似性を用いたLAION-400Mデータセットの系統的検討により、妊娠中の超音波画像を取得し、名前や位置情報などの何千もの個人情報を検知する。
その結果,複数の画像にリスクの高い情報があり,再識別や偽造が可能であることがわかった。
我々は、データセットのキュレーション、データのプライバシ、パブリックイメージデータセットの倫理的利用に関する推奨プラクティスで締めくくります。
関連論文リスト
- De-Identification of Medical Imaging Data: A Comprehensive Tool for Ensuring Patient Privacy [4.376648893167674]
オープンソースツールを使用して、DICOMの磁気共鳴画像、コンピュータ画像、スライド画像全体、および磁気共鳴twixの生データを識別することができる。
複数種類の入力のための精巧な匿名化パイプラインを備えており、画像データの非識別に使用される追加ツールの必要性を低減している。
論文 参考訳(メタデータ) (2024-10-16T09:31:24Z) - A Unified View of Differentially Private Deep Generative Modeling [60.72161965018005]
プライバシー上の懸念のあるデータには、データアクセスとデータ共有を頻繁に禁止する厳格な規制が伴う。
これらの障害を克服することは、プライバシーに敏感なデータを含む多くの現実世界のアプリケーションシナリオにおいて、技術的進歩の鍵となる。
差分的プライベート(DP)データパブリッシングは、データの衛生化された形式のみを公開する、魅力的なソリューションを提供する。
論文 参考訳(メタデータ) (2023-09-27T14:38:16Z) - Removing confounding information from fetal ultrasound images [1.6624933615451838]
医学画像に埋め込まれたテキストやマーキングの形で情報を融合することは、診断深層学習アルゴリズムの訓練に深刻な影響を与える可能性がある。
皮膚科では、悪性病変の画像で過剰に表現される図面や定規が知られている。
本稿では,胎児検診用超音波スキャンを含む国立データベース上の画像上にテキストとキャリパーを配置した。
論文 参考訳(メタデータ) (2023-03-24T11:13:33Z) - Private, fair and accurate: Training large-scale, privacy-preserving AI models in medical imaging [47.99192239793597]
我々は,AIモデルのプライバシ保護トレーニングが,非プライベートトレーニングと比較して精度と公平性に与える影響を評価した。
我々の研究は、実際の臨床データセットの困難な現実的な状況下では、診断深層学習モデルのプライバシー保護トレーニングは、優れた診断精度と公正さで可能であることを示しています。
論文 参考訳(メタデータ) (2023-02-03T09:49:13Z) - ConfounderGAN: Protecting Image Data Privacy with Causal Confounder [85.6757153033139]
本稿では,GAN(Generative Adversarial Network)のConfounderGANを提案する。
実験は、3つの自然なオブジェクトデータセットと3つの医療データセットからなる6つの画像分類データセットで実施される。
論文 参考訳(メタデータ) (2022-12-04T08:49:14Z) - Voice-assisted Image Labelling for Endoscopic Ultrasound Classification
using Neural Networks [48.732863591145964]
本稿では,臨床医が提示した生音声からのEUS画像にラベルを付けるマルチモーダル畳み込みニューラルネットワークアーキテクチャを提案する。
その結果,5つのラベルを持つデータセットにおいて,画像レベルでの予測精度は76%であった。
論文 参考訳(メタデータ) (2021-10-12T21:22:24Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z) - A Deep Learning Approach to Private Data Sharing of Medical Images Using
Conditional GANs [1.2099130772175573]
COSENTYX (secukinumab) Ankylosing Spondylitis の臨床的検討に基づいて合成データセットを生成する方法を提案する。
本稿では, 画像の忠実度, サンプルの多様性, データセットのプライバシーの3つの重要な指標について, 合成データセットを生成し, その特性を詳細に分析する手法を提案する。
論文 参考訳(メタデータ) (2021-06-24T17:24:06Z) - Privacy-Preserving Image Classification in the Local Setting [17.375582978294105]
ローカル微分プライバシ(LDP)は、データ所有者がランダムにインプットを摂動させ、リリース前にデータの妥当な削除を可能にする、有望なソリューションを提供する。
本稿では、データ所有者が画像を保持し、不信なデータ利用者が機械学習モデルにこれらの画像を入力として適合させたいという、双方向のイメージ分類問題について考察する。
本稿では,拡張性のある領域サイズで画像表現を生成する,教師付き画像特徴抽出器 DCAConv を提案する。
論文 参考訳(メタデータ) (2020-02-09T01:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。