論文の概要: Anonpsy: A Graph-Based Framework for Structure-Preserving De-identification of Psychiatric Narratives
- arxiv url: http://arxiv.org/abs/2601.13503v1
- Date: Tue, 20 Jan 2026 01:37:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.11261
- Title: Anonpsy: A Graph-Based Framework for Structure-Preserving De-identification of Psychiatric Narratives
- Title(参考訳): Anonpsy: 精神医学的ナラティブの構造的非識別のためのグラフベースのフレームワーク
- Authors: Kyung Ho Lim, Byung-Hoon Kim,
- Abstract要約: 我々は、タスクをグラフ誘導セマンティックリライトとして再構成する非識別フレームワークであるAnonpsyを紹介した。
解剖学は、各物語を臨床的実体、時間的アンカー、型付き関係をコードする意味グラフに変換する。
専門家、セマンティクス、GPT-5に基づく評価の下で、診断の正確性を維持しながら、常に低い再識別リスクを達成している。
- 参考スコア(独自算出の注目度): 1.4652274443334974
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Psychiatric narratives encode patient identity not only through explicit identifiers but also through idiosyncratic life events embedded in their clinical structure. Existing de-identification approaches, including PHI masking and LLM-based synthetic rewriting, operate at the text level and offer limited control over which semantic elements are preserved or altered. We introduce Anonpsy, a de-identification framework that reformulates the task as graph-guided semantic rewriting. Anonpsy (1) converts each narrative into a semantic graph encoding clinical entities, temporal anchors, and typed relations; (2) applies graph-constrained perturbations that modify identifying context while preserving clinically essential structure; and (3) regenerates text via graph-conditioned LLM generation. Evaluated on 90 clinician-authored psychiatric case narratives, Anonpsy preserves diagnostic fidelity while achieving consistently low re-identification risk under expert, semantic, and GPT-5-based evaluations. Compared with a strong LLM-only rewriting baseline, Anonpsy yields substantially lower semantic similarity and identifiability. These results demonstrate that explicit structural representations combined with constrained generation provide an effective approach to de-identification for psychiatric narratives.
- Abstract(参考訳): 精神医学的物語は、患者のアイデンティティを明示的な識別子だけでなく、臨床構造に埋め込まれた慣用的な生活イベントを通じて符号化する。
PHIマスクやLLMベースの合成書き換えなどの既存の非識別アプローチはテキストレベルで動作し、意味的要素の保存や変更を限定的に制御する。
我々は、タスクをグラフ誘導セマンティックリライトとして再構成する非識別フレームワークであるAnonpsyを紹介した。
解剖学(1)は,各物語を臨床的実体,時間的アンカー,型付き関係をコードする意味グラフに変換し,(2)臨床上不可欠な構造を維持しながらコンテキストを識別するグラフ制約の摂動を適用し,(3)グラフ条件のLLM生成を通じてテキストを再生する。
臨床医による90の精神医学ケースの物語に基づいて評価され、アノンプシーは、専門家、セマンティック、およびGPT-5に基づく評価の下で、常に低い再同定リスクを達成しつつ、診断の忠実さを保っている。
強いLLMのみの書き換えベースラインと比較して、Anonpsyは意味的類似性と識別可能性を大幅に低くする。
これらの結果は,制約付き生成と組み合わせた明示的構造表現が,精神医学的物語の同定に有効な方法であることを示している。
関連論文リスト
- Beyond surface form: A pipeline for semantic analysis in Alzheimer's Disease detection from spontaneous speech [4.447462467582385]
アルツハイマー病(英語: Alzheimer's Disease、AD)は、認知能力に悪影響を及ぼす進行性神経変性疾患である。
言語モデルはADのスクリーニングツールの基盤として有望であるが、その限定的な解釈可能性には課題がある。
そこで本研究では,意味内容の保存中に構文や語彙を変更することによって,テキストの表面形状を変換する手法を提案する。
論文 参考訳(メタデータ) (2025-12-15T18:59:49Z) - Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.350584471060756]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。
本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。
SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文 参考訳(メタデータ) (2025-09-30T08:59:06Z) - CLI-RAG: A Retrieval-Augmented Framework for Clinically Structured and Context Aware Text Generation with LLMs [0.1578515540930834]
CLI-RAG (Clinically Informed Retrieval-Augmented Generation) は、構造的および臨床的な基盤となるテキスト生成のためのドメイン固有のフレームワークである。
臨床文書構造を尊重する新しい階層的チャンキング戦略を取り入れ、タスク固有の2段階検索機構を導入する。
本システムを用いて,MIMIC-IIIデータセットから15種類の臨床ノートを作成した。
論文 参考訳(メタデータ) (2025-07-09T10:13:38Z) - DeIDClinic: A Multi-Layered Framework for De-identification of Clinical Free-text Data [6.473402241020136]
本研究は,臨床テキストを微調整した深層学習モデルであるCeriorBERTを統合することにより,MASKフレームワークを強化する。
このシステムは、臨床文書内の機密性のある実体を効果的に識別し、再認識するか、置き換える。
リスク評価機能も開発され、文書内のコンテキストのユニークさを分析してリスクレベルに分類する。
論文 参考訳(メタデータ) (2024-10-02T15:16:02Z) - Attribute Structuring Improves LLM-Based Evaluation of Clinical Text Summaries [56.31117605097345]
大規模言語モデル(LLM)は、正確な臨床テキスト要約を生成する可能性を示しているが、根拠付けと評価に関する問題に苦慮している。
本稿では、要約評価プロセスを構成するAttribute Structuring(AS)を用いた一般的な緩和フレームワークについて検討する。
ASは、臨床テキスト要約における人間のアノテーションと自動メトリクスの対応性を一貫して改善する。
論文 参考訳(メタデータ) (2024-03-01T21:59:03Z) - Pyclipse, a library for deidentification of free-text clinical notes [0.40329768057075643]
同定アルゴリズムの比較を効率化するpyclipseフレームワークを提案する。
Pyclipseは、ローカル臨床データ上でオープンソースの識別アルゴリズムを実行するための単一のインターフェースとして機能する。
同じベンチマークデータセットで評価しても、アルゴリズムのパフォーマンスは、元の論文で報告された結果に一貫して劣っていることが分かりました。
論文 参考訳(メタデータ) (2023-11-05T19:56:58Z) - De-identification of Unstructured Clinical Texts from Sequence to
Sequence Perspective [8.615499133294097]
本稿では,トークン分類問題ではなく,シーケンスからシーケンスへの学習問題として同定問題を定式化する。
提案手法の早期実験は,i2b2データセット上で98.91%のリコール率を達成した。
論文 参考訳(メタデータ) (2021-08-18T04:48:58Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - Clinical Named Entity Recognition using Contextualized Token
Representations [49.036805795072645]
本稿では,各単語の意味的意味をより正確に把握するために,文脈型単語埋め込み手法を提案する。
言語モデル(C-ELMo)とC-Flair(C-Flair)の2つの深い文脈型言語モデル(C-ELMo)を事前訓練する。
明示的な実験により、静的単語埋め込みとドメインジェネリック言語モデルの両方と比較して、我々のモデルは劇的に改善されている。
論文 参考訳(メタデータ) (2021-06-23T18:12:58Z) - An Interpretable End-to-end Fine-tuning Approach for Long Clinical Text [72.62848911347466]
EHRにおける非構造化臨床テキストには、意思決定支援、トライアルマッチング、振り返り研究を含むアプリケーションにとって重要な情報が含まれている。
最近の研究は、これらのモデルが他のNLPドメインにおける最先端の性能を考慮し、BERTベースのモデルを臨床情報抽出およびテキスト分類に応用している。
本稿では,SnipBERTという新しい微調整手法を提案する。SnipBERTは全音符を使用する代わりに,重要なスニペットを識別し,階層的に切り刻まれたBERTベースのモデルに供給する。
論文 参考訳(メタデータ) (2020-11-12T17:14:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。