論文の概要: Cross-Domain Transfer and Few-Shot Learning for Personal Identifiable Information Recognition
- arxiv url: http://arxiv.org/abs/2507.11862v1
- Date: Wed, 16 Jul 2025 03:14:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.207584
- Title: Cross-Domain Transfer and Few-Shot Learning for Personal Identifiable Information Recognition
- Title(参考訳): 個人識別可能な情報認識のためのクロスドメイン転送とFew-Shot学習
- Authors: Junhong Ye, Xu Yuan, Xinying Qiu,
- Abstract要約: クロスドメインモデル転送,マルチドメインデータ融合,サンプル効率学習について検討した。
以上の結果から, 医療ドメインは送受信に抵抗する一方, 法律ドメインのデータ転送は伝記テキストとよく一致した。
高品質な認識は、低特殊化領域におけるトレーニングデータの10%しか達成できない。
- 参考スコア(独自算出の注目度): 17.75715232207747
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate recognition of personally identifiable information (PII) is central to automated text anonymization. This paper investigates the effectiveness of cross-domain model transfer, multi-domain data fusion, and sample-efficient learning for PII recognition. Using annotated corpora from healthcare (I2B2), legal (TAB), and biography (Wikipedia), we evaluate models across four dimensions: in-domain performance, cross-domain transferability, fusion, and few-shot learning. Results show legal-domain data transfers well to biographical texts, while medical domains resist incoming transfer. Fusion benefits are domain-specific, and high-quality recognition is achievable with only 10% of training data in low-specialization domains.
- Abstract(参考訳): 個人識別情報(PII)の正確な認識は、自動化されたテキスト匿名化の中心である。
本稿では,PII認識におけるクロスドメインモデル転送,マルチドメインデータ融合,サンプル効率学習の有効性について検討する。
医療(I2B2)、法律(TAB)、伝記(Wikipedia)の注釈付きコーパスを用いて、ドメイン内パフォーマンス、ドメイン間移動性、融合性、少数ショット学習の4次元にわたるモデルを評価する。
以上の結果から, 医療ドメインは送受信に抵抗する一方, 法律ドメインのデータ転送は伝記テキストとよく一致した。
融合の利点はドメイン固有のものであり、高品質な認識は、低特殊化領域におけるトレーニングデータの10%しか達成できない。
関連論文リスト
- FairDomain: Achieving Fairness in Cross-Domain Medical Image Segmentation and Classification [24.985944558474166]
本稿では,ドメインシフト下での公平性に関する先駆的なシステム研究について述べる。
我々は医学的セグメンテーションと分類作業の両方に最先端領域適応(DA)と一般化(DG)アルゴリズムを用いる。
また,様々なDAアルゴリズムやDGアルゴリズムに適応して,自己注意を用いて人口統計特性を調整し,公平性を向上する,新規なプラグイン・アンド・プレイ・アイデンティティ・フェアアテンション(FIA)モジュールも導入する。
論文 参考訳(メタデータ) (2024-07-11T18:52:32Z) - Named Entity Recognition Under Domain Shift via Metric Learning for Life Sciences [55.185456382328674]
名前付きエンティティ認識モデルの拡張のための転写学習の適用性について検討する。
本モデルでは,(1)アノテートイベントからの知識を付加してエンティティ間の関係を確立するソースドメインにおけるエンティティグループ化,2) 対象ドメインにおけるエンティティの識別を擬似ラベリングとコントラスト学習に頼って,2つのドメイン内のエンティティ間の識別を強化する,という2つの段階で構成されている。
論文 参考訳(メタデータ) (2024-01-19T03:49:28Z) - Dis-AE: Multi-domain & Multi-task Generalisation on Real-World Clinical
Data [0.0]
本稿では,新しい非交叉型オートエンコーダ(Dis-AE)ニューラルネットワークアーキテクチャを提案する。
Dis-AEは、医療測定のマルチラベル分類のためのドメイン不変データ表現を学習する。
人工的データセットと血液提供者からの全血液量(FBC)データに基づいて,モデルの領域一般化能力を評価する。
論文 参考訳(メタデータ) (2023-06-15T14:56:37Z) - Disentanglement-based Cross-Domain Feature Augmentation for Effective
Unsupervised Domain Adaptive Person Re-identification [87.72851934197936]
Unsupervised Domain Adaptive (UDA) Person Re-identification (ReID) は、ラベル付きソースドメインからラベル付きターゲットドメインへ知識を転送することを目的としている。
ひとつの課題は、トレーニング用に信頼できるラベルでターゲットドメインサンプルを生成する方法だ。
ディスタングルメントに基づくクロスドメイン機能拡張戦略を提案する。
論文 参考訳(メタデータ) (2021-03-25T15:28:41Z) - Domain Adaptation for Learning Generator from Paired Few-Shot Data [72.04430033118426]
十分なソースデータと少数のターゲットデータを持つジェネレータを学習するためのペアドフェーショットGAN(PFS-GAN)モデルを提案する。
提案手法は,複数のベースラインと比較して,より多様性の高い生成対象ドメインデータに対して,定量的,定性的な結果が得られる。
論文 参考訳(メタデータ) (2021-02-25T10:11:44Z) - Dual-Teacher++: Exploiting Intra-domain and Inter-domain Knowledge with
Reliable Transfer for Cardiac Segmentation [69.09432302497116]
最先端の半教師付きドメイン適応フレームワークである Dual-Teacher++ を提案する。
ソースドメイン(MRなど)からのクロスモダリティ優先度を探索するドメイン間教師モデルと、ラベルのないターゲットドメインの知識を調査するドメイン内教師モデルを含む、新しいデュアル教師モデルを設計する。
このようにして、学生モデルは信頼できる二重ドメイン知識を得て、ターゲットドメインデータのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2021-01-07T05:17:38Z) - Distant Domain Transfer Learning for Medical Imaging [14.806736041145964]
医用画像分類のための遠隔ドメイン転送学習(DDTL)手法を提案する。
いくつかの現在の研究では、肺CT(Computed Tomography)画像が迅速かつ正確なCOVID-19診断に使用できることが示されています。
提案手法は,遠隔地から収集したラベルのないデータから容易にアクセスできる。
それは「非転送」アルゴリズムよりも13%高い分類精度である96%の分類精度を達成しました。
論文 参考訳(メタデータ) (2020-12-10T02:53:52Z) - Domain Generalized Person Re-Identification via Cross-Domain Episodic
Learning [31.17248105464821]
本稿では、メタ学習戦略を進化させ、観測されたソースドメインラベル付きデータを活用するためのエピソード学習手法を提案する。
4つのベンチマークデータセットに対する実験により,最先端技術よりも提案手法の優位性が確認された。
論文 参考訳(メタデータ) (2020-10-19T14:42:29Z) - Towards Fair Cross-Domain Adaptation via Generative Learning [50.76694500782927]
ドメイン適応(DA)は、よくラベル付けされたソースドメイン上でトレーニングされたモデルを、異なる分散に横たわる未ラベルのターゲットドメインに適応することを目的としています。
本研究では,新規な生成的Few-shot Cross-Domain Adaptation (GFCA) アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-03-04T23:25:09Z) - Domain Adaption for Knowledge Tracing [65.86619804954283]
本稿では,DAKT問題に対処するための新しい適応型フレームワーク,すなわち知識追跡(AKT)を提案する。
まず,Deep Knowledge Trace(DKT)に基づく教育的特徴(スリップ,推測,質問文など)を取り入れ,優れた知識追跡モデルを得る。
第2の側面として、3つのドメイン適応プロセスを提案し、採用する。まず、ターゲットモデルトレーニングに有用なソースインスタンスを選択するために、自動エンコーダを事前訓練する。
論文 参考訳(メタデータ) (2020-01-14T15:04:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。