論文の概要: A Different Level Text Protection Mechanism With Differential Privacy
- arxiv url: http://arxiv.org/abs/2409.03707v1
- Date: Thu, 5 Sep 2024 17:13:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 19:43:43.729617
- Title: A Different Level Text Protection Mechanism With Differential Privacy
- Title(参考訳): 差分プライバシーをもつ異なるレベルのテキスト保護機構
- Authors: Qingwen Fu,
- Abstract要約: 本稿では,BERT事前学習モデルに基づいて,重要度が異なる単語を抽出する方法を紹介し,本手法の有効性を実証する。
この記事では、テキストユーティリティ全体において、異なる重要性を持つ単語に対して、同じ結果を維持することが及ぼす影響についても論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The article introduces a method for extracting words of different degrees of importance based on the BERT pre-training model and proves the effectiveness of this method. The article also discusses the impact of maintaining the same perturbation results for words of different importance on the overall text utility. This method can be applied to long text protection.
- Abstract(参考訳): 本稿では,BERT事前学習モデルに基づいて,重要度が異なる単語を抽出する方法を紹介し,本手法の有効性を実証する。
本稿は、テキストユーティリティ全体において、異なる重要性を持つ単語に対して、同じ摂動結果を維持することが及ぼす影響についても論じる。
この方法は長文保護に適用できる。
関連論文リスト
- A Modified Word Saliency-Based Adversarial Attack on Text Classification Models [0.0]
本稿では,テキスト分類モデルを対象とした新たな逆攻撃手法を提案する。
The Modified Word Saliency-based Adversarial At-tack (MWSAA)は、セマンティックコヒーレンスを維持しながら分類モデルを誤解させる。
多様なテキスト分類データセットを用いて実証評価を行い,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-03-17T18:39:14Z) - Improving Mandarin Prosodic Structure Prediction with Multi-level
Contextual Information [68.89000132126536]
本研究は,音声間言語情報を用いて韻律構造予測(PSP)の性能を向上させることを提案する。
提案手法は,韻律語(PW),韻律語(PPH),国際語句(IPH)の予測におけるF1スコアの向上を実現する。
論文 参考訳(メタデータ) (2023-08-31T09:19:15Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - The Limits of Word Level Differential Privacy [30.34805746574316]
そこで本稿では, パラフレージング用に微調整されたトランスフォーマーベース言語モデルに基づくテキスト匿名化手法を提案する。
提案手法を徹底的な実験により評価し,提案手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2022-05-02T21:53:10Z) - Semantics-Preserved Distortion for Personal Privacy Protection in Information Management [65.08939490413037]
本稿では,意味的整合性を維持しつつテキストを歪ませる言語学的アプローチを提案する。
本稿では, 意味保存歪みの枠組みとして, 生成的アプローチと置換的アプローチの2つを提示する。
また、特定の医療情報管理シナリオにおけるプライバシ保護についても検討し、機密データの記憶を効果的に制限していることを示す。
論文 参考訳(メタデータ) (2022-01-04T04:01:05Z) - TFW2V: An Enhanced Document Similarity Method for the Morphologically
Rich Finnish Language [0.5801044612920816]
本研究は,形態学的に豊かな言語であるフィンランド語に対する現在のアプローチの実験に焦点をあてる。
本稿では,長文文書と限られた量のデータの両方を扱う上で,高い効率性を示す簡易な方法TFW2Vを提案する。
論文 参考訳(メタデータ) (2021-12-23T12:27:45Z) - Let the CAT out of the bag: Contrastive Attributed explanations for Text [10.703346059899637]
テキスト(CAT)のコントラスト的説明法を提案する。
提案手法は,自然言語のテキストデータに対して,新しいツイストを用いた対照的な説明を提供する。
定性的な例とユーザスタディを通して、これらの属性により、我々の手法がより多くの洞察を伝達するだけでなく、より良い品質(コントラスト)のテキストをもたらすことを示す。
論文 参考訳(メタデータ) (2021-09-16T13:44:55Z) - Pre-training Language Model Incorporating Domain-specific Heterogeneous Knowledge into A Unified Representation [49.89831914386982]
本研究では, 構造化されていないテキスト, 半構造化されたテキスト, 十分に構造化されたテキストを含む, あらゆる形式のテキストに対して, 統一された事前学習言語モデル (PLM) を提案する。
提案手法は,データの1/4のみを用いて,プレーンテキストの事前学習に優れる。
論文 参考訳(メタデータ) (2021-09-02T16:05:24Z) - On Learning Text Style Transfer with Direct Rewards [101.97136885111037]
平行コーパスの欠如により、テキストスタイルの転送タスクの教師付きモデルを直接訓練することは不可能である。
我々は、当初、微調整されたニューラルマシン翻訳モデルに使用されていた意味的類似度指標を活用している。
我々のモデルは、強いベースラインに対する自動評価と人的評価の両方において大きな利益をもたらす。
論文 参考訳(メタデータ) (2020-10-24T04:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。