Fugu-MT 論文翻訳(概要): Building cross-language corpora for human understanding of privacy policies

論文の概要: Building cross-language corpora for human understanding of privacy policies

arxiv url: http://arxiv.org/abs/2302.05355v1
Date: Fri, 10 Feb 2023 16:16:55 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-19 14:06:46.419646
Title: Building cross-language corpora for human understanding of privacy policies
Title（参考訳）: プライバシーポリシーの人間理解のための言語横断コーパスの構築
Authors: Francesco Ciclosi, Silvia Vidor, and Fabio Massacci
Abstract要約: この研究は、国語と参照学習言語で同等のクロス言語を構築するための方法論を提供する。本稿では,プライバシポリシにおける技術的用語の理解に関する最初の研究の1つとして,英語とイタリア語を比較した方法論の応用例を示す。
参考スコア（独自算出の注目度）: 7.1707060082291925
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Making sure that users understand privacy policies that impact them is a key challenge for a real GDPR deployment. Research studies are mostly carried in English, but in Europe and elsewhere, users speak a language that is not English. Replicating studies in different languages requires the availability of comparable cross-language privacy policies corpora. This work provides a methodology for building comparable cross-language in a national language and a reference study language. We provide an application example of our methodology comparing English and Italian extending the corpus of one of the first studies about users understanding of technical terms in privacy policies. We also investigate other open issues that can make replication harder.
Abstract（参考訳）: ユーザがそれらに影響を与えるプライバシーポリシーを理解することが、実際のGDPRデプロイメントにとって重要な課題である。研究は主に英語で行われているが、ヨーロッパや他の地域では、ユーザーは英語でない言語を話す。異なる言語で研究を複製するには、同等のクロス言語プライバシポリシコーパスが必要である。この研究は、国語と参照学習言語で同等のクロス言語を構築するための方法論を提供する。プライバシポリシにおける技術的用語の理解に関する最初の研究の1つとして,英語とイタリア語の比較手法を応用例として紹介する。レプリケーションを難しくする、他のオープンな問題も調査します。

関連論文リスト

The Model's Language Matters: A Comparative Privacy Analysis of LLMs [0.3441021278275805]
我々は,6つの言語指標を定量化し,抽出,反事実記憶,会員推定の3つの攻撃ベクトルを評価する。イタリアは最も強い漏れを示す一方、英語は高い会員分離性を示す。フランスとスペインは、モルフォロジーの複雑さが高いため、より大きなレジリエンスを示す。
論文参考訳（メタデータ） (2025-10-09T20:59:42Z)
A Study of Privacy-preserving Language Modeling Approaches [0.0]
言語モデルにおけるプライバシの保護は、重要な研究領域となっている。本研究は,プライバシ保護言語モデリングのアプローチを包括的に研究する。本研究の結果は,プライバシ保護言語モデリングに関する継続的な研究に寄与している。
論文参考訳（メタデータ） (2025-08-21T10:22:40Z)
Crosslingual Capabilities and Knowledge Barriers in Multilingual Large Language Models [62.91524967852552]
大規模言語モデル(LLM)は、多言語コーパスの事前訓練のため、一般的に多言語である。しかし、これらのモデルは言語間で対応する概念を関連付けることができ、効果的にクロスランガルなのでしょうか? 本研究は,言語横断的課題に関する6つの技術 LLM の評価を行った。
論文参考訳（メタデータ） (2024-06-23T15:15:17Z)
Learning Phonotactics from Linguistic Informants [54.086544221761486]
本モデルでは,情報理論的なポリシーの1つに従って,データポイントを反復的に選択または合成する。提案モデルでは,情報提供者を問う項目の選択に使用する情報理論のポリシーが,完全教師付きアプローチに匹敵する,あるいはそれ以上の効率性が得られることがわかった。
論文参考訳（メタデータ） (2024-05-08T00:18:56Z)
A Federated Learning Approach to Privacy Preserving Offensive Language Identification [14.487531876937247]
フェデレートラーニング(FL)を導入して,攻撃的言語をオンラインで識別するためのプライバシ保護アーキテクチャを提案する。 FLは分散アーキテクチャであり、データ共有を必要とせずに複数のモデルをローカルにトレーニングすることができる。公開可能な4つの英語ベンチマークデータセットで、複数のディープラーニングモデルをトレーニングしました。
論文参考訳（メタデータ） (2024-04-17T15:23:12Z)
Multilingual Evaluation of Semantic Textual Relatedness [0.0]
意味的テクスト関係性(STR)は、言語的要素や話題、感情、視点といった非言語的要素を考慮して、表面的な単語重複を越えている。以前のNLP研究は主に英語に焦点を合わせており、言語間の適用性を制限している。 Marathi、Hindi、スペイン語、英語でSTRを探索し、情報検索や機械翻訳などの可能性を解き放つ。
論文参考訳（メタデータ） (2024-04-13T17:16:03Z)
MLaKE: Multilingual Knowledge Editing Benchmark for Large Language Models [65.10456412127405]
MLaKEは5言語にわたる知識編集手法の適応性のベンチマークである。 MLaKEは、ウィキペディアから言語にまたがるファクトチェーンを集約し、フリーフォームとマルチチョイスの両方で質問を生成する。 MLaKEにおける既存手法の多言語知識編集の一般化能力を評価する。
論文参考訳（メタデータ） (2024-04-07T15:23:28Z)
A Study on Scaling Up Multilingual News Framing Analysis [23.80807884935475]
本研究では,クラウドソーシングによるデータセット生成の可能性を検討する。まず、英語ニュース以外のフレーミング分析を多言語文脈に拡張する。また、ベンガルとポルトガルの移民と同性結婚に関する新しい基準も提示する。
論文参考訳（メタデータ） (2024-04-01T21:02:18Z)
PLUE: Language Understanding Evaluation Benchmark for Privacy Policies in English [77.79102359580702]
プライバシポリシ言語理解評価ベンチマークは,プライバシポリシ言語理解を評価するマルチタスクベンチマークである。また、プライバシポリシの大規模なコーパスを収集し、プライバシポリシドメイン固有の言語モデル事前トレーニングを可能にします。ドメイン固有の連続的な事前トレーニングは、すべてのタスクでパフォーマンスを改善することを実証します。
論文参考訳（メタデータ） (2022-12-20T05:58:32Z)
Monolingual and Cross-Lingual Acceptability Judgments with the Italian CoLA corpus [2.418273287232718]
ItaCoLAコーパスは,受理性判定を伴う約1万文を含む。また、多言語トランスフォーマーに基づくアプローチが、微調整中に2つの言語で文を使うことのメリットを評価できるかを評価することを目的とした、最初の言語間実験も提示する。
論文参考訳（メタデータ） (2021-09-24T16:18:53Z)
AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文参考訳（メタデータ） (2021-04-17T20:23:45Z)
Bridging Linguistic Typology and Multilingual Machine Translation with Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。我々の表現は類型学を組み込み、言語関係と相関関係を強化する。次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文参考訳（メタデータ） (2020-04-30T16:25:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。