論文の概要: Building cross-language corpora for human understanding of privacy
policies
- arxiv url: http://arxiv.org/abs/2302.05355v1
- Date: Fri, 10 Feb 2023 16:16:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 14:06:46.419646
- Title: Building cross-language corpora for human understanding of privacy
policies
- Title(参考訳): プライバシーポリシーの人間理解のための言語横断コーパスの構築
- Authors: Francesco Ciclosi, Silvia Vidor, and Fabio Massacci
- Abstract要約: この研究は、国語と参照学習言語で同等のクロス言語を構築するための方法論を提供する。
本稿では,プライバシポリシにおける技術的用語の理解に関する最初の研究の1つとして,英語とイタリア語を比較した方法論の応用例を示す。
- 参考スコア(独自算出の注目度): 7.1707060082291925
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Making sure that users understand privacy policies that impact them is a key
challenge for a real GDPR deployment. Research studies are mostly carried in
English, but in Europe and elsewhere, users speak a language that is not
English. Replicating studies in different languages requires the availability
of comparable cross-language privacy policies corpora. This work provides a
methodology for building comparable cross-language in a national language and a
reference study language. We provide an application example of our methodology
comparing English and Italian extending the corpus of one of the first studies
about users understanding of technical terms in privacy policies. We also
investigate other open issues that can make replication harder.
- Abstract(参考訳): ユーザがそれらに影響を与えるプライバシーポリシーを理解することが、実際のGDPRデプロイメントにとって重要な課題である。
研究は主に英語で行われているが、ヨーロッパや他の地域では、ユーザーは英語でない言語を話す。
異なる言語で研究を複製するには、同等のクロス言語プライバシポリシコーパスが必要である。
この研究は、国語と参照学習言語で同等のクロス言語を構築するための方法論を提供する。
プライバシポリシにおける技術的用語の理解に関する最初の研究の1つとして,英語とイタリア語の比較手法を応用例として紹介する。
レプリケーションを難しくする、他のオープンな問題も調査します。
関連論文リスト
- Data and Approaches for German Text simplification -- towards an
Accessibility-enhanced Communication [0.0]
本稿では,ドイツ語テキストの簡易化の現状を考察し,並列化と単言語的ドイツ語コーパスに着目した。
ドイツのテキストを単純化するためのニューラルネットワークモデルをレビューし、法的テキストとアクセシビリティ要件に対するそれらの適合性を評価する。
著者らは2023年4月にこれらの研究ギャップに対処するため、学際的なOPEN-LSプロジェクトを立ち上げた。
論文 参考訳(メタデータ) (2023-12-15T17:23:33Z) - Can LLMs Keep a Secret? Testing Privacy Implications of Language Models
via Contextual Integrity Theory [86.8514623654506]
私たちは、最も有能なAIモデルでさえ、人間がそれぞれ39%と57%の確率で、プライベートな情報を公開していることを示しています。
我々の研究は、推論と心の理論に基づいて、新しい推論時プライバシー保護アプローチを即時に探求する必要性を浮き彫りにしている。
論文 参考訳(メタデータ) (2023-10-27T04:15:30Z) - A Corpus for Sentence-level Subjectivity Detection on English News
Articles [52.58681161666199]
文レベルで主観性検出のための新しいコーパスを提案する。
我々は,タスクのための新しいアノテーションガイドラインを開発し,それらを英語で新しいコーパスの作成に適用する。
この新たなリソースは、英語および他の言語で主観性検出のためのモデルを開発するための道を開く。
論文 参考訳(メタデータ) (2023-05-29T11:54:50Z) - PLUE: Language Understanding Evaluation Benchmark for Privacy Policies
in English [77.79102359580702]
プライバシポリシ言語理解評価ベンチマークは,プライバシポリシ言語理解を評価するマルチタスクベンチマークである。
また、プライバシポリシの大規模なコーパスを収集し、プライバシポリシドメイン固有の言語モデル事前トレーニングを可能にします。
ドメイン固有の連続的な事前トレーニングは、すべてのタスクでパフォーマンスを改善することを実証します。
論文 参考訳(メタデータ) (2022-12-20T05:58:32Z) - CONCRETE: Improving Cross-lingual Fact-checking with Cross-lingual
Retrieval [73.48591773882052]
ほとんどのファクトチェックアプローチは、他の言語におけるデータ不足の問題にのみ英語に焦点を当てている。
クロスリンガル検索を付加した最初のファクトチェックフレームワークを提案する。
提案したクロスリンガル逆クローズタスク(XICT)を用いてレトリバーを訓練する。
論文 参考訳(メタデータ) (2022-09-05T17:36:14Z) - What Does it Mean for a Language Model to Preserve Privacy? [12.955456268790005]
自然言語は私たちのプライベートな生活とアイデンティティを反映しており、そのプライバシーに関する懸念は現実の生活のそれと同じくらい広まっています。
既存の保護手法は、言語モデルに対する汎用的で意味のあるプライバシの概念を保証できない、と我々は主張する。
我々は、言語モデルは、公用として明示的に作成されたテキストデータに基づいて訓練されるべきである、と結論付けた。
論文 参考訳(メタデータ) (2022-02-11T09:18:27Z) - Monolingual and Cross-Lingual Acceptability Judgments with the Italian
CoLA corpus [2.418273287232718]
ItaCoLAコーパスは,受理性判定を伴う約1万文を含む。
また、多言語トランスフォーマーに基づくアプローチが、微調整中に2つの言語で文を使うことのメリットを評価できるかを評価することを目的とした、最初の言語間実験も提示する。
論文 参考訳(メタデータ) (2021-09-24T16:18:53Z) - Cross-lingual hate speech detection based on multilingual
domain-specific word embeddings [4.769747792846004]
トランスファーラーニングの視点から多言語のヘイトスピーチ検出の課題に取り組むことを提案する。
私たちの目標は、ある特定の言語の知識が他の言語の分類に使用できるかどうかを判断することです。
単純かつ特定された多言語ヘイト表現を用いることで分類結果が向上することを示す。
論文 参考訳(メタデータ) (2021-04-30T02:24:50Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。