論文の概要: Unfair TOS: An Automated Approach using Customized BERT
- arxiv url: http://arxiv.org/abs/2401.11207v1
- Date: Sat, 20 Jan 2024 10:42:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 17:32:03.049778
- Title: Unfair TOS: An Automated Approach using Customized BERT
- Title(参考訳): Unfair TOS: カスタマイズBERTによる自動アプローチ
- Authors: Bathini Sai Akash, Akshara Kupireddy, Lalita Bhanu Murthy
- Abstract要約: SVC(Support Vector)と統合した前例のない細調整BERTに基づくTOS文書から不公平な節検出に関するSOTA結果を示す。
本研究は,不公平な節検出におけるマクロF1スコア0.922の有能な性能を示すとともに,各タグによる不公平な節の分類においても優れた性能を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Terms of Service (ToS) form an integral part of any agreement as it defines
the legal relationship between a service provider and an end-user. Not only do
they establish and delineate reciprocal rights and responsibilities, but they
also provide users with information on essential aspects of contracts that
pertain to the use of digital spaces. These aspects include a wide range of
topics, including limitation of liability, data protection, etc. Users tend to
accept the ToS without going through it before using any application or
service. Such ignorance puts them in a potentially weaker situation in case any
action is required. Existing methodologies for the detection or classification
of unfair clauses are however obsolete and show modest performance. In this
research paper, we present SOTA(State of The Art) results on unfair clause
detection from ToS documents based on unprecedented Fine-tuning BERT in
integration with SVC(Support Vector Classifier). The study shows proficient
performance with a macro F1-score of 0.922 at unfair clause detection, and
superior performance is also shown in the classification of unfair clauses by
each tag. Further, a comparative analysis is performed by answering research
questions on the Transformer models utilized. In order to further research and
experimentation the code and results are made available on
https://github.com/batking24/Unfair-TOS-An-Automated-Approach-based-on-Fine-tuning-BERT-in-conjuncti on-with-ML.
- Abstract(参考訳): サービス提供者(ToS)は、サービス提供者とエンドユーザの間の法的関係を定義するため、契約の不可欠な部分を形成します。
彼らは相互の権利と責任を確立し、定義するだけでなく、デジタル空間の使用に関連する契約の本質的な側面に関する情報をユーザに提供します。
これらの側面には、責任の制限、データ保護など、幅広いトピックが含まれている。
ユーザはアプリケーションやサービスを使う前に、ToSを経由せずに受け入れる傾向がある。
このような無知は、何らかの行動が必要な場合、より弱い状況に陥る。
しかし、不公平な条項の検出や分類のための既存の方法論は時代遅れであり、控えめな性能を示している。
本稿では,SVC(Support Vector Classifier)と統合した前例のない細調整BERTに基づいて,TOS文書から不公平な条項検出を行うSOTA(State of The Art)結果を提案する。
本研究は,不公平節検出時のマクロf1スコア0.922の熟練度を示し,各タグによる不公平節の分類においても優れた性能を示す。
さらに、使用したTransformerモデルに関する研究質問に回答して比較分析を行う。
さらなる研究と実験のために、コードと結果はhttps://github.com/batking24/Unfair-TOS-An-Automated-Approach-based-on-Fine-tuning-BERT-in-conjuncti on-with-MLで公開されている。
関連論文リスト
- LegalPro-BERT: Classification of Legal Provisions by fine-tuning BERT Large Language Model [0.0]
契約分析は、合意の範囲内で重要な規定及び段落の識別及び分類を必要とする。
LegalPro-BERTはBERTトランスフォーマーアーキテクチャモデルであり、法定条項の分類処理を効率的に行うために微調整を行う。
論文 参考訳(メタデータ) (2024-04-15T19:08:48Z) - CASA: Causality-driven Argument Sufficiency Assessment [79.13496878681309]
ゼロショット因果関係に基づく議論十分性評価フレームワークであるCASAを提案する。
PSは前提イベントの導入が前提イベントと結論イベントの両方が欠落した場合の結論につながる可能性を測っている。
2つの論理的誤り検出データセットの実験により、CASAは不十分な議論を正確に識別することを示した。
論文 参考訳(メタデータ) (2024-01-10T16:21:18Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Evaluating the Fairness of Discriminative Foundation Models in Computer
Vision [51.176061115977774]
本稿では,CLIP (Contrastive Language-Pretraining) などの差別基盤モデルのバイアス評価のための新しい分類法を提案する。
そして、これらのモデルにおけるバイアスを緩和するための既存の手法を分類学に関して体系的に評価する。
具体的には,ゼロショット分類,画像検索,画像キャプションなど,OpenAIのCLIPとOpenCLIPモデルをキーアプリケーションとして評価する。
論文 参考訳(メタデータ) (2023-10-18T10:32:39Z) - WiCE: Real-World Entailment for Claims in Wikipedia [63.234352061821625]
We propose WiCE, a new fine-fine textual entailment dataset built on natural claim and evidence pairs from Wikipedia。
標準クレームレベルのエンターメントに加えて、WiCEはクレームのサブ文単位に対するエンターメント判断を提供する。
我々のデータセットの真のクレームは、既存のモデルで対処できない検証と検索の問題に挑戦することを含んでいる。
論文 参考訳(メタデータ) (2023-03-02T17:45:32Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - ContractNLI: A Dataset for Document-level Natural Language Inference for
Contracts [39.75232199445175]
契約書に対する文書レベルの自然言語推論(NLI)を提案する。
システムには一連の仮説と契約が与えられ、それぞれの仮説が「関連づけられている」か、「矛盾している」か、「言及されていない」か(中立である)を分類するよう求められる。
これまでで最大のコーパスを607のアノテート契約でリリースしています。
論文 参考訳(メタデータ) (2021-10-05T03:22:31Z) - Unsupervised Data Augmentation with Naive Augmentation and without
Unlabeled Data [40.82826366059613]
Unsupervised Data Augmentation (UDA) は、モデルの予測の違いを解析するために一貫性損失を適用する半教師付き手法である。
本稿では,UDAを再検討し,その有効性を示す。
一貫性の喪失を適用することで、ラベルのないデータなしで有意義な利益が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-22T18:01:51Z) - A Benchmark for Lease Contract Review [9.249443355045969]
契約審査において重要な役割を果たす2つの異なるタイプの要素を検出する問題に取り組む。
後者は、署名当事者の1つ以上の場合、何らかの危険または潜在的に問題のある状況があることを示す用語または文である。
我々は179のリース契約書の新しいベンチマークデータセットをリリースし、それらに含まれるエンティティと赤いフラグを手動で注釈付けしました。
論文 参考訳(メタデータ) (2020-10-20T15:50:50Z) - Federated Semi-Supervised Learning with Inter-Client Consistency &
Disjoint Learning [78.88007892742438]
ラベル付きデータの位置に基づくFSSL(Federated Semi-Supervised Learning)の2つの重要なシナリオについて検討する。
フェデレートマッチング(FedMatch)と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2020-06-22T09:43:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。