論文の概要: GerPS-Compare: Comparing NER methods for legal norm analysis
- arxiv url: http://arxiv.org/abs/2412.02427v1
- Date: Tue, 03 Dec 2024 12:46:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:50:32.568886
- Title: GerPS-Compare: Comparing NER methods for legal norm analysis
- Title(参考訳): GerPS-Compare:法規範解析のためのNER法の比較
- Authors: Sarah T. Bachinger, Christoph Unger, Robin Erd, Leila Feddoul, Clara Lachenmaier, Sina Zarrieß, Birgitta König-Ries,
- Abstract要約: クラス検出のためのNER(Named Entity Recognition)の3つの手法について検討・比較を行った。
深層判別モデルは、ルールベースシステムと深部生成モデルの両方より優れている。
- 参考スコア(独自算出の注目度): 6.060800075004249
- License:
- Abstract: We apply NER to a particular sub-genre of legal texts in German: the genre of legal norms regulating administrative processes in public service administration. The analysis of such texts involves identifying stretches of text that instantiate one of ten classes identified by public service administration professionals. We investigate and compare three methods for performing Named Entity Recognition (NER) to detect these classes: a Rule-based system, deep discriminative models, and a deep generative model. Our results show that Deep Discriminative models outperform both the Rule-based system as well as the Deep Generative model, the latter two roughly performing equally well, outperforming each other in different classes. The main cause for this somewhat surprising result is arguably the fact that the classes used in the analysis are semantically and syntactically heterogeneous, in contrast to the classes used in more standard NER tasks. Deep Discriminative models appear to be better equipped for dealing with this heterogenerity than both generic LLMs and human linguists designing rule-based NER systems.
- Abstract(参考訳): 我々は、NERを、公務員管理における行政過程を規定する法律規範のジャンルである、ドイツ語の法文の特定のサブジャンルに適用する。
このようなテキストの分析には、公共サービス管理者によって特定される10のクラスの1つをインスタンス化するテキストのストレッチの特定が含まれる。
本研究では,これらのクラスを検出するために,名前付きエンティティ認識(NER)を行う3つの手法について,ルールベースシステム,深層識別モデル,深層生成モデルについて検討・比較する。
その結果、Deep Discriminative モデルはルールベースシステムとDeep Generative モデルの両方より優れており、後者の2つは概ね同等に機能し、異なるクラスで互いに優れています。
この驚くべき結果の主な原因は、解析で使用されるクラスが、より標準的なNERタスクで使用されるクラスとは対照的に、意味的に、統語的に異質であるという事実である。
深層識別モデルは、ジェネリックLLMと人間の言語学者の両方がルールベースのNERシステムを設計するよりも、この異種性を扱うのに適しているようである。
関連論文リスト
- Show Less, Instruct More: Enriching Prompts with Definitions and Guidelines for Zero-Shot NER [3.4998124138877786]
より少ない例でモデルを指示することで、今まで見たことのないエンティティタグに対処するためのアプローチであるSLIMERを提案する。
実験は、定義とガイドラインがより良いパフォーマンス、より速く、より堅牢な学習をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-01T13:25:33Z) - Low-Resource Named Entity Recognition: Can One-vs-All AUC Maximization
Help? [29.925539498551046]
我々は,1-vs-all(OVA)学習問題として,マルチクラス問題の革新的再構成を提案し,受信動作特性曲線(AUC)の下での領域に基づく損失関数を提案する。
OVAに基づくアプローチの効率を高めるために,類似言語特性を持つグループラベルとメタラーニングを用いたグループラベルの2つのトレーニング戦略を提案する。
提案手法の優位性は,NER設定の異なる従来のNER学習を超越した性能によって確認される。
論文 参考訳(メタデータ) (2023-11-02T10:14:52Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Self-Ensembling GAN for Cross-Domain Semantic Segmentation [107.27377745720243]
本稿では,セマンティックセグメンテーションのためのクロスドメインデータを利用した自己理解型生成逆数ネットワーク(SE-GAN)を提案する。
SE-GANでは、教師ネットワークと学生ネットワークは、意味分節マップを生成するための自己組織化モデルを構成する。
その単純さにもかかわらず、SE-GANは敵の訓練性能を大幅に向上させ、モデルの安定性を高めることができる。
論文 参考訳(メタデータ) (2021-12-15T09:50:25Z) - Social Norm Bias: Residual Harms of Fairness-Aware Algorithms [21.50551404445654]
社会ノームバイアス (Social Norm Bias, SNoB) は、自動意思決定システムによって示される、微妙だが連続的な差別の一種である。
我々は、アルゴリズムの予測が性規範とどのように関連しているかを測定することでSNoBを定量化する。
後処理の介入は、この種のバイアスを全く軽減しないことを示す。
論文 参考訳(メタデータ) (2021-08-25T05:54:56Z) - Category Contrast for Unsupervised Domain Adaptation in Visual Tasks [92.9990560760593]
本稿では,視覚的 UDA タスクのインスタンス識別に先立って,セマンティックな事前情報を導入した新しいカテゴリコントラスト手法(CaCo)を提案する。
CaCoは既存のUDAメソッドを補完し、半教師付き学習や教師なしモデル適応などの他の学習設定に一般化可能である。
論文 参考訳(メタデータ) (2021-06-05T12:51:35Z) - Revisiting Contrastive Learning for Few-Shot Classification [74.78397993160583]
インスタンス識別に基づくコントラスト学習は,視覚表現の自己教師あり学習の指導的アプローチとして現れてきた。
本稿では,インスタンス識別に基づくコントラスト型自己教師付き学習フレームワークにおいて,新しいタスクを一般化する表現を学習する方法を示す。
提案手法は,cidを用いて訓練された普遍的埋め込みと組み合わせて,挑戦的メタデータセットベンチマークにおいて最先端アルゴリズムよりも優れる新しいモデル選択アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-26T19:58:08Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - SOAR: Simultaneous Or of And Rules for Classification of Positive &
Negative Classes [0.0]
本稿では,実世界の雑音の多い二項分類における固有曖昧性を明確に把握し,定量化する新奇かつ完全な分類法を提案する。
提案手法は,確率モデルのよりきめ細かい定式化につながり,シミュレート・アニーリングに基づく最適化により,同等の手法と競合する分類性能が得られることを示す。
論文 参考訳(メタデータ) (2020-08-25T20:00:27Z) - Generation of Consistent Sets of Multi-Label Classification Rules with a
Multi-Objective Evolutionary Algorithm [11.25469393912791]
本稿では,複数のルールに基づく多ラベル分類モデルを生成する多目的進化アルゴリズムを提案する。
我々のアルゴリズムは規則の集合(順序のない集合)に基づいてモデルを生成し、解釈可能性を高める。
また、ルール作成中にコンフリクト回避アルゴリズムを用いることで、与えられたモデル内のすべてのルールは、同じモデル内の他のすべてのルールと整合することが保証される。
論文 参考訳(メタデータ) (2020-03-27T16:43:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。