論文の概要: Weakly Supervised Named Entity Tagging with Learnable Logical Rules
- arxiv url: http://arxiv.org/abs/2107.02282v1
- Date: Mon, 5 Jul 2021 21:32:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-07 14:02:48.838357
- Title: Weakly Supervised Named Entity Tagging with Learnable Logical Rules
- Title(参考訳): 学習可能な論理ルールによる名前付きエンティティタグの弱監視
- Authors: Jiacheng Li, Haibo Ding, Jingbo Shang, Julian McAuley, Zhe Feng
- Abstract要約: 本稿では,いくつかのルールを弱い監督力として利用することにより,エンティティタグシステム構築の課題について検討する。
本稿では,ニューラルネットワークを完全自動で学習するために,高品質な論理規則をブートストラップする新しい手法TALLORを提案する。
- 参考スコア(独自算出の注目度): 20.90760075357411
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of building entity tagging systems by using a few rules
as weak supervision. Previous methods mostly focus on disambiguation entity
types based on contexts and expert-provided rules, while assuming entity spans
are given. In this work, we propose a novel method TALLOR that bootstraps
high-quality logical rules to train a neural tagger in a fully automated
manner. Specifically, we introduce compound rules that are composed from simple
rules to increase the precision of boundary detection and generate more diverse
pseudo labels. We further design a dynamic label selection strategy to ensure
pseudo label quality and therefore avoid overfitting the neural tagger.
Experiments on three datasets demonstrate that our method outperforms other
weakly supervised methods and even rivals a state-of-the-art distantly
supervised tagger with a lexicon of over 2,000 terms when starting from only 20
simple rules. Our method can serve as a tool for rapidly building taggers in
emerging domains and tasks. Case studies show that learned rules can
potentially explain the predicted entities.
- Abstract(参考訳): 本稿では,いくつかのルールを弱い監督として用いることで,エンティティタグ付けシステム構築の問題点について検討する。
従来のメソッドは主にコンテキストと専門家が提供するルールに基づいた曖昧なエンティティタイプにフォーカスし、エンティティスパンが与えられると仮定する。
本研究では,高品質な論理規則をブートストラップして,ニューラルネットワークを完全自動で学習するTALLORを提案する。
具体的には,境界検出の精度を高め,より多様な擬似ラベルを生成するために,単純な規則からなる複合規則を導入する。
我々はさらに,疑似ラベル品質を確保するために動的ラベル選択戦略を考案する。
3つのデータセットの実験により、我々の手法は他の弱い教師付き手法よりも優れており、20の単純なルールから始めると2000以上の用語で最先端の教師付きタグと競合することを示した。
我々の手法は、新しいドメインやタスクでタグを迅速に構築するためのツールとして機能する。
ケーススタディは、学習したルールが予測された実体を説明できることを示している。
関連論文リスト
- RulePrompt: Weakly Supervised Text Classification with Prompting PLMs and Self-Iterative Logical Rules [30.239044569301534]
弱教師付きテキスト分類(WSTC)は、大量のテキストを分類できるため、注目を集めている。
本稿では,ルールマイニングモジュールとルール強化擬似ラベル生成モジュールからなるWSTCタスクに対して,ルールプロンプトというPLMベースのアプローチを提案する。
提案手法は解釈可能なカテゴリー規則を導出し,難解なカテゴリを曖昧にすることの利点を証明した。
論文 参考訳(メタデータ) (2024-03-05T12:50:36Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Losses over Labels: Weakly Supervised Learning via Direct Loss
Construction [71.11337906077483]
プログラム可能な弱い監視は、機械学習のパラダイムとして成長している。
ラベルの中間ステップを経由することなく,直接損失を発生させるため,ラベルのロバスト・オーバー・ラベル(Losses over Labels, LoL)を提案する。
いくつかのベンチマークテキストおよび画像分類タスクにおいて、LoLは既存の弱い監督手法を改善していることを示す。
論文 参考訳(メタデータ) (2022-12-13T22:29:14Z) - Distilling Task-specific Logical Rules from Large Pre-trained Models [24.66436804853525]
本研究では,大規模な事前学習モデルからタスク固有の論理規則を抽出する新しい枠組みを開発する。
具体的には、初期シードルールを生成するための知識エキスパートとして、最近のプロンプトベースの言語モデルを借りる。
3つのパブリックなエンティティタグ付けベンチマークの実験は、提案フレームワークの有効性を実証している。
論文 参考訳(メタデータ) (2022-10-06T09:12:18Z) - A Weakly Supervised Learning Framework for Salient Object Detection via
Hybrid Labels [96.56299163691979]
本稿では,ハイブリッドラベル下でのSODタスクに焦点をあてる。
このタスクにおけるラベルノイズと量不均衡の問題に対処するため、我々は3つの洗練されたトレーニング戦略を持つ新しいパイプラインフレームワークを設計する。
5つのSODベンチマーク実験により,本手法は弱教師付き/非教師付き手法と競合する性能を示した。
論文 参考訳(メタデータ) (2022-09-07T06:45:39Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Fine-Grained Visual Entailment [51.66881737644983]
そこで本稿では,テキストから画像への微粒な知識要素の論理的関係を予測することを目的として,このタスクの拡張を提案する。
従来の研究とは異なり、本手法は本質的に説明可能であり、異なるレベルの粒度で論理的予測を行う。
本手法は,手動でアノテートした知識要素のデータセットを用いて評価し,この課題に対して68.18%の精度を達成できることを示す。
論文 参考訳(メタデータ) (2022-03-29T16:09:38Z) - GLaRA: Graph-based Labeling Rule Augmentation for Weakly Supervised
Named Entity Recognition [8.352789684571704]
グラフベースのラベル付けルール拡張フレームワークであるtextscGLaRA を提案し,ラベルなしデータから新しいラベル付けルールを学習する。
ラベルなしデータに対する拡張ルールを適用し,弱いラベルを生成し,弱いラベル付きデータを用いてnerモデルをトレーニングする。
論文 参考訳(メタデータ) (2021-04-13T14:20:58Z) - Self-Training with Weak Supervision [32.68342091430266]
最先端のディープニューラルネットワークには、多くのタスクで入手するのに高価な大規模なラベル付きトレーニングデータが必要です。
ドメイン固有のルールの形での弱い監視は、そのような設定で有用であることが示されている。
我々は、与えられたタスクに利用可能なすべてのデータを活用する弱い監視フレームワーク(ASTRA)を開発する。
論文 参考訳(メタデータ) (2021-04-12T14:45:04Z) - Towards Learning Instantiated Logical Rules from Knowledge Graphs [20.251630903853016]
本稿では,知識グラフから一階述語論理規則を抽出するために最適化された確率論的学習ルールGPFLを提案する。
GPFLは、抽出された経路を非循環的な抽象規則であるテンプレートに一般化する新しい2段階ルール生成機構を利用する。
オーバーフィッティングルールの存在、予測性能への影響、およびオーバーフィッティングルールをフィルタリングする単純なバリデーション手法の有効性を明らかにする。
論文 参考訳(メタデータ) (2020-03-13T00:32:46Z) - Structured Prediction with Partial Labelling through the Infimum Loss [85.4940853372503]
弱い監督の目標は、収集コストの安いラベル付け形式のみを使用してモデルを学習できるようにすることである。
これは、各データポイントに対して、実際のものを含むラベルのセットとして、監督がキャストされる不完全なアノテーションの一種です。
本稿では、構造化された予測と、部分的なラベリングを扱うための無限損失の概念に基づく統一的なフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-02T13:59:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。