Fugu-MT 論文翻訳(概要): LinkNER: Linking Local Named Entity Recognition Models to Large Language Models using Uncertainty

論文の概要: LinkNER: Linking Local Named Entity Recognition Models to Large Language Models using Uncertainty

arxiv url: http://arxiv.org/abs/2402.10573v3
Date: Sun, 22 Dec 2024 06:18:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-24 19:42:47.488327
Title: LinkNER: Linking Local Named Entity Recognition Models to Large Language Models using Uncertainty
Title（参考訳）: LinkNER:不確実性を利用したローカル名前付きエンティティ認識モデルと大規模言語モデルとのリンク
Authors: Zhen Zhang, Yuhua Zhao, Hang Gao, Mengting Hu,
Abstract要約: 名前付きエンティティ認識(NER)は、自然言語理解の基本的なタスクである。本稿では,小型微調整モデルとLLM(LinkNER)を組み合わせ,RCCと呼ばれる不確実性に基づくリンク戦略を提案する。 LinkNERは、堅牢性テストにおいて、特にSOTAモデルを上回る、NERタスクパフォーマンスを向上させる。
参考スコア（独自算出の注目度）: 12.32180790849948
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Named Entity Recognition (NER) serves as a fundamental task in natural language understanding, bearing direct implications for web content analysis, search engines, and information retrieval systems. Fine-tuned NER models exhibit satisfactory performance on standard NER benchmarks. However, due to limited fine-tuning data and lack of knowledge, it performs poorly on unseen entity recognition. As a result, the usability and reliability of NER models in web-related applications are compromised. Instead, Large Language Models (LLMs) like GPT-4 possess extensive external knowledge, but research indicates that they lack specialty for NER tasks. Furthermore, non-public and large-scale weights make tuning LLMs difficult. To address these challenges, we propose a framework that combines small fine-tuned models with LLMs (LinkNER) and an uncertainty-based linking strategy called RDC that enables fine-tuned models to complement black-box LLMs, achieving better performance. We experiment with both standard NER test sets and noisy social media datasets. LinkNER enhances NER task performance, notably surpassing SOTA models in robustness tests. We also quantitatively analyze the influence of key components like uncertainty estimation methods, LLMs, and in-context learning on diverse NER tasks, offering specific web-related recommendations. Code is available at https://github.com/zhzhengit/LinkNER.
Abstract（参考訳）: 名前付きエンティティ認識(NER)は、自然言語理解の基本的なタスクであり、Webコンテンツ分析、検索エンジン、情報検索システムに直接影響する。ファインチューニングされたNERモデルは標準のNERベンチマークで満足な性能を示す。しかし、微調整データに制限があり、知識が不足しているため、見当たらないエンティティ認識では不十分である。その結果、Web 関連アプリケーションにおける NER モデルのユーザビリティと信頼性が損なわれている。代わりに、GPT-4のようなLarge Language Models (LLM) は外部知識を持っているが、NERタスクの専門性を欠いていることを示している。さらに、非公開および大規模の重み付けにより、LLMのチューニングが困難になる。これらの課題に対処するために、小型の微調整モデルとLLM(LinkNER)を組み合わせたフレームワークと、細調整モデルでブラックボックスのLCMを補完し、より良い性能を実現するRDCと呼ばれる不確実性ベースのリンク戦略を提案する。標準NERテストセットとノイズの多いソーシャルメディアデータセットの両方を実験する。 LinkNERは、堅牢性テストにおいて、特にSOTAモデルを上回る、NERタスクパフォーマンスを向上させる。また,不確実性推定手法やLLM,コンテキスト内学習などの重要要素が多様なNERタスクに与える影響を定量的に分析し,特定のWeb関連勧告を提供する。コードはhttps://github.com/zhzhengit/LinkNERで入手できる。

関連論文リスト

EL4NER: Ensemble Learning for Named Entity Recognition via Multiple Small-Parameter Large Language Models [5.250561620875686]
大規模言語モデル(LLM)に基づくインコンテキスト学習(ICL)技術は、名前付きエンティティ認識(NER)タスクで注目されている。我々は,NERタスクの全体的な性能を,より少ないデプロイメントと推論コストで向上させるために,EL4NER(Ensemble Learning Method for Named Entity Recognition)を提案する。 NER タスクに適した ICL デモ検索機構を確立するために,新しいスパンレベル文類似性アルゴリズムを提案する。
論文参考訳（メタデータ） (2025-05-29T03:25:14Z)
How Robust Are Router-LLMs? Analysis of the Fragility of LLM Routing Capabilities [62.474732677086855]
大規模言語モデル(LLM)ルーティングは,計算コストと性能のバランスをとる上で重要な戦略である。 DSCベンチマークを提案する: Diverse, Simple, and Categorizedは、幅広いクエリタイプでルータのパフォーマンスを分類する評価フレームワークである。
論文参考訳（メタデータ） (2025-03-20T19:52:30Z)
DLBacktrace: A Model Agnostic Explainability for any Deep Learning Models [1.747623282473278]
ディープラーニングモデルは、意思決定プロセスにおける透明性が制限された不透明な'ブラックボックス'として機能する。この研究は、AIシステムにおける解釈可能性の押し付けの必要性に対処し、信頼の育成、説明責任の確保、ミッションクリティカルな分野における責任あるデプロイメントの促進におけるその役割を強調した。 DLBacktraceは、AryaXAIチームが開発し、幅広い領域にわたるモデル決定を照らす革新的なテクニックです。
論文参考訳（メタデータ） (2024-11-19T16:54:30Z)
Neurosymbolic AI approach to Attribution in Large Language Models [5.3454230926797734]
ニューロシンボリックAI(NesyAI)は、ニューラルネットワークの強みと構造化されたシンボリック推論を組み合わせる。本稿では、NesyAIフレームワークが既存の属性モデルをどのように拡張し、より信頼性が高く、解釈可能で、適応可能なシステムを提供するかを検討する。
論文参考訳（メタデータ） (2024-09-30T02:20:36Z)
GEIC: Universal and Multilingual Named Entity Recognition with Large Language Models [7.714969840571947]
ジェネレーションベース抽出とテキスト内分類(GEIC)の課題について紹介する。次に,多言語GEICフレームワークであるCascadeNERを提案する。我々はまた、Large Language Models(LLMs)用に特別に設計された最初のNERデータセットであるAnythingNERを紹介します。
論文参考訳（メタデータ） (2024-09-17T09:32:12Z)
Proficient Graph Neural Network Design by Accumulating Knowledge on Large Language Models [20.31388126105889]
DesiGNNは知識中心のフレームワークで、過去のモデル設計の経験を構造化されたきめ細かな知識に変換する。目に見えないグラフ理解と既知の効果的なアーキテクチャパターンの固いメタ知識を構築することで、DesiGNNは、目に見えないデータセットに対するトップ5.77%の初期モデル提案を数秒で提供できる。
論文参考訳（メタデータ） (2024-08-13T08:22:01Z)
ProgGen: Generating Named Entity Recognition Datasets Step-by-step with Self-Reflexive Large Language Models [25.68491572293656]
大規模言語モデルは、名前付きエンティティ認識のような構造化された知識抽出タスクにおいて不足する。本稿では,より優れたNERデータセットを生成するため,LCMを質素なNER能力で活用するための革新的で費用効率のよい戦略について検討する。
論文参考訳（メタデータ） (2024-03-17T06:12:43Z)
NuNER: Entity Recognition Encoder Pre-training via LLM-Annotated Data [41.94295877935867]
Named Entity Recognitionタスクに特化したコンパクト言語表現モデルであるNuNERの作成方法を示す。 NuNERは、データ効率のよい方法で下流のNER問題を解決するように微調整できる。トレーニング済みデータセットのサイズとエンティティタイプの多様性が、優れたパフォーマンスを実現するための鍵であることが分かりました。
論文参考訳（メタデータ） (2024-02-23T14:23:51Z)
GLiNER: Generalist Model for Named Entity Recognition using Bidirectional Transformer [4.194768796374315]
名前付きエンティティ認識(NER)は、様々な自然言語処理(NLP)アプリケーションに必須である。本稿では,任意の種類のエンティティを識別するために訓練されたコンパクトなNERモデルを提案する。我々のモデルであるGLiNERは、Large Language Models (LLM) の遅いシーケンシャルトークン生成に対するアドバンテージである並列エンティティ抽出を容易にする。
論文参考訳（メタデータ） (2023-11-14T20:39:12Z)
Improving Open Information Extraction with Large Language Models: A Study on Demonstration Uncertainty [52.72790059506241]
オープン情報抽出(OIE)タスクは、構造化されていないテキストから構造化された事実を抽出することを目的としている。一般的なタスク解決手段としてChatGPTのような大きな言語モデル(LLM)の可能性にもかかわらず、OIEタスクの最先端(教師付き)メソッドは遅れている。
論文参考訳（メタデータ） (2023-09-07T01:35:24Z)
E-NER: Evidential Deep Learning for Trustworthy Named Entity Recognition [69.87816981427858]
ほとんどの名前付きエンティティ認識(NER)システムは、モデル不確実性を定量化する必要性を無視して、モデルパフォーマンスの改善に重点を置いている。 Evidential Deep Learning (EDL) は、最近、分類タスクの予測不確実性を明示的にモデル化するための有望な解決策として提案されている。本稿では、従来のEDLに2つの不確実性誘導損失条件を導入し、一連の不確実性誘導訓練戦略を導入することにより、E-NERという信頼性の高いNERフレームワークを提案する。
論文参考訳（メタデータ） (2023-05-29T02:36:16Z)
A Confidence-based Partial Label Learning Model for Crowd-Annotated Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文参考訳（メタデータ） (2023-05-21T15:31:23Z)
Batch-Ensemble Stochastic Neural Networks for Out-of-Distribution Detection [55.028065567756066]
Out-of-Distribution(OOD)検出は、機械学習モデルを現実世界のアプリケーションにデプロイすることの重要性から、マシンラーニングコミュニティから注目を集めている。本稿では,特徴量の分布をモデル化した不確実な定量化手法を提案する。バッチアンサンブルニューラルネットワーク(BE-SNN)の構築と機能崩壊問題の克服を目的として,効率的なアンサンブル機構,すなわちバッチアンサンブルを組み込んだ。 We show that BE-SNNs yield superior performance on the Two-Moons dataset, the FashionMNIST vs MNIST dataset, FashionM。
論文参考訳（メタデータ） (2022-06-26T16:00:22Z)
Distantly-Supervised Named Entity Recognition with Noise-Robust Learning and Language Model Augmented Self-Training [66.80558875393565]
遠距離ラベル付きデータのみを用いて、名前付きエンティティ認識(NER)モデルを訓練する際の課題について検討する。本稿では,新しい損失関数と雑音ラベル除去ステップからなるノイズロスバスト学習手法を提案する。提案手法は,既存の遠隔教師付きNERモデルよりも優れた性能を実現する。
論文参考訳（メタデータ） (2021-09-10T17:19:56Z)
An Open-Source Dataset and A Multi-Task Model for Malay Named Entity Recognition [3.511753382329252]
マレーNERデータセット(MYNER)を28,991文(384万個以上)で構築する。 NERトレーニングを明示的かつ暗黙的に改善するために、補助的なタスクである境界検出が導入されている。
論文参考訳（メタデータ） (2021-09-03T03:29:25Z)
Rethinking Generalization of Neural Models: A Named Entity Recognition Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文参考訳（メタデータ） (2020-01-12T04:33:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。