論文の概要: Strategies for Span Labeling with Large Language Models
- arxiv url: http://arxiv.org/abs/2601.16946v1
- Date: Fri, 23 Jan 2026 18:03:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.794998
- Title: Strategies for Span Labeling with Large Language Models
- Title(参考訳): 大規模言語モデルを用いたスパンラベリング手法
- Authors: Danil Semin, Ondřej Dušek, Zdeněk Kasner,
- Abstract要約: 大規模言語モデル(LLM)は、名前付きエンティティ認識やエラー検出などのテキスト解析タスクにますます使われている。
エンコーダベースのモデルとは異なり、生成アーキテクチャは入力の特定の部分を参照する明確なメカニズムを欠いている。
本稿では,これらの戦略を,入力テキストのタグ付け,スパンの数値位置のインデックス付け,スパンの内容のマッチングという3つのファミリーに分類する。
コンテンツマッチングの限界に対処するために,モデルの出力を有効な入力スパンと整合させる制約付き復号法であるLogitMatchを導入する。
- 参考スコア(独自算出の注目度): 0.19116784879310025
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) are increasingly used for text analysis tasks, such as named entity recognition or error detection. Unlike encoder-based models, however, generative architectures lack an explicit mechanism to refer to specific parts of their input. This leads to a variety of ad-hoc prompting strategies for span labeling, often with inconsistent results. In this paper, we categorize these strategies into three families: tagging the input text, indexing numerical positions of spans, and matching span content. To address the limitations of content matching, we introduce LogitMatch, a new constrained decoding method that forces the model's output to align with valid input spans. We evaluate all methods across four diverse tasks. We find that while tagging remains a robust baseline, LogitMatch improves upon competitive matching-based methods by eliminating span matching issues and outperforms other strategies in some setups.
- Abstract(参考訳): 大規模言語モデル(LLM)は、名前付きエンティティ認識やエラー検出などのテキスト解析タスクにますます使われている。
しかし、エンコーダベースのモデルとは異なり、生成アーキテクチャは入力の特定の部分を参照する明確なメカニズムを欠いている。
これは多種多様なアドホックなラベリング戦略をもたらし、しばしば矛盾した結果をもたらす。
本稿では,これらの戦略を,入力テキストのタグ付け,スパンの数値位置のインデックス付け,スパンの内容のマッチングという3つのファミリーに分類する。
コンテンツマッチングの限界に対処するために,モデルの出力を有効な入力スパンと整合させる制約付き復号法であるLogitMatchを導入する。
我々は4つのタスクにまたがるすべての手法を評価する。
タグ付けは依然として堅牢なベースラインでありながら、LogitMatchはマッチング問題を排除し、いくつかの設定で他の戦略を上回ることで、競合するマッチングベースのメソッドを改善します。
関連論文リスト
- MultiMatch: Multihead Consistency Regularization Matching for Semi-Supervised Text Classification [41.135013117834795]
我々は、協調学習と整合性正規化のパラダイムを擬似ラベルで組み合わせた、新しい半教師付き学習(SSL)アルゴリズムであるMultiMatchを紹介する。
コアとなるMultiMatchは、ヘッドアグリーメントとモデルの信頼性に基づいた擬似ラベルの選択とフィルタリングのために設計された擬似ラベル重み付けモジュールを備えている。
論文 参考訳(メタデータ) (2025-06-09T14:27:47Z) - Leveraging Annotator Disagreement for Text Classification [3.6625157427847963]
テキスト分類では、データセットが複数のアノテータによってアノテートされた場合でも、モデルトレーニングに1つのマジョリティラベルのみを使用するのが一般的である。
本稿では,アノテータの不一致を利用してテキスト分類を行う3つの手法を提案する。
論文 参考訳(メタデータ) (2024-09-26T06:46:53Z) - A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - A Structured Span Selector [100.0808682810258]
本稿では,新しい文法に基づく構造化スパン選択モデルを提案する。
我々は、コア参照解決とセマンティックロールラベリングという2つの一般的なスパン予測タスクでモデルを評価した。
論文 参考訳(メタデータ) (2022-05-08T23:58:40Z) - Contextualizing Meta-Learning via Learning to Decompose [125.76658595408607]
本稿では,メタ学習型サポート・ツー・ターゲット戦略の文脈化を図るために,ネットワーク(LeadNet)を分解する学習を提案する。
LeadNetは、コンテキスト間の比較をポリセムの埋め込みに組み込むことで、右に関連付けられた戦略を自動的に選択することを学ぶ。
論文 参考訳(メタデータ) (2021-06-15T13:10:56Z) - Few-shot Intent Classification and Slot Filling with Retrieved Examples [30.45269507626138]
そこで我々は,新しいバッチソフトマックスの手法を用いて,同じラベルを持つスパンの類似した文脈表現を学習するスパンレベル検索手法を提案する。
提案手法は,CLINCおよびSNIPSベンチマークにおいて,様々な数ショット設定で過去のシステムより優れていた。
論文 参考訳(メタデータ) (2021-04-12T18:50:34Z) - Wasserstein Distance Regularized Sequence Representation for Text
Matching in Asymmetrical Domains [51.91456788949489]
WD-Matchと呼ばれる非対称領域におけるテキストマッチングに適した新しいマッチング手法を提案する。
WD-Matchでは、ワッサーシュタイン距離に基づく正規化器が定義され、異なる領域から投影される特徴ベクトルを正規化する。
WD-Matchのトレーニングプロセスは、ワッサースタイン距離によって正規化されるマッチング損失を最小限に抑えるゲームに相当する。
論文 参考訳(メタデータ) (2020-10-15T12:52:09Z) - Dynamic Semantic Matching and Aggregation Network for Few-shot Intent
Detection [69.2370349274216]
利用可能な注釈付き発話が不足しているため、インテント検出は困難である。
セマンティック成分はマルチヘッド自己認識によって発話から蒸留される。
本手法はラベル付きインスタンスとラベルなしインスタンスの両方の表現を強化するための総合的なマッチング手段を提供する。
論文 参考訳(メタデータ) (2020-10-06T05:16:38Z) - MultiGBS: A multi-layer graph approach to biomedical summarization [6.11737116137921]
本稿では,文書を多層グラフとしてモデル化し,テキストの複数の特徴を同時に処理可能にするドメイン固有手法を提案する。
教師なしの手法では,MultiRankアルゴリズムと概念数に基づいて,多層グラフから文を選択する。
提案するMultiGBSアルゴリズムはUMLSを採用し,SemRepやMetaMap,OGERといったさまざまなツールを用いて概念と関係を抽出する。
論文 参考訳(メタデータ) (2020-08-27T04:22:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。