論文の概要: A Mechanism and Optimization Study on the Impact of Information Density on User-Generated Content Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2604.18944v1
- Date: Tue, 21 Apr 2026 00:46:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.555093
- Title: A Mechanism and Optimization Study on the Impact of Information Density on User-Generated Content Named Entity Recognition
- Title(参考訳): エンティティ認識を用いたユーザ生成コンテンツに対する情報密度の影響に関するメカニズムと最適化研究
- Authors: Jiang Xiaobo, Dinghong Lai, Song Qiu, Yadong Deng, Xinkai Zhan,
- Abstract要約: 低情報密度(ID)による表面レベルノイズ症状は根本原因の統一化に寄与していることを示す。
「注意スペクトル分析(ASA)を導入し、IDの減少が注意をそらす原因を定量化する。」
提案するWindow-Aware Optimization Module (WOM) は LLM を利用したモデルに依存しないフレームワークである。
- 参考スコア(独自算出の注目度): 1.005854289245731
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named Entity Recognition (NER) models trained on clean, high-resource corpora exhibit catastrophic performance collapse when deployed on noisy, sparse User-Generated Content (UGC), such as social media. Prior research has predominantly focused on point-wise symptom remediation -- employing customized fine-tuning to address issues like neologisms, alias drift, non-standard orthography, long-tail entities, and class imbalance. However, these improvements often fail to generalize because they overlook the structural sparsity inherent in UGC. This study reveals that surface-level noise symptoms share a unified root cause: low Information Density (ID). Through hierarchical confounding-controlled resampling experiments (specifically controlling for entity rarity and annotation consistency), this paper identifies ID as an independent key factor. We introduce Attention Spectrum Analysis (ASA) to quantify how reduced ID causally leads to ``attention blunting,'' ultimately degrading NER performance. Informed by these mechanistic insights, we propose the Window-Aware Optimization Module (WOM), an LLM-empowered, model-agnostic framework. WOM identifies information-sparse regions and utilizes selective back-translation to directionally enhance semantic density without altering model architecture. Deployed atop mainstream architectures on standard UGC datasets (WNUT2017, Twitter-NER, WNUT2016), WOM yields up to 4.5\% absolute F1 improvement, demonstrating robustness and achieving new state-of-the-art (SOTA) results on WNUT2017.
- Abstract(参考訳): クリーンで高リソースなコーパスでトレーニングされたエンティティ認識(NER)モデルは、ソーシャルメディアなどの希少なユーザ生成コンテンツ(UGC)上にデプロイされた場合、壊滅的なパフォーマンス崩壊を示す。
従来の研究では、ネオロジズム、エイリアスドリフト、非標準正書法、ロングテールエンティティ、クラス不均衡といった問題に対処するために、カスタマイズされた微調整を活用して、ポイントワイドな症状の修復に重点を置いていた。
しかしながら、これらの改善はしばしば、UGCに固有の構造的疎結合を見落としているため、一般化に失敗する。
本研究は,低情報密度 (ID) の根本原因を表面レベルノイズ症状が共有していることを明らかにする。
本稿では,階層的コンバウンディング制御による再サンプリング実験(特にエンティティの規則性やアノテーションの一貫性の制御)を通じて,IDを独立したキーファクタとして同定する。
我々は,Attention Spectrum Analysis (ASA)を導入し,IDの因果的削減が,最終的にNER性能の低下につながるかを定量化する。
これらの力学的な知見から,LLMを利用したモデルに依存しないフレームワークである Window-Aware Optimization Module (WOM) を提案する。
WOMは、情報スパース領域を特定し、選択的なバックトランスレーションを利用して、モデルアーキテクチャを変更することなく、意味密度を方向付けする。
標準的なUGCデータセット(WNUT2017、Twitter-NER、WNUT2016)のメインストリームアーキテクチャ上にデプロイされたWOMは、最大4.5\%の絶対F1の改善、堅牢性の実証、WNUT2017の新たな最先端(SOTA)結果の達成を実現している。
関連論文リスト
- EReLiFM: Evidential Reliability-Aware Residual Flow Meta-Learning for Open-Set Domain Generalization under Noisy Labels [85.78886153628663]
Open-Set Domain Generalizationは、ディープラーニングモデルが新しいドメインで目に見えないカテゴリを認識できるようにすることを目的としている。
ラベルノイズは、ソースドメインの知識を損なうことによって、オープンセットドメインの一般化を妨げる。
本稿では,ドメインギャップを埋めるために,Evidential Reliability-Aware Residual Flow Meta-Learning (EReLiFM)を提案する。
論文 参考訳(メタデータ) (2025-10-14T16:23:11Z) - A Noise-Resilient Semi-Supervised Graph Autoencoder for Overlapping Semantic Community Detection [0.0]
重なり合う構造を持つネットワークにおけるコミュニティ検出は依然として重要な課題である。
重なり合うコミュニティを頑健に検出するために,グラフの多面的注意とモジュール性を組み合わせた半教師付きグラフオートエンコーダを提案する。
主なイノベーションは、耐雑音性アーキテクチャと、コミュニティの品質に最適化されたセマンティックな半教師付き設計である。
論文 参考訳(メタデータ) (2025-05-09T11:34:07Z) - Dissecting the Failure of Invariant Learning on Graphs [36.11431280689549]
本研究では、2つの顕著な不変学習法の性能を理論的に判別する構造因果モデル(SCM)を開発した。
我々は,同じクラスに設定されたクロス環境表現をアライメントすることで,突発的特徴を明示的に排除する,クロス環境内アライメント(CIA)を提案する。
さらに、隣接ラベルの分布を利用してノード表現を選択的に整列させるCIA-LRA(Localized Reweighting Alignment)を提案する。
論文 参考訳(メタデータ) (2024-11-05T06:36:48Z) - Unbiased Faster R-CNN for Single-source Domain Generalized Object Detection [35.71100602593928]
一般化可能な特徴学習のためのUnbiased Faster R-CNN (UFR)を提案する。
具体的には、因果的観点からの物体検出を定式化し、データバイアスとタスクの特徴バイアスを分析する構造因果モデル(SCM)を構築する。
5つの場面における実験結果から,本手法の顕著な一般化能力が示され,ナイトクリアシーンでは3.9%のmAPが向上した。
論文 参考訳(メタデータ) (2024-05-24T05:34:23Z) - Discovering Dynamic Causal Space for DAG Structure Learning [64.763763417533]
本稿では,DAG構造学習のための動的因果空間であるCASPERを提案する。
グラフ構造をスコア関数に統合し、因果空間における新しい尺度として、推定真理DAGと基底真理DAGの因果距離を忠実に反映する。
論文 参考訳(メタデータ) (2023-06-05T12:20:40Z) - Calibrated Feature Decomposition for Generalizable Person
Re-Identification [82.64133819313186]
Calibrated Feature Decomposition (CFD)モジュールは、人物の再識別の一般化能力の向上に焦点を当てている。
キャリブレーション・アンド・スタンダード化されたバッチ正規化(CSBN)は、キャリブレーションされた人物表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-11-27T17:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。