論文の概要: Do Lexical and Contextual Coreference Resolution Systems Degrade Differently under Mention Noise? An Empirical Study on Scientific Software Mentions
- arxiv url: http://arxiv.org/abs/2604.02171v1
- Date: Thu, 02 Apr 2026 15:37:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.887811
- Title: Do Lexical and Contextual Coreference Resolution Systems Degrade Differently under Mention Noise? An Empirical Study on Scientific Software Mentions
- Title(参考訳): 精神ノイズ下での語彙的・文脈的基準解決システムは分解するか? : 科学的ソフトウェア精神に関する実証的研究
- Authors: Atilla Kaan Alkan, Felix Grezes, Jennifer Lynn Bartlett, Anna Kelbert, Kelly Lockhart, Alberto Accomazzi,
- Abstract要約: 我々は、コア参照解決に言及したクロスドキュメントソフトウェアにおけるSOMD 2026共有タスクへの参加を提示する。
我々は,Fizzy Matching (FM) とContext Aware Representation (CAR) の2つの細調整のない手法を比較した。
どちらも全てのサブタスク(CoNLL F1の0.94-0.96)で競争力を発揮し、CARは公式のテストセットでFMを1ポイント上回っている。
- 参考スコア(独自算出の注目度): 0.19364179562537212
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present our participation in the SOMD 2026 shared task on cross-document software mention coreference resolution, where our systems ranked second across all three subtasks. We compare two fine-tuning-free approaches: Fuzzy Matching (FM), a lexical string-similarity method, and Context Aware Representations (CAR), which combines mention-level and document-level embeddings. Both achieve competitive performance across all subtasks (CoNLL F1 of 0.94-0.96), with CAR consistently outperforming FM by 1 point on the official test set, consistent with the high surface regularity of software names, which reduces the need for complex semantic reasoning. A controlled noise-injection study reveals complementary failure modes: as boundary noise increases, CAR loses only 0.07 F1 points from clean to fully corrupted input, compared to 0.20 for FM, whereas under mention substitution, FM degrades more gracefully (0.52 vs. 0.63). Our inference-time analysis shows that FM scales superlinearly with corpus size, whereas CAR scales approximately linearly, making CAR the more efficient choice at large scale. These findings suggest that system selection should be informed by both the noise profile of the upstream mention detector and the scale of the target corpus. We release our code to support future work on this underexplored task.
- Abstract(参考訳): 我々は,3つのサブタスクで2位にランクインしたコア参照解決に関する,クロスドキュメントソフトウェアにおけるSOMD 2026共有タスクへの参加を提示する。
我々は,Fizzy Matching (FM) とContext Aware Representation (CAR) の2つの細調整のない手法を比較した。
どちらも全てのサブタスク(CoNLL F1の0.94-0.96)で競合性能を達成し、CARはソフトウェア名の高表面の規則性と整合してFMを1ポイント上回り、複雑なセマンティック推論の必要性を減らす。
境界ノイズの増加に伴い、CAR は FM が 0.20 であるのに対し、CAR は FM が 0.07 F1 の点しかなく、FM が 0.20 であるのに対して、FM は 0.63 よりも優雅に劣化する(0.52 対 0.63)。
我々の推定時間解析では、FMはコーパスサイズと超直線的にスケールするのに対し、CARは概ね線形にスケールするので、CARは大規模においてより効率的な選択となる。
これらの結果から,上流レファレンス検出器のノイズプロファイルと目標コーパスのスケールの両方でシステム選択を通知すべきであることが示唆された。
私たちは、この未調査のタスクの今後の作業をサポートするために、コードをリリースします。
関連論文リスト
- Beyond Final Answers: CRYSTAL Benchmark for Transparent Multimodal Reasoning Evaluation [3.23600523782706]
CRYSTAL (Clear Reasoning via Yielded Steps, Traceability, and Logic)は6,372インスタンスの診断ベンチマークである。
本稿では,意味的類似性マッチングによるステップレベルの精度とリコールをスコアするMatch F1と,乱れた推論連鎖をペナルティ化するOrdered Match F1の2つの相補的指標を提案する。
CPR-CurriculumはGRPOによるMatch F1の32%の改善を実現している。
論文 参考訳(メタデータ) (2026-03-13T15:48:15Z) - Lightweight Self-Supervised Detection of Fundamental Frequency and Accurate Probability of Voicing in Monophonic Music [0.0]
本稿では,F0推定とVoicing推論のための軽量で完全自己教師型フレームワークを提案する。
提案手法は競争力のあるクロスコーパス性能(RPA 95.84, RCA 96.24)を実現し,クロスインストラクトの一般化を実証する。
論文 参考訳(メタデータ) (2026-01-16T20:46:33Z) - AxBench: Steering LLMs? Even Simple Baselines Outperform Sparse Autoencoders [73.37603699731329]
ステアリングと概念検出のための大規模ベンチマークであるAxBenchを紹介する。
ステアリングでは、すべての既存のメソッドを高速に処理し、次いで微調整する。
概念検出では、差分のような表現に基づく手法が最善を尽くす。
論文 参考訳(メタデータ) (2025-01-28T18:51:24Z) - MAJL: A Model-Agnostic Joint Learning Framework for Music Source Separation and Pitch Estimation [14.547438854536306]
音源分離とピッチ推定は音楽情報検索において重要な課題である。
両タスクのモデル非依存型共同学習フレームワークを提案する。
両タスクにおいてMAJLが最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-01-07T10:38:51Z) - Uncertainty and Generalizability in Foundation Models for Earth Observation [1.3654846342364308]
我々は,特定の関心領域(AOI)において,限られたラベル付け予算で下流タスク(植生被覆の推定など)を設計したいという視点を採っている。
既存のファンデーションモデル(FM)を利用することで、異なるがラベルに富んだAOIで下流モデルをトレーニングするかどうかを判断する必要があります。
本研究では,Sentinel 1 または Sentinel 2 の8つの既存のFMを入力データとして,ESA World Cover 製品からのクラスを下流タスクとして,大規模なアブレーション研究を行う。
論文 参考訳(メタデータ) (2024-09-13T11:52:16Z) - Noisy Pair Corrector for Dense Retrieval [59.312376423104055]
ノイズペアコレクタ(NPC)と呼ばれる新しい手法を提案する。
NPCは検出モジュールと修正モジュールから構成される。
我々は,テキスト検索ベンチマークのNatural QuestionとTriviaQA,コード検索ベンチマークのStaQCとSO-DSで実験を行った。
論文 参考訳(メタデータ) (2023-11-07T08:27:14Z) - Class Prototype-based Cleaner for Label Noise Learning [73.007001454085]
半教師付き学習法は、雑音ラベル学習問題に対する現在のSOTAソリューションである。
textbfClass textbfPrototype-based label textbfCleaner。
論文 参考訳(メタデータ) (2022-12-21T04:56:41Z) - Disentangle Your Dense Object Detector [82.22771433419727]
深層学習に基づく高密度物体検出器はここ数年で大きな成功を収め、ビデオ理解などのマルチメディアアプリケーションにも応用されてきた。
しかし、現在の高密度検出器の訓練パイプラインは、保持できない多くの接続に妥協されている。
そこで本研究では, 簡易かつ効果的な遠心分離機構を設計し, 現在の最先端検出器に統合するDED(Disentangled Dense Object Detector)を提案する。
論文 参考訳(メタデータ) (2021-07-07T00:52:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。