論文の概要: IRC-Bench: Recognizing Entities from Contextual Cues in First-Person Reminiscences
- arxiv url: http://arxiv.org/abs/2605.06142v1
- Date: Thu, 07 May 2026 12:39:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.780222
- Title: IRC-Bench: Recognizing Entities from Contextual Cues in First-Person Reminiscences
- Title(参考訳): IRC-Bench:初対人回想における文脈クイズからの実体認識
- Authors: Yehudit Aperstein, Eden Moran, Alexander Apartsin,
- Abstract要約: IRC-Benchは暗黙的な実体認識を評価するためのベンチマークである。
12,337のWikiデータリンクされたエンティティから1,994のテキストに25,136のサンプルが作成されている。
LLM生成、高密度検索、RAG、微調整を含む19の構成を評価した。
- 参考スコア(独自算出の注目度): 43.0484058393522
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When people recount personal memories, they often refer to people, places, and events indirectly, relying on contextual cues rather than explicit names. Such implicit references are central to reminiscence narratives: first-person accounts of lived experience used in therapeutic, archival, and social settings. They pose a difficult computational problem because the intended entity must be inferred from dispersed narrative evidence rather than from a local mention. We introduce IRC-Bench, the Implicit Reminiscence Context Benchmark, for evaluating implicit entity recognition in reminiscence transcripts. The benchmark targets non-locality: entity-identifying cues are distributed across multiple, non-contiguous clauses, unlike named entity recognition, entity linking, or coreference resolution. IRC-Bench comprises 25,136 samples constructed from 12,337 Wiki-data-linked entities across 1,994 transcripts spanning 11 thematic domains. Each sample pairs an Entity-Grounded Narrative, in which the target entity is explicitly mentioned, with an Entity-Elided Narrative, in which direct mentions are removed. We evaluate 19 configurations across LLM generation, dense retrieval, RAG, and fine-tuning. QLoRA-adapted Llama 3.1 8B performs best in the open-world setting (38.94% exact match; 51.59% Jaccard), while fine-tuned DPR leads closed-world retrieval (35.38% Hit@1; 71.49% Hit@10). We release IRC-Bench with data, code, and evaluation tools.
- Abstract(参考訳): 人は個人的な記憶を振り返ると、しばしば人、場所、出来事を間接的に参照し、明示的な名前ではなく文脈的な手がかりに依存する。
このような暗黙の言及は思い出の物語の中心であり、治療、アーカイブ、社会設定で使われる生きた経験を一人称で記述する。
それらは、意図された実体は、局所的な言及からではなく、分散した物語的証拠から推論されなければならないため、難しい計算問題を引き起こす。
我々はImplicit Reminiscence Context BenchmarkであるIRC-Benchを導入し、暗黙的なエンティティ認識を評価する。
エンティティ識別キューは、名前付きエンティティ認識、エンティティリンク、コア参照解決とは異なり、複数の、連続しない節に分散されます。
IRC-Benchは、11のセマンティックドメインにまたがる1,994の転写された12,337のWikiデータリンクされたエンティティから構築された25,136のサンプルで構成されている。
各サンプルはEntity-Grounded Narrativeのペアで、ターゲットエンティティが明示的に言及され、Entity-Elided Narrativeが直接参照を削除する。
LLM生成、高密度検索、RAG、微調整を含む19の構成を評価した。
QLoRA対応のLlama 3.1 8Bはオープンワールド・セッティング(38.94%の正確な試合、51.59%のジャカード)でベスト、微調整のDPRはクローズドワールド・検索(35.38%のヒット@1; 71.49%のヒット@10)をリードする。
データ、コード、評価ツールを備えたIRC-Benchをリリースします。
関連論文リスト
- NearID: Identity Representation Learning via Near-identity Distractors [116.71529576796605]
既存のビジョンエンコーダは、オブジェクトのアイデンティティを背景コンテキストと絡み合わせることで、信頼性の低い表現やメトリクスを生み出します。
我々は、この脆弱性に対処するための最初の原則付きフレームワークをNear-identity distractorsを使って紹介する。
我々は、厳密なマージンベースの評価プロトコルとともに、NearIDデータセット(19KのID、316Kの一致したコンテキストインタプリタ)を提示する。
論文 参考訳(メタデータ) (2026-04-02T12:33:14Z) - Selective Memory for Artificial Intelligence: Write-Time Gating with Hierarchical Archiving [0.0]
パラメトリックアプローチは、選択的な更新を前に、知識を重みに圧縮する。
合成サリエンススコアを用いて、入ってくる知識オブジェクトをフィルタリングする書き込み時間ゲーティングを導入する。
論文 参考訳(メタデータ) (2026-03-16T23:06:44Z) - Enhancing the Robustness of Contextual ASR to Varying Biasing Information Volumes Through Purified Semantic Correlation Joint Modeling [63.755562174967274]
クロスアテンションはバイアス情報量の変化に影響される。
そこで本研究では,PSC-Jointを用いた意味相関結合モデリング手法を提案する。
PSC-JointはAISHELL-1では21.34%、KeSpeechでは28.46%の平均的なF1スコアの改善を達成した。
論文 参考訳(メタデータ) (2025-09-07T03:46:59Z) - Entity Re-identification in Visual Storytelling via Contrastive Reinforcement Learning [0.2455468619225742]
ビジュアルストーリーテリングシステムは、フレーム間のキャラクタとオブジェクトの同一性を維持するのに苦労する。
本研究では,コヒーレントな画像列と無関係な画像から物語を識別するモデルを訓練する,対照的な強化学習手法を提案する。
論文 参考訳(メタデータ) (2025-07-09T23:52:10Z) - Exploring SSL Discrete Speech Features for Zipformer-based Contextual ASR [74.38242498079627]
自己教師付き学習(SSL)に基づく離散音声表現は、非常にコンパクトで、ドメイン適応性が高い。
本稿では、Zipformer-Transducer ASRシステムにおいて、WavLMモデルから抽出したSSL離散音声特徴を追加の発話音響コンテキスト特徴として用いた。
論文 参考訳(メタデータ) (2024-09-13T13:01:09Z) - SWING: Balancing Coverage and Faithfulness for Dialogue Summarization [67.76393867114923]
本稿では,自然言語推論(NLI)モデルを用いて,事実の不整合を回避し,カバレッジを向上させることを提案する。
我々は、NLIを用いて詳細なトレーニング信号を計算し、モデルがカバーされていない参照サマリーのコンテンツを生成することを奨励する。
DialogSumおよびSAMSumデータセットの実験により,提案手法の有効性が確認された。
論文 参考訳(メタデータ) (2023-01-25T09:33:11Z) - 'Tis but Thy Name: Semantic Question Answering Evaluation with 11M Names
for 1M Entities [0.0]
Wiki Entity similarity(WES)データセットは、Wikipediaのリンクテキストから生成される111M例、ドメインターゲット、セマンティックエンティティ類似性データセットである。
例はエンティティとフレーズで、セマンティッククラスタにグループ化され、複数の基底構造ラベルをシミュレートする。
人間のアノテータは、WESラベルに一貫して同意し、基本的なクロスエンコーダメトリックは、人間の正当性を予測するための4つの古典的な指標よりも優れている。
論文 参考訳(メタデータ) (2022-02-28T07:12:39Z) - A Unified Approach to Entity-Centric Context Tracking in Social
Conversations [6.0969408858730985]
人間と人間の会話において、コンテキストトラッキングは重要な実体を特定し、それらの性質と関係を追跡する。
Contrackは、人間と人間の大規模会話コーパスで、コンテキストトラッキングと位置アノテーションを提供する。
コンテキストトラッキングのためのニューラルネットワークアーキテクチャをオープンソースとして公開しています。
論文 参考訳(メタデータ) (2022-01-28T20:38:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。