論文の概要: An Annotation Scheme and Classifier for Personal Facts in Dialogue
- arxiv url: http://arxiv.org/abs/2605.10339v1
- Date: Mon, 11 May 2026 10:42:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.738868
- Title: An Annotation Scheme and Classifier for Personal Facts in Dialogue
- Title(参考訳): 対話における個人関係のアノテーション方式と分類法
- Authors: Konstantin Zaitsev,
- Abstract要約: 本稿では、既存のアプローチの制約に対処する個人的事実分類のための拡張アノテーションスキームを提案する。
提案手法では, 対話継続に適した記憶, 品質フィルタリング, 事実の識別が可能な新たなカテゴリ (Duration, Validity, Followup) と属性 (Duration, Validity, Followup) を導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The advancement of Large Language Models (LLMs) has enabled their application in personalized dialogue systems. We present an extended annotation scheme for personal fact classification that addresses limitations in existing approaches, particularly PeaCoK. Our scheme introduces new categories (Demographics, Possessions) and attributes (Duration, Validity, Followup) that enable structured storage, quality filtering, and identification of facts suitable for dialogue continuation. We manually annotated 2,779 facts from Multi-Session Chat and trained a multi-head classifier based on transformer encoders. Combined with the Gemma-300M encoder, the classifier achieves $81.6 \pm 2.6$\% macro F1, outperforming all few-shot LLM baselines (best: GPT-5.4-mini, 72.92\%) by nearly 9 percentage points while requiring substantially fewer computational resources. Error analysis reveals persistent challenges in semantic boundary disambiguation, temporal aspect interpretation, and pragmatic reasoning for followup assessment. The dataset\footnotemark[1] and classifier\footnotemark[2] are publicly available.
- Abstract(参考訳): LLM(Large Language Models)の進歩により、パーソナライズされた対話システムに応用できるようになった。
本稿では,既存のアプローチ,特にPeaCoKにおける制約に対処する,個人的事実分類のための拡張アノテーションスキームを提案する。
提案手法では, 対話継続に適した記憶, 品質フィルタリング, 事実の識別が可能な新たなカテゴリ (Duration, Validity, Followup) と属性 (Duration, Validity, Followup) を導入する。
マルチセッションチャットから2,779の事実を手動でアノテートし,トランスフォーマーエンコーダに基づくマルチヘッド分類器を訓練した。
Gemma-300Mエンコーダと組み合わせて、分類器は81.6 \pm 2.6$\%のマクロF1を達成し、より少ない計算資源を必要としながら、ほとんど9ポイントの差(GPT-5.4-mini, 72.92\%)を達成している。
誤り解析は、意味境界の曖昧さ、時間的側面の解釈、そしてフォローアップアセスメントのための実践的推論における永続的な課題を明らかにする。
dataset\footnotemark[1]とclassifier\footnotemark[2]が公開されている。
関連論文リスト
- Are Multimodal Large Language Models Good Annotators for Image Tagging? [62.01475514488922]
本稿では,MLLMの生成するアノテーションと人間のアノテーションのギャップを分析することを目的とする。
本稿では,MLLM生成アノテーションと人間のアノテーションのギャップを狭めることを目的とした,画像タグ付けのための新しいフレームワークであるTagLLMを提案する。
論文 参考訳(メタデータ) (2026-02-24T14:53:16Z) - Divide, Cache, Conquer: Dichotomic Prompting for Efficient Multi-Label LLM-Based Classification [0.2799896314754614]
大規模言語モデル(LLM)を用いた効率的な多言語テキスト分類手法を提案する。
単一の構造化された応答で全てのラベルを生成する代わりに、各ターゲット次元は独立してクエリされる。
この結果から,マルチラベル分類をダイコトミッククエリに分解することで,スケーラブルで効率的なフレームワークが提供されることが示唆された。
論文 参考訳(メタデータ) (2025-11-05T19:53:51Z) - Small sample-based adaptive text classification through iterative and contrastive description refinement [0.0]
大規模言語モデル(LLM)は、進化する知識とあいまいなカテゴリ境界を持つ領域の一般化に苦慮することが多い。
本稿では,反復的トピック洗練,コントラスト的プロンプト,アクティブラーニングを組み合わせた分類フレームワークを提案する。
このフレームワークはHuman-in-the-loopコンポーネントを備えており、自然言語でカテゴリ定義を導入したり、改訂したりすることができる。
論文 参考訳(メタデータ) (2025-08-01T11:12:38Z) - Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.16354555208417]
PADとFFDはそれぞれ物理メディアベースのプレゼンテーションアタックとデジタル編集ベースのDeepFakeから顔データを保護するために提案されている。
これら2つのカテゴリの攻撃を同時に処理する統一顔攻撃検出モデルがないことは、主に2つの要因に起因する。
本稿では,異なる意味空間から複数の分類基準を適応的に探索する,視覚言語モデルに基づく階層型プロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T16:35:45Z) - Just Say the Word: Annotation-Free Fine-Grained Object Counting [22.31750687552324]
細粒度オブジェクトカウントは、クラスに依存しないカウントモデルにとって依然として大きな課題である。
カテゴリ名を与えられた場合、合成画像と擬似ラベルを用いてプロンプトからコンパクトな概念を組み込む。
この埋め込み条件は、凍結したカウンタからの生のオーバーカウントを正確にカテゴリー別推定に洗練する特殊化モジュールである。
論文 参考訳(メタデータ) (2025-04-16T02:05:47Z) - Localizing Factual Inconsistencies in Attributable Text Generation [74.11403803488643]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - A Fixed-Point Approach to Unified Prompt-Based Counting [51.20608895374113]
本研究の目的は,ボックス,ポイント,テキストなど,さまざまなプロンプト型で示されるオブジェクトの密度マップを生成することができる包括的プロンプトベースのカウントフレームワークを確立することである。
本モデルは,クラスに依存しない顕著なデータセットに優れ,データセット間の適応タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2024-03-15T12:05:44Z) - BYOC: Personalized Few-Shot Classification with Co-Authored Class
Descriptions [2.076173115539025]
LLMを用いた少数ショットテキスト分類のための新しい手法を提案する。
わずかな例ではなく、LLMは各クラスの健全な特徴を記述して誘導される。
例、質問、回答は、分類プロンプトを形成するために要約される。
論文 参考訳(メタデータ) (2023-10-09T19:37:38Z) - Enabling Classifiers to Make Judgements Explicitly Aligned with Human
Values [73.82043713141142]
性差別/人種差別の検出や毒性検出などの多くのNLP分類タスクは、人間の値に基づいている。
本稿では,コマンド内で明示的に記述された人間の値に基づいて予測を行う,値整合型分類のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-14T09:10:49Z) - Multitask Learning for Class-Imbalanced Discourse Classification [74.41900374452472]
マルチタスクアプローチは,現在のベンチマークで7%のマイクロf1コアを改善できることを示す。
また,NLPにおける資源不足問題に対処するための追加手法の比較検討を行った。
論文 参考訳(メタデータ) (2021-01-02T07:13:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。