論文の概要: Low-resource Personal Attribute Prediction from Conversation
- arxiv url: http://arxiv.org/abs/2211.15324v1
- Date: Mon, 28 Nov 2022 14:04:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 17:55:26.464765
- Title: Low-resource Personal Attribute Prediction from Conversation
- Title(参考訳): 会話からの低リソース個人属性予測
- Authors: Yinan Liu and Hu Chen and Wei Shen and Jiaoyan Chen
- Abstract要約: 会話から個人属性を予測するための新しいフレームワークPEARLを提案する。
PEARLは、更新された先行属性知識を用いて、両項意味情報と単語共起情報とをシームレスに結合する。
- 参考スコア(独自算出の注目度): 20.873276038560057
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Personal knowledge bases (PKBs) are crucial for a broad range of applications
such as personalized recommendation and Web-based chatbots. A critical
challenge to build PKBs is extracting personal attribute knowledge from users'
conversation data. Given some users of a conversational system, a personal
attribute and these users' utterances, our goal is to predict the ranking of
the given personal attribute values for each user. Previous studies often rely
on a relative number of resources such as labeled utterances and external data,
yet the attribute knowledge embedded in unlabeled utterances is underutilized
and their performance of predicting some difficult personal attributes is still
unsatisfactory. In addition, it is found that some text classification methods
could be employed to resolve this task directly. However, they also perform not
well over those difficult personal attributes. In this paper, we propose a
novel framework PEARL to predict personal attributes from conversations by
leveraging the abundant personal attribute knowledge from utterances under a
low-resource setting in which no labeled utterances or external data are
utilized. PEARL combines the biterm semantic information with the word
co-occurrence information seamlessly via employing the updated prior attribute
knowledge to refine the biterm topic model's Gibbs sampling process in an
iterative manner. The extensive experimental results show that PEARL
outperforms all the baseline methods not only on the task of personal attribute
prediction from conversations over two data sets, but also on the more general
weakly supervised text classification task over one data set.
- Abstract(参考訳): 個人知識ベース(pkbs)は、パーソナライズドレコメンデーションやwebベースのチャットボットなど、幅広いアプリケーションにとって重要である。
PKBを構築する上で重要な課題は、ユーザの会話データから個人属性の知識を抽出することである。
会話システムや個人属性,これらのユーザの発話のユーザ数を考えると,ユーザ毎の個人属性値のランク付けを予測することが目的である。
従来の研究では、ラベル付き発話や外部データなどのリソースの相対的な数に依存することが多いが、ラベル付き発話に埋め込まれた属性知識は未利用であり、難解な個人属性を予測する能力は未だに不十分である。
さらに,この課題を直接解決するために,いくつかのテキスト分類手法が利用可能であることが判明した。
しかし、これらの難しい個人的属性に対してうまく機能しない。
本稿では,ラベル付き発話や外部データを使用しない低リソース環境下で,発話から豊富な個人的属性知識を活用し,会話から個人的属性を予測する新しい枠組みを提案する。
PEARLは、更新された事前属性知識を用いて、両項意味情報と単語共起情報をシームレスに結合し、両項トピックモデルのギブスサンプリングプロセスを反復的に洗練する。
広範な実験結果から,pearlは2つのデータセット上での会話による個人属性予測のタスクだけでなく,より一般的な弱い教師付きテキスト分類タスクを1つのデータセット上で超えていることがわかった。
関連論文リスト
- PersonalSum: A User-Subjective Guided Personalized Summarization Dataset for Large Language Models [3.516029765200171]
我々はPersonalSumと呼ばれる高品質でパーソナライズされた手作業による要約データセットを提案する。
このデータセットは、公開読者の焦点が、大規模言語モデルによって生成された一般的な要約と異なるかどうかを調査する最初のものである。
論文 参考訳(メタデータ) (2024-10-04T20:12:39Z) - Prompt-based Personality Profiling: Reinforcement Learning for Relevance Filtering [8.20929362102942]
著者プロファイルは、共有するコンテンツを分析して個人の特徴を推測するタスクである。
本稿では,関係のないコンテンツと関係のないコンテンツとを区別することを目的とした著者プロファイリング手法を提案し,それに続いて,関連データのみを用いて実際のユーザプロファイリングを行う。
2つのTwitterコーパスにおける5つの人格特性予測手法の評価を行った。
論文 参考訳(メタデータ) (2024-09-06T08:43:10Z) - Speaker Profiling in Multiparty Conversations [31.518453682472575]
本研究では,会話における話者プロファイリング(SPC)の課題について検討する。
SPCの主な目的は、対話に存在する各話者について、ペルソナの特徴の要約を作成することである。
SPCの課題に対処するため、私たちはSPICEという名前の新しいデータセットをキュレートしました。
論文 参考訳(メタデータ) (2023-04-18T08:04:46Z) - AnnoLLM: Making Large Language Models to Be Better Crowdsourced Annotators [98.11286353828525]
GPT-3.5シリーズのモデルは、様々なNLPタスクにまたがる顕著な少数ショットとゼロショットの能力を示している。
本稿では,2段階のアプローチを取り入れたAnnoLLMを提案する。
我々はAnnoLLMを用いた対話型情報検索データセットを構築した。
論文 参考訳(メタデータ) (2023-03-29T17:03:21Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - Personal Attribute Prediction from Conversations [9.208339833472051]
個人知識ベース(PKB)の充実に寄与する個人属性値の予測を目指す。
ラベル付き発話を必要とせずに会話から個人属性を予測するために,雑音ロス機能付き事前学習言語モデルに基づくフレームワークを提案する。
本フレームワークは, nDCG と MRR の合計12基に対して, 最高の性能が得られる。
論文 参考訳(メタデータ) (2022-08-29T15:21:53Z) - Dialogue History Matters! Personalized Response Selectionin Multi-turn
Retrieval-based Chatbots [62.295373408415365]
本稿では,コンテキスト応答マッチングのためのパーソナライズドハイブリッドマッチングネットワーク(phmn)を提案する。
1) ユーザ固有の対話履歴からパーソナライズされた発話行動を付加的なマッチング情報として抽出する。
ユーザ識別による2つの大規模データセット,すなわちパーソナライズされた対話 Corpus Ubuntu (P-Ubuntu) とパーソナライズされたWeiboデータセット (P-Weibo) のモデルを評価する。
論文 参考訳(メタデータ) (2021-03-17T09:42:11Z) - Vyaktitv: A Multimodal Peer-to-Peer Hindi Conversations based Dataset
for Personality Assessment [50.15466026089435]
本稿では,ピアツーピアのHindi会話データセットであるVyaktitvを提案する。
参加者の高品質な音声とビデオの録音と、会話ごとにヒングリッシュのテキストによる書き起こしで構成されている。
データセットには、収入、文化的指向など、すべての参加者のための豊富な社会デコグラフィー的特徴が含まれています。
論文 参考訳(メタデータ) (2020-08-31T17:44:28Z) - Deep Active Learning with Crowdsourcing Data for Privacy Policy
Classification [6.5443502434659955]
アクティブラーニングとクラウドソーシングの技術は、Calpricという自動分類ツールの開発に使用されている。
Calpricは、ラベル付けコストを最小限に抑えつつ、高い精度で熟練した人間のアノテータによるアノテーションに匹敵するアノテーションを実行することができる。
我々のモデルは、オリジナルのラベル付け作業の62%だけを使用して、同じF1スコアを達成することができる。
論文 参考訳(メタデータ) (2020-08-07T02:13:31Z) - TIPRDC: Task-Independent Privacy-Respecting Data Crowdsourcing Framework
for Deep Learning with Anonymized Intermediate Representations [49.20701800683092]
本稿では,匿名化中間表現を用いたタスク非依存型プライバシ参照データクラウドソーシングフレームワークTIPRDCを提案する。
このフレームワークの目的は、中間表現からプライバシー情報を隠蔽できる機能抽出器を学習することであり、データコレクターの生データに埋め込まれた元の情報を最大限に保持し、未知の学習タスクを達成することである。
論文 参考訳(メタデータ) (2020-05-23T06:21:26Z) - A Neural Topical Expansion Framework for Unstructured Persona-oriented
Dialogue Generation [52.743311026230714]
Persona Exploration and Exploitation (PEE)は、事前に定義されたユーザペルソナ記述を意味論的に相関したコンテンツで拡張することができる。
PEEはペルソナ探索とペルソナ搾取という2つの主要なモジュールで構成されている。
提案手法は, 自動評価と人的評価の両面で, 最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-02-06T08:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。