論文の概要: SS-MPC: A Sequence-Structured Multi-Party Conversation System
- arxiv url: http://arxiv.org/abs/2502.16920v1
- Date: Mon, 24 Feb 2025 07:25:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:55:14.532531
- Title: SS-MPC: A Sequence-Structured Multi-Party Conversation System
- Title(参考訳): SS-MPC:シーケンス構造化多人数会話システム
- Authors: Yoonjin Jang, Keunha Kim, Youngjoong Ko,
- Abstract要約: 我々は,多人数会話(MPC)モデルに対する応答生成モデルである textbfSS-MPC を提案する。
会話構造を分析するためにグラフに依存する既存のモデルとは異なり、SS-MPCは内部的に対話構造を逐次入力としてエンコードする。
人間による評価では、SS-MPCは既存のMPCモデルと比較して、より流動的で正確な応答を生成する。
- 参考スコア(独自算出の注目度): 12.943428847927123
- License:
- Abstract: Recent Multi-Party Conversation (MPC) models typically rely on graph-based approaches to capture dialogue structures. However, these methods have limitations, such as information loss during the projection of utterances into structural embeddings and constraints in leveraging pre-trained language models directly. In this paper, we propose \textbf{SS-MPC}, a response generation model for MPC that eliminates the need for explicit graph structures. Unlike existing models that depend on graphs to analyze conversation structures, SS-MPC internally encodes the dialogue structure as a sequential input, enabling direct utilization of pre-trained language models. Experimental results show that \textbf{SS-MPC} achieves \textbf{15.60\% BLEU-1} and \textbf{12.44\% ROUGE-L} score, outperforming the current state-of-the-art MPC response generation model by \textbf{3.91\%p} in \textbf{BLEU-1} and \textbf{0.62\%p} in \textbf{ROUGE-L}. Additionally, human evaluation confirms that SS-MPC generates more fluent and accurate responses compared to existing MPC models.
- Abstract(参考訳): 最近のMulti-Party Conversation(MPC)モデルは、通常、対話構造をキャプチャするためのグラフベースのアプローチに依存している。
しかし、これらの手法には、発話の投影中の情報損失や、事前訓練された言語モデルを直接活用する際の制約といった制限がある。
本稿では、明示的なグラフ構造を必要としないMPCの応答生成モデルである \textbf{SS-MPC} を提案する。
会話構造を分析するためにグラフに依存する既存のモデルとは異なり、SS-MPCは内部的に対話構造を逐次入力としてエンコードし、事前訓練された言語モデルの直接利用を可能にする。
実験の結果, \textbf{SS-MPC} は \textbf{15.60\% BLEU-1} と \textbf{12.44\% ROUGE-L} のスコアを達成し, \textbf{BLEU-1} の \textbf{3.91\%p} と \textbf{0.62\%p} の \textbf{ROUGE-L} の \textbf{0。
さらに, SS-MPCは既存のMPCモデルと比較して, より流動的で正確な応答を生成する。
関連論文リスト
- Adaptive Reconstruction for Graph Neural Networks [7.307436175842646]
グラフニューラルネットワーク(GNN)は、グラフ表現のための半教師付き学習において基礎となっている。
GNNにおける最近の研究動向 : テクスブファダプティブkホップ構造学習を中心に
我々はk-hop構造学習を動的に洗練するテクスチャファダプティブ再構築フレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-25T05:12:51Z) - Unsupervised Pre-training with Language-Vision Prompts for Low-Data Instance Segmentation [105.23631749213729]
低データ体制における教師なし事前学習のための新しい手法を提案する。
最近成功したプロンプト技術に触発されて,言語ビジョンプロンプトを用いた教師なし事前学習法を導入した。
提案手法は,低データ方式のCNNモデルよりも高速に収束し,性能がよいことを示す。
論文 参考訳(メタデータ) (2024-05-22T06:48:43Z) - CELA: Cost-Efficient Language Model Alignment for CTR Prediction [70.65910069412944]
CTR(Click-Through Rate)予測は、レコメンダシステムにおいて最重要位置を占める。
最近の取り組みは、プレトレーニング言語モデル(PLM)を統合することでこれらの課題を緩和しようとしている。
CTR予測のためのtextbfCost-textbfEfficient textbfLanguage Model textbfAlignment (textbfCELA)を提案する。
論文 参考訳(メタデータ) (2024-05-17T07:43:25Z) - Expedited Training of Visual Conditioned Language Generation via
Redundancy Reduction [61.16125290912494]
$textEVL_textGen$は、視覚条件付き言語生成モデルの事前トレーニング用に設計されたフレームワークである。
提案手法は,視覚言語モデルの学習を5倍に加速させるが,全体的な性能に顕著な影響を与えないことを示す。
論文 参考訳(メタデータ) (2023-10-05T03:40:06Z) - Grounded Image Text Matching with Mismatched Relation Reasoning [39.524420144738684]
GITM-MR(Gunded Image Text Matching with Mismatched Relation)は,新しい視覚言語共同作業である。
GITM-MRは、式が画像を記述するかどうかを最初に決定するためにモデルを必要とし、次に参照オブジェクトをローカライズするか、テキストのミスマッチ部分をグラウンドする。
本稿では、双方向メッセージ伝搬による関係認識推論を組み込んだRCRN(Relation-sensitive Cor correspondence Reasoning Network)を提案する。
論文 参考訳(メタデータ) (2023-08-02T15:44:36Z) - Autoregressive Structured Prediction with Language Models [73.11519625765301]
本稿では, PLM を用いた自己回帰的手法を用いて, モデル構造を行動列として記述する。
我々のアプローチは、私たちが見てきた全ての構造化予測タスクにおいて、新しい最先端を実現する。
論文 参考訳(メタデータ) (2022-10-26T13:27:26Z) - SAICL: Student Modelling with Interaction-level Auxiliary Contrastive
Tasks for Knowledge Tracing and Dropout Prediction [15.116940192251029]
本研究では,新しい学生モデリングフレームワークであるSAICLを紹介する。
クロスエントロピーと対照的な目的を組み合わせることで、提案したSAICLは、同等の知識追跡とドロップアウト予測性能を達成した。
論文 参考訳(メタデータ) (2022-10-07T14:17:22Z) - Enhancing Pre-trained Models with Text Structure Knowledge for Question
Generation [2.526624977753083]
テキスト構造を応答位置と構文依存としてモデル化し,これらの制約に対処するために応答局所性モデリングと構文マスクアテンションを提案する。
SQuADデータセットの実験により、提案した2つのモジュールは、トレーニング済みの強力なモデルであるProphetNetよりも性能が向上することが示された。
論文 参考訳(メタデータ) (2022-09-09T08:33:47Z) - Representation Learning for Conversational Data using Discourse Mutual
Information Maximization [9.017156603976915]
構造を意識しない単語・バイ・ワード生成は効果的な会話モデリングには適さないと我々は主張する。
対話表現モデルの学習のための構造認識型相互情報に基づく損失関数DMIを提案する。
本モデルでは,対話評価タスクであるDailyDialog++において,ランダムな負のシナリオと逆のシナリオの両方において,最も有望な性能を示す。
論文 参考訳(メタデータ) (2021-12-04T13:17:07Z) - Structural Adapters in Pretrained Language Models for AMR-to-text
Generation [59.50420985074769]
グラフ構造データからのテキスト生成に関するこれまでの研究は、事前学習言語モデル(plm)に依存している。
グラフ構造をPLMにエンコードするアダプタ法であるStructAdaptを提案する。
論文 参考訳(メタデータ) (2021-03-16T15:06:50Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。