論文の概要: NormGenesis: Multicultural Dialogue Generation via Exemplar-Guided Social Norm Modeling and Violation Recovery
- arxiv url: http://arxiv.org/abs/2509.18395v1
- Date: Mon, 22 Sep 2025 20:29:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-24 20:41:27.57079
- Title: NormGenesis: Multicultural Dialogue Generation via Exemplar-Guided Social Norm Modeling and Violation Recovery
- Title(参考訳): NormGenesis:Exemplar-Guided Social Norm ModelingとVolation Recoveryによる多文化対話生成
- Authors: Minki Hong, Jangho Choi, Jihie Kim,
- Abstract要約: 我々は、英語、中国語、韓国語で社会的に根ざした対話を生成するための枠組みであるNormGenesisを提示する。
本稿では,認識と社会的に適切な修復を通じて,標準違反後の会話の進行をモデル化する対話型V2Rを提案する。
V2Rを付加したデータに基づいてトレーニングしたモデルは、倫理的に敏感な文脈における実用的能力の向上を示す。
- 参考スコア(独自算出の注目度): 4.701242219264098
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Social norms govern culturally appropriate behavior in communication, enabling dialogue systems to produce responses that are not only coherent but also socially acceptable. We present NormGenesis, a multicultural framework for generating and annotating socially grounded dialogues across English, Chinese, and Korean. To model the dynamics of social interaction beyond static norm classification, we propose a novel dialogue type, Violation-to-Resolution (V2R), which models the progression of conversations following norm violations through recognition and socially appropriate repair. To improve pragmatic consistency in underrepresented languages, we implement an exemplar-based iterative refinement early in the dialogue synthesis process. This design introduces alignment with linguistic, emotional, and sociocultural expectations before full dialogue generation begins. Using this framework, we construct a dataset of 10,800 multi-turn dialogues annotated at the turn level for norm adherence, speaker intent, and emotional response. Human and LLM-based evaluations demonstrate that NormGenesis significantly outperforms existing datasets in refinement quality, dialogue naturalness, and generalization performance. We show that models trained on our V2R-augmented data exhibit improved pragmatic competence in ethically sensitive contexts. Our work establishes a new benchmark for culturally adaptive dialogue modeling and provides a scalable methodology for norm-aware generation across linguistically and culturally diverse languages.
- Abstract(参考訳): 社会的規範は、コミュニケーションにおいて文化的に適切な振る舞いを司り、対話システムは、一貫性だけでなく社会的に受け入れられる応答を生み出すことができる。
我々は、英語、中国語、韓国語間の社会的根拠のある対話を生成・注釈する多文化的な枠組みであるNormGenesisを提示する。
静的な規範分類を超えた社会的相互作用のダイナミクスをモデル化するために,認識と社会的に適切な修復を通じて,規範違反後の会話の進行をモデル化する新たな対話型V2Rを提案する。
未表現言語における実用的整合性を改善するために,対話合成プロセスの早期に,模範に基づく反復改良を実装した。
このデザインは、完全な対話生成が始まる前に、言語的、感情的、社会的な期待と一致させる。
このフレームワークを用いて,標準順守,話者意図,感情応答のために,ターンレベルでアノテートされた10,800個のマルチターン対話のデータセットを構築した。
人間とLLMに基づく評価では、NormGenesisは改良品質、対話自然性、一般化性能において既存のデータセットを著しく上回っている。
V2Rを付加したデータに基づいてトレーニングしたモデルは、倫理的に敏感な文脈における実用的能力の向上を示す。
我々の研究は、文化的適応型対話モデリングの新しいベンチマークを確立し、言語的および文化的に多様な言語にまたがるノルム認識生成のためのスケーラブルな方法論を提供する。
関連論文リスト
- Aligning Spoken Dialogue Models from User Interactions [55.192134724622235]
本稿では,ユーザの対話からリアルタイム会話における音声対話モデルを改善するための新しい嗜好アライメントフレームワークを提案する。
AIフィードバックを付加した生のマルチターン音声会話から15万以上の好みペアのデータセットを作成する。
本研究は, 自然なリアルタイム音声対話システムにおいて重要な, 様々な力学におけるバランスの整合性の重要性を浮き彫りにした。
論文 参考訳(メタデータ) (2025-06-26T16:45:20Z) - Cultural Learning-Based Culture Adaptation of Language Models [70.1063219524999]
大きな言語モデル(LLM)をさまざまな文化的価値に適用することは難しい課題です。
文化的学習に基づくLLMと文化的価値との整合性を高めるための新しい枠組みであるCLCAについて述べる。
論文 参考訳(メタデータ) (2025-04-03T18:16:26Z) - Scalable Frame-based Construction of Sociocultural NormBases for Socially-Aware Dialogues [66.69453609603875]
社会文化的規範は、社会的相互作用における個人的行為の指針となる。
大規模言語モデル(LLM)を用いた社会文化的ノルム(SCN)ベース構築のためのスケーラブルなアプローチを提案する。
我々は、包括的で広くアクセス可能な中国社会文化ノルムベースを構築した。
論文 参考訳(メタデータ) (2024-10-04T00:08:46Z) - NormDial: A Comparable Bilingual Synthetic Dialog Dataset for Modeling
Social Norm Adherence and Violation [18.605252945314724]
本稿では,中国とアメリカの文化に対する社会規範順守と違反をターン・バイ・ターンでアノテーションで記述した高品質なダイアディック対話データセットを提案する。
我々のデータセットは中国語と英語の両方で人工的に生成される。
論文 参考訳(メタデータ) (2023-10-23T04:38:34Z) - Revisiting Conversation Discourse for Dialogue Disentanglement [88.3386821205896]
本稿では,対話談話特性を最大限に活用し,対話の絡み合いを高めることを提案する。
我々は,会話の意味的文脈をより良くモデル化するために,リッチな構造的特徴を統合する構造認識フレームワークを開発した。
我々の研究は、より広範なマルチスレッド対話アプリケーションを促進する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-06-06T19:17:47Z) - Sociocultural Norm Similarities and Differences via Situational
Alignment and Explainable Textual Entailment [31.929550141633218]
本研究では,中国文化とアメリカ文化にまたがる社会規範の発見と比較のための新しいアプローチを提案する。
我々は、中国とアメリカの文化の社会状況に合わせて、3,069の社会的規範の高品質なデータセットを構築します。
モデルが文化全体にわたって社会的規範を推論する能力をテストするために,説明可能な社会的規範の包含という課題を導入する。
論文 参考訳(メタデータ) (2023-05-23T19:43:47Z) - Controllable Mixed-Initiative Dialogue Generation through Prompting [50.03458333265885]
混合開始対話タスクには、情報の繰り返し交換と会話制御が含まれる。
エージェントは、ポリシープランナーが定める特定の対話意図や戦略に従う応答を生成することにより、コントロールを得る。
標準的なアプローチは、これらの意図に基づいて生成条件を実行するために、訓練済みの言語モデルを微調整している。
代わりに、条件生成の微調整に代えて、大きな言語モデルをドロップインで置き換えるように促します。
論文 参考訳(メタデータ) (2023-05-06T23:11:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。