論文の概要: SELF-PERCEPT: Introspection Improves Large Language Models' Detection of Multi-Person Mental Manipulation in Conversations
- arxiv url: http://arxiv.org/abs/2505.20679v1
- Date: Tue, 27 May 2025 03:51:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.389218
- Title: SELF-PERCEPT: Introspection Improves Large Language Models' Detection of Multi-Person Mental Manipulation in Conversations
- Title(参考訳): SELF-PERCEPT:イントロスペクションは会話における多人数のメンタルマニピュレーションの検出を改善する
- Authors: Danush Khanna, Pratinav Seth, Sidhaarth Sredharan Murali, Aditya Kumar Guru, Siddharth Shukla, Tanuj Tyagi, Sandeep Chaurasia, Kripabandhu Ghosh,
- Abstract要約: 心的操作は、対人コミュニケーションにおける微妙だが広範にわたる虐待である。
我々は,マニピュティブインタラクションと非マニピュティブインタラクションのバランスの取れた220個のマルチターン・マルチパーソン対話を含むマルチマニップデータセットを提案する。
自己知覚理論に触発された新しい2段階プロンプトフレームワークSELF-PERCEPTを提案する。
- 参考スコア(独自算出の注目度): 3.9207535345233873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mental manipulation is a subtle yet pervasive form of abuse in interpersonal communication, making its detection critical for safeguarding potential victims. However, due to manipulation's nuanced and context-specific nature, identifying manipulative language in complex, multi-turn, and multi-person conversations remains a significant challenge for large language models (LLMs). To address this gap, we introduce the MultiManip dataset, comprising 220 multi-turn, multi-person dialogues balanced between manipulative and non-manipulative interactions, all drawn from reality shows that mimic real-world scenarios. For manipulative interactions, it includes 11 distinct manipulations depicting real-life scenarios. We conduct extensive evaluations of state-of-the-art LLMs, such as GPT-4o and Llama-3.1-8B, employing various prompting strategies. Despite their capabilities, these models often struggle to detect manipulation effectively. To overcome this limitation, we propose SELF-PERCEPT, a novel, two-stage prompting framework inspired by Self-Perception Theory, demonstrating strong performance in detecting multi-person, multi-turn mental manipulation. Our code and data are publicly available at https://github.com/danushkhanna/self-percept .
- Abstract(参考訳): 心的操作は、対人コミュニケーションにおける微妙ながら広範囲にわたる虐待であり、潜在的な犠牲者を保護するためにその検出が重要である。
しかし、操作のニュアンスと文脈固有の性質のため、複雑な多ターン、多対人会話において操作言語を特定することは、大きな言語モデル(LLM)にとって重要な課題である。
このギャップに対処するために,実世界のシナリオを模倣した現実から引き出された,マニピュティブインタラクションと非マニピュティブインタラクションのバランスの取れた220個のマルチターン・マルチパーソン対話を含むマルチマニップデータセットを導入する。
操作的相互作用には、現実のシナリオを描写した11の異なる操作が含まれる。
我々は, GPT-4o や Llama-3.1-8B などの最先端 LLM の評価を多種多様なプロンプト戦略を用いて行った。
それらの能力にもかかわらず、これらのモデルはしばしば効果的に操作を検出するのに苦労する。
この制限を克服するために,自己知覚理論に触発された新しい2段階プロンプトフレームワークSELF-PERCEPTを提案する。
私たちのコードとデータはhttps://github.com/danushkhanna/self-percept で公開されています。
関連論文リスト
- MentalMAC: Enhancing Large Language Models for Detecting Mental Manipulation via Multi-Task Anti-Curriculum Distillation [12.845142027768881]
精神的な操作は微妙だが広範囲にわたる心理的虐待であり、精神的な健康に深刻な脅威をもたらす。
MentalMACはマルチタスクの反キュリキュラム蒸留法であり、マルチターン対話におけるメンタル操作の検出能力を高める。
i)進化的操作と音声行動理論に基づく教師なしデータ拡張手法であるEvoSA,(ii)教師モデルによるマルチタスク監視,(iii)複雑なタスクから単純なタスクへの進化的知識の蒸留。
論文 参考訳(メタデータ) (2025-05-21T08:34:06Z) - Can LLM Agents Maintain a Persona in Discourse? [3.286711575862228]
大規模言語モデル(LLM)は、教育、法律、医学など、様々な分野でその能力を利用する会話エージェントとして広く利用されている。
LLMは、しばしばコンテキストシフトの振る舞いを受け、一貫性と解釈可能なパーソナリティ整合性の相互作用が欠如する。
LLMはパーソナライズされた対話へと導くことができるが、その性格特性を維持する能力はモデルと談話設定の組み合わせによって大きく異なる。
論文 参考訳(メタデータ) (2025-02-17T14:36:39Z) - Visual Error Patterns in Multi-Modal AI: A Statistical Approach [0.0]
MLLM(Multi-modal large language model)は、テキストと視覚データの統合に優れるが、曖昧さや不完全な視覚刺激を解釈する際に体系的な課題に直面する。
本研究では3D、回転、顔と面の欠如といった特徴を特徴とする幾何的刺激のデータセットを用いて、統計モデルを用いてこれらの誤差を駆動する要因を分析する。
論文 参考訳(メタデータ) (2024-11-27T01:20:08Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
データ構築とモデルチューニングを改善するためのフレームワークPersLLMを提案する。
データ利用が不十分な場合には、Chain-of-Thoughtプロンプトやアンチインダクションといった戦略を取り入れます。
厳密な振舞いパターンを設計し,モデルの性格の特異性とダイナミズムを高めるために自動DPOを導入する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - MentalManip: A Dataset For Fine-grained Analysis of Mental Manipulation in Conversations [41.661208833153225]
心的操作は対人会話において重要な虐待形態である。
本研究は、4000ドルの注釈付き映画対話からなる、$rm M Small entalM Small anip$という新しいデータセットを紹介する。
このデータセットは、精神的な操作の包括的な分析を可能にし、操作に使用されるテクニックと、被害者がターゲットとする脆弱性の両方をピンポイントする。
論文 参考訳(メタデータ) (2024-05-26T14:27:48Z) - Detecting and Grounding Multi-Modal Media Manipulation and Beyond [93.08116982163804]
マルチモーダルフェイクメディア(DGM4)の新たな研究課題について述べる。
DGM4は、マルチモーダルメディアの真正性を検出するだけでなく、操作されたコンテンツも検出することを目的としている。
本稿では,異なるモーダル間のきめ細かい相互作用を完全に捉えるために,新しい階層型マルチモーダルマニピュレーションrEasoning tRansformer(HAMMER)を提案する。
論文 参考訳(メタデータ) (2023-09-25T15:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。