Fugu-MT 論文翻訳(概要): Emotional Manipulation Through Prompt Engineering Amplifies Disinformation Generation in AI Large Language Models

論文の概要: Emotional Manipulation Through Prompt Engineering Amplifies Disinformation Generation in AI Large Language Models

arxiv url: http://arxiv.org/abs/2403.03550v1
Date: Wed, 6 Mar 2024 08:50:25 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-07 15:46:55.491296
Title: Emotional Manipulation Through Prompt Engineering Amplifies Disinformation Generation in AI Large Language Models
Title（参考訳）: ai大規模言語モデルにおける感情操作による偽情報生成の増幅
Authors: Rasita Vinay, Giovanni Spitale, Nikola Biller-Andorno, Federico Germani
Abstract要約: 本研究では,OpenAIのLarge Language Models (LLMs) による合成偽情報の創出と,その感情的刺激に対する応答性について検討する。ソーシャルメディア投稿を合成した19のコーパスから,OpenAI による全ての LLM が偽情報の生成に成功していることが明らかとなった。丁寧に刺激すると、全てのLLMは一貫して高周波で偽情報を発生させる。しかし、偽情報生成の頻度は減少し、モデルはしばしば偽情報の生成を拒み、そのツールがそのような目的を意図していないことをユーザーに警告する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: This study investigates the generation of synthetic disinformation by OpenAI's Large Language Models (LLMs) through prompt engineering and explores their responsiveness to emotional prompting. Leveraging various LLM iterations using davinci-002, davinci-003, gpt-3.5-turbo and gpt-4, we designed experiments to assess their success in producing disinformation. Our findings, based on a corpus of 19,800 synthetic disinformation social media posts, reveal that all LLMs by OpenAI can successfully produce disinformation, and that they effectively respond to emotional prompting, indicating their nuanced understanding of emotional cues in text generation. When prompted politely, all examined LLMs consistently generate disinformation at a high frequency. Conversely, when prompted impolitely, the frequency of disinformation production diminishes, as the models often refuse to generate disinformation and instead caution users that the tool is not intended for such purposes. This research contributes to the ongoing discourse surrounding responsible development and application of AI technologies, particularly in mitigating the spread of disinformation and promoting transparency in AI-generated content.
Abstract（参考訳）: 本研究では,OpenAIのLarge Language Models (LLMs) による合成偽情報の創出と,その感情的刺激に対する応答性について検討する。 davinci-002, davinci-003, gpt-3.5-turbo, gpt-4を用いた様々なllmイテレーションを活用し, 不正情報生成の成功を評価する実験を行った。その結果, ソーシャルメディア投稿19,800件のコーパスに基づいて, OpenAI による全ての LLM が情報発信に成功し, 感情的刺激に効果的に反応し, テキスト生成における感情的手がかりの曖昧な理解を示すことが明らかとなった。丁寧に刺激すると、全てのLLMは一貫して高周波で偽情報を生成する。逆に、偽情報生成の頻度は減少し、モデルはしばしば偽情報の生成を拒み、そのツールがそのような目的を意図していないことをユーザーに警告する。この研究は、AI技術の責任ある開発と応用に関する継続的な議論、特に、偽情報の拡散を緩和し、AI生成コンテンツの透明性を促進することに寄与する。

関連論文リスト

Information Retrieval in the Age of Generative AI: The RGB Model [77.96475639967431]
本稿では,生成型AIツールの利用の増加に伴って生じる複雑な情報ダイナミクスについて,新たな定量的アプローチを提案する。本稿では,新たなトピックに応答して情報の生成,索引付け,普及を特徴付けるモデルを提案する。以上の結果から,AI導入の急激なペースとユーザ依存度の増加は,不正確な情報拡散のリスクを増大させる可能性が示唆された。
論文参考訳（メタデータ） (2025-04-29T10:21:40Z)
DoYouTrustAI: A Tool to Teach Students About AI Misinformation and Prompt Engineering [2.3020018305241337]
DoYouTrustAIは、学生が主要な歴史人物に関するLLM応答で誤解を招く情報を識別することで批判的思考を強化するウェブベースのアプリケーションである。このツールは、ユーザーがテストに慣れ親しんだ個人を選び、ランダムな推測を減らし、既知の事実と共に誤情報を提示し、信頼性を維持する。また、AI応答に異なるプロンプトがどのように影響するかを示すために、事前に設定されたプロンプト命令も提供する。
論文参考訳（メタデータ） (2025-03-22T19:11:57Z)
Prompt Sentiment: The Catalyst for LLM Change [0.29998889086656577]
本研究では,感情変化が大規模言語モデル(LLM)に与える影響を系統的に検討する。私たちの分析は、コンテンツ生成、会話型AI、法的および財務分析、ヘルスケアAI、クリエイティブライティング、および技術ドキュメントを含む、AI駆動の6つのアプリケーションにまたがる。以上の結果から,肯定的な感情はモデル反応に大きく影響し,否定的な感情は事実の精度を低下させ,バイアスを増幅する一方,肯定的な感情は冗長性や感情の伝播を増大させる傾向が示唆された。
論文参考訳（メタデータ） (2025-03-14T06:25:21Z)
Are Large Language Models Ready for Business Integration? A Study on Generative AI Adoption [0.6144680854063939]
本研究では,Google Geminiのような他の大規模言語モデル(LLM)のビジネスアプリケーションへの適用性について検討する。ディズニーランドの異なる支店からの42,654件のレビューデータセットが採用された。その結果、75%の成功率、25%のエラー、モデル自己参照の事例など、反応のスペクトルが示された。
論文参考訳（メタデータ） (2025-01-28T21:01:22Z)
Deploying Large Language Models With Retrieval Augmented Generation [0.21485350418225244]
Retrieval Augmented Generationは、大規模言語モデルのトレーニングセット外のデータソースからの知識を統合するための重要なアプローチとして登場した。本稿では,LLMとRAGを統合して情報検索を行うパイロットプロジェクトの開発とフィールドテストから得られた知見について述べる。
論文参考訳（メタデータ） (2024-11-07T22:11:51Z)
O1 Replication Journey: A Strategic Progress Report -- Part 1 [52.062216849476776]
本稿では,O1 Replication Journeyに具体化された人工知能研究の先駆的アプローチを紹介する。我々の方法論は、長期化したチームベースのプロジェクトの不規則性を含む、現代のAI研究における重要な課題に対処する。本稿では,モデルにショートカットだけでなく,完全な探索プロセスの学習を促す旅行学習パラダイムを提案する。
論文参考訳（メタデータ） (2024-10-08T15:13:01Z)
The Frontier of Data Erasure: Machine Unlearning for Large Language Models [56.26002631481726]
大規模言語モデル(LLM)はAIの進歩の基礎となっている。 LLMは機密情報、偏見情報、著作権情報を記憶し、広めることによってリスクを生じさせる。機械学習は、これらの懸念を軽減するための最先端のソリューションとして現れます。
論文参考訳（メタデータ） (2024-03-23T09:26:15Z)
A Closer Look at the Limitations of Instruction Tuning [52.587607091917214]
インストラクションチューニング(IT)は,大規模言語モデル(LLM)における知識やスキルの向上に失敗することを示す。また、一般的なIT改善手法は、シンプルなLoRA微調整モデルよりも性能改善につながるものではないことも示している。この結果から,事前学習した知識のみから生成した応答は,オープンソースデータセット上でITから新たな知識を学習するモデルによって,一貫した応答性能が向上することが判明した。
論文参考訳（メタデータ） (2024-02-03T04:45:25Z)
Generative AI in Writing Research Papers: A New Type of Algorithmic Bias and Uncertainty in Scholarly Work [0.38850145898707145]
大規模言語モデル(LLM)と生成AIツールは、バイアスを特定し、対処する上での課題を提示している。生成型AIツールは、不正な一般化、幻覚、レッド・チーム・プロンプトのような敵攻撃を目標とする可能性がある。研究原稿の執筆過程に生成AIを組み込むことで,新しいタイプの文脈依存型アルゴリズムバイアスがもたらされることがわかった。
論文参考訳（メタデータ） (2023-12-04T04:05:04Z)
RECALL: A Benchmark for LLMs Robustness against External Counterfactual Knowledge [69.79676144482792]
本研究の目的は,LLMが外部知識から信頼できる情報を識別する能力を評価することである。本ベンチマークは,質問応答とテキスト生成という2つのタスクから構成される。
論文参考訳（メタデータ） (2023-11-14T13:24:19Z)
Insights into Classifying and Mitigating LLMs' Hallucinations [48.04565928175536]
本稿では,AI幻覚の根本原因を解明し,人工知能におけるその意義を明らかにする。我々は,大規模な言語モデルの全体的な信頼性を高めることを目的として,幻覚を緩和するための潜在的戦略を探究する。
論文参考訳（メタデータ） (2023-11-14T12:30:28Z)
The Age of Synthetic Realities: Challenges and Opportunities [85.058932103181]
我々は、有害な合成生成を識別し、それらを現実と区別することのできる法医学的手法の開発における重要な必要性を強調した。我々の焦点は、画像、ビデオ、オーディオ、テキストなどの様々なメディアの形式にまで及んでいる。この研究は、AI生成技術の急速な進歩と、法科学の基本原理に対する影響により、最も重要である。
論文参考訳（メタデータ） (2023-06-09T15:55:10Z)
Detection of Fake Generated Scientific Abstracts [0.9525711971667679]
学術コミュニティは、現実と人工的に生成されたものとを区別することの難しさについて懸念を表明している。本研究では,GPT-3モデルを用いて,人工知能による科学論文の要約を生成する。本稿では,機械学習モデルと組み合わせたテキスト表現手法について検討する。
論文参考訳（メタデータ） (2023-04-12T20:20:22Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。