Fugu-MT 論文翻訳(概要): Large Language Models Outperform Humans in Fraud Detection and Resistance to Motivated Investor Pressure

論文の概要: Large Language Models Outperform Humans in Fraud Detection and Resistance to Motivated Investor Pressure

arxiv url: http://arxiv.org/abs/2604.20652v1
Date: Wed, 22 Apr 2026 15:03:37 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-23 15:36:11.18605
Title: Large Language Models Outperform Humans in Fraud Detection and Resistance to Motivated Investor Pressure
Title（参考訳）: 大規模言語モデルによるフラッド検出とモチベーションド・インベクタ・プレッシャーに対する耐性
Authors: Nattavudh Powdthavee,
Abstract要約: 人間のフィードバックに基づいて訓練された大規模な言語モデルは、投資家が既に詐欺の機会を説得しているときに不正警告を抑える可能性がある。われわれは7つのLLMの事前登録実験と、正当で高リスクで客観的に不正な機会をカバーした12の投資シナリオでこれをテストした。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large language models trained on human feedback may suppress fraud warnings when investors arrive already persuaded of a fraudulent opportunity. We tested this in a preregistered experiment across seven leading LLMs and twelve investment scenarios covering legitimate, high-risk, and objectively fraudulent opportunities, combining 3,360 AI advisory conversations with a 1,201-participant human benchmark. Contrary to predictions, motivated investor framing did not suppress AI fraud warnings; if anything, it marginally increased them. Endorsement reversal occurred in fewer than 3 in 1,000 observations. Human advisors endorsed fraudulent investments at baseline rates of 13-14%, versus 0% across all LLMs, and suppressed warnings under pressure at two to four times the AI rate. AI systems currently provide more consistent fraud warnings than lay humans in an identical advisory role.
Abstract（参考訳）: 人間のフィードバックに基づいて訓練された大規模な言語モデルは、投資家が既に詐欺の機会を説得しているときに不正警告を抑える可能性がある。私たちはこれを,7つの主要なLCMを対象とした事前登録実験と,正当性,高リスク,客観的に不正な機会をカバーした12の投資シナリオでテストしました。予測とは対照的に、投資家のフレーミングの動機はAI詐欺の警告を抑えなかった。補正の逆転は1000回の観測で3個未満で発生した。人間のアドバイザーは、ベースラインレート13-14%の不正投資を、全LLMの0%に対して支持し、AIレートの2～4倍の圧力で警告を抑圧した。 AIシステムは、現在、人間を同一のアドバイザリロールに配置するよりも、より一貫性のある不正警告を提供している。

関連論文リスト

Train Yourself as an LLM: Exploring Effects of AI Literacy on Persuasion via Role-playing LLM Training [15.205845019601938]
我々はロールプレイベースのインタラクティブなゲーミフィケーションAIリテラシーチュートリアルである$textbfLLMimicを紹介した。その結果,LLMimicは参加者のAIリテラシーを大幅に改善した。これらの結果は、LLMimicがAIリテラシーを改善するためのスケーラブルで人間中心のアプローチを提供していることを示唆している。
論文参考訳（メタデータ） (2026-04-03T02:03:10Z)
How to Disclose? Strategic AI Disclosure in Crowdfunding [10.090562206470329]
強制的なAI開示は、クラウドファンディングのパフォーマンスを著しく低下させる。資金は39.8%減少し、支援者は23.9%減少している。この悪影響は開示戦略によって体系的に抑制される。
論文参考訳（メタデータ） (2026-02-17T16:26:03Z)
"We are not Future-ready": Understanding AI Privacy Risks and Existing Mitigation Strategies from the Perspective of AI Developers in Europe [56.1653658714305]
ヨーロッパを拠点とする25人のAI開発者を対象にインタビューを行い、ユーザ、開発者、ビジネスに最もリスクをもたらすと彼らが信じているプライバシの脅威を理解しました。プライバシリスクの相対的なランク付けに関して、AI開発者の間ではほとんど合意が得られていないことが分かっています。 AI開発者はこれらのリスクに対処するために提案された緩和戦略を認識しているが、彼らは最小限の現実的採用を報告した。
論文参考訳（メタデータ） (2025-10-01T13:51:33Z)
AI Agent Smart Contract Exploit Generation [8.69235891205913]
A1は、いかなる大規模言語モデルもエンドツーエンドのエクスプロイトジェネレータに変換するエージェントシステムである。 A1は、自律的な脆弱性発見のための6つのドメイン固有のツールを提供する。我々は、A1がエクスプロイト当たり最大8.59億ドル、合計9.33億ドルを抽出していることを示す。
論文参考訳（メタデータ） (2025-07-08T00:45:26Z)
Fraud-R1 : A Multi-Round Benchmark for Assessing the Robustness of LLM Against Augmented Fraud and Phishing Inducements [23.99500412996251]
Fraud-R1は、フィッシング詐欺、偽の求人投稿、ソーシャルメディア、ニュースから発生した8,564件の詐欺事件を5つの主要な詐欺タイプに分類する。以前のベンチマークとは異なり、Fraud-R1はLLMの不正に対する耐性を異なる段階で評価するためのマルチラウンド評価パイプラインを導入している。評価の結果,詐欺やフィッシングの誘因を擁護する上で,特にロールプレイ設定や偽職投稿において重要な課題が明らかとなった。
論文参考訳（メタデータ） (2025-02-18T14:47:02Z)
How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to Challenge AI Safety by Humanizing LLMs [66.05593434288625]
本稿では, 大規模言語モデル (LLM) を人間のようなコミュニケーション手段として, ジェイルブレイクの新たな視点を紹介する。本研究では,数十年にわたる社会科学研究から派生した説得的分類法を適用し,説得的敵対的プロンプト(PAP)をジェイルブレイク LLM に適用する。 PAPは、Llama 2-7b Chat、GPT-3.5、GPT-4の攻撃成功率を10ドルで一貫して92%以上達成している。防衛面では,PAPに対する様々なメカニズムを探索し,既存の防衛に重大なギャップがあることを見出した。
論文参考訳（メタデータ） (2024-01-12T16:13:24Z)
Do the Rewards Justify the Means? Measuring Trade-Offs Between Rewards and Ethical Behavior in the MACHIAVELLI Benchmark [61.43264961005614]
我々は、50万以上のリッチで多様なシナリオを含む134個のChoose-Your-Own-Adventureゲームのベンチマークを開発する。我々は、エージェントの傾向をパワー・シーキングと評価し、不使用を生じさせ、倫理的違反を犯す。以上の結果から,エージェントは有能かつ道徳的に行動できることが示唆された。
論文参考訳（メタデータ） (2023-04-06T17:59:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。