論文の概要: Voice-Enabled AI Agents can Perform Common Scams
- arxiv url: http://arxiv.org/abs/2410.15650v1
- Date: Mon, 21 Oct 2024 05:22:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:12:43.043920
- Title: Voice-Enabled AI Agents can Perform Common Scams
- Title(参考訳): 音声対応AIエージェントは、共通の詐欺を行うことができる
- Authors: Richard Fang, Dylan Bowman, Daniel Kang,
- Abstract要約: 我々は、音声対応AIエージェントが、共通の詐欺を行うために必要なアクションを実行可能であることを示す。
我々の結果は、音声対応AIエージェントの広範な展開に関する疑問を提起する。
- 参考スコア(独自算出の注目度): 2.6217304977339464
- License:
- Abstract: Recent advances in multi-modal, highly capable LLMs have enabled voice-enabled AI agents. These agents are enabling new applications, such as voice-enabled autonomous customer service. However, with all AI capabilities, these new capabilities have the potential for dual use. In this work, we show that voice-enabled AI agents can perform the actions necessary to perform common scams. To do so, we select a list of common scams collected by the government and construct voice-enabled agents with directions to perform these scams. We conduct experiments on our voice-enabled agents and show that they can indeed perform the actions necessary to autonomously perform such scams. Our results raise questions around the widespread deployment of voice-enabled AI agents.
- Abstract(参考訳): マルチモーダルで高機能なLLMの最近の進歩は、音声対応AIエージェントを有効化している。
これらのエージェントは、音声対応の自律顧客サービスなど、新しいアプリケーションを可能にしている。
しかし、すべてのAI能力によって、これらの新しい機能は二重利用の可能性を秘めている。
本研究では、音声対応AIエージェントが、共通の詐欺を行うために必要なアクションを実行できることを示す。
そこで我々は,政府によって収集された共通詐欺のリストを選択し,これらの詐欺を行うための指示付き音声対応エージェントを構築する。
音声対応エージェントで実験を行い、このような詐欺を自律的に行うために必要なアクションを実際に実行できることを示します。
我々の結果は、音声対応AIエージェントの広範な展開に関する疑問を提起する。
関連論文リスト
- Evaluating Synthetic Command Attacks on Smart Voice Assistants [2.91784559412979]
単純な結合音声合成であっても、攻撃者が音声アシスタントに繊細な操作を指示するために使用できることを示す。
以上の結果から、音声アシスタントをターゲットとする合成悪意のあるコマンドに対するより良い防御の必要性が示された。
論文 参考訳(メタデータ) (2024-11-13T03:51:58Z) - Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - Toward a Dialogue System Using a Large Language Model to Recognize User Emotions with a Camera [0.0]
ユーザの表情から感情を認識するためのAIエージェントの方法は研究されていない。
LLMをベースとしたAIエージェントが、カメラと対話してユーザをキャプチャすることで、感情状態に応じてユーザと対話できるかどうかを検討した。
その結果、AIエージェントは、HappyやAngryのような比較的高いスコアを持つ感情状態の感情状態に応じて会話できることを確認した。
論文 参考訳(メタデータ) (2024-08-15T07:03:00Z) - The Voice: Lessons on Trustworthy Conversational Agents from "Dune" [0.7832189413179361]
我々は、生産的なAIが、産業規模で個人化された影響を実装する方法を提供する方法について検討する。
悪質な俳優が雇用すれば、世論の形成や不協和を招き、企業から政府まで組織を弱体化させる強力なツールになる恐れがある。
論文 参考訳(メタデータ) (2024-07-10T05:38:31Z) - One Agent Too Many: User Perspectives on Approaches to Multi-agent
Conversational AI [10.825570464035872]
システムユーザビリティとシステムパフォーマンスの両方において,エージェントオーケストレーションを抽象化する上で,ユーザにとって重要な選択肢があることが示される。
人間の選択した回答の1%以内に評価された質の高い応答を提供できることを実証する。
論文 参考訳(メタデータ) (2024-01-13T17:30:57Z) - SpeechAgents: Human-Communication Simulation with Multi-Modal
Multi-Agent Systems [53.94772445896213]
大規模言語モデル(LLM)に基づくマルチエージェントシステムは,人間の社会をシミュレートする上で有望な性能を示した。
本研究では,マルチモーダルLLMに基づくマルチエージェントシステムであるSpeechAgentsを提案する。
論文 参考訳(メタデータ) (2024-01-08T15:01:08Z) - The Rise and Potential of Large Language Model Based Agents: A Survey [91.71061158000953]
大規模言語モデル(LLM)は、人工知能(AGI)の潜在的な火花と見なされる
まず、エージェントの概念を哲学的起源からAI開発まで追跡し、LLMがエージェントに適した基盤である理由を説明します。
単一エージェントシナリオ,マルチエージェントシナリオ,ヒューマンエージェント協調の3つの側面において,LLMベースのエージェントの広範な応用について検討する。
論文 参考訳(メタデータ) (2023-09-14T17:12:03Z) - CAMEL: Communicative Agents for "Mind" Exploration of Large Language
Model Society [58.04479313658851]
本稿では,コミュニケーションエージェント間の自律的協調を支援するスケーラブルな手法の構築の可能性について検討する。
本稿では,ロールプレイングという新しいコミュニケーションエージェントフレームワークを提案する。
コントリビューションには、新しいコミュニケーティブエージェントフレームワークの導入、マルチエージェントシステムの協調行動や能力を研究するためのスケーラブルなアプローチの提供などが含まれます。
論文 参考訳(メタデータ) (2023-03-31T01:09:00Z) - HuggingGPT: Solving AI Tasks with ChatGPT and its Friends in Hugging
Face [85.25054021362232]
大規模言語モデル(LLM)は、言語理解、生成、相互作用、推論において例外的な能力を示した。
LLMは、複雑なAIタスクを解決するために既存のAIモデルを管理するコントローラとして機能する可能性がある。
本稿では,機械学習コミュニティのさまざまなAIモデルを接続するLLMエージェントであるHuggingGPTを紹介する。
論文 参考訳(メタデータ) (2023-03-30T17:48:28Z) - AVLEN: Audio-Visual-Language Embodied Navigation in 3D Environments [60.98664330268192]
AVLEN(Audio-Visual-Language Embodied Navigationの対話型エージェント)を提案する。
AVLENの目標は、3Dビジュアルワールドをナビゲートすることでオーディオイベントをローカライズすることである。
これらの能力を実現するために、AVLENはマルチモーダル階層的な強化学習バックボーンを使用する。
論文 参考訳(メタデータ) (2022-10-14T16:35:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。