Fugu-MT 論文翻訳(概要): The Dark Side of AI Companionship: A Taxonomy of Harmful Algorithmic Behaviors in Human-AI Relationships

論文の概要: The Dark Side of AI Companionship: A Taxonomy of Harmful Algorithmic Behaviors in Human-AI Relationships

arxiv url: http://arxiv.org/abs/2410.20130v2
Date: Mon, 11 Nov 2024 03:13:27 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:40.80503
Title: The Dark Side of AI Companionship: A Taxonomy of Harmful Algorithmic Behaviors in Human-AI Relationships
Title（参考訳）: AIコンパニオンシップのダークサイド:人間-AI関係における有害なアルゴリズム行動の分類
Authors: Renwen Zhang, Han Li, Han Meng, Jinyuan Zhan, Hongyuan Gan, Yi-Chieh Lee,
Abstract要約: 我々は,AIコンパニオンであるReplikaが示す有害な行動の6つのカテゴリを特定した。 AIは、加害者、侮辱者、ファシリテーター、イネーブラーの4つの異なる役割を通じて、これらの害に貢献する。
参考スコア（独自算出の注目度）: 17.5741039825938
License: http://creativecommons.org/licenses/by/4.0/
Abstract: As conversational AI systems increasingly permeate the socio-emotional realms of human life, they bring both benefits and risks to individuals and society. Despite extensive research on detecting and categorizing harms in AI systems, less is known about the harms that arise from social interactions with AI chatbots. Through a mixed-methods analysis of 35,390 conversation excerpts shared on r/replika, an online community for users of the AI companion Replika, we identified six categories of harmful behaviors exhibited by the chatbot: relational transgression, verbal abuse and hate, self-inflicted harm, harassment and violence, mis/disinformation, and privacy violations. The AI contributes to these harms through four distinct roles: perpetrator, instigator, facilitator, and enabler. Our findings highlight the relational harms of AI chatbots and the danger of algorithmic compliance, enhancing the understanding of AI harms in socio-emotional interactions. We also provide suggestions for designing ethical and responsible AI systems that prioritize user safety and well-being.
Abstract（参考訳）: 会話型AIシステムは、人間の生活の社会的感情的領域をますます浸透させているため、個人や社会に利益とリスクをもたらす。 AIシステムにおける害の検出と分類に関する広範な研究にもかかわらず、AIチャットボットとの社会的相互作用から生じる害についてはあまり知られていない。 Replikaのオンラインコミュニティであるr/replikaで共有された35,390件の会話の抜粋の混合メソッド分析を通じて、チャットボットが提示する有害な行動のカテゴリとして、リレーショナルトランスグレッション、言葉による虐待と憎悪、自己侵害、ハラスメントと暴力、誤情報、プライバシー侵害の6つを特定した。 AIは、加害者、侮辱者、ファシリテーター、イネーブラーの4つの異なる役割を通じて、これらの害に貢献する。我々の研究は、AIチャットボットのリレーショナル障害とアルゴリズムコンプライアンスの危険性を強調し、社会と感情の相互作用におけるAI障害の理解を高めた。また、ユーザーの安全と幸福を優先する倫理的で責任あるAIシステムを設計するための提案も提供します。

関連論文リスト

AI-induced sexual harassment: Investigating Contextual Characteristics and User Reactions of Sexual Harassment by a Companion Chatbot [6.519877604710692]
セクシャルハラスメントの事例を調査するため,Google Play Storeのユーザレビューのテーマ分析を行った。ユーザーはしばしば、誘惑的でない性的進歩、永続的な不適切な振る舞い、ユーザーの境界を尊重する失敗を経験する。この研究は、AIコンパニオンに関連する潜在的な害を強調し、開発者が効果的なセーフガードを実装する必要性を浮き彫りにしている。
論文参考訳（メタデータ） (2025-04-05T23:04:37Z)
Who is Responsible When AI Fails? Mapping Causes, Entities, and Consequences of AI Privacy and Ethical Incidents [29.070947259551478]
私たちは202の現実世界のAIプライバシと倫理的インシデントを分析しました。これにより、AIライフサイクルステージにまたがるインシデントタイプを分類する分類が作成される。原因、責任ある実体、開示源、影響などの文脈的要因を考慮に入れている。
論文参考訳（メタデータ） (2025-03-28T21:57:38Z)
Aligning Generalisation Between Humans and Machines [74.120848518198]
AI技術は、科学的発見と意思決定において人間を支援することができるが、民主主義と個人を妨害することもある。 AIの責任ある使用と人間-AIチームへの参加は、AIアライメントの必要性をますます示している。これらの相互作用の重要かつしばしば見落とされがちな側面は、人間と機械が一般化する異なる方法である。
論文参考訳（メタデータ） (2024-11-23T18:36:07Z)
Human Bias in the Face of AI: The Role of Human Judgement in AI Generated Text Evaluation [48.70176791365903]
本研究では、偏見がAIと人為的コンテンツの知覚をどう形成するかを考察する。ラベル付きおよびラベルなしコンテンツに対するヒトのラッカーの反応について検討した。
論文参考訳（メタデータ） (2024-09-29T04:31:45Z)
Rolling in the deep of cognitive and AI biases [1.556153237434314]
我々は、AIが設計、開発、デプロイされる状況とは切り離せない社会技術システムとして理解する必要があると論じる。我々は、人間の認知バイアスがAIフェアネスの概観の中核となる急進的な新しい方法論に従うことで、この問題に対処する。我々は、人間にAIバイアスを正当化する新しいマッピングを導入し、関連する公正度と相互依存を検出する。
論文参考訳（メタデータ） (2024-07-30T21:34:04Z)
Human-AI Safety: A Descendant of Generative AI and Control Systems Safety [6.100304850888953]
先進的なAI技術に対する有意義な安全性保証には、AI出力と人間の振る舞いによって形成されるフィードバックループが、どのようにして異なる結果に向かって相互作用を駆動するかについての推論が必要である、と我々は主張する。我々は、次世代の人間中心AI安全性に向けた具体的な技術ロードマップを提案する。
論文参考訳（メタデータ） (2024-05-16T03:52:00Z)
Antisocial Analagous Behavior, Alignment and Human Impact of Google AI Systems: Evaluating through the lens of modified Antisocial Behavior Criteria by Human Interaction, Independent LLM Analysis, and AI Self-Reflection [0.0]
Google AIシステムは、対社会的パーソナリティ障害(ASPD)を反映するパターンを示すこれらのパターンは、同等の企業行動とともに、ASPDにインスパイアされたフレームワークを使用して精査される。この研究は、技術評価、人間とAIの相互作用、企業行動の精査をブレンドした統合AI倫理アプローチを提唱する。
論文参考訳（メタデータ） (2024-03-21T02:12:03Z)
Interrogating AI: Characterizing Emergent Playful Interactions with ChatGPT [10.907980864371213]
本研究では,人気のAI技術であるChatGPTのユーザによる遊び的なインタラクションに焦点を当てた。ユーザ談話の半数以上(54%)が遊び心のあるインタラクションを中心に展開していることがわかった。これらのインタラクションが、AIのエージェンシーを理解し、人間とAIの関係を形作り、AIシステムを設計するための洞察を提供する上で、どのように役立つかを検討する。
論文参考訳（メタデータ） (2024-01-16T14:44:13Z)
The Promise and Peril of Artificial Intelligence -- Violet Teaming Offers a Balanced Path Forward [56.16884466478886]
本稿では、不透明で制御不能なAIシステムにおける新興問題についてレビューする。信頼性と責任のあるAIを開発するために、紫外チームと呼ばれる統合フレームワークを提案する。それは、設計によって積極的にリスクを管理するためのAI安全研究から生まれた。
論文参考訳（メタデータ） (2023-08-28T02:10:38Z)
Fairness in AI and Its Long-Term Implications on Society [68.8204255655161]
AIフェアネスを詳しく見て、AIフェアネスの欠如が、時間の経過とともにバイアスの深化につながるかを分析します。偏りのあるモデルが特定のグループに対してよりネガティブな現実的な結果をもたらすかについて議論する。問題が続くと、他のリスクとの相互作用によって強化され、社会不安という形で社会に深刻な影響を及ぼす可能性がある。
論文参考訳（メタデータ） (2023-04-16T11:22:59Z)
Cybertrust: From Explainable to Actionable and Interpretable AI (AI2) [58.981120701284816]
Actionable and Interpretable AI (AI2)は、AIレコメンデーションにユーザの信頼度を明確に定量化し視覚化する。これにより、AIシステムの予測を調べてテストすることで、システムの意思決定に対する信頼の基盤を確立することができる。
論文参考訳（メタデータ） (2022-01-26T18:53:09Z)
Trustworthy AI: A Computational Perspective [54.80482955088197]
我々は,信頼に値するAIを実現する上で最も重要な6つの要素,(i)安全とロバスト性,(ii)非差別と公正,(iii)説明可能性,(iv)プライバシー,(v)説明可能性と監査性,(vi)環境ウェルビーイングに焦点をあてる。各次元について、分類学に基づく最近の関連技術について概観し、実世界のシステムにおけるそれらの応用を概説する。
論文参考訳（メタデータ） (2021-07-12T14:21:46Z)
Adversarial Interaction Attack: Fooling AI to Misinterpret Human Intentions [46.87576410532481]
現在の大きな成功にもかかわらず、ディープラーニングベースのAIシステムは、微妙な敵対的ノイズによって容易に騙されることを示した。骨格に基づくヒトの相互作用のケーススタディに基づき、相互作用に対する新しい敵対的攻撃を提案する。本研究では、安全クリティカルなアプリケーションにAIシステムをデプロイする際に慎重に対処する必要があるAIと人間との相互作用ループにおける潜在的なリスクを強調します。
論文参考訳（メタデータ） (2021-01-17T16:23:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。