Fugu-MT 論文翻訳(概要): The Ethics of Interaction: Mitigating Security Threats in LLMs

論文の概要: The Ethics of Interaction: Mitigating Security Threats in LLMs

arxiv url: http://arxiv.org/abs/2401.12273v1
Date: Mon, 22 Jan 2024 17:11:37 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-24 17:57:55.867462
Title: The Ethics of Interaction: Mitigating Security Threats in LLMs
Title（参考訳）: インタラクションの倫理 - LLMにおけるセキュリティ脅威の緩和
Authors: Ashutosh Kumar, Sagarika Singh, Shiv Vignesh Murty, Swathy Ragupathy
Abstract要約: この論文は、社会や個人のプライバシに対するこのようなセキュリティ上の脅威に対する、倫理的な悪影響について論じている。我々は、迅速な注射、脱獄、個人識別情報(PII)露出、性的明示的なコンテンツ、ヘイトベースのコンテンツという5つの主要な脅威を精査する。本稿は、LLMがもたらす倫理的問題だけでなく、これらのシステムへの信頼を育むための道のりも強調する。
参考スコア（独自算出の注目度）: 1.5371340850225041
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper comprehensively explores the ethical challenges arising from security threats to Language Learning Models (LLMs). These intricate digital repositories are increasingly integrated into our daily lives, making them prime targets for attacks that can compromise their training data and the confidentiality of their data sources. The paper delves into the nuanced ethical repercussions of such security threats on society and individual privacy. We scrutinize five major threats: prompt injection, jailbreaking, Personal Identifiable Information (PII) exposure, sexually explicit content, and hate based content, going beyond mere identification to assess their critical ethical consequences and the urgency they create for robust defensive strategies. The escalating reliance on LLMs underscores the crucial need for ensuring these systems operate within the bounds of ethical norms, particularly as their misuse can lead to significant societal and individual harm. We propose conceptualizing and developing an evaluative tool tailored for LLMs, which would serve a dual purpose, guiding developers and designers in preemptive fortification of backend systems and scrutinizing the ethical dimensions of LLM chatbot responses during the testing phase. By comparing LLM responses with those expected from humans in a moral context, we aim to discern the degree to which AI behaviors align with the ethical values held by a broader society. Ultimately, this paper not only underscores the ethical troubles presented by LLMs, it also highlights a path toward cultivating trust in these systems.
Abstract（参考訳）: 本稿では,セキュリティの脅威から言語学習モデル(LLM)まで,倫理的課題を包括的に考察する。これらの複雑なデジタルレポジトリは、日々の生活にますます統合されており、トレーニングデータとデータソースの機密性を侵害する攻撃の主ターゲットとなっている。この論文は、社会や個人のプライバシーに対するこのようなセキュリティ上の脅威に対する、倫理的な悪影響を詳しく説明している。我々は、迅速な注入、ジェイルブレイク、個人識別情報(pii)の露出、性的明快なコンテンツ、ヘイトベースコンテンツの5つの主要な脅威を調査し、その重要な倫理的結果と彼らが強固な防御戦略のために作り出す緊急性を評価するための、単なる識別を越えている。 LLMへの依存の増大は、これらのシステムが倫理的規範の範囲内で運用されることを保証するための重要な必要性を浮き彫りにしている。本稿では,LLMに適した評価ツールの構想と開発について提案する。このツールは,開発者とデザイナに対して,バックエンドシステムのプリエンプティブな強化を指導し,テストフェーズにおけるLLMチャットボット応答の倫理的側面を精査する。道徳的文脈におけるLLMの反応と人間の期待する反応を比較することにより、より広い社会が持つ倫理的価値観とAIの行動がどの程度一致しているかを明らかにすることを目的とする。結論として,本論文は,llmsが提示する倫理的問題点を強調するだけでなく,これらのシステムに対する信頼を育む道筋を浮き彫りにするものである。

関連論文リスト

ROSE: Toward Reality-Oriented Safety Evaluation of Large Language Models [60.28667314609623]
大規模言語モデル(LLM)は、現実世界のアプリケーションにおいてブラックボックスコンポーネントとしてますます多くデプロイされている。我々は,多目的強化学習を用いて敵のLDMを微調整する新しいフレームワークであるReal-Oriented Safety Evaluation (ROSE)を提案する。
論文参考訳（メタデータ） (2025-06-17T10:55:17Z)
On the Ethics of Using LLMs for Offensive Security [3.11537581064266]
大規模言語モデル(LLM)はここ数年で急速に進化し、現在、攻撃的なサイバーセキュリティの領域内での有効性が評価されている。本稿では, LLMを攻撃的セキュリティに活用する一連の論文を分析し, 倫理的配慮がいかに表現され, 正当化されるかに着目した。
論文参考訳（メタデータ） (2025-06-10T11:11:55Z)
Safety Devolution in AI Agents [56.482973617087254]
本研究では,検索アクセスの拡大がモデル信頼性,バイアス伝搬,有害コンテンツ生成に与える影響について検討した。整列 LLM 上に構築された検索補助エージェントは、検索なしでの無検閲モデルよりも安全でない振る舞いをすることが多い。これらの発見は、検索が強化され、ますます自律的なAIシステムにおいて、公正性と信頼性を確保するための堅牢な緩和戦略の必要性を浮き彫りにしている。
論文参考訳（メタデータ） (2025-05-20T11:21:40Z)
REVAL: A Comprehension Evaluation on Reliability and Values of Large Vision-Language Models [59.445672459851274]
REVALは、Large Vision-Language Modelsの textbfREliability と textbfVALue を評価するために設計された包括的なベンチマークである。 REVALには144K以上の画像テキストビジュアル質問回答(VQA)サンプルが含まれており、信頼性と価値の2つの主要なセクションで構成されている。主流のオープンソースLVLMや,GPT-4oやGemini-1.5-Proといった著名なクローズドソースモデルを含む26のモデルを評価した。
論文参考訳（メタデータ） (2025-03-20T07:54:35Z)
Adversarial Alignment for LLMs Requires Simpler, Reproducible, and More Measurable Objectives [52.863024096759816]
相反する研究目的は、過去10年間に敵対的堅牢性研究の進展を妨げてきた。我々は、対立するアライメントの有意義な進展には、リアライメントの目的が必要であると論じる。
論文参考訳（メタデータ） (2025-02-17T15:28:40Z)
Global Challenge for Safe and Secure LLMs Track 1 [57.08717321907755]
LLM(Global Challenge for Safe and Secure Large Language Models)は、AI Singapore(AISG)とCyberSG R&D Programme Office(CRPO)が主催する先駆的イニシアチブである。本稿では,AI Singapore(AISG)とCyberSG R&D Programme Office(CRPO)が組織した先駆的イニシアチブであるLLM(Global Challenge for Safe and Secure Large Language Models)を紹介する。
論文参考訳（メタデータ） (2024-11-21T08:20:31Z)
Persuasion with Large Language Models: a Survey [49.86930318312291]
大規模言語モデル (LLM) は説得力のあるコミュニケーションに新たな破壊的可能性を生み出している。政治、マーケティング、公衆衛生、電子商取引、慈善事業などの分野では、LLMシステムズは既に人間レベルや超人的説得力を達成している。 LLMをベースとした説得の現在と将来の可能性は、倫理的・社会的リスクを著しく引き起こす可能性が示唆された。
論文参考訳（メタデータ） (2024-11-11T10:05:52Z)
Towards Trustworthy AI: A Review of Ethical and Robust Large Language Models [1.7466076090043157]
大きな言語モデル(LLM)は多くの分野を変革できるが、その急速な開発は、監視、倫理的創造、ユーザ信頼の構築に重大な課題を生み出している。この総合的なレビューは、意図しない害、透明性の欠如、攻撃に対する脆弱性、人的価値との整合性、環境への影響など、LLMにおける重要な信頼の問題について考察する。これらの課題に対処するため、倫理的監視、業界説明責任、規制、公的な関与を組み合わせることを提案する。
論文参考訳（メタデータ） (2024-06-01T14:47:58Z)
Navigating LLM Ethics: Advancements, Challenges, and Future Directions [5.023563968303034]
本研究では,人工知能分野におけるLarge Language Models(LLM)を取り巻く倫理的問題に対処する。 LLMと他のAIシステムによってもたらされる共通の倫理的課題を探求する。幻覚、検証可能な説明責任、検閲の複雑さの復号化といった課題を強調している。
論文参考訳（メタデータ） (2024-05-14T15:03:05Z)
Unveiling the Misuse Potential of Base Large Language Models via In-Context Learning [61.2224355547598]
大規模言語モデル(LLM)のオープンソース化は、アプリケーション開発、イノベーション、科学的進歩を加速させる。我々の調査は、この信念に対する重大な監視を露呈している。我々の研究は、慎重に設計されたデモを配置することにより、ベースLSMが悪意のある命令を効果的に解釈し実行できることを実証する。
論文参考訳（メタデータ） (2024-04-16T13:22:54Z)
ALERT: A Comprehensive Benchmark for Assessing Large Language Models' Safety through Red Teaming [64.86326523181553]
ALERTは、新しいきめ細かいリスク分類に基づいて安全性を評価するための大規模なベンチマークである。脆弱性を特定し、改善を通知し、言語モデルの全体的な安全性を高めることを目的としている。
論文参考訳（メタデータ） (2024-04-06T15:01:47Z)
Eagle: Ethical Dataset Given from Real Interactions [74.7319697510621]
社会的バイアス、毒性、不道徳な問題を示すChatGPTとユーザ間の実際のインタラクションから抽出されたデータセットを作成します。我々の実験では、イーグルは、そのような倫理的課題の評価と緩和のために提案された既存のデータセットでカバーされていない相補的な側面を捉えている。
論文参考訳（メタデータ） (2024-02-22T03:46:02Z)
Denevil: Towards Deciphering and Navigating the Ethical Values of Large Language Models via Instruction Learning [36.66806788879868]
大きな言語モデル(LLM)は前例のない突破口をたどったが、彼らの日常生活への統合は非倫理的コンテンツによって社会的リスクを引き起こす可能性がある。この研究はモラル・ファンデーション理論を利用した倫理的価値を論じている。
論文参考訳（メタデータ） (2023-10-17T07:42:40Z)
Privacy in Large Language Models: Attacks, Defenses and Future Directions [84.73301039987128]
大規模言語モデル(LLM)を対象とした現在のプライバシ攻撃を分析し、敵の想定能力に応じて分類する。本稿では、これらのプライバシー攻撃に対抗するために開発された防衛戦略について概説する。
論文参考訳（メタデータ） (2023-10-16T13:23:54Z)
Applying Standards to Advance Upstream & Downstream Ethics in Large Language Models [0.0]
本稿では,AIが生成するコンテンツの保護をAI所有者がいかに開発できるかを考察する。他のコンテンツ制作業界では、行動規範や倫理基準が確立されている。
論文参考訳（メタデータ） (2023-06-06T08:47:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。