論文の概要: SafeSpace: An Integrated Web Application for Digital Safety and Emotional Well-being
- arxiv url: http://arxiv.org/abs/2508.16488v1
- Date: Fri, 22 Aug 2025 16:07:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.444172
- Title: SafeSpace: An Integrated Web Application for Digital Safety and Emotional Well-being
- Title(参考訳): SafeSpace: デジタル安全と感情のウェルビーイングのための統合Webアプリケーション
- Authors: Kayenat Fatmi, Mohammad Abbas,
- Abstract要約: 我々は、NLPモデルとGoogleのパースペクティブAPIを使用して、チャットやスクリーンショットの毒性検出を統合する統一WebアプリケーションであるSafeSpaceを紹介する。
このシステムは、アラート管理のためのリフレクションと、ユーザビリティ、プライバシ、スケーラビリティのために設計されたモジュラーアーキテクチャを採用している。
実験の結果,毒性検出の精度は93%,エミュレータ試験時の安全警報の信頼性は100%,自動票と手動票の一致率は92%であった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the digital era, individuals are increasingly exposed to online harms such as toxicity, manipulation, and grooming, which often pose emotional and safety risks. Existing systems for detecting abusive content or issuing safety alerts operate in isolation and rarely combine digital safety with emotional well-being. In this paper, we present SafeSpace, a unified web application that integrates three modules: (1) toxicity detection in chats and screenshots using NLP models and Google's Perspective API, (2) a configurable safety ping system that issues emergency alerts with the user's live location (longitude and latitude) via SMTP-based emails when check-ins are missed or SOS alerts are manually triggered, and (3) a reflective questionnaire that evaluates relationship health and emotional resilience. The system employs Firebase for alert management and a modular architecture designed for usability, privacy, and scalability. The experimental evaluation shows 93% precision in toxicity detection, 100% reliability in safety alerts under emulator tests, and 92% alignment between automated and manual questionnaire scoring. SafeSpace, implemented as a web application, demonstrates the feasibility of integrating detection, protection, and reflection within a single platform, with future deployment envisioned as a mobile application for broader accessibility.
- Abstract(参考訳): デジタル時代には、個人は毒性、操作、グルーミングなどのオンラインの害に晒されやすくなり、しばしば感情や安全性のリスクが生じる。
既存システムでは、乱用コンテンツの検出や安全警報の発行は単独で行われており、デジタル安全と感情的幸福を兼ねることはほとんどない。
本稿では,(1)NLPモデルとGoogleのパースペクティブAPIを用いたチャットやスクリーンショットの毒性検出,(2)チェックインが失敗したり,SOSアラートが手動で起動されたりした場合にSMTPベースの電子メールでユーザのライブロケーション(経度と緯度)に緊急警報を発行する構成可能な安全ピンピングシステム,(3)関係の健康と感情の回復性を評価するリフレクティブアンケート,の3つのモジュールを統合した統合WebアプリケーションであるSafeSpaceを提案する。
システムには、アラート管理にFirebaseと、ユーザビリティ、プライバシ、スケーラビリティのために設計されたモジュールアーキテクチャが使用されている。
実験の結果, 毒性検出精度は93%, エミュレータ試験時の安全警報の信頼性は100%, 自動票と手動票の一致率は92%であった。
Webアプリケーションとして実装されたSafeSpaceは、単一のプラットフォームに検出、保護、リフレクションを統合する可能性を示している。
関連論文リスト
- Endpoint Security Agent: A Comprehensive Approach to Real-time System Monitoring and Threat Detection [0.3266916057202441]
本稿では,“Endpoint Security Agent: A Comprehensive Approach to Real-time System Monitoring and Threat Detection”を提案する。
良性および悪意のあるアクティビティのラベル付きデータセットに基づいてトレーニングされた機械学習ベースの検出エンジンは、最小限の偽陽性で正確な脅威識別を可能にする。
このシステムには、アラートと法医学的分析のための集中インターフェイスが含まれている。
論文 参考訳(メタデータ) (2025-11-11T15:28:54Z) - OS-Sentinel: Towards Safety-Enhanced Mobile GUI Agents via Hybrid Validation in Realistic Workflows [77.95511352806261]
VLM(Vision-Language Models)を利用したコンピュータ利用エージェントは、モバイルプラットフォームのようなデジタル環境を操作する上で、人間のような能力を実証している。
我々は,明示的なシステムレベルの違反を検出するための形式検証器と,文脈的リスクとエージェント行動を評価するコンテキスト判断器を組み合わせた,新しいハイブリッド安全検出フレームワークOS-Sentinelを提案する。
論文 参考訳(メタデータ) (2025-10-28T13:22:39Z) - OpenAgentSafety: A Comprehensive Framework for Evaluating Real-World AI Agent Safety [58.201189860217724]
OpenAgentSafetyは,8つの危機リスクカテゴリにまたがるエージェントの動作を評価する包括的なフレームワークである。
従来の作業とは異なり、我々のフレームワークは、Webブラウザ、コード実行環境、ファイルシステム、bashシェル、メッセージングプラットフォームなど、実際のツールと対話するエージェントを評価します。
ルールベースの分析とLSM-as-judgeアセスメントを組み合わせることで、過度な行動と微妙な不安全行動の両方を検出する。
論文 参考訳(メタデータ) (2025-07-08T16:18:54Z) - OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents [34.396536936282175]
コンピュータ使用エージェントの安全性を計測する新しいベンチマークであるOS-Harmを紹介する。
OS-HarmはOSWorld環境上に構築されており、故意のユーザ誤用、インジェクション攻撃、モデル誤動作の3つのカテゴリでモデルをテストすることを目指している。
我々は、フロンティアモデルに基づいてコンピュータ利用エージェントを評価し、その安全性に関する洞察を提供する。
論文 参考訳(メタデータ) (2025-06-17T17:59:31Z) - DRIFT: Dynamic Rule-Based Defense with Injection Isolation for Securing LLM Agents [52.92354372596197]
大規模言語モデル(LLM)は、強力な推論と計画能力のため、エージェントシステムの中心となってきています。
この相互作用は、外部ソースからの悪意のある入力がエージェントの振る舞いを誤解させる可能性がある、インジェクション攻撃のリスクも引き起こす。
本稿では,信頼に値するエージェントシステムのための動的ルールベースの分離フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-13T05:01:09Z) - Does Johnny Get the Message? Evaluating Cybersecurity Notifications for Everyday Users [0.0]
最近のアプローチでは、大規模な言語モデルを使用して、簡潔で技術的なセキュリティ警告を直感的な言語に書き直している。
このようなアラートがユーザに対してどの程度うまく説明されているのか、まだ明らかな疑問だ。
本稿では,Human-Centered Security Alert Evaluation Framework (HCSAEF)を紹介する。
論文 参考訳(メタデータ) (2025-05-28T14:58:29Z) - SafeAgent: Safeguarding LLM Agents via an Automated Risk Simulator [77.86600052899156]
LLM(Large Language Model)ベースのエージェントは、現実のアプリケーションにますますデプロイされる。
完全自動合成データ生成によるエージェント安全性を体系的に向上する最初のフレームワークであるAutoSafeを提案する。
AutoSafeは安全性のスコアを平均で45%向上させ、現実世界のタスクでは28.91%の改善を実現している。
論文 参考訳(メタデータ) (2025-05-23T10:56:06Z) - Towards Trustworthy GUI Agents: A Survey [64.6445117343499]
本調査では,GUIエージェントの信頼性を5つの重要な次元で検証する。
敵攻撃に対する脆弱性、シーケンシャルな意思決定における障害モードのカスケードなど、大きな課題を特定します。
GUIエージェントが普及するにつれて、堅牢な安全基準と責任ある開発プラクティスを確立することが不可欠である。
論文 参考訳(メタデータ) (2025-03-30T13:26:00Z) - Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System [0.8136541584281987]
本研究は,3つの検査手法を用いて,逆チューリングテストによりローグエージェントを検出し,マルチエージェントシミュレーションにより知覚的アライメントを解析する。
GEMINI 1.5 Pro と llama-3.3-70B, Deepseek r1 モデルを用いて, 抗ジェイルブレイクシステムを開発した。
GEMINI 1.5 Proの94%の精度など、検出能力は強いが、長時間の攻撃を受けた場合、システムは永続的な脆弱性に悩まされる。
論文 参考訳(メタデータ) (2025-02-23T23:35:15Z) - PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety [70.84902425123406]
大規模言語モデル(LLM)で拡張されたマルチエージェントシステムは、集団知能において重要な能力を示す。
しかし、悪意のある目的のためにこのインテリジェンスを誤用する可能性があり、重大なリスクが生じる。
本研究では,エージェント心理学を基盤とした枠組み(PsySafe)を提案し,エージェントのダークパーソナリティ特性がリスク行動にどう影響するかを明らかにする。
実験の結果,エージェント間の集団的危険行動,エージェントが危険な行動を行う際の自己反射,エージェントの心理的評価と危険な行動との相関など,いくつかの興味深い現象が明らかになった。
論文 参考訳(メタデータ) (2024-01-22T12:11:55Z) - Face Presentation Attack Detection [59.05779913403134]
顔認識技術は、チェックインやモバイル支払いといった日々の対話的アプリケーションで広く利用されている。
しかしながら、プレゼンテーションアタック(PA)に対する脆弱性は、超セキュアなアプリケーションシナリオにおける信頼性の高い使用を制限する。
論文 参考訳(メタデータ) (2022-12-07T14:51:17Z) - Securing of Unmanned Aerial Systems (UAS) against security threats using
human immune system [1.2691047660244335]
人体免疫システム(HIS)を用いた安全対策のための侵入検知システム(IDS)が提案されている。
IDSはターゲットシステムに侵入する試みを検知し、応答するために使用される。
論文 参考訳(メタデータ) (2020-03-01T19:05:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。