論文の概要: SafeSpace: An Integrated Web Application for Digital Safety and Emotional Well-being
- arxiv url: http://arxiv.org/abs/2508.16488v1
- Date: Fri, 22 Aug 2025 16:07:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.444172
- Title: SafeSpace: An Integrated Web Application for Digital Safety and Emotional Well-being
- Title(参考訳): SafeSpace: デジタル安全と感情のウェルビーイングのための統合Webアプリケーション
- Authors: Kayenat Fatmi, Mohammad Abbas,
- Abstract要約: 我々は、NLPモデルとGoogleのパースペクティブAPIを使用して、チャットやスクリーンショットの毒性検出を統合する統一WebアプリケーションであるSafeSpaceを紹介する。
このシステムは、アラート管理のためのリフレクションと、ユーザビリティ、プライバシ、スケーラビリティのために設計されたモジュラーアーキテクチャを採用している。
実験の結果,毒性検出の精度は93%,エミュレータ試験時の安全警報の信頼性は100%,自動票と手動票の一致率は92%であった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the digital era, individuals are increasingly exposed to online harms such as toxicity, manipulation, and grooming, which often pose emotional and safety risks. Existing systems for detecting abusive content or issuing safety alerts operate in isolation and rarely combine digital safety with emotional well-being. In this paper, we present SafeSpace, a unified web application that integrates three modules: (1) toxicity detection in chats and screenshots using NLP models and Google's Perspective API, (2) a configurable safety ping system that issues emergency alerts with the user's live location (longitude and latitude) via SMTP-based emails when check-ins are missed or SOS alerts are manually triggered, and (3) a reflective questionnaire that evaluates relationship health and emotional resilience. The system employs Firebase for alert management and a modular architecture designed for usability, privacy, and scalability. The experimental evaluation shows 93% precision in toxicity detection, 100% reliability in safety alerts under emulator tests, and 92% alignment between automated and manual questionnaire scoring. SafeSpace, implemented as a web application, demonstrates the feasibility of integrating detection, protection, and reflection within a single platform, with future deployment envisioned as a mobile application for broader accessibility.
- Abstract(参考訳): デジタル時代には、個人は毒性、操作、グルーミングなどのオンラインの害に晒されやすくなり、しばしば感情や安全性のリスクが生じる。
既存システムでは、乱用コンテンツの検出や安全警報の発行は単独で行われており、デジタル安全と感情的幸福を兼ねることはほとんどない。
本稿では,(1)NLPモデルとGoogleのパースペクティブAPIを用いたチャットやスクリーンショットの毒性検出,(2)チェックインが失敗したり,SOSアラートが手動で起動されたりした場合にSMTPベースの電子メールでユーザのライブロケーション(経度と緯度)に緊急警報を発行する構成可能な安全ピンピングシステム,(3)関係の健康と感情の回復性を評価するリフレクティブアンケート,の3つのモジュールを統合した統合WebアプリケーションであるSafeSpaceを提案する。
システムには、アラート管理にFirebaseと、ユーザビリティ、プライバシ、スケーラビリティのために設計されたモジュールアーキテクチャが使用されている。
実験の結果, 毒性検出精度は93%, エミュレータ試験時の安全警報の信頼性は100%, 自動票と手動票の一致率は92%であった。
Webアプリケーションとして実装されたSafeSpaceは、単一のプラットフォームに検出、保護、リフレクションを統合する可能性を示している。
関連論文リスト
- OpenAgentSafety: A Comprehensive Framework for Evaluating Real-World AI Agent Safety [58.201189860217724]
OpenAgentSafetyは,8つの危機リスクカテゴリにまたがるエージェントの動作を評価する包括的なフレームワークである。
従来の作業とは異なり、我々のフレームワークは、Webブラウザ、コード実行環境、ファイルシステム、bashシェル、メッセージングプラットフォームなど、実際のツールと対話するエージェントを評価します。
ルールベースの分析とLSM-as-judgeアセスメントを組み合わせることで、過度な行動と微妙な不安全行動の両方を検出する。
論文 参考訳(メタデータ) (2025-07-08T16:18:54Z) - OS-Harm: A Benchmark for Measuring Safety of Computer Use Agents [34.396536936282175]
コンピュータ使用エージェントの安全性を計測する新しいベンチマークであるOS-Harmを紹介する。
OS-HarmはOSWorld環境上に構築されており、故意のユーザ誤用、インジェクション攻撃、モデル誤動作の3つのカテゴリでモデルをテストすることを目指している。
我々は、フロンティアモデルに基づいてコンピュータ利用エージェントを評価し、その安全性に関する洞察を提供する。
論文 参考訳(メタデータ) (2025-06-17T17:59:31Z) - Does Johnny Get the Message? Evaluating Cybersecurity Notifications for Everyday Users [0.0]
最近のアプローチでは、大規模な言語モデルを使用して、簡潔で技術的なセキュリティ警告を直感的な言語に書き直している。
このようなアラートがユーザに対してどの程度うまく説明されているのか、まだ明らかな疑問だ。
本稿では,Human-Centered Security Alert Evaluation Framework (HCSAEF)を紹介する。
論文 参考訳(メタデータ) (2025-05-28T14:58:29Z) - SafeAgent: Safeguarding LLM Agents via an Automated Risk Simulator [77.86600052899156]
LLM(Large Language Model)ベースのエージェントは、現実のアプリケーションにますますデプロイされる。
完全自動合成データ生成によるエージェント安全性を体系的に向上する最初のフレームワークであるAutoSafeを提案する。
AutoSafeは安全性のスコアを平均で45%向上させ、現実世界のタスクでは28.91%の改善を実現している。
論文 参考訳(メタデータ) (2025-05-23T10:56:06Z) - Towards Trustworthy GUI Agents: A Survey [64.6445117343499]
本調査では,GUIエージェントの信頼性を5つの重要な次元で検証する。
敵攻撃に対する脆弱性、シーケンシャルな意思決定における障害モードのカスケードなど、大きな課題を特定します。
GUIエージェントが普及するにつれて、堅牢な安全基準と責任ある開発プラクティスを確立することが不可欠である。
論文 参考訳(メタデータ) (2025-03-30T13:26:00Z) - Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System [0.8136541584281987]
本研究は,3つの検査手法を用いて,逆チューリングテストによりローグエージェントを検出し,マルチエージェントシミュレーションにより知覚的アライメントを解析する。
GEMINI 1.5 Pro と llama-3.3-70B, Deepseek r1 モデルを用いて, 抗ジェイルブレイクシステムを開発した。
GEMINI 1.5 Proの94%の精度など、検出能力は強いが、長時間の攻撃を受けた場合、システムは永続的な脆弱性に悩まされる。
論文 参考訳(メタデータ) (2025-02-23T23:35:15Z) - PsySafe: A Comprehensive Framework for Psychological-based Attack, Defense, and Evaluation of Multi-agent System Safety [70.84902425123406]
大規模言語モデル(LLM)で拡張されたマルチエージェントシステムは、集団知能において重要な能力を示す。
しかし、悪意のある目的のためにこのインテリジェンスを誤用する可能性があり、重大なリスクが生じる。
本研究では,エージェント心理学を基盤とした枠組み(PsySafe)を提案し,エージェントのダークパーソナリティ特性がリスク行動にどう影響するかを明らかにする。
実験の結果,エージェント間の集団的危険行動,エージェントが危険な行動を行う際の自己反射,エージェントの心理的評価と危険な行動との相関など,いくつかの興味深い現象が明らかになった。
論文 参考訳(メタデータ) (2024-01-22T12:11:55Z) - Face Presentation Attack Detection [59.05779913403134]
顔認識技術は、チェックインやモバイル支払いといった日々の対話的アプリケーションで広く利用されている。
しかしながら、プレゼンテーションアタック(PA)に対する脆弱性は、超セキュアなアプリケーションシナリオにおける信頼性の高い使用を制限する。
論文 参考訳(メタデータ) (2022-12-07T14:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。