論文の概要: SENSOR: An ML-Enhanced Online Annotation Tool to Uncover Privacy Concerns from User Reviews in Social-Media Applications
- arxiv url: http://arxiv.org/abs/2507.10640v1
- Date: Mon, 14 Jul 2025 14:58:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-16 19:46:02.80606
- Title: SENSOR: An ML-Enhanced Online Annotation Tool to Uncover Privacy Concerns from User Reviews in Social-Media Applications
- Title(参考訳): SENSor: ソーシャルメディアアプリケーションにおけるユーザレビューからプライバシの懸念を明らかにするためのML強化オンラインアノテーションツール
- Authors: Labiba Farah, Mohammad Ridwan Kabir, Shohel Ahmed, MD Mohaymen Ul Anam, Md. Sakibul Islam,
- Abstract要約: 本稿では,SENtinel SORt (SENSOR)について紹介する。
Google Play Storeで人気の高い7つのソーシャルメディアアプリからの16万のユーザーレビューが分析された。
GRACEはクラス不均衡にもかかわらず最高の性能(マクロF1スコア: 0.9434、マクロROC-AUC: 0.9934、精度: 95.10%)を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The widespread use of social media applications has raised significant privacy concerns, often highlighted in user reviews. These reviews also provide developers with valuable insights into improving apps by addressing issues and introducing better features. However, the sheer volume and nuanced nature of reviews make manual identification and prioritization of privacy-related concerns challenging for developers. Previous studies have developed software utilities to automatically classify user reviews as privacy-relevant, privacy-irrelevant, bug reports, feature requests, etc., using machine learning. Notably, there is a lack of focus on classifying reviews specifically as privacy-related feature requests, privacy-related bug reports, or privacy-irrelevant. This paper introduces SENtinel SORt (SENSOR), an automated online annotation tool designed to help developers annotate and classify user reviews into these categories. For automating the annotation of such reviews, this paper introduces the annotation model, GRACE (GRU-based Attention with CBOW Embedding), using Gated Recurrent Units (GRU) with Continuous Bag of Words (CBOW) and Attention mechanism. Approximately 16000 user reviews from seven popular social media apps on Google Play Store, including Instagram, Facebook, WhatsApp, Snapchat, X (formerly Twitter), Facebook Lite, and Line were analyzed. Two annotators manually labelled the reviews, achieving a Cohen's Kappa value of 0.87, ensuring a labeled dataset with high inter-rater agreement for training machine learning models. Among the models tested, GRACE demonstrated the best performance (macro F1-score: 0.9434, macro ROC-AUC: 0.9934, and accuracy: 95.10%) despite class imbalance. SENSOR demonstrates significant potential to assist developers with extracting and addressing privacy-related feature requests or bug reports from user reviews, enhancing user privacy and trust.
- Abstract(参考訳): ソーシャルメディアアプリケーションの普及は、重要なプライバシー上の懸念を生じさせ、しばしばユーザーレビューで強調されている。
これらのレビューは、問題に対処し、より良い機能を導入することで、アプリを改善するための貴重な洞察を提供する。
しかし、レビューの量と微妙な性質は、開発者がプライバシーに関する懸念を手動で識別し優先順位付けすることを困難にしている。
これまでの研究では、機械学習を使用して、ユーザのレビューを自動的にプライバシ関連、プライバシ関連、バグ報告、機能要求等に分類するソフトウェアユーティリティが開発された。
特に、プライバシ関連の機能要求、プライバシ関連のバグレポート、プライバシ関連のバグレポートなど、レビューの分類に重点が置かれていない点が注目に値する。
本稿では,SENtinel SORt (SENSOR)について紹介する。
本稿では,アノテーションモデルGRACE(GRU-based Attention with CBOW Embedding),GRU(Gated Recurrent Units),CBOW(Continuous Bag of Words),Atention Mechanismについて紹介する。
Instagram、Facebook、WhatsApp、Snapchat、X(元Twitter)、Facebook Lite、Lineを含む7つの人気ソーシャルメディアアプリから約16万のユーザーレビューが分析された。
2つのアノテータがレビューを手作業でラベル付けし、CohenのKappa値が0.87に達した。
試験されたモデルの中で、GRACEはクラス不均衡にもかかわらず最高の性能(マクロF1スコア:0.9434、マクロROC-AUC:0.9934、精度:95.10%)を示した。
SENSORは、プライバシ関連の機能要求やバグレポートをユーザレビューから抽出し、対処し、ユーザのプライバシと信頼を高める上で、開発者を支援する大きな可能性を実証している。
関連論文リスト
- SAGE: A Context-Aware Approach for Mining Privacy Requirements Relevant Reviews from Mental Health Apps [0.0]
メンタルヘルス(MH)アプリは、メンタルウェルネスのニーズに合わせてサービスをカスタマイズするために、敏感なユーザーデータを必要とすることが多い。
この研究は、MHアプリから自動的にプライバシーレビューをマイニングするコンテキスト認識アプローチであるSAGEを紹介した。
論文 参考訳(メタデータ) (2025-07-11T21:53:56Z) - LazyReview A Dataset for Uncovering Lazy Thinking in NLP Peer Reviews [74.87393214734114]
この研究は、微粒な遅延思考カテゴリで注釈付けされたピアレビュー文のデータセットであるLazyReviewを紹介している。
大規模言語モデル(LLM)は、ゼロショット設定でこれらのインスタンスを検出するのに苦労する。
命令ベースのデータセットの微調整により、パフォーマンスが10~20ポイント向上する。
論文 参考訳(メタデータ) (2025-04-15T10:07:33Z) - Can LLM feedback enhance review quality? A randomized study of 20K reviews at ICLR 2025 [115.86204862475864]
Review Feedback Agentは、あいまいなコメント、コンテンツの誤解、レビュアーへの専門的でない発言に対する自動的なフィードバックを提供する。
ICLR 2025で大規模なランダム化制御研究として実装された。
フィードバックを受けたレビュアーの27%がレビューを更新し、エージェントからの12,000以上のフィードバック提案がレビュアーによって取り入れられた。
論文 参考訳(メタデータ) (2025-04-13T22:01:25Z) - CRScore: Grounding Automated Evaluation of Code Review Comments in Code Claims and Smells [15.66562304661042]
CRScoreは、簡潔さ、包括性、関連性といったレビュー品質の次元を測定するための基準のないメトリクスである。
我々は、CRScoreが、オープンソースメトリクスの人間の判断に最も適した、正確できめ細かいレビュー品質のスコアを生成できることを実証した。
また、自動メトリクスの開発をサポートするために、マシン生成およびGitHubレビューコメントのための2.9kの人手によるレビュー品質スコアのコーパスもリリースしました。
論文 参考訳(メタデータ) (2024-09-29T21:53:18Z) - Exploring User Privacy Awareness on GitHub: An Empirical Study [5.822284390235265]
GitHubは、開発者にソースコードを配布し、共通のプロジェクトで協力する実践的な方法を提供する。
アカウントのセキュリティとプライバシを強化するため、GitHubでは、アクセス権限の管理、監査ログのレビュー、二要素認証を有効にしている。
この努力にもかかわらず、このプラットフォームはユーザーのプライバシーに関するさまざまな問題に直面している。
論文 参考訳(メタデータ) (2024-09-06T06:41:46Z) - Combat AI With AI: Counteract Machine-Generated Fake Restaurant Reviews
on Social Media [77.34726150561087]
我々は、高品質なYelpレビューを活用して、OpenAI GPTレビュー作成者から偽レビューを生成することを提案する。
このモデルを適用して、非エリートレビューを予測し、複数の次元にまたがるパターンを識別する。
ソーシャルメディアプラットフォームは、マシン生成の偽レビューによって継続的に挑戦されていることを示す。
論文 参考訳(メタデータ) (2023-02-10T19:40:10Z) - Mining User Privacy Concern Topics from App Reviews [10.776958968245589]
アプリストアのアプリレビューを通じて、プライバシー上の懸念を訴えるユーザーが増えている。
プライバシーに関する懸念をユーザーレビューから効果的に掘り下げる主な課題は、プライバシーに関する懸念を表すレビューが、より一般的なテーマや騒々しいコンテンツを表す多くのレビューによって過大評価されているという事実にある。
本研究では,この課題を克服するための新しい自動化手法を提案する。
論文 参考訳(メタデータ) (2022-12-19T08:07:27Z) - Analysis of Longitudinal Changes in Privacy Behavior of Android
Applications [79.71330613821037]
本稿では,プライバシに関して,Androidアプリが時間とともにどのように変化してきたかを検討する。
HTTPSの採用、アプリが他のインストール済みアプリのデバイスをスキャンするかどうか、プライバシに敏感なデータに対するパーミッションの使用、ユニークな識別子の使用について検討する。
アプリがアップデートを受け続けるにつれて、プライバシ関連の振る舞いは時間とともに改善され、アプリによって使用されるサードパーティライブラリが、プライバシに関するより多くの問題に責任を負っていることが分かっています。
論文 参考訳(メタデータ) (2021-12-28T16:21:31Z) - TOUR: Dynamic Topic and Sentiment Analysis of User Reviews for Assisting
App Release [34.529117157417176]
TOURは、(i)アプリバージョンよりも新しいアプリの問題を検知し、要約し、(ii)アプリ機能に対するユーザー感情を特定し、(iii)開発者の検査を容易にするために重要なユーザーレビューを優先順位付けすることができる。
論文 参考訳(メタデータ) (2021-03-26T08:44:55Z) - Emerging App Issue Identification via Online Joint Sentiment-Topic
Tracing [66.57888248681303]
本稿では,MERITという新しい問題検出手法を提案する。
AOBSTモデルに基づいて、1つのアプリバージョンに対するユーザレビューに否定的に反映されたトピックを推測する。
Google PlayやAppleのApp Storeで人気のアプリに対する実験は、MERITの有効性を実証している。
論文 参考訳(メタデータ) (2020-08-23T06:34:05Z) - Automating App Review Response Generation [67.58267006314415]
本稿では,レビューと回答の知識関係を学習することで,レビュー応答を自動的に生成する新しいアプローチRRGenを提案する。
58のアプリと309,246のレビュー-レスポンスペアの実験では、RRGenはBLEU-4の点で少なくとも67.4%のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-02-10T05:23:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。