論文の概要: HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps
- arxiv url: http://arxiv.org/abs/2506.19268v2
- Date: Thu, 26 Jun 2025 15:23:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 13:31:57.7396
- Title: HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps
- Title(参考訳): HARPT:モバイルヘルスアプリにおける消費者の信頼とプライバシの懸念を分析するコーポレート
- Authors: Timoteo Kelly, Abdulkadir Korkmaz, Samuel Mallet, Connor Souders, Sadra Aliakbarpour, Praveen Rao,
- Abstract要約: 本稿では,ユーザプライバシと信頼度の研究を進めることを目的とした,モバイルヘルスアプリストアレビューの大規模コーパスについて紹介する。
データセットには、アプリケーションへの信頼、プロバイダへの信頼、プライバシの懸念といった重要な側面を捉える7つのカテゴリにラベル付けされた480,000以上のユーザレビューが含まれている。
- 参考スコア(独自算出の注目度): 2.1082753116647264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present HARPT, a large-scale annotated corpus of mobile health app store reviews aimed at advancing research in user privacy and trust. The dataset comprises over 480,000 user reviews labeled into seven categories that capture critical aspects of trust in applications, trust in providers and privacy concerns. Creating HARPT required addressing multiple complexities, such as defining a nuanced label schema, isolating relevant content from large volumes of noisy data, and designing an annotation strategy that balanced scalability with accuracy. This strategy integrated rule-based filtering, iterative manual labeling with review, targeted data augmentation, and weak supervision using transformer-based classifiers to accelerate coverage. In parallel, a carefully curated subset of 7,000 reviews was manually annotated to support model development and evaluation. We benchmark a broad range of classification models, demonstrating that strong performance is achievable and providing a baseline for future research. HARPT is released as a public resource to support work in health informatics, cybersecurity, and natural language processing.
- Abstract(参考訳): HARPTは,ユーザのプライバシと信頼性の研究を促進することを目的とした,モバイルヘルスアプリストアレビューの大規模コーパスである。
データセットには、アプリケーションへの信頼、プロバイダへの信頼、プライバシの懸念といった重要な側面を捉える7つのカテゴリにラベル付けされた480,000以上のユーザレビューが含まれている。
HARPTの作成には、ニュアンス付きラベルスキーマの定義、ノイズの多い大量のデータから関連するコンテンツを分離すること、スケーラビリティと精度のバランスをとるアノテーション戦略の設計など、複数の複雑さに対処する必要がある。
この戦略は、ルールベースのフィルタリング、レビュー付き反復手動ラベリング、ターゲットデータ拡張、およびトランスフォーマーベースの分類器による弱い監督を統合し、カバレッジを加速させる。
並行して、7000のレビューを慎重にキュレートしたサブセットが手作業でアノテートされ、モデルの開発と評価がサポートされた。
我々は、幅広い分類モデルをベンチマークし、強力な性能が達成可能であることを示し、将来の研究のベースラインを提供する。
HARPTは、健康情報学、サイバーセキュリティ、自然言語処理における作業を支援するための公開リソースとしてリリースされた。
関連論文リスト
- An Investigation of Memorization Risk in Healthcare Foundation Models [21.94560578418064]
構造化されたEHRデータに基づいてトレーニングされた基礎モデルのプライバシー関連リスクを評価するためのブラックボックス評価テストスイートを導入する。
本フレームワークは, 組込みと生成の両レベルでの記憶の探索方法と, モデル一般化と有害記憶の区別を目的とした。
論文 参考訳(メタデータ) (2025-10-14T19:55:07Z) - DRBench: A Realistic Benchmark for Enterprise Deep Research [81.49694432639406]
DRBenchは、エンタープライズ環境で複雑でオープンなディープリサーチタスクでAIエージェントを評価するためのベンチマークである。
セールス、サイバーセキュリティ、コンプライアンスなど10のドメインにわたる15のディープリサーチタスクをリリースしています。
論文 参考訳(メタデータ) (2025-09-30T18:47:20Z) - From App Features to Explanation Needs: Analyzing Correlations and Predictive Potential [2.2139415366377375]
本研究では,ユーザレビューから分類した説明要求が,アプリ特性に基づいて予測可能であるかを検討する。
メタデータに富んだ4,495のアプリレビューのゴールド標準データセットを分析した。
論文 参考訳(メタデータ) (2025-08-05T19:46:13Z) - SENSOR: An ML-Enhanced Online Annotation Tool to Uncover Privacy Concerns from User Reviews in Social-Media Applications [0.0]
本稿では,SENtinel SORt (SENSOR)について紹介する。
Google Play Storeで人気の高い7つのソーシャルメディアアプリからの16万のユーザーレビューが分析された。
GRACEはクラス不均衡にもかかわらず最高の性能(マクロF1スコア: 0.9434、マクロROC-AUC: 0.9934、精度: 95.10%)を示した。
論文 参考訳(メタデータ) (2025-07-14T14:58:04Z) - SAGE: A Context-Aware Approach for Mining Privacy Requirements Relevant Reviews from Mental Health Apps [0.0]
メンタルヘルス(MH)アプリは、メンタルウェルネスのニーズに合わせてサービスをカスタマイズするために、敏感なユーザーデータを必要とすることが多い。
この研究は、MHアプリから自動的にプライバシーレビューをマイニングするコンテキスト認識アプローチであるSAGEを紹介した。
論文 参考訳(メタデータ) (2025-07-11T21:53:56Z) - Transforming Sensitive Documents into Quantitative Data: An AI-Based Preprocessing Toolchain for Structured and Privacy-Conscious Analysis [0.0]
大規模分析は、機密性の高い個人識別可能な情報の存在によって妨げられる。
埋め込み型解析のためのテキストデータを作成するモジュラーツールチェーンを提案する。
スウェーデンの裁判所判決10,842件のコーパス上で,このツールチェーンを実証した。
論文 参考訳(メタデータ) (2025-07-11T11:58:36Z) - EVADE: Multimodal Benchmark for Evasive Content Detection in E-Commerce Applications [24.832537917472894]
EVADEは、eコマースにおける回避コンテンツ検出の基礎モデルを評価するために設計された、最初の専門家による、中国のマルチモーダルベンチマークである。
データセットには、2,833の注釈付きテキストサンプルと、6つの要求のある製品カテゴリにまたがる13,961のイメージが含まれている。
論文 参考訳(メタデータ) (2025-05-23T09:18:01Z) - Embedding with Large Language Models for Classification of HIPAA Safeguard Compliance Rules [4.871808381472344]
コードパターン処理における従来のWord2Vec埋め込みの限界を特定します。
この問題を克服するために、データセットの属性にコンテキスト化された埋め込みを提供する多言語BERTを採用しています。
その結果,ロジスティック回帰は99.95%の精度で,分類を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-10-28T01:54:24Z) - Which Client is Reliable?: A Reliable and Personalized Prompt-based Federated Learning for Medical Image Question Answering [51.26412822853409]
本稿では,医学的視覚的質問応答(VQA)モデルのための,パーソナライズド・フェデレーションド・ラーニング(pFL)手法を提案する。
提案手法では,学習可能なプロンプトをTransformerアーキテクチャに導入し,膨大な計算コストを伴わずに,多様な医療データセット上で効率的にトレーニングする。
論文 参考訳(メタデータ) (2024-10-23T00:31:17Z) - Core: Robust Factual Precision with Informative Sub-Claim Identification [44.36892500212747]
スコアを人工的にインフレーションするために、明らかまたは反復的なサブステートメントを追加することで、人気のあるメトリクスを操作できることを観察する。
この観察は、Coreと呼ばれる新しいカスタマイズ可能なプラグインとプレイのサブステート選択コンポーネントを動機付けます。
Coreによって強化された多くの一般的な事実精度指標が、幅広い知識領域においてかなり堅牢であることを示す。
論文 参考訳(メタデータ) (2024-07-04T01:51:38Z) - PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models [72.57329554067195]
ProxyQAは、長文生成を評価するための革新的なフレームワークである。
さまざまなドメインにまたがる詳細なヒューマンキュレートされたメタクエストで構成されており、それぞれに事前にアノテートされた回答を持つ特定のプロキシクエストが伴っている。
プロキシクエリに対処する際の評価器の精度を通じて、生成されたコンテンツの品質を評価する。
論文 参考訳(メタデータ) (2024-01-26T18:12:25Z) - Robust Recommender System: A Survey and Future Directions [58.87305602959857]
まず,悪質な攻撃や自然騒音に耐える現在の手法を整理するための分類法を提案する。
次に、不正検出、敵の訓練、悪意のある攻撃から守るための確実な堅牢な訓練など、各カテゴリにおける最先端の手法を検討する。
さまざまなレコメンデーションシナリオの堅牢性や,正確性や解釈可能性,プライバシ,公正性といった他の特性との相互作用について論じる。
論文 参考訳(メタデータ) (2023-09-05T08:58:46Z) - Blockchain-empowered Federated Learning for Healthcare Metaverses:
User-centric Incentive Mechanism with Optimal Data Freshness [66.3982155172418]
まず、医療メタバースのための分散型フェデレートラーニング(FL)に基づく、ユーザ中心のプライバシ保護フレームワークを設計する。
次に,情報時代(AoI)を有効データ更新度指標として利用し,観測理論(PT)に基づくAoIベースの契約理論モデルを提案し,センシングデータ共有の動機付けを行う。
論文 参考訳(メタデータ) (2023-07-29T12:54:03Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - DecodingTrust: A Comprehensive Assessment of Trustworthiness in GPT
Models [92.6951708781736]
本稿では,GPT-4とGPT-3.5に着目した大規模言語モデルの総合的信頼性評価を提案する。
GPTモデルは、有害で偏りのある出力を生成し、個人情報を漏らすために、容易に誤解され得る。
我々の研究は、GPTモデルの総合的な信頼性評価を示し、信頼性のギャップに光を当てている。
論文 参考訳(メタデータ) (2023-06-20T17:24:23Z) - Protecting User Privacy in Online Settings via Supervised Learning [69.38374877559423]
我々は、教師付き学習を活用する、オンラインプライバシ保護に対するインテリジェントなアプローチを設計する。
ユーザのプライバシを侵害する可能性のあるデータ収集を検出してブロックすることにより、ユーザに対してある程度のディジタルプライバシを復元することが可能になります。
論文 参考訳(メタデータ) (2023-04-06T05:20:16Z) - Mining User Privacy Concern Topics from App Reviews [10.776958968245589]
アプリストアのアプリレビューを通じて、プライバシー上の懸念を訴えるユーザーが増えている。
プライバシーに関する懸念をユーザーレビューから効果的に掘り下げる主な課題は、プライバシーに関する懸念を表すレビューが、より一般的なテーマや騒々しいコンテンツを表す多くのレビューによって過大評価されているという事実にある。
本研究では,この課題を克服するための新しい自動化手法を提案する。
論文 参考訳(メタデータ) (2022-12-19T08:07:27Z) - Personalized multi-faceted trust modeling to determine trust links in
social media and its potential for misinformation management [61.88858330222619]
ソーシャルメディアにおけるピア間の信頼関係を予測するためのアプローチを提案する。
本稿では,データ駆動型多面信頼モデルを提案する。
信頼を意識したアイテムレコメンデーションタスクで説明され、提案したフレームワークを大規模なYelpデータセットのコンテキストで評価する。
論文 参考訳(メタデータ) (2021-11-11T19:40:51Z) - Privacy-preserving medical image analysis [53.4844489668116]
医用画像におけるプライバシ保護機械学習(PPML)のためのソフトウェアフレームワークであるPriMIAを提案する。
集合型学習モデルの分類性能は,未発見データセットの人間専門家と比較して有意に良好である。
グラデーションベースのモデル反転攻撃に対するフレームワークのセキュリティを実証的に評価する。
論文 参考訳(メタデータ) (2020-12-10T13:56:00Z) - RobustBench: a standardized adversarial robustness benchmark [84.50044645539305]
ロバストネスのベンチマークにおける主な課題は、その評価がしばしばエラーを起こし、ロバストネス過大評価につながることである。
我々は,白箱攻撃と黒箱攻撃のアンサンブルであるAutoAttackを用いて,敵対的ロバスト性を評価する。
分散シフト,キャリブレーション,アウト・オブ・ディストリビューション検出,フェアネス,プライバシリーク,スムースネス,転送性に対するロバスト性の影響を解析した。
論文 参考訳(メタデータ) (2020-10-19T17:06:18Z) - COVID-19 Antibody Test / Vaccination Certification: There's an app for
that [1.1744028458220426]
新型コロナウイルスの「免疫パスポート(Immunity Passport)」は、個人が仕事に戻れるようにするための手段だ。
本研究では,携帯電話アプリのプロトタイプと,タンパー保護テスト結果の即時検証を容易にする分散型サーバアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-15T22:42:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。