論文の概要: HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps
- arxiv url: http://arxiv.org/abs/2506.19268v1
- Date: Tue, 24 Jun 2025 02:59:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-25 19:48:23.457615
- Title: HARPT: A Corpus for Analyzing Consumers' Trust and Privacy Concerns in Mobile Health Apps
- Title(参考訳): HARPT:モバイルヘルスアプリにおける消費者の信頼とプライバシの懸念を分析するコーポレート
- Authors: Timoteo Kelly, Abdulkadir Korkmaz, Samuel Mallet, Connor Souders, Sadra Aliakbarpour, Praveen Rao,
- Abstract要約: 本稿では,ユーザプライバシと信頼度の研究を進めることを目的とした,モバイルヘルスアプリストアレビューの大規模コーパスについて紹介する。
データセットには、アプリケーションへの信頼、プロバイダへの信頼、プライバシの懸念といった重要な側面を捉える7つのカテゴリにラベル付けされた480,000以上のユーザレビューが含まれている。
- 参考スコア(独自算出の注目度): 2.1082753116647264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present HARPT, a large-scale annotated corpus of mobile health app store reviews aimed at advancing research in user privacy and trust. The dataset comprises over 480,000 user reviews labeled into seven categories that capture critical aspects of trust in applications, trust in providers and privacy concerns. Creating HARPT required addressing multiple complexities, such as defining a nuanced label schema, isolating relevant content from large volumes of noisy data, and designing an annotation strategy that balanced scalability with accuracy. This strategy integrated rule-based filtering, iterative manual labeling with review, targeted data augmentation, and weak supervision using transformer-based classifiers to accelerate coverage. In parallel, a carefully curated subset of 7,000 reviews was manually annotated to support model development and evaluation. We benchmark a broad range of classification models, demonstrating that strong performance is achievable and providing a baseline for future research. HARPT is released as a public resource to support work in health informatics, cybersecurity, and natural language processing.
- Abstract(参考訳): HARPTは,ユーザのプライバシと信頼性の研究を促進することを目的とした,モバイルヘルスアプリストアレビューの大規模コーパスである。
データセットには、アプリケーションへの信頼、プロバイダへの信頼、プライバシの懸念といった重要な側面を捉える7つのカテゴリにラベル付けされた480,000以上のユーザレビューが含まれている。
HARPTの作成には、ニュアンス付きラベルスキーマの定義、ノイズの多い大量のデータから関連するコンテンツを分離すること、スケーラビリティと精度のバランスをとるアノテーション戦略の設計など、複数の複雑さに対処する必要がある。
この戦略は、ルールベースのフィルタリング、レビュー付き反復手動ラベリング、ターゲットデータ拡張、およびトランスフォーマーベースの分類器による弱い監督を統合し、カバレッジを加速させる。
並行して、7000のレビューを慎重にキュレートしたサブセットが手作業でアノテートされ、モデルの開発と評価がサポートされた。
我々は、幅広い分類モデルをベンチマークし、強力な性能が達成可能であることを示し、将来の研究のベースラインを提供する。
HARPTは、健康情報学、サイバーセキュリティ、自然言語処理における作業を支援するための公開リソースとしてリリースされた。
関連論文リスト
- EVADE: Multimodal Benchmark for Evasive Content Detection in E-Commerce Applications [24.832537917472894]
EVADEは、eコマースにおける回避コンテンツ検出の基礎モデルを評価するために設計された、最初の専門家による、中国のマルチモーダルベンチマークである。
データセットには、2,833の注釈付きテキストサンプルと、6つの要求のある製品カテゴリにまたがる13,961のイメージが含まれている。
論文 参考訳(メタデータ) (2025-05-23T09:18:01Z) - Embedding with Large Language Models for Classification of HIPAA Safeguard Compliance Rules [4.871808381472344]
コードパターン処理における従来のWord2Vec埋め込みの限界を特定します。
この問題を克服するために、データセットの属性にコンテキスト化された埋め込みを提供する多言語BERTを採用しています。
その結果,ロジスティック回帰は99.95%の精度で,分類を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2024-10-28T01:54:24Z) - Core: Robust Factual Precision with Informative Sub-Claim Identification [44.36892500212747]
スコアを人工的にインフレーションするために、明らかまたは反復的なサブステートメントを追加することで、人気のあるメトリクスを操作できることを観察する。
この観察は、Coreと呼ばれる新しいカスタマイズ可能なプラグインとプレイのサブステート選択コンポーネントを動機付けます。
Coreによって強化された多くの一般的な事実精度指標が、幅広い知識領域においてかなり堅牢であることを示す。
論文 参考訳(メタデータ) (2024-07-04T01:51:38Z) - PROXYQA: An Alternative Framework for Evaluating Long-Form Text Generation with Large Language Models [72.57329554067195]
ProxyQAは、長文生成を評価するための革新的なフレームワークである。
さまざまなドメインにまたがる詳細なヒューマンキュレートされたメタクエストで構成されており、それぞれに事前にアノテートされた回答を持つ特定のプロキシクエストが伴っている。
プロキシクエリに対処する際の評価器の精度を通じて、生成されたコンテンツの品質を評価する。
論文 参考訳(メタデータ) (2024-01-26T18:12:25Z) - Robust Recommender System: A Survey and Future Directions [58.87305602959857]
まず,悪質な攻撃や自然騒音に耐える現在の手法を整理するための分類法を提案する。
次に、不正検出、敵の訓練、悪意のある攻撃から守るための確実な堅牢な訓練など、各カテゴリにおける最先端の手法を検討する。
さまざまなレコメンデーションシナリオの堅牢性や,正確性や解釈可能性,プライバシ,公正性といった他の特性との相互作用について論じる。
論文 参考訳(メタデータ) (2023-09-05T08:58:46Z) - Blockchain-empowered Federated Learning for Healthcare Metaverses:
User-centric Incentive Mechanism with Optimal Data Freshness [66.3982155172418]
まず、医療メタバースのための分散型フェデレートラーニング(FL)に基づく、ユーザ中心のプライバシ保護フレームワークを設計する。
次に,情報時代(AoI)を有効データ更新度指標として利用し,観測理論(PT)に基づくAoIベースの契約理論モデルを提案し,センシングデータ共有の動機付けを行う。
論文 参考訳(メタデータ) (2023-07-29T12:54:03Z) - Bring Your Own Data! Self-Supervised Evaluation for Large Language
Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。
閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。
自己監督評価と人監督評価との間には強い相関関係が認められた。
論文 参考訳(メタデータ) (2023-06-23T17:59:09Z) - RobustBench: a standardized adversarial robustness benchmark [84.50044645539305]
ロバストネスのベンチマークにおける主な課題は、その評価がしばしばエラーを起こし、ロバストネス過大評価につながることである。
我々は,白箱攻撃と黒箱攻撃のアンサンブルであるAutoAttackを用いて,敵対的ロバスト性を評価する。
分散シフト,キャリブレーション,アウト・オブ・ディストリビューション検出,フェアネス,プライバシリーク,スムースネス,転送性に対するロバスト性の影響を解析した。
論文 参考訳(メタデータ) (2020-10-19T17:06:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。