論文の概要: More Insight from Being More Focused: Analysis of Clustered Market Apps
- arxiv url: http://arxiv.org/abs/2405.15737v1
- Date: Fri, 24 May 2024 17:34:06 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 13:01:17.386915
- Title: More Insight from Being More Focused: Analysis of Clustered Market Apps
- Title(参考訳): より注目されるための洞察: クラスタ化された市場アプリケーションの分析
- Authors: Maleknaz Nayebi, Homayoon Farrahi, Ada Lee, Henry Cho, Guenther Ruhe,
- Abstract要約: 最近の調査では、主に全アプリのサンプリングが検討されている。
プロプライエタリなソフトウェアやWebベースのサービスと同様に、より均一なサンプルを見ることで、より具体的な結果が期待できる。
本稿では,アプリの同質なサンプルを対象とし,分析から得られる洞察の度合いを高める。
- 参考スコア(独自算出の注目度): 2.66221280030096
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The increasing attraction of mobile apps has inspired researchers to analyze apps from different perspectives. As with any software product, apps have different attributes such as size, content maturity, rating, category, or number of downloads. Current research studies mostly consider sampling across all apps. This often results in comparisons of apps being quite different in nature and category (games compared with weather and calendar apps), also being different in size and complexity. Similar to proprietary software and web-based services, more specific results can be expected from looking at more homogeneous samples as they can be received as a result of applying clustering. In this paper, we target homogeneous samples of apps to increase the degree of insight gained from analytics. As a proof-of-concept, we applied the clustering technique DBSCAN and subsequent correlation analysis between app attributes for a set of 940 open-source mobile apps from F-Droid. We showed that (i) clusters of apps with similar characteristics provided more insight compared to applying the same to the whole data and (ii) defining the similarity of apps based on the similarity of topics as created from the topic modeling technique Latent Dirichlet Allocation does not significantly improve clustering results.
- Abstract(参考訳): モバイルアプリの魅力が増すにつれ、研究者は異なる視点からアプリを分析するようになった。
他のソフトウェア製品と同様に、アプリはサイズ、コンテンツ成熟度、評価、カテゴリ、ダウンロード数など、さまざまな属性を持つ。
最近の調査では、主に全アプリのサンプリングが検討されている。
この結果、アプリの性質やカテゴリー(天気やカレンダーアプリと比較するゲーム)がかなり異なり、サイズや複雑さもかなり異なることがしばしばある。
プロプライエタリなソフトウェアやWebベースのサービスと同様に、クラスタリングを適用する結果として、より均一なサンプルを受信できるため、より具体的な結果が期待できる。
本稿では,アプリの同質なサンプルを対象とし,分析から得られる洞察の度合いを高める。
概念実証として,F-Droidの940個のオープンソースモバイルアプリに対して,クラスタリング手法DBSCANとその後のアプリ属性間の相関解析を適用した。
私たちはそれを示しました
i) 類似した特徴を持つアプリのクラスタは、データ全体に同じを適用することに比べ、より多くの洞察を与えます。
(II)トピックモデリング手法であるLatent Dirichlet Allocationから作成されたトピックの類似性に基づいてアプリの類似性を定義することは、クラスタリングの結果を著しく改善するものではない。
関連論文リスト
- The Impact of Train-Test Leakage on Machine Learning-based Android Malware Detection [6.9053043489744015]
同一またはほぼ同一のアプリ表現を持つ異なるAndroidアプリを特定します。
これは、機械学習モデルのパフォーマンスを膨らませるデータリークの問題につながる。
機械学習ベースのAndroidマルウェア検知器を構築するためのリーク認識方式を提案する。
論文 参考訳(メタデータ) (2024-10-25T08:04:01Z) - Bayesian Joint Additive Factor Models for Multiview Learning [7.254731344123118]
マルチオミクスデータが収集され、臨床結果と相関する精度医学の文脈でモチベーション応用が生じる。
本稿では,共有およびビュー固有のコンポーネントを考慮に入れた,構造化された付加的設計を伴うJAFAR(Joint Additive Factor regression model)を提案する。
免疫,メタボローム,プロテオームデータから得られた時間とラベルの発症の予測は,最先端の競合相手に対するパフォーマンス向上を示す。
論文 参考訳(メタデータ) (2024-06-02T15:35:45Z) - DealMVC: Dual Contrastive Calibration for Multi-view Clustering [78.54355167448614]
マルチビュークラスタリングのための新しいデュアルコントラストキャリブレーションネットワーク(DealMVC)を提案する。
まず、グローバルなクロスビュー特徴を得るための融合機構を設計し、その上で、ビュー特徴類似性グラフと高信頼な擬ラベルグラフを整列させることにより、グローバルなコントラストキャリブレーション損失を提案する。
トレーニング手順の間、対話型クロスビュー機能は、ローカルレベルとグローバルレベルの両方で共同最適化される。
論文 参考訳(メタデータ) (2023-08-17T14:14:28Z) - Automatically Classifying Emotions based on Text: A Comparative
Exploration of Different Datasets [0.0]
関連文献で最近紹介された3つのデータセットに注目した。
従来型および最先端のディープラーニングモデルの性能について、データに異なる特性が存在する場合について検討する。
実験により,RoBERTaのような最先端モデルがすべてのケースで最高の性能を発揮することが示された。
論文 参考訳(メタデータ) (2023-02-28T16:34:55Z) - When to Use What: An In-Depth Comparative Empirical Analysis of OpenIE
Systems for Downstream Applications [0.0]
本稿では、ニューラルネットワークOpenIEモデル、トレーニングセット、ベンチマークに関するアプリケーション中心の実証調査を紹介する。
異なるモデルとデータセットによる異なる仮定は、統計的にパフォーマンスに有意な影響を及ぼすことがわかった。
論文 参考訳(メタデータ) (2022-11-15T15:48:27Z) - OpenMixup: Open Mixup Toolbox and Benchmark for Visual Representation Learning [53.57075147367114]
視覚表現学習のための最初のミックスアップ拡張とベンチマークであるOpenMixupを紹介する。
私たちは、スクラッチから18の代表的なミックスアップベースラインをトレーニングし、11の画像データセットでそれらを厳格に評価します。
また、人気のあるビジョンバックボーン、最適化戦略、分析ツールキットのコレクションを含むモジュラーバックボーンをオープンソースにしています。
論文 参考訳(メタデータ) (2022-09-11T12:46:01Z) - Multi-Domain Joint Training for Person Re-Identification [51.73921349603597]
ReID(Deep Learning-based person Re-IDentification)は、優れたパフォーマンスを達成するために、大量のトレーニングデータを必要とすることが多い。
多様な環境からより多くのトレーニングデータを集めることで、ReIDのパフォーマンスが向上する傾向にある。
本稿では,パラメータを様々な要因に適応させることができる,Domain-Camera-Sample Dynamic Network (DCSD) というアプローチを提案する。
論文 参考訳(メタデータ) (2022-01-06T09:20:59Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - Dataset Bias in Few-shot Image Recognition [57.25445414402398]
まず,基本カテゴリから学習した伝達可能能力の影響について検討する。
第2に、データセット構造と異なる少数ショット学習方法から、異なるデータセットのパフォーマンス差について検討する。
論文 参考訳(メタデータ) (2020-08-18T14:46:23Z) - The OARF Benchmark Suite: Characterization and Implications for
Federated Learning Systems [41.90546696412147]
Open Application Repository for Federated Learning (OARF)は、フェデレートされた機械学習システムのためのベンチマークスイートである。
OARFは、画像、テキスト、構造化データの異なるデータサイロとして、公開データセットを使って、より現実的なアプリケーションシナリオを模倣します。
論文 参考訳(メタデータ) (2020-06-14T10:11:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。