論文の概要: Revisiting Android App Categorization
- arxiv url: http://arxiv.org/abs/2310.07290v1
- Date: Wed, 11 Oct 2023 08:25:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 03:12:18.673078
- Title: Revisiting Android App Categorization
- Title(参考訳): Androidアプリのカテゴリを再検討
- Authors: Marco Alecci, Jordan Samhi, Tegawend\'e F. Bissyand\'e, Jacques Klein
- Abstract要約: そこで本研究では,既存のAndroidアプリのカテゴリ化アプローチを,新たな基盤構造データセットを用いて包括的に評価する。
本稿では,記述に基づく手法とAPKに基づく手法の両方において,既存の手法の性能を効果的に上回る2つの革新的な手法を提案する。
- 参考スコア(独自算出の注目度): 5.805764439228492
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerous tools rely on automatic categorization of Android apps as part of
their methodology. However, incorrect categorization can lead to inaccurate
outcomes, such as a malware detector wrongly flagging a benign app as
malicious. One such example is the SlideIT Free Keyboard app, which has over
500000 downloads on Google Play. Despite being a "Keyboard" app, it is often
wrongly categorized alongside "Language" apps due to the app's description
focusing heavily on language support, resulting in incorrect analysis outcomes,
including mislabeling it as a potential malware when it is actually a benign
app. Hence, there is a need to improve the categorization of Android apps to
benefit all the tools relying on it. In this paper, we present a comprehensive
evaluation of existing Android app categorization approaches using our new
ground-truth dataset. Our evaluation demonstrates the notable superiority of
approaches that utilize app descriptions over those solely relying on data
extracted from the APK file, while also leaving space for potential improvement
in the former category. Thus, we propose two innovative approaches that
effectively outperform the performance of existing methods in both
description-based and APK-based methodologies. Finally, by employing our novel
description-based approach, we have successfully demonstrated that adopting a
higher-performing categorization method can significantly benefit tools reliant
on app categorization, leading to an improvement in their overall performance.
This highlights the significance of developing advanced and efficient app
categorization methodologies for improved results in software engineering
tasks.
- Abstract(参考訳): 多くのツールは、その方法論の一部として、Androidアプリの自動分類に依存している。
しかし、不正な分類は、マルウェア検知器が悪質なアプリを悪質であると誤って警告するなど、不正確な結果をもたらす可能性がある。
例えば、SlideIT Free Keyboardアプリは、Google Playで50万回以上ダウンロードされている。
キーボード”アプリであるにも関わらず、アプリの説明が言語サポートに重点を置いているため、誤って"言語"アプリと分類されることが多い。
したがって、Androidアプリの分類を改善して、それに依存するすべてのツールに利益をもたらす必要がある。
本稿では,既存のAndroidアプリのカテゴリ化アプローチを,新たな基盤トラスデータセットを用いて包括的に評価する。
本評価は,apkファイルから抽出したデータのみに依存するユーザに対して,アプリ記述を利用するアプローチの顕著な優位性を示すとともに,前カテゴリの改良の余地も残している。
そこで本研究では,記述に基づく手法とAPKに基づく手法の両方において,既存の手法の性能を効果的に上回る2つの革新的な手法を提案する。
最後に,新たな説明ベースのアプローチを採用することで,高性能なカテゴリ化手法を採用することで,アプリカテゴリ化に依存するツールのメリットが著しく向上し,全体のパフォーマンスが向上することを示すことができた。
これは、ソフトウェアエンジニアリングタスクの成果を改善するために、高度で効率的なアプリ分類手法を開発することの重要性を強調します。
関連論文リスト
- Detecting Android Malware by Visualizing App Behaviors from Multiple Complementary Views [28.69137642535078]
我々は,複数の相補的なビューからアプリの動作を可視化することで,Androidマルウェアを検出する新しい手法であるLensDroidを提案し,実装する。
私たちのゴールは、ディープラーニングとソフトウェアビジュアライゼーションを組み合わせたパワーを活用して、本質的にリンクされていない高レベルの機能を自動的にキャプチャし、集約することにあります。
論文 参考訳(メタデータ) (2024-10-08T16:00:27Z) - SelEx: Self-Expertise in Fine-Grained Generalized Category Discovery [55.72840638180451]
Generalized Category Discoveryは、新しいカテゴリーを同時に発見し、既知のカテゴリを正確に分類することを目的としている。
自己超越と対照的な学習に強く依存する伝統的な手法は、細かなカテゴリーを区別する場合にしばしば不足する。
モデルが微妙な違いを認識し、未知のカテゴリを明らかにする能力を高める。
論文 参考訳(メタデータ) (2024-08-26T15:53:50Z) - Fairness Concerns in App Reviews: A Study on AI-based Mobile Apps [9.948068408730654]
本研究は,モバイルアプリレビューにおける公平性の懸念を調査することを目的としている。
我々の研究は、AIベースのモバイルアプリレビューに焦点を当てており、AIベースのアプリの不公平な振る舞いや結果が非AIベースのアプリよりも高い可能性がある。
論文 参考訳(メタデータ) (2024-01-16T03:43:33Z) - Learn to Categorize or Categorize to Learn? Self-Coding for Generalized
Category Discovery [49.1865089933055]
テスト時に未知のカテゴリを発見できる新しい,効率的かつ自己管理手法を提案する。
このアプローチの健全な特徴は、個々のデータインスタンスに最小長のカテゴリコードの割り当てである。
試行錯誤による評価は, 提案手法の有効性を実証するものである。
論文 参考訳(メタデータ) (2023-10-30T17:45:32Z) - Evaluating the Predictive Performance of Positive-Unlabelled
Classifiers: a brief critical review and practical recommendations for
improvement [77.34726150561087]
Positive-Unlabelled (PU) 学習は機械学習の領域として成長している。
本稿では、PU分類器を提案する51の論文において、主要なPU学習評価手法と予測精度の選択について批判的にレビューする。
論文 参考訳(メタデータ) (2022-06-06T08:31:49Z) - Towards a Fair Comparison and Realistic Design and Evaluation Framework
of Android Malware Detectors [63.75363908696257]
一般的な評価フレームワークを用いて,Androidのマルウェア検出に関する10の研究成果を分析した。
データセットの作成やデザイナの設計に考慮しない場合、トレーニングされたMLモデルに大きく影響する5つの要因を特定します。
その結果,MLに基づく検出器は楽観的に評価され,良好な結果が得られた。
論文 参考訳(メタデータ) (2022-05-25T08:28:08Z) - Evaluating categorical encoding methods on a real credit card fraud
detection database [0.0]
対象統計と証拠の重みに基づく、よく知られた分類的符号化法について述べる。
我々は、最先端の勾配向上手法を用いて符号化されたデータベースを訓練し、その性能を評価する。
本研究の貢献は2つある:(1) 大規模データベース上で最先端の「礼儀正しい」分類法を比較し、(2) 実際のクレジットカード不正検出データベースを使用する。
論文 参考訳(メタデータ) (2021-12-22T16:48:46Z) - Evaluating Pre-Trained Models for User Feedback Analysis in Software
Engineering: A Study on Classification of App-Reviews [2.66512000865131]
アプリレビュー分類のための事前学習型ニューラルネットワークモデル(PTM)の精度と時間効率について検討した。
複数の設定でPTMを評価するために,異なる研究をセットアップした。
いずれの場合も、MicroとMacro Precision、Recall、F1スコアが使用されます。
論文 参考訳(メタデータ) (2021-04-12T23:23:45Z) - Revisiting Mahalanobis Distance for Transformer-Based Out-of-Domain
Detection [60.88952532574564]
本稿では,ドメイン外インテント検出手法を徹底的に比較する。
意図分類のための3つの標準データセット上で,複数のコンテキストエンコーダとメソッドを効率良く評価する。
本研究の主目的は,超微調整トランスフォーマーを用いたドメイン内データエンコーダが優れた結果をもたらすことである。
論文 参考訳(メタデータ) (2021-01-11T09:10:58Z) - Emerging App Issue Identification via Online Joint Sentiment-Topic
Tracing [66.57888248681303]
本稿では,MERITという新しい問題検出手法を提案する。
AOBSTモデルに基づいて、1つのアプリバージョンに対するユーザレビューに否定的に反映されたトピックを推測する。
Google PlayやAppleのApp Storeで人気のアプリに対する実験は、MERITの有効性を実証している。
論文 参考訳(メタデータ) (2020-08-23T06:34:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。