論文の概要: Understanding the Challenges and Promises of Developing Generative AI Apps: An Empirical Study
- arxiv url: http://arxiv.org/abs/2506.16453v1
- Date: Thu, 19 Jun 2025 16:39:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.170842
- Title: Understanding the Challenges and Promises of Developing Generative AI Apps: An Empirical Study
- Title(参考訳): ジェネレーティブAIアプリ開発における課題と約束を理解する:実証的研究
- Authors: Buthayna AlMulla, Maram Assi, Safwat Hassan,
- Abstract要約: 2022年のChatGPTは、生成人工知能モバイルアプリ(つまり、Gen-AIアプリ)の急激な急増を引き起こした。
Google Play Storeの173のGen-AIアプリから、676,066のレビューをユーザ中心で分析します。
- 参考スコア(独自算出の注目度): 0.1433758865948252
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The release of ChatGPT in 2022 triggered a rapid surge in generative artificial intelligence mobile apps (i.e., Gen-AI apps). Despite widespread adoption, little is known about how end users perceive and evaluate these Gen-AI functionalities in practice. In this work, we conduct a user-centered analysis of 676,066 reviews from 173 Gen-AI apps on the Google Play Store. We introduce a four-phase methodology, SARA (Selection, Acquisition, Refinement, and Analysis), that enables the systematic extraction of user insights using prompt-based LLM techniques. First, we demonstrate the reliability of LLMs in topic extraction, achieving 91% accuracy through five-shot prompting and non-informative review filtering. Then, we apply this method to the informative reviews, identify the top 10 user-discussed topics (e.g., AI Performance, Content Quality, and Content Policy & Censorship) and analyze the key challenges and emerging opportunities. Finally, we examine how these topics evolve over time, offering insight into shifting user expectations and engagement patterns with Gen-AI apps. Based on our findings and observations, we present actionable implications for developers and researchers.
- Abstract(参考訳): 2022年にChatGPTがリリースされたことで、生成人工知能モバイルアプリ(つまりGen-AIアプリ)が急速に急増した。
広く採用されているにもかかわらず、エンドユーザーが実際にこれらのGen-AI機能をどのように認識し評価しているかはほとんど分かっていない。
本研究では,Google Play Store上の173のGen-AIアプリから676,066のレビューをユーザ中心で分析する。
そこで我々は,SARA(Selection, Acquisition, Refinement, Analysis)という4段階の手法を導入し,プロンプトベースのLCM技術を用いてユーザインサイトを体系的に抽出する手法を提案する。
まず、トピック抽出におけるLCMの信頼性を示し、5ショットプロンプトと非形式的レビューフィルタリングにより91%の精度を達成した。
そして、この手法を情報的レビューに適用し、ユーザから注目されるトピックのトップ10(例えば、AIパフォーマンス、コンテンツ品質、コンテンツポリシーと検閲)を特定し、重要な課題と新たな機会を分析します。
最後に、これらのトピックが時間とともにどのように進化するかを検討し、Gen-AIアプリによるユーザの期待とエンゲージメントパターンの変化に関する洞察を提供する。
本研究の成果と観察から,開発者や研究者に有効な意味を提示する。
関連論文リスト
- What Users Value and Critique: Large-Scale Analysis of User Feedback on AI-Powered Mobile Apps [2.352412885878654]
本稿では,AIを活用したモバイルアプリにおけるユーザフィードバックに関する総合的かつ大規模な研究について紹介する。
私たちは、14カテゴリにわたる292のAI駆動アプリのキュレートされたデータセットを活用し、Google Playから894KのAI固有のレビューを取得しています。
私たちのパイプラインは、ひとつの機能による満足度と、同じレビュー内で別の機能に対するフラストレーションの両方を表面化しています。
論文 参考訳(メタデータ) (2025-06-12T14:56:52Z) - The AI Imperative: Scaling High-Quality Peer Review in Machine Learning [49.87236114682497]
AIによるピアレビューは、緊急の研究とインフラの優先事項になるべきだ、と私たちは主張する。
我々は、事実検証の強化、レビュアーのパフォーマンスの指導、品質改善における著者の支援、意思決定におけるAC支援におけるAIの具体的な役割を提案する。
論文 参考訳(メタデータ) (2025-06-09T18:37:14Z) - Analyzing User Perceptions of Large Language Models (LLMs) on Reddit: Sentiment and Topic Modeling of ChatGPT and DeepSeek Discussions [0.0]
本研究の目的は、感情モデルとトピックモデリングを用いて、ChatGPTとDeepSeekに関するRedditの議論を分析することである。
レポートは、ユーザーがこのテクノロジーを信じているかどうか、そして彼らが未来と見なしているものについて言及している。
論文 参考訳(メタデータ) (2025-02-22T17:00:42Z) - How Effectively Do LLMs Extract Feature-Sentiment Pairs from App Reviews? [2.218667838700643]
本研究は,GPT-4,ChatGPT,およびLlama-2チャットの異なる変種を含む最先端LLMの性能を比較した。
肯定的な感情と中立的な感情を予測するため、GPT-4は0ショット設定でf1スコアの76%と45%を達成している。
論文 参考訳(メタデータ) (2024-09-11T10:21:13Z) - Voices from the Frontier: A Comprehensive Analysis of the OpenAI Developer Forum [5.667013605202579]
OpenAIの先進的な大規模言語モデル(LLM)は自然言語処理に革命をもたらし、開発者は革新的なアプリケーションを作成できるようになった。
本稿では,OpenAI Developer Forumを包括的に分析する。
本研究では,(1)人気傾向とユーザエンゲージメントパターン,(2)開発者が直面する課題や関心事の分類に焦点をあてる。
論文 参考訳(メタデータ) (2024-08-03T06:57:43Z) - A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to
GPT-5 All You Need? [112.12974778019304]
生成AI(AIGC、つまりAI生成コンテンツ)は、テキスト、画像、その他を分析、作成する能力により、あらゆる場所で話題を呼んだ。
純粋な分析から創造へと移行するAIの時代において、ChatGPTは最新の言語モデルであるGPT-4とともに、多くのAIGCタスクからなるツールである。
本研究は,テキスト,画像,ビデオ,3Dコンテンツなど,出力タイプに基づいたAIGCタスクの技術的開発に焦点を当てている。
論文 参考訳(メタデータ) (2023-03-21T10:09:47Z) - The Role of AI in Drug Discovery: Challenges, Opportunities, and
Strategies [97.5153823429076]
この分野でのAIのメリット、課題、欠点についてレビューする。
データ拡張、説明可能なAIの使用、従来の実験手法とAIの統合についても論じている。
論文 参考訳(メタデータ) (2022-12-08T23:23:39Z) - Sentiment Analysis of Users' Reviews on COVID-19 Contact Tracing Apps
with a Benchmark Dataset [6.592595861973966]
接触追跡は、新型コロナウイルスの感染率を制御する戦いで世界的に採用されています。
スマートフォンやウェアラブルデバイスなどのデジタル技術のおかげで、COVID-19患者の連絡先を簡単に追跡し、ウイルスへの潜在的な曝露について知らせることができます。
興味深いモバイルアプリケーションもいくつか開発されている。
しかしながら、これらのアプリケーションの動作メカニズムやパフォーマンスに対する懸念はますます高まっている。
本研究では,クラウドソーシングによる手動アノテーションから始めるパイプラインを提案し,ユーザのレビュー自動感情分析のためのaiモデルの開発とトレーニングについて考察する。
論文 参考訳(メタデータ) (2021-03-01T18:43:10Z) - Emerging App Issue Identification via Online Joint Sentiment-Topic
Tracing [66.57888248681303]
本稿では,MERITという新しい問題検出手法を提案する。
AOBSTモデルに基づいて、1つのアプリバージョンに対するユーザレビューに否定的に反映されたトピックを推測する。
Google PlayやAppleのApp Storeで人気のアプリに対する実験は、MERITの有効性を実証している。
論文 参考訳(メタデータ) (2020-08-23T06:34:05Z) - Automating App Review Response Generation [67.58267006314415]
本稿では,レビューと回答の知識関係を学習することで,レビュー応答を自動的に生成する新しいアプローチRRGenを提案する。
58のアプリと309,246のレビュー-レスポンスペアの実験では、RRGenはBLEU-4の点で少なくとも67.4%のベースラインを上回っている。
論文 参考訳(メタデータ) (2020-02-10T05:23:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。