Fugu-MT 論文翻訳(概要): Towards a Data-Driven Requirements Engineering Approach: Automatic Analysis of User Reviews

論文の概要: Towards a Data-Driven Requirements Engineering Approach: Automatic Analysis of User Reviews

arxiv url: http://arxiv.org/abs/2206.14669v1
Date: Wed, 29 Jun 2022 14:14:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-30 23:05:45.378885
Title: Towards a Data-Driven Requirements Engineering Approach: Automatic Analysis of User Reviews
Title（参考訳）: データ駆動要求エンジニアリングアプローチに向けて:ユーザレビューの自動分析
Authors: Jialiang Wei, Anne-Lise Courbis, Thomas Lambolais, Binbin Xu, Pierre Louis Bernard, G\'erard Dray
Abstract要約: 我々は,フランス語の最先端言語モデルであるCamemBERTを用いて,自動解析を行う。私たちはHealth & Fitness分野の3つのアプリケーションから6000のユーザレビューのマルチラベル分類データセットを作成しました。結果は推奨され、新機能の要求に関するレビューを自動的に識別することが可能になることを示唆している。
参考スコア（独自算出の注目度）: 0.440401067183266
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We are concerned by Data Driven Requirements Engineering, and in particular the consideration of user's reviews. These online reviews are a rich source of information for extracting new needs and improvement requests. In this work, we provide an automated analysis using CamemBERT, which is a state-of-the-art language model in French. We created a multi-label classification dataset of 6000 user reviews from three applications in the Health & Fitness field. The results are encouraging and suggest that it's possible to identify automatically the reviews concerning requests for new features. Dataset is available at: https://github.com/Jl-wei/APIA2022-French-user-reviews-classification-dataset.
Abstract（参考訳）: 私たちはデータ駆動要件エンジニアリング、特にユーザのレビューの考慮に関心を持っています。これらのオンラインレビューは、新しいニーズや改善要求を抽出するための豊富な情報源です。本研究では,フランス語の最先端言語モデルであるCamemBERTを用いて,自動解析を行う。健康とフィットネス分野の3つのアプリケーションから、6000ユーザレビューのマルチラベル分類データセットを作成しました。結果は推奨され、新機能の要求に関するレビューを自動的に識別することができることを示唆している。 Datasetは、https://github.com/Jl-wei/APIA2022- French-user-reviews-classification-datasetで利用可能である。

関連論文リスト

ProxAnn: Use-Oriented Evaluations of Topic Models and Document Clustering [52.19512723549318]
我々は,実践者の実世界のモデル利用を反映したスケーラブルなヒューマン評価プロトコルを設計する。このプロトコルを用いて、さまざまなトピックモデルから出力された大量のクラウドワーカーアノテーションを収集する。次に、これらのアノテーションを用いて自動プロキシの検証を行い、最適なLCMプロキシが人間のアノテーションと統計的に区別できないことを発見した。
論文参考訳（メタデータ） (2025-07-01T15:00:55Z)
AutoBencher: Creating Salient, Novel, Difficult Datasets for Language Models [84.65095045762524]
3つのデシラタを言語モデルのための優れたベンチマークとして提示する。ベンチマークでは、以前のベンチマークでは示されていなかったモデルランキングの新しいトレンドが明らかになった。 AutoBencherを使って、数学、多言語、知識集約的な質問応答のためのデータセットを作成しています。
論文参考訳（メタデータ） (2024-07-11T10:03:47Z)
Long-Span Question-Answering: Automatic Question Generation and QA-System Ranking via Side-by-Side Evaluation [65.16137964758612]
大規模言語モデルにおける長文文の活用について検討し,本書全体の読解データを作成する。我々の目的は、長いテキストの詳細な理解を必要とする問題を分析し、理解し、推論するLLMの能力をテストすることである。
論文参考訳（メタデータ） (2024-05-31T20:15:10Z)
BESTMVQA: A Benchmark Evaluation System for Medical Visual Question Answering [8.547600133510551]
本稿では,BESTMVQAで表される医用視覚質問応答のベンチマーク評価SysTemを開発する。本システムは,Med-VQAデータセットを自動構築する上で有用なツールを提供する。簡単な構成で、ベンチマークデータセット上で選択したモデルを自動でトレーニングし、評価する。
論文参考訳（メタデータ） (2023-12-13T03:08:48Z)
Zero-shot Bilingual App Reviews Mining with Large Language Models [0.7340017786387767]
Mini-BARは、英語とフランス語の両方でユーザーレビューのゼロショットマイニングを実行するために、大きな言語モデル(LLM)を統合するツールである。 Mini-BARの性能を評価するために、6,000の英語と6000のフランス語の注釈付きユーザレビューを含むデータセットを作成しました。
論文参考訳（メタデータ） (2023-11-06T12:36:46Z)
Instruct and Extract: Instruction Tuning for On-Demand Information Extraction [86.29491354355356]
On-Demand Information extractは、現実世界のユーザのパーソナライズされた要求を満たすことを目的としている。 InstructIEというベンチマークを、自動生成したトレーニングデータと、人手による注釈付きテストセットの両方を含む形で提示する。 InstructIE 上に構築した On-Demand Information Extractor, ODIE をさらに発展させる。
論文参考訳（メタデータ） (2023-10-24T17:54:25Z)
UltraFeedback: Boosting Language Models with Scaled AI Feedback [99.4633351133207]
大規模で高品質で多様なAIフィードバックデータセットである textscUltraFeedback を提示する。我々の研究は、強力なオープンソースのチャット言語モデルを構築する上で、スケールしたAIフィードバックデータの有効性を検証する。
論文参考訳（メタデータ） (2023-10-02T17:40:01Z)
Can GitHub Issues Help in App Review Classifications? [0.7366405857677226]
GitHubイシューから抽出した情報を活用することでラベル付きデータセットの拡張を支援する新しいアプローチを提案する。以上の結果から,データ拡張にラベル付き問題を用いることで,F1スコアが6.3,機能要求が7.2に向上することが示された。
論文参考訳（メタデータ） (2023-08-27T22:01:24Z)
GEMv2: Multilingual NLG Benchmarking in a Single Line of Code [161.1761414080574]
Generation, Evaluation, and Metrics Benchmarkは、データセット、モデル、メトリック開発者のためのモジュラーインフラストラクチャを提供する。 GEMv2は51言語で40のドキュメントデータセットをサポートする。すべてのデータセットのモデルはオンラインで評価でき、インタラクティブなデータカード作成とレンダリングツールによって、生きたベンチマークに新しいデータセットを簡単に追加できます。
論文参考訳（メタデータ） (2022-06-22T17:52:30Z)
Generating Usage-related Questions for Preference Elicitation in Conversational Recommender Systems [19.950705852361565]
項目使用量に基づいて暗黙的な質問を行うことにより、嗜好の誘惑に対する新しいアプローチを提案する。クラウドソーシングを用いた高品質なラベル付きトレーニングデータセットを開発した。本手法は,限られたトレーニングデータであっても,エレキュベーション質問を発生させるのに有効であることを示す。
論文参考訳（メタデータ） (2021-11-26T12:23:14Z)
E-commerce Query-based Generation based on User Review [1.484852576248587]
本稿では,従来のユーザによるレビューに基づいて,ユーザの質問に対する回答を生成するための新しいセク2seqベースのテキスト生成モデルを提案する。ユーザの質問や感情の極性が与えられた場合,関心事の側面を抽出し,過去のユーザレビューを要約した回答を生成する。
論文参考訳（メタデータ） (2020-11-11T04:58:31Z)
Scaling Systematic Literature Reviews with Machine Learning Pipelines [57.82662094602138]
体系的なレビューは、科学的文書からデータを抽出する。これらの側面をそれぞれ自動化するパイプラインを構築し、多くの人間時間対システム品質トレードオフを実験します。人間の専門的アノテーションの2週間だけで、パイプラインシステム全体の驚くほどの精度と一般性が得られることが分かりました。
論文参考訳（メタデータ） (2020-10-09T16:19:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。