論文の概要: Lowering the Barrier of Machine Learning: Achieving Zero Manual Labeling in Review Classification Using LLMs
- arxiv url: http://arxiv.org/abs/2502.02893v1
- Date: Wed, 05 Feb 2025 05:31:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-06 14:27:43.599906
- Title: Lowering the Barrier of Machine Learning: Achieving Zero Manual Labeling in Review Classification Using LLMs
- Title(参考訳): 機械学習の障壁を下げる: LLMを用いたレビュー分類におけるゼロマニュアルラベリングの実現
- Authors: Yejian Zhang, Shingo Takada,
- Abstract要約: 本稿では,大規模言語モデル(LLM),特にGPT(Generative Pre-trained Transformer)とBERT(Bidirectional Representations from Transformers)を統合したアプローチを提案する。
提案手法は,手動ラベリングやチューニングやデータアノテーションの専門知識,あるいは相当量の計算能力を必要とせず,高い分類精度を維持している。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: With the internet's evolution, consumers increasingly rely on online reviews for service or product choices, necessitating that businesses analyze extensive customer feedback to enhance their offerings. While machine learning-based sentiment classification shows promise in this realm, its technical complexity often bars small businesses and individuals from leveraging such advancements, which may end up making the competitive gap between small and large businesses even bigger in terms of improving customer satisfaction. This paper introduces an approach that integrates large language models (LLMs), specifically Generative Pre-trained Transformer (GPT) and Bidirectional Encoder Representations from Transformers (BERT)-based models, making it accessible to a wider audience. Our experiments across various datasets confirm that our approach retains high classification accuracy without the need for manual labeling, expert knowledge in tuning and data annotation, or substantial computational power. By significantly lowering the barriers to applying sentiment classification techniques, our methodology enhances competitiveness and paves the way for making machine learning technology accessible to a broader audience.
- Abstract(参考訳): インターネットの進化に伴い、消費者はサービスや製品の選択に対するオンラインレビューにますます依存するようになり、企業はサービスを強化するために広範な顧客のフィードバックを分析する必要がある。
機械学習に基づく感情分類は、この領域において有望であることを示しているが、その技術的な複雑さは、小さな企業や個人がそのような進歩を活用することを妨げていることが多い。
本稿では、大規模言語モデル(LLM)、特にGPT(Generative Pre-trained Transformer)とBERT(Bidirectional Encoder Representations from Transformers)ベースのモデルを統合するアプローチを紹介し、より広範な聴衆に利用できるようにする。
各種データセットを対象とした実験により,手動ラベリングやチューニングやデータアノテーションの知識,あるいは計算能力の大幅な向上を必要とせず,高い分類精度を維持していることを確認した。
感情分類技術の適用障壁を著しく低くすることで、我々の手法は競争力を高め、機械学習技術がより広い層で利用できるようにする方法を舗装する。
関連論文リスト
- A Deep Learning Approach for Imbalanced Tabular Data in Advertiser Prospecting: A Case of Direct Mail Prospecting [0.6990493129893112]
本稿では,新たな顧客を特定するための教師付き学習手法を提案する。
このフレームワークは、膨大な数の数値的および分類的特徴を持つ大きな不均衡データセットに取り組むように設計されている。
我々のフレームワークは、オートエンコーダとフィードフォワードニューラルネットワークの2つのコンポーネントで構成されている。
論文 参考訳(メタデータ) (2024-10-02T01:19:40Z) - LLM-based Weak Supervision Framework for Query Intent Classification in Video Search [6.519428288229856]
本稿では,大規模言語モデル(LLM)を弱監督によって活用し,大量のユーザ検索クエリを自動的にアノテートする手法を提案する。
思考の連鎖(Chain of Thought)と文脈学習(In-Context Learning)を通じてドメイン知識を組み込むことによって、我々のアプローチはラベル付きデータを活用し、リアルタイム推論に最適化された低レイテンシモデルを訓練する。
論文 参考訳(メタデータ) (2024-09-13T15:47:50Z) - Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。
本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。
当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文 参考訳(メタデータ) (2024-08-07T16:35:10Z) - LEARN: Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
Llm-driven knowlEdge Adaptive RecommeNdation (LEARN)フレームワークは、オープンワールドの知識と協調的な知識をシナジする。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - Efficient Prompt Tuning of Large Vision-Language Model for Fine-Grained Ship Classification [59.99976102069976]
リモートセンシング(RS-FGSC)における船のきめ細かい分類は、クラス間の高い類似性とラベル付きデータの限られた可用性のために大きな課題となる。
大規模な訓練済みビジョンランゲージモデル(VLM)の最近の進歩は、少数ショット学習やゼロショット学習において印象的な能力を示している。
本研究は, 船種別分類精度を高めるために, VLMの可能性を生かしたものである。
論文 参考訳(メタデータ) (2024-03-13T05:48:58Z) - CLASSify: A Web-Based Tool for Machine Learning [0.0]
本稿では、機械学習の分類問題の自動化ツールについて、学習モデルのプロセスを簡単にし、結果を生成するとともに、データに対する情報的可視化と洞察を提供する。
CLASSifyは、機械学習の知識を必要とせずに分類問題を解決するオープンソースのツールである。
論文 参考訳(メタデータ) (2023-10-05T15:51:36Z) - Client-side Gradient Inversion Against Federated Learning from Poisoning [59.74484221875662]
フェデレートラーニング(FL)により、分散参加者は、データを中央サーバに直接共有することなく、グローバルモデルをトレーニングできる。
近年の研究では、FLは元のトレーニングサンプルの再構築を目的とした勾配反転攻撃(GIA)に弱いことが判明している。
本稿では,クライアント側から起動可能な新たな攻撃手法であるクライアント側中毒性グレーディエント・インバージョン(CGI)を提案する。
論文 参考訳(メタデータ) (2023-09-14T03:48:27Z) - Optimizing Multi-Class Text Classification: A Diverse Stacking Ensemble
Framework Utilizing Transformers [0.0]
本研究では,トランスモデルを利用したマルチテキスト分類手法を提案する。
BERT、ELECTRA、DistilBERTを含む複数の単一トランスを組み合わせることにより、最適な予測モデルを生成する。
実世界の顧客レビューデータセットを用いて実験評価を行い,提案手法の有効性と優位性を示した。
論文 参考訳(メタデータ) (2023-08-19T13:29:15Z) - Personalizing Federated Learning with Over-the-Air Computations [84.8089761800994]
フェデレートされたエッジ学習は、プライバシー保護の方法で無線ネットワークのエッジにインテリジェンスをデプロイする、有望な技術である。
このような設定の下で、複数のクライアントは、エッジサーバの調整の下でグローバルジェネリックモデルを協調的にトレーニングする。
本稿では,アナログオーバー・ザ・エア計算を用いて通信ボトルネックに対処する分散トレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-24T08:41:19Z) - Opinion Spam Detection: A New Approach Using Machine Learning and
Network-Based Algorithms [2.062593640149623]
オンラインレビューは、消費者が製品やサービスを評価し比較する上で重要な役割を果たす。
偽レビュー(オピニオンスパム)が普及し、顧客やサービスプロバイダに悪影響を及ぼしている。
本稿では,機械学習とメッセージパッシングアルゴリズムを組み合わせて,レビュアーをスパマーや良心として分類する手法を提案する。
論文 参考訳(メタデータ) (2022-05-26T15:27:46Z) - Deep invariant networks with differentiable augmentation layers [87.22033101185201]
データ拡張ポリシーの学習方法は、保持データを必要とし、二段階最適化の問題に基づいている。
我々のアプローチは、現代の自動データ拡張技術よりも訓練が簡単で高速であることを示す。
論文 参考訳(メタデータ) (2022-02-04T14:12:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。