論文の概要: Merit-based Fusion of NLP Techniques for Instant Feedback on Water
Quality from Twitter Text
- arxiv url: http://arxiv.org/abs/2202.04462v1
- Date: Wed, 9 Feb 2022 13:47:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 18:55:06.439271
- Title: Merit-based Fusion of NLP Techniques for Instant Feedback on Water
Quality from Twitter Text
- Title(参考訳): メリットに基づくnlp技術の融合によるtwitterテキストからの水質の即時フィードバック
- Authors: Khubaib Ahmad, Muhammad Asif Ayub, Kashif Ahmad, Jebran Khan, Nasir
Ahmad, Ala Al-Fuqaha
- Abstract要約: 本稿は,フィードバックの即時源としてのソーシャルメディアの可能性を分析することによって,水質を評価できる重要な環境課題に焦点を当てる。
この研究の主な目的は、水質に関連するソーシャルメディアの投稿を自動的に分析し、検索することである。
本稿では,プリプロセッシング,データ拡張,分類手法を取り入れた新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.4565260052193185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on an important environmental challenge; namely, water
quality by analyzing the potential of social media as an immediate source of
feedback. The main goal of the work is to automatically analyze and retrieve
social media posts relevant to water quality with particular attention to posts
describing different aspects of water quality, such as watercolor, smell,
taste, and related illnesses. To this aim, we propose a novel framework
incorporating different preprocessing, data augmentation, and classification
techniques. In total, three different Neural Networks (NNs) architectures,
namely (i) Bidirectional Encoder Representations from Transformers (BERT), (ii)
Robustly Optimized BERT Pre-training Approach (XLM-RoBERTa), and (iii) custom
Long short-term memory (LSTM) model, are employed in a merit-based fusion
scheme. For merit-based weight assignment to the models, several optimization
and search techniques are compared including a Particle Swarm Optimization
(PSO), a Genetic Algorithm (GA), Brute Force (BF), Nelder-Mead, and Powell's
optimization methods. We also provide an evaluation of the individual models
where the highest F1-score of 0.81 is obtained with the BERT model. In
merit-based fusion, overall better results are obtained with BF achieving an
F1-score score of 0.852.
We also provide comparison against existing methods, where a significant
improvement for our proposed solutions is obtained. We believe such rigorous
analysis of this relatively new topic will provide a baseline for future
research.
- Abstract(参考訳): 本稿は,フィードバックの即時源としてのソーシャルメディアの可能性を分析することによって,水質を評価できる重要な環境課題に焦点を当てる。
この研究の主な目的は、水色、匂い、味、関連する病気など、水質の異なる側面を記述した投稿に特に注意を向けて、水質に関連するソーシャルメディア投稿を自動分析して検索することである。
そこで本研究では,異なる事前処理,データ拡張,分類手法を取り入れた新しいフレームワークを提案する。
合計で3つの異なるニューラルネットワーク(NN)アーキテクチャ、すなわち
(i)トランスフォーマー(bert)からの双方向エンコーダ表現
(II)ロバストに最適化されたBERT事前学習手法(XLM-RoBERTa)および
(iii)カスタム長短期記憶モデル(lstm)は、メリットに基づく融合方式に採用されている。
モデルへのメリットに基づく重み付けについては、粒子群最適化(pso)、遺伝的アルゴリズム(ga)、ブルート力(bf)、ネルダーミード、パウエルの最適化法など、いくつかの最適化と探索手法を比較した。
また, BERTモデルを用いて, 最高F1スコア0.81を得る個別モデルの評価を行った。
メリットベースの融合では、BFがF1スコアスコアの0.852を達成して総合的に良い結果が得られる。
また,提案手法の大幅な改善が得られた既存手法との比較を行った。
このような比較的新しいトピックの厳密な分析は、将来の研究のベースラインになると考えています。
関連論文リスト
- Benchmarking Post-Training Quantization in LLMs: Comprehensive Taxonomy, Unified Evaluation, and Comparative Analysis [89.60263788590893]
後学習量子化(PTQ)技術は大規模言語モデル(LLM)圧縮に広く採用されている。
既存のアルゴリズムは主にパフォーマンスに重点を置いており、モデルサイズ、パフォーマンス、量子化ビット幅間のトレードオフを見越している。
論文 参考訳(メタデータ) (2025-02-18T07:35:35Z) - UniCBE: An Uniformity-driven Comparing Based Evaluation Framework with Unified Multi-Objective Optimization [19.673388630963807]
統一統一性駆動型CBEフレームワークUniCBEを提案する。
AlpacaEvalベンチマークでは、UniCBEは評価予算の17%以上を削減し、Pearsonと地上の真実との相関は0.995を超えている。
新しいモデルが継続的に導入されるシナリオでは、UniCBEは評価コストの50%以上を節約できる。
論文 参考訳(メタデータ) (2025-02-17T05:28:12Z) - Clear Preferences Leave Traces: Reference Model-Guided Sampling for Preference Learning [59.11519451499754]
直接選好最適化(DPO)は、言語モデルと人間の選好を整合させるデファクトアプローチとして登場した。
最近の研究によると、DPOの有効性はデータ品質のトレーニングに依存している。
基準モデル確率空間は,高品質なトレーニングサンプルを自然に検出する。
論文 参考訳(メタデータ) (2025-01-25T07:21:50Z) - QGAPHEnsemble : Combining Hybrid QLSTM Network Ensemble via Adaptive Weighting for Short Term Weather Forecasting [0.0]
本研究は,高度な機械学習技術を用いた実践的有効性を強調した。
本モデルでは,気象予測の精度と信頼性が大幅に向上したことを示す。
本稿では,天気予報タスクの性能向上のために,最適化アンサンブル技術の重要性を強調した。
論文 参考訳(メタデータ) (2025-01-18T20:18:48Z) - Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback [64.67540769692074]
人間のフィードバックからの強化学習など、アライメント技術で微調整された大規模言語モデル(LLM)は、これまでで最も有能なAIシステムの開発に役立っている。
マージンマッチング選好最適化(MMPO)と呼ばれる手法を導入し、相対的な品質マージンを最適化し、LLMポリシーと報酬モデルを改善する。
人間とAIの両方のフィードバックデータによる実験によると、MMPOはMT-benchやRewardBenchといった一般的なベンチマークにおいて、ベースラインメソッドよりも一貫してパフォーマンスが向上している。
論文 参考訳(メタデータ) (2024-10-04T04:56:11Z) - Bridging Data Barriers among Participants: Assessing the Potential of Geoenergy through Federated Learning [2.8498944632323755]
本研究では,XGBoostモデルに基づく新しい連邦学習(FL)フレームワークを提案する。
FLモデルは、異なるモデルと比較して精度と一般化能力が優れていることを示す。
本研究は, 協調型・プライバシー保護型FL技術により, 従来と異なる貯水池を評価するための新たな道を開くものである。
論文 参考訳(メタデータ) (2024-04-29T09:12:31Z) - From Learning to Analytics: Improving Model Efficacy with Goal-Directed Client Selection [29.257066178498984]
フェデレートラーニング(FL)は、分散クライアント間でグローバルモデルを学ぶための魅力的なパラダイムである。
クライアントのローカルデータを用いて訓練されたグローバルモデルの効果的な評価を可能にするクローズドループモデル分析フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-30T13:49:59Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - NLP Techniques for Water Quality Analysis in Social Media Content [4.284841324544116]
本稿では,メディアEval 2021タスク,すなわち「WaterMM:Water Quality in Social Multimedia」へのコントリビューションについて述べる。
この課題は、水彩、匂い、味、関連する病気などの側面に特に焦点をあてて、水質に関連するソーシャルメディアの投稿を分析することを目的としている。
この目的のために、メタデータとともにテキスト情報と視覚情報の両方を含むマルチモーダルデータセットを提供する。
論文 参考訳(メタデータ) (2021-11-30T10:36:35Z) - Reenvisioning Collaborative Filtering vs Matrix Factorization [65.74881520196762]
近年,行列因数分解に基づく協調フィルタリングモデルや,ニューラルネットワーク(ANN)を用いた類似性の学習が注目されている。
推薦エコシステム内でのANNの発表が最近疑問視され、効率性と有効性に関していくつかの比較がなされている。
本研究では,これらの手法が相補的評価次元に与える影響を解析しながら,超精度評価にもたらす可能性を示す。
論文 参考訳(メタデータ) (2021-07-28T16:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。