論文の概要: Merit-based Fusion of NLP Techniques for Instant Feedback on Water
Quality from Twitter Text
- arxiv url: http://arxiv.org/abs/2202.04462v1
- Date: Wed, 9 Feb 2022 13:47:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-02-10 18:55:06.439271
- Title: Merit-based Fusion of NLP Techniques for Instant Feedback on Water
Quality from Twitter Text
- Title(参考訳): メリットに基づくnlp技術の融合によるtwitterテキストからの水質の即時フィードバック
- Authors: Khubaib Ahmad, Muhammad Asif Ayub, Kashif Ahmad, Jebran Khan, Nasir
Ahmad, Ala Al-Fuqaha
- Abstract要約: 本稿は,フィードバックの即時源としてのソーシャルメディアの可能性を分析することによって,水質を評価できる重要な環境課題に焦点を当てる。
この研究の主な目的は、水質に関連するソーシャルメディアの投稿を自動的に分析し、検索することである。
本稿では,プリプロセッシング,データ拡張,分類手法を取り入れた新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.4565260052193185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper focuses on an important environmental challenge; namely, water
quality by analyzing the potential of social media as an immediate source of
feedback. The main goal of the work is to automatically analyze and retrieve
social media posts relevant to water quality with particular attention to posts
describing different aspects of water quality, such as watercolor, smell,
taste, and related illnesses. To this aim, we propose a novel framework
incorporating different preprocessing, data augmentation, and classification
techniques. In total, three different Neural Networks (NNs) architectures,
namely (i) Bidirectional Encoder Representations from Transformers (BERT), (ii)
Robustly Optimized BERT Pre-training Approach (XLM-RoBERTa), and (iii) custom
Long short-term memory (LSTM) model, are employed in a merit-based fusion
scheme. For merit-based weight assignment to the models, several optimization
and search techniques are compared including a Particle Swarm Optimization
(PSO), a Genetic Algorithm (GA), Brute Force (BF), Nelder-Mead, and Powell's
optimization methods. We also provide an evaluation of the individual models
where the highest F1-score of 0.81 is obtained with the BERT model. In
merit-based fusion, overall better results are obtained with BF achieving an
F1-score score of 0.852.
We also provide comparison against existing methods, where a significant
improvement for our proposed solutions is obtained. We believe such rigorous
analysis of this relatively new topic will provide a baseline for future
research.
- Abstract(参考訳): 本稿は,フィードバックの即時源としてのソーシャルメディアの可能性を分析することによって,水質を評価できる重要な環境課題に焦点を当てる。
この研究の主な目的は、水色、匂い、味、関連する病気など、水質の異なる側面を記述した投稿に特に注意を向けて、水質に関連するソーシャルメディア投稿を自動分析して検索することである。
そこで本研究では,異なる事前処理,データ拡張,分類手法を取り入れた新しいフレームワークを提案する。
合計で3つの異なるニューラルネットワーク(NN)アーキテクチャ、すなわち
(i)トランスフォーマー(bert)からの双方向エンコーダ表現
(II)ロバストに最適化されたBERT事前学習手法(XLM-RoBERTa)および
(iii)カスタム長短期記憶モデル(lstm)は、メリットに基づく融合方式に採用されている。
モデルへのメリットに基づく重み付けについては、粒子群最適化(pso)、遺伝的アルゴリズム(ga)、ブルート力(bf)、ネルダーミード、パウエルの最適化法など、いくつかの最適化と探索手法を比較した。
また, BERTモデルを用いて, 最高F1スコア0.81を得る個別モデルの評価を行った。
メリットベースの融合では、BFがF1スコアスコアの0.852を達成して総合的に良い結果が得られる。
また,提案手法の大幅な改善が得られた既存手法との比較を行った。
このような比較的新しいトピックの厳密な分析は、将来の研究のベースラインになると考えています。
関連論文リスト
- Meta-rater: A Multi-dimensional Data Selection Method for Pre-training Language Models [7.61977883644433]
我々はPRRCを提案し、プロフェッショナル主義、可読性、推論、クリーンラインにまたがるデータ品質を評価する。
学習した最適重み付けにより,これらの次元を既存の品質指標と統合する多次元データ選択手法であるMeta-raterを紹介する。
実験により、Meta-raterは1.3Bパラメータモデルの収束速度を2倍にし、100Bトークンでトレーニングされた3.3Bモデルにおいて、ダウンストリームタスクのパフォーマンスを3.23倍改善することを示した。
論文 参考訳(メタデータ) (2025-04-19T06:12:33Z) - Clear Preferences Leave Traces: Reference Model-Guided Sampling for Preference Learning [59.11519451499754]
直接選好最適化(DPO)は、言語モデルと人間の選好を整合させるデファクトアプローチとして登場した。
最近の研究によると、DPOの有効性はデータ品質のトレーニングに依存している。
基準モデル確率空間は,高品質なトレーニングサンプルを自然に検出する。
論文 参考訳(メタデータ) (2025-01-25T07:21:50Z) - The Dual-use Dilemma in LLMs: Do Empowering Ethical Capacities Make a Degraded Utility? [54.18519360412294]
大きな言語モデル(LLM)は、安全のための有害な要求を拒否することと、ユーティリティのための正当な要求を収容することのバランスをとる必要がある。
本稿では,DPO(Direct Preference Optimization)に基づくアライメントフレームワークを提案する。
我々は,DeepSeek-R1をベンチマークでテストした結果を解析し,この高い評価を得たモデルがもたらす批判的倫理的懸念を明らかにする。
論文 参考訳(メタデータ) (2025-01-20T06:35:01Z) - QGAPHEnsemble : Combining Hybrid QLSTM Network Ensemble via Adaptive Weighting for Short Term Weather Forecasting [0.0]
本研究は,高度な機械学習技術を用いた実践的有効性を強調した。
本モデルでは,気象予測の精度と信頼性が大幅に向上したことを示す。
本稿では,天気予報タスクの性能向上のために,最適化アンサンブル技術の重要性を強調した。
論文 参考訳(メタデータ) (2025-01-18T20:18:48Z) - Margin Matching Preference Optimization: Enhanced Model Alignment with Granular Feedback [64.67540769692074]
人間のフィードバックからの強化学習など、アライメント技術で微調整された大規模言語モデル(LLM)は、これまでで最も有能なAIシステムの開発に役立っている。
マージンマッチング選好最適化(MMPO)と呼ばれる手法を導入し、相対的な品質マージンを最適化し、LLMポリシーと報酬モデルを改善する。
人間とAIの両方のフィードバックデータによる実験によると、MMPOはMT-benchやRewardBenchといった一般的なベンチマークにおいて、ベースラインメソッドよりも一貫してパフォーマンスが向上している。
論文 参考訳(メタデータ) (2024-10-04T04:56:11Z) - Bridging Data Barriers among Participants: Assessing the Potential of Geoenergy through Federated Learning [2.8498944632323755]
本研究では,XGBoostモデルに基づく新しい連邦学習(FL)フレームワークを提案する。
FLモデルは、異なるモデルと比較して精度と一般化能力が優れていることを示す。
本研究は, 協調型・プライバシー保護型FL技術により, 従来と異なる貯水池を評価するための新たな道を開くものである。
論文 参考訳(メタデータ) (2024-04-29T09:12:31Z) - From Learning to Analytics: Improving Model Efficacy with Goal-Directed Client Selection [29.257066178498984]
フェデレートラーニング(FL)は、分散クライアント間でグローバルモデルを学ぶための魅力的なパラダイムである。
クライアントのローカルデータを用いて訓練されたグローバルモデルの効果的な評価を可能にするクローズドループモデル分析フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-30T13:49:59Z) - A Performance Analysis of Basin Hopping Compared to Established
Metaheuristics for Global Optimization [2.209921757303168]
BBOBテスト関数セットと2つの困難な実世界の問題を用いたIOHプロファイラ環境を用いた数値実験を行った。
その結果, 流域ホッピングは, より確立されたメタヒューリスティクスとともに, 大域的な数値最適化問題の候補となる可能性が示唆された。
論文 参考訳(メタデータ) (2024-03-09T11:02:47Z) - Benchmarking PtO and PnO Methods in the Predictive Combinatorial Optimization Regime [59.27851754647913]
予測最適化(英: Predictive optimization)は、エネルギーコストを意識したスケジューリングや広告予算配分など、多くの現実世界のアプリケーションの正確なモデリングである。
我々は,広告のための新しい産業データセットを含む8つの問題に対して,既存のPtO/PnOメソッド11をベンチマークするモジュラーフレームワークを開発した。
本研究は,8ベンチマーク中7ベンチマークにおいて,PnOアプローチがPtOよりも優れていることを示すが,PnOの設計選択に銀の弾丸は見つからない。
論文 参考訳(メタデータ) (2023-11-13T13:19:34Z) - QualEval: Qualitative Evaluation for Model Improvement [82.73561470966658]
モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文 参考訳(メタデータ) (2023-11-06T00:21:44Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Surrogate-based optimization using an artificial neural network for a
parameter identification in a 3D marine ecosystem model [0.0]
海洋生態系モデルの同定は,観測データに対する海洋生態系モデルの評価と検証に重要である。
SBO(Surrogate-based optimization)は、複雑なモデルを最適化する計算効率の良い手法である。
論文 参考訳(メタデータ) (2021-11-30T17:43:32Z) - NLP Techniques for Water Quality Analysis in Social Media Content [4.284841324544116]
本稿では,メディアEval 2021タスク,すなわち「WaterMM:Water Quality in Social Multimedia」へのコントリビューションについて述べる。
この課題は、水彩、匂い、味、関連する病気などの側面に特に焦点をあてて、水質に関連するソーシャルメディアの投稿を分析することを目的としている。
この目的のために、メタデータとともにテキスト情報と視覚情報の両方を含むマルチモーダルデータセットを提供する。
論文 参考訳(メタデータ) (2021-11-30T10:36:35Z) - Reenvisioning Collaborative Filtering vs Matrix Factorization [65.74881520196762]
近年,行列因数分解に基づく協調フィルタリングモデルや,ニューラルネットワーク(ANN)を用いた類似性の学習が注目されている。
推薦エコシステム内でのANNの発表が最近疑問視され、効率性と有効性に関していくつかの比較がなされている。
本研究では,これらの手法が相補的評価次元に与える影響を解析しながら,超精度評価にもたらす可能性を示す。
論文 参考訳(メタデータ) (2021-07-28T16:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。