Fugu-MT 論文翻訳(概要): Graph-based Reinforcement Learning for Active Learning in Real Time: An Application in Modeling River Networks

論文の概要: Graph-based Reinforcement Learning for Active Learning in Real Time: An Application in Modeling River Networks

arxiv url: http://arxiv.org/abs/2010.14000v2
Date: Tue, 8 Dec 2020 18:04:58 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-02 11:23:35.632141
Title: Graph-based Reinforcement Learning for Active Learning in Real Time: An Application in Modeling River Networks
Title（参考訳）: リアルタイム能動学習のためのグラフベース強化学習:河川ネットワークのモデリングへの応用
Authors: Xiaowei Jia, Beiyu Lin, Jacob Zwart, Jeffrey Sadler, Alison Appling, Samantha Oliver, Jordan Read
Abstract要約: 本研究では,空間的・時間的文脈情報を用いたリアルタイム能動学習手法を開発し,強化学習フレームワークにおける代表的クエリサンプルの選択を行う。ラベル付きデータ収集の予算が限られているデラウェア川流域において, 流水量と水温を予測し, 提案手法の有効性を実証した。
参考スコア（独自算出の注目度）: 2.8631830115500394
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Effective training of advanced ML models requires large amounts of labeled data, which is often scarce in scientific problems given the substantial human labor and material cost to collect labeled data. This poses a challenge on determining when and where we should deploy measuring instruments (e.g., in-situ sensors) to collect labeled data efficiently. This problem differs from traditional pool-based active learning settings in that the labeling decisions have to be made immediately after we observe the input data that come in a time series. In this paper, we develop a real-time active learning method that uses the spatial and temporal contextual information to select representative query samples in a reinforcement learning framework. To reduce the need for large training data, we further propose to transfer the policy learned from simulation data which is generated by existing physics-based models. We demonstrate the effectiveness of the proposed method by predicting streamflow and water temperature in the Delaware River Basin given a limited budget for collecting labeled data. We further study the spatial and temporal distribution of selected samples to verify the ability of this method in selecting informative samples over space and time.
Abstract（参考訳）: 高度なmlモデルの効果的なトレーニングには大量のラベル付きデータが必要であり、ラベル付きデータの収集に必要な人的労力と材料的コストを考えると、科学的な問題では不足することが多い。これは、ラベル付きデータを効率的に収集するために計測器(例えば、その場センサー)をいつ、どこで配置すべきかを決定する上での課題となる。この問題は、時系列で入力されたデータを観察した後、ラベル付けの決定を直ちに行わなければならないという、従来のプールベースのアクティブラーニング設定とは異なる。本稿では,空間的・時間的文脈情報を用いたリアルタイム能動学習手法を開発し,強化学習フレームワークにおける代表的クエリサンプルの選択を行う。大規模トレーニングデータの必要性を減らすため,既存の物理モデルから生成されたシミュレーションデータから学習したポリシーを転送する。本研究では,ラベルデータ収集予算が限定されたデラウェア川流域の流量と水温を予測し,提案手法の有効性を実証する。さらに,選択したサンプルの空間的および時間的分布について検討し,空間的および時間的情報的サンプルの選択における本手法の有効性を検証する。

関連論文リスト

SiameseDuo++: Active Learning from Data Streams with Dual Augmented Siamese Networks [8.762175520727611]
この研究は、アクティブラーニングを使用して、予算に応じてラベル付けする人間のエキスパートのインスタンスを自動的に選択する、SiameseDuo++メソッドを提案する。具体的には、シナジーで動作し、生成された例によって強化される2つのシアムニューラルネットワークをインクリメンタルにトレーニングする。シミュレーション実験により,提案手法は学習速度および/または性能の点で,強いベースラインと最先端の手法より優れていることが示された。
論文参考訳（メタデータ） (2025-04-06T20:45:25Z)
Capturing the Temporal Dependence of Training Data Influence [100.91355498124527]
我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文参考訳（メタデータ） (2024-12-12T18:28:55Z)
Learning with Less: Knowledge Distillation from Large Language Models via Unlabeled Data [54.934578742209716]
現実世界のNLPアプリケーションでは、Large Language Models (LLMs) は巨大なデータセットの広範なトレーニングのために、有望なソリューションを提供する。 LLKDは、教師と学生の両方の信号を組み込んだ適応的なサンプル選択法である。総合的な実験により,LLKDは高いデータ効率で,様々なデータセットで優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2024-11-12T18:57:59Z)
Downstream-Pretext Domain Knowledge Traceback for Active Learning [138.02530777915362]
本稿では、下流知識と事前学習指導のデータ相互作用をトレースするダウンストリーム・プレテキスト・ドメイン知識トレース(DOKT)手法を提案する。 DOKTは、トレースバックの多様性指標とドメインベースの不確実性推定器から構成される。 10のデータセットで行った実験は、我々のモデルが他の最先端の手法よりも優れていることを示している。
論文参考訳（メタデータ） (2024-07-20T01:34:13Z)
A Survey on Data Selection for Language Models [148.300726396877]
データ選択方法は、トレーニングデータセットに含まれるデータポイントを決定することを目的としている。ディープラーニングは、主に実証的な証拠によって駆動され、大規模なデータに対する実験は高価である。広範なデータ選択研究のリソースを持つ組織はほとんどない。
論文参考訳（メタデータ） (2024-02-26T18:54:35Z)
The Why, When, and How to Use Active Learning in Large-Data-Driven 3D Object Detection for Safe Autonomous Driving: An Empirical Exploration [1.2815904071470705]
エントロピークエリは、リソース制約のある環境でモデル学習を強化するデータを選択するための有望な戦略である。この結果から,エントロピークエリは資源制約のある環境でのモデル学習を促進するデータ選択に有望な戦略であることが示唆された。
論文参考訳（メタデータ） (2024-01-30T00:14:13Z)
Towards Free Data Selection with General-Purpose Models [71.92151210413374]
望ましいデータ選択アルゴリズムは、限られたアノテーション予算の有用性を最大化するために、最も情報性の高いサンプルを効率的に選択することができる。アクティブな学習手法で表現された現在のアプローチは、通常、時間を要するモデルのトレーニングとバッチデータ選択を繰り返し繰り返す、面倒なパイプラインに従う。 FreeSelは重いバッチ選択プロセスをバイパスし、効率を大幅に改善し、既存のアクティブラーニングメソッドよりも530倍高速である。
論文参考訳（メタデータ） (2023-09-29T15:50:14Z)
Exploring Data Redundancy in Real-world Image Classification through Data Selection [20.389636181891515]
ディープラーニングモデルはトレーニングに大量のデータを必要とすることが多く、結果としてコストが増大する。実世界の画像データの冗長性を調べるために,シナプスインテリジェンスと勾配ノルムに基づく2つのデータ評価指標を提案する。オンラインおよびオフラインのデータ選択アルゴリズムは、検査されたデータ値に基づいてクラスタリングとグループ化によって提案される。
論文参考訳（メタデータ） (2023-06-25T03:31:05Z)
Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文参考訳（メタデータ） (2022-12-20T19:29:37Z)
Stream-based active learning with linear models [0.7734726150561089]
生産において、製品情報を取得するためにランダム検査を行う代わりに、ラベルなしデータの情報内容を評価することによりラベルを収集する。本稿では,ストリームベースのシナリオを学習者に順次提供するための新たな戦略を提案する。未ラベルデータポイントの通知性にしきい値を設定することにより、意思決定プロセスの反復的な側面に取り組む。
論文参考訳（メタデータ） (2022-07-20T13:15:23Z)
Transfer learning to improve streamflow forecasts in data sparse regions [0.0]
本研究では,データスパース領域におけるストリームフロー予測の一般化性能向上のために,微調整およびパラメータ転送による伝達学習(TL)の方法論について検討する。本稿では,Long Short-Term Memory(LSTM)という形式で,十分に大きなソースドメインデータセットに適合する標準のリカレントニューラルネットワークを提案する。本稿では,モデルの空間的および時間的成分を分離し,モデルを一般化する訓練を行うことにより,水文学応用のための伝達学習手法を実装する手法を提案する。
論文参考訳（メタデータ） (2021-12-06T14:52:53Z)
Robust Event Classification Using Imperfect Real-world PMU Data [58.26737360525643]
本研究では,不完全な実世界のファサー計測単位(PMU)データを用いて,ロバストな事象分類について検討する。我々は、堅牢なイベント分類器を訓練するための新しい機械学習フレームワークを開発する。
論文参考訳（メタデータ） (2021-10-19T17:41:43Z)
Message Passing Adaptive Resonance Theory for Online Active Semi-supervised Learning [30.19936050747407]
オンラインのアクティブ半教師あり学習のためのメッセージパッシング適応共振理論(MPART)を提案する。 MPARTはラベルのないデータのクラスを推論し、トポロジグラフ上のノード間のメッセージパッシングを通じて情報的および代表的サンプルを選択する。我々は,MPARTがオンラインのアクティブ学習環境において,競合モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2020-12-02T14:14:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。