論文の概要: Reinforced Labels: Multi-Agent Deep Reinforcement Learning for
Point-feature Label Placement
- arxiv url: http://arxiv.org/abs/2303.01388v1
- Date: Thu, 2 Mar 2023 16:18:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 13:35:02.053404
- Title: Reinforced Labels: Multi-Agent Deep Reinforcement Learning for
Point-feature Label Placement
- Title(参考訳): 強化ラベル:多元深部強化学習による点特徴ラベル配置
- Authors: Petr Bob\'ak, Ladislav \v{C}mol\'ik, Martin \v{C}ad\'ik
- Abstract要約: 視覚化という別の領域に強化学習(RL)を導入しています。
提案手法は,マルチエージェント深層強化学習(MADRL)を用いてラベル配置戦略を学習する。
提案手法により訓練された戦略は,未学習エージェントのランダムな戦略よりも有意に優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the past few years, Reinforcement Learning combined with Deep Learning
techniques has successfully proven to solve complex problems in various domains
including robotics, self-driving cars, finance, and gaming. In this paper, we
are introducing Reinforcement Learning (RL) to another domain - visualization.
Our novel point-feature label placement method utilizes Multi-Agent Deep
Reinforcement Learning (MADRL) to learn label placement strategy, which is the
first machine-learning-driven labeling method in contrast to existing
hand-crafted algorithms designed by human experts. To facilitate the RL
learning paradigm, we developed an environment where an agent acts as a proxy
for a label, a short textual annotation that augments visualizations like
geographical maps, illustrations, and technical drawings. Our results
demonstrate that the strategy trained by our method significantly outperforms
the random strategy of an untrained agent and also performs superior to the
compared methods designed by human experts in terms of completeness (i.e., the
number of placed labels). The trade-off is increased computation time, making
the proposed method slower than compared methods. Nevertheless, our method is
ideal for situations where the labeling can be computed in advance, and
completeness is essential, such as cartographic maps, technical drawings, and
medical atlases. Additionally, we conducted a user study to assess the
perceived performance. The outcomes revealed that the participants considered
the proposed method to be significantly better than the other examined methods.
This indicates that the improved completeness is not just reflected in the
quantitative metrics but also in the subjective evaluation of the participants.
- Abstract(参考訳): ここ数年、Reinforcement LearningとDeep Learningの技術が組み合わさって、ロボット工学、自動運転車、金融、ゲームなど、さまざまな分野の複雑な問題を解決することに成功した。
本稿では,Reinforcement Learning(RL)を別のドメインに導入する。
提案手法は,人手による既存の手作りアルゴリズムとは対照的な,機械学習によるラベル付け手法であるマルチエージェントディープ強化学習(MADRL)を用いてラベルの配置戦略を学習する。
rl学習パラダイムを容易にするために,エージェントがラベルのプロキシとして振る舞う環境や,地理地図やイラスト,技術図などの可視化を補助する短いテキストアノテーションを開発した。
提案手法により訓練された戦略は,未学習エージェントのランダムな戦略を著しく上回り,完全性(配置ラベル数)において人間専門家が設計した手法よりも優れていることを示す。
トレードオフは計算時間の増加であり、提案手法は比較法よりも遅い。
しかし,本手法は事前にラベル付けを計算できる状況において理想的であり,地図地図,技術図面,医療アトラスなどの完全性は不可欠である。
また,性能評価のためのユーザ調査を行った。
その結果,提案手法は他の検査方法よりも有意に優れていると考えられた。
この結果から,完全性の向上は定量的指標だけでなく,主観的評価にも反映されることが示唆された。
関連論文リスト
- RLIF: Interactive Imitation Learning as Reinforcement Learning [61.14928315004026]
オフ・ポリティクス強化学習は、インタラクティブな模倣学習よりも近いが、潜在的にさらに実践的な仮定の下で、パフォーマンスを向上させることができる。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - MeanAP-Guided Reinforced Active Learning for Object Detection [34.19741444116433]
本稿では,オブジェクト検出のためのMeanAP誘導強化能動学習について紹介する。
LSTMアーキテクチャに基づいて構築されたエージェントは、その後のトレーニングインスタンスを効率的に探索し、選択する。
我々は、一般的なベンチマーク、PASCAL VOC、MS COCOにおけるMAGRALの有効性を評価した。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Unleashing the Potential of Regularization Strategies in Learning with
Noisy Labels [65.92994348757743]
クロスエントロピー損失を用いた単純なベースラインと、広く使われている正規化戦略を組み合わせることで、最先端の手法より優れていることを示す。
この結果から,正規化戦略の組み合わせは,ノイズラベルを用いた学習の課題に対処する上で,複雑なアルゴリズムよりも効果的であることが示唆された。
論文 参考訳(メタデータ) (2023-07-11T05:58:20Z) - New Intent Discovery with Pre-training and Contrastive Learning [21.25371293641141]
新しい意図発見は、ユーザ発話から新しい意図カテゴリーを明らかにして、サポート対象クラスのセットを拡張することを目的としている。
既存のアプローチは通常、大量のラベル付き発話に依存する。
本稿では,クラスタリングのためのラベルなしデータにおける自己超越的信号を活用するために,新たなコントラスト損失を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:07:25Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Semi-supervised Active Learning for Instance Segmentation via Scoring
Predictions [25.408505612498423]
インスタンスセグメンテーションのための新規かつ原則的な半教師付きアクティブ学習フレームワークを提案する。
具体的には,クラス,バウンディングボックス,マスクの手がかりを明示的に評価するトリプレットスコア予測(tsp)という不確実性サンプリング戦略を提案する。
医用画像データセットを用いた結果から,提案手法が有意義な方法で利用可能なデータから知識を具現化することを示す。
論文 参考訳(メタデータ) (2020-12-09T02:36:52Z) - Can Semantic Labels Assist Self-Supervised Visual Representation
Learning? [194.1681088693248]
近隣環境におけるコントラスト調整(SCAN)という新しいアルゴリズムを提案する。
一連のダウンストリームタスクにおいて、SCANは従来の完全教師付きおよび自己教師付きメソッドよりも優れたパフォーマンスを達成する。
本研究は, セマンティックラベルが自己指導的手法の補助に有用であることを明らかにする。
論文 参考訳(メタデータ) (2020-11-17T13:25:00Z) - Improving Classification through Weak Supervision in Context-specific
Conversational Agent Development for Teacher Education [1.215785021723604]
教育シナリオ固有の会話エージェントを開発するのに必要な労力は、時間を要する。
アノテーションをモデリングするための従来のアプローチは、何千もの例をラベル付けし、アノテーション間の合意と多数決を計算することに依存してきた。
本稿では,これらの問題に対処するために,多タスク弱監視手法とアクティブラーニングを組み合わせた手法を提案する。
論文 参考訳(メタデータ) (2020-10-23T23:39:40Z) - Learning to Learn in a Semi-Supervised Fashion [41.38876517851431]
本稿では,ラベル付きデータとラベルなしデータの両方から半教師付き学習を行うメタ学習手法を提案する。
我々の戦略は、完全に教師付き学習タスクに適用可能な自己教師付き学習スキームとみなすことができる。
論文 参考訳(メタデータ) (2020-08-25T17:59:53Z) - Deep Semi-supervised Knowledge Distillation for Overlapping Cervical
Cell Instance Segmentation [54.49894381464853]
本稿では, ラベル付きデータとラベルなしデータの両方を, 知識蒸留による精度向上に活用することを提案する。
摂動に敏感なサンプルマイニングを用いたマスク誘導型平均教師フレームワークを提案する。
実験の結果,ラベル付きデータのみから学習した教師付き手法と比較して,提案手法は性能を著しく向上することがわかった。
論文 参考訳(メタデータ) (2020-07-21T13:27:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。