論文の概要: Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming
- arxiv url: http://arxiv.org/abs/2203.01382v1
- Date: Wed, 2 Mar 2022 19:57:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 16:05:37.774122
- Title: Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming
- Title(参考訳): Nemo: インタラクティブなデータプログラミングのためのガイドとコンテキスト化の弱さ
- Authors: Cheng-Yu Hsieh, Jieyu Zhang, Alexander Ratner
- Abstract要約: 私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
- 参考スコア(独自算出の注目度): 77.38174112525168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weak Supervision (WS) techniques allow users to efficiently create large
training datasets by programmatically labeling data with heuristic sources of
supervision. While the success of WS relies heavily on the provided labeling
heuristics, the process of how these heuristics are created in practice has
remained under-explored. In this work, we formalize the development process of
labeling heuristics as an interactive procedure, built around the existing
workflow where users draw ideas from a selected set of development data for
designing the heuristic sources. With the formalism, we study two core problems
of how to strategically select the development data to guide users in
efficiently creating informative heuristics, and how to exploit the information
within the development process to contextualize and better learn from the
resultant heuristics. Building upon two novel methodologies that effectively
tackle the respective problems considered, we present Nemo, an end-to-end
interactive system that improves the overall productivity of WS learning
pipeline by an average 20% (and up to 47% in one task) compared to the
prevailing WS approach.
- Abstract(参考訳): Weak Supervision(WS)技術により、ユーザはヒューリスティックなデータソースをプログラムでラベル付けすることで、大規模なトレーニングデータセットを効率的に作成できる。
WSの成功は提供されたラベル付けヒューリスティックに大きく依存していますが、これらのヒューリスティックが実際にどのように作成されるかのプロセスは、まだ解明されていないままです。
本稿では,ヒューリスティックをインタラクティブな手順としてラベル付けする開発プロセスを定式化し,ユーザが選択した開発データからアイデアを描き,ヒューリスティックなソースを設計する既存のワークフローを中心に構築する。
本稿では,情報ヒューリスティックを効率的に作成するための開発データを戦略的に選択する方法と,開発プロセス内の情報を活用して,結果ヒューリスティックからよりよく学習する方法の2つの問題について検討する。
それぞれの問題に効果的に対処する2つの新しい手法に基づいて、我々は、一般的なWSアプローチと比較して、WS学習パイプライン全体の生産性を平均20%(最大47%まで)改善するエンドツーエンドの対話システムNemoを紹介します。
関連論文リスト
- Data Interpreter: An LLM Agent For Data Science [43.99482533437711]
Data Interpreterは、コードで解決するように設計されたソリューションである。
データサイエンスにおける問題解決を強化するための3つの重要なテクニックを強調している。
MATHデータセットは26%増加し、オープンなタスクは112%改善した。
論文 参考訳(メタデータ) (2024-02-28T19:49:55Z) - Informed Meta-Learning [65.268245109828]
メタラーニングとインシデントMLは、事前知識をMLパイプラインに組み込むための2つのアプローチとして際立っている。
本稿では,タスク間の知識共有の相補性を求める,メタラーニングのための新しいハイブリッドパラダイムを提案する。
観測騒音に対するデータ効率とロバスト性を改善する上で,情報メタラーニングの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-02-25T15:08:37Z) - Reinforcement Learning Based Multi-modal Feature Fusion Network for
Novel Class Discovery [47.28191501836041]
本稿では,人間の認知過程をシミュレートするために強化学習フレームワークを用いる。
また,マルチモーダル情報から特徴を抽出・融合するマルチエージェントフレームワークをデプロイした。
我々は、OS-MN40、OS-MN40-Miss、Cifar10データセットを用いて、3Dドメインと2Dドメインの両方でのアプローチの性能を示す。
論文 参考訳(メタデータ) (2023-08-26T07:55:32Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - STAR: Boosting Low-Resource Information Extraction by Structure-to-Text
Data Generation with Large Language Models [56.27786433792638]
STARは大規模言語モデル(LLM)を利用してデータインスタンスを合成するデータ生成手法である。
我々は、初期データインスタンスを取得するための詳細なステップバイステップ命令を設計する。
実験の結果,STARが生成したデータは,低リソースイベント抽出および関係抽出タスクの性能を著しく向上させることがわかった。
論文 参考訳(メタデータ) (2023-05-24T12:15:19Z) - Learning Context-Aware Service Representation for Service Recommendation
in Workflow Composition [6.17189383632496]
本稿では,ワークフロー開発プロセス全体でのサービス推奨に対して,NLPにインスパイアされた新たなアプローチを提案する。
ワークフロー構成プロセスは、ステップワイドでコンテキスト対応のサービス生成手順として形式化される。
サービス埋め込みは、NLPフィールドからディープラーニングモデルを適用することで学習される。
論文 参考訳(メタデータ) (2022-05-24T04:18:01Z) - SemTUI: a Framework for the Interactive Semantic Enrichment of Tabular
Data [0.0]
SemTUIは、セマンティクスを使うことで、リッチ化プロセスを柔軟、完全、効果的にするためのフレームワークである。
タスク駆動のユーザ評価によって、SemTUIは理解でき、使いやすく、テーブルの充実をほとんど努力も時間もかからずに達成できることが証明された。
論文 参考訳(メタデータ) (2022-03-17T17:14:21Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。