論文の概要: Automatic Synthesis of Diverse Weak Supervision Sources for Behavior
Analysis
- arxiv url: http://arxiv.org/abs/2111.15186v1
- Date: Tue, 30 Nov 2021 07:51:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 13:52:05.499959
- Title: Automatic Synthesis of Diverse Weak Supervision Sources for Behavior
Analysis
- Title(参考訳): 挙動解析のための横弱重畳震源の自動合成
- Authors: Albert Tseng, Jennifer J. Sun, Yisong Yue
- Abstract要約: AutoSWAPはデータ効率の高いタスクレベルのラベリング機能を自動的に合成するフレームワークである。
本稿では,AutoSWAPがラベル付け機能を自動生成する有効な方法であり,行動分析の専門的労力を大幅に削減できることを示す。
- 参考スコア(独自算出の注目度): 37.077883083886114
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Obtaining annotations for large training sets is expensive, especially in
behavior analysis settings where domain knowledge is required for accurate
annotations. Weak supervision has been studied to reduce annotation costs by
using weak labels from task-level labeling functions to augment ground truth
labels. However, domain experts are still needed to hand-craft labeling
functions for every studied task. To reduce expert effort, we present AutoSWAP:
a framework for automatically synthesizing data-efficient task-level labeling
functions. The key to our approach is to efficiently represent expert knowledge
in a reusable domain specific language and domain-level labeling functions,
with which we use state-of-the-art program synthesis techniques and a small
labeled dataset to generate labeling functions. Additionally, we propose a
novel structural diversity cost that allows for direct synthesis of diverse
sets of labeling functions with minimal overhead, further improving labeling
function data efficiency. We evaluate AutoSWAP in three behavior analysis
domains and demonstrate that AutoSWAP outperforms existing approaches using
only a fraction of the data. Our results suggest that AutoSWAP is an effective
way to automatically generate labeling functions that can significantly reduce
expert effort for behavior analysis.
- Abstract(参考訳): 大規模なトレーニングセットのためのアノテーションの取得は、特に正確なアノテーションにドメイン知識が必要となる行動分析設定において、高価である。
弱ラベルをタスクレベルのラベル付け機能から基礎的真理ラベルを拡大することにより,アノテーションコストの低減を図る。
しかし、ドメインの専門家は研究課題ごとにラベリング機能を手作りする必要がある。
データ効率のよいタスクレベルのラベリング機能を自動的に合成するフレームワークであるAutoSWAPを提案する。
提案手法の鍵となるのは、再利用可能なドメイン固有言語とドメインレベルのラベリング関数で専門家の知識を効率よく表現することであり、これにより、最先端のプログラム合成技術と小さなラベル付きデータセットを用いてラベル付け関数を生成する。
さらに,最小限のオーバーヘッドで多種多様なラベル関数を直接合成できる構造的多様性コストを提案し,さらにラベル関数データ効率を向上する。
我々はAutoSWAPを3つの行動分析領域で評価し、AutoSWAPが既存の手法より優れていることを示す。
以上の結果から,AutoSWAPはラベル付け機能を自動生成する手段として有効であることが示唆された。
関連論文リスト
- FIND: A Function Description Benchmark for Evaluating Interpretability
Methods [86.80718559904854]
本稿では,自動解釈可能性評価のためのベンチマークスイートであるFIND(Function Interpretation and Description)を紹介する。
FINDには、トレーニングされたニューラルネットワークのコンポーネントに似た機能と、私たちが生成しようとしている種類の記述が含まれています。
本研究では、事前訓練された言語モデルを用いて、自然言語とコードにおける関数の振る舞いの記述を生成する手法を評価する。
論文 参考訳(メタデータ) (2023-09-07T17:47:26Z) - Towards Zero-Shot Frame Semantic Parsing with Task Agnostic Ontologies
and Simple Labels [0.9236074230806577]
OpenFSPは単純なラベルから新しいドメインを簡単に作成するためのフレームワークである。
我々のアプローチは、小さな、しかし表現力のある、ドメインに依存しないスロットタイプを作成することに依存します。
私たちのモデルは、この単純なラベル設定で強いベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-05T18:47:18Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - AutoWS: Automated Weak Supervision Framework for Text Classification [1.748907524043535]
本稿では、ドメインエキスパートへの依存を減らしつつ、弱い監督プロセスの効率を高めるための新しい枠組みを提案する。
本手法では,ラベルクラス毎にラベル付きサンプルの小さなセットが必要であり,多数のラベル付きデータにノイズ付きラベルを割り当てるラベル付き関数のセットを自動生成する。
論文 参考訳(メタデータ) (2023-02-07T07:12:05Z) - SepLL: Separating Latent Class Labels from Weak Supervision Noise [4.730767228515796]
弱い教師付き学習では、ラベル付け機能は自動的にデータサンプルにラベルを割り当て、しばしばうるさい。
本研究では,2種類の補完情報を分離し,弱いラベルから学習する手法を提案する。
我々のモデルは最先端技術と競合し、新しい最高の平均性能をもたらす。
論文 参考訳(メタデータ) (2022-10-25T10:33:45Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - TagRuler: Interactive Tool for Span-Level Data Programming by
Demonstration [1.4050836886292872]
データプログラミングは、プログラミングの方法を知っているユーザーにのみアクセス可能だった。
我々はTagRulerという新しいツールを構築し、アノテータがプログラミングなしでスパンレベルのラベリング関数を簡単に構築できるようにする。
論文 参考訳(メタデータ) (2021-06-24T04:49:42Z) - Adaptive Self-training for Few-shot Neural Sequence Labeling [55.43109437200101]
ニューラルシークエンスラベリングモデルにおけるラベル不足問題に対処する手法を開発した。
自己学習は、大量のラベルのないデータから学ぶための効果的なメカニズムとして機能する。
メタラーニングは、適応的なサンプル再重み付けにおいて、ノイズのある擬似ラベルからのエラー伝播を軽減するのに役立つ。
論文 参考訳(メタデータ) (2020-10-07T22:29:05Z) - Data Programming by Demonstration: A Framework for Interactively
Learning Labeling Functions [2.338938629983582]
本稿では,ユーザによるインタラクティブなデモンストレーションによるラベル付けルールを生成するために,DPBD(Data Programming by Demo)という新しいフレームワークを提案する。
DPBDは、ユーザからのラベリング関数記述の負担を軽減し、より高いレベルのセマンティクスに集中できるようにすることを目的としている。
文書分類のためのラベル付けルールを,文書例におけるユーザのスパンレベルアノテーションを用いて合成する対話型システムであるReducerを用いて,我々のフレームワークを運用する。
論文 参考訳(メタデータ) (2020-09-03T04:25:08Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。