Fugu-MT 論文翻訳(概要): Dependency Structure Misspecification in Multi-Source Weak Supervision Models

論文の概要: Dependency Structure Misspecification in Multi-Source Weak Supervision Models

arxiv url: http://arxiv.org/abs/2106.10302v1
Date: Fri, 18 Jun 2021 18:15:44 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-25 08:31:02.694433
Title: Dependency Structure Misspecification in Multi-Source Weak Supervision Models
Title（参考訳）: 多元弱監督モデルにおける依存構造誤特定
Authors: Salva R\"uhling Cachay, Benedikt Boecking, Artur Dubrawski
Abstract要約: 下流分類器のテストセット性能に及ぼすラベルモデルの誤特定の影響について検討した。我々はモデリング誤差に関する新しい理論的境界を導出し、この誤差が実質的であることを実証的に示す。
参考スコア（独自算出の注目度）: 15.125993628007972
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data programming (DP) has proven to be an attractive alternative to costly hand-labeling of data. In DP, users encode domain knowledge into \emph{labeling functions} (LF), heuristics that label a subset of the data noisily and may have complex dependencies. A label model is then fit to the LFs to produce an estimate of the unknown class label. The effects of label model misspecification on test set performance of a downstream classifier are understudied. This presents a serious awareness gap to practitioners, in particular since the dependency structure among LFs is frequently ignored in field applications of DP. We analyse modeling errors due to structure over-specification. We derive novel theoretical bounds on the modeling error and empirically show that this error can be substantial, even when modeling a seemingly sensible structure.
Abstract（参考訳）: データプログラミング(DP)は、高価な手書きデータに代わる魅力的な選択肢であることが証明されている。 dp では、ユーザはドメイン知識を \emph{labeling functions} (lf) にエンコードし、データのサブセットを能動的にラベル付けし、複雑な依存関係を持つヒューリスティックスを作成する。その後、ラベルモデルはLFに適合し、未知のクラスラベルの見積もりを生成する。下流分類器のテストセット性能に対するラベルモデルの不特定の影響について検討する。これは、特に dp のフィールドアプリケーションでは lf 間の依存性構造が頻繁に無視されるため、実践者に深刻な認識のギャップをもたらす。構造過特化によるモデリングエラーを解析する。我々は、モデリングエラーに関する新しい理論的境界を導出し、この誤差が、一見意味のある構造をモデル化しても、実質的であることを実証的に示す。

関連論文リスト

Sharpness-aware Dynamic Anchor Selection for Generalized Category Discovery [61.694524826522205]
既知のクラスのラベル付きデータを考えると、GCDは既知のクラスと未知のクラスの両方を含むラベルなしデータをクラスタ化することを目的としている。大規模な事前学習モデルでは、特定の視覚的パターンが好まれ、ラベルのないデータに対して刺激的な相関を符号化する。 LSP(Los Sharpness Penalty)とDAS(Dynamic Anchor Selection)の2つのモジュールを含む新しい手法を提案する。
論文参考訳（メタデータ） (2025-12-15T02:24:06Z)
Semi-Supervised Learning under General Causal Models [51.90307793476367]
半教師付き学習(SSL)は、ラベル付きデータと非ラベル付きデータの両方を使用して機械学習モデルをトレーニングすることを目的としている。本稿では、変数が柔軟な因果関係を持つ一般的な因果関係モデルで動作するフレームワークを提案する。学習した因果生成モデルは、より正確な予測モデルをトレーニングするための合成ラベル付きデータを生成することができる。
論文参考訳（メタデータ） (2025-10-26T07:46:38Z)
You only need 4 extra tokens: Synergistic Test-time Adaptation for LLMs [50.54173262572369]
大規模言語モデル (LLM) は、金融、医療、農業などの専門分野にますます導入されている。本稿では,言語モデルに対するラベルフリーテスト時適応について検討し,追加の監督なしにモデルをオンザフライで適応する推論時フレームワークであるSyTTAについて述べる。
論文参考訳（メタデータ） (2025-10-11T14:00:39Z)
Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文参考訳（メタデータ） (2025-10-02T06:25:10Z)
CoPS: Conditional Prompt Synthesis for Zero-Shot Anomaly Detection [6.1568149026052374]
Conditional Prompt Synthesis (CoPS)は、視覚的特徴に条件付き動的プロンプトを合成し、ZSAD性能を向上させる新しいフレームワークである。 CoPSは、13の産業および医療データセットの分類とセグメンテーションの両方において、最先端の手法を2.5%AUROCで上回っている。
論文参考訳（メタデータ） (2025-08-05T13:47:45Z)
Constraint-aware Learning of Probabilistic Sequential Models for Multi-Label Classification [0.5624791703748108]
出力ラベルが論理的制約を満たすことが知られているようなラベルの集合を含む多ラベル分類について検討する。本稿では,各ラベルの分類器を表現的逐次モデルに変換し,共同分布を生成するアーキテクチャについて考察する。
論文参考訳（メタデータ） (2025-07-20T23:31:36Z)
Unsupervised Model Diagnosis [49.36194740479798]
本稿では,ユーザガイドを使わずに,意味論的対実的説明を生成するために,Unsupervised Model Diagnosis (UMO)を提案する。提案手法は意味論における変化を特定し可視化し,その変化を広範囲なテキストソースの属性と照合する。
論文参考訳（メタデータ） (2024-10-08T17:59:03Z)
Fusing Conditional Submodular GAN and Programmatic Weak Supervision [5.300742881753571]
PWS(Programmatic Weak Supervision)と生成モデルは、データ収集や手動のアノテーションプロセスに頼ることなく、既存のデータセットの有用性を最大化する重要なツールとして機能する。 PWSは、データの基礎となるクラスラベルを推定するために様々な弱い監視技術を使用し、生成モデルは、主に与えられたデータセットの基盤分布からのサンプリングに集中する。最近、WSGANは2つのモデルを融合させるメカニズムを提案した。
論文参考訳（メタデータ） (2023-12-16T07:49:13Z)
Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文参考訳（メタデータ） (2023-05-28T06:30:29Z)
ChiroDiff: Modelling chirographic data with Diffusion Models [132.5223191478268]
チャーログラフィーデータのための強力なモデルクラスである「拡散確率モデル(Denoising Diffusion Probabilistic Models)」やDDPMを導入している。我々のモデルは「ChiroDiff」と呼ばれ、非自己回帰的であり、全体論的概念を捉えることを学び、したがって高い時間的サンプリングレートに回復する。
論文参考訳（メタデータ） (2023-04-07T15:17:48Z)
Representation Disentaglement via Regularization by Causal Identification [3.9160947065896803]
本稿では,不整合表現学習における基礎となるデータ生成過程の仮定を記述するために,因果コライダー構造モデルを提案する。そこで本研究では,大規模生成モデルの挙動を因果同定によって課される絡み合った制約に整合させるモジュール型正規化エンジンReIを提案する。
論文参考訳（メタデータ） (2023-02-28T23:18:54Z)
Leveraging Instance Features for Label Aggregation in Programmatic Weak Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。 PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文参考訳（メタデータ） (2022-10-06T07:28:53Z)
Latent-Insensitive Autoencoders for Anomaly Detection and Class-Incremental Learning [0.0]
我々は、類似ドメインからのラベルなしデータを負の例として用いて、正規のオートエンコーダの潜伏層(ブートネック)を形成するLatent-Insensitive Autoencoder (LIS-AE)を紹介した。本稿では,クラス毎に異なる潜在層を追加して,クラス増分学習を複数の異常検出タスクとして扱うとともに,クラス増分学習を負の例として,各潜在層を形作る。
論文参考訳（メタデータ） (2021-10-25T16:53:49Z)
DirectDebug: Automated Testing and Debugging of Feature Models [55.41644538483948]
変数モデル(例えば、特徴モデル)は、ソフトウェアアーティファクトの変数と共通性を表現する一般的な方法である。複雑でしばしば大規模な機能モデルは欠陥になりうる、すなわち、ソフトウェアアーチファクトの期待される変動特性を表現しない。
論文参考訳（メタデータ） (2021-02-11T11:22:20Z)
Identification of Latent Variables From Graphical Model Residuals [0.0]
本稿では,推定モデルの残差から遅延空間のプロキシを反復的に導出することにより,DAGを推定する際に潜伏空間を制御する新しい手法を提案する。結果の予測の改善は本質的にカプセル化されており,既成モデルと比較して一定の限界を超えないことを示す。
論文参考訳（メタデータ） (2021-01-07T02:28:49Z)
Structural Causal Models Are (Solvable by) Credal Networks [70.45873402967297]
因果推論は、干潟網の更新のための標準的なアルゴリズムによって得ることができる。この貢献は, 干潟ネットワークによる構造因果モデルを表現するための体系的なアプローチと見なされるべきである。実験により, 実規模問題における因果推論には, クレーダルネットワークの近似アルゴリズムがすぐに利用できることがわかった。
論文参考訳（メタデータ） (2020-08-02T11:19:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。