論文の概要: Unsupervised Cross-Lingual Transfer of Structured Predictors without
Source Data
- arxiv url: http://arxiv.org/abs/2110.03866v1
- Date: Fri, 8 Oct 2021 02:46:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 03:19:06.301044
- Title: Unsupervised Cross-Lingual Transfer of Structured Predictors without
Source Data
- Title(参考訳): ソースデータのない構造化予測器の教師なし言語間転送
- Authors: Kemal Kurniawan, Lea Frermann, Philip Schulz and Trevor Cohn
- Abstract要約: 入力モデルを集約する手段は重要であり, 遠隔監視のための高確率構造を得るために, サブストラクチャの限界確率を乗じることの方が, 入力モデルよりもはるかに優れていることを示す。
本手法は18言語を対象に,係り受け解析とパート・オブ・音声による予測問題を考慮し,言語間セッティングで機能することが実証された。
分析の結果,提案手法は遠隔監視のためのノイズの少ないラベルを生成することがわかった。
- 参考スコア(独自算出の注目度): 37.1075911292287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Providing technologies to communities or domains where training data is
scarce or protected e.g., for privacy reasons, is becoming increasingly
important. To that end, we generalise methods for unsupervised transfer from
multiple input models for structured prediction. We show that the means of
aggregating over the input models is critical, and that multiplying marginal
probabilities of substructures to obtain high-probability structures for
distant supervision is substantially better than taking the union of such
structures over the input models, as done in prior work. Testing on 18
languages, we demonstrate that the method works in a cross-lingual setting,
considering both dependency parsing and part-of-speech structured prediction
problems. Our analyses show that the proposed method produces less noisy labels
for the distant supervision.
- Abstract(参考訳): トレーニングデータの不足やプライバシー上の理由から保護されたコミュニティやドメインに技術を提供することがますます重要になっている。
そこで我々は,構造化予測のための複数の入力モデルからの教師なし転送法を一般化する。
本研究は, 入力モデル上でのアグリゲーションの方法が重要であり, 遠隔監視のための高確率構造を得るために, サブ構造の限界確率を乗じることが, 入力モデル上での結合よりもはるかに優れていることを示す。
本手法は18言語を対象に,係り受け解析とパート・オブ・音声による予測問題を考慮し,言語横断的に機能することを示した。
分析の結果,提案手法は遠隔監視のためのノイズの少ないラベルを生成することがわかった。
関連論文リスト
- Causal Unsupervised Semantic Segmentation [60.178274138753174]
教師なしセマンティックセグメンテーションは、人間のラベル付きアノテーションなしで高品質なセマンティックセマンティックセグメンテーションを実現することを目的としている。
本稿では、因果推論からの洞察を活用する新しいフレームワークCAUSE(CAusal Unsupervised Semantic sEgmentation)を提案する。
論文 参考訳(メタデータ) (2023-10-11T10:54:44Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - POUF: Prompt-oriented unsupervised fine-tuning for large pre-trained
models [62.23255433487586]
モデルに微調整を施したり、ラベルのないターゲットデータにプロンプトを施したりするための教師なしの微調整フレームワークを提案する。
本稿では,プロンプトとターゲットデータから抽出した離散分布を整列させて,言語拡張視覚とマスキング言語モデルの両方に適用する方法を示す。
論文 参考訳(メタデータ) (2023-04-29T22:05:22Z) - An Operational Perspective to Fairness Interventions: Where and How to
Intervene [9.833760837977222]
フェアネス介入の評価と文脈化のための包括的枠組みを提案する。
予測パリティに関するケーススタディで、我々のフレームワークを実証する。
グループデータを使わずに予測パリティを実現することは困難である。
論文 参考訳(メタデータ) (2023-02-03T07:04:33Z) - Query-Adaptive Predictive Inference with Partial Labels [0.0]
ブラックボックス予測モデル上に部分的にラベル付けされたデータのみを用いて予測集合を構築する新しい手法を提案する。
我々の実験は、予測セット構築の有効性と、よりフレキシブルなユーザ依存損失フレームワークの魅力を強調した。
論文 参考訳(メタデータ) (2022-06-15T01:48:42Z) - Unsupervised Paraphrasing with Pretrained Language Models [85.03373221588707]
教師なし環境で,事前学習した言語モデルを用いて高品質なパラフレーズを生成する訓練パイプラインを提案する。
提案手法は,タスク適応,自己スーパービジョン,動的ブロッキング(Dynamic Blocking)という新しい復号アルゴリズムから構成される。
提案手法は,Quora Question PairとParaNMTの両方のデータセット上で,最先端の性能を達成できることを示す。
論文 参考訳(メタデータ) (2020-10-24T11:55:28Z) - Learning Output Embeddings in Structured Prediction [73.99064151691597]
構造化予測に対する強力で柔軟なアプローチは、予測される構造化対象を潜在的に無限次元の特徴空間に埋め込むことである。
原空間における予測は、前像問題の解法により計算される。
本研究では,新しい特徴空間に出力埋め込みと回帰関数の有限近似を共同で学習することを提案する。
論文 参考訳(メタデータ) (2020-07-29T09:32:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。