論文の概要: The Ungrounded Alignment Problem
- arxiv url: http://arxiv.org/abs/2408.04242v1
- Date: Thu, 8 Aug 2024 06:08:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-09 16:29:12.438942
- Title: The Ungrounded Alignment Problem
- Title(参考訳): アングラウンドアライメント問題
- Authors: Marc Pickett, Aakash Kumar Nain, Joseph Modayil, Llion Jones,
- Abstract要約: 所与の刺激がどのような根拠になるか分からないシステムにおいて、事前に定義された知識を構築する方法について検討する。
教師なし学習者が画像とクラスラベルを確実に関連付けるためには,文字大文字周波数のみを活用するだけで十分であることを示す。
より一般に、この手法は、モダリティに依存しないモデルにおいて、特定の所望の自然行動を符号化するアプローチを提案する。
- 参考スコア(独自算出の注目度): 1.7115942252530902
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern machine learning systems have demonstrated substantial abilities with methods that either embrace or ignore human-provided knowledge, but combining benefits of both styles remains a challenge. One particular challenge involves designing learning systems that exhibit built-in responses to specific abstract stimulus patterns, yet are still plastic enough to be agnostic about the modality and exact form of their inputs. In this paper, we investigate what we call The Ungrounded Alignment Problem, which asks How can we build in predefined knowledge in a system where we don't know how a given stimulus will be grounded? This paper examines a simplified version of the general problem, where an unsupervised learner is presented with a sequence of images for the characters in a text corpus, and this learner is later evaluated on its ability to recognize specific (possibly rare) sequential patterns. Importantly, the learner is given no labels during learning or evaluation, but must map images from an unknown font or permutation to its correct class label. That is, at no point is our learner given labeled images, where an image vector is explicitly associated with a class label. Despite ample work in unsupervised and self-supervised loss functions, all current methods require a labeled fine-tuning phase to map the learned representations to correct classes. Finding this mapping in the absence of labels may seem a fool's errand, but our main result resolves this seeming paradox. We show that leveraging only letter bigram frequencies is sufficient for an unsupervised learner both to reliably associate images to class labels and to reliably identify trigger words in the sequence of inputs. More generally, this method suggests an approach for encoding specific desired innate behaviour in modality-agnostic models.
- Abstract(参考訳): 現代の機械学習システムは、人間が提供する知識を受け入れたり無視したりする手法でかなりの能力を発揮してきたが、両方のスタイルの利点を組み合わせることは依然として困難である。
1つの課題は、特定の抽象的な刺激パターンに対するビルトイン応答を示す学習システムを設計することである。
そこで,本稿では,与えられた刺激がどう接地されるか分からないシステムにおいて,事前定義された知識をいかに構築できるかを問う。
本稿では、教師なし学習者がテキストコーパス内の文字の連続した画像を提示する一般的な問題の単純化版について検討し、その後、特定の(稀な)連続パターンを認識する能力について評価する。
重要なことに、学習者は学習や評価中にラベルを付与されないが、未知のフォントからのイメージや置換を正しいクラスラベルにマッピングする必要がある。
つまり、画像ベクトルがクラスラベルに明示的に関連付けられている場合、学習者がラベル付きイメージを付与することは決してない。
教師なしおよび自己教師付き損失関数における十分な作業にもかかわらず、現在のすべてのメソッドは、学習した表現を正しいクラスにマッピングするために、ラベル付き微調整フェーズを必要とする。
ラベルがない状態でこのマッピングを見つけるのは馬鹿げているように思えるが、私たちの主な結果は、このパラドックスを解決しているように見える。
本研究では, 教師なし学習者にとって, 画像とクラスラベルを確実に関連付け, 入力順序におけるトリガー語を確実に識別するには, 文字大文字周波数のみを活用するだけで十分であることを示す。
より一般に、この手法は、モダリティに依存しないモデルにおいて、特定の所望の自然行動を符号化するアプローチを提案する。
関連論文リスト
- Pose-Aware Self-Supervised Learning with Viewpoint Trajectory Regularization [40.5076868823241]
本稿では,視点軌跡から得られた隣接画像三重項の新たなデータセットを提案する。
同じ視覚的特徴に対して意味分類とポーズ推定の精度をベンチマークする。
本実験は,オブジェクトの同一性を符号化した視覚表現の開発に有効であることを示す。
論文 参考訳(メタデータ) (2024-03-22T06:04:11Z) - CAPro: Webly Supervised Learning with Cross-Modality Aligned Prototypes [93.71909293023663]
クロスモダリティ・アライテッド・プロトタイプ(CAPro)は、視覚表現を正しい意味論で学習する統合コントラスト学習フレームワークである。
CAProは、新しい最先端のパフォーマンスを実現し、オープンセット認識に対する堅牢性を示す。
論文 参考訳(メタデータ) (2023-10-15T07:20:22Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - Few-shot Class-Incremental Semantic Segmentation via Pseudo-Labeling and
Knowledge Distillation [3.4436201325139737]
セマンティックセグメンテーションモデルのための新しいクラスをいくつかの例から学習する問題に対処する。
限られたデータから学習するために、数発のトレーニングアノテーションを増強する擬似ラベル方式を提案する。
上記のステップを、統一的な学習目標を持つ単一の畳み込みニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2023-08-05T05:05:37Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - A Closer Look at Self-training for Zero-Label Semantic Segmentation [53.4488444382874]
トレーニング中に見られないクラスをセグメント化できることは、ディープラーニングにおいて重要な技術的課題です。
事前のゼロラベルセマンティクスセグメンテーションは、ビジュアル・セマンティクスの埋め込みや生成モデルを学ぶことによってこのタスクにアプローチする。
本研究では,同一画像の異なる増分から生じる擬似ラベルの交点を取り出し,ノイズの多い擬似ラベルをフィルタリングする整合性正規化器を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:34:33Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Exploiting Context for Robustness to Label Noise in Active Learning [47.341705184013804]
本稿では,どのラベルが間違っているのかをシステムがどのように識別するか,ラベルノイズの負の影響を最小限に抑えるために,マルチクラスアクティブラーニングシステムをどのように適用できるか,といった課題に対処する。
我々は、これらの関係を符号化し、ノイズラベルが利用できる場合にグラフ上の新しい信念を得るために、ラベルなしデータのグラフィカルな表現を構築した。
これはシーン分類、アクティビティ分類、文書分類の3つの異なる応用で実証されている。
論文 参考訳(メタデータ) (2020-10-18T18:59:44Z) - Predicting What You Already Know Helps: Provable Self-Supervised
Learning [60.27658820909876]
自己教師付き表現学習は、ラベル付きデータを必要としない補助的な予測タスク(プリテキストタスクと呼ばれる)を解決する。
本研究では,特定のエミュレーションに基づくプレテキストタスク間の統計的関係を利用して,優れた表現を学習することを保証する機構を示す。
複素基底真理関数クラスにおいても線形層は近似誤差が小さいことを証明した。
論文 参考訳(メタデータ) (2020-08-03T17:56:13Z) - Continual Local Replacement for Few-shot Learning [13.956960291580938]
少数ショット学習の目標は,1つないし少数のトレーニングデータに基づいて,新しいクラスを認識可能なモデルを学習することにある。
1)新しいクラスの優れた特徴表現が欠けていること、(2)ラベル付きデータの一部が真のデータ分布を正確に表現できないこと、である。
データ不足問題に対処するために,新たな局所的置換戦略を提案する。
論文 参考訳(メタデータ) (2020-01-23T04:26:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。