Fugu-MT 論文翻訳(概要): Reason from Context with Self-supervised Learning

論文の概要: Reason from Context with Self-supervised Learning

arxiv url: http://arxiv.org/abs/2211.12817v2
Date: Tue, 11 Apr 2023 07:17:38 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-12 18:39:40.445326
Title: Reason from Context with Self-supervised Learning
Title（参考訳）: 自己教師型学習による文脈からの推論
Authors: Xiao Liu, Ankur Sikarwar, Gabriel Kreiman, Zenglin Shi, Mengmi Zhang
Abstract要約: 文脈推論(SeCo)のための外部記憶を用いた自己教師型手法を提案する。どちらのタスクでも、SeCoはすべての最先端(SOTA)SSLメソッドを大幅なマージンで上回りました。以上の結果から,SeCoは人間的な行動を示すことが明らかとなった。
参考スコア（独自算出の注目度）: 15.16197896174348
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Self-supervised learning (SSL) learns to capture discriminative visual features useful for knowledge transfers. To better accommodate the object-centric nature of current downstream tasks such as object recognition and detection, various methods have been proposed to suppress contextual biases or disentangle objects from contexts. Nevertheless, these methods may prove inadequate in situations where object identity needs to be reasoned from associated context, such as recognizing or inferring tiny or obscured objects. As an initial effort in the SSL literature, we investigate whether and how contextual associations can be enhanced for visual reasoning within SSL regimes, by (a) proposing a new Self-supervised method with external memories for Context Reasoning (SeCo), and (b) introducing two new downstream tasks, lift-the-flap and object priming, addressing the problems of "what" and "where" in context reasoning. In both tasks, SeCo outperformed all state-of-the-art (SOTA) SSL methods by a significant margin. Our network analysis revealed that the proposed external memory in SeCo learns to store prior contextual knowledge, facilitating target identity inference in the lift-the-flap task. Moreover, we conducted psychophysics experiments and introduced a Human benchmark in Object Priming dataset (HOP). Our results demonstrate that SeCo exhibits human-like behaviors.
Abstract（参考訳）: 自己教師付き学習(SSL)は、知識伝達に有用な識別的視覚的特徴を捉えることを学ぶ。オブジェクト認識や検出など、現在の下流タスクのオブジェクト中心の性質をよりよく適応するために、コンテキストバイアスやコンテキストからのオブジェクトの絡み合いを抑制する様々な手法が提案されている。しかし、これらの手法は、小さなオブジェクトや未知のオブジェクトの認識や推論など、関連するコンテキストからオブジェクトのアイデンティティを推論する必要がある状況では不十分である。 SSL文献における最初の取り組みとして、SSL体制内の視覚的推論において、文脈的関連性をどのように拡張できるかを調査する。 (a)外部記憶を用いたSeCo(Context Reasoning)のための新たな自己管理手法の提案 (b)コンテキスト推論における"what"と"where"の問題に対処する2つの新しいダウンストリームタスク、lift-the-flapとobject primingを導入する。どちらのタスクでも、SeCoはすべての最先端(SOTA)SSLメソッドを大幅なマージンで上回りました。ネットワーク解析の結果,secoで提案する外部メモリは,事前の文脈知識の保存を学習し,リフト・ザ・フラップタスクにおいて目標のアイデンティティ推論を容易にすることが明らかとなった。さらに,精神物理学実験を行い,対象プライミングデータセット(HOP)にHumanベンチマークを導入した。以上の結果から,SeCoは人間的な行動を示すことが明らかとなった。

関連論文リスト

Skill Learning via Policy Diversity Yields Identifiable Representations for Reinforcement Learning [67.90033766878962]
自己指導型特徴学習(RL)は、相互情報スキル学習(MISL)と呼ばれる情報理論の原則に依存することが多い。本研究は,MISLを識別可能な表現学習のレンズを用いて検討する。コントラスト継承機能(Contrastive Successor Features, CSF)は, 線形変換まで環境の地下構造を確実に復元できることを実証する。
論文参考訳（メタデータ） (2025-07-19T20:48:46Z)
From Objects to Events: Unlocking Complex Visual Understanding in Object Detectors via LLM-guided Symbolic Reasoning [71.41062111470414]
現在のオブジェクト検出器は、エンティティのローカライゼーションと分類において優れているが、イベント認識機能には固有の制限がある。本稿では,単なるオブジェクト認識以上の標準オブジェクト検出能力を,複雑なイベント理解に拡張する新しいフレームワークを提案する。私たちの重要なイノベーションは、高価なタスク固有のトレーニングを必要とせずに、オブジェクト検出とイベント理解のセマンティックなギャップを埋めることです。
論文参考訳（メタデータ） (2025-02-09T10:30:54Z)
On the loss of context-awareness in general instruction fine-tuning [101.03941308894191]
命令応答対における教師付き微調整(SFT)のようなポストトレーニング手法は、事前トレーニング中に学習した既存の能力を損なう可能性がある。そこで本研究では,ユーザプロンプトに配慮したポストホックアテンション・ステアリングと,コンテキスト依存度指標を用いた条件付きインストラクションの微調整という,インストラクションモデルにおけるコンテキスト認識の損失を軽減する2つの方法を提案する。
論文参考訳（メタデータ） (2024-11-05T00:16:01Z)
Exploiting Contextual Uncertainty of Visual Data for Efficient Training of Deep Models [0.65268245109828]
アクティブラーニングCDALにおける文脈多様性の概念を導入する。モデルバイアスを低減するために、文脈的に公正なデータをキュレートするデータ修復アルゴリズムを提案する。我々は、野生生物カメラトラップ画像の画像検索システムと、質の悪い農村道路に対する信頼性の高い警告システムの開発に取り組んでいる。
論文参考訳（メタデータ） (2024-11-04T09:43:33Z)
Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-01T17:32:26Z)
Mitigating Object Dependencies: Improving Point Cloud Self-Supervised Learning through Object Exchange [50.45953583802282]
我々は,ポイントクラウドシーン理解のための新たな自己教師型学習(SSL)戦略を導入する。このアプローチでは、オブジェクトパターンとコンテキストキューの両方を活用して、堅牢な機能を生成します。提案手法は既存のSSL技術よりも優れていることを示す。
論文参考訳（メタデータ） (2024-04-11T06:39:53Z)
A Probabilistic Model Behind Self-Supervised Learning [53.64989127914936]
自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。自己教師型学習のための生成潜在変数モデルを提案する。対照的な方法を含む識別的SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示した。
論文参考訳（メタデータ） (2024-02-02T13:31:17Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文参考訳（メタデータ） (2023-03-29T18:07:25Z)
Knowledge-guided Causal Intervention for Weakly-supervised Object Localization [32.99508048913356]
KG-CI-CAMは知識誘導因果介入法である。我々は、因果介入による共起コンテキスト共同設立問題に取り組む。分類知識の吸収と局所化知識のバランスをとるための多元的知識指導フレームワークを提案する。
論文参考訳（メタデータ） (2023-01-03T12:02:19Z)
Relate to Predict: Towards Task-Independent Knowledge Representations for Reinforcement Learning [11.245432408899092]
強化学習は、エージェントが複雑なタスクを学習できるようにする。知識を解釈し、タスク間で再利用することは難しい。本稿では,対象中心の知識分離を明示する帰納的バイアスを導入する。知識分離における明示性の程度は、学習の高速化、精度の向上、一般化の向上、理解可能性の向上と相関していることを示す。
論文参考訳（メタデータ） (2022-12-10T13:33:56Z)
Object Pursuit: Building a Space of Objects via Discriminative Weight Generation [23.85039747700698]
視覚学習と理解のためのオブジェクト中心表現を継続的に学習するフレームワークを提案する。我々は、オブジェクト中心の表現を学習しながら、オブジェクトとそれに対応するトレーニング信号の多様なバリエーションをサンプリングするために、インタラクションを活用する。提案するフレームワークの重要な特徴について広範な研究を行い,学習した表現の特徴を分析した。
論文参考訳（メタデータ） (2021-12-15T08:25:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。