論文の概要: Interactive Machine Learning for Image Captioning
- arxiv url: http://arxiv.org/abs/2202.13623v1
- Date: Mon, 28 Feb 2022 09:02:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-01 14:25:50.448848
- Title: Interactive Machine Learning for Image Captioning
- Title(参考訳): 画像キャプションのためのインタラクティブ機械学習
- Authors: Mareike Hartmann, Aliki Anagnostopoulou, Daniel Sonntag
- Abstract要約: 画像キャプションモデルのための対話型学習手法を提案する。
我々は、データ拡張手法を用いてフィードバックを乗算することで、人間のフィードバックをできるだけ活用するシステムを構想する。
- 参考スコア(独自算出の注目度): 8.584932159968002
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We propose an approach for interactive learning for an image captioning
model. As human feedback is expensive and modern neural network based
approaches often require large amounts of supervised data to be trained, we
envision a system that exploits human feedback as good as possible by
multiplying the feedback using data augmentation methods, and integrating the
resulting training examples into the model in a smart way. This approach has
three key components, for which we need to find suitable practical
implementations: feedback collection, data augmentation, and model update. We
outline our idea and review different possibilities to address these tasks.
- Abstract(参考訳): 画像キャプションモデルのための対話型学習手法を提案する。
人間のフィードバックは高価であり、現代のニューラルネットワークベースのアプローチでは、トレーニングに大量の教師付きデータを必要とすることが多いため、私たちは、データ拡張方法を使用してフィードバックを乗算し、結果のトレーニング例をスマートな方法でモデルに統合することで、人間のフィードバックを可能な限り活用するシステムを構想します。
このアプローチには3つの重要なコンポーネントがあり、フィードバック収集、データ拡張、モデル更新という、適切な実用的な実装を見つける必要があります。
我々は、これらの課題に取り組むための様々な可能性について概説し、検討する。
関連論文リスト
- Exploiting Contextual Uncertainty of Visual Data for Efficient Training of Deep Models [0.65268245109828]
アクティブラーニングCDALにおける文脈多様性の概念を導入する。
モデルバイアスを低減するために、文脈的に公正なデータをキュレートするデータ修復アルゴリズムを提案する。
我々は、野生生物カメラトラップ画像の画像検索システムと、質の悪い農村道路に対する信頼性の高い警告システムの開発に取り組んでいる。
論文 参考訳(メタデータ) (2024-11-04T09:43:33Z) - Interpretable Data Fusion for Distributed Learning: A Representative Approach via Gradient Matching [19.193379036629167]
本稿では,複数の生データポイントを仮想表現に変換する分散学習のための代表的アプローチを提案する。
これにより、広範囲なデータセットを消化可能なフォーマットに凝縮し、直感的な人間と機械の相互作用を促進する。
論文 参考訳(メタデータ) (2024-05-06T18:21:41Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Visual Affordance Prediction for Guiding Robot Exploration [56.17795036091848]
我々は,ロボット探索を導くための視覚能力の学習手法を開発した。
VQ-VAEの潜伏埋め込み空間における条件分布の学習にはTransformerベースのモデルを用いる。
本稿では,ロボット操作における視覚的目標条件付きポリシー学習において,目標サンプリング分布として機能することで探索を導くために,トレーニングされた余裕モデルをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2023-05-28T17:53:09Z) - Evaluating how interactive visualizations can assist in finding samples where and how computer vision models make mistakes [1.76602679361245]
コンピュータビジョン(CV)モデルを作成するシステムであるSpriteのコンテキストにおいて、2つのインタラクティブな可視化を提示する。
これらの視覚化は、Spriteのユーザがモデルに苦労している画像を特定し(評価)、(計画的な)画像を選択するのにどのように役立つかを調べる。
論文 参考訳(メタデータ) (2023-05-19T14:43:00Z) - Learning New Skills after Deployment: Improving open-domain
internet-driven dialogue with human feedback [22.92577324751342]
学習フレームワークにおけるインターネットによる会話能力の向上について検討する。
デプロイデータを収集し、さまざまな種類のフィードバックを収集します。
最近導入されたDirectorモデルは、他の既存のアプローチよりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-08-05T16:41:46Z) - PEBBLE: Feedback-Efficient Interactive Reinforcement Learning via
Relabeling Experience and Unsupervised Pre-training [94.87393610927812]
我々は、フィードバックと非政治学習の両方の長所を生かした、非政治的、インタラクティブな強化学習アルゴリズムを提案する。
提案手法は,従来ヒト・イン・ザ・ループ法で検討されていたよりも複雑度の高いタスクを学習可能であることを実証する。
論文 参考訳(メタデータ) (2021-06-09T14:10:50Z) - A Survey on Neural Recommendation: From Collaborative Filtering to
Content and Context Enriched Recommendation [70.69134448863483]
レコメンデーションの研究は、ニューラルネットワークに基づく新しいレコメンダーモデルの発明にシフトした。
近年,神経リコメンデータモデルの開発が著しい進展を遂げている。
論文 参考訳(メタデータ) (2021-04-27T08:03:52Z) - Teaching with Commentaries [108.62722733649542]
コメントとメタ情報を用いたフレキシブルな教育フレームワークを提案する。
解説はトレーニングのスピードと/またはパフォーマンスを改善することができる。
パフォーマンスのメリットを得るために、新しいモデルをトレーニングするときに、コメンタリを再利用できる。
論文 参考訳(メタデータ) (2020-11-05T18:52:46Z) - Bowtie Networks: Generative Modeling for Joint Few-Shot Recognition and
Novel-View Synthesis [39.53519330457627]
本稿では,複数ショット認識と新規ビュー合成という新たな課題を提案する。
我々は、オブジェクト分類器を同時に学習し、新しい視点からそのタイプのオブジェクトの画像を生成することを目的としている。
生成モデルと識別モデルとの相互作用と協調に焦点を当てる。
論文 参考訳(メタデータ) (2020-08-16T19:40:56Z) - Revisiting Meta-Learning as Supervised Learning [69.2067288158133]
メタラーニングと従来の教師付き学習の関連性を再考し,強化することで,原則的,統一的なフレームワークの提供を目指す。
タスク固有のデータセットとターゲットモデルを(機能、ラベル)サンプルとして扱うことで、多くのメタ学習アルゴリズムを教師付き学習のインスタンスに還元することができる。
この視点は、メタラーニングを直感的で実践的なフレームワークに統一するだけでなく、教師付き学習から直接洞察を伝達してメタラーニングを改善することができる。
論文 参考訳(メタデータ) (2020-02-03T06:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。