論文の概要: Learning Bidirectional Translation between Descriptions and Actions with
Small Paired Data
- arxiv url: http://arxiv.org/abs/2203.04218v1
- Date: Tue, 8 Mar 2022 17:39:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-09 13:14:26.843043
- Title: Learning Bidirectional Translation between Descriptions and Actions with
Small Paired Data
- Title(参考訳): 小ペアデータによる記述と動作の双方向翻訳の学習
- Authors: Minori Toyoda, Kanata Suzuki, Yoshihiko Hayashi, Tetsuya Ogata
- Abstract要約: 本研究では,双方向翻訳のための2段階学習手法を提案する。
我々は、大量の非ペアデータによる記述と動作のために、繰り返しオートエンコーダ(RAE)を訓練する。
そして、小さなペアデータを用いてモデル全体を微調整し、その中間表現を結合する。
- 参考スコア(独自算出の注目度): 5.188295416244741
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study achieved bidirectional translation between descriptions and
actions using small paired data. The ability to mutually generate descriptions
and actions is essential for robots to collaborate with humans in their daily
lives. The robot is required to associate real-world objects with linguistic
expressions, and large-scale paired data are required for machine learning
approaches. However, a paired dataset is expensive to construct and difficult
to collect. This study proposes a two-stage training method for bidirectional
translation. In the proposed method, we train recurrent autoencoders (RAEs) for
descriptions and actions with a large amount of non-paired data. Then, we
fine-tune the entire model to bind their intermediate representations using
small paired data. Because the data used for pre-training do not require
pairing, behavior-only data or a large language corpus can be used. We
experimentally evaluated our method using a paired dataset consisting of
motion-captured actions and descriptions. The results showed that our method
performed well, even when the amount of paired data to train was small. The
visualization of the intermediate representations of each RAE showed that
similar actions were encoded in a clustered position and the corresponding
feature vectors well aligned.
- Abstract(参考訳): この研究は、小さなペアデータを用いた記述と行動の双方向翻訳を実現した。
ロボットが人間と日常的に協働するためには、説明や行動の相互生成が不可欠である。
ロボットは現実世界のオブジェクトと言語表現を関連付ける必要があり、機械学習のアプローチには大規模なペアデータが必要である。
しかし、ペアデータセットの構築は高価であり、収集は困難である。
本研究では双方向翻訳のための二段階学習法を提案する。
提案手法では,大量の非ペアデータを用いた記述と動作のための繰り返しオートエンコーダ(RAE)を訓練する。
そして、小さなペアデータを用いてモデル全体を微調整し、その中間表現を結合する。
事前トレーニングに使用するデータはペアリングを必要としないため、振る舞いのみのデータや大きな言語コーパスが使用できる。
モーションキャプチャされた動作と記述からなるペアデータセットを用いて,提案手法を実験的に評価した。
その結果,電車のペアデータ量が少なかった場合でも,本手法は良好に動作したことがわかった。
各RAEの中間表現の可視化により、類似した動作がクラスタ化された位置に符号化され、対応する特徴ベクトルが適切に整列された。
関連論文リスト
- DOAD: Decoupled One Stage Action Detection Network [77.14883592642782]
人々をローカライズし、ビデオからアクションを認識することは、ハイレベルなビデオ理解にとって難しい課題だ。
既存の手法は主に2段階ベースで、1段階は人物境界ボックス生成、もう1段階は行動認識を行う。
本稿では、時間的行動検出の効率を向上させるために、DOADと呼ばれる分離したワンステージネットワークを提案する。
論文 参考訳(メタデータ) (2023-04-01T08:06:43Z) - Semi-Supervised Image Captioning by Adversarially Propagating Labeled
Data [95.0476489266988]
本稿では、画像キャプションモデルの一般化を改善するための、新しいデータ効率半教師付きフレームワークを提案する。
提案手法は,キャプタにペアデータから学習し,段階的に未ペアデータの関連付けを行うよう訓練する。
1)画像ベースと(2)高密度領域ベースキャプションデータセットの両方を総合的かつ包括的な実験結果とし,それに続いて,少ないペアリングデータセットの包括的分析を行った。
論文 参考訳(メタデータ) (2023-01-26T15:25:43Z) - Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。
我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。
また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文 参考訳(メタデータ) (2023-01-22T18:22:55Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Embracing Structure in Data for Billion-Scale Semantic Product Search [14.962039276966319]
我々は、数十億の規模でダイアドニューラル埋め込みモデルを訓練し、展開するための原則的アプローチを提案する。
実世界のデータセットの自然な構造を活用することで、両方の課題に効率的に対処できることが示される。
論文 参考訳(メタデータ) (2021-10-12T16:14:13Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Recognition and Processing of NATOM [0.0]
本稿では,民間航空分野におけるNOTAM(Notice to Airmen)データの処理方法について述べる。
NOTAMのオリジナルのデータには、中国語と英語の混合があり、構造は貧弱です。
グローブワードベクターメソッドを使用して、カスタムマッピング語彙を使用するデータを表現する。
論文 参考訳(メタデータ) (2021-04-29T10:12:00Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Leverage Unlabeled Data for Abstractive Speech Summarization with
Self-Supervised Learning and Back-Summarization [6.465251961564605]
神経抽象的要約のための改良されたアプローチは、構築にコストがかかる大きな注釈付きコーパスを必要とする。
本稿では,ミーティング音声記録の自動書き起こしに基づいて,レポートが予測される,フランスの会議要約タスクを提案する。
本報告では,2つの評価セットの両アプローチのベースラインに対して,以前のベースラインと比較して大きな改善点を報告した。
論文 参考訳(メタデータ) (2020-07-30T08:22:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。