論文の概要: The World is Not Binary: Learning to Rank with Grayscale Data for
Dialogue Response Selection
- arxiv url: http://arxiv.org/abs/2004.02421v4
- Date: Tue, 13 Oct 2020 07:08:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 06:37:38.657967
- Title: The World is Not Binary: Learning to Rank with Grayscale Data for
Dialogue Response Selection
- Title(参考訳): 世界はバイナリではない:対話応答選択のためのグレースケールデータによるランク付け学習
- Authors: Zibo Lin, Deng Cai, Yan Wang, Xiaojiang Liu, Hai-Tao Zheng, Shuming
Shi
- Abstract要約: 人間の努力なしに、グレースケールのデータを自動的に構築できることが示される。
本手法では,自動グレースケールデータ生成装置として,市販の応答検索モデルと応答生成モデルを用いる。
3つのベンチマークデータセットと4つの最先端マッチングモデルの実験は、提案手法が大幅に、一貫したパフォーマンス改善をもたらすことを示している。
- 参考スコア(独自算出の注目度): 55.390442067381755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Response selection plays a vital role in building retrieval-based
conversation systems. Despite that response selection is naturally a
learning-to-rank problem, most prior works take a point-wise view and train
binary classifiers for this task: each response candidate is labeled either
relevant (one) or irrelevant (zero). On the one hand, this formalization can be
sub-optimal due to its ignorance of the diversity of response quality. On the
other hand, annotating grayscale data for learning-to-rank can be prohibitively
expensive and challenging. In this work, we show that grayscale data can be
automatically constructed without human effort. Our method employs
off-the-shelf response retrieval models and response generation models as
automatic grayscale data generators. With the constructed grayscale data, we
propose multi-level ranking objectives for training, which can (1) teach a
matching model to capture more fine-grained context-response relevance
difference and (2) reduce the train-test discrepancy in terms of distractor
strength. Our method is simple, effective, and universal. Experiments on three
benchmark datasets and four state-of-the-art matching models show that the
proposed approach brings significant and consistent performance improvements.
- Abstract(参考訳): 応答選択は,検索に基づく会話システム構築において重要な役割を果たす。
応答選択は自然に学習からランクへの問題であるにもかかわらず、ほとんどの先行研究はポイントワイズでこのタスクのバイナリ分類器を訓練する:それぞれの応答候補は、関連(1)または非関連(0)のいずれかでラベル付けされる。
一方、この形式化は、応答品質の多様性を知らないため、副最適である。
一方、グレースケールデータを学習してランク付けするための注釈付けは、極めて高価で困難である。
本研究では,人間の努力なしにグレイスケールのデータを自動的に構築できることを示す。
本手法では,自動グレースケールデータ生成装置として,市販の応答検索モデルと応答生成モデルを用いる。
構築したグレースケールデータを用いて,(1)よりきめ細かな文脈-応答関係の差を捉えるためのマッチングモデルを指導し,(2)気晴らし強度の観点から列車-テストの相違を低減できる,訓練用多段階ランク付け目標を提案する。
私たちの方法は単純で効果的で普遍的です。
3つのベンチマークデータセットと4つの最先端マッチングモデルに関する実験は、提案手法が大幅に一貫したパフォーマンス改善をもたらすことを示している。
関連論文リスト
- Rethinking Object Saliency Ranking: A Novel Whole-flow Processing
Paradigm [22.038715439842044]
本稿では、その「重要順」によって、有能な物体のランク付けに完全にフォーカスすることを目的とした、有能なランキングのための新しいパラダイムを提案する。
提案手法は、広く使われているSALICONの既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-12-06T01:51:03Z) - A Challenge in Reweighting Data with Bilevel Optimization [11.910900792664288]
バイレベルソルバは、モデルパラメータとデータウェイトの両方を同時に学習するウォームスタート戦略に基づいている。
このジョイントダイナミクスは、最終的なデータの重み付けが極めて少ない準最適解に繋がる可能性があることを示す。
この発見は、データ再重み付けの難しさを浮き彫りにしており、この方法が実際に使われない理由を手がかりにしている。
論文 参考訳(メタデータ) (2023-10-26T13:33:26Z) - Dialogue-Contextualized Re-ranking for Medical History-Taking [5.039849340960835]
本稿では,第1段階の質問候補を再ランク付けすることで,トレーニングと推論のギャップを埋める2段階の再ランク付け手法を提案する。
専門家システムと比較して,提案するトランスフォーマーバックボーンを用いたグローバルリランカにより,最高の性能が得られることがわかった。
論文 参考訳(メタデータ) (2023-04-04T17:31:32Z) - Online Coreset Selection for Rehearsal-based Continual Learning [65.85595842458882]
継続的な学習では、後に再生されるトレーニング例(コアセット)のサブセットを格納し、破滅的な忘れを軽減します。
提案するオンラインコアセット選択(OCS, Online Coreset Selection)は, 各イテレーションにおいて最も代表的で情報性の高いコアセットを選択するシンプルで効果的な方法である。
提案手法は,過去のタスクに対して高親和性サンプルを選択しながら,目標データセットへのモデル適応を最大化し,破滅的忘れを直接的に抑制する。
論文 参考訳(メタデータ) (2021-06-02T11:39:25Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Learning an Effective Context-Response Matching Model with
Self-Supervised Tasks for Retrieval-based Dialogues [88.73739515457116]
我々は,次のセッション予測,発話復元,不整合検出,一貫性判定を含む4つの自己教師型タスクを導入する。
我々はPLMに基づく応答選択モデルとこれらの補助タスクをマルチタスク方式で共同で訓練する。
実験結果から,提案した補助的自己教師型タスクは,多ターン応答選択において大きな改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-09-14T08:44:46Z) - Improving Multi-Turn Response Selection Models with Complementary
Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。
2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文 参考訳(メタデータ) (2020-02-18T06:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。