論文の概要: AffRankNet+: Ranking Affect Using Privileged Information
- arxiv url: http://arxiv.org/abs/2108.05598v1
- Date: Thu, 12 Aug 2021 08:36:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 14:27:23.096461
- Title: AffRankNet+: Ranking Affect Using Privileged Information
- Title(参考訳): AffRankNet+: プライヴィグド情報による影響ランク付け
- Authors: Konstantinos Makantasis
- Abstract要約: 我々は、トレーニングデータに関する追加情報を特権情報として扱うランキングモデルを導入し、状態を正確にランク付けする。
私たちの知る限りでは、ニューラルネットワークに基づくランキングモデルが特権情報を利用するのは初めてです。
- 参考スコア(独自算出の注目度): 3.0306221812663465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many of the affect modelling tasks present an asymmetric distribution of
information between training and test time; additional information is given
about the training data, which is not available at test time. Learning under
this setting is called Learning Under Privileged Information (LUPI). At the
same time, due to the ordinal nature of affect annotations, formulating affect
modelling tasks as supervised learning ranking problems is gaining ground
within the Affective Computing research community. Motivated by the two facts
above, in this study, we introduce a ranking model that treats additional
information about the training data as privileged information to accurately
rank affect states. Our ranking model extends the well-known RankNet model to
the LUPI paradigm, hence its name AffRankNet+. To the best of our knowledge, it
is the first time that a ranking model based on neural networks exploits
privileged information. We evaluate the performance of the proposed model on
the public available Afew-VA dataset and compare it against the RankNet model,
which does not use privileged information. Experimental evaluation indicates
that the AffRankNet+ model can yield significantly better performance.
- Abstract(参考訳): 影響モデリングタスクの多くは、トレーニングとテスト時間の間の非対称な情報の分布を示しており、テスト時に利用できないトレーニングデータに関する追加情報が提供される。
この条件下での学習はLearning Under Privileged Information (LUPI)と呼ばれる。
同時に、影響アノテーションの常習性から、教師付き学習ランキング問題として、モデルタスクの定式化がAffective Computing Research Community内で定着している。
以上の2つの事実に触発され、本研究では、トレーニングデータに関する追加情報を特権情報として扱うランキングモデルを導入し、状態を正確にランク付けする。
私たちのランキングモデルは、よく知られたranknetモデルをlupiパラダイムに拡張します。
私たちの知る限りでは、ニューラルネットワークに基づくランキングモデルが特権情報を利用するのは初めてです。
Afew-VAデータセット上で提案したモデルの性能を評価し,特権情報を使用しないRランクネットモデルと比較した。
実験の結果, AffRankNet+モデルでは性能が大幅に向上した。
関連論文リスト
- Getting More Juice Out of the SFT Data: Reward Learning from Human Demonstration Improves SFT for LLM Alignment [65.15914284008973]
我々は、報酬モデルと政策モデルを同時に構築するために、逆強化学習(IRL)技術を活用することを提案する。
提案アルゴリズムはIRL問題の定常解に収束することを示す。
その結果,アライメントプロセス全体を通じて報酬学習を活用することは有益であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T07:11:05Z) - Learning Fair Ranking Policies via Differentiable Optimization of
Ordered Weighted Averages [55.04219793298687]
本稿では,学習からランクへの学習ループに,効率よく解ける公正ランキングモデルを組み込む方法について述べる。
特に,本論文は,OWA目標の制約された最適化を通じてバックプロパゲーションを行う方法を示す最初のものである。
論文 参考訳(メタデータ) (2024-02-07T20:53:53Z) - Entailment as Robust Self-Learner [14.86757876218415]
我々は、複数の異なるNLUタスクを文脈的エンターテイメントとして定式化するプロンプト戦略を設計する。
自己学習における擬似ラベル品質向上のための簡易擬似ラベル編集(SimPLE)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-26T18:41:23Z) - Exploring the Impact of Instruction Data Scaling on Large Language
Models: An Empirical Study on Real-World Use Cases [17.431381376675432]
本稿では,命令データのスケールの異なる命令データに対して,命令チューニングに基づく大規模言語モデルの性能について検討する。
ベースモデルとしてBloomz-7B1-mtを用いると、命令データの量を増やすだけで、オープン・エンド・ジェネレーションのようなタスクが継続的に改善されることが示される。
本稿では,高品質なトレーニングデータ,スケールベースモデル,ハードタスクに特化したトレーニング手法を効果的に選択する,といった将来的な研究方向を提案する。
論文 参考訳(メタデータ) (2023-03-26T14:49:37Z) - Striving for data-model efficiency: Identifying data externalities on
group performance [75.17591306911015]
信頼できる、効果的で責任ある機械学習システムの構築は、トレーニングデータとモデリング決定の違いが、予測パフォーマンスにどのように影響するかを理解することに集中する。
我々は、特定のタイプのデータモデル非効率性に注目し、一部のソースからトレーニングデータを追加することで、集団の重要なサブグループで評価されるパフォーマンスを実際に低下させることができる。
以上の結果から,データ効率が正確かつ信頼性の高い機械学習の鍵となることが示唆された。
論文 参考訳(メタデータ) (2022-11-11T16:48:27Z) - Large Language Models with Controllable Working Memory [64.71038763708161]
大規模言語モデル(LLM)は、自然言語処理(NLP)の一連のブレークスルーをもたらした。
これらのモデルをさらに切り離すのは、事前訓練中に内在する膨大な量の世界的知識だ。
モデルの世界知識が、文脈で提示された事実情報とどのように相互作用するかは、まだ解明されていない。
論文 参考訳(メタデータ) (2022-11-09T18:58:29Z) - Beyond Transfer Learning: Co-finetuning for Action Localisation [64.07196901012153]
同時に、複数のアップストリームとダウンストリームのタスクで1つのモデルをトレーニングする。
共ファインタニングは、同じデータ量を使用する場合、従来のトランスファーラーニングよりも優れていることを示す。
さらに、複数のアップストリームデータセットへのアプローチを簡単に拡張して、パフォーマンスをさらに向上する方法も示しています。
論文 参考訳(メタデータ) (2022-07-08T10:25:47Z) - How to Learn when Data Gradually Reacts to Your Model [10.074466859579571]
我々は,これらの効果が存在する場合でも,性能損失を最小限に抑えるための新しいアルゴリズム Stateful Performative Gradient Descent (Stateful PerfGD) を提案する。
実験の結果, Stateful PerfGD は従来の最先端手法よりもかなり優れていたことが確認された。
論文 参考訳(メタデータ) (2021-12-13T22:05:26Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。