論文の概要: LEAPMood: Light and Efficient Architecture to Predict Mood with Genetic
Algorithm driven Hyperparameter Tuning
- arxiv url: http://arxiv.org/abs/2202.02522v1
- Date: Sat, 5 Feb 2022 09:44:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-08 16:09:15.034038
- Title: LEAPMood: Light and Efficient Architecture to Predict Mood with Genetic
Algorithm driven Hyperparameter Tuning
- Title(参考訳): leapmood: 遺伝的アルゴリズム駆動ハイパーパラメータチューニングによるムード予測のための軽量かつ効率的なアーキテクチャ
- Authors: Harichandana B S S and Sumit Kumar
- Abstract要約: LEAPMoodは、テキストデータから気分を予測するためのデバイス上でのディープラーニングアプローチである。
文字埋め込み,音声ハッシュ,アテンションと条件ランダムフィールド(CRF)を組み合わせることで,現状のState-Of-the-Artに匹敵する性能が得られることを示す。
- 参考スコア(独自算出の注目度): 2.4763587045241553
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate and automatic detection of mood serves as a building block for use
cases like user profiling which in turn power applications such as advertising,
recommendation systems, and many more. One primary source indicative of an
individual's mood is textual data. While there has been extensive research on
emotion recognition, the field of mood prediction has been barely explored. In
addition, very little work is done in the area of on-device inferencing, which
is highly important from the user privacy point of view. In this paper, we
propose for the first time, an on-device deep learning approach for mood
prediction from textual data, LEAPMood. We use a novel on-device
deployment-focused objective function for hyperparameter tuning based on the
Genetic Algorithm (GA) and optimize the parameters concerning both performance
and size. LEAPMood consists of Emotion Recognition in Conversion (ERC) as the
first building block followed by mood prediction using K-means clustering. We
show that using a combination of character embedding, phonetic hashing, and
attention along with Conditional Random Fields (CRF), results in a performance
closely comparable to that of the current State-Of-the-Art with a significant
reduction in model size (> 90%) for the task of ERC. We achieve a Micro F1
score of 62.05% with a memory footprint of a mere 1.67MB on the DailyDialog
dataset. Furthermore, we curate a dataset for the task of mood prediction
achieving a Macro F1-score of 72.12% with LEAPMood.
- Abstract(参考訳): 気分の正確な自動検出は、ユーザプロファイリングのようなユースケースのためのビルディングブロックとして機能し、それによって広告やレコメンデーションシステムなどのアプリケーションに電力を供給する。
個人の気分を示す主要な情報源は、テキストデータである。
感情認識に関する研究は盛んに行われているが、気分予測の分野ではほとんど研究されていない。
さらに、オンデバイス参照の分野では、ユーザのプライバシーの観点から非常に重要な作業がほとんど行われていません。
本稿では,テキストデータであるleapmoodから気分を予測するための,デバイス上でのディープラーニングアプローチを初めて提案する。
遺伝的アルゴリズム(ga)に基づくハイパーパラメータチューニングのための,新しいオンデバイス配置指向目的関数を用いて,性能とサイズに関するパラメータを最適化する。
LEAPMood は、最初のビルディングブロックとして Emotion Recognition in Conversion (ERC) で構成され、その後 K-means クラスタリングを用いて気分予測を行う。
本研究では, 文字埋め込み, 音声ハッシュ, 注意の組み合わせと条件付きランダムフィールド(CRF)を併用することにより, モデルサイズ(以上90%)の大幅な削減を図り, 現状の状態-Of-the-Artに匹敵する性能が得られることを示す。
DailyDialogデータセット上のわずか1.67MBのメモリフットプリントで、マイクロF1スコアが62.05%に達する。
さらに、LEAPMoodを用いて、マクロF1スコア72.12%の気分予測を行うためのデータセットをキュレートする。
関連論文リスト
- Enhancing Microgrid Performance Prediction with Attention-based Deep Learning Models [0.0]
本研究の目的は、グリッド不安定性に寄与する電力振動を特徴とするマイクログリッドシステムの運用上の課題に対処することである。
畳み込みとGRU(Gated Recurrent Unit)の強みを活かした統合戦略が提案されている。
このフレームワークは、包括的な負荷予測を行うMulti-Layer Perceptron(MLP)モデルによって固定されている。
論文 参考訳(メタデータ) (2024-07-20T21:24:11Z) - MemControl: Mitigating Memorization in Diffusion Models via Automated Parameter Selection [15.477246927584499]
拡散モデルは、トレーニングデータによく似ているが、データ記憶の影響を受ける画像を生成するのに優れている。
微調整時のモデル容量の正規化がこの問題を軽減することを提案する。
当社のフレームワークは大規模データセットにスケーラブルで,関数の報酬に依存せず,既存のアプローチと統合することで,メモリ化の軽減を実現しています。
論文 参考訳(メタデータ) (2024-05-29T19:12:08Z) - Spatio-Temporal Side Tuning Pre-trained Foundation Models for Video-based Pedestrian Attribute Recognition [58.79807861739438]
既存の歩行者認識アルゴリズム(PAR)は主に静的画像に基づいて開発されている。
本稿では,時間的情報を完全に活用できるビデオフレームを用いて,人間の属性を理解することを提案する。
論文 参考訳(メタデータ) (2024-04-27T14:43:32Z) - Dynamic Focus-aware Positional Queries for Semantic Segmentation [94.6834904076914]
本稿では,動的焦点認識型位置情報クエリと呼ばれるセマンティックセグメンテーションのための,シンプルで効果的なクエリ設計を提案する。
我々のフレームワークはSOTAの性能を達成し、ResNet-50、Swin-T、Swin-Bのバックボーンによる1.1%、1.9%、および1.1%の単一スケールmIoUでMask2formerより優れています。
論文 参考訳(メタデータ) (2022-04-04T05:16:41Z) - End-to-End Zero-Shot HOI Detection via Vision and Language Knowledge
Distillation [86.41437210485932]
我々は、ゼロショットHOI検出を前進させ、同時に見えないHOIと見えないHOIの両方を検出することを目指している。
本稿では,視覚言語による知識蒸留によるエンドツーエンドのゼロショットHOI検出フレームワークを提案する。
本手法は, 従来のSOTAを8.92%, 全体の10.18%で上回っている。
論文 参考訳(メタデータ) (2022-04-01T07:27:19Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Masked Transformer for Neighhourhood-aware Click-Through Rate Prediction [74.52904110197004]
本稿では,近隣相互作用に基づくCTR予測を提案し,そのタスクを異種情報ネットワーク(HIN)設定に組み込む。
周辺地域の表現を高めるために,ノード間のトポロジカルな相互作用を4種類検討する。
本研究では,2つの実世界のデータセットに関する総合的な実験を行い,提案手法が最先端のCTRモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2022-01-25T12:44:23Z) - DAAS: Differentiable Architecture and Augmentation Policy Search [107.53318939844422]
この研究は、ニューラルネットワークとデータ拡張のカップリングの可能性を検討し、それらを共同で検索する効果的なアルゴリズムを提案する。
CIFAR-10では97.91%、ImageNetデータセットでは76.6%の精度で97.91%の精度を達成し、検索アルゴリズムの優れた性能を示している。
論文 参考訳(メタデータ) (2021-09-30T17:15:17Z) - RETRONLU: Retrieval Augmented Task-Oriented Semantic Parsing [11.157958012672202]
マルチドメインタスク指向のセマンティックパーシングの問題に対して,検索に基づくモデリングのアイデアを適用している。
我々のアプローチであるRetroNLUは、シーケンス・ツー・シーケンス・モデルアーキテクチャを検索コンポーネントで拡張する。
近隣の検索コンポーネントの品質、モデルの感度を分析し、発話の複雑さの異なる意味解析の性能を分解する。
論文 参考訳(メタデータ) (2021-09-21T19:30:30Z) - Moving Towards Centers: Re-ranking with Attention and Memory for
Re-identification [18.539658212171062]
リグレードは、コンテキスト情報を利用して、人物または車両の再識別(re-ID)の初期ランキングリストを最適化する
本論文では,プローブと近傍試料の相関を予測するための再ランクネットワークを提案する。
論文 参考訳(メタデータ) (2021-05-04T12:14:30Z) - Reformulating HOI Detection as Adaptive Set Prediction [25.44630995307787]
我々は適応セット予測問題としてHOI検出を再構成する。
本稿では,並列インスタンスとインタラクションブランチを備えた適応型セットベースワンステージフレームワーク(as-net)を提案する。
この手法は、人間のポーズや言語的特徴を必要とせず、従来の最先端の手法を上回ります。
論文 参考訳(メタデータ) (2021-03-10T10:40:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。