論文の概要: Detecting Hateful Memes Using a Multimodal Deep Ensemble
- arxiv url: http://arxiv.org/abs/2012.13235v1
- Date: Thu, 24 Dec 2020 13:01:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-25 08:28:16.037871
- Title: Detecting Hateful Memes Using a Multimodal Deep Ensemble
- Title(参考訳): マルチモーダルディープ・アンサンブルによる有害ミームの検出
- Authors: Vlad Sandulescu
- Abstract要約: 本稿では,最新の視覚言語変換アーキテクチャについて検討し,その性能向上のための改良を提案する。
提案したモデルは,3100人以上の参加者のうち,リーダボード上で5ドルという大きなマージンで,ベースラインを上回ります。
- 参考スコア(独自算出の注目度): 0.5537911706288436
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While significant progress has been made using machine learning algorithms to
detect hate speech, important technical challenges still remain to be solved in
order to bring their performance closer to human accuracy. We investigate
several of the most recent visual-linguistic Transformer architectures and
propose improvements to increase their performance for this task. The proposed
model outperforms the baselines by a large margin and ranks 5$^{th}$ on the
leaderboard out of 3,100+ participants.
- Abstract(参考訳): ヘイトスピーチの検出には機械学習アルゴリズムが使用されているが、人間の精度に近づくために重要な技術的課題はまだ解決されていない。
直近の視覚言語トランスフォーマーアーキテクチャのいくつかを調査し,その性能向上のための改善を提案する。
提案したモデルは,3100名以上の参加者のうち,リーダボード上の5$^{th}$に対して,ベースラインを大きなマージンで上回る。
関連論文リスト
- Masked Thought: Simply Masking Partial Reasoning Steps Can Improve
Mathematical Reasoning Learning of Language Models [106.59263704052206]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。
入力の摂動に代えて,外部リソースを回避する手法を開発した。
私たちのトレーニングアプローチは、思考の連鎖内の特定のトークンをランダムに隠蔽します。
論文 参考訳(メタデータ) (2024-03-04T16:21:54Z) - Data Augmentation for Human Behavior Analysis in Multi-Person
Conversations [27.38635423877249]
我々は,ACM Multimedia 2023 の MultiMediate Grand Challenge 2023 に対して,我々のチーム HFUT-VUT の解決策を提示する。
このソリューションは、身体行動認識、アイコンタクト検出、次の話者予測という3つのサブチャレンジをカバーしている。
論文 参考訳(メタデータ) (2023-08-03T04:04:40Z) - FULLER: Unified Multi-modality Multi-task 3D Perception via Multi-level
Gradient Calibration [89.4165092674947]
マルチモダリティ融合とマルチタスク学習は、3D自動運転シナリオにおいてトレンドになりつつある。
先行研究は、学習フレームワークを経験的な知識で手作業で調整し、それがサブオプティマに繋がる可能性がある。
そこで本稿では,最適化中のタスクやモダリティにまたがる,シンプルなマルチレベル勾配校正学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-31T12:50:15Z) - Learning Transferable Adversarial Robust Representations via Multi-view
Consistency [57.73073964318167]
デュアルエンコーダを用いたメタ逆多視点表現学習フレームワークを提案する。
未確認領域からの少数ショット学習タスクにおけるフレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2022-10-19T11:48:01Z) - Multi-dataset Training of Transformers for Robust Action Recognition [75.5695991766902]
動作認識のための複数のデータセットをうまく一般化することを目的として,ロバストな特徴表現の課題について検討する。
本稿では、情報損失と投影損失という2つの新しい損失項を設計した、新しいマルチデータセットトレーニングパラダイムであるMultiTrainを提案する。
本研究では,Kineetics-400,Kineetics-700,Moments-in-Time,Activitynet,Some-something-v2の5つの課題データセットに対して,本手法の有効性を検証する。
論文 参考訳(メタデータ) (2022-09-26T01:30:43Z) - Efficient Neural Net Approaches in Metal Casting Defect Detection [0.0]
本研究は,精度と推定時間の観点から効率の良い軽量アーキテクチャを提案する。
以上の結果から,深度的に分離可能な畳み込みを持つ590Kパラメータのカスタムモデルが事前学習アーキテクチャよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2022-08-08T13:54:36Z) - A Metaheuristic-Driven Approach to Fine-Tune Deep Boltzmann Machines [0.0]
この研究はDeep Boltzmann Machinesの微調整ハイパーパラメータの問題に対処する。
バイナリイメージ再構築のための3つの公開データセットで実施された実験は、メタヒューリスティック技術が妥当な結果を得ることができることを示した。
論文 参考訳(メタデータ) (2021-01-14T18:57:29Z) - Making DensePose fast and light [78.49552144907513]
このタスクを解くことができる既存のニューラルネットワークモデルは、非常にパラメータ化されている。
現在のモデルで端末のDense Pose推論を有効にするには、高価なサーバーサイドのインフラをサポートし、安定したインターネット接続が必要である。
本研究では,DensePose R-CNNモデルのアーキテクチャを再設計することで,最終的なネットワークがその精度の大部分を維持しつつ,より軽量で高速なネットワークを実現することを目的とする。
論文 参考訳(メタデータ) (2020-06-26T19:42:20Z) - Improving 3D Object Detection through Progressive Population Based
Augmentation [91.56261177665762]
本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。
このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。
PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-02T05:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。