論文の概要: A Data Augmentation Method by Mixing Up Negative Candidate Answers for
Solving Raven's Progressive Matrices
- arxiv url: http://arxiv.org/abs/2103.05222v1
- Date: Tue, 9 Mar 2021 04:50:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-10 14:59:41.779656
- Title: A Data Augmentation Method by Mixing Up Negative Candidate Answers for
Solving Raven's Progressive Matrices
- Title(参考訳): ravenのプログレッシブ行列を解くための負の候補解を混合したデータ拡張法
- Authors: Wentao He, Jialu Zhang, Chenglin Yao, Shihe Wang, Jianfeng Ren, Ruibin
Bai
- Abstract要約: Raven's Progressive Matrices (RPM) は人間の視覚的推論能力をテストするために頻繁に使用される。
最近開発されたRPMライクなデータセットとソリューションモデルは、この種の問題を認知科学からコンピュータ科学に転送します。
本稿では,様々な多重選択問題に一般化可能な画像混合によるデータ拡張戦略を提案する。
- 参考スコア(独自算出の注目度): 0.829949723558878
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Raven's Progressive Matrices (RPMs) are frequently-used in testing human's
visual reasoning ability. Recently developed RPM-like datasets and solution
models transfer this kind of problems from cognitive science to computer
science. In view of the poor generalization performance due to insufficient
samples in RPM datasets, we propose a data augmentation strategy by image
mix-up, which is generalizable to a variety of multiple-choice problems,
especially for image-based RPM-like problems. By focusing on potential
functionalities of negative candidate answers, the visual reasoning capability
of the model is enhanced. By applying the proposed data augmentation method, we
achieve significant and consistent improvement on various RPM-like datasets
compared with the state-of-the-art models.
- Abstract(参考訳): RavenのProgressive Matrices(RPM)は、人間の視覚的推論能力のテストに頻繁に使用されます。
最近開発されたRPMライクデータセットとソリューションモデルは、この種の問題を認知科学からコンピュータ科学に転送します。
本研究では,RPMデータセットのサンプル不足による一般化性能の低さから,画像混合によるデータ拡張戦略を提案する。
負の候補解の潜在的な機能に着目して、モデルの視覚的推論能力を向上する。
提案手法を適用すれば,最先端モデルと比較して様々なrpmライクなデータセットにおいて有意かつ一貫した改善が得られる。
関連論文リスト
- Surprisingly Fragile: Assessing and Addressing Prompt Instability in Multimodal Foundation Models [1.9001431325800364]
OFASysのようなマルチモーダル基礎モデル(MFM)は、テキストプロンプトだけで複雑なデータの解析をアンロックする可能性を示している。
彼らのパフォーマンスは、トレーニング分布と若干異なるテキスト入力に直面している場合があります。
本研究は, 即時不安定性はMFMにとって大きな関心事であり, 全てのモダリティに対して一貫した性能低下をもたらすことを示した。
論文 参考訳(メタデータ) (2024-08-26T19:26:55Z) - Ambient Diffusion Posterior Sampling: Solving Inverse Problems with
Diffusion Models trained on Corrupted Data [56.81246107125692]
Ambient Diffusion Posterior Smpling (A-DPS) は、ある種類の腐敗に対して事前訓練された生成モデルである。
A-DPSは、いくつかの画像復元タスクにおいて、クリーンなデータで訓練されたモデルよりも、速度と性能の両方で優れていることが示される。
我々はAmbient Diffusionフレームワークを拡張して、FourierサブサンプルのマルチコイルMRI測定にのみアクセスしてMRIモデルをトレーニングする。
論文 参考訳(メタデータ) (2024-03-13T17:28:20Z) - On Calibrating Diffusion Probabilistic Models [78.75538484265292]
拡散確率モデル(DPM)は様々な生成タスクにおいて有望な結果を得た。
そこで本研究では,任意の事前学習DPMを校正する簡単な方法を提案する。
キャリブレーション法は1回だけ行い, 得られたモデルをサンプリングに繰り返し使用することができる。
論文 参考訳(メタデータ) (2023-02-21T14:14:40Z) - RAGO: Recurrent Graph Optimizer For Multiple Rotation Averaging [62.315673415889314]
本稿では,複数回転平均化(MRA)のための深部繰り返し回転平均化グラフ(RAGO)を提案する。
我々のフレームワークは、実世界のアプリケーションに小さなサイズでデプロイされた、リアルタイムに学習から最適化するローテーション平均化グラフである。
論文 参考訳(メタデータ) (2022-12-14T13:19:40Z) - Denoising Diffusion Restoration Models [110.1244240726802]
Denoising Diffusion Restoration Models (DDRM) は効率的で教師なしの後方サンプリング手法である。
DDRMの汎用性を、超高解像度、デブロアリング、インペイント、カラー化のためにいくつかの画像データセットに示す。
論文 参考訳(メタデータ) (2022-01-27T20:19:07Z) - One-shot Visual Reasoning on RPMs with an Application to Video Frame
Prediction [1.0932251830449902]
Raven's Progressive Matrices (RPM) は人間の視覚的推論能力を評価するために頻繁に用いられる。
本稿では,現実の視覚認識とそれに続く論理的推論タスクの課題に対処するために,ワンショットの人間理解可能なReaSoner(Os-HURS)を提案する。
論文 参考訳(メタデータ) (2021-11-24T06:51:38Z) - Distributionally Robust Multi-Output Regression Ranking [3.9318191265352196]
DRMRR(Distributedally Robust Multi-output Regression Ranking)と呼ばれるリストワイズ学習ランクモデルを導入する。
DRMRRは分散ロバスト最適化フレームワークを使用して、経験的データ分布の近傍で最も有害な分布の下でのマルチ出力損失関数を最小化する。
本実験は,医用文書検索と薬物反応予測の2つの実世界の応用について行った。
論文 参考訳(メタデータ) (2021-09-27T05:19:27Z) - On the Efficacy of Adversarial Data Collection for Question Answering:
Results from a Large-Scale Randomized Study [65.17429512679695]
逆データ収集(ADC)では、人間の労働力がモデルとリアルタイムで対話し、誤った予測を誘発する例を作成しようとする。
ADCの直感的な魅力にも拘わらず、敵対的データセットのトレーニングがより堅牢なモデルを生成するかどうかは不明だ。
論文 参考訳(メタデータ) (2021-06-02T00:48:33Z) - Multi-Label Contrastive Learning for Abstract Visual Reasoning [0.0]
Ravenのプログレッシブマトリクスを解く最先端のシステムは、大量のパターンベースのトレーニングとデータセットのバイアスを利用する。
人間は、解決すべきRPM(または一般的には視覚的推論タスク)の根底にあるルールや概念の識別に集中する。
本稿では,新しいトレーニングアルゴリズムに加えて,最先端性能に寄与する重要な要因であるRPMのスパースルール符号化方式を提案する。
論文 参考訳(メタデータ) (2020-12-03T14:18:15Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。