論文の概要: Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks
- arxiv url: http://arxiv.org/abs/2501.12824v1
- Date: Wed, 22 Jan 2025 12:04:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:29:40.090140
- Title: Enhancing Monocular Depth Estimation with Multi-Source Auxiliary Tasks
- Title(参考訳): 多元補助課題による単眼深度推定の強化
- Authors: Alessio Quercia, Erenus Yildiz, Zhuo Cao, Kai Krajsek, Abigail Morrison, Ira Assent, Hanno Scharr,
- Abstract要約: 共有デコーダとの交互学習のための視覚タスクの補助的データセットを用いて,この問題に対処する。
我々は,MDE品質を平均11%向上させるために,ドメイン内の各種補助データセットとタスクを組み込むことの利点を実証する。
これにより、高品質なラベル付きデータの可用性が制限されているにもかかわらず、関連するタスクから補助データを使用することで、MDEの品質を向上させることができる。
- 参考スコア(独自算出の注目度): 5.840924060437216
- License:
- Abstract: Monocular depth estimation (MDE) is a challenging task in computer vision, often hindered by the cost and scarcity of high-quality labeled datasets. We tackle this challenge using auxiliary datasets from related vision tasks for an alternating training scheme with a shared decoder built on top of a pre-trained vision foundation model, while giving a higher weight to MDE. Through extensive experiments we demonstrate the benefits of incorporating various in-domain auxiliary datasets and tasks to improve MDE quality on average by ~11%. Our experimental analysis shows that auxiliary tasks have different impacts, confirming the importance of task selection, highlighting that quality gains are not achieved by merely adding data. Remarkably, our study reveals that using semantic segmentation datasets as Multi-Label Dense Classification (MLDC) often results in additional quality gains. Lastly, our method significantly improves the data efficiency for the considered MDE datasets, enhancing their quality while reducing their size by at least 80%. This paves the way for using auxiliary data from related tasks to improve MDE quality despite limited availability of high-quality labeled data. Code is available at https://jugit.fz-juelich.de/ias-8/mdeaux.
- Abstract(参考訳): 単眼深度推定(MDE)はコンピュータビジョンにおいて難しい課題であり、しばしば高品質なラベル付きデータセットのコストと不足によって妨げられる。
我々は,事前学習された視覚基盤モデル上に構築された共有デコーダを用いて,関連視覚タスクからの補助的データセットを交互に学習する手法を用いて,MDEに重みを与えながら,この問題に対処する。
広範な実験を通じて、様々なドメイン内の補助データセットとタスクを組み込むことで、平均で約11%のMDE品質を向上させる利点を実証する。
実験分析の結果,補助的なタスクには異なる影響があり,タスク選択の重要性が確認され,単にデータを追加するだけでは品質向上が達成できないことが明らかとなった。
注目すべきは、セマンティックセグメンテーションデータセットをMLDC(Multi-Label Dense Classification)として使用すると、さらなる品質向上がもたらされることである。
最後に,提案手法は,検討したMDEデータセットのデータ効率を大幅に向上させ,その品質を向上させるとともに,少なくとも80%の小型化を実現した。
これにより、高品質なラベル付きデータの可用性が制限されているにもかかわらず、関連するタスクから補助データを使用することで、MDEの品質を向上させることができる。
コードはhttps://jugit.fz-juelich.de/ias-8/mdeaux.comで入手できる。
関連論文リスト
- Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning [71.2981957820888]
本稿では,データセット間のデータ品質向上を自動化する新しいStar-Agentsフレームワークを提案する。
このフレームワークは最初,複数のLDMエージェントを用いた多様なインストラクションデータを生成する。
生成したデータは、難易度と品質の両方を評価する二重モデル法を用いて厳密な評価を行う。
論文 参考訳(メタデータ) (2024-11-21T02:30:53Z) - MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct [148.39859547619156]
我々は,新しいマルチモーダル命令データ進化フレームワークであるMMEvolを提案する。
MMEvolは、きめ細かい知覚、認知的推論、相互作用の進化の洗練された組み合わせによって、データ品質を反復的に改善する。
提案手法は,9つのタスクにおいて,最先端モデルに比べて有意に少ない精度でSOTA(State-of-the-art)性能を実現する。
論文 参考訳(メタデータ) (2024-09-09T17:44:00Z) - Segmenting Medical Images with Limited Data [7.83073107607804]
データ効率医療セグメンタ(DEMS)と呼ばれる半教師付き一貫性に基づくアプローチを提案する。
DEMSはエンコーダ・デコーダアーキテクチャを備え、開発されているオンライン自動拡張器(OAA)と残留ロバストネス強化(RRE)ブロックを組み込んでいる。
極端なデータ不足のシナリオ下では、私たちのDEMSは、それぞれU-Netとトップパフォーマンスの最先端手法と比較して、ダイススコアが16.85%と10.37%向上しました。
論文 参考訳(メタデータ) (2024-07-12T11:41:18Z) - Exploring the Mystery of Influential Data for Mathematical Reasoning [127.61978092016228]
数学的推論のためのQaDS(Quality-Aware Diverse Selection)戦略を提案する。
他の選択戦略との比較は、QaDSの優位性を検証する。
OpenMathMixでは、7Bベースモデルを用いたMATHで最先端の48.8%の精度を実現している。
論文 参考訳(メタデータ) (2024-04-01T12:01:06Z) - Less is More: High-value Data Selection for Visual Instruction Tuning [127.38740043393527]
本稿では,視覚的命令データの冗長性を排除し,トレーニングコストを削減するために,高価値なデータ選択手法TIVEを提案する。
約15%のデータしか使用していない我々のアプローチは、8つのベンチマークで全データ微調整モデルに匹敵する平均性能を実現することができる。
論文 参考訳(メタデータ) (2024-03-14T16:47:25Z) - Rethinking the Instruction Quality: LIFT is What You Need [20.829372251475476]
既存の品質改善手法は、データセットの拡張やキュレーションを通じて命令データを変更する。
本稿では,命令品質を新たな高さに高めるために設計された新しい多目的パラダイムであるLIFT(LLM Instruction Fusion Transfer)を提案する。
実験結果から, LLMは, パラダイムによって選択された高品質な命令データが少ない場合でも, 各種タスクにおける頑健な性能を一貫して維持することを示した。
論文 参考訳(メタデータ) (2023-12-12T03:30:21Z) - Data Diversity Matters for Robust Instruction Tuning [129.83575908023312]
近年の研究では、高品質で多様な命令チューニングデータセットをキュレートすることにより、命令追従能力を大幅に改善できることが示されている。
データセットの多様性と品質を制御できる新しいアルゴリズムQDIT(Quality-Diversity Instruction Tuning)を提案する。
いくつかの大規模命令チューニングデータセット上でのQDITの性能を検証した結果、最悪のケースと平均ケースのパフォーマンスを大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2023-11-21T19:12:18Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - Assessing Dataset Quality Through Decision Tree Characteristics in
Autoencoder-Processed Spaces [0.30458514384586394]
データセットの品質がモデルトレーニングとパフォーマンスに深く影響していることを示します。
以上の結果から,適切な特徴選択,適切なデータボリューム,データ品質の重要性が浮き彫りになった。
この研究は、データアセスメントのプラクティスに関する貴重な洞察を提供し、より正確で堅牢な機械学習モデルの開発に寄与する。
論文 参考訳(メタデータ) (2023-06-27T11:33:31Z) - A Unified Framework for Task-Driven Data Quality Management [10.092524512413831]
高性能なデータは、高性能機械学習(ML)モデルのトレーニングに不可欠である。
既存のデータ品質管理スキームは、MLのパフォーマンスを十分に改善することはできない。
本稿では,タスク駆動型モデルに依存しないDQMフレームワークDataSifterを提案する。
論文 参考訳(メタデータ) (2021-06-10T03:56:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。