Fugu-MT 論文翻訳(概要): THE Benchmark: Transferable Representation Learning for Monocular Height Estimation

論文の概要: THE Benchmark: Transferable Representation Learning for Monocular Height Estimation

arxiv url: http://arxiv.org/abs/2112.14985v2
Date: Thu, 21 Sep 2023 14:32:17 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-22 20:24:08.995261
Title: THE Benchmark: Transferable Representation Learning for Monocular Height Estimation
Title（参考訳）: 単眼高推定のための転送可能表現学習
Authors: Zhitong Xiong, Wei Huang, Jingtao Hu, and Xiao Xiang Zhu
Abstract要約: クロスデータセット設定における高さ推定モデルの転送可能性を検討するための新しいベンチマークデータセットを提案する。このベンチマークデータセットには、新しく提案された大規模合成データセット、新たに収集された実世界のデータセット、および異なる都市の既存の4つのデータセットが含まれている。本論文では、高さ推定タスクにおけるスケール変量問題に対処するウィンドウベース変換器を強化するためのスケール変形可能な畳み込みモジュールを提案する。
参考スコア（独自算出の注目度）: 25.872962101146115
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generating 3D city models rapidly is crucial for many applications. Monocular height estimation is one of the most efficient and timely ways to obtain large-scale geometric information. However, existing works focus primarily on training and testing models using unbiased datasets, which does not align well with real-world applications. Therefore, we propose a new benchmark dataset to study the transferability of height estimation models in a cross-dataset setting. To this end, we first design and construct a large-scale benchmark dataset for cross-dataset transfer learning on the height estimation task. This benchmark dataset includes a newly proposed large-scale synthetic dataset, a newly collected real-world dataset, and four existing datasets from different cities. Next, a new experimental protocol, few-shot cross-dataset transfer, is designed. Furthermore, in this paper, we propose a scale-deformable convolution module to enhance the window-based Transformer for handling the scale-variation problem in the height estimation task. Experimental results have demonstrated the effectiveness of the proposed methods in the traditional and cross-dataset transfer settings. The datasets and codes are publicly available at https://mediatum.ub.tum.de/1662763 and https://thebenchmarkh.github.io/.
Abstract（参考訳）: 3D都市モデルを迅速に生成することは、多くのアプリケーションにとって不可欠である。単分子高さ推定は、大規模な幾何学的情報を得る最も効率的かつタイムリーな方法の1つである。しかし、既存の作業は主に偏りのないデータセットを使用してモデルのトレーニングとテストに焦点を当てている。そこで本研究では,クロスデータセットにおける高さ推定モデルの転送可能性を調べるための新しいベンチマークデータセットを提案する。そこで我々はまず,ハイト推定タスク上でのクロスデータセット変換学習のための大規模ベンチマークデータセットの設計と構築を行う。このベンチマークデータセットは、新たに提案された大規模合成データセット、新たに収集された実世界のデータセット、異なる都市の既存の4つのデータセットを含む。次に、新しい実験プロトコル、マイトショットクロスデータセット転送が設計されている。さらに,本論文では,高さ推定タスクにおけるスケール変動問題に対処するウィンドウベーストランスフォーマを強化するためのスケール変形可能な畳み込みモジュールを提案する。提案手法の有効性を従来のデータ転送方式とクロスデータセット転送方式で実証した。データセットとコードはhttps://mediatum.ub.tum.de/1662763とhttps://thebenchmarkh.github.io/で公開されている。

関連論文リスト

SITUATE -- Synthetic Object Counting Dataset for VLM training [0.0]
本稿では,視覚言語モデルの訓練と評価を目的とした新しいデータセットであるSITUATEを提案する。このデータセットは、VLMCountBenchのような単純な2Dデータセットと、TallyQAのようなあいまいな実生活データセットとのギャップを埋める。
論文参考訳（メタデータ） (2026-01-26T16:17:53Z)
OmniTraj: Pre-Training on Heterogeneous Data for Adaptive and Zero-Shot Human Trajectory Prediction [62.385417528148224]
OmniTrajは、大規模な異種データセットで事前トレーニングされたトランスフォーマーベースのモデルである。実験によると、フレームレートを明示的に条件付けすることで、OmniTrajは最先端のゼロショット転送性能を実現することができる。
論文参考訳（メタデータ） (2025-07-31T15:37:09Z)
Modeling Saliency Dataset Bias [10.364146597632365]
画像ベースサリエンシ予測の最近の進歩は、既存のベンチマーク上でのゴールド標準性能レベルに近づいている。データセットバイアスのため、複数の正当性データセットにまたがる修正予測が依然として困難であることを示す。本稿では,データセットに依存しないエンコーダ・デコーダ構造を20未満のパラメータで拡張する新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-05-15T10:55:47Z)
Core-Set Selection for Data-efficient Land Cover Segmentation [16.89537279044251]
リモートセンシング画像セグメンテーションデータセットからサンプルの重要なサブセットを選択するための6つの新しいコアセット選択手法を提案する。本手法は,3つの土地被覆分類データセットのランダム選択ベースラインに対して,これらのアプローチをベンチマークする。この結果は,リモートセンシング領域におけるデータ中心学習の重要性と可能性を示している。
論文参考訳（メタデータ） (2025-05-02T12:22:08Z)
Scaling Up Diffusion and Flow-based XGBoost Models [5.944645679491607]
本稿では,XGBoostを拡散・流れマッチングモデルにおける関数近似器として利用するための最近の提案について検討する。より優れた実装では、以前よりも370倍大きなデータセットにスケールできる。我々は,Fast Calorimeter Simulation Challengeの一環として,大規模科学的データセットについて報告する。
論文参考訳（メタデータ） (2024-08-28T18:00:00Z)
UniTraj: A Unified Framework for Scalable Vehicle Trajectory Prediction [93.77809355002591]
さまざまなデータセット、モデル、評価基準を統一する包括的なフレームワークであるUniTrajを紹介する。我々は広範な実験を行い、他のデータセットに転送するとモデルの性能が大幅に低下することがわかった。これらの知見を説明するために,データセットの特徴に関する洞察を提供する。
論文参考訳（メタデータ） (2024-03-22T10:36:50Z)
Rethinking Transformers Pre-training for Multi-Spectral Satellite Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文参考訳（メタデータ） (2024-03-08T16:18:04Z)
LargeST: A Benchmark Dataset for Large-Scale Traffic Forecasting [65.71129509623587]
道路交通予測はスマートシティのイニシアチブにおいて重要な役割を担い、ディープラーニングの力によって大きな進歩を遂げている。しかし、現在の公開データセットで達成される有望な結果は、現実的なシナリオには適用できないかもしれない。カリフォルニアで合計8,600のセンサーと5年間の時間カバレッジを含む、LargeSTベンチマークデータセットを紹介します。
論文参考訳（メタデータ） (2023-06-14T05:48:36Z)
Uni3D: A Unified Baseline for Multi-dataset 3D Object Detection [34.2238222373818]
現在の3Dオブジェクト検出モデルは、単一のデータセット固有のトレーニングとテストのパラダイムに従っている。本稿では,複数のデータセットから統合された3次元検出器を訓練する作業について検討する。単純なデータレベルの修正操作と設計された意味レベルの結合・再結合モジュールを利用するUni3Dを提案する。
論文参考訳（メタデータ） (2023-03-13T05:54:13Z)
Primitive3D: 3D Object Dataset Synthesis from Randomly Assembled Primitives [44.03149443379618]
アノテーションで大量の3Dオブジェクトを自動生成するコスト効率のよい手法を提案する。これらのオブジェクトはプリミティブから派生した部分ラベルで自動アノテーションされる。生成したデータセットに対する学習のオーバーヘッドが大きいことを考慮し,データセットの蒸留戦略を提案する。
論文参考訳（メタデータ） (2022-05-25T10:07:07Z)
Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文参考訳（メタデータ） (2021-12-14T13:14:24Z)
Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文参考訳（メタデータ） (2021-10-11T04:21:46Z)
A Method to Generate High Precision Mesh Model and RGB-D Datasetfor 6D Pose Estimation Task [10.24919213221012]
本稿では, 高速, 高精度, 堅牢性を考慮したオブジェクト再構成手法を提案する。私たちのデータはレンダリングデータに近いので、実際のデータと合成データのギャップをさらに縮めることができます。
論文参考訳（メタデータ） (2020-11-17T16:56:57Z)
2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文参考訳（メタデータ） (2020-08-10T09:50:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。