論文の概要: A simple, strong baseline for building damage detection on the xBD
dataset
- arxiv url: http://arxiv.org/abs/2401.17271v1
- Date: Tue, 30 Jan 2024 18:59:56 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 13:45:29.195774
- Title: A simple, strong baseline for building damage detection on the xBD
dataset
- Title(参考訳): xBDデータセットによる建物損傷検出のためのシンプルで強力なベースライン
- Authors: Sebastian Gerard, Paul Borne-Pons, Josephine Sullivan
- Abstract要約: 我々は,xView2コンペティションの高勝率解から始めることで,損傷検出のための強力なベースライン手法を構築した。
単純化されたソリューションがより広く、容易に適用できることを期待しています。
複雑なモデルと単純化されたモデルの両方が、目に見えない場所に一般化できないことがわかった。
- 参考スコア(独自算出の注目度): 2.7163621600184773
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We construct a strong baseline method for building damage detection by
starting with the highly-engineered winning solution of the xView2 competition,
and gradually stripping away components. This way, we obtain a much simpler
method, while retaining adequate performance. We expect the simplified solution
to be more widely and easily applicable. This expectation is based on the
reduced complexity, as well as the fact that we choose hyperparameters based on
simple heuristics, that transfer to other datasets. We then re-arrange the
xView2 dataset splits such that the test locations are not seen during
training, contrary to the competition setup. In this setting, we find that both
the complex and the simplified model fail to generalize to unseen locations.
Analyzing the dataset indicates that this failure to generalize is not only a
model-based problem, but that the difficulty might also be influenced by the
unequal class distributions between events.
Code, including the baseline model, is available under
https://github.com/PaulBorneP/Xview2_Strong_Baseline
- Abstract(参考訳): 我々は,xView2コンペティションのハイエンジニアリングな勝利解から始めて,コンポーネントを徐々に取り除き,損傷検出を構築するための強力なベースライン手法を構築した。
これにより、十分な性能を維持しつつ、より簡単な方法が得られる。
単純化されたソリューションがより広く、容易に適用できることを期待しています。
この期待は、複雑さの低減と、他のデータセットに転送する単純なヒューリスティックスに基づいてハイパーパラメータを選択するという事実に基づいている。
次に、xView2データセットの分割を並べ替えて、トレーニング中にテストロケーションが見えないようにします。
この設定では、複素モデルと単純化モデルの両方が見えない場所に一般化できないことが分かる。
データセットの分析は、この一般化の失敗はモデルベースの問題だけでなく、イベント間の不平等なクラス分布にも影響される可能性があることを示している。
ベースラインモデルを含むコードはhttps://github.com/PaulBorneP/Xview2_Strong_Baselineで入手できる。
関連論文リスト
- Hedging Is Not All You Need: A Simple Baseline for Online Learning Under Haphazard Inputs [7.738999125093431]
HapNetは、スケーラブルなシンプルなベースラインであり、オンラインのバックプロパゲーションを必要としない。
この複雑なシナリオにおいても,提案手法の変種が有効であることを示す。
論文 参考訳(メタデータ) (2024-09-16T12:45:03Z) - D2 Pruning: Message Passing for Balancing Diversity and Difficulty in
Data Pruning [70.98091101459421]
コアセット選択は、トレーニングデータのサブセットを選択して、このサブセット(コアセットとも呼ばれる)でトレーニングされたモデルのパフォーマンスを最大化する。
コアセット選択のために,このデータセットグラフ上で前後のメッセージパッシングを利用する新しいプルーニングアルゴリズムD2プルーニングを提案する。
その結果、D2プルーニングは従来の最先端手法よりもコアセット選択を向上し、最大70%のプルーニングレートが得られた。
論文 参考訳(メタデータ) (2023-10-11T23:01:29Z) - Simplicity Bias Leads to Amplified Performance Disparities [8.60453031364566]
SGDで訓練されたモデルは、単純さに偏りがあることを示し、多数派の学習を優先させる。
モデルは、単純なデータセットのクラスやグループを優先順位付けし、複雑なものを見つけることを犠牲にすることができる。
論文 参考訳(メタデータ) (2022-12-13T15:24:41Z) - Unpaired Referring Expression Grounding via Bidirectional Cross-Modal
Matching [53.27673119360868]
表現基盤の参照はコンピュータビジョンにおいて重要かつ困難な課題である。
本稿では,これらの課題に対処する新しい双方向クロスモーダルマッチング(BiCM)フレームワークを提案する。
私たちのフレームワークは、2つの一般的なグラウンドデータセットで、以前の作業の6.55%と9.94%を上回っています。
論文 参考訳(メタデータ) (2022-01-18T01:13:19Z) - Information-Theoretic Measures of Dataset Difficulty [54.538766940287864]
データセットの難しさを推定するには、通常、最先端のモデルを人間と比較する。
使用可能な情報の欠如として、フレーミングデータセットの難しさを考慮した情報理論的な視点を提案する。
論文 参考訳(メタデータ) (2021-10-16T00:21:42Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - End-to-End Training of CNN Ensembles for Person Re-Identification [0.0]
本稿では,識別モデルにおける過剰適合問題に対処するため,個人再識別のためのエンドツーエンドアンサンブル手法を提案する。
提案するアンサンブル学習フレームワークは,1つのDenseNetで多種多様な,正確なベースラーニングを行う。
いくつかのベンチマークデータセットを用いた実験により,本手法が最先端の結果を得ることを示す。
論文 参考訳(メタデータ) (2020-10-03T12:40:13Z) - The Little W-Net That Could: State-of-the-Art Retinal Vessel
Segmentation with Minimalistic Models [19.089445797922316]
数桁のパラメータが桁違いに少ない標準U-Netのミニマリストバージョンが、現在のベストプラクティスの性能を近似していることを示す。
また,W-Netと呼ばれる単純な拡張も提案する。
また、Artery/Veinセグメンテーション問題にもアプローチを試行し、その結果を最先端技術に整合させる。
論文 参考訳(メタデータ) (2020-09-03T19:59:51Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。