論文の概要: Habaek: High-performance water segmentation through dataset expansion and inductive bias optimization
- arxiv url: http://arxiv.org/abs/2410.15794v1
- Date: Mon, 21 Oct 2024 09:06:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:20:31.806652
- Title: Habaek: High-performance water segmentation through dataset expansion and inductive bias optimization
- Title(参考訳): Habaek: データセット拡張と帰納バイアス最適化による高性能水分割
- Authors: Hanseon Joo, Eunji Lee, Minjong Cheon,
- Abstract要約: 本研究では,ADE20K や RIWA などのデータセットを用いたデータ拡張によるセグメンテーションのためのセグフォーマーモデルの改良を提案する。
提案するHabaekモデルは, 0.9 1986 から 0.94397 までの IoU (Intersection over Union) で, 現在のモデルよりも高い性能を示すことを示す。
- 参考スコア(独自算出の注目度): 4.198865250277024
- License:
- Abstract: Water segmentation is critical to disaster response and water resource management. Authorities may employ high-resolution photography to monitor rivers, lakes, and reservoirs, allowing for more proactive management in agriculture, industry, and conservation. Deep learning has improved flood monitoring by allowing models like CNNs, U-Nets, and transformers to handle large volumes of satellite and aerial data. However, these models usually have significant processing requirements, limiting their usage in real-time applications. This research proposes upgrading the SegFormer model for water segmentation by data augmentation with datasets such as ADE20K and RIWA to boost generalization. We examine how inductive bias affects attention-based models and discover that SegFormer performs better on bigger datasets. To further demonstrate the function of data augmentation, Low-Rank Adaptation (LoRA) is used to lower processing complexity while preserving accuracy. We show that the suggested Habaek model outperforms current models in segmentation, with an Intersection over Union (IoU) ranging from 0.91986 to 0.94397. In terms of F1-score, recall, accuracy, and precision, Habaek performs better than rival models, indicating its potential for real-world applications. This study highlights the need to enhance structures and include datasets for effective water segmentation.
- Abstract(参考訳): 水分割は災害対応と水資源管理に不可欠である。
当局は川、湖、貯水池の監視に高解像度の写真を使用し、農業、産業、および保護におけるより積極的な管理を可能にしている。
ディープラーニングは、CNN、U-Net、トランスフォーマーといったモデルで大量の衛星や空中データを処理できるようにすることで、洪水モニタリングを改善した。
しかしながら、これらのモデルは通常重要な処理要件を持ち、リアルタイムアプリケーションでの使用を制限する。
本研究では, ADE20K や RIWA などのデータセットを用いたデータ拡張により, セグフォーマーモデルを改良し, 一般化を促進することを提案する。
我々は、インダクティブバイアスが注意ベースのモデルにどのように影響するかを調べ、SegFormerがより大きなデータセットでより優れたパフォーマンスを示すことを発見した。
さらに、データ拡張の機能を示すために、LoRA(Lo-Rank Adaptation)は精度を保ちながら処理の複雑さを低減するために使用される。
提案するHabaekモデルは, 0.9 1986 から 0.94397 までの IoU (Intersection over Union) で, 現在のモデルよりも高い性能を示すことを示す。
F1スコア、リコール、精度、精度の点で、Habaekはライバルモデルよりも優れており、現実世界のアプリケーションの可能性を示している。
本研究は,効率的な水分割のためのデータセットを含む構造を強化する必要性を強調した。
関連論文リスト
- DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data [48.31817189858086]
生成データは、モデルが学習できるデータ分布を拡大し、過剰適合を軽減できると主張している。
DiverGenは強力なX-Pasteよりも優れており、すべてのカテゴリで+1.1ボックスAPと+1.1マスクAPを達成でき、まれなカテゴリでは+1.9ボックスAPと+2.5マスクAPを達成できる。
論文 参考訳(メタデータ) (2024-05-16T15:30:18Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - PanGu-$\pi$: Enhancing Language Model Architectures via Nonlinearity
Compensation [97.78045712375047]
大規模言語モデル(LLM)のための新しい効率的なモデルアーキテクチャを提案する。
そこで,PanGu-$pi$-7Bは,約10%の推論速度を持つベンチマークに匹敵する性能が得られることを示す。
さらに,PanGu-$pi$-7Bを金融法と法律の高価値領域に導入し,実践的応用のためにYunShanというLLMを開発した。
論文 参考訳(メタデータ) (2023-12-27T11:49:24Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - Scaling Data Generation in Vision-and-Language Navigation [116.95534559103788]
本稿では,学習のための大規模データ生成に有効なパラダイムを提案する。
我々は、HM3DとGibsonのデータセットから1200以上のフォトリアリスティック環境を適用し、490万の命令軌道対を合成する。
我々の大規模データセットのおかげで、既存のエージェントの性能は(以前のSoTAでは+11%絶対)、単純な模倣学習によってR2Rテストの分割で80%の単ラン成功率で大幅に向上できる。
論文 参考訳(メタデータ) (2023-07-28T16:03:28Z) - Directed Acyclic Graph Factorization Machines for CTR Prediction via
Knowledge Distillation [65.62538699160085]
本稿では,既存の複雑な相互作用モデルから,知識蒸留によるCTR予測のための高次特徴相互作用を学習するための非巡回グラフファクトリゼーションマシン(KD-DAGFM)を提案する。
KD-DAGFMは、オンラインとオフラインの両方の実験において、最先端のFLOPの21.5%未満で最高の性能を達成する。
論文 参考訳(メタデータ) (2022-11-21T03:09:42Z) - Exploring the Effects of Data Augmentation for Drivable Area
Segmentation [0.0]
既存の画像データセットを解析することで、データ拡張の利点を調べることに重点を置いている。
以上の結果から,既存技術(SOTA)モデルの性能とロバスト性は劇的に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2022-08-06T03:39:37Z) - Transfer learning to improve streamflow forecasts in data sparse regions [0.0]
本研究では,データスパース領域におけるストリームフロー予測の一般化性能向上のために,微調整およびパラメータ転送による伝達学習(TL)の方法論について検討する。
本稿では,Long Short-Term Memory(LSTM)という形式で,十分に大きなソースドメインデータセットに適合する標準のリカレントニューラルネットワークを提案する。
本稿では,モデルの空間的および時間的成分を分離し,モデルを一般化する訓練を行うことにより,水文学応用のための伝達学習手法を実装する手法を提案する。
論文 参考訳(メタデータ) (2021-12-06T14:52:53Z) - High-resolution rainfall-runoff modeling using graph neural network [0.0]
本研究では,高分解能降水データから空間情報をフル活用する新しい深層学習モデルを提案する。
GNRRMは過度に適合せず、モデル性能を大幅に改善した。
論文 参考訳(メタデータ) (2021-10-21T00:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。