論文の概要: Beyond Segmentation: Structurally Informed Facade Parsing from Imperfect Images
- arxiv url: http://arxiv.org/abs/2604.09260v1
- Date: Fri, 10 Apr 2026 12:20:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.852309
- Title: Beyond Segmentation: Structurally Informed Facade Parsing from Imperfect Images
- Title(参考訳): セグメンテーションを超えて:不完全な画像から構造的にインフォームドされたファサード解析
- Authors: Maciej Janicki, Aleksander Plocharski, Przemyslaw Musialski,
- Abstract要約: 標準オブジェクト検出器はアーキテクチャ要素を独立に処理し、構造コヒーレンスを欠いたファサード解析を行う。
我々は、YOLOv8トレーニング目標をカスタム軽量アライメント損失で拡張することで、この制限に対処する。
CMPデータセットの実験により,本手法は構造規則性の向上に成功していることが示された。
- 参考スコア(独自算出の注目度): 42.698418800007865
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Standard object detectors typically treat architectural elements independently, often resulting in facade parsings that lack the structural coherence required for downstream procedural reconstruction. We address this limitation by augmenting the YOLOv8 training objective with a custom lightweight alignment loss. This regularization encourages grid-consistent arrangements of bounding boxes during training, effectively injecting geometric priors without altering the standard inference pipeline. Experiments on the CMP dataset demonstrate that our method successfully improves structural regularity, correcting alignment errors caused by perspective and occlusion while maintaining a controllable trade-off with standard detection accuracy.
- Abstract(参考訳): 標準オブジェクト検出器は通常、アーキテクチャ要素を独立して扱うが、しばしばファサード解析の結果、下流の手続き的再構築に必要な構造的一貫性が欠如している。
我々は、YOLOv8トレーニング目標をカスタム軽量アライメント損失で拡張することで、この制限に対処する。
この正規化は、トレーニング中の有界ボックスのグリッド一貫性の配置を促進し、標準推論パイプラインを変更することなく、幾何学的事前を効果的に注入する。
CMPデータセットにおける実験により,本手法は,標準検出精度で制御可能なトレードオフを維持しつつ,視点や閉塞によるアライメント誤差を補正し,構造規則性の向上に成功していることが示された。
関連論文リスト
- IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。
本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - Alignment-Aware Model Adaptation via Feedback-Guided Optimization [27.93864970404945]
ファインチューニングは、ファンデーションモデルを下流タスクに適応するための主要なメカニズムである。
本稿では,外部アライメント信号からのフィードバックをポリシー段階の正規化を通じて統合するアライメント対応微調整フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-02T16:03:16Z) - Architecture independent generalization bounds for overparametrized deep ReLU networks [0.9687141267566189]
過度パラメータ化ニューラルネットワークは、過度パラメータ化のレベルに依存しないテストエラーで一般化できることを示す。
入力空間次元で有界なトレーニングサンプルサイズを持つ過度にパラメータ化された深部ReLUネットワークに対して、勾配勾配を使わずにゼロ損失最小化器を明示的に構築する。
論文 参考訳(メタデータ) (2025-04-08T05:37:38Z) - Enhancing Robustness of Vision-Language Models through Orthogonality Learning and Self-Regularization [77.62516752323207]
そこで本研究では,事前訓練した重みを効率よく微調整する直交微調整法を導入し,頑健さと一般化の強化を実現した。
自己正規化戦略は、OrthSRと呼ばれるVLMのゼロショット一般化の観点から安定性を維持するためにさらに活用される。
筆者らはCLIPとCoOpを再検討し,少数の画像のクラスフィシエーションシナリオにおけるモデルの改善を効果的に行う。
論文 参考訳(メタデータ) (2024-07-11T10:35:53Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。