論文の概要: Fast and Regularized Reconstruction of Building Fa\c{c}ades from
Street-View Images using Binary Integer Programming
- arxiv url: http://arxiv.org/abs/2002.08549v3
- Date: Wed, 22 Apr 2020 10:21:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-30 07:43:15.887834
- Title: Fast and Regularized Reconstruction of Building Fa\c{c}ades from
Street-View Images using Binary Integer Programming
- Title(参考訳): バイナリ整数型プログラミングによるストリートビュー画像からのfa\c{c}ade構築の高速化と正規化
- Authors: Han Hu, Libin Wang, Mier Zhang, Yulin Ding, Qing Zhu
- Abstract要約: 都市環境の再構築に向けては, ファッケードの整列位置と一貫した大きさに対するプリミティブの規則的な配置が重要である。
この問題を解くために混合整数線形計画法が用いられたが、最先端の商用解法でも極端に時間がかかる。
本稿では、実値パラメータの要求を省略し、解法をより効率的にする二進整数計画法を提案する。
- 参考スコア(独自算出の注目度): 14.294553980039325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Regularized arrangement of primitives on building fa\c{c}ades to aligned
locations and consistent sizes is important towards structured reconstruction
of urban environment. Mixed integer linear programing was used to solve the
problem, however, it is extreamly time consuming even for state-of-the-art
commercial solvers. Aiming to alleviate this issue, we cast the problem into
binary integer programming, which omits the requirements for real value
parameters and is more efficient to be solved . Firstly, the bounding boxes of
the primitives are detected using the YOLOv3 architecture in real-time.
Secondly, the coordinates of the upper left corners and the sizes of the
bounding boxes are automatically clustered in a binary integer programming
optimization, which jointly considers the geometric fitness, regularity and
additional constraints; this step does not require \emph{a priori} knowledge,
such as the number of clusters or pre-defined grammars. Finally, the
regularized bounding boxes can be directly used to guide the fa\c{c}ade
reconstruction in an interactive envinronment. Experimental evaluations have
revealed that the accuracies for the extraction of primitives are above 0.82,
which is sufficient for the following 3D reconstruction. The proposed approach
only takes about $ 10\% $ to $ 20\% $ of the runtime than previous approach and
reduces the diversity of the bounding boxes to about $20\%$ to $50\%$.
- Abstract(参考訳): fa\c{c}ades 構築におけるプリミティブの規則的な配置は、都市環境の構造的再構築において重要である。
この問題を解決するために混合整数線形計画法が用いられたが、最先端の商用解法でも非常に時間がかかる。
この問題を軽減するため、この問題をバイナリ整数プログラミングにキャストし、実際の値パラメータの要件を省略し、より効率的に解決します。
まず、プリミティブのバウンディングボックスをリアルタイムにYOLOv3アーキテクチャを用いて検出する。
第二に、上隅の座標と境界箱の大きさは、幾何学的適合性、正則性、追加の制約を共同で考慮する二進整数計画最適化において自動的にクラスタ化される。
最後に、正規化境界ボックスは直接fa\c{c}ade再構成をインタラクティブなエンビローメントで導くために使うことができる。
実験により, プリミティブ抽出の精度は0.82以上であり, 以下の3次元再構成に十分であることがわかった。
提案されたアプローチは、以前のアプローチよりも10\%$から20\%$のランタイムしか必要とせず、バウンディングボックスの多様性を約20\%$から50\%$に削減する。
関連論文リスト
- OmniSDF: Scene Reconstruction using Omnidirectional Signed Distance Functions and Adaptive Binoctrees [23.692550740531367]
静止シーンの形状と外観を、小さな円形のスリープ内を移動する全方向ビデオから再構成する手法を提案する。
球状ビノクツリーデータ構造内の符号付き距離場として幾何学を推定する。
通常のグリッドや木とは異なり、この構造の形状はカメラの設定とよく一致し、メモリ品質のトレードオフが向上する。
論文 参考訳(メタデータ) (2024-03-31T13:07:00Z) - Latent Space Representations of Neural Algorithmic Reasoners [15.920449080528536]
アルゴリズムの実行時にGNNによって誘導される潜伏空間の構造を詳細に解析する。
i) 分解能の喪失、(i) 類似した値の識別が困難、(ii) トレーニング中に観察された範囲外の値を扱うことができない、という2つの可能な障害モードを特定します。
これらの変更は、最先端のTriplet-GMPNNプロセッサを使用する場合、CLRS-30ベンチマークのアルゴリズムの大部分の改善につながることを示す。
論文 参考訳(メタデータ) (2023-07-17T22:09:12Z) - Accelerated First-Order Optimization under Nonlinear Constraints [73.2273449996098]
我々は、制約付き最適化のための一階アルゴリズムと非滑らかなシステムの間で、新しい一階アルゴリズムのクラスを設計する。
これらのアルゴリズムの重要な性質は、制約がスパース変数の代わりに速度で表されることである。
論文 参考訳(メタデータ) (2023-02-01T08:50:48Z) - MLPruning: A Multilevel Structured Pruning Framework for
Transformer-based Models [78.45898846056303]
プルーニングは、大きな自然言語処理モデルに関連するメモリフットプリントと計算コストを削減する効果的な方法である。
我々は,頭部刈り込み,行刈り,ブロックワイズ刈りという3つの異なるレベルの構造化刈り込みを利用する,新しいマルチレベル構造化刈り込みフレームワークを開発した。
論文 参考訳(メタデータ) (2021-05-30T22:00:44Z) - Sign-Agnostic CONet: Learning Implicit Surface Reconstructions by
Sign-Agnostic Optimization of Convolutional Occupancy Networks [39.65056638604885]
畳み込み型ネットワークの符号非依存最適化により暗黙的表面再構成を学習する。
この目標をシンプルで効果的な設計で効果的に達成できることを示す。
論文 参考訳(メタデータ) (2021-05-08T03:35:32Z) - Next-best-view Regression using a 3D Convolutional Neural Network [0.9449650062296823]
本論文では,次のベストビュー問題に対するデータ駆動アプローチを提案する。
提案手法は、次のベストビューのbtxtpositionを抑えるために、以前の再構成で3D畳み込みニューラルネットワークを訓練する。
提案手法を2つの実験グループを用いて検証した。
論文 参考訳(メタデータ) (2021-01-23T01:50:26Z) - Accelerate CNNs from Three Dimensions: A Comprehensive Pruning Framework [40.635566748735386]
ほとんどのニューラルネットワークプルーニング手法は、計算予算を満たすために、ネットワークモデルを1つ(深さ、幅、解像度)に沿ってプルークする。
刈り取りは3次元を包括的に行うべきだと論じる。
提案アルゴリズムは最先端のプルーニングアルゴリズムやニューラルアーキテクチャ検索アルゴリズムを超越している。
論文 参考訳(メタデータ) (2020-10-10T02:30:47Z) - Image segmentation via Cellular Automata [58.86475603234583]
我々は高解像度画像のセグメンテーションを成功させるセルオートマトンを設計し、訓練する。
私たちの最小のオートマトンは、複雑なセグメンテーションタスクを解決するために1万以下のパラメータを使用します。
論文 参考訳(メタデータ) (2020-08-11T19:04:09Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z) - Learning to Accelerate Heuristic Searching for Large-Scale Maximum
Weighted b-Matching Problems in Online Advertising [51.97494906131859]
バイパルタイトbマッチングはアルゴリズム設計の基本であり、経済市場や労働市場などに広く適用されている。
既存の正確で近似的なアルゴリズムは、通常そのような設定で失敗する。
我々は、以前の事例から学んだ知識を活用して、新しい問題インスタンスを解決するtextttNeuSearcherを提案する。
論文 参考訳(メタデータ) (2020-05-09T02:48:23Z) - Lagrangian Decomposition for Neural Network Verification [148.0448557991349]
ニューラルネットワーク検証の基本的なコンポーネントは、出力が取ることのできる値のバウンダリの計算である。
ラグランジアン分解に基づく新しい手法を提案する。
ランニングタイムのごく一部で、既成の解法に匹敵するバウンダリが得られることを示す。
論文 参考訳(メタデータ) (2020-02-24T17:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。