論文の概要: Hybrid Perception and Equivariant Diffusion for Robust Multi-Node Rebar Tying
- arxiv url: http://arxiv.org/abs/2509.00065v1
- Date: Tue, 26 Aug 2025 07:09:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.044072
- Title: Hybrid Perception and Equivariant Diffusion for Robust Multi-Node Rebar Tying
- Title(参考訳): ロバストなマルチノード残響タイピングのためのハイブリッド知覚と同変拡散
- Authors: Zhitao Wang, Yirong Xiong, Roberto Horowitz, Yanke Wang, Yuxing Han,
- Abstract要約: レバータイリングは、鉄筋コンクリート造の繰り返しではあるが重要な作業であり、通常は手動でかなりのエルゴノミクスリスクで実施される。
ロボット操作の最近の進歩は、タイイングプロセスを自動化する可能性を秘めているが、密集したリバーノードのタイイングポーズを正確に推定する上で、課題に直面している。
本研究では,SE(3)(Diffusion-EDFs)上の等変デノイング拡散と幾何学的認識を統合したハイブリッド認識と運動計画手法を導入し,最小限のトレーニングデータで堅牢なマルチノードリバータイリングを実現する。
- 参考スコア(独自算出の注目度): 3.949012733192417
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rebar tying is a repetitive but critical task in reinforced concrete construction, typically performed manually at considerable ergonomic risk. Recent advances in robotic manipulation hold the potential to automate the tying process, yet face challenges in accurately estimating tying poses in congested rebar nodes. In this paper, we introduce a hybrid perception and motion planning approach that integrates geometry-based perception with Equivariant Denoising Diffusion on SE(3) (Diffusion-EDFs) to enable robust multi-node rebar tying with minimal training data. Our perception module utilizes density-based clustering (DBSCAN), geometry-based node feature extraction, and principal component analysis (PCA) to segment rebar bars, identify rebar nodes, and estimate orientation vectors for sequential ranking, even in complex, unstructured environments. The motion planner, based on Diffusion-EDFs, is trained on as few as 5-10 demonstrations to generate sequential end-effector poses that optimize collision avoidance and tying efficiency. The proposed system is validated on various rebar meshes, including single-layer, multi-layer, and cluttered configurations, demonstrating high success rates in node detection and accurate sequential tying. Compared with conventional approaches that rely on large datasets or extensive manual parameter tuning, our method achieves robust, efficient, and adaptable multi-node tying while significantly reducing data requirements. This result underscores the potential of hybrid perception and diffusion-driven planning to enhance automation in on-site construction tasks, improving both safety and labor efficiency.
- Abstract(参考訳): レバータイリングは、鉄筋コンクリート造の繰り返しではあるが重要な作業であり、通常は手動でかなりのエルゴノミクスリスクで実施される。
ロボット操作の最近の進歩は、タイイングプロセスを自動化する可能性を秘めているが、密集したリバーノードのタイイングポーズを正確に推定する上で、課題に直面している。
本稿では,SE(3)上の等変デノイング拡散(Diffusion-EDFs)と幾何に基づく知覚を統合し,最小限のトレーニングデータでロバストなマルチノードリバータイリングを実現するハイブリッド認識と運動計画手法を提案する。
我々の知覚モジュールは、密度に基づくクラスタリング(DBSCAN)、幾何に基づくノードの特徴抽出、および主成分分析(PCA)を利用して、複雑な非構造環境においても、逐次ランク付けのためのリバーバーのセグメンテーション、リバーノードの特定、および推定方向ベクトルを推定する。
Diffusion-EDFをベースとしたモーションプランナーは、衝突回避とタイリング効率を最適化するシーケンシャルなエンドエフェクターのポーズを生成するために、最大5-10のデモで訓練されている。
提案方式は, 単一層, 複数層, 粗い構成を含む様々なリバーメッシュ上で検証され, ノード検出と精度の高いシーケンシャルタイリングで高い成功率を示す。
大規模なデータセットや広範囲な手動パラメータチューニングに依存する従来の手法と比較して,本手法はデータ要求を大幅に低減しつつ,堅牢で効率的で適応可能なマルチノードタイピングを実現する。
この結果は、現場建設作業における自動化を向上し、安全と労働効率の両方を改善するために、ハイブリッド認識と拡散駆動型計画の可能性を強調している。
関連論文リスト
- Wireless Federated Multi-Task LLM Fine-Tuning via Sparse-and-Orthogonal LoRA [61.12136997430116]
低ランク適応(LoRA)に基づく分散連合学習(DFL)により、マルチタスクデータセットを持つモバイルデバイスは、ローカルに更新されたパラメータを、無線接続を介して近隣デバイスのサブセットと交換することで、大きな言語モデル(LLM)を協調的に微調整することができる。
不均一データセットに微調整されたパラメータを直接集約すると、DFLライフサイクルの3つの主要な問題が発生する: (i) 微調整プロセス中に忘れる破滅的な知識、(ii) データの異種性に起因する更新方向の矛盾に起因する。
論文 参考訳(メタデータ) (2026-02-24T02:45:32Z) - Task-Oriented Data Synthesis and Control-Rectify Sampling for Remote Sensing Semantic Segmentation [13.370878496504458]
トレーニングデータ合成は、ラベル付きデータセットを拡張し、リモートセンシングにおける手動アノテーションを軽減するための有望な方法となっている。
セマンティックマスク制御の複雑さとサンプリング品質の不確実性は、下流セマンティックセグメンテーションタスクにおける合成データの有用性を制限することが多い。
本稿では,マルチモーダル拡散変換器(MM-DiT)と,タスクフィードバックによって誘導されるプラグアンドプレイサンプリング戦略を含む,タスク指向のデータ合成フレームワークを提案する。
提案手法は最先端の制御可能生成法を一貫して上回り,RSセマンティックセグメンテーションのためのより安定的でタスク指向の合成データを生成する。
論文 参考訳(メタデータ) (2025-12-18T16:37:39Z) - Model-Based Diffusion Sampling for Predictive Control in Offline Decision Making [48.998030470623384]
オフラインの意思決定は、さらなるインタラクションを伴わずに、固定データセットからの信頼性の高い振る舞いを必要とする。
i)タスク整列軌道を多様に生成するプランナー,(ii)システム力学との整合性を強制するダイナミクスモデル,(iii)タスク目標に整合した動作を選択するランサーモジュールからなる構成モデルに基づく拡散フレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T06:26:02Z) - Improving Deepfake Detection with Reinforcement Learning-Based Adaptive Data Augmentation [60.04281435591454]
CRDA(Curriculum Reinforcement-Learning Data Augmentation)は、マルチドメインの偽造機能を段階的にマスターするための検出器を導く新しいフレームワークである。
私たちのアプローチの中心は、強化学習と因果推論を統合することです。
提案手法は検出器の一般化性を大幅に向上し,複数のクロスドメインデータセット間でSOTA法より優れている。
論文 参考訳(メタデータ) (2025-11-10T12:45:52Z) - Diffuse to Detect: A Generalizable Framework for Anomaly Detection with Diffusion Models Applications to UAVs and Beyond [2.4449457537548036]
UAVセンサーの読み取りなどの複雑な高次元データにおける異常検出は、運用上の安全性に不可欠である。
本稿では,拡散モデルを適用して異常検出を行うDiffuse to Detect(DTD)フレームワークを提案する。
DTDは1ステップの拡散プロセスを用いてノイズパターンを予測し、再構成エラーのない異常の迅速かつ正確な同定を可能にする。
論文 参考訳(メタデータ) (2025-10-27T02:08:08Z) - BERTector: Intrusion Detection Based on Joint-Dataset Learning [7.393571667416083]
侵入検知システム(IDS)は,ネットワークトラフィックの不均一性や攻撃パターンの多様性により,一般化と堅牢性の課題に直面している。
IDSのための新たな統合データセットトレーニングパラダイムを提案し,BERTに基づくスケーラブルなBERTectorフレームワークを提案する。
BERTectorは、トラフィック対応セマンティックトークン化のためのNAS-Tokenizer、ハイブリッドデータセットによる微調整の監督、効率的なトレーニングのためのローランク適応(LoRA)の3つの重要なコンポーネントを統合している。
論文 参考訳(メタデータ) (2025-08-14T04:05:01Z) - Adaptive Inference-Time Scaling via Cyclic Diffusion Search [68.58892778987936]
適応的推論時間スケーリング-動的に計算量を調整するという課題について紹介する。
本稿では,適応型双方向サイクル拡散(ABCD)を提案する。
ABCDは、探索深度と終了を適応的に制御しながら、双方向拡散サイクルを通じて出力を洗練する。
論文 参考訳(メタデータ) (2025-05-20T07:31:38Z) - Taming Flow Matching with Unbalanced Optimal Transport into Fast Pansharpening [10.23957420290553]
本稿では,一段階の高品位パンシャーピングを実現するための最適輸送フローマッチングフレームワークを提案する。
OTFMフレームワークは、パンシャーピング制約の厳格な遵守を維持しつつ、シミュレーション不要なトレーニングとシングルステップ推論を可能にする。
論文 参考訳(メタデータ) (2025-03-19T08:10:49Z) - PFSD: A Multi-Modal Pedestrian-Focus Scene Dataset for Rich Tasks in Semi-Structured Environments [73.80718037070773]
本稿では, 半構造化シーンに, nuScenesの形式を付加したマルチモーダルなPedestrian-Focused Sceneデータセットを提案する。
また,密集・隠蔽シナリオにおける歩行者検出のためのHMFN(Hybrid Multi-Scale Fusion Network)を提案する。
論文 参考訳(メタデータ) (2025-02-21T09:57:53Z) - Lightweight Deep Learning Framework for Accurate Particle Flow Energy Reconstruction [8.598010350935596]
本稿では,ディープラーニング再構築の枠組みを体系的に評価する。
重み付き平均2乗と誤差構造類似度指数を組み合わせたハイブリッド損失関数を設計する。
我々は,モーダル時間的相関とエネルギー変位非線形性を捉えるモデルの能力を強化する。
論文 参考訳(メタデータ) (2024-10-08T11:49:18Z) - Bridging Sensor Gaps via Attention Gated Tuning for Hyperspectral Image Classification [8.646232481181976]
HSI分類法は高品質なラベル付きHSIを必要とするが、しばしば入手するのにコストがかかる。
本稿では,3重構造トランスモデルであるTri-Formerを提案する。
論文 参考訳(メタデータ) (2023-09-22T13:39:24Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。