論文の概要: TransTac: Visuo-Tactile Modality Transition via Ultraviolet-Encoded Transparent Elastomers
- arxiv url: http://arxiv.org/abs/2606.04477v1
- Date: Wed, 03 Jun 2026 05:46:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.572563
- Title: TransTac: Visuo-Tactile Modality Transition via Ultraviolet-Encoded Transparent Elastomers
- Title(参考訳): トランスタック:紫外エンコードされた透明エラストマーによるビジュオ触覚モダリティ転移
- Authors: Lingyue Yang, Bin Fang,
- Abstract要約: 透明紫外(UV)を符号化した両眼VBTSであるTransTacについて検討した。
このシステムは、紫外反射マーカーを埋め込んだ透明エラストマーと、頑丈なスパース三角測量のための事前誘導型デラウネーステレオマッチングアルゴリズムを用いる。
意味評価において、TransTacは触覚画像に対して最大83.3%のゼロショット認識精度を達成し、不透明な触覚ベースラインを約50ポイント超えた。
- 参考スコア(独自算出の注目度): 6.211452009978906
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-based tactile sensors (VBTS) recover high-resolution contact geometry but typically rely on opaque elastomer layers that prevent visual transparency, while RGB-D cameras provide global depth perception yet degrade significantly at close range. To address this limitation, we present TransTac, a transparent ultraviolet (UV)-encoded binocular VBTS that integrates visual observation and marker-based tactile reconstruction within a single compact device. The system employs a transparent elastomer embedded with UV-reflective markers and a prior-guided Delaunay stereo matching algorithm for robust sparse triangulation. To reliably detect densely distributed semitransparent markers, we develop a lightweight detector that enables stable localization under contact and deformation. The proposed prior-guided Delaunay matching improves correspondence robustness by approximately 21% compared with global assignment baselines while maintaining high reconstruction accuracy. In semantic evaluation, TransTac achieves up to 83.3% zero-shot recognition accuracy on tactile images, exceeding opaque tactile baselines by approximately 50 percentage points. Embedding analysis further reveals substantially stronger cross-modal alignment with natural images, with class-center similarity increasing from around 0.2 to over 0.77. Controlled near-distance experiments quantify the degradation of RGB-D depth reliability and demonstrate extended geometric coverage enabled by visuo-tactile integration. Finally, a compact prototype is implemented with an approximate hardware cost of $70.
- Abstract(参考訳): 視覚ベースの触覚センサー(VBTS)は高解像度の接触形状を回復するが、通常、視界の透明性を妨げる不透明なエラストマー層に頼っている。
この制限に対処するため、単一コンパクトデバイスに視覚観察とマーカーベースの触覚再構築を統合する透明紫外(UV)符号化双眼VBTSであるTransTacを提案する。
このシステムは、紫外反射マーカーを埋め込んだ透明エラストマーと、頑丈なスパース三角測量のための事前誘導型デラウネーステレオマッチングアルゴリズムを用いる。
密度分布した半透明マーカーを確実に検出するために,接触および変形下で安定な局所化を可能にする軽量検出器を開発した。
提案したDelaunayマッチングは,高い復元精度を維持しつつ,グローバルな割り当てベースラインと比較して約21%の対応性向上を実現している。
意味評価において、TransTacは触覚画像に対して最大83.3%のゼロショット認識精度を達成し、不透明な触覚ベースラインを約50ポイント超えた。
埋め込み解析により、自然画像とのクロスモーダルアライメントが大幅に強くなり、クラス中心の類似性は0.2から0.77以上に増加した。
制御された近距離実験は、RGB-D深度信頼性の劣化を定量化し、ビジュオ・触覚統合により拡張された幾何学的カバレッジを示す。
最後に、コンパクトなプロトタイプは、およそ70ドルのハードウェアコストで実装されている。
関連論文リスト
- WISV: Wireless-Informed Semantic Verification for Distributed Speculative Decoding in Device-Edge LLM Inference [56.297697169678095]
WISV(Wireless-Informed Semantic Verification)は、分散投機的復号化フレームワークである。
WISVは最大60.8%の許容長の増加、37.3%の対話ラウンドの削減、31.4%のエンドツーエンドレイテンシの改善を実現している。
NVIDIA Jetson AGX OrinとA40搭載サーバからなるハードウェアテストベッド上でWISVを検証する。
論文 参考訳(メタデータ) (2026-04-20T01:29:56Z) - Tri-Modal Fusion Transformers for UAV-based Object Detection [1.338174941551702]
本稿では、RGB、サーマル、イベントデータをデュアルストリーム階層型視覚変換器で処理するトリオモーダル・フレームワークを提案する。
10,489フレームのUAVデータセットを導入し,RGB-熱対流と24,223の注釈付き車両を同期・調整した。
論文 参考訳(メタデータ) (2026-04-17T18:35:06Z) - Amped: Adaptive Multi-stage Non-edge Pruning for Edge Detection [53.59823657644554]
エッジ検出のための適応型多段非エッジプルーニングフレームワーク(Amped)を提案する。
Ampedは高信頼の非エッジトークンを識別し、可能な限り早く削除し、計算を大幅に削減する。
既存のエッジ検出ネットワークの構造的複雑さを軽減するため,Streamline Edge Detector(SED)と呼ばれる,シンプルながら高性能なTransformerベースのモデルを導入する。
論文 参考訳(メタデータ) (2026-03-29T12:26:35Z) - Transparent Fragments Contour Estimation via Visual-Tactile Fusion for Autonomous Reassembly [69.97596838714595]
視覚触覚融合に基づく一般的な透過的断片輪郭推定フレームワークを提案する。
触覚情報を視覚的手がかりと融合させることにより,視覚触覚融合材料を提案する。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2026-03-18T14:58:17Z) - Cross-Modal Alignment and Fusion for RGB-D Transmission-Line Defect Detection [11.637942429146172]
本稿では,RGBの外観と深度幾何学を原理化されたヒューズ・パラダイムを通じて統合したクロスモーダルアライメント・アンド・フュージョン・ネットワークであるCMAFNetを提案する。
CMAFNetは、辞書ベースの特徴浄化を行うセマンティック再構成モジュールで構成されている。
軽量な派生型は228 FPSで24.8% mAP50に達し、わずか4.9Mのパラメータしか持たない。
論文 参考訳(メタデータ) (2026-02-02T06:11:33Z) - TransBridge: Boost 3D Object Detection by Scene-Level Completion with Transformer Decoder [66.22997415145467]
本稿では,スパース領域における検出機能を改善する共同補完・検出フレームワークを提案する。
具体的には,トランスブリッジ(TransBridge)を提案する。トランスブリッジ(TransBridge)はトランスフォーマーをベースとした新しいアップサンプリングブロックである。
その結果,本フレームワークは,各手法の平均精度(mAP)が0.7から1.5の範囲で,エンドツーエンドの3Dオブジェクト検出を一貫して改善していることがわかった。
論文 参考訳(メタデータ) (2025-12-12T00:08:03Z) - MagicSkin: Balancing Marker and Markerless Modes in Vision-Based Tactile Sensors with a Translucent Skin [52.946698368609844]
MagicSkinは、視覚ベースの触覚センサーのためのマーカーとマーカーのモードのバランスをとる、透明で色のついたマーカーを備えた、新しい触覚皮膚である。
同時に接尾辞の変位追跡、力予測、表面保存の細部が可能である。
透光性マーカーは、従来のマーカーレスマーカーやインケインマーカーの設計と比較して、感度を劣化させるよりも著しく向上する。
論文 参考訳(メタデータ) (2025-12-07T12:59:15Z) - Accelerating 3D Photoacoustic Computed Tomography with End-to-End Physics-Aware Neural Operators [74.65171736966131]
光音響計算トモグラフィ(PACT)は、光コントラストと超音波分解能を組み合わせることで、光拡散限界を超える深部像を実現する。
現在の実装では、高密度トランスデューサアレイと長い取得時間を必要とし、臨床翻訳を制限している。
本研究では,センサ計測からボリューム再構成まで,逆音響マッピングを直接学習する物理認識モデルであるPanoを紹介する。
論文 参考訳(メタデータ) (2025-09-11T23:12:55Z) - Visual-tactile Fusion for Transparent Object Grasping in Complex Backgrounds [12.449232689517538]
透明物体把握のための視覚触覚融合フレームワークを提案する。
把握位置検出、触覚キャリブレーション、視覚触覚融合に基づく分類が含まれる。
提案フレームワークは,視覚と触覚の利点を相乗化し,透明物体の把握効率を大幅に向上させる。
論文 参考訳(メタデータ) (2022-11-30T02:27:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。