Fugu-MT 論文翻訳(概要): Advanced Knowledge Extraction of Physical Design Drawings, Translation and conversion to CAD formats using Deep Learning

論文の概要: Advanced Knowledge Extraction of Physical Design Drawings, Translation and conversion to CAD formats using Deep Learning

arxiv url: http://arxiv.org/abs/2403.11291v1
Date: Sun, 17 Mar 2024 18:06:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-19 17:36:46.814131
Title: Advanced Knowledge Extraction of Physical Design Drawings, Translation and conversion to CAD formats using Deep Learning
Title（参考訳）: 深層学習を用いた物理設計図面の高度な知識抽出、CAD形式への翻訳と変換
Authors: Jesher Joshua M, Ragav V, Syed Ibrahim S P,
Abstract要約: 本研究では,ディープラーニング手法を利用した革新的な手法を提案する。このアプローチでは、物理的な描画オブジェクトを検出するために、Yolov7やFaster R-CNNといったオブジェクト検出モデルを採用している。光文字認識(OCR)ツールは、図面からテキスト要素を識別して抽出するために統合される。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: The maintenance, archiving and usage of the design drawings is cumbersome in physical form in different industries for longer period. It is hard to extract information by simple scanning of drawing sheets. Converting them to their digital formats such as Computer-Aided Design (CAD), with needed knowledge extraction can solve this problem. The conversion of these machine drawings to its digital form is a crucial challenge which requires advanced techniques. This research proposes an innovative methodology utilizing Deep Learning methods. The approach employs object detection model, such as Yolov7, Faster R-CNN, to detect physical drawing objects present in the images followed by, edge detection algorithms such as canny filter to extract and refine the identified lines from the drawing region and curve detection techniques to detect circle. Also ornaments (complex shapes) within the drawings are extracted. To ensure comprehensive conversion, an Optical Character Recognition (OCR) tool is integrated to identify and extract the text elements from the drawings. The extracted data which includes the lines, shapes and text is consolidated and stored in a structured comma separated values(.csv) file format. The accuracy and the efficiency of conversion is evaluated. Through this, conversion can be automated to help organizations enhance their productivity, facilitate seamless collaborations and preserve valuable design information in a digital format easily accessible. Overall, this study contributes to the advancement of CAD conversions, providing accurate results from the translating process. Future research can focus on handling diverse drawing types, enhanced accuracy in shape and line detection and extraction.
Abstract（参考訳）: デザイン図面のメンテナンス、アーカイブ、使用は、長い期間、様々な産業で物理的に困難である。描画シートの簡易走査による情報抽出は困難である。これらをCAD(Computer-Aided Design)などのデジタルフォーマットに変換することで、必要な知識を抽出できる。これらの機械図面をデジタル形式に変換することは、高度な技術を必要とする重要な課題である。本研究では,ディープラーニング手法を利用した革新的な手法を提案する。このアプローチでは、Yolov7やFaster R-CNNといったオブジェクト検出モデルを用いて、画像に存在する物理的描画対象を検出する。また、図面内の装飾品(複合形状)を抽出する。総合的な変換を保証するため、光学文字認識(OCR)ツールを統合して、図面からテキスト要素を識別して抽出する。行、形、テキストを含む抽出されたデータは、構造化されたコンマ分離値(.csv)ファイルフォーマットに集約され、格納される。変換の精度と効率を評価する。これにより、組織が生産性を向上し、シームレスなコラボレーションを容易にし、価値ある設計情報をデジタルフォーマットで容易にアクセスできるようにする。本研究はCAD変換の進歩に寄与し,翻訳過程の正確な結果を提供する。今後の研究は、多様な図形の処理、形状の精度の向上、線検出と抽出に集中できる。

関連論文リスト

Digitization of Document and Information Extraction using OCR [0.0]
本論文は,光学文字認識(OCR)技術とLarge Language Models(LLM)を融合したテキスト抽出フレームワークを提案する。スキャンされたファイルはOCRエンジンで処理され、デジタルファイルはレイアウト対応のライブラリを通して解釈される。そして、抽出した原文をLLMで解析して、キー値対を特定し、あいまいさを解消する。
論文参考訳（メタデータ） (2025-06-11T16:03:01Z)
CADCrafter: Generating Computer-Aided Design Models from Unconstrained Images [69.7768227804928]
CADCrafterは画像からパラメトリックCADモデル生成フレームワークで、合成テクスチャなしCADデータのみをトレーニングする。多様な幾何学的特徴を正確に捉えるための幾何エンコーダを導入する。提案手法は、実際の制約のないCADイメージを頑健に処理でき、また、目に見えない汎用オブジェクトにも一般化できる。
論文参考訳（メタデータ） (2025-04-07T06:01:35Z)
Geometry Restoration and Dewarping of Camera-Captured Document Images [0.0]
本研究では,カメラが捉えた紙文書のデジタル画像のトポロジを復元する手法の開発に焦点をあてる。本手法では,文書アウトライン検出に深層学習(DL)を用い,次いでコンピュータビジョン(CV)を用いてトポロジカル2Dグリッドを作成する。
論文参考訳（メタデータ） (2025-01-06T17:12:19Z)
Geometric Deep Learning for Computer-Aided Design: A Survey [85.79012726689511]
本調査では,コンピュータ支援設計における学習手法の概要について概観する。類似性解析と検索、2Dおよび3DCADモデル合成、点雲からのCAD生成を含む。ベンチマークデータセットとその特性の完全なリストと、この領域の研究を推進しているオープンソースコードを提供する。
論文参考訳（メタデータ） (2024-02-27T17:11:35Z)
Information Extraction from Unstructured data using Augmented-AI and Computer Vision [0.0]
本稿では,A2I(Augmented Intelligence)とコンピュータビジョン,自然言語処理技術を組み合わせた情報抽出フレームワークを提案する。本稿では,物体検出にディープラーニングアーキテクチャを活用することによって,従来の手法の限界に対処する。提案手法は,多種多様な文書形式から構造化情報を抽出する際の精度と効率の向上を実証する。
論文参考訳（メタデータ） (2023-12-15T15:27:41Z)
Optimization of Image Processing Algorithms for Character Recognition in Cultural Typewritten Documents [0.8158530638728501]
光文字認識(OCR)における画像処理手法とパラメータチューニングの影響について検討する。この手法は多目的問題定式化を用いて、Levenshtein編集距離を最小化し、非支配的ソート遺伝的アルゴリズム(NSGA-II)で正しく同定された単語数を最大化する。以上の結果から,OCRにおける画像前処理アルゴリズムの活用は,前処理なしのテキスト認識タスクが良い結果を出さないタイプに適している可能性が示唆された。
論文参考訳（メタデータ） (2023-11-27T11:44:46Z)
SENS: Part-Aware Sketch-based Implicit Neural Shape Modeling [124.3266213819203]
SENSは手描きスケッチから3Dモデルを生成し編集するための新しい手法である。 SENSはスケッチを分析し、部品をViTパッチエンコーディングにエンコードする。 SENSは部分再構成による精細化をサポートし、微調整とアーティファクトの除去を可能にする。
論文参考訳（メタデータ） (2023-06-09T17:50:53Z)
Revisiting Deep Learning for Variable Type Recovery [3.075963833361584]
DIRTYはトランスフォーマーベースのデコーダアーキテクチャで、変数名と型でデコンパイルされたコードを拡張することができる。我々は、オープンソースのGhidraデコンパイラによって生成されたデータセット上で、DIRTYモデルを再学習することで、元のDIRTY結果を拡張する。
論文参考訳（メタデータ） (2023-04-07T22:28:28Z)
Text Detection on Technical Drawings for the Digitization of Brown-field Processes [0.0]
技術図面上のテキストの検出は、自律生産機械にとって重要なステップである。技術図面上のテキストを自動的に検出する問題は,まだ解決されていない。本稿では、ドメイン知識に基づくジェネレータを用いて、最先端のオブジェクト検出モデルとリアルな技術図面を生成する。
論文参考訳（メタデータ） (2022-05-05T13:59:18Z)
Fourier Document Restoration for Robust Document Dewarping and Recognition [73.44057202891011]
本稿では、異なる歪みで文書を復元できるフーリエ文書復元ネットワークであるFDRNetについて述べる。ドキュメントをフレキシブルなThin-Plate Spline変換でデワープし、トレーニング時に変形アノテーションを必要とせずに、様々な変形を効果的に処理できる。これは、デウォープとテキスト認識の両方のタスクにおいて、最先端の技術をはるかに上回る。
論文参考訳（メタデータ） (2022-03-18T12:39:31Z)
CHARTER: heatmap-based multi-type chart data extraction [7.838284602257369]
本稿では,文書チャートを機械可読データ形式に変換する手法とシステムを提案する。提案手法では,グラフの抽出と解析,グラフィカルな要素の抽出と構造解析を行う。我々の検出システムはニューラルネットワークに基づいており、合成データのみに基づいて訓練されている。
論文参考訳（メタデータ） (2021-11-28T11:01:21Z)
Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文参考訳（メタデータ） (2021-10-29T16:51:16Z)
Learning to Caricature via Semantic Shape Transform [95.25116681761142]
本稿では,意味的形状変換に基づくアルゴリズムを提案する。提案手法は,顔の構造を維持しつつ,視覚的に心地よい形状の誇張を表現できることを示す。
論文参考訳（メタデータ） (2020-08-12T03:41:49Z)
SPIN: Structure-Preserving Inner Offset Network for Scene Text Recognition [48.676064155070556]
任意テキストの出現は、シーンテキスト認識タスクにおいて大きな課題となる。我々は新しい学習可能な幾何学的非関連モジュールであるStructure-Preserving Inner Offset Network (SPIN)を導入する。 SPINは、ネットワーク内のソースデータの色操作を可能にする。
論文参考訳（メタデータ） (2020-05-27T01:47:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。