論文の概要: A Public Ground-Truth Dataset for Handwritten Circuit Diagram Images
- arxiv url: http://arxiv.org/abs/2107.10373v1
- Date: Wed, 21 Jul 2021 22:10:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-23 12:54:45.810343
- Title: A Public Ground-Truth Dataset for Handwritten Circuit Diagram Images
- Title(参考訳): 手書き回路図画像のための公開基底データセット
- Authors: Felix Thoma, Johannes Bayer, Yakun Li
- Abstract要約: データセットは、12の起草者による144の回路の1152のイメージと48の563のアノテーションで構成されている。
個々の電気部品には、バウンディングボックスと45のクラスラベルのうち1つがアノテートされている。
この課題から生じる幾何学的・分類学的問題や、クラス自体や外観の統計が述べられている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The development of digitization methods for line drawings (especially in the
area of electrical engineering) relies on the availability of publicly
available training and evaluation data. This paper presents such an image set
along with annotations. The dataset consists of 1152 images of 144 circuits by
12 drafters and 48 563 annotations. Each of these images depicts an electrical
circuit diagram, taken by consumer grade cameras under varying lighting
conditions and perspectives. A variety of different pencil types and surface
materials has been used. For each image, all individual electrical components
are annotated with bounding boxes and one out of 45 class labels. In order to
simplify a graph extraction process, different helper symbols like junction
points and crossovers are introduced, while texts are annotated as well. The
geometric and taxonomic problems arising from this task as well as the classes
themselves and statistics of their appearances are stated. The performance of a
standard Faster RCNN on the dataset is provided as an object detection
baseline.
- Abstract(参考訳): 線画(特に電気工学の分野で)のデジタル化手法の開発は、公開されているトレーニングや評価データの利用可能性に依存している。
本稿ではアノテーションとともにそのようなイメージを提示する。
データセットは、12の起草者による144の回路の1152の画像と48の563のアノテーションで構成されている。
これらの画像はそれぞれ、照明条件や視点の異なる消費者グレードカメラによって撮影された電気回路図を描いている。
様々な種類の鉛筆や表面材料が使用されている。
各画像に対して、個々の電気部品にはバウンディングボックスと45種類のラベルのうちの1つがアノテートされる。
グラフ抽出プロセスを単純化するために、接合点やクロスオーバーといった異なるヘルパーシンボルが導入され、テキストも注釈付けされる。
この課題から生じる幾何学的・分類学的問題や、クラス自体や外観の統計が述べられている。
データセット上での標準のFaster RCNNのパフォーマンスは、オブジェクト検出ベースラインとして提供される。
関連論文リスト
- Modular Graph Extraction for Handwritten Circuit Diagram Images [5.780326596446099]
手描きの回路図は現在も教育分野で使われており、訓練生や学生がこの種の図を描くことを学ぶための容易な手段となっている。
デジタル回路表現の能力を活用するためには、グラフィックから電気グラフを抽出する自動手段が必要である。
本稿では、個別のサブタスクに対するアプローチを評価して新しいベースラインを形成する、大規模でパブリックなデータセット上のモジュラー・エンド・ツー・エンドのソリューションについて述べる。
論文 参考訳(メタデータ) (2024-02-16T21:39:28Z) - Stellar: Systematic Evaluation of Human-Centric Personalized
Text-to-Image Methods [52.806258774051216]
我々は,個々のイメージを入力し,生成プロセスの基盤となるテキストと,所望の視覚的コンテキストを記述したテキストに焦点をあてる。
我々は,既存の関連するデータセットよりも桁違いの大きさの個人画像と,リッチなセマンティックな接地真実アノテーションが容易に利用できるパーソナライズされたプロンプトを含む標準化データセット(Stellar)を紹介した。
被験者ごとにテストタイムの微調整を必要とせず,新しいSoTAを定量的かつ人為的に設定した,シンプルで効率的でパーソナライズされたテキスト・ツー・イメージのベースラインを導出する。
論文 参考訳(メタデータ) (2023-12-11T04:47:39Z) - Learning Dense Correspondences between Photos and Sketches [6.2420740599184175]
人間は、スケッチと現実世界のオブジェクトの関連性を、たとえこれらのスケッチが現実的ではないとしても、しっかりと把握します。
我々は新しいスケッチ写真対応ベンチマークである$textitPSC6k$を導入し、125のオブジェクトカテゴリにわたる6250枚のスケッチ写真ペアの150Kアノテーションを含む。
次に,スケッチ・フォト・ペア間の密接な対応を学習するための自己教師付き手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T17:45:40Z) - Instance Segmentation Based Graph Extraction for Handwritten Circuit
Diagram Images [4.365209337828563]
本稿では, インスタンス分割とキーポイント抽出の手法を用いて, 電気的成分(端末とテキストの記述を含む)を抽出するアプローチについて述べる。
得られたグラフ抽出プロセスは、モデル推論と自明な幾何学的キーポイントマッチングの2段階からなる。
論文 参考訳(メタデータ) (2023-01-09T03:00:20Z) - Using a Conditional Generative Adversarial Network to Control the
Statistical Characteristics of Generated Images for IACT Data Analysis [55.41644538483948]
画像のプロパティの値に応じて、画像を複数のクラスに分割し、新しい画像を生成する際に必要なクラスを指定する。
大気圧チェレンコフ望遠鏡(IACT)の画像の場合、重要な点は全画像ピクセル(画像サイズ)の明るさである。
我々は,TAIGA-IACT実験で得られた画像と類似した画像を生成するために,cGAN技術を使用した。
論文 参考訳(メタデータ) (2022-11-28T22:30:33Z) - I Know What You Draw: Learning Grasp Detection Conditioned on a Few
Freehand Sketches [74.63313641583602]
そこで本研究では,スケッチ画像に関連のある潜在的な把握構成を生成する手法を提案する。
私たちのモデルは、現実世界のアプリケーションで簡単に実装できるエンドツーエンドで訓練され、テストされています。
論文 参考訳(メタデータ) (2022-05-09T04:23:36Z) - Learning to generate line drawings that convey geometry and semantics [22.932131011984513]
本稿では,写真から線画を作成する方法を提案する。
線画はシーン情報のエンコーディングであり,3次元形状と意味的意味を伝達しようとする。
線描画の画像特徴から深度情報を予測する幾何学的損失と、線描画のCLIP特徴と対応する写真とを一致させる意味的損失を導入する。
論文 参考訳(メタデータ) (2022-03-23T19:27:41Z) - Using Text to Teach Image Retrieval [47.72498265721957]
ニューラルネットワークを用いて学習した画像の特徴空間をグラフとして表現するために,画像多様体の概念に基づいて構築する。
我々は、幾何学的に整列したテキストで多様体のサンプルを増補し、大量の文を使って画像について教える。
実験結果から, 結合埋め込み多様体は頑健な表現であり, 画像検索を行うためのより良い基礎となることが示唆された。
論文 参考訳(メタデータ) (2020-11-19T16:09:14Z) - Semantically Tied Paired Cycle Consistency for Any-Shot Sketch-based
Image Retrieval [55.29233996427243]
ローショットスケッチに基づく画像検索はコンピュータビジョンの新たな課題である。
本稿では,ゼロショットおよび少数ショットのスケッチベース画像検索(SBIR)タスクについて述べる。
これらの課題を解決するために,SEM-PCYC(SEM-PCYC)を提案する。
以上の結果から,Sketchy,TU-Berlin,QuickDrawのデータセットを拡張したバージョンでは,最先端の撮影性能が大幅に向上した。
論文 参考訳(メタデータ) (2020-06-20T22:43:53Z) - SketchDesc: Learning Local Sketch Descriptors for Multi-view
Correspondence [68.63311821718416]
我々はマルチビュースケッチ対応の問題について検討し、同じオブジェクトの異なるビューを持つ複数のフリーハンドスケッチを入力として扱う。
異なる視点における対応する点の視覚的特徴は、非常に異なる可能性があるため、この問題は困難である。
我々は、深層学習アプローチを採用し、データから新しいローカルスケッチ記述子を学習する。
論文 参考訳(メタデータ) (2020-01-16T11:31:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。