論文の概要: Scalability in Building Component Data Annotation: Enhancing Facade Material Classification with Synthetic Data
- arxiv url: http://arxiv.org/abs/2404.08557v1
- Date: Fri, 12 Apr 2024 15:54:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-15 14:37:30.561122
- Title: Scalability in Building Component Data Annotation: Enhancing Facade Material Classification with Synthetic Data
- Title(参考訳): コンポーネントデータアノテーション構築におけるスケーラビリティ - 合成データによるファサード素材分類の強化
- Authors: Josie Harrison, Alexander Hollberg, Yinan Yu,
- Abstract要約: Googleストリートビューの画像で訓練されたコンピュータビジョンモデルは、物質カダストを作成することができる。
現在のアプローチでは手動でアノテートされたデータセットが必要です。
本稿では、DALL-Eで生成された合成データセット上でSwin Transformerモデルを微調整し、同様の手動注釈付きデータセットと比較する。
- 参考スコア(独自算出の注目度): 45.981332942020856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computer vision models trained on Google Street View images can create material cadastres. However, current approaches need manually annotated datasets that are difficult to obtain and often have class imbalance. To address these challenges, this paper fine-tuned a Swin Transformer model on a synthetic dataset generated with DALL-E and compared the performance to a similar manually annotated dataset. Although manual annotation remains the gold standard, the synthetic dataset performance demonstrates a reasonable alternative. The findings will ease annotation needed to develop material cadastres, offering architects insights into opportunities for material reuse, thus contributing to the reduction of demolition waste.
- Abstract(参考訳): Googleストリートビューの画像で訓練されたコンピュータビジョンモデルは、物質カダストを作成することができる。
しかし、現在のアプローチでは、入手が難しく、しばしばクラス不均衡を持つ手動のアノテートデータセットが必要である。
これらの課題に対処するため、DALL-Eで生成された合成データセット上でSwin Transformerモデルを微調整し、同様の手動注釈付きデータセットと比較した。
手動のアノテーションは依然として金の標準であるが、合成データセットのパフォーマンスは妥当な代替手段であることを示している。
この発見は、材料カダストリーの開発に必要なアノテーションを緩和し、材料再利用の機会に関するアーキテクトの洞察を提供することで、廃棄廃棄物の削減に寄与する。
関連論文リスト
- Understanding Synthetic Context Extension via Retrieval Heads [51.8869530817334]
本稿では,検索と推論を必要とする3つの長文タスクに対する合成データの微調整について検討する。
合成データに基づいてトレーニングされたモデルは、実際のデータには及ばないが、驚くべきことに、ミスマッチを解釈できる。
我々の結果は、合成データの微調整性能の解釈方法と、長期にわたる実世界の能力学習のためのより良いデータ作成方法に光を当てた。
論文 参考訳(メタデータ) (2024-10-29T17:55:00Z) - Unveiling the Flaws: Exploring Imperfections in Synthetic Data and Mitigation Strategies for Large Language Models [89.88010750772413]
大規模言語モデル(LLM)の学習における高品質なデータ不足問題に対する解決法として,合成データを提案する。
我々の研究は、Q-A(Q-A)ペア、一般的な合成データに関連するこれらの特定の欠陥を掘り下げ、これらの欠陥を軽減するための未学習技術に基づく方法を提案する。
我々の研究は、より堅牢で効率的なLLMトレーニングを促進することを目的として、合成データの効果的な利用に関する重要な洞察を得た。
論文 参考訳(メタデータ) (2024-06-18T08:38:59Z) - JOBSKAPE: A Framework for Generating Synthetic Job Postings to Enhance
Skill Matching [18.94748873243611]
JobSkapeは、スキル・ツー・タコノミーマッチングのための合成データを生成するフレームワークである。
このフレームワーク内では、ジョブ投稿の包括的な合成データセットであるSkillSkapeを作成します。
本稿では,大規模言語モデルを用いたスキル抽出とマッチングタスクのための多段階パイプラインを提案する。
論文 参考訳(メタデータ) (2024-02-05T17:57:26Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Effective Few-Shot Named Entity Linking by Meta-Learning [34.70028855572534]
本稿では,非自明な合成エンティティ-メント対を生成するための新しい弱監督戦略を提案する。
また,各合成実体対に異なる重みを割り当てるメタ学習機構を設計する。
実世界のデータセットの実験により、提案手法は最先端の少数ショットエンティティリンクモデルを大幅に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-12T03:23:02Z) - Unsupervised Opinion Summarization with Content Planning [58.5308638148329]
要約モデルにコンテンツプランニングを明示的に組み込むことで、より高い品質のアウトプットが得られることを示す。
また、より自然な合成データセットを作成し、実世界の文書と要約のペアに似ている。
当社のアプローチは,情報的,一貫性,流動的な要約を生成する上で,競争モデルよりも優れています。
論文 参考訳(メタデータ) (2020-12-14T18:41:58Z) - Assembling Semantically-Disentangled Representations for
Predictive-Generative Models via Adaptation from Synthetic Domain [32.42156485883356]
物理ベースエンジンの助けを借りて意味的に整合した表現を生成可能であることを示す。
提案手法は,実際のデータラベルに依存することなく,人間の顔特性の条件生成モデルを構築することができる。
論文 参考訳(メタデータ) (2020-02-23T03:35:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。