論文の概要: An Evaluation of GPT-4V for Transcribing the Urban Renewal Hand-Written Collection
- arxiv url: http://arxiv.org/abs/2409.09090v1
- Date: Wed, 11 Sep 2024 20:55:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-17 22:18:51.967185
- Title: An Evaluation of GPT-4V for Transcribing the Urban Renewal Hand-Written Collection
- Title(参考訳): GPT-4Vによる都市再生手書きコレクションの書き起こしの評価
- Authors: Myeong Lee, Julia H. P. Hsu,
- Abstract要約: 1960年から1980年の間、都市再生は多くの都市を変革し、手書きの大規模な記録を作った。
2023年11月のGPT-4Vの打ち上げは突破口となり、これらの歴史的都市再生文書の大規模かつ効率的な転写と分析を可能にした。
- 参考スコア(独自算出の注目度): 1.0128808054306186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Between 1960 and 1980, urban renewal transformed many cities, creating vast handwritten records. These documents posed a significant challenge for researchers due to their volume and handwritten nature. The launch of GPT-4V in November 2023 offered a breakthrough, enabling large-scale, efficient transcription and analysis of these historical urban renewal documents.
- Abstract(参考訳): 1960年から1980年の間、都市再生は多くの都市を変革し、手書きの大規模な記録を作った。
これらの文書は、その量と手書きの性質から、研究者にとって大きな課題となった。
2023年11月のGPT-4Vの打ち上げは突破口となり、これらの歴史的都市再生文書の大規模かつ効率的な転写と分析を可能にした。
関連論文リスト
- A Perspective Analysis of Handwritten Signature Technology [7.193142573563886]
手書き署名は、科学コミュニティの議論の中心にある生体特性である。
この視点は、手書き署名に関する過去10年間の文献の体系的なレビューを報告している。
論文 参考訳(メタデータ) (2024-05-22T11:41:19Z) - SAGHOG: Self-Supervised Autoencoder for Generating HOG Features for Writer Retrieval [1.024113475677323]
SAGHOGは、二項化入力画像のHOG特徴を用いた著者検索のための自己教師付き事前学習戦略である。
SAGHOGは、予め訓練されたエンコーダに符号化層としてNetRVLADを付加することにより微調整される。
ヒストリー-WI,HisFrag20,GRK-Papyriの3つの歴史的データセットに対するアプローチの評価は,著者検索におけるSAGHOGの有効性を実証する。
論文 参考訳(メタデータ) (2024-04-26T07:48:00Z) - LOCR: Location-Guided Transformer for Optical Character Recognition [55.195165959662795]
自動回帰中にトランスフォーマーアーキテクチャに位置案内を組み込むモデルであるLOCRを提案する。
125Kの学術文書ページから777万以上のテキスト配置ペアからなるデータセット上でモデルをトレーニングする。
これは、編集距離、BLEU、METEOR、F測定によって測定されたarXivから構築されたテストセットの既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2024-03-04T15:34:12Z) - UrbanKGent: A Unified Large Language Model Agent Framework for Urban Knowledge Graph Construction [4.829677240798159]
都市知識グラフ構築(Urban KGC)は依然として手作業に大きく依存しており、その潜在的な進歩を妨げる。
本稿では,都市知識グラフ構築のための統合型大規模言語モデルエージェントフレームワークであるUrbanKGentを提案する。
論文 参考訳(メタデータ) (2024-02-10T01:50:19Z) - The Challenges of HTR Model Training: Feedback from the Project Donner
le gout de l'archive a l'ere numerique [0.0]
本稿では、トランスクリプティングプロトコルの作成と言語モデルをフルスケールで使用することの影響について報告する。
また、手書きテキスト認識モデルの性能向上を支援するため、ベースモデルを使用する最善の方法も決定する。
論文 参考訳(メタデータ) (2022-12-13T12:42:12Z) - A Contextual Master-Slave Framework on Urban Region Graph for Urban
Village Detection [68.84486900183853]
都市域を階層的にモデル化する都市域グラフ(URG)を構築した。
そこで我々は,都市部をURGから効果的に検出する新しいコンテキスト・マスタ・スレーブ・フレームワークを設計した。
提案手法は,都市部における紫外線検出の一般性と特異性のバランスをとることができる。
論文 参考訳(メタデータ) (2022-11-26T18:17:39Z) - The Monocular Depth Estimation Challenge [74.0535474077928]
本稿では,WACV2103で組織された最初の単分子深度推定チャレンジ(MDEC)の結果を要約する。
この課題は、SynS-Patchesデータセット上での自己教師付き単眼深度推定の進捗を評価した。
論文 参考訳(メタデータ) (2022-11-22T11:04:15Z) - Focused Attention Improves Document-Grounded Generation [111.42360617630669]
文書基盤生成は、文書に提供される情報を用いてテキスト生成を改善するタスクである。
本研究はwikipedia更新生成タスクと対話応答生成という2つの異なる文書基底生成タスクに焦点を当てている。
論文 参考訳(メタデータ) (2021-04-26T16:56:29Z) - StylePTB: A Compositional Benchmark for Fine-grained Controllable Text
Style Transfer [90.6768813620898]
スタイル転送は、ソース文定数からコアの意味を維持しながら、ターゲットのスタイル変更を伴うテキストを制御的に生成することを目的としています。
テキストの原子語彙,構文,セマンティック,セマンティックトランスファーにまたがる21のきめ細かなスタイリスティックな文を含む大規模ベンチマークであるStylePTBを導入する。
StylePTBの既存のメソッドは、細かい変更をモデル化するのに苦労し、複数のスタイルを構成するのにさらに困難です。
論文 参考訳(メタデータ) (2021-04-12T04:25:09Z) - The SpaceNet Multi-Temporal Urban Development Challenge [5.191792224645409]
足跡を構築することは、多くの人道的アプリケーションに有用なプロキシを提供する。
本論文では, 建物のランドスケープ, トラッキング, 変化の検出を精度良く行うための手法の開発について論じる。
競合は、4m解像度でPlanet Labsの衛星画像モザイクの全く新しいオープンソースデータセットを中心にした。
受賞した参加者は、新たに開発されたSpaceNet Change and Object Tracking(SCOT)メトリックで印象的なパフォーマンスを示した。
論文 参考訳(メタデータ) (2021-02-23T22:01:22Z) - Investigating Pretrained Language Models for Graph-to-Text Generation [55.55151069694146]
Graph-to-text生成は、グラフベースのデータから流動的なテキストを生成することを目的としている。
本稿では,3つのグラフ領域,つまり表現,ウィキペディア知識グラフ(KG),科学的なKGについて検討する。
我々は, PLM の BART と T5 が新たな最先端の成果を達成し, タスク適応型事前学習戦略が性能をさらに向上することを示す。
論文 参考訳(メタデータ) (2020-07-16T16:05:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。