論文の概要: ProtoSnap: Prototype Alignment for Cuneiform Signs
- arxiv url: http://arxiv.org/abs/2502.00129v1
- Date: Fri, 31 Jan 2025 19:23:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 15:02:28.905225
- Title: ProtoSnap: Prototype Alignment for Cuneiform Signs
- Title(参考訳): ProtoSnap: Cuneiform Signs用のプロトタイプアライメント
- Authors: Rachel Mikulinsky, Morris Alper, Shai Gordin, Enrique Jiménez, Yoram Cohen, Hadar Averbuch-Elor,
- Abstract要約: 偏形符号の微細な内部構成を復元するための教師なし手法を提案する。
当社のアプローチであるProtoSnapは,深部画像の特徴のあるマッチングに対して,構造的一貫性を強制する。
以上の結果から,本手法はプロトタイプの骨格を多種多様な奇形記号に整列させることに成功していると考えられる。
- 参考スコア(独自算出の注目度): 9.529099681105384
- License:
- Abstract: The cuneiform writing system served as the medium for transmitting knowledge in the ancient Near East for a period of over three thousand years. Cuneiform signs have a complex internal structure which is the subject of expert paleographic analysis, as variations in sign shapes bear witness to historical developments and transmission of writing and culture over time. However, prior automated techniques mostly treat sign types as categorical and do not explicitly model their highly varied internal configurations. In this work, we present an unsupervised approach for recovering the fine-grained internal configuration of cuneiform signs by leveraging powerful generative models and the appearance and structure of prototype font images as priors. Our approach, ProtoSnap, enforces structural consistency on matches found with deep image features to estimate the diverse configurations of cuneiform characters, snapping a skeleton-based template to photographed cuneiform signs. We provide a new benchmark of expert annotations and evaluate our method on this task. Our evaluation shows that our approach succeeds in aligning prototype skeletons to a wide variety of cuneiform signs. Moreover, we show that conditioning on structures produced by our method allows for generating synthetic data with correct structural configurations, significantly boosting the performance of cuneiform sign recognition beyond existing techniques, in particular over rare signs. Our code, data, and trained models are available at the project page: https://tau-vailab.github.io/ProtoSnap/
- Abstract(参考訳): この書記制度は、古代近東の知識を三千年以上伝達する媒体として機能した。
キュニフォームの記号は複雑な内部構造を持ち、専門家の古文書分析の主題であり、記号の形状のバリエーションは時代とともに歴史の発展と書物や文化の伝達を目撃するものである。
しかしながら、事前の自動化技術は、手話の型を分類として扱い、非常に多様な内部構成を明示的にモデル化しない。
そこで本研究では,強力な生成モデルとプロトタイプフォント画像の出現と構造を先行として活用することにより,キュニフォーム記号の内部構成の微粒化を再現するための教師なしのアプローチを提案する。
当社のアプローチであるProtoSnapは、深部画像の特徴のあるマッチングに対して構造的整合性を適用して、クニフォーム文字の多様な構成を推定し、スケルトンベースのテンプレートを撮り、クニフォーム記号を撮影する。
我々は、エキスパートアノテーションの新しいベンチマークを提供し、このタスクでメソッドを評価します。
以上の結果から,本手法はプロトタイプの骨格を多種多様な奇形記号に整列させることに成功していると考えられる。
さらに,本手法により生成した構造体に対する条件付けにより,正確な構造構造を持つ合成データの生成が可能となり,既存の技術,特にレアサインよりもクチュニフォーム符号認識の性能が著しく向上することを示す。
私たちのコード、データ、トレーニングされたモデルは、プロジェクトページで利用可能です。
関連論文リスト
- PyPotteryInk: One-Step Diffusion Model for Sketch to Publication-ready Archaeological Drawings [0.0]
PyPotteryInkは、考古学的な陶芸のスケッチを出版可能なインク絵に変換する自動パイプラインだ。
本手法がイタリア原史時代の陶器図面のデータセットに与える影響を実証する。
モデルは、最小限のトレーニングデータで異なる考古学的文脈に適応するように微調整することができる。
論文 参考訳(メタデータ) (2025-02-09T14:03:37Z) - Collaborative decoding of critical tokens for boosting factuality of
large language models [57.504894664689]
微調整および整列モデルでは、命令追従と安全な生成の能力が改善されている。
世代ごとのサンプリングの一般的な実践は、幻覚の確率を増大させる。
我々は、クリティカルトークンの概念を通じて、事前訓練されたモデル内の高い事実性を活用するための協調的復号化フレームワークを導入する。
論文 参考訳(メタデータ) (2024-02-28T01:53:37Z) - Localized Text-to-Image Generation for Free via Cross Attention Control [154.06530917754515]
提案手法は, 推論中のクロスアテンションマップを簡易に制御することで, 局所的な生成が可能であることを示す。
提案するクロスアテンション制御(CAC)は,標準のテキスト・ツー・イメージモデルに対して,新たなオープン語彙のローカライズ機能を提供する。
論文 参考訳(メタデータ) (2023-06-26T12:15:06Z) - Custom Structure Preservation in Face Aging [0.0]
本稿では,顔画像に関連性のある細部を保ちながら構造変化を生成できる顔画像編集のための新しいアーキテクチャを提案する。
本稿では,入力画像のスタイルと内容のアンタングルを解消し,入力画像のスタイルとコンテンツ表現を,出力を目標年齢に条件付けながら組み合わせたスタイルベースの戦略を取り入れた新しいデコーダネットワークを提案する。
論文 参考訳(メタデータ) (2022-07-22T11:58:33Z) - Implicit field supervision for robust non-rigid shape matching [29.7672368261038]
2つの非剛性変形形状の対応を確立することは、ビジュアルコンピューティングにおける最も基本的な問題の1つである。
固定テンプレート上で連続的な形状の変形場を学習する自動デコーダフレームワークに基づく手法を提案する。
本手法は強い人工物の存在下では極めて堅牢であり,任意の形状のカテゴリに一般化することができる。
論文 参考訳(メタデータ) (2022-03-15T07:22:52Z) - Keeping Deep Lithography Simulators Updated: Global-Local Shape-Based
Novelty Detection and Active Learning [21.947570061670397]
学習に基づくプレシミュレートモデルでは,ICレイアウトから製造回路への加工誘起形状変形が予測される。
モデルトレーニングと更新のために、すべてのレイアウトクリップの参照形状画像を集めるのは高価で時間がかかる。
本稿では,新しい(目に見えない)レイアウトパターンを識別するための,ディープラーニングに基づくレイアウトノベルティ検出手法を提案する。
論文 参考訳(メタデータ) (2022-01-24T14:50:30Z) - Scalable Font Reconstruction with Dual Latent Manifolds [55.29525824849242]
タイポグラフィー解析とフォント再構成を行う深層生成モデルを提案する。
このアプローチによって、効果的にモデル化できるキャラクタの種類を大規模にスケールアップすることが可能になります。
多くの言語の文字タイプを表す様々なデータセット上でフォント再構成のタスクを評価する。
論文 参考訳(メタデータ) (2021-09-10T20:37:43Z) - Style Curriculum Learning for Robust Medical Image Segmentation [62.02435329931057]
深部セグメンテーションモデルは、トレーニングデータセットとテストデータセットの間の画像強度の分散シフトによって、しばしば劣化する。
本稿では,そのような分散シフトが存在する場合に,ロバストなセグメンテーションを確保するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-01T08:56:24Z) - Improving Label Quality by Jointly Modeling Items and Annotators [68.8204255655161]
雑音アノテータから基底真理ラベルを学習するための完全ベイズ的枠組みを提案する。
我々のフレームワークは、ラベル分布上の生成的ベイズソフトクラスタリングモデルを古典的なDavidとSkeneのジョイントアノテータデータモデルに分解することでスケーラビリティを保証する。
論文 参考訳(メタデータ) (2021-06-20T02:15:20Z) - CoSE: Compositional Stroke Embeddings [52.529172734044664]
本稿では、ストロークベースの描画タスクのような複雑な自由形式構造に対する生成モデルを提案する。
我々のアプローチは、自動補完図のようなインタラクティブなユースケースに適している。
論文 参考訳(メタデータ) (2020-06-17T15:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。