論文の概要: Mitigating Long-tail Distribution in Oracle Bone Inscriptions: Dataset, Model, and Benchmark
- arxiv url: http://arxiv.org/abs/2504.09555v2
- Date: Wed, 16 Apr 2025 09:29:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-17 11:15:14.440459
- Title: Mitigating Long-tail Distribution in Oracle Bone Inscriptions: Dataset, Model, and Benchmark
- Title(参考訳): Oracleの骨碑文における長期分布の緩和:データセット、モデル、ベンチマーク
- Authors: Jinhao Li, Zijian Chen, Runze Jiang, Tingzhu Chen, Changbo Wang, Guangtao Zhai,
- Abstract要約: オラクル骨碑文(OBI)の認識は、古代中国の歴史や文化を理解する上で重要な役割を担っている。
既存のOBIデータセットは長期分布の問題に悩まされ、多数派と少数派の間でOBI認識モデルの性能に偏りが生じる。
我々は,OBIの専門家によるドメイン知識を取り入れた14,542枚の画像からなる,OBI生成と復調のための構造整合型OBIデータセットであるOracle-P15Kを紹介する。
- 参考スコア(独自算出の注目度): 36.21507457913964
- License:
- Abstract: The oracle bone inscription (OBI) recognition plays a significant role in understanding the history and culture of ancient China. However, the existing OBI datasets suffer from a long-tail distribution problem, leading to biased performance of OBI recognition models across majority and minority classes. With recent advancements in generative models, OBI synthesis-based data augmentation has become a promising avenue to expand the sample size of minority classes. Unfortunately, current OBI datasets lack large-scale structure-aligned image pairs for generative model training. To address these problems, we first present the Oracle-P15K, a structure-aligned OBI dataset for OBI generation and denoising, consisting of 14,542 images infused with domain knowledge from OBI experts. Second, we propose a diffusion model-based pseudo OBI generator, called OBIDiff, to achieve realistic and controllable OBI generation. Given a clean glyph image and a target rubbing-style image, it can effectively transfer the noise style of the original rubbing to the glyph image. Extensive experiments on OBI downstream tasks and user preference studies show the effectiveness of the proposed Oracle-P15K dataset and demonstrate that OBIDiff can accurately preserve inherent glyph structures while transferring authentic rubbing styles effectively.
- Abstract(参考訳): オラクル骨碑文(OBI)の認識は、古代中国の歴史や文化を理解する上で重要な役割を担っている。
しかし、既存のOBIデータセットは長期分布の問題に悩まされ、多数派と少数派の間でOBI認識モデルの性能に偏りが生じる。
近年, 生成モデルの進歩に伴い, OBI合成に基づくデータ拡張は, マイノリティクラスのサンプルサイズを拡大する上で有望な手段となっている。
残念なことに、現在のOBIデータセットには、生成モデルトレーニングのための大規模な構造整列イメージペアが欠如している。
これらの問題に対処するために,我々はまず,OBI専門家のドメイン知識を取り入れた14,542枚の画像からなる,OBI生成と復調のための構造整合型OBIデータセットであるOracle-P15Kを提示する。
第2に,現実的で制御可能なOBI生成を実現するための拡散モデルに基づく擬似OBI生成器OBIDiffを提案する。
クリーンなグリフ画像とターゲットラビングスタイルの画像とが与えられた場合、元のラビングのノイズスタイルをグリフ画像に効果的に転送することができる。
OBI下流タスクとユーザ嗜好に関する広範な実験は、提案したOracle-P15Kデータセットの有効性を示し、OBIDiffが真正なラビングスタイルを効果的に転送しながら、固有のグリフ構造を正確に保存できることを示した。
関連論文リスト
- OBI-Bench: Can LMMs Aid in Study of Ancient Script on Oracle Bones? [40.226986425846825]
OBIベンチ(OBI-Bench, OBI-Bench, OBI-Bench)は,大口径マルチモーダルモデル(LMM)を全プロセスで評価するための総合的なベンチマークである。
OBI-Benchは、5,523個の細心の注意を払って収集された多様なソース画像を含み、認識、再結合、分類、検索、解読の5つの主要な領域問題をカバーする。
既存のベンチマークとは異なり、OBI-Benchは高度な視覚認識とOBI固有の知識による推論に焦点を当てており、専門家が直面しているようなタスクを実行するためにLMMに挑戦している。
論文 参考訳(メタデータ) (2024-12-02T06:31:28Z) - Unsupervised Attention Regularization Based Domain Adaptation for Oracle Character Recognition [59.05212866862219]
オラクル文字の研究は中国考古学や文献学において重要な役割を担っている。
実世界のスキャンされたオラクル文字の収集と注釈の難しさは、オラクル文字認識の発達を妨げる。
我々は,ラベル付き手書きオラクル文字からラベル付きスキャンデータへの認識知識を伝達するための,新しい教師なしドメイン適応(UDA)手法を開発した。
論文 参考訳(メタデータ) (2024-09-24T09:07:05Z) - Oracle Bone Inscriptions Multi-modal Dataset [58.20314888996118]
オラクルの骨碑文(Oracle bone inscriptions, OBI)は中国最古の書記体系であり、初期の上海の歴史や古史の貴重な実例を記している。
本稿では,10,077個のオラクル骨の注釈情報を含むOracle Bone Inscriptions Multi-modalデータセットを提案する。
このデータセットは、OBIの文字検出と認識、ラビングDenoising、キャラクタマッチング、キャラクタ生成、読み込みシーケンス予測、ミスキャラクタ補完タスクなど、OBIの分野に関連するさまざまなAI関連研究タスクに使用することができる。
論文 参考訳(メタデータ) (2024-07-04T12:47:32Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z) - Oracle Character Recognition using Unsupervised Discriminative
Consistency Network [65.64172835624206]
オラクル文字認識(OrCR)のための新しい教師なしドメイン適応手法を提案する。
擬似ラベルを利用して意味情報を適応と制約強化の整合性に組み込む。
提案手法は,Oracle-241データセットの最先端結果を実現し,最近提案した構造・テクスチャ分離ネットワークを15.1%向上させる。
論文 参考訳(メタデータ) (2023-12-11T02:52:27Z) - GATSBI: Generative Adversarial Training for Simulation-Based Inference [4.279381060273715]
GAN(Generative Adversarial Network)は明確な可能性を必要としない。
GAT SBIは、暗黙の後部分布を学習するための対向的な設定における変分目的を再構成する。
GAT SBIによる推論は、観測によって改善され、高次元の後方空間で機能し、暗黙の先行をサポートする。
論文 参考訳(メタデータ) (2022-03-12T16:33:27Z) - Recognition of Oracle Bone Inscriptions by using Two Deep Learning
Models [0.0]
オラクルの骨碑文(OBI)には、約3000年前に中国で使われた世界最古の文字が含まれている。
本論文は,文化遺産の保存と整理を支援するオンラインOBI認識システムの設計を目的とする。
論文 参考訳(メタデータ) (2021-05-03T12:31:57Z) - MOGAN: Morphologic-structure-aware Generative Learning from a Single
Image [59.59698650663925]
近年,1つの画像のみに基づく生成モデルによる完全学習が提案されている。
多様な外観のランダムなサンプルを生成するMOGANというMOrphologic-structure-aware Generative Adversarial Networkを紹介します。
合理的な構造の維持や外観の変化など、内部機能に重点を置いています。
論文 参考訳(メタデータ) (2021-03-04T12:45:23Z) - Improving Learning Effectiveness For Object Detection and Classification
in Cluttered Backgrounds [6.729108277517129]
本稿では,異種乱雑な背景の学習データセットを自律的に生成するフレームワークを開発する。
提案するフレームワークの学習効率は,複雑で異種な環境で改善されるべきである。
提案フレームワークの性能を実証実験により検討し,COCOデータセットを用いてトレーニングしたモデルと比較した。
論文 参考訳(メタデータ) (2020-02-27T22:28:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。