論文の概要: BIRD: Bronze Inscription Restoration and Dating
- arxiv url: http://arxiv.org/abs/2511.01589v1
- Date: Mon, 03 Nov 2025 13:57:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:27.28179
- Title: BIRD: Bronze Inscription Restoration and Dating
- Title(参考訳): BIRD:青銅の銘文復元・日付
- Authors: Wenjie Hua, Hoang H. Nguyen, Gangyan Ge,
- Abstract要約: 中国初期の青銅の碑文は断片的であり、現在までには困難である。
BIRD(Bronze Inscription Restoration and Dating)は,標準的な学術書写と時系列ラベルを基盤とした,完全符号化されたデータセットである。
- 参考スコア(独自算出の注目度): 2.409989347118351
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bronze inscriptions from early China are fragmentary and difficult to date. We introduce BIRD(Bronze Inscription Restoration and Dating), a fully encoded dataset grounded in standard scholarly transcriptions and chronological labels. We further propose an allograph-aware masked language modeling framework that integrates domain- and task-adaptive pretraining with a Glyph Net (GN), which links graphemes and allographs. Experiments show that GN improves restoration, while glyph-biased sampling yields gains in dating.
- Abstract(参考訳): 中国初期の青銅の碑文は断片的であり、現在までには困難である。
BIRD(Bronze Inscription Restoration and Dating)は,標準的な学術書写と時系列ラベルを基盤とした,完全符号化されたデータセットである。
さらに,アログラフとアログラフをリンクするGlyph Net(GN)を用いて,ドメイン適応型およびタスク適応型事前学習を統合するアログラフ対応マスキング言語モデリングフレームワークを提案する。
実験により、GNは修復を改善し、グリフバイアスサンプリングは年代測定で利益を得ることが示された。
関連論文リスト
- Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - CG-RAG: Research Question Answering by Citation Graph Retrieval-Augmented LLMs [9.718354494802002]
CG-RAG(Contextualized Graph Retrieval-Augmented Generation)は、グラフ構造に疎密な検索信号を統合する新しいフレームワークである。
まず、引用グラフの文脈グラフ表現を提案し、文書内および文書間の明示的および暗黙的な接続を効果的にキャプチャする。
次にLexical-Semantic Graph Retrieval(LeSeGR)を提案する。
第3に,検索したグラフ構造化情報を利用した文脈認識生成手法を提案する。
論文 参考訳(メタデータ) (2025-01-25T04:18:08Z) - LogogramNLP: Comparing Visual and Textual Representations of Ancient Logographic Writing Systems for NLP [30.804518354947565]
記録データの大部分は、転写がないため、純粋に視覚的に持続する。
この問題は、NLPツールキットを古代のログ言語研究に応用しようとする研究者にとってボトルネックとなる。
我々は,古代のログ言語のNLP解析を可能にする最初のベンチマークであるLogogramNLPを紹介する。
論文 参考訳(メタデータ) (2024-08-08T17:58:06Z) - Select and Reorder: A Novel Approach for Neural Sign Language Production [35.35777909051466]
手話は、しばしば低リソース言語に分類されるが、正確な翻訳を実現する上で大きな課題に直面している。
本稿では,Select and Reorder(S&R)について紹介する。Gross Selection(GS)とGross Reordering(GR)の2つのステップに分割することで,データ不足に対処する新しいアプローチである。
我々は,Meine DGS Annotated (mDGS)データセット上で,最先端のBLEUとRogeスコアを達成し,テキスト・トゥ・グロス(T2G)翻訳において37.88%のBLUE-1が大幅に改善されたことを示す。
論文 参考訳(メタデータ) (2024-04-17T16:25:19Z) - Gloss-free Sign Language Translation: Improving from Visual-Language
Pretraining [56.26550923909137]
Gloss-Free Sign Language Translation (SLT) はドメイン横断性のために難しい課題である。
視覚言語事前学習(GFSLT-)に基づく新しいGross-free SLTを提案する。
i) コントラスト言語-画像事前学習とマスク付き自己教師付き学習を統合して,視覚的表現とテキスト的表現のセマンティックギャップをブリッジするプレタスクを作成し,マスク付き文を復元すること,(ii) 事前訓練されたビジュアルおよびテキストデコーダのパラメータを継承するエンコーダ-デコーダ-のような構造を持つエンドツーエンドアーキテクチャを構築すること,である。
論文 参考訳(メタデータ) (2023-07-27T10:59:18Z) - Cross-modality Data Augmentation for End-to-End Sign Language Translation [66.46877279084083]
エンドツーエンド手話翻訳(SLT)は、手話動画を中間表現なしで直接音声言語テキストに変換することを目的としている。
署名ビデオとテキスト間のモダリティのギャップとラベル付きデータの不足のため、これは難しい課題だった。
本稿では,強力な光沢からテキストへの翻訳機能をエンドツーエンドの手話翻訳に変換するための,新しいクロスモダリティデータ拡張(XmDA)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-18T16:34:18Z) - Complex Handwriting Trajectory Recovery: Evaluation Metrics and
Algorithm [10.642342653937794]
そこで我々は,様々なストローク幅の影響を排除したアダプティブ・コンベンション(AIoU)と,トラジェクティブ・ポイントアライメント問題を解決する長さ非依存動的時間ワープ(LDTW)という2つの新しい指標を考案した。
次に、複雑なグリフと長い軌跡を持つ文字に対して、PEN-Net(Parsing-and-tracing ENcoder-decoder Network)と呼ばれる新しい手書き軌道復元モデルを提案する。
実験の結果,AIoU と LDTW の2つの新しい指標は,手書き軌道復元の精度を真に評価できることがわかった。
論文 参考訳(メタデータ) (2022-10-28T03:57:07Z) - One-shot Compositional Data Generation for Low Resource Handwritten Text
Recognition [10.473427493876422]
低リソース手書きテキスト認識は、わずかな注釈付きデータと非常に限られた言語情報のために難しい問題です。
本稿では,ベイズプログラム学習に基づくデータ生成手法を用いてこの問題に対処する。
大量の注釈付き画像を必要とする従来型の手法とは対照的に,各記号のサンプルを1つだけ,所望のアルファベットから生成することが可能である。
論文 参考訳(メタデータ) (2021-05-11T18:53:01Z) - Promoting Graph Awareness in Linearized Graph-to-Text Generation [72.83863719868364]
局所グラフ構造を符号化する線形化モデルの能力を検討する。
本研究は,モデルの暗黙のグラフ符号化の品質を高めるための解法である。
これらの消音足場は、低リソース設定における下流生成の大幅な改善につながることが分かりました。
論文 参考訳(メタデータ) (2020-12-31T18:17:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。