論文の概要: PharmaShip: An Entity-Centric, Reading-Order-Supervised Benchmark for Chinese Pharmaceutical Shipping Documents
- arxiv url: http://arxiv.org/abs/2512.23714v1
- Date: Sat, 29 Nov 2025 06:55:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-04 08:45:17.113485
- Title: PharmaShip: An Entity-Centric, Reading-Order-Supervised Benchmark for Chinese Pharmaceutical Shipping Documents
- Title(参考訳): ファーマシップ(PharmaShip):中国製薬品出荷文書のエンティティ中心で読み書きを最適化したベンチマーク
- Authors: Tingwei Xie, Tianyi Zhou, Yonghong Song,
- Abstract要約: PharmaShipは、実世界の中国のスキャンされた医薬品の出荷文書のデータセットです。
PharmaShipは、ノイズの多いOCRとヘテロジニアステンプレートの下で、事前訓練されたテキスト指向モデルをストレステストするために設計されている。
- 参考スコア(独自算出の注目度): 18.836762489296103
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present PharmaShip, a real-world Chinese dataset of scanned pharmaceutical shipping documents designed to stress-test pre-trained text-layout models under noisy OCR and heterogeneous templates. PharmaShip covers three complementary tasks-sequence entity recognition (SER), relation extraction (RE), and reading order prediction (ROP)-and adopts an entity-centric evaluation protocol to minimize confounds across architectures. We benchmark five representative baselines spanning pixel-aware and geometry-aware families (LiLT, LayoutLMv3-base, GeoLayoutLM and their available RORE-enhanced variants), and standardize preprocessing, splits, and optimization. Experiments show that pixels and explicit geometry provide complementary inductive biases, yet neither alone is sufficient: injecting reading-order-oriented regularization consistently improves SER and EL and yields the most robust configuration, while longer positional coverage stabilizes late-page predictions and reduces truncation artifacts. ROP is accurate at the word level but challenging at the segment level, reflecting boundary ambiguity and long-range crossings. PharmaShip thus establishes a controlled, reproducible benchmark for safety-critical document understanding in the pharmaceutical domain and highlights sequence-aware constraints as a transferable bias for structure modeling. We release the dataset at https://github.com/KevinYuLei/PharmaShip.
- Abstract(参考訳): 我々は、ノイズの多いOCRおよび異種テンプレートの下で、事前訓練されたテキストレイアウトモデルをストレステストするために設計された、実世界の中国製医薬品出荷文書のデータセットであるPharmaShipを提示する。
PharmaShipは3つの相補的なタスクシーケンスエンティティ認識(SER)、関係抽出(RE)、読み出し順序予測(ROP)をカバーし、アーキテクチャ間の欠点を最小限に抑えるためにエンティティ中心の評価プロトコルを採用する。
我々は,LLT,LayoutLMv3-base,GeoLayoutLMとそのRORE拡張版にまたがる5つの代表的なベースラインをベンチマークし,前処理,分割,最適化を標準化する。
読み順序指向の正規化を注入することで、SERとELが一貫して改善され、最も堅牢な構成が得られる一方で、より長い位置のカバレッジは、後期の予測を安定化させ、トランケーションアーティファクトを減少させる。
ROPは単語レベルでは正確だがセグメントレベルでは困難であり、境界の曖昧さと長距離横断を反映している。
PharmaShipは、医薬品分野における安全クリティカルな文書理解のための制御された再現可能なベンチマークを確立し、構造モデリングの伝達可能なバイアスとしてシーケンス認識制約を強調している。
データセットはhttps://github.com/KevinYuLei/PharmaShip.comで公開しています。
関連論文リスト
- Limits of Generative Pre-Training in Structured EMR Trajectories with Irregular Sampling [0.7537475180985093]
ファンデーションモデルは、複雑なパターンやモチーフをキャプチャするために自動回帰事前トレーニングを使用して、広大なデータセットでトレーニングされたアーキテクチャを指す。
HIVおよび急性低血圧データセットの経時的ART(Sequence-to-Sequence LSTM)とTransformer(reduced Transformer)の2つの自己回帰モデル(Sequence-to-Sequence LSTM)をトレーニングした。
ランダムな視線間ギャップを介してトレーニング中に制御された不規則性が追加されたが、テストシーケンスは完了しなかった。
どちらも特徴分布を再現したが、クロスフィーチャー構造を保存できなかった。
論文 参考訳(メタデータ) (2025-10-27T00:04:17Z) - Beyond Frequency: Scoring-Driven Debiasing for Object Detection via Blueprint-Prompted Image Synthesis [97.37770785712475]
オブジェクト検出のための世代ベースデバイアスフレームワークを提案する。
提案手法は,未表現オブジェクト群の性能ギャップを著しく狭める。
論文 参考訳(メタデータ) (2025-10-21T02:19:12Z) - Lightweight Baselines for Medical Abstract Classification: DistilBERT with Cross-Entropy as a Strong Default [8.496659173445655]
本研究は, 医療抽象分類法を軽量に評価し, 財政予算の制約下での最大性能の確立を図った。
CE, クラス重み付きCE, 同一トークン化, シーケンス長, スケジュールによる焦点損失の3つの目的を持つBERTベースとDistil BERTを微調整した。
論文 参考訳(メタデータ) (2025-10-11T05:05:21Z) - Exploring the Capabilities of LLM Encoders for Image-Text Retrieval in Chest X-rays [8.019362739504087]
視覚言語による事前訓練は画像とテキストのアライメントが進んでいるが、臨床報告の不均一性によって放射線学の進歩が制限されている。
我々は,大規模言語モデル (LLM) エンコーダが,多様なスタイルにまたがる堅牢な臨床表現を提供できるかどうかを問う。
胸部X線レポート用のドメイン適応エンコーダLLM2VEC4CXRと、このエンコーダとビジョンバックボーンを結合するデュアルトウワーフレームワークLLM2CLIP4CXRを紹介する。
論文 参考訳(メタデータ) (2025-09-17T09:44:59Z) - Graph-KV: Breaking Sequence via Injecting Structural Biases into Large Language Models [63.64507678113921]
構造的帰納バイアスを通して相互作用を管理するグラフ-KVを導入する。
このフレームワークでは、「ターゲット」セグメントは指定された「ソース」セグメントのKV-cacheのみに選択的に参加する。
我々は,(1)直接推論,マルチホップ推論,長期文書理解にまたがる7つのRAGベンチマーク,(2)引用エゴグラフとして構造化された全文科学論文を用いた新しい学術論文QAタスクArxiv-QA,(3)引用ネットワーク内の論文トピック分類の3つのシナリオでグラフ-KVを評価する。
論文 参考訳(メタデータ) (2025-06-09T00:30:08Z) - Test-Time Alignment for Large Language Models via Textual Model Predictive Control [63.508812485566374]
Textual Model Predictive Control (TMPC) は、推論時に大規模言語モデルを調整するために適応された新しい予測計画フレームワークである。
TMPCは、談話レベル翻訳、長文応答生成、プログラム合成の3つの異なるセグメンテーション特性を持つタスクで評価される。
その結果、TMPCはパフォーマンスを継続的に改善し、一般性を強調している。
論文 参考訳(メタデータ) (2025-02-28T07:24:33Z) - PharmacoNet: Accelerating Large-Scale Virtual Screening by Deep
Pharmacophore Modeling [0.0]
我々は,この課題に対処するために,構造に基づく薬剤師範モデリングのためのディープラーニングフレームワークを初めて記述する。
PharmacoNetは最先端の構造に基づくアプローチよりもはるかに高速だが、単純なスコアリング機能では合理的に正確である。
論文 参考訳(メタデータ) (2023-10-01T14:13:09Z) - Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.87489798671155]
構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文 参考訳(メタデータ) (2023-06-20T14:21:58Z) - ZScribbleSeg: Zen and the Art of Scribble Supervised Medical Image
Segmentation [16.188681108101196]
弱い教師付きセグメンテーションにのみスクリブルアノテーションを活用することを提案する。
既存のソリューションは主に注釈付き領域でのみ計算された選択的損失を利用する。
空間的関係と形状を事前にエンコードする正規化項を導入する。
我々は、ZScribbleSegと表記される統合フレームワークに、効率的なスクリブル監視を前者と統合する。
論文 参考訳(メタデータ) (2023-01-12T09:00:40Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。