論文の概要: PARROT: An Open Multilingual Radiology Reports Dataset
- arxiv url: http://arxiv.org/abs/2507.22939v1
- Date: Fri, 25 Jul 2025 07:54:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-01 17:19:08.316046
- Title: PARROT: An Open Multilingual Radiology Reports Dataset
- Title(参考訳): PARROT: オープンな多言語ラジオロジーレポート
- Authors: Bastien Le Guellec, Kokou Adambounou, Lisa C Adams, Thibault Agripnidis, Sung Soo Ahn, Radhia Ait Chalal, Tugba Akinci D Antonoli, Philippe Amouyel, Henrik Andersson, Raphael Bentegeac, Claudio Benzoni, Antonino Andrea Blandino, Felix Busch, Elif Can, Riccardo Cau, Armando Ugo Cavallo, Christelle Chavihot, Erwin Chiquete, Renato Cuocolo, Eugen Divjak, Gordana Ivanac, Barbara Dziadkowiec Macek, Armel Elogne, Salvatore Claudio Fanni, Carlos Ferrarotti, Claudia Fossataro, Federica Fossataro, Katarzyna Fulek, Michal Fulek, Pawel Gac, Martyna Gachowska, Ignacio Garcia Juarez, Marco Gatti, Natalia Gorelik, Alexia Maria Goulianou, Aghiles Hamroun, Nicolas Herinirina, Krzysztof Kraik, Dominik Krupka, Quentin Holay, Felipe Kitamura, Michail E Klontzas, Anna Kompanowska, Rafal Kompanowski, Alexandre Lefevre, Tristan Lemke, Maximilian Lindholz, Lukas Muller, Piotr Macek, Marcus Makowski, Luigi Mannacio, Aymen Meddeb, Antonio Natale, Beatrice Nguema Edzang, Adriana Ojeda, Yae Won Park, Federica Piccione, Andrea Ponsiglione, Malgorzata Poreba, Rafal Poreba, Philipp Prucker, Jean Pierre Pruvo, Rosa Alba Pugliesi, Feno Hasina Rabemanorintsoa, Vasileios Rafailidis, Katarzyna Resler, Jan Rotkegel, Luca Saba, Ezann Siebert, Arnaldo Stanzione, Ali Fuat Tekin, Liz Toapanta Yanchapaxi, Matthaios Triantafyllou, Ekaterini Tsaoulia, Evangelia Vassalou, Federica Vernuccio, Johan Wasselius, Weilang Wang, Szymon Urban, Adrian Wlodarczak, Szymon Wlodarczak, Andrzej Wysocki, Lina Xu, Tomasz Zatonski, Shuhang Zhang, Sebastian Ziegelmayer, Gregory Kuchcinski, Keno K Bressem,
- Abstract要約: PARROTは、複数の言語にまたがる架空の放射線学レポートの大きな、多中心的でオープンアクセスデータセットである。
このデータセットは、21か国と13の言語にわたる76人の著者による2,658の放射線学レポートで構成されている。
- 参考スコア(独自算出の注目度): 23.87266865056347
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Rationale and Objectives: To develop and validate PARROT (Polyglottal Annotated Radiology Reports for Open Testing), a large, multicentric, open-access dataset of fictional radiology reports spanning multiple languages for testing natural language processing applications in radiology. Materials and Methods: From May to September 2024, radiologists were invited to contribute fictional radiology reports following their standard reporting practices. Contributors provided at least 20 reports with associated metadata including anatomical region, imaging modality, clinical context, and for non-English reports, English translations. All reports were assigned ICD-10 codes. A human vs. AI report differentiation study was conducted with 154 participants (radiologists, healthcare professionals, and non-healthcare professionals) assessing whether reports were human-authored or AI-generated. Results: The dataset comprises 2,658 radiology reports from 76 authors across 21 countries and 13 languages. Reports cover multiple imaging modalities (CT: 36.1%, MRI: 22.8%, radiography: 19.0%, ultrasound: 16.8%) and anatomical regions, with chest (19.9%), abdomen (18.6%), head (17.3%), and pelvis (14.1%) being most prevalent. In the differentiation study, participants achieved 53.9% accuracy (95% CI: 50.7%-57.1%) in distinguishing between human and AI-generated reports, with radiologists performing significantly better (56.9%, 95% CI: 53.3%-60.6%, p<0.05) than other groups. Conclusion: PARROT represents the largest open multilingual radiology report dataset, enabling development and validation of natural language processing applications across linguistic, geographic, and clinical boundaries without privacy constraints.
- Abstract(参考訳): Rationale and Objectives: PARROT (Polyglottal Annotated Radiology Reports for Open Testing) を開発、検証するために、複数の言語にまたがる多言語でオープンアクセス可能な架空の放射線学レポートのデータセットである。
資料と方法:2024年5月から9月にかけて、放射線学者は標準的な報告の慣行に従って、架空の放射線学レポートの提出を依頼された。
コントリビューターは、解剖学的領域、画像のモダリティ、臨床状況、非英語のレポート、英訳などの関連メタデータを少なくとも20件提供した。
全ての報告はICD-10コードに割り当てられた。
人対AIレポートの差別化調査は、154人の参加者(放射線学者、医療専門家、非医療専門家)によって実施され、報告が人間によるものであるか、AIによって生成されたかが評価された。
結果: このデータセットは21か国と13の言語で76人の著者から2,658件の放射線学レポートで構成されている。
複数の画像モダリティ(CT: 36.1%、MRI: 22.8%、X線撮影: 19.0%、超音波: 16.8%、解剖学的領域: 胸部(19.9%)、腹部(18.6%)、頭部(17.3%)、骨盤(14.1%)をカバーしている。
分化研究において、被験者は人間とAIが生成するレポートを区別して53.9%の精度(95% CI: 50.7%-57.1%)を達成し、放射線学者は他のグループよりもはるかに優れた成績(56.9%、95% CI: 53.3%-60.6%、p<0.05)を得た。
結論: PARROTは、言語、地理的、臨床の境界を越えて自然言語処理アプリケーションの開発と検証を可能にする、最大規模のオープン多言語ラジオロジーレポートデータセットである。
関連論文リスト
- Development of a Large-scale Dataset of Chest Computed Tomography Reports in Japanese and a High-performance Finding Classification Model [4.989937142229914]
大規模言語モデルの最近の進歩は、高品質な多言語医療データセットの必要性を強調している。
我が国はCTスキャナの展開と利用を世界中にリードしているが,大規模な放射線学データセットの欠如により,医用画像解析のための特化言語モデルの開発が妨げられている。
われわれは,CT-BERT-JPNを「tohoku-nlp/bert-base-japanese-v3」アーキテクチャで構築した。
論文 参考訳(メタデータ) (2024-12-20T13:59:11Z) - MGH Radiology Llama: A Llama 3 70B Model for Radiology [50.42811030970618]
本稿では,高度な放射線学に焦点を当てた大規模言語モデルMGH Radiology Llamaを提案する。
Llama 3 70Bモデルを使用して開発され、Radiology-GPTやRadiology-Llama2といった従来のドメイン固有モデルをベースにしている。
従来の指標とGPT-4に基づく評価の両方を取り入れた評価では,汎用LLMよりも高い性能を示す。
論文 参考訳(メタデータ) (2024-08-13T01:30:03Z) - RaDialog: A Large Vision-Language Model for Radiology Report Generation and Conversational Assistance [49.04445246682948]
会話型AIツールは、所定の医療画像に対して臨床的に正しい放射線学レポートを生成し、議論することができる。
RaDialogは、ラジオロジーレポート生成と対話ダイアログのための、初めて徹底的に評価され、公開された大きな視覚言語モデルである。
本手法は,報告生成における最先端の臨床的正確性を実現し,報告の修正や質問への回答などのインタラクティブなタスクにおいて,印象的な能力を示す。
論文 参考訳(メタデータ) (2023-11-30T16:28:40Z) - Consensus, dissensus and synergy between clinicians and specialist
foundation models in radiology report generation [32.26270073540666]
世界中の放射線技師の不足は専門家のケアへのアクセスを制限し、重労働を課している。
視覚言語モデルを用いた自動レポート生成の最近の進歩は、状況を改善するための明確な可能性を示唆している。
我々は、胸部X線写真のための最新のレポート生成システム、textitFlamingo-CXRを構築し、放射線学データに基づくよく知られた視覚言語基盤モデルを微調整する。
論文 参考訳(メタデータ) (2023-11-30T05:38:34Z) - ChatRadio-Valuer: A Chat Large Language Model for Generalizable
Radiology Report Generation Based on Multi-institution and Multi-system Data [115.0747462486285]
ChatRadio-Valuerは、一般化可能な表現を学習する自動放射線学レポート生成のための調整されたモデルである。
本研究で利用した臨床データセットは,textbf332,673の顕著な総計を含む。
ChatRadio-Valuerは、最先端のモデル、特にChatGPT(GPT-3.5-Turbo)やGPT-4などより一貫して優れている。
論文 参考訳(メタデータ) (2023-10-08T17:23:17Z) - Multilingual Natural Language Processing Model for Radiology Reports --
The Summary is all you need! [2.4910932804601855]
マルチリンガルテキスト・トゥ・テキスト・トランスフォーマに基づくモデルを微調整することで、放射線学印象の生成を自動化した。
ブラインドテストでは、2人の放射線学者が、システム生成サマリーのうち少なくとも70%は、品質が対応する人文サマリーと一致または上回っていることを示した。
本研究は,複数の言語モデルにおいて,放射線学レポートの要約に特化している他のモデルと,特に放射線学レポートの要約に特化していないモデルとを比較検討した。
論文 参考訳(メタデータ) (2023-09-29T19:20:27Z) - Radiology-Llama2: Best-in-Class Large Language Model for Radiology [71.27700230067168]
本稿では,ラジオロジーに特化した大規模言語モデルであるRadiology-Llama2を紹介する。
MIMIC-CXRとOpenIデータセットのROUGEメトリクスを用いた定量的評価は、Radiology-Llama2が最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2023-08-29T17:44:28Z) - Radiology-GPT: A Large Language Model for Radiology [74.07944784968372]
本稿では,ラジオロジーのための大規模言語モデルであるRadiology-GPTを紹介する。
StableLM、Dolly、LLaMAといった一般的な言語モデルと比較して、優れたパフォーマンスを示している。
放射線診断、研究、通信において大きな汎用性を示す。
論文 参考訳(メタデータ) (2023-06-14T17:57:24Z) - Act Like a Radiologist: Radiology Report Generation across Anatomical Regions [50.13206214694885]
X-RGenは6つの解剖学的領域にわたる放射線学者によるレポート生成フレームワークである。
X-RGenでは、ヒトの放射線学者の行動を模倣し、これらを4つの主要な段階に分解する。
画像エンコーダの認識能力は,各領域にまたがる画像やレポートを分析して向上する。
論文 参考訳(メタデータ) (2023-05-26T07:12:35Z) - Event-based clinical findings extraction from radiology reports with
pre-trained language model [0.22940141855172028]
今回,臨床所見を付加した新しい放射線診断報告のコーパスを報告する。
金の標準コーパスには合計500点の注記CTレポートが含まれていた。
BERTを含む2つの最先端ディープラーニングアーキテクチャを用いて、トリガと引数のエンティティを抽出した。
論文 参考訳(メタデータ) (2021-12-27T05:03:10Z) - RadGraph: Extracting Clinical Entities and Relations from Radiology
Reports [6.419031003699479]
RadGraphは、フルテキストの胸部X線診断レポートにおけるエンティティと関係のデータセットである。
我々のデータセットは、胸部X線写真にリンクした際のコンピュータビジョンやマルチモーダル学習と同様に、医療自然言語処理の幅広い研究を促進することができる。
論文 参考訳(メタデータ) (2021-06-28T08:24:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。