論文の概要: POTracker: Optimizing Large Language Models for Standard-Compliant Power Outage Report Generation
- arxiv url: http://arxiv.org/abs/2606.23533v1
- Date: Mon, 22 Jun 2026 16:12:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 18:26:06.691518
- Title: POTracker: Optimizing Large Language Models for Standard-Compliant Power Outage Report Generation
- Title(参考訳): POTracker: 標準準拠の停電レポート生成のための大規模言語モデル最適化
- Authors: Hung Phan, Aniroop Naladala, Dubey Avanindra, Supryia Chinthavali, Lunga Dalton, Ali Jannesari,
- Abstract要約: 大規模言語モデル(LLM)は一般的なテキスト生成に長けているが、ドメイン固有のデータ生成に使用するのは難しい。
電源停止レポート生成のための最適化LDMであるPOTrackerを提案する。
我々は1,000の停電レポートのデータセット上でPOTrackerを評価し、よく知られた5つの微調整アプローチと比較した。
- 参考スコア(独自算出の注目度): 8.009728819049483
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent large language models (LLMs) are good at general text generation, but it is still hard to use them for domain-specific data generation because the output must follow strict formatting and structural rules. Unlike open-ended tasks such as question answering or translation, domain-specific generation must be both semantically correct and compliant with existing guidelines and standards. In this work, we study the nationwide interoperability problem of utility power outage reports in the United States. In practice, outage reports need to be machine-readable (e.g., JSON or XML) and must strictly follow requirements from energy-sector regulatory bodies. To address this problem, we propose POTracker, an optimized LLM for power outage report generation. We fine-tune Qwen2.5-7B-Instruct using our proposed objective. The key contribution is a new loss function, POTrackerLoss, that considers both textual similarity and structural (tag) similarity between the generated report and the ground-truth report. We evaluate POTracker on a dataset of 1,000 power outage reports and compare it with five well-known fine-tuning methods and one rule-based XML conversion method. Results show that POTracker outperforms other fine-tuning approaches, improving overall accuracy by up to 51% and reaching 86.47% structural accuracy for generated power outage reports. In addition, we conduct a human study to assess the quality of the ground-truth standard reports, where domain experts assign the generated labels an average score of 4.03 on a 0--5 scale.
- Abstract(参考訳): 最近の大規模言語モデル(LLM)は、一般的なテキスト生成に長けているが、出力は厳格なフォーマットや構造規則に従う必要があるため、ドメイン固有のデータ生成に使用するのは難しい。
質問応答や翻訳のようなオープンなタスクとは異なり、ドメイン固有の生成は意味論的に正しく、既存のガイドラインや標準に準拠している必要があります。
本研究では,米国における電力停止報告の全国的相互運用問題について検討する。
実際には、障害レポートは機械可読性(例えば、JSONやXML)でなければなりません。
この問題を解決するために,電源停止レポート生成のための最適化LLMであるPOTrackerを提案する。
提案手法を用いてQwen2.5-7Bインストラクションを微調整する。
主要なコントリビューションは、新しい損失関数POTrackerLossである。これは、テキストの類似性と、生成されたレポートと地平線レポートの間の構造(タグ)の類似性の両方を考慮したものである。
我々は1,000の停電レポートのデータセット上でPOTrackerを評価し、よく知られた5つの微調整法と1つのルールベースのXML変換法と比較した。
結果、POTrackerは他の微調整手法よりも優れており、全体の精度は最大51%向上し、発生した停電報告の精度は86.47%に達した。
また,本研究では,0~5スケールで生成したラベルの平均スコア4.03をドメインの専門家が割り当てる,地平標準レポートの品質を評価するための人間による研究を行っている。
関連論文リスト
- LAB-Det: Language as a Domain-Invariant Bridge for Training-Free One-Shot Domain Generalization in Object Detection [53.988759250627425]
物体検出のための訓練不要なワンショット領域一般化を提案する。
我々は各例を、凍結検知器を条件付けし誘導する記述テキストに投影する。
UODD (underwater) と NEU-DET (industrial defects) についての検討
論文 参考訳(メタデータ) (2026-02-06T08:03:04Z) - Standardizing Longitudinal Radiology Report Evaluation via Large Language Model Annotation [10.771534459008699]
放射線学報告における縦断的な情報は、時間とともに複数の検査にまたがる結果のシーケンシャルな追跡を指す。
基盤構造とモデル生成の両テキストの時間的変化を一貫してラベル付けする適切なツールは存在しない。
既存のアノテーションメソッドは、通常労働集約的であり、手動のレキシコンとルールの使用に依存している。
論文 参考訳(メタデータ) (2026-01-23T13:57:09Z) - Advancing Retrieval-Augmented Generation for Structured Enterprise and Internal Data [0.0]
大きな言語モデル(LLM)は強力な生成能力を持つ。
静的事前トレーニング、短いコンテキストウィンドウ、および異種データフォーマットを処理する際の課題によって制限されている。
従来のRetrieval-Augmented Generation (RAG) フレームワークはこれらのギャップのいくつかに対処するが、構造化データや半構造化データに苦慮することが多い。
本研究では,SpaCy NERとクロスエンコーダによるメタデータ認識フィルタリングにより強化された,高密度埋め込み(All-mpnet-base-v2)とBM25を用いたハイブリッド検索戦略を組み合わせた高度なRAGフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-16T17:13:06Z) - Discourse Features Enhance Detection of Document-Level Machine-Generated Content [53.41994768824785]
機械生成コンテンツは、学術プラジャリズムや誤報の拡散といった課題を提起する。
既存のMGC検出器は、しばしば表面レベルの情報のみに焦点を当て、暗黙的かつ構造的な特徴を見渡す。
これらの課題を克服するために、新しい方法論とデータセットを導入します。
論文 参考訳(メタデータ) (2024-12-17T08:47:41Z) - Enhancing IR-based Fault Localization using Large Language Models [5.032687557488094]
本稿では、プログラミングエンティティ、スタックトレース、自然言語テキストに基づいてバグレポートを分類することで、障害局所化(IRFL)を強化する。
クエリの不正確性に対処するため,LLmiRQ+と呼ばれるユーザと対話型クエリ再構成手法を導入する。
6,340件のバグ報告を含む46のプロジェクトの評価では、MRRは0.6770件、MAPは0.5118件であり、7つの最先端IRFL技術を上回っている。
論文 参考訳(メタデータ) (2024-12-04T22:47:51Z) - Beyond Traditional Benchmarks: Analyzing Behaviors of Open LLMs on Data-to-Text Generation [0.0]
データ・トゥ・テキスト(D2T)生成タスクにおけるオープン・大規模言語モデル(LLM)の挙動を解析する。
オープン LLM は,Quintd で収集した共通フォーマットのデータから,ゼロショット設定で,ゆるやかで一貫性のあるテキストを生成することができる。
論文 参考訳(メタデータ) (2024-01-18T18:15:46Z) - T5Score: Discriminative Fine-tuning of Generative Evaluation Metrics [94.69907794006826]
我々は、現在利用可能なデータから、教師なし信号と教師なし信号の両方を用いて、両方の世界のベストを結合するフレームワークを提案する。
このアイデアを,mT5をバックボーンとするトレーニング信号を使用するメトリックであるT5Scoreをトレーニングすることで,運用する。
T5Scoreは、セグメントレベルの既存のトップスコアメトリクスに対して、すべてのデータセットで最高のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-12-12T06:29:04Z) - Grounded Keys-to-Text Generation: Towards Factual Open-Ended Generation [92.1582872870226]
そこで我々は,新しい接地型キー・ツー・テキスト生成タスクを提案する。
タスクは、ガイドキーと接地パスのセットが与えられたエンティティに関する事実記述を生成することである。
近年のQAに基づく評価手法に着想を得て,生成した記述の事実的正当性を示す自動計量MAFEを提案する。
論文 参考訳(メタデータ) (2022-12-04T23:59:41Z) - Evaluation of Transfer Learning for Polish with a Text-to-Text Model [54.81823151748415]
ポーランド語におけるテキスト・テキスト・モデルの質を評価するための新しいベンチマークを導入する。
KLEJベンチマークはテキスト・トゥ・テキスト、en-pl翻訳、要約、質問応答に適応している。
本稿では,ポーランド語のための汎用テキスト・テキスト・ツー・テキスト・モデルであるplT5について述べる。
論文 参考訳(メタデータ) (2022-05-18T09:17:14Z) - Partially-Aligned Data-to-Text Generation with Distant Supervision [69.15410325679635]
我々はPADTG(Partially-Aligned Data-to-Text Generation)と呼ばれる新しい生成タスクを提案する。
自動的にアノテートされたデータをトレーニングに利用し、アプリケーションドメインを大幅に拡張するため、より実用的です。
我々のフレームワークは、全てのベースラインモデルより優れており、部分整合データの利用の可能性を検証する。
論文 参考訳(メタデータ) (2020-10-03T03:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。