DR Tulu: Reinforcement Learning with Evolving Rubrics for Deep Research [152.2] ディープ・リサーチ・モデルは、多段階の研究を行い、長文でよく理解された回答を生成する。
ほとんどのオープンディープリサーチモデルは、検証可能な報酬を伴う強化学習を通じて、短い形式のQAタスクで訓練されている。
我々は、オープンエンドで長期のディープリサーチのために直接訓練された最初のオープンモデルであるDeep Research Tulu (DR Tulu-8B)を開発した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:35:54 GMT)
Deep Research: A Systematic Survey [118.8] Deep Research (DR)は、大規模言語モデルの推論能力と検索エンジンなどの外部ツールを組み合わせることを目的としている。
本調査は,深層研究システムの包括的かつ体系的な概要を提示する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:28:28 GMT)
Rethinking Long-tailed Dataset Distillation: A Uni-Level Framework with Unbiased Recovery and Relabeling [105.9] トラジェクトリに基づく手法の限界を再考することにより,長い尾のデータセット蒸留を再考する。
統計的アライメントの観点からバイアスをモデル化し、公正な監督を復元する。
提案手法は,CIFAR-100-LTで15.6%,Tiny-ImageNet-LTで11.8%向上する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:57:01 GMT)
Dual-Granularity Semantic Prompting for Language Guidance Infrared Small Target Detection [102.1] 限られた特徴表現と厳しい背景干渉のため、赤外線小目標検出は依然として困難である。
エンドツーエンドの言語プロンプト駆動フレームワークであるDGSPNetを提案する。
提案手法は検出精度を大幅に向上し、3つのベンチマークデータセットの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:58:23 GMT)
ThreadWeaver: Adaptive Threading for Efficient Parallel Reasoning in Language Models [99.7] 適応並列推論のためのフレームワークThreadWeaverを紹介します。
ThreadWeaverは、同等サイズの一般的なシーケンシャル推論モデルと同等の精度を達成する。
ThreadWeaverはトークンのレイテンシの平均速度を最大1.53倍にします。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:55:59 GMT)
Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models [97.6] 本研究の目的は、SLMのリアルタイムレイテンシの主要な決定要因を特定し、SLMの設計とトレーニングのための一般化可能な原則と方法論を提供することである。
我々はNemotron-Flashと呼ばれるハイブリッドSLMの新たなファミリーを導入し、最先端SLMの精度・効率のフロンティアを大幅に向上させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:46:36 GMT)
DiP: Taming Diffusion Models in Pixel Space [91.5] Diffusion Transformer (DiT) バックボーンは、効率的なグローバル構造構築のために大きなパッチで動作する。
共同トレーニングされた軽量パッチディーラーヘッドは、コンテキスト機能を活用して、きめ細かいローカル詳細を復元する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:55:49 GMT)
DriveFlow: Rectified Flow Adaptation for Robust 3D Object Detection in Autonomous Driving [85.1] DriveFlowは、自律運転におけるデータ強化をトレーニングするためのRectified Flow Adaptation法である。
これは、精密な3次元オブジェクト形状を維持するために、フォアグラウンドの高周波アライメント損失を組み込む。
また、バックグラウンドをデュアル周波数で最適化し、編集の柔軟性とセマンティック一貫性のバランスをとる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:12:43 GMT)
FlowSteer: Guiding Few-Step Image Synthesis with Authentic Trajectories [82.9] ReFlowはフローマッチングと理論的に整合性があるが、現実的なシナリオでは最適ではない。
本研究では,ReFlowをベースとした蒸留手法であるFlowSteerを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:13:23 GMT)
HiGFA: Hierarchical Guidance for Fine-grained Data Augmentation with Diffusion Models [82.1] 生成拡散モデルは、データ拡張の約束を示す。
きめ細かいタスクにそれらを適用することは、重大な課題である。
HiGFAは階層的な信頼性駆動型オーケストレーションであり、多様なが忠実な合成画像を生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:31:40 GMT)
In-Video Instructions: Visual Signals as Generative Control [79.4] フレーム内に埋め込まれた視覚信号を命令として解釈することにより、制御可能な画像・映像生成に機能を利用することができるかを検討する。
In-Video Instructionは、オーバーレイテキスト、矢印、軌跡などの要素を通じて、視覚領域に直接ユーザーガイダンスをエンコードする。
Veo 3.1、Kling 2.5、Wan 2.2を含む最先端の3つのジェネレータの実験では、ビデオモデルがそのような視覚的に埋め込まれた命令を確実に解釈し実行できることが示されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:38:45 GMT)
MetaDCSeg: Robust Medical Image Segmentation via Meta Dynamic Center Weighting [77.3] 医用画像のセグメンテーションは臨床応用に欠かせないが,うるさいアノテーションやあいまいな解剖学的境界によってしばしば破壊される。
そこで我々は,雑音の多い接地トラスラベルの影響を抑えるために,最適な画素単位の重みを学習する頑健なフレームワークであるMetaDCSegを提案する。
提案手法は, 前景, 背景, 境界中心の重み付き特徴距離を利用して, 曖昧な境界付近の重み付き画素にモデルを向ける。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:51:02 GMT)
Scaling Agentic Reinforcement Learning for Tool-Integrated Reasoning in VLMs [76.5] VISTA-Gymは視覚言語モデル(VLM)におけるツール統合視覚推論能力のインセンティブ化のためのトレーニング環境である。
VISTA-Gymはビジュアルツールの標準化されたインタフェースで様々な実世界のマルチモーダル推論タスクを統合する。
VISTA-R1-8Bは、11の公開推論集約VQAベンチマークにおいて、同様のサイズで最先端のベースラインを9.51%-18.72%上回ることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:58:26 GMT)
Modality-Collaborative Low-Rank Decomposers for Few-Shot Video Domain Adaptation [74.2] FSVDA(Few-Shot Video Domain Adaptation)の課題について検討する。
モダリティ・ユニクティック・モダリティ・共有特徴を分解するために,モダリティ・コラボレーティブ・ローランク・デコンポスタ(MC-LRD)の新たなフレームワークを導入する。
我々のモデルは既存の手法よりも大幅に改善されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:09:59 GMT)
PRInTS: Reward Modeling for Long-Horizon Information Seeking [74.1] PRInTS(PRInTS)は、二重機能で訓練された生成型PRMである。
PRInTSは,オープンソースモデルと特殊エージェントの情報検索能力を向上させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:09:43 GMT)
OmniLens++: Blind Lens Aberration Correction via Large LensLib Pre-Training and Latent PSF Representation [72.7] この研究は、既存のパイプラインの一般化能力を妨げる2つの課題を解決するOmniLens++フレームワークを提案する。
実世界のレンズと合成レンズリブの様々な収差実験により、OmniLens++はブラインド収差補正において最先端の一般化能力を示すことが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:34:08 GMT)
Parallel Vision Token Scheduling for Fast and Accurate Multimodal LMMs Inference [68.5] ParVTSは、ビジュアルトークンを被写体および非オブジェクトグループに分割し、それらを並列に処理し、それらのセマンティクスを疑問トークンに転送し、非オブジェクトパスミッド推論を破棄する。
実験の結果、ParVTSは最大88.9%の視覚トークンを出力し、最小性能が低下し、1.77倍のスピードアップと70%のFLOPが削減された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:29:36 GMT)
Skeletons Matter: Dynamic Data Augmentation for Text-to-Query [66.5] テキスト・ツー・クエリー・タスク・パラダイムを正式に定義し、様々なクエリー言語にまたがるセマンティック・パース・タスクを統一する。
問合せスケルトンをText-to-Queryタスクの共有最適化ターゲットとして同定し、一般的な動的データ拡張フレームワークを提案する。
4つのText-to-Queryベンチマーク実験により,本手法が最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:39:03 GMT)
Q-Save: Towards Scoring and Attribution for Generated Video Evaluation [65.8] 本稿では,AIGV品質の総合評価のためのベンチマークデータセットとモデルであるQ-Saveを紹介する。
データセットには10000近いビデオが含まれており、それぞれにスカラー平均評価スコア(MOS)と微粒な属性ラベルが付与されている。
品質評価と属性に基づく説明を共同で行う統一評価モデルを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:00:21 GMT)
Understanding, Accelerating, and Improving MeanFlow Training [64.8] MeanFlowは、瞬時および平均速度場を共同で学習することで、数ステップで高品質な生成モデリングを実現する。
両速度間の相互作用を分析し, (i) 確立された即時速度は平均速度を学習するための前提条件である。
即時速度の生成を加速する効果的なトレーニングスキームを設計し、その後、短区間平均速度から短区間平均速度に重点を移す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:59:27 GMT)
BackdoorVLM: A Benchmark for Backdoor Attacks on Vision-Language Models [63.6] textbfBackdoorVLMは視覚言語モデル(VLM)に対するバックドア攻撃を評価するための最初の総合的なベンチマークである。
BackdoorVLMは、マルチモーダルなバックドア脅威を、ターゲットされた拒絶、悪意のある注入、ジェイルブレイク、コンセプト置換、知覚的ハイジャックの5つのカテゴリに分類する。
2つのオープンソースのVLMと3つのマルチモーダルデータセットでテストし、テキスト、画像、バイモーダルトリガにまたがる12の代表的な攻撃手法を用いて、これらの脅威を評価する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:30:38 GMT)
Cognitive Foundations for Reasoning and Their Manifestation in LLMs [63.1] 大規模言語モデル(LLM)は複雑な問題を解くが、単純な変種では失敗し、人間の推論と根本的に異なるメカニズムによって正しい出力を達成することを示唆している。
我々は認知科学研究を、推論不変量、メタ認知制御、推論と知識の組織化のための表現、変換操作にまたがる28の認知要素の分類学に合成する。
複雑な問題に対して66.7%の性能向上を図り、成功構造を自動的に把握するテストタイム推論ガイダンスを開発した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:30 GMT)
Connecting the Dots: Training-Free Visual Grounding via Agentic Reasoning [63.1] GroundingAgentは、タスク固有の微調整なしで動作するビジュアルグラウンドティングフレームワークである。
広く使用されているベンチマークでは、平均ゼロショットグラウンドの精度は65.1%である。
また、強い解釈可能性を提供し、各推論ステップを透過的に照らす。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:11:08 GMT)
View-Consistent Diffusion Representations for 3D-Consistent Video Generation [60.7] 現在生成されているビデオには、3Dの不整合による視覚的アーティファクトが含まれている。
マルチビューで一貫した拡散表現を学習することで,ビデオモデルの3次元一貫性を改善するための新しいアプローチであるViCoDRを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:16:55 GMT)
Multimodal Large Language Models with Adaptive Preference Optimization for Sequential Recommendation [60.3] 本稿では,Hardness-Aware とNoNoRec (HaNoRec) を併用したマルチモーダル大規模言語モデルフレームワークを提案する。
具体的には、HaNoRecは、各トレーニングサンプルの予測硬度とポリシーモデルのリアルタイム応答性の両方に基づいて、最適化重量を動的に調整する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:10:46 GMT)
STCDiT: Spatio-Temporally Consistent Diffusion Transformer for High-Quality Video Super-Resolution [60.1] 我々は,事前学習したビデオ拡散モデルに基づいて構築されたビデオ超解像フレームワークSTCDiTを提案する。
複雑なカメラの動きであっても、構造的に忠実で時間的に安定した動画を劣化した入力から復元することを目的としている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:37:23 GMT)
Syn-GRPO: Self-Evolving Data Synthesis for MLLM Perception Reasoning [58.4] 本研究は、オンラインデータジェネレータを用いて、GRPOトレーニングにおける多様な応答で高品質なトレーニングデータを合成するSyn-GRPOを提案する。
実験の結果,Syn-GRPOはデータ品質を大きなマージンで改善し,既存のMLLM認識法よりも優れた性能を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:42:29 GMT)
PrismAudio: Decomposed Chain-of-Thoughts and Multi-dimensional Rewards for Video-to-Audio Generation [57.9] Video-to-Audio (V2A) の生成には、4つの重要な知覚次元のバランスが必要である。
私たちは、強化学習をV2A世代に統合する最初のフレームワークであるPrismAudioを紹介します。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:11:12 GMT)
CoD: A Diffusion Foundation Model for Image Compression [57.6] 既存の拡散コーデックは、通常、安定拡散のようなテキストから画像への拡散基盤モデルに基づいて構築される。
textbfCoDは、圧縮と生成の両方のエンドツーエンドの最適化を可能にするために、ゼロからトレーニングすることができる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:00:15 GMT)
MHR: Momentum Human Rig [56.9] 我々は,ATLASの切り離された骨格・形状パラダイムと,モメンタム図書館に触発されたフレキシブルで現代的なリグとポーズ修正システムを組み合わせた,パラメトリックな人体モデル MHR を提案する。
我々のモデルは、表現的で解剖学的に妥当な人間のアニメーションを可能にし、非線形ポーズ補正をサポートし、AR/VRとグラフィックパイプラインの堅牢な統合のために設計されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:02:10 GMT)
EventSTU: Event-Guided Efficient Spatio-Temporal Understanding for Video Large Language Models [56.2] 本研究では,EventSTUという,効率的な理解のためのイベント誘導学習自由フレームワークを提案する。
時間領域において、不要な大フレームを除去するために、イベントカメラのトリガー特性を変化させる粗大なサンプリングアルゴリズムを設計する。
空間領域では,イベントの正当性をゼロコストとして活用し,空間的縮小を誘導する適応的トークンプルーニングアルゴリズムを実現する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:30:02 GMT)
VideoCompressa: Data-Efficient Video Understanding via Joint Temporal Compression and Spatial Reconstruction [55.7] ビデオ理解モデルは、大規模データセットの禁止ストレージと計算コストによって、ますます制限されている。
VideoCompressaはビデオデータ合成のための新しいフレームワークで、動的潜在圧縮として問題を再構成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:07:58 GMT)
Edit2Perceive: Image Editing Diffusion Models Are Strong Dense Perceivers [55.2] Edit2Perceiveは、深度、正規度、マッティングの編集モデルを適応させる統合拡散フレームワークである。
私たちの単一ステップの決定論的推論は、比較的小さなデータセットでトレーニングしながら、より高速なランタイムをもたらす。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:13:51 GMT)
CDLM: Consistency Diffusion Language Models For Faster Sampling [54.9] 拡散言語モデル(DLM)は有望な並列生成パラダイムを提供するが、推論が遅い。
本稿では,両方のボトルネックに同時に対処するトレーニングベースの加速度法CDLMを紹介する。
実験では、CDLMは3.6x-14.5倍のレイテンシを実現し、数学やコーディングタスクの競合精度を維持している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:21:25 GMT)
Chain-of-Visual-Thought: Teaching VLMs to See and Think Better with Continuous Visual Tokens [54.2] Chain-of-Visual-Thought (COVT)は、ビジョンランゲージモデル(VLM)が連続的な視覚トークンを通じて推論できるようにするフレームワークである。
約20枚のトークンからなる小さな予算の中で、COVTは軽量ビジョンの専門家から知識を抽出する。
トレーニング中、COVTを持つVLMは視覚トークンを自動回帰予測し、密集した監視信号を再構築する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:55:19 GMT)
BideDPO: Conditional Image Generation with Simultaneous Text and Condition Alignment [53.9] 条件付き画像生成は、構造的、空間的、スタイリスティックな事前のテキストと画像の合成を強化する。
現在の手法では、ソース間の競合を処理する上で、課題に直面している。
双方向分離型DPOフレームワーク(BideDPO)を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:20:11 GMT)
Life-IQA: Boosting Blind Image Quality Assessment through GCN-enhanced Layer Interaction and MoE-based Feature Decoupling [53.7] ブラインド画像品質評価(BIQA)は視覚経験の評価と最適化において重要な役割を担っている。
既存のBIQAアプローチのほとんどは、バックボーンネットワークから抽出された浅く深い特徴を融合させ、品質予測に不平等な貢献を見落としている。
本稿では,BIQA の浅層・深層特性の寄与について検討し,GCN によるアンダーライン層アンダーライン相互作用と MoE ベースのアンダーラインアンダーラインデカップリング(textbf(Life-IQA))による効果的な品質特徴デコードフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:59:55 GMT)
3D Dynamic Radio Map Prediction Using Vision Transformers for Low-Altitude Wireless Networks [52.7] 低高度無線ネットワーク(LAWN)は無人航空機(UAV)の普及に伴い急速に拡大している
信頼性の高い接続性は、三次元(3D)モビリティ、時間変化によるユーザ密度、限られた電力予算のために、依然として重要な課題である。
本稿では,受信電力の進化を学習し,予測する3次元動的無線マップ(3D高度)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:47:17 GMT)
Prune-Then-Plan: Step-Level Calibration for Stable Frontier Exploration in Embodied Question Answering [52.7] 大規模視覚言語モデル(VLM)は、オープン語彙推論のための強力なセマンティック先行情報を提供することにより、EQAエージェントの改良を行った。
ステップレベルキャリブレーションによる探索を安定化するフレームワークPrune-Then-Planを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:50:50 GMT)
DualGazeNet: A Biologically Inspired Dual-Gaze Query Network for Salient Object Detection [52.3] 我々はDualGazeNetを紹介した。DualGazeNetは、純粋なトランスフォーマーフレームワークで、有能なオブジェクト検出を行う。
5つのRGBベンチマークの実験によると、DualGazeNetは25の最先端CNNとTransformerベースのメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:08:22 GMT)
SpeedAug: Policy Acceleration via Tempo-Enriched Policy and RL Fine-Tuning [52.3] 強化学習(Reinforcement learning)は、より高速な実行のためにポリシーを適用する、有望なアプローチである。
タスク実行の高速化のために事前学習されたポリシーを効率的に適応するRLベースのポリシーアクセラレーションフレームワークであるSpeedAugを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:25:47 GMT)
Beyond Description: Cognitively Benchmarking Fine-Grained Action for Embodied Agents [52.1] CFG-Benchは、きめ細かな動作インテリジェンスを体系的に評価する新しいベンチマークである。
CFG-Benchは、1,368のキュレートされたビデオと19,562の3つのモダリティからなる質問応答ペアからなる。
CFG-Benchに関する包括的評価から,MLLMの先導者は,物理的相互作用の詳細な指示を生成するのに苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:02:29 GMT)
Cook and Clean Together: Teaching Embodied Agents for Parallel Task Execution [51.9] Operations Research knowledge-based 3D Grounded Task Scheduling (ORS3D)は、言語理解、3Dグラウンド、効率最適化の相乗効果を必要とする新しいタスクである。
ORS3Dの研究を容易にするために,ORS3D-60Kを構築した。
ORS3D-60Kの実験は、言語理解、3Dグラウンド、スケジューリング効率にまたがるGRANTの有効性を検証する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:17 GMT)
SkillSight: Efficient First-Person Skill Assessment with Gaze [51.2] SkillSightを導入し、一人称データから効率の良いスキルアセスメントを行う。
我々の2段階のフレームワークは、スキルレベルを予測する際に、視線と自我中心のビデオを共同でモデル化し、視線のみの学生モデルを蒸留する。
料理、音楽、スポーツにまたがる3つのデータセットの実験は、初めて、スキル理解において見つめることの価値のある役割を確立した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:05:28 GMT)
Adversarial Attack-Defense Co-Evolution for LLM Safety Alignment via Tree-Group Dual-Aware Search and Optimization [51.1] 大規模言語モデル(LLM)は、Webサービスにおいて急速に発展し、社会的リスクを増幅しつつ、前例のない能力を提供してきた。
既存の作業は、分離されたジェイルブレイク攻撃または静的防御に重点を置いており、現実世界のWebコンテキストにおける進化する脅威とセーフガードの間の動的な相互作用を無視している。
ACE-Safetyは、2つの重要な革新的手順をシームレスに統合することにより、攻撃と防御モデルを協調的に最適化する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:23:41 GMT)
Introducing Visual Scenes and Reasoning: A More Realistic Benchmark for Spoken Language Understanding [51.0] 視覚画像と明示的推論の両方を統合する新しいデータセットであるVRSLUを紹介する。
オーバーイデオライズされたCAでは、GPT-4oとFLUX.1-devを使用して、ユーザの環境やステータスを反映した画像を生成し、続いて人間の検証によって品質を保証する。
推論のために、GPT-4oは予測ラベルの説明を生成するために使用され、その説明は人間のアノテータによって洗練され、精度と一貫性が保証される。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:32:24 GMT)
Equivariant Deep Equilibrium Models for Imaging Inverse Problems [50.9] 等変イメージング(EI)は、地上の真実データを必要とせず、信号再構成モデルを訓練することができる。
バックプロパゲーションはモジュール的に実装でき、トレーニングが簡単になる。
EI で訓練された DEQ が以前の不変量の近位写像に近似する証拠が見つかる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:43:54 GMT)
SteadyDancer: Harmonized and Coherent Human Image Animation with First-Frame Preservation [50.8] 本稿では,高調波とコヒーレントなアニメーションを実現するR2V(Image-to-Video)パラダイムベースのフレームワークであるSteadyDancerを紹介する。
実験により,SteadyDancerは外観の忠実さとモーションコントロールの両方において最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:15:55 GMT)
HuggingR$^{4}$: A Progressive Reasoning Framework for Discovering Optimal Model Companions [50.6] HuggingR$4$は、Reasoning、Retrieval、Refinement、Reflectionを組み合わせて効率的にモデルを選択する新しいフレームワークである。
作業性率は92.03%、理性率は82.46%に達し、それぞれ26.51%、33.25%を超える。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:13:45 GMT)
LAST: LeArning to Think in Space and Time for Generalist Vision-Language Models [50.5] 一般的な視覚言語モデルにおける3次元空間的および長時間の映像理解を改善するために,LASTを提案する。
LASTは,3つの空間的理解,4つの映像理解,3つの画像理解タスクを含む,様々なベンチマークにおいて大きな利益をもたらすことを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:13:26 GMT)
Revisiting Feedback Models for HyDE [49.5] HyDE は LLM 生成した仮説的回答文書でクエリ表現を豊かにする手法である。
実験の結果,Rocchioなどのフィードバックアルゴリズムを利用して抽出と重み拡張を行う場合,HyDEの有効性は著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:50:18 GMT)
Benchmarking Corruption Robustness of LVLMs: A Discriminative Benchmark and Robustness Alignment Metric [49.4] 汚損の堅牢性を評価するための識別サンプルを強調したベンチマークであるBench-Cを紹介する。
本稿では,ロバストネスアライメントスコア(RAS)を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:07:56 GMT)
VDC-Agent: When Video Detailed Captioners Evolve Themselves via Agentic Self-Reflection [49.2] VDC-AgentはDetailed Captioningのための自己進化フレームワークである。
VDC-Agent-7Bは、VDCベンチマークで最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:56 GMT)
PropensityBench: Evaluating Latent Safety Risks in Large Language Models via an Agentic Approach [49.1] 我々は、リスクを伴う行動に関わるモデルの確率を評価する新しいベンチマークフレームワークであるtextbfPropensityBench$を提示する。
私たちのフレームワークには,サイバーセキュリティ,自己増殖,バイオセキュリティ,化学セキュリティという,リスクの高い4つのドメインにまたがる6,648のツールを備えた,5,874のシナリオが含まれています。
オープンソースとプロプライエタリなフロンティアモデル全体で、私たちは9つの不確実性の兆候を発見しました。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:46:44 GMT)
Think Before You Prune: Selective Self-Generated Calibration for Pruning Large Reasoning Models [49.0] キャリブレーションのための自己生成推論データを使用することで,プルーニング性能を大幅に向上できることを示す。
分析の結果,困難かつ適度に長い自己生成推論データが理想的なキャリブレーションデータであることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:08:19 GMT)
Local Entropy Search over Descent Sequences for Bayesian Optimization [48.8] 実用的な方法は、勾配降下のような局所最適化手法を用いて初期設計の近傍を反復的に洗練することである。
降下列で到達可能な解を明示的に対象とするベイズ最適化パラダイムである局所エントロピー探索(LES)を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:52:17 GMT)
Percept-WAM: Perception-Enhanced World-Awareness-Action Model for Robust End-to-End Autonomous Driving [48.5] 本稿では,視覚言語モデル(VLM)に2D/3Dシーン理解能力を暗黙的に統合した知覚強調世界認識行動モデルPercept-WAMを紹介する。
我々は,高密度物体知覚のためのグリッド条件付き予測機構を提案し,IoU対応スコアリングと並列自己回帰デコードを導入し,長距離・遠距離・小対象シナリオの安定性を向上させる。
実験により、パーセプションWAMは下流の知覚ベンチマークで古典的な検出器やセグメンタと一致し、2D検出とBEV 3D検出で51.7/58.9 mAPを達成した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:28:25 GMT)
RhinoInsight: Improving Deep Research through Control Mechanisms for Model Behavior and Context [48.4] RhinoInsightは、パラメータ更新なしで堅牢性、トレーサビリティ、全体的な品質を高めるための2つの制御メカニズムを付加するディープリサーチフレームワークである。
まず、検証可能なチェックリストモジュールは、ユーザ要求をトレーサブルで検証可能なサブゴールに変換し、改善のために人間やLLM評論家を取り入れ、階層的なアウトラインをコンパイルして、その後のアクションをアンロックし、実行不可能なプランニングを防ぐ。
第2に、Evidence Auditモジュールは、検索コンテンツを構造化し、アウトラインを反復的に更新し、ノイズの多いコンテキストを呈する一方、批評家は、高品質な証拠をドラフトコンテンツにランク付けし、検証性を確保し、幻覚を減らす。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:12:41 GMT)
One Attention, One Scale: Phase-Aligned Rotary Positional Embeddings for Mixed-Resolution Diffusion Transformer [48.3] CRPA(Cross-Resolution Phase-Aligned Attention)は、トレーニング不要のドロップイン修正で、ソースでのこの障害を取り除く。
CRPAはトレーニング済みのDiTと完全に互換性があり、すべてのヘッドとレイヤを均一に安定化させる。
CRPAにより高忠実かつ高効率な混合分解能生成が可能であり、画像およびビデオ生成における従来の最先端手法よりも優れることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:10:15 GMT)
DiffSeg30k: A Multi-Turn Diffusion Editing Benchmark for Localized AIGC Detection [48.0] 拡散ベースの編集は、局所画像領域の現実的な修正を可能にし、AI生成したコンテンツを検出しにくくする。
DiffSeg30kは、30kの拡散編集画像とピクセルレベルのアノテーションのデータセットで、きめ細かい検出をサポートする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:43:54 GMT)
SyncMV4D: Synchronized Multi-view Joint Diffusion of Appearance and Motion for Hand-Object Interaction Synthesis [47.6] 同期多視点HOIビデオと4Dモーションを共同生成する最初のモデルであるSyncMV4Dを紹介する。
本手法は,視覚リアリズム,運動可視性,多視点整合性において,最先端の代替手段よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:14:19 GMT)
Breaking the Likelihood-Quality Trade-off in Diffusion Models by Merging Pretrained Experts [46.5] 本稿では,2つの事前学習した拡散の専門家を相互に切り替えて組み合わせた簡単なプラグアンドプレイサンプリング手法を提案する。
我々は、高ノイズレベルの画像品質の専門家をグローバルな構造を形作るために応用し、低ノイズレベルの専門家に切り替えてピクセル統計を精査する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:53 GMT)
FineXtrol: Controllable Motion Generation via Fine-Grained Text [46.3] FineXtrolは、時間的に認識され、正確で、ユーザフレンドリで、きめ細かいテキスト制御信号によってガイドされる、効率的なモーション生成のための新しいフレームワークである。
制御可能なモーション生成においてFineXtrolは高い性能を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:32:26 GMT)
Seeing What Matters: Visual Preference Policy Optimization for Visual Generation [46.1] 私たちは、スカラーフィードバックを構造化されたピクセルレベルのアドバンテージに引き上げる、Visual Preference Policy Optimization (ViPO)を導入します。
ViPOは相変わらずバニラGRPOより優れており、ドメイン内でのアライメントと人為的な報酬を改善している。
この方法はアーキテクチャに依存しず、軽量で、既存のGRPOトレーニングパイプラインと完全に互換性がある。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:21:17 GMT)
LAA3D: A Benchmark of Detecting and Tracking Low-Altitude Aircraft in 3D Space [46.0] 我々は、低高度航空機の3D検出と追跡を促進するために設計された大規模データセットであるLAA3Dを提案する。
LAA3Dには15,000枚の実像と600,000枚の合成フレームがあり、様々なシナリオで撮影されている。
電気垂直離着陸機(eVTOL)、マイクロ・エアリアル・ビークルズ(MAV)、ヘリコプターズ(Helicopters)など、複数の航空機カテゴリーをカバーする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:50:34 GMT)
Efficient Equivalent of Shallow Quantum Hashing [45.9] 振幅形式に対する浅量子ハッシュと単一量子ハッシュの接続を確立する。
浅い回路では、同じ衝突抵抗を実現する深さ1の回路を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:38:17 GMT)
Fairness in Multi-modal Medical Diagnosis with Demonstration Selection [45.8] 人口動態的バランスと意味論的関連性のあるデモを構築するフェアネス・アウェア・デモ・セレクション(FADS)を提案する。
FADSは、性別、人種、民族に関する格差を一貫して減らし、高い精度を維持している。
これらの結果は、公平な医用画像推論のためのスケーラブルでデータ効率のよいソリューションとして、フェアネスを意識したコンテキスト内学習の可能性を強調している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:59:06 GMT)
Growing with the Generator: Self-paced GRPO for Video Generation [45.5] グループ相対政策最適化は、ビデオ生成後のモデルのための強力な強化学習パラダイムとして登場した。
本稿では,報奨フィードバックをジェネレータと共進化させる能力を考慮したGRPOフレームワークであるSelf-Paced GRPOを提案する。
生成品質が向上するにつれて、粗い視覚的忠実度から時間的コヒーレンス、微粒なテキスト・ビデオ・セマンティックアライメントに重点を移すプログレッシブ報酬機構を導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:56:03 GMT)
Ref-SAM3D: Bridging SAM3D with Text for Reference 3D Reconstruction [45.3] Ref-SAM3D は SAM3D の単純な拡張であり、テキスト記述を高レベルな事前表現として組み込む。
Ref-SAM3Dは、自然言語のみでガイドされ、単一の2次元ビューであり、競争力と高忠実度ゼロショット再構成性能を提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:58:22 GMT)
NEZHA: A Zero-sacrifice and Hyperspeed Decoding Architecture for Generative Recommendations [44.7] NEZHAは、推薦品質を犠牲にすることなく、生成レコメンデーション(GR)システムの高速デコーディングを実現する新しいアーキテクチャである。
NEZHAの有効性を公開データセットの広範な実験を通じて実証し,2025年10月以降,そのシステムをTaobao上に展開することに成功している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:53:46 GMT)
Exploring Surround-View Fisheye Camera 3D Object Detection [44.1] 本研究では,サラウンドビュー魚眼カメラシステムによるエンドツーエンド3Dオブジェクト検出の実現の可能性について検討する。
魚眼画像のユニークな形状を主流検出フレームワークに組み込む2つの手法を開発した。
魚眼3DOD実験の結果,我々の魚眼互換モデルでは,基準法よりも最大6.2%精度が向上していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:28:56 GMT)
REArtGS++: Generalizable Articulation Reconstruction with Temporal Geometry Constraint via Planar Gaussian Splatting [44.0] 一般化可能なオブジェクト再構成のための新しい手法であるREArtGS++を提案する。
本研究はまず, 従来型を使わずに各関節の脱結合スクリュー運動をモデル化し, 関節パラメータによる部分認識ガウス運動を最適化する。
合成および実世界の調音物体に対する実験は、一般化可能な部分レベル表面再構成と関節パラメータ推定において、我々の優位性を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:58:36 GMT)
Predicting partially observable dynamical systems via diffusion models with a multiscale inference scheme [43.7] 本稿では、部分的に観測可能な長期記憶力学系の確率論的予測に取り組む。
自動回帰ロールアウトのような標準的な推論スキームは、データ内の長距離依存関係をキャプチャできないことを示す。
提案手法は,現在付近で時間的に微細な軌跡と,遠くに移動するときに粗い軌跡を生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:30:04 GMT)
AutoEnv: Automated Environments for Measuring Cross-Environment Agent Learning [42.5] クロス環境学習は、ほとんど未測定のままである。
我々は、環境を移行、観察、報酬よりも分解可能な分布として扱う自動化フレームワークであるAutoEnvを提案する。
AutoEnvを用いて、358の検証レベルを持つ36の環境のデータセットであるAutoEnv-36を構築し、7つの言語モデルが12-49%の正規化報酬を得る。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:54:23 GMT)
IDEAL-M3D: Instance Diversity-Enriched Active Learning for Monocular 3D Detection [42.5] I-M3Dはモノクロ3D検出のための最初のインスタンスレベルのパイプラインである。
不均一なバックボーンとタスクに依存しない特徴で多様性を誘導する。
我々は、KITTIの検証とテストセットに関するAP3Dを、全体として同じ検出器を訓練するのと比べて、類似またはより良いAP3Dを実現している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:49:20 GMT)
Reasoning via Video: The First Evaluation of Video Models' Reasoning Abilities through Maze-Solving Tasks [42.1] ビデオモデルは、コヒーレントモーションダイナミクスを用いた高忠実度ビデオ生成において顕著な成功を収めた。
離散テキストコーパスと比較して、ビデオグラウンドは明示的な空間的レイアウトと時間的連続性を推論する。
ビデオモデルの推論能力を体系的に評価するために設計されたベンチマークであるVR-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:46:09 GMT)
A Self-Conditioned Representation Guided Diffusion Model for Realistic Text-to-LiDAR Scene Generation [41.4] テキストからLiDAR生成は、下流タスクのためにリッチな構造と多様なシーンで3Dデータをカスタマイズできる。
しかし、Text-LiDARペアの不足は、トレーニング前の不足を招き、過度にスムーズな3Dシーンを生成することが多い。
SCRG(Self-Conditioned Representation Guidance)を用いたシーン生成のためのテキスト対LiDAR拡散モデルT2LDMを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:32:15 GMT)
Learning Plug-and-play Memory for Guiding Video Diffusion Models [41.4] 拡散変換器(DiT)を用いた映像生成モデルは近年,目覚しい品質と時間的コヒーレンスを実現している。
本研究では,有用な世界知識を注入するプラグイン・アンド・プレイメモリの装備方法について検討する。
本稿では,3次元CNN,低域/高域フィルタ,自己アテンション層からなる学習可能なメモリエンコーダDiT-Memを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:42:23 GMT)
MIST: Mutual Information Via Supervised Training [41.0] 我々は、相互情報(MI)推定器を設計するための完全なデータ駆動アプローチを提案する。
任意のMI推定器は、2つの確率変数から観測されたサンプルの関数であるため、ニューラルネットワーク(MIST)を用いてこの関数をパラメータ化する。
625,000の合成関節分布の大規模なメタデータセット上で、既知の接地トラスMIを用いてトレーニングを行う。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:55:28 GMT)
LumiTex: Towards High-Fidelity PBR Texture Generation with Illumination Context [41.0] 物理ベースのレンダリング(PBR)は、コンピュータグラフィックスにおける現実的な物質光相互作用の標準となる。
LumiTex(ルミテックス)は、アルベドと金属の粗さを共有照明で切り離すエンドツーエンドのフレームワークである。
LumiTexはテクスチャの品質において最先端のパフォーマンスを実現し、既存のオープンソースと商用の両方の手法を超越している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:58 GMT)
Evaluating Dataset Watermarking for Fine-tuning Traceability of Customized Diffusion Models: A Comprehensive Benchmark and Removal Approach [40.3] 本稿では、普遍性、透過性、ロバスト性を含む一般的な脅威モデルと包括的評価フレームワークを紹介する。
実験により、既存の手法は普遍性と透過性において良好に機能し、一般的な画像処理操作に対してある程度の堅牢性を示すことが示された。
さらに, 微調整に影響を及ぼすことなく, データセットの透かしを完全に除去する実用的な透かし除去手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:11:00 GMT)
SLMFix: Leveraging Small Language Models for Error Fixing with Reinforcement Learning [39.9] 大規模言語モデル(LLM)は、構文的エラーを含むプログラムを生成し、与えられたタスクを完了できない。
本研究では、強化学習(RL)技術を用いて微調整された小言語モデル(SLM)を利用する新しいコード生成パイプラインであるSLMFixを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:56:47 GMT)
Synthesizing Visual Concepts as Vision-Language Programs [39.9] VLM(Vision-Language Model)は、マルチモーダルタスクにおいて高い性能を達成するが、しばしば系統的な視覚的推論タスクでは失敗する。
本稿では,VLMの知覚的柔軟性とプログラム合成の系統的推論を組み合わせた視覚言語プログラムを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:30:33 GMT)
Vidi2: Large Multimodal Models for Video Understanding and Creation [39.8] 微粒な時間的接地(STG)によるVdi2ビデオ理解とビデオ質問応答能力の向上(ビデオQA)
テキストクエリが与えられた場合、Vidi2は対応するタイムスタンプだけでなく、出力時間範囲内の対象オブジェクトのバウンディングボックスも識別できる。
このエンドツーエンドの時間的グラウンド機能は、複雑な編集シナリオにおける潜在的なアプリケーションを可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:58:29 GMT)
The Loss of Control Playbook: Degrees, Dynamics, and Preparedness [39.4] 本報告では,新たな分類と準備の枠組みを開発することにより,AIシステムにおけるロス・オブ・コントロール(Los of Control, LoC)の実用的な定義が欠如していることに対処する。
そこで本研究では,重度と持続性の指標に基づいて,偏差,境界LoC,Strict LoCを区別したLoC分類法を提案する。
我々は,社会的脆弱性が到達した場合に,準備の維持と LoC 結果の発生防止を計画した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:52:00 GMT)
Are Image-to-Video Models Good Zero-Shot Image Editors? [39.1] 命令駆動画像編集のための事前学習された画像間拡散モデルを再利用した、チューニング不要なフレームワークIF-Editを紹介する。
IF-Editは3つの重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:54 GMT)
VADE: Variance-Aware Dynamic Sampling via Online Sample-Level Difficulty Estimation for Multimodal RL [38.8] GRPOやGSPOのようなグループベースのポリシー最適化手法は、マルチモーダルモデルのトレーニングの標準となっている。
グループ内のすべての応答が同じ報酬を受けると、それらは致命的な急激な消滅問題に悩まされる。
textbfVADEは,オンラインサンプルレベルの難易度を用いたサンプリングフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:59:54 GMT)
Towards Efficient VLMs: Information-Theoretic Driven Compression via Adaptive Structural Pruning [38.8] InfoPruneは視覚言語モデルの適応的構造圧縮のための情報理論フレームワークである。
VQAv2、TextVQA、GQAの実験では、InfoPruneは最大3.2倍のFLOPと1.8倍のアクセラレーションを達成でき、性能劣化は無視できる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:37:14 GMT)
Designing Preconditioners for SGD: Local Conditioning, Noise Floors, and Basin Stability [38.8] SGD(Gradient Descent)は、異方性曲率と勾配雑音により訓練後期に遅くなることが多い。
対称正行列$mathbfM$により誘導される幾何学におけるSGDを解析し、収束率とノイズフロアの両方が$mathbfM$依存量でバウンドされる境界を導出する。
診断と3つのSciMLベンチマークの実験は、予測フロアの挙動を検証する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:24:40 GMT)
Hierarchical GraphCut Phase Unwrapping based on Invariance of Diffeomorphisms Framework [38.5] 構造化光走査における鍵となるステップは位相アンラッピング(英語版)であり、これは測定されたラップされたモジュロ2piから連続的な位相値を復元する。
目的は、方程式 Phi = phi + 2pi k の未開位相数 k を推定することであり、 phi はラップ位相、Phi は真の位相である。
既存の手法は精度で速度を交換するが、正確なアルゴリズムはリアルタイム利用には遅すぎる。
本稿では,GraphCutベースのアンラッピングをピクセルラベル問題として再定義するフェーズアンラッピングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:45:26 GMT)
Upsample Anything: A Simple and Hard to Beat Baseline for Feature Upsampling [38.2] Upsample Anythingは、低解像度の機能をトレーニングなしで高解像度のピクセル単位の出力に復元する。
224x224イメージあたりの$approx0.419テキストのみで動作し、セマンティックセグメンテーション、深さ推定、深さと確率マップのアップサンプリングにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:32:47 GMT)
CoreEval: Automatically Building Contamination-Resilient Datasets with Real-World Knowledge toward Reliable LLM Evaluation [38.1] データ汚染は、自然言語処理タスクにおけるLLM評価の公平性にとって重要な課題である。
実世界の知識でデータを自動的に更新する戦略である textbfCoreEval を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:44:29 GMT)
MatMart: Material Reconstruction of 3D Objects via Diffusion [36.8] ttは, 既存の方法に比べ, 材質復元において優れた性能を発揮する。
ttは、単一拡散モデルのエンドツーエンド最適化により、材料予測と生成機能の両方を達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:58:14 GMT)
An Invariant Latent Space Perspective on Language Model Inversion [36.7] 言語モデルの反転(LMI)は、ユーザのプライバシとシステムセキュリティに対する具体的な脅威として現れます。
我々は LMI を LLM の潜在空間の再利用として再考する。
本稿では,LLMを不変デコーダとして扱うInv2Aについて述べる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:29:40 GMT)
Hypergraph Contrastive Learning for both Homophilic and Heterophilic Hypergraphs [36.4] ハイパーグラフニューラルネットワーク(HNN)は複雑な高次関係を捉えるために広く利用されている。
我々は,新しい教師なしのtextbfHypergraph ctextbfONtrastive Learning framework である textbfHONOR を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:35:46 GMT)
Mixture of Horizons in Action Chunking [36.4] 本稿では,視覚言語-アクションモデルのための水平線(MoH)$戦略を$textbfmixture of horizons(MoH)として提案する。
MoHは、アクションチャンクを異なる水平線で複数のセグメントに並べ替え、共有アクショントランスで並列に処理し、ライトリニアゲートで出力を融合する。
これは1つのモデルにおいて、長期の予測と短期の精度を共同で利用し、複雑なタスクのパフォーマンスと一般化性の両方を改善している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:51 GMT)
PresentCoach: Dual-Agent Presentation Coaching through Exemplars and Interactive Feedback [36.1] 本稿では,理想提示エージェントとコーチエージェントという2つの補完的な役割を通じて,プレゼンテーション実践を支援するデュアルエージェントシステムを提案する。
理想的なプレゼンテーションエージェントは、スライド処理、視覚言語分析、ナレーションスクリプト生成、パーソナライズされた音声合成、同期されたビデオアセンブリを組み合わせることで、ユーザが提供するスライドをモデルプレゼンテーションビデオに変換する。
コーチエージェントは、これらの例に対してユーザ記録されたプレゼンテーションを評価し、マルチモーダルな音声分析を行い、オブザーバ-Impact-Suggestion (OIS)フォーマットで構造化されたフィードバックを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:51:05 GMT)
FVAR: Visual Autoregressive Modeling via Next Focus Prediction [35.7] 我々は,このパラダイムを,プンネクストスケールの予測からプンネクストフォーカスの予測に再編成するtextbf'を提案する。
アプローチでは3つの重要なイノベーションを紹介している。 textbf1) マルチスケールの自己回帰を、単にダウンサンプリングするのではなく、徐々にぼやけを減らし、変換する次世代のFocus Prediction Paradigm。
textbf2) 物理に一貫性のあるデフォーカスカーネルを使用してクリーンでエイリアスフリーなマルチスケール表現を構築するプログレッシブリフォーカスピラミッドの構築。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:19:04 GMT)
Be My Eyes: Extending Large Language Models to New Modalities Through Multi-Agent Collaboration [35.4] BeMyEyesは、LLM(Large Language Models)をマルチモーダル推論に拡張するためのモジュラーフレームワークである。
知覚と推論エージェントの相補的な強みを組み合わせることで、BeMyEyesは大規模なマルチモーダルモデルをトレーニングする必要がなくなる。
実験により,LLMのマルチモーダル推論能力の開放が確認できた。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:55:16 GMT)
CLaRa: Bridging Retrieval and Generation with Continuous Latent Reasoning [34.4] CLaRaは、埋め込みベースの圧縮と共同最適化を共有連続空間で実行する統合フレームワークである。
実験により、CLaRaは、しばしばテキストベースの微調整ベースラインを超える、最先端の圧縮と性能の再ランクを達成することが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:11:14 GMT)
Fara-7B: An Efficient Agentic Model for Computer Use [34.2] マルチステップWebタスクのための新しい合成データ生成システムであるFaraGenを紹介する。
このデータを用いて、スクリーンショットのみを使用してコンピュータを知覚するネイティブCUAモデルであるFara-7Bをトレーニングする。
Fara-7Bは、WebVoyager、Online-Mind2Web、WebTailBenchといったベンチマークで、同等の大きさのCUAモデルよりも優れています。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:56:28 GMT)
Discover, Learn, and Reinforce: Scaling Vision-Language-Action Pretraining with Diverse RL-Generated Trajectories [33.9] 視覚-言語-アクション(VLA)モデルの事前訓練には、多種多様な高品質な操作軌跡が必要となる。
本稿では,VLA事前学習のための複数の異なる高精度な行動パターンを生成するDiscover,Lea rn,Reinforceを提案する。
ダウンストリームのタスクスイートに適応すると、VLAモデルは、同じサイズの標準RLデータセットでトレーニングされたデータセットよりも、多様なRLデータで事前訓練された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:54:49 GMT)
TREASURE: A Transformer-Based Foundation Model for High-Volume Transaction Understanding [33.7] 本稿では,トランザクションデータに特化して設計された多目的トランスフォーマーベース基盤モデルTREASUREを提案する。
このモデルは、消費者の行動と支払いネットワークの信号の両方を同時にキャプチャし、正確なレコメンデーションシステムや異常な行動検出のようなアプリケーションに必要な包括的な情報を提供する。
TREASUREの開発から得られた貴重な知識に着目し、広範囲にわたるアブレーション研究、生産モデルに対するベンチマーク、ケーススタディから重要な知見を提示する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:57:31 GMT)
A Fast Binary Splitting Approach for Non-Adaptive Learning of Erdős--Rényi Graphs [33.5] ノードサブセット上のグループクエリを用いて未知のグラフを学習する問題について検討し、各クエリは、クエリされたノード間に少なくとも1つのエッジが存在するかどうかを報告する。
Erds--Rényi (ER) graphs $GsimmathrmER(n,q)$ in the non-adaptive set, where the expected number of edges is $bark=qbinomn2$。
我々は、最近非適応型グループテストのために開発されたバイナリ分割アプローチをERグラフ設定に拡張し、それを証明した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:13:19 GMT)
Test-Time Preference Optimization for Image Restoration [33.0] 画像復元のための最初のTTPO(Test-Time Preference Optimization)パラダイムを提案する。
TTPOパラダイムは知覚品質を高め、オンザフライで好みのデータを生成し、任意のIRモデルバックボーンと互換性がある。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:32:27 GMT)
FoleyBench: A Benchmark For Video-to-Audio Models [33.0] ビデオオーディオ生成(V2A)は、映画ポストプロダクション、AR/VR、サウンドデザインなどの領域において重要性が増している。
FoleyBenchは、FoleyスタイルのV2A評価のために明示的に設計された最初の大規模ベンチマークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:08:20 GMT)
Nonparametric Instrumental Variable Regression with Observed Covariates [32.9] 観測された共変量を持つ非パラメトリックな楽器変数回帰の問題をNPIV-Oと呼ぶ。
観測された共変数は部分的なアイデンティティ構造を誘導し、以前のNPIV分析は適用できない。
第2の課題として、部分的平滑化の新しいフーリエ測度を導入する。
我々は、KIV-Oで上位の$L2$-learningレート、NPIV-Oで最初の$L2$-minimaxローラーラーレートを証明した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:42:49 GMT)
From Raw Features to Effective Embeddings: A Three-Stage Approach for Multimodal Recipe Recommendation [32.9] 生のマルチモーダルな特徴を効果的に組み込む3段階のレシピレコメンデーションフレームワークであるTESMRを提案する。
2つの実世界のデータセットの実験によると、TESMRは既存のメソッドより優れており、Recall@10は7~15%高い。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:37:22 GMT)
SAM3-Adapter: Efficient Adaptation of Segment Anything 3 for Camouflage Object Segmentation, Shadow Detection, and Medical Image Segmentation [32.8] Segment Anything 3 (SAM3)はアーキテクチャを再設計し、トレーニングパイプラインを改善した、より効率的で高性能な進化だ。
SAM3用の最初のアダプタフレームワークであるSAM3-Adapterは、その完全なセグメンテーション機能をアンロックする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:57:54 GMT)
Musical Score Understanding Benchmark: Evaluating Large Language Models' Comprehension of Complete Musical Scores [32.7] 音楽スコア理解ベンチマーク(MSU-Bench)は,スコアレベルの音楽理解を評価するための大規模人為的なベンチマークである。
MSU-Benchは、Bach、Beethoven、Chopin、Debussyなどの作品から抽出された1,800の生成的質問応答(QA)ペアで構成されている。
急激なモダリティギャップ, 脆弱なレベルワイドの成功率, マルチレベルの正確性を維持することの難しさを明らかにした。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:40:38 GMT)
CafeQ: Calibration-free Quantization via Learned Transformations and Adaptive Rounding [32.7] 学習後の量子化は、大規模言語モデルの提供コストを削減する効果的な方法である。
提案する緩和機構には、適応的な丸め、ランダムな回転変換、キャリブレーションデータを用いたトレーニング後の目標へのコミットなどが含まれる。
キャリブレーションデータにアクセスせずに変換と適応丸めを最適化するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:15:16 GMT)
Diffusion Reconstruction-based Data Likelihood Estimation for Core-Set Selection [32.4] 本稿では,再構成偏差によるデータ可能性の推定手法を提案する。
マルコフ拡散過程のエビデンス・ロウアー・バウンド(ELBO)に基づいて, 復元誤差とデータ可能性との間の公式な関係を確立する。
ImageNetの実験では、再構成の偏差が効果的なスコアリング基準を提供することを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:25:34 GMT)
2D Gaussians Spatial Transport for Point-supervised Density Regression [32.4] 本稿では,画像座標空間の確率測度からアノテーションマップへの移動を容易にするためにガウススプラッティングを利用する新しいフレームワークを提案する。
本稿では,ベイズ確率から導かれる移動計画を計算するために,画素アノテーション対応を推定する手法を提案する。
クラウドカウントやランドマーク検出など,コンピュータビジョンの代表的なタスクに関する実験により,我々のアプローチの有効性が検証された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:16:18 GMT)
HERMES: Towards Efficient and Verifiable Mathematical Reasoning in LLMs [32.2] Hermesはツール支援エージェントで、リーンシステムにおける検証段階と非公式な推論をインターリーブする。
パラメータスケールの異なる LLM を用いて,Hermes を4つの挑戦的数学的推論ベンチマークで評価する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:50:18 GMT)
Flow Map Distillation Without Data [32.2] 最先端のフローモデルは優れた品質を実現するが、遅い反復的なサンプリングが必要である。
このデータ依存は教師データミスマッチの根本的なリスクをもたらすと我々は主張する。
本稿では,教師のサンプリングパスを予測し,自己の複合的誤りを積極的に修正するフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:58:55 GMT)
ABM-LoRA: Activation Boundary Matching for Fast Convergence in Low-Rank Adaptation [32.2] 低ランク適応のための原理的活性化境界マッチング(ABM-LoRA)を提案する。
私たちのABM-LoRAは、下流トレーニングの前に、アダプタのアクティベーション境界と事前訓練されたモデルのバウンダリを整列することで、この問題に対処します。
ABM-LoRAの有効性を様々なアーキテクチャやタスクで実証する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:09:42 GMT)
Performance Guarantees for Quantum Neural Estimation of Entropies [32.0] 量子神経推定器(QNE)は古典的ニューラルネットワークとパラメトリズド量子回路を組み合わせたものである。
非漸近的エラーリスク境界の形で測定された相対エントロピーのQNEの形式的保証について検討する。
我々の理論は、測定された相対エントロピーに対するQNEの原則的実装を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:36:06 GMT)
SENTINEL: A Fully End-to-End Language-Action Model for Humanoid Whole Body Control [31.2] ヒューマノイド全身制御のためのエンドツーエンド言語-アクションモデルを提案する。
我々は,事前訓練された全身制御器を用いて人の動きを追跡することで,大規模なデータセットを構築した。
このモデルは言語コマンドと固有入力を直接中間表現なしで低レベルのアクションにマッピングする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:48:59 GMT)
Towards Generalizable Deepfake Detection via Forgery-aware Audio-Visual Adaptation: A Variational Bayesian Approach [31.1] Forgery-aware Audio-Visual Adaptation with Variational Bayes (FoVB) を開発した。
我々は様々な差分畳み込みとハイパスフィルタを利用して、局所的および大域的偽証トレースを両モードで識別する。
我々のFoVBは、様々なベンチマークにおいて、他の最先端手法よりも優れています。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:20:03 GMT)
Robot-Powered Data Flywheels: Deploying Robots in the Wild for Continual Data Collection and Foundation Model Adaptation [31.0] 我々は、FMコンシューマからデータジェネレータにロボットを変換するフレームワークであるRobot-Powered Data Flywheelを紹介した。
このフレームワークを,東アジア図書館に2週間展開されたモバイルマニピュレータであるScanfordでインスタンス化する。
Scanfordは棚を自動でスキャンし、視覚言語モデル(VLM)を使用して本を識別し、ライブラリカタログを利用して人間のアノテーションなしで画像にラベル付けする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:23:04 GMT)
Neural Architecture Search for Quantum Autoencoders [30.8] 本稿では,量子オートエンコーダの設計を自動化するニューラルネットワーク探索(NAS)フレームワークを提案する。
変分量子回路(VQC)の構成を体系的に進化させることにより,本手法はハイパフォーマンスなハイブリッド量子古典型オートエンコーダの同定を試みる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:55:44 GMT)
The SA-FARI Dataset: Segment Anything in Footage of Animals for Recognition and Identification [30.7] 野生動物のための最大のオープンソースMATデータセットであるSA-FARIを紹介する。
これは、約10年間(2014-2024年)に4大陸の741箇所から収集された11,609のカメラトラップビデオから成っている。
16,224個のマスクレットのアイデンティティと942,702個のバウンディングボックス、セグメンテーションマスク、および種ラベルを含む46時間の濃密な注釈付き映像で、それぞれのビデオが総括的に注釈付けされる。
SAM 3を含む最先端の視覚言語モデルを用いて,SA-FARIの総合的なベンチマークを行い,種別および総称動物で評価した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:02:04 GMT)
Yanyun-3: Enabling Cross-Platform Strategy Game Operation with Vision-Language Models [30.6] Yanyun-3は、ビジュアル推論のためのQwen2.5-VLとインターフェイス実行のためのUI-TARSを統合したVLMベースのエージェントである。
マルチモーダルデータのサンプル内融合とサンプル間混合を区別する新しいデータ組織原理を提案する。
Yanyun-3はGUI自動化のための汎用的なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:51:46 GMT)
MagicWorld: Interactive Geometry-driven Video World Exploration [30.5] 我々は、3次元幾何学的先行と歴史的検索を統合したインタラクティブなビデオワールドモデルMagicWorldを提案する。
本稿では,Action-Guided 3D Geometry Module (AG3D)を紹介した。
さらに、生成時に関連する履歴フレームを検索し、条件付き信号として注入するHistory Cache Retrieval (HCR) 機構を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:41:28 GMT)
What You See is (Usually) What You Get: Multimodal Prototype Networks that Abstain from Expensive Modalities [30.4] マルチモーダルニューラルネットワークは、このタスクを自動化するために種を特定するために利用が増えている。
まず、ブラックボックスの性質は意思決定プロセスの解釈可能性を妨げる。
第二に、遺伝データの収集は高価であり、しばしば侵襲的な手順を必要とする。
従来のニューラルネットワークの代替として人気があり、解釈可能なプロトタイプネットワーク(ProtoPNet)を、マルチモーダルでコストを意識した設定に拡張することで、これらの問題を解決する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:17:24 GMT)
VideoChat-M1: Collaborative Policy Planning for Video Understanding via Multi-Agent Reinforcement Learning [30.3] 本稿では,ビデオ理解のための新しいマルチエージェントシステムであるVideoChat-M1を提案する。
単一のポリシーや固定されたポリシーを使う代わりに、VideoChat-M1は複数のポリシーエージェントを持つCPP(Collaborative Policy Planning)パラダイムを採用する。
我々は,ビデオチャット-M1が4つのタスクにまたがる8つのベンチマークでSOTA性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:04:51 GMT)
SPQR: A Standardized Benchmark for Modern Safety Alignment Methods in Text-to-Image Diffusion Models [30.3] SPQRは、安全に整合した拡散モデルが良質な微調整の下でいかに安全性、実用性、堅牢性を維持するかを評価するための単一のスコア付き計量である。
我々は,多言語・ドメイン固有・アウト・オブ・ディストリビューション分析とカテゴリー別分解を行い,良質な微調整後に安全アライメントが失敗するかどうかを識別する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:46:20 GMT)
fMRI-LM: Towards a Universal Foundation Model for Language-Aligned fMRI Understanding [30.0] 機能的MRI(fMRI)と言語を3段階の枠組みでブリッジする基礎モデルであるfMRI-LMを提案する。
ステージ1では、fMRIを言語一貫性空間に埋め込まれた離散トークンにマッピングする神経トークン化器を学習する。
ステージ2では、事前訓練されたLLMがfMRIトークンとテキストを共同でモデル化し、脳の活動が時間的に予測され言語的に記述されるシーケンスとして扱われる。
ステージ3では、ハイレベルなセマンティック理解を備えたfMRI-LMを実現するために、マルチタスク、マルチパラダイムのチューニングを行う。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:26:59 GMT)
DetAny4D: Detect Anything 4D Temporally in a Streaming RGB Video [29.9] 既存のオープンセット4Dオブジェクト検出手法は、時間的一貫性をモデル化することなく、フレーム単位で予測を行う。
DetAny4Dは、シーケンシャル入力から直接3D b-boxを予測するオープンセットのエンドツーエンドフレームワークである。
大規模な実験により、DetAny4Dは競合検出精度を達成し、時間安定性を著しく向上することが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:42:17 GMT)
Cognitive Alpha Mining via LLM-Driven Code-Based Evolution [29.7] 我々は,コードレベルのアルファ表現とLLMによる推論と進化的探索を組み合わせた認知的アルファマイニングフレームワーク(CogAlpha)を紹介する。
LLMを適応認知エージェントとして扱うことで、我々のフレームワークは、プロンプトや金銭的フィードバックを通じて、アルファ候補を反復的に洗練し、変異し、再結合します。
A-共有平衡の実験は、CogAlphaが既存の方法よりも優れた予測精度、堅牢性、一般化を持つアルファを一貫して発見することを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:45:59 GMT)
StereoDETR: Stereo-based Transformer for 3D Object Detection [29.7] 我々は,DETRに基づく効率的なステレオ3Dオブジェクト検出フレームワークであるStereoDETRを提案する。
単分子アプローチの精度は2倍になるが、推論速度はわずか半分である。
また、KITTIベンチマークの競合精度も達成し、歩行者およびサイクリストのサブセットに新たな最先端の結果を設定する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:38:31 GMT)
ReMatch: Boosting Representation through Matching for Multimodal Retrieval [29.6] ReMatchはマルチモーダル検索にMLLMの生成強度を利用するフレームワークである。
組込みMLLMをチャット形式の生成マッチングステージで訓練する。
実験では, 5つのデータセットに対して, 特に強いゼロショット一般化結果を示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:28:49 GMT)
MedVision: Dataset and Benchmark for Quantitative Medical Image Analysis [29.5] 医用画像解析における視覚言語モデル(VLM)の評価と改善を目的としたデータセットとベンチマークであるMedVisionを紹介する。
MedVisionは、さまざまな解剖学とモダリティをカバーする22のパブリックデータセットにまたがっており、30.8万のイメージアノテーションペアがある。
我々は,(1)解剖学的構造と異常の検出,(2)腫瘍/病変(T/L)の大きさ推定,(3)角度/距離(A/D)測定の3つの代表的な定量的タスクに着目した。
MedVisionの教師付き微調整により、検出、T/L推定、A/D計測における性能を著しく向上する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:26:07 GMT)
Merging without Forgetting: Continual Fusion of Task-Specific Models via Optimal Transport [29.0] OTMFは最適輸送理論に根ざした新しいモデル統合フレームワークである。
従来のタスクを再考することなく、各タスクベクタを漸進的に統合する、連続的な融合パラダイムをサポートする。
我々は、複数の視覚と言語ベンチマークに関する総合的な実験を行い、OTMFが精度と効率の両面で最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:27:47 GMT)
Re-Key-Free, Risky-Free: Adaptable Model Usage Control [28.6] そこで我々は,ADALOCを提案し,鍵ベースのモデル利用制御をモデル進化の適応性で実現する。
ADALOCは、堅牢な保護を維持しながら、大幅な更新の下で高い精度を達成する。
このことは、ADALOCが現実のシナリオの進化において適応的で保護されたデプロイメントのための実用的なソリューションを提供できることを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:13:45 GMT)
Are Large Vision Language Models Truly Grounded in Medical Images? Evidence from Italian Clinical Visual Question Answering [28.4] イタリアの医学的疑問に答える際に,大きな視覚言語モデル (VLM) が真の視覚的根拠を示すかどうかを検討する。
我々は4つの最先端モデル(Claude Sonnet 4.5, GPT-4o, GPT-5-mini, Gemini 2.0 flash exp)をテストする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:26:58 GMT)
RAVEN++: Pinpointing Fine-Grained Violations in Advertisement Videos with Active Reinforcement Reasoning [28.4] RAVEN++は、3つの重要なイノベーションを紹介する新しいフレームワークである。
RL(Active Reinforcement Learning)は、様々な困難のあるサンプルに動的にトレーニングを適用する。
階層的な報酬関数と推論蒸留によって達成された微細粒度換気理解
知識注入、カリキュラムベースの受動RL、アクティブRLを体系的に組み合わせたプログレッシブマルチステージトレーニング。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:32:13 GMT)
Simulating dynamics of the two-dimensional transverse-field Ising model: a comparative study of large-scale classical numerics [28.1] 我々は,2次元横フィールドイジングモデルの力学を古典的にシミュレートするために,最先端数値手法の包括的なツールボックスを用いる。
我々の研究は、古典的なシミュラビリティを、Rydberg配列の量子力学に関連する様々なレギュレーションに結びつける。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:39:29 GMT)
Yo'City: Personalized and Boundless 3D Realistic City Scene Generation via Self-Critic Expansion [28.0] Yo'Cityは、ユーザがカスタマイズして無限に拡張可能な3D都市生成を可能にする新しいエージェントフレームワークである。
連続的な都市の発展をシミュレートするために,Yo'Cityはユーザ対話型,関係誘導型拡張機構を導入した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:02:48 GMT)
Understanding Task Transfer in Vision-Language Models [27.7] あるタスクの微調整は、他のタスクのパフォーマンスに影響を与え、タスク固有の微調整を困難にします。
これらの効果を定量化するために, 透過ギャップ係数 (Perfection Gap Factor, PGF) を導入する。
本分析では, 肯定的, 否定的な伝達パターンを明らかにし, 相互に影響を及ぼすタスク群を同定し, 伝達行動に基づいてタスクをペルソナに整理する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:37:52 GMT)
Medusa: Cross-Modal Transferable Adversarial Attacks on Multimodal Medical Retrieval-Augmented Generation [27.6] マルチモーダル医療検索増強世代(MMed-RAG)システムは、臨床決定支援においてますます採用されている。
本稿では,MMed-RAGシステムに対するクロスモーダル・トランスファー可能な敵攻撃を実現するための新しいフレームワークであるMedusaを提案する。
本研究は,MMed-RAGシステムにおける致命的な脆弱性を明らかにし,安全クリティカルな医療応用におけるロバスト性のベンチマークの必要性を強調した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:11:01 GMT)
ConceptGuard: Proactive Safety in Text-and-Image-to-Video Generation through Multimodal Risk Detection [27.5] ConceptGuardは、マルチモーダルビデオ生成において、安全でないセマンティクスを積極的に検出し緩和するフレームワークである。
コントラスト検出モジュールは、融合画像テキスト入力を構造化概念空間に投影することにより、潜伏する安全リスクを特定する。
意味的抑制機構は、プロンプトのマルチモーダル条件を介在することにより、生成過程を安全でない概念から遠ざける。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:27:05 GMT)
LATTICE: Democratize High-Fidelity 3D Generation at Scale [27.3] LATTICEは高忠実度3Dアセット生成のための新しいフレームワークである。
VoxSetは、3Dの資産を粗いボクセル格子に固定された潜在ベクトルのコンパクトな集合に圧縮する半構造化表現である。
提案手法のコアは単純だが,任意の解像度復号化,低コストトレーニング,フレキシブル推論スキームをサポートする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:22:19 GMT)
Context-Aware Whisper for Arabic ASR Under Linguistic Varieties [27.0] そこで我々は,OpenAIのWhisperをアラビア音声認識に適用するための文脈認識戦略を提案する。
本稿では, アクセシブリオーダー, 話者対応プレフィックス合成, モーダリティ特化検索などの手法を紹介する。
我々のアプローチは、WERを現代標準アラビア語で最大22.3%、方言言語で最大9.2%削減する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:16:04 GMT)
Thinking Ahead: Foresight Intelligence in MLLMs and World Models [26.6] 我々は、フォレストインテリジェンスを抽出し評価するために設計された新しいデータセットであるFSU-QAを紹介する。
我々は,視覚・言語モデル(VLM)をフォレスト指向のタスクで,初めて包括的に研究する。
さらに, FSU-QAは, フォレスト推論を効果的に促進できることを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:04:59 GMT)
Lower Complexity Bounds for Nonconvex-Strongly-Convex Bilevel Optimization with First-Order Oracles [26.1] 少なくとも$()/2$呼び出しは、関連する設定で最もよく知られた境界を強化する必要があります。
我々の結果は、単純化された体制でさえ、そのような体制が低レベルに適用可能であることを示唆していることを示唆している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:43:40 GMT)
IDSplat: Instance-Decomposed 3D Gaussian Splatting for Driving Scenes [25.9] 動的駆動シーンの再構築は、センサ・リアリスティック・シミュレーションによる自律システム開発に不可欠である。
我々は,動的シーンを明示的なインスタンス分解と学習可能なモーショントラジェクトリで再構成する,自己教師型3次元ガウススティングフレームワークIDSplatを提案する。
本手法は, インスタンスレベルの分解を維持しつつ, 競合する再構成品質を実現し, 再トレーニングを伴わずに, 多様なシーケンスやビュー密度を一般化する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:48:08 GMT)
DISCO: A Browser-Based Privacy-Preserving Framework for Distributed Collaborative Learning [25.9] データはしばしば、プライバシー、知的財産権、法的制約に対する懸念など、よく考えられた理由のために共有することができない。
これは予測モデルの統計的パワーを断片化するだけでなく、アクセシビリティバイアスを生み出す。
DISCO: オープンソースのDistributed Collaborative Learningプラットフォームで、非技術ユーザに対してアクセス可能であり、オリジナルのデータを共有したり、プログラミング知識を必要とせずに、機械学習モデルを協調的に構築する手段を提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:16:07 GMT)
Learning Massively Multitask World Models for Continuous Control [25.9] 汎用制御は、多くのタスクや実施事項にまたがって行動するエージェントを要求する。
オンラインインタラクションで数百のタスクで、ひとつのエージェントをトレーニングできるかどうかを問う。
本稿では,まず実演で事前学習した言語条件のマルチタスクワールドモデルであるemphNewtを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:57:19 GMT)
Efficient Transferable Optimal Transport via Min-Sliced Transport Plans [25.8] 我々は,min-Sliced Transport Plan (min-STP) フレームワークについて検討し,最適化スライサの転送性について検討した。
最適化されたスライサは、データ分布のわずかな摂動の下に留まり、関連するタスク間の効率的な転送を可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:59:12 GMT)
Ellipsoid-Based Decision Boundaries for Open Intent Classification [25.8] EliDecideは,異なる特徴方向の様々なスケールで楕円体を学習する新しい手法である。
提案手法は,複数のテキスト意図ベンチマークや質問分類データセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:32:27 GMT)
ObjectAlign: Neuro-Symbolic Object Consistency Verification and Correction [25.7] 我々は,知覚的メトリクスと記号的推論をブレンドして,編集されたビデオシーケンスの不整合を検出し,検証し,修正するフレームワークであるObjectAlignを紹介する。
私たちは、DAVISとPexelsのビデオデータセットのSOTAベースラインと比較して、CLIPスコアの1.4ポイント改善、ワープエラーの6.1ポイント改善を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:50:01 GMT)
Proxy-Free Gaussian Splats Deformation with Splat-Based Surface Estimation [25.6] 本研究では,新しい表面対応スプレートグラフから計算したラプラシアン演算子に基づいて,ガウススプレート(GS)のプロキシフリー変形法であるSpLapを紹介する。
本研究では,プロキシベースのベースラインとプロキシフリーベースラインの両方と比較して,提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:59:31 GMT)
Beyond Multiple Choice: Verifiable OpenQA for Robust Vision-Language RFT [25.5] 複数選択質問応答(MCQA)は、現代のマルチモーダル言語モデルのRFTの評価と強化のための一般的なフォーマットである。
ReVeL(ReVeL)は,複数の質問をオープンな質問に書き換えるフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:45:02 GMT)
Can LLMs Threaten Human Survival? Benchmarking Potential Existential Threats from LLMs via Prefix Completion [25.0] 大規模言語モデル(LLM)が人間の安全を脅かすような予測不可能なアウトプットを生み出すかどうかを検討する。
このようなリスクを評価するためのベンチマークである textscExistBench を提案する。
10個のLDM実験により、LCM生成物は実在の脅威を示すことが明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:34:13 GMT)
LLM-Based Agentic Negotiation for 6G: Addressing Uncertainty Neglect and Tail-Event Risk [25.0] 本稿では,6Gネットワークにおけるエージェント交渉のためのリスク対応フレームワークを提案する。
エージェントの目的を平均の推論から尾の推論へとシフトさせ、最悪の場合の結果に対して統計的に座屈したバッファを構築する。
この信頼性は、わずかに省エネする合理的で定量的なコストを17%に抑え、偏りのあるアプローチの誤った経済を露呈することを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:36:11 GMT)
LLM-Driven Stationarity-Aware Expert Demonstrations for Multi-Agent Reinforcement Learning in Mobile Systems [24.9] マルチエージェント強化学習(MARL)は多くの実世界のアプリケーションで採用されている。
MARLはエージェントポリシーの同期更新により、厳格な非定常性に悩まされる。
大規模言語モデル(LLM)駆動のエキスパートデモと自律エージェント探索を統合した,スケーラブルなMARLフレームワークであるRELEDを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:03:59 GMT)
AVA-VLA: Improving Vision-Language-Action models with Active Visual Attention [24.4] VLA(Vision-Language-Action)モデルは、AIタスクを具現化する際、顕著な能力を示した。
現行のVLAモデルは、通常、各時間ステップごとに独立して濃密な視覚入力を処理する。
このアプローチは、タスクをマルコフ決定プロセス(MDP)として暗黙的にモデル化する。
本稿では,部分観測可能なマルコフ決定プロセス(POMDP)の観点から問題を再構成し,AVA-VLAという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:22:28 GMT)
MAGMA-Edu: Multi-Agent Generative Multimodal Framework for Text-Diagram Educational Question Generation [24.4] 本稿では,テキスト推論と図形合成を統合した自己反射型マルチエージェントフレームワークMAGMA-Eduを紹介する。
MAGMA-Eduは,(1)質問文や解を数学的精度で反復的に洗練する生成検証・回帰ループ,(2)幾何学的忠実度と意味的アライメントを強制するコードベースの中間表現という,2段階の共進化的パイプラインを採用している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:13:26 GMT)
TiCT: A Synthetically Pre-Trained Foundation Model for Time Series Classification [24.2] テキスト内分類を行うために合成データのみに事前訓練したトランスフォーマーベースモデルであるTiCTを紹介する。
TiCTは最先端の教師付き手法と競合する性能を発揮する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:57:55 GMT)
SCoTER: Structured Chain-of-Thought Transfer for Enhanced Recommendation [24.0] 本稿では,パターン発見と構造認識伝達を協調最適化問題として扱う統合フレームワークであるSCoTERを提案する。
具体的には、SCoTERは、自動パターン検出のためのGVMパイプラインと、ステップワイズロジックを効率的なモデルに転送する構造保存統合アーキテクチャという、2つの相乗的コンポーネントを通じてこれを運用する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:00:04 GMT)
Understanding and Mitigating Over-refusal for Large Language Models via Safety Representation [24.0] 大きな言語モデルには安全性の脆弱性がある。
モデル安全性の改善は、しばしば過度に拒絶されるコストがかかる。
LLMの安全性表現を介入することで過度な拒絶を緩和するMOSRを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:38:53 GMT)
Addressing Situated Teaching Needs: A Multi-Agent Framework for Automated Slide Adaptation [23.9] インストラクター仕様に基づくスライド適応の自動化を目的とした,新しいマルチエージェントフレームワークを提案する。
8つの実世界コースにまたがる16の修正要求による評価を行い,本手法の有効性を検証した。
この研究は、AIエージェントが教育設計の論理的負担を処理し、教育者を解放し、教育の創造的かつ戦略的側面に集中させるという、新たなパラダイムを提唱している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:22:41 GMT)
Demystifying Diffusion Objectives: Reweighted Losses are Better Variational Bounds [23.4] 拡散モデルの訓練に広く用いられている再重み付き損失の新たな理論的解釈を導出する。
本手法は,データログに時間依存的な変動的下界のカスケードを構築することに基づく。
本稿では、連続拡散モデルに匹敵するサンプル品質にアプローチし、画素空間画像モデリングにおける以前のトレーニング損失よりも大幅に改善したことを報告する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:58:45 GMT)
Eevee: Towards Close-up High-resolution Video-based Virtual Try-on [23.4] ビデオベースの仮想試行のための高解像度データセットを提案する。
このデータセットには、実際の人間のモデルのフルショットおよびクローズアップトライオンビデオが含まれている。
テクスチャと構造の両方の保存を定量化する新しい衣服整合度基準VGIDを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:19:56 GMT)
MonoSR: Open-Vocabulary Spatial Reasoning from Monocular Images [23.1] MonoSRは、屋内、屋外、オブジェクト中心の設定を含むさまざまなシナリオにまたがるデータセットである。
我々は、その限界を明らかにするために、高度な視覚言語モデルを評価する。
これらの貢献は、現実世界、オープンワールド環境における単分子的空間的推論を促進する基盤をまとめて確立した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:49:17 GMT)
Inverse Rendering for High-Genus Surface Meshes from Multi-View Images [23.0] メッシュベースの表現は、微分幾何学理論の適用を可能にするため好まれ、現代のグラフィックスパイプラインに最適化されている。
既存の逆レンダリング法は、しばしば高原表面で破滅的に失敗し、重要な位相的特徴が失われる。
多視点画像から高次表面メッシュを再構成するための位相インフォームド逆レンダリング手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:44:09 GMT)
OrdMoE: Preference Alignment via Hierarchical Expert Group Ranking in Multimodal Mixture-of-Experts LLMs [22.9] 我々は、外部の人間の嗜好への依存を回避できる新しい嗜好アライメントフレームワークOrdMoEを提案する。
OrdMoEは、専門家をランク付けした階層に分類することで、内部の選好階層を構築する。
これにより、生成した応答に対してゼロコストで自己監督された優先順序が得られる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:59:31 GMT)
GuideFlow: Constraint-Guided Flow Matching for Planning in End-to-End Autonomous Driving [22.9] 運転計画は、エンドツーエンド(E2E)自動運転の重要な要素である。
textittextbfGuideFlowは、本質的にモード崩壊を緩和するフローマッチングプロセスを明示的にモデル化する。
textittextbfGuideFlowは、生成中の制御信号としてアグレッシブな動作をパラメータ化することで、トラジェクトリスタイルの正確な操作を可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:45:32 GMT)
ReEXplore: Improving MLLMs for Embodied Exploration with Contextualized Retrospective Experience Replay [22.7] エンボディード・サーベイ(Embodied Exploring)は、エンボディード・エージェントがきめ細かな認識と知識に富んだ意思決定を持つ必要があるターゲット駆動のプロセスである。
近年のMLLMは知覚力や推論能力の強いため探索に活用されているが,MLLMをベースとしたエンボディエージェントは新たな環境の探索に最適である。
ReEXploreは、蒸留された抽象的な経験を推論時に注入し、階層的なフロンティア選択を行い、フロンティアのランクを粗い決定に分解する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:13:05 GMT)
How Learning Rate Decay Wastes Your Best Data in Curriculum-Based LLM Pretraining [22.5] 高品質なデータを活用するための自然なアプローチはカリキュラムベースの事前トレーニングであり、品質基準によって決定された品質の上位順にソートされたデータに基づいてモデルを訓練する。
この研究は、これらの手法を制約する重要な要因、すなわち、上昇するデータ品質の順序と減衰する学習率のスケジュールの不整合性を特定する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:03:49 GMT)
Eliciting Chain-of-Thought in Base LLMs via Gradient-Based Representation Optimization [22.3] Chain-of-Thought (CoT)推論は、大規模言語モデル(LLM)にとって重要な機能である。
そこで本研究では, 条件付き状態操作により, ベースLLMからElic-Iting CoTを推論する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:55:57 GMT)
WaveTuner: Comprehensive Wavelet Subband Tuning for Time Series Forecasting [22.3] 本稿では、時系列予測のためのフルスペクトルサブバンドチューニングによるウェーブレット分解フレームワークを提案する。
WaveTunerは2つの主要なモジュールから構成される: (i) 時系列を時間周波数係数に変換するAdaptive Wavelet Refinementモジュール、(ii) 複数の機能分岐を利用するマルチブランチモジュール。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:33:35 GMT)
Concept than Document: Context Compression via AMR-based Conceptual Entropy [22.0] 大規模言語モデル(LLM)は、特に検索拡張生成(RAG)において、長いコンテキストを扱う際に、情報の過負荷に直面します。
本稿では,抽象表現(AMR)グラフを利用した教師なしコンテキスト圧縮フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:08:02 GMT)
ChronoGS: Disentangling Invariants and Changes in Multi-Period Scenes [21.9] 時間的に変調されたガウス表現であるクロノGSを導入し、アンカー足場内の全ての周期を再構築する。
ChronoGSは、再構築品質と時間的一貫性において、ベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:55:33 GMT)
KOM: A Multi-Agent Artificial Intelligence System for Precision Management of Knee Osteoarthritis (KOA) [21.8] 変形性膝関節症(KOA)は、世界中で6億人以上の患者に影響を与え、大きな痛み、機能障害、障害と関連している。
我々は, KOA評価, リスク予測, 治療処方の自動化を目的としたマルチエージェントシステム KOM を開発した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:56:51 GMT)
UniGame: Turning a Unified Multimodal Model Into Its Own Adversary [21.7] Unified Multimodal Models (UMM) は、単一のアーキテクチャによる理解と生成の両方において、優れたパフォーマンスを示している。
我々は,不整合を直接対象とする自己学習後フレームワークUniGameを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:50:01 GMT)
Perceptual Taxonomy: Evaluating and Guiding Hierarchical Scene Reasoning in Vision-Language Models [21.6] 知覚分類学は、タスク関連特性を推測する場面理解の構造化過程である。
身体的根拠に基づく視覚的推論のためのベンチマークであるPerceptual Taxonomyを紹介する。
先進的な視覚言語モデルは認識タスクでは良好に機能するが、プロパティ駆動の質問では10~20%低下することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:13:21 GMT)
A Longitudinal Measurement of Privacy Policy Evolution for Large Language Models [21.5] 本稿では,世界の主要言語モデル (LLM) プロバイダのプライバシポリシに関する,最初の縦断的研究について述べる。
我々は,2025年8月までの5カ国11 LLMプロバイダから,74の歴史的プライバシポリシと115の補足的なプライバシドキュメントの時系列データセットをキュレートする。
我々は、連続したポリシーバージョン間の3000以上の文レベルの編集を抽出し、LLMプライバシポリシーに適した分類法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:40:15 GMT)
PairHuman: A High-Fidelity Photographic Dataset for Customized Dual-Person Generation [21.3] PairHumanは、写真標準を満たす2人の肖像画を生成するために特別に設計された、最初の大規模なベンチマークデータセットである。
データセットには100万以上の画像が含まれており、さまざまなシーン、服装、二重対人インタラクションをキャプチャする。
我々のデータセットと方法は、人間の好みに合わせて、優れた視覚的品質で、高度にカスタマイズされたポートレートを生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:58:20 GMT)
Masked Diffusion Models are Secretly Learned-Order Autoregressive Models [21.2] Masked Diffusion Modelsは、トレーニング中にデコード順序を識別し、最適化できることを示す。
これらの命令に対してMDMの目的が正確に重み付けされた自己回帰的損失に分解されることを証明する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:17:56 GMT)
Large Language Models as Search Engines: Societal Challenges [21.1] 大規模言語モデル(LLM)は、いつか検索エンジンをウェブ上の情報の主要なポータルとして置き換えるかもしれない。
本稿では,このような変化がもたらす社会的課題について考察する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:59:42 GMT)
LLMAID: Identifying AI Capabilities in Android Apps with LLMs [20.9] モバイルソフトウェアにおけるAI能力を識別するための既存のアプローチは、主に手動検査とルールベースのアプローチに依存している。
本稿では,候補抽出,知識ベースインタラクション,AI能力分析と検出,AIサービス要約の4つのタスクを含むLLMAIDを提案する。
LLMAIDを4,201のAndroidアプリケーションのデータセットに適用し、最先端のルールベースのアプローチよりも現実のAIアプリを242%多く特定します。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:54:20 GMT)
Neural Texture Splatting: Expressive 3D Gaussian Splatting for View Synthesis, Geometry, and Dynamic Reconstruction [20.8] 3D Gaussian Splatting (3DGS) は高品質な新規ビュー合成の先駆的なアプローチとして現れている。
近年の研究では, 3DGSを原単位のテクスチャなど, 原単位の容量を増大させることが提案されている。
ニューラルテクスチャスティング(NTS)を導入し,多種多様な再構築作業における最先端3DGSのバリエーションを改善する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:26:32 GMT)
MetroGS: Efficient and Stable Reconstruction of Geometrically Accurate High-Fidelity Large-Scale Scenes [20.6] 複雑な都市環境における効率的で堅牢な復興のための新しいフレームワークであるMetroGSを紹介する。
本手法は,分散2次元ガウススプラッティング表現を基本基盤として構築する。
大規模な都市データセットの実験により、MetroGSはより優れた幾何学的精度、レンダリング品質を達成することが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:34:19 GMT)
AttackPilot: Autonomous Inference Attacks Against ML Services With LLM-Based Agents [20.1] 推論攻撃は広く研究され、MLサービスの体系的なリスク評価を提供する。
先進的な大規模言語モデルの出現は、推論攻撃の専門家として自律的なエージェントを開発するという、有望だがほとんど未発見の機会を示している。
本研究では,人間の介入なしに独立して推論攻撃を行う自律エージェントであるAttackPilotを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:14:14 GMT)
Live-SWE-agent: Can Software Engineering Agents Self-Evolve on the Fly? [19.8] 大規模言語モデル(LLM)は、ソフトウェア工学を含むほぼすべての産業を再構築している。
我々は,実世界のソフトウェア問題を解決する際に,自律的かつ連続的に自己進化できる,初のライブソフトウェアエージェントであるLive-SWE-agentを提案する。
広範に研究されているSWE-bench Verifiedベンチマークでは,Live-SWE-AGENTがテスト時間スケーリングなしで77.4%の精度で解決できることが示されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:55:51 GMT)
Robust and Generalizable GNN Fine-Tuning via Uncertainty-aware Adapter Learning [19.5] 既存のAdapterGNNは、しばしばグラフノイズの傾向があり、限定的な一般化性を示す。
本稿では,未学習のGNNモデルをノイズの多いグラフデータに対して強化する不確実性認識適応器(UAdapterGNN)を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:57:37 GMT)
Solving a Research Problem in Mathematical Statistics with AI Assistance [19.4] 我々は、GPT-5が、ロバストな数学的統計学において、未解決の研究問題を解くのにいかに役立ったかを示す。
我々の問題は、観測がワッサーシュタインに結合した汚染によって妨害される、ロバストな密度推定に関するものである。
GPT-5は、私たちが考えていない計算や、我々に馴染みのないテクニックの提案など、その過程で重要な助けを提供しました。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:03:56 GMT)
MFmamba: A Multi-function Network for Panchromatic Image Resolution Restoration Based on State-Space Model [19.3] SR, スペクトル回復, 関節SR, スペクトル回復のタスクを3つの異なる入力で実現できる新しい多機能モデル (MFmamba) を開発した。
多くの実験により、MFmambaは評価指標と視覚的結果に競争力があることが示されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:44:04 GMT)
UNeMo: Collaborative Visual-Language Reasoning and Navigation via a Multimodal World Model [19.3] VLN(Vision-and-Language Navigation)は、視覚画像と自然言語による複雑な環境を自律的にナビゲートするエージェントである。
事前学習型大言語モデル(LLM)を用いた言語誘導ナビゲーション推論の強化に関する最近の研究は、有望な可能性を示している。
視覚状態推論とナビゲーション決定の協調最適化を目的とした新しいフレームワークUNeMoを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:31:58 GMT)
LLM-Driven Kernel Evolution: Automating Driver Updates in Linux [19.1] Linuxカーネルの進化は、API/ABIの変更、セマンティックシフト、セキュリティ強化アップデートを通じてドライバを壊す。
本稿では,カーネル$rightarrow$driver共進化事例の実行可能なコーパスであるDRIVEBENCHと,ドライバのメンテナンスを自動化する閉ループLLM駆動システムであるAUTODRIVERを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:31:52 GMT)
GContextFormer: A global context-aware hybrid multi-head attention approach with scaled additive aggregation for multimodal trajectory prediction [19.0] HDマップに依存したモデルは、コストのかかるデータ取得、更新の遅れ、破損した入力に対する脆弱性に悩まされる。
本稿では,グローバルなコンテキスト認識型ハイブリッドアテンションを備えた,プラグイン・アンド・プレイ型エンコーダ・デコーダアーキテクチャであるGContextFormerを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:28:42 GMT)
Optimization-Aware Test Generation for Deep Learning Compilers [19.0] OATestは最適化対応の計算グラフを合成するための新しいアプローチである。
より多くのバグを検出し、TVMとONNXRutimesでより高いコードカバレッジを達成することができる。
OATestは58の既知のバグを明らかにし、そのうち36のバグが開発者によって確認または修正されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:27:59 GMT)
DUALGUAGE: Automated Joint Security-Functionality Benchmarking for Secure Code Generation [18.2] 大規模言語モデル(LLM)と自律型コーディングエージェントは、広範囲の非メタルドメインにまたがるソフトウェア生成にますます利用されている。
セキュアなコード生成のための既存のベンチマークと評価は、脆弱性の削減、正当性保存の無視、あるいは別々のデータセットのセキュリティと機能の評価のみを短時間で測定する。
GAUGEは,LLM生成コードのセキュリティと正しさを一斉に評価するために設計された,最初の完全自動ベンチマークフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:26:14 GMT)
Learning What to Trust: Bayesian Prior-Guided Optimization for Visual Generation [18.2] GRPOの新たな拡張であるBPGOを導入し、セマンティックな先行アンカーを通して報酬の不確実性を明示的にモデル化する。
BPGOは一貫して強いセマンティックアライメントを提供し、知覚の忠実度を高め、標準GRPOや最近の変種よりも早く収束する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:29:30 GMT)
Multidimensional Music Aesthetic Evaluation via Semantically Consistent C-Mixup Augmentation [17.9] マルチソースなマルチスケール特徴抽出と相補的なセグメントとトラックレベルの表現を組み合わせ,ロバストな音楽美的評価フレームワークを提案する。
ICASSP 2026 SongEvalベンチマークの実験により、我々の手法は相関とトップレベルのメトリクスで、ベースラインメソッドを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:12:33 GMT)
The Core in Max-Loss Non-Centroid Clustering Can Be Empty [17.8] 我々は,各エージェントの損失がクラスタの他のメンバとの最大距離である最大余剰目標の下で,非セントロイドクラスタリングのコア安定性について検討した。
これは、我々の知る限りでは、コアが最大ロスの目的の下で非セントロイドクラスタリングにおいて空であることを示す最初の不可能な結果である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:42:43 GMT)
ReBrain: Brain MRI Reconstruction from Sparse CT Slice via Retrieval-Augmented Diffusion [17.3] 低用量プロトコルは、しばしば低解像度の平面解像度のCTボリュームをもたらす。
脳MRI再建のための検索拡張拡散フレームワークであるReBrainを提案する。
SynthRAD2023とBraTSの実験により、ReBrainはスパース条件下でのクロスモーダル再構築において最先端の性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:52:53 GMT)
EEG-VLM: A Hierarchical Vision-Language Model with Multi-Level Feature Alignment and Visually Enhanced Language-Guided Reasoning for EEG Image-Based Sleep Stage Prediction [17.3] 脳波に基づく睡眠ステージ分類のための多段階特徴アライメントと言語誘導推論を統合した階層型視覚言語フレームワークであるEEG-VLMを提案する。
実験により,脳波を用いた睡眠段階分類において,VLMの精度と解釈性の両方が有意に向上することが確認された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:23:42 GMT)
Granular Computing-driven SAM: From Coarse-to-Fine Guidance for Prompt-Free Segmentation [17.2] グラニュラーコンピューティングをモチベーションとした粗大なフレームワークであるグラニュラーコンピューティング駆動SAM(Grc-SAM)を紹介する。
まず、粗いステージが特徴から高応答領域を適応的に抽出し、精密な前景の局所化を実現する。
第2に、詳細なモデリングを強化するために、局所的なスウィンスタイルの細かな注意を伴って、より微細なパッチパーティショニングを適用する。
第3に、洗練されたマスクはSAMデコーダの遅延プロンプト埋め込みとしてエンコードされ、手作りプロンプトを自動推論プロセスに置き換える。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:55:02 GMT)
Mitigating Long-Tail Bias in HOI Detection via Adaptive Diversity Cache [16.8] ヒューマン・オブジェクト・インタラクション(Human-Object Interaction、HOI)検出は、コンピュータビジョンにおける基本的なタスクであり、マシンが様々な現実のシナリオにおいて人間とオブジェクトの関係を理解するのに有効である。
VLMの最近の進歩は、リッチなクロスモーダル表現を活用することにより、HOI検出を大幅に改善した。
既存のVLMベースのアプローチの多くは、追加のトレーニングやプロンプトチューニングに大きく依存しているため、計算オーバーヘッドが大きくなり、スケーラビリティが制限される。
本稿では,適応多様性キャッシュ(ADC)モジュールを提案する。これは,HOI検出における長期バイアスを軽減するために設計された,新しいトレーニングフリーでプラグアンドプレイ機構である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:30:08 GMT)
Robust Multimodal Sentiment Analysis with Distribution-Based Feature Recovery and Fusion [16.6] 画像・テキスト・ペアの頑健なマルチモーダル感情分析のための分布型特徴回復・融合(DRF)手法を提案する。
具体的には,各モダリティの特徴分布を近似するために,低品質なモダリティと欠落したモダリティを同時に処理できる機能キューをメンテナンスする。
実験では、低品質なモダリティと欠落したモダリティを模倣するために、サンプルのいくつかのモダリティを破壊・破棄する2つの破壊戦略が採用された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:24:33 GMT)
Hi-SAFE: Hierarchical Secure Aggregation for Lightweight Federated Learning [16.5] 署名に基づくフェデレート学習のための暗号的にセキュアな集約フレームワークであるHi-SAFEを提案する。
我々の中核的な貢献は、フェルマーのリトル・セオリームから派生したSIGNSGDMVの効率的な多数決の構築である。
さらに、一定の乗法深さと有界複雑性を保証する階層的な部分群戦略を導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:42:40 GMT)
Minimax Multi-Target Conformal Prediction with Applications to Imaging Inverse Problems [16.3] 画像逆問題において、不確実性定量化は、特に安全クリティカルな応用において、依然として根本的な課題である。
本稿では,複数対象の共形予測に対する最小限のアプローチを提案する。
我々は,既存のマルチターゲット共形予測法と比較して,ミニマックス法の利点を数値的に示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:58:49 GMT)
Rethinking Vision Transformer Depth via Structural Reparameterization [16.1] 本稿では,訓練期間中に機能する分岐型構造パラメータ化手法を提案する。
提案手法では, 変圧器ブロック内の並列分岐を利用して, 合理化シングルパスモデルに体系的に統合する。
ViT-Tinyに適用した場合、このフレームワークは、ImageNet-1Kの分類精度を維持しながら、元の12層アーキテクチャを6層、4層、もしくは3層に改善する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:28:55 GMT)
GraphMind: Theorem Selection and Conclusion Generation Framework with Dynamic GNN for LLM Reasoning [16.1] GraphMindはグラフベースのフレームワークで、グラフニューラルネットワーク(GNN)と大きな言語モデル(LLM)を統合する。
我々のフレームワークは、クローズドループ方式でコンテキスト認識、解釈、構造化推論を可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:18:21 GMT)
CAMformer: Associative Memory is All You Need [16.0] トランスフォーマーは、注意の二次的なコストのためにスケーラビリティの課題に直面します。
本稿では,注意を連想記憶操作として再解釈する新しいアクセラレータであるCAMformerを提案する。
CAMformerは10倍のエネルギー効率、最大4倍高いスループット、最先端のアクセラレータに比べて6~8倍低い領域を実現している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:57:11 GMT)
ModHiFi: Identifying High Fidelity predictive components for Model Modification [16.0] ModHiFiは、トレーニングデータや損失関数アクセスを必要としないモデル修正のためのアルゴリズムである。
構造化プルーニングのためのModHiFi-Pは、ImageNetモデル上での最先端技術よりも11%のスピードアップを実現している。
ModHiFi-Uは、クラスレベルでのアンラーニングのために、微調整なしでCIFAR-10上で完全なアンラーニングを達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:56:24 GMT)
Intelligent Power Grid Design Review via Active Perception-Enabled Multimodal Large Language Models [15.9] 本稿では,インテリジェントグリッド描画のための新しい3段階フレームワークを提案する。
事前訓練されたマルチモーダル大言語モデル(MLLM)によって、高度なプロンプトエンジニアリングによって駆動される。
実世界の電力グリッド描画に関する予備的な結果は、我々のアプローチがMLLMのマクロな意味情報の把握能力を大幅に向上させることを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:41:26 GMT)
When and What to Recommend: Joint Modeling of Timing and Content for Active Sequential Recommendation [15.9] 我々は、次のインタラクション時間を予測するアクティブレコメンデーションを調査し、アイテムを積極的に届ける。
本稿では,ToI と IoI を連立対象とする拡散型フレームワーク PASRec を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:16:10 GMT)
KernelBand: Boosting LLM-based Kernel Optimization with a Hierarchical and Hardware-aware Multi-armed Bandit [15.8] KernelBandは、カーネル最適化を階層的な多重武装バンディット問題として定式化する新しいフレームワークである。
我々はKernelBandが最先端の手法よりも優れており、より少ないトークンで優れた性能を実現し、計算資源の増加とともに飽和を伴わずに一貫した改善を実現していることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:11:50 GMT)
Fast Escape, Slow Convergence: Learning Dynamics of Phase Retrieval under Power-Law Data [15.8] スケーリング法則は、データ、計算、トレーニング時間によって学習のパフォーマンスがどのように改善され、現代のディープラーニングにおける中心的なテーマとなったかを記述している。
共分散スペクトルがパワー則に従う異方性ガウス入力による位相探索を正準非線形モデルで行う。
力学が二次元系に崩壊する等方性の場合とは異なり、異方性は、方程式の無限階層が要約統計の進化を支配する定性的に新しい状態をもたらす。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:21:17 GMT)
FilmSceneDesigner: Chaining Set Design for Procedural Film Scene Generation [14.7] FilmSceneDesignerは、プロの映画デザインワークフローをエミュレートする自動シーン生成システムである。
映画リアリズムと資産多様性を高めるため,6,862本のフィルム特異的な3Dアセットと733本の材料をキュレートしたデータセットであるSetDepot-Proを構築した。
実験結果と人体評価の結果から,本システムは強い映像の忠実度を持つ構造的音響シーンを生成できることが判明した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:00:40 GMT)
MedSAM3: Delving into Segment Anything with Medical Concepts [14.7] 医用画像とビデオのセグメンテーションのためのテキストプロンプト可能な医療セグメンテーションモデルであるMedSAM-3を提案する。
Segment Anything Model (SAM) 3 アーキテクチャをセマンティックな概念ラベルと組み合わせた医療画像に微調整することで、MedSAM-3 は医用Promptable Concept (PCS) を可能にする。
MedSAM-3 Agentは複雑な推論と反復的な洗練をループ内のエージェントワークフローに統合するフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:34:38 GMT)
Sampling Control for Imbalanced Calibration in Semi-Supervised Learning [14.6] 半教師付き学習(SSL)におけるクラス不均衡は依然として重要な課題である
分離サンプリング制御によりモデルバイアスを抑制する統合フレームワークSC-SSLを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:15:58 GMT)
CrypTorch: PyTorch-based Auto-tuning Compiler for Machine Learning with Multi-party Computation [14.1] 我々は,MPCベースの機械学習(ML)のためのコンパイラCrypTorchを提案する。
CrypTorchは、MPCランタイムの他の部分と近似を分離し、自動的に近似を選択して、パフォーマンスと精度の両方を最大化する。
PyTorch 2 コンパイラの拡張として構築された CrypTorch の自動チューニングだけで 1.20--1.7$times$ immediately speedup が提供される。
優れたエンジニアリングと最先端のプラクティスの採用を組み合わせることで、フレームワーク全体が3.22--8.6$times$エンドツーエンドのスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:21:55 GMT)
HOPPS: Hardware-Aware Optimal Phase Polynomial Synthesis with Blockwise Optimization for Quantum Circuits [14.1] 本稿ではハードウェア対応の最適位相合成アルゴリズムであるHOPPSを紹介する。
CNOT数または深さ最適性を有するCNOT,Rzブロックを生成することができる。
大規模なQAOA回路では、Qiskitによるマッピングの後、CNOT数と深さを44.4%、42.4%まで削減することができる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:07:32 GMT)
InstantViR: Real-Time Video Inverse Problem Solver with Distilled Diffusion Prior [13.8] InstantViRは、事前訓練されたビデオ拡散を利用した超高速ビデオ再構成のためのアモータイズされた推論フレームワークである。
InstantViRは、リアルタイム、インタラクティブ、編集可能、ストリーミングのシナリオと互換性があることを示し、高品質のビデオ復元を現代の視覚システムの実用的なコンポーネントに変える。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:03:29 GMT)
Classification EM-PCA for clustering and embedding [13.7] 混合モデルは、間違いなくクラスタリングに対する最大の貢献の1つです。
expectation-Maximization (EM)アルゴリズムは、クラスタリングが推測されるパラメータを推定するのに特に適している。
分類版である分類EM(CEM)アルゴリズムは、高速収束ソリューションを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:18:59 GMT)
Enhancing Conformal Prediction via Class Similarity [13.4] コンフォーマル予測(CP)は,高度な分類応用のための強力な統計フレームワークとして登場した。
グループ外エラーによる予測をペナルティ化する用語を用いて,CPスコア関数の強化を提案する。
数学的には、共通クラス分割に対して、任意のCPスコア関数の平均セットサイズを削減できることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:56:42 GMT)
When Semantics Regulate: Rethinking Patch Shuffle and Internal Bias for Generated Image Detection with CLIP [13.4] CLIPベースの検出器は、しばしばジェネレータアーティファクトではなくセマンティックキューに依存しており、分散シフト時の不安定なパフォーマンスをもたらす。
Patch Shuffleは、グローバルなセマンティックな連続性を阻害するCLIPに対して、非常に強力なメリットを提供する。
本稿では,セマンティックサブ空間を凍結し,人工物に敏感な層のみを適応させるセマンティック・アンタゴニスティックな微調整パラダイムであるSemAntiを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:54:00 GMT)
VAOT: Vessel-Aware Optimal Transport for Retinal Fundus Enhancement [13.2] 欠損した拡張パイプラインは臨床的に重要な血管を歪め、血管のトポロジーとエンドポイントの整合性を変化させる。
最適輸送目標と2つの構造保存正規化器を組み合わせたフレームワークである Vessel-Aware Optimal Transport (textbfVAOT) を提案する。
これらの制約は、船体構造を保ちながら騒音を低減し、未整備の環境での学習を導く。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:56:08 GMT)
HeaRT: A Hierarchical Circuit Reasoning Tree-Based Agentic Framework for AMS Design Optimization [13.2] HeaRTは自動化ループの基本的な推論エンジンであり、インテリジェントで適応的でヒューマンスタイルの設計最適化に向けた第一歩である。
HeaRTは、40サイクルのベンチマークリポジトリで、推論精度97%、Pass@1のパフォーマンス98%を一貫して示しています。
実験の結果,HeaRTはサイズおよびトポロジー設計適応タスクにおいて3倍の収束性が得られることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:11:06 GMT)
VLM in a flash: I/O-Efficient Sparsification of Vision-Language Model via Neuron Chunking [13.1] 本稿では,チャンク上でのI/O効率のスペーシング戦略であるNeuron Chunkingについて述べる。
スパシフィケーション決定を基礎となる貯蔵挙動と整合させることで、ニューロロン・チャンキングはJetson Orin NanoとJetson AGX Orinの最大4.65倍および5.76倍のI/O効率を向上させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:27:19 GMT)
SmartPoC: Generating Executable and Validated PoCs for Smart Contract Bug Reports [13.0] SmartPoCは、テキスト監査レポートを検証済みのテストケースに変換する自動フレームワークである。
SmartPoCは545件の監査結果のうち236件の実際のバグを1件当たり0.03ドルで確認している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:08:48 GMT)
POUR: A Provably Optimal Method for Unlearning Representations via Neural Collapse [12.9] コンピュータビジョンでは、マシン・アンラーニングは、特定の視覚概念や訓練イメージの影響を、スクラッチからリトレーニングすることなく除去することを目的としている。
我々は,非学習の概念を表現レベルまで拡張し,有効性を忘れること,保持の忠実さ,クラス分離を3年間に分けて表現する。
CIFAR-10/100とPathMNISTの実験では、POURは保持された知識を維持しながら効果的なアンラーニングを達成し、分類レベルと表現レベルの両方で最先端のアンラーニング手法より優れていた。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:38:53 GMT)
Heterogeneous Multi-treatment Uplift Modeling for Trade-off Optimization in Short-Video Recommendation [12.8] ソーシャルメディアプラットフォーム上のショートビデオは、レコメンデーションシステムに固有の課題と機会を提供する。
既存のアップリフトモデルは、ショートビデオレコメンデーションの不均一なマルチ処理シナリオを扱う際の制限に直面している。
短ビデオレコメンデーションにおけるトレードオフ最適化のための新しいヘテロジニアス・マルチトリート・アップリフト・モデリング・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:22:46 GMT)
Facade Segmentation for Solar Photovoltaic Suitability [12.6] BIPVファサードの構築は, 都市における脱炭素化への道のりとして有望である。
本稿では、ファサードのアーキテクチャ構成の詳細情報を統合して、PVアプリケーションに適した表面を自動的に識別するパイプラインを提案する。
373ファサードを10都市の既知次元のデータセットに適用すると, BIPV電位が理論的ポテンシャルよりも著しく低いことが示唆された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:37:35 GMT)
STORE: Semantic Tokenization, Orthogonal Rotation and Efficient Attention for Scaling Up Ranking Models [12.0] Storeは,3つのコアイノベーションに基づいて構築された,統一的でスケーラブルなトークンベースのランキングフレームワークである。
我々のフレームワークは、予測精度(オンラインCTR 2.71%、AUC 1.195%)とトレーニング効率(1.84スループット)を継続的に改善します。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:20:02 GMT)
CodeV: Code with Images for Faithful Visual Reasoning via Tool-Aware Policy Optimization [12.0] 最終回答の精度は、しばしば不誠実な視覚的推論を隠蔽する。
ツール・アウェア・ポリシー・オプティマイゼーションで訓練されたコードベースのビジュアルエージェントであるCodeVを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:48:46 GMT)
From Features to Reference Points: Lightweight and Adaptive Fusion for Cooperative Autonomous Driving [11.7] RefPtsFusionは、協調自動運転のための軽量かつ解釈可能なフレームワークである。
大きな特徴マップやクエリの埋め込みを共有する代わりに、車両はコンパクトな参照ポイントを交換する。
このアプローチは、焦点を"見えるもの"から"見える場所"にシフトし、センサーとモデルに依存しないインターフェースを生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:38:57 GMT)
A Nutrition Multimodal Photoplethysmography Language Model [11.5] Photoplethysthy Language Model (NPLM)は、PPGを言語モデルで解釈可能な埋め込みに投射する。
NPLMは、テキストのみのベースラインよりも、毎日のカロリー摂取予測を11%改善する。
以上の結果から, 消費者ウェアラブルの生理的計測と食事情報の統合が, 非侵襲的な食事モニタリングに有用であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:12:03 GMT)
Subtract the Corruption: Training-Data-Free Corrective Machine Unlearning using Task Arithmetic [11.4] CMU(Corrective Machine Unlearning)は、トレーニング後の汚職の影響を取り除くことを目的としている。
以前のCMUでは、典型的には、特定された破損したトレーニングサンプルへのアクセスを前提としています(" forget set'')。
我々は、元のトレーニングデータが利用不可能なEmphsource-free CMUを定式化し、その結果、特定された不正なトレーニングサンプルの忘れ物セットを特定できない。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:15:46 GMT)
Neural Tractability via Structure: Learning-Augmented Algorithms for Graph Combinatorial Optimization [11.2] 本稿では,ニューラルネットワークの推論効率と探索力と,探索に基づくアルゴリズムの解品質保証とを組み合わせた新しいフレームワークを提案する。
我々のフレームワークはニューラルモデルの選択に非依存であり、ニューラルソルバ単独よりも厳密に優れたソリューションを生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:51:42 GMT)
A Problem-Oriented Taxonomy of Evaluation Metrics for Time Series Anomaly Detection [11.1] 時系列異常検出は、IoTやサイバー物理システムで広く使われている。
本研究は, 既存のメトリクスを再解釈する問題指向フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:09:04 GMT)
A General Framework for Per-record Differential Privacy [11.0] 記録ごとの差分プライバシー(PrDP)は、各レコードの機能としてプライバシー予算を定義することでこの問題に対処する。
既存のソリューションは特定のプライバシ機能を扱うか、緩和されたPrDP定義を採用する。
本稿では,任意の標準DP機構がPrDPをサポート可能な,汎用的で実用的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:44:10 GMT)
Beyond SELECT: A Comprehensive Taxonomy-Guided Benchmark for Real-World Text-to-SQL Translation [10.8] 既存のデータセットは、カバー範囲が限られており、現実世界のアプリケーションの多様性を捉えていないことが多い。
コアインテント,ステートメントタイプ,構文構造,キーアクションに基づくテキスト・ツー・ワン分類のための新しい分類法を提案する。
このアプローチは、分類とLLM(Large Language Models)を組み合わせることで、データセットが現実世界のテキスト・ツー・ワンアプリケーションの幅と複雑さを反映することを保証する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:48:39 GMT)
nnActive: A Framework for Evaluation of Active Learning in 3D Biomedical Segmentation [10.8] アクティブラーニングが3Dバイオメディカルイメージングにおいてランダムサンプリングを一貫して上回っているかどうかについては合意が得られていない。
本研究では,大規模な研究によってこれらの落とし穴を克服するオープンソースのALフレームワークであるnnActiveを紹介する。
A)全てのALメソッドは標準のランダムサンプリングよりも優れているが、改良されたフォアグラウンドアウェアランダムサンプリングを確実に上回るものではない。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:50:36 GMT)
EAGER: Edge-Aligned LLM Defense for Robust, Efficient, and Accurate Cybersecurity Question Answering [10.8] EAGERは、パラメータ効率の量子化とドメイン固有の優先順位アライメントを統合し、効率、堅牢性、精度を共同で最適化する。
実験により、EAGERは敵の攻撃成功率を最大7.3倍に下げ、最先端の防御よりもQAの精度を最大55%向上させることが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:49:48 GMT)
Deductive Systems for Logic Programs with Counting [10.8] ルールの2つのグループは、どのような文脈でも同じ意味を持つならば、強く等価であると考えられる。
本稿では,この手法を集計集約を含むプログラムに拡張する方法を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:49:06 GMT)
Scalable Bayesian Network Structure Learning Using Tsetlin Machine to Constrain the Search Space [10.8] PCアルゴリズムはベイズネットワークの構造を学習するための因果推論において広く用いられている手法である。
その人気にもかかわらず、PCアルゴリズムは特にデータセットのサイズが大きくなるにつれて、かなりの時間的複雑さに悩まされる。
本稿では,より効率的にベイズ構造を構築するために,Tsetlin Machine (TM) を利用する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:23:19 GMT)
A Brief History of Digital Twin Technology [10.7] デジタルツイン技術は、産業採用を通じて進歩し、医療変革を引き起こしている。
デジタルツイン(Digital twin)は、物理システムのデータ駆動仮想システムで、リアルタイムデータストリームを通じて継続的に更新される。
医学では、デジタルツインは画像、バイオセンサー、計算モデルを統合し、患者固有のシミュレーションを生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:03:55 GMT)
The Selective Disk Bispectrum and Its Inversion, with Application to Multi-Reference Alignment [10.7] 画像形状解析のための高速な回転不変表現である選択的ディスクバイスペクトルを提案する。
この表現は回転した画像に対して多重参照アライメントを可能にすることを示す。
これらの結果は、回転不変形状データから学習するための実用的で理論的に基礎付けられたツールとしてディスクバイスペクトルを確立する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:15:29 GMT)
Row-stochastic matrices can provably outperform doubly stochastic matrices in decentralized learning [10.7] 分散学習は、不均一ノード重みが$$の重み付きグローバル損失を伴うことが多い。
重み付きヒルベルト空間フレームワーク $L2(mathbbRd)$ を開発し、ユークリッド解析より厳密な収束率を得る。
そして、より小さなスペクトルギャップであっても、行確率的設計がより高速に収束する十分な条件を導出する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:58:38 GMT)
N2N: A Parallel Framework for Large-Scale MILP under Distributed Memory [10.7] 分散メモリコンピューティング環境における大規模問題を解決するために,スケーラブルな並列フレームワークであるN2Nを提案する。
決定論的モードと非決定論的モードの両方がサポートされており、フレームワークは既存のソルバと容易に統合できるように設計されている。
決定論的モードでは、N2N-SCIPは異なるプロセス数と計算クラスタ間でParaSCIPよりも大幅に性能が向上している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:29:55 GMT)
EnfoPath: Energy-Informed Analysis of Generative Trajectories in Flow Matching [10.6] フローベース生成モデルは、基準分布から目標データ分布への学習速度場を統合することにより、データを合成する。
古典力学に触発された運動経路エネルギー (KPE) は, サンプリング器の各生成経路に沿った総運動量を定量化する, 単純かつ強力な診断法である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:27:41 GMT)
BackSplit: The Importance of Sub-dividing the Background in Biomedical Lesion Segmentation [10.6] BackSplitと呼ばれるバックグラウンドクラスをサブ分割するきめ細かいラベルによるトレーニングは、推論コストを増大させることなく、大幅なパフォーマンス向上をもたらす可能性がある、と私たちは主張する。
複数のデータセットにわたる広範な実験により、BackSplitが一貫して小さなセグメンテーション性能を向上することを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:31:51 GMT)
OceanForecastBench: A Benchmark Dataset for Data-Driven Global Ocean Forecasting [10.3] データ駆動深層学習に基づく海洋予測モデルは、複雑な海洋力学を捉える大きな可能性を示している。
これらの進歩にもかかわらず、オープンソースのベンチマークがないため、一貫性のないデータの使用と評価方法が生まれている。
3つのコアコントリビューションを提供するベンチマークであるOceanForecastBenchを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:57:43 GMT)
3M-TI: High-Quality Mobile Thermal Imaging via Calibration-free Multi-Camera Cross-Modal Diffusion [10.3] 3M-TIは、移動体熱画像のためのキャリブレーションフリーマルチカメラ・クロスモダリティ拡散フレームワークである。
中心となる3M-TIは、拡散UNetにクロスモーダル自己アテンションモジュール(CSM)を統合する。
この設計により、拡散ネットワークは、超解熱画像における空間分解能、構造忠実度、テクスチャディテールを高めるために、その生成性を利用することができる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:48:47 GMT)
INTERLACE: Interleaved Layer Pruning and Efficient Adaptation in Large Vision-Language Models [10.3] 我々は,サンプル効率の微調整による性能を維持しながら,VLMの冗長層を創出する新しいフレームワークであるInterLACEを紹介した。
連続する3層構造を解析し, 局所的冗長性を同定し, 残りの2層を微調整し, 残りの層を微調整し, 第三層を凍結し, 微調整時に安定なアンカーとして機能させる。
1つのエポックのためにFineVisionデータセットのわずか1%のレイヤのみを微調整することで、Interlaceはネットワークの25%を落として88.9%のパフォーマンス維持を実現し、SOTAパフォーマンスを達成した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:24:22 GMT)
CellFMCount: A Fluorescence Microscopy Dataset, Benchmark, and Methods for Cell Counting [10.2] 細胞分化に関する免疫細胞化学実験から得られた3,023ドルの画像からなる大規模アノテートデータセットを紹介した。
データセットは、高い細胞密度、重なり合い、形態的に多様な細胞、画像当たりの細胞数の長期分布、染色プロトコルのバリエーションなど、重要な課題を提示する。
我々は、Segment Anything Model(SAM)の密度マップに基づく適応を実装し、平均絶対誤差(MAE)を22.12ドルと報告し、既存のアプローチより優れている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:53:59 GMT)
Can Modern Vision Models Understand the Difference Between an Object and a Look-alike? [10.1] CLIPのような視覚言語モデルがこの違いを捉えているかどうかを考察する。
私たちはRoLA(RealまたはLookalike)という名前のデータセットを、リアルで見た目はLookalikeの例にまとめました。
この方向を画像やテキストの埋め込みに適用することで、クロスモーダル検索における識別が向上する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:09:32 GMT)
Disc3D: Automatic Curation of High-Quality 3D Dialog Data via Discriminative Object Referring [10.1] 3D Multi-modal Large Language Models (MLLM) は、大規模で高品質な3Dシーン対話データセットが不足しているため、2Dピアよりもまだ遅れている。
本稿では,生の3Dスキャンを,前回のコストのごく一部で,曖昧で高品質な対話データに変換する完全自動パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:51:34 GMT)
DataSage: Multi-agent Collaboration for Insight Discovery with External Knowledge Retrieval, Multi-role Debating, and Multi-path Reasoning [10.0] DataSageは、外部知識検索を組み込んだ新しいマルチエージェントフレームワークで、分析コンテキストを充実させる。
InsightBenchに関する大規模な実験は、DataSageが既存のデータインサイトエージェントをあらゆる難易度で一貫して上回っていることを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:37:38 GMT)
VideoPerceiver: Enhancing Fine-Grained Temporal Perception in Video Multimodal Large Language Models [9.9] VideoPerceiverはビデオ理解における微細な認識を高めるビデオマルチモーダル大言語モデル(VMLLM)である。
そこで我々は,キャプションからイベントアクションキーワードを抽出し,対応するキーフレームを識別し,隣接するフレームに置き換えることで,キー情報伝達ビデオを構築する。
VideoPerceiverは、詳細なアクション理解とまれなイベントキャプションベンチマークにおいて、最先端のVMLLMを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:57:26 GMT)
Sphinx: Efficiently Serving Novel View Synthesis using Regression-Guided Selective Refinement [9.7] スフィンクス(Sphinx)は、拡散レベルの忠実度を計算量的に大幅に低い値で達成する、訓練不要なハイブリッド推論フレームワークである。
スフィンクスは拡散モデル推論よりも平均1.8倍のスピードアップを達成するが、知覚的劣化は5%未満である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:09:23 GMT)
An Anatomy Aware Hybrid Deep Learning Framework for Lung Cancer Tumor Stage Classification [9.4] 腫瘍の大きさと距離特性を明示的に測定し,ステージングを行う医用接地型ハイブリッドパイプラインを提案する。
本手法では, 特殊なエンコーダ・デコーダネットワークを用いて肺と隣接する解剖を正確に分類する。
この新しいフレームワークはLung-PET-CT-Dxデータセットで評価されており、従来のディープラーニングモデルと比較して優れた性能を示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:01:47 GMT)
Resolving Node Identifiability in Graph Neural Processes via Laplacian Spectral Encodings [9.3] 固有ベクトル符号のフリップや固有空間内の回転の基底に不変なラプラシアン位置符号化の理論を提供する。
この符号化により、一定数の観測からノード識別性が得られ、Weisfeiler-Lehmanテストで制約されたアーキテクチャからサンプル複雑度を分離することが証明される。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:20:36 GMT)
MonoMSK: Monocular 3D Musculoskeletal Dynamics Estimation [9.3] データ駆動学習と物理に基づくシミュレーションを橋渡しするハイブリッドフレームワークであるMonoMSKを紹介する。
MonoMSKは解剖学的に正確な筋骨格モデルにより運動学(運動)と運動学(力とトルク)の両方を共同で回復させる。
BML-MoVi、BEDLAM、OpenCapの実験では、MonoMSKはキネマティックな精度で最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:20:17 GMT)
Collaborative Learning with Multiple Foundation Models for Source-Free Domain Adaptation [9.2] Source-Free Domain Adaptation (SFDA)は、トレーニング済みのソースモデルを、ソースデータにアクセスすることなく、ラベルなしのターゲットドメインに適応することを目的としている。
ファンデーションモデル(FM)の最近の進歩は、SFDAをガイドするための外部意味知識を活用する新たな機会をもたらした。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:12:22 GMT)
TouchFormer: A Robust Transformer-based Framework for Multimodal Material Perception [8.9] 我々は,堅牢なマルチモーダル融合フレームワークであるTouchFormerを提案する。
モーダリティ適応ゲーティング機構とモーダリティ内およびモーダリティ間注意機構を用いて、モーダリティ間特徴を適応的に統合する。
SSMCおよびサブカテゴリタスクにおいて,TouchFormerは2.48%,6.83%の分類精度の向上を実現している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:43:59 GMT)
SPAGS: Sparse-View Articulated Object Reconstruction from Single State via Planar Gaussian Splatting [8.7] 本稿では,平面ガウススプラッティングによるカテゴリー非依存のオブジェクト再構成フレームワークを提案する。
本手法は,合成データと実世界データの両方で高忠実な部分レベル表面再構成を実現する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:04:41 GMT)
DEAP-3DSAM: Decoder Enhanced and Auto Prompt SAM for 3D Medical Image Segmentation [8.7] SAM(Segment Anything Model)は、最近医療画像のセグメンテーションにおいて大きな可能性を証明している。
本研究では,空間的特徴量を高めるために,特徴強調デコーダを提案する。
また,デュアルアテンション・プロンプタを設計し,空間アテンションとチャネルアテンションを通じて情報を自動的に取得する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:07:22 GMT)
SAOT: An Enhanced Locality-Aware Spectral Transformer for Solving PDEs [8.7] 本稿では,ウェーブレット変換の空間周波数局在特性をトランスフォーマーアーキテクチャに取り入れることを検討した。
本稿では,局所性を考慮した特徴を効率的に学習するための線形計算複雑性を持つ新しいWavelet Attention (WA) モジュールを提案する。
我々はさらに、WAの局所的な焦点をフーリエベースのアテンションのグローバルな受容領域と統合するハイブリッドスペクトル変換器であるスペクトル注意演算子トランスフォーマー(SAOT)を開発した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:22:28 GMT)
VecIntrinBench: Benchmarking Cross-Architecture Intrinsic Code Migration for RISC-V Vector [8.6] アーキテクチャ間でのRISC-Vベクトル(RVV)固有の関数の変換は、現在主流のアプローチである。
現在、RVV拡張の固有のマイグレーション機能を包括的に評価するベンチマークはない。
RVV拡張を包含する最初の固有ベンチマークであるVecIntrinBenchを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:11:10 GMT)
Time Travel: LLM-Assisted Semantic Behavior Localization with Git Bisect [8.6] 本稿では,大規模言語モデル(LLM)をGitビスクトプロセスに統合し,セマンティックなフォールトローカライゼーションを実現する新しいフレームワークを提案する。
本システムでは, 雑音条件下でのコミット分析によるコミットを可能にするため, 構造的思考推論の連鎖によるビステクトトラバーサルを増強する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:49:59 GMT)
Orchestrating Dual-Boundaries: An Arithmetic Intensity Inspired Acceleration Framework for Diffusion Language Models [8.5] ODB-dLLMはdLLM推論を加速するために二重境界を編成するフレームワークである。
我々は,ODB-dLLMがベースラインdLLMとFast-dLLMで46-162xと2.63-6.30xの高速化を達成したことを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:36:54 GMT)
Periodic Asynchrony: An Effective Method for Accelerating On-Policy Reinforcement Learning [8.4] 強化学習 (RL) が注目され, 再生・適用への取り組みが高まっている。
主流のRLフレームワークでは、推論とトレーニングは一般的に同じデバイスにデプロイされる。
本研究では、推論とトレーニングの展開を分離する戦略に戻ります。
従来の同期アーキテクチャを周期的な非同期フレームワークに変換し、各コンポーネントの要求駆動、独立、および弾力的なスケーリングを可能にします。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:22:50 GMT)
Multi-Agent Cross-Entropy Method with Monotonic Nonlinear Critic Decomposition [8.4] マルチエージェント強化学習(MARL)は、分散実行(CTDE)を用いた集中訓練を一般的に採用する
集中分散ミスマッチ(CDM)は、あるエージェントの最適下行動が他のエージェントの学習を劣化させるときに発生する。
単調非線形批判分解(NCD)を併用したマルチエージェントクロスエントロピー法(MCEM)を提案する。
MCEMは、連続したアクションベンチマークと離散的なアクションベンチマークの両方で最先端のメソッドより優れている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:04:42 GMT)
Generalized Landau Paradigm for quantum phases and phase transitions [8.3] ランドーパラダイムは凝縮物質系における相転移と相転移を理解するための中心的ドグマである。
一般化対称性と一般化ガウイングの概念の最近の発展は、ランダウパラダイムを一般化する方法を示しているように思われる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:49:22 GMT)
A CNN-Based Technique to Assist Layout-to-Generator Conversion for Analog Circuits [8.3] 本稿では,アナログ回路の参照レイアウトを,サブセル生成のために利用可能なジェネレータを効率的に再利用することにより,プロシージャレイアウトジェネレータに変換する手法を提案する。
提案した畳み込みニューラルネットワーク(CNN)モデルは,ライブラリ内で利用可能なジェネレータスクリプトによって生成されるサブセルを自動的に検出する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:33:31 GMT)
AI Consciousness and Existential Risk [8.3] AIでは、存在リスクは、人間性を根絶する能力と目的の両方を持つ人工システムによって引き起こされる仮説上の脅威を意味する。
AI意識と生存リスクという2つの質問は、前者が後者に関係しているかのように、時に混同される。
この見解は、意識と知性の共通した混同に由来すると説明します。
しかし、いずれの方向にも、意識が生存リスクに影響を与えるような偶然のシナリオがある。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:48:02 GMT)
Many Ways to be Right: Rashomon Sets for Concept-Based Neural Networks [8.2] Rashomon Concept Bottleneck Modelsは、複数のニューラルネットワークを学習するフレームワークである。
我々のフレームワークは、深層モデルにおけるデータ駆動推論の多様性の体系的な探索を可能にし、等しく正確な解に対する監査、比較、アライメントのための新しいメカニズムを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:12:26 GMT)
MoodBench 1.0: An Evaluation Benchmark for Emotional Companionship Dialogue Systems [8.2] 本稿では,情緒コンパニオンシップ対話システム (ECD) の形式的記述による定義を提案する。
次に、最初のECD評価ベンチマークであるMoodBench 1.0を設計、実装します。
30の主流モデルの広範な評価を通じて,MoodBench 1.0は識別妥当性に優れ,モデル間の感情的相性の違いを効果的に定量化できることを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:32:02 GMT)
SimDiff: Simpler Yet Better Diffusion Model for Time Series Point Forecasting [8.1] 拡散モデルは近年,時系列予測において有望であることが示されている。
それらはしばしば最先端のポイント推定性能を達成するのに失敗する。
ポイント推定のための一段階のエンドツーエンドフレームワークであるSimDiffを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:09:55 GMT)
FanarGuard: A Culturally-Aware Moderation Filter for Arabic Language Models [8.0] FanarGuardはアラビア語と英語の安全性と文化的アライメントを評価するバイリンガル・モデレーション・フィルターである。
文化的アライメントを厳格に評価するために、アラビア文化の文脈をターゲットとした最初のベンチマークを開発する。
結果は、FanarGuardがアノテーション間の信頼性よりも人間アノテーションとの強い合意を達成していることを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:48:35 GMT)
Stable Multi-Drone GNSS Tracking System for Marine Robots [7.9] 表層および近面の海洋ロボットのためのスケーラブルなマルチドローンベーストラッキングシステムを提案する。
提案手法は,効率的な視覚検出,軽量な多対象追跡,信頼度重み付き拡張カルマンフィルタ(EKF)を組み合わせることで,リアルタイムに安定した推定を行う。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:28:31 GMT)
A Novel Dual-Stream Framework for dMRI Tractography Streamline Classification with Joint dMRI and fMRI Data [7.9] 本稿では,dMRIとfMRIデータを共同で解析し,トラクションパーセレーションの機能的コヒーレンスを向上する,新しい双方向ストリームライン分類フレームワークを提案する。
本手法は,皮質脊髄路(CST)を4つの体 tomatotopic subdivision にパーセルする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:31:47 GMT)
Shortcut Invariance: Targeted Jacobian Regularization in Disentangled Latent Space [7.9] ディープニューラルネットワークはショートカットを学習しやすく、刺激的で容易に学習できる相関関係を持つ。
ショートカット信号に機能的に不変な分類器を簡易かつ効果的に描画する手法を提案する。
我々はこれを対象のヤコビ正規化として分析し、分類器は急激な特徴を無視し、より複雑なコアセマンティック信号に依存するように強制する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:09:08 GMT)
Learning to Compress Graphs via Dual Agents for Consistent Topological Robustness Evaluation [7.9] グラフをコンパクトな表現に圧縮し、トポロジ的構造とロバスト性プロファイルの両方を保存することを提案する。
Cutterは、バイタル検出エージェント(VDA)と冗長検出エージェント(RDA)からなる二重エージェント強化学習フレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:19:58 GMT)
IndEgo: A Dataset of Industrial Scenarios and Collaborative Work for Egocentric Assistants [7.9] IndEgoは、一般的な産業タスクに対処するマルチモーダルなエゴセントリックでエクソセントリックなデータセットである。
データセットには3,460件のエゴセントリックな記録(約197時間)と1,092件のエゴセントリックな記録が含まれている。
データセットの重要な焦点は、協調作業であり、2人の労働者が共同で認知的および身体的に集中的なタスクを行う。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:45:17 GMT)
Graph-based 3D Human Pose Estimation using WiFi Signals [7.8] GraphPose-Fiは、WiFiベースの人間のポーズ推定のための骨格トポロジーを明示的にモデル化するグラフベースのフレームワークである。
提案手法はMM-Fiデータセット上の既存手法を様々な設定で大幅に上回っている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:40:26 GMT)
CNN-Based Camera Pose Estimation and Localisation of Scan Images for Aircraft Visual Inspection [7.7] ジェネラル・ビジュアル・インスペクション (General Visual Inspection) は、商業用機の外装に明らかな損傷を検知し、ローカライズするために用いられる手動のプロセスである。
本稿では,パンティルトズームカメラのポーズを推定し,スキャン画像のローカライズを行うための,インフラストラクチャフリーでデプロイが容易なオンサイト手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:52:36 GMT)
Learning Robust Social Strategies with Large Language Models [7.7] 強化学習は,大規模言語モデル(LLM)を単一エージェント体制で整列させるのに有効である。
マルチエージェント設定における標準RLは、しばしば欠陥のある自己関心のポリシーに収束することを示す。
我々は、近年の対人学習認識アルゴリズムAdvantage Alignmentを、マルチエージェント協調と非探索性に向けて微調整LDMに適用する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:43:46 GMT)
Now You See It, Now You Don't - Instant Concept Erasure for Safe Text-to-Image and Video Generation [7.7] Instant Concept Erasure (ICE)は、トレーニング不要で、モダリティに依存しない、1ショットの重み修正アプローチで、ゼロオーバーヘッドで正確で永続的な未学習を実現する。
ICEは、異方性エネルギー重み付きスケーリングを用いて部分空間の消去と保存を定義し、その後、ユニークな閉形式重なりプロジェクタを用いて交叉に対して明示的に正規化する。
T2IモデルとT2Vモデルの両方において、元の生成能力の最小限の低下しか生じないにもかかわらず、レッドピーティングに対する堅牢性を改善した強い消去を効率的に達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:48:44 GMT)
Single Image to High-Quality 3D Object via Latent Features [7.6] 単一画像から3Dオブジェクトを生成するフレームワークであるLatntDreamerを紹介する。
事前訓練された変分オートエンコーダは、3Dジオメトリを潜在特徴にマッピングする。
LatentDreamerは粗いジオメトリ、洗練されたジオメトリ、現実的なテクスチャを逐次生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:31:04 GMT)
SWAN: Sparse Winnowed Attention for Reduced Inference Memory via Decompression-Free KV-Cache Compression [7.6] 大きな言語モデル(LLM)は、キーバリュー(KV)キャッシュの巨大なメモリフットプリントのため、自動回帰推論において重大なボトルネックに直面します。
SWANは、このオーバーヘッドをなくす、新しい、微調整不要なフレームワークである。
提案手法はオフライン行列を用いてKV-cacheを回転させプルークする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:41:24 GMT)
A Multi-Agent LLM Framework for Multi-Domain Low-Resource In-Context NER via Knowledge Retrieval, Disambiguation and Reflective Analysis [7.6] In-context Learning (ICL) with large language model (LLMs)は、低リソースシナリオにおける名前付きエンティティ認識(NER)のための有望なパラダイムとして登場した。
KDR-Agentは、知識検索、曖昧さ、反射分析を統合した、コンテキスト内NERのための新しいマルチエージェントフレームワークである。
5つのドメインから10のデータセットを対象とした実験では、KDR-Agentが既存のゼロショットと少数ショットのICLベースラインを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:23:34 GMT)
Any4D: Open-Prompt 4D Generation from Natural Language and Images [7.5] bfPrimitive Embodied World Models (PEWM) を提案する。
我々のフレームワークは、きめ細かい物理的相互作用と高レベルの推論のギャップを埋め、スケーラブルで解釈可能で汎用的なインテリジェンスへの道を開く。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:17:26 GMT)
IRSDA: An Agent-Orchestrated Framework for Enterprise Intrusion Response [7.5] 侵入応答システムデジタルアシスタント(Intrusion Response System Digital Assistant、IRSDA)は、自律的でポリシーに準拠したサイバー防御を提供するために設計されたエージェントベースのフレームワークである。
IRSDAには、コンテキスト情報とAIベースの推論を統合して、システム誘導の侵入応答をサポートする知識駆動アーキテクチャが組み込まれている。
本研究は, 侵入応答における説明可能性, システム状態認識, 操作制御を重視した, サイバー防御に対するモジュール型エージェント駆動型アプローチの概要である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:21:09 GMT)
Active Slice Discovery in Large Language Models [7.5] 大規模言語モデル(LLM)は、しばしばエラースライスとして知られるデータの特定のサブセットに対して体系的なエラーを示す。
我々は、この手法をActive Slice Discoveryとして定式化し、毒性分類において人間の定義したスライスを発見するという問題を経験的に探求する。
その結果,不確実性に基づく能動学習アルゴリズムが最も有効であることが判明した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:43:20 GMT)
Information Physics of Intelligence: Unifying Logical Depth and Entropy under Thermodynamic Constraints [7.4] 本稿では,情報処理を存在論的状態からキャリア状態へのマッピングを可能にする理論的枠組みを提案する。
与えられた論理深度から対象状態を計算するのに必要な有効な作業量を定量化する,新しい計量である導出エントロピーを導入する。
このことから, 導出エントロピーの最小化は, 生物と人工知能の双方の進化に支配的な原則であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:24:08 GMT)
Rethinking Garment Conditioning in Diffusion-based Virtual Try-On [7.4] 高速な単一UNetモデルであるRe-CatVTONを開発した。
提案されたRe-CatVTONは前機種に比べて性能が大幅に向上した。
その結果,FID,KID,LPIPSのスコアは改善し,SSIMはわずかに低下した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:19:44 GMT)
Fewer Tokens, Greater Scaling: Self-Adaptive Visual Bases for Efficient and Expansive Representation Learning [7.4] 画像のセマンティクスを保存するのに必要となる最小限の視覚トークン数とモデル容量の関係について検討する。
最小記述長の原理に着想を得て,画像トークンを視覚的意味空間内のベクトルとして再解釈する。
本稿では,冗長トークンをコンパクトな基底集合に適応的にクラスタリングする軽量モジュールOrthogonal Filteringを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:10:12 GMT)
What does it mean to understand language? [7.1] 脳の中核言語系における処理は基本的に制限されているため、言語系から他の脳領域へ情報をエクスポートする必要があると提案する。
認知神経科学の最近の進歩は、概念的基礎とそれを直接的にテストする方法の両方を提供しており、言語を理解するために認知的かつ神経的に何を意味するのかを明らかにするための新しい戦略を開拓している、と我々は主張する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:21:55 GMT)
A Layered Protocol Architecture for the Internet of Agents [7.1] 大規模言語モデル(LLM)は、目覚ましいパフォーマンス向上と、ドメイン固有の言語を学習する能力を示している。
LLMは基本的な制限に直面しており、コンテキストウィンドウは無限に成長できず、メモリと計算能力が制限される。
我々は、textbfAgent Communication Layer (L8) と textbfAgent Semantic Negotiation Layer (L9) の2つの新しいレイヤを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:06:14 GMT)
Topological BF Theory construction of twisted dihedral quantum double phases from spontaneous symmetry breaking [7.0] 連続な$O(2)$ゲージ場に基づく非アーベル二面体量子二重位相の体系的構成を提案する。
我々の提案は、合成ゲージ場プラットフォームにおいて期待できるような、非アーベル位相順序への代替ルートを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:00:00 GMT)
RADSeg: Unleashing Parameter and Compute Efficient Zero-Shot Open-Vocabulary Segmentation Using Agglomerative Models [7.0] 我々は、見過ごされた集合的視覚基盤モデルRADIOを活用し、mIoU、レイテンシ、パラメータ効率の3つの主要な軸に沿ったゼロショットOVSSを同時に改善する。
RADSegは,3.95倍高速かつ2.5倍少ないパラメータを用いて,ベースViTクラスの6~30%のmIoU改善を実現した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:15:01 GMT)
QuantKAN: A Unified Quantization Framework for Kolmogorov Arnold Networks [6.9] Kolmogorov Arnold Networks (KAN) は、線形変換をスプラインベースの関数近似に置き換え、ネットワークエッジに沿って分散する。
カンは強い表現性と解釈性を提供するが、その不均一なスプラインと基底分岐パラメータは効率的な量子化を妨げる。
我々は、量子化意識トレーニング(QAT)とポストトレーニング量子化システムの両方にまたがって、kanを量子化する統合フレームワークであるQuantKANを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:05:16 GMT)
Generating Reading Comprehension Exercises with Large Language Models for Educational Applications [6.8] 本稿では,RCEG(Reading Exercise Generation)と呼ばれる新しいフレームワークを提案する。
RCEGは、高品質でパーソナライズされた英語読解演習を自動生成する。
RCEGの性能を評価するため、英語読解のための専用データセットを構築した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:00:48 GMT)
MapRF: Weakly Supervised Online HD Map Construction via NeRF-Guided Self-Training [6.6] MapRFは弱い教師付きフレームワークであり、2Dイメージラベルのみを使用して3Dマップを構築することを学ぶ。
自己学習中の誤差蓄積を軽減するため,マップ・ツー・レイマッチング方式を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:23:10 GMT)
Beyond Reward Margin: Rethinking and Resolving Likelihood Displacement in Diffusion Models via Video Generation [6.6] 直接選好最適化は、選択されたサンプルと拒否されたサンプルを区別することにより、生成出力を人間の選好に合わせることを目的としている。
DPOの限界は、トレーニング中に選択されたサンプルの確率がパラドックス的に減少する確率変位である。
本稿では,Adaptive Rejection Scaling (ARS) と Implicit Preference Regularization (IPR) を組み合わせた新しいソリューションである Policy-Guided DPO を紹介する。
実験の結果,PG-DPOは測定値と定性評価の両方において既存手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:37:49 GMT)
Vision--Language Enhanced Foundation Model for Semi-supervised Medical Image Segmentation [6.5] 半教師付き学習(SSL)は医用画像セグメンテーションの有効なパラダイムとして登場した。
SSLフレームワークに基盤レベルの視覚的セマンティック理解を組み込んだVESSA(Vision-Language Enhanced Semi-supervised Assistant)を導入する。
ステージ1では、VESSAはゴールドスタンダードの例を含むテンプレートバンクを使用して、参照誘導セグメンテーションアシスタントとして訓練される。
ステージ2では、VESSAは最先端のSSLフレームワークに統合され、学生モデルとの動的相互作用を可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:33:19 GMT)
Fairness Meets Privacy: Integrating Differential Privacy and Demographic Parity in Multi-class Classification [6.3] 差分プライバシーは、公平性保証に最小限の影響を与える公平性向上パイプラインに統合可能であることを示す。
我々はDP2DPと呼ばれるポストプロセッシングアルゴリズムを設計し、人口統計と差分プライバシーの両方を強制する。
分析の結果,我々のアルゴリズムは,文献から得られる最良な非私的手法と基本的に同じ割合で,その人口的平等目標に向かって収束していることが判明した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:31:02 GMT)
SupLID: Geometrical Guidance for Out-of-Distribution Detection in Semantic Segmentation [6.2] セマンティックセグメンテーションにおけるアウト・オブ・ディストリビューション(OOD)検出は、画素レベルで異常領域をローカライズすることを目的としている。
近年,画像レベルのOOD手法の適応性について研究が進められている。
本稿では,下層の意味空間の幾何学的構造を利用して分類器由来のOODスコアを効果的にガイドする新しいフレームワークであるSupLIDを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:49:54 GMT)
DynaMix: Generalizable Person Re-identification via Dynamic Relabeling and Mixed Data Sampling [6.0] 一般化可能な人物識別(Re-ID)は、見えないカメラや環境にまたがって個人を識別することを目的としている。
我々は,手動ラベル付きマルチカメラと大規模擬似ラベル付きシングルカメラデータを効果的に組み合わせたDynaMixを提案する。
一般化可能な人物Re-IDにおいて,DynaMixは最先端の手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:01:32 GMT)
Understanding the Staged Dynamics of Transformers in Learning Latent Structure [5.9] 3つのタスクバリアントに対して,デコーダのみの小さなトランスをトレーニングする。
モデルが個々の段階で能力を取得することを示す。
また、モデルが基本規則をしっかりと構成できる重要な非対称性も同定するが、基本規則を発見するために複雑な例を分解するのに苦労する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:20:42 GMT)
On the Utility of Foundation Models for Fast MRI: Vision-Language-Guided Image Reconstruction [5.8] 本稿では,事前学習された視覚言語基盤モデルを用いた意味分布誘導型再構築フレームワークを提案する。
対照的な目的は、再構成された表現と対象の意味分布を一致させる。
膝と脳のデータセットの実験では、画像からのセマンティックな先行は微細な解剖学的構造を保ち、知覚の質が優れていることが示されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:15:47 GMT)
Quantum Hardware-Efficient Selection of Auxiliary Variables for QUBO Formulations [5.7] 本稿では,接続性に制限のあるアーキテクチャに適した補助変数を選択するための新しい手法を提案する。
従来の補助選択法を用いて構築したQUBO回路と比較して,提案手法は回路深さを約40%削減する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:00:05 GMT)
Peregrine: One-Shot Fine-Tuning for FHE Inference of General Deep CNNs [5.7] FHEに基づく推論に一般の深層CNNを適用する際の2つの根本的な課題に対処する。
1つ目は、ReLUのような非線形活性化を低次で近似し、精度の劣化を最小限に抑えることである。
2つ目は、FHE推論の高分解能画像処理を制限する暗号容量障壁を克服することである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:47:39 GMT)
Solar-GECO: Perovskite Solar Cell Property Prediction with Geometric-Aware Co-Attention [5.7] ペロブスカイト太陽電池は次世代の太陽電池の候補として期待されている。
マルチスケールデバイスとしてのそれらの性能は、構成層間の複雑な相互作用によって決定される。
幾何学的コアテンションモデルを用いてペロブスカイト太陽電池の電力変換効率を予測することを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:15:41 GMT)
MapFormer: Self-Supervised Learning of Cognitive Maps with Input-Dependent Positional Embeddings [5.6] 認知地図は、世界の実体間の抽象的な関係を符号化する内部モデルである。
本研究では,Transformerモデルに基づく新しいアーキテクチャであるMapFormerを紹介し,観測データから認識マップを学習する。
MapFormerは、認知マップを生み出す神経メカニズムを説明することによって、神経科学とAIの両方に広く応用されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:29:02 GMT)
Three-Dimensional Anatomical Data Generation Based on Artificial Neural Networks [5.6] 機械学習に基づく外科的計画と訓練は、医療画像から再構築された大量の3次元解剖モデルを必要とする。
本稿では,身体臓器モデルから得られたデータを用いた3次元解剖学的自動生成のための新しいワークフローを提案する。
また、他の下流機械学習タスクに有用な3Dモデルの多様体を得るために、GAN(3D Generative Adversarial Network)を利用する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:07:45 GMT)
A Theory-Inspired Framework for Few-Shot Cross-Modal Sketch Person Re-Identification [5.5] スケッチをベースとした人物の再識別は、手描きのスケッチとRGBの監視画像とをマッチングすることを目的としている。
KTCAAは,数発のクロスモーダル一般化のためのフレームワークである。
我々は,KTCAAが特にデータスカース条件下で,最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:26:46 GMT)
On the Role of Hidden States of Modern Hopfield Network in Transformer [5.4] ホップフィールドネットワークに基づく連想記憶モデルとキー-値機構に基づく自己注意は、ディープラーニングにおける記憶機構の研究において一般的なアプローチである。
本稿では,この近似を超え,MHNと自己注意の関係について検討する。
この結果から, ホップフィールドネットワークとトランスフォーマーの対応性は, MHN から派生した隠れ状態である新しい変数を自己アテンションに付加することにより, より一般化された形で確立できることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:06:31 GMT)
Cross-Domain Generalization of Multimodal LLMs for Global Photovoltaic Assessment [5.2] 本研究では,グローバルPV評価のための多モード大言語モデル(LLM)のクロスドメイン一般化について検討する。
構造化プロンプトと微調整を活用することで、モデルは統合スキーマ内の検出、ローカライゼーション、定量化を統合する。
F1 の測度を用いたクロスリージョン評価は,提案モデルが未確認領域における最小性能劣化を実現することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:26:30 GMT)
Data Augmentation Strategies for Robust Lane Marking Detection [5.1] 本稿では、車線監視に使用されるサイドマウントカメラの領域シフトの課題について、生成型AIベースのデータ拡張パイプラインを導入することで解決する。
このアプローチは、幾何学的視点変換、AI駆動の塗装、車体オーバーレイを組み合わせて、デプロイメント固有の視点をシミュレートする。
強化されたデータをトレーニングすることで、両方のモデルはシャドーを含むさまざまな条件に対する堅牢性を改善する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:47:27 GMT)
Open-weight genome language model safeguards: Assessing robustness via adversarial fine-tuning [5.1] 我々は、最先端のgLMであるEvo 2を評価し、110の有害ヒト感染ウイルスの配列を用いて微調整を行う。
我々は、gLMの安全フレームワークの必要性を強調し、gLMの安全な配置を可能にするために必要な作業の概要を述べる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:46:44 GMT)
Integrating RCTs, RWD, AI/ML and Statistics: Next-Generation Evidence Synthesis [4.7] この見解は、エビデンス生成の未来は、RCTとRWD、統計学とAI/MLに依存せず、その原理的な統合に依存していると主張している。
統合的エビデンス合成の重要な目的として、より広い人口へのRTT結果の転送、RCTへのAI支援分析の埋め込み、ハイブリッド制御試験の設計、長期RWDによる短期RTTの延長などを挙げる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:51:52 GMT)
Towards Synergistic Teacher-AI Interactions with Generative Artificial Intelligence [4.6] GenAIによる教育タスクの自動化は、教師代理店の縮小、潜在的な認知萎縮、教育のより広範な非専門化への懸念を提起する。
この章では、トランザクション、状況、運用、実践的、シナジスティックな5つのレベルの教師-AIチームの概念化を提示します。
我々は、教師とAIの協調的な意思決定に向けて、個々の教員機関を超えて進む将来のビジョンを概説する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:29:29 GMT)
Joint learning of a network of linear dynamical systems via total variation penalization [4.6] 線形力学系のパラメータを$m$で合同推定する問題を考察する。
確率の高い平均二乗誤差の非漸近境界を導出する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:07:46 GMT)
Toward end-to-end quantum simulation of rapidly distorted turbulence [4.6] ハミルトニアン(LCHS)の線形結合による急激な乱れをシミュレートするエンドツーエンドの量子アルゴリズムを提案する。
我々の研究は、将来のフォールトトレラント量子コンピュータにおけるより複雑な乱流現象に対処するための基盤を確立する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:12:54 GMT)
Optimization of Deep Learning Models for Dynamic Market Behavior Prediction [4.6] UCI Online Retail IIデータセットを用いて,電子商取引におけるマルチ水平需要予測について検討した。
本稿では,マルチスケールの時間的畳み込み,ゲートリカレントモジュール,タイムアウェア・セルフアテンションを組み合わせたハイブリッド・シーケンス・モデルを提案する。
結果は,ピーク/ホリデー期間において,一貫した精度向上と改善を示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:30:52 GMT)
Multiscale Vector-Quantized Variational Autoencoder for Endoscopic Image Synthesis [4.3] 本研究は,医用画像合成のための新しいVAEベースの方法論を導入し,そのWCE画像生成への応用について紹介する。
臨床診断支援のための生成画像の有用性を画像分類により評価する。
提案手法の汎用性は,医療マルチメディア関連分野に適用可能であることを保証している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:23:28 GMT)
Leveraging Unlabeled Scans for NCCT Image Segmentation in Early Stroke Diagnosis: A Semi-Supervised GAN Approach [4.2] 虚血性脳卒中は、患者の予後を改善するために急激な診断が不可欠である、時間的クリティカルな医療緊急事態である。
非コントラストCT(non-contrast Computed tomography)は、最前線撮影ツールとして機能するが、早期の超急性期における微妙な虚血変化を明らかにするのに失敗することが多い。
本稿では,早期虚血性脳梗塞領域を正確に記述するためのGANを用いた半教師付きセグメンテーション手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:14:53 GMT)
Leveraging Duration Pseudo-Embeddings in Multilevel LSTM and GCN Hypermodels for Outcome-Oriented PPM [4.1] 予測プロセス監視(PPM)のための既存のディープラーニングモデルは、時間的不規則性に悩まされている。
本稿では,イベント属性とシーケンス属性を分離する2つの入力ニューラルネットワーク戦略を提案する。
提案手法の利点を実証し,実世界の堅牢なPPMアプリケーションのためのフレキシブルな設計を提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:06:08 GMT)
LLM-CSEC: Empirical Evaluation of Security in C/C++ Code Generated by Large Language Models [3.8] 本研究は,大規模言語モデル(LLM)のセキュリティを検証し,評価することに焦点を当てる。
コード生成に10種類のLCMを使用し、静的解析により出力を分析した。
AI生成コードに存在する共通弱さ(Common Weaknession, CWE)の量について検討する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:31:53 GMT)
Evolution of Cybersecurity Subdisciplines: A Science of Science Study [3.8] 我々は,科学の観点から,サイバーセキュリティの分野を初めて研究する。
サイバーセキュリティにおける2つの学際的コミュニティの進化について検討する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:26:28 GMT)
Scalable Parameter-Light Spectral Method for Clustering Short Text Embeddings with a Cohesion-Based Evaluation Metric [3.8] 短いテキストの埋め込みをクラスタ化することは自然言語処理の基本的なタスクである。
本稿では,ラプラシア固有スペクトルの構造から直接クラスタ数を推定するスケーラブルなスペクトル法を提案する。
また、単純かつ解釈可能な評価指標である凝集比も提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:52:58 GMT)
Learning to Solve Weighted Maximum Satisfiability with a Co-Training Architecture [3.7] SplitGNNはグラフニューラルネットワーク(GNN)ベースのアプローチで、最大重み付けサシフィアビリティ(MaxSAT)問題の解法を学ぶ。
以上の結果から,他のGNN法と比較すると,SplitGNNは3*の収束率と予測精度が向上することがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:22:29 GMT)
CSD: Change Semantic Detection with only Semantic Change Masks for Damage Assessment in Conflict Zones [3.6] 事前学習したDINOv3モデルを導入し、マルチスケールのクロスアテンション差シムネットワーク(MC-DiSNet)を提案する。
DINOv3バックボーンの強力な視覚的表現能力は、双方向のリモートセンシング画像から堅牢でリッチな特徴抽出を可能にする。
従来の意味変化検出(SCD)とは異なり,両時間画像の大規模な意味アノテーションは不要である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:16:21 GMT)
Emotion-Enhanced Multi-Task Learning with LLMs for Aspect Category Sentiment Analysis [3.6] 本稿では,感情極性とカテゴリー固有の感情を学習する,感情強化型ACSAフレームワークを提案する。
我々のアプローチは、各アスペクトカテゴリに対して、モデルが感情的な記述を生成することを可能にする。
また,Valence-Arousal-Dominance(VAD)次元フレームワークに基づく感情改善機構も導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:52:42 GMT)
Robust Long-term Test-Time Adaptation for 3D Human Pose Estimation through Motion Discretization [3.6] 3次元ポーズ推定のオンライン適応は、不完全な予測を伴う自己スーパービジョンに依存する場合、エラーの蓄積に悩まされる。
本稿では, 動きの離散化に着目した新しい手法を提案する。
我々は、同一人物のドメイン外ストリーミングテストビデオに継続的に適応することで、長期的オンライン適応を検証した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:46:58 GMT)
Prompt Less, Smile More: MTP with Semantic Engineering in Lieu of Prompt Engineering [3.4] 本稿では,プログラムセマンティクスを充実させる軽量な手法であるセマンティックエンジニアリングを紹介する。
SemTextsを使えば、開発者は自然のコンテキストを直接プログラムコンストラクトに埋め込むことができる。
評価の結果,セマンティック・エンジニアリングはプロンプト・エンジニアリングに匹敵する性能を達成し,即時忠実度を大幅に向上することがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:58:22 GMT)
CataractCompDetect: Intraoperative Complication Detection in Cataract Surgery [3.4] CataractCompDetectは、位相認識のローカライゼーション、SAM 2ベースのトラッキング、合併症特異的リスクスコアリング、最終分類のための視覚言語推論を組み合わせたものだ。
CataCompでは、CatalactCompDetectの平均F1スコアは70.63%、合併症当たりのパフォーマンスは81.8%(アイリス・プロラプス)、60.87%(PCR)、69.23%(硝子体喪失)である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:34:12 GMT)
Blinking Beyond EAR: A Stable Eyelid Angle Metric for Driver Drowsiness Detection and Data Augmentation [3.3] 我々は,3次元顔のランドマークから得られる目開きの再現可能な新しい指標であるEyelid Angle (ELA)を紹介した。
ELAは、カメラアングルの変動に対して頑丈な眼球運動の安定した幾何学的記述を提供する。
我々は、ERA信号を用いて、Blender 3Dで引き裂かれたアバターをアニメーション化し、リアルな合成データセットの作成を可能にします。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:26:42 GMT)
Large Language Models Require Curated Context for Reliable Political Fact-Checking -- Even with Reasoning and Web Search [3.3] PolitiFactによる6000以上のクレームに対する15の最近の大規模言語モデル (LLM) の評価を行った。
標準モデルは性能が悪く、推論は最小限の利益をもたらし、Web検索は適度な利益しか得られない。
PolitiFactサマリを用いたRAGシステムのマクロF1はモデル変種の平均で233%向上した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:22:32 GMT)
Uncertainty of Network Topology with Applications to Out-of-Distribution Detection [3.3] 予測トポロジカル不確実性(pTU)と呼ばれるベイズニューラルネットワークの新しいトポロジカルサマリーを導入する。
pTUはモデルと入力間の相互作用の不確実性を測定する。
アプリケーションとして、pTUは、モデルの信頼性を確保するために重要なOOD(out-of-distriion)検出問題を解決するために使用される。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:39:45 GMT)
Artificial Intelligence Driven Workflow for Accelerating Design of Novel Photosensitizers [3.2] textbfAI-textbfAccelerated textbfPhototextbfSensitizer textbfInnovation (AAPSI)を提案する。
AAPSIは専門知識、足場ベースの分子生成、ベイズ最適化を統合したクローズドループワークフローである。
AAPSIは102,534個の光増感剤溶媒対のキュレートされたデータベースを活用し、6,148個の合成可能な候補を生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:46:54 GMT)
Layer-wise Weight Selection for Power-Efficient Neural Network Acceleration [3.2] シストリックアレイ加速器は、乗算累積(MAC)単位に支配されるエネルギーでCNNを実行する。
本稿では,MACと層レベルのエネルギー特性を明示的に活用する,エネルギーを意識した層間圧縮フレームワークを提案する。
異なるCNNモデルの実験では、58.6%のエネルギー削減と2-3%の精度低下を示し、最先端のパワーアウェアベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:02:34 GMT)
Dynamic Mixture of Experts Against Severe Distribution Shifts [3.2] 継続的学習(CL)と強化学習(RL)の分野において、継続的な学習と進化するデータストリームへの適応が可能なニューラルネットワークの構築が課題となっている。
ニューラルネットワークとは異なり、生物学的脳は容量成長を通じて可塑性を維持しており、研究者は動的に容量を追加するなど、人工ネットワークにおける同様のアプローチを探求するよう促している。
本稿では、継続学習環境と強化学習環境に対するDynamicMoEアプローチの評価を行い、既存のネットワーク拡張手法と比較してその有効性を評価することを目的とする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:00:32 GMT)
Real-Time Object Tracking with On-Device Deep Learning for Adaptive Beamforming in Dynamic Acoustic Environments [3.1] 本研究は,深層学習に基づくトラッキングとビームフォーミングを統合し,正確な音源定位を実現する組込みシステムを提案する。
このシステムは、遠隔会議、スマートホームデバイス、および補助技術に適している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:33:50 GMT)
Explicit Tonal Tension Conditioning via Dual-Level Beam Search for Symbolic Music Generation [3.0] 最先端の象徴的な音楽生成モデルは、最近顕著な出力品質を達成した。
本稿では,計算音調テンションモデルをトランスフォーマーフレームワークに統合する手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:41:04 GMT)
Solving Diffusion Inverse Problems with Restart Posterior Sampling [3.0] 逆問題(英: inverse problem)とは、科学や工学において基本的な問題であり、ノイズ測定から基礎となる信号や状態を推測することである。
近年のアプローチでは、複雑なデータ分布をキャプチャする能力のため、そのような問題に対する強力な暗黙の先行モデルとして拡散モデルが採用されている。
本稿では,線形逆問題と非線形逆問題の両方を解決するための汎用的で効率的なフレームワークであるRePS(Restart for Posterior Sampling)を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:42:33 GMT)
Maritime Small Object Detection from UAVs using Deep Learning with Altitude-Aware Dynamic Tiling [2.9] 小さい物体は、低い物体と背景のピクセル比のため、高高度から検出することが困難であることが多い。
そこで本研究では,画像をタイルに拡大・適応的に分割し,小型物体検出を高速化する高度対応動的タイリング手法を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:45:01 GMT)
Federated style aware transformer aggregation of representations [2.9] FedSTARは、クライアント固有のスタイル要素を共有コンテンツ表現から切り離す、スタイル対応のフェデレーション学習フレームワークである。
完全なモデルパラメータの代わりに、コンパクトなプロトタイプとスタイルベクターを交換することで、FedSTARは通信オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:24:09 GMT)
On the Optimality of Discrete Object Naming: a Kinship Case Study [2.9] 離散オブジェクト命名システムのための情報理論フレームワークを提案する。
最適なトレードオフは、リスナーのデコーダが話者のベイズデコーダと同値である場合にのみ達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:49:31 GMT)
Auto-ML Graph Neural Network Hypermodels for Outcome Prediction in Event-Sequence Data [2.9] HGNN(O)は、イベントシーケンスデータに対する結果予測のためのAutoML GNNハイパーモデルフレームワークである。
我々は,HGNN(O)がTraffic Finesデータセットで0.98以上の精度を達成し,重み付きF1スコアが患者データセットで最大0.86に達することを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:13:34 GMT)
Large Language Model-Assisted Planning of Electric Vehicle Charging Infrastructure with Real-World Case Study [2.8] 電気自動車(EV)の充電インフラの需要の増加は、大きな計画上の課題を呈している。
EV充電の潜在的な利点、特に充電需要の空間的・時間的パターンの変化に対する応答は、インフラ計画において未探索のままである。
本稿では、投資決定とチャージ代行を協調的に最適化する統合的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:45:10 GMT)
The Determinant Ratio Matrix Approach to Solving 3D Matching and 2D Orthographic Projection Alignment Tasks [2.8] この研究は、洞察比行列(DRaM)アプローチの観点から、誤りのないEnP問題とOnP問題の両方に対する最小二乗システムを示す。
ノイズの多い3D-2D正書法(OnP)タスクは、類似した閉形式を持たず、DRaMクラスで解決できる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:22:21 GMT)
Holographic duality between bulk topological order and boundary mixed-state order [2.8] 本稿では,強い対称性を持つ繰り返し量子チャネルの定常状態を分析するホログラフィーフレームワークを提案する。
我々は、$d$次元量子チャネルの定常状態が、逐次ユニタリ回路によって生成される$(d+1)$次元の波動関数の境界縮小密度行列にホログラフィック的にマッピングされていることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:00:01 GMT)
Efficient Multi-Hop Question Answering over Knowledge Graphs via LLM Planning and Embedding-Guided Search [2.7] 知識グラフに答えるマルチホップ問題はまだ計算が難しい。
最近のアプローチでは、エンティティリンクとパスランキングの両方において、高価なLarge Language Model (LLM) の推論に依存している。
効率性と妥当性の両方に対処する2つの相補的ハイブリッドアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:27:56 GMT)
Counterfactual Explainable AI (XAI) Method for Deep Learning-Based Multivariate Time Series Classification [2.7] 多変量時系列分類のための新しい多目的対実説明法(CE)を提案する。
ConFETTI は、重要な MTS サブシーケンスを特定し、反ファクトターゲットを特定し、予測の信頼性、近接性、スパーシリティのバランスをとるために、時系列を最適に修正する。
常に最先端のCEメソッドを最適化の目的、および文献の他の6つの指標で上回っている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:47:20 GMT)
Dynamic Expert Quantization for Scalable Mixture-of-Experts Inference [2.6] 我々は、専門家の精度を第一級、動的に管理されるリソースとして扱うランタイムシステムDynaExqを提案する。
我々は,DynaExqが5090とA6000のGPU上で大きなLLMをデプロイし,静的な低精度ベースラインに対して最大4.03ポイントの精度向上を実現していることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:36:49 GMT)
Using Wearable Devices to Improve Chronic PainTreatment among Patients with Opioid Use Disorder [2.6] 慢性痛 (CP) とオピオイド使用障害 (OUD) は一般的で、関連する慢性疾患である。
ウェアラブルデバイスは、複雑な患者の情報を監視し、OUDおよびCPの患者に対して治療開発を通知する可能性がある。
痛みのスパイクを理解するためのウェアラブルデータを用いた大規模言語モデル(LLMs)の応用は、まだ解明されていない。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:19:56 GMT)
On Instability of Minimax Optimal Optimism-Based Bandit Algorithms [2.6] マルチアーム・バンディット(MAB)アルゴリズムは適応的で非i.d.な性質のため困難である。
楽観主義原理に基づく広帯域アルゴリズムの安定性特性を解析する。
MOSS, Anytime-MOSS, Vanilla-MOSS, ADA-UCB, OC-UCB, KL-MOSS, KL-UCB-SWITCH, Anytime KL-UCB-SWITCH などのミニマックス最適UPB型アルゴリズムが不安定であることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:23:26 GMT)
Scale What Counts, Mask What Matters: Evaluating Foundation Models for Zero-Shot Cross-Domain Wi-Fi Sensing [2.5] Wi-Fiセンサーは、カメラに代わる魅力的なプライバシー保護を提供する。
1つのセットアップでトレーニングされたモデルは、新しい環境やハードウェア、ユーザへの一般化に失敗する。
本研究は14のデータセットから抽出した13万以上のサンプルの事前学習と評価を行う。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:46:29 GMT)
Analysis of heart failure patient trajectories using sequence modeling [2.5] Mambaアーキテクチャは、Llamaをベースとした高度なTransformer(Transformer++)で、長いコンテキスト長を扱う。
ラマは最も高い予測的差別を達成し、最高の校正を行い、全てのタスクに頑丈さを示し、その後にマンバが続く。
本稿では、入力トークン化、モデル構成、時間データ前処理のための体系的設計選択を用いた最初のアブレーション研究について述べる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:46:39 GMT)
ReLU-Based and DNN-Based Generalized Maximum Score Estimators [2.5] 本稿では,修正線形単位(ReLU)関数の合成を用いた最大スコア推定器の新たな定式化を提案する。
ReLU関数はLipschitzであるため、新しいReLUベースの最大スコア基準関数は、かなり簡単に最適化できる。
さらに、深層ニューラルネットワーク(DNN)アーキテクチャにおいて、RMSのさらなる再構成を特別な層として用いた代替推定器を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:50:25 GMT)
Dendritic Convolution for Noise Image Recognition [2.4] 本稿では, 抗ノイズ性神経畳み込み法を提案する。
これは神経細胞の樹状突起構造を模倣し、樹状突起の近傍相互作用論理を畳み込み操作の基本設計に統合する。
この畳み込みの計算法と生物学的ニューロンのデンドライトとの整合性により、複雑な雑音環境下での従来の畳み込みよりもはるかに優れた性能を発揮する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:43:29 GMT)
Learning Solution Operators for Partial Differential Equations via Monte Carlo-Type Approximation [2.4] モンテカルロ型ニューラル演算子(MCNO)は、パラメトリックPDEのためのソリューション演算子を学習するための軽量なアーキテクチャを導入している。
フーリエニューラル演算子とは異なり、MCNOはスペクトルや翻訳不変性の仮定をしない。
標準1次元PDEベンチマークの実験では、MCNOは計算コストの低い競争精度を達成している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:35:10 GMT)
Rethinking Plant Disease Diagnosis: Bridging the Academic-Practical Gap with Vision Transformers and Zero-Shot Learning [2.4] 注意に基づくアーキテクチャとゼロショット学習アプローチが、キュレートされた学術データセットと現実世界の農業環境とのギャップを埋めるかどうかを検討する。
CNN(Convolutional Neural Networks)、ビジョントランスフォーマー(Vision Transformers)、およびCLIP(Contrastive Language- Image Pre-training)ベースのゼロショットモデルである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:08:01 GMT)
Towards Characterizing Knowledge Distillation of PPG Heart Rate Estimation Models [2.3] ウェアラブルデバイスが生成する光胸腺画像からの心拍数推定は、個人の健康と幸福に重大な影響を及ぼす。
本研究では, 実時間推定に適した小型モデルに対して, 事前学習したPSGモデルをどのように蒸留するかを探索し, 特徴付ける。
本稿では,モデルサイズと性能の関係を記述したスケーリング法則の特性について述べる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:06:06 GMT)
Assessing the alignment between infants' visual and linguistic experience using multimodal language models [2.3] 日常学習における子どもの視覚的・言語的経験と時間的整合性について
学習のための理想化された整列モーメントは、現代の機械学習データセットと比較して、子供の日常体験において比較的稀であることを示す。
これらの結果から, 単語学習を記述したモデルでは, 頻繁なアライメントが制約であることが示唆された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:58:16 GMT)
Prototype-Guided Non-Exemplar Continual Learning for Cross-subject EEG Decoding [2.2] 過去の脳波サンプルにアクセスすることなく事前知識を保存するための,プロトタイプ誘導型非経験的連続学習(ProNECL)フレームワークを提案する。
ProNECLは、各主題から識別表現を要約するために、クラスレベルのプロトタイプを構築している。
本フレームワークは知識保持と適応性を効果的にバランスさせ,脳波復号処理のクロスオブジェクトにおける優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:42:03 GMT)
Deep Hybrid Model for Region of Interest Detection in Omnidirectional Videos [2.2] 360ドルのビデオストリーミングでは、関心の領域が重要な役割を担っている。
本研究では、関心のある地域を表すために、有給地域を参照する。
本発明の方法は、フレームを得るためのビデオを前処理し、関心領域を予測するためのハイブリッド・サリエンシ・モデルを開発し、最終的にハイブリッド・サリエンシ・モデルの出力予測を後処理して各フレームの出力領域を得る。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:52:06 GMT)
Large Language Models for the Summarization of Czech Documents: From History to the Present [2.1] テキスト要約は、より長いテキストを、元の意味とキー情報を保存しながら、より短く一貫性のある要約に自動的に凝縮するタスクである。
これは主にチェコ固有の言語学的複雑さと高品質な注釈付きデータセットの欠如によるものである。
このギャップに対処するために、大規模言語モデル(LLM)、特にMistralとmT5の機能を活用します。
また、まずチェコ語のテキストを英語に翻訳し、それらを英語モデルで要約し、その後、要約をチェコ語に翻訳する翻訳ベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:40:31 GMT)
Extracting Disaster Impacts and Impact Related Locations in Social Media Posts Using Large Language Models [2.1] 本研究は大規模言語モデル(LLM)を用いて,災害関連ソーシャルメディア投稿で言及されているすべての場所,影響,影響の特定を行う。
我々の微調整モデルでは, 衝撃に対するF1スコア0.69, 衝撃を受けた位置抽出のための0.74が有効である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:55:51 GMT)
Order Selection in Vector Autoregression by Mean Square Information Criterion [2.1] 平均2乗情報量規準(MIC)は比較的穏やかな条件下でプロセスの順序を一貫して推定する。
この利点は、ニューヨーク市で新型コロナウイルス(COVID-19)のアウトカムを予報するときに裏付けられる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:37:43 GMT)
Learning to Reason: Training LLMs with GPT-OSS or DeepSeek R1 Reasoning Traces [2.1] テストタイムのスケーリングにより、複雑な問題から推論できる新しいLarge Language Models(LLM)が実現された。
2種類の推論トレースを用いた後学習後の数学問題に対する中規模のLLMの性能の比較を行った。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:26:58 GMT)
Online Sparse Feature Selection in Data Streams via Differential Evolution [2.0] 本稿では,データストリームにおけるSparse Feature Selection (ODESFS) のオンライン微分進化について紹介する。
6つの実世界のデータセットで実施された実験は、ODESFSが最先端のOSFSとOS2FSメソッドを一貫して上回ることを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:19:51 GMT)
Leveraging Adversarial Learning for Pathological Fidelity in Virtual Staining [2.0] 本研究では,条件付き生成逆ネットワークに基づく仮想染色モデルを構築した。
病理組織学的鑑定により病理組織像の高度化を図った。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:56:35 GMT)
LLMs-Powered Real-Time Fault Injection: An Approach Toward Intelligent Fault Test Cases Generation [1.9] 本稿では,新しいLarge Language Models (LLMs) 支援型フォールトテストケース (TCs) 生成手法を提案する。
提案手法は,F1スコアが88%,F1スコアが97.5%のFSR分類とフォールトTCの生成において高い性能を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:57:31 GMT)
Extracting Robust Register Automata from Neural Networks over Data Sequences [1.8] 既存の技法は有限入力アルファベットを仮定するので、連続領域から引き出されたデータシーケンスには直接適用できない。
この課題は、有限オートマトンを数値を格納・比較するレジスタで拡張する決定論的レジスタオートマトン(DRAs)を用いて解決する。
我々の主な貢献は、ブラックボックスモデルから堅牢なDRA抽出のためのフレームワークである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:36:45 GMT)
Cross Domain Evaluation of Multimodal Chain-of-Thought Reasoning of different datasets into the Amazon CoT Framework [1.8] 本研究はマルチモーダル・チェーン・オブ・ソート(Multimodal-CoT)推論の包括的解析を行う。
A-OKVQA,OKVQA,ChartQAのデータセット上での有効性を評価する。
その結果,視覚統合は理性発生における幻覚を著しく減少させるが,CoT推論の有効性は質問の種類によって大きく異なることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:20:02 GMT)
TPG-INR: Target Prior-Guided Implicit 3D CT Reconstruction for Enhanced Sparse-view Imaging [1.8] 本研究では,オブジェクトの投影データから得られる「ターゲット事前」を利用して,暗黙的な学習を促進する新しい3次元再構成フレームワークを提案する。
提案手法は, ボクセルサンプリングに先立って, 位置構造的エンコーディングを統合し, ボクセルの暗黙的再構成を容易にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:21:52 GMT)
Processing Entangled Links Into Secure Cryptographic Keys [1.7] 最終鍵レートに対する処理チェーン全体の相互作用と集団的影響について検討する。
調査はEckert 1991プロトコルの原理に基づいており、2005年にDevetakとWinterが導入した秘密鍵容量を利用している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:21:49 GMT)
Training-Free Active Learning Framework in Materials Science with Large Language Models [1.7] 大規模言語モデル(LLM)は、事前訓練された知識と普遍的なトークンベースの表現を活用することで、新しいパラダイムを提供する。
本稿では, LLM をベースとしたアクティブラーニングフレームワーク (LLM-AL) について紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:46:29 GMT)
Knowledge-based Graphical Method for Safety Signal Detection in Clinical Trials [1.7] 臨床治験における治療・発疹性有害事象(AE)をレビューするための知識ベース手法を提案する。
このアプローチは、2次元マップ内の用語間のセマンティックな関係をキャプチャする隠れ医療知識層(Safeterm)を追加することで、MedDRAを強化する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:42:58 GMT)
GRIT-LP: Graph Transformer with Long-Range Skip Connection and Partitioned Spatial Graphs for Accurate Ice Layer Thickness Prediction [1.6] 極性レーダから極性氷層厚推定のためのグラフ変換器GRIT-LPを導入する。
GRIT-LPは、帰納的幾何学グラフ学習フレームワークと自己認識機構を組み合わせたものである。
GRIT-LPは、平均2乗誤差を24.92%改善し、最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:14:55 GMT)
CountXplain: Interpretable Cell Counting with Prototype-Based Density Map Estimation [1.6] 本稿では,密度マップ推定による解釈可能なセルカウントの試作手法を提案する。
提案手法は, プロトタイプ層を密度推定ネットワークに統合し, モデルがセルと背景アーティファクトの両方の視覚的パターンを学習できるようにする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:47:44 GMT)
DensifyBeforehand: LiDAR-assisted Content-aware Densification for Efficient and Quality 3D Gaussian Splatting [1.6] 本稿では,Sparse LiDARデータと対応するRGB画像からの単眼深度推定を組み合わせ,既存の3次元ガウス散乱(3DGS)法の限界に対処する。
我々のROI対応サンプリング手法は意味的にも幾何学的にも重要な領域を優先し、密度の高い点雲を生成する。
本手法は,資源消費とトレーニング時間を著しく削減しつつ,最先端技術に匹敵する結果が得られる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:39:13 GMT)
Can LLMs Recover Program Semantics? A Systematic Evaluation with Symbolic Execution [1.5] 難読化は、プログラムの理解、メンテナンス、テスト、脆弱性検出といったソフトウェアエンジニアリングタスクに永続的な課題をもたらす。
微調整言語モデルがプログラムを効果的に難読化し、分析可能性を取り戻すことができるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:55:20 GMT)
Gender Bias in Emotion Recognition by Large Language Models [1.5] 本研究では,大きな言語モデル (LLM) が人とその環境を記述した場合, 性別バイアスを示すか否かを検討する。
バイアスの有意義な低減を実現するには、トレーニングベースの介入が必要であることを実証し、いくつかのデバイアス対策を提案し、評価する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:24:54 GMT)
Theoretical and Empirical Analysis of Lehmer Codes to Search Permutation Spaces with Evolutionary Algorithms [1.5] 我々は、進化的アルゴリズムの多くの実践的応用の核となる置換空間における問題に焦点をあてる。
逆ベクトルは置換空間$S_n$の代替表現であり、古典的なエンコーディングは$n$ユニークなエントリのベクトルである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:30:02 GMT)
UISearch: Graph-Based Embeddings for Multimodal Enterprise UI Screenshots Retrieval [1.4] 本稿では,UIスクリーンショットを階層関係や空間配置を符号化した属性グラフに変換するグラフベース表現を提案する。
対照的なグラフオートエンコーダは、視覚的、構造的、意味的な特性にまたがる多レベル類似性を保存する埋め込みを学習する。
この表現を,構成可能なクエリ言語による構造埋め込みとセマンティック検索を組み合わせたマルチモーダル検索フレームワークであるUISearchに実装する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:20:08 GMT)
A Storage-Efficient Feature for 3D Concrete Defect Segmentation to Replace Normal Vector [1.3] 本研究では,ある点の正規ベクトルとその親点雲の平均正規ベクトルとの間の角度として計算される新しい特徴,相対角を提案する。
PointNet++でトレーニングとテストを行うことで、相対角に基づくモデルは通常のベクトルに基づくモデルと同様のパフォーマンスを得た。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:36:09 GMT)
Zero-shot segmentation of skin tumors in whole-slide images with vision-language foundation models [1.2] 我々は、全スライディング画像(ZEUS)のためのゼロショット視覚言語セグメンテーションパイプラインを導入する。
ZEUSは、ギガピクセル全スライド画像に高解像度の腫瘍マスクを生成する。
2つの社内データセットで競合性能を示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:50:30 GMT)
Edge-Based Predictive Data Reduction for Smart Agriculture: A Lightweight Approach to Efficient IoT Communication [1.2] IoTデバイスの急速な成長は、処理のためにクラウドサーバへの送信を必要とする膨大なセンサデータを生み出しました。
これは、帯域幅が制限されたリソース制約とリモート環境において特に問題となる。
本稿では,エッジコンピューティング環境向けに設計され,シミュレーションにより検証された解析予測アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:37:33 GMT)
Synthesizing Test Cases for Narrowing Specification Candidates [1.2] 仕様のセットが与えられた場合、我々の技術は、一度ユーザーによって望ましいかどうかと分類された一連のテストケースを生成し、候補のセットを少なくとも1つの仕様に絞り込む。
最小限のテストスイートを生成するアルゴリズムと、最小限を保証しないアルゴリズムの2つが提案されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:41:17 GMT)
Understanding Accelerator Compilers via Performance Profiling [1.2] アクセラレータ設計言語(ADL)は、ハードウェアユニットにコンパイルされるハイレベル言語である。
Petalは、コンパイラの判断がパフォーマンスにどのように影響するかを理解するための、サイクルレベルのツールです。
その結果,Petalのサイクルレベルのプロファイルは,既存の設計における性能問題を特定することができることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:40:11 GMT)
From Pixels to Posts: Retrieval-Augmented Fashion Captioning and Hashtag Generation [1.2] 本稿では,ファッションキャプションの自動生成とハッシュタグ生成のための検索フレームワークを提案する。
このパイプラインは、マルチガーメントローカライゼーションのためのYOLOベースの検出器、優占色抽出のためのk平均クラスタリング、布と性別属性推論のためのCLIP-FAISS検索モジュールを組み合わせる。
RAG-LLMパイプラインは、表現力のある属性対応キャプションを生成し、ハッシュタグ生成の50%の閾値で完全なカバレッジを持つ平均属性カバレッジ0.80を達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:13:57 GMT)
Personalized Federated Segmentation with Shared Feature Aggregation and Boundary-Focused Calibration [1.1] 臓器腫瘍セグメンテーション(FedOAP)のための新しいパーソナライズド・フェデレーション・アプローチについて紹介する。
FedOAPは分離されたクロスアテンション(DCA)を採用しており、各クライアントは、すべてのクライアントから集約されたグローバルに共有されたキーと値のペアに出席しながら、ローカルクエリを保持することができる。
大規模な実験により、FedOAPは既存の最先端のフェデレーションとパーソナライズされたセグメンテーションメソッドを一貫して上回っていることが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:40:04 GMT)
FedPoisonTTP: A Threat Model and Poisoning Attack for Federated Test-Time Personalization [1.1] FedPoisonTTPは現実的な灰色のボックス攻撃フレームワークで、フェデレートされた適応設定でテスト時のデータ中毒を調査する。
妥協された参加者は、テストタイム全体のパフォーマンスを著しく低下させます。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:02:01 GMT)
Masked Autoencoder Joint Learning for Robust Spitzoid Tumor Classification [1.0] ReMACはReMaskerの拡張であり、完全かつ不完全な条件下での高次元データの分類タスクに取り組むように設計されている。
ReMACは、スピッツイド腫瘍の層状化における競合する分類法と比較して、強力で堅牢な性能を達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:54:14 GMT)
Closing Gaps in Emissions Monitoring with Climate TRACE [1.0] Climate TRACEは、詳細、カバレッジ、タイムラインが強化されたグローバルエミッション推定を提供するオープンアクセスプラットフォームである。
データセットは、個々のソースに対して、グローバルに包括的なエミッション推定を提供する最初のものである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:28:44 GMT)
MambaRefine-YOLO: A Dual-Modality Small Object Detector for UAV Imagery [1.0] 無人航空機(UAV)画像における小さな物体検出は、低解像度と背景の乱れによって妨げられる永続的な課題である。
我々は,RGBとIRモダリティのバランスをとる融合モジュールであるMamba-YOLOを紹介した。
我々の研究は精度と速度のバランスが優れており、実際のUAVアプリケーションに非常に適している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:59:01 GMT)
Defending Large Language Models Against Jailbreak Exploits with Responsible AI Considerations [1.0] 大きな言語モデル(LLM)は、安全フィルタを回避し、有害または非倫理的な振る舞いを誘発するジェイルブレイクの悪用に影響を受けやすいままである。
この研究は、即時レベル、モデルレベル、トレーニングタイムの介入にまたがって、既存のジェイルブレイク防御の体系的な分類を提示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:38:11 GMT)
Large-Scale In-Game Outcome Forecasting for Match, Team and Players in Football using an Axial Transformer Neural Network [1.0] 試合中に各プレイヤーが完了する各アクションの総数を正確に予測することは、様々なアプリケーションに望ましい。
本稿では,複数ステップで予測される13個の動作の総総量を連続的かつ反復的に予測するトランスフォーマーベースニューラルネットワークを提案する。
モデルが一貫した信頼性のある予測を行うことができることを実証的に示し,各ゲームに対して低レイテンシで,$sim$75,000のライブ予測を効率的に行う。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:47:59 GMT)
3D-Guided Scalable Flow Matching for Generating Volumetric Tissue Spatial Transcriptomics from Serial Histology [1.0] HoloTeaは3D対応のフローマッチングフレームワークで、隣接部からの情報を明示的に使用しながら、H&Eからスポットレベルの遺伝子発現を誘導する。
グローバルアテンションブロックは、スライド内のスポット数と線形に3D H&Eスケーリングを導入し、大規模な3D STデータセットのトレーニングと推論を可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:25:51 GMT)
Automated Fault Detection in 5G Core Networks Using Large Language Models [0.9] 本研究では,大規模言語モデル(LLM)を用いてネットワーク故障検出と分類を自動化する。
データセットには、さまざまなネットワークコンポーネント(pod)からのログに加えて、システム記述、ラウンドトリップ時間(RTT)テスト、ポッドステータス情報などの補完データが含まれている。
このデータセット上のAPIによりGPT-4.1ナノモデルを微調整し,ベースモデルと比較して欠陥検出精度が大幅に向上した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:55:29 GMT)
Structured Matching via Cost-Regularized Unbalanced Optimal Transport [0.9] 不均衡最適輸送(英語版)(UOT)は、非負の有限ラドン測度を一致または比較するための柔軟な方法を提供する。
我々は,大量生産と除去を可能とし,地価の変動を可能にするフレームワークであるCR-UOTを導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:11:27 GMT)
Beyond Protein Language Models: An Agentic LLM Framework for Mechanistic Enzyme Design [0.8] Genie-CAT (Genie-CAT) は、タンパク質設計における科学的仮説生成を加速するために設計されたツール拡張大型言語モデル(LLM)システムである。
システムは機械的に解釈可能な、テスト可能な仮説のリンクシーケンス、構造、関数を生成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:57:07 GMT)
OncoVision: Integrating Mammography and Clinical Data through Attention-Driven Multimodal AI for Enhanced Breast Cancer Diagnosis [0.8] OncoVisionは、マンモグラフィ画像と臨床データを組み合わせて乳癌の診断を改善するマルチモーダルAIパイプラインである。
4つのROI(質量、石灰化、軸索所見、乳房組織)を共同で区分する。
質量形態,石灰化型,ACR乳房密度,BI-RADSの10種類の臨床像を強く予測する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:04:26 GMT)
GPU-Initiated Networking for NCCL [0.8] 従来のGPU通信は、CPUがすべての通信操作をオーケストレーションするホスト開始モデルに従っている。
本稿では,GINアーキテクチャ,設計,セマンティクスについて述べる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:45:45 GMT)
Deterministic Continuous Replacement: Fast and Stable Module Replacement in Pretrained Transformers [0.8] 冷間開始再活性化は凍結した背骨を安定化させるが、制御された研究でこのコア安定性の課題を分離する。
単座研究において、DCRは、制御された注意置換に基づくゲーティングや蒸留ベースラインよりも早く収束し、より強いアライメントを得ることができ、不均一なオペレータスワップの基礎を確立した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 00:55:14 GMT)
The DataSquad Experiment: Lessons for Preparing Data and Computer Scientists for Work [0.7] カールトン大学のDataSquadは、構造化されたピアメンターシップと実際のクライアントプロジェクトを通じて、学部生を訓練する。
本稿では、カールトン大学におけるプログラムの実装について述べ、構造化されたピアメンターシップが制度データサービスをどのように同時に改善できるかを考察する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:49:28 GMT)
Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM [0.7] SmoothLLMは、ジェイルブレイク攻撃に対する認証保証を提供する。
これは、実際にはほとんど成り立たない厳密なk不安定な仮定に依存している。
より現実的な確率的フレームワーク (k, $varepsilon$)-unstable) を導入し、多様なジェイルブレイク攻撃に対する防御を認証する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:25:16 GMT)
The Semiotic Channel Principle: Measuring the Capacity for Meaning in LLM Communication [0.7] 本稿では,Large Language Models (LLMs) 解析のための新しいセミオティックフレームワークを提案する。
我々はLLMを、出力がアクティブで非対称な人間の解釈を必要とするセミオティックエンジンとして概念化する。
本研究では、不透明なモデル内部から可観測的なテキストアーティファクトまでの分析を行い、広さと解読可能性の実証的な測定を可能にした。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:06:29 GMT)
Designing Gamified Social Interaction for Gen Z in the Metaverse: A Framework-Oriented Systematic Literature Review [0.7] ゲーミフィケーションは、メタバースにおけるユーザーエンゲージメントを高める上で重要な役割を果たす。
本研究では,PRISMA 2020とSPIDERによって指導された,フレームワーク指向の体系的文献レビューについて述べる。
本稿では,ソーシャルな没入型体験を設計するための概念モデルである Affordance-Driven Gamification Framework (ADGF) を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:40:15 GMT)
NVGS: Neural Visibility for Occlusion Culling in 3D Gaussian Splatting [0.7] 3D Gaussiantingは、多数のプリミティブを含むシーンのレンダリングを高速化するために、フラストタルカリングと詳細戦略を利用することができる。
本研究では,シーン内の資産のインスタンス間で共有される小さなモデルを用いて,すべてのガウスの視点依存可視関数を訓練されたモデルで学習する手法を提案する。
レンダリングの前にガウスアンに問い合わせることで、レンダリング中に隠されたプリミティブを破棄することができる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:11:12 GMT)
Navigating Gigapixel Pathology Images with Large Multimodal Models [0.6] 汎用大規模マルチモーダルモデル(LMM)は、一般的に医療画像の解釈において不十分または不確定な性能を示している。
病理医のように,LMMが画像全体を反復的にナビゲートできる最初のフレームワークであるgigapixel Image Agent for Navigating tissue (GIANT)を紹介した。
我々はMultiPathQAを用いて,従来のパッチやサムネイルベースのベースラインよりもはるかに優れたエージェントシステムを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:33:56 GMT)
LLM Chatbots in High School Programming: Exploring Behaviors and Interventions [0.6] 本研究は,大規模言語モデル(LLM)の高次プログラミング教育における統合を改良するために,デザインベース研究サイクルを用いた。
最初の問題は、インタベンション・グループ(Intervention Group)で特定され、インタベーション・グループ(Intervention Group)では、インタベーション・グループ(Intervention Group)では、インタベーション・グループ(Intervention Group)では、エグゼクティブ、ソリューション・サーキング・クエリの比率が、試験のパフォーマンスと強く負の相関をとっていた。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:58:06 GMT)
Normative active inference: A numerical proof of principle for a computational and economic legal analytic approach to AI governance [0.6] 本稿では,AIエージェントの行動に法的規範がどう影響するかを計算学的に考察する。
我々は,エージェントに意図的な制御システムを与える設計による規制によって,合法的で規範に敏感なAI行動が達成可能であることを提案する。
我々は、文脈依存の嗜好が自律エージェントの安全メカニズムとしてどのように機能するかを議論することで結論付けた。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:30:51 GMT)
Synergistic Effects of Detuning and Auxiliary Qubits on Quantum Synchronization [0.6] 分散マルチキュービットシステムにおいて,デチューニングと補助量子ビットが協調的に量子同期を向上する方法について検討する。
提案手法は,アクティブなエンジニアのフェーズを調整し,補助量子ビットは持続的同期に必要なメモリを提供する協調制御戦略を確立する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:03:30 GMT)
LLMs for Low-Resource Dialect Translation Using Context-Aware Prompting: A Case Study on Sylheti [0.6] 本研究は,バングラ語の方言であるSylhetiに対する機械翻訳(MT)に関する最初の体系的な研究である。
Sylheti-CAP(Context-Aware Prompting)は、言語規則書、辞書、イディオムをプロンプトに埋め込むフレームワークである。
大規模な実験により、Sylheti-CAPはモデル間の翻訳品質を一貫して改善し、戦略を推進している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:34:18 GMT)
MAIF: Enforcing AI Trust and Provenance with an Artifact-Centric Agentic Paradigm [0.5] 現在のAIシステムは、監査証跡、証明追跡、EU AI Actのような新たな規則で要求される説明可能性に欠ける不透明なデータ構造で運用されている。
動作は一時的なタスクではなく、永続的で検証可能なデータアーティファクトによって駆動される、アーティファクト中心のAIエージェントパラダイムを提案する。
プロダクション対応実装では、超高速ストリーミング(2,720.7MB/s)、最適化されたビデオ処理(1,342MB/s)、エンタープライズレベルのセキュリティが示されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:26:39 GMT)
EVCC: Enhanced Vision Transformer-ConvNeXt-CoAtNet Fusion for Classification [0.5] トランスフォーマーとCNNを組み合わせたハイブリッド視覚アーキテクチャは画像分類が大幅に進歩しているが、通常は計算コストがかなり高い。
本稿では、Vision Transformer、軽量ConvNeXt、CoAtNetを統合した新しいマルチブランチアーキテクチャであるEVCCを紹介する。
CIFAR-100、Tobacco3482、CelebA、Brain Cancerデータセットにわたる実験は、EVCCが強力なモデルよりも優れていることを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:11:19 GMT)
CodeR3: A GenAI-Powered Workflow Repair and Revival Ecosystem [0.5] CodeR$3$(コード修復、リバイバル、再利用のためのスタンド)と呼ばれる新しいレガシなワークフローマイグレーションシステムを提示します。
我々は生成AIを用いて崩壊した特徴を分析し、それらをSnakemakeやVisFlowといった現代的なワークフロー技術に再現する。
また、ステップワイズワークフロー分析、自動サービス置換、可視化、ヒューマン・イン・ザ・ループ・バリデーションも統合する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:06:45 GMT)
No-go theorems for sequential preparation of two-dimensional chiral states via channel-state correspondence [0.5] 逐次ユニタリ回路が2次元キラル状態を作ることができるかどうかを検討する。
ガウスフェルミオン系とジェネリック相互作用系のための2つのノーゴー定理を定めている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:00:05 GMT)
Lightweight Transformer Framework for Weakly Supervised Semantic Segmentation [0.5] 弱い教師付きセマンティックセマンティックセグメンテーション(WSSS)は、ノイズの多い未特定の手がかりから密集したマスクを学習しなければならない。
3つの小さな相乗的変化は、MiTバックボーンを変更することなく、弱い監督を著しく効果的にすることを示した。
提案手法であるCrispFormerは,(1)軽量エッジヘッドと境界認識損失を用いて細い物体の輪郭を監督する境界分岐,(2)画素ごとの不確かさを予測し,重み付けとセグメント化ログの残差補正に使用する不確実性誘導型精細化器,(3)静的結合を置き換える動的マルチスケール融合層をデコーダに拡張する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:40:57 GMT)
Accelerating Reinforcement Learning via Error-Related Human Brain Signals [0.4] 本研究では、複雑なロボット操作設定において、暗黙のニューラルフィードバックが強化学習を加速させる方法について検討する。
オフライン学習された脳波分類器からデコードされたエラー関連電位を報酬形成に統合し、フィードバック重み付けの効果を評価する。
本研究は,脳波を用いた強化学習が運動課題を超えて拡張可能であることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:33:47 GMT)
Reinforcement Learning for Self-Healing Material Systems [0.4] 本研究は、マルコフ決定プロセス(MDP)における強化学習問題として自己修復過程を考察し、エージェントが最適なポリシーを自律的に導出できるようにする。
シミュレーション環境下での離散作用(Q-learning, DQN)と連続作用(TD3)の比較評価により, RLコントローラはベースラインを著しく上回り, ほぼ完全な材料回収を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:42:00 GMT)
LogSyn: A Few-Shot LLM Framework for Structured Insight Extraction from Unstructured General Aviation Maintenance Logs [0.4] 航空機のメンテナンスログは、貴重な安全データを保持するが、構造化されていないテキストフォーマットのため、未使用のままである。
本稿では,大規模言語モデル(LLM)を用いて,これらのログを構造化機械可読データに変換するフレームワークであるLogSynを紹介する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:41:57 GMT)
FISCAL: Financial Synthetic Claim-document Augmented Learning for Efficient Fact-Checking [0.3] FISCALは金融ファクトチェックに適した合成データを生成するためのフレームワークである。
MiniCheck-FISCALは数値ファイナンシャルクレームの軽量検証器である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:11:44 GMT)
GRAPHIC--Guidelines for Reviewing Algorithmic Practices in Human-centred Design and Interaction for Creativity [0.3] GraphIC (Guidelines for Reviewing Algorithmic Practices in Human-centred Design and Interaction for Creativity) は、グラフィックデザインに適用された計算システムを分析するためのフレームワークである。
その目標は、グラフィックデザインの分野において、現在のシステムが人間とAIのコラボレーションをどのようにサポートするかを理解することである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:38:31 GMT)
HABIT: Human Action Benchmark for Interactive Traffic in CARLA [0.3] 高忠実度シミュレーションベンチマークであるHABIT(Human Action Benchmark for Interactive Traffic)を紹介する。
約3万回の再ターゲティングされた最初のプールから、交通対応の歩行者4,730回をキュレートする。
当科におけるAbbreviated Injury Scale (AIS) やFalse Positive Braking Rate (FPBR) などの安全基準は, 先行評価で見逃された最先端ADエージェントの致命的な障害モードを明らかにする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:43:39 GMT)
Infrared absorption spectroscopy of a single polyatomic molecular ion [0.3] 単一分子イオン中赤外振動遷移における非破壊吸収分光法について報告する。
この方法は、複雑な多原子分子の量子的非破壊測定へのマイルストーンである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:48:05 GMT)
Trust-Based Social Learning for Communication (TSLEC) Protocol Evolution in Multi-Agent Reinforcement Learning [0.3] 信頼に基づく社会学習は、エピソード・コンバージェンスを23.9%削減する。
信頼スコアは教育の質を強く相関させ、効果的な知識フィルタリングを可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:31:51 GMT)
SpectraNet: FFT-assisted Deep Learning Classifier for Deepfake Face Detection [0.3] 本稿では,EfficientNet-B6に基づく軽量で一般化可能なバイナリ分類モデルを提案する。
我々のモデルは高い精度、安定性、一般化を達成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:54:00 GMT)
TICAL: Trusted and Integrity-protected Compilation of AppLications [0.2] Ticalは信頼できるコンパイルのためのフレームワークで、ソースコードから最終実行ファイルまでのビルドパイプラインの完全性と機密性を提供する。
当社のアプローチでは,TEEをランタイム保護として活用するが,ファイルシステムの保護とバージョン履歴による不変監査ログにより,TEEを充実させ,説明責任を提供します。
評価の結果,TicalはCI/CDパイプライン全体の機密性と整合性を,許容可能なパフォーマンスオーバーヘッドで保護できることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:28:48 GMT)
Pre-Filtering Code Suggestions using Developer Behavioral Telemetry to Optimize LLM-Assisted Programming [0.2] 大規模言語モデル(LLM)は、AIによるコード提案を提供するために、コードエディタにますます統合されている。
しかし、これらの提案の多くは無視され、時間の無駄な計算、レイテンシの増加、不要な中断をもたらす。
LLMを起動する前に提案を受理する可能性を予測する軽量な事前フィルタモデルを導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:42:07 GMT)
Optimizing LLM Code Suggestions: Feedback-Driven Timing with Lightweight State Bounds [0.2] 大規模言語モデル(LLM)は、コンテキスト対応の提案を生成することで、コードの自動補完を変換した。
リアルタイムの開発者フィードバックに基づいて提案を行う前に遅延を動的に調整する適応タイミング機構を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:29:15 GMT)
A symbolic Perl algorithm for the unification of Nahuatl word spellings [0.2] 我々のモデルは、以前ナワトルの文を解析するために使用したアルゴリズムに基づいています。
我々の自動統一アルゴリズムは記号正規表現の言語規則を実装している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:49:13 GMT)
What Drives Cross-lingual Ranking? Retrieval Approaches with Multilingual Language Models [0.2] リソース、スクリプト、埋め込みモデルにおける弱い言語間セマンティックアライメントの相違により、言語間情報検索は困難である。
既存のパイプラインは、しばしば翻訳と単言語検索に依存し、計算オーバーヘッドとノイズ、パフォーマンスを追加する。
この研究は、文書翻訳、事前訓練されたエンコーダによる多言語密集検索、単語、フレーズ、クエリー文書レベルのコントラスト学習、および3つのベンチマークデータセットにおけるクロスエンコーダの再ランク付けという、4つの介入タイプを体系的に評価する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:17:40 GMT)
Generative Query Expansion with Multilingual LLMs for Cross-Lingual Information Retrieval [0.2] マルチ言語大言語モデル (mLLMs) は、セマンティック拡張から同義語や関連語によるクエリ拡張から擬文書生成へ移行した。
本研究は,近年のmLLMと,言語間検索性能を向上する要因を特定するために,複数の生成的拡張戦略にまたがる微調整変種を評価した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:18:25 GMT)
ProvRain: Rain-Adaptive Denoising and Vehicle Detection via MobileNet-UNet and Faster R-CNN [0.2] ProvRainは、堅牢な気象条件に一般化するために調整された軽量なMobileNet-U-Netアーキテクチャである。
システムは8.94%の精度向上と10.25%のリコールを達成している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:40:33 GMT)
Empirical Comparison of Forgetting Mechanisms for UCB-based Algorithms on a Data-Driven Simulation Platform [0.2] 本稿では、ディスカウントに基づく長期視点とスライディングウインドウに基づく短期視点を統合した新しいデュアルビューアルゴリズムであるFDSW-UCBを紹介し、評価する。
ダイナミックな設定で優れたパフォーマンスを実現し、アンサンブル戦略自体が成功の決定的な要因であることを強調します。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:52:02 GMT)
PhysDNet: Physics-Guided Decomposition Network of Side-Scan Sonar Imagery [0.2] PhysDNetは物理誘導ネットワークで、SSS画像を3つの解釈可能なフィールドに分離する。
PhysDNetは海底反射率、地形高度、伝播損失からソナー強度を再構築する。
実験により、分解された表現は安定した地質構造を保持し、物理的に一貫した照明と減衰を捉え、信頼できる影の地図を生成することが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:54:03 GMT)
Representational Stability of Truth in Large Language Models [0.2] 本稿では,LLMの真理の操作的定義における摂動に対する妥当性表現の頑健性として表現安定性を導入する。
トレーニングデータから欠落していると思われるエンティティに関する事実的主張と、よく知られたフィクションの文脈から引き出された非事実的主張の2つを比較した。
未知のステートメントは最大の境界シフトを引き起こし、脆弱なドメインで最大40%の真理を反転させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:28:50 GMT)
High-throughput validation of phase formability and simulation accuracy of Cantor alloys [0.1] 本稿では,予測値と実験観測値との一致を評価するための定量的信頼度指標を提案する。
組成変化したFeNiMnCr合金ライブラリ上での高スループットシンクロトロンX線回折により実験データセットを作成した。
観測された相と予測相の一致を,温度依存性の相分類または温度依存性の相形成確率を含むモデルを用いて評価した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:31:16 GMT)
Satellite to Street : Disaster Impact Estimator [0.1] 本研究は, 衛星画像と衛星画像との協調処理により, 微粒な画素レベルの損傷マップを得るディープラーニングフレームワークを提案する。
このモデルは、局所的な構造的変化とより広い文脈的手がかりの両方をキャプチャするために、拡張された機能融合を備えた修正されたデュアルインプットU-Netアーキテクチャを使用する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:20:40 GMT)
Development of a fully deep learning model to improve the reproducibility of sector classification systems for predicting unerupted maxillary canine likelihood of impaction [0.1] 本研究の目的は,セクター分類システムの内・間運用者を減らすための,完全深層学習モデルを開発することである。
DenseNet121は3つの異なるクラスで影響を受け、全体的な精度は76.8%であった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:45:46 GMT)
Large Scale Community-Aware Network Generation [0.1] ネットワーククラスタリング(ネットワーククラスタリング)は、ネットワーク内の潜在コミュニティ構造を特定するために用いられる。
本稿では,RECCS+とRECCS++の2つの拡張版を示す。
この新たなパフォーマンスにより、RECCS++は1億以上のノードと20億近いエッジを持つネットワークに拡張できるようになった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:25:40 GMT)
In Machina N400: Pinpointing Where a Causal Language Model Detects Semantic Violations [0.1] コーパスを用いて因果語モデル (phi-2) の評価を行った。
そこで, 線形プローブを用いた層間検出を行った。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:43:56 GMT)
Flexible Genetic Algorithm for Quantum Support Vector Machines [0.0] GA-QSVMは遺伝的アルゴリズム(GA)を用いて特徴マップを自動的に最適化するハイブリッドフレームワークである。
GA-QSVMは従来のSVMや標準QSVMに比べて精度が良いことを示す。
これらの知見は、将来の量子機械学習アプリケーションのためのカーネル設計を自動化し、拡張するための進化戦略の可能性を強調している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:26:18 GMT)
Modelling and experimental verification of photoelectrical response of NV diamond spin centres [0.0] ダイヤモンド中のNV色中心の光電応答の数学的モデルについて報告する。
チャージキャリアのドリフトと回収、およびジェネレーションと組換えダイナミクスによる他の欠陥の存在を含めます。
このモデルは実験的に確認され、NV量子ビット光電リードアウトの性能を最適化するための有用なツールとなる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:53:51 GMT)
YBa$_2$Cu$_3$O$_7$ nano-constriction Josephson junctions and SQUIDs fabricated by focused helium-ion-beam irradiation [0.0] 適切に選択された線量により、超伝導は4,mathrmK$まで抑制されるが、結晶性は保存されている。
我々は, 正伝導性YBCOの領域を作成し, ナノスケールで比抵抗共役型ジョセフソン接合 (cJJs) を定義する。
また、製造したcJJsを直流超伝導量子干渉デバイスに組み込むことができ、THzアンテナの検出器ジャンクションとして使用できることを示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:06:37 GMT)
Wigner and Gabor phase-space analysis of propagators for evolution equations [0.0] 線形進化方程式の広範クラスのプロパゲータに付随するウィグナー核とガボル行列について検討する。
フーリエ乗算器のウィグナー核に対する明示的な表現を導出し、対応するガボル行列に対して定量的な減衰推定値を確立する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:36:04 GMT)
Who Owns the Knowledge? Copyright, GenAI, and the Future of Academic Publishing [0.0] 生成人工知能(GenAI)と大規模言語モデル(LLM)の科学研究と高等教育への統合はパラダイムシフトを呈している。
本研究では、著作権法やオープンサイエンスの原則にかかわる課題に特に焦点をあて、AIと科学の複雑な交わりについて検討する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:34:38 GMT)
When Should Neural Data Inform Welfare? A Critical Framework for Policy Uses of Neuroeconomics [0.0] 政策や商業のアクターは、父親主義的な規制、「脳に基づく」介入、新しい福祉措置を正当化するために、神経データをますます呼び起こす。
本稿では、ニューラルネットワークが、単に行動を記述するのではなく、政策に対する福祉判断を正当に通知する条件を問う。
私は、ニューラルネットワーク、計算決定モデル、規範的福祉基準の3つのレベルをリンクする、経験的でないモデルベースのフレームワークを開発します。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:34:40 GMT)
When +1% Is Not Enough: A Paired Bootstrap Protocol for Evaluating Small Improvements [0.0] 最近の機械学習論文では、ベンチマークの単一実行から1-2パーセントの改善が報告されている。
したがって、報告された+1-2%が実際のアルゴリズムの進歩とノイズを反映しているかどうかは不明である。
本稿では,ペア型マルチシードラン,バイアス補正・高速化(BCa)ブートストラップ信頼区間,およびデルタ単位のサインフリップ置換試験に基づくPCフレンドリーな評価プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:50:27 GMT)
Web of Non-invertible Dualities for (2+1) Dimensional Models with Subsystem Symmetries [0.0] サブシステム対称性を持つ格子モデルの非可逆双対性を構築する。
開格子上では、部分系とケネディ・タサキ(KT)の両方がユニタリ可逆作用素として作用する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:36:11 GMT)
Uncertainty-Aware Dual-Student Knowledge Distillation for Efficient Image Classification [0.0] 本稿では,不確実性を考慮した二重学習型知識蒸留フレームワークを提案する。
2つの異質な学生アーキテクチャが教師ネットワークと相互に協調して学習するピアラーニング機構を導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:02:22 GMT)
Uncertainty-Aware Deep Learning Framework for Remaining Useful Life Prediction in Turbofan Engines with Learned Aleatoric Uncertainty [0.0] 本研究は,確率論的モデリングにより,アレータリックな不確実性を直接学習する,新しい不確実性を考慮したディープラーニングフレームワークを提案する。
本フレームワークは,RMSEが5.14,6.89,5.27,7.16で,ブレークスルークリティカルゾーン性能(RUL=30サイクル)を達成する。
学習された不確実性は95パーセントの信頼区間を提供し、カバー範囲は93.5パーセントから95.2%までであり、リスク対応のメンテナンススケジュールを可能にしている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:53:31 GMT)
Unboxing the Black Box: Mechanistic Interpretability for Algorithmic Understanding of Neural Networks [0.0] 機械的解釈可能性(Mechanistic Interpretability)は、ニューラルネットワークの内部計算を研究し、それらを人間の理解可能なアルゴリズムに変換するプロセスである。
我々は、MIは機械学習システムのより科学的理解を支援する大きな可能性を秘めていると論じる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:16:49 GMT)
Torsion-Space Diffusion for Protein Backbone Generation with Geometric Refinement [0.0] 新しいモデルでは、ねじれ角を識別してタンパク質のバックボーンを生成し、構築による完全な局所幾何学を保証する。
標準PDBタンパク質の実験は、100%結合長の精度を示し、構造的コンパクト性を大幅に改善した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:51:29 GMT)
Tiny-TSM: Efficiently Training a Lightweight SOTA Time Series Foundation Model [0.0] 本稿では,小規模,経済訓練,最先端パフォーマンスを特徴とする時系列基礎モデルTiny-TSMを提案する。
新たに合成データ生成とデータ拡張パイプラインを使用して、1週間以内に1つのA100 GPUでトレーニングされた23万のパラメータで構成されている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:22:05 GMT)
Think First, Assign Next (ThiFAN-VQA): A Two-stage Chain-of-Thought Framework for Post-Disaster Damage Assessment [0.0] 災害時における視覚的質問応答(VQA)のための2段階推論に基づくフレームワークであるThiFAN-VQAを提案する。
カスタム情報検索システム、ドメイン固有のプロンプト、推論誘導型回答選択を統合することで、ThiFAN-VQAはゼロショットと教師付きメソッドのギャップを埋める。
FloodNetとRescueNet-VQAの実験は、洪水やハリケーンに影響を受けた地域のUAVベースのデータセットで、ThiFAN-VQAがより優れた精度、解釈可能性、適応性を実現することを実証している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:32:07 GMT)
The Unified Non-Convex Framework for Robust Causal Inference: Overcoming the Gaussian Barrier and Optimization Fragility [0.0] オーバーラップ(ATO)における平均処理効果の評価を再設計する。
強靭性のためのガンマ・ディヴァージェンス、大域的最適化のための漸進的非凸性(GNC)、ガウス政権における高次性の不合理性に対処する「ゲイトキーパー」機構を合成する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:32:07 GMT)
The Alexander-Hirschowitz theorem for neurovarieties [0.0] ニューラルネットワークのニューロバリアリティについて検討し、単出力の場合の期待次元に到達すると完全に特徴付ける。
その結果,多出力アーキテクチャにおける非欠陥性とグローバルな識別性を確立した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:09:42 GMT)
Tensor-network approach to quantum optical state evolution beyond the Fock basis [0.0] 非線形光学系の力学を効率的に捉えるテンソル・ネットワーク手法を提案する。
行列積状態(MPS)形式を用いることで、量子状態と演算子は共に高度に圧縮された形で符号化される。
この枠組みは、マルチモード量子光と非線形光学現象をモデル化するためのスケーラブルな経路を開く。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:35:07 GMT)
Targeted Manipulation: Slope-Based Attacks on Financial Time-Series Data [0.0] 本稿では,N-HiTSモデルにより予測される株価予測の傾向を変えることを目的とした,2つの新しい傾斜法を提案する。
通常のN-HiTS予測と比較して、この2つの新しい手法は斜面を2倍にすることでN-HiTS予測を操作できる。
これらの新たなスロープ攻撃は、実際の入力と摂動入力をフィルタリングする識別器など、標準的なセキュリティメカニズムをバイパスすることができる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:26:20 GMT)
Synthetic Data: AI's New Weapon Against Android Malware [0.0] 攻撃者は人工知能を使って、従来の検出技術を回避できる高度なマルウェアのバリエーションを作成している。
MalSynGenは、条件付き生成逆数ネットワーク(cGAN)を使用して合成データを生成する、Malware Synthetic Data Generation方法論である。
このデータは,実世界のデータの統計特性を保存し,Androidマルウェア分類器の性能を向上させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:27:58 GMT)
Synchronized Aharonov-Bohm Motifs via Engineered Dissipation [0.0] 我々は、このフラックス誘起局在化と工学的な散逸とを組み合わせることで、回転対称スピン幾何学におけるロバストスピン同期が導かれることを示した。
その結果, フラックス誘起局在化, 散逸工学, 集合量子同期の直接的な関係が明らかとなった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:25:04 GMT)
Summary-Mediated Repair: Can LLMs use code summarisation as a tool for program repair? [0.0] 大きな言語モデル(LLM)は、強いベンチマーク性能にもかかわらず、微妙な実装レベルのバグのあるコードを生成することが多い。
本稿では,プログラム修復のためのプロンプトのみのパイプラインである要約型修復を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:33:38 GMT)
Studying Maps at Scale: A Digital Investigation of Cartography and the Evolution of Figuration [0.0] この研究は、38のデジタルカタログから集められた71,561の地図記録と99,715のデジタル画像の多種多様なコーパスを活用している。
地図学の空間的焦点は、政治的ダイナミクス、大西洋海図作成、三角貿易、植民地拡大の関連性について分析される。
ランドクラスの解析により、地図はフレーミングと構成が中心的および意味的対称性を通して特徴を強調するデザインされたイメージであることが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:35:37 GMT)
Structured Noise Modeling for Enhanced Time-Series Forecasting [0.0] 本研究は、構造的ノイズモデリングによる時間的忠実度を改善する予測ブルーデノエーズフレームワークを導入する。
電気、交通、太陽のデータセットにわたる実験は、マルチ水平精度と安定性において一貫した利得を示している。
このフレームワークは、エネルギー、インフラストラクチャ、その他の時間クリティカルドメインにわたる予測駆動決定サポートに使用される、より信頼性の高いAIシステムに寄与する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:44:46 GMT)
Strategic Innovation Management in the Age of Large Language Models Market Intelligence, Adaptive R&D, and Ethical Governance [0.0] 本研究では,大規模言語モデル(LLM)の研究開発プロセスの変換における多機能性について検討する。
知識発見の自動化、仮説作成の促進、学際的洞察の統合、イノベーションエコシステム内の協力の実現により、LLMは研究プロセスの効率と効率を劇的に改善する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:42:33 GMT)
Solution of Incompressible Flow Equations with Physics and Equality Constrained Artificial Neural Networks [0.0] 本稿では,非圧縮性ナビエ・ストークス方程式の対流支配状態における解を求めるメッシュレス手法を提案する。
単一ニューラルネットワークは速度場と圧力場の両方をパラメータ化し、圧力に対するポアソン方程式の残差を最小化して訓練する。
提案手法は,レノルズ数7,500までの標準蓋駆動キャビティ流れと,流入流境界条件を有する円柱上の層流について実証した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:54:20 GMT)
Shake before use: universal enhancement of quantum thermometry by unitary [0.0] このレターは、熱化されたプローブに適用された任意の温度依存のユニタリ駆動が、その平衡値に関してその量子フィッシャー情報を強化することを示す一般的なモデルに依存しない結果を定めている。
さらに, 共振変調によりフィッシャー情報の2次時間スケーリングが著しく回復し, 感度ピークを任意の温度範囲に移動させることができることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:07:04 GMT)
Scaling Item-to-Standard Alignment with Large Language Models: Accuracy, Limits, and Solutions [0.0] 従来の人間のアライメントレビューは正確だが、遅く、労働集約的である。
本研究では,Large Language Models (LLM) が精度を犠牲にすることなく,このプロセスを加速できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:12:23 GMT)
SPARTA: $χ^2$-calibrated, risk-controlled exploration-exploitation for variational quantum algorithms [0.0] 変分量子アルゴリズムは、基本的なトレーニング可能性の危機に直面している。
本稿では、量子最適化のための明示的かつ有意なリスク制御を提供する逐次プラトー適応型システマテストアルゴリズム(SPARTA)を提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:54:01 GMT)
RoguePrompt: Dual-Layer Ciphering for Self-Reconstruction to Circumvent LLM Moderation [0.0] 本稿では,不正なユーザクエリを自己再構成プロンプトに変換する自動ジェイルブレイク攻撃を提案する。
GPT 4oに対してRoguePromptをインスタンス化し、2 448で評価すると、以前は強く拒否されていた生産モデレーションシステムであることが示唆される。
3つのセキュリティ関連の結果のバイパス、再構築、実行を分離する評価プロトコルの下で、攻撃は84.7%のバイパス、80.2%の再構築、および71.5パーセントの完全な実行を達成した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 05:42:54 GMT)
Robotic chip-scale nanofabrication for superior consistency [0.0] 本稿では,ロボットアームを用いて低体積・高吸蔵作業を自動化することにより,プロセス制御と整合性を改善することを提案する。
プロセスの再現性に関する統計的比較は、ロボットプロセスが2%近いチップにまたがる抵抗を達成していることを示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:59:45 GMT)
Reproducibility Study of Large Language Model Bayesian Optimization [0.0] 大規模言語モデルを代理語として使用するLLAMBOフレームワークを再検討する。
GPT-3.5を全テキストエンコーディングコンポーネントで使用されるオープンウェイトなLlama 3.1 70Bモデルに置き換える。
本結果はLLAMBOの主な主張を裏付けるものである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 08:48:38 GMT)
Replication Study: Federated Text-Driven Prompt Generation for Vision-Language Models [0.0] オリジナルのFedTPG論文citeQiu2024では、クラス名に条件付きプロンプトを動的に生成するテキスト駆動プロンプト生成ネットワークが導入されている。
我々はFedTPGを忠実に再現し、6つの多様な視覚データセット上で事前学習したモデルを評価する。
本評価の結果は,本論文が報告した精度の0.2%以内であり,平均精度は74.58%,未確認(新)クラス76.00%であり,一般化では+1.43ポイント向上した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:05:10 GMT)
Relativistic Quantum-Speed Limit for Gaussian Systems and Prospective Experimental Verification [0.0] マンデルスタム・タムおよびマルゴラス・レヴィタン境界に対する一階相対論的補正を導出する。
結果は、高速または強磁場状態における量子速度制限のアクセス可能なテストを指す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:48:36 GMT)
Regularity as Structural Amplifier, Not Trap: A Causal and Archetype-Based Analysis of Dropout in a Constrained Engineering Curriculum [0.0] 工学プログラム、特にラテンアメリカでは、厳格なカリキュラムと厳格な規則によって管理されることが多い。
本研究はCAPIREフレームワークを用いて因果仮説を検証する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:53:41 GMT)
Quantum Key Distribution Based on Systematic Polar Coding [0.0] 量子鍵分布と系統的極性符号化(誤り訂正アルゴリズム)の組み合わせを提案する。
これにより、標準量子鍵分布(BB84)とその効率的なバージョン(eBB84)よりも高い鍵レートが得られる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:52:41 GMT)
Quantum Coherence of Rare-Earth Ions in Heterogeneous Photonic Interfaces [0.0] 発光励起分光法により、III-V/オキシド界面からの距離が増加するEr$3+$イオンが、系統的なブルーシフトをもたらすことが明らかになった。
補償された赤方偏移と線幅狭めは、酸素空孔とガリウム拡散ノイズの役割を分離する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:07:48 GMT)
Quantitative and Optimal Device-Independent Lower Bounds on Detection Efficiency [0.0] 本稿では, (2,2,2) Bell実験における検出効率の定量的かつ最適な下界を, (2,2,2) Bell実験において完全にデバイスに依存しない枠組みで検討する。
我々は,Navascués-Pironio-Acn階層を用いて,所望のBell-CHSH違反を観測するために必要な最小限の効率を低くする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:50:49 GMT)
Psychometric Tests for AI Agents and Their Moduli Space [0.0] 我々は、電池上のAAI関数の概念を正確に定義し、合理的な自律性/汎用知能スコアが満足するべきであると判断する。
従来定義されていた複合指標('AAI-Index')が,AAI関数の特別な場合であることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:15:08 GMT)
Prompt Fencing: A Cryptographic Approach to Establishing Security Boundaries in Large Language Model Prompts [0.0] 大型言語モデル (LLM) は、インジェクション攻撃の迅速化に弱いままである。
暗号認証とデータアーキテクチャの原則を適用する新しいアーキテクチャアプローチであるPrompt Fencingを紹介します。
我々の手法は、信頼評価やコンテンツタイプを含む暗号署名されたメタデータでプロンプトセグメントをデコレートする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:44:33 GMT)
Preventing Shortcut Learning in Medical Image Analysis through Intermediate Layer Knowledge Distillation from Specialist Teachers [0.0] ディープラーニングモデルは、トレーニングデータの急激な相関と無関係な特徴を使って、問題に対するショートカットを学習する傾向がある。
医用画像解析などの高リスクアプリケーションでは、この現象は、予測を行うときに臨床的に意味のある特徴を使用するのを防ぐことができる。
本稿では,タスク関連データの小さなサブセットに微調整された教師ネットワークを活用して,ショートカット学習を緩和する新しい知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:32:57 GMT)
Pretraining Transformer-Based Models on Diffusion-Generated Synthetic Graphs for Alzheimer's Disease Prediction [0.0] 本稿では,合成データ生成とグラフ表現学習と伝達学習を組み合わせたTransformerベースの診断フレームワークを提案する。
実世界のNACCデータセットを用いて、クラス条件付き拡散確率モデル(DDPM)を訓練し、大規模な合成コホートを生成する。
モダリティ固有のグラフトランスフォーマーエンコーダは、まずこの合成データに基づいて、堅牢なクラス識別表現を学習する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:34:53 GMT)
Post-Pruning Accuracy Recovery via Data-Free Knowledge Distillation [0.0] 医療や金融といったプライバシに敏感なドメインでは、オリジナルのトレーニングデータへのアクセスは、規制によりデプロイ後に制限されることが多い。
本稿では,モデル圧縮とデータプライバシのギャップを埋めるために,データ自由知識蒸留フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:27:40 GMT)
Optimization and Regularization Under Arbitrary Objectives [0.0] 本研究では,マルコフ連鎖モンテカルロ法(MCMC)を任意目的関数に適用する際の限界について検討する。
それらの性能は、採用される可能性の鋭さに依存していることを示す。
この研究は、任意の目的関数に極端に鋭さが与える影響を、別々に分析して結論付けている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:03:43 GMT)
On the microlocal phase space concentration of Schrödinger evolutions [0.0] メタプレクティックウィグナー分布を用いたシュルディンガー方程式の局所的性質について検討する。
我々はまず、よく知られたコーン・ニーレンバーグ量子化を含む全てのメタプレクティックウィグナー分布に局所的な結果を拡張する。
2つの状態の相互作用から生じるウィグナー分布の位相空間濃度を解析した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:48:50 GMT)
Noisy dynamics of confined quantum walks on a chip [0.0] 量子ウォークは、ユニタリコヒーレントと非コヒーレントな散逸過程の間の相互作用を研究するための優れたテストベッドである。
我々は,20x20オンチップマルチモード干渉計を用いて,歩行格子内のエッジの存在という,この問題の別の重要な側面を導入する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:53:35 GMT)
NOEM$^{3}$A: A Neuro-Symbolic Ontology-Enhanced Method for Multi-Intent Understanding in Mobile Agents [0.0] 我々は、構造化意図オントロジーとコンパクト言語モデルを統合することにより、移動型AIエージェントにおける多言語理解のためのニューロシンボリックフレームワークを導入する。
我々は,階層的オントロジーの深さに基づいて,予測意図が語彙的に異なる場合でも意味的近接を捉える,新しい評価指標-意味的固有類似性(SIS)を定式化する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 23:14:45 GMT)
MultiBanAbs: A Comprehensive Multi-Domain Bangla Abstractive Text Summarization Dataset [0.0] 今日のデジタル時代には、大量のバングラコンテンツがブログ、新聞、ソーシャルメディアで継続的に制作されている。
これにより、情報の過負荷を減らし、読者がコンテンツをより早く理解できるようにするための要約システムの必要性が強まる。
本研究は,さまざまな情報源からバングラ記事の簡潔な要約を生成するために,バングラの抽象要約データセットを開発した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:11:49 GMT)
Monogamy of Mutual Information in Graph States [0.0] 相互情報の独占は、三部情報の非肯定性を強制する。
グラフ状態におけるMMIの故障を,禁じられたサブグラフ現象として検討する。
MMIの失敗はスコープ内のケースでは再現できないことが分かりました。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:00:00 GMT)
Modeling Bioelectric State Transitions in Glial Cells: An ASAL-Inspired Computational Approach to Glioblastoma Initiation [0.0] この研究は、グリア細胞の生体電気的状態遷移をシミュレートするASALにインスパイアされたエージェントベースのフレームワークを導入する。
6万段以上の64x64マルチセルグリッドを用いて,臨界閾値以下でMeffを減少させると脱分極,ATP崩壊,ROSが持続することを示した。
さらに, 遺伝的アルゴリズムとMAP-Elitesを応用して, レジリエンス, パラメータ感度, 腫瘍様アトラクタの出現を探索する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:59:51 GMT)
Micrometer thick single crystal iron-garnet films on a diamagnetic buffer layer for cryogenic applications [0.0] この研究は低減衰磁性材料のフロンティアを前進させ、量子コンピューティングや低温エレクトロニクスにおける超低損失部品の需要に直接対処する。
本研究では, 単結晶マイクロメーター厚イットリウム鉄ガーネット (YIG) 膜を低減衰で得るための新しいアプローチとして, パラ磁性基板のバッファー層による界面常磁性特性の分離と緩和を行った。
ガドリニウムガリウム基板上の液相エピタキシーにより成長したジア磁性イットリウムガリウムガリウム緩衝層を有するYIG膜は、薄い平面YIG構造に対して前例のない均一性を示し、強磁性をもたらす。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:40:23 GMT)
Medical Malice: A Dataset for Context-Aware Safety in Healthcare LLMs [0.0] この研究は、普遍的な安全性からコンテキスト認識の安全性へのシフトを提唱している。
高度な医療環境に固有の、曖昧で体系的な脅威に対して、AIを免疫するために必要なリソースを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:55:22 GMT)
MOCLIP: A Foundation Model for Large-Scale Nanophotonic Inverse Design [0.0] MOCLIPはナノフォトニック基礎モデルであり、準曲面幾何学とスペクトルを共有潜在空間に統合する。
MoCLIPは、実験的に取得したデータセットを使用して、幾何学とスペクトル表現を整列するために、対照的な学習を用いる。
MoCLIPは、次世代フォトニックデザインとデータ駆動アプリケーションのためのスケーラブルで汎用的なプラットフォームである。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:54:19 GMT)
MAESTRO: Multi-Agent Environment Shaping through Task and Reward Optimization [0.0] 既存のアプローチは、制御ループ内で直接、固定生成されたLarge Language Models (LLM) に依存している。
我々は,PLMを実行ループ外に移動させるフレームワークであるMAESTROを提案し,オフラインのトレーニングアーキテクトとして使用している。
大規模交通信号制御(広州16交差点)におけるMAESTROの評価を行い,その制御方法について検討した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:05:37 GMT)
Low-Rank GEMM: Efficient Matrix Multiplication via Low-Rank Approximation with FP8 Acceleration [0.0] 低ランクGEMMは、低ランク行列近似を利用してサブクアクラティック複雑性を実現する新しいアプローチである。
システムはハードウェア機能に自動的に適応し、最適な分解方法を選択する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 01:13:52 GMT)
Look It Up: Analysing Internal Web Search Capabilities of Modern LLMs [0.0] 我々は、内部の状態やパラメータにアクセスできない商用モデルにおけるWebアクセスの必要性と有効性を評価するベンチマークを導入する。
データセットには、783の静的な分割が含まれており、時間的に固定された質問は、プレカットの知識から答えられる。
Web アクセスは GPT-5-mini と Claude Haiku 4.5 の静的精度を大幅に向上するが、信頼性の校正は悪化する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:37:43 GMT)
Longitudinal Pulsed Dynamic Nuclear Polarization Transfer via Periodic Optimal Control [0.0] 我々は、長手偏光転送によって励起パルスの課題を軽減する、LOOPと呼ばれる新しいブロードバンドDNPパルス列を提案する。
これらのシーケンスは、マイクロ波磁場の不均一性に対して印象的な補償を施し、100MHzを超える帯域幅でDNP転送を行うことのできる、ロバストなシングルスピン有効$z$回転を定義する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:54:40 GMT)
Logic of Montage [0.0] 感情を表現する際には、自然言語とは別の表現形式として、自然言語を補完する代替形式を提案する。
コントラクタリー構造の影響」は静的ではないが動的であり、「コントラクタリー構造の影響」は不快または快適である。
『構造の影響』の過程は、次のレベルの教育に進む例を用いて実証される。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:55:20 GMT)
Localization and Delocalization of Quantum Trajectories in the Liouvillian Spectrum [0.0] この結果から, トラジェクトリーはリウヴィリアスペクトルの奥深くにある一過性固有状態に対して, 遅い時期においてもよく分布することが明らかとなった。
軌道の非局在化は軌道平均定常状態の純度と強く相関していることがわかった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:06:34 GMT)
LiveVectorLake: A Real-Time Versioned Knowledge Base Architecture for Streaming Vector Updates and Temporal Retrieval [0.0] LivevusLakeは2階層の時間的知識ベースアーキテクチャで、現在の知識をリアルタイムにセマンティック検索できる。
システムは、コンプライアンス、監査可能性、ポイント・イン・タイム検索のための完全なバージョン履歴を維持している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:15:39 GMT)
Leveraging Metaheuristic Approaches to Improve Deep Learning Systems for Anxiety Disorder Detection [0.0] 本研究では,Swarmインテリジェンスにインスパイアされた最適化戦略とディープラーニングアーキテクチャを統合した包括的モデルを提案する。
マルチモーダルおよびウェアラブルセンサーのデータセットを使用して、このフレームワークは生理的、感情的、行動的な信号を解析する。
この2つの計算パラダイムの融合が検出性能を大幅に向上させることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:03:15 GMT)
Leveraging LLMs for reward function design in reinforcement learning control tasks [0.0] 本稿では,LEARN-Opt (LLM-based Evaluator and Analyzer for Reward functioN Optimization)を紹介する。
このフレームワークは、システムやタスク目標のテキスト記述から報酬関数候補を生成し、実行し、評価する。
実験の結果,LEARN-Optは最先端手法に匹敵する性能を示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 17:55:46 GMT)
Leveraging Foundation Models for Histological Grading in Cutaneous Squamous Cell Carcinoma using PathFMTools [0.0] PathFMToolsは,病理基盤モデルの効率的な実行,解析,可視化を可能にするPythonパッケージである。
本ツールを用いて,皮膚扁平上皮癌における組織学的グレーディングの課題に対して,最先端のビジョン言語基盤モデルであるCONCHとMUSKをインターフェースし,評価する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:16:12 GMT)
Interpreting GFlowNets for Drug Discovery: Extracting Actionable Insights for Medicinal Chemistry [0.0] Generative Flow Networks(GFlowNets)は分子設計のための有望なフレームワークを提供するが、内部決定方針は不透明である。
本稿では, 文書化化学反応と購入可能な開始材料に基づくGFlowNetであるSynFlowNetの解釈可能性フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:16:18 GMT)
Individual and group fairness in geographical partitioning [0.0] 我々は、人口が不均一な地理的分割問題の新しいクラスを定式化する。
最適解は加法重み付きボロノイ図形の新しい一般化であることを示す。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:34:51 GMT)
In Defense of the Turing Test and its Legacy [0.0] チューリングの最初の試験はワイゼンバウムが共同で行った。
チューリングテストの最も一般的な6つの批判は、チューリングの主張とAIの歴史的発展の両方に不公平である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 12:57:54 GMT)
HyperbolicRAG: Enhancing Retrieval-Augmented Generation with Hyperbolic Representations [0.0] グラフベースのRAGは、大きな言語モデルが外部知識にアクセスできるようにする。
本稿では,ハイパーボリック幾何をグラフベースRAGに統合する検索フレームワークであるHyperbolicRAGを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 06:27:58 GMT)
High-Order Splitting of Non-Unitary Operators on Quantum Computers [0.0] 量子回路における安定な積分のために、正の実部を持つ複素係数分割法が選択される。
35兆セル上の3次元の6次のステップは、1,562個のCNOTゲートを必要とする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:45:06 GMT)
Geometry-Aware Deep Congruence Networks for Manifold Learning in Cross-Subject Motor Imagery [0.0] 脳波ベースの脳-コンピュータインタフェースでは、クロスオブジェクト・モーター・イメージ・デコーディングが依然として大きな課題である。
本稿では,新しいジオメトリ対応プリプロセッシングモジュールとディープコングルーエンスネットワークを紹介する。
我々のフレームワークは、最強の古典的ベースラインに対して、クロスオブジェクトの精度を3~4%向上させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:46:55 GMT)
Fractional Contribution of Dynamical and Geometric Phases in Quantum Evolution [0.0] 我々は、この分割が任意の瞬間において、単一の幾何学量によってのみ支配されることを示す驚くほど単純で普遍的な法則を証明している。
この結果は、原点において幾何学的対動的である全位相の正確な分数を定義する普遍的かつ厳密な方法を与える。
この発見はすぐに実践的な結果をもたらし、高忠実な幾何学的量子ゲートを設計するための進化の幾何学性をリアルタイムで測定する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:46:51 GMT)
Fermionisation of the Aharanov--Bohm Phase on the Lightfront [0.0] 照明面上のホロノミー(ウィルソン線作用素)の量子化について検討する。
ホロノミー代数の構造定数を計算し、交叉の幾何学に依存することを示す。
ヒルベルト空間はいくつかの予期せぬ特徴を示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:20:57 GMT)
Feature Ranking in Credit-Risk with Qudit-Based Networks [0.0] 金融においては、予測モデルは正確性と解釈可能性のバランスをとる必要がある。
量子ニューラルネットワーク(QNN)を1つのキューディットに基づいて提案する。
台湾の信用リスクデータセットを実世界の非バランスでベンチマークする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:15:57 GMT)
Factors That Support Grounded Responses in LLM Conversations: A Rapid Review [0.0] 大規模言語モデル(LLM)は、ユーザの意図と不一致した出力を生成したり、文脈的根拠を欠いたり、会話中に幻覚を示すことがある。
本研究の目的は,LLM応答を会話目標と整合させ,接地を確保し,幻覚や話題の漂流を減らす手法を同定し,解析することであった。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:18:46 GMT)
Facilitating the Integration of LLMs Into Online Experiments With Simple Chat [0.0] 大規模言語モデル(LLM)のための研究中心のチャットインターフェースであるSimple Chatを紹介する。
Simple ChatはQualtrics、oTree、LimeSurveyなどのプラットフォームとの統合を合理化し、統合された参加者エクスペリエンスを提供する。
技術的な障壁を減らし、インターフェースを標準化し、参加者エクスペリエンスを改善することで、Simple Chatは人間とLLMのインタラクションの研究を前進させる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 13:52:42 GMT)
Exact Solutions for the Kemmer Oscillator in 1+1 Rindler Coordinates [0.0] この研究は、スピン-1粒子に対するケマー方程式の正確な解を、$(1+1)$次元リンドラー時空で提示する。
加速度パラメータが特性長をどう変更し、離散エネルギースペクトルをシフトし、縮退を解除するかを示す。
これらの知見は、曲線時空、量子重力、およびアナログ重力プラットフォームにおける量子場理論に影響を及ぼす加速誘起効果を解析可能なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:11:43 GMT)
Evaluation of Real-Time Mitigation Techniques for Cyber Security in IEC 61850 / IEC 62351 Substations [0.0] サブステーションのデジタル化はサイバー攻撃面を拡大し、デジタルサブステーションにおけるサイバー攻撃の効果的な検出と緩和を必要とする。
IEC 62351で規定された、リアルタイムサイバー防御の実用的な候補として暗号認証が登場した。
本稿では,GOOSEをベースとした攻撃に対処可能な3つの潜在的リアルタイム緩和手法の設計論理と実装の側面について述べる。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 04:20:49 GMT)
Evaluating Deep Learning and Traditional Approaches Used in Source Camera Identification [0.0] 本稿では、ソースカメラ識別(SCI: Photo Response Non-Uniformity)、JPEG圧縮アーティファクト分析、畳み込みニューラルネットワーク(CNN)の3つの手法の比較分析を行う。
本研究は,各手法をデバイス分類精度で評価し,実生活シナリオにおける手法の実装に必要な科学的発展について考察する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:42:44 GMT)
Entropy Flow and Exceptional-Point Structure in Two-Mode Squeezed-Bath Dynamics [0.0] 特異な相関関係において、スクイージングは*2次*でのみエントロピー生成を誘導することを示す。
このエントロピーフローには、リッチな非エルミート構造が伴っている。
本分析は,情報付加雑音が不可逆な振舞を誘導する自然環境として,圧縮された貯水池を定めている。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:49:30 GMT)
Entropic Dynamics approach to Quantum Electrodynamics [0.0] エントロピー力学(Entropic dynamics, ED)は、統計多様体の余接束上のハミルトン・キリングフローとして量子理論を導出することを可能にする枠組みである。
本稿では、EDフレームワークを局所ゲージ対称性に対処するために拡張する。
荷電粒子と相互作用する放射場の量子電磁力学を導出する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:51:36 GMT)
Entanglement-limited linear response in fermionic systems [0.0] 有限領域内の粒子数に結合した摂動に対する応答は、その領域の絡み合いエントロピーと同じ大きさのスケーリングを示す。
結果として、応答関数の絡み合ったスケーリングは、予期せぬ物理的結果をもたらす。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:53:16 GMT)
Enhancing low energy reconstruction and classification in KM3NeT/ORCA with transformers [0.0] 本研究は, 物理および検出器設計に着想を得た注目マスクを組み込むことにより, 変圧器の強度を生かした。
この研究は、ある構成から別の構成への微調整を行う際に、検出器間で貴重な情報を保持するためのトランスフォーマーの有効性も示している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:25:30 GMT)
Enhancing Cognitive Robotics with Commonsense through LLM-Generated Preconditions and Subgoals [0.0] 伝統的な象徴的なプランナーは、明示的に記述するために隠れた前提条件と小さなサブゴールが必要である。
このプロジェクトでは、大きな言語モデルとシンボリックプランニングを組み合わせています。
我々のシステムは、より有効な計画を作成し、より高いタスク成功率を達成し、環境の変化に適応する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:16:41 GMT)
Empathetic Cascading Networks: A Multi-Stage Prompting Technique for Reducing Social Biases in Large Language Models [0.0] Empathetic Cascading Networks (ECN) は、大規模言語モデルの共感的および包括的能力を高めるために設計されたフレームワークである。
ECNは、パースペクティブ導入、感情共鳴、反射的理解、統合的合成という4つの段階を採用し、感情的に共鳴し、文脈的に認識される応答を生成するためのモデルを導く。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 02:32:20 GMT)
Efficiency vs. Fidelity: A Comparative Analysis of Diffusion Probabilistic Models and Flow Matching on Low-Resource Hardware [0.0] Denoising Diffusion Probabilistic Models (DDPMs) は、生成画像合成における新しい最先端技術を確立した。
本研究では,新たなフローマッチングパラダイムに対するDDPMの比較分析を行った。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 18:19:42 GMT)
Dynamic Multi-Species Bird Soundscape Generation with Acoustic Patterning and 3D Spatialization [0.0] 鳥の歌は、急激な周波数変調のチャープ、複雑な振幅の封筒、独特な音響パターン、重なり合う呼び出し、鳥間の動的相互作用を含む。
既存のアプローチは通常、単一の種モデリング、静的呼び出し構造、記録から直接合成することに焦点を当てている。
DSPに基づくチャープ生成と3次元空間化を用いた動的多種鳥サウンドスケープを生成する新しいアルゴリズム駆動フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:25:55 GMT)
Dissecting the Ledger: Locating and Suppressing "Liar Circuits" in Financial Large Language Models [0.0] 大規模言語モデル(LLM)は、高額の金融ドメインにますますデプロイされている。
LLMは算術演算を行う際に特定の再現可能な幻覚に悩まされる。
内因性幻覚検出のための機械的アプローチを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 11:49:28 GMT)
Decoupling local classicality from classical explainability: A noncontextual model for bilocal classical theory and a locally-classical but contextual theory [0.0] バイロカル古典理論(doi.org103/PhysRevA.102.052216)のオントロジモデルを構築した。
理論全体のために存在論モデルが構築されたのはこれが二度目である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:16:56 GMT)
Data Flows and Colonial Regimes in Africa: A Critical Analysis of the Colonial Futurities Embedded in AI Ecosystems [0.0] この章は、アフリカの文脈におけるAIとビッグデータの要素的および目に見えない問題を説明することを目的としている。
この地域の新しいデジタル社会を再現するために、これらのサイトがAIレコメンデーションアルゴリズムを使用しているかについてのリフレクションを提示する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:31:50 GMT)
Comparative Analysis of LoRA-Adapted Embedding Models for Clinical Cardiology Text Representation [0.0] ドメイン固有のテキスト埋め込みは、臨床自然言語処理に不可欠である。
本研究では,低ランク適応を用いた10種類の変圧器型埋め込みモデルについて検討した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:57:09 GMT)
Clustering Approaches for Mixed-Type Data: A Comparative Study [0.0] 混在型データのクラスタリングは、このタスクに適合するアプローチがほとんどないため、課題である。
本研究は,これらの手法の現状を考察し,様々なシミュレーションモデルを用いて比較する。
KAMILA, LCM, k-prototypes は, 調整型ランドインデックス (ARI) に関して, 最高の性能を示した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:18:23 GMT)
Can LLMs Faithfully Explain Themselves in Low-Resource Languages? A Case Study on Emotion Detection in Persian [0.0] 大規模言語モデル(LLM)は、予測と並行して自己説明を生成するためにますます使用される。
本研究では,ペルシャ語における感情分類の文脈におけるLLM生成の説明の忠実性を評価する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:29:15 GMT)
Berry's phase on photonic quantum computers [0.0] 連続変数量子計算アルゴリズムを定式化し、ベリーの位相をフォトニック量子コンピュータ上で研究する。
CVQCは, 可逆的に変化する$vecB$場の影響を受け, 軌道角運動量を持つ荷電粒子のシミュレーションを可能にした。
Aharonov-Anandanサイクルを反対磁場に結合することにより、動的位相と非幾何学的誤差を対称性でキャンセルする回路を設計できることが示される。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:00:01 GMT)
BASICS: Binary Analysis and Stack Integrity Checker System for Buffer Overflow Mitigation [0.0] サイバー物理システムは私たちの日常生活において重要な役割を担い、電力や水などの重要なサービスを提供してきた。
従来の脆弱性発見技術は、Cプログラムのバイナリコードに直接適用する場合、スケーラビリティと精度に苦労する。
この研究は、モデルチェックとココリック実行技術を活用することによって、これらの制限を克服するために設計された新しいアプローチを導入している。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 20:11:41 GMT)
AttenDence: Maximizing Attention Confidence for Test Time Adaptation [0.0] テスト時間適応(TTA)は、モデルが推論時に分散シフトに適応できるようにする。
本稿では,CLSトークンから画像パッチへの注目分布のエントロピーを,新たなTTA目標として最小化することを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 09:32:01 GMT)
Atomic magnetometry based on the ground-state Hanle effect in an elliptically polarized light wave [0.0] 共振共振型偏光によるアルカリ金属蒸気照射における基底状態ハンル効果について検討した。
提案手法はゼロフィールド原子磁気センサの開発に有効である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:07:33 GMT)
Are Neuro-Inspired Multi-Modal Vision-Language Models Resilient to Membership Inference Privacy Leakage? [0.0] 本稿では,マルチモーダル視覚言語モデル(VLM)に対するブラックボックスプライバシ攻撃について検討する。
本稿では,MM VLMのレジリエンスをプライバシ攻撃に対して解析するための,神経科学にヒントを得たトポロジカル正規化フレームワークを提案する。
以上の結果から,神経性VLMはプライバシ攻撃に対して比較的耐性が高いが,モデルの有用性は著しくは向上していない。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:32:03 GMT)
An Adaptive, Data-Integrated Agent-Based Modeling Framework for Explainable and Contestable Policy Design [0.0] マルチエージェントシステムはフィードバック、適応、非定常性の下で運用されることが多い。
本稿では,一般適応型マルチエージェント学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 21:41:45 GMT)
Agint: Agentic Graph Compilation for Software Engineering Agents [0.0] Agintはエージェントグラフコンパイラ、インタプリタ、ランタイムである。
自然言語命令を型付きエフェクト対応コードDAGに変換する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:10:47 GMT)
Adversarial Patch Attacks on Vision-Based Cargo Occupancy Estimation via Differentiable 3D Simulation [0.0] 本研究では, 完全にシミュレーションされた3次元環境を用いて, 畳み込み型貨物乗員分類器への攻撃の可能性について検討した。
実験により, 3次元最適化パッチは特にサービス拒否シナリオにおいて, 高い攻撃成功率を達成することが示された。
これは、物理的に現実的で、完全にシミュレートされた3Dシーンにおける、貨物乗員推定のための敵のパッチ攻撃を調査する最初の研究である。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 16:05:40 GMT)
Active Inference is a Subtype of Variational Inference [0.0] 我々はEFE最小化を変分推論として再キャストし、正式にプランニング・アズ・推論と統合し、ドライブをユニークなエントロピー的貢献として示す理論を構築した。
我々の主な貢献は、この統一目的のための新しいメッセージパス方式であり、分解状態のMDPにおけるスケーラブルなアクティブ推論を可能にし、高次元プランニングの難しさを克服する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 10:14:09 GMT)
Accuracy and Efficiency Trade-Offs in LLM-Based Malware Detection and Explanation: A Comparative Study of Parameter Tuning vs. Full Fine-Tuning [0.0] Low-Rank Adaptation (LoRA) fine-tuned Large Language Models (LLMs) は、人間の解釈可能な決定とマルウェア分類の説明を生成する際に、完全に微調整されたモデルの性能を近似することができる。
LoRAは、解釈可能性とリソース効率の現実的なバランスを提供し、説明品質を犠牲にすることなく、リソースに制約のある環境へのデプロイを可能にする。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 19:37:13 GMT)
AIRHILT: A Human-in-the-Loop Testbed for Multimodal Conflict Detection in Aviation [0.0] AIRHILT(Aviation Integrated Reasoning, Human-in-the-Loop Testbed)を紹介する。
航空機の衝突検知のためのマルチモーダルパイロットおよび航空交通制御支援システムを評価するために設計されたモジュール式軽量なシミュレーション環境。
オープンソースのGodotエンジン上に構築されたAIRHILTは、パイロットとATC無線通信、カメラストリームからの視覚的シーン理解、統合されたプラットフォーム内のADS-B監視データを同期する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 03:18:55 GMT)
A demonstration that classical gravity does not produce entanglement [0.0] 提案された量子情報理論実験の解釈に関して論争が起こった。
この混乱は、ハミルトニアン形式主義の解釈的応用に存在するようである。
ニュートン・カルタン解析により、重力が古典的であると、媒介者、絡み合いがGIE実験の結果として観察されることが示された。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 15:52:57 GMT)
A Set of Rules for Model Validation [0.0] データ駆動モデルの検証は、関心の集団において、新しい、目に見えないデータに一般化するモデルの能力を評価するプロセスである。
本稿では,モデル検証のための一般的なルールセットを提案する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 22:42:52 GMT)
A Robust State Filter Against Unmodeled Process And Measurement Noise [0.0] 本稿では,プロセスと測定ノイズの両面において,ロバストな状態推定を実現するための新しいKalmanフィルタフレームワークを提案する。
Weighted Observation Likelihood Filter (WoLF) にインスパイアされ, 一般ベイズ法を適用し, プロセスおよび測定ノイズの外れ値の両方を考慮した枠組みを構築した。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 14:25:13 GMT)
A Reproducible Framework for Neural Topic Modeling in Focus Group Analysis [0.0] ニューラルトピックモデリングを適用してグループ転写に焦点を合わせるための、厳密で再現可能なフレームワークを提案する。
チュニジアにおけるHPVワクチンの認識を探索する10の焦点群(1,076発)にBERTopicを適用し,系統的評価を行った。
我々のフレームワークは、研究者が自身の質的な研究状況に適応できる実践的なガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 24 Nov 2025 07:30:15 GMT)