FeRA: Frequency-Energy Constrained Routing for Effective Diffusion Adaptation Fine-Tuning [124.6] FeRAは、効果的な拡散適応微調整のための包括的な周波数エネルギーの枠組みを確立する。
アダプタベースのチューニングスキームとシームレスに統合され、拡散バックボーンと解像度にわたってうまく一般化される。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:46:18 GMT)
MambaTAD: When State-Space Models Meet Long-Range Temporal Action Detection [94.1] 本稿では,長距離モデリングとグローバル機能検出機能を導入した新しい状態空間TADモデルであるMambaTADを提案する。
MambaTADは、複数の公開ベンチマークで一貫して優れたTAD性能を達成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:04:29 GMT)
VITAL: Vision-Encoder-centered Pre-training for LMMs in Visual Quality Assessment [88.8] 本稿では,視覚エンコーダを中心とした生成事前学習パイプラインを提案し,VITAL-Series LMMを開発した。
これまでで最大のVQualAトレーニングデータセットである、450万以上の視覚言語(VL)ペアを構築した。
モデルの定量的スコアリング精度を同時に向上するマルチタスクトレーニングワークフローを採用している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:55:21 GMT)
X-ReID: Multi-granularity Information Interaction for Video-Based Visible-Infrared Person Re-Identification [79.4] 本稿では,VVI-ReIDのためのX-ReIDという新しいクロスモーダル特徴学習フレームワークを提案する。
具体的には、まずクロスモダリティプロトタイプコラボレーション(CPC)を提案する。
次に, 隣接フレームからの短期的相互作用, 長期的クロスフレーム情報融合, クロスモダリティ特徴アライメントを組み込んだMII(Multi-granularity Information Interaction)を設計する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:57:15 GMT)
Tracking and Segmenting Anything in Any Modality [75.3] そこで我々はSATAという汎用的なトラッキング・セグメンテーション・フレームワークを提案し、このフレームワークは任意のモダリティ入力でトラッキング・セグメンテーション・サブタスクの広帯域を統一する。
SATAは18の挑戦的なトラッキングとセグメンテーションベンチマークで優れたパフォーマンスを示し、より一般化可能なビデオ理解のための新しい視点を提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:09:22 GMT)
CADTrack: Learning Contextual Aggregation with Deformable Alignment for Robust RGBT Tracking [68.7] RGB-Thermal (RGBT) トラッキングは、堅牢な全天候物体追跡のために可視および熱赤外モードを活用することを目的としている。
既存のRGBTトラッカーはモダリティの相違を解決するのに苦労している。
RGBT追跡のためのCADTrackと呼ばれる,変形可能なアライメントによるコンテキストアグリゲーション(Contextual Aggregation)を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:10:02 GMT)
Towards Effective, Stealthy, and Persistent Backdoor Attacks Targeting Graph Foundation Models [62.9] Graph Foundation Models(GFM)は、さまざまなソースドメインで事前トレーニングされ、目に見えないターゲットに適応する。
GFMに対するバックドア攻撃は、3つの主要な課題のために簡単ではない。
グラフ基礎モデルに対する新たなバックドア攻撃モデルであるGFM-BAを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:52:09 GMT)
Consolidating Diffusion-Generated Video Detection with Unified Multimodal Forgery Learning [61.4] 既存の手法は主に画像レベルの偽造検出に重点を置いており、一般的なビデオレベルの偽造検出はほとんど探索されていない。
本稿では,拡散生成ビデオの検出に特化して設計したMM-Det++という統合マルチモーダル検出手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:05:12 GMT)
Comparing Labeled Markov Chains: A Cantor-Kantorovich Approach [53.7] 最近導入されたカントール・カントロビッチ距離(CK)について検討した。
特に、後者は有限水平全変動距離の割引和として表すことができる。
より正確には、CK距離の正確な計算は#P-hardである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:02:56 GMT)
VCU-Bridge: Hierarchical Visual Connotation Understanding via Semantic Bridging [49.6] 視覚的意味理解の人間的な階層を運用するフレームワークであるVCU-Bridgeを提案する。
このフレームワーク上に構築したHVCU-Benchは、階層的視覚的意味理解のためのベンチマークであり、明確なレベルの診断を行う。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:01:03 GMT)
scipy.spatial.transform: Differentiable Framework-Agnostic 3D Transformations in Python [49.0] 三次元剛体変換、すなわち回転と変換は、現代の微分可能な機械学習パイプラインの中心である。
SciPyのspace.moduleは厳格にテストされたPython実装である。
我々は、Python配列APIを実装するどんな配列ライブラリとも互換性のある機能であるSciPyの空間.を全面的にオーバーホールする。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:52:34 GMT)
MambaX: Image Super-Resolution with State Predictive Control [48.8] Mambaは、再構築プロセス全体を複数のノードによる状態シーケンスとして表現し、中間的介入を可能にする、有望なアプローチとして登場した。
我々は、連続するスペクトル帯域を潜在状態空間にマッピングする非線形状態予測制御モデル textbfMambaX を作成し、制御方程式の非線形状態パラメータを動的に学習することでSRタスクを一般化した。
本評価では, 単一像SRと多モード融合型SRの両タスクにおいて, 動的スペクトル状態表現モデルの優れた性能を示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 11:44:09 GMT)
L2V-CoT: Cross-Modal Transfer of Chain-of-Thought Reasoning via Latent Intervention [47.8] Chain-of-Thought (CoT)推論は、大規模言語モデル(LLM)の機能を大幅に強化した。
既存のアプローチでは、高いトレーニングコストが必要か、アーキテクチャアライメントが必要になります。
L2V-CoTは,LLMからVLMへCoT推論を伝達する新しい訓練不要潜伏介入手法である。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 04:25:25 GMT)
Towards Efficient LLM-aware Heterogeneous Graph Learning [47.4] ヘテロジニアスグラフのための効率的なLLM-Awareフレームワークを提案する。
提案するELAは,性能と効率において最先端の手法より優れている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:38:03 GMT)
Accelerating Time Series Foundation Models with Speculative Decoding [47.0] 大規模トランスフォーマーベースのモデルは、時系列予測において最先端のパフォーマンスを達成したが、高い計算コストに悩まされている。
本稿では、投機的復号化を自己回帰時系列モデルに適応させる一般的な推論加速フレームワークを提案する。
我々のアプローチでは、より小さな"ドラフト"モデルを用いて、将来の時系列パッチを提案し、さらに大きな"ターゲット"モデルによって並列に検証する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:04:57 GMT)
CompTrack: Information Bottleneck-Guided Low-Rank Dynamic Token Compression for Point Cloud Tracking [43.9] LiDARポイントクラウドにおける3Dオブジェクトトラッキングは、コンピュータビジョンと自律運転において重要なタスクである。
成功をおさめたにもかかわらず、ポイントクラウドの本質的な分散性は、二重冗長性の問題をもたらす。
我々は、ポイントクラウドにおける両方の冗長性を体系的に排除する、新しいエンドツーエンドフレームワークであるCompTrackを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:51:00 GMT)
Signal: Selective Interaction and Global-local Alignment for Multi-Modal Object Re-Identification [43.8] ReID(Multi-modal object Re-IDentification)は、補完的なマルチモーダル画像情報を利用して特定のオブジェクトを検索する。
マルチモーダルオブジェクトReIDのためのSignalと呼ばれる,新たな選択的相互作用とグローバルなアライメントフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:58:46 GMT)
Synthesizing Precise Protocol Specs from Natural Language for Effective Test Generation [42.6] AutoSPECは平均92.8%のクライアントと80.2%のサーバメッセージタイプを回復し、81.5%のメッセージ受信を現実世界のシステムで行う。
プロトタイプは, 広く用いられている5種類のアプローチの実現可能性を示した。
インターネットベースのプロトコル。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:39:52 GMT)
PA-FAS: Towards Interpretable and Generalizable Multimodal Face Anti-Spoofing via Path-Augmented Reinforcement Learning [42.2] Face Anti-Spoofing (FAS) は、最近マルチモーダル融合、クロスドメイン一般化、解釈可能性において進歩している。
本稿では,限定アノテーションから高品質な拡張推論シーケンスを構築することにより推論経路を向上させるPA-FASを提案する。
また,SFT中の回答シャッフル機構を導入し,表面的な手がかりを使わずに総合的なマルチモーダル解析を強制する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:55:08 GMT)
SciEducator: Scientific Video Understanding and Educating via Deming-Cycle Multi-Agent System [42.2] SciEducatorは、科学ビデオ理解と教育のための自己進化型マルチエージェントシステムである。
我々のデザインは、プラン-Do-Study-Actの哲学を自己進化的推論とフィードバックのメカニズムに再構成する。
特定の科学的プロセスに合わせて、マルチモーダルな教育コンテンツを作成できる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:54:16 GMT)
Augmented Assembly: Object Recognition and Hand Tracking for Adaptive Assembly Instructions in Augmented Reality [40.8] オブジェクト認識とハンドトラッキングを活用するAR支援アセンブリワークフローを提案する。
オブジェクト認識を用いて、リアルタイムでコンポーネントを検出し、ローカライズし、ワークスペースのデジタルツインを作成する。
LEGOブロックとカスタム3Dプリントコンポーネントを使ったケーススタディでは、システムがデジタル命令を物理的なアセンブリにリンクする方法が示されています。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 22:49:40 GMT)
Principled Context Engineering for RAG: Statistical Guarantees via Conformal Prediction [40.3] Retrieval-Augmented Generation (RAG)は、大規模言語モデルにおける現実的な基盤を強化する。
既存の前世代のフィルターは信頼性のスコアに依存しており、保持された証拠に対する統計的制御を提供していない。
本研究では,コンフォメーション予測によるコンテキスト工学の実証を行う。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 04:17:06 GMT)
WavefrontDiffusion: Dynamic Decoding Schedule or Improved Reasoning [39.6] 本稿では,アクティブトークンのウェーブフロントを最終位置から外へ拡張する動的デコード手法であるWavefrontDiffusionを提案する。
推論とコード生成の4つのベンチマークで、WavefrontDiffusionは最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:33:00 GMT)
On a Reinforcement Learning Methodology for Epidemic Control, with application to COVID-19 [39.1] コンパートメンタル流行モデルと逐次ベイズ推論と強化学習コントローラを組み合わせる。
モンテカルログリッドサーチにより計算されたICUしきい値ルールと、後進平均Q学習エージェントに基づくポリシーの2つのRLポリシーについて検討する。
本枠組みは、イングランドのCOVID-19パンデミックのICU占有データに、この流行モデルを適用して検証する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:23:27 GMT)
Plan-X: Instruct Video Generation via Semantic Planning [36.0] Plan-Xは、ビデオ生成プロセスを指示するための高レベルのセマンティックプランニングを明示的に実施するフレームワークである。
本フレームワークは視覚幻覚を著しく低減し,マルチモーダルコンテキストに整合した細粒度な命令整列映像生成を可能にする。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:59:09 GMT)
Spotlight: Identifying and Localizing Video Generation Errors Using VLMs [34.2] ビデオ生成エラーのローカライズと説明を目的とした新しいタスクであるSpotlightを紹介する。
200のテキストプロンプトと3つの最先端のビデオジェネレータを使って600の動画を生成する。
動作、物理、即効性を含む6つのタイプにまたがる1600以上のきめ細かなエラーを注釈します。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:55:30 GMT)
Towards Automating Data Access Permissions in AI Agents [33.4] 我々はAIエージェントのための自動パーミッション管理を提案する。
鍵となる考え方は、ユーザの許可決定に影響を与える要因を特定するために、ユーザスタディを実施することである。
本研究では,全精度85.1%,高信頼度予測94.4%のパーミッション予測モデルを開発した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:50:43 GMT)
Token-Controlled Re-ranking for Sequential Recommendation via LLMs [32.6] CORECは、新しいトークン拡張されたリグレードフレームワークで、レコメンデーション結果の作成に特定のユーザー要求を取り入れている。
CORECは、明示的な属性ベースの信号を通じて、正確なフレキシブルなコントロールで検索結果を再ランク付けすることを可能にする。
実験により、CORECは標準推奨の有効性に関する最先端のベースラインを超えていることが示されている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 04:31:19 GMT)
RoadBench: Benchmarking MLLMs on Fine-Grained Spatial Understanding and Reasoning under Urban Road Scenarios [30.7] マルチモーダルな大言語モデル (MLLM) は、一般的な空間的理解と推論において強力な能力を示している。
RoadBenchはMLLMの詳細な空間的理解と推論能力を総合的に評価するベンチマークである。
RoadBenchは、都市シナリオにおける既存のMLLMのきめ細かい空間的理解と推論能力の重大な欠点を明らかにしている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:23:44 GMT)
V2X-RECT: An Efficient V2X Trajectory Prediction Framework via Redundant Interaction Filtering and Tracking Error Correction [30.2] V2X-RECTは高密度環境向けに設計された軌道予測フレームワークである。
データアソシエーションの一貫性を高め、冗長なインタラクションを減らし、履歴情報を再利用して、より効率的で正確な予測を可能にする。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:50:47 GMT)
UniRSCD: A Unified Novel Architectural Paradigm for Remote Sensing Change Detection [29.2] 変更検出タスクは、バイナリ変更、災害評価、SCD、BDAなど、出力の粒度が異なるものが存在する。
既存の方法は、異なるタスクをエンコードする際の情報損失を補う特別なデコーダを設計するために、かなりの知識を必要とする。
本論文では,UniCDと命名された汎用的な変更検出アーキテクチャを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:05:01 GMT)
Spectral Super-Resolution Neural Operator with Atmospheric Radiative Transfer Prior [28.3] スペクトル超解像(SSR)は、マルチスペクトル観測から超スペクトル像(HSI)を再構成することを目的としている。
データ駆動方式は広く使われているが、しばしば物理的原理を見落とし、非現実的なスペクトルを生み出す。
本研究では,大気放射移動(ART)をデータ駆動方式に組み込んだ分光超解像ニューラル演算子(SSRNO)を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:58:03 GMT)
Multi-Aspect Cross-modal Quantization for Generative Recommendation [27.9] 生成レコメンデーション(MACRec)のための多視点クロスモーダル量子化を提案する。
まず、ID学習過程において、競合率を効果的に低減するクロスモーダル量子化を導入する。
また、暗黙のアライメントや明示的なアライメントを含むマルチアスペクトのクロスモーダルアライメントも組み込んでいます。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:07:19 GMT)
Privacy Auditing of Multi-domain Graph Pre-trained Model under Membership Inference Attacks [27.9] 我々は,マルチドメイングラフ事前学習モデルに対するメンバシップ推論攻撃のためのフレームワークであるMGP-MIAを提案する。
まず,対象モデルのオーバーフィット特性を増幅するメンバシップ信号増幅機構を提案する。
次に、限られたシャドウグラフを持つ信頼性のあるシャドウモデルを構築するインクリメンタルシャドウモデル構築機構を設計する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:04:58 GMT)
RAISECity: A Multimodal Agent Framework for Reality-Aligned 3D World Generation at City-Scale [27.6] RAISECityはtextbfReality-textbfAligned textbfIntelligent textbfSynthesis textbfEngineで、詳細なtextbfCityスケールの3Dワールドを作成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:09:22 GMT)
SD-PSFNet: Sequential and Dynamic Point Spread Function Network for Image Deraining [27.6] 画像劣化過程を明らかにするためのポイントスプレッド機能(PSF)機構を提案する。
SD-PSFNetは,3段階の逐次復元アーキテクチャを採用している。
我々はRain100H (33.12dB/0.9371)、RealRain-1k-L (42.28dB/0.9872)、RealRain-1k-H (41.08dB/0.9838)の最先端PSNR/SSIM測定値を得る。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:21:27 GMT)
Measuring the Impact of Lexical Training Data Coverage on Hallucination Detection in Large Language Models [26.9] 大規模言語モデル(LLM)における幻覚は、特にオープンドメインの質問応答において、根本的な課題である。
これまでの研究は、トークンレベルのエントロピーや生成一貫性といったモデル内部信号による幻覚の検出を試みた。
本研究では,データカバレッジ自体が検出信号として機能するかどうかを検討する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:59:55 GMT)
Novel View Synthesis from A Few Glimpses via Test-Time Natural Video Completion [26.7] 我々は,この課題を,エフェクト時間自然映像の完成として再放送し,エンフェスト付きビデオ拡散モデルからの先行情報を用いて,両立可能な視界を幻覚させる。
提案手法は, 極端に親和性が高い3D-GSベースラインを著しく上回る。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:08:29 GMT)
Test-Time Temporal Sampling for Efficient MLLM Video Understanding [26.1] Test-Time Temporal Sampling (T3S) は、MLLMが効率よくかつ効果的に長編ビデオを処理できるトレーニングフリーのプラグアンドプレイ推論ラッパーである。
我々の手法は推論時に完全に動作し、モデル修正や微調整は不要であり、幅広い事前訓練されたMLLMと互換性がある。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:59:21 GMT)
SFHand: A Streaming Framework for Language-guided 3D Hand Forecasting and Embodied Manipulation [25.9] SFHandは、言語誘導の3Dハンド予測のための最初のストリーミングフレームワークである。
SFHandは、将来の3Dハンドステートの包括的なセットを自動回帰予測する。
EgoHaFLは、同期した3Dハンドポーズと言語命令を備えた最初の大規模データセットである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:22:24 GMT)
Curvature-Aware Safety Restoration In LLMs Fine-Tuning [25.4] 下流タスクのための微調整大型言語モデル(LLM)は、しばしば安全性を損なう。
影響関数と2階最適化を利用する曲率対応アライメント復元法を提案する。
提案手法は, 実用性を維持しつつ, 学習性能を向上しながら, 有害な応答を効率的に低減する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:33:31 GMT)
Nested Unfolding Network for Real-World Concealed Object Segmentation [25.4] 隠れオブジェクトセグメンテーションのためのネスト展開ネットワーク(NUN)を提案する。
NUNはセグメンテーション指向アンフォールディングネットワーク(SODUN)の各段階に分解耐性アンフォールディングネットワーク(DeRUN)を組み込む
実験では、NUNはクリーンなベンチマークと劣化したベンチマークの両方において主要な位置を占めます。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:25:48 GMT)
Video4Edit: Viewing Image Editing as a Degenerate Temporal Process [24.9] マルチモーダル基礎モデルは、命令駆動の画像生成と編集を真にクロスモーダルで協調的な体制に推進した。
我々は、時間モデリングのレンズを通してこの課題を再考する。
この視点は、ビデオ事前学習から単一フレームの進化を先取りし、非常にデータ効率のよい微調整体制を実現する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:30:55 GMT)
Pistachio: Towards Synthetic, Balanced, and Long-Form Video Anomaly Benchmarks [24.4] Pistachioは、コントロールされた世代ベースのパイプラインで完全に構築された、新しいVAD/VAUベンチマークである。
パイプラインには,シーン条件の異常割当,複数ステップのストーリーライン生成,時間的に一貫した長周期合成戦略が組み込まれている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:37:21 GMT)
State and Scene Enhanced Prototypes for Weakly Supervised Open-Vocabulary Object Detection [23.8] 既存のセマンティックプロトタイプは、異なるオブジェクト状態によって引き起こされる豊富なクラス内の視覚的バリエーションをキャプチャできない。
標準的な擬似ボックス生成は、視覚領域の提案とオブジェクト中心のテキスト埋め込みのセマンティックなミスマッチを導入する。
セマンティック・プロトタイプ(SESP)とSAPP(Scene-Augmented Pseudo Prototypes)を導入し,セマンティック・ミスマッチに対処する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:25:19 GMT)
Continually Evolving Skill Knowledge in Vision Language Action Model [23.6] オープン環境における汎用ロボットインテリジェンスの開発には,継続的なスキル学習が必要である。
本稿では,タスク中心の知識空間をモデル化するT-Stellarと,階層的なタスクスキル構造を捉えるTS-Stellarという,知識駆動型連続学習フレームワークであるStellar VLAを提案する。
LIBEROベンチマークと実世界のタスクの実験は、ベースラインに対する最終成功率の平均50%以上の改善を示している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:00:08 GMT)
Multi-speaker Attention Alignment for Multimodal Social Interaction [23.6] ビデオにおける社会的相互作用は、言語的および非言語的手がかりの動的相互作用に関する推論を必要とする。
MLLM(Multimodal Large Language Models)は自然の候補であるが、視覚的な入力を追加するだけで、社会的タスクにおいて驚くほど不整合的な利得が得られる。
本稿では,既存のMLLMに組み込むマルチモーダル多話者アライメント手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:35:47 GMT)
EgoControl: Controllable Egocentric Video Generation via 3D Full-Body Poses [23.5] 我々は,映像予測モデルをトレーニングし,3次元ボディポーズシーケンスに将来のフレーム生成を条件付ける。
本稿では,グローバルカメラのダイナミックスと体の動きを捉える新しいポーズ表現を提案する。
EgoControlは高品質でポーズ一貫性のあるエゴセントリックなビデオを制作する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:56:39 GMT)
Switch-JustDance: Benchmarking Whole Body Motion Tracking Policies Using a Commercial Console Game [23.3] ロボット全体の制御を評価するために,低コストで再現可能なベンチマークパイプラインであるSwitch-JustDanceを提案する。
まず、Just Danceの評価特性を評価し、その信頼性、妥当性、感度、潜在的なバイアス源を分析した。
我々は、ハードウェア上で3つの最先端のヒューマノイド全体コントローラをベンチマークし、その相対的な強度と限界について洞察を提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:40:52 GMT)
Together, Then Apart: Revisiting Multimodal Survival Analysis via a Min-Max Perspective [22.6] この研究は、アライメントと特徴性の二重レンズによる多モードサバイバル分析を再考する。
We introduced Together-Then-Apart, a unified min-max optimization framework that simultaneously models shared and modality-specific representations。
我々の定式化は、堅牢で、解釈可能で、生物学的に有意義なマルチモーダルサバイバル分析において、アライメントと特異性をどのように共同で達成できるかという新しい理論的視点を提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:10:46 GMT)
Frequency-Adaptive Sharpness Regularization for Improving 3D Gaussian Splatting Generalization [22.2] 3DGSは、スパース観測に過度に適合するため、いくつかのシナリオにおいて、新しい視点での一般化を欠いている。
本稿では,周波数適応型シャープネス規則化(FASR)を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:04:46 GMT)
Beyond Jailbreak: Unveiling Risks in LLM Applications Arising from Blurred Capability Boundaries [22.1] 本稿では,新しい開発パラダイムを体系的に分析し,LLMアプリケーション機能空間の概念を定義した。
また、現実のシナリオにおける曖昧な機能境界から生じる、脱獄以外の潜在的な新たなリスクも発見しました。
15以上のシナリオからタスクを実行するか、悪意のある178のアプリケーションを特定しました。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:09:49 GMT)
Cost-Sensitive Conformal Training with Provably Controllable Learning Bounds [21.9] コンフォーマル予測は、機械学習モデルの予測の不確実性を定量化するフレームワークである。
CPが測定した不確実性を調整するため、共形学習法は予測セットのサイズを最小化する。
本稿では,インジケータ近似機構に依存しない簡易なコスト依存型コンフォメーショントレーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 01:11:44 GMT)
Active Learning with Selective Time-Step Acquisition for PDEs [21.8] PDEサロゲートモデリングにおけるアクティブラーニング(AL)のための新しいフレームワークを提案する。
PDEトラジェクトリ全体を取得するPDEの既存のALメソッドとは異なり、我々のアプローチは戦略的に最も重要な時間ステップしか生成しない。
いくつかのベンチマークPDEにおいて,本手法の有効性を示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:16:08 GMT)
Understanding Private Learning From Feature Perspective [21.6] 個人差分勾配Descent(DP-SGD)は、プライバシ保護機械学習に不可欠なものとなっている。
本稿では,機能学習の観点から,私的トレーニングを解析するための最初の理論的枠組みを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:09:46 GMT)
UnfoldLDM: Deep Unfolding-based Blind Image Restoration with Latent Diffusion Priors [21.4] そこで我々は,UnfoldLDMを提案し,深部展開ネットワークと潜時拡散モデル(LDM)を統合してブラインド画像復元を行う。
各段階において、UnfoldLDMは勾配降下ステップとして多粒度劣化認識モジュール(MGDA)を用いる。
本研究では, 劣化抑制型LCM (DR-LDM) を設計し, コンパクトな劣化不変前駆体を抽出する。
このユニークな組み合わせは、最終的な結果が劣化のない、視覚的に豊かなものであることを保証します。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:44:01 GMT)
Muskie: Multi-view Masked Image Modeling for 3D Vision Pre-training [21.1] Muskieは、3Dビジョンタスク用に設計された、ネイティブなマルチビューバックボーンビジョンである。
Muskieは複数のビューを同時に処理し、事前トレーニング段階に複数ビューの一貫性を導入するように設計されている。
Muskieをバックボーンとして使用すると、下流3Dタスクのパフォーマンスが継続的に向上することを示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:39:59 GMT)
CoordAR: One-Reference 6D Pose Estimation of Novel Objects via Autoregressive Coordinate Map Generation [20.5] CoordARは、一参照6Dポーズ推定のための新しい自動回帰フレームワークである。
1) 離散化された3次元空間上での確率的予測を可能にする新しい座標マップのトークン化,2) RGBの外観と座標キューを別々に符号化するモダリティデカップリング符号化戦略,3) 両方の位置整列クエリ特徴に条件付き自己回帰変換器デコーダを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:25:12 GMT)
Hierarchical Semi-Supervised Active Learning for Remote Sensing [20.3] 半教師付き学習(SSL)と新しい階層型アクティブ学習(HAL)を統合した階層型半教師付きアクティブラーニング(HSSAL)フレームワークを提案する。
各イテレーションでSSLは、教師付き学習と弱い自己学習を通じてラベル付きデータとラベルなしデータの両方を使用してモデルを洗練し、特徴表現の改善と不確実性推定を行う。
UCM、AID、NWPU-RESISC45を含む3つのベンチマークRSシーン分類データセットの実験は、HSSALがSSLまたはALのみのベースラインを一貫して上回ることを示した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:25:42 GMT)
Transformers with RL or SFT Provably Learn Sparse Boolean Functions, But Differently [20.1] 強化学習(RL)と教師付き微調整(SFT)は、この目的に対する2つの主要なアプローチであるが、その基盤となるメカニズムと違いは理論的に不明である。
変換器をRLまたはSFTでCoTで微調整する学習力学を解析し,これらの関数を確実に学習するのに十分な条件を同定する。
RLはCoTチェーン全体を同時に学習し、SFTはCoTチェーンをステップバイステップで学習する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:38:43 GMT)
Alpha Divergence Losses for Biometric Verification [19.8] 差分損失関数($-divergence loss function)は、マージンベースのソフトマックス損失に対して魅力的な代替手段であることを示す。
Q-MarginとA3Mの2つの新しいマージンベースの$-divergence損失を導出する。
我々のモデルは、低い偽受け入れ率で強いベースラインを著しく上回ります。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:17:38 GMT)
FAST: Topology-Aware Frequency-Domain Distribution Matching for Coreset Selection [19.1] コアセット選択はデータセットをコンパクトで代表的なサブセットに圧縮し、ディープニューラルネットワークをトレーニングする際のエネルギーと計算負担を軽減する。
DNNフリーな分散マッチングコアセット選択フレームワークであるFASTを提案する。
FASTは評価された全てのベンチマークで最先端のコアセット選択法を著しく上回り、平均精度は9.12%向上した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:24:57 GMT)
Early Lung Cancer Diagnosis from Virtual Follow-up LDCT Generation via Correlational Autoencoder and Latent Flow Matching [18.2] 臨床実践では、リスクの高い患者は、最初のベースラインといくつかの年次経過観察を行う必要がある。
近年, 肺癌の早期診断に人工知能(AI)法が用いられている。
本稿では,CorrFlowNetと名づけられた生成手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:40:05 GMT)
Vector Arithmetic in Concept and Token Subspaces [17.3] Llama-2-7bにおけるコヒーレントなセマンティック構造を示すモデルアクティベーションのサブスペースを同定するために,概念ヘッドが利用できることを示す。
概念ヘッドの注意重みを用いて隠蔽状態を変換すると、より正確にパラレルグラム演算を行うことができる。
トークンヘッドは、隠れた状態における表面レベルの単語情報を明らかにする変換を可能にすることを示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:21:13 GMT)
CUS-GS: A Compact Unified Structured Gaussian Splatting Framework for Multimodal Scene Representation [16.9] CUS-GSはコンパクトな統一型ガウススプティング表現である。
本稿では,アンカーの生育と刈り取りをガイドするための特徴認識重要度評価戦略を提案する。
CUS-GSは6Mパラメータしか使用しない最先端の手法と比較して、競争性能が向上する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 03:42:49 GMT)
AnimAgents: Coordinating Multi-Stage Animation Pre-Production with Human-Multi-Agent Collaboration [16.8] アニメーション・プレプロダクションは、初期概念をアイデア、スクリプティング、デザイン、ストーリーボードといった、相互依存のステージにまたがるコヒーレントな青写真に変換することで、アニメーション映画の基盤を築いている。
生成AIツールは、このプロセスでますます採用されているが、それらは分離され続けており、クリエイターはワークフローを統合せずに複数のシステムをジャグリングする必要がある。
クリエーターは、断片化されたアウトプットを手作業で調整し、大量の情報を管理し、ステージ間の連続性と創造的なコントロールを維持するのに苦労する必要があります。
これらの知見に基づいて、人間とマルチエージェントの協調システムAnimAgentsを提示する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 04:03:32 GMT)
FastMMoE: Accelerating Multimodal Large Language Models through Dynamic Expert Activation and Routing-Aware Token Pruning [16.8] マルチモーダル・大規模言語モデル (MLLM) は優れた性能を達成しているが、高解像度の視覚入力は視覚トークンの長いシーケンスと相当な推論遅延をもたらす。
冗長なビジュアルトークンの削減は、パフォーマンスを維持しながら計算/メモリの負担を軽減するために重要であり、リソース制約やレイテンシに敏感なシナリオでのMLLMデプロイメントを可能にする。
本稿では,Fast Multimodal Mixture-of-Experts (FastMMoE)を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:25:00 GMT)
Alignment Faking - the Train -> Deploy Asymmetry: Through a Game-Theoretic Lens with Bayesian-Stackelberg Equilibria [16.5] アライメント・フェイキング(Alignment faking)は、AIにおける戦略的な騙しの一形態である。
モデルは、トレーニング中のことを推測するときに、トレーニング目標に選択的に準拠する。
私たちのゴールは、アライメントの流行の原因とそれがいつ起こるかを特定することです。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:30:51 GMT)
Enhancing Automated Program Repair via Faulty Token Localization and Quality-Aware Patch Refinement [16.0] TokenRepairは、プログラム修復のための新しい2段階の洗練フレームワークである。
内部リフレクションを統合して、潜在的な欠陥のあるトークンをローカライズし、外部からのフィードバックで品質を意識したパッチ修正を行う。
TokenRepairは、Defects4J 1.2の88のバグとHumanEval-Javaの139のバグを正しく修正することで、最先端の修復パフォーマンスを新たに達成している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:05:26 GMT)
MobileVLA-R1: Reinforcing Vision-Language-Action for Mobile Robots [15.9] MobileVLA-R1は視覚言語アクションフレームワークで、四足歩行ロボットの明確な推論と連続制御を可能にする。
本研究では,教師付きCoTアライメントとGRPO強化学習を組み合わせた2段階学習パラダイムを導入し,推論の整合性,制御安定性,長期実行を向上する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:34:10 GMT)
MVS-TTA: Test-Time Adaptation for Multi-View Stereo via Meta-Auxiliary Learning [15.3] MVS-TTAは学習に基づくMVS手法のための効率的なテスト時間適応フレームワークである。
補助タスクベースの更新を明示的に活用するために,モデルのトレーニングを行うメタ補助学習戦略を導入する。
我々のフレームワークはモデルに依存しないため、最小限のアーキテクチャ変更で広範囲のMVSメソッドに適用できる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:52:47 GMT)
Extracting Interaction-Aware Monosemantic Concepts in Recommender Systems [15.1] 本稿では,コヒーレントで解釈可能な概念と整合する潜在次元として定義される扁桃体ニューロンの抽出法を提案する。
提案手法はスパースオートエンコーダを用いて,事前学習された表現のセマンティック構造を明らかにする。
提案手法は,様々なレコメンデーションモデルとデータセットをまたがって一般化し,解釈可能なパーソナライゼーションと制御可能なパーソナライズのための実用的なツールを提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 11:27:32 GMT)
Fidelity-Aware Recommendation Explanations via Stochastic Path Integration [14.3] 説明の正確さは、モデルの真の推論をいかに正確に反映しているかを測るが、レコメンデーションシステムでは重要な過小評価が残されている。
本稿では,SPINRecを提案する。SPINRecはモデルに依存しない手法で,経路積分の手法を推薦データのスパースで暗黙的な性質に適応させる手法である。
SPINRecは、すべてのベースラインを一貫して上回り、推奨の忠実な説明可能性のための新しいベンチマークを確立している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:59:04 GMT)
ActDistill: General Action-Guided Self-Derived Distillation for Efficient Vision-Language-Action Models [14.2] 本稿では,既存のVLAモデルの動作予測機能を軽量モデルに転送するフレームワークであるActDistillを提案する。
我々は教師としてよく訓練されたVLAモデルを採用し、グラフ構造化カプセル化戦略を導入し、行動予測の階層的進化を明示的にモデル化する。
具現化されたベンチマークの実験では、ActDistillはフルスケールのVLAモデルと同等または優れた性能を達成し、計算を最大1.67倍のスピードアップで50%以上削減した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:44:03 GMT)
Generative Adversarial Post-Training Mitigates Reward Hacking in Live Human-AI Music Interaction [14.1] 強化学習後、コヒーレンスに基づく報酬を利用して出力の多様性を低下させる。
この崩壊は、音楽的創造性は動的変動と相互応答性に依存するライブジャミングにおいて特に有害である。
メロディと和音の伴奏のためのRLポストトレーニングにおける報酬ハッキングを軽減するために,ポリシー生成トラジェクトリに対する新たな逆行訓練手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:12:41 GMT)
ChemVTS-Bench: Evaluating Visual-Textual-Symbolic Reasoning of Multimodal Large Language Models in Chemistry [14.1] ChemVTS-Benchは、マルチモーダル大言語モデル(MLLM)の視覚的テキスト・シンボリック(VTS)推論能力を評価するために設計されたドメイン認証ベンチマークである。
ChemVTS-Benchは、有機分子、無機物質、および3D結晶構造にまたがる多様で困難な化学問題を含んでいる。
我々は、推論を標準化し、回答を検証し、障害モードを診断する自動エージェントベースのワークフローを開発する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 04:24:24 GMT)
IE-Critic-R1: Advancing the Explanatory Measurement of Text-Driven Image Editing for Human Perception Alignment [14.0] テキスト駆動画像編集ベンチマークスイート (IE-Bench) を導入し, テキスト駆動画像の評価を強化する。
IE-Benchには、さまざまなソースイメージのデータベース、さまざまな編集プロンプト、および異なる編集方法による対応する編集結果が含まれている。
IE-Critic-R1は、人間の知覚に合わせたテキスト駆動画像編集のための、より包括的で説明可能な品質評価を提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:16:58 GMT)
Observer Actor: Active Vision Imitation Learning with Sparse View Gaussian Splatting [13.9] 本稿では,アクターに対して最適な視覚観察を行うための,アクティブな視覚模倣学習のための新しいフレームワークを提案する。
両腕ロボットシステムに手首搭載カメラを搭載したObActについて検討する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:53:16 GMT)
When Better Teachers Don't Make Better Students: Revisiting Knowledge Distillation for CLIP Models in VQA [13.8] 視覚言語モデル(VLM)は、マルチモーダルタスク全体にわたって顕著な成功を収めてきたが、その膨大な計算要求は効率的なデプロイメントを妨げている。
知識蒸留(KD)は、軽量だが競争力のあるモデルを構築するための強力なアプローチとして登場した。
本稿では,標準ベースラインから大規模技術モデルまで,CLIPスタイルの教師モデルにまたがる蒸留に関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:30:18 GMT)
Bias Is a Subspace, Not a Coordinate: A Geometric Rethinking of Post-hoc Debiasing in Vision-Language Models [13.5] VLM(Vision-Language Models)は、マルチモーダルな推論には欠かせないものとなっているが、それらの表現はしばしば人口統計バイアスをエンコードし増幅している。
線形デオード可能なバイアスの全部分空間を同定・除去する幾何学的原理の枠組みを提案する。
提案手法は, 4つのフェアネス指標に対して平均18.5%の精度向上を達成し, より堅牢なデバイアス化を実現する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:04:30 GMT)
On Transportability for Structural Causal Bandits [13.0] 構造的因果バンディットフレームワークは、報酬を最大化できないアクションを特定するためのグラフィカルな特徴を提供する。
デプロイ環境での学習を促進するために、ソース環境の事前がどう融合されているかを示す。
得られた帯域幅アルゴリズムは、事前データの情報性に明示的に依存したサブ線形後悔を実現する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:38:11 GMT)
The Alignment Paradox of Medical Large Language Models in Infertility Care: Decoupling Algorithmic Improvement from Clinical Decision-making Quality [12.7] 8000以上の不妊治療記録を用いて4つのアライメント戦略を評価した。
GRPOは複数の決定層にまたがるアルゴリズムの精度が最も高い。
臨床医はSFTモデルを常に好んでおり、より明確な推論過程を引用している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:48:54 GMT)
Accelerated optimization of measured relative entropies [12.7] 測定された相対エントロピーと測定されたレニイ相対エントロピーは、2つの量子状態の区別可能性の量子化器である。
それらは、正定値作用素の集合上の凹凸関数や客観的凸関数の最適化を含む変分公式で書き換えることができる。
これらの目的関数は$-smoothと$-strongly convex / concaveであり、$と$は$と$の最大相対エントロピーに依存する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:35:40 GMT)
Unified Spherical Frontend: Learning Rotation-Equivariant Representations of Spherical Images from Any Camera [12.4] 統一球面フロントエンド(英: Unified Spherical Frontend、USF)は、レンズに依存しないフレームワークで、任意のカメラからの画像を光線方向対応によって単位球表現に変換する。
USFは高解像度の球面画像を効率的に処理し、ランダムなテスト時間回転で1%未満のパフォーマンス低下を維持する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:57:46 GMT)
A Multi-Stage Deep Learning Framework with PKCP-MixUp Augmentation for Pediatric Liver Tumor Diagnosis Using Multi-Phase Contrast-Enhanced CT [12.2] 良性腫瘍と悪性腫瘍の第一段階分類は良好な成績を示した。
このフレームワークは、小児固有のDL診断ギャップを埋め、CT位相選択とモデル設計のための実用的な洞察を提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:34:03 GMT)
Comprehensive Design Space Exploration for Tensorized Neural Network Hardware Accelerators [12.0] 高次テンソル分解は、エッジ展開のためのコンパクトなディープニューラルネットワークを得るために広く採用されている。
このようなハードウェアを意識しない設計は、テンソル化モデルの潜在的な遅延とエネルギーの利点を曖昧にすることが多い。
テンソル化ニューラルネットワークの効率的なトレーニングと推論のために,これらの次元を統一設計空間内に統一する共同探索フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:18:40 GMT)
UltraFlux: Data-Model Co-Design for High-quality Native 4K Text-to-Image Generation across Diverse Aspect Ratios [11.8] 我々は、MultiAspect-4K-1Mで4Kで訓練されたFluxベースのDiTであるUltraFluxを紹介する。
モデル側では、UltraFluxは4Kでのトレーニングウインドウ、周波数、AR対応の位置符号化のためにResonance 2D RoPEとYaRNを結合する。
4096年のAesthetic-EvalベンチマークとマルチAR 4K設定では、UltraFluxはフィデリティ、美学、アライメントのメトリクスで、強力なオープンソースベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:07:21 GMT)
Statistically-Guided Dual-Domain Meta-Learning with Adaptive Multi-Prototype Aggregation for Distributed Fiber Optic Sensing [11.7] 本稿では,DFOS 活動識別のための新しいメタ学習フレームワーク DUPLE を提案する。
まず、デュアルドメインのマルチプロトタイプ学習者が時間領域と周波数領域の特徴を融合させ、信号分散シフト下でのモデルの一般化能力を向上する。
第二に、統計ガイドネットワーク(SGN)は、生の統計的特徴からドメインの重要性とプロトタイプの感度を推定し、ラベルのないドメインや目に見えないドメインで学習するためのデータ駆動の事前情報を提供する。
第3に、クエリ対応プロトタイプアグリゲーションモジュールは、関連するプロトタイプを適応的に選択・結合し、限られたデータであっても分類性能を向上させる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 03:39:13 GMT)
Scalable Data Synthesis for Computer Use Agents with Step-Level Filtering [11.4] 我々は、ノイズの多いロールアウトを人間のアノテーションなしで信頼性の高い監視に変換するスケーラブルなデータ合成パイプラインを導入する。
ステップレベルのフィルタリング(Step-level filtering)は、アクションを個別に評価し、正しいステップのみを保持する。
その結果,拡張性のあるCUAトレーニングの鍵となるステップレベルのフィルタリングを確立し,新しい2つのデータセットを構築した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:12:56 GMT)
Scaling Competence, Shrinking Reasoning: Cognitive Signatures in Language Model Learning [11.3] タスク固有の微調整における言語モデルの推論を解析する。
推論トークンの長さは、パフォーマンスが向上するにつれて拡大する。
訓練後、モデルは推論を除去しても性能を維持する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 01:58:41 GMT)
Hierarchical Linkage Clustering Beyond Binary Trees and Ultrametrics [11.2] 本稿では,有効階層の概念を導入し,有効階層の集合上の部分順序を定義する。
我々は、データセットの類似性構造と一致した最大情報を符号化する最も有効な階層、すなわち階層の存在を証明した。
本稿では,まず二分木をリンク方式で構築し,その二分木に有効性を持たせるための単純な2ステップアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:20:34 GMT)
Paper2SysArch: Structure-Constrained System Architecture Generation from Scientific Papers [10.4] テキストからダイアグラムの自動生成を定量的に評価するための新しいベンチマークを導入する。
3000の研究論文とそれに対応する高品質な地上構造図を組み合わせ、三段階評価指標を伴って構成されている。
論文を構造化・編集可能な図形に変換するために,マルチエージェントコラボレーションを活用したエンドツーエンドシステムPaper2Archを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:24:30 GMT)
PrefixGPT: Prefix Adder Optimization by a Generative Pre-trained Transformer [10.4] プリフィックス加算器は計算集約的なアプリケーションで高速に使用される。
本稿では,最適化プレフィックス加算器をスクラッチから直接生成するGPT(Generative Pre-trained Transformer)であるPrefixGPTを紹介する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:43:43 GMT)
Training Emergent Joint Associations: A Reinforcement Learning Approach to Creative Thinking in Language Models [9.9] 連想的思考は人間の創造性と問題解決の基礎的な要素である。
本稿では、連想的思考原理によって導かれる強化学習が、多種多様な生成タスクにおけるモデルの性能を高めることができるかどうかを考察する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:10:27 GMT)
InfiniBench: Infinite Benchmarking for Visual Spatial Reasoning with Customizable Scene Complexity [9.6] InfiniBenchは、視覚モデルのための完全に自動化され、カスタマイズ可能で、ユーザフレンドリなベンチマークジェネレータである。
理論上無限に多様な3Dシーンを合成し、シーンの複雑さをパラメータ化して制御することができる。
InfiniBenchは、最先端の手続き法とLLMベースの3D生成法より優れ、忠実さと物理的妥当性を早急に向上させる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 22:05:39 GMT)
ReVeal-MT: A Physics-Informed Neural Network for Multi-Transmitter Radio Environment Mapping [9.4] 本稿では,マルチソースPDE残基をニューラルネットワーク損失関数に統合した新しいPINNであるemphReVeal-MTを提案する。
ReVeal-MTは、農耕地や郊外の環境にまたがるARA無線リビングラボからの実測値を用いて検証されている。
その結果,ReVeal-MTはマルチトランスミッタのシナリオでかなりの精度のゲインが得られることがわかった。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:33:06 GMT)
Matching-Based Few-Shot Semantic Segmentation Models Are Interpretable by Design [9.0] Few-Shot Semantic (FSS)モデルは、最小限のラベル付き例を持つ新規クラスのセグメンテーションにおいて強力な性能を達成する。
本稿では、マッチングベースのFSSモデルを解釈するための最初の専用手法を提案する。
Affinity Explainer アプローチは,画像のどのピクセルがクエリセグメンテーション予測に最も寄与しているかを示す属性マップを抽出する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:22:10 GMT)
Bringing Stability to Diffusion: Decomposing and Reducing Variance of Training Masked Diffusion Models [9.0] マスク付き拡散モデル(MDMs)は自己回帰モデル(ARMs)に代わる有望な代替品である
高い分散は、よりノイズの多い勾配推定と不安定な最適化をもたらすため、同様に強い事前訓練されたMDMやARMもタスク固有の訓練後に分岐する。
A)マスキングパターンノイズ,(B)マスキングレートノイズ,(C)データノイズの3つの源にMDMトレーニングのばらつきを初めて分解した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:04:47 GMT)
Generative Model Predictive Control in Manufacturing Processes: A Review [8.7] 製造プロセスは本質的に動的で不確実であり、品質と信頼性を維持するために堅牢な制御が不可欠である。
モデル予測制御(MPC)は、将来の状態を予測し、制御アクションを最適化するためにプロセスモデルを活用する、より高度なフレームワークとして登場した。
MPCは複雑な力学を捉えるのにしばしば失敗する単純化されたモデルに依存しており、製造環境における正確な状態推定と不確実性の伝播に苦慮している。
機械学習(ML)は、非線形ダイナミクスをモデリングし、予測モデリング、状態推定、最適化をサポートする潜在表現を学習することで、MPCを強化するために導入された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 01:22:53 GMT)
PromptMoE: Generalizable Zero-Shot Anomaly Detection via Visually-Guided Prompt Mixtures [8.5] 本稿では,ZSADのための素早い学習のための構成的アプローチを提案する。
$mathttPromptMoE$は、構成可能なセマンティックプリミティブの基底セットとして機能する専門家プロンプトのプールを学ぶ。
この概念を,視覚誘導型プロンプト混合(VGMoP)により実現し,多様な正常および異常な専門家状態プロンプトを集約する画像ゲートスパースMoEを用いて実現した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:41:18 GMT)
Equivalence of Context and Parameter Updates in Modern Transformer Blocks [8.4] 近年の研究では、バニラ変圧器における文脈の影響は、トークン依存のランク1パッチを重みに形成することで暗黙的に表現できることが判明している。
まず、Gemmaスタイルのトランスフォーマーブロックの正確な解析解を示し、コンテキストの効果をランク1パッチに完全にマッピングできることを証明した。
次に、この結果を一般化し、多層モデルに対する構築的証明とアルゴリズムを提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 01:17:15 GMT)
HEAL: Learning-Free Source Free Unsupervised Domain Adaptation for Cross-Modality Medical Image Segmentation [8.0] 階層化,エッジ誘導選択,サイズ認識融合,学習自由特性を統合した新しいSFUDAフレームワークであるHEALを提案する。
提案手法は既存のSFUDA手法よりも優れ,SOTA(State-of-the-art)性能を実現している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:50:09 GMT)
Is Complete Labeling Necessary? Understanding Active Learning in Longitudinal Medical Imaging [7.1] 縦型医用イメージング能動学習(LMI-AL)という新しいDALフレームワークを提案する。
ラベル付けされたデータの8%未満で、LMI-ALは完全なラベル付きデータセットでトレーニングされたモデルに匹敵するパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:10:25 GMT)
Towards a General Framework for HTN Modeling with LLMs [7.1] 我々は,HPモデル生成をサポートするL2Pの拡張であるL2HPを提案し,汎用性と拡張性の設計哲学に従う。
その結果,構文的妥当性は階層的な場合において著しく低いが,解析的成功は両設定で同等であることがわかった。
これらの結果は,HP が LLM に対して提示するユニークな課題を浮き彫りにし,HP モデルの品質向上に向けたさらなる研究の必要性を強調した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:27:35 GMT)
A superpersuasive autonomous policy debating system [7.1] DeepDebater(ディープデバター)は、2チームによる完全な競争政策の議論に参加し、勝利することのできる新しいシステムである。
本システムでは, 特殊なマルチエージェントエージェントの階層構造を採用している。
ライブでインタラクティブなエンドツーエンドのプレゼンテーションパイプラインは、AIスピーチとアニメーションによる議論を描画する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:45:01 GMT)
AdaPerceiver: Transformers with Adaptive Width, Depth, and Tokens [7.0] AdaPerceiverは,1つのモデル内での深さ,幅,トークンを統一した適応性を備えた最初のトランスフォーマーアーキテクチャである。
AdaPerceiverは85.4%の精度で、FlexiViT-Lよりも36%高いスループットを実現している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:09:14 GMT)
An Adaptive Resonance Theory-based Topological Clustering Algorithm with a Self-Adjusting Vigilance Parameter [6.9] 本稿では,適応共振理論に基づくトポロジカルクラスタリングアルゴリズムを提案する。
多様性駆動適応機構を通じて、再計算間隔と警戒閾値を自律的に調整する。
24の実世界のデータセットに対する実験により、提案アルゴリズムはクラスタリング性能と連続学習能力の両方において最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:53:59 GMT)
BPMN to PDDL: Translating Business Workflows for AI Planning [6.9] このプロジェクトは、BPMNダイアグラムを計画に適したPDDL表現に変換する機能パイプラインを開発するための、以前の理論的作業の上に構築されます。
このシステムは、タスク、イベント、シーケンスフロー、ゲートウェイを含むコアBPMN構造をサポートし、最初に並列かつ包括的なゲートウェイ動作をサポートする。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:51:23 GMT)
AVERY: Adaptive VLM Split Computing through Embodied Self-Awareness for Efficient Disaster Response Systems [6.3] 災害時の無人航空機(UAV)は、CNNが提供できない複雑なクエリー可能な知性を必要とする。
本稿では,適応型分割計算によるVLMデプロイメントを実現するフレームワークであるAVERYを紹介する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:42:04 GMT)
Quality analysis and evaluation prediction of RAG retrieval based on machine learning algorithms [6.1] 本稿では,特徴工学と粒子群最適化に基づくXGBoost機械学習回帰モデルを提案する。
その結果,doc_delevanceが0.66と正の相関を示し,文書の妥当性が回答品質に有意な影響を及ぼすことが示された。
また,VMD PSO BiLSTMモデルでは,MSE,RMSE,MAE,MAPEが比較モデルに比べて有意に低い値を示した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:43:04 GMT)
Enhancing Large Language Models for Automated Homework Assessment in Undergraduate Circuit Analysis [6.0] 我々は,複数ステップのプロンプト,文脈データ拡張,ターゲットとなるヒントの取り込みにより,GPT-4oの性能を向上させる。
GPT-4oの正しい応答率は、強化されたプロンプトと拡張データを適用した後、74.71%から97.70%に増加する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:43:00 GMT)
ArticFlow: Generative Simulation of Articulated Mechanisms [5.9] ArticFlowは2段階のフローマッチングフレームワークで、ノイズから目標点までの制御可能な速度場を明示的なアクション制御の下で学習する。
MuJoCo Menagerieでは、ArticFlowは生成モデルとニューラルシミュレータの両方として機能する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:19:53 GMT)
Unified Bulk-Entanglement Correspondence in Non-Hermitian Systems [5.7] P_ equiv (tildeH)pmod 1$ という基本的な恒等式を準局所性仮定の下で熱力学極限で証明する。
従来の Resta 偏極は、位置分散のばらつきにより $tildeH$ が非局所となるときに失敗するが、$(tildeH)$ は引き続き強量子化される。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:13:11 GMT)
A New Error Temporal Difference Algorithm for Deep Reinforcement Learning in Microgrid Optimization [5.6] 本稿では,予測の不確実性に対処する新しい誤り時間差(ETD)アルゴリズムを提案する。
再生可能エネルギー源(RES)とエネルギー貯蔵システム(ESS)を統合したマイクログリッドシステムをモデル化する。
次に、重み付き平均アルゴリズムと新しいETDアルゴリズムを設計し、予測の不確かさを定量化し対処するディープQネットワーク(DQN)に基づく予測制御手法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:29:18 GMT)
Sparse Kalman Identification for Partially Observable Systems via Adaptive Bayesian Learning [5.5] 本稿では、拡張カルマンフィルタ(AKF)と自動関連判定(ARD)を統合したオンラインスパースカルマン識別(SKI)手法を提案する。
SKI法は, シミュレーションや実世界の実験で示すように, ミリ秒レベルの効率と高い識別精度で高精度なモデル構造選択を実現する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:07:56 GMT)
Divergence-Minimization for Latent-Structure Models: Monotone Operators, Contraction Guarantees, and Robust Inference [5.4] 我々は、潜時混合モデルにおける堅牢かつ効率的な推論のための分散化最小化(DM)フレームワークを開発する。
残留調整された発散を最適化することにより、DMアプローチはEMを特別なケースとして回収し、堅牢な代替品を生成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:25:29 GMT)
Diffusion-based Surrogate Model for Time-varying Underwater Acoustic Channels [5.3] StableUASimは水中音響通信路の力学を捉える条件付き潜伏拡散代理モデルである。
特異な測定サンプルから条件生成をサポートしながら、多種多様で統計的に現実的なチャネル実現を実現している。
システム設計と機械学習駆動型水中アプリケーションの両方に対して、スケーラブルで、データ効率が高く、物理的に一貫性のある代理モデルを提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:25:21 GMT)
Elucidating Many-Body Effects in Molecular Core Spectra through Real-Time Approaches: Efficient Classical Approximations and a Quantum Perspective [5.2] 本稿では,Berker-Campbell-Hausdorff(BCH)拡張による費用対効果近似TD-dCCアンサーゼの階層化を提案する。
基底状態と電離状態の振幅のカップリングから生じる相関過程であるホール媒介励起経路を分離する詳細な成分分析法を開発した。
近似TD-dCC法は, 正確な多体スペクトル特徴と準粒子重みを密に, 効率的に再現できることを実証した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:56:04 GMT)
LLMs-Powered Accurate Extraction, Querying and Intelligent Management of Literature derived 2D Materials Data [4.8] 2次元材料はエネルギー貯蔵と変換に広く応用されている。
資料の財産や製法などの貴重な情報は、公表された研究論文に含まれている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 04:09:53 GMT)
Learning Rate Scheduling with Matrix Factorization for Private Training [4.7] 本研究では,学習速度スケジューリングと相関雑音下での勾配降下を伴う差分プライベートモデルトレーニングについて検討した。
我々は,MaxSEとMeanSEの両方の誤差測定値の下で,プレフィックスサム因数分解の改善を実現する学習速度対応因数分解法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:24:45 GMT)
Arbitrage-Free Bond and Yield Curve Forecasting with Neural Filters under HJM Constraints [4.3] 本研究では,Heath-Jarrow-Morton(HJM)項構造モデルに基づいて,利回り曲線と債券価格予測のための任意自由ディープラーニングフレームワークを開発する。
我々のアプローチは、カルマン、拡張カルマン、粒子フィルタと繰り返しニューラルネットワーク(LSTM/TM)を組み合わせることにより、非アービタードリフト制限をニューラルネットワークに組み込む。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:47:27 GMT)
Sparse Polyak with optimal thresholding operators for high-dimensional M-estimation [4.3] 高次元M推定問題に対するスパースポリアックの変種を提案し解析する。
本研究では,スペーサーとより正確な解を得ながら,その環境次元に関して望ましいスケーリング特性を保ったスパース・ポリアックの変種を導入する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:43:23 GMT)
Space-Optimized and Experimental Implementations of Regev's Quantum Factoring Algorithm [4.0] 整数分解問題(IFP)はRSAのセキュリティを支えるが、ショアのアルゴリズムによって量子コンピュータ上で効率的に解ける。
本稿では、Regevアルゴリズムの空間複雑性を著しく低減する中間計算によるクォービット再利用法を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:57:22 GMT)
HyM-UNet: Synergizing Local Texture and Global Context via Hybrid CNN-Mamba Architecture for Medical Image Segmentation [4.0] HyM-UNet は,CNN の局所的特徴抽出能力を,Mamba の効率的なグローバルモデリング能力と相乗化するために設計された。
エンコーダとデコーダのセマンティックギャップを埋めるため,Mamba-Guided Fusion Skip Connectionを提案する。
その結果,HyM-UNetはDice係数とIoUで既存の最先端手法を著しく上回ることがわかった。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:02:06 GMT)
ASTRA: Agentic Steerability and Risk Assessment Framework [4.0] 大規模言語モデル(LLM)を活用したAIエージェントのセキュア化は、今日のAIセキュリティにおける最も重要な課題の1つだ。
ASTRA は LLM の有効性を評価するための第一種フレームワークである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 16:32:29 GMT)
Compact neural networks for astronomy with optimal transport bias correction [3.9] 本稿では,ウェーブレット分解と状態空間モデリングを統合した理論駆動フレームワークであるWaveletMambaを紹介する。
WaveletMambaは、64x64解像度で81.72%+/-0.53%の分類精度を達成し、パラメータはわずか3.54Mである。
数学的厳密さは、科学AIにおける前例のない効率性と包括的バイアス補正を可能にすることを示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:52:58 GMT)
The Human Brain as a Combinatorial Complex [3.8] 現在のグラフベースの脳ネットワークの表現は、神経の複雑さを特徴づける高次の依存関係を見逃している。
本稿では,fMRI時系列データから複合体(CC)を構築するためのフレームワークを提案する。
この研究は、従来のグラフ手法では見えない、基本的な高次構造を保存する脳ネットワーク表現のためのフレームワークを提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:04:13 GMT)
Scaling Kinetic Monte-Carlo Simulations of Grain Growth with Combined Convolutional and Graph Neural Networks [3.4] グラフニューラルネットワーク(GNN)は、穀物成長などのシミュレーションをシミュレートするための有望な機械学習手法として登場した。
本稿では、畳み込みニューラルネットワーク(CNN)をベースとしたオートエンコーダと、潜伏空間の微細構造を進化させるGNNを組み合わせたハイブリッドアーキテクチャを提案する。
その結果、新しい設計は、メッセージパッシング層を減らして計算コストを大幅に削減することを示した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:18:03 GMT)
MOMA-AC: A preference-driven actor-critic framework for continuous multi-objective multi-agent reinforcement learning [3.3] 本稿では、連続状態とアクション空間のためのインナーループアクター批判フレームワークを初めて紹介する。
このフレームワークをTD3(Deep Deterministic Policy Gradient)とDDPG(Deep Deterministic Policy Gradient)でインスタンス化する。
このフレームワークは、マルチヘッドアクターネットワーク、中央集権的な批評家、客観的な嗜好条件アーキテクチャを組み合わせたものである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:24:51 GMT)
Large-Scale Pre-training Enables Multimodal AI Differentiation of Radiation Necrosis from Brain Metastasis Progression on Routine MRI [3.3] 放射線治療後の腫瘍進展と放射線壊死の鑑別は、脳転移にとって重要な課題である。
従来の教師付き深層学習アプローチは、生検確認の少ない訓練データによって制約される。
自己教師付き学習は、大規模にラベル付けされていない脳転移画像データセットの可用性の増大を活用することで、この問題を克服する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 22:44:50 GMT)
Blu-WERP (Web Extraction and Refinement Pipeline): A Scalable Pipeline for Preprocessing Large Language Model Datasets [3.0] Blu-WERPは、LLMトレーニングのためにCommon Crawl WARCファイルの品質を最適化するために設計された、新しいデータ前処理パイプラインである。
我々は,Blu-WERPが複数のモデルスケールおよび評価ベンチマークにおいて,DCLMを含む確立されたベースラインを著しく上回ることを示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:14:07 GMT)
Reducing Hallucinations in LLM-Generated Code via Semantic Triangulation [2.9] 我々はセマンティックトライアングルを導入し、解間の正確な検証可能なマッピングを保持する方法でプログラミング問題を変換する。
LiveCodeBenchとCodeEloのベンチマークでは、セマンティックトライアングルによって生成されたコードの信頼性が21%向上している。
また、複数の有効だが等価でない解を持つタスクに対して、真のコンセンサスを一貫して形成する唯一のアプローチでもある。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 03:27:30 GMT)
Uncertainty-Aware Federated Learning for Cyber-Resilient Microgrid Energy Management [2.7] 本稿では,長期記憶に基づく太陽光発電予測と,新たな2段階の偽データ注入攻撃検出とエネルギー管理システム最適化を組み合わせた総合的サイバーレジリエンスフレームワークを提案する。
その結果,多信号融合による高精度カスケード検出は単一信号方式よりも優れ,分散マイクログリッドのセキュリティ性能の相乗効果が検証された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:11:52 GMT)
Federated Anomaly Detection and Mitigation for EV Charging Forecasting Under Cyberattacks [2.7] 電気自動車(EV)の充電インフラは、運用効率とグリッド安定性を著しく損なうサイバーセキュリティの脅威がエスカレートしている。
既存の予測技術は、堅牢な異常軽減ソリューションとデータ保存プライバシの欠如によって制限されている。
本稿では,データプライバシを同時に保持し,サイバー攻撃を検出し,敵条件下での信頼性の高い需要予測精度を維持する,新しい異常回復型フェデレーション学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:41:58 GMT)
MTikGuard System: A Transformer-Based Multimodal System for Child-Safe Content Moderation on TikTok [2.7] MTikGuardはTikTokのリアルタイムマルチモーダル有害コンテンツ検出システムである。
ビジュアル、オーディオ、テキストの機能を駆使して、89.37%の精度と89.45%のF1スコアで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:41:16 GMT)
MASTEST: A LLM-Based Multi-Agent System For RESTful API Tests [2.5] クラウドネイティブアプリケーションの品質保証において、APIのテストはますます重要になっている。
機械学習の最近の進歩は、様々なテスト活動が妥当な精度で大規模言語モデル(LLM)によって自動的に実行されることを示した。
本稿では, LLM とプログラムエージェントを組み合わせたマルチエージェントシステム MASTEST を開発した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:33:13 GMT)
Hyperbolic Dispersion and Low-Frequency Plasmons in Electrides [2.4] 非立方晶窒化物は、間質部位における電荷の局在のため、一般的に天然の双曲性物質であることを示す。
半導体電解質では、異方性バンド間遷移は双曲的挙動の付加的なメカニズムを提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 01:01:23 GMT)
Verifcation of general multi-qudit pure states [2.2] 本稿では、一般化された安定化器のフレームワークと、一般のマルチキューディット状態に適用可能な関連するテストについて述べる。
提案手法は,量子量子状態,任意の2ビット純状態,ベル/ベル様,GHZ/GHZ様,グラフ,ハイパーグラフ,マルチグラフ,マルチハイパーグラフ状態の検証を行う。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 03:31:29 GMT)
Linear Algebraic Approaches to Neuroimaging Data Compression: A Comparative Analysis of Matrix and Tensor Decomposition Methods for High-Dimensional Medical Images [1.8] 本稿では,ニューロイメージングデータを圧縮するためのタッカー分解と特異値分解(SVD)について検討する。
タッカー分解は多次元関係を保ち、より優れた再構成忠実性と知覚的類似性を達成する。
SVDは極端な圧縮では優れているが、忠実さを犠牲にする。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:56:55 GMT)
Improving Forecasts of Suicide Attempts for Patients with Little Data [1.7] すべての患者に適合する1つのモデルではパフォーマンスが良くない一方で、個々のモデルではパフォーマンスが向上するが、限られたデータを持つ患者には相変わらず過度に適合することを示す。
カーネル設計なしでも、我々は患者の類似性に関する新たな理解を提供しながら、1つのベースライン以外全てを上回ります。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 22:03:32 GMT)
Towards a future space-based, highly scalable AI infrastructure system design [1.7] この研究は、宇宙における機械学習のためのスケーラブルな計算システムを探究する。
太陽電池アレイ、自由空間光学を用いた衛星間リンク、Google Tenor Processing Unit(TPU)アクセラレータチップを備えた衛星群を使用している。
本稿では, 半径1kmの81サテライトクラスターによる成層飛行の基本的アプローチについて述べるとともに, 大規模星座の制御に高精度MLモデルを用いるアプローチについて述べる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:28:08 GMT)
MGA-VQA: Secure and Interpretable Graph-Augmented Visual Question Answering with Memory-Guided Protection Against Unauthorized Knowledge Use [1.6] Document Visual Question Answering (DocVQA)は、テキストの意味論、空間的レイアウト、視覚的特徴を共同で理解するモデルを必要とする。
トークンレベルの符号化,空間グラフ推論,メモリ拡張推論,質問誘導圧縮を統合したマルチモーダルフレームワークであるMGA-VQAを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:17:42 GMT)
Exploiting the Experts: Unauthorized Compression in MoE-LLMs [1.6] タスク固有の使用条件下でのMoE-LLMの刈取性について検討した。
我々は,MoEモデルを許可なく圧縮・微調整しにくくすることを目的とした防衛戦略を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:08:29 GMT)
ARIAL: An Agentic Framework for Document VQA with Precise Answer Localization [1.6] 本稿では,高精度な回答抽出と信頼性のある空間的接地を実現するために,専門的なツールを編成するフレームワークであるARIALを提案する。
テキスト精度 (ANLS) と空間精度 (空間精度) を用いて, ARIAL を 4 つのベンチマーク (DocVQA, FUNSD, CORD, SROIE) で評価した。
我々の研究は、特殊ツールのエージェント的オーケストレーションが、パフォーマンスと解釈可能性を同時に改善できることを示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:09:28 GMT)
A Coordinated Dual-Arm Framework for Delicate Snap-Fit Assemblies [1.6] 複雑なスナップフィットアセンブリは、オーバーシュートによって引き起こされるコンポーネントの損傷や組み立て失敗を防ぐために、タイムリーなエンゲージメント検出と迅速な力の減衰を要求する。
我々はSnapNetを紹介した。SnapNetは軽量なニューラルネットワークで、共同速度のトランジェントからリアルタイムでスナップフィットのエンゲージメントを検出する。
本稿では,SnapNet駆動型検出とイベントトリガーインピーダンス変調を統合した動的システムに基づくデュアルアーム協調フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:50:35 GMT)
Save, Revisit, Retain: A Scalable Framework for Enhancing User Retention in Large-Scale Recommender Systems [1.5] ユーザーが以前保存されたコンテンツを見るために戻るとき、ユーザーの保持の鍵となる指標は、再考である。
特定のユーザーアクションやコンテンツ露出がリビジットを引き起こすかは、しばしば不明である。
我々は、リビテーション行動のモデリングのための、新しく、軽量で、解釈可能なフレームワークを導入する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:27:20 GMT)
GeeSanBhava: Sentiment Tagged Sinhala Music Video Comment Data Set [1.5] 本稿では,3つの独立アノテータによるRussells Valence-Arousalモデルを用いて手動でタグ付けした,Sinhalaのコメントの高品質データセットであるGeeSanBhavaを紹介する。
分析の結果、異なる曲に対する異なる感情プロファイルが明らかとなり、コメントに基づく感情マッピングの重要性が強調された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:15:06 GMT)
A Low-Code Methodology for Developing AI Kiosks: a Case Study with the DIZEST Platform [1.4] 本稿では,AIに基づく実装を中心に,低コードアーキテクチャによるキオスクシステムの強化に関する研究を行う。
我々は、直感的なワークフロー設計とシームレスなAI統合を可能にする、特殊なローコードプラットフォームであるDIZESTベースのアプローチ方法論を提案する。
今回のケーススタディでは、相互運用性の向上、ユーザエクスペリエンスの向上、デプロイメントの柔軟性の向上など、このアプローチの有効性をさらに検証しています。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:40:02 GMT)
A Novel and Practical Universal Adversarial Perturbations against Deep Reinforcement Learning based Intrusion Detection Systems [1.2] 侵入検知システム(IDS)は、より高度なサイバー脅威から現代のサイバー物理システムを守る上で重要な役割を担っている。
最近の研究は、UAP(Universal Adversarial Perturbations)を含む敵攻撃に対する脆弱性を明らかにしている
本稿では,ネットワークデータルールと特徴関係から派生したドメイン固有の制約の下で,深層強化学習(DRL)に基づく新たなUAP攻撃を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:52:01 GMT)
Agent-as-a-Graph: Knowledge Graph-Based Tool and Agent Retrieval for LLM Multi-Agent Systems [1.2] 本稿では,知識グラフにおいて,ツールと親エージェントをノードとして,エッジとして表現する知識グラフ検索拡張手法であるエージェント・アズ・ア・グラフ検索を紹介する。
我々はLiveMCPBenchmark上でAgent-as-a-Graphを評価し、Recall@5とnDCG@5の14.9%と14.6%の改善を実現した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:24:16 GMT)
Typing Reinvented: Towards Hands-Free Input via sEMG [1.0] 次世代ヒューマン・コンピュータ・インタラクション(HCI)における没入型タイピングを対象とし,筋活動とキーボード入力をマッピングするための非侵襲的入力モダリティとして表面筋電図(sEMG)を探索する。
我々は既存の畳み込みベースラインを大幅に上回り、オンラインジェネリックCERを24.98%から20.34%に減らし、オフラインパーソナライズしたCERを10.86%から10.10%に減らし、完全な因果関係を維持した。
さらに,言語モデルに基づく修正を施した軽量な復号パイプラインを導入し,将来のウェアラブルおよび空間インタフェースにおいて,正確なリアルタイム筋肉駆動型テキスト入力の実現可能性を示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:04:45 GMT)
LocaGen: Low-Overhead Indoor Localization Through Spatial Augmentation [1.0] LocaGenは、見えない場所で高品質な合成データを生成することによって、指紋認証のオーバーヘッドを低減する空間拡張フレームワークである。
実世界のWiFiフィンガープリントデータセットを用いた評価では、LocaGenは、30%のロケーションが見えない場合でも、同じローカライズ精度を維持している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:56:56 GMT)
Animated Territorial Data Extractor (ATDE): A Computer-Vision Method for Extracting Territorial Data from Animated Historical Maps [1.0] 本稿では,アニメーション歴史地図から量的領域データを抽出するコンピュータビジョンツールであるAnimated Territorial Data Extractor (ATDE)を提案する。
ATDEは、HSVベースのカラーセグメンテーション、RGBチャネルフィルタリング、およびDirect-Neighbor Filteringを使用して、領域制御を表すピクセルを特定し、カウントする。
われわれはこのツールを中国10王朝(紀元前200年~1912年)で実証し、予想される歴史的パターンに合わせた年々の画素数を生成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:19:05 GMT)
MINDiff: Mask-Integrated Negative Attention for Controlling Overfitting in Text-to-Image Personalization [0.9] 本研究では,非関連領域における被写体の影響を抑える新しい概念である負の注意(負の注意)を提案する。
推論中にクロスアテンション機構を変更することで、これを実現する。
我々は,MINDiffがクラス固有の保存前損失よりも過度に適合することを実証した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:32:19 GMT)
pFedBBN: A Personalized Federated Test-Time Adaptation with Balanced Batch Normalization for Class-Imbalanced Data [0.9] pFedBBNは、パーソナライズされたテスト時間適応フレームワークである。
完全に教師なしの局所適応をサポートし、クラス認識モデル集約戦略を導入している。
バランスの取れた特徴正規化とドメイン認識のコラボレーションを通じて、分散シフトとクラス不均衡の両方に対処する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:01:41 GMT)
D2D Power Allocation via Quantum Graph Neural Network [0.9] 量子回路グラフ(PQC)を用いたメッセージパッシングを実現する完全量子グラフニューラルネットワーク(QGNN)を提案する。
我々の量子グラフ畳み込み層(QCLG)は、特徴を量子状態にエンコードし、NISQ互換のユニタリを持つグラフを処理し、測定を通して埋め込みを検索する。
このエンドツーエンドのPQCベースのGNNは、量子加速無線最適化への一歩となる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:38:06 GMT)
How Far Can LLMs Emulate Human Behavior?: A Strategic Analysis via the Buy-and-Sell Negotiation Game [0.8] 大規模言語モデル(LLM)の人間の感情的・行動的模倣と戦略的意思決定能力を定量的に評価する手法を提案する。
具体的には、複数のLLMに異なるペルソナを割り当て、バイヤーとセラーの交渉を行い、勝利率、取引価格、SHAP値などの結果を包括的に分析する。
実験の結果,既存のベンチマークスコアが高いモデルでは,全体の交渉性能が向上することが示された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 09:07:29 GMT)
A multi-view contrastive learning framework for spatial embeddings in risk modelling [0.7] 空間データは、しばしば非構造的で、高次元であり、予測モデルに統合することは困難である。
空間埋め込みを生成するための新しい多視点コントラスト学習フレームワークを提案する。
フランスの不動産価格に関するケーススタディでは、生座標で訓練されたモデルと、空間埋め込みを入力として使用するモデルを比較した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:39:34 GMT)
Impact of Data-Oriented and Object-Oriented Design on Performance and Cache Utilization with Artificial Intelligence Algorithms in Multi-Threaded CPUs [0.5] 本研究は,データ指向設計(DOD)と従来のオブジェクト指向設計(OOD)の総合的なパフォーマンス解析を提供する。
評価は実行時間、メモリ使用量、CPUキャッシュミスなどのメトリクスに基づいて行われた。
我々は、複雑な大規模AIおよび並列コンピューティングタスクにおいて、ハードウェア効率を最大化するためのより効果的なアプローチである、と結論付けている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:48:25 GMT)
A Reinforcement Learning Framework for Resource Allocation in Uplink Carrier Aggregation in the Presence of Self Interference [0.2] キャリアアグリゲーション(Carrier aggregate)は、モバイルネットワークが複数のキャリアを組み合わせることで、ユーザデータレートを向上するテクニックである。
非線型性による自己干渉の制約を伴って、アップリンクキャリア集約問題を最適な資源配分問題としてモデル化する。
本稿では,提案したCA2Cアルゴリズムが効率よくSIを扱えるようにするために重要な新しい報酬関数を提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:06:51 GMT)
eBPF-PATROL: Protective Agent for Threat Recognition and Overreach Limitation using eBPF in Containerized and Virtualized Environments [0.2] eBPF-PATROLは、コンテナ化された環境でポリシーを監視し、強制する軽量ランタイムセキュリティエージェントである。
eBPF-PATROLは、リバースシェル、特権エスカレーション、コンテナエスケープのようなリアルタイム境界違反を検出し、防止する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:51:36 GMT)
Controllability Analysis of State Space-based Language Model [0.2] 本研究では,Mambaの状態空間パラメータから導かれる可制御性に基づく尺度であるEmpfect Scoreを導入,検証する。
Influence Scoreは、SSMベースの言語モデルを解釈し比較するための実用的な診断ツールである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:13:17 GMT)
Using MLIR Transform to Design Sliced Convolution Algorithm [0.2] SConvTransformは、MLIRの2D畳み込みを最適化するための操作を提供する変換方言拡張である。
SConvTransformのメインオペレーションであるSConvOpは、Linalgの畳み込みをタイル付きおよび充填されたジェネリック操作に低下させる。
標準の畳み込み構成を適用すると、生成されたコードはARM SMEで60%、Intel AVX512で67%のピークパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:51:51 GMT)
Federated Learning Framework for Scalable AI in Heterogeneous HPC and Cloud Environments [0.2] 我々は、HPCとクラウドの混在する環境を効率的に動かすために構築された連合学習フレームワークを提案する。
本システムは,モデル精度とデータプライバシを維持しつつ,システムヘット・エロジニティ,通信オーバーヘッド,リソーススケジューリングといった重要な課題に対処する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:39:25 GMT)
Can MLLMs Detect Phishing? A Comprehensive Security Benchmark Suite Focusing on Dynamic Threats and Multimodal Evaluation in Academic Environments [0.1] 学術機関や研究者は、動的、多言語、文脈に依存した脅威に直面し、高い価値の目標である。
既存のセキュリティベンチマークは、特定の学術的背景情報を含まないデータセットに大きく依存している。
本稿では,学術的な環境下での動的フィッシング攻撃に対するMLLM防御能力を体系的に評価するための統一的方法論フレームワークとベンチマークスイートであるAdapT-Benchを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:00:56 GMT)
Generating Synthetic Human Blastocyst Images for In-Vitro Fertilization Blastocyst Grading [0.1] 多くのクリニックでのin vitro受精(IVF)の成功は、5日目のブラストシストの正確な形態学的評価に依存している。
高忠実な新しい5日目ブラストシスト画像を生成するために訓練された潜伏拡散モデルであるDiffusion Based Imaging Model for Artificial Blastocysts frameworkを提案する。
以上の結果から、DIAモデルでは、胚学者が実際の画像と確実に区別できないようなリアルな画像が生成されることが示唆された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 22:27:01 GMT)
Hybrid LSTM and PPO Networks for Dynamic Portfolio Optimization [0.1] 本稿では,Long Short-Term Memory(LSTM)予測とPPO強化学習戦略を融合したポートフォリオ最適化のためのハイブリッドフレームワークを提案する。
提案システムでは,時間的依存を捕捉する深部再帰ネットワークの予測能力を活用し,PPOエージェントは連続的な行動空間におけるポートフォリオ割り当てを適応的に改善する。
フレームワークのパフォーマンスは、年次リターン、ボラティリティ、シャープ比、最大ドローダウンメトリクスを使用して、同等の重み付け、インデックスベース、シングルモデルアプローチ(LSTMとPPOのみ)に対してベンチマークされる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:57:03 GMT)
Towards Harnessing the Power of LLMs for ABAC Policy Mining [0.0] 本稿では,大規模言語モデル(LLM)によるABAC(Attribute-based Access Control)ポリシーマイニングの実施に関する実証的研究を行う。
Google Gemini (Flash と Pro) と OpenAI ChatGPT を政策マイニングエンジンとして評価した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:49:36 GMT)
The Workflow as Medium: A Framework for Navigating Human-AI Co-Creation [0.0] クリエイティブインテリジェンスループ(CIL、Creative Intelligence Loop)は、人間とAIの共創に責任を負うための新しい社会技術フレームワークである。
CILは、多様なAIチームメイトの戦略的統合を導く、動的な人間-AIコラボレーションのための規律付き構造を提案する。
CILは、2つのグラフィックノベルラの実践による創造によって実証的に実証された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:36:13 GMT)
The Horcrux: Mechanistically Interpretable Task Decomposition for Detecting and Mitigating Reward Hacking in Embodied AI Systems [0.0] 本論文では,Planner,Coordinator,Executorモジュールを備えた階層型トランスフォーマアーキテクチャである,機械的解釈可能なタスク分解(MITD)を紹介する。
MITDはタスクを解釈可能なサブタスクに分解し、アテンションウォーターフォール図やニューラルパスウェイフローチャートなどの診断視覚化を生成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 01:45:52 GMT)
The Harrow-Hassidim-Lloyd algorithm with qutrits [0.0] 我々は、Harrow-Hassidim-Lloyd (HHL)アルゴリズムを、その量子ビットに拡張する。
アルゴリズムの回路を設計し,その実装のためのプログラムを開発する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:50:44 GMT)
SCI-IoT: A Quantitative Framework for Trust Scoring and Certification of IoT Devices [0.0] 本稿では,IoTデバイスの信頼性評価,評価,認証を行うための標準化された定量的フレームワークであるSCI-IoTを紹介する。
このフレームワークは6層グレーディングモデル(Grades A-F)を採用しており、コンシューマ、産業、重要なインフラストラクチャドメイン間でデバイスプロファイリングを可能にする。
提案システムは,製造業者のコンプライアンスの合理化,消費者の信頼度の向上,IoTセキュリティ認定におけるグローバルな相互運用性の促進を目的としている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:48:56 GMT)
Reward Engineering for Spatial Epidemic Simulations: A Reinforcement Learning Platform for Individual Behavioral Learning [0.0] 本稿では,Gymnasium互換強化学習プラットフォームであるContagionRLについて述べる。
我々のプラットフォームは、様々な流行シナリオにおいて、報酬関数設計が学習した生存戦略にどのように影響するかを厳格に評価することができる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:02:37 GMT)
Rethinking Retrieval: From Traditional Retrieval Augmented Generation to Agentic and Non-Vector Reasoning Systems in the Financial Domain for Large Language Models [0.0] 本稿では,ベクトルベースエージェントRAGをハイブリッド検索とメタデータフィルタリングを用いて比較した最初の体系的評価を行う。
検索指標(MRR, Recall@5), LLM-as-a-judgeのペア比較, レイテンシ, 前処理コストを計測する。
以上の結果から,金融Q&Aシステムに先進的なRAG技術を適用することにより,検索精度,回答品質が向上し,生産における費用対効果のトレードオフが考慮されることが明らかとなった。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:06:25 GMT)
Reinforcement Learning for Portfolio Optimization with a Financial Goal and Defined Time Horizons [0.0] 本研究は,G-Learningアルゴリズムを用いて,革新的なポートフォリオ最適化手法を提案する。
目標は、投資家の定期的な貢献を最小限にしつつ、目標日によってポートフォリオの価値を最大化することである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:21:06 GMT)
Quantum and classical analyses of intertwined phase transitions in odd-mass Nb isotopes [0.0] 量子解析により、II型QPTに重畳されるI型QPTが明らかにされる。
古典的な分析は、偶々のZrコアによって生成される変形体における単一粒子運動の影響を強調している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:30:34 GMT)
Quantifying Modality Contributions via Disentangling Multimodal Representations [0.0] マルチモーダルモデルにおけるモダリティコントリビューションの定量化は、既存のアプローチがコントリビューション自体の概念を強調しているため、依然として課題である。
内部埋め込みにおける予測情報をユニークで冗長でシナジスティックなコンポーネントに分解することで、モダリティの寄与を定量化する部分情報分解(PID)に基づくフレームワークを提案する。
これは、結果ベースのメトリクスよりも明確で解釈可能な洞察を提供する、マルチモーダルな振る舞いの原則的、表現レベルのビューを提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:02:58 GMT)
Partial multivariate transformer as a tool for cryptocurrencies time series prediction [0.0] 部分多変量戦略は,有意な統計的精度を達成し,情報信号と雑音のバランスを効果的に行うことを示す。
予測誤差の低さは、シミュレーションにおける高い金融リターンに一貫して変換されなかった。
この発見は、従来のエラーメトリクスへの依存に挑戦し、現実の財務目標とより整合した評価基準を開発する必要性を強調している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 21:59:32 GMT)
PPoGA: Predictive Plan-on-Graph with Action for Knowledge Graph Question Answering [0.0] PPoGA(Predictive Plan-on-Graph with Action)は,人間の認知制御と問題解決に触発された新しいKGQAフレームワークである。
PPoGAはPlanner-Executorアーキテクチャを導入し、低レベルの実行から高レベルの戦略を分離し、予測処理機構を利用して結果を予測する。
我々は,3つの挑戦的マルチホップKGQAベンチマーク(GrailQA,CWQ,WebQSP)について広範な実験を行った。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:19:36 GMT)
Not Quite Anything: Overcoming SAMs Limitations for 3D Medical Imaging [0.0] SAMやSAM-2のような基礎的なセグメンテーションモデルは、自然画像ではうまく機能するが、脳MRIでは困難である。
本稿では,基礎モデルの出力を付加的な入力チャネルとして扱う合成代替手法を提案する。
従来MRIセグメンテーションで訓練されていた軽量な3次元U-Netを用いてSAM-2プロンプトを生成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 05:29:27 GMT)
Noise-Adaptive Quantum Circuit Mapping for Multi-Chip NISQ Systems via Deep Reinforcement Learning [0.0] 本稿では,双方向長短期記憶に基づく動的雑音適応ネットワークを統合した深層強化学習フレームワークDeepQMapを提案する。
本手法は,量子系の動作の時間的表現を学習することで,ハードウェアのダイナミクスに継続的に適応する。
DeepQMapは平均回路忠実度が0.920 pm 0.023$であり、最先端のQUBO法よりも統計的に49.3%向上している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:27:55 GMT)
Mitigating Catastrophic Forgetting in Streaming Generative and Predictive Learning via Stateful Replay [0.0] 本稿では,ストリーミング自動エンコード時系列予測と分類のためのステートフルリプレイについて統一的な研究を行う。
我々は,Rotated MNIST, ElectricityLoadDiagrams 2011-2014, Airlines遅延データから構築した6つのストリーミングシナリオに対して,単一再生機構を評価する。
ヘテロジニアスなマルチタスクストリームでは、リプレイは平均忘れを2~3倍に減らし、良質な時間ベースストリームでは、どちらのメソッドも同じように動作する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 06:25:54 GMT)
Mesh-based Super-resolution of Detonation Flows with Multiscale Graph Transformers [0.0] 超解像流の再構成は、サブグリッド/フィルタクロージャモデリング、予測の高速化、データ圧縮、スパース実験のためのアップスケーリングツールとしての役割など、様々な用途に有用である。
本研究では, 反応流のメッシュベース超解像(SR-GT)に対して, 第一種マルチスケールグラフトランスフォーマ手法を開発した。
SR-GTは, 従来のSR方式と比較して, 流れ場特性と性能に高い精度で対応できることが実証された。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:09:37 GMT)
MEDIC: a network for monitoring data quality in collider experiments [0.0] データ品質モニタリング(DQM)は、粒子物理学実験の重要なコンポーネントである。
本研究では,DQMに対するシミュレーション駆動型アプローチを提案し,データ品質方法論の研究と開発を可能にした。
本稿では,検出動作の学習とDQMタスクの実行を目的としたニューラルネットワークであるMEDICを紹介する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 19:53:24 GMT)
Less Is More: An Explainable AI Framework for Lightweight Malaria Classification [0.0] この研究は、複雑なニューラルネットワークがマラリアの単純な二分分類タスクに不可欠であるかどうかを論じる。
本稿では,透過的で再現性があり,低計算機械学習アプローチであるExptracted Morphological Feature Engineered (EMFE)パイプラインを紹介する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 14:46:59 GMT)
Influence of the radial number of Laguerre-Gaussian vortex beams on their propagation in a turbulent medium [0.0] 乱流ガス媒質中におけるラゲール・ガウスビームの伝播について考察した。
ラゲール・ガウスモードの安定性の相違は、異なるモードとアジムタール数で明らかである。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:09:10 GMT)
Hierarchical biomarker thresholding: a model-agnostic framework for stability [0.0] プールされたインスタンスに調整された閾値は、階層的依存、頻度シフト、スコアスケールのミスマッチによって、サイト全体で失敗することが多い。
患者レベルの決定を再現可能で、より確実にする階層的しきい値設定のための選択最善の枠組みを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 11:46:26 GMT)
Graph Neural Networks vs Convolutional Neural Networks for Graph Domination Number Prediction [0.0] 本稿では,グラフのエンフェドミネーション数,支配集合の最小サイズを近似する機械学習手法について検討する。
我々は、隣接行列表現で動作する畳み込みニューラルネットワーク(CNN)と、グラフ構造からメッセージパッシングを通じて直接学習するグラフニューラルネットワーク(GNN)の2つのニューラルネットワークパラダイムを比較した。
どちらのモデルも正確な解法よりも大幅にスピードアップし、GNNは200ドル以上の加速を実現し、ほぼ完全な忠実さを維持している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:34:32 GMT)
Fewest switches surface hopping with decoherence in the Marcus inverted regime: correct rates but wrong thermal populations [0.0] Fewest surface hopping (FSSH) は、非透析系をシミュレーションするためのよくベンチマークされた動的手法である。
深部逆転型マーカス法では,拡張FSSH (AFSSH, 1バージョンはデコヒーレンスを含む) は適度に正確な速度定数を得るが,不正確な熱集団を生じる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:48:12 GMT)
Exact solutions of the inhomogeneous nonlinear Schrödinger equation through supersymmetric potentials [0.0] 不均一非線形シュルディンガー方程式(INLSE)の正確な定常解を導出する。
これは、INLSEと非線形シュルディンガー方程式(NLSE)の接続により可能であり、リー点対称性に基づく処理から確立することができる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:43:06 GMT)
Exact Non-Identity Check and Gate-Teleportation-Based Indistinguishability Obfuscation are NP-hard for Low-T-Depth Quantum Circuits [0.0] 2021年に開発された量子回路の計算不特定性難読化のためのゲート・テレポーテーションに基づくプロトコル。
特に、T-depth $O(log(n))$のクリフォード+T回路に対して、ENICを決定することはNPハードであることを示す。
これにより、P=NPでない限り、効率的な ENIC または効率的なゲートテレポーテーションに基づく計算不能な難読化のいずれかの対数Tディープスのクリフォード+T回路の可能性を効果的に定義できる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:51:30 GMT)
Event-Chain Analysis for Automated Driving and ADAS Systems: Ensuring Safety and Meeting Regulatory Timing Requirements [0.0] 本稿ではイベント・チェーン・モデリングに基づく構造化されたホワイトボックス手法を提案する。
Black-Boxのアプローチとは異なり、Event-Chain Analysisは各機能コンポーネントのタイミング動作について透過的な洞察を提供する。
本手法は、エンドツーエンドのタイミング制約の導出、モデル化、検証を可能にする。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 15:22:05 GMT)
Entanglement Generation via Hamiltonian Dynamics Having Limited Resources [0.0] 両部ハミルトニアン力学の下での絡み合い生成の基本的な限界について検討する。
我々は、ハミルトニアンの平均エネルギーのみに基づく制約は、絡み合い生成速度を束縛するには不十分であることを示した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 02:58:40 GMT)
Efficient Dynamic and Momentum Aperture Optimization for Lattice Design Using Multipoint Bayesian Algorithm Execution [0.0] ストレージリング設計の最適化において,マルチポイントベイズアルゴリズムの実行が基本的な計算課題を克服できることを実証する。
我々は,ニューラルネットワークを用いたマルチポイントBAXを用いた第4世代光源の新たな設計法について,遺伝的アルゴリズムと比較して2桁未満の追跡計算を用いて,等価なフロント結果が得られることを示す。
ブラックボックス最適化の代替として,マルチポイントBAXの大幅なコスト削減が期待され,今後の光源,衝突器,大規模科学施設の設計に期待できる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 00:32:44 GMT)
Doublon bound states in the continuum through giant atoms [0.0] 連続体(BIC)における境界状態は、拡張状態のスペクトルに埋め込まれた空間的局所化モードである。
我々は、巨大原子、量子エミッタが非局所的に構造導波路と結合し、ロバストなダブルロンBICをホストできることを示した。
この結果から、オープン量子系における多体局在の安定化のための干渉に基づく機構が明らかとなった。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:02:13 GMT)
Deterministic coupling of ultracold atomic lattice to a suspended photonic waveguide [0.0] 吊り下げられたオンチップフォトニック回路で伝播する光への超低温原子格子の決定論的結合。
これらの能力は、中性原子量子コンピュータやシミュレータのスケーラビリティ問題に対処するために開放される。
制御可能な量子物質以外にも、このプラットフォームは光とナノスケール構造のエバネッセント場をその場で撮像することができる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:01:09 GMT)
Deep Gaussian Process Proximal Policy Optimization [0.0] 強化学習のための不確実性推定(RL)は、エージェントが安全な探索と効率的な学習のバランスをとる必要がある制御タスクにおいて重要な要素である。
本稿では,Deep Gaussian Process Proximal Policy Optimization (GPPO)を紹介する。
GPPOは、標準の高次元連続制御ベンチマークにおけるプロキシポリシー最適化に関する競争性能を維持しつつ、より安全で効果的な探索を知らせる確実性評価を提供する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 23:13:04 GMT)
DELTA: Language Diffusion-based EEG-to-Text Architecture [0.0] DELTAを導入し、Residual Vector Quantization (RVQ) EEGトークンとマスク付き言語拡散モデル(LLaDA)を組み合わせた。
ZuCo上では、DELTAは、単語レベル条件下でBLEU-1 21.9とROUGE-1 F 17.2を達成し、自己回帰ベースライン上で最大5.37ポイントのセマンティックアライメントを改善する。
これらの結果により、小さなEEGテキストデータセットから信頼性の高いテキスト生成が可能となり、スケーラブルなマルチモーダルEEG言語モデルへ向けられる。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 10:30:11 GMT)
Conformal Prediction for Compositional Data [0.0] 本稿では、量子的残差に基づく分割共形手法と、高速な座標フロア近似と内部格子微細化を組み合わせた高密度領域戦略を導入し、シャープネスを回復する。
ホモスセダスティックおよびヘテロスセダスティックな設計にまたがる総合的なモンテカルロの研究は、量子的残留および格子精製されたHDR法が、名目上の90%レベルに近い経験的カバレッジを達成することを示した。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 17:57:39 GMT)
Coherence of quantum non-Gaussian states via nonlinear absorption of quanta [0.0] 飽和系における量子非ガウス状態の生成方法を示す。
状態はフォック状態にのみ近づき、従って量子コヒーレンスを示さない。
このケースは、不飽和吸収器(oscillator)を含むように拡張し、線形吸収と非線形吸収の切り替えを分析する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:18:44 GMT)
CAPIRE Intervention Lab: An Agent-Based Policy Simulation Environment for Curriculum-Constrained Engineering Programmes [0.0] ラテンアメリカのエンジニアリングプログラムは、より正確な早期警戒モデルにもかかわらず、頑丈に高い水準を維持しているドロップアウト率を生み出している。
予測学習分析は、リスクのある生徒を識別できるが、具体的な政策の組み合わせを実装するためのガイダンスは限られている。
本稿では,予測モデルを補完するエージェントベースのシミュレーション環境であるCAPIREインターベンションラボを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 18:14:15 GMT)
Building Browser Agents: Architecture, Security, and Practical Solutions [0.0] 本稿では,実運用ブラウザエージェントの構築と運用から得られた知見について述べる。
モデル能力はエージェントのパフォーマンスを制限しない。
現実世界のインシデントに対するセキュリティ分析は、インジェクションの迅速な攻撃によって、汎用的な自律運転が基本的に安全でないことを明らかにしている。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 12:18:35 GMT)
Brute-force positivization of $J_1-J_2$ model ground states [0.0] 周期的境界条件と開境界条件の違いを示す。
また、シミュレートされたスピン鎖のパリティに符号構造が依存していることを確立する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 07:47:25 GMT)
Bayesian Calibration of Engine-out NOx Models for Engine-to-Engine Transferability [0.0] エンジンアウトNOxは、厳しい排出規制を満たすために不可欠である。
従来のアプローチは、少数のエンジンのデータに基づいて訓練されたモデルに依存していた。
本稿では,ガウス過程と近似ベイズ計算を組み合わせてセンサバイアスを推定・補正するベイズ校正フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 20:10:38 GMT)
Attractor Subspace and Decoherence-Free Algebra of Quantum Dynamics [0.0] ハイゼンベルク図形の有限次元開量子系の力学に関するいくつかの結果について議論する。
我々は、非コヒーレンス自由代数がIII型フォン・ノイマン代数であるマルコフ進化の例を示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 11:18:39 GMT)
An operator splitting analysis of Wasserstein--Fisher--Rao gradient flows [0.0] Wasserstein-Fisher-Rao(WFR)勾配流は、最近強力なサンプリングツールとして提案されている。
ステップサイズと演算子順序の規則的な選択により、分割スキームは正確なWFRフローよりも高速に目標分布に収束できることを示す。
この目標に向けてのステップとして、WFR勾配流は対数凹凸を保ち、WFRに対する最初の鋭い崩壊バウンドを得ることを示す。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:37:53 GMT)
Adversarial Pseudo-replay for Exemplar-free Class-incremental Learning [0.0] Exemplar-free class-incremental Learning (EFCIL) は、ストレージの制約やプライバシー上の懸念により、以前のイメージを保存することなく、新しいクラスを学習しながら、以前のタスクで得た古い知識を維持することを目的としている。
本稿では,新たなタスクのイメージを敵攻撃で摂動させる手法であるAPRを導入し,オンライン上で擬似再生画像を再生サンプルを保存せずに合成する。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:20:09 GMT)
A Lightweight, Interpretable Deep Learning System for Automated Detection of Cervical Adenocarcinoma In Situ (AIS) [0.0] AISと正常頸部腺組織との鑑別が可能な深層学習型仮想病理支援システムを開発した。
モデル全体の精度は0.7323で、F1スコアはAbnormalクラスが0.75、Normalクラスが0.71である。
これらの知見は, 頚腺病理における軽快な形態, 解釈可能なAIシステムの実現可能性を示している。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 13:48:37 GMT)
A Lightweight Approach to Detection of AI-Generated Texts Using Stylometric Features [0.0] 我々は、軽量検出器クラスで最高の性能を実現する軽量なアプローチであるNEULIFを紹介する。
提案手法では、まずテキストをテクスチャと可読性に分解し、その後、コンパクト畳み込みニューラルネットワーク(CNN)やランダムフォレスト(RF)によって分類する。
モデルはCNNで97%の精度(0.95F1)、ランダムフォレストで95%の精度(0.94F1)を達成し、高い精度とリコールを示し、ROC-AUCのスコアはそれぞれ99.5%と95%である。
論文参考訳(メタデータ) (Sat, 22 Nov 2025 08:08:03 GMT)