Vision-Language-Action Models for Autonomous Driving: Past, Present, and Future [125.9] VLA(Vision-Language-Action)フレームワークは、認識と言語に基づく意思決定を統合する。
VLAフレームワークは、より解釈可能で、一般化可能で、人間に準拠した運転ポリシーへの道筋を提供する。
この研究は、人間と互換性のある自動運転システムを構築するための一貫性のある基盤を確立することを目的としている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:37:43 GMT)
In defense of the two-stage framework for open-set domain adaptive semantic segmentation [114.1] Open-Set Domain Adaptation for Semantic Training (OSDA-SS)は、既知のクラスに対するドメイン適応と未知の区別の両方を必要とする。
そこで我々は,OSDA-SSを未知の分離と未知のドメイン適応という2つの逐次ステップで扱う分離適応訓練戦略SATSを提案する。
本手法は,未知のクラスと未知のクラスの両方に対する識別的特徴のバランスの取れた学習を保証し,真に未知のオブジェクトの発見に向けてモデルを操る。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:58:03 GMT)
Evidence for a two-dimensional quantum glass state at high temperatures [108.9] 量子多体系の障害はエルゴード相と非エルゴード相の遷移を駆動することができる。
乱れた景観における有限温度での相互作用するスピンモデルについて検討する。
その結果,2次元システムではエルゴード相からの遷移が存在することがわかった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:09:50 GMT)
NitroGen: An Open Foundation Model for Generalist Gaming Agents [101.4] NitroGenは、ジェネラリストゲームエージェントのためのビジョンアクション基盤モデルである。
1000以上のゲームで4万時間のゲームプレイビデオでトレーニングされている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:24:50 GMT)
Digital Twin AI: Opportunities and Challenges from Large Language Models to World Models [96.0] 物理的システムの正確なデジタル表現としてのデジタルツインは、受動的シミュレーションツールからインテリジェントで自律的なエンティティへと進化してきた。
本稿では,デジタルツインライフサイクルにおけるAI統合を特徴付ける4段階統合フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:17:09 GMT)
Dream-VL & Dream-VLA: Open Vision-Language and Vision-Language-Action Models with Diffusion Language Model Backbone [93.0] 拡散型大規模言語モデルに基づく視覚言語モデルの構築の可能性について検討する。
本稿では,最先端の性能を実現するオープン拡散型VLMであるDream-VLを紹介する。
我々はDream-VLAというdLLMベースのビジョン・ランゲージ・アクション・モデルを構築し、オープンなロボットデータセット上で連続的な事前トレーニングによって開発する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:15:28 GMT)
Let It Flow: Agentic Crafting on Rock and Roll, Building the ROME Model within an Open Agentic Learning Ecosystem [90.2] 本稿では,エージェントモデルの生産パイプラインを最適化する基盤インフラであるエージェント学習エコシステム(ALE)を紹介する。
ALEは、重量最適化のためのトレーニング後のフレームワークであるROLL、軌道生成のためのサンドボックス環境マネージャであるROCK、効率的なコンテキストエンジニアリングのためのエージェントフレームワークであるiFlow CLIの3つのコンポーネントで構成されている。
ROMEはALEが基盤として100万件以上のトラジェクトリをトレーニングしたオープンソースエージェントです。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:35:57 GMT)
SGD-Based Knowledge Distillation with Bayesian Teachers: Theory and Guidelines [82.0] 知識蒸留(英: Knowledge Distillation, KD)は、大きな教師ネットワークから、しばしばソフト確率出力を利用して、より小さな学生モデルに知識を伝達する中心的なパラダイムである。
グラディエント・Descent (SGD) を訓練した学生の収束行動の厳密に分析する。
分析の結果,BCPからの学習は分散の低減と収束境界の近傍項の除去に寄与することがわかった。
これらの知見に触発されて、我々は、通常、KDの教師として、BCPの見積もりを改善するベイズ深層学習モデルの使用を提唱する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:09:49 GMT)
LACONIC: Dense-Level Effectiveness for Scalable Sparse Retrieval via a Two-Phase Training Curriculum [73.8] LACONICは、Llama-3アーキテクチャに基づく学習されたスパースレトリバーのファミリーである。
8Bの派生型はMTEB Retrievalベンチマークで最先端の60.2 nDCGを達成し、リーダーボードで15位となった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:42:20 GMT)
DeepInv: A Novel Self-supervised Learning Approach for Fast and Accurate Diffusion Inversion [65.5] 拡散インバージョンは、実行可能な監視信号が欠如しているため、難しい課題である。
本稿では,Deep Inversion(DeepInv)と呼ばれる自己教師付き拡散インバージョン手法を提案する。
DeepInvはまた、パラメータ化インバージョンソルバをトレーニングするための反復的かつマルチスケールのトレーニングシステムも備えている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:27:26 GMT)
Pretraining Frame Preservation in Autoregressive Video Memory Compression [65.5] 我々は、長いビデオを短い文脈に圧縮するニューラルネットワーク構造であるPFPを提案する。
ベースラインモデルは、20秒のビデオを約5kの長さのコンテキストに圧縮することができ、ランダムフレームは知覚的に保存された外観で検索することができる。
我々は、このフレームワークを合理的な設定で評価し、可能なニューラルアーキテクチャ設計のトレードオフについて議論する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:49:37 GMT)
Leveraging Flatness to Improve Information-Theoretic Generalization Bounds for SGD [64.1] 情報理論(IT)一般化境界は学習アルゴリズムの一般化の研究に用いられている。
本稿では, 平坦度の高いSGDに対して, より平坦度の高いITを導出する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:17:50 GMT)
OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment [63.7] OpenNoveltyは、透明で証拠に基づく新規性分析のためのエージェントシステムである。
回収された実論文のすべての評価を根拠にし、検証可能な判断を確実にする。
OpenNoveltyは、公正で一貫性があり、エビデンスに支えられたピアレビューを促進するスケーラブルなツールで、研究コミュニティに力を与えることを目指している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:48:51 GMT)
Style Amnesia: Investigating Speaking Style Degradation and Mitigation in Multi-Turn Spoken Language Models [61.5] 音声言語モデル(SLM)が特定の話し方で話すように指示された場合、対話の繰り返しの後、必要な話し方を維持することはできない。
我々は、感情、アクセント、音量、発話速度など、パラ言語的な話し方に焦点を当てる。
明示的にスタイルインストラクションをリコールするようモデルに要求することは、部分的にスタイルアムネシアを軽減することができる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:36:25 GMT)
RoboMirror: Understand Before You Imitate for Video to Humanoid Locomotion [59.5] 最先端のヒューマノイド・ロコモーションシステムは、修正されたモーションキャプチャ・トラジェクトリまたはテキストコマンドに依存している。
模倣前の理解」を具現化した最初の自由な動画移動フレームワークであるRoboMirrorを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:45:19 GMT)
Investigating the Multilingual Calibration Effects of Language Model Instruction-Tuning [58.4] 本研究は,多言語設定における大規模言語モデル(LLM)の校正における重要なギャップについて考察する。
低リソース言語であっても、高リソース言語SFTデータセットのインストラクションチューニング後にモデルの信頼性が著しく向上する可能性がある。
しかし、精度の改善は限界的あるいは存在しないものであり、多言語言語における標準SFTの重大な欠点を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:29:12 GMT)
How Does Prefix Matter in Reasoning Model Tuning? [57.7] 推論(数学)、コーディング、安全性、事実性の3つのコアモデル機能にまたがる3つのR1シリーズモデルを微調整します。
その結果,プレフィックス条件付きSFTでは安全性と推論性能が向上し,Safe@1の精度は最大で6%向上した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 18:04:23 GMT)
EscherVerse: An Open World Benchmark and Dataset for Teleo-Spatial Intelligence with Physical-Dynamic and Intent-Driven Understanding [56.9] 本稿では,Teleo-Spatial Intelligence(TSI)について紹介する。
本稿では、大規模なオープンワールドベンチマーク(Escher-Bench)、データセット(Escher-35k)、モデル(Escherシリーズ)からなるEscherVerseを紹介する。
これはIntent-Driven Reasoningを体系的に評価する最初のベンチマークである。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:42:39 GMT)
Do You Have Freestyle? Expressive Humanoid Locomotion via Audio Control [52.8] 現在のヒューマノイドロボットには表現力のある即興能力がなく、事前に定義された動きやスパースコマンドに限られている。
音声から音楽駆動ダンスと音声駆動の音声合成ジェスチャーを直接生成できる,最初の統合型音声-音声合成フレームワークであるRoboPerformを提案する。
RoboPerformは、多様な動きパターンに適応するためのResMoEポリシーと、オーディオスタイル注入のための拡散ベースの学生ポリシーを実現している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:49:24 GMT)
SAFE-QAQ: End-to-End Slow-Thinking Audio-Text Fraud Detection via Reinforcement Learning [52.3] 既存の不正検出方法は、書き起こされたテキストに依存しており、ASRのエラーや、声調や環境条件のような重要な音響的手がかりが欠けている。
音声に基づくスロー思考詐欺検出のためのエンドツーエンド包括的フレームワークSAFE-QAQを提案する。
本フレームワークは,ライブコール中に動的リスクアセスメントフレームワークを導入し,不正の早期検出と防止を可能にする。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:09:07 GMT)
OpenRT: An Open-Source Red Teaming Framework for Multimodal LLMs [52.3] MLLMの安全性評価のための統一的,モジュール型,高スループットのRed-teamingフレームワークであるOpenRTを紹介した。
OpenRTのコアとなるのは,5次元にわたるモジュール分離を可能にする対角カーネルを導入することで,自動化された再チームのパラダイムシフトだ。
このフレームワークは、ホワイトボックス勾配、マルチモーダル摂動、高度なマルチエージェント進化戦略など、37の多様な攻撃手法を統合している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:41:33 GMT)
DrivingGen: A Comprehensive Benchmark for Generative Video World Models in Autonomous Driving [49.1] 我々は、生成駆動世界モデルのための最初の総合的なベンチマークであるDrivingGenを提示する。
DrivingGenは、駆動データセットとインターネットスケールのビデオソースの両方から収集されたさまざまな評価データセットを組み合わせる。
一般的なモデルは良く見えるが物理を破るが、運転に特化したものは現実的に動きを捉えているが、視界の質は遅れている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:36:21 GMT)
Utilizing Earth Foundation Models to Enhance the Simulation Performance of Hydrological Models with AlphaEarth Embeddings [48.5] 本研究は,AlphaEarth Foundationの埋設物が,流域特性を説明するためのより有益な方法であるかどうかを考察する。
トレーニングに使用しない流域内の流れを予測した場合, 精度の高いモデルが得られた。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:14:16 GMT)
Unified Generation and Self-Verification for Vision-Language Models via Advantage Decoupled Preference Optimization [48.1] 本稿では,一つの政策の中で回答生成と自己検証を共同で学習する統合強化学習フレームワークを提案する。
ADPOは最大で+34.1%高い検証AUCと-53.5%低い推論時間を実現し、MathVista/MMMUでは+2.8%/+1.4%の精度、ReasonSegでは+1.9 cIoU、AndroidControl/GUI Odysseyでは+1.7%/+1.0%のステップ成功率を持つ。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:09:33 GMT)
JMedEthicBench: A Multi-Turn Conversational Benchmark for Evaluating Medical Safety in Japanese Large Language Models [47.2] JMedEthicBenchは,大規模言語モデルの医療安全性を評価するための,最初のマルチターン対話型ベンチマークである。
デュアルLLMスコアリングプロトコルを用いて27のモデルを評価し,医療特化モデルでは脆弱性が増大するのに対して,商業モデルは堅牢な安全性を維持していることを確認した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 18:18:18 GMT)
SmoothSync: Dual-Stream Diffusion Transformers for Jitter-Robust Beat-Synchronized Gesture Generation from Quantized Audio [45.2] コ音声ジェスチャー生成は、音声同期型人間的なジェスチャーを合成することを目的とした研究の重要領域である。
本稿では,新しいDiffusion Transformer(DiT)アーキテクチャにおいて,量子化オーディオトークンを利用する新しいフレームワークであるSmoothSyncを提案する。
BEAT2とSHOWデータセットの実験では、SmoothSyncの優位性、FGDの-30.6%、Smooth-BCの10.3%、BEAT2の8.4%、そしてジッタとフットのスライディングの-62.9%、-17.1%よりも優れていた。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:53:07 GMT)
Advanced Global Wildfire Activity Modeling with Hierarchical Graph ODE [44.7] 我々は,山火事の連続的時間的ダイナミクスを学習するための新しいフレームワークである階層ODE(HiGO)を紹介した。
我々は、HiGOが長距離の山火事予測において最先端のベースラインを著しく上回っていることを実証した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:05:45 GMT)
Logics-STEM: Empowering LLM Reasoning via Failure-Driven Post-Training and Document Knowledge Enhancement [44.6] 本稿では、Logics-STEM-SFT-Datasetに基づいて、最先端の推論モデルであるLogics-STEMを提案する。
Logics-STEMは、STEM関連のベンチマークでは8Bスケールで次のベストモデルよりも平均4.68%向上している。
我々はLogics-STEMモデルとLogics-STEM-SFT-Datasetの両方を公開し、オープンソースコミュニティにおける将来の研究を支援する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:23:18 GMT)
SWE-Lego: Pushing the Limits of Supervised Fine-tuning for Software Issue Resolving [44.2] SWE-Lego(SWE-Lego)は、ソフトウェアエンジニアリング(SWE)問題解決における最先端のパフォーマンスを達成するために設計された教師付き微調整(SFT)レシピである。
SWE-Legoは3つのコアビルディングブロックから構成される。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:07:27 GMT)
Adaptive Diffusion-based Augmentation for Recommendation [43.9] 本稿では,制御可能な負のサンプルを生成するために,Adaptive Diffusion-based Augmentation for Recommendation (ADAR)を提案する。
ADARは正から負への連続的な遷移をシミュレートし、サンプル硬さのきめ細かい制御を可能にする。
ADARは広く互換性があり、既存のレコメンデーションモデルの性能を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:29:45 GMT)
EmoHarbor: Evaluating Personalized Emotional Support by Simulating the User's Internal World [43.2] EmoHarborは、ユーザの内界をシミュレートする自動評価フレームワークである。
Chain-of-Agentアーキテクチャを使用して、ユーザの内部プロセスを3つの特別な役割に分解する。
EmoHarborは再現性が高くスケーラブルなフレームワークを提供し、よりニュアンスでユーザ対応の感情支援システムの開発と評価をガイドする。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:46:51 GMT)
MOSS Transcribe Diarize: Accurate Transcription with Speaker Diarization [42.0] 話者対応のタイムスタンプ・トランセプションは,各話者の発話のタイミングを正確に決定することを目的としている。
既存のSATSシステムでは、エンド・ツー・エンドの定式化はまれであり、コンテキストウィンドウの制限、長距離スピーカーメモリの弱い、タイムスタンプの出力ができないといった制約がある。
本稿では,MOSS Transcribe Diarizeについて述べる。MOSS Transcribe Diarizeはマルチモーダルな大規模言語モデルで,エンドツーエンドのパラダイムで話者属性,時間スタンプの転写を行う。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:01:10 GMT)
From Failure to Mastery: Generating Hard Samples for Tool-use Agents [40.3] HardGenは、検証可能な推論を備えたハードツール使用トレーニングサンプルを生成するように設計された自動エージェントパイプラインである。
高度なツールとハードクエリにより、検証可能な複雑なChain-of-Thought(CoT)の生成が可能になる
私たちのコード、モデル、データセットは、将来の研究を促進するためにオープンソース化されます。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:56:33 GMT)
MedKGI: Iterative Differential Diagnosis with Medical Knowledge Graphs and Information-Guided Inquiring [39.8] 臨床実践を基盤とした診断フレームワークであるMedKGIを提案する。
MedKGI は診断精度と検査効率の両方において強力な LLM ベースラインより優れていることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:47:36 GMT)
NL2Dashboard: A Lightweight and Controllable Framework for Generating Dashboards with LLMs [38.1] ダッシュボード生成のための軽量フレームワークであるNL2Dashboardを提案する。
ダッシュボードの内容、レイアウト、視覚要素をカプセル化する構造化中間表現(IR)を導入する。
この枠組みに基づいて、IR駆動型アルゴリズムを一組のツールとしてインスタンス化するマルチエージェントシステムの開発を行う。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:26:04 GMT)
Action-Sketcher: From Reasoning to Action via Visual Sketches for Long-Horizon Robotic Manipulation [37.8] 長距離ロボット操作は、現実世界の展開においてますます重要になっている。
既存のエンドツーエンドおよび階層的なビジョン・ランゲージ・アクションポリシーは、しばしばテキストのみの手がかりに依存している。
ロボットの現在のビューに、ポイント、ボックス、矢印、型付き関係を描画する、不可解な視覚中間体であるVisual Sketchを導入する。
本稿では,サイクリックSee-Think-Sketch-Actワークフローで動作するVLAフレームワークであるAction-Sketcherを紹介する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:53:42 GMT)
COVR:Collaborative Optimization of VLMs and RL Agent for Visual-Based Control [37.3] 視覚強化学習(RL)は、複雑なタスクにおける高次元観察により、サンプル効率の低下に悩まされる。
我々は,VLMおよびRLポリシーの相互強化を可能にする協調最適化フレームワークであるCOVRを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:53:05 GMT)
UltraEval-Audio: A Unified Framework for Comprehensive Evaluation of Audio Foundation Models [36.7] UltraEval-Audioは、オーディオ基礎モデルの統一評価フレームワークである。
10の言語と14のコアタスクカテゴリをサポートし、24の主流モデルと36の信頼できるベンチマークをシームレスに統合する。
オーディオコーデックに新しい包括的評価手法を採用し、3つの重要な領域で性能を評価する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:54:12 GMT)
MM-Sonate: Multimodal Controllable Audio-Video Generation with Zero-Shot Voice Cloning [34.4] MM-Sonateは、制御可能な音声とビデオのジョイント生成とゼロショット音声のクローン機能を統合するマルチモーダルフローマッチングフレームワークである。
ゼロショット音声のクローニングを可能にするため,言語コンテンツから話者識別を効果的に分離する分類器注入機構を導入する。
MM-Sonateがジョイントジェネレーションベンチマークで新しい最先端性能を確立していることを示す実証評価を行った。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:26:15 GMT)
PLA-Serve: A Prefill-Length-Aware LLM Serving System [33.3] PLA-Serveは、TTFTレイテンシを低減するために、異なるプロンプト長でリクエストを特定し、分解する。
提案手法は,適応型スケジューリング戦略のモチベーションとして,応答長の変動がボトルネックを生じさせることを観察する。
PLA-Serveは、プリフィル*-Lang*デコードデアグリゲーションの下でのバニラSGと比較して、プリフィル遅延を30%以上削減する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 18:14:24 GMT)
PartImageNet++ Dataset: Enhancing Visual Models with High-Quality Part Annotations [31.7] 我々は、ImageNet-1Kのすべてのカテゴリに詳細な部分アノテーションを提供するデータセットであるPartImageNet++ (PIN++)を紹介した。
カテゴリ毎に100の注釈付きイメージがあり、合計で100KイメージであるPIN++は、さまざまなオブジェクトカテゴリをカバーする最も包括的なデータセットである。
画像Net-1K上でのロバストな分類のためのMPM(Multiscale Part-supervised Recognition Model)を提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:43:49 GMT)
CaveAgent: Transforming LLMs into Stateful Runtime Operators [31.5] CaveAgentは"LLM-as-Text-Generator"から"LLM-as-as-Runtime"にパラダイムを変換するフレームワークです。
CaveAgentは小売業のタスクで10.5%の成功率の向上を実現し、マルチターンシナリオではトークン総消費を28.4%削減している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:32:47 GMT)
AppellateGen: A Benchmark for Appellate Legal Judgment Generation [30.9] 7,351対のケースペアからなる第2のインスタンス法定判断生成のためのベンチマークであるAppellateGenを紹介する。
このタスクは、最初の評決と明らかな更新について推論することで、法的に拘束力のある判断を起草するモデルを必要とする。
本稿では,SOPに基づく法的マルチエージェントシステム(SLMAS)を提案し,その生成過程を個別の課題識別,検索,起草の段階に分解する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:15:17 GMT)
BARE: Towards Bias-Aware and Reasoning-Enhanced One-Tower Visual Grounding [30.7] 本稿では,1towerビジュアルグラウンドティングのためのバイアス認識および推論強化フレームワークであるBAREを提案する。
BAREは最先端の性能を達成し,既存手法と比較して計算効率が優れていることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:30:06 GMT)
Slot-ID: Identity-Preserving Video Generation from Reference Videos via Slot-Based Temporal Identity Encoding [30.6] 拡散変圧器ビデオジェネレータの同一条件の変種について述べる。
短いクリップでは、ポーズや照明を横切る笑顔の作り方など、主題固有のパターンが明らかになっている。
このアプローチは、大きなポーズの変化と表現力のある顔行動の下で、恒常的にアイデンティティの保持を改善する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:41:55 GMT)
VReID-XFD: Video-based Person Re-identification at Extreme Far Distance Challenge Results [30.2] VReID-XFDは、地上と地上の人物を再識別するためのビデオベースのベンチマークとコミュニティチャレンジである。
371のアイデンティティ、11,288のトラックレット、11.75万のフレームで構成され、5.8mから120mの高度で捕獲されている。
空対空、地上対地、地上対空の評価を厳密な個人分離の下でサポートしている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:27:16 GMT)
Beyond Gemini-3-Pro: Revisiting LLM Routing and Aggregation at Scale [29.2] 大きな言語モデル(LLM)は急速に進歩し、Gemini-3-Proは新たなパフォーマンスマイルストーンを設定している。
我々は、モノリシックなスケーリングの代替手段として集合的インテリジェンスを探求し、オープンソースのLLMのコラボレーションがGemini-3-Proを上回ることを実証する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:05:52 GMT)
ParkGaussian: Surround-view 3D Gaussian Splatting for Autonomous Parking [27.9] パーキングは自動走行システム(ADS)にとって重要な課題であり、混雑する駐車スペースやGPS搭載環境に特有の課題がある。
既存の作業は2D駐車スロットの認識、マッピング、ローカライゼーションに重点を置いている。
本稿では,3次元ガウシアンスプラッティング(3DGS)を統合した駐車シーン再構築のための最初のフレームワークであるParkGaussianを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 05:54:13 GMT)
Quantum simulation with Rydberg ions in a Penning trap [27.2] 実験により,MHzの次数におけるスピンスピン相互作用の強度は実測的な条件下で達成可能であることを示す。
我々のプラットフォームは、電子Rydberg状態間の強い双極子相互作用と、ペニングトラップによって提供される平面閉じ込めを利用する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 18:11:49 GMT)
AirSpatialBot: A Spatially-Aware Aerial Agent for Fine-Grained Vehicle Attribute Recognization and Retrieval [25.2] 空間認識型データセットAirSpatialを導入し,206K以上の命令を含む。
3DBBを提供する最初のリモートセンシンググラウンドデータセットである。
本研究では,航空機属性の微粒化認識と検索が可能な航空エージェントAirSpatialBotを開発した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:38:51 GMT)
Garment Inertial Denoiser (GID): Endowing Accurate Motion Capture via Loose IMU Denoiser [24.8] GID(Garment Inertial Denoiser)は,ゆるいMoCapを3段階に分解する軽量なプラグアンドプレイ変換器である。
GIDは位置認識の専門家アーキテクチャを使用し、共有時間バックボーンはグローバルな動きをモデル化し、IMUの専門家の頭文字は局所力学を専門とする。
実験により、GIDはシングルユーザートレーニングから正確なリアルタイムデノジングを可能にし、目に見えないユーザー、動き、衣服にまたがる一般化を可能にする。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:08:21 GMT)
Beyond Patches: Global-aware Autoregressive Model for Multimodal Few-Shot Font Generation [24.4] わずかなショットフォント生成(FFG)モデルは、限られた参照から構造的整合性とスタイル的忠実性を維持するのに苦労する。
マルチモーダルな少数ショットフォント生成のための新しいARフレームワークであるGAR-Fontを提案する。
GAR-Fontは既存のFFG手法より優れ、グローバルなスタイルの忠実さを維持し、テキストスタイリスティックなガイダンスで高品質な結果を達成する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:46:13 GMT)
Learnability-Driven Submodular Optimization for Active Roadside 3D Detection [24.3] 本研究は,道路側モノクロ3次元物体検出のための能動的学習に焦点を当てた。
本稿では,情報的かつ確実にラベル付け可能なシーンを選択する学習可能性駆動型フレームワークを提案する。
実験の結果, 自動車, 歩行者, 自転車のフルパフォーマンスの86.06%, 67.32%, 78.67%がLH3Dであることがわかった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 23:59:06 GMT)
LANCET: Neural Intervention via Structural Entropy for Mitigating Faithfulness Hallucinations in LLMs [24.0] 大規模言語モデルは情報処理に革命をもたらしたが、その信頼性は忠実な幻覚によって著しく損なわれている。
構造エントロピーと幻覚の差分比を活用することによって、正確な神経介入を実現する新しいフレームワークであるLancetを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:41:28 GMT)
EternalMath: A Living Benchmark of Frontier Mathematics that Evolves with Human Discovery [23.5] 我々は、フロンティア数学的推論を評価するための完全自動化された定理基底パイプラインを提案する。
このパイプラインは、最近のピアレビューされた数学的文献を実行可能で検証可能な推論タスクに変換する。
このパイプラインを適用すると、現代の研究論文から派生した進化的評価スイートである textbfEternalMath が生成される。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:40:25 GMT)
Animated 3DGS Avatars in Diverse Scenes with Consistent Lighting and Shadows [23.5] アニメーション3Dガウススティング(3DGS)アバターが3DGSシーンと相互作用したり、他の静的シーンに挿入された動的オブジェクトと相互作用する場合に、一貫した照明と影を与える方法を提案する。
鍵となる貢献はDGSM(Deep Gaussian Shadow Map)であり、これは3DGSのボリューム表現に合わせた古典的なシャドウマッピングアルゴリズムの現代的な類似体である。
我々は、AvatarXとActorHQのアバターの環境一貫した照明をScanNet++、DL3DV、SuperSplatのシーンに合成し、挿入されたオブジェクトとのインタラクションを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:42:06 GMT)
AHA: Aligning Large Audio-Language Models for Reasoning Hallucinations via Counterfactual Hard Negatives [22.6] AHA(Audio Hallucination Alignment)フレームワークを紹介します。
Qwen-Audio-AHAはAHA-Evalを13.7%改善した。
我々のモデルは、公開ベンチマークでかなりの伸びを示している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:08:19 GMT)
DreamID-V:Bridging the Image-to-Video Gap for High-Fidelity Face Swapping via Diffusion Transformer [21.8] Video Face Swapping (VFS)は、ターゲットのビデオにソースIDをシームレスに注入する必要がある。
既存の方法は、時間的一貫性を維持しながら、アイデンティティの類似性と属性の保存を維持するのに苦労する。
本稿では,画像顔スワッピングの優位性をビデオ領域にシームレスに転送するための包括的フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:07:11 GMT)
Adversarial Instance Generation and Robust Training for Neural Combinatorial Optimization with Multiple Objectives [20.7] 我々は,MOCOPのための優先条件付きDRLソルバのための統一ロバストネス指向フレームワークを提案する。
我々は、解決者の弱点を露呈するハードインスタンスを生成するために、嗜好に基づく敵攻撃を開発する。
また,困難に配慮した選好選択を敵の訓練に組み込む防衛戦略も導入する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:57:43 GMT)
Achieving Fine-grained Cross-modal Understanding through Brain-inspired Hierarchical Representation Learning [20.6] 本稿では,人間の視覚系の階層構造にインスパイアされた,微細なfMRI映像アライメントのための新しいフレームワークであるNeuroAlignを紹介する。
我々のフレームワークは,生物の視覚経路を反映する2段階のメカニズムを実装している。
実験により、NeuroAlignはクロスモーダル検索タスクにおいて既存の手法よりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:54:29 GMT)
How Real is Your Jailbreak? Fine-grained Jailbreak Evaluation with Anchored Reference [20.6] FJARは、アンロックされた参照を持つきめ細かいジェイルブレイク評価フレームワークである。
まず、jailbreakレスポンスを5つの細かいカテゴリに分類します。
そこで我々は,高品質なアンカード参照を構築するために,新しい無害木分解手法を提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:54:24 GMT)
A unified multimodal understanding and generation model for cross-disciplinary scientific research [20.5] FuXi-Uniは、科学的理解と単一のアーキテクチャ内の科学領域にわたる高忠実度生成のためのネイティブ統一マルチモーダルモデルである。
特に、FuXi-Uniは、自然言語トークン内の学際的な科学トークンを整列させ、科学トークンを再構築するために科学デコーダを使用している。
地球システムモデリングにおいて、このモデルは、グローバルな天気予報、熱帯サイクロン(TC)予測の編集、言語命令のみによって駆動される空間的ダウンスケーリングをサポートする。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:31:38 GMT)
SwinIFS: Landmark Guided Swin Transformer For Identity Preserving Face Super Resolution [19.5] 顔の超解像度は、高画質の低解像度入力から高品質の顔画像を取り戻すことを目的としている。
この研究は、構造的先行と階層的注意機構を統合するランドマーク誘導超解像フレームワークであるSwinIFSを紹介する。
CelebAベンチマークの実験では、SwinIFSはより優れた知覚品質、よりシャープな再構築、アイデンティティ保持の改善を実現している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:04:46 GMT)
Lying with Truths: Open-Channel Multi-Agent Collusion for Belief Manipulation via Generative Montage [19.0] 大規模言語モデル(LLM)がリアルタイム情報を合成する自律エージェントに遷移するにつれて、それらの推論能力は予期せぬ攻撃面をもたらす。
本稿では,公衆チャネルを通じて配布される真正な証拠断片のみを用いて,被害者の信念を占拠する新たな脅威について紹介する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:50:23 GMT)
LabelAny3D: Label Any Object 3D in the Wild [18.0] COCO3Dは、MS-COCOデータセットから派生したオープンボキャブラリ単分子3D検出のための新しいベンチマークである。
本稿では,2次元画像から総合的な3Dシーンを再構築し,高品質な3Dバウンディングボックスアノテーションを効率よく生成するインカライズ・バイ・シンセサイザーフレームワークであるLabelAny3Dを紹介する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:03:45 GMT)
Accelerating Storage-Based Training for Graph Neural Networks [18.0] グラフニューラルネットワーク(GNN)は、その強力な表現力によって、さまざまな現実世界の下流タスクにおいてブレークスルーを達成した。
本稿では,新しいストレージベースGNNトレーニングフレームワークであるtextsfAGNESを提案する。
5つの実世界のグラフの実験により、textsfAGNESは、最高の競合相手よりも最大4.1$times$速い4つの最先端メソッドを一貫して上回っていることが明らかになった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:37:14 GMT)
Personalizing black-box models for nonparametric regression with minimax optimality [18.0] そこで本研究では,限定的なサンプル数を用いて,トレーニング済みのブラックボックスモデルを対象ドメインに適応させる,数ショットのパーソナライゼーションについて検討する。
そこで我々は,ブラックボックス事前学習モデルを回帰処理に組み込むアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:32:28 GMT)
DemoBot: Efficient Learning of Bimanual Manipulation with Dexterous Hands From Third-Person Human Videos [18.0] この研究は、デュアルアームのマルチフィンガーロボットシステムが、単一の注釈のないRGB-Dビデオデモから複雑な操作スキルを取得することができる学習フレームワークであるDemoBotを提示する。
生のビデオデータから手と物体の構造化された運動軌跡を抽出する。
これらの軌道は、接触に富んだ相互作用を通じてそれらを洗練することを学ぶ新しい強化学習(RL)パイプラインの運動先として機能する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:06:01 GMT)
Differentiation Between Faults and Cyberattacks through Combined Analysis of Cyberspace Logs and Physical Measurements [17.2] 本稿では,DARシステムにおける未検出故障とサイバー攻撃を区別する非自明なアプローチを提案する。
具体的には、新しい仮想物理変数指向のテイント解析アルゴリズムを用いて、特別な種類の依存性グラフを構築する。
ドメイン固有の知識を捉える一連のパターンは、サイバーと物理的側面の間のセマンティックギャップを橋渡しするために導かれる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:29:06 GMT)
FC-CONAN: An Exhaustively Paired Dataset for Robust Evaluation of Retrieval Systems [16.7] ヘイトスピーチ(HS)は、オンライン談話において重要な問題である。
これに対抗するための有望な戦略の1つは、反ナラティブ(CN)の使用である。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:38:46 GMT)
Time-Dependent Hamiltonian Simulation in the Low-Energy Subspace [16.6] ハミルトンシミュレーションは、断熱量子計算、量子制御、量子多体物理学において重要なサブルーチンである。
低エネルギーのサブスペースで初期状態がサポートされていることを前提として、標準的な性能保証をどの程度改善できるかを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:50:15 GMT)
Benchmarking Continuous Dynamic Multi-Objective Optimization: Survey and Generalized Test Suite [16.4] 本稿では,DMOOベンチマークを構築するための原則的フレームワークを提案する。
本研究では,不規則な環境変化をシミュレートするために時間摂動機構を導入し,一般化された時間リンク機構を提案する。
この研究は、動的多目的最適化ベンチマークのための新しい標準を確立し、次世代アルゴリズムの開発と評価のための強力なツールを提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:03:20 GMT)
Bridging the gap: A comparative exploration of Speech-LLM and end-to-end architecture for multilingual conversational ASR [16.1] 本稿では、細調整されたWhisperとmHuBERTエンコーダをLLMと組み合わせたLLMベースのASRフレームワークを提案する。
CER/WERは10.69%で、上位1位にランクインしている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:08:53 GMT)
Segmentation and Processing of German Court Decisions from Open Legal Data [16.0] この研究は、公式のOpen Legal Dataデータセットから派生した251,038ドイツの裁判所決定の、クリーンでセクション化されたデータセットを導入している。
我々は、ドイツの裁判所決定において、3つの重要な部分、すなわち、テナー(決定の操作部分)、タットベスタント(事件の事実)、エンチェイドゥングスグラーンデ(司法的理由づけ)を体系的に分離した。
得られたコーパスは、RechLフォーマットで公開されており、ドイツの法体系についてさらなる研究を行うためのアクセス可能なリソースとなっている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:30:04 GMT)
Multi-Subspace Multi-Modal Modeling for Diffusion Models: Estimation, Convergence and Mixture of Experts [15.6] 本稿では, 対象データをK$線形部分空間の和としてモデル化する, ガウスモデル(MoLR-MoG)の低ランク混合の混合部分空間を提案する。
このモデリングにより、対応するスコア関数は、自然に専門家(MoE)構造の混合を持ち、マルチモーダル情報をキャプチャし、非線形特性を含む。
この結果から, MoE-latent MoG NN は 10 倍のパラメータを持つ MoE-latent Unet に匹敵する性能を示した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:45:06 GMT)
Latent Space Communication via K-V Cache Alignment [15.2] 我々は、複数のモデルのk-vキャッシュを整列する共有表現空間の学習を提案し、協調のための高帯域チャネルを作成する。
Gemma-2モデルを用いた一連の実験により、このアプローチがシームレスなモデル間通信を可能にするだけでなく、個々のモデルの性能を向上させることを実証した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:15:25 GMT)
Security in the Era of Perceptive Networks: A Comprehensive Taxonomic Framework for Integrated Sensing and Communication Security [15.0] ISAC(Integrated Sensing and Communication)は、6Gランドスケープにおける重要な変化である。
本稿では,ISACのセキュリティ領域全体を網羅する包括的分類体系に研究を合成する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:52:41 GMT)
Communication-Efficient Federated AUC Maximization with Cyclic Client Participation [14.5] AUCは複雑なデータから学習するための強力なアプローチである
一般的なペアワイズAUC損失と$O(1/3)$の不均衡と$O(1/4)$の反復を考える。
PL条件下では、これらは$widetildeO (1/)$の通信複雑性を改善する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 19:57:41 GMT)
LSRE: Latent Semantic Rule Encoding for Real-Time Semantic Risk Detection in Autonomous Driving [14.5] 潜在セマンティックルールフレームワークは、スパースサンプリングされたVLM判断を、繰り返し世界モデルの潜在空間内の決定境界に変換する。
CARLAにおける6つのセマンティック障害シナリオの実験は、LSREが大きなVLMベースラインに匹敵するセマンティックリスク検出精度を得ることを示した。
LSREはさらに、セマンティック類似のテストケースがほとんど見られないように一般化し、言語誘導潜在分類が自律運転におけるセマンティックセーフティ監視に効果的でデプロイ可能なメカニズムを提供することを示している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:50:40 GMT)
Empowering Small Language Models with Factual Hallucination-Aware Reasoning for Financial Classification [13.9] スモール言語モデル(SLM)は、高速な推論とローカルなデプロイ容易性のため、財務分類にますます使われている。
事実の幻覚を緩和することは、SLMの財務分類を改善できるか?
AAAI (Association Identification, Automated Detection, Adaptive Inference) という3段階のパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 05:09:11 GMT)
Language as Prior, Vision as Calibration: Metric Scale Recovery for Monocular Depth Estimation [13.8] 相対深度基礎モデルは良好に伝達されるが、同定不可能なグローバルスケールとドメインシフト感度の上昇により、単分子メートル法深度は未定のままである。
凍結したバックボーンキャリブレーション設定の下では,画像固有のアフィン変換を逆の深さで行い,相対深度バックボーンとCLIPテキストエンコーダを固定しつつ,軽量なキャリブレーションヘッドのみを訓練する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:59:43 GMT)
Benchmarking Quantum Data Center Architectures: A Performance and Scalability Perspective [13.6] 本研究では、分散量子回路実行遅延、リソース競合、スケーラビリティに対する4つの代表的な量子データセンターアーキテクチャの影響について検討する。
この結果から,分散量子性能はトポロジ,スケジューリングポリシ,物理層パラメータによって共同で形成されていることが明らかとなった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:48:02 GMT)
FAR-AMTN: Attention Multi-Task Network for Face Attribute Recognition [13.4] 本研究では,顔属性認識のための新しいマルチタスクネットワークであるFAR-AMTNを紹介する。
Weight-Shared Group-Specific Attention (WSGSA)モジュールが組み込まれている。
CelebAとLFWAデータセットの実験では、提案されたFAR-AMTNは既存のモデルに比べてパラメータが大幅に少ないため、精度が優れていることが示されている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:20:16 GMT)
AIMS: An Adaptive Integration of Multi-Sensor Measurements for Quadrupedal Robot Localization [13.3] AIMSは、退化環境における頑健な四足歩行ロボットの局所化のための適応型LiDAR-IMU-leg odometry fusion法である。
狭い廊下環境において得られた結果から,提案手法は最先端手法と比較して,局所化精度とロバスト性を向上させることが示された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:21:52 GMT)
A large-scale nanocrystal database with aligned synthesis and properties enabling generative inverse design [13.3] 本稿では,大規模で整列したナノ結晶合成・プロパティデータベースの構築について述べる。
私たちの仕事は、構造化されていない文学とデータ駆動の副産物のギャップを埋めます。
また,ナノ結晶発見を加速するための強力な人間-AI協調パラダイムを構築した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:27:40 GMT)
Watch Wider and Think Deeper: Collaborative Cross-modal Chain-of-Thought for Complex Visual Reasoning [12.9] マルチモーダル推論には視覚と言語をシームレスに統合する必要がある。
既存のChain-of-Thoughtメソッドは、クロスモーダルシナリオにおいて2つの重要な制限に悩まされている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:50:55 GMT)
Trustworthy Data-Driven Wildfire Risk Prediction and Understanding in Western Canada [12.8] 近年、カナダ西部における山火事の激化は、社会経済と環境に重大な損失をもたらしている。
本稿では,長期間の時間的モデリングに基づくデータ駆動型山火事リスク予測フレームワークを提案する。
2023年と2024年の火災シーズンでカナダ西部で評価され、提案されたモデルは既存の時系列モデルよりも優れていた。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:05:17 GMT)
A Geometric Approach to Strongly Correlated Bosons: From $N$-Representability to the Generalized BEC Force [12.4] 還元密度行列理論の最近の進歩に基づき、強相関格子ボソンを記述する幾何学的枠組みを開発する。
まず、固定対の相互作用とともに、翻訳対称性が運動量占有数だけで表される正確な関数的定式化を可能にすることを証明した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:10:59 GMT)
The Equivalence between Hardy-type paradox and Logical Contextuality [11.8] 任意の有限シナリオに対して、論理的ハーディ型パラドックスの存在は論理的文脈性と同値であることを示す。
これらの結果は (2,k,2), (2,2,d) および n-サイクルのシナリオに関する先行研究を一般化する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:19:01 GMT)
Multiscale replay: A robust algorithm for stochastic variational inequalities with a Markovian buffer [10.8] 変動不等式(VIs)のクラスを解くためのマルチスケール体験再生(MER)アルゴリズムを提案する。
バッファから一様にサンプリングする代わりに、MERはVVIアルゴリズムの挙動をエミュレートするマルチスケールサンプリング方式を採用している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:05:48 GMT)
Advanced Machine Learning Approaches for Enhancing Person Re-Identification Performance [10.6] 人物再識別(ReID)は、複数のカメラ間でアイデンティティをリンクすることによって、インテリジェントな監視システムにおいて重要な役割を果たす。
ReIDは外見の変化、ドメインシフト、ラベル付きデータ制限といった大きな課題に直面している。
この論文では、教師付き非教師付きドメイン適応(UDA)および完全に教師なし設定下でのReID性能を向上させるための3つの高度なアプローチを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:55:59 GMT)
A New Framework for Explainable Rare Cell Identification in Single-Cell Transcriptomics Data [9.9] 単一セルトランスクリプトミクスデータにおける説明可能な異常検出のためのフレームワークを提案する。
個々の異常を識別し、インスタンスを異常にする遺伝子に基づく視覚的説明を提供する。
最先端の異常検知器と説明器を、各レア細胞と関連する遺伝子サブスペースを見つけるための効率的かつ効果的な手段として用いている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:04:58 GMT)
Noise-Resilient Heisenberg-limited Quantum Sensing via Indefinite-Causal-Order Error Correction [9.7] ノイズ耐性量子情報処理のためのICOベースの量子誤り訂正プロトコルを提案する。
補助的な制御とノイズの進化を不確定な因果順にコヒーレントに配置することにより、結果として生じる非可換的干渉により、補助的なシステムがリアルタイムでエラーを隠蔽し修正することができる。
以上の結果から,ICOは気象QECの強力なリソースであり,ノイズ耐性量子情報処理のための広く適用可能なフレームワークであることがわかった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:02:38 GMT)
Multimodal Fact-Checking: An Agent-based Approach [9.6] 実世界のマルチモーダルファクトチェックのための高品質で説明可能なデータセットであるRW-Postを紹介する。
RW-Postは、実世界のマルチモーダルなクレームと、そのクレームが作成されるリッチなコンテキスト情報を保存するオリジナルのソーシャルメディア投稿を整合させる。
RW-PostをベースとしたエージェントベースのマルチモーダルファクトチェックフレームワークであるAgentFactを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:59:31 GMT)
REE-TTT: Highly Adaptive Radar Echo Extrapolation Based on Test-Time Training [9.4] 深層学習に基づくRadar Echo Extrapolation (REE) が主流となっている。
本稿では,適応型テストタイムトレーニング(TTT)機構を組み込んだ新しいモデルであるREE-TTTを提案する。
クロスリージョンの極端降水シナリオ下での実験では、REE-TTTは予測精度と一般化において最先端のベースラインモデルを大幅に上回っている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:06:48 GMT)
Towards LLM-enabled autonomous combustion research: A literature-aware agent for self-corrective modeling workflows [9.4] FlamePilotは、自動および自己補正CFDによる燃焼モデリング研究を促進するように設計されている。
システムは、科学的な記事から学び、初期設定から最適化された結果までシミュレーションを導くための重要な情報を抽出することができる。
ケーススタディでは、FlamePilotが研究論文を自動で構成されたシミュレーションに変換し、シミュレーションを実行し、結果を後処理し、エビデンスに基づく改善を提案し、収束のために多段階のパラメータスタディを管理した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:00:28 GMT)
DiffKD-DCIS: Predicting Upgrade of Ductal Carcinoma In Situ with Diffusion Augmentation and Knowledge Distillation [9.3] 本研究では,DiffKD-DCISフレームワークを提案する。
このフレームワークは3段階で動作する: まず、条件拡散モデルがデータ拡張のためのマルチモーダル条件を用いて高忠実度超音波画像を生成する。
そして、深層教師ネットワークは、オリジナルデータと合成データの両方からロバストな特徴を抽出する。
最後に,教師から知識蒸留,一般化と計算効率のバランスをとることで,コンパクトな学生ネットワークを学習する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:26:07 GMT)
Non-Hermitian second-order topological insulator with point gap [9.2] 2次元非エルミートSu-Schrieffer-Heegerモデルのギャップにおけるゼロモードコーナー状態は、もはや大規模システムでは有効ではないことを示す。
我々は、安定なゼロモード特異状態と、熱力学極限におけるエネルギースペクトルの位相的に保護されたコーナー状態との対応性を確立する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:21:59 GMT)
iFlip: Iterative Feedback-driven Counterfactual Example Refinement [9.0] iFlipは、モデルの信頼性、特徴属性、自然言語を含む3つのタイプのフィードバックを活用する反復的な改善アプローチである。
以上の結果から,iFlipは5つの最先端ベースラインよりも平均57.8%高い妥当性を示した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:19:45 GMT)
FastV-RAG: Towards Fast and Fine-Grained Video QA with Retrieval-Augmented Generation [8.7] VideoSpeculateRAGは、2つの主要なアイデアに基づいて構築された効率的なVLMベースのRAGフレームワークである。
我々は、抽出された知識において、誤認識という大きなエラーの原因を識別する。
実験により、VideoSpeculateRAGは標準的なRAGアプローチと同等または高い精度を達成することが示された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:46:35 GMT)
The Two-Stage Decision-Sampling Hypothesis: Understanding the Emergence of Self-Reflection in RL-Trained LLMs [8.6] 我々は、報酬勾配が政策コンポーネント間でどのように分散するかを特徴付けるために、グラディエント属性(Gradient Attribution Property)を導入する。
また,SFTとKLの罰則はバランスの取れたグラディエント属性を示すのに対し,サロゲート報酬はバランスの取れたグラディエント属性を示すことが証明された。
また、算術的推論に関する理論的予測を実証的に検証する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:59:15 GMT)
Making MoE based LLM inference resilient with Tarragon [8.0] Tarragonは回復力のあるMoE推論フレームワークで、個々のワーカーへの影響を抑えつつ、パイプラインの残りの部分を前進させる。
Tarragonは、MoEベースのトランスフォーマーにおける注意と専門家の計算を自然に分離し、注意労働者(AW)と専門家労働者(EW)を異なる障害領域として扱う。
現状のメガスケール・インファーと比較して,タラゴンは故障によるストールを160~213倍削減する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:13:31 GMT)
Learning Resilient Elections with Adversarial GNNs [7.9] 学習した投票ルールの表現能力を一般化し、ニューラルネットワークアーキテクチャの改善と敵対的トレーニングを組み合わせることで、投票ルールのレジリエンスを向上させる。
合成と実世界の両方のデータセットに対して,本手法の有効性を評価する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:12:14 GMT)
Scale-Adaptive Power Flow Analysis with Local Topology Slicing and Multi-Task Graph Learning [7.8] 本稿では,スケール適応型マルチタスク・パワーフロー解析(SaMPFA)フレームワークを提案する。
参照不要なマルチタスクグラフ学習(RMGL)モデルは、堅牢な電力フロー予測のために設計されている。
提案モデルでは,それぞれ4.47%,36.82%の精度向上が得られた。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 05:59:41 GMT)
EdgeNeRF: Edge-Guided Regularization for Neural Radiance Fields from Sparse Views [7.8] エッジガイド付きスパースビュー3D再構成アルゴリズムであるEdgeNeRFを提案する。
LLFFデータセットとDTUデータセットの実験は、EdgeNeRFの優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:25:30 GMT)
Image Synthesis Using Spintronic Deep Convolutional Generative Adversarial Network [7.4] 本研究は,合成画像生成のためのCMOS-スピントロニクス深部畳み込み生成ネットワーク(DCGAN)アーキテクチャを提案する。
我々のスピントロニクスDCGANモデルは、グレースケールデータセットとカラーデータセットの両方にわたって、Fashion MNISTで27.5、Anime Faceデータセットで45.4のFr'echet Inception Distances(FID)を達成している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:05:56 GMT)
Exposing Hidden Interfaces: LLM-Guided Type Inference for Reverse Engineering macOS Private Frameworks [7.4] MOTIFは、ツール拡張分析とObjective-C型推論に特化した大きな言語モデルを統合するエージェントフレームワークである。
バイナリを解析可能なインターフェースに変換することで、MOTIFはランタイム内部の体系的な監査のためのスケーラブルな基盤を確立する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 21:44:55 GMT)
ShadowGS: Shadow-Aware 3D Gaussian Splatting for Satellite Imagery [7.3] 3DGSに基づく新しいフレームワークであるShadowGSを提案する。
効率的なレンダリングを維持しながら、幾何学的に一貫した影を正確にモデル化する。
RGB、パンシャーペン、スパースビューの衛星入力など、さまざまな設定で堅牢なパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:33:59 GMT)
Colorful Pinball: Density-Weighted Quantile Regression for Conditional Guarantee of Conformal Prediction [7.3] 我々は、多くの共形法を支える量子レグレッション成分を洗練する。
我々は、結果として生じる過剰なリスクを特徴付ける、正確な非漸近的保証を伴う理論的分析を提供する。
多様な高次元実世界のデータセットの実験では、条件付きカバレッジ性能が著しく改善された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:50:59 GMT)
FALCON: Few-Shot Adversarial Learning for Cross-Domain Medical Image Segmentation [6.9] データを2次元スライスとして処理することで,高精度な3次元ボリュームセグメンテーションを実現するクロスドメイン・ショットセグメンテーションフレームワークであるFALCONを提案する。
FALCONは最も低いハウスドルフ距離のスコアを一貫して達成し、境界精度が優れていることを示す。
結果はラベル付きデータを大幅に減らし、データ拡張をなくし、計算オーバーヘッドを大幅に減らして達成される。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:57:49 GMT)
CONSENT: A Negotiation Framework for Leveraging User Flexibility in Vehicle-to-Building Charging under Uncertainty [6.8] 電気自動車(EV)の成長は、非コーディネート充電による高エネルギーコストに直面している建築事業者と、利便性とフルチャージを優先するドライバーとの衝突を引き起こす。
本稿では、自発的な参加、戦略保護、予算実現性を保証する交渉ベースの枠組みを提案する。
EV充電は、ドライバーに、出発時間や要求された充電状態における控えめな柔軟性に対するインセンティブによって支えられた様々なオプションを提供することによって、戦略的リソースに変換される。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:59:52 GMT)
Unsupervised SE(3) Disentanglement for in situ Macromolecular Morphology Identification from Cryo-Electron Tomography [6.8] クライオ電子トモグラフィー(cryo-ET)は、細胞内の高分子を直接3D可視化する。
したがって、モルフォロジーを推定することは、テンプレート形態とSE(3)変換の両方を推定する逆問題である。
既存の予想最大化に基づく解は、しばしば稀だが重要な形態を欠いている。
本稿では,SE(3)変換を表現空間における形態的内容から分離する,非絡み合った深層表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:37:18 GMT)
The Optimal Sample Complexity of Linear Contracts [6.8] 経験的ユーティリティ最大化(EUM)アルゴリズムは、少なくとも1-$の確率で最適線形契約を$varepsilon$-approximation(英語版)する。
我々の証明は、一様収束の強い保証を確立する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:45:17 GMT)
Accelerating Decentralized Optimization via Overlapping Local Steps [6.7] 本稿では,理論的な保証を犠牲にすることなく分散計算を高速化する新しい手法を提案する。
OLDSGD は局部分散 SGDOLDD と同じイテレーションを維持しつつ,通信遅延の異なるレベルにおいて,各項目の収束性を改善していることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:40:22 GMT)
Sampling Strategy Design for Model Predictive Path Integral Control on Legged Robot Locomotion [6.2] 本稿では,足歩行ロボットにおけるモデル予測経路積分(MPPI)フレームワークにおけるサンプリング戦略設計の役割を体系的に検討する。
四足歩行ロボットプラットフォーム上での広範囲なシミュレーションにより、異なるサンプリング戦略が制御の滑らかさ、タスク性能、堅牢性、サンプル効率にどのように影響するかを評価する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:25:37 GMT)
LinMU: Multimodal Understanding Made Linear [5.3] 現代の視覚言語モデル(VLM)は印象的な性能を達成するが、自己注意の二次的な複雑さによって制限される。
本稿では,2次複雑モジュールを使わずに線形複雑性を実現するVLM設計であるLinMUを紹介する。
また,LinMUは教師モデルの性能にマッチするが,TTFT(Time-To-First-Token)を最大2.7$times$に削減し,トークンスループットを最大9.0$times$まで改善することを示した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:17:36 GMT)
Causal discovery for linear causal model with correlated noise: an Adversarial Learning Approach [5.3] 本稿では,f-GANフレームワークに基づくアプローチを提案し,重み値に依存しない二項因果構造を学習する。
この問題は、真のデータ分布とモデル生成分布とのf分割を最小化するのと等価であることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:40:04 GMT)
FLOP-Efficient Training: Early Stopping Based on Test-Time Compute Awareness [5.3] FLOPで測定されたトレーニング計算のスケーリングは、大規模な言語モデルの精度を向上させるために長年にわたって行われてきた。
我々は、中間チェックポイントとそれに対応するTTC構成が、完全に訓練されたモデルの正確さに一致または超えるようなTTC対応トレーニングを導入する。
この知見に基づいて,チェックポイントとTTC構成を共同で選択し,精度を犠牲にすることなくトレーニング計算を最小化する早期停止アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:33:30 GMT)
Soliton Thouless pumping engineered by inter-site nonlinearities [5.2] オンサイト非線形性とサイト間非線形性を有する拡張対角オーブリー・アンドレ・ハーパーモデルにおけるソリトンThoulessポンプについて検討した。
サイト間非線形性により、ソリトンは線形バンドによって予測されるものよりもはるかに遠くに異常な輸送距離を取得できることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:53:24 GMT)
Higher-Order Domain Generalization in Magnetic Resonance-Based Assessment of Alzheimer's Disease [5.2] 多様な分布変化を模倣する高次特徴モーメント(歪と曲率)をブレンドするフレームワークであるExtended MixStyle(EM)を紹介する。
EMはクロスドメイン性能を向上し、最先端ベンチマークよりも平均2.4ポイントのマクロF1を改善した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:25:36 GMT)
Double Machine Learning of Continuous Treatment Effects with General Instrumental Variables [5.0] 継続的な治療の因果効果を推定することは、実際は一般的な問題である。
本稿では,楽器変数を用いた線量応答関数の局所同定のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:29:53 GMT)
Length-Aware Adversarial Training for Variable-Length Trajectories: Digital Twins for Mall Shopper Paths [4.8] 本研究では, 時間スタンプを伴って, 訪れた場所・項目の列を列挙した, エンフェバリアブルな長さ軌跡の生成モデルについて検討する。
軌道長が非常に均一な場合、標準のミニバッチトレーニングは不安定である。
本稿では,bf length-aware sample (LAS) を提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:52:07 GMT)
Bayesian Subspace Gradient Estimation for Zeroth-Order Optimization of Large Language Models [4.7] 複数の摂動方向を横断する有限差分情報を組み合わせたZOを導入する。
BSZOは標準ZO法と比較して$k/$の係数で収束率を向上することを示す。
RoBERTa、Mistral、OPTモデルの実験では、BSZOはMeZO、MeZO-Adam、HiZOOより優れていた。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:35:11 GMT)
GlycoPy: An Equation-Oriented and Object-Oriented Software for Hierarchical Modeling, Optimization, and Control in Python [4.6] 我々はPythonでプロセスモデリング、オプティマイゼーション、NMPCのための方程式指向オブジェクト指向ソフトウェアフレームワークであるGly-coPyを紹介した。
GlycoPyには、パラメター推定、動的最適化、NMPCのためのアルゴリズムが含まれており、ユーザーはシミュラオプション、最適化、制御アルゴリズムをカスタマイズできる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:36:11 GMT)
Bond Additivity and Persistent Geometric Imprints of Entanglement in Quantum Thermalization [4.6] マルチバイパーティション・エンタングルメント・トモグラフィーと呼ばれる強力なフレームワークを導入する。
当社の土台は、債券付加法の発見です。」
この枠組みをハミルトン力学、ランダム量子回路、フロッケ力学に適用する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:59:52 GMT)
The Gray Area: Characterizing Moderator Disagreement on Reddit [4.5] 1対7の調停事件は、調停者の間で争われている。
グレーエリアのケースのほぼ半数は、自動モデレーション決定を伴っていた。
我々は、モデレーションプロセスの監督において、専門家の人間モデレーターが果たす重要な役割を強調します。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:59:33 GMT)
Who is the Winning Algorithm? Rank Aggregation for Comparative Studies [4.5] 本稿では,各mアルゴリズムの勝利確率を推定するための新しい概念的枠組みを提案する。
提案手法は,現在知られている合成実例と実例において,大幅に改善されている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:52:47 GMT)
Can Legislation Be Made Machine-Readable in PROLEG? [4.5] 規制アプリケーションのためのツールの課題に対処するためのフレームワークを提案する。
欧州一般データ保護規則第6条に焦点をあてる。
単一プロンプトは、法文をifthenルールと対応するPROLEGエンコーディングに同時に変換する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:53:16 GMT)
Four Quadrants of Difficulty: A Simple Categorisation and its Limits [4.3] そこで我々は,困難信号の4つの四分法分類,すなわち人間対モデル,タスクに依存しない対タスク依存の分類を提案する。
タスクに依存しない機能はほとんど独立して振る舞うことができ、タスクに依存した機能だけが整合していることが分かりました。
これらの知見は、一般的なカリキュラム学習の直観に挑戦し、軽量でタスク依存の難易度推定器の必要性を強調している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:31:51 GMT)
AIS-CycleGen: A CycleGAN-Based Framework for High-Fidelity Synthetic AIS Data Generation and Augmentation [4.3] 本稿では,CycleGAN(Cycle-Consistent Generative Adversarial Networks)に基づくロバストなデータ拡張手法であるAISCycleGenを提案する。
従来の方法とは異なり、AISCycleGenはペアのソースターゲットデータを必要とすることなく、未ペアドメイン変換を利用して高忠実な合成AISデータシーケンスを生成する。
我々は,AISCycleGenが,PSNR値30.5,FIDスコア38.9を達成し,同時代の拡張技術より優れていることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:09:53 GMT)
Group versus Individual Review Requests: Tradeoffs in Speed and Quality at Mozilla Firefox [4.0] 本研究は,グループレビュー要求と個人レビュー要求がベロシティと品質に及ぼす影響について検討する。
Mozilla Firefoxプロジェクトの約66,000のリビジョンを調査した。
レビュー品質を改善したグループレビューでは、レビューベロシティと無視可能な関連性を持ちながら、レグレッションの少ないことが特徴だった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:46:40 GMT)
Reliable Grid Forecasting: State Space Models for Safety-Critical Energy Systems [3.7] 本稿では,統計的精度のみでなく,運用リスクを計測するグリッド固有評価フレームワークを提案する。
気象対応CAISO TAC-areaデータセットを用いて,カリフォルニア州のグリッド予測のためのマンバをベースとしたステートスペースモデルの評価を行った。
S-Mambaモデルは、iTransformerの16.66%よりも低いリザーブ_99.5%(14.12%)を達成し、99.5パーセントのテールリスクリザーブプロキシの下で優れた予測信頼性を示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:30:50 GMT)
Deep Linear Discriminant Analysis Revisited [3.6] 制約のないDeep Linear Discriminant Analysis (LDA)分類器の場合, 最大線量トレーニングは病的解決策を認める。
混合密度に簡単なペナルティを伴ってLDAログ類似度を増大させるemphDiscriminative Negative Log-Likelihood (DNLL)損失を導入する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:59:11 GMT)
Utilizing intermediate states in quantum annealing for multi-objective optimization [3.2] 多目的最適化において線形和法の限界に対処するため、量子クエンチ過程における中間量子状態の取得について検討する。
数値シミュレーションとそれ以前のシミュレーションを用いた物理実験により,本手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:19:34 GMT)
SGD with Dependent Data: Optimal Estimation, Regret, and Inference [3.0] 勾配降下 (SGD) は, 広範囲の段階的スケジュールと探索率スキームの下で, 独立情報と依存情報の両方に対応できることが示されている。
SGDは統計的に最適な推定誤差と後悔を同時に達成し,既存の結果を拡張し,改善することを示す。
オンラインのスパースレグレッションのために、我々はSGDベースの新しいアルゴリズムを開発し、ストレージの$d$のみを使用し、1イテレーションあたり$O(d)$フロップを必要とする。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:52:11 GMT)
A Depth Hierarchy for Computing the Maximum in ReLU Networks via Extremal Graph Theory [3.0] 本稿では,ReLUニューラルネットワークを用いた実入力に対して$d$以上の最大関数の正確な計算問題を考察する。
十分に狭いネットワークでは、最大値の非線形性を捕捉できないことを示す。
このことは、その単純性にもかかわらず、最大函数は固有の複雑さを持っていることを示唆している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:40:42 GMT)
VisuoTactile 6D Pose Estimation of an In-Hand Object using Vision and Tactile Sensor Data [2.9] 本稿では,触覚データと視覚データを用いて,ロボットの手でつかんだ物体のポーズを推定する手法を提案する。
その結果,視覚データに加えて触覚データを用いることで6次元ポーズ推定が向上することが示唆された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 21:59:34 GMT)
Bridging the Data Gap: Creating a Hindi Text Summarization Dataset from the English XSUM [2.9] 本研究では、包括的なヒンディー語テキスト要約データセットを作成するための費用対効果の高い自動化フレームワークを提案する。
英語 Extreme Summarization (XSUM) データセットを情報源として,高度な翻訳手法と言語適応手法を採用する。
結果として得られたデータセットは、オリジナルのXSUMコーパスの複雑さを反映した多種多様なマルチテーマリソースを提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:38:58 GMT)
Simplex Deep Linear Discriminant Analysis [2.6] 我々は,Deep Linear Discriminant Analysis (Deep LDA)を再考する。
古典的LDAは線形決定境界を持つ単純なガウスモデルであるのに対し、LDAヘッドをニューラルエンコーダにアタッチすると、最大推定(MLE)による深部分類器の訓練方法が疑問視される。
まず,LDAパラメータとエンコーダパラメータの両方を併用して学習した場合,クラスクラスタのいくつかが重なり,あるいは崩壊し,分類性能が低下する,退化解が認められる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:22:59 GMT)
KGCE: Knowledge-Augmented Dual-Graph Evaluator for Cross-Platform Educational Agent Benchmarking with Multimodal Language Models [2.4] KGCEは知識ベース拡張とデュアルグラフ評価フレームワークを統合する新しいベンチマークプラットフォームである。
最初に、104の教育関連タスクからなるデータセットを構築し、Windows、Android、クロスプラットフォームの協調タスクをカバーした。
そこで我々は,学校固有のソフトウェアに固有の知識ベースを組み込んだエージェントシステムを開発した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:39:39 GMT)
A Graph-based Framework for Online Time Series Anomaly Detection Using Model Ensemble [2.4] 多くの既存の異常検出方法はオフライン設定用に設計されているか、異種ストリーミングデータを扱うのに困難である。
本稿では,モデルアンサンブルを用いたオンライン時系列異常検出のための教師なしグラフベースフレームワークGDMEを提案する。
7つの異種時系列実験により、GDMEは既存のオンライン異常検出方法より優れ、最大24%の改善が達成された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:51:46 GMT)
VARTS: A Tool for the Visualization and Analysis of Representative Time Series Data [2.4] VARTSは、時系列の選択と視覚化のためのインタラクティブなビジュアル分析ツールである。
VARTSは、本質的なデータパターンを保存しながら冗長性を低減し、大規模時系列解析のための視覚的明瞭度と解釈性を効果的に向上する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:18:22 GMT)
HeurekaBench: A Benchmarking Framework for AI Co-scientist [2.2] HeurekaBenchは、実験データセットに対する探索的でオープンな研究質問を伴うベンチマークを作成するためのフレームワークである。
単細胞生物学のフレームワークをインスタンス化し、Sc-HeurekaBenchベンチマークを取得し、最先端の単細胞エージェントと比較する。
批判モジュールを追加することで、オープンソースLLMエージェントの不正な応答を最大22%改善し、クローズドソースエージェントとのギャップを埋めることができる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:16:42 GMT)
Reading Between the Lines: Deconfounding Causal Estimates using Text Embeddings and Deep Learning [2.2] 観察環境における因果治療効果の推定は、観測されていない共同設立者による選択バイアスによってしばしば損なわれる。
本研究では、因果同定にテキスト埋め込みを利用するニューラルネットワーク強化ダブル機械学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:36:45 GMT)
Entropy and Variance Squeezing of V-type Atom in Dissipative Cavity [2.0] 放散キャビティ内のV型原子のエントロピーと分散スキューズについて検討した。
結果は超低ノイズリソースとして量子情報処理に有意義である。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:07:04 GMT)
Signal in the Noise: Decoding the Reality of Airline Service Quality with Large Language Models [1.9] 本研究では,そのようなデータから詳細な洞察を抽出するためのLarge Language Model (LLM) フレームワークを検証する。
エジプト航空とエミレーツ航空の16,000以上のTripAdvisorレビューを分析します。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:05:13 GMT)
Graph-Based Analysis of AI-Driven Labor Market Transitions: Evidence from 10,000 Egyptian Jobs and Policy Implications [1.9] 20.9%の雇用は高い自動化リスクに直面しているが、リスクの高い労働者の24.4%のみが移行経路を持っている。
実現可能な4,534の移行の中で、プロセス指向のスキルが最上位の介入として現れている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 21:19:58 GMT)
Learning Relationship between Quantum Walks and Underdamped Langevin Dynamics [1.7] 量子計算における量子ウォークに基づく探索アルゴリズムと古典計算におけるランゲヴィン力学に基づくサンプリングアルゴリズムについて検討する。
我々の研究は、量子ウォークとランゲヴィン力学との関係に関する新たな知見と、量子スピードアップと古典的な勾配加速度の基礎となる固有のメカニズムを提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:29:47 GMT)
Matrix Kloosterman Sums, Random Matrix Statistics, and Cryptography [1.7] 本稿では,行列Kloosterman和の包括的研究について述べる。
計算的側面、分布的挙動、および暗号解析の応用を含む。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:04:52 GMT)
Improving Behavioral Alignment in LLM Social Simulations via Context Formation and Navigation [1.6] 大規模言語モデル(LLM)は、実験環境での人間の振る舞いをシミュレートするために、ますます使われている。
LLMは複雑な意思決定環境において、人間の決定から体系的に分岐する。
行動アライメントを改善するための2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:42:00 GMT)
Bayesian Orchestration of Multi-LLM Agents for Cost-Aware Sequential Decision-Making [1.3] 大規模言語モデル(LLM)は、非対称なエラーコストの設定において、自律的な決定エージェントとしてデプロイされることが増えている。
本稿では,LLMを近似的近似モデルとして扱う,ベイズ的かつコストに配慮したマルチLLMオーケストレーションフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:19:27 GMT)
Rethinking Multimodal Few-Shot 3D Point Cloud Segmentation: From Fused Refinement to Decoupled Arbitration [1.2] Decoupled-experts Arbitration Few-Shot SegNet (DA-FSS)を提案する。
DA-FSSは意味的経路と幾何学的経路を区別し、それらの勾配を相互に規則化し、より良い一般化を実現する。
また,各モータリティ経路に対して畳み込み融合と調停相関を行うために,SAM(Stacked Arbitration Module)を提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:53:49 GMT)
Constraint-Aware Quantum Optimization via Hamming Weight Operators [1.1] 厳密な線形制約を伴う制約付き最適化は、薬物発見、電力グリッド、物流、金融の応用を支えている。
ハミングウェイト作用素(ハミングウェイト作用素、Hamming Weight Operators)は、量子進化を、実現可能な部分空間内で厳密に定義する制約対応作用素のクラスである。
我々は,金融と高エネルギー物理学のベンチマークタスク,特にポートフォリオ最適化とエネルギーバランスを伴う2ジェットクラスタリングのアプローチを検証した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:58:04 GMT)
Design and Characterization of Compact Acousto-Optic-Deflector Individual Addressing System for Trapped-Ion Quantum Computing [1.1] acousto-optic-deflectors (AOD) に基づくビームステアリングシステムのコンパクト設計について述べる。
この設計は光学的安定性を向上させるために、光学的自由度と光ビーム経路を最小化することを目的としている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 19:50:18 GMT)
Real Time NILM Based Power Monitoring of Identical Induction Motors Representing Cutting Machines in Textile Industry [1.1] バングラデシュの繊維産業は最もエネルギー集約的な産業の一つである。
モニタリングの実践はほとんど時代遅れであり、効率の悪さと運用コストが高い。
本稿では,産業アプリケーションに適したリアルタイム非侵入負荷モニタリングフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:51:19 GMT)
Adaptive Hierarchical Evaluation of LLMs and SAST tools for CWE Prediction in Python [1.0] 脆弱性検出のための大規模言語モデルを評価する最初の関数レベルのPythonベンチマークを示す。
ALPHAはオーバージェネレーション、オーバースペクテーション、およびサイドエラーを区別する。
LLMはSASTよりかなり優れているが,SASTは検出時に高い精度を示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:13:37 GMT)
A Novel Deep Learning Method for Segmenting the Left Ventricle in Cardiac Cine MRI [1.0] GBU-Netは、シネMRIにおける左室分画の精度を大幅に改善する。
GBU-Netのアンサンブルは、SunnyBrookデータセットで97%のダイススコアを獲得している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:43:46 GMT)
From Classification to Generation: An Open-Ended Paradigm for Adverse Drug Reaction Prediction Based on Graph-Motif Feature Fusion [1.0] グラフモチーフ特徴融合とマルチラベル生成に基づくオープンなADR予測パラダイムを提案する。
GM-MLGは最大38%の改善を達成し、平均20%向上し、予測空間を200種から10,000種以上に拡大した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:35:41 GMT)
Breadcrumbs in the Digital Forest: Tracing Criminals through Torrent Metadata with OSINT [0.9] 本研究では,オープンソースインテリジェンス(OSINT)のソースとしてのトレントメタデータの可能性について検討する。
データはThe Pirate Bayとトラッカーから収集され、206の人気のトレントに6万以上のユニークなIPアドレスのデータセットが得られた。
この研究によると、公開されているトレントメタデータは、スケーラブルで自動化されたOSINTプロファイリングをサポートすることができる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:39:32 GMT)
Mitigating Longitudinal Performance Degradation in Child Face Recognition Using Synthetic Data [0.8] 本研究では, 子どもの顔認識モデルの時間的ロバスト性を向上させることにより, 合成顔データが縦方向安定化器として機能するかどうかを検討する。
我々は,データセットを指定せずに事前訓練したMagFace埋め込み,認証されたトレーニング顔のみを用いたMagFace微調整,および認証されたトレーニング顔と合成生成されたトレーニング顔の組み合わせによるMagFace微調整の3つの設定を評価する。
6~36ヶ月の入学検証ギャップにおける実験結果から, 合成微調整は, 予め訓練したベースラインと実物のみの微調整の両方と比較して, 誤差を著しく低減することが示された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 23:03:03 GMT)
Concave Certificates: Geometric Framework for Distributionally Robust Risk and Complexity Analysis [0.7] 分散ロバスト(DR)最適化は、ワッサーシュタインの不確実性集合内の最悪のケースリスクの証明を目的としている。
本稿では,成長速度関数の最小長元に基づく新しい幾何学的枠組みを提案する。
この枠組みを複雑性解析に拡張し、標準的な統計的境界を補完する決定論的境界を導入する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:24:43 GMT)
Evaluating Deep Learning-Based Face Recognition for Infants and Toddlers: Impact of Age Across Developmental Stages [0.7] 幼児と幼児の顔認識は、迅速な顔形態変化、クラス間の類似度の高さ、データセットの可用性の制限など、ユニークな課題を呈している。
本研究は,0~3歳児を対象とする7つのセッションにおいて,24カ月間にわたって収集した,深層学習に基づく顔認識モデルFaceNet,ArcFace,MagFace,CosFaceの性能評価を行った。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:30:28 GMT)
Aletheia: Quantifying Cognitive Conviction in Reasoning Models via Regularized Inverse Confusion Matrix [0.6] 我々はシムヒのCHOKE現象を拡張し、システム2推論モデルにおける「認知信念」の定量化を行う。
我々は,Tikhonov正則化を用いた認知物理学フレームワークであるProject Aletheiaを提案し,裁判官の混乱行列を逆転させる。
この研究は、AIの科学的完全性を測定するための青写真として機能する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:57:32 GMT)
Bithoven: Formal Safety for Expressive Bitcoin Smart Contracts [0.6] 本稿では,表現性と形式的安全性のギャップを埋めるための高水準言語Bithovenを紹介する。
厳密な型チェッカーとリソースのライブネスアナライザとセマンティックコントロールフローアナライザを統合することで、Bithovenはコンセンサスとロジックの欠陥の主要なカテゴリを排除している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:48:34 GMT)
Steerability of Instrumental-Convergence Tendencies in LLMs [0.6] 我々は、許可されたステアビリティ(意図された行動に確実に到達するビルダー)と許可されていないステアビリティ(禁止された行動を引き起こすアタッカー)を区別する。
この区別は、オープンウェイトAIモデルの基本的な安全性とセキュリティのジレンマを強調している。
短い反構造的プロンプト接尾辞は、インストゥルメンタルコンバージェンスとしてラベル付けされた出力を鋭く削減する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:15:59 GMT)
Evaluation of Impression Difference of a Domestic Mobile Manipulator with Autonomous and/or Remote Control in Fetch-and-Carry Tasks [0.6] 単一のサービスロボットは、その自律性とオペレーターを介するエージェンシーという、2つの異なるエージェンシーを提示することができる。
我々は、この二重緊急構造を、自律的な遠隔操作環境において、ユーザ・ロボット・オペレータ・トライアドとして定式化する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:57:10 GMT)
Data Complexity-aware Deep Model Performance Forecasting [0.6] トレーニング前にモデル性能を推定できる軽量な2段階フレームワークを提案する。
このセットアップにより、フレームワークはデータセットとモデルタイプをまたいで一般化できる。
予測に使用される基礎的な特徴のいくつかは、モデル選択のための実用的なガイダンスを提供することができる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 05:31:04 GMT)
SAGE-32B: Agentic Reasoning via Iterative Distillation [0.4] エージェント推論と長期計画タスクに焦点を当てた32億のパラメータ言語モデルであるSAGE-32Bを実証する。
このモデルはQwen2.5-32Bの事前訓練モデルで、反復蒸留を用いて微調整されている。
エージェント推論ベンチマークでは、SAGE-32Bはマルチツールの使用シナリオでより高い成功率を達成する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:41:58 GMT)
Fast Gibbs Sampling on Bayesian Hidden Markov Model with Missing Observations [0.3] 隠れマルコフモデル(英語: Hidden Markov Model、MM)は、シーケンシャルデータを扱うための広く使われている統計モデルである。
実世界のデータセットに欠落した観測は、しばしば数値シミュレーションや実データに現れる。
本稿では,欠落するエントリ数と多くの時間的複雑さの両方を推定するアルゴリズムを提案する。
提案アルゴリズムは,理論上,理論的に正当化可能な,より大きな有効サンプルサイズ(ESS)を要約毎に生成する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:10:43 GMT)
Domain Adaptation of Carotid Ultrasound Images using Generative Adversarial Network [0.3] 本稿では,画像から画像への変換のためのGANに基づく新しいモデルを提案する。
画像のテクスチャパターンの変換に成功し,超音波画像から残響ノイズを除去した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:08:36 GMT)
HalluZig: Hallucination Detection using Zigzag Persistence [0.2] 本稿では,モデルの層的注意の動的トポロジを解析し,幻覚検出のための新しいパラダイムを提案する。
我々の中心となる仮説は、事実的および幻覚的世代は、異なる位相的シグネチャを示すというものである。
フレームワークであるHaluZigを複数のベンチマークで検証し、強力なベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:55:43 GMT)
Unveiling the Heart-Brain Connection: An Analysis of ECG in Cognitive Performance [0.2] ECG信号は認知負荷を確実に反映し、脳波に基づく指標のプロキシとして機能する。
脳波表現型認知空間にECG特徴を投影するクロスモーダルなXGBoostフレームワークを提案する。
本研究は心電図を日常的な認知モニタリングのための解釈可能でリアルタイムなウェアラブルソリューションとして捉えたものである。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:06:19 GMT)
Actively Obtaining Environmental Feedback for Autonomous Action Evaluation Without Predefined Measurements [0.1] AIエージェントは、事前に定義された測定に頼ることなく、環境と積極的に対話して、フィードバックを発見し、スクリーニングし、検証する。
自律的に計画し、行動を調整するためのセルフトリガ機構が導入された。
実験結果から,本提案手法は因子同定の効率と堅牢性を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:52:56 GMT)
Distant Entanglement Generation between Magnon and Superconducting Qubits in Magnon-Mediated Hybrid Systems [0.1] 我々は、マグノンを介するハイブリッド量子システムにおいて、遠方絡みを生成するための効率的な2段階プロトコルを提案する。
この統合された設計は、マグノンの固有の利点を生かしながら、物理成分の数を減少させる。
その結果、分散量子ネットワークのためのスケーラブルで実用的なビルディングブロックとしてプロトコルを確立した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:10:39 GMT)
grangersearch: An R Package for Exhaustive Granger Causality Testing with Tidyverse Integration [0.0] grangersearchは、複数の時系列で徹底的なGranger因果検索を行うためのRパッケージである。
このパッケージはvarsインフラストラクチャをラップし、探索因果解析のためのシンプルなインターフェースを提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:06:18 GMT)
Variation on the theme of Jarzynski's inequality [0.0] ジャジンスキーの等式は、現代の非平衡統計熱力学において中心的な役割を果たす。
ジャージンスキーの不等式は、イェンセンの不等式を通して、正式にはジャージンスキーの等式から得ることができる。
我々は、ジャジンスキーの不等式を、量子場理論によって記述された多体統計システムに拡張する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 19:24:57 GMT)
Towards a Principled Muon under $μ\mathsf{P}$: Ensuring Spectral Conditions throughout Training [0.0] 我々は,大規模言語モデル(LLM)訓練において,$Pが要求するスペクトル条件を確実に保証する方法を示す。
トレーニングプロセスを通じてスペクトル条件を満たすMuon++の変種を開発する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:04:05 GMT)
Talks that Builds: Exploring Communication factors for the Success of Emerging Professional in Product Teams [0.0] 本研究では,18~27歳の若手プロのプロダクトチームを調査し,その成功に影響を与える要因について検討する。
確立された要因がまだ当てはまるが、関連性が少なくなり、好奇心、位置近接性、ドキュメント、リソースへのアクセスといった新しい要素が特定された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 02:02:06 GMT)
Structured Decomposition for LLM Reasoning: Cross-Domain Validation and Semantic Web Integration [0.0] ルールベースの推論は、決定が監査可能で正当化可能な領域で発生します。
このような入力にルールを適用するには、解釈の柔軟性と形式的な保証の両方が必要である。
本稿では,これらの強みを組み合わせた統合パターンを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:19:20 GMT)
Sim2Real SAR Image Restoration: Metadata-Driven Models for Joint Despeckling and Sidelobes Reduction [0.0] 本稿では,デスペックリングとサイドローブリダクションを共同で行う統合フレームワークを提案する。
次に、実際のSAR画像上で推論を行い、実(Sim2Real)転送可能性に対する効果的なシミュレーションを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 14:32:04 GMT)
Scattering Cross Section Formula Derived From Macroscopic Model of Detectors [0.0] 我々は、量子散乱理論で一般的に使用される(明示的または暗黙的に)ステートメントの正当化を懸念している。
検出過程の異なるマクロモデルに基づいて,この式を2つの導出する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 18:08:22 GMT)
Safe in the Future, Dangerous in the Past: Dissecting Temporal and Linguistic Vulnerabilities in LLMs [0.0] 本研究では, HausaSafety を用いた3つのモデル (GPT5.1, Gemini 3 Pro, Claude 4.5 Opus) の系統的監査を行った。
言語間の非線形相互作用(英語対ハウサ)と時間的フレーミング(時間的フレーミング)を検証した。
我々は、過去分断が防御をバイパスした15.6%の深刻な時間的非対称性を報告し、一方、未来分断のシナリオは超保守的拒絶(57.2%の安全)を引き起こした。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 19:51:51 GMT)
Robust Ship Detection and Tracking Using Modified ViBe and Backwash Cancellation Algorithm [0.0] 本稿では,船舶やバックウォッシュを検出する移動物体検出のための改良型ViBeを提案する。
船舶の幾何学的性質と明るさ歪みなどの概念に基づいて,新しいバックウォッシュキャンセル法を提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:04:07 GMT)
Reimagining the Traditional Flight Computer: E6BJA as a Modern, Multi-Platform Tool for Flight Calculations and Training [0.0] Jamie's Flight Computer (E6BJA) は、Apple iOS、Android、Microsoft Windows向けのマルチプラットフォーム・ソフトウェアベースのフライトコンピュータである。
E6BJAは、従来の飛行コンピュータのコア計算を再現し、拡張されたモデリング能力によって拡張する。
各電卓には、基礎となる仮定、変数、方程式を説明する組み込みの教育用モノグラフが付属している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 12:31:45 GMT)
Reasoning Over Recall: Evaluating the Efficacy of Generalist Architectures vs. Specialized Fine-Tunes in RAG-Based Mental Health Dialogue Systems [0.0] ChromaDBを使用して,同じRAGパイプラインを通じて4つのオープンソースモデルを運用しています。
ジェネラリストモデルは、共感においてドメイン固有のモデルよりも優れています。
以上の結果から,RAGベースの治療システムにおいては,精神保健専門用語の訓練よりも強い推論が重要であることが示唆された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:09:23 GMT)
Quantum Kaczmarz Algorithm for Solving Linear Algebraic Equations [0.0] 本稿では,Kaczmarz法に基づく量子線形システム解法を提案する。
その単純さとメモリコストの低さにより、データ回帰、トモグラフィー再構成、最適化にまたがる実用的な選択肢となっている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 03:13:36 GMT)
Quantifying Local Strain Field and Deformation in Active Contraction of Bladder Using a Pretrained Transformer Model: A Speckle-Free Approach [0.0] 本研究では,最先端ゼロショットトランスモデルであるCoTracker3を用いて局所ひずみ場を定量化するためのスペックルフリーフレームワークを提案する。
ベンチマークテストでは、高いピクセル精度と低いひずみ誤差が検証された。
この非侵襲的なアプローチは、スペックルによって引き起こされるアーティファクトを排除し、より生理学的に関連する測定を可能にする。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:52:27 GMT)
Prompt Engineering for Responsible Generative AI Use in African Education: A Report from a Three-Day Training Series [0.0] ジェネレーティブ人工知能(GenAI)ツールは、教育においてますます採用されている。
しかし、多くの教育者は責任と文脈に敏感なエンジニアリングに関する構造化された指導を欠いている。
本稿では,アフリカにおけるジェネレーティブAI(Generative AI for Education and Research)が主催する3日間のオンラインプロフェッショナル開発プログラムについて報告する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:18:57 GMT)
Overcoming Stark-Shift Constraints in Phase-Controlled Rydberg Two-Qubit Gates [0.0] 任意の2ビット位相ゲートを3パルスシーケンスを用いて高忠実度で作成可能であることを示す。
これらの知見に基づき、異なる位相ゲートに適した2つの頑健な制御方式を導入する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 13:16:41 GMT)
On the Practical Estimation and Interpretation of Rényi Transfer Entropy [0.0] レニイ移動エントロピー (Rényi transfer entropy, RTE) は、レニイの情報測度による古典的移動エントロピーの一般化である。
RTEは複雑な非ガウス系の因果関係を解析する強い可能性を示す。
信頼性条件が満たされパラメータが調整された場合、実効的なRTE推定は方向情報の流れを正確に把握する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:53:09 GMT)
Modeling Information Blackouts in Missing Not-At-Random Time Series Data [0.0] 大規模な交通予測は、しばしばブラックアウトを示す固定センサーネットワークに依存している。
本稿では,線形力学系による交通力学を協調的にモデル化する潜在状態空間フレームワークを提案する。
明示的なMNARモデリングは、実際のデータに対して一貫したがより小さな改善を提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:03:13 GMT)
MTS-1: A Lightweight Delta-Encoded Telemetry Format optimised for Low-Resource Environments and Offline-First System Health Monitoring [0.0] 本稿では,新しいデルタ符号化バイナリテレメトリフォーマットであるMTS-1(Magenta Telemetry Standard v1)を紹介する。
オフラインファーストのシステム監視、プロキシ配信、エネルギー効率のよいIoT-to-serverトランスミッション用に設計されている。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:03:55 GMT)
Learning Minimally-Congested Drive Times from Sparse Open Networks: A Lightweight RF-Based Estimator for Urban Roadway Operations [0.0] 本稿では,最小渋滞車走行時間に対する軽量な推定器を開発した。
オープンなロードネットワークデータ、速度制約、スパース制御/ターン機能をランダムなフォレストフレームワークに統合する。
大都市圏でのポイント・ツー・ポイントの忠実さを保ち、資源の要求を減らし、防御可能な性能推定を供給している。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 09:54:44 GMT)
Identifying recurrent flows in high-dimensional dissipative chaos from low-dimensional embeddings [0.0] 不安定周期軌道(unstable periodic orbit、UPOs)は、決定論的カオス時間軌道の非カオスな構成要素である。
カオスアトラクターの低次元埋め込みに直接UPOのループ収束アルゴリズムを提案する。
モデルPDE と 2D Navier-Stokes 方程式の両方の潜在 UPO と物理的 UPO の等価性を実証する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 16:35:23 GMT)
HanoiWorld : A Joint Embedding Predictive Architecture BasedWorld Model for Autonomous Vehicle Controller [0.0] 本研究では、JEPAベースの世界モデルであるハノイワールドを紹介し、リカレントニューラルネットワーク(RNN)を用いて、効果的な推論時間で長期水平計画を行う。
実験では,SOTAベースラインと比較して,安全に配慮した運転計画作成の有効性を示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 15:49:46 GMT)
Generation of circular polarized high-order harmonics from single color quantum light [0.0] 我々は,高度に楕円偏光されたドライバが高調波発生プロセスを実現することを示す。
HHGスペクトルは、駆動場の量子的性質に関する情報を符号化する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:23:38 GMT)
GateChain: A Blockchain Based Application for Country Entry-Exit Registry Management [0.0] GateChainは、分散型で不変で暗号的に検証可能な台帳にエントリイベントと終了イベントを記録することによって、データの整合性、信頼性、透明性を向上させることを目的としている。
このアプリケーションは、認可された機関に対してリアルタイムアクセス制御と検証を提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:08:44 GMT)
From Theory of Mind to Theory of Environment: Counterfactual Simulation of Latent Environmental Dynamics [0.0] 人間は、心の理論と共有される計算機構に基づいて、社会的な手がかりから隠れた環境力学の存在を推測することができる。
提案した「環境理論」は、運動探索の次元性を拡張することによって行動革新を支援する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 17:00:04 GMT)
From Emotion Classification to Emotional Reasoning: Enhancing Emotional Intelligence in Large Language Models [0.0] 本研究は、より小さなオープンな大言語モデル(LLM)の感情的推論能力を、合成的感情的連鎖データが改善するかどうかを考察する。
治療スタイルの会話を生成するマルチエージェント生成パイプラインを設計し,それをMCQ(Structured emotion Multiple-choice Question)に変換する。
このデータセット上で様々な7Bモデルを微調整すると、感情的理解と感情的認識が大幅に向上することが提案される。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:08:37 GMT)
Formal Analysis of AGI Decision-Theoretic Models and the Confrontation Question [0.0] AGI(Artificial General Intelligence, 人工知能)は、対立する問題に直面しているかもしれない。
我々はこれをマルコフ決定プロセスで定式化し、人間によるシャットダウンイベントを開催する。
ほぼすべての報酬関数に対して、不整合エージェントがシャットダウンを避けるインセンティブを持っていることを示す。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 08:02:00 GMT)
Evaluation of Convolutional Neural Network For Image Classification with Agricultural and Urban Datasets [0.0] カスタム畳み込みニューラルネットワーク(CustomCNN)は、アーキテクチャ設計の選択がマルチドメイン画像分類タスクにどのように影響するかを研究するために作成される。
モデルはトレーニングされ、5つの公開データセットでテストされる。
一般的なCNNアーキテクチャと比較すると、CustomCNNは計算効率を保ちながら競争力のある性能を提供する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:09:49 GMT)
Einstein-Podolsky-Rosen Steering in Three Coupled Harmonic Oscillators [0.0] 量子ステアリングは多体系における相関の理解に不可欠である。
Wigner関数フレームワークを用いて、可能なすべての方向における量子ステアリングの解析式を導出する。
以上の結果から,励起はシステム全体の量子ステアリングを著しく向上させることが示唆された。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:08:14 GMT)
Efficient Cover Construction for Ball Mapper via Accelerated Range Queries [0.0] 範囲問合せの効率を向上させることにより,ボールマッパーのカバー構築を高速化する戦略について検討する。
本研究では,ボールツリーデータ構造を用いた階層的幾何学的プルーニングと,Facebook AIの類似度探索を用いたハードウェア対応距離計算という,Ball Mapperパイプラインに補完的な2つのアプローチを統合する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 07:04:18 GMT)
EHRSummarizer: A Privacy-Aware, FHIR-Native Architecture for Structured Clinical Summarization of Electronic Health Records [0.0] EHRSummarizerは構造化チャートレビューをサポートする構造化要約を生成する。
システムは、データ最小化、ステートレス処理、フレキシブルなデプロイメントのために設定できる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 21:10:42 GMT)
Distortion Instead of Hallucination: The Effect of Reasoning Under Strict Constraints [0.0] 推論能力は、出力信頼性を向上させる自己検証プロセスとして注目されている。
厳密な制約の下で実験を行い、複数のモデルにまたがる推論の効果を調べる。
この結果から,制約遵守と事実的正確性とのトレードオフが明らかとなった。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 11:35:39 GMT)
DiMEx: Breaking the Cold Start Barrier in Data-Free Model Extraction via Latent Diffusion Priors [0.0] モデル盗難攻撃は機械学習・アズ・ア・サービス(ML)に現実的な脅威をもたらす
我々は,事前学習した遅延拡散モデルのリッチなセマンティクスを武器とするフレームワークであるDiMExを提案し,その「コールドスタート」問題を回避した。
以上の結果から,DMEx は静的分布検出器を回避しているが,HSE はこの時間的シグネチャを利用して攻撃成功率を21.6 % に抑えることができた。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 22:58:34 GMT)
Collective behaviors of an electron gas in the mean-field regime [0.0] 電子ガスの3次元トーラスにおける運動量分布について検討した。
ランダム位相近似により得られた試行状態に対するフーリエモードの占有数を算出する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 04:37:20 GMT)
Bayesian Negative Binomial Regression of Afrobeats Chart Persistence [0.0] Afrobeatsの曲は、チャートの可視性が収益と文化的影響の両方に影響を与えるストリーミングプラットフォームに注意を向けている。
本稿では,2024年からの日刊ナイジェリアのSpotify Top 200データを用いて,コラボレーションが楽曲をチャートに残すのに役立っているかを検討する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 06:08:12 GMT)
Automated SBOM-Driven Vulnerability Triage for IoT Firmware: A Lightweight Pipeline for Risk Prioritization [0.0] 本稿では,LinuxベースのIoTファームウェアからファイルシステムを抽出する軽量で自動化されたパイプラインを提案する。
包括的なSoftware Bill of Materialsを生成し、特定されたコンポーネントを既知の脆弱性にマップし、多要素トリアージスコアモデルを適用します。
アーキテクチャ,組込みLinuxの正規化課題,および警告疲労軽減を目的とした評価手法について述べる。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 00:09:01 GMT)
Automated Post-Incident Policy Gap Analysis via Threat-Informed Evidence Mapping using Large Language Models [0.0] 本稿では,Large Language Models (LLMs) が,システム証拠を自律的に分析し,セキュリティポリシーのギャップを識別することによって,事故後のレビューを強化することができるかどうかを検討する。
我々は、ログデータを取り込み、観察された振る舞いをMITRE ATT&CKフレームワークにマップし、妥当性とコンプライアンスに関する組織的セキュリティポリシーを評価する脅威に富んだエージェント型フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 01:39:20 GMT)
An Empirical Study of Monocular Human Body Measurement Under Weak Calibration [0.0] 単眼のRGB画像から人体計測を推定することは、視線感度、明快な深度情報がないため、依然として困難である。
この研究は、ランドマークに基づく幾何学、ポーズ駆動回帰、およびオブジェクト校正されたシルエットの3つの弱い校正された単分子戦略に関する体系的な実証的研究を提示する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 19:05:45 GMT)
A construction of an optimal base for conditional attribute and attributional condition implications in triadic contexts [0.0] 我々は,ガンターとオビドコフが導入した条件属性と帰属条件含意に着目した。
我々の目的は、これらの意味の最適な基盤を構築することである。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 10:21:06 GMT)
A Koopman-Bayesian Framework for High-Fidelity, Perceptually Optimized Haptic Surgical Simulation [0.0] 本稿では, 非線形力学, 知覚心理学, 高周波触覚レンダリングを併用し, 手術シミュレーションにおけるリアリズムを向上する統合フレームワークを提案する。
また, 触診, 切開, 骨削りなどの外科的作業のシミュレーションでは, 平均レンダリング遅延が4.3ms, 力誤差が2.8%未満, 知覚的識別が20%向上した。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 20:43:37 GMT)
A Dynamic Retrieval-Augmented Generation System with Selective Memory and Remembrance [0.0] Emph Adaptive RAG Memory (ARM) は,静的ベクトルインデックスをEmphdynamicメモリ基板に置き換える検索拡張生成(RAG)フレームワークである。
ARMは、軽量な検索ベンチマークで最先端のパフォーマンスに近づいた。
ARMは、ジェネレータカラーブラックを再トレーニングすることなく、競合精度、自己正規化メモリ成長、解釈可能な保持ダイナミクスを出力し、生産・研究RAGシステムの品質、レイテンシ、メモリ効率のトレードオフを実践する。
論文参考訳(メタデータ) (Sun, 04 Jan 2026 21:51:41 GMT)