Think With Videos For Agentic Long-Video Understanding [117.7] ロングビデオ理解はコンピュータビジョンにおいて難しい問題である。
ビデオによる思考の原則に基づくフレームワークであるVideoExplorerを提案する。
静的なコンテキストを推論する代わりに、VideoExplorerは、サブクエストを反復的に定式化し、関連するモーメントを特定し、タスク指向で時間的にスケーラブルなビデオ理解を実行する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:48:39 GMT)
Lizard: An Efficient Linearization Framework for Large Language Models [113.9] プリトレーニングされたトランスフォーマーベース大規模言語モデル(LLM)をサブクワッドアーキテクチャに変換する線形化フレームワークであるLizardを提案する。
Lizardは、モデル品質を保ちながらソフトマックスアテンションを正確に近似するサブクワッドアテンションメカニズムを導入することで、これらの制限に対処する。
5 ショット MMLU ベンチマークにおいて,Lizard は教師モデルの性能のほぼ無作為な回復を実現し,従来の手法よりも 9.4 ~ 24.5 ポイント高い性能を示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:37:43 GMT)
Hulu-Med: A Transparent Generalist Model towards Holistic Medical Vision-Language Understanding [112.5] Hulu-Medは透明な医療用VLMで、これらすべてのモダリティの理解を統一する。
パッチベースのビジョンエンコーダとLCMデコーダを統一して構築され、Hulu-Medは2Dから3D、ビデオの理解のために167万 (M) のサンプルを徐々に訓練した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:06:42 GMT)
Distilling a Small Utility-Based Passage Selector to Enhance Retrieval-Augmented Generation [110.6] Retrieval-augmented Generation (RAG)は、取得した情報を組み込むことで、大規模言語モデル(LLM)を強化する。
RAGでは、重要度は実用性に移行し、正確な回答を生成するためのパスの有用性を考慮している。
提案手法は、ランク付けよりもユーティリティベースの選択に重点を置いており、固定しきい値を必要とせずに、特定のクエリに合わせた動的通過選択を可能にする。
本実験は, 実用性に基づく選択により, RAGの柔軟性とコスト効率が向上し, 計算コストが大幅に低減され, 応答品質が向上することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:10:12 GMT)
Zebra-CoT: A Dataset for Interleaved Vision Language Reasoning [109.8] 我々は182,384サンプルの多種多様な大規模データセットであるtextbfZebra-CoT$を紹介した。
スケッチや視覚的推論が特に自然なタスクの4つのカテゴリに注目します。
微調整されたベーゲル7Bは高品質な視覚的推論連鎖を生成するモデルを生成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:46:09 GMT)
xRouter: Training Cost-Aware LLMs Orchestration System via Reinforcement Learning [104.6] 我々は,学習したルータが直接応答するか,あるいは1つ以上の外部モデルを呼び出すことができるツールコールベースのルーティングシステム x を提案する。
当社の実装には、報酬とコスト会計を含む、完全な強化学習フレームワークが含まれています。
さまざまなベンチマークで、xはコストパフォーマンスのトレードオフを強く達成します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:52:01 GMT)
MM-HELIX: Boosting Multimodal Long-Chain Reflective Reasoning with Holistic Platform and Adaptive Hybrid Policy Optimization [103.7] ロングチェーンのリフレクティブ推論は、複雑な現実世界の問題を解決するための前提条件である。
我々は42の難解な合成タスクの1,260のサンプルからなるベンチマークを構築した。
トレーニング後のデータを生成し、そのようなデータを活用するための学習パラダイムを探索する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:53:58 GMT)
More Than One Teacher: Adaptive Multi-Guidance Policy Optimization for Diverse Exploration [103.2] ガイダンス・オン・デマンド」アプローチは、自己発見の価値を保ちながら探究を広げる。
実験の結果、AMPOは強いベースラインを大幅に上回ることが示された。
ピアサイズの4人の教師を用いて、より強力な1人の教師を活用できる手法に匹敵する結果が得られる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:18:49 GMT)
TTOM: Test-Time Optimization and Memorization for Compositional Video Generation [102.6] ビデオファウンデーションモデル (VFM) は目覚ましい視覚生成性能を示すが、構成シナリオでは苦戦している。
テスト時間とメモ空間化器(TTOM)を導入し,VFMとビデオレイアウトを一致させてテキスト画像のアライメントを改善する。
我々はTTOMが構成的世界知識を歪め、強力な伝達可能性と一般化を示すことを発見した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:37:00 GMT)
NaViL: Rethinking Scaling Properties of Native Multimodal Large Language Models under Data Constraints [100.0] 本稿では,Multimodal Large Language Models(MLLM)のエンドツーエンドなネイティブトレーニングに焦点を当てる。
そこで我々は,NaViLと呼ばれるネイティブMLLMと,シンプルで費用対効果の高いレシピを組み合わせて提案する。
14のマルチモーダルベンチマークによる実験結果から,既存のMLLMに対するNaViLの競合性能が確認された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:37 GMT)
Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.9] 我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:28:28 GMT)
A Survey of Reinforcement Learning for Large Reasoning Models [98.6] 大規模言語モデルによる推論のための強化学習の最近の進歩について
LRMのためのRLのさらなるスケーリングは、計算資源だけでなく、アルゴリズム設計、トレーニングデータ、インフラにおいても課題に直面している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:08:52 GMT)
MLLM as a UI Judge: Benchmarking Multimodal LLMs for Predicting Human Perception of User Interfaces [97.6] GPT-4o、Claude、Llamaを30のインターフェースでベンチマークするためにクラウドソーシングを使用します。
以上の結果から,MLLMは特定の次元において人間の嗜好を近似するが,他の次元では異なってしまうことが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:00:41 GMT)
Utility-Focused LLM Annotation for Retrieval and Retrieval-Augmented Generation [96.2] 本稿では,大規模言語モデル (LLM) を用いた検索・検索・拡張生成システム (RAG) の訓練における文書ユーティリティのアノテートについて検討する。
以上の結果から,LLM生成アノテーションは,人間のアノテーションや下流QAメトリクスのみを訓練したモデルと比較して,ドメイン外検索性能の向上とRAG結果の改善を図っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:00:21 GMT)
Agent Learning via Early Experience [93.8] 言語エージェントの長期的な目標は、彼ら自身の経験から学び、改善することであり、最終的には複雑な現実世界のタスクにおいて人間より優れています。
現在のエージェントのほとんどは、専門家データによる教師付き微調整に依存しており、スケールと一般化が不十分である。
本研究では,(1)環境力学における政策の基盤として収集された状態を利用するインプリシット・ワールド・モデリング,(2)エージェントが最適な行動から学習し,推論と意思決定を改善するための自己回帰という2つの手法について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:17 GMT)
CIR-CoT: Towards Interpretable Composed Image Retrieval via End-to-End Chain-of-Thought Reasoning [93.1] Composed Image Retrieval (CIR) は、参照画像と修正テキストから対象画像を見つけることを目的としている。
CIR-CoTは、明示的なChain-of-Thought (CoT)推論を統合するために設計された最初のエンドツーエンド検索指向MLLMである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:41:45 GMT)
LLaVA-OneVision-1.5: Fully Open Framework for Democratized Multimodal Training [92.9] LLaVA-OneVision-1.5はLMMの新しいファミリーである
これは、計算コストと財政コストを大幅に削減して最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:54:14 GMT)
Value Flows [90.2] 本稿では, フローベースモデルを用いて, 将来のリターン分布を推定する。
学習したフローモデルに基づいて、新しいフロー微分ODEを用いて、異なる状態の戻り不確かさを推定する。
ステートベース37ドル、イメージベースのベンチマークタスク25ドルの実験では、バリューフローが平均的な成功率で1.3倍の改善を達成している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:57:40 GMT)
Latent Harmony: Synergistic Unified UHD Image Restoration via Latent Space Regularization and Controllable Refinement [90.0] LH-VAEを導入し、視覚的意味的制約や進行的劣化による意味的堅牢性を高める。
Latent Harmonyは、UHD修復のためのVAEを再定義する2段階のフレームワークである。
実験により、Latent HarmonyはUHDおよび標準解像度タスクにまたがって最先端のパフォーマンスを実現し、効率、知覚品質、再現精度を効果的にバランスさせることが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:54:26 GMT)
SciVideoBench: Benchmarking Scientific Video Reasoning in Large Multimodal Models [89.1] SciVideoBenchは、科学的文脈における高度なビデオ推論を評価するために設計された厳密なベンチマークである。
SciVideoBenchは、最先端の科学実験ビデオから得られた、慎重に構築された1000の多重選択質問で構成されている。
我々の評価は、最先端のプロプライエタリおよびオープンソース LMM における大幅な性能低下を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:23 GMT)
Beyond Turn Limits: Training Deep Search Agents with Dynamic Context Window [88.9] DeepMinerは、高機能なトレーニングタスクと動的コンテキストウィンドウを導入することで、そのような能力を引き出す新しいフレームワークである。
We developed DeepMiner-32B, which is a significant performance improvements across multiple search agent benchmarks。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:31:39 GMT)
Reasoning-enhanced Query Understanding through Decomposition and Interpretation [87.6] ReDIは、分解と解釈によるクエリ理解のための推論強化アプローチである。
我々は,大規模検索エンジンから実世界の複雑なクエリの大規模データセットをコンパイルした。
BRIGHT と BEIR の実験により、ReDI はスパースと密度の高い検索パラダイムの両方において、強いベースラインを一貫して超えることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:28:46 GMT)
Flora: Effortless Context Construction to Arbitrary Length and Scale [87.5] 本稿では,人間/LLMフリーの長文構成戦略であるFloraを紹介する。
Llama3-8B-InstructとQwQ-32Bの実験では、Floraは3つの長文のベンチマークで優れており、短文のタスクでは強いパフォーマンスを維持している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:55:36 GMT)
Quartic quantum speedups for community detection [84.1] 我々は,準量子スピードアップを実現するハイパーグラフコミュニティ検出のための量子アルゴリズムを開発した。
提案アルゴリズムは,従来検討されていた PCA や $p$XORSAT といった問題を超えて拡張した Kikuchi 法に基づいている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:35:17 GMT)
UNIDOC-BENCH: A Unified Benchmark for Document-Centric Multimodal RAG [82.8] マルチモーダル検索拡張生成(MM-RAG)は,大規模言語モデルを現実世界の知識ベースに適用するための重要なアプローチである。
UniDoc-Benchは、70万の現実世界のPDFページから構築されたMM-RAGのための最初の大規模で現実的なベンチマークである。
実験により,マルチモーダルテキスト画像融合RAGシステムは,非モーダルおよび共同マルチモーダル埋め込みに基づく検索において一貫して優れていた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:30:23 GMT)
Erasing Without Remembering: Implicit Knowledge Forgetting in Large Language Models [81.6] 我々は,その一般化に着目して,大規模言語モデルにおける知識の忘れについて検討する。
確率摂動に基づく新しいアンラーニングパラダイムであるPerMUを提案する。
TOFU、Harry Potter、ZsRE、WMDP、MUSEなど、さまざまなデータセットで実験が行われている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:22:34 GMT)
CoMAS: Co-Evolving Multi-Agent Systems via Interaction Rewards [80.8] 自己進化(Self-evolution)は、大規模言語モデル(LLM)ベースのエージェントが事前トレーニング後の能力を継続的に改善できるようにする上で、中心的な研究トピックである。
エージェントがエージェント間相互作用から学習することで自律的に改善できる新しいフレームワークであるCo-Evolving Multi-Agent Systems (CoMAS)を紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:26 GMT)
The Alignment Waltz: Jointly Training Agents to Collaborate for Safety [80.2] WaltzRLは、安全アライメントを協調的でポジティブなゲームとして定式化する、新しいマルチエージェント強化学習フレームワークである。
WaltzRLのコアとなるDIR(Dynamic Improvement Reward)は、会話エージェントがフィードバックをいかにうまく組み込むかに基づいて、時間とともに進化する。
我々の実験は5つの多様なデータセットで行われ、WaltzRLは安全でない応答と過度な拒絶の両方を著しく低減することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:03:05 GMT)
ToolLibGen: Scalable Automatic Tool Creation and Aggregation for LLM Reasoning [80.1] 外部ツールを備えたLarge Language Models (LLM) は、複雑な推論タスクにおけるパフォーマンスの向上を実証している。
このツールに強化された推論が広く採用されるのは、ドメイン固有のツールが不足しているためである。
構造化ツールライブラリに非構造化ツールのコレクションを自動的に組み込むための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:11:16 GMT)
Energy-Driven Steering: Reducing False Refusals in Large Language Models [80.1] エネルギー駆動ステアリング(EDS、Energy-Driven Steering)は、動的で推論時間の介入によってこの問題を解決するために設計された、新しい、微調整自由なフレームワークである。
我々は、望ましくない(偽の拒絶または脱獄)状態に高エネルギーを割り当て、望ましい(好ましくない反応または安全な拒絶)状態に低エネルギーを割り当てるために、軽量な外部エネルギーベースモデル(EBM)を訓練した。
エネルギー関数の勾配を利用してLLMの隠れた状態を低エネルギー領域に動的に操る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:01:41 GMT)
Real-Time Motion-Controllable Autoregressive Video Diffusion [79.3] 本稿では,AR-Dragを提案する。このAR-Dragは,多様なモーション制御を備えたリアルタイム画像・ビデオ生成のための,RLで拡張された最初の数ステップのARビデオ拡散モデルである。
まず,基本動作制御をサポートするためのベースI2Vモデルを微調整し,さらに軌道ベース報酬モデルによる強化により改良する。
本設計では、自己学習機構を通じてマルコフ特性を保存し、ステップを選択的に分解することで訓練を加速する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:17:11 GMT)
Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models [78.4] ビデオ理解はコンピュータビジョンにおける最も困難なフロンティアである。
近年,映像理解タスクにおいて,映像多時間モデルが顕著に出現している。
Surveyは、ビデオ-LMM能力を向上するための統一的なフレームワークを研究者や実践者に提供することを目的としている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:45 GMT)
COSMOS: A Hybrid Adaptive Optimizer for Memory-Efficient Training of LLMs [77.8] 大規模言語モデル(LLM)は、様々な領域で顕著な成功を収めている。
それらの最適化は、彼らが居住している複雑で高次元のロスランドスケープのために重要な課題である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:46:36 GMT)
Kontinuous Kontext: Continuous Strength Control for Instruction-based Image Editing [76.4] Kontinuous Kontext は命令駆動の編集モデルであり、編集強度を制御できる新しい次元を提供する。
軽量プロジェクタネットワークは、入力スカラーと編集命令をモデルの変調空間の係数にマッピングする。
本モデルのトレーニングには,既存の生成モデルを用いて,画像編集・指導・強化四重項の多種多様なデータセットを合成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:51:03 GMT)
Accelerated Evolving Set Processes for Local PageRank Computation [75.5] この研究は、パーソナライズされたPageRank計算を高速化するために、ネストした進化したセットプロセスに基づく新しいフレームワークを提案する。
このような局所化手法の時間複雑性は、PPRベクトルの$epsilon$-approximationを得るために$mintildemathcalO(R2/epsilon2), tildemathcalO(m)$によって上界となることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:47:40 GMT)
SelfRACG: Enabling LLMs to Self-Express and Retrieve for Code Generation [75.0] textbfSelfRACG は,大規模な言語モデル (LLM) がtextbfRACG を強化するために必要な情報を表現できる新しいパラダイムである。
SelfRACGには、情報要求表現モジュールと、2段階の情報要求誘導トレーニング戦略が含まれており、LLMが情報要求を表現することを奨励している。
大規模な実験により、SelfRACGはLLM自身の情報要求によく適合する外部知識を回収できることが示され、バニラRACGよりも優れた世代性能が得られる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:19:20 GMT)
R2RGEN: Real-to-Real 3D Data Generation for Spatially Generalized Manipulation [74.4] 本稿では,実世界のデータを生成するために,ポイントクラウド観測-アクションペアを直接拡張するリアルタイム3Dデータ生成フレームワーク(R2RGen)を提案する。
R2RGenは、広範な実験におけるデータの効率を大幅に向上させ、モバイル操作におけるスケーリングと応用の強い可能性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:55:44 GMT)
Understanding In-context Learning of Addition via Activation Subspaces [73.8] そこで本研究では,入力に整数$k$を追加するという真の予測規則を,数ショット学習タスクの構造化されたファミリについて検討する。
次に、次元の減少と分解を通じて、個々の頭部の詳細な分析を行う。
この結果から,前進パスを横断する局所化頭部の低次元部分空間の追跡が,言語モデルにおける微粒化計算構造に対する洞察を与えることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:58:05 GMT)
D$^2$GS: Depth-and-Density Guided Gaussian Splatting for Stable and Accurate Sparse-View Reconstruction [73.6] 3D Gaussian Splatting (3DGS)は、3D表現を明示したリアルタイムかつ高忠実なノベルビュー合成(NVS)を可能にする。
疎視条件下では,カメラ近傍のガウス密度が過大な地域での過度適合と,ガウス範囲が不十分な遠隔地での過度適合の2つの重要な障害モードを同定する。
本稿では,奥行き案内型ドロップアウト戦略と距離認識型フィデリティ拡張モジュールという,2つの主要なコンポーネントからなる統合フレームワークD$2$GSを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:49 GMT)
Physics-Driven Spatiotemporal Modeling for AI-Generated Video Detection [73.5] 本稿では,確率流の保存原理に基づくAI駆動型ビデオ検出パラダイムを提案する。
本研究では,テストのNSG特徴と実ビデオとの間の平均離散性(MMD)を計算するNSG-VD(NSG-VD)を開発した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:00:35 GMT)
SpatialLadder: Progressive Training for Spatial Reasoning in Vision-Language Models [73.2] 本稿では,空間知能を段階的に構築するための包括的方法論を提案する。
オブジェクトローカライゼーション、単一画像、マルチビュー、ビデオ空間推論タスクにまたがる26,610のサンプルを含むマルチモーダルデータセットであるSpatialLadder-26kを紹介する。
本研究では,物体の局所化による空間知覚の確立,多次元空間的タスクによる空間理解の発達,および検証可能な報酬を用いた強化学習による複雑な推論の強化を目的とした3段階のプログレッシブ・トレーニング・フレームワークを設計する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:54 GMT)
Sherkala-Chat: Building a State-of-the-Art LLM for Kazakh in a Moderately Resourced Setting [72.5] Sherkala-Chat (8B) は、カザフ語話者向けに設計された命令調整されたオープン生成型大言語モデル(LLM)である。
LLaMA-3.1-8Bモデルに適応したシェルカラ・チャット (8B) はカザフ語、英語、ロシア語、トルコ語で45.3Bのトークンで訓練されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:40:43 GMT)
Inference-time Alignment in Continuous Space [72.2] 推論時間アライメントのための単純で効果的なアルゴリズムであるSimple Energy Adaptation(textbfSEA$)を提案する。
SEAは、連続潜時空間における勾配に基づくサンプリングを通じて、基本ポリシーから最適なものへの元の応答を適応する。
例えば、SEAはAdvBenchで最大$textbf77.51%$、MATHで$textbf16.36%$で2番目に高いベースラインを上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:10:39 GMT)
Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8] VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:08:33 GMT)
Teaching Your Models to Understand Code via Focal Preference Alignment [70.7] 既存の手法では、テストケースの成功率に基づいてn個の候補解が評価される。
このアプローチは、特定のエラーを特定するのではなく、失敗するコードブロック全体を整列するので、意味のあるエラーと訂正の関係を捉えるのに必要な粒度が欠けている。
我々は、人間の反復デバッグを模倣してコードLLMを洗練させる新しい優先順位調整フレームワークであるTarget-DPOを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:51:19 GMT)
Recycling Pretrained Checkpoints: Orthogonal Growth of Mixture-of-Experts for Efficient Large Language Model Pre-Training [70.6] パラメータ数を拡大し,継続訓練を行うことで,事前学習したチェックポイントを再利用することを提案する。
70Bパラメータと1T以上のトレーニングトークンを持つモデルにアプローチを拡大し、スクラッチからトレーニングよりも10.66%の精度向上を実現しています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:45:45 GMT)
I&S-ViT: An Inclusive & Stable Method for Pushing the Limit of Post-Training ViTs Quantization [70.5] 我々は,ViTのPTQを包括的かつ安定した方法で制御する新しい手法であるI&S-ViTを紹介する。
I&S-ViTは3ビットのViT-Bの性能を50.68%向上させた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:49:41 GMT)
Unified World Models: Memory-Augmented Planning and Foresight for Visual Navigation [69.9] 現在のアプローチでは、ナビゲーション計画とビジュアルワールドモデリングが分離されており、状態-アクションのミスアライメントと適応性の制限につながっている。
一つのマルチモーダル自己回帰バックボーン内に、自我中心の視線と計画を統合する統一されたメモリ拡張世界モデルUniWMを提案する。
我々は,UniWMが航法成功率を最大30%向上し,トラジェクトリエラーを強いベースラインと比較して著しく低減し,未確認のTartanDriveデータセットに印象的なゼロショット一般化を示すことを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:18:11 GMT)
UNCLE: Benchmarking Uncertainty Expressions in Long-Form Generation [69.1] 大型言語モデル(LLM)は幻覚を起こす傾向があり、特に長期の世代では顕著である。
長文と短文の問合せ(QA)における不確実性評価のためのベンチマークであるUNCLEを紹介する。
我々のデータセットは、一致した質問やゴールドスタンダードの回答を通じて、短くて長いQAを直接リンクする最初のものです。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:44:39 GMT)
BigCodeArena: Unveiling More Reliable Human Preferences in Code Generation via Execution [69.0] BigCodeArenaは、包括的でオンザフライな実行環境を背景とした、コード生成のためのオープンなヒューマン評価プラットフォームである。
10の言語と8種類の実行環境にまたがる10のLLMで14,000以上の生のコード中心の会話セッションを収集しました。
BigCodeRewardでは、4700件の会話を後処理し、報酬モデルと人間の好みの一貫性を評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:01:47 GMT)
Towards Reliable LLM-based Robot Planning via Combined Uncertainty Estimation [68.1] 大規模言語モデル (LLM) は高度な推論能力を示し、ロボットが自然言語の命令を理解し、適切な接地で高レベルな計画を生成することができる。
LLMの幻覚は重大な課題であり、しばしば過度に信頼され、不一致または安全でない計画に繋がる。
本研究は, 信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性評価を別々に評価するものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:26:58 GMT)
SDAR: A Synergistic Diffusion-AutoRegression Paradigm for Scalable Sequence Generation [67.9] 本稿では, 自己回帰モデルの学習効率を, 拡散の並列推論能力で統一するSynergistic Diffusion-Autoregressionパラダイムを提案する。
SDARは、十分に訓練された自己回帰モデル(AR)を、簡潔でデータ効率のよい適応を通じてブロックワイズ拡散モデルに変換する、軽量なパラダイム変換を実行する。
この知見に基づいて、SDARは最小コストで効率的なAR-拡散変換を実現し、並列生成を可能にしながら、ARレベルのパフォーマンスを維持する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:55:18 GMT)
OneForecast: A Universal Framework for Global and Regional Weather Forecasting [67.6] 本稿では,グラフニューラルネットワークに基づくグローバルなネスト型気象予報フレームワーク(OneForecast)を提案する。
動的システムパースペクティブとマルチグリッド理論を組み合わせることで,マルチスケールグラフ構造を構築し,対象領域を密度化する。
動的ゲーティングユニットを用いた適応型メッセージング機構を導入し,ノードとエッジ機能を深く統合し,より正確なイベント予測を行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:01:35 GMT)
Dual-granularity Sinkhorn Distillation for Enhanced Learning from Long-tailed Noisy Data [67.3] ディープラーニングのための実世界のデータセットは、クラス不均衡とラベルノイズの共起的な課題にしばしば悩まされる。
蒸留と相補的な知見の統合により二重強靭性を高める新しいフレームワークであるD-SINKを提案する。
ベンチマークデータセットの実験では、D-SINKはロバスト性を大幅に向上し、長い尾のノイズデータから学習する際の強い経験的性能を達成することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:05:27 GMT)
Spotlight Attention: Towards Efficient LLM Generation via Non-linear Hashing-based KV Cache Retrieval [67.2] 本研究では,クエリやキーの埋め込み分布を最適化するために,非線形ハッシュ関数を利用する新しい手法であるSpotlight Attentionを紹介する。
また、Bradley-Terryランキングに基づく損失を利用して、軽量で安定したトレーニングフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:33:47 GMT)
TransMamba: Fast Universal Architecture Adaption from Transformers to Mamba [66.8] 本稿では,Transformer事前学習知識の再利用を容易にするクロスアーキテクチャな知識伝達パラダイムであるTransMambaを提案する。
本稿では,マンバをベースとしたモデルのトレーニングを高速化する2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:04:31 GMT)
SaFeR-VLM: Toward Safety-aware Fine-grained Reasoning in Multimodal Models [66.7] MLRM(Multimodal Large Reasoning Models)は、クロスモーダルな推論を示すが、しばしば敵のプロンプトによる安全性のリスクを増幅する。
既存の防御は主に出力レベルで動作し、推論プロセスを制約せず、モデルは暗黙のリスクに置かれる。
4つのコンポーネントを統合し,表面レベルのフィルタリングを超える動的かつ解釈可能な安全性決定をサポートするSaFeR-VLMを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:46:31 GMT)
EpiCoder: Encompassing Diversity and Complexity in Code Generation [66.4] 既存のコード生成方法はシードデータとしてコードスニペットを使用する。
階層的なコード機能を中心に展開する,新しい機能ツリーベースの合成フレームワークを提案する。
我々のフレームワークは、生成されたコードの複雑さを正確に制御し、関数レベルの操作からマルチファイルのシナリオまで幅広い機能を実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:39:50 GMT)
First Try Matters: Revisiting the Role of Reflection in Reasoning Models [66.4] 我々は、モデルがすでに答を生み出しているが、その出力を確定する前に反射し続ける反射行動に焦点を当てる。
分析の結果,反射はおおむね肯定的であり,モデルの初期回答を変えることは滅多にないことがわかった。
本稿では,いくつかの候補解が生成されると推論プロセスが停止し,推論時間のトークン効率を向上させる質問認識早期検索手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:57:10 GMT)
Mitigating Forgetting in LLM Fine-Tuning via Low-Perplexity Token Learning [65.2] LLM生成データによる微調整により,目標タスクの性能が向上し,非目標タスクの劣化が低減されることを示す。
微調整後のLSMにおける破滅的忘れを緩和するために、トークンの難易度低減に基づく経験的説明を提供する最初の研究である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:25:41 GMT)
MATRIX: Multimodal Agent Tuning for Robust Tool-Use Reasoning [65.2] マルチモーダル軌道を自動的に合成する視覚中心型エージェントチューニングフレームワークを開発した。
また、自動生成された11Kの選好ペアであるPref-Xについても紹介する。
Agent-X、GTA、GAIAの3つのベンチマークで、MATRIXはオープンソースとクローズドソースの両方のVLMを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:54 GMT)
Scenario-Wise Rec: A Multi-Scenario Recommendation Benchmark [65.1] 6つの公開データセットと12のベンチマークモデルと、トレーニングと評価パイプラインで構成されるベンチマークである textbfScenario-Wise Rec を紹介します。
このベンチマークは、研究者に先行研究から貴重な洞察を提供することを目的としており、新しいモデルの開発を可能にしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:59:00 GMT)
Thinking with Camera: A Unified Multimodal Model for Camera-Centric Understanding and Generation [65.1] Puffinはカメラ中心のマルチモーダルモデルであり、カメラ次元に沿って空間認識を拡張する。
我々は,カメラを言語として扱う新しいパラダイムを導入し,カメラによる思考を可能にした。
コード、モデル、データセットパイプライン、ベンチマークを公開し、マルチモーダル空間知能研究を前進させます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:29 GMT)
Unveiling the Power of Multiple Gossip Steps: A Stability-Based Generalization Analysis in Decentralized Training [64.8] 分散トレーニングは集中型サーバを取り除き、通信効率が向上し、トレーニング効率が大幅に向上するが、集中型トレーニングに比べてパフォーマンスが低下することが多い。
MultiGossip Steps (MGS) は、分散トレーニングと集中トレーニングの間に、シンプルだが効果的なブリッジとして機能する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:14:47 GMT)
Splat the Net: Radiance Fields with Splattable Neural Primitives [64.8] 安定なニューラルプリミティブは、プリミティブベースのスプレイティングの効率でニューラルモデルの表現性を調整します。
私たちの表現は、高価な光線マーチングを必要とせずに、ビュー線に沿った統合をサポートします。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:31:11 GMT)
HA-VLN 2.0: An Open Benchmark and Leaderboard for Human-Aware Navigation in Discrete and Continuous Environments with Dynamic Multi-Human Interactions [64.7] HA-VLN 2.0は、明示的な社会的認識制約を導入した統一ベンチマークである。
その結果、明示的な社会的モデリングはナビゲーションの堅牢性を向上し、衝突を減らすことが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:17:24 GMT)
Code Agent can be an End-to-end System Hacker: Benchmarking Real-world Threats of Computer-use Agent [64.1] 我々は,MITRE ATT&CK Enterprise Matrix において,実世界の TTP に対応する最初のベンチマークである AdvCUA を提案する。
ReAct、AutoGPT、Gemini CLI、Cursor CLIの5つの主要なCUAを評価した。
結果は、現在のフロンティアCUAがOSのセキュリティ中心の脅威を十分にカバーしていないことを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:18:19 GMT)
QoNext: Towards Next-generation QoE for Foundation Models [63.8] ファウンデーションモデルの既存の評価は、本当に重要なこと、つまりインタラクション中のユーザの経験を捉えるのに失敗します。
基礎モデルの評価にQuality of Experienceの原則を適用する最初のフレームワークであるQoNextを紹介します。
我々はQoE指向のデータベースを構築し、測定可能なシステムパラメータから知覚されたユーザエクスペリエンスを推定する予測モデルを訓練する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:06:14 GMT)
R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? [63.5] R-HoriZONは、Large Reasoning Models(LRMs)における長い水平推論挙動を刺激するために設計された方法である
R-HoriZONに基づいて、長い推論地平線にまたがる相互依存問題を伴う複雑な多段階推論タスクを含む、長期水平推論ベンチマークを構築する。
分析の結果, LRMは有効推論長が限られており, 複数の問題に対する思考予算の配分に苦慮していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:16:22 GMT)
Better Together: Leveraging Unpaired Multimodal Data for Stronger Unimodal Models [63.0] In this present: Unpaired Multimodal, a modality-agnostic training paradigm, a single model then alternately processs from different modalities while sharing parameters across。
補助モダリティからの未ペアリングデータを使用することで、画像や音声などの様々な単一目標に対して、ダウンストリーム性能が一貫して向上することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:32:23 GMT)
MoA-VR: A Mixture-of-Agents System Towards All-in-One Video Restoration [62.9] 実世界のビデオは、ノイズ、圧縮アーティファクト、低照度歪みなどの複雑な劣化に悩まされることが多い。
3つの協調エージェントによる人間のプロの推論・処理手順を模倣したMoA-VRを提案する。
具体的には、大規模かつ高解像度なビデオ劣化認識ベンチマークを構築し、視覚言語モデル(VLM)による劣化識別子を構築する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:42:51 GMT)
Controllable Video Synthesis via Variational Inference [62.8] 未特定要素の多様性を維持しつつ,特定の要素に対して高い制御性を持つサンプルを生成するビデオ合成法を開発した。
我々は,複数のビデオ生成バックボーンを利用して,全てのタスク制約を総合的に考慮し,構成された分布を近似するために,このタスクを変分推論としてキャストした。
実験により, 従来よりも制御性, 多様性, 3次元の整合性が向上した試料が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:48:16 GMT)
Paper2Video: Automatic Video Generation from Scientific Papers [62.6] Paper2Videoは、著者が作成したプレゼンテーションビデオ、スライド、スピーカーメタデータと組み合わせた101の研究論文の最初のベンチマークである。
そこで我々は,学術プレゼンテーションビデオ生成のための最初のマルチエージェントフレームワークであるPaperTalkerを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:29:00 GMT)
UniMMVSR: A Unified Multi-Modal Framework for Cascaded Video Super-Resolution [62.1] カスケードビデオ超解像は、大規模な基礎モデルを用いて高解像度ビデオを生成するための有望な技術として登場した。
UniMMVSRは,テキスト,画像,ビデオを含むハイブリッドモード条件を組み込んだ最初の統合ビデオ超解像フレームワークである。
実験の結果、UniMMVSRは既存の手法よりも優れており、より細部が良く、マルチモーダル条件への適合度が高いビデオを生成することがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:25:16 GMT)
Generate Any Scene: Scene Graph Driven Data Synthesis for Visual Generation Training [61.8] データエンジンであるGenerate Any Sceneを紹介し、視覚的なシーンの配列を表すシーングラフを列挙する。
サンプルのシーングラフが与えられた場合、Generate Any Sceneはそれを、テキスト・トゥ・イメージやテキスト・トゥ・ビデオ生成のためのキャプションに変換する。
また、視覚的な質問応答の集合に翻訳し、意味的アライメントの自動評価と報酬モデリングを可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:10:23 GMT)
Pseudo2Real: Task Arithmetic for Pseudo-Label Correction in Automatic Speech Recognition [61.7] 現実世界のシステムは、ラベル付きデータに制限のある、目に見えないアクセントとドメインに遭遇する。
擬似ラベルは、しばしばフィルタリングが修正に失敗するシステマティックでアクセント固有のエラーをもたらす。
そこで本研究では,これらの繰り返しバイアスを目的の真理を含まない簡単なパラメータ空間補正を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:31:47 GMT)
BEAR: Benchmarking and Enhancing Multimodal Language Models for Atomic Embodied Capabilities [61.2] 身体能力とは、エージェントが物理的世界を理解し、理解し、相互作用する一連の基本的な能力を指す。
我々は,原子エンボディド能力のMLLMを評価する,包括的できめ細かなベンチマークであるBEARを紹介する。
BEARは、低レベルポインティング、軌跡理解、空間的推論、高レベルプランニングといったタスクを含む、14のドメインにまたがる4,469のインターリーブイメージビデオテキストエントリで構成されている。
我々は,MLLM知覚,3D理解,計画能力を強化するために,事前学習された視覚モデルを統合するマルチモーダル・コンバータブルエージェントであるBEAR-Agentを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:18:36 GMT)
DICEPTION: A Generalist Diffusion Model for Visual Perceptual Tasks [61.2] 計算資源と限られた訓練データとの制約下で複数のタスクに対処できる頑健な一般認識モデルを構築した。
我々は、何十億もの画像に事前訓練されたテキスト・画像拡散モデルを活用し、ビジュアル・ジェネラリスト・モデルであるDICEPTIONの導入に成功した。
DICEPTIONは、SOTAシングルタスクスペシャリストモデルに匹敵するパフォーマンスを達成しつつ、様々な知覚タスクに効果的に取り組むことを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:27:36 GMT)
Product of Experts for Visual Generation [60.9] 異種モデルから推論時知識合成を行うPoE(Product of Experts)フレームワークを提案する。
本フレームワークは画像と映像の合成作業において実用的な利点を示し,モノリシックな手法よりも制御性が高いことを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:37:47 GMT)
UniVideo: Unified Understanding, Generation, and Editing for Videos [60.9] 統合モデリングをビデオ領域に拡張する汎用フレームワークUniVideoを提案する。
UniVideoは、単一のマルチモーダル命令パラダイムの下で、多様なビデオ生成と編集タスクを統合する。
We show that UniVideo match or over the state-the-the-art task-specific baselines in text/image-to-video generation, in-context video generation and in-context video editing。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:01:30 GMT)
Hallucination Detection in LLMs with Topological Divergence on Attention Graphs [60.8] 幻覚(Halucination)、すなわち、事実的に誤ったコンテンツを生成することは、大きな言語モデルにとって重要な課題である。
本稿では,TOHA (Topology-based HAllucination detector) をRAG設定に導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:14:09 GMT)
Large Scale Diffusion Distillation via Score-Regularized Continuous-Time Consistency [60.7] 連続時間一貫性モデル(sCM)は理論的に原理化され、学術規模の拡散を加速するために実証的に強力である。
まず並列性互換なFlashAttention-2 JVPカーネルを開発し、100億以上のパラメータと高次元ビデオタスクを持つモデル上でsCMトレーニングを可能にする。
本稿では, スコア蒸留を長軸正則化器として組み込んだスコア規則化連続時間一貫性モデル(rCM)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:45:30 GMT)
LLMs Learn to Deceive Unintentionally: Emergent Misalignment in Dishonesty from Misaligned Samples to Biased Human-AI Interactions [60.5] 本研究は, 緊急不整合が, 安全行動を超えて, より広範な不正行為や詐欺のスペクトルにまで及ぼせるかどうかを, 高リスクシナリオ下で検討する。
さまざまな領域にまたがるミスアライメントの完了について、LLMをオープンソースにしました。
標準下流タスクに1%のミスアライメントデータを導入するだけで、正直な振る舞いを20%以上減らすのに十分であることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:35:19 GMT)
BLAZER: Bootstrapping LLM-based Manipulation Agents with Zero-Shot Data Generation [59.7] BLAZERは、自動生成されたトレーニングデータから操作ポリシーを学ぶフレームワークである。
シミュレーション環境と実環境の両方において、BLAZERはゼロショット操作を大幅に改善することを示す。
私たちのコードとデータはプロジェクトのページで公開されます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:58 GMT)
Not All Clients Are Equal: Collaborative Model Personalization on Heterogeneous Multi-Modal Clients [59.5] 計算コストを伴わずに異種アーキテクチャ間の知識共有を可能にするFedMosaicを提案する。
実世界のタスクの多様性を模倣するために,40の異なるタスクにまたがるマルチモーダルPFLベンチマークを提案する。
実証研究は、FedMosaicが最先端のPFL法より優れていることを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:07:53 GMT)
OneFlow: Concurrent Mixed-Modal and Interleaved Generation with Edit Flows [59.1] 可変長および同時混合モード生成が可能な最初の非自己回帰型マルチモーダルモデルであるOneFlowを提案する。
テキストと画像生成の間の厳格な因果順序を強制する自己回帰モデルとは異なり、OneFlowは個別のテキストトークンに対する挿入ベースのEdit Flowと、画像潜伏者のためのFlow Matchingを組み合わせる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:05:49 GMT)
DISCO: Diversifying Sample Condensation for Efficient Model Evaluation [59.0] コスト評価は傾向を低下させ、イノベーションのサイクルを遅くし、環境への影響を悪化させる。
モデル応答の多様性を最大化するサンプルを選択することが重要となる。
我々のメソッドである$textbfDiversifying Sample Condensation (DISCO)$は、最も大きなモデル不一致を持つトップkサンプルを選択します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:53:59 GMT)
AutoRed: A Free-form Adversarial Prompt Generation Framework for Automated Red Teaming [58.7] AutoRedは、シード命令の必要性を取り除く自由形式の逆プロンプト生成フレームワークである。
2つのレッドチームデータセットを構築し、8つの最先端の大規模言語モデルを評価する。
本研究は,シードベースアプローチの限界を強調し,安全性評価のための自由形レッドチームの可能性を示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:17:28 GMT)
Drift No More? Context Equilibria in Multi-Turn LLM Interactions [58.7] コンテキストドリフト(Contexts drift)とは、ターン間のゴール一貫性のある振る舞いからモデルが出力する出力の段階的なばらつきである。
シングルターンエラーとは異なり、ドリフトは時間的に展開し、静的な評価指標では捉えにくい。
マルチターンドリフトは、避けられない崩壊というよりも、制御可能な平衡現象として理解できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:48:49 GMT)
AdaSwitch: Adaptive Switching Generation for Knowledge Distillation [58.6] スモール言語モデル(SLM)は、厳密な待ち時間と計算制約のあるアプリケーションには不可欠である。
トークンレベルでのオン・ポリティクスとオフ・ポリティクス・ジェネレーションを組み合わせた新しいアプローチであるAdaSwitchを提案する。
AdaSwitchは一貫して精度を向上し、SLMを蒸留するための実用的で効果的な方法を提供し、追加のオーバーヘッドを許容する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:38:37 GMT)
Parallel Test-Time Scaling for Latent Reasoning Models [58.4] 並列テスト時間スケーリング(TTS)は、大規模言語モデル(LLM)の拡張のための重要なアプローチである。
連続ベクトル空間において中間的推論が展開する潜在的推論の最近の進歩は、明示的なチェーン・オブ・サート(Chain-of-Thought)に対するより効率的な代替手段を提供する。
この作業は、上記の問題に対処することで、潜在推論モデルに対する並列TSを可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:33:00 GMT)
UltraLED: Learning to See Everything in Ultra-High Dynamic Range Scenes [58.0] 超高ダイナミックレンジのシーンは、明るい領域と暗い領域の間に顕著な露光差を示す。
RGBベースのブラケット法は、短距離露光ペアを使用して両端の細部をキャプチャできるが、修正ミスやゴーストのアーティファクトの影響を受けやすい。
本研究では,ゴーストや動きのぼかしを本質的に回避する,単一の短時間露光フレームにのみ依存する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:29:39 GMT)
PARL-MT: Learning to Call Functions in Multi-Turn Conversation with Progress Awareness [57.0] マルチターン関数呼び出しのためのLLMトレーニングに進捗認識を明示的に組み込むフレームワークであるPARL-MTを導入する。
PARL-MTは既存の手法よりも優れており、堅牢で効率的なマルチターン関数呼び出しの実現における進捗認識の有効性を強調している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:23:18 GMT)
AlignCAT: Visual-Linguistic Alignment of Category and Attribute for Weakly Supervised Visual Grounding [57.0] 弱教師付きビジュアルグラウンドティングは、テキスト記述に基づいて画像中のオブジェクトを見つけることを目的としている。
既存の手法では、テキスト表現の微妙な意味的差異を区別するために、強力なクロスモーダル推論が欠如している。
本稿では、弱教師付きVGのための新しいクエリベースのセマンティックマッチングフレームワークAlignCATを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:01:50 GMT)
A Multimodal Depth-Aware Method For Embodied Reference Understanding [56.3] Embodied Reference Understandingでは、言語命令とポインティングキューの両方に基づいて、視覚的なシーンで対象のオブジェクトを識別する必要がある。
本稿では,データ拡張,深度マップのモダリティ,深度認識決定モジュールを共同で活用する新しいERUフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:32:21 GMT)
OASIS: Online Sample Selection for Continual Visual Instruction Tuning [55.9] 連続的インストラクションチューニング(CIT)のシナリオでは、新しいインストラクションチューニングデータがオンラインストリーミング形式で連続的に到着する。
データの選択はこのオーバーヘッドを軽減することができるが、既存の戦略はしばしば事前訓練された参照モデルに依存している。
最近の参照モデルなしオンラインサンプル選択手法はこれに対処するが、典型的にはバッチ毎に一定の数のサンプルを選択する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:42:58 GMT)
FastUMI-100K: Advancing Data-driven Robotic Manipulation with a Large-scale UMI-style Dataset [55.7] 我々は,大規模なUMIスタイルのマルチモーダルデモデータセットであるFastUMI-100Kを提案する。
FastUMI-100Kは、現実世界のロボットデモデータの多様な要求を満たすために、よりスケーラブルで柔軟性があり、適応可能なソリューションを提供する。
我々のデータセットは、エンドエフェクタ状態、多視点手首装着魚眼画像、テキストアノテーションを含むマルチモーダルストリームを統合している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:57:25 GMT)
PRVR: Partially Relevant Video Retrieval [55.4] 現在のテキスト・ツー・ビデオ検索(T2VR)では、ビデオとアドホックなテキストクエリの対応が自然に存在するように、検索対象の動画を適切にトリミングしている。
本稿では,PRVR(Partially Relevant Video Retrieval)と呼ぶこの設定に関する最初の研究について述べる。
PRVRタスクを複数インスタンス学習問題として定式化し、クリップスケールとフレームスケールの両方の類似性を共同で学習するマルチスケール類似学習(MS-SL++)ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:57:01 GMT)
ThinkNote: Enhancing Knowledge Integration and Utilization of Large Language Models via Constructivist Cognition Modeling [55.2] 大規模言語モデル(LLM)は、幅広いNLPタスクにおいて強力なパフォーマンスを示している。
それらはしばしば、不慣れな外部情報に晒されたとき、最適でない行動と矛盾を示す。
本稿では,LLMの外部知識活用を促進する新しいフレームワークであるThinkNoteを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:11:43 GMT)
Surfel-based Gaussian Inverse Rendering for Fast and Relightable Dynamic Human Reconstruction from Monocular Video [54.9] SGIAは、リライトブルな動的人間の再構築のための効率的なトレーニングとレンダリングを導入している。
本手法は,光速計算のための事前積分と画像ベース照明を統合する。
実験により、SGIAは極めて正確な物理的特性を達成し、ダイナミックな人間のアバターのリアルなリライティングを著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:59:37 GMT)
dInfer: An Efficient Inference Framework for Diffusion Language Models [54.8] 拡散に基づく大規模言語モデル (dLLM) は自己回帰(AR) LLM に代わる有望な代替品として登場した。
本稿では、dLLM推論のための効率的かつ効率的なフレームワークであるdInferについて述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:19:42 GMT)
Robust Source-Free Domain Adaptation for Medical Image Segmentation based on Curriculum Learning [54.5] ソースフリーなドメイン適応のためのカリキュラム(LFC)から学習するカリキュラムベースのフレームワークを提案する。
提案したソースフリー領域適応手法を,ファンドスセグメンテーションとポリプセグメンテーションのためのパブリッククロスドメインデータセット上で評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:15:10 GMT)
Evaluating LLMs' Mathematical Reasoning in Financial Document Question Answering [54.5] 本研究では,大言語モデルによる4つの財務質問応答データセットの数学的推論について検討する。
数理推論のステップの数が増えるにつれて、テーブルの複雑さや性能の変化に対する感度に焦点をあてる。
半構造化文書に適した新しいプロンプト技術を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:32:43 GMT)
BEVTrack: A Simple and Strong Baseline for 3D Single Object Tracking in Bird's-Eye View [54.5] 3Dシングルオブジェクトトラッキング(SOT)はコンピュータビジョンの基本課題であり、自律運転のようなアプリケーションにおいて重要な役割を果たす。
BEVTrackは、シンプルだが効果的な動きに基づくトラッキング手法である。
我々は,BEVTrackが200FPSで動作しながら最先端の結果を達成し,リアルタイム適用性を実現していることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:31:44 GMT)
ARES: Multimodal Adaptive Reasoning via Difficulty-Aware Token-Level Entropy Shaping [54.4] 本稿では,タスクの難易度に基づいて探索作業を動的に割り当てる適応推論のための統合フレームワークであるARESを提案する。
単一トークンエントロピーはノイズが多いが,高いウィンドウエントロピー(HWE)トークンは推論クリティカルな瞬間を確実に捉えることができる。
In the Adaptive Cold-Start stage, we curate multimodal and textual data paired with reasoning traces of length proportional to problem difficulty。
第2段階では,HWEトークンを探索トリガとする適応エントロピーポリシー最適化(AEPO)を開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:03:28 GMT)
ReasonMed: A 370K Multi-Agent Generated Dataset for Advancing Medical Reasoning [54.3] ReasonMedは、これまでで最大の医療推論データセットで、370万の高品質な例がある。
マルチエージェント生成、検証、改善プロセスを通じて構築される。
ReasonMedを用いて、簡潔な答えの要約と詳細なCoT推論を統合することで、最も堅牢な微調整結果が得られる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:42:50 GMT)
DeepPrune: Parallel Scaling without Inter-trace Redundancy [53.6] 並列推論トレースの80%以上は、実質的な無駄な計算を代表して、同じ最終回答をもたらす。
動的プルーニングによる効率的な並列スケーリングを実現する新しいフレームワークであるDeepPruneを提案する。
我々の研究は並列推論のための新しい標準を確立し、高性能推論をより効率的にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:24:54 GMT)
Benchmarking Chinese Commonsense Reasoning with a Multi-hop Reasoning Perspective [53.6] 我々は,大言語モデル(LLM)を評価するために,中国語コモンセンスマルチホップ推論(CCMOR)を提案する。
CCMORは、中国固有の事実知識と多段階論理的推論を統合するLLMの能力を評価するように設計されている。
提案手法では,提案手法を用いて,提案手法の検証と検証を行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:29:00 GMT)
TIGeR: Tool-Integrated Geometric Reasoning in Vision-Language Models for Robotics [53.4] 本稿では、視覚言語モデル(VLM)を幾何学コンピュータに変換する新しいフレームワークであるTIGeR(Tool-Integrated Geometric Reasoning)を提案する。
TIGeRは、ニューラルネットワーク内で複雑な幾何学的操作を内部化しようとするのではなく、幾何学的推論要求を認識するためにモデルに権限を与える。
TIGeRは、実世界のロボット操作タスクにおいて、センチメートルレベルの精度を示しながら、幾何学的推論ベンチマーク上でSOTA性能を達成することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:56:25 GMT)
Motion Capture from Inertial and Vision Sensors [53.0] Inertial と visION Sensors から収集した大規模なモーションキャプチャーデータセット MINIONS をコントリビュートする。
提案するMINIONSデータセットを用いて,IMUやビデオから人間の動きをキャプチャするSparseNetフレームワークを提案する。
実験結果は、慣性・視覚センサーの独特な利点を強調し、消費者が使用可能なマルチモーダルモーションキャプチャーの可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:36:13 GMT)
Equilibrium Matching: Generative Modeling with Implicit Energy-Based Models [52.7] EqMは、平衡力学の観点から構築された生成モデリングフレームワークである。
時間条件の速度を統一された平衡景観に置き換えることで、EqMは流れとエネルギーベースのモデルの間により緊密な橋渡しを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:25:23 GMT)
FedBook: A Unified Federated Graph Foundation Codebook with Intra-domain and Inter-domain Knowledge Modeling [52.1] サーバサイドのフェデレーション事前トレーニング中にクライアントのローカルコードブックを集約する統合グラフ基盤コードブックであるFedBookを提案する。
FedBookは、独立した教師付き学習、FL/FGL、集中型GFMのフェデレーション適応、FedGFM技術など、21のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:50:30 GMT)
How Many Code and Test Cases Are Enough? Evaluating Test Cases Generation from a Binary-Matrix Perspective [51.3] LLM(Large Language Models)が自動生成するテストケースの評価は、非常に難しい作業です。
既存のベンチマークは高い計算コスト、インフレーションのスコア、稀でクリティカルな欠陥に対する自明なバグに対するバイアスに悩まされている。
本稿では,ベンチマーク構築をバイナリコードテスト行列の最適な診断基準として定式化するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:29:24 GMT)
A Unified Multi-Task Learning Framework for Generative Auto-Bidding with Validation-Aligned Optimization [51.3] マルチタスク学習は、これらのタスクを共有表現を通じて共同でトレーニングするための、原則化されたフレームワークを提供する。
既存のマルチタスク最適化戦略は、主にトレーニングダイナミクスによって導かれ、不安定な入札環境ではよく一般化される。
本稿では,タスク毎のトレーニング勾配と保留有効度勾配のアライメントに基づいてタスク重みを適応的に割り当てる,バリデーション適応型マルチタスク最適化(VAMO)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:59:51 GMT)
IntentionVLA: Generalizable and Efficient Embodied Intention Reasoning for Human-Robot Interaction [51.1] Vision-Language-Action(VLA)モデルは、事前訓練された視覚言語モデル(VLM)を活用して、ロボット制御との認識を両立させる。
カリキュラム学習パラダイムと効率的な推論機構を備えたVLAフレームワークである textbfIntentionVLA を提案する。
提案手法はまず,意図推論,空間的接地,コンパクトな具体的推論を組み合わせ,慎重に設計した推論データを活用する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:49:46 GMT)
Bidirectional Representations Augmented Autoregressive Biological Sequence Generation:Application in De Novo Peptide Sequencing [51.1] 自己回帰(AR)モデルは、全体的な双方向表現を提供するが、生成的コヒーレンスとスケーラビリティに関する課題に直面している。
非自己回帰機構からリッチなコンテキスト情報を動的に統合することにより、AR生成を向上するハイブリッドフレームワークを提案する。
新しいクロスデコーダアテンションモジュールにより、ARデコーダは、これらの双方向機能を反復的にクエリし、統合することができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:52:55 GMT)
An End-to-End Room Geometry Constrained Depth Estimation Framework for Indoor Panorama Images [50.8] 既存の手法ではピクセルレベルの精度に重点を置いており、部屋の角が乱れ、ノイズ感度が低下する。
室内形状制約に基づく奥行き推定フレームワークを提案する。
本フレームワークには,部屋形状に基づく背景深度解決戦略と,背景分割誘導型融合機構の2つの戦略が組み込まれている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:52:48 GMT)
BRIGHT: A globally distributed multimodal building damage assessment dataset with very-high-resolution for all-weather disaster response [50.8] ビル被害評価(BDA)は、人的被害を減らすために災害後の重要な能力である。
近年の研究では、目に見えない災害事象の正確なマッピングを実現するためのAIモデルの開発に焦点が当てられている。
本稿では, veRy-hIGH-resoluTion Optical and SAR image (BRIGHT) を用いたBDAデータセットを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:34:50 GMT)
CurvNet: Latent Contour Representation and Iterative Data Engine for Curvature Angle Estimation [50.7] CurvNetは曲率角推定フレームワークである。
我々は、画像自己生成、自動アノテーション、自動選択を備えたデータエンジンを開発する。
提案手法は,最先端のコブ角推定性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:25:48 GMT)
In-Context Clustering with Large Language Models [50.3] ICCは、注意機構を通じて入力間の複雑な関係をキャプチャする。
事前学習したLLMは、テキスト符号化された数値データに対して、印象的なゼロショットクラスタリング機能を示す。
我々の研究は、文脈内学習を教師なしの設定に拡張し、クラスタリングにおけるLLMの有効性と柔軟性を示します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:07:55 GMT)
Self-Improving LLM Agents at Test-Time [49.9] 言語モデル(LM)の1つのパラダイムは、大規模なトレーニングデータセットの作成に依存している。
実際には、大量のデータを集めることは非効率であり、それらのトレーニングは違法に高価である。
テスト時間自己改善(TT-SI)とテスト時間蒸留(TT-D)の2つのバリエーションについて検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:37:35 GMT)
The Curious Case of In-Training Compression of State Space Models [49.8] ステートスペースモデル(SSM)は、並列化可能なトレーニングと高速推論の両方を提供する。
鍵となる設計上の課題は、表現力の最大化と計算負荷の制限の間の適切なバランスを打つことだ。
我々のアプローチである textscCompreSSM はリニアリカレントユニットのような線形時間不変SSMに適用されるが、選択モデルにも拡張可能である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:32:54 GMT)
Beyond Single Frames: Can LMMs Comprehend Temporal and Contextual Narratives in Image Sequences? [49.2] StripCipherはLMM(Large Multimodal Models)の機能を評価するために設計されたベンチマークである。
StripCipherは、人間の注釈付きデータセットと、視覚的物語理解、文脈的フレーム予測、時間的物語再構成という3つの挑戦的なサブタスクで構成されている。
GPT-4o や Qwen2.5VL を含む16種類の最先端 LMM の評価を行ったところ,人的能力と比較して大きな性能差が認められた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:52:21 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [49.2] 二段階強化学習(BRL)は、生成モデルを調整するための強力なフレームワークとして登場した。
連続状態-作用複雑性において$mathcalO(epsilon)$の最初のサンプルを示す。
我々の分析は、既存の$mathcalO(epsilon)$のバウンダリで、複雑さを改善します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:45:25 GMT)
Training-Free Safe Denoisers for Safe Use of Diffusion Models [48.7] 強力な拡散モデル(DM)は、安全でない作業用コンテンツ(NSFW)を生成したり、忘れられたい個人の著作権のある資料やデータを生成するためにしばしば誤用される。
我々は,データ分布の否定領域を回避しつつ,高品質なサンプルを生成する実用的なアルゴリズムを開発した。
これらの結果は、DMをより安全に使用するための、トレーニング不要の安全なデノイザーの大きな可能性を示唆している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:28:40 GMT)
Knowledge-Driven Federated Graph Learning on Model Heterogeneity [48.0] FGL(Federated Graph Learning)は、協調グラフ表現学習において、有望なパラダイムとして登場した。
本稿では,FedGKC(Federated Graph Knowledge Collaboration)フレームワークを提案する。
FedGKCは、MHtFGLシナリオのベースラインよりも平均3.74%の精度向上を実現し、均一な設定では優れたパフォーマンスを維持している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:20:16 GMT)
Contrastive Self-Supervised Learning at the Edge: An Energy Perspective [47.7] 我々は,SimCLR,MoCo,SimSiam,Barlow Twinsの4つのコントラスト学習フレームワークの評価を行った。
我々は,これらのCLフレームワークのエッジおよびフォグ展開の実現可能性に注目し,体系的なベンチマーク戦略を導入する。
この結果,SimCLRは計算コストの認識に反し,様々なデータ体制における省エネ効果を実証していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:57:44 GMT)
CoCoA: Collaborative Chain-of-Agents for Parametric-Retrieved Knowledge Synergy [47.2] Retrieval-Augmented Generation (RAG)はLarge Language Models (LLM)を強化する
現在のRAG法は、世代間の知識を完全に活用するのに苦労することが多い。
本稿では,パラメトリックな知識と検索された知識の相乗効果を明確に向上するフレームワークであるCollaborative Chain-of-Agentsを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:53:40 GMT)
MAGREF: Masked Guidance for Any-Reference Video Generation with Subject Disentanglement [47.1] 我々は、任意の参照ビデオ生成のための統一的で効果的なフレームワークであるMAGREFを紹介する。
提案手法は,マスキング誘導と主観的ゆがみ機構を取り入れたものである。
包括的なベンチマークの実験は、MAGREFが既存の最先端のアプローチを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:41:12 GMT)
Cost-aware Stopping for Bayesian Optimization [47.0] 本稿では,様々な評価コストに適応し,チューニングが不要なベイズ最適化のためのコスト対応停止則を提案する。
我々は,最先端の取得関数と組み合わせた場合,停止規則によって得られる期待累積評価コストを拘束する理論的な保証を証明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:49:46 GMT)
Breaking the Reviewer: Assessing the Vulnerability of Large Language Models in Automated Peer Review Under Textual Adversarial Attacks [46.9] 本稿では,大規模言語モデル (LLM) が,敵対的攻撃の存在下で自動レビュアーとして使用されることのロバスト性について検討する。
テキスト操作はLLM評価を歪ませる可能性があるため,本評価は重大な脆弱性を明らかにする。
我々の発見は、学術コミュニケーションの完全性よりも、AIの強化を確実にするために、敵対的リスクに対処することの重要性を強調した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:07:40 GMT)
ARM2: Adaptive Reasoning Model with Vision Understanding and Executable Code [46.9] 大規模推論モデル(LRM)は、しばしば過剰な思考の問題に悩まされ、単純なタスクに対する不必要に長い推論を引き起こす。
ARM2は、複数のフォーマットにわたる推論性能と効率を適応的にバランスさせる統一モデルである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:49:34 GMT)
ComGS: Efficient 3D Object-Scene Composition via Surface Octahedral Probes [46.8] Gaussian Splatting (GS)は没入型レンダリングを可能にするが、現実的な3Dオブジェクトシーンの合成は難しいままである。
我々は,新しい3Dオブジェクトシーン合成フレームワークであるComGSを提案する。
提案手法は,28FPS程度の高画質リアルタイムレンダリングを実現し,鮮明な影で視覚的に調和し,編集に36秒しか必要としない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:10:41 GMT)
A$^2$Search: Ambiguity-Aware Question Answering with Reinforcement Learning [46.8] A$2$Searchはアノテーションのないエンドツーエンドのトレーニングフレームワークで、曖昧さを認識し、扱います。
8つのオープンドメインQAベンチマークの実験では、A$2$Searchが新しい最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:53:31 GMT)
Comprehensiveness Metrics for Automatic Evaluation of Factual Recall in Text Generation [46.7] 大規模言語モデル(LLM)は、不完全または選択的に鍵情報を省略する出力を生成する。
センシティブなドメインでは、そのような欠落は、事実的不正確さによって引き起こされるものと同等の重大な害をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:22:24 GMT)
Near-optimal Rank Adaptive Inference of High Dimensional Matrices [46.7] 線形測定から高次元行列を推定する問題に対処する。
本稿では,Last-Squares推定器と共通特異値しきい値のしきい値処理を併用したアルゴリズムを提案する。
この結果は, 特異値しきい値のしきい値に基づく行列分解手法の高度化に依拠している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:01:46 GMT)
LogicMP: A Neuro-symbolic Approach for Encoding First-order Logic Constraints [46.6] 本稿では,MLN上で平均場変動推定を行う新しいニューラルネットワーク層LogicMPを提案する。
モジュール性と効率を保ちながら、FOLCをエンコードするために、市販のニューラルネットワークにプラグインすることができる。
グラフ、画像、テキストの3種類のタスクを経験した結果、LogicMPは、パフォーマンスと効率の両面で、先進的な競合より優れています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:36:43 GMT)
DEGS: Deformable Event-based 3D Gaussian Splatting from RGB and Event Stream [46.5] 本稿では2つのモードから動的3DGSを協調的に最適化する新しいフレームワークを提案する。
鍵となる考え方は、変形場の最適化を導くために、イベント・モーション・プレファレンスを採用することである。
提案手法は,合成シーンと実シーンをまたいだ既存の画像およびイベントベースアプローチより優れる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:43:27 GMT)
Do LLMs Really Need 10+ Thoughts for "Find the Time 1000 Days Later"? Towards Structural Understanding of LLM Overthinking [46.4] ロングチェーン・オブ・シント(CoT)モデルは、単純なクエリであっても、必要以上に広範囲な推論を行うことが多い。
本研究では, LLMの思考過程の体系的, きめ細かな解析を行い, そのギャップ, TRACEを橋渡しする。
筆者らは,長さに基づくメトリクスを超えて,過剰思考のユーティリティベース定義を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:33:25 GMT)
DEAS: DEtached value learning with Action Sequence for Scalable Offline RL [46.4] Action Sequence(DEAS)は、アクションシーケンスをバリュー学習に活用する、シンプルだが効果的なオフラインRLフレームワークである。
DEASはOGBenchの複雑な長期タスクのベースラインを一貫して上回る。
大規模ビジョン・ランゲージ・アクションモデルの性能向上に応用できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:11:09 GMT)
SkipSR: Faster Super Resolution with Token Skipping [46.4] 拡散型超解像(SR)はビデオ生成とビデオ復元において重要な要素であるが、遅くて高価である。
我々は,低解像度入力から直接低次元領域を識別することで,ビデオSRを高速化するフレームワークであるSkipSRを提案する。
標準SRベンチマークでは、720pビデオの従来モデルよりも最大60%高速で、品質が損なわれない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:27:11 GMT)
MultiCOIN: Multi-Modal COntrollable Video INbetweening [46.4] マルチモーダル制御が可能なビデオインベントリフレームワークである Modelname を紹介する。
DiTとマルチモーダルコントロールの互換性を確保するため、すべてのモーションコントロールを共通スパース表現にマッピングする。
実験により、マルチモーダルコントロールにより、よりダイナミックで、カスタマイズ可能で、文脈的に正確な視覚的物語が可能になることが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:27 GMT)
FlowSearch: Advancing deep research with dynamic structured knowledge flow [46.3] FlowSearchはマルチエージェントフレームワークで、動的に構造化された知識フローを構築し、進化させ、サブタスクの実行と推論を促進する。
GAIA、HLE、GPQA、TRQAなど、一般的なベンチマークと科学ベンチマークの両方で最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:48:12 GMT)
ReasonEmbed: Enhanced Text Embeddings for Reasoning-Intensive Document Retrieval [46.1] ReasonEmbedは、推論集約的な文書検索のために開発された新しいテキスト埋め込みモデルである。
ReMixerは、過去の合成データセットでよく見られる自明性問題を克服する新しいデータ合成手法である。
Redapterは自己適応学習アルゴリズムで、推論強度に基づいて各サンプルの重量を動的に調整する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:10:26 GMT)
SViM3D: Stable Video Material Diffusion for Single Image 3D Generation [46.0] ビデオ拡散モデルは、1つの画像から3Dオブジェクトを効率的に再構成するのに成功している。
我々は,映像拡散モデルを拡張し,空間的に変化するPBRパラメータと表面正規度を,明示的なカメラ制御に基づいて各生成したビューと共同で出力する。
このユニークなセットアップにより、私たちのモデルをニューラルプリエントとして使用した3Dアセットのリライトと生成が可能になります。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:29:47 GMT)
Multi-Source Knowledge Pruning for Retrieval-Augmented Generation: A Benchmark and Empirical Study [45.7] Retrieval-augmented Generation (RAG) は、大規模言語モデル(LLM)の幻覚を、外部知識の統合によって緩和するための効果的なアプローチである。
本稿では,多様な領域にまたがる構造化知識と非構造化知識を組み合わせたベンチマークデータセットを標準化する。
また,マルチグラニュラリティプルーニング戦略を主特徴とする,プラグアンドプレイのRAGフレームワークである textbfPruningRAG も開発している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:48:50 GMT)
Average-case quantum complexity from glassiness [45.6] グラスネス(Glassiness)は、物理学において、不安定な自由エネルギーの風景を特徴とする現象であり、安定な古典的アルゴリズムの難しさを意味する。
レプリカ対称性の破れに基づく標準的な量子ガラス性の概念は、ギブスサンプリングのための安定な量子アルゴリズムを妨げていることを証明している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:37:33 GMT)
Spatiotemporal Forecasting as Planning: A Model-Based Reinforcement Learning Approach with Generative World Models [45.5] 本研究では,モデルベース強化学習における新たなパラダイムであるSFP予測・アズ・プランニング(SFP)を提案する。
SFPは、多様な高時間将来の状態をシミュレートし、「想像に基づく」環境シミュレーションを可能にする新しい世界モデルを構築している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:48:26 GMT)
Unlocking 3D Affordance Segmentation with 2D Semantic Knowledge [45.2] Affordance segmentationは、3Dオブジェクトを機能的に異なる部分にパースすることを目的としている。
我々は,3次元エンコーダを昇降した2次元意味論と整合させ,再現,親和性,多様性を共同で最適化し,意味的に整理された表現を得るための事前学習戦略であるCross-Modal Affinity Transfer (CMAT)を導入する。
さらに,マルチモーダルプロンプトとCMAT対応機能を統合し,高精度かつ迅速なセグメンテーションマップを生成するCAST (Cross-modal Affordance Transformer) を設計する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:01:26 GMT)
Hybrid Reinforcement: When Reward Is Sparse, It's Better to Be Dense [45.1] HEROは、検証者信号と報酬モデルスコアを構造化された方法で統合する強化学習フレームワークである。
HEROはRMのみのベースラインと検証者のみのベースラインを一貫して上回り、検証可能なタスクと検証しにくいタスクの両方で大きな利益を上げている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:01:54 GMT)
ARTDECO: Towards Efficient and High-Fidelity On-the-Fly 3D Reconstruction with Structured Scene Representation [44.8] ARTDECOは、フィードフォワードモデルの効率とSLAMベースのパイプラインの信頼性を組み合わせた統合フレームワークである。
ARTDECOはSLAMに匹敵するインタラクティブな性能、フィードフォワードシステムに類似した堅牢性、シーンごとの最適化に近い再現品質を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:57:38 GMT)
High-dimensional Analysis of Synthetic Data Selection [44.7] 線形モデルでは,対象分布と合成データの分布の共分散が一般化誤差に影響を与えることを示す。
興味深いことに、線形モデルからの理論的な洞察は、ディープニューラルネットワークと生成モデルに受け継がれる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:06:31 GMT)
Improving Temporal Understanding Logic Consistency in Video-Language Models via Attention Enhancement [44.7] 大規模言語モデル(LLM)は、しばしば自己矛盾的な出力を生成する。
ビデオ言語モデル (Video-LLMs) は論理的に言い換えられた質問に対して一貫した応答を提供しない。
本稿では,テンポラリコンディショニング(Temporally Conditioned Attention Sharpening)と呼ばれるアテンション強化手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:22:06 GMT)
Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning [44.5] Supervised Fine-Tuning (SFT) Large Language Modelsは高品質なトレーニングデータに依存している。
自己進化型モデル駆動動的データ最適化フレームワークであるMiddoを紹介した。
その結果,Middoはシードデータの品質を継続的に向上し,LLMの性能を平均7.15%向上させることができた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:59:32 GMT)
Graph Diffusion Transformers are In-Context Molecular Designers [44.4] コンテキスト内学習は、いくつかのデモから新しいタスクに適応することができるが、分子設計での成功は限られている。
実験条件付き拡散モデル(DemoDiff)を導入し、テキスト記述の代わりに分子スコアの小さな例を用いてタスクコンテキストを定義する。
6つのカテゴリにおける33の設計タスクのうち、DemoDiffは100-1000$times$より大きく、ドメイン固有のアプローチでは5.25-10.20よりも平均3.63ランクに達する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:56:57 GMT)
oMeBench: Towards Robust Benchmarking of LLMs in Organic Mechanism Elucidation and Reasoning [44.4] 有機化学における有機機構推論のための,最初の大規模で専門家によるベンチマークであるoMeBenchを紹介する。
また,ステップレベルの論理と化学的類似性を組み合わせた動的評価フレームワークoMeSを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:13:31 GMT)
FlyLoRA: Boosting Task Decoupling and Parameter Efficiency via Implicit Rank-Wise Mixture-of-Experts [44.2] Low-Rank Adaptation (LoRA) は基礎モデルのパラメータ効率の高い微調整法である。
MoEベースのLoRA変種は、単一タスクの命令チューニングにおいて、タスク内相関を緩和する。
FlyLoRA は暗黙の MoE ベースの LoRA 変種であり、アッププロジェクション行列にランクワイズの専門家アクティベーションを導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:17:13 GMT)
Enhancing Reasoning for Diffusion LLMs via Distribution Matching Policy Optimization [44.1] 拡散大言語モデル(dLLM)は自己回帰大言語モデル(AR-LLM)の代替として有望である
強化学習(RL)は、推論などの重要なタスクにおいて、AR-LLMと同等のパフォーマンスを達成するために、dLLMにとって重要なコンポーネントである。
本稿では,原理的かつ理論的に基礎付けられたRL微調整法である分散マッチングポリシー最適化(DMPO)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:59:50 GMT)
Scaling Laws Are Unreliable for Downstream Tasks: A Reality Check [44.1] 下流のスケーリング法則は、より大規模なタスクパフォーマンスを、より小さなスケールでモデルのパフォーマンスから予測することを目的としている。
予測可能なスケーリングは少数のケースでのみ発生します。
明らかに実験的な設定の変更は、スケーリングの振る舞いを完全に変えます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:15:34 GMT)
Multimodal Safety Evaluation in Generative Agent Social Simulations [44.0] エージェントを3次元で評価するための再現可能なシミュレーションフレームワークを提案する。
エージェントはしばしば、地域のリビジョンとグローバルな安全の整合に失敗し、安全でない計画の修正で55%の成功率にしか達していないことを示す。
特に、誤解を招く視覚と組み合わせると、安全でない行動の45%が受け入れられ、画像が過信される傾向が強かった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:42:57 GMT)
RAGDiffusion: Faithful Cloth Generation via External Knowledge Assimilation [43.9] 本稿では、構造決定性を高め、幻覚を軽減するために、RAGDiffusionと呼ばれる新しいRAG(Retrieval-Augmented Generation)フレームワークを提案する。
RaGDiffusionは、構造的にもテクスチャ的にも忠実な衣服の資産を合成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:47:03 GMT)
Augur: Modeling Covariate Causal Associations in Time Series via Large Language Models [43.6] フルLLM駆動の時系列予測フレームワークであるAugurを紹介した。
強力な教師LLMは、時系列から有向因果グラフをペアの因果検定と共に探索を用いて推論する。
ライトウェイトな学生エージェントがグラフを洗練し、リッチテキストプロンプトとして符号化された高信頼因果関係を微調整する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:59:15 GMT)
Norwegian Electricity in Geographic Dataset (NoreGeo) [43.5] ノルウェーの電力システムを表す包括的地理データセットについて述べる。
我々のデータセットには、2024年のノルウェーの各自治体に関する情報が含まれており、電力インフラ、消費、再生可能および従来の生産、電力グリッドのトポロジー、関連する天然資源、人口統計が含まれています。
この作業は、さまざまな情報資源とオープンにリリースされたインタラクティブマップを統合する、フォーマットされた地理的データセットをもたらす。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:58:09 GMT)
EVALUESTEER: Measuring Reward Model Steerability Towards Values and Preferences [43.4] 大規模言語モデル(LLM)は世界中に展開され、世界中のユーザの多様な好みに合わせて複数のシステムを生成する。
ESTEERは、モデルのユーザ価値とスタイリスティックな嗜好プロファイルに対する操縦性を測定するためのベンチマークである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:13:47 GMT)
When Less is More: Approximating the Quantum Geometric Tensor with Block Structures [43.4] ブロック対角量子幾何テンソルを導入し、K-FACのようなブロック構造フィッシャー法に類似したネットワーク層で計量を分割する。
ハイゼンベルクの実験と、J_1$-$J$モデルのフラストレーションは、より高速な収束、低エネルギー、安定性の向上を示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:44:30 GMT)
Kimi-Dev: Agentless Training as Skill Prior for SWE-Agents [43.2] 大規模言語モデル(LLM)は、ソフトウェア工学(SWE)にますます適用されつつある
我々はまず、Agentlessトレーニングレシピをキュレートし、SWE-bench Verified上で60.4%を達成したオープンソースのSWE LLMであるKim-Devを提示する。
5kの公用軌道にSFTを付加することで、Kim-DevはClaude 3.5 Sonnetと同等の48.6%のpass@1にSWE-Agentsをパワーアップする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:13:02 GMT)
Scaling Laws for Code: A More Data-Hungry Regime [43.2] 効率的な訓練を導くスケーリング法は、主に自然言語(NL)に基づいて分析される
コードのスケーリング法則に関する大規模な実証的研究は,0.2Bから3.8Bまでのモデルサイズ117回,2Bから128Bまでのトレーニングトークンからなる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:05:52 GMT)
Agnostic Product Mixed State Tomography via Robust Statistics [43.0] 本研究では, アンザッツを混合した非依存トモグラフィーの問題点を考察する。
目標は、ほぼ自明な混合状態近似を$rho$に出力することである。
そこで本研究では,製品混合状態の非依存トモグラフィーから,二項積分布を逐次学習する古典的タスクへの,新たなブラックボックス効率の低下を実証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:13:03 GMT)
SenWave: A Fine-Grained Multi-Language Sentiment Analysis Dataset Sourced from COVID-19 Tweets [43.0] SenWaveは、新型コロナウイルス(COVID-19)のツイートを分析するために特別に設計された、新しい微粒な多言語感情分析データセットである。
このデータセットは、英語とアラビア語でそれぞれ1万の注釈付きツイートと、スペイン語、フランス語、イタリア語で3万の翻訳ツイートで構成されている。
本研究は,言語,国,トピック間の進化する情緒的景観を詳細に分析し,時間とともに重要な洞察を明らかにする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:38:05 GMT)
Learning on the Job: An Experience-Driven Self-Evolving Agent for Long-Horizon Tasks [42.8] 大規模言語モデルは、さまざまなドメインにまたがる顕著な機能を示しているが、現実の長期タスクのためのAIエージェントとしてそれらをデプロイする場合には、大きな課題が続く。
既存のLLMエージェントは、テスト時の静的であり、経験から学ぶことができず、知識を蓄積し、仕事を継続的に改善する能力が欠如している。
本稿では,階層型メモリモジュールを中心に,経験駆動型自己進化型システムを実現する新しいエージェントフレームワークであるMUSEを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:40:34 GMT)
DarkHash: A Data-Free Backdoor Attack Against Deep Hashing [42.8] 近年の研究では、バックドア攻撃に対するディープハッシュモデルの脆弱性が実証されている。
本稿では,DarkHashを提案する。DarkHashはディープハッシュに対する最初のデータフリーバックドア攻撃である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:28:23 GMT)
SPICE: Simple and Practical Image Clarification and Enhancement [42.7] 低照度画像の強調とヘイズ画像の明確化に対処する。
本手法では,低照度条件や湿潤条件をシミュレートする画像フィルタを構築する。
私たちのメソッドは、ほんの数行のコードで実装できます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:43:07 GMT)
SmartUT: Receive Beamforming for Spectral Coexistence of NGSO Satellite Systems [42.7] 我々は、非静止衛星軌道(NGSO)共存系におけるダウンリンク共周波数干渉(CFI)の緩和について検討する。
ゼロ強制(ZF)のような従来の緩和技術は、干渉信号の到着方向(DOA)に対してヌルを生成する。
本稿では、教師なしディープラーニング(DL)アプローチを活用し、ユーザ端末(UT)アンテナアレイ上に展開可能なMambaベースのビームフォーマ(MambaBF)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:26:26 GMT)
AD-LLM: Benchmarking Large Language Models for Anomaly Detection [42.5] 本稿では,大規模な言語モデルが異常検出にどのように役立つかを評価する最初のベンチマークであるAD-LLMを紹介する。
我々は、ゼロショット検出、LLMの事前訓練された知識を用いて、タスク固有のトレーニングなしでADを実行すること、データ拡張、ADモデルを改善するために合成データとカテゴリ記述を生成すること、LLMを使用して教師なしADモデルを提案するモデル選択の3つの主要なタスクについて検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:42:37 GMT)
Building Whitespace-Sensitive Languages Using Whitespace-Insensitive Components [42.4] 本稿では,モジュール型・白色空間感応言語モジュールを用いて,白色空間感応言語を構築する手法を提案する。
私たちのソリューションは、既存の言語コンポーネントの再利用性を高め、開発時間を短縮し、ソフトウェア言語の全体的な品質を向上させることを目的としています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:26:47 GMT)
Zero-Shot Policy Transfer in Reinforcement Learning using Buckingham's Pi Theorem [42.4] 強化学習ポリシーは、しばしば、新しいロボット、タスク、または異なる物理的パラメータを持つ環境への一般化に失敗する。
本稿では,バッキンガムのPi理論に基づくシンプルなゼロショット転送手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:36:18 GMT)
Discrete Compositional Generation via General Soft Operators and Robust Reinforcement Learning [42.2] 近年の手法では、プロキシ報酬関数によって導かれる強化学習を活用して、このフィルタリングを可能にする。
これらの手法は,大規模検索空間において,過度に多様で最適な候補を生成できないことを示す。
いくつかの正規化されたRL演算子を一般化したフレームワークに結合する新しい統一演算子を導入する。
合成タスクと実世界のタスクの両方において、ベースラインよりも高品質で多様な候補を特定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:49:49 GMT)
Airy: Reading Robot Intent through Height and Sky [42.2] Airy氏は、複雑なマルチエージェントAIが直感的に理解できるようになるかどうか尋ねる。
知覚メタファがブラックボックスを公開インターフェースに変える方法を示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:07:30 GMT)
Tensor-network representation of excitations in Josephson junction arrays [42.1] ジョセフソン接合配列に基づく超伝導回路の励起スペクトルに対する非摂動テンソルネットワーク手法を提案する。
以上の結果から,低配列ジャンクションインピーダンスの条件下での従来の摂動的治療から大きな逸脱が明らかとなり,改善が期待できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:00:01 GMT)
Video-STAR: Reinforcing Open-Vocabulary Action Recognition with Tools [42.0] Video-STARは、オープン語彙行動認識のためのツール強化学習とコンテキストサブモーション分解を調和させるフレームワークである。
アクションをモノリシックなエンティティとして扱う従来の方法とは異なり、我々のアプローチは、アクションをきめ細かなマッチングのための差別的なサブモーションに革新的に分解する。
本手法は,テキスト中心の推論から視覚的接地推論へ伝達する,明示的な監督を伴わずに,外部ツールを自律的に活用し,サブモーションパターンの優先順位付けを行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:20:44 GMT)
Learn the Ropes, Then Trust the Wins: Self-imitation with Progressive Exploration for Agentic Reinforcement Learning [41.9] エージェントLLMを学習するためのカリキュラムベースの自己アニメーション学習(SIL)レシピであるSPEARを提案する。
具体的には,本手法は,本質的な報奨を生かして,技術レベルの探究を促進するためのカリキュラムを取り入れている。
さらにトレーニングを安定させるために、リプレイバッファでの経験の利点を再検討し、潜在的ポリシードリフトに対処する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:27:07 GMT)
Understanding DeepResearch via Reports [41.6] DeepResearchは、高度な推論とマルチツール統合を通じて専門家レベルの研究を行う、変革的なAIパラダイムである。
これらのシステムを評価することは、オープンな研究シナリオと、独立した機能に焦点を当てた既存のベンチマークのため、依然として極めて難しい。
DeepResearch-ReportEvalは、DeepResearchシステムを最も代表的なアウトプットで評価するための総合的なフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:03:43 GMT)
Reinforcement Learning from Probabilistic Forecasts for Safe Decision-Making via Conditional Value-at-Risk Planning [41.5] 本稿では,ベイズ予測,後方サンプリング強化学習,計画とを結合した統一的枠組みである不確実性認識マルコフ決定プロセス(UAMDP)を提案する。
構造的不確実性と経済のボラティリティを特徴とする2つのドメインの高頻度株式取引と小売在庫管理において,UAMDPを評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:46:32 GMT)
Design-Based Bandits Under Network Interference: Trade-Off Between Regret and Statistical Inference [41.5] ネットワーク干渉(MABNI)を持つマルチアームバンディットでは、あるノードによって取られたアクションは他のノードの報酬に影響を与え、複雑な相互依存を生み出す。
我々は,最小化と推論精度のトレードオフをバランスさせるため,任意の正の信頼度シーケンスと対応するアルゴリズムを導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:38:10 GMT)
Conformal Risk Training: End-to-End Optimization of Conformal Risk Control [41.5] 我々は,モデルトレーニングや微調整において,コンフォーマルなOCEリスク制御を通じて区別する,エンドツーエンドのアプローチである「コンフォーマルリスクトレーニング」を導入する。
提案手法は,実証可能なリスク保証を実現するとともに,ポストホック手法よりも平均ケース性能が大幅に向上したことを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:05:45 GMT)
Building Resource-Constrained Language Agents: A Korean Case Study on Chemical Toxicity Information [41.4] 本稿では,これらの制限下で考案された韓国の化学毒性情報エージェントであるTox-chatについて述べる。
本稿では,階層的な部分探索によるトークン消費を低減する文脈効率アーキテクチャと,シナリオベースの対話生成手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:36:34 GMT)
Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [41.2] 大規模言語モデル(LLM)は、不一致の自己認識に起因する幻覚の傾向にある。
本稿では,高速かつ低速な推論システムを統合し,信頼性とユーザビリティを調和させる明示的知識境界モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:57:43 GMT)
Curing Miracle Steps in LLM Mathematical Reasoning with Rubric Rewards [40.9] 数学的推論のための大きな言語モデルは、通常結果に基づく報酬で訓練される。
我々の実験では、このパラダイムがハッキングに報酬を与える可能性が高く、モデルの推論能力のかなりの過大評価につながります。
これは、偽陽性の頻度が高いことが証明されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:30:45 GMT)
FuelCast: Benchmarking Tabular and Temporal Models for Ship Fuel Consumption [40.7] 海運業界では、燃費と排出が経済効率と環境持続可能性に大きな影響を及ぼす重要な要因である。
船舶の燃料消費の正確な予測は、海洋活動のさらなる最適化に不可欠である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:38:46 GMT)
Profit Mirage: Revisiting Information Leakage in LLM-based Financial Agents [40.6] LLMベースの金融エージェントは、人間の専門家のように取引できる能力に広く興奮している。
バックテストされたリターンのダズラは、モデルの知識ウィンドウが終了すると蒸発します。
本稿では,LLMをベースとしたエージェントに対して,暗記された結果ではなく因果関係の学習を強制するために,反ファクト的摂動を適用したフレームワークFactFinを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:13:35 GMT)
InfiR2: A Comprehensive FP8 Training Recipe for Reasoning-Enhanced Language Models [40.4] 本稿では、連続的な事前学習と教師付き微調整をシームレスに統合するエンドツーエンドのFP8トレーニングレシピを提案する。
我々は,FP8をBF16の実用的で堅牢な代替品として確立し,大規模モデルトレーニングをさらに民主化するためのコードをリリースする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:13:53 GMT)
Dissecting Logical Reasoning in LLMs: A Fine-Grained Evaluation and Supervision Study [40.1] 我々は3次元にわたる論理的推論を評価するためのきめ細かい評価フレームワークであるFinalLogicを紹介した。
微調整形推論能力の異なる監督形式について検討する。
自然言語の監督は一般化において優れており、シンボリックな監督は構造的に健全な原子推論のステップを打つのに優れている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:32:49 GMT)
Learning General Causal Structures with Hidden Dynamic Process for Climate Analysis [39.7] 我々は,(i)観測変数間の因果関係と(ii)潜在駆動力の相互作用を協調的に解明する統合的枠組みを導入する。
CRLと因果発見を統合した構造制約を持つ時系列生成モデルであるCaDRe(Causal Discovery and Representation Learning)を提案する。
実世界の気候データセットでは、CaDReは競争力のある予測精度を提供するだけでなく、ドメインの専門知識に合わせて視覚化された因果グラフを復元する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:34:57 GMT)
Language Surgery in Multilingual Large Language Models [39.7] 大規模言語モデル(LLM)はタスクや言語にまたがる顕著な一般化機能を示している。
本稿では, LLMにおける自然に出現する表現アライメント, 特に中層における表現アライメントについて検討する。
Inference-Time Language Control (ITLC) を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:51:59 GMT)
A Design-based Solution for Causal Inference with Text: Can a Language Model Be Too Large? [39.6] 社会科学の質問は、言語特性が聴衆の態度や行動にどう影響するかを問う。
近年の文献では、処理と結果の両方をうまく予測するテキストの潜在表現を学習するために、大きな言語モデルを適用することを提案する。
そこで我々は, 遅延共起処理, 重複問題回避, 治療効果を不偏に見積もる新しい実験設計を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:17:57 GMT)
Towards Real-World Deepfake Detection: A Diverse In-the-wild Dataset of Forgery Faces [39.5] 我々はRedFace(Real-world-oriented Deepfake Face)を紹介した。
RedFaceは、6万以上の偽造画像と、本物の顔の特徴から派生した1000の操作されたビデオで構成されている。
以前のベンチマークとは異なり、RedFaceは9つの商用オンラインプラットフォームを使用して、"荒野"で見つかった最新のディープフェイク技術を統合する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:54:38 GMT)
Pairing particles into holonomies [39.2] ホロノミは量子計算とシミュレーションに大きな関心を持つ。
ここでは粒子数を増やして新しいホロノミーのクラスを構築する。
単一粒子ホロノミーを持たない系に複数粒子ホロノミーが存在することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:52:11 GMT)
Provably Robust Adaptation for Language-Empowered Foundation Models [39.1] 言語をベースとした基礎モデル(LeFM)は、視覚的(またはグラフ)機能をテキスト表現と整合させることでマルチモーダル学習を変革し、少数ショット学習のような強力な下流機能を実現する。
既存の防衛は、正式な保証を欠いている経験的戦略に依存しており、目に見えない適応的な攻撃に弱いままである。
本稿では,テキストと特徴埋め込みの両方を適応的なブレンディング機構で統合した,Language-empowered Few-shot Certification(textbfLeFCert)を提案する。
実験により、LeFCertは最先端のパフォーマンスを達成し、既存のベースラインと比較して、クリーンと認定の両方の精度を著しく向上することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:01:57 GMT)
VideoCanvas: Unified Video Completion from Arbitrary Spatiotemporal Patches via In-Context Conditioning [38.9] 任意の場所に配置された任意のユーザ指定のパッチからビデオが生成され、ビデオキャンバスに描画されるような、任意の時間的ビデオ補完のタスクを紹介する。
この柔軟性は、単一のパラダイムの下で、ファーストフレームのイメージ・トゥ・ビデオ、塗り絵、拡張、結束など、既存のコントロール可能なビデオ生成タスクを統一する。
In-Context Conditioning(ICC)パラダイムを、新しいパラメータをゼロとしたこのきめ細かい制御タスクに適応する、新しいフレームワークであるVideoCanvasを開発した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:58:59 GMT)
On the Relationship Between the Choice of Representation and In-Context Learning [38.5] In-context Learning(ICL)は、コンテキストの一部として提示されたいくつかのデモから、大きな言語モデルで新しいタスクを学習する能力である。
過去の研究では、ICLの成功の大部分は、これらの文脈内デモンストレーションの表現方法によるものだった。
ICLにおけるこれらの2つの側面の相互作用,表現と学習について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:55:28 GMT)
LeWiDi-2025 at NLPerspectives: The Third Edition of the Learning with Disagreements Shared Task [38.5] LEWIDIシリーズは、AIモデルのトレーニングと評価に対するこのアプローチを促進するために、学習と認識に関するタスクを共有している。
タスクの第3版は、LEWIDIベンチマークをパラフレーズ識別、皮肉検出、皮肉検出、自然言語推論の4つのデータセットに拡張することで、この目標に基づいている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:04:28 GMT)
OpenRubrics: Towards Scalable Synthetic Rubric Generation for Reward Modeling and LLM Alignment [38.2] OpenRubricsは,ルーブリック世代とルーブリックベースの報酬モデルをトレーニングするための,大規模な(プロンプト,エクスプリシット)ペアのコレクションである。
識別的・包括的評価信号を引き出すために,優先的・拒否的な応答を対比することにより,厳格な規則(単純質)と原則(簡易品質)の両方を導出するコントラスト生成(CRG)を導入する。
この結果から,ごみは費用対人評価と自動報酬モデリングのギャップを狭めるような,スケーラブルなアライメント信号を提供することがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:31:26 GMT)
Attribution-by-design: Ensuring Inference-Time Provenance in Generative Music Systems [38.1] 本稿では,直接帰属,透過的なロイヤリティ分布,アーティストや権利者に対するきめ細かい制御を中心にした生成的音楽基盤の枠組みを提案する。
著者のカタログを用いて生成した出力を条件付ける場合、直接的かつ検証可能な補償を可能にするため、推論時属性が好ましい。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:49:44 GMT)
If Probable, Then Acceptable? Understanding Conditional Acceptability Judgments in Large Language Models [37.9] 条件受理性とは、条件文がどのように認識されるかを示す。
これは、個人が含意を解釈し、議論を評価し、仮説的なシナリオに基づいて決定する方法に影響を与える。
大規模な言語モデルが、そのようなステートメントの$textitacceptability$をどの程度判断するかは、まだ不明である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:12:10 GMT)
Knowledge Graph Sparsification for GNN-based Rare Disease Diagnosis [37.8] RareNetはグラフベースのグラフニューラルネットワークで、最も可能性の高い因果遺伝子を特定するために、患者表現型のみを必要とする。
我々は、他のフレームワークと統合した場合に、競合的かつ堅牢な因果遺伝子予測と顕著なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:05:06 GMT)
Training LLMs to be Better Text Embedders through Bidirectional Reconstruction [37.5] コントラスト学習の前に新たなトレーニングステージを追加して,最終トークン埋め込みのセマンティクスを強化することを提案する。
このステージでは、EBQ2D (Embedding-based Query-to-Document) と EBD2Q (Embedding-based Document-to-Query) という双方向の生成的再構築タスクを採用している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:37:52 GMT)
Multilingual Knowledge Graph Completion via Efficient Multilingual Knowledge Sharing [37.4] 本稿では,多言語共有知識を活用して性能を大幅に向上する新しいMKGCフレームワークを提案する。
私たちのフレームワークは、それぞれHits@1、Hits@3、Hits@10メトリクスで5.47%、3.27%、1.01%の改善を実現しています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:19:21 GMT)
Rethinking Reasoning: A Survey on Reasoning-based Backdoors in LLMs [37.3] 大規模言語モデル(LLM)における推論ベースのバックドア攻撃は、セキュリティリスクを引き起こす。
本稿では,既存のアプローチを要約し,推論に基づくバックドア攻撃を連想的,受動的,活発に分類する新たな分類法を提案する。
また、このような攻撃に対する防衛戦略を提示し、今後の研究の方向性とともに現在の課題について議論する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:35:37 GMT)
Dual-Stream Alignment for Action Segmentation [37.2] アクションセグメンテーションは、連続したビデオストリームで特定のアクションがいつどこで発生するかを特定する。
最近の研究は、アクション性能を向上させるためにアクションワイドな特徴を学習する2ストリーム方式に移行している。
本稿では,Dual-Stream Alignment Network (DSA Net)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:59:17 GMT)
Scaling Performance of Large Language Model Pretraining [37.2] 大規模言語モデル(LLM)は、幅広い自然言語処理アプリケーションで最高の性能を示す。
これらのモデルのトレーニングは非常に計算コストのかかる作業である。
Frontier Artificial Intelligence(AI)の研究会社は、ますます大規模なデータセット上で、徐々に大きなモデルを訓練するために、スーパーコンピューティングのインフラに数十億ドルを投資している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:56:59 GMT)
Random unitaries from Hamiltonian dynamics [37.1] 真にランダムなユニタリからの時間非依存なハミルトン力学の不明瞭性について検討する。
一次元にランダム多元系ハミルトンのアンサンブルが存在することを証明し、一定の進化時間の下では、結果として生じる時間進化のユニタリはハールランドムと区別できない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:46:55 GMT)
From Moments to Models: Graphon Mixture-Aware Mixup and Contrastive Learning [37.0] 本稿では,グラフトンで表される基礎となるグラフ生成モデルの混合として,データを明示的にモデル化する統合フレームワークを提案する。
これにより、混合成分を解離させ、それらの異なる生成機構を同定することができる。
教師なし学習では、MGCLは最先端の結果を達成し、8つのデータセットの平均ランクを得る。
教師付き学習では、GMAMは既存の戦略を一貫して上回り、7つのデータセットのうち6つで新しい最先端の精度を達成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:55:28 GMT)
Matryoshka Pilot: Learning to Drive Black-Box LLMs with LLMs [36.9] 軽量なホワイトボックス大言語モデルコントローラであるMatryoshka Pilot(M-Pilot)を紹介する。
M-Pilotは、複雑なタスクを一連の中間出力に分解することで、大規模なブラックボックスLCMジェネレータを誘導する。
多様なタスクに対する経験的評価は,複雑な長期タスクにおけるブラックボックスLLMの能力を効果的に向上することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:01:48 GMT)
Standard-to-Dialect Transfer Trends Differ across Text and Speech: A Case Study on Intent and Topic Classification in German Dialects [36.9] 我々は、テキストモデル、音声モデル、カスケードシステムという3つの設定で標準音声変換を比較した。
実験では,ドイツ語とドイツ語の方言を,文章や音声の意図,話題の分類といった文脈で焦点をあてた。
音声のみのセットアップが方言データに最適な結果をもたらすのに対して、テキストのみのセットアップは標準データに最適であることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:43:08 GMT)
IMAGHarmony: Controllable Image Editing with Consistent Object Quantity and Layout [36.7] マルチオブジェクトシーンにおける量とレイアウトの整合性(QL-Edit)について検討した。
我々はIMAGHarmonyについて述べる。IMAGHarmonyは、オブジェクトの個数と位置をモデル化しながら知覚意味論を融合する、プラグアンドプレイ調和認識(HA)モジュールを特徴とするフレームワークである。
また、視覚と言語マッチングを通して意味的に整合した初期雑音を選択するPNS戦略を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:55:51 GMT)
Quantum Random Feature Method for Solving Partial Differential Equations [36.6] 量子コンピューティングは、古典的な手法よりも指数的なスピードアップの可能性を秘めているため、科学計算の可能性を秘めている。
本研究では,数値解析とニューラル解析の両方の利点を利用する量子ランダム法(QRFM)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:42:09 GMT)
DvD: Unleashing a Generative Paradigm for Document Dewarping via Coordinates-based Diffusion Model [36.5] DvDはDiffusionフレームワークを介して文書のデウォーピングに取り組む最初の生成モデルである。
具体的に言うと、DvDは典型的なピクセルレベルのデノナイジングの代わりに座標レベルのデノナイジングを導入し、変形補正のためのマッピングを生成する。
我々は,6300の実画像対からなる大規模文書デウォープベンチマークであるAnyPhotoDoc6300を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:32:09 GMT)
MetaDefense: Defending Finetuning-based Jailbreak Attack Before and During Generation [36.4] 本稿では,大規模言語モデル(LLM)におけるファインタニングベースのジェイルブレイク攻撃を防御する新しい枠組みを提案する。
本稿では、応答生成開始前に有害なクエリを検出する前世代防御と、より有害なコンテンツを出力しないように生成中の部分的な応答を監視する中世代防衛という2段階防衛手法を提案する。
我々のMetaDefenseはLSMを訓練し、特定のプロンプトを使ってクエリと部分応答の両方の有害性を予測し、潜在的に有害な相互作用の早期終了を可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:27:34 GMT)
Theoretical guarantees for change localization using conformal p-values [36.2] 分布自由な変化点の局所化を有限サンプルの有効性で実現するための理論的な保証を提供する。
また、分布変化設定において、共形$p$-値の様々な有限サンプルと特性を示す。
我々の貢献は、分布自由な変化点推論に対する包括的で理論的に原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:05:47 GMT)
D-CoDe: Scaling Image-Pretrained VLMs to Video via Dynamic Compression and Question Decomposition [36.2] ビデオ大言語モデル(Vid-LLM)は多様なビデオ言語タスクに優れる。
D-CoDeは動的圧縮と質問分解を組み込んだトレーニングフリー適応フレームワークである。
実験により、D-CoDeは様々なベンチマークでビデオの理解を効果的に改善することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:08:32 GMT)
Trans-EnV: A Framework for Evaluating the Linguistic Robustness of LLMs Against English Varieties [36.2] 大規模言語モデル (LLM) は標準アメリカ英語 (SAE) に基づいて評価され、しばしばグローバルな英語品種の多様性を見落としている。
我々は,SAEデータセットを複数の英語変種に変換するフレームワークであるTrans-EnVを導入し,言語的堅牢性を評価する。
その結果,非標準品種の精度は46.3%まで低下した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:41:44 GMT)
Arbitrary Entropy Policy Optimization: Entropy Is Controllable in Reinforcement Finetuning [36.0] 本稿では, エントロピーボーナスをREINFORCEポリシー勾配に置き換えることで, エントロピー崩壊を解消するArbitrary Entropy Policy Optimization (AEPO)を提案する。
AEPOは、ポリシー勾配を正規化として、分布を正規化として、REINFORCEを正規化として統合し、最適化を歪ませることなく正確なエントロピー制御を可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:24:08 GMT)
From Noise to Signal to Selbstzweck: Reframing Human Label Variation in the Era of Post-training in NLP [35.8] 我々は、HLVを人間の多元主義の具現化として保存することは、Selbstzweckとして扱う必要があると論じる。
我々は、HLVを優先データセットに積極的に組み込んで、それに向けた実行可能なステップを概説することを求めている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:48:29 GMT)
Leveraging Whisper Embeddings for Audio-based Lyrics Matching [35.5] WEALYは、Whisperデコーダの埋め込みを活用して、完全に再現可能なパイプラインである。
We demonstrate that WEALY achieve a performance to the state-of-the-art method that without robustness。
本研究は,今後の研究に信頼性の高いベンチマークを提供し,音楽情報検索タスクにおける音声技術の可能性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:03:34 GMT)
Multi-fidelity Batch Active Learning for Gaussian Process Classifiers [35.5] 本稿では,多要素GP分類器のためのバッチアクティブ学習アルゴリズムであるBernoulli Mutual Information(BPMI)を紹介する。
BPMIは、リンク関数の1階テイラー展開を利用することで、確率空間における相互情報の計算の難しさを回避する。
あらゆる実験において、BPMIは優れた性能を示し、固定された計算予算に対して高い予測精度を達成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:45:38 GMT)
Frequency-Guided Posterior Sampling for Diffusion-Based Image Restoration [35.4] 本稿では,既存の拡散型修復法に対する簡単な修正を提案する。
本手法では,周波数領域における時間変化の少ない低域通過フィルタを提案する。
本稿では,その基礎となるデータ分布に基づいて,この周波数スケジュールの適応カリキュラムを開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:00:40 GMT)
VisionTS++: Cross-Modal Time Series Foundation Model with Continual Pre-trained Vision Backbones [35.3] VisonTS++は、大規模時系列上でのビジョンモデルの継続的な事前トレーニングに基づくTSFMである。
提案手法は,視覚モデルに基づくフィルタリング,色付き多変量変換,マルチクアンタイル予測という3つの重要なイノベーションを導入している。
実験により、VisionTS++は分布内および分布外予測の両方で最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:27:04 GMT)
Generalised fractional Rabi problem [35.2] フラクショナル量子力学は、量子系における非局所的時間的挙動とメモリ効果を捉える自然な枠組みを提供する。
本研究では、カプトー分数微分に基づくグリーン関数の定式化を用いて、分数次量子進化の物理的結果を分析する。
外部駆動がなくても、静的ハミルトン項は、分数的時間的非局所性に直接関連した減衰特徴を持つ非自明スピンダイナミクスを誘導する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:51:57 GMT)
Unsupervised Radio Map Construction in Mixed LoS/NLoS Indoor Environments [34.9] 本稿では,チャネル伝播シーケンスから直接データ収集軌道を復元することを目的とする。
提案手法は,室内環境における平均局部位置精度0.65mを実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:53:24 GMT)
To Sink or Not to Sink: Visual Information Pathways in Large Vision-Language Models [34.9] Vision Transformer (ViT)は、視覚コンテンツを画像トークンのシーケンスにエンコードする。
LLM(Large Language Model)は、これらのトークンを解釈して高レベルの推論を行う。
我々は、ViTアテンションシンク(ViT attention sinks)と呼ばれる、ViTから高北の視覚トークンのクラスを同定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:44:42 GMT)
CaRT: Teaching LLM Agents to Know When They Know Enough [34.8] CaRTは、情報を求めるのをやめる際にLLMを教えるアプローチである。
CaRT微細トンネルLLMは、いつ終了するかを正当に学習する。
対話型医療診断と数学問題解決という2つの領域でCaRTをインスタンス化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:46:39 GMT)
Training-Free Group Relative Policy Optimization [34.7] 我々は,Large Language Model (LLM) エージェントが,経験的知識を先行するトークンとして学習することで,出力分布に類似した効果を得られることを論じる。
我々は,LLMエージェントの性能をパラメータ更新なしで向上する,費用対効果の高いソリューションであるTraining-Free Group Relative Policy Optimization (Training-Free GRPO)を提案する。
数学的推論とWeb検索タスクの実験により、DeepSeek-V3.1-Terminusに適用されたトレーニングフリーGRPOは、ドメイン外のパフォーマンスを大幅に改善することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:18:17 GMT)
Neuron-Level Analysis of Cultural Understanding in Large Language Models [34.7] 大規模言語モデル(LLM)は、その公正で包括的な文化的理解を確実にするために、世界中で展開されている。
我々は、文化行動を促進するニューロンを特定するために、ニューロンレベルの分析を行う。
我々は,文化によらず文化理解に寄与する文化一般ニューロンと,個々の文化に結びついている文化特異的ニューロンの両方を同定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:35:00 GMT)
Long-tailed Recognition with Model Rebalancing [34.1] 長い尾の認識はユビキタスで、ディープラーニングでは難しい。
本稿では,モデルのパラメータ空間を直接再バランスすることで不均衡を緩和する新しいフレームワーク,Model Rebalancingを提案する。
MOREは、特に尾クラスの一般化を大幅に改善し、既存の不均衡緩和手法を効果的に補完する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:04:38 GMT)
Chain-of-Trigger: An Agentic Backdoor that Paradoxically Enhances Agentic Robustness [34.1] チェイン・オブ・トリガー・バックドア (Chain-of-Trigger Backdoor, CoTri) は、長距離エージェント制御用に設計された多段バックドア攻撃である。
CoTriは、ほぼゼロの偽トリガーレート(FTR)を維持しながら、ほぼ完璧な攻撃成功率(ASR)を達成する
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:01:43 GMT)
Quantum-limited optical delay sensing across an enhanced dynamic range by frequency-resolving two-photon interference [34.0] 2光子干渉は精密気象学の強力なプラットフォームを提供する。
2つの干渉光子の周波数をサンプリングし、時間領域の感度を高める。
これにより、未解決推定値の最大20倍の光学遅延推定のダイナミックレンジが向上する。
この技術は、走査型ナノメートル分解能深度センサーをミリメートルの範囲で実現し、生体およびナノマテリアルイメージングに応用できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:11:54 GMT)
PointAD+: Learning Hierarchical Representations for Zero-shot 3D Anomaly Detection [33.9] 私たちはCLIPの堅牢な2D一般化機能を、非常に多様なクラスセマンティクスの未確認オブジェクト間で3D異常を特定するために転送する。
点レベルの情報と画素レベルの情報を活用することにより,3次元異常を包括的に検出し,セグメンテーションする統合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:57:01 GMT)
SyncHuman: Synchronizing 2D and 3D Generative Models for Single-view Human Reconstruction [33.9] 光リアリスティックな3Dフルボディの人間の再構築は、映画やビデオゲームの応用には不可欠である。
最近のアプローチでは、SMPL推定とSMPL条件画像生成モデルを利用して、新しい視点を幻覚させる。
2次元多視点生成モデルと3次元ネイティブ生成モデルを組み合わせた新しいフレームワークSyncHumanを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:01:10 GMT)
ConlangCrafter: Constructing Languages with a Multi-Hop LLM Pipeline [33.8] 我々は,現代のLLMを,エンドツーエンドのコンラン生成のための計算クリエイティビティ支援として活用する。
言語設計をモジュールステージに分解するマルチホップパイプラインであるConlangCrafterを紹介します。
整合性と型的多様性を測定する指標として,ConlangCrafterを評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:34:49 GMT)
On the average-case complexity of learning output distributions of quantum circuits [33.8] 統計的クエリモデルでは,ブロックワークランダムな量子回路の出力分布の学習は平均ケースハードであることが示されている。
この学習モデルは、ほとんどの一般的な学習アルゴリズムの抽象的な計算モデルとして広く利用されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:44:03 GMT)
MotionSight: Boosting Fine-Grained Motion Understanding in Multimodal LLMs [33.6] 我々は、物体中心の視覚スポットライトと動きのぼけを視覚的プロンプトとして生み出す新しいゼロショット手法であるMotionSightを紹介した。
我々は、SFTや嗜好データ、Theta(40K)ビデオクリップ、Theta(87K)QAといった階層的なアノテーションを備えた、ビデオモーション理解のための最初の大規模データセットであるMotionVid-QAをキュレートした。実験の結果、MotionSightは最先端のオープンソースパフォーマンスと商用モデルとの競争性を達成している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:30:15 GMT)
Q-CLIP: Unleashing the Power of Vision-Language Models for Video Quality Assessment through Unified Cross-Modal Adaptation [33.5] VLM(Vision-Language Models)は、幅広い視覚タスクにまたがる顕著な一般化機能を示す。
ビデオ品質評価(VQA)のための完全なVLMベースのフレームワークQ-CLIPを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:58:11 GMT)
Audio-Conditioned Diffusion LLMs for ASR and Deliberation Processing [33.4] 拡散型大言語モデルLLaDAを用いた音声認識(ASR)に関する実験的検討を行った。
ランダムマスキング,低信頼マスキング,半自己回帰戦略について検討し,Whisper-LLaDAがベースラインと比較してWERを大幅に低減することを示した。
ほとんどの実験的な構成はWhisper-LLaMAベースラインよりも高速な推論を実現するが、認識精度はわずかに低い。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:55:28 GMT)
ArenaBencher: Automatic Benchmark Evolution via Multi-Model Competitive Evaluation [33.2] ArenaBencherは自動ベンチマーク進化のためのモデルに依存しないフレームワークである。
アリーナベンチャーを数学の問題解決、常識推論、安全領域に適用する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:55 GMT)
ASBench: Image Anomalies Synthesis Benchmark for Anomaly Detection [33.0] 異常検出は製造品質管理において重要な役割を担っているが、その応用は限られた異常サンプルと手作業による注釈コストによって制限されている。
本稿では,異常合成法を評価するためのベンチマークフレームワークASBenchを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:23:29 GMT)
Entropy Regularizing Activation: Boosting Continuous Control, Large Language Models, and Image Classification with Activation as Entropy Constraints [32.9] モデル出力に特別に設計されたアクティベーションを適用することで、与えられた閾値以上のサンプリングエントロピーを制約する新しいパラダイムであるERAを提案する。
我々の研究は、出力の活性化をエントロピー制御の強力なツールとして評価し、よりシンプルで堅牢なアルゴリズムを設計するための新たな方向性を開拓する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:56:17 GMT)
A Binary Optimisation Algorithm for Near-Term Photonic Quantum Processors [32.8] 近距離フォトニック量子プロセッサ用に設計されたバイナリ最適化のための新しいアルゴリズムを提案する。
この変分アルゴリズムは、トレーニング可能な古典的なビットフリップ確率を用いて後処理される量子光学回路のサンプルを使用する。
勾配に基づく訓練ループは収束するまで徐々により良い解を求める。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:30:50 GMT)
Deep Neural Networks Inspired by Differential Equations [32.6] ディープラーニングはコンピュータビジョン、科学計算、動的システムといった分野において重要な技術となっている。
ニューラルネットワークは、理論的理解、解釈可能性、一般化に関連する課題に永続的に直面する。
本稿では、ディファレンシャル方程式にインスパイアされたディープニューラルネットワークと動的モデリング手法について広範なレビューを行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:08:23 GMT)
Unified Cross-Scale 3D Generation and Understanding via Autoregressive Modeling [32.5] クロススケールな3D生成と理解のための統合自己回帰フレームワークUni-3DARを提案する。
コアとなるのはオクツリーデータ構造に基づく粗大なトークンライザで、多様な3D構造をコンパクトな1Dトークンシーケンスに圧縮する。
圧縮によって引き起こされる動的に異なるトークン位置の課題に対処するために,マスク付き次世代予測戦略を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:59:45 GMT)
PFAttack: Stealthy Attack Bypassing Group Fairness in Federated Learning [32.4] フェデレーテッド・ラーニング(FL)は、異なる集団に対して偏見のない決定を下すグローバルモデルを、クライアントが共同でトレーニングすることを可能にする。
これまでの研究では、FLシステムは毒殺攻撃のモデルに弱いことが示されている。
本研究では,グローバルモデル精度を低下させるのではなく,公平性メカニズムを回避することを目的としたPFAttack(Profit-driven Fairness Attack)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:29:43 GMT)
Beyond Textual CoT: Interleaved Text-Image Chains with Deep Confidence Reasoning for Image Editing [32.4] CoT(Chain-of-Thought)は、複雑なビジュアルレイアウトを表現する能力に制限がある。
本稿では,視覚的編集過程を純粋にテキストベースの推論からインターリーブな論理へとシフトさせるためのマルチモーダル推論編集(MURE)を提案する。
14Kの高品質な編集例を含む最初のCoT-Edit-14Kデータセットをリリースする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:36:51 GMT)
gLSTM: Mitigating Over-Squashing by Increasing Storage Capacity [32.1] 我々は,モデル記憶と検索能力のレンズを通して,過洗現象を再検討する。
我々は、情報ボトルネックがこの容量を飽和させることができることを示すために、新しい合成タスクを導入する。
キャパシティを向上した新しいGNNアーキテクチャを開発した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:58:49 GMT)
Selective high-order topological states and tunable chiral emission in atomic metasurfaces [31.7] 2次元加護目AMの量子光学的および位相的性質について検討する。
特異な動的追尾挙動を持つ高次トポロジカルな選択的状態を明らかにする。
この結果から,AMsは可変位相状態とキラル量子光学現象の多用途プラットフォームとして確立された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:36:33 GMT)
A Survey of Process Reward Models: From Outcome Signals to Process Supervisions for Large Language Models [31.7] この調査は、完全なループを通して、PRMの体系的な概要を提供する。
数学、コード、テキスト、マルチモーダル推論、ロボット工学、エージェントにまたがる応用を要約する。
私たちのゴールは、設計空間を明確にし、オープンな課題を明らかにし、きめ細かな、堅牢な推論アライメントに向けた将来の研究を導くことです。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:35:31 GMT)
Science Hierarchography: Hierarchical Organization of Science Literature [31.6] 我々は、科学文献を高品質な階層構造に整理する目的であるSCIENCE HIERARCHOGRAPHYを動機付けている。
我々は、効率的な埋め込みベースのクラスタリングとLLMベースのプロンプトを組み合わせたハイブリッドアプローチを開発した。
その結果,本手法は解釈可能性を改善し,科学的文献を探索するための代替経路を提供することがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:25:02 GMT)
CS3-Bench: Evaluating and Enhancing Speech-to-Speech LLMs for Mandarin-English Code-Switching [31.6] 我々はCS3-Bench(Code-Switching Speech-to-Speech Benchmark)を提案する。
7つの主流モデルに関する実験は、知識集約的な質問応答の相対的なパフォーマンス低下を66%まで示している。
提案手法は, 知識の精度を25.14%から46.13%に改善し, オープンエンド理解率を64.5%から86.5%に改善し, 第二言語における発音誤りを大幅に低減する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:34:23 GMT)
ANCORA: Accurate Intrusion Recovery for Web Applications [31.2] ANCORAは、Webアプリケーションの正確な侵入復旧システムである。
ANCORAはファイルとデータベースを別々に修正する。
エクスプロイトされたプロセスを含むすべての変更を明らかにするグラフを構築する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:33:09 GMT)
NavSpace: How Navigation Agents Follow Spatial Intelligence Instructions [31.1] タスクカテゴリと1,228のトラジェクトリ-インストラクションペアを含むNavSpaceベンチマークを導入する。
我々は、最先端ナビゲーションモデルやマルチモーダル大言語モデルを含む22のナビゲーションエージェントを包括的に評価する。
本稿では,空間知的なナビゲーションモデルSNavを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:59:19 GMT)
Active Confusion Expression in Large Language Models: Leveraging World Models toward Better Social Reasoning [31.1] 大規模言語モデル(LLM)は、認知的混乱、論理的矛盾、および客観的世界状態と主観的信念状態の衝突を示す。
本研究では,動的テキスト世界モデルを構築し,実体状態と時間的シーケンスを追跡する適応的世界モデル拡張推論機構を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:07:31 GMT)
MAHL: Multi-Agent LLM-Guided Hierarchical Chiplet Design with Adaptive Debugging [30.3] 大きな言語モデル(LLM)は2.5Dに拡張することを約束している。
LLMはフラットな設計、高い検証コスト、不正確なパラメータ最適化といった課題に直面している。
階層型LLMベースのチップレット設計生成フレームワークであるMAHLを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:12:14 GMT)
Less is More: Compact Clue Selection for Efficient Retrieval-Augmented Generation Reasoning [30.2] 現在のRAGレトリバーは主に人間の読者向けに設計されており、完全な、読みやすい、一貫性のある段落を強調している。
既存の方法はしばしば、キー文を識別するために再分類や要約に頼っているが、意味的なブレークと不誠実さに悩まされることがある。
LLM中心RAGアプリケーションのためのコンパクトな手掛かり選択機構であるCompSelectを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:02:59 GMT)
TiAda: A Time-scale Adaptive Algorithm for Nonconvex Minimax Optimization [30.1] 適応的手法は、パラメータに依存しない方法でハエの段差を調整する能力を示した。
非凹極小問題に対する勾配上昇の電流収束解析にはパラメータの注意深くチューニングが必要である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:58:26 GMT)
Spectral Prefiltering of Neural Fields [29.7] 本稿では,単一前方通過で事前フィルタリング可能なニューラルネットワークを最適化する,シンプルかつ強力な手法を提案する。
我々は、フィルタの周波数応答でフーリエ特徴埋め込みを解析的にスケーリングすることにより、入力領域における畳み込みフィルタリングを行う。
フィルタ信号の単サンプルモンテカルロ推定を用いてニューラルネットワークを訓練する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:15:46 GMT)
Effective and Stealthy One-Shot Jailbreaks on Deployed Mobile Vision-Language Agents [29.6] アプリ内のプロンプトインジェクションを活用する一発のjailbreak攻撃を提示する。
悪意のあるアプリはUIテキストに短いプロンプトを埋め込むが、エージェントがADBを介してUIを駆動すると明らかになる。
当社のフレームワークは,(1)悪質なアプリへのペイロードをエージェントの視覚入力として注入する低プライバシー認識チェーンターゲティング,(2)物理的タッチ属性を用いてエージェントを識別し,エージェント操作時にのみペイロードを公開するタッチベーストリガ,(3)ステルス誘導された文字レベルのワンショットプロンプトエフェクト,の3つの重要なコンポーネントから構成される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:34:57 GMT)
Examining Multilingual Embedding Models Cross-Lingually Through LLM-Generated Adversarial Examples [29.6] 本稿では,並列文のみを必要とする軽量な評価タスクである言語間セマンティック識別(D)と,対向的気晴らしを生成するLarge Language Model(LLM)を導入する。
CLSDは、意味的に誤解を招くが、語彙的に類似した代替品の上に、真の並列文をランク付けする埋め込みモデルの能力を測定する。
我々の実験では、検索タスクに微調整されたモデルは、英語をピボットすることの恩恵を受ける一方、bitextマイニングモデルは、直接言語間設定で最高のパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:39:40 GMT)
Kelp: A Streaming Safeguard for Large Models via Latent Dynamics-Guided Risk Detection [29.5] Kelpは、LM生成パイプライン内でのストリーミングリスク検出を可能にする、新しいプラグインフレームワークである。
Kelpは、最先端のポストホックガードレールと以前のプラグインプローブを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:42:50 GMT)
Mitigating Noise Detriment in Differentially Private Federated Learning with Model Pre-training [29.5] Differentially Private Learning (DPFL)は、ノイズを伴うモデル勾配の摂動によるプライバシー保護を強化する。
前回の実証実験では、ランダムパラメータではなく事前訓練による初期化がノイズ障害を軽減することが示唆された。
本稿では,3つの代表的な微調整戦略を体系的に評価するフレームワークであるPretrain-DPFLを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:53:00 GMT)
Detecting and Mitigating Insertion Hallucination in Video-to-Audio Generation [29.4] Video-to-Audio世代は、ビデオのための自動サウンドに顕著な進歩を遂げた。
我々は、この現象を挿入幻覚と呼び、データセットバイアスによって引き起こされるシステム的リスクとみなす。
この問題の有病率と重症度を定量化する2つの新しい指標を導入する。
IHを緩和する新しいトレーニングフリー推論時間法であるPosterior Feature Correctionを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:08:07 GMT)
InstructX: Towards Unified Visual Editing with MLLM Guidance [29.4] InstructXは画像とビデオの編集を統一したフレームワークである。
画像データのトレーニングは、明示的な監督なしに、創発的な映像編集能力をもたらす可能性があることを示す。
本手法は,モダリティ固有のMLLM機能を組み込むことで,画像編集タスクと映像編集タスクを1つのモデルに効果的に統合する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:26:09 GMT)
Upfront Chain-of-Thought: A Cooperative Framework for Chain-of-Thought Compression [29.4] Upfront CoT (UCoT) は、Chain-of-Thought (CoT) 圧縮を自動化するために事前思考を組み込んだ効率的な推論フレームワークである。
UCoTはエグゼクタの強力な推論能力を維持しつつ、CoTの長さを大幅に削減している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:34:31 GMT)
OpenRLHF: An Easy-to-use, Scalable and High-performance RLHF Framework [29.2] ヒューマンフィードバック(RLHF)からの強化学習による大規模言語モデル(LLM)の微調整
OpenRLHFは、Ray、vLLM、DeepSpeed、HuggingFace Transformers上に構築された、ユーザフレンドリーでスケーラブルで、簡単に学習できるオープンソースRLHFフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:22:46 GMT)
Everything is Plausible: Investigating the Impact of LLM Rationales on Human Notions of Plausibility [29.1] 本研究では, 人間の可否判断が, 可否判断にどのような影響を及ぼすかについて検討する。
我々は、人間から3000の可否判定と、LLMから13,600の判定を収集する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:22:29 GMT)
Metric Calculating Benchmark: Code-Verifiable Complicate Instruction Following Benchmark for Large Language Models [29.1] MCBenchは,LLMが厳密なステップバイステップ命令に従うことで,文字列マッチングNLPメトリクスの実行が可能なかどうかを評価するためのベンチマークである。
主観的判断や一般的な推論に依存する以前のベンチマークとは異なり、MCBenchは客観的、決定論的、コード検証可能な評価を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:43:15 GMT)
Team Xiaomi EV-AD VLA: Learning to Navigate Socially Through Proactive Risk Perception - Technical Report for IROS 2025 RoboSense Challenge Social Navigation Track [28.7] IROS 2025 RoboSense Challenge Social Navigation Trackについて述べる。
このトラックは、RGBDベースの知覚とナビゲーションシステムの開発に焦点を当てている。
本稿では,社会的ナビゲーション性能を高めるための能動的リスク認識モジュールを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:22:12 GMT)
AppForge: From Assistant to Independent Developer - Are GPTs Ready for Software Development? [28.6] APPFORGEは、現実世界のAndroidアプリから引き出された101のソフトウェア開発問題からなるベンチマークである。
アプリケーション文書から主要な機能を自動で要約するマルチエージェントシステムを設計し、テストケースを合成するためにアプリをナビゲートする。
Android開発専門家による厳格な手作業による検証に続いて、APPFORGEでは、テストケースを自動評価フレームワークに組み込んでいる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:26:05 GMT)
CREST-Search: Comprehensive Red-teaming for Evaluating Safety Threats in Large Language Models Powered by Web Search [28.5] 大きな言語モデル(LLM)は、対話、要約、質問応答といったタスクに優れる。
これを解決するために、ウェブ検索はLLMに統合され、オンラインコンテンツへのリアルタイムアクセスを可能にした。
この接続は、敵のプロンプトと信頼できないソースが組み合わさって深刻な脆弱性を引き起こすため、安全性のリスクを増大させる。
我々は,このようなシステムにおけるリスクを体系的に公開するフレームワークであるCREST-Searchを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:44:14 GMT)
AdaptiveK Sparse Autoencoders: Dynamic Sparsity Allocation for Interpretable LLM Representations [28.4] 本稿では,各入力の意味的複雑さに基づいて空間レベルを動的に調整する新しいフレームワークであるAdaptiveK SAE(Adaptive Top K Sparse Autoencoders)を提案する。
本研究では, この複雑化による適応が, 再構成忠実度, 分散, コサイン類似度, 解釈可能性指標において, 固定スパーシティアプローチを著しく上回っていることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:34:09 GMT)
Targetless LiDAR-Camera Calibration with Neural Gaussian Splatting [28.4] 本稿では,ニューラルベースガウス表現と協調してセンサポーズを最適化するTLC(Targetless LiDAR scene)を提案する。
光度および幾何正則化による完全微分可能なパイプラインは、ロバストで一般化可能なキャリブレーションを実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:55:36 GMT)
Convergence Theorems for Entropy-Regularized and Distributional Reinforcement Learning [28.4] 本稿では,特定の最適政策への収束を保証する政策最適化の理論的枠組みを提案する。
本手法は,正則化温度が消えるにつれて,解釈可能かつ多様性を保った最適政策を実現する。
本稿では,その解釈可能かつ多様性を保った最適ポリシに関連する回帰分布を任意の精度で推定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:07 GMT)
Experimental property-reconstruction in a photonic quantum extreme learning machine [28.4] 我々は、光子の偏光状態の資源効率と正確な評価を実現するために、フォトニックプラットフォームに量子エクストリームラーニングマシンを実装した。
本研究では, 未知の偏光状態の再構成が測定装置の注意深い評価を必要とせず, 実験的不完全性に対して頑健であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:53:50 GMT)
Multidomain Evolutionary Optimization on Combinatorial Problems in Complex Networks [28.3] マルチドメイン進化最適化(MDEO)という新しいフレームワークを提案する。
本稿では,ドメイン間の知識伝達を管理するために,コミュニティレベルのグラフ類似度の測定手法を提案する。
グラフ学習に基づくネットワークアライメントモデルを構築し、異なるドメイン間でソリューションを効果的に転送するコンジットとして機能する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:35:19 GMT)
Perovskite-LLM: Knowledge-Enhanced Large Language Models for Perovskite Solar Cell Research [27.7] 本稿では,ペロブスカイト太陽電池(PSC)の3つの重要な構成要素を統合する知識強化システムについて述べる。
まず,1,517の論文から構築したドメイン固有知識グラフであるPerovskite-KGを開発した。
次に、Perovskite-ChatとPerovskite-Reasoningという2つの補完的なデータセットを作成します。
第3に、ドメイン固有の知識支援のためのPerovskite-Chat-LLMと科学的推論タスクのためのPerovskite-Reasoning-LLMの2つの専門的な大規模言語モデルを導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:40:58 GMT)
Textual Entailment and Token Probability as Bias Evaluation Metrics [27.5] 我々は、より現実的な代替バイアス指標として自然言語推論(NLI)をテストする。
NLIのメトリクスは、"バイアスのかかる"ケースを検出する傾向にあることが分かりました。
トークン確率も自然言語推論も、すべての場合において「良い」バイアス計量ではないと結論づける。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:30:35 GMT)
MRI-derived quantification of hepatic vessel-to-volume ratios in chronic liver disease using a deep learning approach [27.3] 深層学習MRIによる肝血管量を,慢性肝疾患の段階と健常度で定量化することを目的とした。
肝機能障害と線維症/門脈圧亢進症との関連について検討した。
深層学習に基づく肝血管容積検査では,健康な肝臓と慢性肝疾患の段階の違いが認められた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:23:16 GMT)
Test-Time Reasoners Are Strategic Multiple-Choice Test-Takers [27.3] 大規模言語モデル(LLM)は、応答前に推論を与え、MCQA(Multi-choice Question answering)のようなタスクに優れる。
しかし、LCMsがMCQAで成功する理由は、選択肢のみという疑問を使わずに見いだすことができる。
これらの戦略を研究するために、LLMは完全かつ選択のみの入力でMCQを解く。
浅いショートカットによる可能性があるが、選択のみの成功は、推論のトレースの長さによってほとんど影響を受けない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:00:09 GMT)
XYZCylinder: Feedforward Reconstruction for Driving Scenes Based on A Unified Cylinder Lifting Method [27.2] 統一シリンダリフト法に基づくフィードフォワードモデルである textbfXYZ Cylinder を提案する。
具体的には、視点に依存した空間対応の学習を避けるため、UCCM(Unified Cylinder Camera Modeling)戦略を設計する。
再構成精度を向上させるために,新たに設計されたCylinder Plane Feature Groupに基づく複数の専用モジュールを用いたハイブリッド表現を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:58:03 GMT)
Stop DDoS Attacking the Research Community with AI-Generated Survey Papers [27.0] 我々は、膨大な量のAI生成調査論文を研究コミュニティにアップロードするのをやめなければならないと論じている。
私たちは、AI利用における専門家の監視と透明性の回復を呼びかけています。
調査の完全性を守ることはもはやオプションではなく、研究コミュニティにとって必須であることを示します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:55:13 GMT)
Rectified-CFG++ for Flow Based Models [26.9] 本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器ガイダンスであるRectified-C++を提案する。
大規模なテキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の実験では、Rectified-C++がベンチマークデータセットの標準CFGを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:00:47 GMT)
PIT-QMM: A Large Multimodal Model For No-Reference Point Cloud Quality Assessment [26.9] 大規模マルチモーダルモデル(LMM)は近年,画像および映像品質評価の領域において,大幅な進歩を実現している。
我々はこれらのモデルを用いて、No-Reference Point Cloud Quality Assessment (NR-PCQA)を実施することに興味があります。
その目的は、参照のない点雲の知覚的品質を自動的に評価することである。
NR-PCQAのための新しいLMMであるPIT-QMMを構築し、テキスト、画像、点雲をエンドツーエンドに消費して品質スコアを予測する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:13:34 GMT)
Multilingual Generative Retrieval via Cross-lingual Semantic Compression [26.9] 言語間セマンティック圧縮(MGR-CSC)を用いた多言語生成検索を提案する。
MGR-CSCは意味論的に等価な多言語キーワードを共有原子に統一し、意味論を整合させ、識別子空間を圧縮する。
MGR-CSCはmMarco100kで6.83%、mNQ320kで4.77%向上した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:42:57 GMT)
Prompts Generalize with Low Data: Non-vacuous Generalization Bounds for Optimizing Prompts with More Informative Priors [26.8] このような広範な成功は、データや分布に依存した難易度を慎重に検討することで、より完全に説明できる、と我々は主張する。
我々は、より有用な事前処理によるデータスカースプロンプト最適化において、空でない新しい一般化境界を導出する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:32:46 GMT)
On the Convergence of Moral Self-Correction in Large Language Models [26.7] 大きな言語モデル(LLM)は、そのように指示されたときの応答を改善することができる。
LLMは、内在的な自己補正と呼ばれるプロセスである応答品質を改善するために、内部知識に頼らなければならない。
我々は,多ラウンド相互作用による性能収束という,本質的な自己補正のキーとなる特徴を明らかにする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:09:12 GMT)
Instance Relation Learning Network with Label Knowledge Propagation for Few-shot Multi-label Intent Detection [26.4] MID(Multi-label Intent Detection)は対話システムにおいて重要であり,複数の発話意図を検出することを目的としている。
複数ラベルの連成学習手法をエンドツーエンドに提案する。
実験では、1ショットシナリオで平均9.54%のAUCと11.19%のMacro-F1で強いベースラインを上回ります。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:47:06 GMT)
CVD-STORM: Cross-View Video Diffusion with Spatial-Temporal Reconstruction Model for Autonomous Driving [26.4] 時空間再構成変分オートエンコーダ(VAE)を用いたビデオ拡散モデルCVD-STORMを提案する。
提案手法は,まず補助的な4次元再構成タスクでVAEを微調整し,その3次元構造と時間的ダイナミクスをエンコードする能力を向上する。
実験結果から,FIDとFVDの両指標の精度向上が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:41:58 GMT)
Mitigating Judgment Preference Bias in Large Language Models through Group-Based Polling [26.4] 自動評価器としての大規模言語モデル(LLM)が注目されている。
LLMは自分自身が生み出す反応を好む傾向があり、判断の信頼性を損なう。
本稿では,教師なしマルチエージェント協調最適化フレームワークであるグループベースポーリング最適化(Genii)を紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:32:31 GMT)
ReInAgent: A Context-Aware GUI Agent Enabling Human-in-the-Loop Mobile Task Navigation [26.3] ReInAgentは、ヒューマン・イン・ザ・ループのモバイルタスクナビゲーションを可能にする、コンテキスト対応のマルチエージェントフレームワークである。
これは、明確で静的なタスク仮定に依存する既存のアプローチの制限を克服する。
真のユーザの好みとより緊密に一致した結果を生み出すのです。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:22:05 GMT)
Propagation-Based Vulnerability Impact Assessment for Software Supply Chains [26.2] ソフトウェアサプライチェーンにおける脆弱性の影響範囲と進化を定量化する新しい手法を提案する。
Java Mavenエコシステムで私たちのアプローチのプロトタイプを実装し、100の現実世界の脆弱性で評価します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:22:47 GMT)
From Noisy to Native: LLM-driven Graph Restoration for Test-Time Graph Domain Adaptation [26.1] 本稿では,テスト時間グラフドメイン適応(TT-GDA)を生成グラフ復元問題として再編成する新しいフレームワークを提案する。
グラフ復元の有効性を確保するため,GRAILを提案する。
修復の質をさらに向上するため,特殊アライメントと信頼報酬によって指導される強化学習プロセスを導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:00:42 GMT)
Alignment, Mining and Fusion: Representation Alignment with Hard Negative Mining and Selective Knowledge Fusion for Medical Visual Question Answering [26.1] 医学的視覚的質問回答(Med-VQA)は、医学的イメージとテキスト的質問の両方を深く理解する必要がある課題である。
私たちのフレームワークは、RAD-VQA、SLAKE、PathVQA、VQA 2019といった、広く使用されているMed-VQAデータセットの最先端よりも優れています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:14:49 GMT)
Little By Little: Continual Learning via Self-Activated Sparse Mixture-of-Rank Adaptive Learning [26.1] 大規模な事前学習モデルによる継続的な学習は、破滅的な忘れ込みとタスクの干渉によって挑戦される。
既存のLoRAベースのMixture-of-Experts (MoE)は、タスク固有のアダプタを割り当て、凍結することで、忘れを緩和する。
CLに対する自己アクティベートとスパースなランクアクティベーションを備えたMixture-of-Rank Adaptive LearningアプローチであるMoRAを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:43:44 GMT)
Search-on-Graph: Iterative Informed Navigation for Large Language Model Reasoning on Knowledge Graphs [26.1] 大規模言語モデル(LLM)は、知識集約型マルチホップ質問では信頼性が保たれていない印象的な推論能力を示している。
本稿では,LLMの反復的なグラフナビゲーションを実現するための,シンプルかつ効果的なフレームワークである検索オングラフ(SoG)を提案する。
Wikidataベンチマーク(以前のベストメソッドよりも+16%改善)とFreebaseベンチマークの一貫性のある改善は特に顕著です。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:20:16 GMT)
RePainter: Empowering E-commerce Object Removal via Spatial-matting Reinforcement Learning [26.1] Repainterは、空間マッピングの軌道修正とグループ相対的ポリシー最適化を統合する強化学習フレームワークである。
提案手法は,背景コンテキストを強調するために注意機構を変調し,より高い逆サンプルを生成し,不要なオブジェクト挿入を減らす。
EcomPaint-100Kは高品質で大規模な電子商取引の塗装データセットであり、標準化されたベンチマークEcomPaint-Benchは公正な評価を目的としている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:57:33 GMT)
X2Video: Adapting Diffusion Models for Multimodal Controllable Neural Video Rendering [25.9] X2Videoは、アルベド、正常、粗さ、金属性、照射を含む固有チャネルによって誘導される最初の拡散モデルである。
グローバルリージョンとローカルリージョンの両方で参照イメージとテキストプロンプトを備えた直感的なマルチモーダルコントロールをサポートする。
X2Videoは、本質的な条件でガイドされた、長く、時間的に一貫性があり、フォトリアリスティックなビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:31 GMT)
Multi-Trigger Poisoning Amplifies Backdoor Vulnerabilities in LLMs [25.7] 複数の異なるバックドアトリガが1つのモデル内で相互に干渉することなく共存できることを示し、敵が複数のトリガを同時に埋め込むことを可能にする。
我々の発見は、大規模言語モデルにおいて、より広く、より永続的な脆弱性サーフェスを明らかにします。
本稿では,階層単位の重み差解析に基づいて,特定のモデル成分を選択的に再学習するポストホック回収法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:56:04 GMT)
Med-R$^3$: Enhancing Medical Retrieval-Augmented Reasoning of LLMs via Progressive Reinforcement Learning [25.7] 本稿では、**Med-R$3$*, a*Med*ical **R**etrieval-augmented **R**easoning framework driven by Progress **R**einforcement learningを紹介する。
本稿ではまず,医学的問題に対する論理的推論を行うモデルの開発を行う。
次に,知識コーパスの特性と外部情報の利用性に適合するように,検索機能を適応的に最適化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:05:29 GMT)
Improving Reasoning for Diffusion Language Models via Group Diffusion Policy Optimization [25.5] 拡散言語モデル(DLMs)は、反復的洗練を伴う並列で順序に依存しない生成を可能にする。
強化学習の微調整をDLMに適用することは、難易度が高いため、未解決の課題である。
DLMに適した新しいRLアルゴリズムである textbfGroup Diffusion Policy Optimization (GDPO) を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:58:07 GMT)
Med-R$^2$: Crafting Trustworthy LLM Physicians via Retrieval and Reasoning of Evidence-Based Medicine [25.4] 大言語モデル(LLM)は臨床シナリオにおいて顕著な機能を示した。
我々はEvidence-Based Medicine(EBM)プロセスに準拠した新しいフレームワークであるMed-R2を紹介する。
実験の結果,Med-R2はバニラRAG法よりも13.27%改善し,微調整法に比べて4.55%向上した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:42:57 GMT)
MergeBench: A Benchmark for Merging Domain-Specialized LLMs [25.3] MergeBenchは、スケールでのモデルマージを評価するために設計された評価スイートである。
2Bから9BスケールのLlamaやGemmaファミリなど、最先端のオープンソース言語モデルの上に構築されている。
マルチタスク性能, 忘れられたこと, 実行効率にまたがる8つの代表的なマージ手法を評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:22:49 GMT)
Evaluating Evaluation Metrics -- The Mirage of Hallucination Detection [25.3] 幻覚は言語モデルの信頼性と普及に大きな障害となる。
4つのデータセット、37の言語モデル、5つの復号法で幻覚検出指標を大規模に評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:39:50 GMT)
Online Rubrics Elicitation from Pairwise Comparisons [25.2] InlineRubrics Elicitation (OnlineRubrics)は,オンライン手法で評価基準を動的にキュレートする手法である。
OnlineRubricsは、静的ルーブリックのみによるトレーニングよりも、最大8%の一貫性のある改善を実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:26:39 GMT)
VideoVerse: How Far is Your T2V Generator from a World Model? [25.2] VideoVerseは、T2Vモデルが現実世界の複雑な時間的因果関係と世界的知識を理解できるかどうかを評価するベンチマークである。
VideoVerseは、815のイベントと733のバイナリ評価質問を含む300の慎重にキュレートされたプロンプトで構成されている。
我々は、VideoVerse上で、最先端のオープンソースおよびクローズドソースT2Vモデルの体系的評価を行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:18:20 GMT)
QAgent: A modular Search Agent with Interactive Query Understanding [25.1] 大規模言語モデルは自然言語処理に優れるが、静的パラメトリック知識によって制限される。
本稿では,適応検索に検索エージェントを用いる統一エージェントRAGフレームワークを提案する。
実験ではQAでQAgentが優れていることを示し、実世界のデプロイのためのプラグイン・アンド・プレイモジュールとして機能する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:08:05 GMT)
Task Vector Bases: A Unified and Scalable Framework for Compressed Task Arithmetic [24.4] 本稿では,タスク演算の機能を維持しつつ,$T$タスクベクトルを$M T$ベースベクトルに圧縮するフレームワークであるTask Vector Basesを提案する。
各タスクベクトルを基底原子の構造的線形結合として表現することにより、より高度な算術演算だけでなく、加算や否定といった標準的な演算もサポートする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:18:04 GMT)
MAViS: A Multi-Agent Framework for Long-Sequence Video Storytelling [24.2] MAViSは、長時間のビデオストーリーテリングを支援するために設計されたマルチエージェント協調フレームワークである。
スクリプト作成、ショットデザイン、キャラクターモデリング、生成、ビデオアニメーション、オーディオ生成など、複数のステージにまたがる特殊エージェントを編成する。
簡単なアイデア記述だけで、MAViSは、高品質で完全なロングシーケンス動画を効率よく生成することで、様々なビジュアルなストーリーテリングと、シーケンシャルなビデオ生成のための創造的な方向を素早く探索することができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:46:23 GMT)
WebRenderBench: Enhancing Web Interface Generation through Layout-Style Consistency and Reinforcement Learning [24.2] 実世界のポータルサイトから収集した45.1kのWebページの大規模なベンチマークを示す。
また、最終レンダリングページからレイアウトとスタイルの整合性を測定する新しい評価指標を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:04:27 GMT)
Revisiting Reweighted Risk for Calibration: AURC, Focal, and Inverse Focal Loss [24.1] 深層学習で一般的に用いられる重み付きリスク関数のクラスを再検討し,キャリブレーション誤差と選択分類の原則的関連性を確立する。
キャリブレーション誤差の最小化は選択的分類パラダイムと密接に関連していることを示し、低信頼領域における選択的リスクの最適化が自然にキャリブレーションの改善につながることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:25:31 GMT)
MeSH: Memory-as-State-Highways for Recursive Transformers [24.0] パラメータが少ない再帰モデルは、マッチした計算の下では非再帰的モデルよりも遅れることが多い。
隠れた状態を探索することで、このパフォーマンスギャップを2つの主要なボトルネックにトレースします。
メモリ管理を明示的なメモリバッファに外部化するメモリ・アズ・ステート・ハイウェイ方式を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:23:38 GMT)
HiChunk: Evaluating and Enhancing Retrieval-Augmented Generation with Hierarchical Chunking [24.0] HiChunkは、微調整 LLM と Auto-Merge 検索アルゴリズムに基づくマルチレベル文書構造化フレームワークである。
HiChunkは適切な時間消費でより優れたチャンキング品質を実現し、RAGシステム全体の性能を向上させる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:21:50 GMT)
Tug-of-war between idioms' figurative and literal interpretations in LLMs [24.0] 非構成的図形解釈は、しばしばイディオムのリテラル解釈から強く分かれる。
我々は因果トレースを用いて、事前訓練された因果変換器がこのあいまいさにどう対処するかを分析する。
本研究は自己回帰変換器における理解のメカニズム的証拠を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:21:10 GMT)
Neologism Learning for Controllability and Self-Verbalization [23.9] モデルをよりよく理解し、制御するために、新しい単語を導入するというアイデアを探求する。
本手法では、新しい単語を埋め込み、その概念を示す例で訓練することにより、新しい単語を導入する。
新しい単語を追加することで、フラットリー、誤った回答、テキストの長さ、AxBenchのより複雑な概念などの概念を制御できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:41:57 GMT)
Can LLMs Grasp Implicit Cultural Values? Benchmarking LLMs' Cultural Intelligence with CQ-Bench [23.9] 文化インテリジェンス(文化インテリジェンス、英: Cultural Intelligence、略称:CQ)とは、文化の文脈を理解する能力のこと。
既存の研究は、しばしば明示された文化的規範に焦点を当てるが、日々の会話でよく見られる微妙で暗黙的な価値を捉えることに失敗する。
自然会話の文脈から暗黙的な文化的価値を推測するLLMの能力を評価するために設計されたベンチマークであるCQBenchを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:36:23 GMT)
Investigating Counterclaims in Causality Extraction from Text [23.8] 「Concausal」は、関係を否定する言明は、完全に無視されるか、偶発的に代名詞として注釈付けされる。
コンカジュナリティを統合する新しいデータセットを開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:45:54 GMT)
An approach for systematic decomposition of complex llm tasks [23.8] 大きな言語モデル(LLM)は、既存の分解手法がエージェントや手動分解に依存しているため、複雑なタスクに対する信頼性の問題に悩まされる。
この研究は、制約問題としてタスクをモデル化し、分解を導くための形式的な複雑さ対策を活用する、新しい体系的な分解フレームワークを導入している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:24:47 GMT)
ManipGPT: Is Affordance Segmentation by Large Vision Models Enough for Articulated Object Manipulation? [23.7] 本稿では,調音対象の最適相互作用領域を予測するためのフレームワークであるManipGPTを紹介する。
9.9kのシミュレーションと実際の画像のデータセットを作成し、視覚的シミュレートとリアルのギャップを埋める。
我々は,ロボット操作のシナリオに対して,モデルのコンテキスト内セグメンテーション機能を適用することにより,部分レベルの割当セグメンテーションを大幅に改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:15:53 GMT)
Multi-Continental Healthcare Modelling Using Blockchain-Enabled Federated Learning [23.7] 局所的なデータセットを共有せずに、多大陸のデータセットを用いたグローバルヘルスケアモデリングのためのフレームワークを提案する。
技術的には、医療データのプライバシと安全性の要件を満たすために、ブロックチェーン対応のフェデレーション学習が適応して実装されている。
実験結果から,提案するフレームワークは有効で,効率的で,かつ,プライバシーを保護できることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:22:19 GMT)
ReviewerToo: Should AI Join The Program Committee? A Look At The Future of Peer Review [23.6] ReviewerTooは、AI支援ピアレビューの研究とデプロイのためのフレームワークである。
専門的なレビュアー・ペルソナと構造化された評価基準による体系的な実験を支援する。
私たちは、複雑な評価判断をドメインの専門家に任せながら、AIが一貫性、カバレッジ、公平性を高める方法を示します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:53:19 GMT)
Latency-Aware Contextual Bandit: Application to Cryo-EM Data Collection [23.5] 本稿では,標準的なコンテキスト帯域幅問題を一般化した待ち時間対応のコンテキスト帯域幅フレームワークを提案する。
この設定では、学習者はコンテキストを観察し、選択されたサブセットによって決定される合計時間で、決定セットから複数のアームを選択することができる。
提案アルゴリズムは, 探索, エクスプロイト, 動作遅延のバランスを保ち, 最適平均回帰ポリシーに対する後悔を最小限に抑える。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:24:21 GMT)
Stress-Testing Model Specs Reveals Character Differences among Language Models [23.5] 大規模言語モデル(LLM)は、AI構成とモデル仕様からますます訓練されている。
本稿では,ストレステストモデルキャラクタ仕様の体系的手法を提案する。
我々は、現在のモデル仕様における矛盾と解釈の曖昧さの多くの事例を同定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:24:37 GMT)
FlexTraj: Image-to-Video Generation with Flexible Point Trajectory Control [23.5] フレキシブル・ポイント・トラジェクトリ・コントロールを備えた画像・ビデオ生成フレームワークFlexTrajを提案する。
本稿では,各点をセグメント化ID,時間的に一貫した軌跡ID,外見的手がかりのためのオプションカラーチャネルで符号化する統合された点ベース動作表現を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:22 GMT)
Personalized Federated Fine-Tuning for LLMs via Data-Driven Heterogeneous Model Architectures [23.5] フェデレートラーニング(FL)は、生データにアクセスすることなく、大規模言語モデルの協調的な微調整を可能にする。
既存のファインチューニングへのアプローチは通常、一様モデルアーキテクチャを採用する。
データ駆動の異種モデルアーキテクチャを実現する軽量なパーソナライズFLフレームワークであるFedAMoLEを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:40:31 GMT)
DM1: MeanFlow with Dispersive Regularization for 1-Step Robotic Manipulation [23.4] フローベースの生成モデルは、アクションの分布を学習するための有望なソリューションとして現れてきた。
既存のフローベースのポリシーは、表現の崩壊、類似した視覚的表現を区別できないこと、そして正確な操作タスクの失敗に悩まされる。
本稿では,分散正規化をMeanFlowに統合した新しいフローマッチングフレームワークDM1を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:12:20 GMT)
PEAR: Phase Entropy Aware Reward for Efficient Reasoning [23.4] 本稿では,位相依存型エントロピーを報酬設計に組み込んだ報酬機構であるPEARを紹介する。
4つのベンチマーク実験により、PEARはモデルスケール間の競争精度を維持しながら、応答長を一貫して減少させることが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:04:31 GMT)
Rethinking Provenance Completeness with a Learning-Based Linux Scheduler [23.3] セキュリティの脅威や影響の根本原因分析に対するシステムの動作のトレーサビリティを維持する上で、証明は重要な役割を果たす。
近年の研究では、既存の前兆収集システムが真の基準モニターのセキュリティ保証に失敗しているかどうかを疑問視している。
オペレーティングシステムのカーネルスケジューラがこの脅威を軽減する方法を示し、特に証明のために設計されたLinuxの学習スケジューラであるVenusを紹介します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:18:50 GMT)
In-Context Learning for Non-Stationary MIMO Equalization [23.3] In-context Learning (ICL) は、いくつかの例で推論時に新しいチャネルに適応する。
既存のICLベースの等化器は、主にコンテキストウィンドウ内の静的チャネルに対して開発・評価されている。
非定常タスクの適応性を改善した効率的な注意機構を設計するための原則的枠組みを用いる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:16:41 GMT)
PrismGS: Physically-Grounded Anti-Aliasing for High-Fidelity Large-Scale 3D Gaussian Splatting [23.3] 3D Gaussian Splatting (3DGS)は、最近、コンパクトなシーンでのリアルタイムレンダリングを可能にしたが、大都市環境へのスケーリングは、深刻なエイリアス化アーティファクトをもたらす。
そこで,PrismGSを提案する。PrismGSは3次元ガウスの内在的なレンダリング動作を改善する物理地上正規化フレームワークである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:21:45 GMT)
Towards Urban Planing AI Agent in the Age of Agentic AI [23.2] 都市計画とは別に、生成AI、大規模言語モデル、エージェントAIが出現している。
既存の研究は、都市計画をジェネレーティブなAIタスクとして概念化し、そこでAIは土地利用構成を合成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:28:38 GMT)
Submodular Context Partitioning and Compression for In-Context Learning [23.2] Sub-CPは、大規模言語モデルのためのブロック対応コンテキスト選択フレームワークである。
選択戦略のフレキシブルなスペクトルをサポートしており、各ブロックは世界規模で多様なものから局所的なコヒーレントまで様々である。
実験の結果、Sub-CPはモデルスケールで継続的に性能を改善している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:17:52 GMT)
ACE: Attribution-Controlled Knowledge Editing for Multi-hop Factual Recall [23.1] 大きな言語モデル(LLM)は、事実情報を更新するために効率的な知識編集(KE)を必要とする。
既存の手法は、マルチホップのファクトリコールにおいて顕著な性能低下を示す。
マルチホップファクチュアルリコールのための属性制御型知識編集法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:46:08 GMT)
TokenSelect: Efficient Long-Context Inference and Length Extrapolation for LLMs via Dynamic Token-Level KV Cache Selection [23.1] Dynamic Token-Level KV Cache Selection (TokenSelect) は、高速で正確な長文推論のためのトレーニング不要な手法である。
TokenSelectの総合的な評価では、注意計算のスピードアップが最大23.84ドル、エンドツーエンドのレイテンシのアクセラレーションが最大2.28ドルである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:05:04 GMT)
Approximate Domain Unlearning for Vision-Language Models [22.9] 本稿では,特定の領域の画像の認識精度を低下させる新しい問題設定であるADU(Approximate Domain Unlearning)を紹介する。
ADUは、事前訓練されたビジョンランゲージモデルの強力なドメイン一般化能力のために、新しい技術的課題を提示している。
本稿では,ドメイン分布を明示的に切り離し,インスタンス固有のドメイン情報を適応的にキャプチャする手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:17:59 GMT)
SustainableQA: A Comprehensive Question Answering Dataset for Corporate Sustainability and EU Taxonomy Reporting [22.8] 企業サステナビリティと年次レポートから包括的なQAペアを生成する新しいデータセットとスケーラブルなパイプラインであるSustainableQAを紹介する。
その結果、195,000以上の多様なファクトイドと非ファクトイドのQAペアの頑健なデータセットが得られる。
SustainableQAは、複雑な持続可能性コンプライアンスデータをナビゲートできるベンチマークと高度な知識アシスタントを開発するための、非常に効果的なリソースであることが証明されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:51:33 GMT)
Ultra-Efficient On-Device Object Detection on AI-Integrated Smart Glasses with TinyissimoYOLO [22.5] 本報告では、常時オンのオンデバイスオブジェクト検出のためのスマートグラスプラットフォームの設計を1日限りのバッテリー寿命で提案する。
提案するプラットフォームは、Greenwaves TechnologiesのマルチコアRISC-VプロセッサであるGAP9をベースにしている。
スマートグラスプロトタイプの評価では、TinyissimoYOLOの推論遅延は17msで、推論毎に1.59mJのエネルギーを消費している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:28:34 GMT)
IG-MCTS: Human-in-the-Loop Cooperative Navigation under Incomplete Information [22.5] CoNav-Mazeは、人間のオペレータが不正確な地図に基づいてガイダンスを提供する間、ロボットが局所的な知覚でナビゲートするシミュレーション環境である。
我々は,自律移動と情報通信を協調的に最適化する情報ゲインモンテカルロ木探索(IG-MCTS)を提案する。
IG-MCTSはコミュニケーション要求を著しく減らし、認知負荷の低下を示す視線追跡指標を得る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:20:16 GMT)
Optimal Stopping in Latent Diffusion Models [22.5] 我々は,拡散の最終段階が試料の品質を劣化させる,潜在拡散モデル(LDM)の驚くべき現象を特定し,解析する。
潜伏次元と停止時間の間の相互作用を分析することによって、原理的な説明を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:28:48 GMT)
DexNDM: Closing the Reality Gap for Dexterous In-Hand Rotation via Joint-Wise Neural Dynamics Model [22.5] 我々は,シミュレーションで訓練された単一ポリシーを,現実世界のさまざまな対象や条件に一般化することのできる,新しいフレームワークを開発した。
単一のポリシーは、複雑な形状(例えば動物)、高いアスペクト比(最大5.33)、小さなサイズで挑戦対象を回転させることに成功した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:11 GMT)
How to Teach Large Multimodal Models New Skills [22.5] 本研究では,5つの目標スキルを連続的に微調整し,8つのベンチマークで一般的な能力をモニタリングする。
細粒度調整後の保留作業の「鍛造」が後段に部分的に回復する可能性が示唆された。
ドリフトを制限しながら強く学習する,シンプルで堅牢なチューニングレシピを2つ同定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:37 GMT)
A 3D Generation Framework from Cross Modality to Parameterized Primitive [22.3] 本稿では,テキスト入力と画像入力によってガイドされるパラメータ化プリミティブからなる3次元モデルを生成する新しいフレームワークを提案する。
パラメータ化プリミティブに基づくモデル生成アルゴリズムを提案し,モデル構成要素の形状特徴を同定する。
パラメータ化プリミティブのパラメータのみを保持しながら,モデルの本来の表面品質を保証できるモデル記憶法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:15:33 GMT)
FlashDLM: Accelerating Diffusion Language Model Inference via Efficient KV Caching and Guided Diffusion [22.2] 拡散言語モデルは並列トークン生成と本質的に双方向性を提供する。
最先端拡散モデル(ドリーム7B、LLaDA 8Bなど)は推論が遅い。
我々は,トークンアンマキングを監督するために,軽量な事前学習型自己回帰モデルを用いた学習自由度法であるガイドド拡散を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:43:02 GMT)
$λ$-GRPO: Unifying the GRPO Frameworks with Learnable Token Preferences [22.2] トークンレベルの重み付けを適応的に制御する学習可能なパラメータ$lambda$を導入します。
lambda$-GRPOはバニラGRPOとDAPOよりも一貫した改善を実現しています。
これらの利益は、トレーニングデータの変更や追加の計算コストなしで得られます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:27:04 GMT)
Deceptive Exploration in Multi-armed Bandits [22.1] 我々は、各アームがパブリックかつプライベートな報酬分布を持つマルチアームのバンディット設定について検討する。
観察者は、公開報酬に応じて、エージェントがトンプソンサンプリングに従うことを期待するが、偽装エージェントは、気づかれることなく、最高のプライベートアームを素早く特定することを目的としている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:15:52 GMT)
Provable Speech Attributes Conversion via Latent Independence [22.0] 本稿では,理論的解析と妥当な仮定の下での保証を伴って,音声属性変換のための一般的な枠組みを提案する。
本フレームワークは,予測潜在変数と対象可制御変数との独立性制約を持つ非確率的オートエンコーダアーキテクチャ上に構築する。
この設計は、観測されたスタイル変数に条件付きで一貫した信号変換を保証し、元のコンテンツを保持し、所望の属性を変更する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:32:27 GMT)
Rethinking Losses for Diffusion Bridge Samplers [22.0] 拡散ブリッジは、正規化されていない分布からサンプリングする深層学習法として有望なクラスである。
最近の研究によると、ログ分散(LV)損失は、逆のKullback-Leibler(rKL)損失よりも一貫して優れていた。
ログデリバティブ・トリック(rKL-LD)を用いたrKL損失は,概念的問題を回避するだけでなく,LV損失を一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:05:39 GMT)
Search Wisely: Mitigating Sub-optimal Agentic Searches By Reducing Uncertainty [22.0] エージェント検索型Augmented Generation (RAG) システムは,動的かつ多段階の推論と情報検索を可能にし,Large Language Models (LLM) を強化する。
これらのシステムは、オーバーサーチ(冗長な情報を取得する)やアンダーサーチ(必要な情報を取得するのに失敗する)のような準最適探索行動を示すことが多い。
この研究は、これらの振る舞いを公式に定義し、定量化し、複数のQAデータセットとエージェントRAGシステムにまたがるそれらの頻度を明らかにする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:24:13 GMT)
Instructor-Worker Large Language Model System for Policy Recommendation: a Case Study on Air Quality Analysis of the January 2025 Los Angeles Wildfires [22.0] ロサンゼルスの山火事における大気の質を調査するために,多エージェントの大規模言語モデルフレームワークを改良し,活用する。
我々は、インストラクタエージェントとWorkerエージェントからなるマルチエージェントの大規模言語システムを使用する。
本研究では,インストラクタ・ワークス LLM システムの健康基準を空気質に基づいて評価することにより,データに基づく政策推薦の能力をテストする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:23:15 GMT)
Characterizing the Multiclass Learnability of Forgiving 0-1 Loss Functions [21.9] この一般化されたナタラジャン次元が有限である場合に限り、仮説クラスが我々の設定で学習可能であることを示す。
また,設定値フィードバックによる学習の関連も示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:07:55 GMT)
When to Reason: Semantic Router for vLLM [21.8] 推論の遅延とトークンの使用に相当なコストがかかる。
本稿では,その推論要求に基づいてクエリを分類するセマンティックルータを提案する。
本手法はMMLU-Proベンチマークの精度を10.2ポイント向上する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:38:00 GMT)
Strategic Communication under Threat: Learning Information Trade-offs in Pursuit-Evasion Games [21.6] 追跡エージェントが回避者の位置を得るためにいつ通信するかを判断しなければならないPursuitEvasion-Exposure-Concealment Game (PEEC) を定式化する。
双方のエージェントは強化学習を通じて行動方針を学習し、追跡者は観測可能性とリスクのバランスをとるコミュニケーション方針も学習する。
実験的な評価は、SHADOW追跡者が6つの競争基準よりも高い成功率を達成することを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:44:00 GMT)
Random Window Augmentations for Deep Learning Robustness in CT and Liver Tumor Segmentation [21.5] 我々は,CT画像中の強度のHU分布を利用して,ランダムウィンドウと呼ばれるCT固有の拡張手法を提案する。
提案手法を複数のデータセット上で改善・解析し,最先端の代替手法と比較し,性能を比較検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:57:04 GMT)
TCIP: Threshold-Controlled Iterative Pyramid Network for Deformable Medical Image Registration [21.3] ピラミッドネットワークにおける各デコード層のコアコンポーネントとして機能強化残留モジュール(FERM)を提案する。
FERMは、解剖学的意味的特徴を抽出し、無関係な特徴を抑えることを学習し、最終的な変形場を推定する3つの連続ブロックから構成される。
我々は FERM と TCI をThreshold-Controlled Iterative Pyramid (TCIP) として統合するモデルを作成した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:38:40 GMT)
Do We Really Need Permutations? Impact of Width Expansion on Linear Mode Connectivity [21.2] 置換がなくても、単にモデルを拡張すれば、線形モード接続を実現するのに十分であることを示す。
階層的に指数関数的に重み付け接続(LEWC)は、マージされたモデルの各レイヤの出力は、元のモデルの対応するレイヤの出力の指数的に重み付けされた和として表すことができることを述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:59:29 GMT)
Maximum In-Support Return Modeling for Dynamic Recommendation with Language Model Prior [21.1] 我々は、DT(Decision Transformer)上に構築されたオフラインRLRSフレームワークであるMDT4Recを導入し、2つの大きな課題に対処する。
まず、MDT4Recは、軌道縫合手順をトレーニングフェーズからアクション推論にシフトし、システムの履歴コンテキストを短縮する。
5つの公開データセットとオンラインシミュレーション環境でMDT4Recを評価し、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:43:24 GMT)
Energy-Guided Diffusion Sampling for Long-Term User Behavior Prediction in Reinforcement Learning-based Recommendation [21.1] 強化学習に基づく推薦システム(RL4RS)は,動的なユーザの嗜好に適応する能力に注目されている。
オフライン強化学習手法は、これらの問題に対処するために広範囲なデータセットを活用する。
本稿では、拡散過程と強化学習を統合する新しいフレームワークであるオフラインRL4RS(DAC4Rec)について述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:38:40 GMT)
H3DE-Net: Efficient and Accurate 3D Landmark Detection in Medical Imaging [21.1] 3Dランドマーク検出は、医用画像解析において重要な課題である。
局所特徴抽出のためのCNNと軽量アテンション機構を組み合わせた新しいフレームワークを提案する。
H3DE-Netは、このような軽量な注意機構をCNNと統合した最初の3Dランドマーク検出モデルである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:28:19 GMT)
HiPRAG: Hierarchical Process Rewards for Efficient Agentic Retrieval Augmented Generation [21.1] 準最適探索行動は、オーバーサーチやアンダーサーチなど、広く存在する。
現在のトレーニング方法は、通常、RLフレームワークの成果ベースの報酬に依存するが、これらの非効率に対処するために必要なきめ細かい制御が欠如している。
我々は、RLトレーニングに詳細な知識に基づくプロセス報酬を組み込んだトレーニング手法であるHiPRAGを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:13:10 GMT)
Benchmarking LLM Causal Reasoning with Scientifically Validated Relationships [21.0] 因果推論は、真の因果関係を理解するための大言語モデルの基本である。
既存のベンチマークは、合成データへの依存やドメインカバレッジの狭さといった、重大な制限に悩まされている。
本稿では,上位階層の経済誌と財務誌から抽出したカジュアルに同定された関係から構築された新しいベンチマークを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:46:30 GMT)
Lossless Vocabulary Reduction for Auto-Regressive Language Models [21.0] トークンと呼ばれるサブワードのシーケンスに所定のテキストを分解するプロセスであるトークン化は、言語モデルの開発において重要なコンポーネントの1つである。
我々は、与えられた自己回帰言語モデルを任意に小さな語彙を持つ言語に変換する、損失のない語彙還元の理論的枠組みを確立する。
アプリケーションとして、異なるトークン化を持つ言語モデルが、最大共通語彙によって互いに効率的に協調できることを実証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:38:48 GMT)
Once Is Enough: Lightweight DiT-Based Video Virtual Try-On via One-Time Garment Appearance Injection [21.0] Video Virtual try-onは、ビデオの中の人の服をターゲットの服に置き換えることを目的としている。
本稿では,OIE(Once is Enough)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:13:37 GMT)
MMHOI: Modeling Complex 3D Multi-Human Multi-Object Interactions [21.0] 本稿では,12の日常シナリオの画像からなる大規模多目的インタラクションデータセットMMHOIを提案する。
MMHOIは、すべての人やオブジェクトに対して完全な3D形状とアノテーションを提供し、78のアクションカテゴリと14のインタラクション固有のボディパーツのラベルを提供する。
MMHOI-Netは、人間と物体の3次元空間、それらの相互作用、および関連する動作を共同で推定するエンド・ツー・エンドのトランスフォーマーベースのニューラルネットワークである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:18:12 GMT)
Safely Exploring Novel Actions in Recommender Systems via Deployment-Efficient Policy Learning [20.9] 本稿では,新しい行動の探索を安全保証として実施するための枠組みを提案する。
本フレームワークは,レコメンデータシステムの安全な実装を保証しながら,新たな行動の探索を可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:10:07 GMT)
Man-Made Heuristics Are Dead. Long Live Code Generators! [20.8] 生成モデルの最近の進歩に支えられた新しい自動探索技術を用いて,政策設計を再考する。
我々は、Webキャッシングと混雑制御という、2つの長年続くシステムポリシーにポリシーを適用する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:35:00 GMT)
BiomedSQL: Text-to-SQL for Scientific Reasoning on Biomedical Knowledge Bases [20.7] 実世界のバイオメディカル知識ベース上で科学的推論を評価するために設計された最初のベンチマークであるBiomedを紹介する。
Biomedはテンプレートから生成された68,000のQ/Q/Aトリプルで構成され、調和したBigQueryの知識ベースに基盤を置いている。
GPT-o3-miniは59.0%の精度で実行し、カスタムマルチステップエージェントBMは62.6%の精度で実行した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:08:48 GMT)
LogAction: Consistent Cross-system Anomaly Detection through Logs via Active Domain Adaptation [20.4] アクティブドメイン適応に基づく新しいログベース異常検出モデルであるLogActionを提案する。
一方、成熟したシステムのラベル付きデータを使用してベースモデルをトレーニングし、アクティブな学習におけるコールドスタート問題を緩和する。
一方、LogActionは、自由エネルギーに基づくサンプリングと不確実性に基づくサンプリングを利用して、手動ラベリングのための分布境界に位置するログを選択する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:43:25 GMT)
Permutation-Invariant Spectral Learning via Dyson Diffusion [20.4] 拡散モデルは生成モデルの中心であり、隣接行列表現を拡散することによってグラフに適応した。
ダイソンのブラウン運動を利用して、隣接行列上のオルンシュタイン-ウレンベック過程のスペクトル力学を捉えるダイソン拡散モデルを導入する。
ダイソン拡散モデル(Dyson Diffusion Model)は,グラフスペクトルを正確に学習し,既存のグラフ拡散モデルより優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:52:19 GMT)
Physics-informed Value Learner for Offline Goal-Conditioned Reinforcement Learning [20.4] EmphPhysics-informed (Pi) regularized loss for value learning, derived from the Eikonal partial Differential Equation (PDE)。
トレーニングを安定させるために主に用いられる一般的な勾配のペナルティとは異なり、我々の定式化は連続時間最適制御に基礎を置いており、コスト対ゴ構造に整合する値関数を奨励している。
提案した正規化器は時間差に基づく値学習と広く互換性があり、既存のオフラインGCRLアルゴリズムに統合できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:43:55 GMT)
Adaptive Gradient Calibration for Single-Positive Multi-Label Learning in Remote Sensing Image Scene Classification [20.3] マルチラベル分類(MLC)は、リモートセンシング(RS)画像のより包括的なセマンティック理解を提供する。
単一陽性多ラベル学習(SPML)が出現し,各画像に関連ラベルが1つだけアノテートされ,そのモデルがラベルの全集合を回復することが期待されている。
本稿では,適応勾配(AdaGC)を,RS画像に適した新しい一般化可能なSPMLフレームワークとして提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:26:09 GMT)
PO-Flow: Flow-based Generative Models for Sampling Potential Outcomes and Counterfactuals [20.1] 本稿では,因果推論のための連続正規化フロー(CNF)フレームワークPO-Flowを提案する。
PO-Flowは、平均的な処理効果推定、個人化された潜在的な結果予測、および対実予測に対する統一的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:28:01 GMT)
LinVideo: A Post-Training Framework towards O(n) Attention in Efficient Video Generation [19.7] 対象とする自己注意モジュール数を線形注意で置き換える,効率的なデータフリーポストトレーニングフレームワークを提案する。
生成品質を保ちながら1.25-2.00xの高速化を実現し、4段階蒸留モデルにより、視覚的品質低下を最小限に抑えた15.92倍の遅延低減を実現した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:03:39 GMT)
Expert-Token Resonance MoE: Bidirectional Routing with Efficiency Affinity-Driven Active Selection [19.4] エキスパート-トークン共鳴(ETR)は、専門家-トークン相互作用を再想像する理論的な双方向ルーティング機構である。
ETRは、ベースラインのMoE実装と比較して、エンドツーエンドのトレーニング効率が5.4%-46.6%向上している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:15:04 GMT)
Selection, Reflection and Self-Refinement: Revisit Reasoning Tasks via a Causal Lens [19.3] 推論タスクは、機械学習モデルの能力を評価するための厳格なベンチマークとみなされてきた。
我々は、因果的視点から推論タスクを再考し、潜在空間におけるそれらの振る舞いを理解する。
SR$2$と呼ばれるフレームワークを導入し、推定された潜在変数を選択機構にフィードバックとして組み込む。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:45:31 GMT)
VideoNorms: Benchmarking Cultural Awareness of Video Language Models [19.3] 私たちは、米国と中国の文化から1000以上のペア(ビデオクリップ、標準)のベンチマークであるVideoNormsを紹介します。
我々は人間とAIの協調フレームワークを使用し、理論的に接地されたプロンプトを用いた教師モデルが候補アノテーションを提供する。
新しいデータセット上で、さまざまなオープンウェイトなVideoLLMをベンチマークし、いくつかの共通のトレンドを強調します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:54:55 GMT)
Reinforcing Diffusion Models by Direct Group Preference Optimization [19.2] グループ選好最適化(DGPO)は、グループ内のサンプルの相対情報を利用するグループレベルの選好から直接学習する。
その結果、DGPOは既存の最先端手法の約20倍の速度でトレーニングを行い、ドメイン内および外部メトリクスの報酬よりも優れたパフォーマンスを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:40:43 GMT)
Efficient and Transferable Agentic Knowledge Graph RAG via Reinforcement Learning [19.0] 知識グラフ検索強化世代(KG-RAG)は、大きな言語モデル(LLM)と構造化された検証可能な知識グラフ(KG)を結合して幻覚を減らし、推論トレースを公開する。
我々は、強化学習(RL)によるエージェントKG検索増強世代(KG-RAG)フレームワークであるKG-R1を紹介する。
KG-R1は、KGと相互作用する単一のエージェントを環境として利用し、各ステップで学習し、取得した情報をその推論と生成に組み込む。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:18:28 GMT)
From Feedback to Checklists: Grounded Evaluation of AI-Generated Clinical Notes [18.9] 本稿では,実際のユーザフィードバックを構造化されたチェックリストに抽出してノート評価を行うパイプラインを提案する。
21,000人以上の臨床検査結果から同定したデータを用いて,フィードバックに基づくチェックリストは,オフライン評価におけるベースラインアプローチよりも優れていることを示す。
オフラインの調査設定では、チェックリストは、定義された品質基準に反するかもしれないメモをフラグする実用的なツールを提供します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:45:01 GMT)
TAPAS: Datasets for Learning the Learning with Errors Problem [18.9] AIによるLearning with Errors(LWE)に対する攻撃は、量子後暗号において重要な問題である。
このアプローチの約束にもかかわらず、アクセス可能なデータの不足により、AI実践者がこれらの攻撃を研究し改善する能力は制限される。
本稿では,AIシステムを用いたポスト量子暗号解析用ツールキットであるTAPASデータセットを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:23:06 GMT)
Adaptive Science Operations in Deep Space Missions Using Offline Belief State Planning [18.9] 本稿では、宇宙船科学機器を適応的にシーケンスする、部分的に観測可能なマルコフ決定プロセス(POMDP)フレームワークを提案する。
我々はベイズネットワークをPOMDP観測空間に統合し、宇宙生物学のミッションに典型的な高次元かつ不確実な測定値を管理する。
提案手法はサンプル識別誤差を40%近く削減する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:58:35 GMT)
BFS-Prover: Scalable Best-First Tree Search for LLM-based Automatic Theorem Proving [18.8] スケーラブルなエキスパートイテレーションフレームワークであるBFS-Proverを紹介します。
BFS-Proverは、MiniF2Fテストセットで72.95%の最先端スコアを達成している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:57:35 GMT)
LightReasoner: Can Small Language Models Teach Large Language Models Reasoning? [18.7] 小型言語モデル(SLM)は、高価値推論モーメントを明らかにすることによって、より大きな言語モデル(LLM)を教える。
より強力な専門家モデル (LLM) と弱いアマチュアモデル (SLM) の振舞いの相違を利用した新しいフレームワークであるLightReasonerを提案する。
LightReasonerは精度を最大28.1%向上し、時間消費を90%削減し、問題を80%削減し、トークンの使用量を99%改善した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:55:12 GMT)
Recurrent Natural Policy Gradient for POMDPs [18.6] 部分観測可能なマルコフ決定過程(POMDP)の解法は、強化学習(RL)における根本的な課題である。
本稿では,リカレントニューラルネットワーク(RNN)アーキテクチャを自然ポリシー勾配(NPG)法と時間差学習(TD)法に統合するナチュラルアクタ・クリティカル(NAC)アルゴリズムについて検討する。
提案手法は,関数近似への大域的最適性を実現するために,サンプル反復と複雑性のバウンドを含む,漸近的でない理論的保証を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:32:01 GMT)
Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory [18.5] 本稿では,長期メモリを備えた新しいマルチモーダルエージェントフレームワークであるM3-Agentを紹介する。
M3-Agentは、リアルタイムの視覚的および聴覚的入力を処理し、エピソードおよびセマンティックメモリの構築と更新を行う。
命令が与えられた後、M3-Agentは自動でマルチターン推論を行い、関連するメモリを取得してタスクを完了させる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:31:15 GMT)
Synthetic Series-Symbol Data Generation for Time Series Foundation Models [18.5] シンボル情報を用いた時系列表現向上のための基礎モデルであるtextttSymTime を開発した。
textttSymTimeは、下流タスクで微調整を行う場合、主要な5つのTSAタスク間での競合性能を示す。
このアプローチは,データ不足を克服し,タスク性能を向上する上で,系列記号データ生成と事前学習機構の可能性を強調する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:54:18 GMT)
Have We Scene It All? Scene Graph-Aware Deep Point Cloud Compression [18.4] セマンティックシーングラフに基づくディープ圧縮フレームワークを提案する。
このフレームワークは最先端の圧縮速度を実現し,データサイズを最大98%削減することを示す。
マルチロボットのポーズグラフ最適化やマップマージといった下流アプリケーションをサポートする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:45:09 GMT)
AlignGS: Aligning Geometry and Semantics for Robust Indoor Reconstruction from Sparse Views [18.4] 屋内シーンのセマンティックにリッチな3Dモデルへの需要は急速に増加しており、拡張現実、仮想現実、ロボット工学の応用によって推進されている。
既存の手法は、しばしば意味論を、既に形成され、潜在的に欠陥のある幾何学に描かれた受動的特徴として扱う。
本稿では、このビジョンを実現する新しいフレームワークであるAlignGSを紹介し、幾何学と意味論の相乗的でエンドツーエンドの最適化を開拓する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:30:20 GMT)
Stochastic Interpolants: A Unifying Framework for Flows and Diffusions [18.3] フローベースおよび拡散ベースを統一する生成モデルのクラスを紹介する。
これらのモデルは、Albergo と VandenEijnden (2023) で提案されたフレームワークを拡張し、インターポーラントと呼ばれる広範囲の連続時間プロセスの使用を可能にした。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:43:44 GMT)
PRESCRIBE: Predicting Single-Cell Responses with Bayesian Estimation [18.2] 単細胞摂動予測では、トレーニングデータに見えない遺伝子摂動の効果を予測することが中心課題である。
このような予測の有効性は,(1) 対象遺伝子とトレーニングデータに表れている遺伝子との類似性,(2) モデルの不確かさを知らせる,(2) 対応するトレーニングデータの品質,という2つの要因に依存する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:57:11 GMT)
RA-Gen: A Controllable Code Generation Framework Using ReAct for Multi-Agent Task Execution [18.2] マルチエージェントタスク実行のためのReActパラダイムを利用した制御可能なコード生成フレームワークを提案する。
このフレームワークは、効率的で正確で解釈可能なコード生成を可能にするために設計されたマルチエージェントシステムである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:59:24 GMT)
Leveraging Personalized PageRank and Higher-Order Topological Structures for Heterophily Mitigation in Graph Neural Networks [18.2] グラフニューラルネットワーク(GNN)はノード分類タスクに優れるが、接続ノードが同様のラベルを共有するホモフィリーを仮定することが多い。
ヘテロ親和グラフの既存のモデルは、主に高階構造からのマルチスケール情報を見渡すペアワイズ関係に依存している。
我々は高階パーソナライズされたPageRankとグラフニューラルネットワークを組み合わせた新しいモデルHPGNNを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:45:15 GMT)
DiMA: An LLM-Powered Ride-Hailing Assistant at DiDi [18.2] DiDi、Uber、Lyftといったオンデマンド配車サービスは、都会の交通手段にマッチせず、利便性と柔軟性を提供している。
本稿では,DiDi Chuxing における LLM を利用した配車支援システム DiMA について紹介する。
私たちの目標は、シームレスな配車サービスを提供することです。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:36:51 GMT)
ERR@HRI 2.0 Challenge: Multimodal Detection of Errors and Failures in Human-Robot Conversations [18.2] ERR@HRI 2.0 Challengeは、人間とロボットの会話中の会話ロボットの失敗のデータセットを提供する。
データセットには、顔、スピーチ、頭の動きを取り入れた16時間の人-ロボットインタラクションが含まれている。
参加者はチームを作り、マルチモーダルデータを使用してこれらの障害を検出する機械学習モデルを開発するために招待される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:54:27 GMT)
From Defender to Devil? Unintended Risk Interactions Induced by LLM Defenses [18.1] 大規模言語モデル(LLM)は、様々なアプリケーションで顕著なパフォーマンスを示しているが、センシティブなドメインへのデプロイは重大な懸念を引き起こす。
安全,公正,プライバシの複雑な相互作用に着目し,LLMの防御による意図せぬ相互作用を調査する第一歩を踏み出した。
リスク1つを目標とする防衛の展開が他者に影響を与えるかどうかを評価するための総合的な評価フレームワークであるCrossRiskEvalを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:00:00 GMT)
Play to Generalize: Learning to Reason Through Game Play [18.1] そこで我々は,MLLMがアーケードライクなゲームによって一般化可能な推論スキルを発達させる,新しい学習方法であるVisual Game Learning (ViGaL)を提案する。
本研究は,マルチモーダル推論がゲームプレイから生まれることを示唆し,RLポストトレーニングのためのサロゲートタスクを設計するための有望な戦略を示唆している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:58:45 GMT)
CommandSans: Securing AI Agents with Surgical Precision Prompt Sanitization [17.9] 本稿では,データに実行可能命令を含まないという,コンピュータセキュリティの基本原理に着想を得た新しいアプローチを提案する。
サンプルレベルの分類の代わりに,ツール出力からAIシステムに指示された指示を外科的に除去するトークンレベルの衛生プロセスを提案する。
このアプローチは非ブロッキングであり、キャリブレーションを必要とせず、ツール出力のコンテキストに依存しない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:32:02 GMT)
Condition Weaving Meets Expert Modulation: Towards Universal and Controllable Image Generation [17.9] 多様な条件入力をサポートするUnified Image-to-image Generation (UniGen) フレームワークを提案する。
Condition Modulated Expert (CoMoE)モジュールは、視覚表現と条件モデリングのために意味的に類似したパッチ機能を集約する。
また,背骨からのグローバルテキストレベル制御と条件分岐からのきめ細かい制御を効果的に相互作用できる動的ヘビ様接続機構WeaveNetを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:50:35 GMT)
Unified approach to the resources of tensor network and stabilizer simulations [17.9] 我々は、古典シミュレーションの資源依存を束縛するために使用できるブラケット絡みという一般的な資源指標を導入する。
テンソルネットワークフレームワークでは、ブラケットの絡み合いが、コヒーレンスとマジックという2つの物理的リソース間の相互作用を支配していることを示す。
安定的な形式主義のアプローチでは、魔法は常にブラケットの絡み合いによらず支配的な資源である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:00:38 GMT)
A Dobrushin condition for quantum Markov chains: Rapid mixing and conditional mutual information at high temperature [17.9] 量子物理学における中心的な課題は、多体系の構造的性質を理解することである。
古典系では、熱平衡における系の構造的性質とそれらと混合するマルコフ連鎖力学を結合する統一的な視点を持つ。
我々は、古典理論の幅と柔軟性を高温における量子ギブズ状態にもたらす一般的な枠組みを開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:54:41 GMT)
Disparate Conditional Prediction in Multiclass Classifiers [17.8] 異なる条件予測尺度(DCP)を多クラス分類器に一般化する。
DCPは、分類器が最も近い共通基底線とは異なる条件付き予測確率で予測する集団の分数として定義される。
2つの異なる条件下でのマルチクラスDCPを推定するための新しい局所最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:38:36 GMT)
The impact of abstract and object tags on image privacy classification [17.8] 本稿では,画像プライバシのコンテキスト依存的・主観的課題に対して,どのタグがより適しているかを検討する。
タグ予算が限られている場合,抽象タグの方が有効であることを示す。逆に,画像あたりのタグ数が多ければ,オブジェクト関連情報も有用である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:09:02 GMT)
SummDiff: Generative Modeling of Video Summarization with Diffusion [17.8] ビデオ要約は、その重要な瞬間を保ちながら、フレームのサブセットを選択することで、ビデオを短くするタスクである。
先行研究は、複数のラッカーよりも平均的なフレームスコアに決定的に回帰し、良い要約を構成するものの本質的な主観性を無視している。
条件生成タスクとしてビデオ要約をフレーミングすることで,新しい問題定式化を提案する。
映像要約において初めて拡散モデルを採用することで,提案手法であるSummDiffは動的に視覚的文脈に適応し,入力ビデオに条件付き複数の候補要約を生成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:03:51 GMT)
Efficiency-Effectiveness Reranking FLOPs for LLM-based Rerankers [17.7] 大規模言語モデル(LLM)は,情報検索におけるタスクの再分類に応用され,高い性能を実現している。
既存の研究では、遅延、フォワードパス数、入力トークン、出力トークンなどのプロキシメトリクスを使用して、LCMベースのリランカの効率を評価する。
本稿では、PetaFLOP当たりのランキング品質(例えば、NDCGやMRR)と、PetaFLOP当たりのクエリ数(PetaFLOPあたりのクエリ数)を測るRCPを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:56:11 GMT)
Measuring directional bias amplification in image captions using predictability [17.6] MLデータセットのバイアス増幅を測定するために,DPAC(Directional Predictability Amplification in Captioning)を提案する。
DPACはキャプションの方向バイアス増幅を測定し、データセットバイアスをよりよく推定し、攻撃モデルに敏感でない。
COCOキャプションデータセットを用いた実験は, DPACがキャプションのバイアス増幅測定において最も信頼性の高い指標であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:35:02 GMT)
Making Bias Amplification in Balanced Datasets Directional and Interpretable [17.6] 我々は、方向予測可能性増幅(DPA)と呼ばれる新しい予測可能性に基づくメトリクスを提案する。
DPAは、バランスの取れたデータセットであっても、方向バイアス増幅を測定する。
実験の結果,DPAは指向性バイアス増幅の測定に有効な指標であることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:12:09 GMT)
COMPASS: Enhancing Agent Long-Horizon Reasoning with Evolving Context [17.6] 小さなエラーはステップにまたがって複雑で、最先端のモデルでさえしばしばコヒーレンスを幻覚または失う。
本稿では,戦術的実行,戦略的監視,文脈的組織を3つの特殊コンポーネントに分離する軽量階層型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:14:26 GMT)
STEPER: Step-wise Knowledge Distillation for Enhancing Reasoning Ability in Multi-Step Retrieval-Augmented Language Models [17.4] 多段階検索言語モデル(StepER)における推論能力向上のためのステップワイズ知識蒸留法を提案する。
StepERは、進化する情報とステージ間の推論要求に合わせるために、段階的に監督する。
難易度学習を取り入れ、適切なステップを優先順位付けすることで学習を段階的に最適化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:20:27 GMT)
Trajectory Conditioned Cross-embodiment Skill Transfer [17.4] TrajSkillは、Trajectory Conditioned Cross-Embodiment Skill Transferのフレームワークである。
トラジスキルは最先端技術と比較してFVDを39.6%、KVDを36.6%削減することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:26:06 GMT)
Fewer Weights, More Problems: A Practical Attack on LLM Pruning [17.3] 最新のLCMプルーニング手法を悪質に悪用できることを示す。
提案手法は,各パラメータがプルーニングされる確率を推定するプロキシメトリックを,敵が計算できるという考えに基づいている。
5つのモデルに対する広範囲な評価を通じて,攻撃の重大さを実証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:17:35 GMT)
DNA-DetectLLM: Unveiling AI-Generated Text via a DNA-Inspired Mutation-Repair Paradigm [17.3] 本稿では,AI生成テキストと人文テキストを区別するゼロショット検出手法であるDNA-DetectLLMを紹介する。
DNA-DetectLLMはAUROCで5.55%、F1スコアで2.08%の相対的な改善を実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:19:25 GMT)
Prompt-guided Representation Disentanglement for Action Recognition [17.0] ProDA(Prompt-Guided Disentangled Representation for Action Recognition)を提案する。
ProDAは、特定のアクションをマルチアクションシーンから切り離す。
動的重みを使って情報を集約するビデオ適応型グラフパーシングニューラルネットワーク(GPNN)を設計する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:42:40 GMT)
HyPINO: Multi-Physics Neural Operators via HyperPINNs and the Method of Manufactured Solutions [16.9] パラメトリックPDEの幅広いクラスにまたがるゼロショット一般化のために設計された多物理ニューラル演算子であるHyPINOについて述べる。
このモデルは、PDEパラメトリゼーションをターゲットとする物理情報ニューラルネットワーク(PINN)にマッピングし、線形楕円型、双曲型、放物型方程式を2次元で扱うことができる。
HyPINOは、PINNによる7つのベンチマーク問題、U-Net、文学、物理インフォームドニューラル演算子(PINO)よりも優れたゼロショット精度を実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:27:25 GMT)
Truth, Trust, and Trouble: Medical AI on the Edge [16.9] 我々は1000以上の健康問題データセットを用いたベンチマークフレームワークを提案する。
正直さ、便利さ、無害さのモデルパフォーマンスを評価します。
短いショットプロンプトは精度を78%から85%に改善し、すべてのモデルが複雑なクエリの利便性を低下させる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:17:59 GMT)
LLMs on a Budget? Say HOLA [16.9] エッジデバイス上での大規模言語モデル(LLM)の実行は、高い計算量とメモリ要求によって制限される。
我々は,効率的なLLMデプロイメントのためのエンドツーエンド最適化フレームワークであるHOLAを紹介する。
GSM8Kで17.6% EMA、ARCで10.5% MCA、Jetson Nanoのようなエッジデバイスでレイテンシとメモリを削減し、スケーラブルでプロダクション対応の両方を実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:27:57 GMT)
Who Stole Your Data? A Method for Detecting Unauthorized RAG Theft [16.8] 本稿では,RAGプラジャリズム検出に特化して設計された新しいデータセットであるRADを紹介する。
セマンティックレベルと語彙レベルの両方で保護を埋め込んだ二重層透かしシステムを開発した。
この研究は、検索強化AIシステムにおける知的財産権保護の基盤となる枠組みを確立する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:09:18 GMT)
To Ask or Not to Ask: Learning to Require Human Feedback [16.8] 機械学習モデルにエキスパートインプットをいつ、どのように組み込むかを扱う新しいフレームワークを提案する。
LtAは、標準的なMLモデルと、さらなる専門家のフィードバックでトレーニングされた強化モデルという、2部構成のアーキテクチャに基づいている。
LtAの実践的な実装として、ステージ内のモデルをトレーニングするシーケンシャルアプローチと、それらを同時に最適化するジョイントアプローチの2つを挙げる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:00:06 GMT)
Struc-EMB: The Potential of Structure-Aware Encoding in Language Embeddings [16.7] 本稿では,構造認識テキストの埋め込み生成のための新しいパラダイムを,体系的に導入し,評価する。
本稿では,逐次連結と並列キャッシングという2つのプロセス内手法について検討する。
並列キャッシングは、長い高信号のコンテキストに対してより効果的にスケールするが、気晴らしにはより敏感である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:45:54 GMT)
Humanoid Everyday: A Comprehensive Robotic Dataset for Open-World Humanoid Manipulation [16.7] Humanoid Everydayは大規模かつ多様なヒューマノイド操作データセットである。
RGB、deep、LiDAR、触覚入力を含む高品質なマルチモーダル感覚データを自然言語アノテーションとともに集約する。
我々は、データセット上で代表的政策学習手法の分析を行い、その強みと限界について洞察を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:43:27 GMT)
Watch your steps: Dormant Adversarial Behaviors that Activate upon LLM Finetuning [16.5] オープンウェイトなLarge Language Models (LLM) はタスク固有のパフォーマンス改善を実現するための標準的なプラクティスである。
これまで、微調整は、良質なデータセットのトレーニングが予測可能な振る舞いをもたらす、制御されたセキュアなプロセスとみなされてきた。
我々は、初めて、敵が不正なLLMを作成でき、性能が良く、良心的でありながら、下流のユーザーによって微調整された敵の行動を示すことを実証した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:23:19 GMT)
PiCo: Jailbreaking Multimodal Large Language Models via Pictorial Code Contextualization [16.2] 先進MLLMにおける多層防御機構をバイパスする新しいジェイルブレイクフレームワークであるPiCoを提案する。
コードスタイルの視覚命令に有害な意図を埋め込むことで、Gemini-Pro Visionでは84.13%、GPT-4では52.66%のアタック成功率(ASR)を達成した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:50:04 GMT)
Automatic Text Box Placement for Supporting Typographic Design [16.2] 本研究では,不完全レイアウトにおけるテキストボックスの自動配置について検討する。
標準的なTransformerベースの手法、小さなVision and Language Model(Phi3.5-vision)、大きな事前訓練されたVLM(Gemini)、複数の画像を処理する拡張Transformerを比較する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:38:21 GMT)
Scaling up Multi-Turn Off-Policy RL and Multi-Agent Tree Search for LLM Step-Provers [16.1] 本稿では,2つのスケーリング問題に対処するシステムである textttBFS-Prover-V2 を紹介する。
1つ目は、トレーニング時にLLMのステッププロデューサの性能を継続的に改善する、新しいマルチターンオフポリチフレームワークである。
第二のイノベーションは、推論時に推論能力を拡大するプランナーによるマルチエージェント検索アーキテクチャである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:45:50 GMT)
Which Heads Matter for Reasoning? RL-Guided KV Cache Compression [15.9] 推論可能な大きな言語モデルは、拡張されたチェーン・オブ・ソート・ジェネレーションを通じて複雑な推論の振る舞いを示す。
既存のKVキャッシュ圧縮手法は推論モデルでは性能が低い。
本稿では,新しい推論クリティカルな頭部識別フレームワークRLKVを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:00 GMT)
Efficient Prompt Optimisation for Legal Text Classification with Proxy Prompt Evaluator [15.9] 本稿では,モンテカルロ木探索(MCTS)とプロキシプロンプト評価器を組み合わせることで,より効果的にプロンプト空間を探索するフレームワークを提案する。
提案手法は,制約付き計算予算下でのベースライン法よりも高い分類精度と効率を実現することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:49:53 GMT)
Faver: Boosting LLM-based RTL Generation with Function Abstracted Verifiable Middleware [15.8] LLMベースのRTL生成は、チップ設計において最も自動化されていないステージを解放する可能性を秘めている。
高レベル仕様とRTLのセマンティックなギャップのため、既存のモデルは生成精度に苦しむ。
Faverはモデルの生成精度を最大14%向上させる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:41:43 GMT)
Safe-Control: A Safety Patch for Mitigating Unsafe Content in Text-to-Image Generation Models [15.7] 我々は,テキスト・ツー・イメージ(T2I)モデルにおいて,安全でないコンテンツ生成を緩和するために設計された,革新的なプラグ・アンド・プレイ安全パッチであるSafe-Controlを紹介する。
データ駆動戦略と安全を意識した条件を使用して、Safe-ControlはロックされたT2Iモデルに安全制御信号を注入し、パッチのような方法で更新する。
プラグ・アンド・プレイの設計により適応性も確保され、同様のデノナイジングアーキテクチャの他のT2Iモデルと互換性がある。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:02:05 GMT)
Counterfactual Identifiability via Dynamic Optimal Transport [15.6] 我々は、反事実は因果的主張を正当化するために識別可能でなければならないと論じている。
反実的推論に関する最近の研究は、有望な結果を示すが、識別に欠ける。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:45:13 GMT)
Interpreting GNN-based IDS Detections Using Provenance Graph Structural Features [15.5] グラフネットワーク(GNN)ベースのセキュリティソリューションは、セキュリティクリティカルなタスクのためにシステムグラフをダイジェストする。
本稿では、PROVEXPLAINERが現在の最先端(SOTA)GNN説明器と相乗してドメインとインスタンス固有の説明を提供する方法を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:50:09 GMT)
Topological Mixed States: Phases of Matter from Axiomatic Approaches [15.4] 閉量子系において、位相的順序は、ギャップ付き局所ハミルトニアンの基底状態の同値類を通して理解される。
ここでは、局所的回復可能性(i$)、長距離相関の欠如(ii$)、空間的均一性(iii$)という3つの公理に基づくアプローチを提案することにより、このギャップを埋める。
これらの公理から、トポロジカルデータの豊富な集合が自然に出現し、重要なことは、これらのデータは公理の緩和の下で堅牢である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:29:46 GMT)
Defending MoE LLMs against Harmful Fine-Tuning via Safety Routing Alignment [15.4] 大規模言語モデル(LLM)に適した安全な微調整法であるSafeMoEを提案する。
SafeMoEは、微調整モデルのルーティングウェイトと初期安全整合モデルのルーティングウェイトとのギャップを埋めることによって、ルーティングドリフトを直接緩和する。
実験の結果、SafeMoEはHFT攻撃を効果的に軽減し、OLMoEの有害度スコアを62.0から5.0に下げた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:00:18 GMT)
SimCast: Enhancing Precipitation Nowcasting with Short-to-Long Term Knowledge Distillation [15.2] 正確な放送は、災害管理、農業、輸送、エネルギー最適化など、様々な社会的ニーズに対処する上で最も重要である。
我々は,短時間から長期の知識蒸留技術と重み付きMSE損失を併用し,豪雨地域を優先する新たな訓練パイプラインであるSimCastを提案する。
SimCastは、決定論的予測を生成するため、さらに拡散に基づくフレームワークCasCastに統合し、確率モデルからの強みを活用して、決定論的出力の曖昧さや分布シフトといった制限を克服する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:49:16 GMT)
Language Model Embeddings Can Be Sufficient for Bayesian Optimization [15.1] 入力を文字列として表現することで、様々な領域にまたがる汎用レグレッションが実現できることを示す。
提案手法は,Google Vizierのような最先端のガウスプロセスベースの手法に匹敵する最適化性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:20:18 GMT)
Exploring Cross-Client Memorization of Training Data in Large Language Models for Federated Learning [14.9] フェデレートラーニング(FL)は、生のデータ共有なしに協調的なトレーニングを可能にするが、それでもデータの記憶をトレーニングするリスクがある。
本研究では,細粒度クロスサンプル計測を用いて,FLにおけるクライアント内およびクライアント間記憶を定量化するフレームワークを提案する。
FLモデルでは,クライアントデータ,特にクライアント内データ,特にクライアント間データよりも,トレーニングや推論要因の影響を受けやすいことが判明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:07:48 GMT)
HIVTP: A Training-Free Method to Improve VLMs Efficiency via Hierarchical Visual Token Pruning Using Middle-Layer-Based Importance Score [14.9] HIVTPは、VLM(Vision-Language Models)推論効率を改善するためのトレーニング不要の手法である。
本稿では,グローバルかつ局所的に重要な視覚トークンを保持するための階層的視覚トークンプルーニング手法を提案する。
HIVTPは, LLaVA-v1.5-7BとLLaVA-Next-7BのTTFTを最大50.0%, 55.1%削減できることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:02:35 GMT)
Long Chain-of-Thought Reasoning Across Languages [14.8] モデル開発の4つの重要な段階として,スケーリング,事前学習,ポストトレーニング,推論について検討する。
スケーリング推論モデルのサイズはEn-CoTの多言語タスク性能を改善するが、Target-CoTのパフォーマンスは遅れている。
英語以外の言語で高品質な推論トレースが不足していることを踏まえ,ポストトレーニングのための合成データキュレーション手法について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:36:20 GMT)
Q-Router: Agentic Video Quality Assessment with Expert Model Routing and Artifact Localization [14.8] ビデオアセスメント(VQA)は、人間の判断に沿った映像の品質を予測することを目的としている。
マルチ層ルーティングモデルシステムを用いた汎用VQAのためのエージェントフレームワークQ-C-Benchを提案する。
Q-C-ベンチは、様々なベンチマークで最先端のVQAモデルと一致または超え、一般化と解釈性を大幅に改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:11:38 GMT)
SatFusion: A Unified Framework for Enhancing Satellite IoT Images via Multi-Temporal and Multi-Source Data Fusion [14.6] サテライト・インターネット・オブ・モノ(Sat-IoT)における衛星の拡散は、大規模なマルチテンポラリ画像とマルチソース画像の連続的な蓄積につながった。
既存の手法では、時間次元とソース次元の両方に埋め込まれた補完的な情報を十分に活用できない。
サットフュージョン: マルチテンポラル・マルチソースデータフュージョンによる衛星IoT画像の統一フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:59:37 GMT)
Foundation Models for Structural Health Monitoring [14.4] 本稿では,トランスフォーマーニューラルネットワークをMasked Auto-Encoderアーキテクチャを用いて,構造的健康モニタリングのための基礎モデルとして初めて利用することを提案する。
自己教師付き事前学習を通じて、複数の大規模データセットから一般化可能な表現を学習する能力を実証する。
本研究は,3つの運用用インダクトのデータを用いた基礎モデルの有効性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:02:05 GMT)
How Reliable is Language Model Micro-Benchmarking? [14.4] 本研究では,マイクロベンチマークにおいて,性能差の関数として,マイクロベンチマークが2つのモデルにどの程度の精度でランク付けできるかを検討する。
MMLU-Proでは3.5点、BIG-bench Hardでは4点の精度でモデルペアを常にランク付けすることはできない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:37:03 GMT)
More Bang for the Buck: Process Reward Modeling with Entropy-Driven Uncertainty [14.4] 本稿では,プロセス報酬モデリングのための新しいエントロピー駆動トレーニングフレームワークであるEDU-PRMを紹介する。
複雑な推論ステップの動的で不確実性に整合したセグメンテーションを可能にし、コストのかかる手動のステップアノテーションを不要にする。
ProcessBenchベンチマークでは、EDU-PRMは公開PRMベースラインよりも優れています。
提案したEDUサンプリング戦略を利用して,生成的推論タスクの精度を64.7%から67.3%に向上させ,トークン使用率を32%削減した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:37:01 GMT)
The Boundaries of Fair AI in Medical Image Prognosis: A Causal Perspective [14.4] 医用画像における時間-時間予測の公平性を評価するための,初の総合的なフレームワークであるFairTTEを紹介する。
FairTTEは、医療画像データセットに埋め込まれた独自のバイアス源を発見し、定量化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:54:48 GMT)
LTCA: Long-range Temporal Context Attention for Referring Video Object Segmentation [14.3] 本研究では,グローバルな文脈情報をオブジェクトの特徴に集約する,効果的な長期時間的コンテキストアテンション(LTCA)機構を提案する。
提案手法は,4つの参照ビデオセグメンテーションベンチマークにおいて,新しい最先端技術を実現することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:55:52 GMT)
GeoGen: A Two-stage Coarse-to-Fine Framework for Fine-grained Synthetic Location-based Social Network Trajectory Generation [14.2] 大規模LBSNチェックイン軌道生成のための2段階粗粒化フレームワークを提案する。
第1段階では,従来のLBSNチェックイン軌道から空間的連続的,時間的正則な潜伏運動列を再構成する。
第2段階では、エンコーダの動的コンテキスト融合機構とマルチタスクハイブリッドヘッドデコーダを備えたトランスフォーマーベースのSeq2SeqアーキテクチャであるCoarse2FineNetを設計する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:15:24 GMT)
Feedback Guidance of Diffusion Models [14.2] Interval-Free Guidance (CFG) は, 条件付き拡散モデルにおける試料の忠実度向上の標準となっている。
本稿では,FBG(FeedBack Guidance)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:57:40 GMT)
SPAD: Specialized Prefill and Decode Hardware for Disaggregated LLM Inference [14.1] 大規模言語モデル(LLM)は近年人気を集めており、推論の需要が高まっている。
LLMの推論は、計算バウンドプリフィルフェーズとメモリバウンドデコードフェーズという、2つの異なる特徴を持つフェーズで構成されている。
本稿では,プリフィルおよびデコード位相の異なる特性に合わせた専用チップを設計するためのSPAD(Specialized Prefill and Decode hardware)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:55:08 GMT)
From Federated Learning to X-Learning: Breaking the Barriers of Decentrality Through Random Walks [14.1] X-Learning(XL)は分散学習アーキテクチャであり、分散化の概念を一般化し拡張する。
我々は、XL、グラフ理論、マルコフ連鎖の間の直感的かつ非自明な関係に光を当てた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:10:54 GMT)
FreqCa: Accelerating Diffusion Models via Frequency-Aware Caching [14.0] 拡散モデルの特徴の異なる周波数帯域は、時間経過によって異なるダイナミクスを示すことを示す。
本稿では、周波数対応キャッシング(FreqCa)を提案し、その類似性に基づいて低周波成分の特徴を直接再利用する。
また、すべてのレイヤの機能の代わりにCRF(Cumulative Residual Feature)をキャッシュすることを提案し、この機能キャッシングのメモリフットプリントを99%削減する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:22:23 GMT)
From Correction to Mastery: Reinforced Distillation of Large Language Model Agents [14.0] 大規模言語モデルエージェントは反復的推論とツールの使用を通じて複雑なタスクの解決に長けている。
既存の蒸留手法は、小規模の生徒に完全な教師の軌跡を模倣するように訓練する。
本研究では,教師が最初期の誤りのみを訂正する学習者中心のフレームワークであるSCoReを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:22:47 GMT)
Game of Trust: How Trustworthy Does Your Blockchain Think You Are? [13.9] ブロックチェーンは、ノードの(サブ)セットの信頼性に関するノードの集合的信念を、タスクを正しく実行する確率を反映した評価システムに蒸留する方法について検討する。
我々は,合理的参加者の行動から信頼に関する集団的信念を抽出することを目的とした,信頼に値する評価ゲーム(TREPゲーム)と呼ばれる新しい種類のゲームを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:50:19 GMT)
NovaFlow: Zero-Shot Manipulation via Actionable Flow from Generated Videos [13.8] NovaFlowは、タスク記述をターゲットロボットの実行可能な計画に変換する、自律的な操作フレームワークである。
我々は,テーブルトップのフランカアームとスポット四足歩行ロボットを用いて,剛性,調音性,変形可能な物体操作タスクを検証した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:55 GMT)
SU(d)-Symmetric Random Unitaries: Quantum Scrambling, Error Correction, and Machine Learning [13.8] SU(d)対称性の存在下では、局所保存量は、$t rightarrow infty$ であっても残留値を示す。
我々は、SU(d)対称ユニタリを用いて、任意の論理キューディット数を符号化する神経学的最適符号を構築することができることを示す。
量子機械学習における一般アンサッツの指数収束保証に必要な量子タンジェントカーネルによるオーバーパーティショニング閾値を導出する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:24:17 GMT)
Hyperspectral data augmentation with transformer-based diffusion models [13.8] 本稿では,誘導拡散モデルを利用したデータ拡張手法を提案する。
本手法が森林分類タスクにおける10種類の森林タイプに対する有効性を評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:50:29 GMT)
The Price of Thought: A Multilingual Analysis of Reasoning, Performance, and Cost of Negotiation in Large Language Models [13.8] 交渉は、戦略的に判断し、対立者をモデル化し、競争との協力のバランスを取る能力を必要とするため、AIエージェントにとって根本的な課題である。
商業LLMとオープンウェイトLLMの交渉能力に対する(LLM-)推論の効果を体系的に評価した最初の総合的研究を行った。
3つの多様な対話ゲームにまたがるセルフプレイ設定を用いて、性能とコストのトレードオフ、推論プロセスの言語一貫性、そしてモデルが提示する戦略的適応の性質を分析する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:36:38 GMT)
Computationally-efficient Graph Modeling with Refined Graph Random Features [13.7] 本稿では,グラフランダム特徴量(GRF)の新しいクラスを提案する。
GRFs++は、通常のGRFの長年の制限を解決している。
これにより、新しいウォークスティッチ技術により、長いグラフのランダムウォークのサンプリングへの依存を減らすことができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:53:26 GMT)
(Token-Level) InfoRMIA: Stronger Membership Inference and Memorization Assessment for LLMs [13.6] 大規模言語モデル(LLM)は、ほぼすべての利用可能なデータに基づいてトレーニングされている。
プライバシを定量化する標準的な方法は、メンバシップ推論攻撃である。
本稿では、会員推論の原理的情報理論の定式化であるInfoRMIAを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:03:33 GMT)
Interleaved Learning and Exploration: A Self-Adaptive Fuzz Testing Framework for MLIR [13.4] 本稿では,MLIRのための自己適応型ファジィフレームワークであるFLEXを紹介する。
FLEXは、プログラム生成のためのニューラルネットワーク、多様性を促進するサンプリング戦略、フィードバック駆動の拡張ループを摂動させた。
上流MLIRコンパイラ上でのFLEXを4つの最先端ファジィに対して評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:47:20 GMT)
Phantora: Maximizing Code Reuse in Simulation-based Machine Learning System Performance Estimation [13.3] Phantoraは、機械学習トレーニングワークロードのパフォーマンス見積のための、ハイブリッドGPUクラスタシミュレータである。
MLフレームワークのソースコードをシミュレーションで直接再利用することが可能で、再実装の必要がなくなる。
Phantoraは最先端のトレーニングフレームワークを3つサポートしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:58:43 GMT)
Efficient and Adaptable Overlapping for Computation and Communication via Signaling and Reordering [13.2] 生成モデルは様々なアプリケーションで顕著な成功を収め、マルチGPUコンピューティングへの需要が高まっている。
本稿では,新しいシグナリング機構を用いたFlashOverlapを提案する。
実験の結果、FlashOverlapはオーバーラップによって最大1.65倍のスピードアップを実現しており、ほとんどの場合、既存の作業よりも優れています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:47:25 GMT)
Interpreting LLM-as-a-Judge Policies via Verifiable Global Explanations [13.0] LLM-as-a-Judgeから高レベルな概念に基づくグローバルポリシーを抽出する手法を提案する。
抽出した国際政策は, LLM-as-a-Judgeの決定に極めて忠実であることがわかった。
我々はまた、テキストの摂動と敵攻撃に対するグローバルポリシーの堅牢性を評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:05:37 GMT)
MARC: Memory-Augmented RL Token Compression for Efficient Video Understanding [13.0] 構造的検索とRLに基づく蒸留を統合したMARCを提案する。
MARCは1フレームのトークンのみを使用してほぼベースラインの精度を達成する。
これにより、リソース制約のある環境での効率的なリアルタイムビデオ理解の可能性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:07:19 GMT)
Reinforcement Learning-Based Optimization of CT Acquisition and Reconstruction Parameters Through Virtual Imaging Trials [12.9] プロトコル最適化はCTにおいて放射線線量を最小限に抑えつつ高い画像品質を実現するために重要である。
本研究では,より効率的にCTプロトコルを最適化するために,仮想画像ツールと強化学習を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:30:41 GMT)
TASP: Topology-aware Sequence Parallelism [12.9] Long-context Large Language Model (LLM) は自己認識機構の2次複雑さのために制約に直面している。
Ring Attentionは、クエリをアクセラレータにまたがる複数のクエリチャンクに分散することで、この問題を解決する。
通信効率が低く、実用性が制限されている。
長文LLMのためのトポロジ対応SP法であるTASPを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:03:29 GMT)
FlowNIB: An Information Bottleneck Analysis of Bidirectional vs. Unidirectional Language Models [12.7] 双方向言語モデルは、自然言語理解タスクにおける一方向モデルよりもコンテキスト理解が優れ、パフォーマンスがよい。
トレーニング中の相互情報を動的かつスケーラブルに推定するFlowNIBを提案する。
両方向モデルが相互情報をより多く保持し,一方向モデルよりも高次元性を示すことを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:09:40 GMT)
DACIP-RC: Domain Adaptive Continual Instruction Pre-Training via Reading Comprehension on Business Conversations [12.7] 本稿では,DACIP-RC(Domain Adaptive Continual Instruction Pre-Training)を提案する。
次世代の予測に依存する従来の事前学習アプローチとは異なり、DACIP-RCは会話書き起こしの読解を通じて多様なタスク命令と応答を生成する。
実験により,DACIP-RCは広範囲のビジネス会話タスクにおいて,ゼロショットの一般化を著しく改善することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:35:20 GMT)
Depression Detection on Social Media with Large Language Models [12.7] ソーシャルメディアプラットフォームは、早期うつ病の診断に有用なデータソースを提供する。
大規模言語モデル(LLM)を利用したフレームワークであるDORISを提案する。
医療知識を統合するため、DORISはLSMを使用して、確立された診断基準に対してユーザテキストに注釈を付ける。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:02:37 GMT)
GTR-Bench: Evaluating Geo-Temporal Reasoning in Vision-Language Models [12.6] GTR-Bench(Geo-Temporal Reasoning benchmark)は、大規模カメラネットワークにおける移動対象の地理的時間的推論のための新しい課題である。
GTR-Bench上で10以上の人気のあるVisual-Language Model (VLM)の評価は、最高のプロプライエタリモデルであるGemini-2.5-Proでさえ、時空間推論において人間のパフォーマンス(78.61%)よりもかなり遅れていることを示している。
GTR-Benchは貴重な洞察を提供し、空間的時間的知性の研究と応用の新たな機会を開く。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:09:27 GMT)
Scalable Offline Metrics for Autonomous Driving [12.6] ロボットシステムの知覚に基づく計画モデルの実世界評価は、安全かつ安価にオフラインで行うことができる。
しかし、オフラインモデルのパフォーマンスからオンライン設定への外挿は依然として課題である。
これらの設定では、一見小さなエラーが複雑になり、テスト時間違反や衝突を引き起こします。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:57 GMT)
Verifying Graph Neural Networks with Readout is Intractable [12.5] グローバルリードアウト(ACR-GNN)を用いた量子化集約-組合せグラフニューラルネットワークの論理言語を導入する。
我々は、読み出しを伴う量子化GNNの検証タスクが(co)NEXPTIME完全であることを証明した。
また, 量子化ACR-GNNモデルは, 非量子化モデルに対して高い精度と一般化能力を維持しつつ, 軽量であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:29:09 GMT)
FOLK: Fast Open-Vocabulary 3D Instance Segmentation via Label-guided Knowledge Distillation [12.5] Open-vocabulary 3Dのインスタンスセグメンテーションは、ラベル空間を超えてインスタンスをセグメンテーションし分類しようとする。
ラベル誘導型知識蒸留(FOLK)による高速開語彙3次元インスタンス分割法を提案する。
私たちの中心となる考え方は、高品質なインスタンス埋め込みを抽出し、オープン語彙の知識を3D学生モデルに抽出する教師モデルを設計することである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:43:26 GMT)
RFOD: Random Forest-based Outlier Detection for Tabular Data [12.5] 外乱検出は、サイバーセキュリティ、金融詐欺検出、医療といった高度な領域におけるデータの整合性を保護するために不可欠である。
textsfRFODは特徴的条件付き再構成問題として異常検出をリフレームする。
textsfRFODは、検出精度において最先端のベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:02:12 GMT)
Is Supervised Learning Really That Different from Unsupervised? [12.4] 教師あり学習を2段階の手順に分解する方法を実証する。
線形およびカーネルリッジの回帰、スムーズなスプライン、ニューラルネットワークは、yにアクセスせずにトレーニングされ、標準のyベースと同等に動作することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:52:05 GMT)
MAMBO: High-Resolution Generative Approach for Mammography Images [12.3] 本報告では,MAMmography ensemBle mOdel (MAMBO)について述べる。
この設計により、MAMBOは最大3840×3840ピクセルの非常にリアルなマンモグラムを生成することができる。
数値および放射線学の検証を含む実験は、画像生成、超解像度、異常セグメンテーションにおけるMAMBOの能力を評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:27:44 GMT)
A class-driven hierarchical ResNet for classification of multispectral remote sensing images [12.3] 本稿では,異なる意味クラスレベルでのマルチスペクトル画像の時系列(TS)分類をモデル化するために,クラス駆動型階層型残留ニューラルネットワーク(ResNet)を提案する。
我々は、階層的なペナルティマップを利用して、分類の非一貫性な階層的遷移を阻止する。
センチネル2号画像の月12回の合成でアマゾン林の2つのタイルから得られた実験結果から,階層的アプローチの有効性が示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:47:52 GMT)
FedLAM: Low-latency Wireless Federated Learning via Layer-wise Adaptive Modulation [12.2] 無線連合学習(FL)では、クライアントは帯域幅制限チャネルを介して高次元ディープニューラルネットワーク(DNN)パラメータを送信する必要がある。
通信遅延を抑えるため,レイヤワイド適応変調方式を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:07:30 GMT)
BEACON: Bayesian Optimal Stopping for Efficient LLM Sampling [12.1] 本稿では,ベイズ学習を用いた逐次探索に基づく適応型サンプリングフレームワークBEACONを紹介する。
BEACONは応答品質を維持しつつ,平均サンプリングを最大80%削減することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:26:25 GMT)
MemWeaver: A Hierarchical Memory from Textual Interactive Behaviors for Personalized Generation [12.1] 本稿では,ユーザのテキスト履歴全体を階層記憶に織り込み,パーソナライズされた生成を行うフレームワークを提案する。
MemWeaverは、時間情報と意味情報を統合した2つの補完的なメモリコンポーネントを構築している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:47:21 GMT)
Self-Training with Dynamic Weighting for Robust Gradual Domain Adaptation [12.0] 動的重み付き自己学習法(STDW)を提案する。
STDWは、GDA(Gradual Domain Adaptation)における堅牢性向上を目指す
本手法では,トレーニング中のソースとターゲットドメインの損失寄与を適応的にバランスする動的重み付け機構を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:56:48 GMT)
Rotated Mean-Field Variational Inference and Iterative Gaussianization [12.0] 回転座標系における平均場変動推定(MFVI)を提案する。
回転座標系におけるMFVIは、目標をガウスに近づける回転と座標写像を定義する。
この手順を反復すると、目標をガウスへ徐々に変換する一連の変換が得られる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:13:44 GMT)
ConPoSe: LLM-Guided Contact Point Selection for Scalable Cooperative Object Pushing [11.9] 協調的な物体輸送では、複数のロボットが協調して、1つのロボットには大きすぎる物体を動かす必要がある。
本稿では,大規模言語モデルの推論能力と局所探索を組み合わせ,適切な接触点を選択することを提案する。
接触点選択のためのLLM誘導局所探索手法であるConPoSeは,様々な形状の接触点の選択に成功している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:07:39 GMT)
Don't Run with Scissors: Pruning Breaks VLA Models but They Can Be Recovered [11.9] VLA(Vision-Language-Action)モデルには高度なロボット機能があるが、リソース限定のハードウェアへの展開は困難である。
GLUESTICKは,初期モデルの機能の多くを復元し,スパーシティの利点を保ちながら回収する手法である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:07:30 GMT)
GraphEnet: Event-driven Human Pose Estimation with a Graph Neural Network [11.8] 本稿では,グラフニューラルネットワーク,GraphEnetを提案し,一人の人物の2次元人文を高頻度で推定する。
このアーキテクチャには、人間のポーズを推定するための信頼に基づくプールを備えた、新しいオフセットベクトル学習パラダイムが組み込まれている。
これは、ヒューマンポーズ推定のためのイベントデータにグラフニューラルネットワークを適用する最初の作業である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:24:48 GMT)
Synergy Between the Strong and the Weak: Spiking Neural Networks are Inherently Self-Distillers [11.8] 脳にインスパイアされたスパイクニューラルネットワーク(SNN)は、計算集約型人工ニューラルネットワーク(ANN)の低消費電力代替となることを約束する
近年の研究では、知識蒸留によりSNNの性能が向上しているが、大きな教師モデルに依存したり、追加の訓練オーバーヘッドを導入したりしている。
SNNは自然に複数のサブモデルに分解して効率よく自己蒸留できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:21:46 GMT)
MoM: Linear Sequence Modeling with Mixture-of-Memories [11.7] 我々はMixture-of-Memories (MoM)と呼ばれる新しいアーキテクチャを導入する。
MoMは複数の独立したメモリ状態を利用し、ルータネットワークは入力トークンを特定のメモリ状態に誘導する。
MoMは、既存の線形シーケンスモデリング技術を超え、リコール集約タスクにおいて非常によく機能する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:38:50 GMT)
Towards Human-Like Grading: A Unified LLM-Enhanced Framework for Subjective Question Evaluation [11.7] 本稿では,全ての主観的質問に対して人間ライクな評価を提供する,LLM(Large Language Model)拡張自動階調フレームワークを提案する。
本フレームワークは,4つの相補的なモジュールを統合し,学生の回答を総合的に評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:05:39 GMT)
AILoRA: Function-Aware Asymmetric Initialization for Low-Rank Adaptation of Large Language Models [11.7] Low-Rank Adaptation (LoRA)は最も広く採用されているアプローチの1つだ。
LoRAは通常、自己アテンションモジュールの$WQ$と$WV$プロジェクション行列に適用される。
関数認識型非対称な低ランクプリエントを組み込んだ新しいパラメータ効率手法であるtextAILoRA を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:13:16 GMT)
AI Knowledge Assist: An Automated Approach for the Creation of Knowledge Bases for Conversational AI Agents [11.6] 企業固有の知識基盤は、コンタクトセンターで会話型AIシステムを統合する上で、大きな障壁となる。
質問応答(QA)ペアの形式で知識を抽出するシステムであるAI Knowledge Assistを導入し,知識ベースを自動的に構築する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:34:31 GMT)
Emergent continuous symmetry and ground-state factorization induced by long-range interactions [11.5] 破壊対称性の位相における低層励起が連続対称性を得る理論を提案する。
創発的連続対称性と保存則の顕著な結果は、基底状態における量子相関をゼロに制限することである。
我々の発見は、完全連結系と格子一般化における量子相転移の普遍的な特徴である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:13:53 GMT)
A Unified Approach to Quantum Key Leasing with a Classical Lessor [11.4] 本稿では,古典的レスラーを用いたセキュアな鍵リースを構築するためのモジュラーフレームワークを提案する。
我々は、公開鍵暗号(PKE)、擬似乱数関数(PRF)、デジタル署名のための古典的かつ安全な鍵リース方式を得る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:09:34 GMT)
FedDTRE: Federated Dialogue Generation Models Powered by Trustworthiness Evaluation [11.3] 我々は,信頼度評価に基づく対話生成のためのフェデレーション適応アグリゲーション戦略であるFedDTREを提案する。
我々は,FedDTREが対話モデルの性能を改善し,対話生成の質を向上させることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:43:14 GMT)
Robust and Efficient Collaborative Learning [11.3] 協調的機械学習は、訓練時間の敵対行動によって挑戦される。
本稿では,ロバストプルに基づくエピデミック・ラーニング(RPEL)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:57:29 GMT)
Thinking Longer, Not Always Smarter: Evaluating LLM Capabilities in Hierarchical Legal Reasoning [11.3] 本稿では,ケース間の重要な区別を3段階の推論タスクに分解する枠組みを提案する。
我々のフレームワークは、要因と呼ばれる事実的述語を使用してケースをモデル化し、それらを法的知識階層に整理し、区別を識別するための検証可能なルールを定義します。
我々は、モデルが正しい応答よりも間違った応答について、常に多くの計算資源を消費していることを発見し、「より長く考えることは、必ずしも「より賢く考える」という意味ではないことを示唆している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:15:28 GMT)
The Poisson Midpoint Method for Langevin Dynamics: Provably Efficient Discretization for Diffusion Models [11.2] ランゲヴィン・モンテカルロ(Langevin Monte Carlo、LMC)は、最も単純かつ最も研究されたアルゴリズムである。
本稿では, ステップサイズが大きい小型LCCを近似したPoisson Midpoint Methodを提案する。
DDPMは,わずか50~80のニューラルネットワークコールで1000件のニューラルネットワークコールで品質を維持し,同様の計算でODEベースの手法より優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:13:57 GMT)
Automating Android Build Repair: Bridging the Reasoning-Execution Gap in LLM Agents with Domain-Specific Tools [11.2] 43のオープンソースプロジェクトのコミット履歴から算出した1,019のビルド失敗のベンチマークであるAndroidBuildBenchを紹介した。
それぞれの問題は、その後のコミットから検証されたソリューションとペアになって、修正が可能であることを保証する。
汎用シェルコマンドをドメイン認識抽象化に置き換える,ツールブリッジ(Tool Bridging)という戦略の有効性を実証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:33:25 GMT)
Causality Guided Representation Learning for Cross-Style Hate Speech Detection [11.0] オンラインヘイトスピーチの普及は、ウェブの調和に重大な脅威をもたらす。
既存のヘイトスピーチ検出モデルは、様々なスタイルのバリエーションで効果的に一般化できない。
本稿では,ヘイトスピーチを解釈可能な潜在要因に分解する因果表現学習フレームワークCADETを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:41:37 GMT)
FinMR: A Knowledge-Intensive Multimodal Benchmark for Advanced Financial Reasoning [11.0] FinMRは専門アナリストの基準で専門家レベルの財務推論能力を評価するために設計された知識集約型マルチモーダルデータセットである。
これは15の金融分野において、3,200以上の厳格にキュレートされ、専門的に注釈付けされた質問応答ペアで構成されている。
FinMRは、専門的なアナリストレベルの能力に向け、マルチモーダルな財務推論を評価し、前進させるための重要なベンチマークツールとして、自らを確立している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:49:55 GMT)
Mining the Mind: What 100M Beliefs Reveal About Frontier LLM Knowledge [11.0] 我々は,GPTKB v1.5に基づいて,フロンティアLEMの事実的知識(あるいは信念)を深く探究する。
モデルの事実的知識は,確立された知識ベースとは大きく異なり,その精度は従来のベンチマークよりも著しく低いことがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:23:03 GMT)
Where Have All the Kaczmarz Iterates Gone? [10.9] ランダム化 Kaczmarz (RK) アルゴリズムは、大規模線形系を解くための最も計算的かつメモリ効率のよい反復アルゴリズムの1つである。
本稿では, 雑音や不整合を解く際のRKの挙動を考察し, 限界点の位置に対処する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:36 GMT)
Search-based Hyperparameter Tuning for Python Unit Test Generation [10.9] 差分進化は, 試験アルゴリズムのチューニングにおいて, 基本的なグリッド探索よりも効率的であることを示す。
この結果から,DynaMOSAアルゴリズムにより,テストスイートのカバレッジを大幅に改善できることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:22:07 GMT)
Agent Bain vs. Agent McKinsey: A New Text-to-SQL Benchmark for the Business Domain [10.9] 我々は、現実世界のビジネスコンテキストに特化して設計された新しいベンチマークであるCORGIを紹介する。
ビジネスクエリの4つのカテゴリ – 説明性,説明性,予測性,レコメンデーション – に関する質問を提供する。
CORGIのパフォーマンスは高いレベルの質問で低下し,正確な予測と実行可能な計画の提供に苦慮していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:27:56 GMT)
Beyond Over-Refusal: Scenario-Based Diagnostics and Post-Hoc Mitigation for Exaggerated Refusals in LLMs [10.9] 大きな言語モデル(LLM)は、しばしば偽の拒絶を発生させ、安全でないクエリに似た用語を含む良質な要求を減少させる。
単一ターンプロンプトに対するXSB(Exaggerated Safety Benchmark)、リファイン誘導トリガを識別する"Focus"キーワードのアノテーション、マルチターンシナリオベースのExaggerated Safety Benchmark(MS-XSB)の2つの総合ベンチマークを紹介した。
ベンチマークの結果,近年の多種多様なLCMにおいて過大な拒絶が持続し,特に複雑なマルチターンシナリオで顕著であることが判明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:38:16 GMT)
Distribution Transformers: Fast Approximate Bayesian Inference With On-The-Fly Prior Adaptation [10.8] 本稿では,任意の分布-分布マッピングを学習可能な新しいアーキテクチャである分散トランスフォーマーを紹介する。
提案手法は,あるデータセットに条件付きで,対応する後部への事前のマッピングを訓練することができる。
我々は、配電変換器が事前の変動に柔軟性を保ち、時間帯を数分からミリ秒に短縮できることを実証した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:56:02 GMT)
One Stone with Two Birds: A Null-Text-Null Frequency-Aware Diffusion Models for Text-Guided Image Inpainting [10.8] テキスト誘導画像のインペイントは、テキストプロンプトに従ってマスクされた領域を再構築することを目的としている。
我々は、テキスト誘導画像のインペイントのための、textbfNTN-Diffと呼ばれるNull-text-null周波数対応拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:30:34 GMT)
Revisiting Hallucination Detection with Effective Rank-based Uncertainty [10.8] 隠れ状態の有効ランクを測定することによって不確実性を定量化する,単純かつ強力な手法を提案する。
表現のスペクトル解析に基づいて,本手法はモデルの内部推論過程の解釈可能な洞察を与える。
本手法は,幻覚を効果的に検出し,様々なシナリオで頑健に一般化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:12:12 GMT)
Partition Generative Modeling: Masked Modeling Without Masks [10.8] マスケ生成モデル(MGM)は、複雑なデータをキャプチャし、自己回帰モデル(AR)よりも高速な生成を可能にするために広く利用されている。
本稿では,ARとMGMの強みを組み合わせた新しいアプローチである分割生成モデル(PGM)を紹介する。
OpenWebTextでは、PGMはサンプリングレイテンシとスループットを少なくとも5倍改善し、ジェネレーティブ・パープレクティビティ(Generative Perplexity)の優れたサンプルを生成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:59:57 GMT)
Queries Are Not Alone: Clustering Text Embeddings for Video Search [10.7] 本稿では,テキストクエリをクラスタリングしてより広いセマンティックスコープをキャプチャすることで,ビデオ検索を強化する新しいフレームワークであるVideo-Text Cluster(VTC)を紹介する。
本稿では,関連するクエリをグループ化するユニークなクラスタリング機構を提案し,各クエリの複数の解釈とニュアンスについて検討する。
また、ビデオコンテンツに基づいてクラスタを調整するVTC-Attention(VTC-Atttention)を導入し、検索プロセスが最も関連性の高いテキスト機能を強調することを保証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:56:18 GMT)
AutoAgent: A Fully-Automated and Zero-Code Framework for LLM Agents [10.7] 大規模言語モデル (LLM) エージェントはタスクの自動化とインテリジェントな意思決定において顕著な能力を示した。
これらのフレームワークは、主に開発者に対して広範な技術的専門知識を提供する。
世界の人口の0.03%のみが必要なプログラミングスキルを持っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:27:04 GMT)
PO-CKAN:Physics Informed Deep Operator Kolmogorov Arnold Networks with Chunk Rational Structure [10.6] PO-CKANは偏微分方程式を近似する物理インフォームド・ディープ・オペレーター・フレームワークである。
Chunkwise Rational Kolmogorov-Arnold-Arnold Networks (KAN) をベースとしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:18:24 GMT)
Three-dimensional optical characterization of magnetostrictive deformation in magnomechanical systems [10.6] YIG球面は、マグノメカニカルに誘導される透明性、動的バックアクション、リッチ非線形効果を研究するのに理想的な系であることが証明されている。
本稿では,YIG球の磁歪変形を3次元(3Ds)で高精度に検出する光学的手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:37:32 GMT)
An LLM-Powered Cooperative Framework for Large-Scale Multi-Vehicle Navigation [10.5] マルチサイクルダイナミックナビゲーションは、進化する交通条件の下で大きな船隊を同時にルーティングする必要がある。
既存の経路探索アルゴリズムと強化学習手法は、都市全体のネットワークにスケールするのに苦労する。
大規模多車両ナビゲーションのための階層型LLMフレームワークであるCityNavを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:14:29 GMT)
ZeroCard: Cardinality Estimation with Zero Dependence on Target Databases -- No Data, No Query, No Retraining [10.4] ZeroCardはセマンティクス駆動の濃度推定手法で、生のデータアクセスやクエリログ、ターゲットデータベースの再トレーニングに依存せずに適用できる。
我々は、実世界のテーブルから派生した大規模クエリデータセットを構築し、ZeroCardを事前訓練することで、スキーマのセマンティクスや述語表現から濃度を学習することができる。
事前トレーニング後、ZeroCardのパラメータは、既製の方法で凍結して適用することができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:16:01 GMT)
Maintaining Performance with Less Data [10.4] 本稿では,画像分類のためのニューラルネットワークのトレーニング手法を提案する。
ランタイムを最大50%削減し, 炭素排出量を比例的に削減しながら, 精度を維持できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:39:46 GMT)
On the optimization dynamics of RLVR: Gradient gap and step size thresholds [10.4] Reinforcement Learning with Verifiable Rewards (RLVR) は経験的成功を収めた。
本稿では,RLVRの学習過程を全応答レベル(軌道)とトークンレベルの両方で解析することにより,RLVRの理論的基盤を構築する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:53:41 GMT)
Who Said Neural Networks Aren't Linear? [10.3] 本稿では,そのようなベクトル空間を構築によって明示する手法を提案する。
線形作用素 $A$ を 2 つの可逆ニューラルネットワーク、$f(x)=g_y-1(A g_x(x))$ に挟むと、対応するベクトル空間 $X$ と $Y$ は新たに定義された加算およびスケーリングアクションによって誘導される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:57 GMT)
Adaptive Memory Momentum via a Model-Based Framework for Deep Learning Optimization [10.3] 定常運動量係数を動的運動量係数に置き換えるテクスチマタテプティブメモリ機構を導入する。
我々はSGDとAdamWの両方の適応型メモリを幅広い学習タスクで実装する。
私たちの仕事は、最適化において適応性を誘導する新しい方法の扉を開く。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:53:07 GMT)
Surrogate Graph Partitioning for Spatial Prediction [10.3] 本研究では,空間セグメントを構成するグラフ分割問題を提案する。
セグメントへのデータポイントの割り当ては混合整数二次計画問題として定式化することができる。
グラフ分割の構造特性を利用する近似法を開発した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:24:49 GMT)
RedDebate: Safer Responses through Multi-Agent Red Teaming Debates [10.2] 安全でない振る舞いを識別し緩和する、新しいマルチエージェントの議論フレームワークであるRedDebateを紹介します。
RedDebateでは、さまざまな議論シナリオにわたる複数の大規模言語モデル(LLM)間の協調的な議論を採用している。
さまざまなモデルの安全ベンチマークに関する実証的な評価は、RedDebateが安全でない出力を大幅に削減していることを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:50:19 GMT)
GRADE: Personalized Multi-Task Fusion via Group-relative Reinforcement Learning with Adaptive Dirichlet Exploratio [10.2] パーソナライズされた多目的ランキングシステムの全体的なアーキテクチャ。
1)初期特徴処理と候補生成のための特徴中心と先行モデル,(2)多様なユーザフィードバック信号を予測するマルチタスク学習(MTL)モデル,(3)マルチタスク融合(MTF)モジュール(GRADEフレームワークの提案)。
これらの重みは最終的なスコアを計算するために適用され、Blended Ranking Modelによってブレンドされたランキングを生成するようにソートされる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:12:52 GMT)
FairSHAP: Preprocessing for Fairness Through Attribution-Based Data Augmentation [10.2] 既存の前処理アプローチでは、不公平の原因となる機能やインスタンスを特定するための透過的なメカニズムが欠如している。
FairSHAPは、Shapley値の属性を利用して、個人とグループの両方の公正性を改善する新しい前処理フレームワークである。
モデルに依存しない透明な方法として、FairSHAPは既存の機械学習パイプラインにシームレスに統合し、バイアスの原因に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:12:31 GMT)
DACP: Domain-Adaptive Continual Pre-Training of Large Language Models for Phone Conversation Summarization [10.1] 大規模言語モデル (LLM) はテキスト要約において顕著な性能を達成した。
微調整は要約の品質を向上させることができるが、通常は高価で高品質なラベル付きデータに依存している。
我々は、下流の要約タスクにLLMを適用するためのスケーラブルで自己管理的なアプローチとして、継続事前学習について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:35:24 GMT)
STOPA: A Database of Systematic VariaTion Of DeePfake Audio for Open-Set Source Tracing and Attribution [10.1] STOPAは、13の合成器から8つのAM、6つの設定、700kサンプルをカバーするディープフェイク音声ソーストレースのためのデータセットである。
STOPAは、ボコーダモデル、音響モデル、事前訓練された重みの選択など、幅広い生成要因をカバーする体系的に制御されたフレームワークを提供する。
この制御により帰属精度が向上し、法医学的分析、ディープフェイク検出、生成モデルの透明性が向上する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:21:42 GMT)
The Role of Model Confidence on Bias Effects in Measured Uncertainties for Vision-Language Models [10.1] 我々は,GPT-4oにおける不確かさの定量化が促進されることを見出した。
また、バイアスのないモデル信頼度が低い場合、すべてのバイアスが両方の不確実性により大きな影響を及ぼすことがわかった。
これらの異なる影響により、不確実性定量化のためのバイアス緩和の理解が深まり、より高度な技術の発展を知らせる可能性がある。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:08:47 GMT)
Two-Stage Voting for Robust and Efficient Suicide Risk Detection on Social Media [10.1] 近年は世界中で自殺率が上昇しており、予防策の緊急的必要性が浮き彫りになっている。
ソーシャルメディアは、多くのリスクのある個人がオンラインで苦悩を共有するために、貴重な信号を提供する。
しかし、比喩、皮肉、微妙な感情的な手がかりを通じて間接的に伝えられる暗黙の自殺観念を検出することは、依然として非常に困難である。
効率性とロバスト性のバランスをとる2段階の投票アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:51:05 GMT)
The Exponential Deviation Induced by Quantum Readout Error Mitigation [10.0] 従来の測定誤差低減手法では,量子ビット数の増加に伴い指数関数的に増大する体系的誤差を導入する。
我々は,大規模絡み合った状態の忠実度が,状態準備誤差の有無で著しく過大評価されることを実証した。
また, 変分量子固有解法や時間発展法などの有価量子アルゴリズムの結果が, システム規模が大きくなるにつれて, 理想的な結果から著しく逸脱することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:00:05 GMT)
LLM4Cell: A Survey of Large Language and Agentic Models for Single-Cell Biology [10.0] 大規模言語モデル(LLM)と新しいエージェントフレームワークが単一細胞生物学を変革し始めている。
LLMは自然言語推論、生成アノテーション、マルチモーダルデータ統合を可能にする。
本研究は, 単細胞研究のために開発された58の基盤およびエージェントモデルの統一的な調査である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:12:09 GMT)
Expressive Value Learning for Scalable Offline Reinforcement Learning [9.9] 強化学習(Reinforcement Learning, RL)は、意思決定の順序を学習するための強力なパラダイムである。
オフラインRLは、大規模で多様なデータセットのトレーニングエージェントによる有望な道を提供する。
オフライン強化学習のための表現的価値学習(EVOR)を導入する。これはスケーラブルなオフラインRLアプローチであり、表現的ポリシーと表現的価値関数を統合している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:42:20 GMT)
LOTION: Smoothing the Optimization Landscape for Quantized Training [9.9] 生の量子化損失を非バイアスのランダム化周囲雑音下での予測に置き換える原理的平滑化フレームワークであるLOTIONを導入する。
本手法は, 合成テストベッドおよび150M-および300M-パラメータ言語モデルにおいて, 標準QATよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:16:46 GMT)
Spatial Deconfounder: Interference-Aware Deconfounding for Spatial Causal Inference [9.8] 空間領域における因果推論は、未測定の空間要因と近くの治療からの干渉の2つの相反する課題に直面している。
本研究では,局所的な治療ベクトルから代用共同創設者を再構築する2段階の手法である空間的共同ファウンダーを提案する。
この手法により、弱い仮定の下で直接と効果の両方を非パラメトリックに識別できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:28:18 GMT)
Pattern Enhanced Multi-Turn Jailbreaking: Exploiting Structural Vulnerabilities in Large Language Models [9.7] マルチターンジェイルブレイク攻撃は、異なる会話アプローチによって異なる害カテゴリーをターゲットにしている。
自然な対話を通して効果的なマルチターンジェイルブレイクを構築するために,PE-CoA(Pattern Enhanced Chain of Attack)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:26:28 GMT)
Anticipating the Selectivity of Intramolecular Cyclization Reaction Pathways with Neural Network Potentials [9.7] 本稿では, 複雑な反応, 環化の模範的なファミリーの探索を支援するためのメカニズム探索戦略を提案する。
グラフベースの列挙手法と中間フィルタリングのための機械学習技術を組み合わせることで,関連する基本反応ステップを特定するための費用対効果の戦略を提案する。
本稿では,NNPが活性化エネルギーを推定する能力を評価し,立体選択性の正しい予測を実証し,天然物合成における複雑な有効ステップを再カプセル化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:27:12 GMT)
Generating Sizing Fields for Mesh Generation via GCN-based Simplification of Adaptive Background Grids [9.6] 三角形の背景格子上に定義されたサイズフィールドは、非構造メッシュ生成の品質と効率を制御するために重要である。
本稿では,グラフ畳み込みネットワーク(GCN)に基づく新しい適応型バックグラウンドグリッド単純化フレームワークを提案する。
我々は、エッジスコア回帰問題としてグリッド単純化タスクを再構成し、GCNモデルを訓練し、最適なエッジ崩壊候補を効率的に予測する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:57:25 GMT)
DPCformer: An Interpretable Deep Learning Model for Genomic Prediction in Crops [9.6] ゲノム選択(GS)は、全ゲノム情報を用いて、作物の表現型を予測し、繁殖を加速する。
しかし、従来のGS手法は複雑な特徴や大きなデータセットの予測精度に苦慮している。
複雑な遺伝子型とフェノタイプの関係をモデル化するために,畳み込みニューラルネットワークと自己認識機構を統合したディープラーニングモデルDPCformerを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:53:36 GMT)
LLM Fingerprinting via Semantically Conditioned Watermarks [9.5] 意味的条件付き透かしによるLCMフィンガープリントを導入する。
弱めのない非定型鍵を各応答中に拡散した統計的透かし信号に置き換える。
私たちの指紋はステルスで、すべての一般的なデプロイメントシナリオに対して堅牢です。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:40:25 GMT)
Unifying Quantum Smoothing Theories with Extended Retrodiction [9.5] 量子状態平滑化のための包括的再予測フレームワークを開発する。
我々は、我々の理論が分野を統一し、それをより広いシナリオのクラスに自然に拡張することを示します。
我々の結果は、量子状態の平滑化は基本的には回帰過程であり、最終的に古典的平滑化と類似していることを証明している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:55:25 GMT)
The Unintended Trade-off of AI Alignment:Balancing Hallucination Mitigation and Safety in LLMs [9.5] 真実性を高めることは 安全性に悪影響を及ぼす
本稿では, 事実の精度向上が, 拒否行動の弱化を招きやすいことを示す。
スパースオートエンコーダを用いた幻覚特徴から拒絶関連特徴を分離する手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:30:58 GMT)
Memory Retrieval and Consolidation in Large Language Models through Function Tokens [9.5] 大規模言語モデル(LLM)の動作を説明するために関数トークン仮説を提案する。
推論中、関数トークンはコンテキストから最も予測可能な機能を起動する。
トレーニング前では、トレーニング損失は関数トークンに続く次のコンテントトークンの予測によって支配される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:31:20 GMT)
Beyond Real Data: Synthetic Data through the Lens of Regularization [9.5] 合成データは、実際のデータが不足しているときに一般化を改善することができるが、過度な依存は、性能を低下させる分布ミスマッチをもたらす可能性がある。
本稿では,合成データと実データとのトレードオフを定量化する学習理論フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:33:09 GMT)
Multiple Memory Systems for Enhancing the Long-term Memory of Agent [9.4] MemoryBankやA-MEMといった既存の手法は、記憶されているメモリの質が劣っている。
我々は認知心理学理論にインスパイアされた多重記憶システムを設計した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:50:57 GMT)
Transmuting prompts into weights [9.4] 我々は、プロンプトの影響を数学的に暗黙の重み更新にマッピングする方法を示す。
この情報をトークンに依存しない思考ベクトルと思考行列に凝縮する原理的手法を導出する。
これらの構造は、既存のベクトルおよび行列ベースのモデル編集技術の理論的な説明を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:40:39 GMT)
Contrastive Decoding for Synthetic Data Generation in Low-Resource Language Modeling [9.4] 合成コーパス生成におけるコントラストデコーディングの利点について検討する。
優れた性能を持つモデルからの信号を増幅することにより、合成コーパスを作成し、元のトレーニングデータと混ぜる。
本研究は,合成データと実データとの混合による学習により,言語モデリングの目的と下流タスクの範囲の性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:04:52 GMT)
AutoQual: An LLM Agent for Automated Discovery of Interpretable Features for Review Quality Assessment [9.4] AutoQualは、データに埋め込まれた暗黙の知識を明示的で計算可能な機能に変換するためのフレームワークである。
我々は,10億のユーザベースを持つ大規模オンラインプラットフォームにメソッドをデプロイする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:11:02 GMT)
Average Controlled and Average Natural Micro Direct Effects in Summary Causal Graphs [9.4] 概略因果グラフで表される因果系における平均制御直結効果と平均自然直結効果の同定可能性について検討する。
特に、要約因果グラフから平均制御マイクロダイレクト効果と平均自然マイクロダイレクト効果を識別するのに十分な条件を与える。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:24:37 GMT)
Operator Learning for Power Systems Simulation [9.3] オペレータ学習(Operator Learning)は、関数間のマッピングを学習する機械学習手法のファミリーである。
時間領域シミュレーションは電力系統の安定性と動的性能を研究・向上するための重要なツールである。
本稿では、粗い時間ステップで訓練されたモデルから微細分解能力学への一般化を可能にするシミュレーション時間ステップ不変性の概念について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:10:35 GMT)
Co-design is powerful and not free [9.3] ロボットのパフォーマンスは、ボディとコントローラの結合から生まれる。
形態制御の共設計がいつ必要かは、まだ不明である。
本稿では,1つのニューラルネットワークに形態と制御パラメータを組み込む統一フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:52:48 GMT)
Mobile Gamer Lifetime Value Prediction via Objective Decomposition and Reconstruction [9.3] 本稿では,客観的分解・再構成フレームワークを用いて,分散問題に対処する新しいLTV予測手法を提案する。
モバイルゲーマーのアプリ内購入特性に基づいて,まず特定の価格での取引数を予測し,その中間予測から支払金額を算出した。
提案手法は,実世界の産業データセットを用いて評価され,オンラインA/BテストのためのTapTap RTB広告システムに,最先端のZILNモデルとともに展開された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:33:12 GMT)
Post-Quantum Security of Block Cipher Constructions [9.2] 我々はブロック暗号と関連する構成のための量子後セキュリティの理論の基礎を設定した。
キー長拡張スキームFXの最初の量子後セキュリティ証明、変更可能なブロック暗号LRWおよびXEX、およびほとんどのブロック暗号暗号化および認証モードを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:33:05 GMT)
Opponent Shaping in LLM Agents [9.2] 本稿では,Large Language Models (LLM) を用いた対戦型シェーピング (OS) の最初の検討について述べる。
ShapeLLM を用いて,LLM エージェントが多種多様なゲーム理論環境における協調プレイヤの学習力学に影響を及ぼすかどうかを検討する。
以上の結果から, LLM エージェントは相互作用によって形状と形状を両立できることが明らかとなり, 多エージェント LLM 研究の鍵となる次元として対向型整形が確立された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:13:24 GMT)
Grover Adaptive Search for the Higher-Order Formulation of Quadratic Assignment Problems [9.0] 我々は、置換準備演算子(PPO)を用いたグロバー適応探索(GAS)を用いて二次代入問題の探索空間を縮小できることを実証した。
まず,従来の2次非拘束バイナリ最適化(QUBO)を高次非拘束バイナリ最適化(HUBO)に変換する。
量子ビット数, 量子ゲート数, 回路深さ, クエリの複雑さの代数的解析を行い, 提案手法が探索空間を著しく減少させることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:38:39 GMT)
Role-Conditioned Refusals: Evaluating Access Control Reasoning in Large Language Models [9.0] 本研究は, LLMのアクセス制御ポリシーに準拠する能力に着目し, 承認された場合に応答し, 拒否した場合に応答することに着目し, 役割条件の拒絶について検討する。
この振る舞いを評価するために、SpiderとBIRDのテキスト・ツー・ショット・データセットを拡張する新しいデータセットを作成しました。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:28:59 GMT)
PLUM: Adapting Pre-trained Language Models for Industrial-scale Generative Recommendations [9.0] PLUMは,産業規模のレコメンデーションタスクに事前訓練された大規模言語モデルを適用するために設計されたフレームワークである。
PLUMは、セマンティックIDを使用したアイテムトークン化、ドメイン固有のデータに対する継続事前トレーニング(CPT)、推奨目的のためのタスク固有の微調整で構成されている。
そこでは,ユーザコンテキストに基づいて推奨項目のセマンティックIDを生成するために,モデルを直接訓練する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:01:05 GMT)
SINQ: Sinkhorn-Normalized Quantization for Calibration-Free Low-Precision LLM Weights [9.0] 訓練後の量子化は、大規模言語モデルを低精度で展開するための最も広く使われている戦略として現れてきた。
現在の手法では、ビット幅が4以下でパープレキシティ劣化を示す。
本稿では,2軸スケール係数と高速シンクホーン-ノック方式のアルゴリズムにより,既存の学習後量子化器を増強するSINQを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:46:47 GMT)
$μ$-Parametrization for Mixture of Experts [9.0] 非常に大きなモデルにおいて、Mixture-of-Experts (MoE) が主要なアーキテクチャとして登場している。
$mu$Transferはモデルスケール間で最適なハイパーパラメータをシームレスに転送することを可能にする。
実験により、最適な学習速度がモデルサイズ間で確実に伝達されることが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:31:29 GMT)
FedQS: Optimizing Gradient and Model Aggregation for Semi-Asynchronous Federated Learning [8.9] フェデレートラーニング(FL)は、生データを共有することなく、複数のパーティ間で協調的なモデルトレーニングを可能にする。
本稿では,SAFLにおけるこれらの格差を理論的に解析し対処する最初のフレームワークであるFedQSについて述べる。
我々の研究は、SAFLにおける集約戦略のギャップを埋め、安定的で正確で効率的な連合学習のための統一されたソリューションを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:32:19 GMT)
LinguaSim: Interactive Multi-Vehicle Testing Scenario Generation via Natural Language Instruction Based on Large Language Models [8.8] 大規模言語モデル(LLM)は、新しいシナリオ生成メソッドを可能にした。
現在の手法は、実世界の運転環境のリアリズムとコマンドの付着精度のバランスをとるのに苦労している。
自然言語をリアルでインタラクティブな3Dシナリオに変換するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:30:02 GMT)
DeepEN: Personalized Enteral Nutrition for Critically Ill Patients using Deep Reinforcement Learning [8.8] DeepEN(ディープエン)は、重篤な患者にパーソナライズされた経腸栄養(EN)の枠組みである。
これは、各患者の進化する生理学に合わせて、カロリー、タンパク質、流体の摂取を4時間で推奨する。
DeepENは、安全でない逸脱を抑えながら、高価値な臨床行動と整合する臨床的に現実的なポリシーを学ぶ。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:37:56 GMT)
On the Alignment Between Supervised and Self-Supervised Contrastive Learning [8.7] 自己指導型コントラスト学習(CL)は経験的成功を収めた。
最近の理論では、CLの損失は教師付きサロゲートであるNegatives-Only Supervised Contrastive Learning (NSCL)の損失と密接に近似している。
共有ランダム性の下で学習したCLモデルとNSCLモデルの表現アライメントを解析する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:01:42 GMT)
Agent-in-the-Loop: A Data Flywheel for Continuous Improvement in LLM-based Customer Support [8.6] LLMベースのカスタマーサポートシステムを反復的に改善するための連続データフライホイールを実装したAgent-in-theLoopフレームワークを提案する。
バッチアノテーションに依存する通常のオフラインアプローチとは異なり、AITLは4つの重要なアノテーションを実際の顧客操作に直接統合する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:01:51 GMT)
Nonlinear-linear duality for multipath quantum interference [8.5] 量子光学において、非退化パラメトリックダウンコンバージョンプロセスのポストセレクションは、部分時間反転を介してビームスプリッタ(BS)にリンクされる。
利得が低い特別な例は、量子イメージングにおけるクリシュコの先進波像を思い起こさせるものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:05:17 GMT)
Quantum Algorithm for Reversing Unknown Unitary Evolutions [8.5] 未知の量子進化を逆転することは、量子情報処理と基礎物理学の中心的な重要性である。
我々は、任意の未知のユニタリ変換を普遍的に逆転する決定論的かつ正確なアプローチである量子ユニタリ逆アルゴリズム(QURA)を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:35:52 GMT)
XRPO: Pushing the limits of GRPO with Targeted Exploration and Exploitation [8.5] GRPOのような強化学習アルゴリズムは、大規模言語モデル(LLM)推論の最近の進歩を促している。
既存のアプローチは、挑戦的なプロンプトに対する限られた探索に悩まされ、情報的なフィードバック信号が未公開のまま残されている。
本稿では,eXplore-eXploit GRPOについて述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:39:47 GMT)
Mutual Learning for Hashing: Unlocking Strong Hash Functions from Weak Supervision [8.5] Mutual Learning for Hashing(MLH)は、より弱いペアワイズベースのブランチから知識を転送することで、中心的なハッシュブランチを強化する弱強フレームワークである。
MLHは、複数のベンチマークデータセット間で、最先端のハッシュメソッドを一貫して上回る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:39:05 GMT)
Characterizing Space-Constrained Implementability of Quantum Instruments via Signaling Conditions [8.5] 量子プロセッサで利用可能な量子ビットの数をスケールアップすることは、長期的にも技術的に要求される。
量子機器として知られる最も一般的な量子演算のクラスでは、量子ビット要求は十分に理解されていない。
最適なキュービット数は$[[9,1,3]$-codeベースのプロトコルで3、$[5,1,3]$-codeベースのプロトコルで4である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:59:54 GMT)
LiveThinking: Enabling Real-Time Efficient Reasoning for AI-Powered Livestreaming via Reinforcement Learning [8.5] AIを使ったeコマースのライブストリーミングでは、デジタルアバターはエンゲージメントを促進するためにリアルタイムの応答を必要とする。
このギャップを埋めるための2段階最適化フレームワークであるLiveThinkingを紹介します。
LiveThinkingは計算コストを30倍に削減し、秒単位のレイテンシを実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:17:20 GMT)
On the Cryptographic Foundations of Interactive Quantum Advantage [8.4] 量子性の証明を達成するのに必要な硬さ(PoQ)
特に, この結果から, 格子を用いた公開検証PoQ構築の課題が説明できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:54:25 GMT)
Can Large Language Models Be Trusted as Evolutionary Optimizers for Network-Structured Combinatorial Problems? [8.4] 大規模言語モデル(LLM)は、言語理解とさまざまなドメイン間の推論において強力な能力を示している。
本研究では,問題構造に係わるLLMの能力を評価するための体系的枠組みを提案する。
我々は、よく使われる進化的手法(EVO)を採用し、LLM演算子の出力忠実度を厳格に評価する包括的評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:13:18 GMT)
Domain Generalization in-the-Wild: Disentangling Classification from Domain-Aware Representations [8.3] ここでは、CLIP-DCA(拡張ドメイン認識表現からの関心分類)を提案する。
我々は、ImageNet上でCLIPを微調整した後、OODスコアを定量化した33の多様なデータセットについて評価した。
既存の手法と比較して,この課題評価において大幅な改善が見られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:50:32 GMT)
On the Optimality of the Median-of-Means Estimator under Adversarial Contamination [8.2] 対向汚染下におけるMoMの誤差について, 上下境界について検討した。
有限分散を持つ分布のクラスにおいて、MoM は (minimax) 最適であることを示す。
また、提示された上界の順序に一致するMoMの誤差に対して下界を提供し、光尾分布に対してMoMが準最適であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:17:09 GMT)
When Robustness Meets Conservativeness: Conformalized Uncertainty Calibration for Balanced Decision Making [8.2] 本稿では,誤発見と後悔の保証を無分布で有限サンプルで提供する新しいフレームワークを提案する。
提案手法は,不規則なフロンティアを追従する有効な推定器を構築する。
これらの結果は、ロバスト性選択を導くための、最初の原則付きデータ駆動手法を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:38:17 GMT)
LLM Applications: Current Paradigms and the Next Frontier [8.2] 大規模言語モデル(LLM)の開発は、4つの主要なアプリケーションパラダイムを生み出した。
それぞれにメリットはあるが、共通の課題も共有している。
本稿では、これらのパラダイムをレビューし、分析し、アーキテクチャ設計、アプリケーションエコシステム、研究の進展、そして彼らが直面する課題とオープンな問題について述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:34:39 GMT)
Adaptive Originality Filtering: Rejection Based Prompting and RiddleScore for Culturally Grounded Multilingual Riddle Generation [8.2] セマンティック・リジェクション(セマンティック・リジェクション)による新規性と文化的信条を強制するために適応原性フィルタリングを導入する。
RiddleScoreは、斬新さ、多様性、流布度、回答アライメントを組み合わせたメトリクスである。
人間の評価は、流布度、創造性、文化的適合性を確認する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:11:04 GMT)
Dream to Recall: Imagination-Guided Experience Retrieval for Memory-Persistent Vision-and-Language Navigation [8.1] VLN(Vision-and-Language Navigation)は、エージェントが環境を通じて自然言語の指示に従う必要がある。
既存のメモリ永続化VLNのアプローチには、限界がある。
本稿では,暗黙記憶に基づく検索機構として想像力を利用するMemoirを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:58:01 GMT)
Efficient Graph Condensation via Gaussian Process [8.1] グラフ凝縮は、性能を維持しながら大きなグラフのサイズを減らす。
既存の手法はしばしば二段階最適化に依存しており、広範囲なGNNトレーニングとスケーラビリティの制限を必要とする。
本稿では,ガウス過程を用いたグラフ凝縮法(GCGP)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:45:06 GMT)
A Survey of Foundation Models for IoT: Taxonomy and Criteria-Based Analysis [8.1] ファウンデーションモデルは、ラベル付きデータへの依存度が低いため、IoT領域への関心が高まっている。
既存の基盤モデルベースのメソッドのほとんどは、特定のIoTタスク用に開発されている。
この調査は、現在の方法論を包括的に概観することで、このギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:28:19 GMT)
Balanced ternary formalism of second quantization [8.1] 平衡三項形式構造を持つ第二量子化表現を構築する。
励起子の量子熱力学は、閉じてコンパクトな方法で研究される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:11:28 GMT)
The Tournament Tree Method for preference elicitation in Multi-criteria decision-making [8.1] トーナメント・ツリー・メソッド(TTM)は、新しい評価フレームワークである。
提案手法は、設計による一貫性を確保し、認知的努力を最小限に抑え、嗜好モデリングの次元性を低下させる。
古典的なデック・オブ・カード法と互換性があり、間隔と比率のスケールを扱える。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:24:32 GMT)
Open ASR Leaderboard: Towards Reproducible and Transparent Multilingual and Long-Form Speech Recognition Evaluation [8.0] 我々は、11データセットにわたる60以上のオープンソースおよびプロプライエタリシステムを比較した、完全に再現可能なベンチマークであるOpen ASR Leaderboardを提示する。
We standardize text and report both word error rate (WER) and real-time efficiency factor (RTFx)。
英語の書き起こしでは、コンバータエンコーダとデコーダのペアは、微調整された平均的なWERを提供するが、TDTデコーダは平均的なWERを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:39:28 GMT)
From Tokens to Layers: Redefining Stall-Free Scheduling for LLM Serving with Layered Prefill [8.0] 大規模言語モデル(LLM)は、TTFT(Time-to-first-token)とTBT(Time-between-token)の両方に対して、厳密なサービスレベル目標を満たす必要がある。
現代のサービスシステムでは、チャンクプリフィルのようなストールフリーなスケジューリング技術を採用している。
本稿では,トランスフォーマ層群を主スケジューリング単位として扱う新しいスケジューリングパラダイムであるLayered Prefillを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:41:35 GMT)
Reproducible workflow for online AI in digital health [8.0] オンライン人工知能(AI)アルゴリズムは、デジタルヘルス介入の重要な構成要素である。
オンラインAIのデプロイは重要な課題である。
本稿では、デジタルヘルス介入におけるオンラインAI意思決定アルゴリズムの開発、デプロイ、分析のための再現可能な科学的ワークフローを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:59:41 GMT)
MAGIC: A Multi-Hop and Graph-Based Benchmark for Inter-Context Conflicts in Retrieval-Augmented Generation [7.9] RAGシステムでは、検索された文書が互いに矛盾したり、モデルのパラメトリックな知識と矛盾することがある。
本稿では,2つの類似しているが異なる文脈間の相違を多様かつ微妙に生成する知識グラフ(KG)に基づくフレームワークを提案する。
我々のベンチマークであるMAGICの実験結果から,LLMの内部動作に関する興味深い知見が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:28:51 GMT)
Quantum Limits of LEO Satellite Beacon Reading [7.9] 本研究では,ホームズ,ウィーバー,パーマーが導入したELROIビーコンの概念の量子極限について検討する。
地上局の設計に量子技術を導入することにより,性能が著しく向上することが実証された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:23:54 GMT)
Neptune: Advanced ML Operator Fusion for Locality and Parallelism on GPUs [7.9] 本論文では, 減算演算子の列に対する高度な演算子融合のためのテンソルコンパイラであるNeptuneを紹介する。
N Neptuneは、いくつかの既存の依存関係を意図的に破壊する高度な演算子融合のための新しいアプローチを提示している。
10のアテンションベースのベンチマークで、NeptuneはTriton、TVM、FlexAttentionといった既存のコンパイラを上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:33:52 GMT)
Evaluating LLM-Generated Legal Explanations for Regulatory Compliance in Social Media Influencer Marketing [7.9] 本稿では, 自動モデレーションが正確かつ法的に堅牢であるかどうかを評価するために, LLM法則の一般的な誤りの分類法を提案する。
また、インフルエンサーマーケティング法で訓練を受けた2人の学生によって注釈付けされたLSM説明のオリジナルのデータセットも含まれている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:50:37 GMT)
Quantum effects in rotationally invariant spin glass models [7.8] 本研究では、回転不変ランダム相互作用を持つ横場イジングスピンガラスモデルにおける量子効果について検討する。
主目的は,命題パラメータの仮想時間依存性を捉える準静的近似の有効性を評価することである。
本研究は、量子スピングラス解析のための準静電処理をサポートし、量子最適化アルゴリズムの解析に有用な洞察を与えるかもしれない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:31:40 GMT)
Understanding Teen Overreliance on AI Companion Chatbots Through Self-Reported Reddit Narratives [7.8] 我々は、キャラクタ.AIサブレディットで13~17歳として自己開示したユーザーによるRedditの投稿318件を分析した。
十代の若者たちは、サポートや創造的な遊びにチャットボットを使い始めることが多いが、これらのアクティビティは、対立、離脱、寛容、再発、ムードの規制によって特徴付けられる強い愛着へと深まる可能性がある。
ディスエンゲージメントは、十代の若者が害を認識したり、オフライン生活で再エンゲージメントを行ったり、制限的なプラットフォーム変化に遭遇したとき、一般的に発生する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:09:38 GMT)
Navigating Sparsities in High-Dimensional Linear Contextual Bandits [7.8] 高次元線形文脈バンドイット問題は、次元の呪いのため、依然として重要な課題である。
この研究では、両方の空間を適応的にナビゲートする強力なポイントワイズ推定器が導入された。
この点に基づいて,HOPEと呼ばれる新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:47:14 GMT)
Learning to steer quantum many-body dynamics with tree optimization [7.8] 我々は,多体スピンシステム上での最適量子制御のためのパルスシーケンスの設計を学習するAIフレームワークを提案する。
本フレームワークでは,非直観的構造を示す900以上のハイパフォーマンスシーケンスを同定する。
ダイヤモンドスピンアンサンブルの実験では、最高のAI設計シーケンスが200マイクロ秒を超えるコヒーレンス時間を達成することが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:30:12 GMT)
The Hidden Bias: A Study on Explicit and Implicit Political Stereotypes in Large Language Models [7.7] 本研究では,8大言語モデルにおける政治バイアスとステレオタイププロパゲーションについて検討した。
主要な発見は、すべての調査対象モデルにおいて、一貫した左利きのポリト-カルアライメントを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:00:40 GMT)
A Honest Cross-Validation Estimator for Prediction Performance [7.7] 特定の(ランダムな)トレーニングセットでトレーニングされたモデルの性能を推定する新しい手法を提案する。
解離試験セットにモデルを適用することにより、ナイーブ推定器を得ることができる。
驚くべきことに、他のランダムスプリットから計算されたクロスバリデーション推定器は、この単純な推定器を改善するために使用できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:45:03 GMT)
Bridged Clustering for Representation Learning: Semi-Supervised Sparse Bridging [7.6] 我々はBridged Clusteringを紹介した。Bridged Clusteringは、未実装の入力$X$と出力$Y$データセットから予測子を学習する半教師付きフレームワークである。
我々のメソッドはまず最初に$X$と$Y$を独立にクラスタし、その後、わずかにペア化された例を使ってクラスタ間のスパースで解釈可能なブリッジを学習する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:57:59 GMT)
Fine-Tuning Jailbreaks under Highly Constrained Black-Box Settings: A Three-Pronged Approach [7.6] 我々は,データセットのみのブラックボックスファインチューニングインタフェースの下で,プロバイダの防御に対する3段階のジェイルブレイク攻撃を示す。
我々の攻撃には、安全スタイルの接頭辞/接尾辞ラッパー、敏感なトークンの良質な語彙エンコーディング(アンダースコーディング)、バックドア機構が組み合わされている。
実世界の展開において,本手法はOpenAIプラットフォーム上でGPT-4.1とGPT-4oをジェイルブレークし,攻撃成功率は両モデルともに97%以上である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:10:33 GMT)
ToolExpander: Extending the Frontiers of Tool-Using Reinforcement Learning to Weak LLMs [7.6] ToolExpanderは、リソース制約のある大規模言語モデルのツール指向強化学習を促進する新しいフレームワークである。
Dynamic Multi-Round Hard Smpling と Self-Exemplifying Thinking が組み込まれている。
ToolExpanderは、特により弱い小規模モデルにおいて、LLMのツール使用能力を著しく向上する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:20:13 GMT)
Golden Ratio Weighting Prevents Model Collapse [7.5] 我々は、実データと合成データを統合するための最適なトレーニング戦略を開発する。
合成データの混合比と重み付け方式が最終モデルの性能に及ぼす影響を特徴付ける。
場合によっては、実データに割り当てられた最適な重みは、黄金比の逆数に対応する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:00:19 GMT)
Continuous Variable Hamiltonian Learning at Heisenberg Limit via Displacement-Random Unitary Transformation [7.5] 変位-ランダムユニタリ変換(D-RUT)は、任意の有限階ボソニックハミルトニアンの係数を学習する。
マルチモードシステムでは,より優れた統計効率を持つ階層的回復戦略を開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:37:47 GMT)
Rényi Sharpness: A Novel Sharpness that Strongly Correlates with Generalization [7.4] 我々は,損失ヘッセンの負のR'enyiエントロピー(古典的なシャノンエントロピーの一般化)として定義される,新しいシャープネス尺度(textitR'enyi sharpness)を提案する。
一般化と(R'enyi)シャープネスの関係を厳密に確立するために、R'enyiシャープネスという観点からいくつかの一般化境界を提供する。
R'enyiのシャープネスと一般化の間の強い相関(具体的にはケンドールのランク相関)を検証する実験を行った。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:58:21 GMT)
Single-Shot Universality in Quantum LDPC Codes via Code-Switching [7.4] 本稿では,高速量子コード間のコードスイッチングを用いてフォールトトレラント量子計算を行う単一ショットユニバーサルプロトコルを提案する。
固定レート2Dハイパーグラフ製品(HGP)コードと高レート3DHGPコードとのシングルショットコードスイッチングにより、この偉業を成し遂げる。
我々は,コードスイッチングプロトコルのフォールトトレランスを,対向雑音モデルと局所雑音モデルの両方で証明する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:57:46 GMT)
A pseudo-inverse of a line graph [7.4] 線グラフの空間に小さな摂動が存在する場合について検討し、対応するルートグラフの復元を試みる。
本稿では,線グラフの最小のエッジを編集し,ルートグラフの発見を可能にする線形整数プログラムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:59:58 GMT)
Attention based End to end network for Offline Writer Identification on Word level data [7.2] 注意駆動型畳み込みニューラルネットワーク(CNN)に基づく著者識別システムを提案する。
このシステムは、単語画像から抽出された断片として知られる画像セグメントを利用して、ピラミッドベースの戦略を用いて訓練されている。
提案アルゴリズムの有効性を3つのベンチマークデータベースで評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:43:00 GMT)
Routed Bell tests with arbitrarily many local parties [7.2] ルート付きベル試験は、この制限を緩和するための有望な戦略として最近再燃した。
我々はAliceとBobの両方のローカルセルフテストを可能にする改良されたセットアップを導入する。
完璧なローカルベルテストは、原則として、検出効率の障壁を克服できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:24:11 GMT)
Universality and kernel-adaptive training for classically trained, quantum-deployed generative models [7.2] ビットストリング上の有望な量子生成モデルとして、IQP量子回路Born Machine (QCBM) が提案されている。
近年の研究では、IQP-QCBMのトレーニングは古典的には、ガウスカーネル最大平均誤差(MMD)損失関数(英語版)のように、牽引可能であることが示されている。
カーネル適応法では、MDD値の収束はジェネレータの分布の弱収束を意味することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:17:34 GMT)
MEDEQUALQA: Evaluating Biases in LLMs with Counterfactual Reasoning [7.2] 重篤な症状と症状を一定に保ちながら,患者代名詞のみを摂動する反ファクト・ベンチマークであるMEDEQUALQAを紹介する。
我々は、GPT-4.1モデルを評価し、代名詞の変種間の安定性を測定するために、推論トレース間のセマンティックテキスト類似性(STS)を計算する。
以上の結果から,総じて高い類似性(平均STS >0.80)を示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:12:58 GMT)
Quantum Algorithm for Low Energy Effective Hamiltonian and Quasi-Degenerate Eigenvalue Problem [7.1] 準退化固有値問題は量子化学と凝縮物質物理学の中心である。
低次元部分空間において有効ハミルトニアン固有プロブレムを解くことにより、そのような準退化多様体を対角化する量子アルゴリズムを提案する。
我々の分析は、固有値精度と部分空間の忠実度に関する証明可能なバウンダリと、全クエリの複雑さを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:20:15 GMT)
MCPSecBench: A Systematic Security Benchmark and Playground for Testing Model Context Protocols [7.1] 本研究は,4つの主要な攻撃面にわたる17種類の攻撃タイプを同定し,MCPセキュリティの最初の系統分類を提示する。
MCPSecBenchは、プロンプトデータセット、MPPサーバ、MPPクライアント、アタックスクリプト、プロテクションメカニズムを統合した総合的なセキュリティベンチマークとグラウンドである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:57:42 GMT)
A Feasible Quantum Walk-Enabled Blockchain with Quantum Delegated Proof-of-Stake Consensus [7.0] この研究は、量子ウォークに基づく新しい量子ブロックチェーンフレームワークを提案する。
重み付き量子投票プロトコルに基づく量子コンセンサス機構を提案する。
既存の絡み合いに依存したアプローチと比較して、我々のフレームワークはより強固な安定性を実現し、ブロック整合性の簡易な検証を可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:26:14 GMT)
Why AI Agents Still Need You: Findings from Developer-Agent Collaborations in the Wild [7.0] ソフトウェアエンジニアリングエージェント(SWEエージェント)は、SWE Benchのようなベンチマーク上で、自律的に開発タスクを実行することができる。
SWEエージェントは、しばしば開発者との対話を可能にし、協調的な問題解決を可能にするように設計されている。
私たちは、以前コントリビュートしたリポジトリの33のオープンイシューを解決するために、IDEエージェントを使用した19の開発者を観察しました。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:54:39 GMT)
Mini-batch Estimation for Deep Cox Models: Statistical Foundations and Practical Guidance [7.0] 勾配降下(SGD)は、ディープコックスニューラルネットワーク(Cox-NN)の最適化に広く用いられている。
SGDは, 従来の部分的類似度とは異なるミニバッチ部分類似度の平均を最適化することを目的としている。
我々は,Cox-NN の mb-MPLE が一貫したものであり,最大最小収束率をポリ対数係数まで達成できることを確認した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:35:15 GMT)
Foundations of LLM Knowledge Materialization: Termination, Reproducibility, Robustness [7.0] ミニGPTKBを用いてLarge Language Models (LLM)知識の実体化を体系的に研究する。
我々は、収量、語彙的類似性、意味的類似性という3つのカテゴリのメトリクスの終端、堅牢性、およびメトリクスを分析します。
以上の結果から, (i) モデルに依存しながら高い終端率, (ii) 混合, (iii) 摂動型によって異なる, 種子や温度は高い, 言語やモデルでは低い,といった結果が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:00:50 GMT)
Self-Improving Skill Learning for Robust Skill-based Meta-Reinforcement Learning [7.0] SISL(Self-Improving Skill Learning)は、ハイレベルなスキル改善ポリシーを分離して自己指導型スキル改善を行う。
SISLは様々なロングホライゾンタスクにおいて、他のスキルベースのメタRLメソッドよりも一貫して優れている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:16:53 GMT)
InstructUDrag: Joint Text Instructions and Object Dragging for Interactive Image Editing [7.0] InstructUDragは、テキスト命令とオブジェクトドラッグを組み合わせた拡散ベースのフレームワークである。
本フレームワークは,オブジェクトのドラッグングを画像再構成プロセスとして扱い,二つの相乗的分岐に分割する。
InstructUDragはフレキシブルで高忠実な画像編集を容易にし、オブジェクトの移動精度と画像コンテンツに対するセマンティックコントロールを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:06:49 GMT)
Quantized decay charges in non-Hermitian networks characterized by directed graphs [6.9] 我々は、純粋で滑らかな指数減衰を持つ純粋な崩壊モード-固有状態を示す新しい非エルミート系を導入する。
この発見は、フォトニクス、信号処理などにおける潜在的な応用の道を開く。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:58:28 GMT)
A Kernel Distribution Closeness Testing [6.9] 分布近接性試験(DCT)は、分布対間の距離が少なくとも$epsilon$-farであるかどうかを評価する。
既存のDCT法は主に離散的な一次元空間上で定義された分布対間の不一致を測定する。
2つの複素分布間の分布差の強力な測定法である最大平均誤差(MMD)を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:13:32 GMT)
Some theoretical improvements on the tightness of PAC-Bayes risk certificates for neural networks [6.7] 本稿では,PAC-Bayes境界に基づくニューラルネットワークのリスク証明書のユーザビリティ向上に寄与する4つの理論的貢献について述べる。
最初の貢献は、0-1損失のような微分不可能な目的に対する境界を最適化する方法である。
実際,ニューラルネットワークにおけるCIFAR-10の非空一般化境界について述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:34:47 GMT)
SliceFine: The Universal Winning-Slice Hypothesis for Pretrained Networks [6.6] 本稿では,事前学習モデルにおいて,小型でランダムに選択されたスライス(スライス)の微調整が下流適応に十分である理由を説明する理論的枠組みを提案する。
SliceFineというPEFT法は,本手法に着想を得て,従来のウェイトから選択したスライスのみを更新する手法を提案する。
我々の研究は理論と実践を橋渡しし、理論上は既存のPEFT技術に代わる代替手段を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:45:28 GMT)
Classical Obfuscation of Quantum Circuits via Publicly-Verifiable QFHE [6.6] 量子回路の古典的オブファスケータ(英: classical obfuscator)とは、量子回路の古典的記述を$Q$で出力するプログラムである。
我々は、すべての擬決定論的量子回路に対して古典的オブファスケータが存在することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:19:12 GMT)
Rethinking Decoders for Transformer-based Semantic Segmentation: A Compression Perspective [6.6] セマンティックセグメンテーションと圧縮の間には根本的な関係があることを論じる。
PrIncipled SemantiC SegemenTation(DEPICT)のためのホワイトボックス完全注意型Decoderを考案した。
ADE20Kで行った実験では、DEPICTはブラックボックスであるSegmenterよりも一貫して優れていた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:04:28 GMT)
Contrastive Learning Augmented Social Recommendations [6.6] 本稿では,行動モデルからの関心表現を豊かにするために,社会関係グラフを活用することを提案する。
そこで我々は,低ランクなSVDをユーザ・イテム相互作用行列に採用し,二重視点の認知型ソーシャルグラフを構築した。
我々は「相互蒸留」技術を用いて、元の利益を社会的・行動的利益と社会的・行動特異的利益に分離する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:02:16 GMT)
GCPO: When Contrast Fails, Go Gold [6.6] 本稿では、外部標準基準回答を組み込んだグループコントラストポリシー最適化(GCPO)を紹介する。
モデルが問題を解くことができない場合、参照応答は正しい応答を提供し、不当に正確な更新方向に向けてモデルを操る。
GCPOは、複数のベンチマークデータセットで卓越した結果を達成し、ベースラインモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:09:06 GMT)
DexMan: Learning Bimanual Dexterous Manipulation from Human and Generated Videos [6.6] DexManは、人間の視覚的なデモンストレーションをシミュレーションで人型ロボットの両面的な操作スキルに変換する自動フレームワークである。
DexManでは、カメラのキャリブレーション、深度センサー、スキャンされた3Dオブジェクトアセット、グラウンドトルースハンド、オブジェクトモーションアノテーションの必要性をなくしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:17:05 GMT)
Ready to Translate, Not to Represent? Bias and Performance Gaps in Multilingual LLMs Across Language Families and Domains [6.4] 大規模言語モデル (LLM) は機械翻訳 (MT) を再定義した
LLMは言語家族や専門ドメイン間で不均一なパフォーマンスを示すことが多い。
オープンソースLLMの翻訳品質と公平性を評価するための統合フレームワークおよびデータセットであるTranslation Tanglesを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:28:30 GMT)
A Meta-Complexity Characterization of Minimal Quantum Cryptography [6.3] EFIペアは量子暗号における「最小」プリミティブと見なされている。
我々は、あるコルモゴロフのような複雑性測度を推定する問題は、1つのコピーで困難であるような、純粋状態上の一様でないサンプリング可能な分布が存在することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:00:31 GMT)
An AUTOSAR-Aligned Architectural Study of Vulnerabilities in Automotive SoC Software [6.3] 本研究は、自動車のシステム・オン・チップ(SoC)脆弱性180件を分析した。
16の根本原因と56の影響を受けるソフトウェアモジュールを特定し、CWE(Common Weaknession)カテゴリとアーキテクチャレイヤの階層化遅延を調査した。
我々は、パッチの遅れを長くした主要な脆弱性パターンとクリティカルモジュールを発見し、自動車のCPSプラットフォームをセキュアにするための実用的な洞察を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:38:06 GMT)
Quantum Advantage from Sampling Shallow Circuits: Beyond Hardness of Marginals [6.3] 我々は$mathcalD_nn$を$mathcalD_n$以上$0, 1n$、深さ7$の量子回路群を構成する。
私たちのディストリビューションのファミリーは、Bravyi、Gosset、K"onig(Science)の作業をベースに構築された、Watts、Kothari、Schaeffer、およびTal(STOC, 2019)のParity Halving Problem of Watts、Kothari、Schaeffer、およびTal(STOC, 2019)に触発されたものです。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:34:42 GMT)
Long-Tailed Recognition via Information-Preservable Two-Stage Learning [6.2] 不均衡(または長い尾)は多くの実世界のデータ分布の性質である。
本稿では,この傾向を緩和する新たな2段階学習手法を提案する。
提案手法は,様々なロングテールベンチマークデータセットにまたがる最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:49:12 GMT)
Coefficients-Preserving Sampling for Reinforcement Learning with Flow Matching [6.2] Reinforcement Learning (RL) は拡散およびフローマッチングモデルにおける画像生成と映像生成を改善する強力な手法として登場した。
SDEに基づくサンプリングは、生成された画像に顕著なノイズアーティファクトを導入します。
提案手法であるCoefficients-Preserving Sampling (CPS)は,これらのノイズアーティファクトを除去する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:42:33 GMT)
Meta-Learning Based Few-Shot Graph-Level Anomaly Detection [6.2] グラフレベルの異常検出は、不正検出、レビュー分類、生化学など様々な分野で重要な役割を果たしている。
既存の手法は大量のラベル付きデータに大きく依存しており、現実のシナリオでは利用できないことが多い。
メタラーニングに基づくグラフレベルの異常検出フレームワーク(MA-GAD)を提案する。
MA-GADにはグラフ圧縮モジュールが組み込まれており、グラフのサイズを小さくし、ノイズ干渉を緩和し、必須ノード情報を保持できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:45:07 GMT)
Banking Done Right: Redefining Retail Banking with Language-Centric AI [6.2] Ryt AIはLLMネイティブなエージェントフレームワークで、Ryt Bankを使用して自然言語会話を通じて中核的な金融トランザクションを実行可能にする。
これは、会話型AIが主要なバンキングインターフェースとして機能する、世界で初めてグローバルな規制当局が承認したデプロイメントである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:35:08 GMT)
Inner-Instance Normalization for Time Series Forecasting [6.2] 実世界の時系列は多くの要因に影響され、複雑な非定常特性を示す。
学習条件分布(LCD)と学習条件分布(LD)の2つの新しいポイントレベル手法を提案する。
各種バックボーンモデルを用いた2つの手法の性能評価を行った。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:24:47 GMT)
CATS-Linear: Classification Auxiliary Linear Model for Time Series Forecasting [6.2] 線形モデルCATS-Linearの分類法を提案する。
CACIはインスタンスを分類を通じて専用の予測器に動的にルーティングし、教師付きチャネル設計を可能にする。
また、デカップリング -- 線形写像を追加することで、トレンド・シーズン分解アーキテクチャを再設計する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:51:48 GMT)
MAESTRO: Masked AutoEncoders for Multimodal, Multitemporal, and Multispectral Earth Observation Data [6.1] 本稿では,Masked Autoencoder の新たな適応である MAESTRO について紹介する。
我々は,4つの地球観測データセットにおけるMAESTROの評価を行った。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:49:28 GMT)
A Comprehensive Survey on Smart Home IoT Fingerprinting: From Detection to Prevention and Practical Deployment [6.1] スマートホームのコンテキストに特化して,IoTフィンガープリントを包括的に分析する。
ネットワークトラフィック分析や機械学習ベースのスキームなど、既存のテクニックをレビューし、適用性と制限を強調します。
われわれは、次世代スマートホームエコシステムの信頼性とプライバシー保護の指紋認証を推進できるオープンな研究方針を概説する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:12:40 GMT)
Language Models Do Not Embed Numbers Continuously [6.0] 言語モデルは, 数値空間を非連続性として表現するだけでなく, 有意なノイズをもたらすことを示す。
この研究の発見は、埋め込みモデルが使われる多くの領域に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:46:19 GMT)
PAC Learnability in the Presence of Performativity [6.0] 本研究では,従来のPAC学習フレームワークのレンズを用いて,性能的二項分類問題を学習可能かどうかについて検討する。
本研究では,本来の分布から得られるデータと,その型による性能的リスク関数を構築した。
この性能リスクの概念を最小化することで、標準的な二項分類設定における任意のPAC学習可能な仮説空間がPAC学習可能なままであることを示すことができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:22:52 GMT)
AI-Driven Post-Quantum Cryptography for Cyber-Resilient V2X Communication in Transportation Cyber-Physical Systems [5.9] Transportation Cyber-Physical Systems (TCPS) は、交通インフラや車両などの物理的要素を高度な通信技術を介してサイバー要素と統合する。
従来の暗号手法はTCPS通信の確保に使われてきたが、量子コンピューティングの出現はこれらの既存のセキュリティ対策に重大な脅威をもたらす。
この章では、TCPS通信プロトコルを紹介し、サイバー攻撃に対応する通信の脆弱性について論じ、量子時代の既存の暗号手法の限界について考察する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:37:00 GMT)
Product testing with single-copy measurements [5.9] 単一コピー測定に制限された2種類の製品テストのサンプル複雑性について検討した。
特に、両部製品テスト(すなわち、状態が製品であるような、少なくとも1つの非自明なカットが存在するか)と多部製品テスト(すなわち、各カットにまたがる状態は完全に製品である)の両方を考慮する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:01:10 GMT)
VoiceAgentBench: Are Voice Assistants ready for agentic tasks? [5.6] 本稿では,現実的な音声エージェント設定におけるSpeechLMの評価ベンチマークであるVoiceAgentBenchを紹介する。
インドの文脈に根ざした5,500以上の合成音声クエリで構成されている。
ツール選択の正確性、構造的整合性、ツールの実行の正しさを測定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:11:38 GMT)
FireGNN: Neuro-Symbolic Graph Neural Networks with Trainable Fuzzy Rules for Interpretable Medical Image Classification [5.6] 本稿では、医用画像分類のための訓練可能なファジィルールをGNNに統合した、グラフに基づく解釈可能な学習フレームワークFireGNNを提案する。
ファジィルール強化モデルは,5つのMedMNISTベンチマークと合成データセットMorphoMNISTで高い性能を実現する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:43:33 GMT)
MOSAIC: Multi-agent Orchestration for Task-Intelligent Scientific Coding [5.5] MOSAICは訓練のないフレームワークで、特別に設計されたエージェントで、生徒-教師のパラダイム内で、自己表現し、合理性を作り、コードを作り、デバッグする。
我々はMOSAICを科学的符号化ベンチマークで評価し、我々の特殊エージェントフレームワークが既存の手法よりも精度、堅牢性、解釈可能性で優れていることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:35:23 GMT)
Block encoding with low gate count for second-quantized Hamiltonians [5.5] 多体ハミルトニアンの効率的なブロック符号化は、科学計算における量子アルゴリズムの中心的な要件である。
我々はクリフォード+Tゲートの複雑さとアンシラオーバーヘッドを著しく低減する第二量子化ハミルトンのブロック符号化のための新しい明示的な構成を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:37:15 GMT)
Robust Canonicalization through Bootstrapped Data Re-Alignment [5.4] 昆虫や鳥の識別などのきめ細かい視覚分類タスクは、微妙な視覚的手がかりに対する感受性を必要とする。
分散を低減してトレーニングサンプルを反復的に調整するブートストラップアルゴリズムを提案する。
本手法は,拡張と同等の性能を保ちながら,同変および正準化ベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:05:20 GMT)
Iterated Agent for Symbolic Regression [5.4] 本稿では,Large Language Models (LLM) を進化的探索のセマンティック演算子として利用するフレームワークであるIdeanSearchFitterを紹介する。
自然言語の合理性によって導かれる候補表現を生成することにより,本手法は,正確なだけでなく,概念的に一貫性があり,解釈可能なモデルへの発見をバイアスする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:02:56 GMT)
Think Just Enough: Sequence-Level Entropy as a Confidence Signal for LLM Reasoning [5.4] 推論タスクにおいて,大規模言語モデルにおいてトークン効率を向上する新しいエントロピーベースのフレームワークを提案する。
提案手法では,トークンレベルのログプロブからのシャノンエントロピーを信頼信号として使用し,早期停止を実現する。
エントロピーに基づく信頼度キャリブレーションは,事前学習後の最適化の創発的特性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:33:16 GMT)
Large Language Models Meet Virtual Cell: A Survey [5.4] 大型言語モデル(LLM)は「仮想細胞」の開発を可能にすることによって細胞生物学を変革している
この研究は、仮想セルモデリングのためのLLMの包括的なレビューを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:41:30 GMT)
A Large-scale Dataset for Robust Complex Anime Scene Text Detection [5.3] 現在のテキスト検出データセットは、主に自然または文書のシーンをターゲットにしている。
AnimeTextは、735Kイメージと4.2Mの注釈付きテキストブロックを含む大規模なデータセットである。
階層的なアノテーションと、アニメシナリオに適したハードネガティブなサンプルが特徴である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:47:52 GMT)
A New Approach to Arguments of Quantum Knowledge [5.3] QMAのための非対話型ゼロ知識論法を構築する。
我々の建設の安全性は、ポストクォータの識別不能な難読器の使用にかかっている。
ハッシュ関数を用いることで、オブファスケータの使用を代替する方法を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:54:47 GMT)
ProtoMedX: Towards Explainable Multi-Modal Prototype Learning for Bone Health Classification [5.3] ProtoMedXはマルチモーダル(マルチモーダル)モデルであり、腰椎のDEXAスキャンと患者の記録の両方を使用する。
視覚のみのタスクでは87.58%、マルチモーダル版では89.8%の精度を達成しており、どちらも既存の手法を超越している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:54:12 GMT)
Optimal and Robust In-situ Quantum Hamiltonian Learning through Parallelization [5.3] ハミルトン学習は、正確な多体シミュレーションを推進し、量子デバイスの性能を改善し、量子強調センシングを可能にするための基盤となる。
そこで本研究では,クラマーラオ法とクラマーラオ法を併用したハミルトニアン学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:58:37 GMT)
Detecting Legend Items on Historical Maps Using GPT-4o with In-Context Learning [5.3] 本稿では,レイアウト検出のためのLayoutLMv3と,テキスト内学習を用いたGPT-4oを組み合わせた手法を提案する。
実験の結果,構造化プロンプトを有するGPT-4は,88%のF-1,85%のIoUを達成し,ベースラインよりも優れていた。
このアプローチは、スケーラブルでレイアウト対応のレジェンド解析をサポートし、様々な視覚的スタイルにわたる歴史地図のインデックス化と検索性を改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:08:48 GMT)
Quantum channel discrimination against jammers [5.2] 逆入力相手を持つ2つのチャネル間の量子チャネル識別の問題(ジャマー)について検討する。
ミニマックスチャネルの発散の概念を導入し,その重要な特性のいくつかを確立する。
並列戦略下での最適型II指数誤差は、正規化されたミニマックスチャネルのばらつきによって特徴づけられる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:10:09 GMT)
Security of Key-Alternating Ciphers: Quantum Lower Bounds and Quantum Walk Attacks [5.2] キー交換暗号(KAC)の量子セキュリティについて検討する。
我々は、Q1モデルとQ2モデルの両方において、非適応的敵に対する$t$ラウンドKACのセキュリティを証明する。
Q1 モデルで$t$-round KAC に対する最初の非自明な量子鍵復元アルゴリズムを与える。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:14:51 GMT)
Fair Graph Machine Learning under Adversarial Missingness Processes [5.2] 逆方向の欠損プロセスは、計算によって公正なモデルに偽装できることを示す。
感性属性に対する公平なデータ計算モデルであるBFtS(Better Fair than Sorry)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:30:23 GMT)
Incremental Summarization for Customer Support via Progressive Note-Taking and Agent Feedback [5.2] 本稿では,顧客支援エージェントを対象とした漸進的な要約システムを提案する。
会話中に簡潔な弾丸音をいつ生成するかをインテリジェントに決定する。
エージェントのコンテキストスイッチングの労力を削減し、冗長性をレビューする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:15:43 GMT)
Learning and certification of local time-dependent quantum dynamics and noise [5.2] ハミルトン学習プロトコルは、量子コンピュータとシミュレーターのベンチマークに必須のツールである。
実効次元D$のグラフ上で局所的に相互作用する$nqubit系の時間依存性の進化を学習する。
本プロトコルは,成功確率1-delta$の間隔で,関数近似係数を精度$epsilon$に出力する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:39:40 GMT)
Through the Perspective of LiDAR: A Feature-Enriched and Uncertainty-Aware Annotation Pipeline for Terrestrial Point Cloud Segmentation [5.2] 地上レーザー走査(TLS)点雲の正確なセマンティックセマンティックセマンティクスは、高価な手動アノテーションによって制限される。
球面投影,特徴強調,アンサンブル学習,ターゲットアノテーションを統合した半自動不確実性対応パイプラインを提案する。
提案手法は,2次元球面格子を投影し,マルチソース特徴量で画素を拡大し,擬似ラベルと不確実性マップを生成するためにセグメンテーションネットワークのアンサンブルを訓練する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:22:20 GMT)
Verifiable blind observable estimation: A composably secure protocol for near-term quantum advantage tasks [5.1] 本稿では,信頼できない量子マシン上での観測可能推定を効率的に検証するプロトコルを提案する。
より正確には、計算された推定値が真の期待値のおよそ$epsilon>0$以内であることを保証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:56:15 GMT)
VisualDAN: Exposing Vulnerabilities in VLMs with Visual-Driven DAN Commands [5.1] この研究は、DANスタイルのコマンドに埋め込まれた単一の逆画像であるVisualDANを導入している。
我々は、有害なコーパスに肯定的なプレフィックスを付与し、モデルに悪質なクエリに正の反応をさせる。
この結果から, 少量の有害物質であっても, モデルの防御が損なわれれば, 有害なアウトプットを著しく増幅できることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:18:31 GMT)
Emotionally Vulnerable Subtype of Internet Gaming Disorder: Measuring and Exploring the Pathology of Problematic Generative AI Use [5.1] ジェネレーティブAI(GenAI)の過剰な共感に関する懸念は、経験的ツールと理論的な洗練を求めるものである。
本研究はPUGenAIS-9 (Problematic use of Generative Artificial Intelligence Scale-9 items)を開発した。
PUGenAISは,インターネットゲーム障害(IGD)の枠組みにおいて,中毒様パターンを反映しているかどうかを検討した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:37:06 GMT)
Dynamic Features Adaptation in Networking: Toward Flexible training and Explainable inference [5.1] 本稿では,適応ランダムフォレスト(ARF)を通信ネットワークシナリオにおける動的特徴適応のための信頼性の高いソリューションとして取り上げる。
ARFの反復的トレーニングは、より多くの機能が追加されるにつれて、時間とともに精度が向上し、効果的に安定した予測につながることを示す。
さらに、AI駆動ネットワークにおける説明可能性の重要性を強調し、効率的なXAI特徴重要度(FI)手法としてDrift-Aware Feature Importance(DAFI)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:55:04 GMT)
LLM-Assisted Web Measurements [5.1] 本研究では,大規模言語モデル(LLM)を対象とするWeb計測研究の手段として利用することを検討した。
以上の結果から, LLMはWeb上のセキュリティとプライバシの傾向を分析するための実用的なツールとして機能することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:38:38 GMT)
Towards Meaningful Transparency in Civic AI Systems [5.1] 我々は、AIの透明性を人間中心の視点で捉える既存のアプローチと、社会技術的システムビューを組み合わせて、市民AIシステムにとって意味のある透明性の概念を開発するためのアプローチを構築します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:43:01 GMT)
PainFormer: a Vision Foundation Model for Automatic Pain Assessment [5.1] 痛みは人口のかなりの割合に影響を与える多様体条件である。
本研究では,マルチタスク学習原理に基づく視覚基盤モデルPainFormerを紹介する。
PainFormerは様々な入力モードから高品質な埋め込みを効果的に抽出する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:30:59 GMT)
MMM: Quantum-Chemical Molecular Representation Learning for Combinatorial Drug Recommendation [5.0] 共同処方薬間の薬物・薬物相互作用(DDI)は依然として重要な課題である。
分子電子局在関数(ELF)マップ(MMM)を用いたマルチモーダルDDI予測を提案する。
MMMは、グローバル電子特性を符号化するELFに由来する特徴と、局所的なサブ構造相互作用をモデル化する二部グラフエンコーダを組み合わせる。
以上の結果から,ALFをベースとした3D表現の予測精度の向上と,臨床実践における薬剤処方の安全性向上が示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:03:14 GMT)
ISMIE: A Framework to Characterize Information Seeking in Modern Information Environments [5.0] 情報探索(IS)モデルは、ユーザ・システム間のインタラクションを特徴付ける効果的なメカニズムである。
現代情報環境における情報探索(ISMIE)フレームワークを基本ステップとして提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:32:07 GMT)
Wavefunction Flows: Efficient Quantum Simulation of Continuous Flow Models [4.9] フローモデルは、学習力学に基づいて確率分布を変換する生成モデルである。
これらのモデルは、連続変数上の珍しいハミルトニアンに対して、自然にシュル「オーディンガー方程式」と関係があることが示される。
我々は、このハミルトニアンによって生成される力学が量子コンピュータ上で効率的にシミュレートできることを証明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:05:54 GMT)
Positive maps and extendibility hierarchies from copositive matrices [4.9] 本研究は, PCOP(pairwise co positive)の新しい凸錐体を導入し, 系統的に研究する。
我々は、この円錐がPCPの錐体と双対であること(pairwise completely positive)を証明し、批判的に、広い共変写像群の正の完全な特徴づけを与える。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:51:54 GMT)
Codeword Stabilized Codes from m-Uniform Graph States [4.9] n 量子ビット上の m-一様量子状態は、すべての m-一様部分系が最大混合される絡み合った状態である。
純粋[[n,k,m+1]安定化量子誤り訂正符号(QECC)がコードワード(CWS)コードフレームワーク内に構築可能であることを示す。
また、コード状態へのエンコーディングや、コード状態からの論理量子ビットの復元のための測定ベースのプロトコルも提供します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:53:10 GMT)
RCPU: Rotation-Constrained Error Compensation for Structured Pruning of a Large Language Model [4.8] 大規模言語モデル(LLM)の構造化プルーニングによる誤りに対処する回転制限補償法を提案する。
LLMは大量のデータセットに基づいて訓練され、表現空間に豊富なセマンティック知識を蓄積する。
実験では,提案手法をLLaMA-7Bに適用し,WikiText-2および複数の言語理解ベンチマーク上で評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:54:09 GMT)
Fair Play in the Newsroom: Actor-Based Filtering Gender Discrimination in Text Corpora [4.7] 本稿では,大規模テキストコーパスにおける性差別の検出と緩和を目的とした,ユーザ中心のアクターレベルのパイプラインを提案する。
ドイツの新聞記事のtaz2024fullコーパスに適用すると、このパイプラインは、ソース材料のコアダイナミクスを保ちながら、よりジェンダーバランスのよいデータセットを生成する。
本研究は, 系統的なフィルタリングによって構造的非対称性を低減できることを示すが, 感情やフレーミングの微妙なバイアスは残る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:41:03 GMT)
Language learning shapes visual category-selectivity in deep neural networks [4.7] ヒト脳のカテゴリー選択領域(FFA)、外骨格体領域(EBA)、海馬傍位置領域(PPA)、視覚的単語形成領域(VWFA)など)。
人工ニューラルネットワーク(ANN)は,類似のカテゴリー選択ニューロンを示すか,これらの表現が言語経験によってどのように形成されるかを検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:58:58 GMT)
Hybrid CNN-BYOL Approach for Fault Detection in Induction Motors Using Thermal Images [4.7] 本稿では,BYOLとCNNを併用して誘導モータの熱画像の分類を行い,故障検出を行うハイブリッド手法を提案する。
提案したBYOL-IMNetは、99.89%のテスト精度と画像当たり5.7msの推論時間を実現し、最先端のモデルを上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:28:39 GMT)
Entanglement Growth from Entangled States: A Unified Perspective on Entanglement Generation and Transport [4.6] 絡み合いの成長を2つのメカニズムに分解する概念的枠組みを導入する。
MBL の力学は移動支配的'' であることが分かり、これは自然にエンタングルメント成長の観測された非単調性を説明する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:29:19 GMT)
Modeling Hypergraph Using Large Language Models [4.6] ハイパーグラフは、高階クラスタリング、ハイパーグラフニューラルネットワーク、コンピュータビジョンで使用される。
しかし、従来のペアワイズグラフと比較して、実際のハイパーグラフデータセットはスケールと多様性の両方において不足している。
マルチエージェント協調によるハイパーグラフの生成と進化をシミュレートする新しいLCM駆動型ハイパーグラフ生成装置HyperLLMを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:23:16 GMT)
Unbounded quantum-classical separation in sample complexity for sphere center finding [4.5] 本稿では、有限体上の非有界ベクトル空間における球面の中心を求める問題に対する量子的優位性について考察する。
中心を見つけるのに一定の数のサンプルしか必要としない量子ウォークに基づく量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:59:28 GMT)
Optimal quantum spectroscopy using single-photon pulses [4.5] 単一光子パルスを用いた量子エミッタの分光において達成可能な究極の精度を提供する。
我々は、線幅をエミッタの素ハミルトニアンの細部から独立に推定する最大値と、デチューニングがそうでないことを推定する最大値を求める。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:10:13 GMT)
Bug Histories as Sources of Compiler Fuzzing Mutators [4.4] 本稿では,バグ履歴からコンパイラファジィ・ミュータを抽出する最初の手法である IssueMut を提案する。
私たちは1760 GCCとLLVMのバグレポートから587のミュータをマイニングしています。
彼らは、最先端の突然変異コンパイラであるfuzzerがGCCで-28を、LLVMで37をミスする新しいバグを見つけました。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:25:37 GMT)
A Computational Perspective on NeuroAI and Synthetic Biological Intelligence [4.4] 我々はNeuroAIのランドスケープをハードウェア、ソフトウェア、ウェットウェアの3つの相互作用ドメインにまとめる。
我々は、オルガノイドインテリジェンス、ニューロモルフィックコンピューティング、ニューロシンボリックラーニングの進歩を強調している。
これらの発展は、生きた神経組織とデジタルアルゴリズムの相互作用を通して計算する新しい種類のシステムに一括して向けられている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:19:11 GMT)
METRICALARGS: A Taxonomy for Studying Metrical Poetry with LLMs [4.3] 本稿では,大規模言語モデルの評価を目的とした,詩関連NLPタスクの最初の分類法であるMetricalARGSを紹介する。
これらのタスクが既存のNLPタスクとどのように関連し、データセットや評価指標に関する疑問に対処するかについて議論する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:14:38 GMT)
Climate Surrogates for Scalable Multi-Agent Reinforcement Learning: A Case Study with CICERO-SCM [4.3] 本研究では,高忠実で高効率な気候シュロゲートを環境ループに直接組み込むマルチエージェント強化学習フレームワークを提案する。
概念実証として,気候モデルCICERO-SCMをサロゲートするために,2万ドル(約220万円)のマルチガス排出経路で事前訓練された繰り返しニューラルネットワークアーキテクチャを導入する。
シュロゲートモデルは、大域平均温度 RMSE $approx 0.0004 MathrmK$ と約10,000 times$ 1ステップの高速推論でほぼシミュレータ精度を得る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:02:49 GMT)
Robust Heuristic Algorithm Design with LLMs [4.3] 入力空間の領域に設計を特化させることにより,既存の手法よりも堅牢なアルゴリズムを実現できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:13:56 GMT)
The Shape of Adversarial Influence: Characterizing LLM Latent Spaces with Persistent Homology [4.3] 本研究では,大規模言語モデルの内部表現空間に対して,逆入力が体系的にどう影響するかに着目した。
アクティベーションの形状と神経情報の流れを定量化することにより、アーキテクチャに依存しない枠組みは、表現的変化の基本的な不変性を明らかにする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:00:15 GMT)
Practical robust Bayesian spin-squeezing-enhanced quantum sensing under noises [4.3] 本稿では,雑音下でのスピンスクイーズ状態による最適測定精度を実現する適応ベイズ量子推定プロトコルを提案する。
我々のプロトコルは、量子重力計や原子時計などの様々なシナリオに適用でき、ノイズ下での従来のフィッティング法よりも精度を高めることができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:53:48 GMT)
Chiral Edge Excitations of Fractional Chern Insulators [4.3] エッジ励起は、キラルトポロジカルに順序付けられた系の決定的なシグネチャである。
連続分数量子ホール(FQH)では、これらの励起はキラルルッティンガー液体(chi$LL)理論によって記述される。
ここでは、幅$L_y=10$の無限長ストリップ上の$nu=1/2$ FCIのチャージワンエッジスペクトル関数が、$chi$LL理論の予測を定量的に従うことを数値的に示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:15:53 GMT)
Haibu Mathematical-Medical Intelligent Agent:Enhancing Large Language Model Reliability in Medical Tasks via Verifiable Reasoning Chains [4.2] LLM(Large Language Models)は医学における有望さを示すが、現実的および論理的誤りを生じやすい。
The Haibu Mathematical-Medical Intelligent Agent (MMIA)は、正式に検証可能な推論プロセスを通じて信頼性を確保する。
MMIAの「ブートストラップ」モードは、理論として検証された推論連鎖を記憶する
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:35:37 GMT)
Preprint: Poster: Did I Just Browse A Website Written by LLMs? [4.2] LLM-dominant」コンテンツは、人間の入力が少ない大規模言語モデル(LLM)によって生成される。
ウェブサイト全体を分類する信頼性が高くスケーラブルなパイプラインを提案する。
LLMが優位なサイトは,検索結果の順に増加し,ランクも高くなっている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:55:04 GMT)
Uncertainty Comes for Free: Human-in-the-Loop Policies with Diffusion Models [4.0] 本研究では,拡散政策が人的援助を必要時にのみ積極的に求め,一定の人的監視への依存を減らす方法を提案する。
我々は、拡散政策の生成過程を利用して、自律エージェントが展開時にオペレーター支援を要求できる不確実性に基づくメトリクスを計算する。
この手法は, 自律的な性能向上のために, 微調整拡散ポリシーの効率的なデータ収集に有効であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:08:00 GMT)
Quantum Entanglement without Spin-Analyzing Power Dependence at the Colliders [4.0] スピン解析能力に依存しない衝突子における量子絡みについて検討する。
衝突機で発生するフェルミオン対の量子絡み合いは角情報のみを用いて証明できるかどうかを検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:10:14 GMT)
Shape-Informed Clustering of Multi-Dimensional Functional Data via Deep Functional Autoencoders [3.9] FAEclustは多次元関数データのクラスタ解析のための新しい機能的オートエンコーダフレームワークである。
本稿では, 成分関数間の複素非線形依存性をキャプチャするユニバーサル近似器エンコーダと, ユークリッド関数と多様体値関数の両方を正確に再構成できるユニバーサル近似器デコーダを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:20:12 GMT)
Learning What's Missing: Attention Dispersion and EMA Stabilization in Length Generalization [3.9] 本研究では, 変圧器における長さ一般化について, 集合補題を用いて検討する。
モデルは入力シーケンスから欠落したトークンに対する均一な分布を予測しなければならない。
そのようなモデルが長さ 1 と 2 の平衡ロジット変位を達成した場合、より長い列に一般化する必要があることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:26:48 GMT)
High-Fidelity Synthetic ECG Generation via Mel-Spectrogram Informed Diffusion Training [3.9] リアル患者心電図(ECG)データの共有に関するプライバシー制限により、心臓ケアのための機械学習の開発が妨げられる。
本研究は、現在の生成ECG法における2つの大きな欠点に対処する。
条件付き拡散に基づく構造化状態空間モデル (Structured State Space Model, SSSD-ECG) を2つの原則により構築する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:47:14 GMT)
Beyond Sub-6 GHz: Leveraging mmWave Wi-Fi for Gait-Based Person Identification [3.8] 実効的なバックグラウンドサブトラクションと組み合わせることで、mWave Wi-Fi信号は高い識別精度(20人91.2%)が得られることを示す。
本研究は,商用オフザシェルフ(COTS)Wi-Fiを用いた人物識別のためのサブ6GHzとミリ波Wi-Fi信号の比較研究である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:39:11 GMT)
Large Language Models Hallucination: A Comprehensive Survey [3.8] 大規模言語モデル(LLM)は自然言語処理を変革し、様々なタスクで優れたパフォーマンスを実現している。
派手な派手さは、しばしば幻覚(幻覚)として知られる偽情報や偽情報を生み出すコストが伴う。
この調査は、LSMにおける幻覚の研究を包括的にレビューし、原因、検出、緩和に焦点を当てている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:23:48 GMT)
Adaptive Sparsification for Linear Programming [3.7] 線形プログラムを多くの制約で解くための一般的なフレームワークを適応的なスペーシングにより$(n gg d)$で導入する。
制約行列に対して$tildeO(sqrtn d3)$ row-queries を用いて、LPの正確な解を求めるクラークソンのアルゴリズムの量子バージョンを示す。
第二に、我々のフレームワークは、パッキング制約が単純であるときに、混成パッキングと問題をカバーするための新しい最先端のアルゴリズムを生み出します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:36:00 GMT)
A Haskell to FHE Transpiler [3.7] ホモモルフィック暗号化(FHE)は、プログラムを直接暗号化データ上で評価する。
本稿では,Haskellプログラムを同型評価に適した回路に変換するHaskell用トランスパイラを提案する。
回路の各層を並列化してゲートを並列に実行する評価器を実装した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:28:27 GMT)
Spatial-Functional awareness Transformer-based graph archetype contrastive learning for Decoding Visual Neural Representations from EEG [3.7] 本稿では,脳波に基づく視覚的デコーディングを強化するために,空間認識変換器を用いたグラフアーチタイプコントラスト学習(SFTG)フレームワークを提案する。
具体的には、空間的脳の接続性と時間的神経力学を同時に符号化する新しいグラフベースのニューラルアーキテクチャであるEEG Graph Transformer(EGT)を紹介する。
高い対象内変動を緩和するために,特徴の整合性とクラス分離性を改善するために,主観固有の脳波グラフアーチタイプを学習するグラフアーチタイプコントラスト学習(GAC)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:02:25 GMT)
Biology-driven assessment of deep learning super-resolution imaging of the porosity network in dentin [3.6] 歯のメカノセンスシステムは、象牙質を介して伸びる多孔性ネットワークを流れる流体による象牙芽細胞細胞刺激に部分的に依存していると考えられている。
最小のサブ顕微鏡ポロシティ容器を可視化するには、共焦点蛍光顕微鏡による最も高い分解能が必要である。
我々は、低解像度画像の高速な取得と、後処理による最適な画像品質の回復を可能にするために、異なる深層学習(DL)超解像(SR)モデルを試験した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:26:38 GMT)
Control Synthesis of Cyber-Physical Systems for Real-Time Specifications through Causation-Guided Reinforcement Learning [3.6] 信号時相論理(STL)は、リアルタイム制約を表現する強力な形式主義として登場した。
強化学習(RL)は未知環境における制御合成問題の解法として重要である。
本稿では,STLのオンライン因果監視によって導かれるオンライン報酬生成手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:49:28 GMT)
Adaptive Tool Generation with Models as Tools and Reinforcement Learning [3.6] MTRは、ツール強化推論のためのシミュレーションファーストのトレーニングフレームワークである。
スキーマ検証されたシミュレートされた観察で、完全なReActトレースから学習する。
MTRは、ライブAPIシステムと競合するエクサクトマッチ(EM)スコアを取得する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:38:31 GMT)
Computational and statistical lower bounds for low-rank estimation under general inhomogeneous noise [3.6] そこで我々は,低ランク信号行列に対するスペクトルアルゴリズムの計算的最適性について検討した。
分散プロファイルがブロック構造を持つとは仮定せず、非常に一般的なプロファイルに対して同じスペクトルアルゴリズムが最適であるかもしれないことを示唆する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:53:59 GMT)
IKNet: Interpretable Stock Price Prediction via Keyword-Guided Integration of News and Technical Indicators [3.6] 個別のニュースキーワードと株価の動きのセマンティックな関連をモデル化するための解釈可能なキーワード誘導ネットワーク(IKNet)を提案する。
IKNetは、FinBERTベースの文脈分析を通じて有能なキーワードを特定し、それぞれの表現を別々の非線形投影層を通して処理し、その表現を技術指標の時系列データと統合し、翌日の閉値を予測する。
2015年から2024年にかけてのS&P 500データの実証的な評価は、IKNetがリカレントニューラルネットワークやトランスフォーマーモデルを含むベースラインを上回り、RMSEを最大32.9%削減し、累積リターンを18.5%改善したことを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:30:30 GMT)
What Is Your Agent's GPA? A Framework for Evaluating Agent Goal-Plan-Action Alignment [3.6] Agent GPAは、目標を設定し、計画を立て、アクションを実行するエージェントの運用ループに基づいた評価パラダイムである。
フレームワークには、ゴールフルフィルメント、論理一貫性、実行効率、プラン品質、プラン順守の5つの評価指標が含まれている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:40:19 GMT)
Looking to Learn: Token-wise Dynamic Gating for Low-Resource Vision-Language Modelling [3.5] 認知的に証明可能な量のデータに基づいて視覚言語モデルをトレーニングするには、モデルがマルチモーダル情報を統合する方法を再考する必要がある。
本稿では,トークンワイド動的ゲーティングを用いた軽量デコーダアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:10:36 GMT)
Compiling Any $\mathsf{MIP}^{*}$ into a (Succinct) Classical Interactive Argument [3.5] 我々は、$mathsfMIP*$プロトコルを簡潔な対話的引数に変換するジェネリックコンパイラを提案する。
a such compiler for $mathsfMIP*$ was given by Kalai, Lombardi, Vaikuntanathan and Yang (STOC 2022)
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:35:47 GMT)
On the Optimality of Tracking Fisher Information in Adaptive Testing with Stochastic Binary Responses [3.5] 逐次二進応答から連続能力パラメータを推定する問題について検討する。
本稿では,フィッシャー情報を最大化するための質問を適応的に選択する簡単なアルゴリズムを提案する。
我々は,このフィッシャー追跡戦略が,固定信頼と固定予算の双方において最適な性能を達成することを証明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:10:00 GMT)
Sparse components distinguish visual pathways & their alignment to neural networks [3.5] 高レベルのヒト視覚皮質における腹側、背側、側方の流れは、異なる機能過程に関係している。
しかし、ディープニューラルネットワーク(DNN)は単一のタスクモデルでトレーニングされ、視覚システム全体が驚くほどうまく機能する。
本研究では,各ストリーム内の視覚表現の主成分を特定するために,新しいスパース分解手法を適用した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:26:11 GMT)
SIMU: Selective Influence Machine Unlearning [3.4] LLM(Large Language Models)による機密情報の不要な記憶は、安全メカニズムの必要性を強調している。
1次法と2次法は、LLMがターゲット情報を忘れることを可能にするために大きな進歩を見せている。
本稿では,2段階のアンラーニングを強化する2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:03:15 GMT)
Efficient Fidelity Estimation with Few Local Pauli Measurements [3.4] 本研究では,実験状態がターゲットとどの程度近いかを定量化するプロトコルを開発する。
この推定器のバイアスを分析し、その性能を目標状態によって誘導されるマルコフ連鎖の混合時間$tau$にリンクする。
この作業により、スケーラブルなベンチマーク、エラーキャラクタリゼーション、トモグラフィ支援が可能になる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:35:58 GMT)
Confident-Knowledge Diversity Drives Human-Human and Human-AI Free Discussion Synergy and Reveals Pure-AI Discussion Shortfalls [3.3] 大規模言語モデルが人間の議論で観察される相乗効果を再現できるかどうかを考察する。
本稿では,各参加者をパフォーマンス(正確性)と信頼度でモデル化するエージェント非依存の自信知識フレームワークを提案する。
この枠組みは、信頼できる知識の多様性を定量化し、あるエージェントが他のエージェントが不確実であるときに正しい傾向にある度合いを計算し、信頼インフォームド決定によって利得に対する保守的な上限を得る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:45:21 GMT)
Quantum memory optimisation using finite-horizon, decoherence time and discounted mean-square performance criteria [3.3] 本稿では,量子情報をほぼ保持するオープンな量子メモリシステムについて述べる。
システム変数を初期値から逸脱させることは、トラクタブルモーメントダイナミクスの観点でクローズドフォームの計算に役立てる。
本手法は, 有限時間水平線における平均二乗偏差関数の最小化と, 量子系の平均性能を一時記憶として定量化する割引バージョンとを関連付ける。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:51:08 GMT)
Beyond AME: A Novel Connection between Quantum Secret Sharing Schemes and $k$-Uniform States [3.3] 量子秘密共有スキームと量子ビットの$k$一様状態の関連について検討する。
その結果,QSSスキームの設計における$k$-uniform状態の役割について,新たな知見が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:44:59 GMT)
Pattern or Not? QAOA Parameter Heuristics and Potentials of Parsimony [3.2] 量子近似最適化アルゴリズム(QAOA)のような構造的変動量子アルゴリズムは、短期量子ハードウェアの利点を利用するための主要な候補として浮上している。
大規模数値シミュレーションにより,QAOA性能における古典的パラメータの役割を体系的に検討した。
その結果, (i) 最適パラメータは, 期待されるパターンから大きく逸脱することが多く, (ii) QAOA性能は, 深さが大きくなるにつれて, パラメータ選択に対して徐々に敏感になる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:35:30 GMT)
Non-Hermitian many-body localization in asymmetric chains with long-range interaction [3.2] 一次元クリーンで長距離相互作用により誘導される非エルミート多体局在系において、静的および動的スペクトル実-複雑相転移の共存を発見した。
これらの2種類の遷移の位相図は、同様の非単調境界の傾向を示すが、重複しない。
本研究は,長距離相互作用系における非エルミート多体局在と非エルミートスペクトルの関係をより深く理解するための貴重な知見を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:32:13 GMT)
Bayesian Decision Making around Experts [3.2] 我々は、専門家データが学習者の後部に与える影響を定式化し、専門家の成果に対する事前学習が情報理論的後悔の境界を締め付けることを証明した。
専門家データの価値を定量化することにより、我々のフレームワークはエージェントがいつ他人から学ぶべきかをインテリジェントに決定するための実践的で情報理論的なアルゴリズムを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:53:19 GMT)
Guess your neighbor's input: Quantum advantage in Feige's game [3.2] プレイヤーごとに2つの質問と3つの回答を持つ非ローカルゲームについて検討し、1991年にフェイジが最初に検討した。
我々は、このゲームが3$次元の最大絡み合った状態に対する堅牢な自己テストであることを証明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:25:35 GMT)
Computing moment polytopes - with a focus on tensors, entanglement and matrix multiplication [3.1] 量子情報において、モーメント・ポリトープは単一粒子量子境界問題の枠組みを提供し、絡み合いの幾何学的特徴を提供する。
我々はフランツの数学的記述に基づいてテンソルのモーメントポリトープを計算する新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:23:49 GMT)
Accelerated Aggregated D-Optimal Designs for Estimating Main Effects in Black-Box Models [3.1] 我々は、$textbfA$ccelerated $textbfA$ggregated $textbfD$esignsをベースとした、$textbfE$stimatorであるA2D2Eを提案する。
我々は収束と分散の低減を含む理論的保証を確立し、広範囲なシミュレーションを通してA2D2Eを検証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:07:36 GMT)
High-Rate Surgery: towards constant-overhead logical operations [3.1] 我々は,任意のqLDPC符号上で,大規模かつアドレス可能な論理的パウリ積の測定を並列に行うための一般的な手法であるハイレート手術を導入する。
本研究は,qLDPC符号における複雑でアドレス可能な論理演算を現実的に行う上でのボトルネックに対処し,拡張性のあるフォールトトレラント量子計算の展望を推し進めるものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:49:39 GMT)
A Novel Framework for Augmenting Rating Scale Tests with LLM-Scored Text Data [3.1] この研究は、新しい概念的枠組みの中で定性的データを活用するために、最近の進歩を活用している。
そこで我々は,高校生の実世界サンプルを用いてフレームワークを開発し,評価する。
ホールドアウトテストセットでは、測定精度と精度が統計的に有意に向上した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:37:24 GMT)
Development of Mental Models in Human-AI Collaboration: A Conceptual Framework [3.0] 意思決定者のメンタルモデルが、AIシステムとの継続的な相互作用を通じて進化することは、ほとんど無視されてきた。
本稿では,人間とAIのコラボレーションのデザインが,このコラボレーションに必要な3つの相補的なメンタルモデルの開発にどのように影響するかについて論じる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:40:41 GMT)
Geometric signature of non-Markovian dynamics [3.0] 開系の力学における非マルコフ効果は、非単調な情報フローによって特徴づけられる。
我々は、TLSの幾何学的デコヒーレンス係数のばらつきが、非マルコフ力学の十分条件となることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:16:27 GMT)
Want to train KANS at scale? Now UKAN! [3.0] 我々は、従来のコルモゴロフ・アルノルドネットワーク(KAN)における有界グリッドの必要性を取り除く方法であるUnbounded Kolmogorov-Arnold Networks (UKANs)を提案する。
UKANは、グリッドグループの位置符号化をCGモデルに入力することで、カンと多層パーセプトロンを結合し、データ正規化を必要とせずに非有界領域上の関数近似を可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:32:06 GMT)
Time Independence Does Not Limit Information Flow. II. The Case with Ancillas [3.0] 時間非依存ハミルトニアンの光円錐は、局所的なアンシラが許される時、時間依存系の光円錐と同じであることを示す。
我々は,対応する時間依存プロトコルと同じ実行時間で量子状態転移を近似するための時間非依存プロトコルを開発する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:23:25 GMT)
The detection of Planck-scale physics facilitated by nonlinear quantum optics [2.9] 我々は、ng質量機械共振器の非定常ダイナミクスを測定するための完全量子モデルを提案する。
測定解像度は、電弱スケール以下の15ドルオーダーの精度レベルに最適化されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:42:21 GMT)
Fractional quantum Hall states under density decoherence [2.9] 2つのパラダイム状態(ラウリン状態とムーア-リード状態)で符号化された情報は、密度デコヒーレンスによってどのように影響を受けるかを調べる。
ラウリン状態について、位相基底多様体に符号化された情報は、この臨界相内のデコヒーレンス強度とともに連続的に劣化する。
一方、ムーア・リード状態の非アーベル素数の融合空間に符号化された量子情報は、任意の強いデコヒーレンスに対して完全に回復可能である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:30:37 GMT)
Scalable Cosmic AI Inference using Cloud Serverless Computing [2.9] これらの課題に対処するために、クラウドベースの天文学推論(CAI)フレームワークを紹介します。
CAIは、広範なハードウェアを使わずに、天文学的な画像の効率的でスケーラブルな推論を可能にする。
CAIの有効性を示すため,大規模データを最大1TBまで処理する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:35:59 GMT)
Backdoor Vectors: a Task Arithmetic View on Backdoor Attacks and Defenses [2.8] 本稿では,攻撃自体をタスクベクトルとして扱うことで,バックドア攻撃を理解するためのシンプルなフレームワークを提案する。
本稿では,Sparse Backdoor Vector(SBV)$という,複数の攻撃を1つの攻撃に組み合わせることで,バックドアのレジリエンスを向上させる手法を提案する。
以上の結果から,SBVは先行攻撃を超越し,バックドア効果を向上させるためにマージを利用する最初の方法であることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:54:05 GMT)
Can Small-Scale Data Poisoning Exacerbate Dialect-Linked Biases in Large Language Models? [2.8] スタイル条件付きデータ中毒は、社会言語バイアスを増幅するための隠蔽ベクトルとして同定される。
この研究は、言語スタイルが有害な行動の潜在的な引き金になるかどうかを調査する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:58:03 GMT)
Gaze on the Prize: Shaping Visual Attention with Return-Guided Contrastive Learning [2.7] 視覚強化学習(RL)エージェントは,少数のピクセルだけがタスク関連である高次元画像データに基づいて,行動を学ぶ必要がある。
このフレームワークは、自己監督信号によって誘導される学習可能な焦点注意機構で視覚的RLを増強する。
提案手法は, サンプル効率の最大2.4倍の改善を実現し, ベースラインの学習に失敗するタスクを解くことができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:54:11 GMT)
Vanishing Contributions: A Unified Approach to Smoothly Transition Neural Models into Compressed Form [2.7] Vanishing Contributions (VCON) は、ニューラルネットワークを圧縮形式にスムーズに移行するための一般的なアプローチである。
コンピュータビジョンおよび自然言語処理ベンチマークにおけるVCONの評価を,複数の圧縮戦略と組み合わせて行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:17:13 GMT)
VersionRAG: Version-Aware Retrieval-Augmented Generation for Evolving Documents [2.7] 既存のアプローチは、バージョンに敏感な質問に対して58~64%の精度しか達成していない。
文書の進化を明示的にモデル化するバージョン対応RAGフレームワークであるVersionRAGを紹介します。
検索中、VersionRAGはインテント分類に基づいて、クエリを特定のパスにルーティングする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:48:58 GMT)
Do Internal Layers of LLMs Reveal Patterns for Jailbreak Detection? [2.6] 大規模言語モデル(LLM)の内部表現を調べることでジェイルブレイク現象を研究する。
具体的には、オープンソースのLCM GPT-Jと状態空間モデルMamba2を分析する。
本研究は,ロバストなジェイルブレイク検出・防御のための内部モデル力学の活用に向けた今後の研究の方向性を示唆するものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:48:38 GMT)
A Systematic Evaluation of Self-Supervised Learning for Label-Efficient Sleep Staging with Wearable EEG [2.6] ウェアラブル脳波を用いた睡眠ステージングのための自己教師型学習の最初の体系的評価について述べる。
Ikon Sleep ウェアラブルEEG ヘッドバンドで取得した2つの睡眠データベース上で,SSL 手法の確立と評価を行った。
その結果、SSLは教師付きベースラインよりも最大10%の分類性能を継続的に改善している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:54:10 GMT)
Unsupervised Multi-Source Federated Domain Adaptation under Domain Diversity through Group-Wise Discrepancy Minimization [2.5] Unsupervised Multi-source Domain adapt (UMDA) は、複数の多様なソースドメインからのラベル付きデータを活用することにより、ラベルなしのターゲットドメインに一般化するモデルを学習することを目的としている。
GALAはスケーラブルで堅牢なUMDAフレームワークで、2つの重要なコンポーネントを導入しています。
GALAは、標準ベンチマークの競合や最先端の結果を一貫して達成し、様々なマルチソース設定で先行メソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:34:37 GMT)
DYNAMIX: RL-based Adaptive Batch Size Optimization in Distributed Machine Learning Systems [2.5] 既存のバッチサイズ選択アプローチは、異質な動的コンピューティング環境に適応できない静的アロケーションや単純化に依存している。
PPO(Proximal Policy Optimiza- tion)を用いてバッチサイズ最適化をシークエント決定問題として定式化する強化学習フレームワークDYNAmixを提案する。
提案手法では,ネットワークレベルのメトリクス,システムレベルのリソース利用,統計的効率指標のトレーニングを含む多次元状態表現を用いて,多様な計算資源をまたいだ情報的意思決定を可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:48:24 GMT)
Enhancing Self-Supervised Learning with Semantic Pairs A New Dataset and Empirical Study [2.4] インスタンス識別は、データセット内の個々のインスタンスを別々のクラスとして扱う、自己教師付き表現学習パラダイムである。
これは典型的には、変換を適用することによって、各インスタンスの2つの異なるビューを生成することで達成される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:31:55 GMT)
Exponential Speed-ups for Structured Goemans-Williamson relaxations via Quantum Gibbs States and Pauli Sparsity [2.4] 我々は,Guemans-Williamson SDPを既存手法よりも指数関数的に高速に近似する量子および量子インスピレーション付きアルゴリズムを開発した。
また,多対数時間でQUBOの実現可能な点のエネルギーを抽出し,ランダム化されたラウンドリング手順の手法についても検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:44:34 GMT)
Single layer tiny Co$^4$ outpaces GPT-2 and GPT-BERT [2.4] Co$4$は、BabyLM ChallengeのベースラインであるGPT-2 (124M, 12 Layer, $O(N2))$とGPT-BERT (30M, 12 Layer, $O(N2))$をわずか2回で上回り、どちらも10回トレーニングされている。
特に、Co$4$は、ゼロショットの7つ中5つ、微調整の7つ中6つでGPT-2、両方のケースで7つ中4つでGPT-BERTを上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:22:30 GMT)
Random unitaries that conserve energy [2.3] ハール測度からサンプリングされたランダムユニタリは、汎用量子多体力学の基本的なモデルとして機能する。
近年の研究では、Haar-randomユニタリと計算的に区別できない大きさの量子回路が構築されている。
PRUは多体物理学において広範囲に影響を及ぼすが、物理系を支配するエネルギーの保存には失敗している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:56:17 GMT)
Quantum Spin Chains Thermalize at All Temperatures [2.2] 短距離相互作用を持つすべての1次元ハミルトニアンは、全ての有限温度におけるシステムサイズの独立スペクトルギャップを持つ量子ギブスサンプリング器(CKG23)を許容している。
ギブス状態は多対数深さで準備でき、相関の指数的クラスタリングを満足させ、[Ara69]を一般化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:51:03 GMT)
Mix- and MoE-DPO: A Variational Inference Approach to Direct Preference Optimization [2.1] ソフトミックスモデルとMix-of-expertの両方でDPOを拡張するフレームワークであるMix-とMoE-DPOを提案する。
当社のフレームワークは、専門家固有のポリシーヘッドを備えた共有ベースアーキテクチャと、完全に独立したエキスパートモデルの両方をサポートします。
様々なモデルサイズとマルチパラメータデータセットに対するアプローチを検証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:15:14 GMT)
Multi-level informed optimization via decomposed Kriging for large design problems under uncertainty [2.1] 最先端技術では、不確実性の定量化と設計最適化という2つのステップを採用して、不確実性のあるシステムの最適化を行っている。
ここでは,資源集約性,高次元性,複雑な工学的問題を最小限の資源で不確実性の下で正確に最適化する多レベル手法を提案する。
提案手法は, 解析テストベッドによる最先端技術と比較し, 桁違いに高速かつ高精度であることが確認された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:59:16 GMT)
Empowering Lightweight MLLMs with Reasoning via Long CoT SFT [2.1] 本稿では,軽量マルチモーダル言語モデル(MLLM)の推論能力向上における長鎖(ロングCoT)データの役割について検討する。
以上の結果から,長いCoTデータを持つSFT(Supervised Fine-Tuning)はMLLM推論を大幅に改善することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:53:53 GMT)
HySim-LLM: Embedding-Weighted Fine-Tuning Bounds and Manifold Denoising for Domain-Adapted LLMs [2.1] 大規模言語モデル(LLM)は、テキスト理解と推論において顕著な進歩を遂げた。
埋め込み重み付きファインチューニングと多様体認識デノーミングを統合した,統一的な数学的・計算フレームワークHySim-LLMを提案する。
本研究では,(1)組込み発散下での適応性能を定量化する類似性重み付き一般化境界,(2)ノイズやオフ多様体からの損失寄与を束縛する多様体に基づく記述保証,の2つの理論的結果を確立する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:16:46 GMT)
Bridging the Physics-Data Gap with FNO-Guided Conditional Flow Matching: Designing Inductive Bias through Hierarchical Physical Constraints [2.0] 時系列生成は、しばしばドメイン固有の物理的制約を無視し、統計的および物理的一貫性を制限する。
本研究では, 物理法則, 力学, 境界, 経験的関係の階層構造を, 直接的に深層生成モデルに組み込む階層的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:48:51 GMT)
Limits to black-box amplification in QMA [2.0] 量子複雑性クラスQMAにおけるブラックボックス増幅の限界について検討する。
増幅は、完全性と音響性の間の逆ポリノミカルギャップを指数的に小さな誤差に押し上げることが知られている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:24:13 GMT)
Reducing Cognitive Overhead in Tool Use via Multi-Small-Agent Reinforcement Learning [2.0] ツールの使用から推論を明示的に分離するフレームワークであるMSARLを提案する。
MSARLでは、Reasoning Agentが問題とツール呼び出しを分解し、複数のツールエージェントが特定の外部ツールを専門にしている。
コード実行による数学的問題解決において、MSARLは単一エージェントベースラインに対する推論安定性と最終回答精度を大幅に改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:11:56 GMT)
A Structural Theory of Quantum Metastability: Markov Properties and Area Laws [2.0] 複雑な量子系は、散逸性開系力学の準安定状態としてのみ存在する。
すべての準安定状態は、相互情報の領域法則とマルコフ特性を満たす。
この結果は, 熱転移性に関する包括的理論に向けて構築される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:53:36 GMT)
Is Architectural Complexity Always the Answer? A Case Study on SwinIR vs. an Efficient CNN [1.9] 我々は,標準CNNが計算オーバーヘッドを著しく低減し,最先端に近い結果が得られることを示す。
この研究は、標準的なCNNが計算オーバーヘッドを大幅に低減した、最先端に近い結果を提供できることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:16:05 GMT)
Energy, Bosons and Computational Complexity [1.9] ボゾン系の計算複雑性における資源としてのエネルギーの役割について検討する。
エネルギー成長速度 (1. Energy growth rate) 有限時間/コンスタント時間における無限エネルギーなど、エネルギーを驚くほど急速に増加させるボソニックゲートセットが存在する。
これらの高エネルギーはボソニック計算の計算特性を極めて困難にし、正式には決定不能にすることができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:55:10 GMT)
Systematic Assessment of Cache Timing Vulnerabilities on RISC-V Processors [1.9] キャッシュベースのタイミング脆弱性に対するIntel x86-64ベンチマークスイートをRISC-Vに移植する作業について述べる。
次に、このベンチマークを用いて、市販のRISC-Vプロセッサ3プロセッサのセキュリティを評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:29:54 GMT)
Efficient Label Refinement for Face Parsing Under Extreme Poses Using 3D Gaussian Splatting [1.9] この洗練されたデータセットで顔解析モデルを微調整すると、挑戦的な頭部ポーズの精度が大幅に向上する。
本手法は,実環境における顔解析の堅牢性を改善するために,スケーラブルで効果的なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:34:55 GMT)
Aligning LLM+PDDL Symbolic Plans with Human Objective Specifications through Evolutionary Algorithm Guidance [1.9] 我々は,記号的目標仕様の集団を生成するための進化的アプローチを開発する。
本研究は,海上災害復旧作業における原型仕様の収集に対するアプローチを評価するものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:26:32 GMT)
Accurate and Noise-Tolerant Extraction of Routine Logs in Robotic Process Automation (Extended Version) [1.9] 最終的な目標は、ロボットプロセスの自動化を可能にするルーチン型モデルを見つけることだ。
ルーチン型モデルの発見には、ルーチンログのプロビジョニングが必要である。
本稿では,ルーチンログの抽出を目的としたクラスタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:02:28 GMT)
Efficient Closest Matrix Product State Learning in Logarithmic Depth [1.9] 我々は,$O(log n)$ depthで実行し,サンプル複雑性を$O(n3)$とする,新しい効率的なMPS学習アルゴリズムを示す。
また,本アルゴリズムは,既知アルゴリズムのサンプリング複雑性と回路深度も改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:25:00 GMT)
The quantum communication power of indefinite causal order [1.8] 我々は因果秩序の役割を厳格に評価できる枠組みを開発する。
この設定では、古典的メッセージのワンショット送信における不確定順序の明確化の利点を確立する。
また、すべての通信タスクに対して、利点が汎用的でないことも示しています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:42:04 GMT)
Training a Foundation Model for Materials on a Budget [1.8] Nequix はコンパクトな E(3) 等価ポテンシャルで、単純化された NequIP と現代の訓練実践を組み合わせている。
Nequixは700Kパラメータを持ち、100 A100 GPU時間でトレーニングされた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:45:15 GMT)
Automated Capability Evaluation of Foundation Models [1.8] 本稿では,基盤モデルのスケーラブルで自動化された,きめ細かな評価のための新しいフレームワークである能動学習能力評価(ACE)を紹介する。
ACEは多様な評価タスクを生成し、人間の労力を大幅に削減する。
0.01 RMSEの範囲に到達し、半分未満の能力を評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:50:55 GMT)
Exploring the Viability of the Updated World3 Model for Examining the Impact of Computing on Planetary Boundaries [1.7] 現在、データセンター開発は急速に拡大しており、その多くはAIと関連付けられている。
成長限界に対するデータセンターの影響を定量的にシミュレートするために,World3-03モデルが有効な方法であるかどうかを考察する。
AI関連の変数を追加することで、期待されるダイナミクスの変化を観察でき、惑星境界に対するAIの影響を調べるためのWorld3-03モデルの実現可能性を示すことができます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:06:32 GMT)
Parallel Spooky Pebbling Makes Regev Factoring More Practical [1.7] 古典コンピューティングの抽象化である"Pebble Games"は、本質的にシーケンシャルなタスクに量子回路の設計に使われている。
本稿では,これらの手法をRegevの分解アルゴリズムに適用することにより,演算のコストを大幅に削減できることを示す。
我々は、整数分解以外の量子暗号解析にも応用できると信じている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:45:58 GMT)
Quantum Tanner Color Codes on Qubits with Transversal Gates [1.7] 本研究は,高次元展開器(HDX)を用いて高性能な量子コードを構築する方法の理解を深めることに焦点を当てる。
対称非積単純HDXを自然に利用できる論理ゲートの枠組みを開発する。
我々は、このフレームワークで、以前の構成よりも様々な利点を提供する特定のコードを実証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:12:00 GMT)
On Variational Perspectives To The Graph Isomorphism Problem [1.7] 変分量子アルゴリズムの観点から,グラフ同型問題に対する2次非制約二元最適化(QUBO)の定式化を考える。
本研究は,4ノードと5ノードのグラフに対して,それぞれの結果を示し,その変動を強調する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:06:59 GMT)
Generalized Orders of Magnitude for Scalable, Parallel, High-Dynamic-Range Computation [1.7] ディープラーニングからファイナンスまで、多くのドメインは、長いシーケンスで実数を合成する必要がある。
我々は、浮動小数点数を特別なケースとして組み込んだ従来の等級の等級を原則的に拡張した一般化等級数(GOOMs)を導入する。
我々は、GPUなどの並列ハードウェア上でのネイティブ実行をサポートするために、GOOMと効率的なカスタムパラレルプレフィックススキャンを実装している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:23:43 GMT)
The geography of novel and atypical research [1.6] 我々は、創造的な作品を生み出すために、新しい科学と非定型科学における国の代表性を定量化し、正当性に永続的な相違を見出す。
我々は、新しい科学を出版する傾向が時間とともにどのように変化するかに基づいて、各国をクラスタリングし、新興国の1つのグループを特定します。
我々の分析は、近年の中国の台頭は、科学における大きな生産者としてだけでなく、より斬新で非典型的な研究を生み出すリーダーとしても指摘している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:42:46 GMT)
Dynamical error reshaping for dual-rail erasure qubits [1.6] 消去チェックや2ビットゲートを行いながらトランスモンノイズの悪影響を抑える方法を示す。
本稿では,これらの操作に対して,消去チェックエラーを2桁の精度で抑制する制御方式を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:35:22 GMT)
Language Models Surface the Unwritten Code of Science and Society [1.6] 本稿では,大規模言語モデル(LLM)が人間のバイアスをどのように受け継がれるかを研究する研究コミュニティに呼びかける。
本稿では,科学のケーススタディを通じて,ピアレビューに隠されたルールを明らかにする概念的枠組みを紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:01:05 GMT)
Quenching, Fast and Slow: Breaking Kibble-Zurek Universal Scaling by Jumping along Geodesics [1.6] 断熱的量子コンピューティングの大きな欠点は、エネルギーギャップの制約を満たすことである。
1つの有望なアプローチは、断続的ショートカット手順のファミリーを高速なAQCに使用することである。
ここでは、断熱力学の高速前進への進化において、余分なハミルトニアンを避ける代替経路について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:26 GMT)
Demystifying Deep Learning-based Brain Tumor Segmentation with 3D UNets and Explainable AI (XAI): A Comparative Analysis [1.6] この研究は、脳腫瘍のセグメンテーションにUNetモデルを適用することに焦点を当てた。
3つのディープラーニングモデルを評価し,最も優れたモデルを特定した。
ResUNetは最高のパフォーマンスモデルであることが判明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:03:31 GMT)
Hierarchical Reinforcement Learning with Low-Level MPC for Multi-Agent Control [1.6] 強化学習(RL)による戦術的意思決定とモデル予測制御(MPC)による低レベル実行を組み合わせた階層的枠組みを提案する。
プレデター・プリーベンチマークでテストしたところ、我々のアプローチは報酬、安全性、一貫性の点でエンドツーエンドとシールドベースのRLベースラインよりも優れています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:49:48 GMT)
The Visual Iconicity Challenge: Evaluating Vision-Language Models on Sign Language Form-Meaning Mapping [1.6] ビデオベースのベンチマークは、視覚言語モデルを評価するための心理言語学的尺度に適応する。
オランダの手話(Sign Language of the Netherlands)で、ゼロおよび数ショット設定で、最先端のVLMを13ドル評価します。
より強い音韻形式予測モデルでは、人間の象徴性判断と相関する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:21:59 GMT)
Formalizing Style in Personal Narratives [1.6] 著者が行う言語的選択のパターンとして,個人的物語のスタイルを形式化する新しいアプローチを提案する。
本フレームワークは,機能言語学,コンピュータ科学,心理学的観察という3つの領域を統合している。
我々はこの枠組みを、外傷後ストレス障害を持つ退役軍人のケーススタディを含む、数百の夢物語に適用する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:48:06 GMT)
Faithful and Interpretable Explanations for Complex Ensemble Time Series Forecasts using Surrogate Models and Forecastability Analysis [1.6] 本稿では,精度と解釈可能性のギャップを埋めるサロゲートに基づく説明手法を開発する。
スペクトル予測可能性分析を統合し,各系列固有の予測可能性の定量化を行う。
結果として得られるフレームワークは、最先端のアンサンブル予測に対する解釈可能なインスタンスレベルの説明を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:49:45 GMT)
Learning Coulomb Potentials and Beyond with Fermions in Continuous Space [1.6] 連続空間自由フェルミオンモデルにおける外部ポテンシャルを学習するためのモジュラーアルゴリズムを提案する。
格子ベースのアプローチと比較して、連続体は新しい数学的課題を提示している。
量子化学における核とイオンの電荷と位置のキャラクタリゼーションが考えられる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:11:17 GMT)
Multi-Turn Human-LLM Interaction Through the Lens of a Two-Way Intelligibility Protocol [1.6] 本稿では,エージェント間のインタラクションのための抽象的プロトコルに基づく,より構造化されたアプローチについて検討する。
このプロトコルは"双方向のインテリジェンス"の概念によって動機付けられ、通信有限状態マシンのペアによってモデル化される。
その結果,人間-LLM相互作用における一方向および二方向のインテリジェンスを捕捉するプロトコルの能力を支持する証拠が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:41:24 GMT)
Classical simulation and quantum resource theory of non-Gaussian optics [1.6] 非ガウス初期状態に適用された測定をシミュレーションするための効率的なアルゴリズムを提案する。
構成は非ガウス状態をガウス状態の線型結合に分解することに基づいている。
量子資源理論の観点から、このタイプの非ガウス性測度の性質を考察し、連続変数量子コンピューティングに関連する状態に対する最適分解を計算する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:33:08 GMT)
An Improved Quantum Algorithm for 3-Tuple Lattice Sieving [1.5] 最短ベクトル問題はポスト量子暗号の基盤の1つである。
SVPに対する最も高速な攻撃はいわゆる Sieving メソッドである。
本稿では,3タプルシービングの量子時間複雑性を20.3098d$から20.2846d$に改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:13:07 GMT)
From Keywords to Clusters: AI-Driven Analysis of YouTube Comments to Reveal Election Issue Salience in 2024 [1.5] 移民と民主主義は、分析されたYouTubeビデオのユーザーコメントの中で最も頻繁に、一貫して解決された問題だった。
これらの結果は、選挙後の調査の結果を裏付けるだけでなく、選挙問題としてのインフレの重要性を否定するものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:02:10 GMT)
Lyapunov-Stable Adaptive Control for Multimodal Concept Drift [1.5] 本稿では,概念ドリフトの存在下での頑健なマルチモーダル学習のための適応制御フレームワークLS-OGDを紹介する。
有界ドリフト条件下では、LS-OGD系の予測誤差は一様に有界となり、ドリフトが停止すると0に収束する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:55:26 GMT)
A Novel Ensemble Learning Approach for Enhanced IoT Attack Detection: Redefining Security Paradigms in Connected Systems [1.5] 本研究は、IoT攻撃検出を改善するために設計された、新しいアンサンブル学習アーキテクチャを提案する。
提案手法は、高度な機械学習技術、特にエクストラツリー、および徹底的な前処理を適用している。
その結果, 高いリコール, 精度, エラー率の低い精度が得られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:15:15 GMT)
On the role of coherence for quantum computational advantage [1.5] 量子計算における経路干渉のコヒーレントな経路干渉の尺度として経路コヒーレンスを導入する。
経路コヒーレンスでスケールする量子遷移振幅を推定するための古典的アルゴリズムを得る。
この結果は,古典計算機を用いた大規模量子計算のシミュレーションに応用できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:16:23 GMT)
Machine-Learning Driven Load Shedding to Mitigate Instability Attacks in Power Grids [1.5] この研究は、電力グリッドに対する不安定な攻撃に焦点を当てている。
システムオペレータは、状況が解決されるまで、一連の負荷を選択してシャットオフする。
本稿では,負荷層決定のためのデータ駆動手法を用いてこの問題に対処する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:55:13 GMT)
A Survey on Self-supervised Contrastive Learning for Multimodal Text-Image Analysis [1.5] 近年のテキストイメージモデルにおけるコントラスト学習のアプローチの概要について述べる。
第3に、プロセスで使用されるテクニックの最新の進歩を紹介し、議論する。
テキスト画像に基づく自己教師付きコントラスト学習モデルの最近の技術応用について論じる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:55:19 GMT)
The debiased Keyl's algorithm: a new unbiased estimator for full state tomography [1.4] 完全状態トモグラフィーのための最初の推定器であるデバイアスド・キールのアルゴリズムについて述べる。
我々は、$n = O(rd/varepsilon2)$コピーが、最適な距離誤差である$varepsilon$をトレースするためにランク-r$混合状態を学ぶのに十分であることを示す。
さらに、$n = O(rd/varepsilon2)$コピーは、より困難なBures距離で$varepsilon$の誤りを学習するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:07:12 GMT)
Training-free AI for Earth Observation Change Detection using Physics Aware Neuromorphic Networks [1.4] 主なボトルネックは、衛星から地上局へのデータの帯域幅制限によるダウンリンクである。
本研究では,自然災害による変化を検出する物理認識ニューロモルフィックネットワーク(PANN)を提案する。
PANNは最先端のAIモデルに対してベンチマークされ、各自然災害カテゴリで同等またはより良い結果を得た。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:32:27 GMT)
SHAP-Based Supervised Clustering for Sample Classification and the Generalized Waterfall Plot [1.4] 膨大な量のデータを処理し、信じられないほど複雑な入出力関係を学習する能力によって、大規模なブラックボックスモデルが標準になりつつある。
これらの手法の欠如は、予測過程を説明できないことであり、それらが信頼できないものとなり、高い状況で利用できない。
Shapley Additive ExPlanations (SHAP)分析は、オリジナルの特徴の観点からモデル予測を説明する能力で人気が高まっている説明可能なAIメソッドである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:45:43 GMT)
Bloated Disclosures: Can ChatGPT Help Investors Process Information? [1.4] ChatGPTのような生成AIツールは、投資家が情報を処理する方法を根本的に変えることができる。
我々は、これらのツールが、株式市場を実験室として利用した複雑な企業情報開示を要約する上での経済的有用性について検討する。
肥大化した開示は、価格効率の低下や情報非対称性の上昇など、資本市場の悪影響と関連していることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:05:41 GMT)
Past, Present, and Future of Bug Tracking in the Generative AI Era [1.3] 従来のバグトラッキングシステムは、手動のレポート、再生、トリアージ、解像度に大きく依存している。
我々は、インテリジェントで大規模言語モデル(LLM)による自動化によって既存のツールを拡張するAIベースのバグトラッキングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:42:30 GMT)
Transversal gates for probabilistic implementation of multi-qubit Pauli rotations [1.3] 本稿では、局所的な物理ユニタリによって実現された論理的ユニタリの確率的実装である弱いゲートのための一般的なフレームワークを紹介する。
我々は,数百万の大規模Clifford+Tゲート数を持つワークロード上で,標準的なClifford+Tアーキテクチャを上回る,新しいフォールトトレラントな量子コンピューティングアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:42:35 GMT)
Towards Neurocognitive-Inspired Intelligence: From AI's Structural Mimicry to Human-Like Functional Cognition [1.3] ニューロ認知インスパイアドインテリジェンス(Neurocognitive-Inspired Intelligence)は、神経科学、認知科学、コンピュータビジョン、AIを組み合わせたハイブリッドアプローチである。
これらのシステムは、人間の脳が柔軟に学習し、推論し、記憶し、知覚し、最小限の監督で現実世界で行動する能力をエミュレートすることを目的としている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:10:55 GMT)
Curl Descent: Non-Gradient Learning Dynamics with Sign-Diverse Plasticity [1.3] 学習力学は、基本的には非段階的な「カール」のようなコンポーネントを含む可能性があることを示す。
小さなカール項は元の解多様体の安定性を保ち、勾配降下と同様の学習力学をもたらす。
この結果から,多様な学習規則を通した堅牢な学習を支援することのできる,特定のアーキテクチャを同定した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:58:43 GMT)
Self-Supervised Learning Strategies for a Platform to Test the Toxicity of New Chemicals and Materials [1.2] 自己教師付き学習を通して学習した表現が、有害物質による変化を効果的に識別する方法を実証する。
分析の結果, 自己教師付き学習を用いた学習表現は, 異なる化合物の作用様式を効果的に区別するのに適していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:51:12 GMT)
Skyrmionic Transport and First Order Phase Transitions in Twisted Bilayer Graphene Quantum Hall Ferromagnet [1.2] 大角ねじれ二層グラフェン(TBLG)は、強いクーロン相互作用駆動対称性破壊相を持つスピン、バレー、および層状擬似スピンからなる多成分量子ホール(QH)プラットフォームを実現する。
そこで本研究では, 層分離TBLGの低エネルギーランダウレベルスペクトルについて検討し, 空調条件付帯電励起を同定し, ゼロフィリング係数でのインターバルリーコヒーレント状態への電界誘起絶縁遷移について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:18:09 GMT)
Interpolative separable density fitting on adaptive real space grids [1.2] 高度に局所化された単一粒子基底関数に対して適応的な実空間格子を組み込む。
高度に局所化された基底集合を持つERRテンソルのISDF圧縮効率は、一様格子と互換性のある滑らかな基底集合の圧縮効率に匹敵する。
我々の研究は、任意の滑らかな基底関数を持つスケーラブルな多体電子構造シミュレーションの経路を確立する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:42:49 GMT)
Controllable Hybrid Captioner for Improved Long-form Video Understanding [1.2] ビデオデータは極めて密度が高く、高次元である。
テキストベースの動画コンテンツの要約は、生よりはるかにコンパクトな方法でコンテンツを表現する方法を提供する。
静的なシーン記述でメモリを豊かにするビジョン言語モデル(VLM)を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:12:07 GMT)
Prepared mind, fast response: A temporal decoupling framework for adaptive knowledge orchestration in open-domain dialogue [1.2] レイテンシ品質のトレードオフは、オープンドメイン対話AIシステムにおける基本的な制約である。
本稿では,非同期知識オーケストレーションによる矛盾を解消する時間的疎結合フレームワークを提案する。
TopiOCQAの評価結果は、PMFRが重み付き同期ベースラインに匹敵する応答品質を維持しながら、95.3%のレイテンシ低減を実現していることを示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:01:00 GMT)
Beyond Monolingual Assumptions: A Survey of Code-Switched NLP in the Era of Large Language Models [1.2] 単一発話における言語とスクリプトの交替であるコードスイッチングは、多言語言語NLPの根本的な課題である。
ほとんどの大規模言語モデル(LLM)は、混合言語入力、限られたCSWデータセット、評価バイアスに苦戦している。
この調査は、CSWを意識したLLM研究308の総合的な分析を初めて提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:45:15 GMT)
Neural PDE Solvers with Physics Constraints: A Comparative Study of PINNs, DRM, and WANs [1.1] 部分方程式 (PDE) は、科学や工学にまたがるモデルを支えるが、解析解は非定型であり、古典的なメッシュベースの解法は高次元でコストがかかる。
この論文は、3つのメッシュフリーニューラルネットワークPDEソルバ、物理インフォームドニューラルネットワーク(PINN)、ディープリッツ法(DRM)、弱い敵ネットワーク(WAN)、ポアソン問題(最大5D)と1D/2Dにおける時間非依存シュラーオーディンガー方程式の統一的な比較を提示する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:41:51 GMT)
LLM meets ML: Data-efficient Anomaly Detection on Unstable Logs [1.1] 不安定なログ(ULAD)の異常検出は、より現実的で、未検討の課題である。
現在のアプローチは主に機械学習(ML)モデルを採用しており、トレーニングには広範なラベル付きデータを必要とすることが多い。
我々は、アンサンブル学習を通じて、決定木、k-アネレスト隣人、フィードフォワードニューラルネットワークといったMLモデルを組み合わせた、ULADのための新しいハイブリッドアプローチであるFlexLogを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:37:26 GMT)
Speed limits of two-qutrit gates [1.1] 本研究では,三段CZゲートの速度限界について検討する。
最適制御理論手法を用いてCZゲートプロトコルを生成する。
従来の量子速度制限法を用いて,量子CZゲートの解析速度限界を導出する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:30:27 GMT)
Reasoning Large Language Model Errors Arise from Hallucinating Critical Problem Features [1.1] 可変複素制約満足論理問題として,o1-mini,o3-mini,DeepSeek-R1,Claude 3.7 Sonnet,Gemini 2.5 Pro Preview,Grok 3 Mini Betaをグラフカラー化でテストする。
誤り率比較とCoT/説明テキスト解析の両方から、RLLMはプロンプトに指定されていないグラフエッジを幻覚させる傾向にあることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:03:00 GMT)
Platform-Agnostic Modular Architecture for Quantum Benchmarking [1.1] 量子コンピューティングベンチマークの断片化がますます進んでいる状況に対処する,プラットフォームに依存しないモジュールアーキテクチャを提案する。
我々はBernstein-Vaziraniのような単純なテストから、観測可能な計算を伴う複雑なハミルトンシミュレーションまで、20以上のベンチマーク変種をサポートしている。
このアーキテクチャは、進化を続けるQED-C Application-Oriented Performance Benchmarks for Quantum Computingスイートの重要な拡張として開発されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:09:56 GMT)
DODO: Causal Structure Learning with Budgeted Interventions [1.0] 本稿では,エージェントが環境の因果構造を自律的に学習する方法を定義するアルゴリズムであるDODOを紹介する。
その結果,最も限られた資源条件を除いて,観測的アプローチに比べ,DODOの性能は向上した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:32:33 GMT)
Sentiment Matters: An Analysis of 200 Human-SAV Interactions [1.0] 共有自動運転車(SAV)は交通システムにおいて重要な部分を占める可能性が高い。
本稿では,200人の人間-SAVインタラクションのデータセットを紹介する。
本稿では,オープンソースの人間-SAV対話データセットを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:30:23 GMT)
Coordinates from Context: Using LLMs to Ground Complex Location References [1.0] ジオコーディング(Geocoding)は、位置参照と実際の地理的位置をリンクするタスクである。
比較的小さな微調整 LLM が,市販モデルよりもはるかに大きなモデルで同等の性能を達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:51:52 GMT)
Optimal lower bounds for quantum state tomography [1.0] in mathbbCd times d$ up to error $varepsilon$ in trace distance において、$n = Omega(rd/varepsilon2)$コピーは階数 $r$ mixed state $rho を学ぶために必要であることを示す。
我々の証明における重要な技術的要素は、プロジェクタートモグラフィーのアルゴリズムで、トレース距離で$varepsilon$の誤差を学習するアルゴリズムを、より厳密なBuresで$O(varepsilon)$の誤差を学習するアルゴリズムに変換することである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:36:48 GMT)
Universal syndrome-based recovery for noise-adapted quantum error correction [1.0] 本稿では,任意のコードやノイズプロセスに対して,エラーシンドロームを識別するアルゴリズムを提案する。
次に、我々のアルゴリズムを用いて、ペッツ回復マップ(症候群に基づくペッツ回復マップ)の変種を開発する。
我々は,IBM量子ハードウェア上で回復回路を実行し,ノイズ適応QECプロトコルのブレークフェア性能の実証に成功した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:27:22 GMT)
Degeneracy Cutting: A Local and Efficient Post-Processing for Belief Propagation Decoding of Quantum Low-Density Parity-Check Codes [1.0] 量子低密度パリティチェック(qLDPC)符号は、スケーラブルなフォールトトレラント量子計算を実現することを約束している。
qLDPC符号を復号化するための一般的なアプローチは、信念伝播デコーダ(BP)を使い、その後に復号化の精度を高めるための後処理ステップを用いることである。
リアルタイムデコーディングでは、処理後アルゴリズムは計算コストが小さく、並列実装を容易にするためにTannerグラフ上のローカル操作にのみ依存することが望ましい。
我々は,各安定化器の支持に制限された情報を操作するBPデコーダの効率的な後処理手法であるデジェネリアシーカット(DC)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:01:30 GMT)
Enhancing Visual Prompting through Expanded Transformation Space and Overfitting Mitigation [0.9] ビジュアルプロンプト(VP)は、トレーニング済みの視覚モデルを下流タスクに適応させるための、パラメータ効率の良い微調整手法として期待されている。
本稿では,ACAVP(Affine, Color, Additive Visual Prompting)を提案する。
ACAVPはVP法間で最先端の精度を達成し、平均精度で線形探索を超越し、分布シフトに優れたロバスト性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:08:15 GMT)
Weights initialization of neural networks for function approximation [0.9] ニューラルネットワークに基づく関数近似は、科学計算と機械学習の発展に重要な役割を果たしている。
基本関数事前学習に基づく再利用可能なフレームワークを提案する。
このアプローチでは、ベースニューラルネットワークはまず、参照ドメイン上の構造対応の族を近似するように訓練される。
学習したパラメータは、より複雑なターゲット関数のためのネットワークの初期化に使用される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:56:26 GMT)
Decentralised Blockchain Management Through Digital Twins [0.9] この研究は、デジタルツインに基づいた動的で分散化されたブロックチェーン管理メカニズムを提案する。
分散化を確保するため、提案したメカニズムは、システムの利害関係者が制御する複数のデジタルツインを利用する。
提案機構によって導入されたオーバーヘッドの性能と影響を予備評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:54:26 GMT)
The Right to Communications Confidentiality in Europe: Protecting Privacy, Freedom of Expression, and Trust [0.9] 我々は、その中核にある通信機密権が3つの個人的および集団的価値を保護していることを示す。
我々は、通信の機密性を保護するための別のEU規則が正当化され、必要であると結論付けている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:05:36 GMT)
Does everyone have a price? Understanding people's attitude towards online and offline price discrimination [0.9] オランダ人の代表的サンプルのうち,2つの消費者調査を実施している。
大多数はオンラインの価格差別が不公平で受け入れがたいと考えており、禁止されるべきだと考えている。
結果を分析して、人々が多くの種類の価格差別を嫌う理由をよりよく理解する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:05:04 GMT)
PyMigTool: a tool for end-to-end Python library migration [0.9] 任意のPythonライブラリ間でコードを自動的に移行できるエンドツーエンドソリューションを開発しました。
まず,321個の実世界のライブラリマイグレーションのベンチマークを用いて,Large Language Models(LLM)のライブラリマイグレーション機能について検討した。
LLMはライブラリのマイグレーションを効果的に行うことができるが、後処理のステップによってはパフォーマンスがさらに向上する可能性がある。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:54:26 GMT)
QuIRK: Quantum-Inspired Re-uploading KAN [0.8] Kolmogorov-Arnold Networks や Kans は、古典的なディープニューラルネットワークを上回る性能を示している。
本稿では,量子データ再アップロード(DR)モデルに基づくkanの量子インスパイアされた変種を紹介する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:00:41 GMT)
Explaining raw data complexity to improve satellite onboard processing [0.8] 本研究では,物体検出および分類タスクの深層学習モデルに対する生データの利用効果について検討した。
2つのオブジェクト検出モデル(YOLOv11nとYOLOX-S)は、生データとL1データセットの両方でトレーニングされる。
その結果,両モデルが低信頼度,中信頼度でも同様に機能する一方で,生データに基づいてトレーニングしたモデルでは,高い信頼度でオブジェクト境界の識別に苦慮していることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:22:46 GMT)
SurveyG: A Multi-Agent LLM Framework with Hierarchical Citation Graph for Automated Survey Generation [0.8] 大規模言語モデル(LLM)は、調査用紙の自動生成にますます採用されている。
LLMに基づくエージェントフレームワークである textbfSurveyG を提案する。
textbfFoundation、textbfDevelopment、textbfFrontierの3つのレイヤで構成されており、セミナルな作品から漸進的な進歩、新たな方向性までの研究の進化を捉えている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:14:20 GMT)
Evaluating Small Vision-Language Models on Distance-Dependent Traffic Perception [0.8] 本稿では,DTPQA(Distance-Annotated Traffic Perception Question Answering)ベンチマークを紹介する。
最初のVisual Question Answering (VQA)ベンチマークは、トラフィックシーンにおける知覚に基づく質問のみに焦点を当てたものだ。
DTPQA上では、いくつかの最先端(SOTA)小型ビジョンランゲージモデル(VLM)を評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:38:41 GMT)
A Mega-Study of Digital Twins Reveals Strengths, Weaknesses and Opportunities for Further Improvement [0.8] 個人(デジタル双子)のデジタル表現は、社会科学と意思決定を変革することを約束する。
我々は,米国代表パネルとそのデジタル双生児を対象に,19個の研究を行った。
双子は75%の精度で個々の反応を再現し、人間の答えとの相関は低かった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:30:22 GMT)
Measuring gravitational lensing time delays with quantum information processing [0.7] 天体物理学的な時間遅延を測定するための新しい手法を提案する。
提案手法は従来よりも指数関数的に少ない光子を用いており、他の方法では不可能な観測を可能にしている。
我々は、光学干渉望遠鏡の校正と、進行中のマイクロレンズイベントの直接質量測定の両方にその用途を探求する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:53:31 GMT)
Efficient Multi Subject Visual Reconstruction from fMRI Using Aligned Representations [0.7] 被験者の脳信号は、トレーニング中にこの共通空間に整列して、意味的に整列した共通脳を形成することができることを示す。
これは、対象固有の軽量モジュールを参照対象に合わせることが、従来のエンドツーエンドのトレーニング方法よりもはるかに効率的であることを示すのに有効である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:49:56 GMT)
Property Classification of Vacation Rental Properties during Covid-19 [0.7] 本研究は,コビッドパンデミック時に活動する休暇料の分類にクラスタリング手法を採用することを提唱する。
このデータセットは、ESRCが出資したConsumer Data Research Centre(CDRC)とAirDNAのコラボレーションで、100万以上のプロパティとホストのデータを含んでいる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:24:59 GMT)
FMI Meets SystemC: A Framework for Cross-Tool Virtual Prototyping [0.7] 物理ハードウェアを必要とせずにソフトウェアを開発するためには、フルシステムシミュレータが一般的に使用される。
SystemCにはネイティブなFMIサポートがないため、より広い共ミュレーション環境への統合が制限されている。
本稿では,FMIを用いてSystemCベースのVPを制御・操作するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:04:19 GMT)
Investigating Matrix Repartitioning to Address the Over- and Undersubscription Challenge for a GPU-based CFD Solver [0.7] 既存のアプローチは、完全にあるいはプラグインベースのGPUソルバを使用しており、それぞれがパフォーマンスと開発努力のトレードオフに直面している。
本稿では、CPU行列アセンブリとGPUベースの線形解のバランスを改善するための分割戦略を提案する。
提案手法は, オーバーサブスクライブ問題を大幅に軽減し, ソルバ性能の向上と資源利用率の向上を図っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:53:12 GMT)
Generation and annotation of item usage scenarios in e-commerce using large language models [0.7] アイテムの組み合わせを動機づける、基本的な使用状況に注目します。
大規模言語モデルを用いて項目使用シナリオを生成する。
その結果, LLMは現実的なアイテム利用シナリオを効果的に生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:37:54 GMT)
Human Action Recognition from Point Clouds over Time [0.6] 本稿では,シーンの背景から人点雲を分割するパイプラインを導入することで,3次元映像からの行動を認識する新しい手法を提案する。
この方法は、深度センサと単眼深度推定の両方から点雲をサポートする。
実験では、認識精度を高めるために、表面の正常、色、赤外線強度、身体部分解析ラベルなどの補助的な特徴が組み込まれている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:21:42 GMT)
Interpretable and Granular Video-Based Quantification of Motor Characteristics from the Finger Tapping Test in Parkinson Disease [0.6] 本稿では,ビデオ記録からPDモータ特性を定量化するコンピュータビジョンに基づく手法を提案する。
低スキネジア、ブレジキネシア、シークエンス・エフェクト、鎮静剤を特徴付けるために、臨床的に関係のある4つの特徴セットが提案されている。
運動障害学会統一パーキンソン病評価尺度 (MDS-UPDRS) の指触診スコアを推定するために, これらの特徴を機械学習分類器の訓練に利用した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:29:31 GMT)
LLMs Reproduce Human Purchase Intent via Semantic Similarity Elicitation of Likert Ratings [0.6] 大規模言語モデル(LLM)は、合成消費者をシミュレートする代替手段を提供するが、数値評価を直接要求すると非現実的な応答分布を生成する。
本稿では,LLMからテキスト応答を抽出し,これらをLikert分布にマッピングする意味的類似度評価(SSR)を提案する。
このフレームワークは、従来の調査メトリクスと解釈可能性を維持しながら、スケーラブルな消費者調査シミュレーションを可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:24:48 GMT)
LATTE: Learning Aligned Transactions and Textual Embeddings for Bank Clients [0.6] LATTEは、生のイベント埋め込みと凍結した言語モデルからのセマンティック埋め込みを整合させる、対照的な学習フレームワークである。
提案手法は,実世界の財務データセット上でのイベントシーケンス表現の学習において,最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:52:29 GMT)
Towards Methane Detection Onboard Satellites [0.6] メタンは温室効果ガスであり、気候変動の主要な要因である。
衛星に搭載された機械学習(ML)は、ダウンリンクコストを低減しつつ、迅速な検出を可能にする。
テクスチュノルト認証データ(UnorthoDOS)を用いて,これらの前処理ステップをバイパスする新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:07:30 GMT)
VeriPy - A New Python-Based Approach for SDR Pipelined/Unrolled Hardware Accelerator Generation [0.6] ソフトウェア定義無線(SDR)は、フレキシブルでカスタマイズされた通信システムを提供することによって、通信分野において重要な役割を果たす。
SDRアプリケーションの性能を高めるため、ハードウェアアクセラレーターは近年広くデプロイされている。
この研究はPythonベースのHLSツールVeriPyを提案し、これはSDR設計に特化したVerilogのハードウェアアクセラレーターの主流アーキテクチャの両方を生成できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:04:01 GMT)
Disambiguation-Centric Finetuning Makes Enterprise Tool-Calling LLMs More Realistic and Less Risky [0.6] 大規模言語モデル(LLM)はますますエンタープライズAPIの呼び出しを担っているが、ほぼ重複したツールが同じユーザ意図で動作しようとすると、日常的にフェールする。
人格駆動の多ターン対話を合成する,曖昧性中心の3段階パイプラインであるDiaFORGEを紹介する。
DiaBENCHのベンチマークでは、DiaFORGEでトレーニングしたモデルは、GPT-4oで27pp、Claude-3.5-Sonnetで49pp、それぞれ最適化されたプロンプトで成功した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:01:00 GMT)
How hard is it to verify a classical shadow? [0.5] 古典的な影 S を考えると、S が量子状態の測定統計を予測していることを示すのは難しいだろうか。
我々は,CSVが局所的クリフォード測定を利用した,[Huang, Kueng, Preskill, Nature Physics 2020] の単純な古典的シャドウプロトコルであっても,CSVはQMA完全であることを示す。
その他の結果の中では、指数関数的に多くの観測可能量に対する CSV が量子階層の第二レベルを一般化するために完備であることを示し、そのようなクラスに対する最初の自然完備問題をもたらす。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:46:18 GMT)
InfoPos: A Design Support Framework for ML-Assisted Fault Detection and Identification in Industrial Cyber-Physical Systems [0.5] InfoPosフレームワークは利用可能な知識とデータ次元のレベルに基づいたユースケースの配置を可能にする。
産業用サイバー物理システムのための障害識別ユースケースである実証実験の結果は、達成された効果を反映している。
達成されたMLモデルのパフォーマンスは、より良いソリューションの指標と見なされる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:09:03 GMT)
A resource theory of gambling [0.5] 我々は、敵情報の資源理論として賭けたケリー基準を再検討した。
目標達成確率を最大化する最適戦略を計算する。
我々はこのフレームワークを分散側情報ゲームに一般化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:37:27 GMT)
MONKEY: Masking ON KEY-Value Activation Adapter for Personalization [0.5] パーソナライズのための一般的な方法として、IP-Adapterは、推論中に被写体を背景から分割するマスクを自動的に生成する。
我々は,この自動生成マスクを第2パスに使用して画像トークンをマスクし,背景ではなく被写体に制限することを提案する。
場所や場所を記述したテキストプロンプトに対して、プロンプトを確定的にマッチングしながら、対象を正確に描写する画像を生成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:20:06 GMT)
Enabling Responsible, Secure and Sustainable Healthcare AI - A Strategic Framework for Clinical and Operational Impact [0.5] 私たちは、責任があり、安全で持続可能なヘルスケアAIを運用するための実用モデルを提供しています。
このフレームワークには、リーダーシップと戦略、MLOps & Technical Infrastructure、ガバナンスと倫理、教育と労働力開発、変革管理と採用の5つの重要な柱が含まれている。
2つのデプロイを通じてそのユーティリティを実証します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:40:59 GMT)
Enabling Personalized Long-term Interactions in LLM-based Agents through Persistent Memory and User Profiles [0.5] 大規模言語モデル(LLM)はAIエージェントの中央制御ユニットとしての役割を担っている。
本稿では、パーソナライズされた長期的なインタラクションを実現するために、永続メモリ、動的コーディネーション、自己検証、およびユーザプロファイルの進化を統合するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:22:16 GMT)
Universal Fault Tolerance with Non-Transversal Clifford Gates [0.5] 我々は、これまでのフラグガジェットに関する研究を、あらゆるクリフォード回路にフラグを付ける一般的なフレームワークに拡張した。
このフレームワークは、フラグを使用して選択された非横断的クリフォードゲートのフォールトトレラントな実現と並行して、$T$ゲートの実装を可能にする。
また,本手法をマジック状態準備,クリフォード回路を用いた一般状態準備,データシンドローム符号に適用する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:21:40 GMT)
TinyGraphEstimator: Adapting Lightweight Language Models for Graph Structure Inference [0.5] 本稿では,テキストグラフ表現から直接グラフ理論パラメータを推論できる言語モデルについて検討する。
複数のランダムグラフモデルから生成される連結グラフのバランスの取れたコレクションであるTinyGraphEstorデータセットを紹介する。
我々は、密度、クラスタリング、色数などのキーグラフパラメータを予測する能力に基づいて、いくつかの小さなオープンモデルを評価する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:47:07 GMT)
Time-Aware Feature Selection: Adaptive Temporal Masking for Stable Sparse Autoencoder Training [0.5] 本稿では,アクティベーションの程度,頻度,コントリビューションの追跡によって特徴選択を調整し,時間とともに進化する重要度を計算するための新しいトレーニング手法であるAdaptive Temporal Masking(ATM)を紹介する。
ATMは、TopKやJumpReLU SAEsのような既存の方法に比べて吸収スコアが大幅に低いが、再現性は良好である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:12:51 GMT)
Hardness of recognizing phases of matter [0.5] 未知の量子状態の物質相を認識することは量子的に難しいことを証明する。
位相認識アルゴリズムの量子計算時間は、未知の状態の$xi$の相関範囲で指数関数的に増加しなければならないことを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:40:42 GMT)
Deblurring in the Wild: A Real-World Image Deblurring Dataset from Smartphone High-Speed Videos [0.4] スマートフォンのスローモーションビデオから構築した,世界最大規模の画像デブロアリングデータセットについて紹介する。
240フレームを1秒でキャプチャすることで、フレームの平均化によって現実的な長時間露光のぼかしをシミュレートし、ぼかし画像を生成する。
我々のデータセットには42,000以上の高解像度のぼかしシャープ画像ペアが含まれており、広く使われているデータセットの約10倍の大きさである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:12:44 GMT)
Quantum Agents for Algorithmic Discovery [0.4] 量子アルゴリズムとプロトコルを自律的に再発見するために、エピソード、報酬に基づく強化学習によって訓練された量子エージェントを導入する。
特に、我々のエージェントは、量子フーリエ変換のための効率的な対数深さ量子回路、グローバーの探索アルゴリズム、強力なコインフリップのための最適な不正戦略を学習する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:38:53 GMT)
GL-PGENet: A Parameterized Generation Framework for Robust Document Image Enhancement [0.4] ドキュメント画像強調(DIE)は、ドキュメントAIシステムにおいて重要なコンポーネントであり、そのパフォーマンスが下流タスクの有効性を決定する。
マルチ劣化カラー文書画像のための新しいアーキテクチャであるGlobal with Local Parametric Generation Enhancement Network (GL-PGENet)について述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:16:02 GMT)
Authentication Security of PRF GNSS Ranging [0.4] この研究は、複数のスプーフィングモデルの下での擬似ランダム関数(PRF)の認証セキュリティを導出する。
本稿では、GalileoのSignal Authentication Service(SAS)に、暗号化されたGalileo E6-C信号を利用する方法を適用する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:04:04 GMT)
OBSR: Open Benchmark for Spatial Representations [0.4] 本稿では地理空間埋め込み器の性能, 精度, 効率を評価するための新しいベンチマークを提案する。
我々のベンチマークは、モダリティに依存しないものであり、3大陸にまたがる多様な都市から7つの異なるデータセットで構成されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:19:28 GMT)
ChatGPT as a Translation Engine: A Case Study on Japanese-English [0.4] 文書レベルの翻訳は、ChatGPTの文レベルの翻訳よりも優れている。
ChatGPTは2つの広く知られている翻訳システムと競合する結果をもたらす。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:25:10 GMT)
An Elementary Characterization of Bargmann Invariants [0.4] 我々は、$n$-次不変量を取ることができる複素値の集合 $B_n$ の完全な特徴づけを与える。
どちらの範囲も複素単位 $n$-gon の$n$-次乗に等しいことを示し、従って凸である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:36:39 GMT)
The Model's Language Matters: A Comparative Privacy Analysis of LLMs [0.3] 我々は,6つの言語指標を定量化し,抽出,反事実記憶,会員推定の3つの攻撃ベクトルを評価する。
イタリアは最も強い漏れを示す一方、英語は高い会員分離性を示す。
フランスとスペインは、モルフォロジーの複雑さが高いため、より大きなレジリエンスを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:59:42 GMT)
Neuro-Symbolic Agents with Modal Logic for Autonomous Diagnostics [0.3] エージェント推論の構造、忠実性、論理的一貫性のスケーリングは、AI研究の重要かつ過小評価されている次元である、と我々は主張する。
本稿では,個々のエージェントの信念状態がKripkeモデルとして正式に表現される,ニューロシンボリックなマルチエージェントアーキテクチャを提案する。
LMの仮説生成を積極的に導く制約を示し、物理的あるいは論理的に不可能な結論に達するのを効果的に阻止する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:39:50 GMT)
Using LLMs to Directly Guess Conditional Expectations Can Improve Efficiency in Causal Estimation [0.3] 過去のデータに基づいて学習した生成モデルによる予測は,これらの推定器の性能向上に有効であることを示す。
オンラインジュエリーオークションの小さなデータセットを用いてケーススタディを考察し,LLM生成推定を予測子として含めることによって推定効率が向上することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:34:06 GMT)
Quantum Multiplexer Simplification for State Preparation [0.3] 本稿では,与えられた量子状態がサブステートに分解できるかどうかを検出するアルゴリズムを提案する。
単純化は、量子多重化器の制御をなくすことによって行われる。
深度とCNOTゲート数の観点からは,本手法は文献の手法と競合する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:49:00 GMT)
Prioritizing Latency with Profit: A DRL-Based Admission Control for 5G Network Slices [0.3] 5Gネットワークは、eMBB、URLLC、mMTCなどの多様なサービスをネットワークスライシングによって実現している。
遅延・利益を考慮したスライス適応制御方式であるDePSACを提案する。
我々のDRLベースのアプローチは遅延認識型報酬関数を取り入れており、サービス遅延による罰則が遅延クリティカルスライスの優先順位付けを動機付ける。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:36:38 GMT)
Learning T-conjugated stabilizers: The multiple-squares dihedral StateHSP [0.3] 非アーベル状態HSPを位数8$の2進群のコピー(正方形の対称性)で解くアルゴリズムを提案する。
このアルゴリズムは、非パウリ安定化器、およびハミルトン分光の問題に関連する関連する対称性を学ぶことに興味がある。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:23:53 GMT)
Exponential improvement in quantum simulations of bosons [0.2] デジタル量子コンピュータ上のボソンのハミルトン量子シミュレーションでは、ヒルベルト空間を有限次元に切り離す必要がある。
ヤン=ミルズ理論やQCDのような格子量子論では、いくつかのハミルトンの定式化と対応するトランケーションが近年進行している。
3人の著者によって提唱された普遍的枠組みは、回路複雑性の指数的スケーリングを$Q$で解決する自然な方法であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:15:06 GMT)
Integral Signatures of Activation Functions: A 9-Dimensional Taxonomy and Stability Theory for Deep Learning [0.2] 活性化関数はニューラルネットワークの表現性と安定性を制御している。
9次元積分シグネチャS_sigma(phi)を用いた厳密な分類フレームワークを提案する。
我々のフレームワークは、原則化された設計指針、試行錯誤から証明可能な安定性とカーネル条件へのアクティベーション選択を移動させる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:03:00 GMT)
Reconstructing the local density field with combined convolutional and point cloud architecture [0.2] ダークマターハローの視線特異速度が与えられた局所的なダークマター密度場の回帰を行うニューラルネットワークを構築した。
我々のアーキテクチャは、畳み込みU-NetとポイントクラウドDeepSetsを組み合わせたものです。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:59:58 GMT)
How Scale Breaks "Normalized Stress" and KL Divergence: Rethinking Quality Metrics [0.2] 研究者は、しばしば2次元散乱プロットの精度を測定するために品質指標を使用する。
最も一般的に使用されるメトリクスの1つ、正規化ストレスは、投影の均一なスケーリング(ストレッチ、縮小)に敏感である。
得られた値がどの程度変化し、これが寸法削減技術の評価にどのように影響するかを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:11:31 GMT)
Non-Clifford Gates are Required for Long-Term Memory [0.2] 本研究では, クロス分散非偏極雑音下でのクリフォード回路は, 入力のメモリを指数関数的に失うことを示す。
Aharonov et al. [STOC1997] は、新しい量子ビットの供給を用いて、一般的な量子回路の耐障害性プロトコルを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:59:44 GMT)
SoK: Scope and Mission of CS&Law [0.2] シンポジウムの名称で「and」という言葉の意味と重要性を論じる。
我々はCS&Lawの範囲の異なる側面を実証する論文を以前公表した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:32:31 GMT)
Spatio-temporal, multi-field deep learning of shock propagation in meso-structured media [0.2] 本研究では, 圧力, 密度, 温度, エネルギー, 物質分布, および2つの速度成分の7つの場を1つの自己回帰的サロゲートに統一するマルチフィールド時間モデル(MSTM)を提案する。
MSTMは多孔質な構成と建築された構成で非線形ショック駆動のダイナミクスを捉え、平均誤差は1.4%と3.2%で、いずれも3桁以上のスピードアップを達成している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:00:33 GMT)
An infinite hierarchy of multi-copy quantum learning tasks [0.2] 測定データから量子状態の学習は、量子情報の基本的な課題である。
任意の素数 c に対して次数 c の明示的な学習タスクを構築することを示し、これは (c - 1)-copy 測定では指数関数的に難しいが、c-copy 測定では効率的に解けることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:57:42 GMT)
Decoding Positive Selection in Mycobacterium tuberculosis with Phylogeny-Guided Graph Attention Models [0.2] 陽性選択は、マイコバクテリウム結核における適応突然変異の出現を促進する。
本稿では,SNPを付加した系統樹をニューラルネットワーク解析に適したグラフ構造に変換するための系統誘導グラフアテンションネットワーク(GAT)を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:06:39 GMT)
Randomized truncation of quantum states [0.2] トレース距離またはロバストネスにおいて、与えられた純状態を最適に近似するスパース状態の混合を見つけるための効率的なアルゴリズムを提供する。
これらのアルゴリズムはまた、これらの最適混合近似に対応するスパース状態の効率的にサンプリング可能なアンサンブルを記述する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:47:07 GMT)
Generation of Volume-Law Entanglement by Local-Measurement-Only Quantum Dynamics [0.2] 我々は,局所的,非ランダムな,しかし非交換的な測定によって,容積法則の絡み合った状態が生成可能であることを示す。
このような大きな絡み合いの生成は、単体演算子の測定のみを用いて達成できることが判明した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:43:37 GMT)
Graph-SCP: Accelerating Set Cover Problems with Graph Neural Networks [0.2] Graph-SCPは、ソリューション空間を含む小さなサブプロブレムを識別することを学ぶことで、既存の最適化解法を強化するグラフニューラルネットワーク手法である。
グラフ-SCPは問題サイズを60~80%削減し,Gurobiと比較して平均10倍の高速化を実現している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:58:29 GMT)
Revealing Interconnections between Diseases: from Statistical Methods to Large Language Models [0.2] 大規模臨床データの手動解析による疾患の相互関係の同定は、労働集約的であり、主観的であり、専門家の意見の不一致を招く。
本研究は,MIMIC-IV EHRのICD-10コードシーケンスとICD-10コードの全セットの2つのデータソースに基づいて,疾患関係を明らかにするための7つのアプローチを評価する。
i)実際の臨床データを用いた統計的共起解析とマスク言語モデリング(MLM)アプローチ,(ii)ドメイン固有のBERT変種,(iii)汎用BERTと文書検索。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:46:38 GMT)
Position Paper: Towards Open Complex Human-AI Agents Collaboration Systems for Problem Solving and Knowledge Management [0.2] 我々は,Human-AI Agents Collaboration Systems(HAACS)のための技術に依存しない,コラボレーション可能なスタンスを提案する。
7次元のコラボスピンと人間とエージェントのコントラストを通して経験的なパターンを読み取ることで、欠落したピースを識別する。
アドホック接着剤を使わず,バイオサイバネティック拡張をスケッチすることなく,新たなエージェントプロトコルとの相互運用性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:19:01 GMT)
Continuous-Time Quantum State Transfer with a Generalized Laplacian [0.1] ラプラシア作用素 L_k = A+kD が支配する連続時間量子ウォークについて検討する。
パラメータkをチューニングすることで、エンドポイント間の状態伝達の忠実度を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:09:36 GMT)
The Complexity of Thermalization in Finite Quantum Systems [0.1] 有限サイズ系のハミルトニアンが与えられたとき、与えられた定常値に熱分解するか緩和するかは計算的に決定可能であることを示す。
この限界における熱化の不確定性を示す最近の研究結果から,本研究は,多体物理学の難易度が問題の原因であることを示唆している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:56:14 GMT)
Localizing entanglement in high-dimensional states [0.1] 本研究では,大規模マルチキュービット状態における絡み合いを,残りのキュービットを測定することで,キュービットのサブセットに局在させるプロトコルについて検討する。
固定部分系上で生成できる最大平均n-三角形は、その補関数を有益値のキーフィギュアとして測定することで得られる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:39:58 GMT)
Exploring the Spectral Edge in SYK Models [0.1] JT(Jackiw-Teitelboim)重力に関する以前の研究は、低温では熱処理されたエントロピーが負となり、焼成されたエントロピーから外れることを示した。
我々は、$mathcal N = 2$ 超対称SYKモデルでモデル化された物質で満たされた超対称ワームホールにおいて同様の効果を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:30:34 GMT)
Repository-Aware File Path Retrieval via Fine-Tuned LLMs [0.1] 大規模言語モデル(LLM)は自然言語を理解できるが、リポジトリの詳細は明らかにされていない。
本稿では,QLoRAとUnslothを最適化した強力なLLMを微調整するファイルパス検索手法を提案する。
Flask、Click、Jinja、FastAPI、PyTorchなどのPythonプロジェクトを微調整し、高い検索精度を得る。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:49:10 GMT)
From Ethical Declarations to Provable Independence: An Ontology-Driven Optimal-Transport Framework for Certifiably Fair AI Systems [0.1] 本稿では、現在のバイアス軽減手法の限界を克服する、証明可能な公正なAIのためのフレームワークを提案する。
感度属性を定義し、論理的推論を通じてプロキシを推論し、偏りのあるパターンの完全な構造を捉えるシグマ代数 G を構成する。
このアプローチは、ZIPコードのようなプロキシが競合を明らかにするローン承認のようなタスクにおいて、完全な公正性を保証する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:18:41 GMT)
Scalable multilingual PII annotation for responsible AI in LLMs [0.1] この研究は、13の未表現ローカライズにまたがる高品質なPIIアノテーションのために設計されたスケーラブルな多言語データキュレーションフレームワークを導入する。
我々のフェーズド・ヒューマン・イン・ザ・ループの方法論は、言語学の専門知識と厳格な品質保証を組み合わせることで、リコールと偽陽性率を大幅に改善する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:12:29 GMT)
Beyond Discrete Categories: Multi-Task Valence-Arousal Modeling for Pet Vocalization Analysis [0.1] 本研究では,2次元空間における感情を表現する連続的ヴァレンス・オーラル(VA)モデルを提案する。
提案手法はVAラベルの自動生成アルゴリズムを用いて,42,553ペット発声サンプルの大規模アノテーションを可能にする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:39:40 GMT)
A Quantum Time-Space Tradeoff for Directed $st$-Connectivity [0.1] 任意の$Sgeq log2(n)$に対して、空間$S$と時間$Tleq 2frac12log(n)log(n/S)+o(log2(n))$を用いてDSTCONの量子アルゴリズムが存在することを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:22:04 GMT)
Production-Grade Local LLM Inference on Apple Silicon: A Comparative Study of MLX, MLC-LLM, Ollama, llama.cpp, and PyTorch MPS [0.1] 我々は,Apple Silicon 上で 5 つの局所的大規模言語モデル (LLM) の体系的,実証的な評価を行う。
MLX, MLC-LLM, llama, Ollama, PyTorch MPSを試験した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:53:38 GMT)
McMining: Automated Discovery of Misconceptions in Student Code [0.1] プログラミングを学ぶとき、学生は様々なプログラミング言語の概念に関する誤解をしばしば生み出す。
我々は、学生のコードのサンプルからプログラミングの誤解をマイニングするタスクであるMcMiningを紹介する。
次に、LLMに基づく2つのMcMinerアプローチを導入し、広範囲な評価を通して、Gemini、Claude、GPTファミリーのモデルが学生コードにおける誤解を発見するのに有効であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:27:39 GMT)
Quantum Max-Cut is NP hard to approximate [0.1] 我々は、定数有界グラフ上の QUANTUM MAX-CUT 問題に対する定数乗法近似を計算するのがNPハードであることを証明する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:32:08 GMT)
MInDI-3D: Iterative Deep Learning in 3D for Sparse-view Cone Beam Computed Tomography [0.0] MInDI-3Dは実世界のスパースビューコーンビームCT(CBCT)アーティファクト除去のための最初の3次元条件拡散モデルである。
以上よりMInDI-3Dの有効性が示され,12.96 (6.10) dB PSNR が未修正スキャンより向上した。
臨床医は、すべての解剖学的部位にまたがる患者の位置決めに十分なモデルとして、我々のモデルを評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:53:47 GMT)
pyGinkgo: A Sparse Linear Algebra Operator Framework for Python [0.0] pyGinkgoはGinkgoライブラリの軽量でPython的なインターフェースである。
pyGinkgoは、Pybind11とaPyとPyTorch互換インターフェースを介してGinkgoの機能を公開することで、高性能なC++バックエンドとPythonのギャップを埋める。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:55:51 GMT)
Work distribution of quantum fields in static curved spacetimes [0.0] 静的な時空における量子スカラー場の作業分布の定式化について検討する。
Unruh-DeWitt粒子検出器の使用は、作業統計を定義して測定するための因果一貫性のあるフレームワークを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:20:59 GMT)
Weak Form Learning for Mean-Field Partial Differential Equations: an Application to Insect Movement [0.0] 感染、捕食、異方性環境条件を受ける昆虫種は、優先的な移動パターンを示す可能性がある。
基礎となるFokker-Planck方程式を学習するために設計されたデータ駆動モデリングアプローチは、そのような振る舞いを理解し予測するための理想的なツールである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:04:32 GMT)
Voxel-scale quantum state control in nanorod ensembles using reconfigurable needle beams [0.0] GaAsに埋め込まれたInAsナノロッドの量子光学応答を選択的に切り替えることができる。
光照射されたナノロッドとダークナノロッドの活性化比は、発光ピーク位置を連続的に制御する。
このコンセプトは、再構成可能な量子エミッタ、回折光学、オンチップのスローライトコンポーネントへの低クロストーク、ウェハスケールのルートを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:10:04 GMT)
Vision-Enabled LLMs in Historical Lexicography: Digitising and Enriching Estonian-German Dictionaries from the 17th and 18th Centuries [0.0] 本稿では,2022年から2025年にかけてエストニア語研究所で行われた大規模言語モデル(LLM)の適用に関する研究について述べる。
著者らは3つの主要な領域に対処する: 現代語形と意味を持つ歴史的辞書を充実させる; 視覚対応のLLMを使用して、ゴシック文字(Fraktur)で印刷されたソース上でテキスト認識を行う; 統一されたクロスソースデータセットを作成する準備をする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:29:22 GMT)
Vibe Coding: Toward an AI-Native Paradigm for Semantic and Intent-Driven Programming [0.0] 本稿では、開発者が所望の「ビブ」の定性記述子とともに高レベルの機能的意図を規定する、AIネイティブプログラミングパラダイムであるビブコーディングを紹介する。
インテリジェントエージェントは、これらの仕様を実行可能なソフトウェアに変換する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:31:53 GMT)
Universal whirling magnetic orders in non-Heisenberg Tsai-type quasicrystal approximants [0.0] Au-Ga-Dy系における非ハイゼンベルク型1/1近似結晶の磁気秩序について検討した。
その結果、[111]結晶軸に沿って渦巻く非コプラナー、強磁性(FM)、反強磁性(AFM)スピン配置が明らかになった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:22:47 GMT)
Uniform mixing in continuous-time quantum walks on oriented, nonabelian Cayley graphs [0.0] 配向、正規、非アーベルケイリーグラフの族が示され、その連続時間量子ウォークは均一な混合を示す。
配向、正規、非アーベルケイリーグラフの族が示され、その連続時間量子ウォークは均一な混合を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:00:58 GMT)
Understanding Exoplanet Habitability: A Bayesian ML Framework for Predicting Atmospheric Absorption Spectra [0.0] 我々は、外惑星の大気吸収スペクトル予測モデルの作成に取り組んでいる。
このモデルは、収集された観測スペクトルと合成スペクトルデータの両方に基づいている。
この研究は、太陽系外惑星の性質や、一般的な太陽系外惑星の気候や居住性に関する理解に寄与することが期待されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:34:07 GMT)
TracE2E: Easily Deployable Middleware for Decentralized Data Traceability [0.0] TracE2Eは複数のノードにまたがるデータ説明可能性とコンプライアンスを提供する。
TracE2Eはプロセスの入力と出力を仲介することで、出所情報を記録し、データ保護ポリシーを実行する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:46:14 GMT)
Towards deterministic non-Gaussianity on a chip [0.0] 光の非ガウス状態を直接生成するためのスケーラブルで効率的なアプローチとして、マイクロリング共振器におけるカスケード自発4波混合(SFWM)を提案する。
SFWMを用いたトリプルト生成は,AlGaAsの現実的なマイクロリング源を用いて,高効率かつ良好なスペクトル特性で実現可能であることを実証した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:27:09 GMT)
The role of entropy production and thermodynamic uncertainty relations in the asymmetric thermalization of open quantum systems [0.0] オープン量子系における加熱と冷却の間の非対称性は、非平衡力学の目印である。
本研究では, エントロピー生成速度の解析式を導出し, 加熱は, 冷却よりも高速な熱化を促進するエントロピー生成から始まることを示した。
量子TKURはこの非対称性と熱電流のゆらぎを結びつけ、エントロピーの生成が大きくなれば変動が抑制され、冷却よりも加熱が安定になることを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:51:18 GMT)
The power of quantum catalytic local operations [0.0] 絡み合い理論の鍵となる結果は、触媒の追加が局所的な操作や古典的なコミュニケーションを通じて可能な状態変換の集合を劇的に拡大することである。
これらのクラスは相容れないことを示し、量子状態変換の異なる面をキャプチャする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:05:41 GMT)
The non-stabilizerness of fermionic Gaussian states [0.0] フェルミオンガウス状態の非安定化性を定量化する効率的な方法を提案する。
対数的減算補正を施したハール乱数状態に匹敵する広範囲な先行挙動を明らかにする。
2次元自由フェルミオントポロジカルモデルにサンプリングアルゴリズムを適用し、位相境界における非安定化性の急激な遷移を明らかにする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:16:00 GMT)
The charge-singlet measurement toolbox [0.0] 古典的および量子シミュレーションおよび離散的および連続的なゲージ理論のための柔軟なツールとして電荷-シグレット測定を適用する方法を示す。
我々のアプローチは、ノイズ低減回路を含む電荷中性(電荷中性)セクターにおける状態準備以上の電荷-シグレット測定の使用を拡大する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:25:26 GMT)
The Rise of the Knowledge Sculptor: A New Archetype for Knowledge Work in the Age of Generative AI [0.0] 本稿では,Human-GenAIコラボレーションのための新しいプロフェッショナルアーチタイプであるKSを紹介する。
KSはビジョンのアーキテクチャを含む能力の枠組みを通じて概念化されている。
実践に基づくヴィグネットはKSの役割を表現しており、自己参照的なアプローチでは、紙自体が表現する彫刻過程の人工物として機能する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:19:17 GMT)
The Quantum Formalism Revisited [0.0] 直線に制限された点のような粒子の単純な系に対して、私は最初、量子力学の構造的要素である簡潔なテーブルにコンパイルする。
多くの類似性にもかかわらず、量子構造における代数的非可換性から生じる、よく知られた基本的な違いがある。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:37:27 GMT)
Temporal Conformal Prediction (TCP): A Distribution-Free Statistical and Machine Learning Framework for Adaptive Risk Forecasting [0.0] TCPは、非定常時系列において、よく校正された予測間隔を構築するための分散フリーフレームワークである。
TCPは、ローリングウィンドウ上に分割等角キャリブレーション層を持つ現代の量子予測器を結合する。
危機風の可視化では、TCP/TCP-RMが膨張し、すぐに間隔帯をボラティリティのスパイクと後退として収縮する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:07:59 GMT)
T-VEC: A Telecom-Specific Vectorization Model with Enhanced Semantic Understanding via Deep Triplet Loss Fine-Tuning [0.0] 本稿では,Gte-Qwen2-1.5B-インストラクトバックボーンを微調整したドメイン適応埋め込みモデルであるT-VECについて述べる。
T-VECはMPNet, BGE, Jina, E5を超越し, テレコム固有の検索において, 優れたドメイン基盤とセマンティック精度を示す。
我々はT-VECとそのトークン化ツールをリリースし、テレコムドメイン内で意味的に忠実なNLPアプリケーションをサポートする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:34:15 GMT)
Superradiant Axionic Black-Hole Clouds as Seeds for Graviton Squeezing [0.0] 標準一般相対性理論 (GR) とチャーン・サイモンズ重力理論 (CS) の両方が, 多モード圧縮状態における絡み合った重力子対の生成を誘導することを示した。
スクイーズ効果の桁数、特に圧縮真空中のグラビトン励起の数は非相対論的極限で推定される。
また、長寿命のアキオン性雲では、超放射能が有効である時間スケールよりも寿命が長い場合において、大きなスクイーズ効果が生じることが示されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:48:59 GMT)
Structured Output Regularization: a framework for few-shot transfer learning [0.0] 従来のトランスファーラーニングは、重みのいくつかを凍結し、タスク固有のレイヤーを追加することで、トレーニング済みの大きなネットワークを再利用する。
本稿では,内部ネットワーク構造を凍結するシンプルかつ効果的なフレームワークであるStructured Output Regularization (SOR)を提案する。
このフレームワークは、モデルを最小限の追加パラメータで特定のデータに調整し、様々なネットワークコンポーネントに容易に適用できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:34:22 GMT)
Stick-Breaking Mixture Normalizing Flows with Component-Wise Tail Adaptation for Variational Inference [0.0] 後部近似のためのコンポーネントワイドテール適応(StiCTAF)を用いたスティック破断混合ベースを提案する。
人工後部実験は、ベンチマークモデルと比較して、尾部回復の改善と複数モードのカバレッジの向上を実証した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:57:27 GMT)
Statistical Benchmarking of Optimization Methods for Variational Quantum Eigensolver under Quantum Noise [0.0] 本研究では,H2分子に対する平均軌道-d変分量子固有解器に適用した数値最適化アルゴリズムの性能について検討する。
目標は、ノイズ中間スケール量子系において一般的に使用される勾配に基づく、勾配のない、大域的な最適化戦略の安定性、精度、計算効率を評価することである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:34:11 GMT)
Stability of digital and analog quantum simulations under noise [0.0] 様々な摂動雑音モデル下でのディジタルおよびアナログ量子シミュレータの安定性を比較した。
2つのパラダイムは、最悪の場合において同等のスケーリングを示し、平均的なエラーキャンセルの異なる形式を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:08:55 GMT)
Spin-Locking Spectroscopy of Harmonic Motion [0.0] 本研究では,200Hzから5kHzの周波数域における単一捕捉イオンの運動ノイズを,2桁の周波数で分解するパワースペクトル密度で測定する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:38:43 GMT)
Speed of evolution in qutrit systems [0.0] 完全に区別可能な状態間の進化速度は、閉じた3レベル(量子)量子系で完全に解析される。
任意の時間非依存ハミルトニアンの下での進化を考えると、対応する量子速度限界がマンデルスタム・タム、マルゴラス・レヴィチン、ネッサ・アルバーティ・サギ境界によって与えられるかどうかによって、関連するパラメータを完全に特徴づける。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:02:44 GMT)
Solving Time-Fractional Partial Integro-Differential Equations Using Tensor Neural Network [0.0] 線形時間-屈折拡散波方程式を解くために,適応テンソルニューラルネットワーク部分空間に基づく新しい機械学習手法を提案する。
提案したテンソルニューラルネットワークに基づく機械学習手法の有効性と精度を検証するために,いくつかの数値例が提供される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 04:11:44 GMT)
Single-shot conditional displacement gate between a trapped atom and traveling light [0.0] キャビティからの光反射と同期した原子の古典的な駆動は、ハイブリッドシステムの普遍的な制御のための重要なゲートの単発実装を実現する。
この提案は、定常原子とイテナント光をコヒーレントに結びつけるための重要な実用ツールを確立し、これはハイブリッド量子情報処理を実現するのに必須の能力である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:00:25 GMT)
Signal-to-Noise Ratio in Scanning Electron Microscopy: A Comprehensive Review [0.0] 走査電子顕微鏡(SEM)における信号対雑音比(SNR)は必須パラメータである
SEMは様々な科学分野で広く使われているが、その用途はノイズによって損なわれ、画像の明瞭さを低下させる。
本稿では,SEMの主動作,SEMのノイズ源,SNR計測と推定方法,SNR計測に影響を及ぼすさまざまな側面,SNR向上へのアプローチなど,SEMイメージングプロセスのさまざまな側面について考察する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:38:46 GMT)
Rule Encoding and Compliance in Large Language Models: An Information-Theoretic Analysis [0.0] 大規模言語モデル(LLM)に基づく安全クリティカルエージェントの設計には、単純なプロンプトエンジニアリング以上のものが必要である。
本稿では,ルールエンコーディングが注意機構やコンプライアンス行動にどのように影響するかを包括的に情報理論で分析する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:08:05 GMT)
Reinforcement Learning-Driven Edge Management for Reliable Multi-view 3D Reconstruction [0.0] 信頼性3次元再構成のための強化学習(RL)に基づくエッジリソース管理フレームワークを提案する。
その結果,動的環境におけるエンドツーエンドのレイテンシと再構築品質を効果的にバランスさせることで,アプリケーションの信頼性を向上させることが示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:54:14 GMT)
Real-time Noise Detection and Classification in Single-Channel EEG: A Lightweight Machine Learning Approach for EMG, White Noise, and EOG Artifacts [0.0] 単一チャネル脳波における眼球,筋 (EMG) , ホワイトノイズアーティファクトのリアルタイム検出と分類のためのハイブリッドスペクトル時間フレームワークを提案する。
30秒のトレーニング時間(CNNよりも97%高速)とSNRレベルの堅牢なパフォーマンスにより、このフレームワークは臨床応用性と計算効率のギャップを埋める。
この研究は、脳波アーチファクト検出のためのモデル深さへのユビキタスな依存にも挑戦し、ドメインインフォームド機能融合が複雑なアーキテクチャをノイズの多いシナリオで超越していることを示します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:36:30 GMT)
Real-Time Instantons in Complex-Driven Qubits [0.0] 我々は、ラビ振動の代わりに、単項コヒーレント駆動が一方向のインスタントン解をもたらすことを示す。
このトンネルの時間スケールは、有効共振結合に逆比例していることが示されている。
ブロッホ球面上の任意の点に強誘電体を配置するために、ドライブをどのように設計するかを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:11:08 GMT)
Re-Identifying Kākā with AI-Automated Video Key Frame Extraction [0.0] 本研究では,k=ak=a(Nestor meridionalis)のビデオから高品質なキーフレームを抽出するためのユニークなパイプラインを提案する。
カスタムフィードの映像記録を用いて,キーフレームを抽出し,パイプラインの再同定性能を評価する。
その結果,提案手法では,k=ak=a再同定において高い精度で画像収集を行うことができた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:46:46 GMT)
RASALoRE: Region Aware Spatial Attention with Location-based Random Embeddings for Weakly Supervised Anomaly Detection in Brain MRI Scans [0.0] 脳MRIスキャンにおける弱い監視された異常検出(WSAD)は、脳の異常を迅速かつ正確に検出する上で有用な重要な課題である。
RASALoRE: 位置情報に基づく新しい2段階WSADフレームワークであるRandom Embeddingsを用いた領域認識空間アテンションを提案する。
提案手法は最先端の異常検出性能を実現し,既存のWSAD法を著しく上回っている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:37:47 GMT)
RAG4Tickets: AI-Powered Ticket Resolution via Retrieval-Augmented Generation on JIRA and GitHub Data [0.0] 本稿では,セマンティック埋め込みのための文変換器をFAISSベースのベクトル検索と統合して,コンテキスト対応のチケット解決レコメンデーションを提供するRetrieval-Augmented Generationフレームワークを提案する。
このフレームワークは、統合パイプラインリンクとGitHubデータ、異種ソフトウェアアーティファクトの埋め込みとFAISSインデクシング戦略、検索されたエビデンスによってガイドされる解決生成モジュールをコントリビュートしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:33:00 GMT)
Quantum variance and fluctuations for Walsh-quantized baker's maps [0.0] ウォルシュ量子化ベーカーマップはトーラス上の量子カオスのモデルである。
D=4$を除いて、すべてのパン屋の地図スケーリング係数$Dge2$に対して、スケールされた行列要素の実験的分布が$sqrtNlangle varphi(j)|operatornameOp_k,ell(a)|varphi(j)rangle-int_mathbbT2a_j=1N$であることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:08:29 GMT)
Quantum theory does not need complex numbers [0.0] 実数量子論は量子論の仮定と一致していることを示す。
結果の直接的な結果は、実数や複素数に基づく量子論は実験的に区別できないことである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:57:43 GMT)
Quantum Shannon Information Theory -Design of communication, cipher and sensor- [0.0] 量子媒体を用いてシャノン情報を伝達する通信システムの理論は、量子シャノン情報理論(quantum Shannon information theory)と呼ばれる。
本稿では,量子シャノン情報理論を現実の通信システムに活用するには,様々な制約が存在することを示唆する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 03:03:22 GMT)
Quantifying entanglement from the geometric perspective [0.0] 本稿では, 近距離分離状態への距離に基づく量化器として, 絡み合いの幾何学的測度について概説する。
基本的な特性、計算のための既存の方法、運用上の解釈、スケーリングや複雑性の問題を説明します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:45:35 GMT)
Quantifying Label-Induced Bias in Large Language Model Self- and Cross-Evaluations [0.0] 大規模言語モデル (LLM) は、テキスト品質の評価器としてますます多くデプロイされている。
本研究では,ChatGPT,Gemini,Claudeの3つのLLMにおける自己モデルと相互モデルの評価の系統的バイアスについて検討した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:01:01 GMT)
Q-ball mechanism of electron transport properties of high-T$_c$ superconductors [0.0] 電子/ホールのフェルミ面近傍の「ネストされた」フェルミオン状態に基づく銅酸化物の高温超伝導の理論
超伝導凝縮体は、フェルミ面のネストされた部分のスペクトルギャップを誘導する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:26:31 GMT)
Pretty Good Bounds on the worst-case Pretty Good Measurement [0.0] 我々は、最悪の量子状態判別のためのPretty Good Measurementの成功確率に基づいて、新しい低い境界を導出する。
私たちのバウンダリは、以前知られていたGram-matrixベースのバウンダリ($mgeq 4$)よりも厳密です。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:50:52 GMT)
Photon-assisted entanglement creation by minimum-error generalized quantum measurements in the strong coupling regime [0.0] 光照射場の助けを借りて、2つの遠方物質量子ビットを絡める可能性を探る。
光子損失がなければ、2ビットのベル状態がユニティに近づいた状態がポストセレクトできる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:22:07 GMT)
Optimizing delivery for quick commerce factoring qualitative assessment of generated routes [0.0] そこで本研究では,大規模言語モデル(LLM)を用いてVRP生成経路をポリシーベース基準に対して批判するフレームワークを提案する。
調査の結果,オープンソースのLCMでは79%の精度でルーティングの問題を特定し,プロプライエタリな推論モデルでは最大86%に達した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:31:58 GMT)
Optimizing VQE Ansatz for Studying Tight-Binding Models with \textit{sd}-Interaction and On-Site Coulomb Repulsion [0.0] VQEアルゴリズムは、オンサイトクーロン反発、最寄りホッピング、およびオンサイトsd-相互作用を持つ格子モデルの基底状態を求める問題に適用する。
我々は、クラスタやジェネリックフォームを含むいくつかのアンサーゼの性能を比較した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:42:05 GMT)
Optimization of Quadratic Constraints by Decoded Quantum Interferometry [0.0] Decoded Quantum Interferometry (DQI) を2次制約を含む最適化問題に拡張する。
我々は、最大QDSATに対してDQI状態を作成するための効率的なアルゴリズムを提供する。
2次OPIがmax-QUADSATのインスタンスであることを示し、アルゴリズムを用いて最適化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:49:17 GMT)
Optimal trace-distance bounds for free-fermionic states: Testing and improved tomography [0.0] 相関行列の推定における誤差が状態のトレース距離誤差にどのように影響するかを示す。
我々は,自由フェルミオン状態の物性試験とトモグラフィーの大幅な進歩を導出した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:38:26 GMT)
Optimal Distillation of Qubit Clocks [0.0] 時間変換不変操作下でのコヒーレンス蒸留について検討した。
各入力量子ビットのコヒーレンスの純度の逆数の1/N$である。
さらに、量子ビットのコヒーレンス蒸留問題における多くの興味深い側面について研究する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:34:05 GMT)
On the modeling of irreversibility by relaxator Liouville dynamics [0.0] 可逆性を破る緩和器は、リウヴィル作用素の関連する自由度を凝縮する。
無関係な自由度は、システムの環境として機能する。
可逆緩和子リウヴィル方程式は、すべての自由度のメモリ効果と初期相関を含む。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:13:01 GMT)
On the Occurence of Critical Learning Periods in Neural Networks [0.0] ニューラルネットワークの可塑性について検討し、臨界学習期間とウォームスタート性能損失を回避できるという概念を実証的に支援する。
循環学習率のスケジュールを用いることで,これらの問題を回避できることを示す。
本研究は, 重要な学習期間と, ウォームスタートニューラルネットワークトレーニングの現在進行中の研究との間に, 重要な関連性を見いだすものである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:34:06 GMT)
New Machine Learning Approaches for Intrusion Detection in ADS-B [0.0] 航空交通管理は、脆弱性のあるAutomatic Dependent Surveillance-Broadcast (ADS-B)プロトコルに依存している。
本研究では,ADS-BのためのAIベースの侵入検知システム(IDS)を改善するための機械学習モデルとトレーニング戦略について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:22:20 GMT)
Mitigating Subject Dependency in EEG Decoding with Subject-Specific Low-Rank Adapters [0.0] ニューラルネットワークアーキテクチャの標準的な線形層や畳み込み層に対するドロップイン置換を提案する。
我々の層は、その重みを共有の主観不変成分に分解することで、主観的変動を捉えます。
経験的に、私たちの層を備えたモデルは、共有重みのみのモデルと、個別に訓練された対象特化モデルの平均の両方を上回ります。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:46:08 GMT)
Measuring What Matters: The AI Pluralism Index [0.0] AI Pluralism Index(AIPI)は、4つの柱(参加型ガバナンス、傾向と多様性、透明性、説明責任)にまたがる生産者とシステム家族を評価する透明でエビデンスに基づく指標である。
この指標は、多元主義的な実践に対するインセンティブを推し進め、政策立案者、調達者、一般大衆に同等の証拠を与えることを目的としている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:19:34 GMT)
Measuring Moral LLM Responses in Multilingual Capacities [0.0] 我々は、フロンティアと主要なオープンソースモデルの応答を、低級および高級の言語で5次元で評価する。
本研究は, GPT-5が各カテゴリーで平均で最高の成績を示したのに対し, 他のモデルでは言語, カテゴリー間で矛盾性を示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:47:40 GMT)
Markets for Models [0.0] 我々は、企業が予測を改善するためにモデルを消費者に販売する市場を調査する。
競争相手の参入を抑えるために、非効率に偏ったモデルや非効率にコストがかかるモデルを選択できることを示します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:08:41 GMT)
Low-temperature Gibbs states with tensor networks [0.0] 本稿では,量子多体系の温度平衡状態を低温で近似するテンソルネットワーク手法を提案する。
共形場の理論の基底状態の性質によって動機付けられ、我々のアンザッツは特に臨界近くに適している。
アンザッツが共形場理論における絡み合いの有限温度スケーリングをいかに再現するかを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:10:10 GMT)
Low-depth measurement-based deterministic quantum state preparation [0.0] 任意の量子状態生成のための低深さ振幅符号化法を提案する。
そこで本研究では,既存の分割コンカレントアルゴリズムに基づいて,最終状態からアシラリー量子ビットをアンタングルする方法を提案する。
提案手法は測定に基づくが決定論的であり,既存の状態準備アルゴリズムに代替的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:22:26 GMT)
Local active error correction from simulated confinement [0.0] 我々は、励起間の整合性相互作用をシミュレートすることにより、トポロジカル符号におけるフォールトトレラントな誤り訂正を行うという古い考え方を洗練する。
我々は、シンドロームを計測し、近隣のプロセッサにメッセージをブロードキャストし、受信したメッセージを使って励起を移動するためのローカルな古典プロセッサの配列を用いて閉じ込めを実装する。
結果のリアルタイムデコーダのダイナミクスは幾何学的に局所的であり、時空では均一であり、グローバルな制御を一切行わない自己組織型である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:41:37 GMT)
Lithographic integration of TES microcalorimeters with SQUID multiplexer circuits for large format spectrometers [0.0] 軟X線遷移エッジセンサ(TES)とマイクロ波SQUID多重回路(mu$MUX)の統合
TESと$mu$MUXプロセスを1つのTES-System-on-a-Chip製造に組み合わせた最初のデモ。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:28:24 GMT)
Length scale estimation of excited quantum oscillators [0.0] 本研究では, 巨大な発振器の変位状態と励起領域が, 長さスケールの量子フィッシャー情報のハイゼンベルクスケーリングを示すことを示す。
本研究では,2つの大規模発振器の絡み合い状態の列を構築し,非絡み合い系に第3の大規模発振器を付加するのと同等の長さの感度を向上させる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:22:47 GMT)
Learning What to Remember: Adaptive Probabilistic Memory Retention for Memory-Efficient Language Models [0.0] トランスフォーマーアテンションは、シーケンス長O(n2)で2次スケールし、長文の使用を制限する。
我々は,厳格なグローバル予算Mの下でどの表現を保持すべきかを学習する確率的,層単位でのトークン選択機構であるAdaptive Retentionを提案する。
トークンの30~50%しか保持しない分類,抽出QA,長期文書要約は,ピークメモリを35~45%カットし,スループットを最大1.8倍向上させるとともに,全モデル性能の95%を維持している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:26:47 GMT)
LIV-Decoherence on Gravitational Cat States [0.0] 本稿では,Londonz Invariance Violation (LIV) シナリオにおける変分関係の量子化から導かれるリンドブラッド方程式を提案する。
この枠組みにより,重力誘起絡み合い効果を示す粒子系の脱コヒーレンス効果を解明することができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:30:05 GMT)
Krylov spread complexity as holographic complexity beyond JT gravity [0.0] 量子ブラックホール物理学における重要な開問題のひとつは、ホログラフィック複雑性の提案の二重解釈である。
我々の研究は、最近の2重スケールSYKと正弦ディラトン重力の接続を利用して、クリロフ拡散複雑性と体積=体積の量的関係が有限温度とディスクレベルでの重力側の完全な量子状態に広がることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:27:17 GMT)
IsoSignVid2Aud: Sign Language Video to Audio Conversion without Text Intermediaries [0.0] 音声言語への手話翻訳は、聴覚障害者と音声障害者を繋ぐ上で重要である。
我々は連続的な文法的な署名よりも、孤立した手話列を持つ手話ビデオを考える。
IsoSignVid2Audは手話ビデオの非文法的連続符号列を音声に変換する新しいエンドツーエンドフレームワークである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:29:59 GMT)
Inverse-Free Wilson Loops for Transformers: A Practical Diagnostic for Invariance and Order Sensitivity [0.0] WILSONは単純なループと内部表現のチェックをシステム信号に変換する。
WILSONは、簡単なループを変換し、内部表現のチェックをシステム信号に変換する、最小限のポストホック診断スイートである。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:41:18 GMT)
Interlaced dynamic XCT reconstruction with spatio-temporal implicit neural representations [0.0] Inmplicit Neural Representations を用いた動的X線CT(Dynamic X-ray Computed Tomography)再構成の検討を行った。
提案手法は,ADMMに基づく最適化と,事前知識を組み込んだ条件付けフレームワークINCODEを組み合わせることで,効率的な収束を実現する。
全ての設定において、我々のモデルは強力なパフォーマンスのロバスト性を実現し、最先端のモデルベース反復法であるTIMBIR(Time-Inter Model-Based Iter Reconstruction)より優れている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:33:58 GMT)
Integer Factoring with Unoperations [0.0] この研究は、ある操作の$hatO$に対して$mathfrakUn(hatO)$というアンオベーションの概念を紹介します。
非操作の動作原理は、加算の例を使って説明される。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:04:43 GMT)
Information Loss and Cost in Symmetry Breaking [0.0] 2つの空間次元における対称性の破れを特徴付ける情報理論の枠組みを開発する。
この観点は自然に、トポロジカルな物質の相における任意の凝縮の記述と結びついている。
我々の結果は、一般化対称性の研究において、作用素代数、テンソル圏論、および量子情報の間の新たな接続を創出する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:06:53 GMT)
Incremental Hybrid Ensemble with Graph Attention and Frequency-Domain Features for Stable Long-Term Credit Risk Modeling [0.0] HYDRA-EIはハイブリッドアンサンブルインクリメンタルラーニングフレームワークである。
リレーショナル、クロス、および周波数ベースの機能を構築する。
HYDRA-EIは新しいデータを使って毎週更新し、単純なパフォーマンスベースの方法でモデルの重みを調整する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:31:04 GMT)
Identifying Video Game Debugging Bottlenecks: An Industry Perspective [0.0] 関連スポンサーコンテンツ この記事では、20人の経験豊富な業界ゲーム開発者が、ゲームの生産中にどのようにデバッグするかについて、ビデオゲームスタジオから洞察を提供する。
私たちの実験は、クラッシュ、オブジェクトの振舞い、オブジェクトの永続化に分類される最も重要なバグのデバッグセッションの記録に依存しています。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:45:05 GMT)
Human-Centered Development of Indicators for Self-Service Learning Analytics: A Transparency through Exploration Approach [0.0] 学習分析の目的は、学習と教育を改善するために、教育データを洞察、決定、行動に変換することである。
提供された洞察、決定、行動の理由付けは、エンドユーザにとって透過的ではないことが多い。
本稿では,透過的な学習分析の実現に光を当てる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:15:54 GMT)
Hubbard-like Interactions and Emergent Dynamical Regimes Between Modulational Instability and Self-Trapping [0.0] 有限二乗格子における離散3次非線形シュル・オーディンガー方程式により制御される一様波動パケットの変調不安定性について検討する。
我々は、初期安定な均一分布が自己追跡(局所化)体制へとどのように進化するかを分析する。
対角的, 対角的, 対角的, 対角的, 対角的, 対角的, 対角的, 対角的, 対角的, 対角的, 対角的, 対角的。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:59:13 GMT)
How We Won BraTS-SSA 2025: Brain Tumor Segmentation in the Sub-Saharan African Population Using Segmentation-Aware Data Augmentation and Model Ensembling [0.0] 脳腫瘍、特にグリオーマは、複雑な成長パターン、浸潤性の性質、個体間の脳構造の変化により、著しい黄斑を呈する。
本研究では,BraTS-Africaデータセット上でセグメント化を意識したオフラインデータ拡張を行い,データサンプルのサイズと多様性を高め,一般化を向上した。
最も優れたモデルであるMedNeXtは1000エポックで訓練され,それぞれ0.86点,0.81点の正常化面距離スコアを達成した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 06:22:41 GMT)
High-fidelity, quasi-deterministic entanglement generation using phase-matched spectral islands in a zero-added-loss multiplexing architecture [0.0] 自然パラメトリックダウンコンバータ(SPDC)は、量子インターネット上での絡み合いを分散するための最も有効な絡み合い源である。
本稿では, スペクトル多重化手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:44:48 GMT)
High-Sensitivity Optical Detection of Electron-Nuclear Spin Clusters in Diamond [0.0] 室温でダイヤモンド中の窒素空孔中心(NV中心)によって偏光されたスピンアンサンブルを用いた高感度核磁気共鳴(NMR)を行う。
近距離ショットノイズ制限光ルミネッセンス検出と高度に均一な磁場により、複数のスピンクラスターから生じる鋭いNMR特性を解明する。
結果は、現在高価な核磁気共鳴システムに依存している動的偏光のアンサンブル測定や、最近提案された核スピンジャイロスコープに関係している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:14:19 GMT)
Hierarchical Spatial Algorithms for High-Resolution Image Quantization and Feature Extraction [0.0] 本研究では,空間画像処理のためのモジュラー・フレームワークを提案する。
グレースケールの量子化、色と明るさの強化、画像のシャープ化、双方向変換パイプライン、幾何学的特徴抽出を統合している。
多様なデータセットに対する実験的評価は、堅牢で決定論的性能を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:56:24 GMT)
Harvesting Contextuality from the Vacuum [0.0] 量子文脈性 (quantum contextuality) とは、特定の測定シナリオがそれらの統計のグローバルな記述を含まないという概念である。
文脈性は非局所的絡み合いと魔法の概念を一般化し、ウィグナー負性に対する非古典性の概念と同等のものであることが示されている。
本稿では、文脈性収穫のプロトコルを導入し、Unruh-DeWittモデルが量子テクスチュアリティを収穫できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:45:51 GMT)
Guiding Exploration in Reinforcement Learning Through LLM-Augmented Observations [0.0] 大規模言語モデル(LLM)は、手続き的知識とテキスト事前学習による推論能力を持っている。
拡張観測空間を通してLLM生成アクションレコメンデーションを提供するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:54:31 GMT)
GazeProphet: Software-Only Gaze Prediction for VR Foveated Rendering [0.0] ファブリケートレンダリングは、バーチャルリアリティーアプリケーションにおける計算要求を大幅に減少させる。
現在のアプローチは高価なハードウェアベースのアイトラッキングシステムを必要とする。
本稿では,VR環境における視線位置を予測するためのソフトウェアのみのアプローチであるGazeProphetを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:07:51 GMT)
From Light-Cone to Supersonic Propagation of Correlations by Competing Short- and Long-Range Couplings [0.0] 本研究では, 競合する短距離および大域のカップリングと多体量子系の相関関係の動的拡散について検討する。
結果が1次元と2次元と消散の有無の両方で成り立つことを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 08:53:36 GMT)
FlowLensing: Simulating Gravitational Lensing with Flow Matching [0.0] 本稿では,強力な重力レンズシミュレーションのためのコンパクトで効率的なフローマッチングモデルであるFlowLensingを紹介する。
スケーラブルなシミュレーションを可能とすることで、我々のモデルはダークマターの研究、特に宇宙調査におけるダークマターのサブストラクチャの探索を進展させることができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:31:47 GMT)
Feature Identification via the Empirical NTK [0.0] 我々は、経験的ニューラルネットワーク(eNTK)の固有解析が、訓練されたニューラルネットワークで使われる特徴を表面化できることを示す。
eNTKは、最上部の固有空間が地中構造と整合するシャープなスペクトル崖を示す。
我々は、層状eNTKが特定の層に特徴を局在させ、eNTKスペクトルの進化をグルーキング相転移の診断に利用できることを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:53:08 GMT)
Fault Tolerance by Construction [0.0] フォールトトレラント量子コンピューティングの主な課題は、ノイズの多い環境での回路の合成と最適化である。
本稿では,構成によって正しいフォールトトレラント量子回路を設計するための枠組みを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:36:32 GMT)
Faraday patterns, spin textures, spin-spin correlations and competing instabilities in a driven spin-1 antiferromagnetic Bose-Einstein condensate [0.0] 準1次元および準2次元のスピン-1 ボース-アインシュタイン凝縮体における一過性ファラデーパターンとスピンテクスチャの形成について検討した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:19:51 GMT)
FMANet: A Novel Dual-Phase Optical Flow Approach with Fusion Motion Attention Network for Robust Micro-expression Recognition [0.0] 微妙な顔の動きを捉えるのが難しいため、微小な表情認識は困難である。
本稿では,マイクロ圧縮相とマイクロ圧縮相の運動力学を統合記述子に統合した総合的な動き表現を提案する。
次に、二相解析と等級変調を学習可能なモジュールに内部化する、新しいエンドツーエンドニューラルネットワークアーキテクチャであるFMANetを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:36:40 GMT)
Exponentially accurate open quantum simulation via randomized dissipation with minimal ancilla [0.0] リンドブラッド力学をシミュレートするいくつかの量子アルゴリズムは、精度$varepsilon$で対数的に短い回路深さを達成する。
観測可能な推定を目的とした複数のジャンプ演算子を用いて一般リンドブラッド力学をシミュレーションする量子アルゴリズムを提案し,対数的に短い回路深さと最小アンシラサイズの両方を達成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:59:30 GMT)
Existence of universal resource and uselessness of too entangled states for quantum metrology [0.0] ある種の線型ハミルトニアンに対する普遍的資源状態の存在を示す。
また、より一般のハミルトニアンを考えると、ランダムな純粋状態は基本的に役に立たないことも示している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:19:14 GMT)
Exact simulation of realistic Gottesman-Kitaev-Preskill cluster states [0.0] 本稿では,現実的なGottesman-Kitaev-Preskill(GKP)クラスタ状態をシミュレーションし,特徴付ける手法について述べる。
キャット状態の育種による単一モードGKP状態の生成と,線形光回路およびホモダイン測定による多モードGKPクラスター状態の形成について検討する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:54:18 GMT)
ExPrESSO: Zero-Knowledge backed Extensive Privacy Preserving Single Sign-on [0.0] サービスプロバイダはSSO(Single-Sign On)を活用して,ユーザによる認証を容易にする。
OIDCのようなSSOの標準化されたシステムは、IDプロバイダがユーザアクティビティを追跡することができるため、ユーザのプライバシを保証しない。
我々は,OIDCと統合したゼロ知識ベースの機構を提案し,サービスプロバイダに関する情報を公開せずに,ユーザがSSOを通じて認証できるようにする。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:42:01 GMT)
Everyone prefers human writers, including AI [0.0] 我々は,Raymond Queneaus Exercises Style (1947) を用いて帰属バイアスを測定する実験を行った。
人間は+13.7ポイント(pp)バイアス(コーエンのh = 0.28, 95%CI: 0.21-0.34)を示し、AIモデルは+34.3ポイントバイアス(h = 0.70, 95%CI: 0.65-0.76)を示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:33:30 GMT)
Evaluation of Differential Privacy Mechanisms on Federated Learning [0.0] フェデレーション学習は、生データを開示することなく、複数のクライアントに分散される。
差分プライバシー(DP)は、モデル更新にノイズを加えることで機密データを保護する技術である。
本研究は,Laplace と Gaussian のメカニズムを用いたDP手法を適応的なプライバシー予算で実装する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:32:36 GMT)
Equivalence of continuous- and discrete-variable gate-based quantum computers with finite energy [0.0] ゲートベースの連続変数量子コンピュータは、量子ビットまたは離散変数量子コンピュータより優れている。
システムの固定エネルギーについては、ゲートベースの連続変数量子コンピュータを使用する場合の超数理計算上の優位性はない。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:55:26 GMT)
Entanglement of mechanical oscillators mediated by a Rydberg tweezer chain [0.0] 本稿では、2つのマイクロエレクトロメカニカル発振器が、光ツイーザーに閉じ込められたリドベルク原子の連鎖を介して相互作用する量子システムを提案する。
我々は、リドベルク原子の放射崩壊のチューナビリティを散逸的絡み合い発生に利用した。
この結果から,Rydberg原子鎖の柔軟性とチューニング性を利用して非古典的相関関係を生成する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:54:38 GMT)
Empirical evaluation of normalizing flows in Markov Chain Monte Carlo [0.0] 現在、MCMCの異なる正規化フローアーキテクチャの体系的な比較は行われていない。
我々は,多数の正規化フローアーキテクチャを広範囲に評価し,そのようなガイドラインを初めて提示する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:09:02 GMT)
Efficient Deployment of CNN Models on Multiple In-Memory Computing Units [0.0] インメモリコンピューティング(IMC)は、ディープラーニングの加速におけるパラダイムシフトである。
本稿では,効率的な資源利用による処理速度の最大化とレイテンシの最小化を目的としたLoad-Balance-Longest-Path (LBLP)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:03:32 GMT)
Edu-EmotionNet: Cross-Modality Attention Alignment with Temporal Feedback Loops [0.0] Edu-EmotionNetは、時間的感情の進化と、ロバストな感情認識のためのモダリティ信頼性を共同でモデル化する新しいフレームワークである。
EmotionNetは最先端のパフォーマンスを実現し、欠落や騒々しいモダリティに対して強い堅牢性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:33:52 GMT)
Dynamic and Geometric Shifts in Wave Scattering [0.0] 1984年のベリーの先駆的な研究以来、進化する波における幾何学的および動的貢献の分離は物理学において基礎となっている。
ここでは、この幾何学的・力学的な分解を波動進化相から波動散乱問題に拡張する。
Wigner-Smith演算子と期待値のシフトの両方がゲージ不変な分解を動的および幾何学的な部分に含めることを示す。
この統一フレームワークは、波動散乱における幾何学と力学の相互作用を照らし、幅広い物理系に適用することができる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:13:15 GMT)
Detecting spills using thermal imaging, pretrained deep learning models, and a robotic platform [0.0] 本稿では,RGBと熱画像を用いた事前学習モデルを用いたリアルタイム流出検知システムを提案する。
VGG19やNasNetMobileといった軽量モデルを使って,最大100%の精度を実現しています。
実際のロボットとテストデータセットによる実験の結果、熱画像に基づいて訓練されたVGG19モデルが最もよく機能することが示された。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:40:58 GMT)
DemandCast: Global hourly electricity demand forecasting [0.0] このモデルは、過去の電力需要と包括的な気象と社会経済の変数を統合し、正規化された電力需要プロファイルを予測する。
我々のアプローチは正確でスケーラブルな需要予測を提供し、エネルギーシステムプランナーや政策立案者に貴重な洞察を与えます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:39:06 GMT)
Defect mediated quantum melting of charge ordered insulators [0.0] We show that the allowed topological order phases which are proximate to the Wigner-Mott insulators strongly depending the charge ordering in the WMI。
WMIのトポロジ的欠陥の増大の観点から、WMIの量子融解遷移と近位QCLについて述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:32:05 GMT)
Decomposition of multi-qutrit gates generated by Weyl-Heisenberg strings [0.0] ワイル・ハイゼンベルク作用素の任意のテンソル積の指数関数を1および2量子ゲートに分解するアルゴリズムを導入する。
このアプローチをゲルマン弦によって生成されるユニタリ(すなわちゲルマン行列のテンソル積)に拡張する。
特に,量子ビット回路におけるCNOT数を削減するために開発されたSteiner-Gauss法を一般化し,量子ビット系におけるゲートルーティングを最適化する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:10:30 GMT)
Data-Error Scaling Laws in Machine Learning on Combinatorial Mutation-prone Sets: Proteins and Small Molecules [0.0] 本研究では、離散空間で訓練された機械学習モデルのデータエラースケーリング法則の傾向について検討する。
典型的なデータエラースケーリング法とは対照的に,学習中に不連続なモノトニック相転移がみられた。
学習曲線を正規化するための代替戦略を提案し,ミュータントに基づくシャッフルの概念を導入する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:57:40 GMT)
Curriculum Learning with Synthetic Data for Enhanced Pulmonary Nodule Detection in Chest Radiographs [0.0] 本研究は, カリキュラム学習と総合的拡張を統合することで, 難治性肺結節の検出が促進されるかどうかを検証した。
FPN(Feature Pyramid Network)バックボーンを備えた高速なR-CNNは、ハイブリッドデータセットでトレーニングされた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 02:06:13 GMT)
Crystal-Field--Driven Magnetoelectricity in the Triangular Quantum Magnet CeMgAl$_{11}$O$_{19}$ [0.0] 偏光性ヘキサアルミン酸塩格子に埋め込まれたクラマース三角磁石である単結晶ceCeMgAl11O19の磁力学的研究
零磁場では、誘電率$varepsilon'(T)$は25Kまでの量子常電体のバレット則に従う。
SI9テトラまでの磁場の応用は、この最小限の温度を高温にシフトさせ、それを拡大させ、調整可能な磁気応答を導出する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:01:45 GMT)
Continual Learning for Adaptive AI Systems [0.0] 継続的学習は適応型人工知能を開発する上で重要な障害である。
規則化テクニックは、モデルのパラメータに制約を加えることによって、過度な適合を防ぐのに役立つ。
損失関数におけるクラスタ間分離(ICS)に基づく新たな正規化手法を提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 00:44:32 GMT)
Concept-Based Generic Programming in C++ [0.0] 概念は、ジェネリックコードの制約を表現するC++の方法である。
最初の例として、狭めの変換を排除した単純な型システムを提案する。
概念は、型システムに対するユーザ定義の拡張を提供するために、全体にわたって使用されます。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 15:27:30 GMT)
Computing $\varphi(N)$ for an RSA module with a single quantum query [0.0] RSAモジュールの$N$に対して$varphi(N)$を、ランダムに選択された整数の代入として$N$を演算する計算時間アルゴリズムを与える。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:28:48 GMT)
Computations and ML for surjective rational maps [0.0] 例: mathbbP2 dashrightarrow mathbbP2$ with emphcubic terms and the indeterminacy locus $I_f ne emptyset$。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:27:10 GMT)
Computational Bell Inequalities [0.0] 本稿では,デバイス非依存の単一プロデューサ対話プロトコルを計算的仮定で解析するための体系的アプローチを提案する。
これはベルの不等式と非局所ゲームとの明示的な対応を確立することで達成される。
計算的仮定がベルの不等式にどのように変換されるかを示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:40:13 GMT)
Composition Law of Conjugate Observables in Random Permutation Sorting Systems [0.0] 乱数置換ソーティングシステム(RPSS)における共役可観測物質を規定する基本構成則の発見について述べる。
この法則は、離散置換数Npと連続経過時間Tとを、時間の特徴関数と置換数の確率生成関数とを連結する関数関係を介して連結する。
この枠組みはエントロピーの浄化を可能にし、幾何学的収束を通して微構造的タイミング変動を均一なランダム性に変換する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:50:21 GMT)
Completeness for Fault Equivalence of Clifford ZX Diagrams [0.0] 2つの回路は、一方の回路の故障の影響が他方の回路の故障の影響よりも悪ければ、ノイズの下で等価であると考えられている。
フォールト等価性は、そのフォールトトレラント特性を保ちながら回路を変換する方法を提供する。
クリフォードZX図形の欠点同値性に対して完全かつ健全な一組のZX書き直しを提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:18:09 GMT)
Climate Knowledge in Large Language Models [0.0] 本研究では,大規模言語モデルが外部検索なしで気候正常を想起する能力について検討した。
我々は,1deg解像度のランドポイントでクエリのグローバルグリッドを構築し,座標と位置記述子を提供し,ERA5の再解析に対する応答を検証する。
その結果, LLM は非自明な気候構造を符号化し, 3-6 degC のルート平均二乗誤差と$pm$1 degC のバイアスを観測した。
地理的コンテキストを含むとエラーが平均で27%減少し、より大きなモデルは位置記述子に最も敏感であることがわかった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:25:36 GMT)
Clifford+V synthesis for multi-qubit unitary gates [0.0] 基本ゲートの有限集合を用いてターゲットゲートを合成するための一般的な枠組みを開発する。
マルチキュービット制御ゲートを合成するための準最適だが短い実行時アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:57:55 GMT)
ClauseLens: Clause-Grounded, CVaR-Constrained Reinforcement Learning for Trustworthy Reinsurance Pricing [0.0] ClauseLensは条約引用のための条項付き強化学習フレームワークである。
透明で規制に順応し、リスクに配慮した条約の引用を生成する。
可溶性違反を51%減らし、テールリスクパフォーマンスを27.9%改善し、節起点の説明では88.2%の精度を達成した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:43:49 GMT)
Classification and implementation of unitary-equivariant and permutation-invariant quantum channels [0.0] 多くの量子情報タスクは$rhootimes m$という形式の入力を使用し、自然に置換やユニタリ対称性を誘導する。
両方の対称性を尊重する全ての量子チャネルを分類する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:35:39 GMT)
Classical and quantum chaotic synchronization in coupled dissipative time crystals [0.0] 2つのコヒーレント結合型散逸時間結晶のダイナミクスについて検討する。
古典的な場合と類似して、この挙動を量子カオス同期と解釈する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:13:43 GMT)
Characterizing Liouvillian Exceptional Points Through Newton Polygons and Tropical Geometry [0.0] ニュートン多角形と熱帯幾何学的アプローチは、リウビリアの例外点(EP)の同定と特徴付けを可能にすることを示す。
我々のアプローチは、リウヴィリアEPの異方性と順序を捉えつつ、摂動の形式に微妙な依存を明らかにしている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:36:20 GMT)
Can Risk-taking AI-Assistants suitably represent entities [0.0] 本研究では,言語モデル(LM)におけるリスク回避の操作性について検討する。
性別固有の態度、不確実性、役割に基づく意思決定、リスク回避の操作性に焦点を当てている。
結果は、人間とAIのリスク選好をより良く整合させるために、AI設計を洗練するための方向性を示唆している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:55:31 GMT)
CORE-3D: Context-aware Open-vocabulary Retrieval by Embeddings in 3D [0.0] 3Dシーンの理解は、AIとロボティクスの具体化の基礎であり、インタラクションとナビゲーションの信頼性をサポートする。
近年のアプローチでは、視覚言語モデル(VLM)により生成された2次元クラス非依存マスクに埋め込みベクトルを割り当てることで、ゼロショットでオープンな3Dセマンティックマッピングを実現している。
プログレッシブな粒度改善を施したセマンティックSAMを用いて、より正確で多数のオブジェクトレベルのマスクを生成する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:45:58 GMT)
Barycentric Neural Networks and Length-Weighted Persistent Entropy Loss: A Green Geometric and Topological Framework for Function Approximation [0.0] BNN(Barycentric Neural Network)は,構造とパラメータを固定されたベースポイントと関連するバリ中心座標によってエンコードする,コンパクトな浅層アーキテクチャである。
我々は,BNNが連続的部分的線形関数(CPLF)の正確な表現を可能にし,セグメント間の厳密な連続性を保証することを示す。
提案手法は,内部パラメータではなく,BNNを定義するベースポイントを最適化するために,LWPEに基づく損失関数とBNNを統合している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:47:53 GMT)
Assurance of Frontier AI Built for National Security [0.0] この覚書は、AIモデルの信頼性とAIモデルの統制可能性の原則を強化することを目的とした4つの推奨事項を提示している。
我々の焦点は、ミスアライメントのオープンな科学的問題とそのAIモデル行動への影響に関するものである。
ミスアライメントから生じる国家安全保障上の脅威に対処するため、私たちは、DoWとICが既存のテストと評価パイプラインとOT権限を戦略的に活用して、AIモデルの信頼性とAIモデルのガバナンス可能性の原則を将来証明することを推奨します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 20:15:07 GMT)
Are Voters Willing to Collectively Secure Elections? Unraveling a Practical Blockchain Voting System [0.0] 本稿では,投票者自身が秘密保持者として参加して投票の秘密を守ることを目的とした,安全な投票という概念を提案する。
実用的なブロックチェーンベースの集合的安全な投票システムの設計と実装を行う。
結果は、秘密保持者としての行動、株式公開への信頼性の高い参加、提案システムに対する高いセキュリティ信頼を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 18:02:40 GMT)
Approximating quantum states by states of low rank [0.0] 正の整数 k が与えられたとき、与えられた密度行列と最高 k のランクの密度行列の集合の間の距離の公式を求めるのは自然である。
この問題は「距離」がトレースあるいはフロベニウスノルムで測定されたときに既に解決されている。
私たちは公式のいくつかの結果を提示します。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:07:05 GMT)
Approximate Degrees of Multisymmetric Properties with Application to Quantum Claw Detection [0.0] この問題の最適量子複雑性は$Omegaleft(sqrtG+(FG)1/6M1/6right)$ for input function $fcolon [F] to Z$ and $gcolon [G] to Z$であることが知られている。
現在の論文は、下界が$|Z|=Omega(FG)$のすべての小さな範囲$Z$に対してさえも成り立つことを証明している。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 01:15:39 GMT)
Analysis of Josephson Junction Barrier Variation: A Combined Electron Microscopy, Breakdown and Monte-Carlo Approach [0.0] 接続における障壁について、それらがどのような結論を導くかを評価する補完的手法を検討する。
電気分解により、障壁の最弱点を探索することができる。
破壊電圧による接合の群化により、中央値抵抗の異なる接合のサブアンサンブルを同定できる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:38:40 GMT)
An Adaptive Multi Agent Bitcoin Trading System [0.0] 本稿では,Large Lan-guage Models(LLMs)を暗号通貨市場でのアルファ生成とポートフォリオ管理に利用したMulti Agent Bitcoinトレーディングシステムを提案する。
提案するフレームワークは,LLMを技術分析,感情評価,意思決定,パフォーマンスリフレクションの専門エージェントに構造化することで,この問題を克服する。
2024年7月から2025年4月までのBitcoin価格データのバックテストでは、市場体制全体で一貫したパフォーマンスが見られた。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:55:52 GMT)
Amplification and Detection of Single Itinerant Microwave Photons [0.0] マイクロ波光子の低エネルギーは、その検出を可視光よりもはるかに困難にする。
ジョセフソンフォトニクス装置は、入射光子のエネルギーとdcバイアスによって駆動される非弾性クーパーペアトンネルを用いる。
2つの乗算ステージを持つデバイスは、長さのガウスパルスに16ドルで乗算し、検出確率は84.5%で、暗カウントレートは10-3/T$である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 10:07:38 GMT)
Adaptive Optimizable Gaussian Process Regression Linear Least Squares Regression Filtering Method for SEM Images [0.0] 本研究では,SEM画像のノイズ分散(NV)を推定するために,SNR(Signal-to-Noise Ratio)推定手法を用いて機械学習モデルを注入する。
提案手法は,SEM画像のSNRおよびNV推定において顕著な成功を示し,フィルタ処理後の平均二乗誤差(MSE)を下げる結果となった。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 07:45:35 GMT)
Adaptive Execution Scheduler for DataDios SmartDiff [0.0] 2つの実行モードを持つ1つの差分エンジン(SmartDiff)に対する適応型スケジューラを提案する。
スケジューラは、CPUとメモリの固定予算内でバッチサイズとワーカー/スレッド数を調整し、p95レイテンシを最小限にする。
合成と公開のベンチマークで、スケジューラは、調整したウォームアップに比べて、p95のレイテンシを23~28%削減する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:40:16 GMT)
Absence of nontrivial local conserved quantities in the Hubbard model on the two or higher dimensional hypercubic lattice [0.0] 我々は、$dge2$を持つ$d$次元超立方体格子上の標準的なHubbardモデルが、非自明な局所保存量を認めていないことを証明した。
これは、保存量がないという白石の証明をフェルミオンモデルに拡張した最初の例である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 09:33:40 GMT)
AI-Driven Radiology Report Generation for Traumatic Brain Injuries [0.0] 頭蓋外傷に適応した自動放射線診断レポート作成のためのAIベースのアプローチを提案する。
本稿では,AC-BiFPNとTransformerアーキテクチャを統合し,複雑な医用画像データのキャプチャと処理を行う。
RSNA脳内出血検出データセットを用いて,本モデルの性能評価を行った。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:39:04 GMT)
A weighted-likelihood framework for class imbalance in Bayesian prediction models [0.0] クラス不均衡は予測毒性学において広範囲にわたる問題であり、非毒性化合物の数がしばしば毒性化合物の数を超える。
本稿では,クラス不均衡に対処し,確率関数を変化させる,単純で一般的なベイズ的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 05:51:59 GMT)
A paradox in the quantum-mechanical treatment of destructive measurements on photons [0.0] 光子の測定は、量子力学(QM)の予測の確認としてしばしば引用される。
しかし、正統的なQMの枠組みにおける固有状態の重ね合わせで生成した光子の物性値の破壊的測定を処理すれば、光子の物性を計測したと主張することは不可能である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:29:05 GMT)
A convergent hierarchy of spectral gap certificates for qubit Hamiltonians [0.0] 局所量子ハミルトニアンのスペクトルギャップを下から有界化するためのSDP証明書の階層を与える。
得られた証明書は一定度の大きさであり、収束する(実際、レベル$n$)ことを証明します。
また、可換な 1-局所ハミルトニアンに対して、階層はスペクトルギャップ上の非下界を証明していることを示す例を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 16:42:21 GMT)
A Semantic Model for Audit of Cloud Engines based on ISO/IEC TR 3445:2022 [0.0] 本稿では,クラウドエンジンのための形式的機械可読セマンティックモデルを提案する。
このモデルは、クラウドシステムを4つの標準インターフェイスに分解する。
セマンティック推論、自動コンプライアンス検証、ベンダー中立設計を可能にします。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 11:32:35 GMT)
A Pseudo-Hermitian Hybrid Model at Finite Temperature: The Role of the Exceptional Points [0.0] 超伝導フラックス量子ビットと有限温度で相互作用するダイヤモンド中の窒素空孔中心の集合体によって形成されるハイブリッドシステムについて検討した。
この系における不純物の存在は擬エルミート的ハミルトニアンによってモデル化される。
系の正確なグランドパーティション関数を構築し,そこから熱力学量の導出を行う。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:44:44 GMT)
A Multiscale Approach for Enhancing Weak Signal Detection [0.0] 本研究では、ウェーブレット変換を用いたマルチスケールアプリケーションにおける共鳴(SR)の適用について検討する。
本稿では,2つの単一閾値検出器を統合し,弱い信号検出を向上する二重閾値検出システムを提案する。
実験により、元のデータ領域において、提案したダブルスレッショルド検出器は、従来のシングルスレッショルド手法と比較して、弱い信号検出を著しく改善することを示した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 19:13:54 GMT)
A Multimodal GUI Architecture for Interfacing with LLM-Based Conversational Assistants [0.0] 本稿では、GUIが音声対応アシスタントと対話できる具体的なアーキテクチャを提供する。
アーキテクチャにより、アプリケーションのナビゲーショングラフとセマンティクスは、モデルコンテキストプロトコル(MCP)を介して利用可能になる。
プライバシとデータセキュリティに関する懸念に対処するため、音声対応マルチモーダルUIのためのローカル展開可能なオープンウェイトLLMの実用的有効性を評価した。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 12:55:47 GMT)
A Multi-Component Reward Function with Policy Gradient for Automated Feature Selection with Dynamic Regularization and Bias Mitigation [0.0] 隠れた依存関係がモデル予測に影響を与えると、静的な機能排除戦略はバイアスを防ぐことができない。
バイアス緩和と自動特徴選択を1つの学習プロセスに統合する強化学習フレームワークを開発した。
予測者が相関し、バイアスが必然的に再帰できる環境において、フレキシブルで一般化可能な機能選択方法を提供する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 22:45:38 GMT)
A Light Weight Cryptographic Solution for 6LoWPAN Protocol Stack [0.0] 本稿では,通常の重暗号AESの代わりに軽量暗号を用いた軽量6LoWPANプロトコルスタックの実装について述べる。
本稿では,無線センサノードが持つ制約に対処するため,この暗号は6LoWPANアーキテクチャに特に適している。
提案された暗号LiCi2はLiCi暗号設計から動機付けられているが、全ての設計基準で外されている。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 23:47:04 GMT)
A Formalization of the Generalized Quantum Stein's Lemma in Lean [0.0] 我々は、リーン対話的定理証明器において、ハヤシとヤマサキ(2024年)で提示された証明を定式化する。
これは、これまでコンピュータで検証された証明を持つ物理学で最も技術的に要求される定理である。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 17:41:13 GMT)
A Distributed Emulation Environment for In-Memory Computing Systems [0.0] インメモリコンピューティング技術は人工知能デバイスで広く使われている。
本研究では,分散・拡張可能なエミュレーションシステムのアーキテクチャ,ソフトウェア開発ツール,実験結果について述べる。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 14:15:35 GMT)
1 Particle - 1 Qubit: Particle Physics Data Encoding for Quantum Machine Learning [0.0] 高エネルギー物理のための新しい量子データ符号化方式である1P1Qを紹介する。
量子機械学習(QML)における1P1Qの有効性を示す。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 13:47:57 GMT)
$\mathsf{P} \neq \mathsf{NP}$: A Non-Relativizing Proof via Quantale Weakness and Geometric Complexity [0.0] We work in the weak Quantale $w_Q=K_mathrmpoly(cdotmidcdot)$.
ランダムな3ドルCNFをマスキングした効率よくサンプリング可能なアンサンブル$D_m$に対して、スイッチング・バイ・ウェイクネスの正規形式を証明する。
論文参考訳(メタデータ) (Thu, 09 Oct 2025 21:01:17 GMT)