Fugu-MT: arxivの論文翻訳(概要)

On the Trustworthiness of Generative Foundation Models: Guideline, Assessment, and Perspective [377.2]
Generative Foundation Models (GenFMs) がトランスフォーメーションツールとして登場した。彼らの広く採用されていることは、次元の信頼に関する重要な懸念を提起する。本稿では,3つの主要なコントリビューションを通じて,これらの課題に対処するための包括的枠組みを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:09:14 GMT)
MuSLR: Multimodal Symbolic Logical Reasoning [133.9]
マルチモーダルな論理的推論は、自律運転や診断などの高度な応用において重要である。形式論理規則を基礎としたマルチモーダルな記号論理的推論のための最初のベンチマーク Mu SLR を導入する。我々は,GPT-4.1のChain-of-Thought性能を14.13%向上させるモジュール型フレームワークであるLogiCAMを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:42:20 GMT)
AudioTrust: Benchmarking the Multifaceted Trustworthiness of Audio Large Language Models [125.4]
オーディオ大言語モデル(ALLMs)は広く採用されているが、信頼性は未定である。音色,アクセント,背景雑音などの非意味的音響的手がかりから生じるALMの有意な信頼性リスクを同定した。本稿では,AudioTrustを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:36:30 GMT)
Experience-Guided Reflective Co-Evolution of Prompts and Heuristics for Automatic Algorithm Design [124.5]
組合せ最適化問題は伝統的に手作りのアルゴリズムで取り組まれている。最近の進歩は、大規模言語モデルによる自動設計の可能性を強調している。本稿では,自動アルゴリズム設計のためのPmpt and Heuristics (EvoPH) を用いた経験進化的リフレクティブ・ガイドを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:56:36 GMT)
HumanVideo-MME: Benchmarking MLLMs for Human-Centric Video Understanding [120.8]
MLLM(Multimodal Large Language Models)は、画像とビデオの両方を含む視覚的理解タスクにおいて、大きな進歩を見せている。既存の人間中心のベンチマークは、主にビデオ生成の品質と行動認識を強調し、人間中心のシナリオに必要な知覚と認知の能力を見落としている。我々は,人間中心のビデオ理解におけるMLLMのより総合的な評価を提供するために,厳格にキュレートされたベンチマークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:05:26 GMT)
Human-MME: A Holistic Evaluation Benchmark for Human-Centric Multimodal Large Language Models [119.5]
MLLM(Multimodal Large Language Models)は視覚的理解タスクにおいて大きな進歩を見せている。 Human-MMEは、人間中心のシーン理解におけるMLLMのより総合的な評価を提供するために設計された、キュレートされたベンチマークである。我々のベンチマークは、単一対象の理解を多対多の相互理解に拡張する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:20:57 GMT)
Muon Outperforms Adam in Tail-End Associative Memory Learning [119.0]
機能埋め込みにかかわらず,Muonはクラス間のバランスの取れた学習を一貫して達成している。我々の経験的観察と理論的分析により、ムオンの核となる利点が明らかとなり、その更新規則は線形連想記憶の外積構造と一致している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:04:08 GMT)
Aristotle: Mastering Logical Reasoning with A Logic-Complete Decompose-Search-Resolve Framework [117.7]
本稿では論理完全推論フレームワークであるAristotleについて,論理解法,論理解法,論理解法,論理解法の3つの主要なコンポーネントを提案する。本フレームワークでは,記号表現と論理規則を総合的に推論プロセスに統合する。いくつかのデータセットの実験結果は、Aristotleが最先端の推論フレームワークを精度と効率の両方で一貫して上回っていることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:35:22 GMT)
Scaling RL to Long Videos [116.0]
LongVILA-R1-7Bはビデオベンチマークで高いパフォーマンスを達成し、ビデオMMEではそれぞれ65.1%と71.1%の精度を達成した。 LongVILA-R1-7Bは最大8,192フレームのビデオフレームとFPS設定をサポートする。各種モダリティのRLトレーニングをサポートする,一般公開のためのトレーニングシステムをリリースする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:13:20 GMT)
Scaling Up Temporal Domain Generalization via Temporal Experts Averaging [108.4]
時間領域の一般化は、時間的変化などの時間的分布シフトを一般化することを目的としている。本稿では, 時間的エキスパート平均化(TEA)を提案する。これは, 一般化ポテンシャルを最大化するために, 重量平均化を用いてモデル全体を更新する, 新しくスケーラブルなTDGフレームワークである。従来のTDG法では最大69%,効率は最大60倍であった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:21:44 GMT)
AccidentBench: Benchmarking Multimodal Understanding and Reasoning in Vehicle Accidents and Beyond [101.2]
AccidentBenchは、自動車事故シナリオとBeyondドメインを組み合わせた大規模なベンチマークである。このベンチマークには、約2000のビデオと19000以上の人間による質問応答ペアが含まれている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:13 GMT)
Game-Time: Evaluating Temporal Dynamics in Spoken Language Models [93.8]
時間的能力を評価するためにGame-Time Benchmarkフレームワークを導入します。多様なSLMモデルについて評価した結果,性能の相違が明らかとなった。 GameTime Benchmarkは、より時間的に認識された会話型AIに向けた将来の研究を導くための基盤を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:23:39 GMT)
Taming Diffusion Transformer for Efficient Mobile Video Generation in Seconds [91.6]
Diffusion Transformer (DiT) はビデオ生成タスクにおいて高いパフォーマンスを示しているが、その高い計算コストは、スマートフォンのようなリソース制約のあるデバイスでは実用的ではない。本稿では,ビデオ生成の大幅な高速化と,モバイルプラットフォームへの実用的な展開を実現するための新しい最適化手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:27:53 GMT)
The Hunger Game Debate: On the Emergence of Over-Competition in Multi-Agent Systems [91.0]
本稿では,超高圧下のエージェントが信頼できない有害な行動を示すマルチエージェント論争における過剰競争について検討する。この現象を研究するために,ゼロサム競争領域下での議論をシミュレートする新しい実験フレームワークであるHATEを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:44:47 GMT)
LargeAD: Large-Scale Cross-Sensor Data Pretraining for Autonomous Driving [88.9]
LargeADは多用途でスケーラブルなフレームワークで、さまざまな現実世界の運転データセットにわたる大規模3D事前トレーニング用に設計されている。我々のフレームワークはVFMを利用して2次元画像から意味的にリッチなスーパーピクセルを抽出する。このアライメントは、クロスモーダルな表現学習を促進し、2Dデータと3Dデータのセマンティック一貫性を高める。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:55:43 GMT)
Understanding the Mixture-of-Experts with Nadaraya-Watson Kernel [87.6]
Mixture-of-Experts (MoE)は最近の最先端の大規模言語モデル(LLM)の基盤となっている。伝統的に、MoEはエキスパート出力を集約するためにルータスコア関数として$mathrmSoftmax$に依存している。 mathrmSoftmax$の代替として,textbfzero-additional-cost Kernel Router with Normalization (KERN)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:04:02 GMT)
MR$^2$-Bench: Going Beyond Matching to Reasoning in Multimodal Retrieval [86.4]
マルチモーダル検索は、現代のAIアプリケーションにおいて重要なコンポーネントになりつつあるが、その評価は、より現実的で困難なシナリオの要求に遅れている。マルチモーダル検索のための推論集約型ベンチマークであるMR$2$-Benchを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:09:14 GMT)
Recursive Self-Aggregation Unlocks Deep Thinking in Large Language Models [85.8]
推論時間計算は、複数の独立解の中から選択するか、あるいは自己精製を通じて逐次的にスケールすることができる。進化的手法にインスパイアされたテスト時間スケーリング手法であるRecursive Self-Aggregation (RSA)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:58:03 GMT)
BatonVoice: An Operationalist Framework for Enhancing Controllable Speech Synthesis with Linguistic Intelligence from LLMs [84.6]
音声生成から命令理解を分離する「操作主義」に着想を得た新しいパラダイムを提案する。本稿では,LLMが導体として機能するフレームワークであるBatonVoiceを紹介し,ユーザの指示を理解する。別個のTSモデルである「オーケストラ」は、これらの特徴から音声を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:52:14 GMT)
PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [83.4]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。 PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:27:49 GMT)
AiDE-Q: Synthetic Labeled Datasets Can Enhance Learning Models for Quantum Property Estimation [83.2]
AiDE-Qは高品質な合成ラベル付きデータセットを反復的に生成する。量子多体系と分子系の多種多様な集合について広範な数値シミュレーションを行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:29:14 GMT)
Towards Reliable and Holistic Visual In-Context Learning Prompt Selection [82.2]
Visual In-Context Learning (VICL) は、視覚基礎モデルを新しいタスクに適用するための顕著なアプローチとして登場した。部分2Global や VPR のような VICL の手法は、クエリ画像とより視覚的に類似したイメージが、より良いコンテキスト内例として機能するという類似性と優先度の仮定に基づいている。本稿では、VICLにおけるテキスト内サンプルの信頼性と包括的選択のために、Partial2Globalの拡張版を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:23:12 GMT)
Atomic Thinking of LLMs: Decoupling and Exploring Mathematical Reasoning Abilities [81.9]
現在の大規模推論モデルは、多様な数学的問題と長い思考連鎖を持つトレーニングデータセットのスケールアップに依存している、と我々は主張する。対照的に、人間は複雑な問題を複数の基本原子能力に分解する傾向がある。本研究は,(1)代数,幾何学,解析,トポロジーの4つの主要な数学分野にまたがる場固有の能力,および(2)概念的理解を含む異なるレベルでの論理能力の2つの次元に分類する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:37:14 GMT)
Generalized Fine-Grained Category Discovery with Multi-Granularity Conceptual Experts [81.7]
Generalized Category Discoveryは、部分的にラベル付けされたカテゴリの知識を活用することでラベル付けされていないデータをクラスタリングする、オープンワールドな問題である。既存のアプローチでは、視覚データにおいて複数の粒度の概念情報を活用できない。精度の高いカテゴリ発見のための多粒度知識を統合した多粒度エキスパートフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:25:11 GMT)
Personalized Reasoning: Just-In-Time Personalization and Why LLMs Fail At It [81.5]
現在の大規模言語モデル(LLM)開発は、タスク解決と優先順位調整を別の課題として扱う。静的ベンチマークを対話型パーソナライズタスクに変換する評価手法であるPreFDISCOを紹介する。我々のフレームワークは、ユーザコンテキストに応じて、同じ質問が異なる推論チェーンを必要とするシナリオを作成します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:55:28 GMT)
DRBench: A Realistic Benchmark for Enterprise Deep Research [81.5]
DRBenchは、エンタープライズ環境で複雑でオープンなディープリサーチタスクでAIエージェントを評価するためのベンチマークである。セールス、サイバーセキュリティ、コンプライアンスなど10のドメインにわたる15のディープリサーチタスクをリリースしています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:47:20 GMT)
Wolf Hidden in Sheep's Conversations: Toward Harmless Data-Based Backdoor Attacks for Jailbreaking Large Language Models [81.4]
Supervised Fine-tuning (SFT) は、大きな言語モデルと人間の意図を協調させ、ラベル付きタスク固有データでトレーニングする。悪意のある攻撃者は、有害な質問応答(QA)ペアにトリガーを埋め込むことで、これらのモデルにバックドアを注入することができる。脱獄型LDMのための新しいテキストクリーンデータバックドアアタックを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:21:07 GMT)
BoxDreamer: Dreaming Box Corners for Generalizable Object Pose Estimation [81.2]
本稿では、スパースビュー設定における課題に対処するために、オブジェクトポーズ推定のための汎用RGBベースのアプローチを提案する。これらの制約を克服するために、オブジェクトのポーズの中間表現としてオブジェクト境界ボックスのコーナーポイントを導入する。 3Dオブジェクトコーナーはスパース入力ビューから確実に復元でき、対象ビューの2Dコーナーポイントは、新しい参照ベースポイントデータセットによって推定される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:17:27 GMT)
Ferret-UI Lite: Lessons from Building Small On-Device GUI Agents [79.8]
Ferret-UI Liteは、様々なプラットフォームで動作する、コンパクトでエンドツーエンドのGUIエージェントである。 Ferret-UI Liteは、他の小規模GUIエージェントとの競合性能を達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:13:56 GMT)
A theoretical framework for self-supervised contrastive learning for continuous dependent data [79.6]
自己教師付き学習(SSL)は、特にコンピュータビジョンの分野で、表現を学習するための強力なアプローチとして登場した。本稿では,サンプル間のアンフェマティック独立に適した対照的なSSLの理論的枠組みを提案する。具体的には、標準のUEAベンチマークとUCRベンチマークでTS2Vecを上回り、それぞれ4.17$%と2.08$%の精度で改善した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:56:25 GMT)
StPR: Spatiotemporal Preservation and Routing for Exemplar-Free Video Class-Incremental Learning [79.4]
CIL(Class-Incremental Learning)は、以前取得した知識を使わずに、時間とともに新しいアクションカテゴリを継続的に学習するモデルの開発を目指している。既存のアプローチでは、メモリとプライバシに関する懸念を忘れたり、あるいは時間的モデリングを無視する静的なイメージベースのメソッドを適用したりする。本稿では,情報を明示的に切り離して保存する,統一的で非定型なVCILフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:06:04 GMT)
DyFlow: Dynamic Workflow Framework for Agentic Reasoning [79.2]
DyFlowは動的ワークフロー生成フレームワークで、タスク要求とリアルタイム中間フィードバックに基づいて推論手順を適応的に構築し、調整する。社会的推論,生物医学的タスク,数学的問題解決,コード生成など,さまざまな領域でDyFlowを体系的に評価する。結果は、DyFlowが既存のベースラインを大幅に上回り、Pass@kの改善を実現し、さまざまなドメインにわたって堅牢な一般化を示すことを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:36:23 GMT)
Dynamic Novel View Synthesis in High Dynamic Range [78.7]
現在の手法は主に静的なシーンに焦点を当てており、すべてのシーン要素が静止していて生きていないことを暗黙的に仮定している。 HDR-4DGSは,革新的な動的トーンマッピングモジュールを備えたガウススプラッティング方式のアーキテクチャである。実験により、HDR-4DGSは、定量的性能と視覚的忠実度の両方において、既存の最先端手法を超越していることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:05:11 GMT)
VerlTool: Towards Holistic Agentic Reinforcement Learning with Tool Use [78.3]
VerlToolは、体系的な設計原則を通じて制限に対処する統一的でモジュール化されたフレームワークです。我々のフレームワークはARLTをマルチターントラジェクトリとして定式化し、マルチモード観測トークン(テキスト/画像/ビデオ)を単一ターンRLVRパラダイムを超えて拡張する。モジュール化されたプラグインアーキテクチャは、軽量Python定義のみを必要とする迅速なツール統合を可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:22:37 GMT)
Stable Cinemetrics : Structured Taxonomy and Evaluation for Professional Video Generation [78.2]
フィルム製造制御を4つの非交叉階層制御ノードに形式化するフレームワークであるStable Cinemetricsを紹介する。 10以上のモデルと20Kビデオにまたがる大規模な人間研究を行い、80以上の映画専門家のプールで注釈を付けました。 SCINEは、ビデオ生成モデルのランドスケープにプロの動画生成を集中させる最初のアプローチである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:22:18 GMT)
CWM: An Open-Weights LLM for Research on Code Generation with World Models [78.0]
我々は、Code World Model (CWM) をリリースし、世界モデルを用いたコード生成の研究を進めます。我々はPythonインタプリタとエージェントDocker環境から大量の観察-アクショントラジェクトリをトレーニング中である。我々は,ワールドモデルがエージェントプログラミングの恩恵を受けるための第一歩として,Pythonコード実行のステップバイステップシミュレーションを実現し,推論が後者にどのようなメリットをもたらすかを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:47:10 GMT)
Learning to Rank Chain-of-Thought: Using a Small Model [77.8]
本稿では、この課題に対処するために設計された高効率で軽量な検証器であるEORM(Energy Outcome Reward Model)を紹介する。 EORMはエネルギーベースのフレームワークを使用してChain-of-Thought(CoT)ソリューションをランク付けし、単純な結果ラベルだけで誤った推論と正しく区別することを学ぶ。 55Mのパラメータだけで、通常の報酬モデルより127倍以上小さいEORMは、Llama 3 8Bの精度をGSM8kで90.7%、MATHで63.7%に向上させた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:50:37 GMT)
ExoPredicator: Learning Abstract Models of Dynamic Worlds for Robot Planning [77.5]
本研究では,内因性行動とメカニズムの両方について,シンボル的状態表現と因果過程を共同で学習する抽象世界モデルのためのフレームワークを提案する。シミュレーションされた5つのテーブルトップロボット環境の中で、学習されたモデルは、より多くのオブジェクトとより複雑な目標を持つ保留タスクに一般化した高速な計画を可能にし、幅広いベースラインを上回ります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:44:34 GMT)
Nudging the Boundaries of LLM Reasoning [77.3]
現在のオンライン強化学習アルゴリズムは、モデルに「解決不可能」な問題から学べない。自己生成ヒントを用いてLLM推論の上界を推し進める「看護」手法であるNuRLを提案する。 NuRLは、テスト時間スケーリングを補完しながら、6つのベンチマークと3つのモデルで一貫した改善を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:01:40 GMT)
dParallel: Learnable Parallel Decoding for dLLMs [77.2]
拡散大言語モデル(dLLM)は並列トークン予測と低推論遅延を提供する。既存のオープンソースモデルは、パフォーマンスを確保するためにトークン長のデコードステップをほとんど必要としています。高速サンプリングのためにdLLMs固有の並列性を解き放つシンプルで効果的な方法であるdParallelを導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:32:52 GMT)
SPARE: Symmetrized Point-to-Plane Distance for Robust Non-Rigid 3D Registration [77.1]
本研究では,SPAREを提案する。SPAREは,非剛性登録のための対称化点-平面間距離を用いた新しい定式化である。提案手法は, 厳密でない登録問題の精度を大幅に向上し, 比較的高い解効率を維持する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:18:42 GMT)
OmniRetarget: Interaction-Preserving Data Generation for Humanoid Whole-Body Loco-Manipulation and Scene Interaction [76.4]
ヒューマノイドロボットの複雑なスキルを教えるための主要なパラダイムは、強化学習ポリシーの運動学的参照として人間の動きを再ターゲットすることである。インタラクションメッシュに基づくインタラクション保存データ生成エンジンであるOmniRetargetを紹介する。人間のメッシュとロボットメッシュの間のラプラシアの変形を最小限にすることで、OmniRetargetは運動学的に実現可能な軌道を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:02 GMT)
Uncertainty Quantification for Regression using Proper Scoring Rules [76.2]
CRPS,対数,2乗誤差,2次スコアなど,適切なスコアリングルールに基づく回帰のための統一的UQフレームワークを提案する。実測パラメトリックな仮定に基づく不確実性尺度に対する閉形式式を導出し、モデルのアンサンブルを用いてそれらを推定する方法を示す。合成および実世界の回帰データセットに対する広範な評価は、信頼性の高いUQ尺度を選択するためのガイダンスを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:52:12 GMT)
MGen: Millions of Naturally Occurring Generics in Context [75.5]
MGenは400万以上の自然発生文と定量化文のデータセットである。データセット内のジェネリクス文の特徴を興味深い洞察で分析する。 MGenは自然発生の汎用文の最大かつ最も多様なデータセットである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:13:51 GMT)
FlashEdit: Decoupling Speed, Structure, and Semantics for Precise Image Editing [75.3]
FlashEditは、高忠実でリアルタイムな画像編集を可能にするように設計された新しいフレームワークである。その効率性は,(1)コストのかかる反復プロセスをバイパスするワンステップ・インバージョン・アンド・編集(OSIE)パイプライン,(2)編集領域内でのみ特徴を選択的に修正することで背景保存を保証するバックグラウンドシールド(BG-Shield)技術,(3)背景への意味的漏洩を抑えることで正確な局所的編集を保証するスカラー化空間横断認識(SSCA)機構の3つの重要なイノベーションに由来する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:48:09 GMT)
IMG: Calibrating Diffusion Models via Implicit Multimodal Guidance [74.9]
Implicit Multimodal Guidance(IMG)は、新しい世代ベースのマルチモーダルアライメントフレームワークである。 IMGはミスアライメントを特定し、再アライメント目標をトレーニング可能な目標に定式化する。 IMGはフレキシブルなプラグアンドプレイアダプタとして機能し、ファインチューニングベースのアライメント手法をシームレスに強化する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:27:03 GMT)
LayerLock: Non-collapsing Representation Learning with Progressive Freezing [74.8]
本稿では、自己教師付き視覚表現学習のためのシンプルで効果的なアプローチであるLayerLockを紹介する。ビデオマスク自動符号化(MAE)モデルのトレーニング中、ViT層は深さの順に収束する。我々は,この観測を,明示的なスケジュールに従ってモデルを段階的に凍結することにより,標準MAEの高速化に活用できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:26:26 GMT)
UniMMAD: Unified Multi-Modal and Multi-Class Anomaly Detection via MoE-Driven Feature Decompression [74.1]
UniMMADは、マルチモーダルおよびマルチクラスの異常検出のための統一されたフレームワークである。 UniMMADは、9つの異常検出データセット上で、3つのフィールド、12のモダリティ、66のクラスにまたがる最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:29:12 GMT)
V-HUB: A Visual-Centric Humor Understanding Benchmark for Video LLMs [72.6]
v-HUBは視覚中心のビデオユーモア理解ベンチマークである。各ビデオクリップは、キャプション、説明、説明を含むリッチなアノテーションとペアリングされる。我々は,特殊なビデオLLMから音声処理が可能な汎用OmniLLMまで,MLLMの多様なセットを評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:33:52 GMT)
EditScore: Unlocking Online RL for Image Editing via High-Fidelity Reward Modeling [71.8]
強化学習(RL)は有望な解決策を提供するが、画像編集におけるその採用は、高忠実で効率的な報酬信号の欠如によって妨げられている。我々は、最先端の特殊報酬モデルの開発を中心に、この障壁を克服するための包括的な方法論を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:34:18 GMT)
Conda: Column-Normalized Adam for Training Large Language Models Faster [70.7]
Column-Normalized Adam (Conda)は、大規模言語モデル(LLM)に対する新しいアプローチである。 Condaはサブスペースに更新を投影し、投影された勾配に基づいてカラムワイズ第2モーメント正規化を適用する。 LLaMAとGPT-2シリーズの実験では、コンダはトレーニング前のAdamW、Muon、その他のベースラインを一貫して上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:02:30 GMT)
FlowRL: Matching Reward Distributions for LLM Reasoning [69.9]
大規模言語モデル(LLM)強化学習(RL)において、報酬を最大化する代わりに、フローバランシングによる全報酬分布をマッチングするフローRLを提案する。我々はスカラー報酬を学習可能な分割関数を用いて正規化対象分布に変換し、その後、ポリシーと対象分布との逆KL分散を最小化する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:25:00 GMT)
OceanGym: A Benchmark Environment for Underwater Embodied Agents [69.6]
OceanGymは、海洋水中のエンボディエージェントに関する最初の総合的なベンチマークである。それは、最も要求の多い現実世界環境の1つでAIを前進させるように設計されている。高忠実で厳格に設計されたプラットフォームを提供することで、OceanGymは堅牢なエンボディAIを開発するためのテストベッドを確立する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:09:32 GMT)
TTT3R: 3D Reconstruction as Test-Time Training [69.5]
テストタイムトレーニングの観点から3次元再構築基盤モデルを再考する。メモリ状態と受信した観測値のアライメントの信頼性を利用して、クローズドフォーム学習率を導出する。この訓練のない介入はTTT3Rと呼ばれ、長さの一般化を大幅に改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:51 GMT)
The Ever-Evolving Science Exam [69.2]
本研究では,基礎モデルの科学的能力を確実に評価するための動的ベンチマークであるEver-Evolving Science Exam (EESE)を紹介する。 1)5つの分野と500以上のサブフィールドにまたがる専門的な科学インスタンス(問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ)から構成される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:00:52 GMT)
LLM-based Multi-Agent Blackboard System for Information Discovery in Data Science [69.2]
従来のAIモデルのためのブラックボードアーキテクチャに着想を得た,新しいマルチエージェント通信パラダイムを提案する。このフレームワークでは、中央エージェントが共有ブラックボードにリクエストをポストし、自律的な従属エージェントがその能力に基づいて応答する。明示的なデータ発見を必要とする3つのベンチマークに対して,本手法の評価を行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:34:23 GMT)
AgenticIQA: An Agentic Framework for Adaptive and Interpretable Image Quality Assessment [69.1]
画像品質評価(IQA)は、人間の視覚系に根ざした知覚品質の定量化と解釈の両方を反映している。 AgenticIQAは、IQAを歪み検出、歪み解析、ツール選択、ツール実行の4つのサブタスクに分解する。本稿では,IQAエージェントに適した大規模命令データセットであるAgenticIQA-200Kと,VLMベースのIQAエージェントの計画,実行,要約機能を評価するための最初のベンチマークであるAgenticIQA-Evalを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:37:01 GMT)
Toward Effective Tool-Integrated Reasoning via Self-Evolved Preference Learning [68.9]
Tool-Integrated Reasoning (TIR)により、大きな言語モデル(LLM)は、外部ツールを統合することで、内部推論能力を改善することができる。提案するTool-Lightは,LDMがTIRを効率的にかつ正確に実行できるようにするためのフレームワークである。 10個のデータセットの実験結果は、ツールライトの有効性を示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:56:53 GMT)
Importance Sampling for Multi-Negative Multimodal Direct Preference Optimization [68.6]
MISP-DPOはマルチモーダルDPOに複数の意味的に多様な負の画像を組み込む最初のフレームワークである。提案手法は,CLIP空間にプロンプトと候補画像を埋め込んで,意味的偏差を解釈可能な因子に発見するためにスパースオートエンコーダを適用する。 5つのベンチマーク実験により、MISP-DPOは従来手法よりも常にマルチモーダルアライメントを改善することが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:24:09 GMT)
ViewSpatial-Bench: Evaluating Multi-perspective Spatial Localization in Vision-Language Models [68.5]
視覚言語モデル (VLM) は視覚的内容の理解と推論において顕著な能力を示した。現在のVLMは、主に自我中心の空間的推論(カメラの観点から)に優れるが、同中心の視点に一般化することができない。マルチ視点空間位置認識評価に特化して設計された,初の総合的なベンチマークであるViewSpatial-Benchを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:53:34 GMT)
Beyond Linear Probes: Dynamic Safety Monitoring for Language Models [67.2]
従来の安全モニタは、クエリ毎に同じ量の計算を必要とする。動的アクティベーションモニタリングのための線形プローブの自然な拡張であるTrncated Polynomials (TPCs)を紹介する。我々の重要な洞察は、TPCを段階的に、短期的に訓練し、評価できるということです。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:32:59 GMT)
Quantized Visual Geometry Grounded Transformer [67.2]
本稿では,VGGTの最初の量子化フレームワーク,すなわちQuantVGGTを提案する。球状前アダマール回転と局所流路平滑化を統合したDual-Smoothed Fine-Grained Quantizationを導入する。また、重層統計量を用いて外周をフィルタするノイズフィルタディバースサンプリングを設計する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:07:52 GMT)
QuantSparse: Comprehensively Compressing Video Diffusion Transformer with Model Quantization and Attention Sparsification [67.2]
拡散変換器は素晴らしいビデオ生成能力を示すが、その計算とメモリの禁止コストは実際の展開を妨げる。モデル量子化とアテンションスパシフィケーションは圧縮に有望な2つの方向であるが、それぞれがアグレッシブ圧縮の下で深刻な性能劣化を被っている。モデル量子化と注意散布を統合した統合フレームワークである textbfQuantSparse を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:14:18 GMT)
M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical Image Segmentation [66.9]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:55:10 GMT)
dVLA: Diffusion Vision-Language-Action Model with Multimodal Chain-of-Thought [66.8]
VLA(Vision-Language-Action)モデルは、ロボット工学の次世代パラダイムとして登場しつつある。単一システムにおける視覚認識,言語推論,ロボット制御を統一する拡散型VLAであるdVLAを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:36:11 GMT)
From Ideal to Real: Unified and Data-Efficient Dense Prediction for Real-World Scenarios [66.6]
DenseWorldは、緊急な現実世界のアプリケーションに対応する、25の密集した予測タスクの幅広いセットにまたがるベンチマークである。次に,DenseDiTを提案する。DenseDiTは,生成モデルの視覚的先行性を利用して,統合された戦略により,多種多様な実世界の密集予測タスクを実行する。 DenseDiTは、ベースラインの0.01%未満のトレーニングデータを使用して優れた結果を得る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:33:46 GMT)
Rotation Control Unlearning: Quantifying and Controlling Continuous Unlearning for LLM with The Cognitive Rotation Space [66.5]
本研究では,学習継続過程における学習度を定量化し,制御する,回転制御アンラーニング(RCU)と呼ばれる新しい手法を提案する。歪対称損失は、回転角の変化が連続的未学習過程をシミュレートできる認知回転空間の存在を構築するように設計されている。複数のデータセットに対する実験により、保持されたデータセットを持たないメソッドがSOTA性能を達成することを確認した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:59:29 GMT)
Large-Scale Targeted Cause Discovery via Learning from Simulated Data [66.5]
本稿では,観測結果から対象変数の因果変数を推定する機械学習手法を提案する。我々は、シミュレートされたデータに基づいて教師あり学習を用いてニューラルネットワークを訓練し、因果関係を推定する。大規模遺伝子制御ネットワークにおける因果関係の同定に優れた性能を示す実験結果が得られた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:15:41 GMT)
SeedPrints: Fingerprints Can Even Tell Which Seed Your Large Language Model Was Trained From [65.8]
我々は,LDMフィンガープリントのより強く,より本質的な概念であるSeedPrintsを提案する。トレーニングされていないモデルでは,パラメータのみに依存した再現可能なトークン選択バイアスが示される。 LLaMAスタイルとQwenスタイルのモデルの実験では、SeedPrintsはシードレベルの識別性を実現し、バイオメトリック指紋に似た生来からライフサイクルの識別認証を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:34:08 GMT)
FameMind: Frame-Interleaved Video Reasoning via Reinforcement Learning [65.4]
現在のビデオ理解モデルは、各質問の特定の推論条件にかかわらず、固定されたフレームサンプリング戦略に依存し、所定の視覚入力を処理する。この静的アプローチは、視覚的エビデンスを適応的に収集する能力を制限し、広範囲の時間的カバレッジやきめ細かい空間的詳細を必要とするタスクにおいて、最適以下のパフォーマンスをもたらす。 Frame-Interleaved Chain-of-Thought (FiCOT)を通して、モデルが推論中に視覚情報を動的に要求することを可能にする強化学習で訓練されたエンドツーエンドフレームワークであるFrameMindを紹介する。従来のアプローチとは異なり、FrameMindは複数のターンで動作し、モデルがテキスト推論とアクティブな視覚知覚を交互に切り替え、ツールを使って抽出する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:09:35 GMT)
Seeing Through Deception: Uncovering Misleading Creator Intent in Multimodal News with Vision-Language Models [65.2]
DeceptionDecodedは,信頼に値する参照記事に基づく12,000のイメージキャプチャペアのベンチマークである。データセットは、誤解を招くケースと、誤解を招くケースの両方をキャプチャし、視覚的およびテキスト的モダリティにわたって操作する。インテント中心の3つのタスク – 意図の検出を誤解させる、ソースの属性を誤解させる、創造的欲求推論 – をサポートしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:53:25 GMT)
PatchVSR: Breaking Video Diffusion Resolution Limits with Patch-wise Video Super-Resolution [65.1]
条件付き誘導のためのデュアルストリームアダプタを統合したPatchVSRという革新的な手法を提案する。提案手法はパッチレベルで高忠実で高解像度の細部を合成できることを示す。 512x512の解像度ベースモデルに基づいて、非常に高い効率で高い競争力を持つ4K VSRを実現することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:55:14 GMT)
Fast-dLLM v2: Efficient Block-Diffusion LLM [64.4]
Fast-dLLM v2はブロック拡散言語モデルで、訓練済みのARモデルをdLLMに適応して並列テキストを生成する。これは、Dream(580Bトークン)のようなフルアテンション拡散LDMと比較して、トレーニングデータの500倍の減少を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:40:18 GMT)
SCUBA: Salesforce Computer Use Benchmark [63.7]
SCUBAは、Salesforceプラットフォーム内の顧客関係管理(CRM)上のコンピュータ利用エージェントを評価するために設計されたベンチマークである。 SCUBAには、実際のユーザインタビューから派生した300のタスクインスタンスが含まれており、3つの主要なペルソナ、プラットフォーム管理者、セールス担当者、サービスエージェントで構成されている。ゼロショット設定とデモ拡張設定の両方で、多様なエージェントのセットをベンチマークします。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:48:49 GMT)
Diversity-Incentivized Exploration for Versatile Reasoning [63.7]
textbfDi-textbf Incentivized Exploration for textbfVersatiltextbfE textbfReasoningを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:11:46 GMT)
Answer, Refuse, or Guess? Investigating Risk-Aware Decision Making in Language Models [63.6]
言語モデル(LM)は、目標を達成するために自律的に行動可能なエージェントを構築するために、ますます使われています。本研究では,人為的リスク構造を体系的に変化させる評価枠組みを用いて,この「回答または延期」問題を考察する。回答や判断に要する独立したスキルを分離した簡易なスキル分解手法が,LMの意思決定ポリシーを一貫して改善できることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:18:59 GMT)
DiffTex: Differentiable Texturing for Architectural Proxy Models [63.4]
非秩序な写真からテクセルレベルでアーキテクチャプロキシモデルのための現実的なテクスチャマップを自動生成する手法を提案する。提案手法は,UVマップ上のテックセルと入力画像中のピクセルとの対応性を確立し,各テクセルの色を関連するピクセル値の重み付けとして計算する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:15:45 GMT)
PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.0]
既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。 Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:07:53 GMT)
Continuous Space-Time Video Super-Resolution with 3D Fourier Fields [62.3]
連続時空ビデオ超解像のための新しい定式化法を提案する。モデリング関節は空間的および時間的超解像の両方を大幅に改善することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:34:02 GMT)
FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting [62.3]
本稿では,長編ビデオによる思考の概念を紹介し,新しいフレームワークFrameThinkerを提案する。 FrameThinkerは,処理フレーム数を劇的に削減しつつ,ベースラインよりも+10.4%の大幅な平均改善を実現していることを示す。最も注目すべきは、7BモデルであるFrameThinkerがLongVideo-Reason上で新しい最先端技術を確立し、平均20.6フレームで76.1%の精度を実現したことです。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:55:37 GMT)
PFDepth: Heterogeneous Pinhole-Fisheye Joint Depth Estimation via Distortion-aware Gaussian-Splatted Volumetric Fusion [61.6]
ヘテロジニアス多視点深度推定のための最初のピンホール・フィッシュアイ・フレームワークPFDepthを提案する。 PFDepthは、ピンホールと魚眼カメラの任意の組み合わせを、様々な内在と外生とで処理できる統一アーキテクチャを採用している。我々は,現在の主流深度ネットワーク上でのKITTI-360およびRealHetデータセットに対して,PFDepthが最先端の性能を示すことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:38:59 GMT)
A Survey on Code Generation with LLM-based Agents [61.5]
大規模言語モデル(LLM)を利用したコード生成エージェントは、ソフトウェア開発パラダイムに革命をもたらしている。 LLMは3つのコア特徴によって特徴づけられる。本稿では,LLMに基づくコード生成エージェントの分野を体系的に調査する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:34:50 GMT)
Self-Supervised Anatomical Consistency Learning for Vision-Grounded Medical Report Generation [61.4]
医用画像の臨床的に正確な記述を作成することを目的とした医用レポート生成。本稿では, 自己監督型解剖学的一貫性学習(SS-ACL)を提案し, 生成された報告を対応する解剖学的領域と整合させる。 SS-ACLは、ヒト解剖学の不変のトップダウン包摂構造にインスパイアされた階層的な解剖学的グラフを構築する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:59:06 GMT)
CoFFT: Chain of Foresight-Focus Thought for Visual Language Models [61.3]
フォレスト・フォーカス思考の連鎖(英語: Chain of Foresight-Focus Thought, CoFFT)は、人間の視覚的認知をエミュレートすることによって視覚的推論を強化する訓練のないアプローチである。これらの段階は反復的に機能し、推論が視覚的焦点を導き、視覚的焦点がその後の推論を知らせる相互依存サイクルを生成する。 Qwen2.5-VL、InternVL-2.5、Llava-Nextを使った複数のベンチマークでの実証結果では、3.1-5.8%が一貫したパフォーマンス向上を示し、計算オーバーヘッドは増大した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:59:16 GMT)
Backdoor Attribution: Elucidating and Controlling Backdoor in Language Models [61.3]
微調整された大規模言語モデル(LLM)は、データ中毒によるバックドア攻撃に対して脆弱である。 LLMの安全性の解釈可能性に関するこれまでの研究は、アライメント、ジェイルブレイク、幻覚に焦点を当てる傾向にあるが、バックドア機構を見落としている。本稿では,3部構成の因果解析フレームワークであるBackdoor Attribution (BkdAttr) によるLCMバックドアの解釈機構について検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:52:35 GMT)
A Multi-Language Object-Oriented Programming Benchmark for Large Language Models [61.3]
35の既存ベンチマークの調査では、3つの大きな不均衡が明らかになった。 85.7%は単一のプログラミング言語に重点を置いている。 94.3%は関数レベルまたはステートメントレベルのタスクのみを対象としている。 80%以上は平均10件未満のテストケースを含む。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:30:08 GMT)
OrthAlign: Orthogonal Subspace Decomposition for Non-Interfering Multi-Objective Alignment [61.0]
大規模言語モデル(LLM)のアライメントは、複数の人間の好みに対処する際に重要なジレンマに直面します。我々は、優先順位調整における勾配レベルの対立を解決する革新的なアプローチであるOrthAlignを提案する。我々はOrthAlignが多重目的アライメント後の34.61%から50.89%の最大単一参照改善を実現していることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:49:29 GMT)
TUMIX: Multi-Agent Test-Time Scaling with Tool-Use Mixture [60.9]
本稿では,複数のエージェントを並列に実行するアンサンブルフレームワークを提案する。 TUmixは、最先端のツール拡張およびテストタイムスケーリングメソッドよりも大幅に向上する。エージェントの多様性と品質は重要であり,LLMを用いてエージェント設計を自動最適化することで向上することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:19:56 GMT)
MobileLLM-R1: Exploring the Limits of Sub-Billion Language Model Reasoners with Open Training Recipes [60.6]
強い推論能力は、はるかに少ないデータで実現可能であることを示す。 MobileLLM-R50MのAIMEスコアは15.5であり、OLMo-2-1.48Bは0.6、SmolLM-2-1.7Bは0.3である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:16:06 GMT)
Beyond Next Token Probabilities: Learnable, Fast Detection of Hallucinations and Data Contamination on LLM Output Distributions [60.4]
LLM出力シグナチャの効率的な符号化を訓練した軽量アテンションベースアーキテクチャであるLOS-Netを紹介する。非常に低い検出レイテンシを維持しながら、さまざまなベンチマークやLLMで優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:21:13 GMT)
Training Matryoshka Mixture-of-Experts for Elastic Inference-Time Expert Utilization [60.3]
Matryoshka MoE(M-MoE)は、エキスパートアンサンブルに直接粗い構造を注入するトレーニングフレームワークである。私たちの作業は、大規模MOEモデルのより実用的で適応可能なデプロイメントの道を開くものです。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:56:44 GMT)
Q-Mirror: Unlocking the Multi-Modal Potential of Scientific Text-Only QA Pairs [60.1]
テキストオンリーQAペア(TQA)を高品質マルチモーダルQAペア(MMQA)に変換する可能性を探る。我々は、TQA-to-MMQAフレームワークを開発し、変換の原則を提供する包括的で多次元のMMQA品質を確立する。我々は,MMQA生成と評価を反復精製のためのクローズドループに統合することにより,我々のフレームワークを運用するエージェントシステム(Q-Mirror)を開発した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:56:54 GMT)
Speculating LLMs' Chinese Training Data Pollution from Their Tokens [59.3]
汚染された中国人(PoC)トークンはポルノやオンラインギャンブルのような内容を示す。 GPTの語彙に基づくPoCトークンの形式的定義と分類について述べる。我々は,LLMを微調整してPoCトークンを語彙でラベル付けすることで,PoCトークン検出装置を構築する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:36:58 GMT)
Pushing LLMs to Their Logical Reasoning Bound: The Role of Data Reasoning Intensity [59.3]
データ推論強度 (Data Reasoning Intensity, DRI) は, サンプルの潜在論理的推論複雑性を定量化する新しい指標である。次に、学習データの論理的推論強度を体系的に強化する再認識最適化戦略を導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:35:59 GMT)
Leveraging Scene Context with Dual Networks for Sequential User Behavior Modeling [58.7]
本稿では,シーンとアイテム間の動的興味や相互作用を捉えるために,新しいDSPネットワークを提案する。 DSPnetは、アイテムやシーンに対するユーザの動的関心を学習するための2つの並列ネットワークと、将来の振る舞いを予測するためのインタープレイをキャプチャするシーケンス機能拡張モジュールで構成されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:26:57 GMT)
Your Agent May Misevolve: Emergent Risks in Self-evolving LLM Agents [58.7]
エージェントの自己進化が意図しない方法で逸脱し、望ましくない結果や有害な結果に至る場合について検討する。我々の経験から、誤進化は広範囲にわたるリスクであり、最上位のLSM上に構築されたエージェントにも影響を及ぼすことが判明した。我々は、より安全で信頼性の高い自己進化型エージェントを構築するためのさらなる研究を促すための潜在的な緩和戦略について議論する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:55:55 GMT)
Point2RBox-v3: Self-Bootstrapping from Point Annotations via Integrated Pseudo-Label Refinement and Utilization [58.4]
Point2RBox-v3は、ラベル割り当てに動的擬似ラベルを使用する最初のモデルである。我々のソリューションは、特にオブジェクトサイズやスパースオブジェクトの発生に大きなバリエーションがあるシナリオにおいて、競争性能を提供します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:01:59 GMT)
Preemptive Detection and Correction of Misaligned Actions in LLM Agents [58.4]
InferActは、実行前に不整合アクションを検出する新しいアプローチである。タイムリーな修正をユーザーに警告し、有害な結果を防ぐ。 InferActは、ミスアライメントされたアクション検出におけるベースラインに対するMarco-F1の最大20%の改善を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:12:22 GMT)
Should You Use Your Large Language Model to Explore or Exploit? [58.0]
探索・探索トレードオフに直面した意思決定エージェントを支援するために,大規模言語モデルの能力を評価する。現在のLLMは、しばしば利用に苦労するが、小規模タスクのパフォーマンスを大幅に改善するために、コンテキスト内緩和が用いられる可能性がある。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:23:41 GMT)
Scalable LLM Math Reasoning Acceleration with Low-rank Distillation [57.9]
資源効率の高い蒸留法を提案し, 効率的な推論手法の展開から損失能力を回収する。もともとの重みは未成熟で、パラメータの約1%、合成トレーニングサンプルは20Kに過ぎなかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:59:16 GMT)
Diffusion Language Models Know the Answer Before Decoding [57.0]
拡散言語モデル (DLM) は自己回帰的アプローチの代替として登場した。我々の研究は、DLMの早期回答収束の見過ごされた特性を強調し、活用する。 Prophetは、早期コミット復号を可能にするトレーニングフリーの高速復号化パラダイムである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:14:27 GMT)
EchoGen: Generating Visual Echoes in Any Scene via Feed-Forward Subject-Driven Auto-Regressive Model [56.5]
EchoGenは、主観駆動生成機能を備えたVisual Auto-Regressive(VAR)モデルを強化する先駆的なフレームワークである。対象の抽象的アイデンティティを抽出するためにセマンティックエンコーダを用いており、このエンコーダは分離されたクロスアテンションを通して注入され、全体の構成を導出する。私たちの知る限りでは、EchoGenはVARモデル上に構築された最初のフィードフォワードの主観駆動フレームワークです。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:45:48 GMT)
Structured Agent Distillation for Large Language Model [56.4]
本研究では,LLMをベースとした大規模エージェントを小さな学生モデルに圧縮するフレームワークであるStructured Agent Distillationを提案する。提案手法は, [REASON] と [ACT] にトラジェクトリを分割し, 各コンポーネントを教師の行動に合わせるためにセグメント特異的な損失を適用した。 ALFWorld、HotPotQA-ReAct、WebShopの実験は、我々のアプローチがトークンレベルと模倣学習のベースラインを一貫して上回っていることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:52:40 GMT)
Judging with Confidence: Calibrating Autoraters to Preference Distributions [56.2]
信頼性の高いオートラッターは、対象の個体群によって定義される嗜好の完全な分布をモデル化することを学ぶ必要がある、と我々は主張する。異なるデータ条件に合わせた2つの学習方法を提案する。この結果から, 分布マッチング目的の微調整オートレーダは, 目的の好み分布に整合した有言確率予測を導出することがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:36:41 GMT)
Boundary-to-Region Supervision for Offline Safe Reinforcement Learning [56.2]
バウンダリ・トゥ・レギオン(Bundary-to-Region, B2R)は、コスト信号による非対称な条件付けを可能にするフレームワークである。 B2Rは、CTGを固定された安全予算の下で境界制約として再定義し、すべての実行可能な軌道のコスト分布を統一する。実験の結果,B2Rは38項目中35項目の安全制約を満たすことがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:38:20 GMT)
DescribeEarth: Describe Anything for Remote Sensing Images [56.0]
リモートセンシングのためのオブジェクトレベルのきめ細かい画像キャプションのための新しいタスクであるGeo-DLCを提案する。このタスクを支援するために,オブジェクト属性,関係,コンテキストを詳細に記述した大規模データセットであるDE-Datasetを構築した。また,Geo-DLC用に設計されたマルチモーダル大規模言語モデルアーキテクチャであるDescribeEarthを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:53:34 GMT)
DiffCamera: Arbitrary Refocusing on Images [55.9]
DiffCameraは、任意の新しいフォーカスポイントとぼやけレベルに条件付けされた生成画像のフレキシブルな再フォーカスを可能にするモデルである。 DiffCameraは、さまざまな場面で安定したリフォーカスをサポートし、写真や生成AIアプリケーションのためのDoF調整を前例のないコントロールを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:48:23 GMT)
An Orthogonal Learner for Individualized Outcomes in Markov Decision Processes [55.9]
DRQ-learnerと呼ばれる新しいメタラーナーを開発した。 DRQ-learnerは離散状態空間と連続状態空間の両方の設定に適用できます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:49:29 GMT)
Uncertainty-Aware Answer Selection for Improved Reasoning in Multi-LLM Systems [55.7]
大規模言語モデル(LLM)は例外的な機能を示しているが、複数のLLMから最も信頼性の高い応答を選択することは依然として困難である。既存のアプローチは、しばしばコストのかかる外部検証器、人間の評価器、または単一のモデルから複数のサンプルを必要とする自己整合技術に依存している。校正されたログ類似度スコアを用いて,複数のLLMから最適な応答を選択するための,原理的,斬新で,計算的に効率的な手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:25:19 GMT)
Training-Free Reward-Guided Image Editing via Trajectory Optimal Control [55.6]
トレーニング不要な報酬誘導画像編集のための新しいフレームワークを提案する。提案手法は,既存のインバージョンベースのトレーニングフリーベースラインを著しく上回ることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:34:37 GMT)
Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.5]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。 Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:19:44 GMT)
CE-SDWV: Effective and Efficient Concept Erasure for Text-to-Image Diffusion Models via a Semantic-Driven Word Vocabulary [55.4]
大規模テキスト・ツー・イメージ(T2I)拡散モデルは、様々な概念に関する顕著な生成性能を達成している。実際には、プライバシーと安全性の制限により、NSFW(Not Safe For Work)の概念に関する生成能力は望ましくない。テキスト意味空間におけるT2I拡散モデルのターゲット概念を除去するフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:49:10 GMT)
Learning to Reason as Action Abstractions with Scalable Mid-Training RL [55.2]
効果的な中間訓練フェーズは、有用なアクションのコンパクトなセットを特定し、高速な選択を可能にする。本稿では,スケーラブルなミッドトレーニングアルゴリズムであるReasoning as Action Abstractions (RA3)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:34:20 GMT)
RE-Searcher: Robust Agentic Search with Goal-oriented Planning and Self-reflection [55.1]
環境の複雑さが脆弱な探索行動をいかに引き起こすかを定量的に分析する。本稿では,検索エージェントRE-Searcherのインスタンス化をシンプルかつ効果的に行う手法を提案する。この目標指向計画と自己回帰の組み合わせにより、RE-Searcherは複雑な検索環境における急激な手がかりに抵抗することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:25:27 GMT)
BiasBusters: Uncovering and Mitigating Tool Selection Bias in Large Language Models [55.1]
大規模言語モデル(LLM)は、複数のプロバイダが機能的に同等のオプションを提供するマーケットプレースから引き出された外部ツールに依存していることが多い。選択が体系的に偏りがある場合、ユーザエクスペリエンスを低下させ、競争を歪ませることができます。ツール選択バイアスを評価するために,複数の機能的に等価なツールを含む多種多様なツールカテゴリのベンチマークを導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:02:13 GMT)
Max-Sliced Wasserstein Distance and its use for GANs [55.1]
GAN(Generative Adversarial Nets)と変分自動エンコーダは,我々の分散モデリング機能を大幅に改善した。距離測定値のサンプルの複雑さは, GANトレーニングに影響を与える要因の1つとして残されている。提案手法は,高次元画像から256x256までのGANを簡易に訓練するものである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:25:53 GMT)
Why Can't Transformers Learn Multiplication? Reverse-Engineering Reveals Long-Range Dependency Pitfalls [54.6]
言語モデルはますます能力が高くなっているが、多桁乗算という一見単純なタスクではまだ失敗している。直観的連鎖を通して乗法をうまく学習するモデルをリバースエンジニアリングすることでなぜ研究する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:03:26 GMT)
Memorize or Generalize? Evaluating LLM Code Generation with Code Rewriting [54.5]
大規模な言語モデル(LLM)は、主にメモリ化(トレーニングデータの大きな部分を複製または再利用する)と一般化(Generalization)を併用している、と我々は主張する。既存の評価は、表面/構造的類似性を無視し、繰り返しコードの良質な再利用を有害なリコールと記憶タスクの正しさで混同する。そこで我々は,2つの信号を組み合わせた正規化スコアである覚書リスク指標(MRI)を提案する。 (i) モデルが元の地平解とどのように類似しているか, (ii) 元のタスクから書き換えされたタスクにどの程度の性能が低下するか。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:17:02 GMT)
PCPO: Proportionate Credit Policy Optimization for Aligning Image Generation Models [54.2]
安定的な客観的な改革と原則的なタイムステップの再重み付けを通じて、比例的な信用割当を強制する枠組みであるPCPO(Proportionate Credit Policy Optimization)を導入する。 PCPOは、最先端のDanceGRPOを含むすべての面で、既存の方針勾配ベースラインを大幅に上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:43:58 GMT)
PANDA: Towards Generalist Video Anomaly Detection via Agentic AI Engineer [54.1]
ビデオ異常検出(VAD)は、現実のシナリオの複雑で多様な性質のため、重要な課題である。以前の方法は、新しいシナリオや見えない異常タイプに適用する場合、ドメイン固有のトレーニングデータと手動の調整に依存していた。本研究では,MLLMに基づくエージェントAI技術者であるPANDAを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:19:43 GMT)
Rethinking Weak-to-Strong Augmentation in Source-Free Domain Adaptive Object Detection [54.0]
Weak-to-strong Semantics Compensation (WSC) を導入する。 WSCは、クラス関連セマンティクスを補償します。 WSCは一般的なプラグインとして実装することができ、既存のSFODパイプラインと容易に統合できます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:30:01 GMT)
Query-Kontext: An Unified Multimodal Model for Image Generation and Editing [53.8]
統一マルチモーダルモデル(UMM)はテキスト・ツー・イメージ生成(T2I)と編集(TI2I)において顕著な性能を示した。本稿では,マルチモーダル入力から符号化されたセマンティックキューと粗粒度画像条件からなるマルチモーダルコンテクス」を用いて,VLMと拡散モデルをブリッジする新しいアプローチであるQuery-Kontextを紹介する。実験により,本手法は強い統一ベースラインと一致し,いくつかのケースにおいてタスク固有の最先端手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:46 GMT)
Towards Unified Multimodal Misinformation Detection in Social Media: A Benchmark Dataset and Baseline [53.7]
詐欺の2つの主要な形態は、人造誤報とAI生成コンテンツである。両形態の偽造を扱うためのフレームワークであるUMFDet(Unified Multimodal Fake Content Detection)を提案する。 UMFDetは、両方の誤情報型に対して堅牢で一貫したパフォーマンスを実現し、特殊ベースラインを上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:26:32 GMT)
Generalized Contrastive Learning for Universal Multimodal Retrieval [53.7]
クロスモーダル検索モデル(例えばCLIP)は、融合した画像テキストのモダリティからなるキーを検索することで、劣化したパフォーマンスを示す。本稿では,新たなデータセットキュレーションを必要とせずに,マルチモーダル検索性能を向上させる新しい損失定式化である汎用コントラスト学習(GCL)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:25:04 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [52.3]
本稿では,オープン語彙フレームワークを用いた複数のオブジェクトカテゴリの同時カウントを実現するための,より実践的なアプローチを提案する。我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察(優先順位)を用いて、ユーザが指定した複数のカテゴリのオブジェクトをカウントすることで際立っている。 OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示し、既存のソリューションを大幅に上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:05:14 GMT)
The Pitfalls of KV Cache Compression [52.2]
圧縮により、特定の命令がより高速に劣化することを示します。本稿では, 圧縮法, 命令順序, KV消去バイアスなど, 即時漏洩に果たすいくつかの要因について述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:55:26 GMT)
Negative-Guided Subject Fidelity Optimization for Zero-Shot Subject-Driven Generation [52.2]
本稿では,ゼロショットな被写体駆動生成のための新しい比較学習フレームワークである主観的忠実度最適化(SFO)を提案する。 SFOは、ペアワイズ比較を通じて、ネガティブよりもポジティブを好むようモデルに導出する。負の目標に対して、主観的生成に適した合成陰性を自動生成する条件劣化負サンプリング(CDNS)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:58:48 GMT)
Learning to Dissipate Energy in Oscillatory State-Space Models [52.0]
状態空間モデル (SSM) はシーケンス学習のためのネットワークのクラスである。我々は,D-LinOSSがLinOSSの手法を長距離学習タスクで一貫して上回っていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:37:49 GMT)
Test time training enhances in-context learning of nonlinear functions [51.6]
テストタイムトレーニング(TTT)は、各予測に先立って指定されたパラメータを明示的に更新することで、モデル性能を向上させる。本研究では,TTTとテキスト内学習(ICL)の組み合わせについて検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:56:44 GMT)
Ringleader ASGD: The First Asynchronous SGD with Optimal Time Complexity under Data Heterogeneity [51.6]
本稿では,並列計算の理論的下界を実現する最初の非同期アルゴリズムであるリングリーダーASGDを紹介する。我々の分析により、リングリーダーASGDは任意の勾配と時間変化速度の下で最適であることが明らかとなった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:11:44 GMT)
DisCO: Reinforcing Large Reasoning Models with Discriminative Constrained Optimization [50.9]
グループ相対政策最適化は大規模推論モデル(LRM)の強化学習手法である差別学習の原則を基礎として, LRMの強化のための新たな差別的制約付き最適化フレームワークを導入する。 DisCO は GRPO と DAPO などの改良型を著しく上回り、GRPO の7%、DAPO の6% を平均的に上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:04:21 GMT)
Partial Identification Approach to Counterfactual Fairness Assessment [50.9]
未知の対実的公正度尺度を高い信頼性で有界化するためのベイズ的アプローチを導入する。以上の結果から、人種をアフリカ系アメリカ人に転換する際のCompASスコアに対する肯定的な(不快な)効果と、若年から高齢に移行する際の否定的な(直接的な因果関係)効果が明らかとなった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:35:08 GMT)
EntroPE: Entropy-Guided Dynamic Patch Encoder for Time Series Forecasting [50.8]
IntroPE(Entropy-Guided Dynamic Patch)は,条件付きエントロピーによる遷移点を動的に検出する新しい時間情報フレームワークである。これは、パッチの計算上の利点を維持しながら、時間構造を保存する。長期予測ベンチマークによる実験では、EntroPEは精度と効率の両方を改善している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:09:56 GMT)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [50.7]
Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:05:34 GMT)
Turning Logic Against Itself : Probing Model Defenses Through Contrastive Questions [50.4]
非倫理的反応を引き起こすために、対照的な推論を利用する新しいジェイルブレイク手法であるPOATEを導入する。 PoATEは意味論的に意図に反し、敵のテンプレートと統合し、有害なアウトプットを驚くほど微妙に操る。これに対応するために、悪意のある意図と理性を検出するためにクエリを分解して、有害な応答を評価し、拒否するIntent-Aware CoTとReverse Thinking CoTを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:18:32 GMT)
Benchmarking Egocentric Visual-Inertial SLAM at City Scale [50.1]
本稿では,エゴセントリックなマルチモーダルデータを用いた視覚慣性SLAMのための新しいデータセットとベンチマークを提案する。我々は、様々なセンサーを備えたメガネのような装置で、市内の中心部を何時間、何キロもの軌跡を記録している。アカデミックによって開発された最先端のシステムは、これらの課題に対して堅牢ではないことを示し、これに責任を負うコンポーネントを特定します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:31 GMT)
Value-Guided Search for Efficient Chain-of-Thought Reasoning [50.0]
本稿では,長文推論トレースを用いた値モデル学習の簡易かつ効率的な手法を提案する。 250万の推論トレースのデータセットを収集して、1.5Bトークンレベルのバリューモデルをトレーニングします。最終多数決を重み付けしたブロックワイド値誘導検索(VGS)は,標準手法よりも優れたテスト時間スケーリングを実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:12:37 GMT)
TraceDet: Hallucination Detection from the Decoding Trace of Diffusion Large Language Models [49.8]
D-LLMの幻覚問題は未解決のままであり、現実世界のアプリケーションでは信頼性が制限されている。既存の幻覚検出法はAR-LLM向けに設計されており、単一ステップ生成からの信号に依存している。本稿では,幻覚検出のためのD-LLMの中間段階を明示的に活用する新しいフレームワークであるTraceDetを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:01:10 GMT)
Projected Coupled Diffusion for Test-Time Constrained Joint Generation [49.7]
制約付きジョイント生成のための新しいテストタイムフレームワークであるProjected Coupled Diffusion (PCD)を提案する。 PCDは、拡散モデル間の協調を促進するために生成力学に結合したガイダンス項を導入し、各拡散ステップにプロジェクションステップを組み込んで厳しい制約を強制する。その結果,過剰な計算コストを発生させることなく,結合効果の向上と制約満足度が保証された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:38:20 GMT)
Probing the Critical Point (CritPt) of AI Reasoning: a Frontier Physics Research Benchmark [49.6]
本研究では,研究レベルの推論タスクにおいて,大規模言語モデル(LLM)をテストするために設計された最初のベンチマークを示す。 CritPtは71の複合研究課題からなる。現在最先端のLCMは、孤立したチェックポイントを早期に保証しているが、完全な研究スケールの課題を確実に解決できるには程遠い。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:34:03 GMT)
Scalable and Robust LLM Unlearning by Correcting Responses with Retrieved Exclusions [49.6]
Webスケールのコーパスリスクを記憶し、センシティブな情報を暴露する言語モデル。本稿では,新しいアンラーニングフレームワークであるCorrective Unlearning with Retrieved Exclusions (CURE)を提案する。 CUREは、リークのモデル出力を確認し、安全な応答に修正する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:07:45 GMT)
Hierarchical Balance Packing: Towards Efficient Supervised Fine-tuning for Long-Context LLM [49.3]
長期コンテキスト大規模言語モデル(LLM)のトレーニングは、長期コンテキストと短コンテキストデータによるハイブリッドトレーニングが、ワークロードの不均衡につながることが多いため、難しい。既存の作業では、主にデータパッキングを使用してこの問題を軽減するが、不均衡な注意計算や通信オーバーヘッドの無駄を考慮できない。本稿では,これらの非効率性に対処する新しいバッチ構築法とトレーニングレシピを設計する階層的バランスパッキング(HBP)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:05:53 GMT)
ReNF: Rethinking the Design Space of Neural Long-Term Time Series Forecasters [48.8]
本稿では,提案手法の理論的基礎となるマルチプルニューラル予測定理を提案する。自動回帰(AR)と直接出力(DO)の両方の利点を組み合わせた新しい予測戦略であるブースト・ダイレクト・アウトプット(BDO)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:05:59 GMT)
What Can RL Bring to VLA Generalization? An Empirical Study [48.1]
VLA(Large Vision-Language Action)モデルは、AIを具現化する大きな可能性を示している。教師付き微調整(SFT)による主な訓練は、分散シフト下での複合誤差による一般化を制限する。本稿では,VLAの一般化評価のための総合的ベンチマークを導入し,RL微調整の影響を系統的に検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:18:07 GMT)
Accelerating Transformers in Online RL [48.0]
強化学習における変圧器モデル本稿では,アクセラレータポリシーをトランスフォーマーのトレーナーとして利用する手法を提案する。提案アルゴリズムを適用することで,トランスフォーマーの安定したトレーニングが可能になるだけでなく,画像ベースの環境におけるトレーニング時間を最大2倍に短縮できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:57:14 GMT)
Cat: Post-training quantization error reduction via cluster-based affine transformation [47.8]
Post-Training Quantization (PTQ)は、フル精度(FP)値を量子化および圧縮データタイプに変換することにより、ディープニューラルネットワークのメモリフットプリントと計算オーバーヘッドを低減する。 PTQはQAT(Quantization-Aware Training)よりもコスト効率が高いが、低ビット量子化条件下での精度劣化に非常に敏感である。本稿ではクラスタベースのアフィン変換(CAT)を提案する。クラスタ固有のパラメータを用いて,LQ出力をFP出力と整合させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:00:28 GMT)
TruthRL: Incentivizing Truthful LLMs via Reinforcement Learning [47.7]
大型言語モデル (LLM) は幻覚や不合理な反応を起こしやすい。これは既存手法の根本的な課題である。本稿では,LLMの真性を直接最適化する汎用強化学習フレームワークTruthRLを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:25:17 GMT)
Type-Less yet Type-Aware Inductive Link Prediction with Pretrained Language Models [47.6]
サブグラフベースの帰納的リンク予測のためのタイプレス型-awaReアプローチであるTyleRを紹介する。我々は、TyleRが、少ない型アノテーションとスパースグラフ接続を持つシナリオにおいて、最先端のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:23:02 GMT)
Simple yet Effective Semi-supervised Knowledge Distillation from Vision-Language Models via Dual-Head Optimization [47.4]
大規模な画像テキストペアで事前訓練された視覚教師付きモデル(VLM)は、顕著なゼロ/フェーショット性能を示した。知識蒸留(KD)は、VLM能力を伝達するための自然な枠組みを提供するが、監督と蒸留の損失の間の勾配の衝突に悩まされる。本稿では,異なる信号に対して2つの予測ヘッドを導入するDual-Head Optimization (DHO)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:13:57 GMT)
ErrorPrism: Reconstructing Error Propagation Paths in Cloud Service Systems [47.3]
実運用マイクロサービスシステムにおけるエラー伝搬経路の自動再構築であるErrorPrismを提案する。 ErrorPrismは、102の現実世界のエラーに対するパスの再構築において97.0%の精度を実現し、既存の静的解析やLLMベースのアプローチよりも優れている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:13:21 GMT)
Attention as a Compass: Efficient Exploration for Process-Supervised RL in Reasoning Models [47.1]
推論モデルの効率的な探索を可能にする新しいPSRLフレームワーク(AttnRL)を提案する。高い注意点を示すステップが推論行動と相関しているという予備観測により,高い値を持つ位置から分岐することを提案する。我々は,問題の難易度と過去のバッチサイズを考慮に入れた適応型サンプリング戦略を開発し,トレーニングバッチ全体が非ゼロの利点値を維持することを保証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:58:34 GMT)
DISCOVER: Data-driven Identification of Sub-activities via Clustering and Visualization for Enhanced Activity Recognition in Smart Homes [46.9]
本研究では,未ラベルセンサデータから詳細な人間のサブアクティビティを検出する手法であるdiscoVERについて,事前のセグメンテーションに頼ることなく紹介する。広範に使用されているHARデータセットに対する再注釈演習を通じて,その効果を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:19:50 GMT)
Explainable and Resilient ML-Based Physical-Layer Attack Detectors [46.3]
物理層侵入を警告するために訓練された各種分類器の内部動作を分析する。有害パラメータのノイズ化に対する検出器のレジリエンスを評価した。この研究は、利用可能なネットワーク監視データに基づいて訓練された高速で堅牢な検出器を開発するための設計ガイドラインとして機能する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:05:33 GMT)
Linear Attention for Efficient Bidirectional Sequence Modeling [46.3]
LIONは、線形変換器を双方向設定に拡張する最初のフレームワークである。 LIONは因果的なケースでよく使われる3つのコア表現を双方向の設定に一般化する。リニアトランスフォーマーの幅広いクラスをLIONを使って拡張できることを証明し、3つのコア例を通して我々のフレームワークを検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:14:55 GMT)
RoRecomp: Enhancing Reasoning Efficiency via Rollout Response Recomposition in Reinforcement Learning [45.9]
検証可能な報酬(RLVR)を用いた強化学習は、大規模言語モデル(LLM)における複雑な推論を導くのに有効であることが証明された。本稿では,学習データを戦略的に再コンパイルすることで,モデルから簡潔な推論へ導くプラグイン・アンド・プレイ手法であるRoRecompを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:54:38 GMT)
Ascent Fails to Forget [45.8]
勾配上昇に基づく非制約最適化手法は、しばしば機械のアンラーニングに失敗することを示した。我々は、この現象を、データセットを忘れ、保持する際、本質的に統計的に依存しているとみなす。これらの統計的依存関係の存在は,相関としてのみ現れても,上昇に基づく未学習が失敗するのに十分であることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:48:49 GMT)
Adaptive Graph Coarsening for Efficient GNN Training [45.4]
本稿では,学習中のK平均クラスタリングによるグラフニューラルネットワーク(GNN)パラメータとマージノードを協調学習するための適応的なグラフ粗大化手法を提案する。我々は,同好性ノード分類データセットと異好性ノード分類データセットの両方にアプローチを検証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:05:04 GMT)
MASLegalBench: Benchmarking Multi-Agent Systems in Deductive Legal Reasoning [45.4]
大規模言語モデル(LLM)の顕著な機能を活用するマルチエージェントシステム(MAS)は、複雑なタスクに対処する大きな可能性を示している。従来の研究でLLMエージェントの法的なベンチマークが開発されたが、MASの独特な利点を考えるために特別に設計されたものはない。提案するMASLegalBenchは,MASに適した法的なベンチマークであり,帰納的推論手法を用いて設計されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:09:29 GMT)
Reframing Generative Models for Physical Systems using Stochastic Interpolants [45.2]
生成モデルは物理系の強力なサロゲートとして現れ、精度、安定性、および/または統計的忠実度が向上した。ほとんどのアプローチは、PDEや気候などの力学系における自己回帰予測タスクにおいて、最も効果的でない選択であるガウシアンを反復的に飾ることに依存している。本研究では,様々な物理領域やタスクにまたがる生成モデルをベンチマークし,補間剤の役割を強調した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:02:00 GMT)
Efficient Fairness-Performance Pareto Front Computation [45.1]
最適公正表現はいくつかの有用な構造特性を持つことを示す。そこで,これらの近似問題は,凹凸プログラミング法により効率的に解けることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:32:13 GMT)
S$^2$FS: Spatially-Aware Separability-Driven Feature Selection in Fuzzy Decision Systems [45.1]
ファジィ決定システムのための空間認識分離性駆動型特徴選択(S$2$FS)を提案する。 S$2$FSは、クラス内コンパクト性とクラス間分離を考慮した空間的に認識された分離性基準によって導かれる。 10の実世界のデータセットの実験では、S$2$FSは8つの最先端の機能選択アルゴリズムを一貫して上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:30:14 GMT)
OrthoLoC: UAV 6-DoF Localization and Calibration Using Orthographic Geodata [45.0]
我々はドイツとアメリカ合衆国から16,425個のUAV画像からなる最初の大規模データセットOrthoLoCを提案する。データセットは、UAV画像と地理空間データのドメインシフトに対処する。我々はAdHoPと呼ばれる改良手法を導入し、任意の特徴マッチングと統合でき、マッチングを最大95%改善し、翻訳エラーを最大63%削減できる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:45:00 GMT)
RE$^2$: Improving Chinese Grammatical Error Correction via Retrieving Appropriate Examples with Explanation [44.8]
中国語の文法的誤り訂正(CGEC)の主な目的は,中国語の文中の誤りを検出し,訂正することである。大きな言語モデル(LLM)では、適切な参照例を選択することでパフォーマンスが向上する。本稿では,文法的誤りを記述した適切な例を検索するRE$2$を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:14:19 GMT)
Hamster: A Large-Scale Study and Characterization of Developer-Written Tests [44.7]
我々はJavaアプリケーションの開発者によるテストについて調査し、オープンソースリポジトリから170万のテストケースをカバーした。この結果から,開発者によるテストの大部分は,現在のATGツールの能力以上の特性を示すことがわかった。私たちは、現在のツール機能と開発者のテストプラクティスに対するより効果的なツールサポートのギャップを埋めるのに役立つ有望な研究方向を特定します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:08:23 GMT)
Provable Scaling Laws of Feature Emergence from Learning Dynamics of Grokking [44.6]
我々は、グルーキング現象、すなわち遅延一般化について研究する。本稿では,2層非線形ネットワークのグルーキング動作の3つの重要な段階を捉える新しいフレームワークを提案する。私たちの研究は、体重減少、学習率、グルーキングにおけるサンプルサイズといったハイパースの役割に光を当てています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:43:09 GMT)
Composing Global Solutions to Reasoning Tasks via Algebraic Objects in Neural Nets [44.6]
二次活性化と損失$L$の2層ニューラルネットワークに対する解空間のリッチ代数構造を証明した。このようなリッチな構造は、部分解から大域最適解を初期的に構築することを可能にする。トレーニング力学は、重量減衰下でのより単純な解を好んでおり、完全記憶のような高次大域的解は好ましくないことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:00:56 GMT)
MotionRAG: Motion Retrieval-Augmented Image-to-Video Generation [44.5]
MotionRAGは、関連する参照ビデオから動きの先行を適応させることで、モーションリアリズムを強化する検索強化フレームワークである。提案手法は,複数のドメインや様々なベースモデルに対して,推論時の計算オーバーヘッドを無視できるような大幅な改善を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:26:04 GMT)
Efficient Dynamic Ensembling for Multiple LLM Experts [44.4]
異なるLLM専門家の強みに対するアンサンブル推論は、多様な入力に対して一貫した満足なパフォーマンスを達成するために重要である。本研究では,動的入力を前提とした複数のLDMエキスパートの強みを統合するために,DERと呼ばれる効率的な動的アンサンブル推論パラダイムを提案する。実験により,本手法では,最先端のベースラインに比べて計算資源が少なく,性能が向上することが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:41:23 GMT)
U-Mamba2: Scaling State Space Models for Dental Anatomy Segmentation in CBCT [44.4]
CBCT (Cone-Beam Computed Tomography) は歯科用3次元イメージング技術として広く用いられている。 U-Mamba2は、マルチ解剖学的CBCTセグメンテーションのために設計された新しいニューラルネットワークアーキテクチャである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:16:30 GMT)
U-Mamba2-SSL for Semi-Supervised Tooth and Pulp Segmentation in CBCT [44.4]
U-Mamba2-SSLは,U-Mamba2モデル上に構築され,多段階の学習戦略を用いる,新しい半教師付き学習フレームワークである。 U-Mamba2-SSLは平均スコア0.789、DSC0.917を隠しテストセットで達成し、STSR 2025のタスク1で1位となった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:23:13 GMT)
Deep Reinforcement Learning-Based Precoding for Multi-RIS-Aided Multiuser Downlink Systems with Practical Phase Shift [44.3]
本研究では、RIS位相シフト行列をスペクトル効率に最適化することを目的として、複数再構成可能なマルチユーザダウンリンクシステムについて検討する。提案するDD-DRLフレームワークは,mmWaveチャネル設定において,両方のランダムなユーザ数で評価される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:57:57 GMT)
User-Centric Communication Service Provision for Edge-Assisted Mobile Augmented Reality [44.0]
将来の6Gネットワークはエッジ支援モバイル拡張現実(MAR)を促進する MARデバイスは、カメラフレームをエッジサーバにタイムリーにアップロードし、SLAMベースのデバイスポーズトラッキングを同時に行う必要がある。我々は、MARのためのユーザ中心の通信サービス提供のためのデジタルツイン(DT)ベースのアプローチを開発する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:50:32 GMT)
OneSearch: A Preliminary Exploration of the Unified End-to-End Generative Framework for E-commerce Search [43.9]
OneSearchは、eコマース検索のための最初の産業向けエンドツーエンド生成フレームワークである。 OneSearchは運用費を75.40%削減し、Model FLOPsの利用を3.26%から27.32%に改善した。このシステムはKuaishouの複数の検索シナリオにまたがって展開され、数百万のユーザーにサービスを提供している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:54:50 GMT)
FAN: Fourier Analysis Networks [43.7]
FANは、周期性モデリングの課題に効果的に対処する、新しい汎用ニューラルネットワークである。本研究では、周期性モデリングタスクにおけるFANの優位性と、実世界のタスクにおけるFANの有効性と一般化性を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:19:28 GMT)
Revealing the Power of Post-Training for Small Language Models via Knowledge Distillation [43.7]
我々は,小型モデルの精度を効果的に向上する,系統的な後学習パイプラインを導入する。結果として得られた命令調整モデルにより、最先端のパフォーマンスが達成される。この研究は、Ascendエッジデバイス上で高性能言語モデルを開発するための実用的で効率的なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:40:55 GMT)
Efficiently Escaping Saddle Points for Policy Optimization [43.6]
政策勾配(PG)は、拡張性と優れた性能のために強化学習に広く用いられている。本稿では,ヘッセンベクトル積 (HVP) の形で二階情報を用いた分散還元二階法を提案し,サンプルの複雑さを$tildeO(epsilon-3)$とする近似二階定常点 (SOSP) に収束する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:20:23 GMT)
UFO: A Unified Approach to Fine-grained Visual Perception via Open-ended Language Interface [43.6]
textbfOpen-ended言語インターフェースを通じて、textbfFineの粒度の視覚的知覚タスクをTextbfUnifyするフレームワークである。オブジェクトレベルの検出、ピクセルレベルのセグメンテーション、イメージレベルの視覚言語タスクを単一のモデルに統合する。私たちのフレームワークは、きめ細かい認識と視覚言語タスクのギャップを埋め、アーキテクチャ設計とトレーニング戦略を大幅に単純化します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:42:01 GMT)
DNN-Based Precoding in RIS-Aided mmWave MIMO Systems With Practical Phase Shift [43.6]
本稿では、直接通信路を妨害したミリ波マルチインプット多重出力(MIMO)システムのスループットを最大化する。リコンフィギュアブルインテリジェントサーフェス(RIS)は、視線(LoS)とマルチパス効果に関連するmmWave特性を考慮して伝送性を高めるために使用される。ディープニューラルネットワーク(DNN)は、より高速なコードワード選択を容易にするために開発された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:52:08 GMT)
EditReward: A Human-Aligned Reward Model for Instruction-Guided Image Editing [43.2]
mnameは、命令誘導画像編集タスクにおいて、人間の好みと優れた整合性を示す。 mnameはGenAI-Bench、AURORA-Bench、ImagenHub、そして私たちの新しいベンチネームといった確立したベンチマークに対して、最先端の人間相関を実現する。トレーニングデータセットを備えたmnameがリリースされ、コミュニティがより高品質な画像編集トレーニングデータセットを構築するのに役立つ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:51:04 GMT)
LMOD+: A Comprehensive Multimodal Dataset and Benchmark for Developing and Evaluating Multimodal Large Language Models in Ophthalmology [43.1]
視力低下の眼疾患は、労働力不足によるタイムリーな診断と専門医療へのアクセス制限により、世界的な健康上の重荷となる。本報告では,12の眼球運動条件に共通する多粒性アノテーションと5つの画像モダリティを併用した32,633例の大規模マルチモーダル眼科ベンチマークを報告する。このデータセットは、画像、解剖学的構造、人口統計、自由テキストアノテーションを統合し、解剖学的構造認識、疾患スクリーニング、疾患ステージング、およびバイアス評価のための人口統計予測をサポートする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:29:18 GMT)
Improving Sampling Efficiency in RLVR through Adaptive Rollout and Response Reuse [43.1]
本稿では, 適応ロールアウトと応答再利用という2つの新しい手法を導入する, サンプリング効率のよいRLVRアルゴリズムを提案する。 AR3POはGRPOを一貫して上回り、DAPOに匹敵する。より大きな32Bモデルでは、AR3POは、ロールアウトコストを著しく低く保ちながら、同様のトレーニングステップでDAPOと同等のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:29:53 GMT)
Noise-Guided Transport for Imitation Learning [42.8]
騒音誘導輸送は、敵の訓練によって解決された最適な輸送問題として模倣を推し進める。 NGTは事前訓練や特別なアーキテクチャを必要とせず、設計による不確実性推定を組み込んでおり、実装とチューニングが容易である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:10:06 GMT)
Silent Leaks: Implicit Knowledge Extraction Attack on RAG Systems through Benign Queries [42.8]
インプシット知識抽出攻撃(IKEA)は、良質なクエリを通してRAGシステム上で知識抽出を行う。 IKEAは、抽出効率の80%以上、攻撃成功率の90%を超えている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:36:11 GMT)
Scalable Fingerprinting of Large Language Models [42.7]
我々はPerinucleus sampleと呼ばれる新しい手法を導入し、スケーラブルで永続的で無害な指紋を生成する。この手法により,Llama-3.1-8Bモデルに24,576個の指紋を付加できることを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:18:39 GMT)
A quantitative analysis of semantic information in deep representations of text and images [42.6]
本稿では,意味的関連データの表現の相対的情報量を測定する手法を提案する。大規模言語モデル(LLM)と視覚変換器の複数のトークンにエンコードする方法を探索する。我々は、画像とテキストの表現の間に有意かつモデルに依存した情報非対称性を観察する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:06:40 GMT)
Adaptive Planning for Multi-Attribute Controllable Summarization with Monte Carlo Tree Search [42.5]
マルチ属性制御可能な要約(PACO)のための適応計画法を提案する。 PACOは、カスタマイズされたモンテカルロ木探索(MCTS)を用いて、シーケンシャル属性制御の順序を計画するタスクを再構成する。多様なドメインやモデルにわたる実験は、PACOが堅牢なマルチ属性制御を実現することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:55:24 GMT)
TAMO: Fine-Grained Root Cause Analysis via Tool-Assisted LLM Agent with Multi-Modality Observation Data in Cloud-Native Systems [42.5]
クラウドネイティブシステムにおける大規模言語モデル(LLM)による根本原因分析(RCA)は、現代のソフトウェア運用とメンテナンスにおいて重要なトピックとなっている。既存のLLMベースのアプローチでは、マルチモード入力制約、コンテキストウィンドウ制限、動的依存グラフの3つの大きな課題に直面している。細粒度RCA,すなわちTAMOのための多モード観測データを用いたツール支援LDMエージェントを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:36:49 GMT)
Observation of non-Hermitian topology in cold Rydberg quantum gases [42.4]
我々は,非エルミートスペクトルトポロジーを散逸性Rydberg原子気体中で実験的に実証した。相互作用強度を増大させることで、系はエルミート系から非エルミート系へと進化する。この研究は、非エルミート位相、強い相互作用、散逸性量子力学の間のリッチな相互作用を探索するための多用途プラットフォームとして、コールド・リドバーグ気体を確立している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:44:43 GMT)
TAU: A Benchmark for Cultural Sound Understanding Beyond Semantics [42.3]
台湾の日常的な「音符」のベンチマークであるTAU(台湾音声理解)について紹介する。 TAUは、キュレートされたソース、人間の編集、LLMによる質問生成を組み合わせたパイプラインで構築されている。 Gemini 2.5やQwen2-Audioを含む最先端のLALMは、局所的な人間よりはるかに低い性能を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:40:45 GMT)
Dragging with Geometry: From Pixels to Geometry-Guided Image Editing [42.2]
幾何学誘導型ドラッグベース画像編集手法であるGeoDragを提案する。ジオドラグは3次元幾何学と2次元空間先行を共同で符号化する統一された変位場に基づいており、コヒーレントで高忠実で構造に一貫性のある編集を可能にしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:53:11 GMT)
Stitch: Training-Free Position Control in Multimodal Diffusion Transformers [42.2]
近年,テキスト・ツー・イメージ(T2I)生成モデルが急速に進歩してきたが,空間的関係を捉えることは永続的な課題である。自動生成バウンディングボックスを介して,外部位置制御をMMDiT(Multi-Modal Diffusion Transformer)に組み込む訓練不要なStitchを提案する。対象とする注目ヘッドは、画像を完全に完成させることなく、世代中の個々のオブジェクトを分離し、切り離すために必要な情報をキャプチャする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:51 GMT)
Multi Layered Autonomy and AI Ecologies in Robotic Art Installations [42.2]
本稿では,Baoyang Chen氏の大規模インスタレーションであるSymbiosis of Agentsについて述べる。 AI駆動のロボットを没入型ミラーラインのアリーナに埋め込んで、マシンエージェンシーと芸術的作者との緊張関係を探る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:42:13 GMT)
CHAI: Command Hijacking against embodied AI [41.9]
CHAI(Command Hijacking against embodied AI)は、LVLM(Large Visual-Language Models)のマルチモーダル言語解釈能力を活用した、新しいプロンプトベースの攻撃である。 CHAIは、誤解を招く標識や視覚的な入力、トークン空間の体系的な検索、プロンプトの辞書の作成、そして視覚的アタック・プロンプットを生成するためにアタックモデルを誘導するなど、偽りの自然言語命令を組み込む。我々は、ドローン緊急着陸、自律走行、空中物体追跡の4つのLVLMエージェントと、実際のロボット車両についてCHAIを評価した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:02:57 GMT)
Overthinking Reduction with Decoupled Rewards and Curriculum Data Scheduling [41.8]
大規模な推論モデルは、パフォーマンス上のメリットのない、過度に長い推論パスを生成します。長さをペナライズする既存のソリューションは、しばしば失敗し、パフォーマンスが低下する。我々は、現在長さの報酬に未適応な2つの欠陥の理論的発見に基づいて、新しいフレームワークDECSを紹介した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:04:43 GMT)
Dual-Scale World Models for LLM Agents Towards Hard-Exploration Problems [41.8]
LLMベースのエージェントは有望な進歩を見てきたが、それでも探索を通じて新しい知識を学ぶことを必要とする「ハード探索」のタスクに限られている。本稿では,グローバルスケールにおける高価値発見の軌道フロンティアを維持しつつ,デュアルスケールの世界モデルを活用した新たなアプローチであるGLoWを提案する。我々はテキストベースのゲームのJerichoベンチマークスイートに取り組み、GLoWはLLMベースのアプローチのための新しい最先端パフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:57:33 GMT)
ConfRAG: Confidence-Guided Retrieval-Augmenting Generation [41.8]
複数の事実性ベンチマークで幻覚率を20～40%から5%以下に下げる微調整戦略であるConfQAを紹介した。モデルが不確実に応答した場合のみRAGを起動するトリガー戦略であるConfRAGを提案する。この枠組みは、不要な外部検索を30%以上削減しつつ、理想的な場合において95%以上の精度を達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:41:32 GMT)
Catalog-Native LLM: Speaking Item-ID Dialect with Less Entanglement for Recommendation [41.6]
本稿では Item-ID + Oral- Language Mixture-of-Experts Language Model (IDIOMoE) を紹介する。アイテムの相互作用履歴を言語空間内のネイティブな方言として扱い、協調的なシグナルを自然言語と同じ方法で理解できるようにする。パブリックデータセットとプロプライエタリデータセットの両方で強力なレコメンデーションパフォーマンスを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:30:43 GMT)
Barriers for Learning in an Evolving World: Mathematical Understanding of Loss of Plasticity [41.6]
可塑性の喪失(LoP)は、ディープラーニングモデルの将来的な学習能力の低下である。本研究は,勾配に基づく学習におけるLoPの第一原理的研究である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:49:50 GMT)
LogPilot: Intent-aware and Scalable Alert Diagnosis for Large-scale Online Service Systems [41.6]
LogPilotは、ログベースの自動アラート診断のためのLarge Language Models(LLM)を利用したインテント対応フレームワークである。各リクエストの実行を時間的ログチェーンに再構築し、同様のチェーンをクラスタして、繰り返し実行される実行パターンを特定し、診断のためにLLMに代表的なサンプルを提供する。 LogPilotは、Volcano Engine Cloudの現実世界のアラートに基づいて、根本原因の要約の有用性を50.34%改善し、最先端の手法よりも正確なローカライゼーション精度を54.79%向上させた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:11:28 GMT)
WorldGym: World Model as An Environment for Policy Evaluation [41.2]
WorldGymは、実環境のプロキシとして機能する自動回帰、アクション条件付きビデオ生成モデルである。ポリシーはモンテカルロの世界モデルによるロールアウトを通じて評価され、視覚言語モデルが報酬を提供する。 We show that WorldGym can maintain relative policy rankings across different policy version, sizes, and training checkpoints。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:34:34 GMT)
Data-Free Continual Learning of Server Models in Model-Heterogeneous Federated learning [41.2]
フェデレートラーニング(Federated Learning, FL)は、データプライバシを保持しながら、複数のエンティティにわたって分散学習パラダイムである。新しいデータの継続的な出現とモデルの多様性の増大により、従来のフェデレーション学習は大きな課題に直面します。我々はFedDCLを紹介した。FedDCLは、モデル・ヘテロジニアス・フェデレーション・セッティングにおいて、サーバモデルのデータフリー連続学習を可能にするように設計された新しいフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:09:33 GMT)
UniVid: The Open-Source Unified Video Model [41.2]
MLLMと拡散デコーダを軽量アダプタで結合する統一アーキテクチャUniVidを提案する。標準ベンチマークの実験では、最先端のパフォーマンスが示されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:46:27 GMT)
Believing without Seeing: Quality Scores for Contextualizing Vision-Language Model Explanations [41.1]
本稿では,2つの品質スコアリング機能を用いて,VLMによる説明の相補的な2つの特性を評価することを提案する。参加者は視覚的コンテキストを観察することなく,VLM予測が正確かどうかを判断しなければならない。 VLMの精度を11.1%向上させることで,VLMの精度が向上することが観察された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:34:21 GMT)
Complexity Analysis of Normalizing Constant Estimation: from Jarzynski Equality to Annealed Importance Sampling and beyond [40.8]
非正規化確率密度 $piproptomathrme-V$ が与えられたとき、正規化定数 $Z=int_mathbbRdmathrme-V(x)mathrmdx$ または自由エネルギー $F=-log Z$ はベイズ統計学、統計力学、機械学習において重要な問題である。本稿では,逆拡散サンプリングに基づく新しいアルゴリズムを提案し,その複雑さを解析するためのフレームワークを構築し,マルチモーダリティに対処する際の効率を実証的に実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:57:37 GMT)
Collaborative Compression for Large-Scale MoE Deployment on Edge [40.8]
本稿では,エキスパートプルーニング,混合精度量子化,アクティベーション最適化を組み合わせた協調圧縮フレームワークを提案する。私たちは、超大型のDeepSeek-V3から128GBのメモリ制限で圧縮されたモデルを初めてプラットフォームにデプロイしました。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:46:03 GMT)
TADA: Improved Diffusion Sampling with Training-free Augmented Dynamics [40.8]
我々は,ImageNet512 上で比較 FID を比較対象とするアートソルバの現在の状態よりも最大 186% 以上高速な新しいサンプリング手法を提案する。提案手法の鍵は,高次元初期雑音を用いて,より詳細なサンプルを生成することである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:59:09 GMT)
3D Interaction Geometric Pre-training for Molecular Relational Learning [40.3]
3DMRLは2次元MRLモデルを訓練し、分子間相互作用のグローバルおよび局所的な幾何学的情報を学ぶ。実験では、40タスクで24.93%のパフォーマンスが向上した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:47:21 GMT)
Knapsack RL: Unlocking Exploration of LLMs via Optimizing Budget Allocation [40.3]
大規模言語モデル(LLM)は強化学習を通じて自己改善が可能で、より良いソリューションを探求し発見するための軌道を生成する。この探索プロセスは計算コストが高く、しばしば現在の手法では各タスクに限られた探査予算を割り当てざるを得ない。本稿では,モデルの現在の学習状況に基づいて資源を適応的に分配する最適割当てルールを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:41:57 GMT)
Pretrain-Test Task Alignment Governs Generalization in In-Context Learning [40.0]
本研究は,ICLにおける事前学習タスクの構造が一般化をどのように支配するかを考察する。線形回帰によるICLの可解モデルを用いて、高次元でのICL一般化誤差の正確な式を導出する。本手法は解法モデルだけでなく非線形変換器においても直接ICL性能を予測する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:19:58 GMT)
FANformer: Improving Large Language Models Through Effective Periodicity Modeling [39.7]
本稿では、FANformerを導入し、FAN(Fourier Analysis Network)をアテンション機構に適応させ、効率的な周期性モデリングを実現する。モデルサイズのスケールアップやトークンのトレーニングでは,FANformerがTransformerより一貫して優れています。トレーニング済みのFANformer-1Bは、同様のモデルパラメータやトレーニングトークンを持つオープンソースのLLMと比較して、ダウンストリームタスクが大幅に改善されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:53:10 GMT)
Point-It-Out: Benchmarking Embodied Reasoning for Vision Language Models in Multi-Stage Visual Grounding [39.6]
VLM(Vision-Language Models)は、様々なタスクにまたがる優れた世界的知識を実証した。既存のベンチマークでは、画像アノテーションに基づいた複数選択質問を通じて、VLMの具体的推論能力を評価している。我々は,VLMの具体的推論能力を正確な視覚的接地により体系的に評価する新しいベンチマークであるPoint-It-Outベンチマークを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:05:54 GMT)
A unified error analysis for randomized low-rank approximation with application to data assimilation [39.5]
中心行列および非標準行列に対するフロベニウスノルムにおける低ランク近似誤差の解析のための統一的なフレームワークを提案する。最小限の仮定の下では、期待と確率の正確な境界を導出する。私たちの境界には、プロパティを導出し、実践的な選択を動機付けるための明確な解釈があります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:10:12 GMT)
TokenSmith: Streamlining Data Editing, Search, and Inspection for Large-Scale Language Model Training and Interpretability [39.4]
TokenSmithは、データセットのインタラクティブな編集、検査、分析のためのオープンソースライブラリである。 GPT-NeoX、Megatron、NVIDIA NeMoといったMegatronスタイルの事前トレーニングフレームワークで使用されるデータセットをサポートする。 TokenSmithはGitHubにホストされており、ドキュメント、チュートリアル、デモビデオが付属している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:21:41 GMT)
Not All Tokens are Guided Equal: Improving Guidance in Visual Autoregressive Models [39.4]
Information-Grounding Guidance (IGG) は、意味的に重要な領域へのガイダンスを注意を通して固定する新しいメカニズムである。 IGGはよりシャープでコヒーレントでセマンティックな画像を提供し、ARベースのメソッドの新しいベンチマークを設定している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:00:45 GMT)
Towards Human Engagement with Realistic AI Combat Pilots [39.4]
本研究では,3次元空戦シナリオにおける戦闘機の制御訓練を行うエージェントとユーザとのリアルタイムインタラクションを実現するシステムを提案する。エージェントはマルチエージェント強化学習を使用して専用の環境で訓練される。訓練されたエージェントをVR-Forcesにシームレスに展開するための通信リンクが開発されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:34:10 GMT)
CliniBench: A Clinical Outcome Prediction Benchmark for Generative and Encoder-Based Language Models [39.2]
生成型大規模言語モデル (LLMs) は, 複雑な医療業務においてますます研究されている。実際の臨床応用におけるそれらの効果は未解明のままである。本報告では,MIMIC-IVデータセットにおける入力音からの退避診断予測のためのエンコーダベース分類器と生成LDMの比較を可能にする最初のベンチマークであるCliniBenchについて述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:56:53 GMT)
Entropy After $\langle \texttt{/Think} \rangle$ for reasoning model early exiting [38.9]
正しい解に到達した後も、回答を再検討し続けながら、大きな推論モデルが過大評価されていることを示す。 We propose Entropy After /Think> (EAT) for monitoring and decide whether to exit reasoning early。 EATは、正確性を損なうことなく、トークン使用量を13～21%削減する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:59:37 GMT)
SSTP: Efficient Sample Selection for Trajectory Prediction [38.9]
既存の大規模データセット上での高度な軌道予測モデルのトレーニングは、時間と計算コストがかかる。本稿では,軌道予測に適したコンパクトだが密度バランスのよいデータセットを構築するSSTPフレームワークを提案する。実験の結果、SSTPはデータの半分しか使用せず、フルデータセットのトレーニングに匹敵するパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:58:18 GMT)
STAC: When Innocent Tools Form Dangerous Chains to Jailbreak LLM Agents [38.8]
本稿では,エージェントツールの利用を生かした新しいマルチターンアタックフレームワークSTACについて紹介する。我々は,483のSTACケースを自動生成し,評価するために,1,352セットのユーザエージェント環境相互作用を特徴とするフレームワークを適用した。 GPT-4.1を含む最先端のLSMエージェントはSTACに対して極めて脆弱であり,攻撃成功率(ASR)は90%以上である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:31:44 GMT)
AVCD: Mitigating Hallucinations in Audio-Visual Large Language Models through Contrastive Decoding [38.7]
本稿では,3モーダル相互作用をモデル化し,大言語モデル(MLLM)における幻覚を抑制するために,AVCD(Audio-Visual Contrastive Decoding)を提案する。効率を向上させるために,モデルの予測に対する信頼度に基づいて不要な復号ステップをスキップするエントロピー誘導適応復号を導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:14:50 GMT)
Long-Horizon Visual Imitation Learning via Plan and Code Reflection [38.6]
複雑なアクションシーケンスを持つ長距離デモから学ぶことは、視覚模倣学習にとって重要な課題である。本稿では,2つの専用リフレクションモジュールを組み込んだ新しいエージェントフレームワークを提案する。これら2つのリフレクションモジュールは、エージェントが計画生成とコード生成の両方のエラーを検出し、修正できるようにし、複雑な時間的および空間的依存関係を持つタスクのパフォーマンスを向上させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:41:22 GMT)
Thoughtbubbles: an Unsupervised Method for Parallel Thinking in Latent Space [38.5]
計算変換器における推論時間の計算をスケールするための現在のアプローチは、答えを生成する前に明示的な連鎖トークンを出力するようにトレーニングすることに依存している。 Thoughtbubblesは、残留ストリームのフォークや削除を学ぶことで、潜在空間における並列適応計算を実行するトランスフォーマーである。 Thoughtbubbles は標準デコーダ LM と OpenWebText と peS2o のパープレキシティおよびHellaSwag や LAMBADA などのゼロショット評価において、非適応並列計算手法の両方に優れる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:49:15 GMT)
VSSFlow: Unifying Video-conditioned Sound and Speech Generation via Joint Learning [38.4]
V2SタスクとVisualTTSタスクをシームレスに統合したフローマッチングフレームワークであるVSSFlowを提案する。 VSSFlowは、学習段階に余分な設計を加えることなく、音声および音声生成のためのエンドツーエンドのジョイントラーニングプロセスの恩恵を受ける。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:16:17 GMT)
Parametric Neural Amp Modeling with Active Learning [38.4]
MUSHRAリスニングテストにより,75個のデータポイントを使用すれば,主要なオープンソース非パラメトリックアンプモデルであるNAMの知覚的品質と一致させることができることが明らかになった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:30:00 GMT)
Benchmarking Diarization Models [38.4]
我々は、複数の言語と音響条件にまたがる4つのダイアリゼーションデータセットに対して、最先端のダイアリゼーションモデル5つを評価する。 PyannoteAI は 11.2% DER で最高のパフォーマンスを達成し、DiariZen は 13.3% DER で競争力のあるオープンソースの代替手段を提供する。故障事例を解析すると,ダイアリゼーションエラーの主な原因は音声セグメントの欠落と話者の混乱にあることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:32:41 GMT)
Revoking Amnesia: RL-based Trajectory Optimization to Resurrect Erased Concepts in Diffusion Models [38.4]
概念消去技術は、安全と著作権の観点から不適切なコンテンツ生成を防止するため、T2I拡散モデルに広く展開されている。確立された消去方法は劣化した効果を示し真のメカニズムに関する疑問を提起する提案するトラジェクトリ最適化フレームワークである textbfRevAm は,デノナイジング過程を動的に操ることで,消去された概念を復活させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:46:19 GMT)
KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction [38.0]
トランスフォーマーベースの大規模言語モデル(LLM)は、推論中にキー値(KV)ペアとしてキャッシュコンテキストを持つ。コンテキストの長さが大きくなると、KVキャッシュのサイズが拡大し、メモリオーバーヘッドが大きくなり、注意の遅延が増大する。本稿では,クエリに依存しないKVキャッシュ消去手法であるKVzipを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:51:05 GMT)
Beyond Sharp Minima: Robust LLM Unlearning via Feedback-Guided Multi-Point Optimization [38.0]
より安定したパラメータ領域を明示的に求める双方向フィードバック誘導最適化フレームワークを提案する。 WMDP と MUSE のベンチマーク実験により,本手法は再学習および脱獄攻撃に対して極めて堅牢であることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:04:46 GMT)
Learning to See Before Seeing: Demystifying LLM Visual Priors from Language Pre-training [37.9]
大規模言語モデル(LLM)は、テキストだけで訓練されているにもかかわらず、リッチな視覚的先行性を開発する。これらの事前設定により、視覚タスクに対して比較的少量のマルチモーダルデータで潜在視覚機能をアンロックすることができる。視覚的先行は、独自のスケーリング傾向と起源を持つ、分離可能な知覚と推論の先行から成り立っていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:57:44 GMT)
Breast Cancer Diagnosis: A Comprehensive Exploration of Explainable Artificial Intelligence (XAI) Techniques [37.9]
乳がんの診断・診断における説明可能な人工知能(XAI)技術の適用について検討する。複雑なAIモデルと実用的な医療アプリケーションの間のギャップを埋めることにおけるXAIの可能性を強調することを目的としている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:26:42 GMT)
SafeEvalAgent: Toward Agentic and Self-Evolving Safety Evaluation of LLMs [37.8]
本稿では, エージェント安全評価の新しいパラダイムとして, 継続的かつ自己進化的なプロセスとしてのリフレーミング評価を提案する。本稿では、構造化されていないポリシー文書を自律的に取り込み、包括的な安全ベンチマークを生成し、永続的に進化させる、新しいマルチエージェントフレームワークSafeEvalAgentを提案する。本実験はSafeEvalAgentの有効性を実証し,評価が強まるにつれてモデルの安全性が一貫した低下を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:20:41 GMT)
TAP: Two-Stage Adaptive Personalization of Multi-task and Multi-Modal Foundation Models in Federated Learning [37.8]
フェデレートラーニング(FL)は、必ずしも各クライアントのニーズに適合するとは限らない最終モデルを生成することが示されている。文献のこのギャップに対処するために,2段階適応パーソナライゼーション(TAP)を提案する。提案アルゴリズムは,多様なデータセットやタスクに対して,多数のベースラインに対して有効であることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:01:32 GMT)
Iterative Residual Cross-Attention Mechanism: An Integrated Approach for Audio-Visual Navigation Tasks [37.7]
IRCAM-AVNは、マルチモーダル情報融合とシーケンスモデリングを統合するエンドツーエンドフレームワークである。初期のマルチモーダルシーケンスと処理された情報シーケンスを利用するマルチレベル残差設計を採用している。実験結果から, 繰り返し残差保持機構を用いたインテリジェントエージェントは, ナビゲーション性能に優れていたことが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:52:57 GMT)
Fading to Grow: Growing Preference Ratios via Preference Fading Discrete Diffusion for Recommendation [37.7]
PreferGrowは個別の拡散に基づくレコメンデーションシステムで、個別のアイテムコーパスよりもユーザの好みを増すことによって、好みの比率をモデル化する。 5つのベンチマークデータセットにまたがって、最先端の拡散ベースのレコメンデータに対して、一貫したパフォーマンス向上を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:37:17 GMT)
PinPoint3D: Fine-Grained 3D Part Segmentation from a Few Clicks [37.7]
PinPoint3Dは、細粒度で多粒度な3Dセグメンテーションのための新しいインタラクティブフレームワークである。数個のユーザーポイントクリックで正確な部分レベルのマスクを生成する。私たちの研究は、よりニュアンスで正確なマシン認識とインタラクションに向けた重要なステップを示しています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:05:29 GMT)
Beyond Pixels: Efficient Dataset Distillation via Sparse Gaussian Representation [37.6]
GSDDは,2次元ガウシアンに基づくデータセット蒸留のための新規かつ効率的なスパース表現である。すべてのピクセルを等しく表現する代わりに、GSDDは少数のガウス原始体を用いて蒸留された画像に重要な離散情報を符号化する。実験の結果,GSDD は CIFAR-10, CIFAR-100, ImageNet サブセット上での最先端性能を実現し, 高効率な符号化と復号化のコストを抑えることができた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:19:05 GMT)
Dual Alignment Maximin Optimization for Offline Model-based RL [37.6]
オフラインの強化剤は、合成から現実の分布ミスマッチのため、重要な展開課題に直面します。本稿では、まずモデル信頼性から、期待したリターンを最適化しながらポリシーの相違に焦点を移し、その後、自己整合的に合成データを組み込む。これは、モデル環境ポリシーの一貫性と、合成およびデータのオフラインを保証する統一されたフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:37:51 GMT)
SAGE: Spatial-visual Adaptive Graph Exploration for Visual Place Recognition [37.6]
視覚的位置認識(VPR)は、外観、視点、環境の変化にもかかわらず、ジオタグ付き画像の堅牢な検索を必要とする。 SAGE(Spatial-visual Adaptive Graph Exploration)は,空間的・視覚的識別の微粒化を促進する統一的な学習パイプラインである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:34:40 GMT)
Predicting LLM Reasoning Performance with Small Proxy Model [37.2]
本研究では,小プロキシが事前学習対象と目標タスクとより緊密に連携することで,大規模モデルの推論を効果的に予測できることを示す。 rBridgeは、フロンティアモデルからの推論トレースをゴールドラベルとして使用して、負のログライクな部分をタスクアライメントで重み付けすることでこれを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:21:33 GMT)
Strong random unitaries and fast scrambling [37.0]
独立な2ビットのハールランダムゲートからなる回路において、強いユニタリ設計が回路深さ$O(log2 n)$で形成可能であることを示す。この結果は、ブラックホール物理学からの高速衝突予想の運用的証明を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:23:46 GMT)
OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always! [37.0]
大規模言語モデル(LLM)の安全性は,大規模なデプロイメントを実現する上で,最も重要な課題のひとつだ。ユーザクエリを適切に受け入れたり拒否したりできる LLM の機能として定義された,運用上の安全性を導入します。我々の評価によると、性能はモデルによって異なるが、それらすべてが非常に運用上安全ではない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:39:17 GMT)
Gradiometric, Fully Tunable C-Shunted Flux Qubits [36.9]
本稿では,T1=25$mu$sまでの緩和時間の改善を特徴とする容量共振束量子ビットを提案する。モデルとして、1オクターブの周波数範囲における2レベルトンネル欠陥の検出を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:51:16 GMT)
Minimum Description Feature Selection for Complexity Reduction in Machine Learning-based Wireless Positioning [36.8]
深層学習に基づくWPの複雑さを大幅に軽減するために,最小記述機能を利用した新しい位置決めニューラルネットワーク(P-NN)を設計する。スパース画像と測定行列の2種類の入力をインテリジェントに処理することで,P-NNの学習能力を向上させる。数値計算の結果,P-NNは深層学習ベースラインに対する性能・複雑性トレードオフにおいて大きな優位性を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:47:12 GMT)
Complexity Reduction in Machine Learning-Based Wireless Positioning: Minimum Description Features [36.8]
我々は、深層学習に基づく無線位置決めアルゴリズムの複雑さを大幅に低減する測位ニューラルネットワーク(P-NN)を設計する。我々の特徴選択は、WPを行うために必要な情報を伝えるために、最大電力測定とその時間的位置に基づく。数値計算の結果,P-NNは深層学習ベースラインに対する性能・複雑性トレードオフにおいて大きな優位性を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:33:35 GMT)
Reinforcement Fine-Tuning Naturally Mitigates Forgetting in Continual Post-Training [36.7]
本稿では,教師付きファインチューニング(SFT)と強化ファインチューニング(RFT)の2つのコアポストトレーニングパラダイムの比較分析を行った。本実験は,7つの多様なマルチモーダルタスクからなるベンチマークで実施した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:32:01 GMT)
Ban&Pick: Ehancing Performance and Efficiency of MoE-LLMs via Smarter Routing [36.6]
Ban&Pickは、よりスマートなルーティングのためのポストトレーニング、プラグイン・アンド・プレイ戦略である。パフォーマンスに大きく影響した重要な専門家を発見し、強化する。トレーニングやアーキテクチャの変更なしに、無償のパフォーマンス向上と推論アクセラレーションを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:29:33 GMT)
DA$^2$: Depth Anything in Any Direction [36.5]
パノラマにはフルのFoV(360$circtimes$180$circ$)があり、視点画像よりも完全な視覚的記述を提供する。従来のメソッドはドメイン内の設定に制限されることが多いため、ゼロショットの一般化は不十分である。 DA$2$: $textbfD$epth $textbfA$nything in $textbfA$ny $textbfD$irection。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:55:37 GMT)
PUREVQ-GAN: Defending Data Poisoning Attacks through Vector-Quantized Bottlenecks [36.5]
PureVQ-GANはセマンティックコンテンツを保持しながらきめ細かいトリガーパターンを破壊する。 CIFAR-10では、PureVQ-GANはグラディエントマッチングやブルジー・ポリトープ攻撃に対して0%の毒性成功率(PSR)を達成する。何百もの反復的な精錬ステップを必要とする拡散ベースの防御とは異なり、PureVQ-GANは50倍以上高速である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:04:17 GMT)
Cutting the Skip: Training Residual-Free Transformers [36.4]
スキップ接続は表現の階層構造を妨害しますスキップが条件付けを改善する理由を示し、その安定化の利点が原則的戦略によって回復できることを明らかにする。標準アーキテクチャを変更することなく、スキップレス変圧器の安定かつ効率的な訓練を可能にする最初の方法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:07:45 GMT)
Free Lunch Alignment of Text-to-Image Diffusion Models without Preference Image Pairs [36.4]
本稿では,T2Iモデルの"フリーランチ"アライメントを可能にするフレームワークであるText Preference Optimization (TPO)を紹介する。 TPOは、ミスマッチしたプロンプトよりもマッチしたプロンプトを好むようにモデルを訓練することで機能する。我々のフレームワークは汎用的で、既存の嗜好ベースのアルゴリズムと互換性がある。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:32:34 GMT)
Griffin: Generative Reference and Layout Guided Image Composition [36.4]
テキストではなく画像から所望のコンテンツが指定されるマルチイメージレイアウト制御の課題に対処する。我々のアプローチはトレーニング不要であり、参照毎に1つのイメージが必要であり、オブジェクトと部分レベルの構成を明示的でシンプルな制御を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:18:16 GMT)
Deconstructing Self-Bias in LLM-generated Translation Benchmarks [36.3]
大きな言語モデル(LLM)は、遅くてコストのかかる人間のキュレーションに代わるスケーラブルな代替品として登場した。 LLMは、ベンチマークを作成するモデルを体系的に好んだ。このバイアスは、生成されたテストデータと評価方法の2つのソースに由来する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:48:35 GMT)
Searching for Difficult-to-Translate Test Examples at Scale [36.2]
インターネットには数万もの潜在的なトピックがある。すべてのトピックにまたがって多数の例を描いて評価することで、最も難しいものを見つけることは不可能です。このフレームワークでは、各トピックは'腕'であり、(コストで)腕を引っ張るには、ひとつの例を描き、それを評価し、その難しさを測る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:55:47 GMT)
TimeRewarder: Learning Dense Reward from Passive Videos via Frame-wise Temporal Distance [36.2]
TimeRewarderは、受動的ビデオから進捗推定信号を導出する、シンプルで効果的な報酬学習手法である。 TimeRewarderはスパース・リワードタスクのRLを大幅に改善し、タスク1タスク当たり20,000のインタラクションしか持たない9/10タスクでほぼ完璧に成功することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:58:20 GMT)
SoMi-ToM: Evaluating Multi-Perspective Theory of Mind in Embodied Social Interactions [36.0]
SoMi-ToMベンチマークは,マルチエージェント複合社会相互作用におけるマルチパースペクティブToMを評価するために設計されている。我々は,35人の第三者視点映像,633人の一人称視点画像,1225人の専門家による複数選択質問を含む挑戦的なデータセットを構築した。その結果,SoMi-ToMではLVLMがヒトよりも有意に低下することが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:52:11 GMT)
FedMuon: Federated Learning with Bias-corrected LMO-based Optimization [36.0]
我々は,ミュオンがフェデレートラーニングにどのように活用できるかを考察した。我々はFedMuonが最先端のフェデレーション学習手法より優れていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:45:12 GMT)
90% Faster, 100% Code-Free: MLLM-Driven Zero-Code 3D Game Development [35.9]
本稿では,ランナブルな3Dゲームのゼロコード開発を自然言語要求から自動化する,初のエンドツーエンド協調型マルチエージェントフレームワークUniGenを紹介する。結果として、UniGenはユーザーからのコーディングを必要とせず、開発時間を91.4%削減することでゲーム作成を民主化している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:14:56 GMT)
Fork-Merge Decoding: Enhancing Multimodal Understanding in Audio-Visual Large Language Models [35.9]
本研究の目的は、音声・視覚大言語モデル(AV-LLM)におけるバランスの取れたマルチモーダル理解を強化することである。現在のAV-LLMでは、オーディオとビデオの機能はデコーダで共同で処理されるのが一般的である。 Fork-Merge Decoding (FMD) は、追加のトレーニングやアーキテクチャの変更を必要としない、シンプルで効果的な推論時間戦略である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:50:02 GMT)
Learning When to Plan: Efficiently Allocating Test-Time Compute for LLM Agents [35.8]
強化学習(RL)による推論のための大規模言語モデル(LLM)の訓練は,その問題解決能力を大幅に向上させる。 LLMエージェントの動的計画を形式化する概念的枠組みを導入し、計画にテスト時間計算をいつ割り当てるかを柔軟に決定できるようにする。 Crafter環境での実験は、このアプローチでトレーニングされた動的計画エージェントがよりサンプリング効率が高く、より複雑な目標を一貫して達成していることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:12:45 GMT)
Unified Cross-Modal Image Synthesis with Hierarchical Mixture of Product-of-Experts [35.8]
MMHVAEと呼ばれるマルチモーダル階層的変分自動エンコーダの深層混合を行い、異なるモードで観察された画像から欠落した画像を合成する。 MMHVAEの設計は、4つの課題に取り組むことに焦点を当てている: (i) 高解像度画像を生成するために複雑なマルチモーダルデータの潜在表現を作成すること、 (ii) 変分分布を奨励し、クロスモーダル画像合成に必要な欠落情報を推定すること、 (iii) 欠落したデータのコンテキストでマルチモーダル情報を融合すること、 (iv) トレーニング時に不完全なデータセットを扱うためにデータセットレベルの情報を活用すること。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:53:49 GMT)
GraphSearch: An Agentic Deep Searching Workflow for Graph Retrieval-Augmented Generation [35.7]
textscGraphSearchは、GraphRAGの二重チャネル検索を備えた新しいエージェントディープ検索ワークフローである。 textscGraphSearchは、従来の戦略よりも解答精度と生成品質を一貫して改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:25:35 GMT)
Text-to-Scene with Large Reasoning Models [35.6]
Reason-3Dは大きな推論モデル(LRM)を利用したテキスト・ツー・シーンモデルである Reason-3Dは、物理的、機能的、コンテキスト的属性をカバーするキャプションを使用してオブジェクト検索を統合する。人間の評価された視覚的忠実度、制約への順守、資産検索品質において、従来の手法よりも大幅に優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:08:11 GMT)
Alignment-Aware Decoding [35.6]
モデルアライメントを直接推論する手法であるアライメント・アウェア・デコーディング(AAD)を導入する。 AADは、様々なアライメントベンチマークとモデルスケールで、一貫して強力なベースラインを上回ります。データ制約のある設定では、AADは高品質な合成データを生成し、標準デコードでのアライメントを改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:24:43 GMT)
GRPO-$λ$: Credit Assignment improves LLM Reasoning [35.5]
GRPO-$lambda$は、複雑な推論タスクのためのLLMのRL微調整におけるクレジット割り当てを強化するGRPOの新たな拡張である。 GRPO-$lambda$とGRPOを比較し、1.5Bから7Bパラメータのモデルを4ドルの異なる数学推論データセットでトレーニングする。 GRPO-$lambda$では、AIME24、Math500、OlympiadMath、MinervaMath、AMCの平均的なパフォーマンスはGRPOよりも3ドル以上改善され、7Bモデルでは4.5ドルポイント改善されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:11:10 GMT)
Revisiting semi-supervised learning in the era of foundation models [35.4]
半教師付き学習(SSL)は、ラベル付きデータとともに豊富なラベル付きデータを活用して学習を強化する。我々は,凍結視覚基盤モデル(VFM)が性能的に劣るSSLベンチマークデータセットを開発し,代表的なSSLメソッドを体系的に評価する。ラベル付きデータのみを用いたパラメータ効率細調整(PEFT)は、ラベルなしデータを活用することなく、SSLのパフォーマンスとよく一致します。ノイズの多い擬似ラベルの悪名高い問題を克服するため,より堅牢な擬似ラベルを生成するために,複数のPEFTアプローチとVFMバックボーンのアンサンブルを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:09:51 GMT)
Causal Interventions Reveal Shared Structure Across English Filler-Gap Constructions [35.3]
我々は,言語モデルに適用された因果的解釈可能性手法は,そのような証拠の価値を大幅に向上させることができると論じる。私たちの経験的焦点は、イングランドのフィラーギャップ依存性構築のセットです。 LMはこれらの構成の類似した抽象的解析に収束することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:57:02 GMT)
Towards an AI-Augmented Textbook [35.3]
生成AIを用いて教科書を変換・拡張する手法を提案する。このアプローチで構築されたシステムをLearning Your Wayと呼ぶ。異なる変換と拡張の教育学的評価を報告し、ランダム化制御試験の結果を報告する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:33:04 GMT)
The non-stabilizerness cost of quantum state estimation [35.2]
単一設定の量子状態推定シナリオにおいて,情報完全性を実現するために必要な非安定化器リソースについて検討する。安定化器資源のみを許す場合、これらの戦略は常に安定器ベースでの射影測定と情報的に等価であることを示す。我々は,$t$ドープクリフォード回路で実装された計測の絡み合い構造と情報パワーの密接な関係を明らかにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:27:59 GMT)
ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs [34.5]
ReSparkは、既存のレポートから分析ロジックをリバースエンジニアリングし、新しいデータセットに適応するシステムである。比較およびユーザスタディを通じてReSparkを評価し,既存の解析コードに頼ることなく,データレポート生成の障壁を低くする効果を実証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:46:23 GMT)
Graph Distribution-valued Signals: A Wasserstein Space Perspective [34.2]
グラフ分布値信号(GDS)として信号をモデル化するグラフ信号処理(GSP)の新しいフレームワークを提案する。信号を分布として表現することで、GDSは自然に不確実性と性を符号化し、従来のグラフ信号を厳密に一般化する。我々はGSPの概念をGDSの概念に体系的にマッピングし、古典的定義が特殊ケースとして回収されることを実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:21:18 GMT)
Reliability Crisis of Reference-free Metrics for Grammatical Error Correction [34.1]
我々は,SOME,Scribendi,IMPARA,LLMベースの4つの基準フリーメトリクスに対する敵攻撃戦略を提案する。これらの結果は、より堅牢な評価方法の必要性を浮き彫りにした。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:58:03 GMT)
On Fitting Flow Models with Large Sinkhorn Couplings [34.0]
フローモデルは、1つのモーダリティ(例えばノイズ)から別のモーダリティ(例えば画像)へ徐々にデータを変換する。近年の研究では、$n$ソースと$n$ターゲットポイントのミニバッチをサンプリングし、OTソルバを使用してそれらを再注文してより良いペアを作る方法が提案されている。エントロピーの正則化が低い大きなシンクホーンカップリングを組み込む場合, 流れモデルに大きな利点があることが示される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:57:27 GMT)
Reconcile Certified Robustness and Accuracy for DNN-based Smoothed Majority Vote Classifier [34.0]
我々は、スムーズな多数決分類器に対して、証明されたロバスト半径を有する一般化誤差を開発する。一般化境界と証明されたロバスト半径の両方の基盤は、部分的には重みスペクトルノルムに基づいて引き出される。本研究では,スムーズな多数決分類を行うための新しい,安価なスペクトル正規化器を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:11:10 GMT)
Causality-guided Prompt Learning for Vision-language Models via Visual Granulation [33.9]
CLIPの視覚的顆粒化による因果誘導型テキストプロンプト学習法を提案する。筆者らのCaPL法は,特に細粒度データセットにおいて,最先端のプロンプト学習法よりも優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:09:02 GMT)
Learning to Generate Unit Test via Adversarial Reinforcement Learning [33.8]
単体テストはプログラミングにおける中核的な実践であり、人間の開発者や大規模言語モデル(LLM)によるプログラムの体系的な評価を可能にする。プログラム命令を与えられた高品質な単体テストを生成するためにLLMを訓練する新しい強化学習フレームワークであるUTRLを提案する。実験では, UTRLを用いてトレーニングしたQwen3-4Bが生成した単体テストが, 教師付き微調整によりトレーニングした同一モデルで生成した単体テストと比較して高い品質を示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:55:43 GMT)
BianCang: A Traditional Chinese Medicine Large Language Model [33.7]
そこで本研究では,まずドメイン固有知識を注入し,まず目標刺激によって調整し,診断と識別能力を向上させる,TCM固有の大規模言語モデルであるBianCangを提案する。実際の病院記録に基づく事前学習コーパス,ChP-TCMデータセット,および中華人民共和国の薬局類由来のChP-TCMデータセットを構築した。我々は,TCMと医用コーパスを総合的に収集し,TCMの理解を深めるための包括的データセットを構築した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:25:18 GMT)
ACT: Agentic Classification Tree [33.7]
本稿では,各分割を自然言語質問として定式化することにより,決定木手法を非構造化入力に拡張するエージェント分類木(ACT)を提案する。テキストベンチマークの実験では、ACTは透過的で解釈可能な決定パスを生成しながら、プロンプトベースのベースラインと一致またはオーバーしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:54:08 GMT)
Mutual Information Minimization for Side-Channel Attack Resistance via Optimal Noise Injection [33.6]
サイドチャネル攻撃(SCA)は、物理的漏洩を通じて秘密鍵を抽出することで、システムセキュリティに深刻な脅威をもたらす。ガウス入力を持つシステムにおける相互情報の最小化のための最適人工雑音注入法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:17:06 GMT)
InverseBench: Benchmarking Plug-and-Play Diffusion Priors for Inverse Problems in Physical Sciences [33.5]
我々は,5つの科学的逆問題にまたがる拡散モデルを評価するフレームワークであるtextscInverseBenchを紹介する。これらの問題には、既存のベンチマークとは異なるユニークな構造上の課題が存在する。我々は、強力なドメイン固有のベースラインに対して、プラグ・アンド・プレイ拡散プリミティブを使用する14の逆問題アルゴリズムをベンチマークする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:26:46 GMT)
LoLA: Low-Rank Linear Attention With Sparse Caching [33.4]
本稿では,リフレッシュなリコールを促進するリニアアテンションのための学習自由化であるLoLAを提案する。パスキー検索タスクでは、LoLAはベースモデルの精度を0.6%から97.4%に改善している。 LoLAは、ゼロショットコモンセンス推論タスクにおいて、他の1Bおよび8Bパラメータのサブクワッドラティックモデルよりも優れている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:42:50 GMT)
Go with Your Gut: Scaling Confidence for Autoregressive Image Generation [33.4]
テストタイムスケーリング(TTS)は、大規模言語モデルの拡張において顕著な成功を収めているが、NTP(Next-token Prediction)自動回帰(AR)画像生成への応用は、まだほとんど達成されていない。これはNTPベースのAR画像生成用に特別に設計された最初のTSフレームワークで、早期復号化や補助的な報酬の不要なScalingARを紹介する。一般的なベンチマークと構成ベンチマークの両方の実験では、ScalingAR(1)はGenEvalで12.5%、TIIF-Benchで15.2%改善し、(2)ベースラインを上回りながら視覚トークンの消費量を62.0%削減し、(3)堅牢性の向上に成功している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:08:25 GMT)
CATCH: A Novel Data Synthesis Framework for High Therapy Fidelity and Memory-Driven Planning Chain of Thought in AI Counseling [33.3]
CATCHはこれらの課題に対処するために設計された新しいデータ合成フレームワークである。治療の忠実度を改善するために, プログレッシブ・ダイアログ合成戦略を導入する。各応答の背後にある意思決定の根拠を捉えるために、メモリ駆動思考パターンを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:44:00 GMT)
scSiameseClu: A Siamese Clustering Framework for Interpreting single-cell RNA Sequencing Data [33.2]
単細胞RNAシークエンシング(scRNA-seq)は細胞不均一性を示す。細胞クラスタリングは、細胞タイプとマーカー遺伝子の同定において重要な役割を担っている。グラフニューラルネットワーク(GNN)ベースの手法はクラスタリング性能を大幅に改善した。 scSiameseCluはシングルセルRNA-seqデータを解釈するための新しいフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:11:49 GMT)
Beyond the Individual: Introducing Group Intention Forecasting with SHOT Dataset [33.0]
グループ意図は、複数の個人の行動を通じて現れる共通の目標を表す。グループ意図予測(Group Intention Forecasting, GIF)は、集団意図がいつ起こるかを予測する新しいタスクである。 SHOTはGIF用の最初の大規模なデータセットで、5つのカメラビューから撮影された1,979本のバスケットボールビデオクリップで構成されている。 GIFTは、意図の出現を予測するためにグループダイナミクスを進化させる、きめ細かい個々の特徴とモデルを抽出するフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:44:41 GMT)
FedGCS: A Generative Framework for Efficient Client Selection in Federated Learning via Gradient-based Optimization [33.0]
FedGCSは、新しい生成クライアント選択フレームワークである。連続表現空間内の豊富な意思決定知識を効率的に符号化する。これは、よく訓練されたデコーダのビームサーチにより、最終的な最適なクライアント選択を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:41:54 GMT)
Learning Unified User Quantized Tokenizers for User Representation [32.9]
U2QT(Unified User Quantized Tokenizers)は、ドメイン間の知識伝達と異種ドメインの初期融合を統合する新しいフレームワークである。まず、Qwen3 Embeddingモデルを用いて、コンパクトで表現力のある特徴表現を導出する。第二に、マルチビューRQ-VAEは、共有およびソース固有のコードブックを通じて、因果埋め込みをコンパクトトークンに識別する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:51:32 GMT)
Teaching Metric Distance to Discrete Autoregressive Language Models [32.8]
DIST2Lossは自動回帰離散モデルの学習を目的とした遠隔認識フレームワークである。 DIST2Lossは、固有距離測定値から派生した指数関数的な家族分布を離散的なカテゴリー最適化ターゲットに変換する。経験的評価は多様なマルチモーダルアプリケーションにおいて一貫した性能向上を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:58:52 GMT)
BiasFreeBench: a Benchmark for Mitigating Bias in Large Language Model Responses [32.6]
大規模言語モデル(LLM)のバイアス緩和手法に関する既存の研究は、様々なベースラインとメトリクスを用いてバイアス低減性能を評価する。 BiasFreeBenchは8つの主流バイアス緩和手法を包括的に比較した経験的ベンチマークである。我々は、バイアス軽減研究のための統合テストベッドを確立することを目的として、我々のベンチマークを公開します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:56:54 GMT)
The Flaw of Averages: Quantifying Uniformity of Performance on Benchmarks [32.0]
本稿では,分布の観点からベンチマークの信頼性について検討し,ベンチマークの調和を導入する。高調和性は望ましいベンチマーク特性であり、凝集度がモデル間の均一なコンピテンスを反映していることを示している。正確さとともに調和を報告することを推奨することで、単純なパフォーマンス平均から、より堅牢で分散的に信頼性の高いパフォーマンス測定まで、評価を見直します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:14:30 GMT)
Are Robust LLM Fingerprints Adversarially Robust? [32.0]
まず、モデルフィンガープリントに対する具体的な、実用的な脅威モデルを定義する。次に、既存のモデルフィンガープリント方式を批判的に見て、その基本的な脆弱性を特定します。これらに基づいて,各脆弱性に適した適応的敵攻撃を開発する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:47:09 GMT)
AICrypto: A Comprehensive Benchmark for Evaluating Cryptography Capabilities of Large Language Models [32.0]
AICryptoは、大規模言語モデルの暗号能力を評価するために設計された最初の包括的なベンチマークである。ベンチマークは135の多重選択質問、150のキャプチャー・ザ・フラッグ課題、18の証明問題で構成されている。 LLMをリードする17のモデルの評価は、最先端のモデルが暗号概念を記憶する上で、人間の専門家と一致しているか、さらに上回っていることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:21:53 GMT)
Incentivizing Reasoning for Advanced Instruction-Following of Large Language Models [32.0]
CoT(Chain-of- Thought)は、大規模言語モデル(LLM)の能力を普遍的に改善することが期待される。テスト時間計算のスケーリングに対する推論をインセンティブ化することで,複雑な命令を扱う上でのLLMを向上する体系的手法であるRAIFを提案する。より優れたCoT施行のためのサンプルワイドコントラストによる複雑な指示の下での推論の浅く、重要でない性質に対処する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:50:34 GMT)
CODA: Repurposing Continuous VAEs for Discrete Tokenization [31.9]
textbfCODA(textbfCOntinuous-to-textbfDiscrete textbfAdaptation)は、圧縮と離散化を分離するフレームワークである。提案手法は,ImageNet 256$times$256ベンチマークにおいて,$mathbf0.43$と$mathbf1.34$を8倍,$16倍の圧縮で,100%のコードブック利用と注目すべき再構成FID(rFID)を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:36:25 GMT)
Model Merging Scaling Laws in Large Language Models [31.7]
クロスエントロピーによって測定された言語モデルマージのスケーリング法則について検討する。モデルサイズとエキスパート番号を結びつけるコンパクトパワー法則を同定する。ここでは、なぜゲインが 1/k になるのかを説明する単純な理論を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:04:41 GMT)
One ruler to measure them all: Benchmarking multilingual long-context language models [31.7]
我々は26言語にわたる長文言語モデルを評価するために設計された多言語ベンチマークONERULERを提案する。英語は、長文タスク(26語中6位)における最高のパフォーマンス言語ではなく、ポーランド語が最上位言語として登場した。異なる言語で命令とコンテキストが現れる言語間シナリオでは、命令言語によってパフォーマンスが最大20%変動する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:07:14 GMT)
Medical Question Summarization with Entity-driven Contrastive Learning [31.5]
本稿では,エンティティ駆動型コントラスト学習(ECL)に基づく新しい医療質問要約フレームワークを提案する。 ECLは、頻繁に質問される質問(FAQ)に存在する医療機関を採用し、硬い負のサンプルを生成する効果的なメカニズムを考案している。これはそれぞれMeQSum、CHQ-Summ、iCliniq、HealthCareMagicデータセット上のROUGE-1メトリックの観点で52.85、43.16、41.31、43.52という新しい最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:11:19 GMT)
Interactive Learning for LLM Reasoning [31.5]
本稿では,大規模言語モデルの独立した問題解決能力を高めるために,マルチエージェントインタラクションが有効かどうかを検討する。動的インタラクションと知覚を統合した新しいコラーニングフレームワークであるIRRを紹介する。 ILRはシングルエージェント学習を一貫して上回り、最強のベースラインよりも最大5%向上した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:21:31 GMT)
MAPLE: Multi-scale Attribute-enhanced Prompt Learning for Few-shot Whole Slide Image Classification [31.3]
マルチスケールな視覚的セマンティクスを統合し,エンティティレベルとスライドレベルの両方で予測を行う,少数ショットWSI分類のための階層的フレームワークを提案する。 3つのがんコホートの結果から,病理診断におけるアプローチの有効性が確認された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:57:56 GMT)
A Multimodal LLM Approach for Visual Question Answering on Multiparametric 3D Brain MRI [31.1]
mpLLMは、3次元脳MRI上での視覚的質問応答のための、迅速な条件付き階層的混合処理アーキテクチャである。 mpLLMは、複数の相互関連3Dモダリティを融合するために、モダリティレベルおよびトークンレベルのプロジェクションエキスパートをルートする。 mpLLMは、複数のmpMRIデータセットにおいて、強い医用VLMベースラインを平均5.3%上回る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:30:30 GMT)
RoleConflictBench: A Benchmark of Role Conflict Scenarios for Evaluating LLMs' Contextual Sensitivity [30.9]
RoleConflictBenchは、複雑な社会的ジレンマにおける大規模言語モデルの文脈感度を評価するために設計された新しいベンチマークである。私たちのベンチマークでは、3段階のパイプラインを使用して、65のロールにわたる13K以上の現実的なロールコンフリクトシナリオを生成しています。本分析では,これらのバイアスを定量化し,家族・職業領域における役割の優位性を明らかにした。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:42:49 GMT)
Guiding Mixture-of-Experts with Temporal Multimodal Interactions [30.7]
本稿では,時間的相互作用を定量化してMoEルーティングをガイドする新しいフレームワークを提案する。マルチモーダルなインタラクション対応ルータは、インタラクションの性質に基づいて、トークンを専門家にディスパッチする方法を学ぶ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:26:31 GMT)
K-DeCore: Facilitating Knowledge Transfer in Continual Structured Knowledge Reasoning via Knowledge Decoupling [30.5]
既存の連続学習アプローチは、シーケンシャルなタスクに適用した場合、重大な課題に直面します。そこで我々はCSKRフレームワークであるtextscK-DeCoreを提案する。 textscK-DeCoreは、異なるステージに対してデュアルパースペクティブなメモリ統合機構を統合し、構造誘導された擬似データ合成戦略を導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:16:42 GMT)
Limited Preference Data? Learning Better Reward Model with Latent Space Synthesis [30.4]
リワードモデリングは、大きな言語モデルと人間の嗜好の整合に不可欠である。既存のテキストデータ合成手法は計算コストが高い。本稿では,言語に潜む埋め込み空間において,好みデータを直接合成するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:48:50 GMT)
Generating Difficult-to-Translate Texts [30.4]
現実世界から得られた機械翻訳ベンチマークは、急速に廃止された。サブサンプリングやオフスクラッチ合成のような難しいテストケースを作成するための現在の手法は、難しい例を識別できないか、多様性と自然性の欠如に悩まされているかのいずれかである。 MTブレーカ(MT-breaker)は,大規模な言語モデルにおいて,翻訳の難易度を高めるために,ソーステキストを反復的に洗練する手法である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:46:08 GMT)
Linking Process to Outcome: Conditional Reward Modeling for LLM Reasoning [30.3]
Process Reward Models (PRM) は、最終回答に向けてステップバイステップの推論を導くことを目的としている。既存のPRMは、ステップ間の依存関係をキャプチャしたり、プロセスの報酬を最終的な結果と整合させるのに失敗します。本稿では,時間的プロセスとして推論をフレーム化して正解を導く条件付きリワードモデリングを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:38:45 GMT)
Beyond Token Probes: Hallucination Detection via Activation Tensors with ACT-ViT [30.1]
両軸におけるアクティベーションデータの自然な逐次構造の上に構築する。画像に類似したフルアクティベーションテンソルの治療を提唱する。アーキテクチャがマルチLLMトレーニングから大きくメリットがあることを示します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:37:43 GMT)
CHROMA: Consistent Harmonization of Multi-View Appearance via Bilateral Grid Prediction [30.1]
カメラパイプラインは、露光調整、ホワイトバランス、色補正など、デバイス上の広範な処理を適用する。外観の変化は複数ビューの一貫性に反し、新しいビュー合成を劣化させる。多視点一貫した方法で測光変動を補正するために、空間適応型二元格子を予測できる一般化可能なフィードフォワード手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:11:14 GMT)
Discovering and Steering Interpretable Concepts in Large Generative Music Models [30.1]
スパースオートエンコーダ(SAE)を用いた解釈可能な概念発見手法を提案する。以上の結果から,理論や言語には明確な相違点が欠如していることが判明した。拡張として、モデル世代をステアリングするためにそのような概念を使用できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:23:07 GMT)
Bubble, Bubble, AI's Rumble: Why Global Financial Regulatory Incident Reporting is Our Shield Against Systemic Stumbles [29.9]
現在のAIインシデントデータベースは、クラウドソーシングやニューススクレイピングに依存しており、体系的に資本市場の異常を見落としている。本稿では,医療・航空のインシデントドキュメンテーションモデルを用いて,取引後の報告フレームワークを合成する,規制グレードのグローバルデータベースを提案する。我々は、AI主導のシステムリスクの不安定な「カルドロン」に対して、AI主導の金融市場におけるリスク管理を強化し、レジリエンスを高めるための即時行動を求めます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:01:25 GMT)
Regularizing Learnable Feature Extraction for Automatic Speech Recognition [29.8]
ニューラルフロントエンドは、音声認識のための従来の固定された特徴抽出パイプラインに代わる魅力的な代替手段である。本研究では,学習可能な特徴抽出フロントエンドを用いたASRモデルの正規化手法について検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:23:56 GMT)
Clip-Low Increases Entropy and Clip-High Decreases Entropy in Reinforcement Learning of Large Language Models [29.8]
PPOとGRPOのクリッピング機構がエントロピーのバイアスを引き起こすことを示す。より積極的なクリップロー値では、RLVRトレーニングにおいてエントロピーを増加させ、探索を促進し、最終的にエントロピー崩壊を防ぐことができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:33:15 GMT)
Universal Beta Splatting [29.7]
我々は,3次元ガウススプラッティングをN次元異方性ベータカーネルに一般化し,明示的な放射場レンダリングを行う統一フレームワークを開発した。提案手法は、複雑な光輸送効果を捉え、異方性ビュー依存の外観を扱い、補助的なネットワークや特定の色エンコーディングを必要とせずにシーンダイナミクスをモデル化する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:03:22 GMT)
LieHMR: Autoregressive Human Mesh Recovery with $SO(3)$ Diffusion [29.6]
単一のRGB画像からHuman Meshリカバリの問題に取り組む。 2次元観察から3次元の人間のポーズを復元することは本質的に曖昧であるが、既存のアプローチのほとんどは単一の決定論的出力を後退させている。本稿では,2次元観察に適合した分布をモデル化する手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:50:56 GMT)
TimeScope: Towards Task-Oriented Temporal Grounding In Long Videos [29.5]
ToTGは、タスクの自然な記述に基づいて必要な情報を含む時間間隔をローカライズすることを目的としている。 TimeScopeは進歩的推論に基づく新しいフレームワークである。大規模な実験により、TimeScopeは既存の時間的接地法と一般的なMLLMよりも一貫して優れていることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:00:43 GMT)
Auto-ARGUE: LLM-Based Report Generation Evaluation [29.2]
Auto-ARGUEは、レポート生成評価のための最近のARGUEフレームワークの堅牢な実装である。本稿では,TREC 2024 NeuCLIR トラックからのレポート生成パイロットタスクにおける Auto-ARGUE の解析を行い,人間の判断とシステムレベルの相関性を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:41:11 GMT)
Are Knowledge and Reference in Multilingual Language Models Cross-Lingually Consistent? [29.2]
言語間の一貫性は、言語間の伝達性を評価するために考慮すべきである。コードスイッチングトレーニングと言語間単語アライメントの目的は、最も有望な結果を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:18:04 GMT)
SMS: Self-supervised Model Seeding for Verification of Machine Unlearning [29.1]
そこで本研究では,真のサンプルに対する未学習検証を実現するための自己教師付きモデル探索(SMS)手法を提案する。 SMSは、ユーザ固有の種(ユーザのユニークなインデックスなど)、元のサンプル、モデルなど)をリンクし、未学習の真のサンプルの検証を容易にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:18:44 GMT)
Dynamical Acoustic Control of Resonance Fluorescence from a Strongly Driven Two-Level System [29.1]
2つの原子-光子状態の間のラビ遷移を第2ギガヘルツ周波数場が駆動する新しい駆動条件下で共鳴蛍光スペクトルを実験的に検討した。その結果, 強い駆動限界における単一2レベル系, 光場, 音場間の量子相互作用に関する新たな知見が得られた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:36:56 GMT)
Octic Vision Transformers: Quicker ViTs Through Equivariance [29.0]
我々は幾何学的対称性を捉えるためにOctic Vision Transformer (octic ViTs)を導入する。われわれの八面体線形層はFLOPの5.33倍、メモリの8倍の低減を実現している。我々は ImageNet-1K 上で octic ViT (DeiT-III) と unsupervised (DINOv2) を訓練する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:21:07 GMT)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement [29.0]
FB(Flicker-banding)は、カメラのローリングシャッター読み出しとディスプレイの明るさ変調との間の時間的エイリアスから生じる明るさ%u2013darkストライプを交互に変化させる。我々は、FB除去を専用修復タスクとして定式化し、遅延拡散拡張(RIFLE)による画像フリッカバンディングの除去を導入する。我々の知る限りでは、FBのシミュレーションと除去の研究は初めてである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:40:08 GMT)
The Impact of Scaling Training Data on Adversarial Robustness [28.8]
ロバストネスは、データボリュームとモデルサイズの両方で対数スケーリングの法則に従う。 DINOv2のようなデータセットでトレーニングされた自己教師型モデルでは、はるかに大きく、キュレートされていないデータセットでトレーニングされたモデルよりも優れています。人間の評価は、人間と機械の視界の間に永続的なギャップを露呈する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:20:56 GMT)
Keep It Real: Challenges in Attacking Compression-Based Adversarial Purification [28.8]
再構築された画像における高いリアリズムは、攻撃の難しさを著しく増大させる。現実的かつ高忠実な再構築を実現できる圧縮モデルが,我々の攻撃に対して極めて耐性があることを実証した。この研究は、将来の敵対的攻撃の大きな障害を強調し、現実主義を克服するより効果的な技術を開発することが、総合的なセキュリティ評価にとって重要な課題であることを示唆している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:28:24 GMT)
From MNIST to ImageNet: Understanding the Scalability Boundaries of Differentiable Logic Gate Networks [28.8]
差別化可能な論理ゲートネットワーク(DLGN)は、従来のフィードフォワードネットワークに代わる、非常に高速でエネルギー効率のよい代替品である。本研究では,大規模マルチクラスデータセット上でのDLGNの挙動について検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:27:58 GMT)
DecepChain: Inducing Deceptive Reasoning in Large Language Models [28.8]
大きな言語モデル(LLM)は、そのチェーン・オブ・思想(CoT)によって、ますます強力な推論能力を示している。攻撃者はLSMを誘導して、一見すると不正確で一貫性のないCoTを生成することができる。我々は、新しいバックドア攻撃パラダイムであるDecepChainを紹介します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:23:40 GMT)
MOLM: Mixture of LoRA Markers [28.8]
本稿では、符号化問題を生成モデルのパラメータの鍵依存として定式化する一般的な透かしフレームワークを提案する。このフレームワークでは、残部および注目ブロック内でバイナリキーが軽量なLoRAアダプタを活性化するルーティングベースのインスタンス化であるMixture of LoRA Markers(MOLM)を導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:27:14 GMT)
Toward Quantum-Enabled Biomarker Discovery: An Outlook from Q4Bio [28.7]
本稿では,ハイブリッド量子古典アルゴリズムの共設計に関するケーススタディと今後の展望について述べる。我々は、経験的量子優位(EQA)を、同じタスクにおける最先端の古典的手法に対する量子ハードウェアを用いた測定可能な性能向上として定義する。ハードウェアの制約がアルゴリズムと物理デバイス機能との協調設計を必要とする現行デバイスにおける機能選択のための量子サブルーチンの実装について論じる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:49:53 GMT)
Cut the Deadwood Out: Backdoor Purification via Guided Module Substitution [28.7]
モデルNLPモデルは、HuggingFaceのような信頼できないプラットフォームからのデータセットに対して、一般的に訓練(あるいは微調整)される。本稿では,単一のプロキシモデルを用いて,被害者モデルのガイド型マージに基づく効果的なリトレーニングフリー手法であるガイドモジュール置換(GMS)を提案する。 GMSは、特にLWSのような挑戦的な攻撃に対して、最強の防衛ベースラインさえも大きく上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:49:22 GMT)
InfiAgent: Self-Evolving Pyramid Agent Framework for Infinite Scenarios [28.7]
InfiAgentはピラミッドのようなDAGベースのMulti-Agent Frameworkで、textbfinfiniteのシナリオに適用できる。 InfiAgentはADAS(類似の自動生成エージェントフレームワーク)と比較して9.9%高いパフォーマンスを実現している
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:55:50 GMT)
Metis: Training LLMs with FP4 Quantization [28.6]
メティス(Metis)は、異方性スペクトルを独立量子化のためのより狭い部分分布に分割するフレームワークである。 100Bトークンで訓練されたLLaMA-3 8Bでは、メティスは重量、アクティベーション、勾配のFP4量子化による堅牢なW4A4G4トレーニングを可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:14:03 GMT)
GeoSketch: A Neural-Symbolic Approach to Geometric Multimodal Reasoning with Auxiliary Line Construction and Affine Transformation [28.5]
GeoSketchは、幾何学的推論をインタラクティブな知覚・推論・アクションループとして再キャストする、ニューラルシンボリックなフレームワークである。階層的な意思決定、実行可能な視覚行動、象徴的な検証を統一することにより、GeoSketchは静的解釈から動的相互作用へのマルチモーダル推論を前進させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:14:18 GMT)
Communication-Aware Knowledge Distillation for Federated LLM Fine-Tuning over Wireless Networks [28.5]
大きな言語モデル(LLM)のためのフェデレーションラーニング(FL)は、クライアントが生データを交換することなく、ローカルにデプロイされたLLMまたはより小さな言語モデル(SLM)を協調的に微調整できるプライバシー保護スキームを提供する。従来のFLモデルのパラメータ共有手法は、多くの技術的課題を解決するが、それでも高い通信オーバーヘッドを発生させる。共有ロジットによる相互知識伝達の枠組みであるフェデレート蒸留を提案する。提案手法は,通信オーバヘッドを約50%削減しつつ,ベースライン方式よりも優れた性能を実現することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:42:50 GMT)
RobustMerge: Parameter-Efficient Model Merging for MLLMs with Direction Robustness [28.4]
RobustMergeは、方向ロバスト性を維持するために相補的なパラメータ適応を備えたトレーニング不要なパラメータ効率のマージ手法である。多様なマルチモーダルタスクからなるベンチマークを構築し,本手法の卓越した性能と一般化性を証明する実験を行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:50:33 GMT)
Learning Generalizable Shape Completion with SIM(3) Equivariance [28.3]
3次元形状補完法は通常、スキャンが標準フレームに予め整列されていると仮定する。このリークは、ネットワークが固有の幾何学を推測するのではなく、絶対的な位置を記憶するために利用するであろうポーズとスケールの手がかりである。 SIM(3)-等変形状補完ネットワークは, モジュール層が連続的に特徴を正準化し, 類似性不変形状の推論を行い, 元のフレームを復元する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:58:55 GMT)
Distillation of Large Language Models via Concrete Score Matching [28.3]
大規模言語モデル (LLM) は優れた性能を提供するが、効率的な推論のための知識蒸留 (KD) の展開に費用がかかる。本稿では,ソフトマックスによる平滑化と最適解集合の制約を克服する離散的なスコアマッチング手法を提案する。実験により、CSDは最近のKD目標を一貫して上回り、良好なフィデリティと多様性のトレードオフを達成し、オン・ポリティの技法と組み合わせることで補完的な利益を得ることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:21:28 GMT)
Less is More: Towards Simple Graph Contrastive Learning [28.2]
グラフコントラスト学習(GCL)は教師なしグラフ表現学習に対して強い期待を示しているが、ヘテロ親和性グラフに対する効果は限定的である。既存の手法の多くは、複雑な拡張スキーム、複雑なエンコーダ、あるいは負のサンプリングに依存している。グラフトポロジから構造的特徴を集約することでノード特徴雑音を緩和する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:56:50 GMT)
FakeChain: Exposing Shallow Cues in Multi-Step Deepfake Detection [28.2]
マルチステップまたはハイブリッドのディープフェイクは、シングルステップのフォージェリーでトレーニングされたモデルを検出するために、予期せぬ技術的課題を生じさせる可能性がある。 textbfFakeChainは,5つの最先端の代表ジェネレータを用いて合成した1-,2-,3-Stepフォージェリーからなる大規模ベンチマークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:02:10 GMT)
CE-GPPO: Coordinating Entropy via Gradient-Preserving Clipping Policy Optimization in Reinforcement Learning [28.0]
政策エントロピーは、訓練中の探検と搾取のバランスを反映している。既存の方法は、クリッピング機構により、低確率トークンから貴重な勾配信号を捨てる。 textbfGradient textbfPreserving textbfPolicy textbfOptimization を用いて textbfCoordinating textbfEntropy を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:07:14 GMT)
Stealthy Yet Effective: Distribution-Preserving Backdoor Attacks on Graph Classification [27.9]
グラフニューラルネットワーク(GNN)は、ノード分類、リンク予測、グラフ分類といったタスク間で強いパフォーマンスを示している。ノードレベルの攻撃はローカルメッセージパッシングを利用するが、グラフレベルの攻撃は、ステルスを維持しながらグローバルな表現を操作するという難しい課題に直面している。 DPSBAは,アノマ・アウェア・ディスクリミネーターが指導する敵対的訓練を通じて,流通中のトリガを学習するクリーンラベルバックドアフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:04:57 GMT)
Retrieval-Augmented Generation for Electrocardiogram-Language Models [27.8]
生成型心電図言語モデル(ELM)は、ECG信号に条件付きテキスト応答を生成することができる。 Retrieval-Augmented Generation (RAG)は幻覚の低減と自然言語生成の改善を支援する
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:32:34 GMT)
v1: Learning to Point Visual Tokens for Multimodal Grounded Reasoning [27.7]
簡単なポイント・アンド・コピーアプローチによるアクティブな視覚的参照を可能にする軽量な拡張であるv1を紹介する。これにより、モデルは関連するイメージパッチを特定し、埋め込みを推論ストリームにコピーすることができる。我々のポインティング戦略では、MLLMはセマンティックな表現をキーとして直接イメージパッチを選択でき、知覚的証拠はモデルの推論と同じ空間に埋め込まれている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:46:00 GMT)
CAST: Continuous and Differentiable Semi-Structured Sparsity-Aware Training for Large Language Models [27.7]
スパシティアウェアトレーニングは、大きな言語モデルをハードウェアフレンドリーなスパースパターンに変換するための効果的なアプローチである。スパースモデルのための連続的かつ微分可能なスパース対応トレーニングフレームワークであるContinuous Adaptive Sparse Trainer (CAST)を提案する。以上の結果から,従来の最先端手法に比べて,トレーニングリソースの最小化による難易度とゼロショット精度の両面で有意な改善が見られた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:28:47 GMT)
SafeBehavior: Simulating Human-Like Multistage Reasoning to Mitigate Jailbreak Attacks in Large Language Models [27.6]
大規模言語モデル(LLM)は、さまざまな自然言語処理タスクで素晴らしいパフォーマンスを実現している。しかし、彼らの成長力は、ビルトインの安全メカニズムを回避するジェイルブレイク攻撃のような潜在的なリスクを増幅する。本研究では,ヒトの適応的多段階推論過程をシミュレートする新しい階層型ジェイルブレイク防御機構であるSafeBehaviorを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:50:59 GMT)
Mitigating Biases in Language Models via Bias Unlearning [27.6]
両経路のアンラーニング機構によって目的のデバイアスを実現する新しいモデルデバイアスフレームワークであるBiasUnlearnを提案する。その結果、BiasUnlearnは言語モデルにおけるバイアスを軽減するために既存の手法よりも優れており、言語モデリング能力は維持されていることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:15:12 GMT)
QuestA: Expanding Reasoning Capacity in LLMs via Question Augmentation [27.6]
強化学習(Reinforcement Learning, RL)は、大規模言語モデル(LLM)を推論タスクで訓練するための中心的なパラダイムとして登場した。近年の研究では、RLがベースモデルを超えて推論能力にインセンティブを与える能力に疑問が呈されている。本稿では,課題解決の難しさを抑えるため,学習中に部分解を導入するという,質問増補によるシンプルかつ効果的な戦略を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:42:16 GMT)
CrediBench: Building Web-Scale Network Datasets for Information Integrity [27.6]
CrediBenchは、時間的Webグラフを構築するための大規模データ処理パイプラインである。我々のアプローチは、一般的な誤情報領域の動的進化を捉えている。本稿では,このグラフスナップショットを用いた実験から,信頼度を学習するための構造的およびWebページコンテンツ信号の強度を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:57:38 GMT)
Automated Model Discovery via Multi-modal & Multi-step Pipeline [27.3]
効率的な自動モデル探索のためのマルチモーダル・グラニュアル・マルチステップパイプラインを提案する。我々のパイプラインは、細部を捕捉し、強力な一般化性を保証するモデルを効果的に発見することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:40:05 GMT)
Kairos: Towards Adaptive and Generalizable Time Series Foundation Models [27.1]
時系列基礎モデル (TSFM) は時系列解析の強力なパラダイムとして登場してきた。動的パッチトークンとインスタンス適応型位置埋め込みを統合した,柔軟なTSFMフレームワークであるKairosを提案する。 Kairosは2つの共通ゼロショットベンチマークのパラメータをはるかに少なくして、優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:02:26 GMT)
Memory-Driven Self-Improvement for Decision Making with Large Language Models [27.0]
大規模言語モデル(LLM)は、シーケンシャルな意思決定タスクのための効果的なアクションポリシーとして登場した。本稿では,LLMの事前知識とドメイン固有体験のコンパクトメモリを組み合わせた,メモリ駆動型自己改善フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:46:06 GMT)
NePTune: A Neuro-Pythonic Framework for Tunable Compositional Reasoning on Vision-Language [26.9]
ネプチューン(NePTune)は、基礎視覚モデルの知覚能力と象徴的推論の合成表現性を統合する、神経象徴的なフレームワークである。 NePTuneは、自然言語クエリを、命令制御フローとVLM生成の不確実性を推論できるソフトロジック演算子をブレンドする実行可能なPythonプログラムに変換する。我々は、複数の視覚的推論ベンチマークと様々なドメイン上でNePTuneを評価し、敵対的テストを活用し、強力なベースモデルよりも大幅に改善したことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:22:42 GMT)
RAGferee: Building Contextual Reward Models for Retrieval-Augmented Generation [26.9]
RAGfereeは、質問回答(QA)データセットを、スタイリスティックな特徴よりも基礎性を優先する選好ペアに再利用する方法論である。 RAGfereeを用いて、4Kサンプルと7Bから24Bパラメータの微調整RMの小さな選好データセットをキュレートする。我々のRAG中心のRMはConJudgeBenchの最先端性能を達成し、既存の70B以上のRMをはるかに大きな(2.4Mサンプルまで)一般コーパスで訓練し、+15.5%の絶対的な改善を実現した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:41:40 GMT)
STaR-Attack: A Spatio-Temporal and Narrative Reasoning Attack Framework for Unified Multimodal Understanding and Generation Models [26.9]
統一マルチモーダル理解・生成モデル(UMM)における世代間結合から生じる脆弱性を同定する。セマンティックドリフトを使わずにUMMのユニークな安全性の弱点を利用する,初のマルチターンジェイルブレイク攻撃フレームワークSTaRAttackを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:22:04 GMT)
How Diffusion Models Memorize [26.7]
拡散モデルはトレーニングデータを記憶し深刻なプライバシーと著作権の懸念を引き起こすことができます初診時のトレーニングサンプルの過大評価により,暗記が促進されることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:03:27 GMT)
Feedback Forensics: A Toolkit to Measure AI Personality [26.5]
優れた”AIモデルを作るいくつかの特徴は、事前に説明することが難しい。我々は、人間の(またはAI)フィードバックによって奨励されたもの、そしてそのようなフィードバックに基づいてトレーニングされ評価されたAIモデルにまたがって提示されたものの両方、AIの性格変化を追跡するためのオープンソースのツールキットを紹介します。まず、(A)Arena、MultiPref、PRISMなどの一般的なフィードバックデータセットで推奨される性格特性を分析し、(B)このツールキットを用いて、人気のあるモデルがどれだけの特性を示すかを分析する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:19:21 GMT)
Learning Egocentric In-Hand Object Segmentation through Weak Supervision from Human Narrations [26.5]
そこで本研究では,ナレーションを利用した人間と物体の相互作用検出手法を提案する。ナレーションは、入手が安くなる弱い監督形態を提供する。 Weakly Supervised In-hand Object Inference from Human Narrations (WISH)
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:34:55 GMT)
Convergence and Divergence of Language Models under Different Random Seeds [26.3]
コンバージェンス(コンバージェンス)は,種子間でのコンバージェンス(コンバージェンス)を期待値として測定する。より大きなモデルは後続のトレーニング段階でより高速に再収束するのに対し、小さなモデルは実際には再収束しない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:50 GMT)
Unlocking Transfer Learning for Open-World Few-Shot Recognition [26.2]
Few-Shot Open-Set Recognition (FSOSR) は、入力を既知のカテゴリに分類することを目的としている。オープンセットなメタ学習とオープンセットのフリートランスファー学習を組み合わせた2段階の手法を提案する。提案手法は,2つの広く認識されているベンチマークである miniImageNet と tieredImageNet の最先端性能を実現し,トレーニング作業は 1.5% しか増加しない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:02:05 GMT)
3DiFACE: Synthesizing and Editing Holistic 3D Facial Animation [25.7]
本稿では,3DiFACEという,音声による3次元顔画像の合成手法を提案する。本手法は1つの音声入力に対して多彩な唇と頭部の動きを生じさせる。我々は,発話スタイルのパーソナライズと,巧妙な制御と編集を実現するために,スキャニングスタイルの動作拡散を用いた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:30:01 GMT)
Logo-VGR: Visual Grounded Reasoning for Open-world Logo Recognition [25.7]
我々は,製品モデレーションにおける中核的な課題である,オープンワールドのロゴ認識ベンチマークを導入する。数万のブランドを記憶する従来のロゴ認識手法とは異なり,Logo-VGRを提案する。 OOD設定では,Logo-VGRが10ポイント近く,強いベースラインを上回ります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:35:10 GMT)
Online Decision Making with Generative Action Sets [25.6]
本研究では,エージェントが任意のステップで新たなアクションを生成できるオンライン学習問題について検討する。本稿では,行動選択に下位信頼境界,行動生成に上位信頼境界を用いる2倍最適化アルゴリズムを提案する。我々は,このアルゴリズムが$O(Tfracdd+2dfracdd+2 + dsqrtTlog T)$の最適後悔を実現することを証明し,オンライン学習における行動空間の拡張による最初のサブ線形後悔を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:46:27 GMT)
CARE: Cognitive-reasoning Augmented Reinforcement for Emotional Support Conversation [25.6]
Emotional Support Conversation (ESC) は、心理的ストレスを緩和し、対話を通じて感情的価値を提供する上で重要な役割を担っている。近年の研究では、データ拡張と合成コーパスの構築に主に焦点が当てられている。大規模合成データに頼らずにESCにおける推論を強化する新しいフレームワークである textbfCARE を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:19:50 GMT)
GIM: Improved Interpretability for Large Language Models [25.6]
セルフリペア(Self-repair)とは、ネットワークが他のコンポーネントを増幅することで信号の減少を補う現象である。本稿では,バックプロパゲーション中の自己修復を考慮に入れたGIM(Gradient Interaction Modifications)を紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:40:49 GMT)
VS-Bench: Evaluating VLMs for Strategic Abilities in Multi-Agent Environments [25.5]
マルチエージェント環境における戦略的能力のための視覚言語モデルを評価するベンチマークであるVisual Strategic Bench (VS-Bench)を紹介する。 VLMエージェントの性能は、要素認識精度で測定された知覚、次のアクション予測精度で測定された戦略的推論、正規化エピソードリターンで測定された意思決定の3つの次元にわたって評価される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:49:16 GMT)
Spatial-Spectral Binarized Neural Network for Panchromatic and Multi-spectral Images Fusion [25.2]
ディープラーニングモデルは優れたパフォーマンスを達成したが、しばしば計算の複雑さが伴う。本稿では,2次ニューラルネットワーク(BNN)をパンシャーピングに適用する可能性について検討する。一連のS2B-Convは、S2BNetと呼ばれるパンシャーピングのための新しいバイナリネットワークを形成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:04:23 GMT)
The Unheard Alternative: Contrastive Explanations for Speech-to-Text Models [25.1]
対照的な説明は、AIシステムが他の(ホイル)ではなく1つの出力(ターゲット)を生成した理由を示している。入力スペクトログラムの一部が代替出力の選択にどのように影響するかを分析することにより、S2Tにおけるコントラスト的な説明を得るための最初の方法を提案する。我々の研究は、S2Tモデルをよりよく理解するための基盤を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:17:27 GMT)
A Framework for Studying AI Agent Behavior: Evidence from Consumer Choice Experiments [25.0]
本稿では,オプション属性と説得的手がかりの制御によるエージェント選択の探索フレームワークを提案する。我々はエージェントの決定が予測可能かつ実質的に変化していることを発見し、エージェントが強い偏見を持つ選択者であることを明らかにした。この感受性はリスクと機会の両方を明らかにしている:リスク、エージェントの消費者は人間の偏見を継承し増幅する可能性がある;機会、消費者の選択はAIエージェントの行動科学に強力なテストベッドを提供するからだ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:05:23 GMT)
The Media Bias Detector: A Framework for Annotating and Analyzing the News at Scale [25.0]
我々は,ニュース報道における選択とフレーミングバイアスを研究するために,大規模で,ほぼリアルタイムなデータセットと計算フレームワークを導入する。我々のパイプラインは、大規模言語モデルとスケーラブルでほぼリアルタイムなニューススクレイピングを統合し、構造化アノテーションを抽出します。我々は、これらのカバレッジの次元を、文レベル、記事レベル、出版者レベルなど、複数のレベルで定量化します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:41:49 GMT)
Attribution-Guided Decoding [24.5]
本稿では,解釈可能性に基づくデコーディング戦略であるAttribution-Guided Decoding (AGD)を紹介する。モデルアクティベーションを直接操作する代わりに、AGDは高確率出力トークン候補のセットを考える。 3つの挑戦領域にまたがってAGDの有効性を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:21:40 GMT)
Frankentext: Stitching random text fragments into long-form narratives [24.5]
我々は,LLMを著者としてではなく,既存のテキストの作曲家として扱う長文物語生成パラダイムであるFrankentextsを紹介した。文章のプロンプトと無作為にサンプリングされた何千もの人間のスニペットが与えられたモデルでは、ほとんどのトークンは提供された段落から冗長にコピーしなければならないという極端な制約の下で物語を作成するように求められている。タスクの極端な課題にもかかわらず、Frankentextsは、書字品質、多様性、独創性の観点から、Vanilla LLM世代よりも大幅に改善されているという広範囲な自動的および人的評価を通して観察する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:38:41 GMT)
DiVeQ: Differentiable Vector Quantization Using the Reparameterization Trick [24.3]
本稿では、量子化を量子化歪みを模倣する誤差ベクトルの追加として扱い、勾配の流れを保ちながら前方通過を困難にするDiVeQを提案する。また,コードワードを接続する行によって構築された曲線を割り当てる空間充足型 (SF-DiVeQ) も提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:17:21 GMT)
Noisy-Pair Robust Representation Alignment for Positive-Unlabeled Learning [24.3]
Negative-Unlabeled (PU) 学習の目的は、限られた正のデータと豊富な未ラベルのデータしか利用できないバイナリ分類器を訓練することである。補助情報を必要としない非競合型PU学習フレームワークであるNcPUを提案する。我々は,NcPUが様々なデータセットにまたがって最先端のPUメソッドよりも大幅に改善されていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:22:30 GMT)
Neural Hamilton--Jacobi Characteristic Flows for Optimal Transport [24.1]
ハミルトン・ヤコビ方程式(HJ)に基づいて最適な輸送問題を解くための新しい枠組みを提案する。特徴の方法を活用することにより、閉形式双方向輸送マップを導出する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:45:01 GMT)
LD-MoLE: Learnable Dynamic Routing for Mixture of LoRA Experts [24.0]
LD-MoLEはLearningable Dynamic routing mechanism for Mixture of LoRA Expertsを提案する。我々の設計では、異なる層で各トークンに対してアクティベートする専門家の数を適応的に決定できる。提案手法は,優れた性能を実現するとともに,トークン依存型およびレイヤワイドのエキスパートアロケーションを学習する能力も示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:38:10 GMT)
scUnified: An AI-Ready Standardized Resource for Single-Cell RNA Sequencing Analysis [24.0]
我々は、シングルセルRNAシークエンシングデータのための、AI対応の標準リソース scUnified を提案する。 scUnified Consolided to 13 high-quality datasets across two species and 9 tissue types。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:23:01 GMT)
DeepScientist: Advancing Frontier-Pushing Scientific Findings Progressively [23.8]
DeepScientistは、科学的な発見を1ヶ月のタイムラインで行うように設計されたシステムだ。このシステムは5,000のユニークな科学的アイデアを生み出し、その約1100を実験的に検証した。この研究は、科学的タスクにおいて人間のSOTAを徐々に上回る発見を達成するためのAIの大規模な証拠として、初めてのものである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:49:32 GMT)
Accurate myocardial T1 mapping at 5T using an improved MOLLI method: A validation study [23.7]
本研究の目的は, 5T MRIシステムのための, 正確かつ臨床的に応用可能な心筋T1マッピング技術を開発することである。 The method is based on a 5-(3)-3 MOLLI sequence, called combined-correction MOLLI (coMOLLI)。この方法はファントム実験で検証され、21人の健康なボランティアと9人の患者で検証された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:21:35 GMT)
Regret Analysis of Posterior Sampling-Based Expected Improvement for Bayesian Optimization [23.5]
本稿では,後部サンプルパスの最大値からEIを評価するEIのランダムな変種を解析する。この後続サンプリングに基づくランダムEIは、ブラックボックス関数がガウス過程に従うという仮定の下で、準線形ベイズ累積後悔境界を達成することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:20:27 GMT)
HLTCOE at TREC 2024 NeuCLIR Track [23.3]
HLTチームはPLAID、mT5リランカ、GPT-4リランカ、スコア融合、文書翻訳をTREC 2024 NeuCLIRトラックに適用した。 PLAIDには、Translate Distill(TD)、Generate Distill(GD)、Multi-lingual Translate-Distill(MTD)といった、さまざまなモデルとトレーニング技術が含まれています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:16:45 GMT)
AuditAgent: Expert-Guided Multi-Agent Reasoning for Cross-Document Fraudulent Evidence Discovery [23.2]
本稿では,金融詐欺事件における詳細な証拠連鎖の特定を目的とした,監査ドメインの専門知識によって強化された新しいマルチエージェント推論フレームワークAuditAgentを紹介する。提案手法は,対象レベルのリスク事前,ハイブリッド検索戦略,特別エージェントモジュールを統合して,クロスレポートの証拠を効率的に識別・集約する。本研究は,現実の規制アプリケーションにおいて,ロバストな金融不正検出を実現するために,ドメイン固有の推論とデータセット構築の価値を強調した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:26:44 GMT)
EchoingECG: An Electrocardiogram Cross-Modal Model for Echocardiogram Tasks [23.2]
本稿では,不確実性を考慮した心電図埋め込みと心電図監視を利用して心電図に基づく心機能予測を改善する,確率的学生・教師モデルであるEchoingECGを紹介する。提案手法では,確率的コントラストフレームワークであるPCME++とECHO-CLIPを併用し,ECHOの知識をECG表現に抽出する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:03:33 GMT)
Submodular Context Partitioning and Compression for In-Context Learning-short paper [23.2]
Sub-CPは、大規模言語モデルのためのブロック対応コンテキスト選択フレームワークである。選択戦略のフレキシブルなスペクトルをサポートしており、各ブロックは世界規模で多様なものから局所的なコヒーレントまで様々である。実験の結果、Sub-CPはモデルスケールで継続的に性能を改善している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:42:11 GMT)
scCDCG: Efficient Deep Structural Clustering for single-cell RNA-seq via Deep Cut-informed Graph Embedding [23.2]
scCDCG (Single-cell RNA-seq Clustering via Deep Cut-informed Graph)は、cRNA-seqデータの効率的かつ正確なクラスタリングを目的とした新しいフレームワークである。 scCDCGは3つの主要な構成要素から構成される: (i) 細胞間高次構造情報を効果的にキャプチャするディープカットインフォームド技術を利用したグラフ埋め込みモジュール。 (II)cRNA-seqデータの特異な複雑さに対応するため,最適なトランスポートによって誘導される自己教師型学習モジュール。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:58:19 GMT)
Differentiable Sparsity via $D$-Gating: Simple and Versatile Structured Penalization [22.9]
D$-Gatingは、理論上、元の群疎性問題の解法と等価であることを示す。ビジョン、言語、タスクにまたがって私たちの理論を検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:01:23 GMT)
Photography Perspective Composition: Towards Aesthetic Perspective Recommendation [22.8]
伝統的な写真合成アプローチは2次元の収穫法によって支配されている。プロの写真家は、しばしば3D再構成の形で視点調整を用いる。従来の収穫法を超越した写真視点合成(PPC)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:45:29 GMT)
Texture Vector-Quantization and Reconstruction Aware Prediction for Generative Super-Resolution [22.8]
テクスチャベクトル量子化とリコンストラクションアウェア予測戦略を提案する。提案した生成SRモデル (TVQ&RAP) は,少ない計算コストで実写SR結果を提供できる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:32:04 GMT)
Understanding and Improving Shampoo and SOAP via Kullback-Leibler Minimization [22.6]
第2モーメントと共分散行列の自然な対応により、シャンプーとSOAPの推定手順を再解釈する。本稿では,各種NNの事前学習において,シャンプーとSOAPの性能に適合する実測手法を提案する。特に、KL-Shampooは優れたパフォーマンスを達成するためにAdamに依存していないため、関連するメモリオーバーヘッドを回避することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:59:13 GMT)
ASGuard: Activation-Scaling Guard to Mitigate Targeted Jailbreaking Attack [22.5]
大規模言語モデル(LLM)は、単純な言語的変化によって回避できる脆い拒絶行動を示す。本研究では、この特定の脆弱性を外科的に軽減する、洞察に富んだ機械的インフォームドフレームワークであるアクティベーション・スケーリングガード(ASGuard)を紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:33:52 GMT)
Physics-Informed Learning for Human Whole-Body Kinematics Prediction via Sparse IMUs [22.5]
本稿では、知識をトレーニングと推論の両方に統合し、人間の動きを予測する物理インフォームドラーニングフレームワークを提案する。人間の運動の空間的特徴を考慮に入れたネットワークを提案する。実験結果から,本手法は動作間のスムーズな遷移を高精度に達成し,未知の対象に対して良好に一般化できることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:02:04 GMT)
Raw-JPEG Adapter: Efficient Raw Image Compression with JPEG [22.5]
本稿では,Raw Adapterについて述べる。Raw Adapterは,標準JPEG圧縮に生画像を適用する軽量で学習可能な,可逆的な前処理パイプラインである。提案手法は直接JPEGストレージよりも忠実度が高く,他のコーデックをサポートし,圧縮比と再現精度のトレードオフが良好である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:44:35 GMT)
Internalizing Self-Consistency in Language Models: Multi-Agent Consensus Alignment [22.3]
言語モデル(LM)は矛盾する推論子であり、しばしば同じプロンプトに対する矛盾した応答を生成する。適切に整合した推論モデルの本質的な性質として自己整合性を定式化し、MACA(Multi-Agent Consensus Alignment)を導入する。 MACAは、エージェントが自分自身をより決定的かつ簡潔に教えることを可能にし、外部の監督なしにマルチエージェント設定におけるピアインサイトをより活用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:57:55 GMT)
Self-Evolving Vision-Language Models for Image Quality Assessment via Voting and Ranking [22.3]
EvoQualityは、視覚言語モデルがその品質知覚能力を自律的に洗練することを可能にする新しいフレームワークである。擬似ラベルを生成し、相対的な品質に関するコンセンサスを確立するために、VLMの出力に対してペアで多数投票を行うことで、擬似ラベルを生成する。 VLMのゼロショット性能は、様々なIQAベンチマークでPLCCで31.8%向上した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:57:26 GMT)
SlimPack: Fine-Grained Asymmetric Packing for Balanced and Efficient Variable-Length LLM Training [22.2]
SlimPackは、サンプルをきめ細かなスライスに分解することで、データパッキングとスケジューリングを根本的に再考するフレームワークです。 SlimPackは、大規模な揮発性ワークロードを小さな管理可能なユニットのストリームに変換することで、重要なメモリと通信ボトルネックを軽減する。非対称分割は、前方と後方の異なる要求に一意に最適化されたバランスの取れたスケジューリングユニットを組み立てる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:37:48 GMT)
Red Teaming Program Repair Agents: When Correct Patches can Hide Vulnerabilities [22.0]
本稿では,APRエージェントが機能的正確かつ脆弱なパッチを生成するために,逆問題文を生成するSWExploitを提案する。評価に基づいて、すべてのテストに合格するパッチが本質的に信頼性と安全性を持つという従来の仮定に初めて挑戦します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:38:57 GMT)
SDA-PLANNER: State-Dependency Aware Adaptive Planner for Embodied Task Planning [22.0]
エージェントは環境内のクローズループな方法で実行可能なアクションを生成する必要がある。我々は,SDA-PLANNERを提案し,適応計画パラダイム,状態依存認識,エラー認識機構を包括的具体的タスク計画に適用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:07:59 GMT)
Non-Vacuous Generalization Bounds: Can Rescaling Invariances Help? [22.0]
PAC-Bayesのバウンダリは、大規模ネットワークにおいても、厳密でデータ依存の保証を提供できるという点で際立っている。我々は、この相違を解消する不変な持ち上げ表現でPAC-Bayes境界を研究することを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:01:20 GMT)
PETAH: Parameter Efficient Task Adaptation for Hybrid Transformers in a resource-limited Context [21.9]
本稿では,Hybrid Transformer のタスク適応性能向上と PETAH: Efficient Task Adaptation for Hybrid Transformer の導入について述べる。我々のPETAH適応ハイブリッドモデルは、パラメータを少なくし、モバイルハードウェアでより効率的であると同時に、ViTのタスク適応技術よりも優れています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:03:09 GMT)
Bridging conformal field theory and parton approaches to SU(n)_k chiral spin liquids [21.9]
共形場理論では、$mathrmSU(n)_k$ Wess-Zumino-Witten (WZW) モデルを用いて、格子波動関数を1次元と2次元の両方で構成する。すべての格子上のスピンは、ヤング・テーブルーの$mathrmSU(n)$既約表現の下で、単一の行と$k$ボックスで変換される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:53:45 GMT)
A Family of Kernelized Matrix Costs for Multiple-Output Mixture Neural Networks [21.9]
ペアワイズ距離に基づくコストは、自己監督的でコントラストのある特徴学習に不可欠である。本稿では,4種類のカーネル化行列コストを用いたデータ密度近似を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:51:03 GMT)
GaussEdit: Adaptive 3D Scene Editing with Text and Image Prompts [21.8]
GaussEditは、テキストと画像プロンプトでガイドされた適応的な3Dシーン編集のためのフレームワークである。ユーザが指定したコンセプトを3Dシーンにうまく埋め込むことで、GaussEditは詳細なユーザー主導の3Dシーン編集のための強力なツールだ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:31:31 GMT)
TGPO: Temporal Grounded Policy Optimization for Signal Temporal Logic Tasks [21.8]
我々は,一般的なSTL課題を解決するため,TGPO,時間的接地ポリシー最適化を提案する。 TGPOは、STLをタイムドサブゴールと不変制約に分解し、この問題に対処するための階層的なフレームワークを提供する。我々は,低次元ナビゲーションから操作,ドローン,四足歩行に至るまで,5つの環境において実験を行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:51:05 GMT)
Learning Theory for Kernel Bilevel Optimization [21.8]
カーネル・バイレベル最適化 (KBO) について検討し, 内部目的をカーネル再生空間上で最適化する。我々は、経験的プロセス理論からツールを利用するKBOに対して、新しい有限サンプル一般化境界を導出する。本稿では,合成器用変分回帰課題に関する理論的知見について述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:58:49 GMT)
OmniDFA: A Unified Framework for Open Set Synthesis Image Detection and Few-Shot Attribution [21.6]
OmniDFAはAIGIのための新しいフレームワークで、画像の信頼性を評価し、その起源を数ショットで決定する。 OmniFakeは大規模なクラス対応合成画像データセットで、45ドルの異なる生成モデルから117ドルの画像をキュレートする。実験により、OmniDFAはオープンセット属性に優れた能力を示し、AIGI検出における最先端の一般化性能を達成することが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:36:40 GMT)
DreamControl: Human-Inspired Whole-Body Humanoid Control for Scene Interaction via Guided Diffusion [21.6]
本稿では,自律型全身ヒューマノイドスキルの学習手法であるDreamControlを紹介する。我々の中心となるイノベーションは、人間の動きデータに基づいて事前訓練された拡散を使うことです。本研究では,Unitree G1ロボットにおけるDreamControlの有効性を検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:48:45 GMT)
LaTo: Landmark-tokenized Diffusion Transformer for Fine-grained Human Face Editing [21.6]
LaToは、きめ細かなアイデンティティ保存顔編集のためのランドマーク化拡散変換器である。鍵となるイノベーションは、生のランドマーク座標を直接離散的な顔トークンに定量化するランドマークトークンライザである。 LaToは、最先端の手法を7.8%のアイデンティティ保存、4.6%のセマンティック一貫性で上回る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:40:27 GMT)
Robust LLM Training Infrastructure at ByteDance [21.5]
ByteRobustは、大規模言語モデルの堅牢で安定したトレーニングに適した、大規模なGPUインフラストラクチャ管理システムである。 LLMトレーニングプロセスの独自性を活用し、定期的に障害を検出して回復するための最優先事項を提供します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:06:10 GMT)
Exploring the Impact of Data Quantity on ASR in Extremely Low-resource Languages [21.4]
この研究は、2つの絶滅危惧言語であるAmisとSediqに焦点を当てている。本稿では,多言語コーパスを利用して対象とする限られた言語データを増やす新しいデータ選択手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:33:57 GMT)
Wasserstein Distributionally Robust Optimization Through the Lens of Structural Causal Models and Individual Fairness [21.4]
我々は因果関係と個々人の公平性の観点からDRO問題を開発する。次に、DRO問題をよりトラクタブルで計算効率の良い形式に変換するための効率的なツールとして、DRO双対定式化を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:59:29 GMT)
From Fragile to Certified: Wasserstein Audits of Group Fairness Under Distribution Shift [21.4]
グループフェアネスの指標は、再サンプル間で大きく変化し、特に分散シフト下では不安定である。本稿では, 実験法則を中心にした有理テスト分布の球面上で最悪の群フェアネスを証明した, 分布的に堅牢なワッサーシュタインフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:35:50 GMT)
Seeing Space and Motion: Enhancing Latent Actions with Spatial and Dynamic Awareness for VLA [21.4]
Latent Action Models (LAMs) は、視覚言語制御システムにおいて、大規模な無注釈データからセマンティック・アクション・リセプションを学習することを可能にする。 Farsighted-LAMを提案する。これは幾何学的空間符号化とマルチスケール時間的モデリングを備えた潜在アクションフレームワークである。さらに,Farsighted-LAM上に構築されたエンドツーエンドVLAフレームワークであるSSM-VLAを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:41:43 GMT)
The silence of the weights: an investigation of structural pruning strategies for attention-based audio signal architectures [21.3]
本研究では,アテンション機構を明示的に対象とする新しいプルーニング手法を提案する。注意ブロック内の4つのレイヤ、すなわちクエリ、キー、値、出力のプロジェクション行列を分離する。その結果,注目パラメータの50%を刈り取ることでも1%未満の性能劣化が生じることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:10:19 GMT)
ProbMed: A Probabilistic Framework for Medical Multimodal Binding [21.3]
確率的モダリティ向上診断(ProbMED)について紹介する。 ProbMEDは、X線、心電図、心エコー計の4つの異なるモードを、統一された確率的埋め込み空間に整列させる。本モデルでは, クロスモーダル検索, ゼロショット分類, 少数ショット分類において, 現在の医用視覚言語事前訓練モデルより優れている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:16:01 GMT)
SelfReflect: Can LLMs Communicate Their Internal Answer Distribution? [21.3]
我々は,要約と回答上の分布の間の情報理論的距離であるSelfReflectメトリックを開発した。我々は,SelfReflectが,要約文字列と LLM の内部分布の回答に対する忠実度を細かな尺度で表していることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:44:21 GMT)
Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography [21.3]
我々は3次元医用画像と対応するテキストレポートを組み合わせたデータセットであるCT-RATEを紹介する。我々はCTに焦点を当てたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。我々は3次元胸部CTボリュームの視覚言語チャットモデルであるCT-CHATを作成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:16:16 GMT)
ResGS: Residual Densification of 3D Gaussian for Efficient Detail Recovery [21.3]
そこで我々は, 残留分断法を新たに導入し, 残留分断法としてガウシアンを付加した。我々のアプローチは、詳細を適応的に検索し、欠落した幾何学を補完することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:28:38 GMT)
Augmenting Researchy Questions with Sub-question Judgments [21.2]
我々はLlama3.370Bモデルを用いて,LLM-judgedラベルを用いたResearchy Questionsデータセットをサブクエスト毎に拡張する。我々は、これらのサブクエストラベルを、複雑な情報ニーズをよりよく支援する検索モデルを訓練するためのリソースとして使うつもりである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:27:34 GMT)
Vector sketch animation generation with differentialable motion trajectories [21.1]
本稿では,ストローク制御点のフレームワイドな動きを記述した,微分可能な運動軌道表現を提案する。 DMTは複数のフレームにまたがってグローバルなセマンティックな伝播を可能にし、セマンティックな一貫性と時間的コヒーレンスを大幅に改善する。暗黙の場の代わりに、空間的空間モデリングのためのトラックポイントを導入し、効率を改善し、長時間のビデオ処理をサポートする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:53:04 GMT)
Mem-α: Learning Memory Construction via Reinforcement Learning [20.9]
大きな言語モデル(LLM)エージェントは、限られたコンテキストウィンドウによって制約される。現在のメモリ拡張エージェントは、メモリ更新のための事前に定義された命令とツールに依存している。 Mem-alphaは、エージェントに複雑なメモリシステムを効果的に管理するように訓練する強化学習フレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:02:34 GMT)
MindVL: Towards Efficient and Effective Training of Multimodal Large Language Models on Ascend NPUs [20.8]
MindVLは、Ascend NPUでエンドツーエンドに訓練されたマルチモーダルな大規模言語モデルである。我々は,安定かつ高性能なトレーニングを支援する,高効率なトレーニングフレームワークであるMindSpeed-MLLMを紹介した。異なるシーケンス長でトレーニングされたチェックポイントから平均的な重み付けが特に有効であることが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:27:18 GMT)
PDE Solvers Should Be Local: Fast, Stable Rollouts with Learned Local Stencils [20.5]
有限差分に着想を得たニューラルネットワークであるFINOは、厳密な局所性を強制する。 FINOは固定有限差分ステンシル係数を学習可能な畳み込みカーネルに置き換える。最先端のオペレータ-ラーニングベースラインよりも最大44%低いエラー、最大2倍のスピードアップを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:42:32 GMT)
On The Fragility of Benchmark Contamination Detection in Reasoning Models [20.5]
LRMのリーダーボードは、評価を競合に転換し、開発者がベンチマークスイート上で直接最適化するインセンティブを与えている。より高いランキングを達成するためのショートカットは、評価ベンチマークをトレーニングデータに組み込むことで、ベンチマーク汚染と呼ばれる膨らませたパフォーマンスを得る。 LRMに対する汚染検出の回避は極めて容易であることが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:40:54 GMT)
Asymptotic Classification Error for Heavy-Tailed Renewal Processes [20.3]
更新プロセスの分類を検討する。 Bhattacharyyaの表現は, 高度更新過程の誤分類確率に基づく。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:56:05 GMT)
AdaBlock-dLLM: Semantic-Aware Diffusion LLM Inference via Adaptive Block Size [20.2]
拡散に基づく大規模言語モデル (dLLM) は並列デコードに固有の能力で注目を集めている。本稿では,セミARデコードにおける固定ブロックサイズの仮定に挑戦する最初の体系的な研究を提案する。 AdaBlock-dLLMは,実行中のブロックサイズを調整することで,ブロック境界とセマンティックステップを適応的に調整する,トレーニング不要のプラグイン・アンド・プレイスケジューラである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:53:56 GMT)
Thinking Sparks!: Emergent Attention Heads in Reasoning Models During Post Training [20.1]
複雑な推論のためのポストトレーニングは、新規で機能的に専門化された注目の頭が出現するきっかけとなることを示す。これらのヘッドは、構造化推論と計算をサポートする。制御可能なシンク/オフモデルには、専用のシンクヘッドがないことが分かっています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:23:43 GMT)
VitaBench: Benchmarking LLM Agents with Versatile Interactive Tasks in Real-world Applications [20.1]
実世界の環境に根ざした多目的対話型タスクのエージェントを評価するベンチマークであるVitaBenchを紹介する。 VitaBenchは、66のツールを含む、これまでで最も複雑な生命維持シミュレーション環境を持つエージェントを提示する。総合評価の結果,最も先進的なモデルでさえ,クロスシナリオタスクにおいて30%の成功率しか達成できないことがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:33:49 GMT)
fev-bench: A Realistic Benchmark for Time Series Forecasting [19.9]
既存のベンチマークでは、ドメインカバレッジが狭くなったり、重要な現実世界の設定を見落としたりすることが多い。 7つの領域にわたる100の予測タスクからなるベンチマークであるfevbenchを提案する。 fev-benchでは、モデルパフォーマンスを報告するために、ブートストラップされた信頼区間を持つ原則化された集約手法を採用している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:17:18 GMT)
Extensions of Robbins-Siegmund Theorem with Applications in Reinforcement Learning [19.8]
我々は、零次項が和可能ではなく、平方和可能であるような、ほとんど超行列に対してロビンス=ジークムントの定理を拡張する。線形関数を持つ$Qp$学習に対する最初のほぼ確実な収束率、最初の高確率集中束縛、および最初の$Lp$収束率を得る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:00:36 GMT)
Feature-aware Hypergraph Generation via Next-Scale Prediction [19.8]
本稿では,ハイパーグラフトポロジと特徴を協調的に生成する階層型フレームワークであるFAHNESを紹介する。合成,3Dメッシュ,グラフポイントクラウドデータセットの実験は,FAHNESが特徴と構造を共同生成して最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:32:30 GMT)
R-Log: Incentivizing Log Analysis Capability in LLMs via Reasoning-based Reinforcement Learning [19.7]
R-Logは、人間のエンジニアの構造的、ステップバイステップの分析プロセスを反映した、推論に基づく新しいパラダイムである。 R-Logは、手動のO&Mプラクティスから13の戦略によってガイドされた、2k以上の推論トラジェクトリのキュレートデータセットで最初にコールドスタートされる。実世界のログに対する実証的な評価は、R-Logが5つのログ解析タスクで既存のメソッドより優れていることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:19:31 GMT)
UI-UG: A Unified MLLM for UI Understanding and Generation [19.7]
UI-UG(UI理解と生成のための統合MLLM)を導入し、両方の機能を統合する。タスク理解には,グループ相対政策最適化(GRPO)を併用したスーパービジョンファインチューニング(SFT)を用い,より詳細な理解を深める。生成タスクでは、さらにDPO(Direct Preference Optimization)を使用して、モデルが人間の好みのUIを生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:45:11 GMT)
Finetune Once: Decoupling General & Domain Learning with Dynamic Boosted Annealing [19.7]
微調整プロセスの合理化を目的とした動的ブーストアニーリング(DBA)を提案する。 DBAはバニラ微調整よりも5.8%の継手性能向上を実現している。 DBA法はバニラ法と比較してGPU時間を91.0%削減できる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:36:17 GMT)
Robust Federated Inference [19.5]
我々は、ロバストなフェデレーション推論法を初めて分析する。直感応答の相違が小さいか、最も確率の高い2つのクラス間の差が大きい場合、アグリゲータの誤差が小さいことを示す。次に、DeepSetアグリゲーションモデルを用いた高度な手法を導入し、敵対的トレーニングとテスト時間ロバストアグリゲーションの新しい構成を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:08:55 GMT)
Using Knowledge Graphs to harvest datasets for efficient CLIP model training [19.4]
高品質のCLIPモデルのトレーニングは通常、膨大なデータセットを必要とする。知識グラフで強化されたスマートWeb検索戦略を利用することで、堅牢なCLIPモデルをスクラッチからトレーニングできることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:12:28 GMT)
A Comprehensive Review on Artificial Intelligence Empowered Solutions for Enhancing Pedestrian and Cyclist Safety [19.4]
本稿では,VRU安全のためのカメラベースAIセンシングシステムの最近の進歩を概観する。本研究では,検出と分類,追跡と再同定,軌道予測,意図認識と予測の4つのコアタスクについて検討する。今後の研究をガイドするために、データ、モデル、デプロイメントの観点から4つの大きなオープン課題を強調します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:50:55 GMT)
DiSC-AMC: Token- and Parameter-Efficient Discretized Statistics In-Context Automatic Modulation Classification [19.2]
大規模言語モデル(LLM)は、微調整なしで、オープンセットで自動変調分類(AMC)を実行することができる。文脈自動変調分類(DiSC-AMC)における離散統計量について述べる。 DiSC-AMCは、高次の統計と累積をコンパクトなシンボルトークンに識別するトークンおよびパラメータ効率の変種である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:20:57 GMT)
CoLLM-NAS: Collaborative Large Language Models for Efficient Knowledge-Guided Neural Architecture Search [19.1]
CoLLM-NAS(Collaborative LLM-based NAS)は、2段階のNASフレームワークである。 ImageNet と NAS-Bench-201 の実験結果から,CoLLM-NAS が既存のNAS法や従来の探索アルゴリズムを超越していることが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:12:49 GMT)
The 1st Solution for MOSEv1 Challenge on LSVOS 2025: CGFSeg [19.1]
Video Object(VOS)は、ビデオシーケンス全体にわたって特定のオブジェクトを追跡し、セグメンテーションすることを目的としている。本稿では,MOSEv1チャレンジにおけるVOSタスクに対する信頼性誘導核融合抽出法(CGFSeg)を提案する。 LSVOS 2025のMOSEv1チャレンジでは,テストセットで86.37%のJ&Fスコアを達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:50:56 GMT)
Efficient and Transferable Agentic Knowledge Graph RAG via Reinforcement Learning [19.0]
知識グラフ検索強化世代(KG-RAG)は、大きな言語モデル(LLM)と構造化された検証可能な知識グラフ(KG)を結合して幻覚を減らし、推論トレースを公開する。我々は、強化学習(RL)によるエージェントKG検索増強世代(KG-RAG)フレームワークであるKG-R1を紹介する。 KG-R1は、KGと相互作用する単一のエージェントを環境として利用し、各ステップで学習し、取得した情報をその推論と生成に組み込む。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:14:24 GMT)
Automatic Fact-checking in English and Telugu [18.8]
本研究では,大規模言語モデル(LLM)の有効性について検討した。この研究の主な貢献は、バイリンガル・イングリッシュ・テルグデータセットの作成と、異なる妥当性分類アプローチのベンチマークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:39:34 GMT)
Expert Merging: Model Merging with Unsupervised Expert Alignment and Importance-Guided Layer Chunking [18.6]
エキスパートマージング(Expert Merging)は、ラベルなしキャリブレーションデータを用いて、少数の層係数を学習するトレーニングライト法である。層間変異をキャプチャするために、Expert Merging++はこの設計を重要誘導チャンクで強化する。本手法は, 強力なトレーニングフリーおよびトレーニングベースのマージベースラインを超越した手法である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:16:24 GMT)
MoWM: Mixture-of-World-Models for Embodied Planning via Latent-to-Pixel Feature Modulation [18.5]
MoWMは、ハイブリッドワールドモデルから表現を融合して、具体的アクションプランニングを行う混合世界モデルフレームワークである。提案手法では,ピクセル空間モデルから微細な視覚的特徴の抽出を誘導する,潜在モデルからの動き認識表現を高レベルな事前表現として利用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:13:10 GMT)
HealthSLM-Bench: Benchmarking Small Language Models for Mobile and Wearable Healthcare Monitoring [18.4]
小型言語モデル(SLM)は軽量で、モバイルおよびウェアラブルデバイス上でローカルかつ効率的に動作するように設計されている。ゼロショット,少数ショット,命令微調整による健康予測タスクにおけるSLMの評価を行った。その結果,SLMは大規模言語モデルに匹敵する性能を達成でき,効率とプライバシを大幅に向上させることができることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:04:14 GMT)
PrunedLoRA: Robust Gradient-Based structured pruning for Low-rank Adaptation in Fine-tuning [18.3]
低ランク適応(LoRA)は、大規模言語モデルのパラメータ効率の良い微調整のパラダイムとして広く使われている。構造化プルーニングを利用して高代表性の高い低ランクアダプタを得る新しいフレームワークである textitPrunedLoRA を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:10:35 GMT)
MENLO: From Preferences to Proficiency - Evaluating and Modeling Native-like Quality Across 47 Languages [18.3]
オーディエンスにインスパイアされたメカニズムに基づいた,ネイティブな応答品質の評価を運用するフレームワークであるMENLOを紹介する。我々は,47種類の言語において,高いアノテータ間一致を伴う4つの品質次元をカバーする6,423個の人称アノテート・レスポンス・プライオリティ・ペアのデータセットを作成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:48:58 GMT)
Advancing Automated Spatio-Semantic Analysis in Picture Description Using Language Models [18.1]
画像記述による認知言語障害の自動評価手法は、しばしば視覚的物語パスを無視する。本研究では,Cookie画像記述からCIUの自動抽出と順序付けを行うために,バイナリクロスエントロピーとペアランキング損失を微調整したBERTベースのパイプラインを提案する。 5倍のクロスバリデーションで評価すると、中央値の93%の精度、CIU検出における中央値のリコール、24%のシーケンスエラー率が得られる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:46:25 GMT)
PatchEAD: Unifying Industrial Visual Prompting Frameworks for Patch-Exclusive Anomaly Detection [18.0]
本稿では,パッチに焦点をあてた一貫したPatch-Exclusive Anomaly Detection (PatchEAD)を提案する。本実験では, テキスト機能がないにも関わらず, 先行作業に比べ, ショット数, バッチゼロショット性能が優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:52:08 GMT)
Nonparametric Identification of Latent Concepts [18.0]
人間の学習の基本である比較の認知メカニズムは、マシンがデータの基礎となる真の概念を回復する上でも不可欠である、と我々は主張する。具体的には、複数の観察クラスを持つ概念の識別可能性に関する理論的枠組みを開発することを目的とする。クラス間で十分な多様性があれば、特定の概念型を仮定せずに隠れた概念を識別できることが示される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:13:53 GMT)
Apple: Toward General Active Perception via Reinforcement Learning [17.9]
APPLE(Active Perception Policy Learning)は、さまざまなアクティブな知覚問題に対処する新しいフレームワークである。設計上、APPLEは特定のタスクに限らず、原則として幅広い能動的知覚問題に適用できる。実験はAPPLEの有効性を示し、回帰タスクと分類タスクの両方で高い精度を達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:27:14 GMT)
Autonomous quantum error correction beyond break-even and its metrological application [17.9]
本稿では,回路量子力学系における非破壊的AQECの実証について述べる。 AQEC保護の下では、論理量子ビットはシステムで利用可能な最高の物理量子ビットの18%を超える寿命を達成している。これらの結果は,AQEC法がフォールトトレラント量子計算の重要なステップであるだけでなく,堅牢な量子センサを構築する上でのメリットも示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:16:57 GMT)
Motion In-Betweening for Densely Interacting Characters [17.9]
キーセプション間の動きを合成する問題である。本研究では,2文字が互いに自然に関わり,反応し合う長軸相互作用の手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:11:39 GMT)
Scaling Spoken Language Models with Syllabic Speech Tokenization [17.8]
音声言語モデル(SLM)は通常、SSL音声モデルから抽出された高フレームレートトークンに音声認識を行う。近年のSSL研究は音節レベルでの音声の音響的トークン化を導入している。 Syllabicトークンは、トレーニングと推論コストを大幅に削減しながら、以前の高フレームレートトークンにマッチまたは超過することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:09 GMT)
TranSUN: A Preemptive Paradigm to Eradicate Retransformation Bias Intrinsically from Regression Models in Recommender Systems [17.8]
そこで本研究では,モデルから内在的にバイアスを除去するプリエンプティブ・パラダイムを提案する。理論的に保証された不偏性を提供するために, 共同バイアス学習法を用いて新しいTranSUN法を提案する。総合的な実験結果から,様々な領域のデータにまたがる手法の優位性が示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:43:05 GMT)
UniSage: A Unified and Post-Analysis-Aware Sampling for Microservices [17.8]
分析後のパラダイムを用いてトレースとログの両方をサンプリングする最初の統合フレームワークであるUniSageを紹介する。 2.5%のサンプリングレートで、臨界トレースの56.5%、関連するログの96.25%を捕捉し、下流の根本原因分析の精度(AC@1)を42.45%向上させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:44:56 GMT)
HiStyle: Hierarchical Style Embedding Predictor for Text-Prompt-Guided Controllable Speech Synthesis [17.7]
制御可能な音声合成とは、特定の韻律的・パラ言語的属性を操作することによって、発話スタイルを正確に制御することを指す。テキストのプロンプトに条件付けされたスタイル埋め込みを階層的に予測する2段階型埋め込み予測器であるHiStyleを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:31:12 GMT)
The Impact of Language Mixing on Bilingual LLM Reasoning [17.6]
中国語と英語のバイリンガル推論モデルにおける言語スイッチングについて検討する。言語混合によって推論が促進されることを示す。以上の結果から,言語混合は多言語学習の副産物であるだけでなく,戦略的推論行動でもあることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:58:13 GMT)
The Silent Judge: Unacknowledged Shortcut Bias in LLM-as-a-Judge [17.6]
大規模言語モデル(LLM)は、要約、対話、創造的執筆といったタスクにおいてシステム出力を評価する自動判断器として、ますます多くデプロイされている。提案手法では,現行のLLM審査員は,プロンプトに導入したショートカットに頼って,両方のカウントでフェールすることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:48:08 GMT)
BRIDGE -- Building Reinforcement-Learning Depth-to-Image Data Generation Engine for Monocular Depth Estimation [17.6]
BRIDGEはRL最適化Deep-to-image(D2I)生成フレームワークである。現実的かつ幾何学的に正確なRGB画像を20万枚以上合成する。我々は,このデータセット上で,ハイブリッド監視戦略を用いて深度推定モデルを訓練する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:38:45 GMT)
CODED-SMOOTHING: Coding Theory Helps Generalization [17.5]
Coded-Smoothingモジュールを導入し、標準のトレーニングパイプラインにシームレスに統合することができます。推論パイプラインに組み込むことで、モデルをランダム化し、敵の摂動に対する堅牢性を高めることができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:24:48 GMT)
LTA-L2S: Lexical Tone-Aware Lip-to-Speech Synthesis for Mandarin with Cross-Lingual Transfer Learning [17.5]
マンダリンに対するLTA-L2S(Lexical Tone-Aware Lip-to-Speech)を提案する。本モデルは,英語の事前学習型音声視覚自己教師学習(SSL)モデルを言語間移動学習戦略により適用する。実験では、LTA-L2Sは、音声の明瞭度と声調精度の両方において、既存の手法を著しく上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:13:55 GMT)
Transformers through the lens of support-preserving maps between measures [17.4]
我々は,測度間の地図がトランスフォーマーであるかどうかを考察する。一方、変換器には変換器が含まれ、一方、変換器は連続なインコンテキスト写像を持つ表現を普遍的に近似する。測度論的な自己アテンションは、無限の深さ、平均場測度論的な変換器がヴラソフフローと同一視できることを保証する性質を持つことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:15:33 GMT)
More Thought, Less Accuracy? On the Dual Nature of Reasoning in Vision-Language Models [17.4]
大規模言語モデル(LLM)において、推論が重要な機能として現れている。近年の研究では、視覚言語モデル(VLM)への推論の拡張が試みられている。本研究は、マルチモーダル推論の二重性を明らかにし、他の基本的な視覚的問題に対する認識障害につながった。本稿では,視覚的接地軌道に対する推論過程を明確に把握する,シンプルかつ効果的な手法であるビジョン・アンコレッド・ポリシー・オプティマイズ(VAPO)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:37:47 GMT)
Causally Guided Gaussian Perturbations for Out-Of-Distribution Generalization in Medical Imaging [17.3]
Causally-Guided Gaussian Perturbations (CGP)は、空間的に変化するノイズを入力画像に注入することでOOD一般化を強化する軽量フレームワークである。 CGPは、スプリアス相関よりも因果関係のある特徴に頼ることを奨励する。挑戦的なWILDSベンチマークであるCamelyon17の結果は、最先端のOODベースラインよりも一貫したパフォーマンス向上を示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:58:35 GMT)
Modeling Saliency Dataset Bias [17.3]
画像ベースサリエンシ予測の最近の進歩は、既存のベンチマーク上でのゴールド標準性能レベルに近づいている。データセットバイアスのため、複数の正当性データセットにまたがる修正予測が依然として困難であることを示す。本稿では,データセットに依存しないエンコーダ・デコーダ構造を20未満のパラメータで拡張する新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:54:09 GMT)
Automated Alignment of Math Items to Content Standards in Large-Scale Assessments Using Language Models [17.2]
本研究では,4つのドメインと19のスキルラベルを連携させる3つの自動パラダイムを評価する。 8つのBERTモデルとその変種をドメインおよびスキルアライメントの両方に微調整した。アンサンブルモデルは最高の性能を持つ言語モデルを超えなかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:44:00 GMT)
HART: Human Aligned Reconstruction Transformer [17.1]
HARTはスパースビュー人間の再構築のための統一されたフレームワークである。水密な布メッシュ、整列SMPL-Xボディーメッシュ、ノベルビューレンダリングのためのガウスプレート表現を出力する。以上の結果から,フィードフォワードトランスフォーマーは実環境における堅牢な人間の再構築のためのスケーラブルなモデルとして機能することが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:56:02 GMT)
Linearly Homomorphic Ring Signature Scheme over Lattices [17.0]
同型環シグネチャスキームは、環シグネチャの強い匿名性と同型シグネチャの計算可能性を組み合わせる。現在、可能な準同型環シグネチャスキームは存在しない。格子型線形準同型環シグネチャスキームを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:51:10 GMT)
Latent Thinking Optimization: Your Latent Reasoning Language Model Secretly Encodes Reward Signals in its Latent Thoughts [16.9]
大規模言語モデル(LLM)は、自然言語における思考の連鎖を生成することで問題解決において優れている。最近の研究は、中間推論ステップを潜在表現のシーケンスとして表現する潜在思考アーキテクチャであるHugin-3.5Bを提案する。我々は,Hugin-3.5Bが潜伏空間においてどのように考えるか,外部監視信号が潜伏思考プロセスを改善するかを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:26:36 GMT)
DeepSketcher: Internalizing Visual Manipulation for Multimodal Reasoning [16.9]
画像を用いたシンキング」とは、視覚言語モデルがテキスト中心のチェーンから画像対話的推論へシフトする現象である。本稿では、画像テキストインターリーブ付きデータセットと自己完結型モデルの両方からなる包括的スイートであるDeepSketcherを紹介する。我々は,視覚的な埋め込み空間で直接操作することで,インターリーブされた画像テキスト推論を実行し,視覚的思考を生成するモデルを設計する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:02:01 GMT)
Characterization and Learning of Causal Graphs with Latent Confounders and Post-treatment Selection from Interventional Data [16.8]
後処理の選択は、介入の下で急激な依存関係や分布の変化をもたらす可能性がある。治療後選択を明示的にモデル化する新たな因果関係定式化を導入し、介入に対する差分反応が選択パターンと因果関係を区別する方法について明らかにする。我々は、因果関係、潜伏した共同設立者、および処理後の選択を最大$mathcalFI$-Markov同値まで識別するために、証明可能な健全かつ完全なアルゴリズムであるF-FCIを開発した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:18:15 GMT)
Which Rewards Matter? Reward Selection for Reinforcement Learning under Limited Feedback [16.7]
限られたフィードバックから強化学習における報酬選択の問題について検討する。報酬の臨界部分集合は、最適な軌道に沿ってエージェントを導くものである。有効選択法は, 完全監督よりも報酬ラベルが著しく少ない, 最適に近い政策を導出することがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:17:49 GMT)
Pretrained Hybrids with MAD Skills [16.6]
ハイブリッドアーキテクチャの設計を自動化するフレームワークであるManticoreを提案する。次に、異なるアーキテクチャファミリーの事前訓練されたモデルを組み合わせた微調整ハイブリッドを作ります。マンティックオーレハイブリッドは、既存の手動設計のハイブリッドと一致し、ロングレンジアリーナで強い性能を達成し、事前訓練されたトランスフォーマーを改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:35:58 GMT)
Text-Based Approaches to Item Alignment to Content Standards in Large-Scale Reading & Writing Tests [16.5]
本研究では、自動項目アライメントのための微調整小言語モデル(SLM)の性能について検討した。学習用入力データの種類とサイズが与える影響について検討した。その結果、微調整されたSLMは埋め込みベースの教師あり機械学習モデルよりも一貫して優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:53:22 GMT)
Dolphin v1.0 Technical Report [16.5]
本稿では,Dolphin v1.0 (V1) とその拡張版であるDolphin R1について紹介する。 Dolphin v1.0は、分類、検出、回帰、レポート生成における信頼性の高いパフォーマンスを提供する。ドルフィンR1は、超音波特異的報酬による強化学習を通じて、診断の推論、透明性の推論、解釈可能性を高める。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:08:45 GMT)
Chat-Driven Text Generation and Interaction for Person Retrieval [16.4]
我々は,Multi-Turn Text Generation(MTG)とMulti-Turn Text Interaction(MTI)の2つの補完モジュールを紹介する。 MTGはMLLMとのシミュレートされた対話を通じて豊かな擬似ラベルを生成し、手動による監督なしに細粒度で多様な視覚的記述を生成する。 MTIは動的対話に基づく推論を通じて推論時にユーザクエリを洗練し、曖昧で不完全、曖昧な記述をシステムが解釈し、解決できるようにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:20:05 GMT)
Towards Reliable Benchmarking: A Contamination Free, Controllable Evaluation Framework for Multi-step LLM Function Calling [16.4]
ツール拡張言語モデル(TaLM)を合成多段階タスクによって評価する,汚染のないフレームワークであるFuncBenchGenを提案する。推論最適化モデルはGPT-5で汎用モデルより一貫して優れており、他のモデルよりも大幅に優れていることを示す。強いモデルはしばしば構文的に有効な関数呼び出しを行うが、ステップ間で誤ったあるいは古い引数値を伝搬し、マルチターンツールの使用においてLLMによる不安定な状態追跡を明らかにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:21:17 GMT)
Data-to-Energy Stochastic Dynamics [16.4]
正規化されていない密度によって1つ(または両方)の分布が与えられるとき、Schr"odinger Bridgeをモデル化するための最初の一般的な方法を提案する。提案アルゴリズムは,非政治強化学習の最近の発展に触発されたデータフリーケースに対する反復比例フィッティング(IPF)手順の一般化に依存している。提案したデータ・トゥ・エネルギIPFの合成問題に対する有効性を示し,マルチモーダル分布間の輸送をうまく学習できることを見出した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:03:55 GMT)
From Ambiguity to Verdict: A Semiotic-Grounded Multi-Perspective Agent for LLM Logical Reasoning [16.4]
LogicAgentは、論理的な複雑さと意味的な複雑さを共同で扱うように設計された、セミオティックな2乗誘導フレームワークである。既存のデータセットのセマンティックな単純さと論理的な複雑さを克服するために、大学レベルの難易度に達するベンチマークであるRepublicQAを導入する。 LogicAgentはRepublicQAで最先端のパフォーマンスを実現しており、強いベースラインよりも平均6.25%向上している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:40:31 GMT)
MuPlon: Multi-Path Causal Optimization for Claim Verification through Controlling Confounding [16.4]
クレーム検証のための新しいフレームワークであるMulti-Path Causal Optimization (MuPlon)を提案する。 MuPlonは、バックドアパスとフロントドアパスからなる2つの因果介入戦略を統合している。実験によると、MuPlonは既存のメソッドより優れ、最先端のパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:22:53 GMT)
Malliavin Calculus with Weak Derivatives for Counterfactual Stochastic Optimization [16.2]
本研究では,不特定雑音勾配情報に基づく条件損失関数の対実的最適化について検討する。拡散過程の条件損失函数は、スコロホッド積分として正確に表現され、古典的モンテカルロに匹敵する分散をもたらすことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:37:54 GMT)
One-Token Rollout: Guiding Supervised Fine-Tuning of LLMs with Policy Gradient [16.1]
政策勾配法を用いてSFTを誘導する新しい微調整アルゴリズムであるワンツーケンロールアウト(OTR)を導入する。 OTRは、各トークン生成を1ステップ強化学習軌跡として扱うことにより、自己回帰学習プロセスを再構築する。我々は,OTRを微調整LDMの強力で実用的な代替品として位置づけた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:25:56 GMT)
A Perspective on Quantum Computing Applications in Quantum Chemistry using 25--100 Logical Qubits [15.8]
量子コンピューティングと量子化学の交わりは、科学的および社会的関連性の双方の領域で量子ユーティリティを実現するための有望なフロンティアである。我々は、アルゴリズムとソフトウェア設計における短期的な機会を強調し、量子加速に適した化学問題について議論し、量子化学における実用的な量子ユーティリティを進化させるための戦略的ロードマップと協調経路を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:28:32 GMT)
TENET: Leveraging Tests Beyond Validation for Code Generation [15.7]
テスト駆動開発(TDD、Test-Driven Development)は、開発者がコード実装と一緒にテストを作成し実行する必要がある、広く採用されているソフトウェア工学のプラクティスである。本稿では、TDD設定の下で複雑な現実世界のリポジトリで関数を生成するエージェントTENETを紹介する。 TENETはRepoCodとRepoEvalのベンチマークで69.08%と81.77%のPass@1を達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:05:32 GMT)
Efficient On-Policy Reinforcement Learning via Exploration of Sparse Parameter Space [15.7]
PPOのような政策段階的な手法は単一の勾配方向に沿って更新され、パラメータ空間のリッチな局所構造は未探索のままである。これまでの研究では、サロゲート勾配は真の報酬の風景と相関が低いことが示されている。本稿では,PPOやTRPOなどのオンラインアルゴリズムとシームレスに統合する,プラグイン可能なパイプラインであるExploRLerを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:13:55 GMT)
Object-Centric Case-Based Reasoning via Argumentation [15.6]
Slot Attention Argumentation for Case-Based Reasoning (SAA-CBR)は、画像分類のためのニューラルシンボリックパイプラインであり、神経スロットアテンション(SA)コンポーネントを介して物体中心学習を統合する。本稿では,AA-CBRとニューラルコンポーネントの新たな統合について検討する。機能の組み合わせ戦略,代表サンプルによるケースベース削減,新しいカウントベース部分順序,AA-CBRのバイポーラ版であるSupported AA-CBRの適用などだ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:04:27 GMT)
Secure and Robust Watermarking for AI-generated Images: A Comprehensive Survey [15.6]
生成人工知能(Gen-AI)の急速な進歩により、高品質な画像の作成が困難になった。ウォーターマーキングは、AI生成画像と自然コンテンツとを区別することで、これらの課題に対する有望な解決策として登場した。この調査は、AIが生成する画像透かし技術の総合的な理解を研究者に提供することを目的としている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:59:05 GMT)
Personalized Subgraph Federated Learning with Differentiable Auxiliary Projections [15.5]
補助投影を用いたフェデレーション学習(FedAux)を紹介する。 FedAuxはパーソナライズされたサブグラフFLフレームワークで、生のデータやノードの埋め込みを共有することなく、均一に分散されたローカルモデルを調整、比較、集約することを学ぶ。多様なグラフベンチマークによる実証的な評価は、FedAuxが精度とパーソナライズ性能の両方で既存のベースラインを大幅に上回っていることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:18:55 GMT)
FM-SIREN & FM-FINER: Nyquist-Informed Frequency Multiplier for Implicit Neural Representation with Periodic Activation [15.5]
我々はNyquist-informed, neuron-specific frequency multipliersを周期的活性化に割り当てるFM-SIRENとFM-FINERを提案する。この単純だが原則化された修正は特徴の冗長性を50%近く低減し、多様なINRタスク間の信号再構成を一貫して改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:13:25 GMT)
Enhancing Certifiable Semantic Robustness via Robust Pruning of Deep Neural Networks [15.4]
ディープニューラルネットワークは視覚入力を備えた多くのビジョンやロボット工学アプリケーションで広く採用されている。明るさやコントラストといったセマンティックトランスフォーメーションの摂動に対する堅牢性を検証することが不可欠である。我々は,USNの低いニューロンを除去し,USNの低いニューロンを除去する新しいニューラルネットワークプルーニング手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:50:29 GMT)
Relaxation of A Thermally Bathed Harmonic Oscillator: A Study Based on the Group-theoretical Formalism [15.4]
熱環境に浸漬した高調波発振器が平衡状態にどのように緩和するかを解析的に検討した。特に、初期状態がガウス状態(すなわち圧縮されたコヒーレント状態)である場合、環境温度の臨界値が存在することが分かる。エントロピーは最初は最大に達するまで増加し、その後は最小に達するまで下降し、そこから上昇し、最終的に平衡値に収束する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:30:30 GMT)
Adaptive Modality Balanced Online Knowledge Distillation for Brain-Eye-Computer based Dim Object Detection [15.4]
本稿では,脳-眼-コンピュータによる空中画像検出システムを構築した。脳波画像データを用いた適応型モダリティバランスオンライン知識蒸留法(AMBOKD)を提案する。実世界のシナリオにおける公開データセットとシステム検証実験により,本手法の有効性と優位性を実証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:36:36 GMT)
MultiFair: Multimodal Balanced Fairness-Aware Medical Classification with Dual-Level Gradient Modulation [15.4]
MultiFairは最先端のマルチモーダル学習やフェアネス学習よりも優れています。本稿ではマルチモーダル医療分類のための新しいアプローチであるMultiFairを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:30:12 GMT)
Self-supervised learning for phase retrieval [15.2]
逆イメージング問題の解決策として、ディープニューラルネットワークが登場した。医学と科学的イメージングでは、完全なサンプルデータがないため、教師付き学習が制限される。この制限を克服する自己管理手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:06:08 GMT)
ReTAG: Retrieval-Enhanced, Topic-Augmented Graph-Based Global Sensemaking [15.2]
グローバルなセンスメイキングに対するグラフベースのアプローチは、検索機構、トピックの特異性に欠け、高い推論コストを発生させる。本稿では、トピック固有のサブグラフを構築し、応答生成に関連する要約を検索するRetrieval-Enhanced Topic-Augmented GraphフレームワークであるReTAGを提案する。実験の結果、ReTAGは応答品質を向上し、ベースラインに比べて推論時間を大幅に短縮することがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:41:58 GMT)
Practical security of local local oscillator continuous-variable quantum key distribution systems with pulse width mismatch [15.2]
本稿では,連続可変量子鍵分布(CVQKD)システムにおいて,信号と信号の間にパルス幅のミスマッチが発生した場合のセキュリティ問題について検討する。このようなミスマッチの下では、秘密鍵レート計算に関わる鍵パラメータが誤って推定され、システムの秘密鍵レートが過大評価される。この不完全なミスマッチは、Eveが実用的なシステムで攻撃を行うための抜け穴を開くことができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:50:07 GMT)
Beyond the Exploration-Exploitation Trade-off: A Hidden State Approach for LLM Reasoning in RLVR [15.1]
RLVR(Reinforcement Learning for Verifiable Rewards)の一般的な見解は、探索・探索トレードオフのレンズを通して最近の進歩を解釈している。我々はこの視点を再検討し、この認識されたトレードオフは基本的な制約ではなく、測定レベルの成果物である可能性を示唆している。本稿では,相乗的探索・探索強化の原理を最初に運用する,Velocity-Exploiting Rank-Learning (VERL)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:42:02 GMT)
Neural Kinematic Bases for Fluids [15.1]
本研究では,無酸素で表される速度場に対する運動論的ニューラルネットワークを用いたメッシュフリー流体シミュレーションを提案する。我々は、これらのニューラルネットワークベースが、ばらつきのない、境界アライメント、滑らかさといった基本的な物理的特性を近似することを保証する一連の損失を設計する。私たちのニューラルベースは、フローの入力スケッチに適合するために使用することができ、ベースから同じ基本特性を継承します。すると、そのような流れを標準時間でリアルタイムでアニメーション化できます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:23:30 GMT)
Solving the Cold Start Problem on One's Own as an End User via Preference Transfer [15.1]
コールドスタート問題はレコメンデーターシステムで一般的な問題である。本研究では,エンドユーザーが積極的にコールドスタート問題を解くアルゴリズムであるPretenderを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:57:33 GMT)
PAME-AI: Patient Messaging Creation and Optimization using Agentic AI [15.0]
我々は,エージェントAIを用いた患者メッセージ作成と最適化のための新しいアプローチであるPAME-AIを開発した。 Data-Information-Knowledge-Wisdom階層に基づいて構築されたPAME-AIは、生データから高性能メッセージング設計のための実行可能な洞察に移行するための構造化されたフレームワークを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:26:33 GMT)
CADmium: Fine-Tuning Code Language Models for Text-Driven Sequential CAD Design [14.9]
我々は,人間的な記述を付加した170k以上のCADモデルの大規模パイプラインを新たに導入する。本研究はCADmiumがCAD設計を自動化可能であることを示すものである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:32:42 GMT)
Decentralized Asynchronous Multi-player Bandits [14.9]
マルチプレイヤーマルチアームバンド (MP-MAB) は、認知無線ネットワークやモノのインターネットシステムに広く応用されているため、広く研究されている。我々は,プレイヤーが探索と搾取の間で適応的に変化する新しいアルゴリズムを開発した。我々のアルゴリズムは$mathcalO(sqrtT log T + log T/Delta2)$を後悔させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:57:38 GMT)
SAFE-SQL: Self-Augmented In-Context Learning with Fine-grained Example Selection for Text-to-SQL [14.8]
骨格メイク選択のような従来のアプローチは、大きな言語モデル(LLM)をガイドするために類似したトレーニング例を取得することで、関連性を示している。テキスト・トゥ・コンテクスト・フィルタリング(SAFE--)のためのきめ細かい例選択による学習における自己拡張を提案する。 SAFEの生成したサンプルは、以前の強力なパフォーマンスと、より高い実行精度を達成するために、テキストからテキストへのほとんどショットのフレームワークを上回っている。特に、我々のアプローチは、従来のメソッドがしばしば失敗する、余分な困難で目に見えないシナリオにおいて、さらなるパフォーマンス向上を提供します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:54:49 GMT)
DEPTHOR++: Robust Depth Enhancement from a Real-World Lightweight dToF and RGB Guidance [14.8]
DEPTHOR++は実用的で斬新な深度補完フレームワークである。 3つの重要な側面からのdToF入力に頑健さを増す。 ZJU-L5データセットと実世界のサンプルに基づいて、トレーニング戦略は既存の深度補完モデルを大幅に強化する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:41:11 GMT)
Decoupled Classifier-Free Guidance for Counterfactual Diffusion Models [14.8]
CFGはすべての属性に対してグローバルなガイダンス尺度を定めており、推論されたカウンターファクトの大幅な変更につながっている。本稿では,因果グラフに従う属性ワイズ制御を可能にする,フレキシブルでモデルに依存しないガイダンス手法であるDecoupled-Free Guidance (DCFG)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:50:06 GMT)
From Factoid Questions to Data Product Requests: Benchmarking Data Product Discovery over Tables and Text [14.6]
DPBenchは、ハイブリッドテーブルテキストコーパス上でのユーザ要求駆動型データ製品ベンチマークである。本フレームワークは,既存のテーブルテキストQAデータセットを,関連するテーブルやパスを一貫性のあるデータ製品にクラスタリングすることで,体系的に再利用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:07:36 GMT)
IPDRecon: Image-Plane Geometric Decoding for View-Invariant Indoor Scene Reconstruction [14.6]
3つのコアコンポーネントからなる画像プレーンデコードフレームワークであるPDReconを提案する。 IPDReconは、ビューカウントが40%削減された場合、ほぼ同じ品質を維持しながら、より優れた再構築安定性を実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:01:30 GMT)
Drones that Think on their Feet: Sudden Landing Decisions with Embodied AI [14.6]
具体的AIは、コンテキストを評価し、適切なアクションをリアルタイムで生成するコモンセンス推論をいかに提供できるかを示す。この能力を,Unreal Engineの都市ベンチマークで実演する。以上の結果から,具体化されたAIは適応的回復と意思決定パイプラインの新たなクラスを可能にすることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:39:36 GMT)
From Trace to Line: LLM Agent for Real-World OSS Vulnerability Localization [14.5]
プロジェクトレベルのエンドツーエンドフレームワークであるT2L-Agentは、独自の分析を計画し、モジュールから正確な脆弱なラインまでスコープを狭める。 T2L-ARVOは,5つのクラッシュファミリと実世界のプロジェクトにまたがる,多種多様な,専門家が検証した50ケースのベンチマークです。 T2L-ARVOでは、T2L-Agentは58.0%の検出と54.8%のラインレベルのローカライゼーションを達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:27:18 GMT)
Deep set based operator learning with uncertainty quantification [14.4]
組込み不確実性定量化(UQ)を用いた置換不変演算子学習フレームワークUQ-SONetを提案する。本モデルでは,スパースおよび可変センサ位置を扱うためにセットトランスフォーマーを組込み,条件変分オートエンコーダ(cVAE)を用いて解演算子の条件分布を近似する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:36:18 GMT)
ReFACT: A Benchmark for Scientific Confabulation Detection with Positional Error Annotations [14.4]
LLM(Large Language Models)は、しばしば科学的事実を議論し、信頼性を損なう。 textbfReFACT (textitReddit False And Correct Texts)は,1,001名の専門家による質問応答対のベンチマークである。それぞれのインスタンスは、科学的に正しい答えと、textbfpreciseエラースパンとエラータイプで注釈付けされた非実例の両方を含む。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:06:23 GMT)
Wan-Alpha: High-Quality Text-to-Video Generation with Alpha Channel [14.4]
Wan-Alphaは、RGBとアルファチャネルを共同で学習することで透明なビデオを生成する新しいフレームワークである。我々のモデルは最先端の手法と比較して、視覚的品質、動きリアリズム、透明性のレンダリングにおいて優れた性能を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:18:05 GMT)
Spatial Reasoning with Vision-Language Models in Ego-Centric Multi-View Scenes [14.3]
3次元空間関係の理解は、現在の視覚・言語モデル(VLM)の大きな限界である。我々は、エゴ中心のマルチビュー屋外データを用いて、VLMの空間的推論能力を評価するために設計された新しいベンチマークであるEgo3D-Benchを紹介する。 VLMの3次元空間的推論を強化する後学習フレームワークであるEgo3D-VLMを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:28:17 GMT)
A Meta-Analysis of LLM Effects on Students across Qualification, Socialisation, and Subjectification [14.2]
大規模言語モデル(LLM)は、教育のソリューションとしてますます位置づけられているが、評価は、パフォーマンス指標の狭さに対する影響を減少させることが多い。この記事では,“LLMが教育にどのような影響を与えるべきか? 133の実験と準実験のメタ分析(k = 188)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:22:27 GMT)
The Rarity Blind Spot: A Framework for Evaluating Statistical Reasoning in LLMs [14.2]
そこで我々はDFM(Distinctive Feature Mining)を導入し,グローバルな文脈では稀な10～40個の文書と表面的特徴をモデルで分析する手法を提案する。この設定は、検索ではなく統計的推論が重要となる候補選択や製品分化といった現実のシナリオを反映している。 DiFBenchを用いて、10の最先端LCMにおいて特徴的特徴マイニングを大規模に評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:48:39 GMT)
Authenticated Private Set Intersection: A Merkle Tree-Based Approach for Enhancing Data Integrity [14.2]
プライベート・セット・インターセクション(PSI)は、参加者のプライバシーを維持しながら、セット・交差点のセキュアな計算を可能にする。標準PSIの既存のプロトコルは、悪意のある参加者が追加の交差点情報を抽出できるようなデータ完全性攻撃に弱いままである。我々はPSIにおけるデータの整合性の定義を提案し、Merkle Treesと最先端の2パーティVolePSIとマルチパーティmPSIプロトコルを統合することにより、2つの認証PSIスキームを構築する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:08:44 GMT)
Clarification as Supervision: Reinforcement Learning for Vision-Language Interfaces [14.1]
本稿では,視覚モデルに対話による情報推論に何が必要なのかを学習するアダプティブ・クラシフィケーション強化学習(AC-RL)を提案する。 AC-RLは7つの視覚数学的推論ベンチマークで事前訓練されたベースラインに対して平均精度を4.4ポイント改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:46:46 GMT)
MIDAS: Misalignment-based Data Augmentation Strategy for Imbalanced Multimodal Learning [14.1]
マルチモーダルモデルは、しばしば支配的なモダリティに過度に頼り、最適な性能を達成できなかった。提案するMIDASは,意味的に整合性のないクロスモーダル情報を用いて,ミスアライメントされたサンプルを生成する新しいデータ拡張戦略である。複数のマルチモーダル分類ベンチマークの実験により、MIDASはモダリティの不均衡に対処する上で、関連するベースラインを著しく上回っていることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:13:17 GMT)
Capacity-Net-Based RIS Precoding Design without Channel Estimation for mmWave MIMO System [14.0]
Capacity-Netは、ミリ波(mmWave)システムにおける達成可能な速度を最大化する新しい教師なし学習手法である。 mmWaveスペクトルの重度チャネルフェードに対処するため、RISの反射素子の位相シフト係数を最適化し、達成可能な速度を向上する。チャネル推定の代わりに、受信したパイロット信号間のマッピング、最適化されたRIS位相シフト、そして達成可能なレートを確立するために、Capacity-Netが提案されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:57:33 GMT)
Collective Counterfactual Explanations: Balancing Individual Goals and Collective Dynamics [13.9]
本稿では,人口動態モデルを導入することで,標準的対実的説明を拡張する新しい枠組みを提案する。本稿では,本手法が個人中心のタスクから集合最適化問題への反実的説明問題をいかに再構成するかを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:05:29 GMT)
Advantage of utilizing nonlocal magic resource in Haar-random circuits [13.9]
複数のユニットを持つ量子回路の設計とシミュレーションにおいて、計算能力は急速に増大する絡み合いによって大幅に制限される。非局所魔法資源の内在的スケーリング則とHaar-random量子回路における行列積状態の結合次元を明らかにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:48:55 GMT)
Scaling Laws Revisited: Modeling the Role of Data Quality in Language Model Pretraining [13.9]
本稿では,モデルサイズ,データボリューム,データ品質の結合関数として損失を予測するため,Chinchillaフレームワークを拡張した品質対応スケーリング法を提案する。データ品質による損失スケールが予測可能であり,高品質なデータにより,モデルサイズを大幅に削減し,従って計算要求を低減できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:45:06 GMT)
Towards Convexity in Anomaly Detection: A New Formulation of SSLM with Unique Optimal Solutions [13.9]
SVDD (Support Vector Description) Small and Large Sphere SVM (Mv-Ms) として広く使われている手法の未解決問題は、最適解をハマーする二次異常検出のための非粘性である。本稿では,最適解が自明に見つかる事例を識別し,不適切な事例を識別する新しいSSLMを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:49:12 GMT)
Find the Fruit: Zero-Shot Sim2Real RL for Occlusion-Aware Plant Manipulation [13.9]
本稿では,開地における自律収穫のための強化学習フレームワークを提案する。茎と葉を配置して標的果実を明らかにするためのシミュレーションで完全に学習される政策複数の実生植物の実験では, 最大86.7%の果実の暴露に成功した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:50:35 GMT)
DGM4+: Dataset Extension for Global Scene Inconsistency [13.8]
創作されたイメージと操作されたキャプションは、説得力のある偽の物語を生み出すために、ますます共起的になっている。我々はDGM4を5000の高品質なサンプルで拡張し、FG-BGのミスマッチとテキスト操作によるハイブリッドを取り入れた。このリソースは、現在FG-BGの不整合に苦しんでいるHAMMERのようなマルチモーダルモデルの評価を強化することを目的としている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:24:21 GMT)
Risk Profiling and Modulation for LLMs [13.8]
大規模言語モデル(LLM)は、不確実性の下で意思決定タスクにますます使われている。既存の研究では、主にパーソナリティ・プロンプトやマルチエージェントの相互作用について研究されている。我々は,ポストトレーニングがリスク嗜好の最も安定かつ効果的な調整を提供することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:06:12 GMT)
How Far Do Time Series Foundation Models Paint the Landscape of Real-World Benchmarks ? [13.8]
本研究は,実世界の映像から時間信号を取り出すことによって,合成データと現実データを橋渡しする新しいベンチマーク手法を提案する。実世界のビデオから派生した多種多様な時系列をキャプチャする新しいデータセットであるREAL-V-TSFMを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:53:05 GMT)
Chypnosis: Undervolting-based Static Side-channel Attacks [13.8]
静的なサイドチャネル解析攻撃は、機密情報を抽出するために停止クロックに依存する。本稿では,標的回路のクロックを間接的に停止させるアンダーボリュート攻撃手法であるEmphChypnosisを提案する。催眠術はまた、前衛の国家浄化段階を阻害し、その存在下においても秘密情報の回復を可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:53:34 GMT)
Debunk the Myth of SFT Generalization [13.7]
一般的な見解では、教師付き微調整(SFT)は一般化に失敗するが、強化学習(RL)はより広範な堅牢性を実現する。 SFTが認識する障害の多くは凍結急激な人工物によるものであることを示す。 SFTがより厳密なタスクを一般化できるかどうかを問う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:01:09 GMT)
The Serial Scaling Hypothesis [13.7]
直列シリアル」問題は、効率よく並列化できない逐次依存型計算ステップを必要とする。逐次的な性質に拘わらず、拡散モデルは本質的に直列的な問題を解くことができないことを示す。計算のシリアルな性質を認識することは、機械学習、モデル設計、ハードウェア開発に深く影響していると論じる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:04:00 GMT)
Covariance Matrix Construction with Preprocessing-Based Spatial Sampling for Robust Adaptive Beamforming [13.6]
本研究は, ステアリングベクトル推定ミスマッチに対処する, 効率的でロバストなビームフォーミング手法を提案する。特に、干渉源の方向(DoA)を、干渉信号の角セクタを適応的に計算した利用可能なスナップショットで推定する。提案手法におけるアレイビームパターンの解析を行い,競合する手法の計算コストについて検討した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:46:44 GMT)
Neural Collapse-Inspired Multi-Label Federated Learning under Label-Distribution Skew [13.6]
フェデレートラーニング(FL)は、分散クライアント間の協調モデルトレーニングを可能にする。多くの実世界のアプリケーション、特に医用画像のような領域では、しばしばマルチラベル設定を含む。本稿では,クライアント間で特徴分布を整列させ,高品質でクラスタ化された表現を学習する手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:06:23 GMT)
RealLiFe: Real-Time Light Field Reconstruction via Hierarchical Sparse Gradient Descent [13.6]
EffLiFeは、スパースビュー画像から高品質な光場をリアルタイムで生成する新しい光場最適化手法である。本手法は,最先端のオフライン手法よりも平均100倍高速な視覚的品質を実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:08:03 GMT)
Regression Language Models for Code [13.5]
単一の統一回帰言語モデル(RLM)がテキストから直接同時に予測可能であることを示す。 5つの古典的NAS設計空間において、RLMが平均平均である0.46のKendall-Tauを得ることができることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:25:23 GMT)
How Do Large Vision-Language Models See Text in Image? Unveiling the Distinctive Role of OCR Heads [13.5]
光文字認識ヘッド(OCRヘッド)と呼ばれる画像からテキストを認識するための頭部を特定する。 1)少ないスパース:以前の検索ヘッドとは異なり、画像からテキスト情報を抽出するために多数のヘッドが活性化される。我々は,OCRと従来の検索ヘッドの両方にCoT(Chain-of-Thought)を適用し,これらのヘッドをマスキングすることで,下流タスクにおける知見を検証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:28:38 GMT)
ODE-GS: Latent ODEs for Dynamic Scene Extrapolation with 3D Gaussian Splatting [13.5]
3次元ガウススプラッティングと潜在ニューラル常微分方程式(ODE)を統合する新しいアプローチODE-GSを導入する。提案手法はまず,観測ウィンドウ内で正確なガウス軌道を生成するモデルを学習し,その上でトランスフォーマーエンコーダを訓練して,過去の軌跡をニューラルODEを介して進化した潜時状態に集約する。数値積分はスムーズで物理的に妥当な未来のガウス軌道を生成し、任意の未来のタイムスタンプでのレンダリングを可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:38:55 GMT)
DiSA-IQL: Offline Reinforcement Learning for Robust Soft Robot Control under Distribution Shifts [13.5]
IQLの拡張であるDiSA-IQL(Distribution-Shift-Aware Implicit Q-Learning)を提案する。シミュレーションの結果、DiSA-IQLは、ビヘイビア・クローン(BC)、保守的Qラーニング(CQL)、バニラ・IQLなど、ベースラインモデルよりも一貫して優れています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:53:47 GMT)
Video Object Segmentation-Aware Audio Generation [13.5]
既存のマルチモーダルオーディオ生成モデルは、しばしば正確なユーザ制御を欠いているため、プロのFoleyでは適用性が制限される。我々は,映像やテキストの手がかりとともに視覚的セグメンテーションマスクを活用することで,制御可能な音声生成を可能にする新しいマルチモーダル生成モデルSAGANetを提案する。提案手法は,現在の最先端手法よりも大幅に改善され,制御可能で高忠実なフォリー合成のための新しい標準が設定されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:49:41 GMT)
Fair Uncertainty Quantification for Depression Prediction [13.5]
うつ病予測における不確実性定量化(UQ)の公平性について検討する。うつ病予測のための不確実性定量化(FUQ)を提案する。 FUQはグループベースの分析を通じて信頼性と公正なうつ病予測を追求している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:11:49 GMT)
Guided Speculative Inference for Efficient Test-Time Alignment of LLMs [13.5]
Guided Speculative Inferenceは、大規模言語モデルにおける効率的な報酬誘導デコーディングのための新しいアルゴリズムである。最適傾きポリシー $pi_beta,B(ymid x) propto pi_B(ymid x)exp(beta,r(x,y))$ of soft best-of-n$ を基本モデル $pi_B$ の下で確実に近似する。推論ベンチマーク実験では, 標準ソフトの$-of-n$と$pi_Sよりも高い精度が得られる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:57:02 GMT)
VLM-FO1: Bridging the Gap Between High-Level Reasoning and Fine-Grained Perception in VLMs [13.5]
VLM(Vision-Language Models)は、高レベルのシーン理解において優れるが、精密なローカライゼーションを必要とする微粒な知覚タスクに重点を置いている。 VLM-FO1は、オブジェクト中心の知覚を堅牢な特徴検索タスクに再フレーミングすることで、この制限を克服する新しいフレームワークである。本手法は,プリトレーニング済みのVLMと統合したプラグイン・アンド・プレイモジュールとして動作する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:10:56 GMT)
AutoJudge: Judge Decoding Without Manual Annotation [13.5]
AutoJudgeは大規模言語モデル(LLM)推論をタスク固有の損失投機的デコードで高速化する手法である。提案手法は,ターゲットモデルとドラフトモデルとのミスマッチのどれを修正すべきかを,半グレディな探索アルゴリズムに頼っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:21:23 GMT)
GeoLink: Empowering Remote Sensing Foundation Model with OpenStreetMap Data [13.5]
この研究は、リモートセンシング(RS)基礎モデル(FM)を強化するためにOpenStreetMap(OSM)データを活用するフレームワークであるGeoLinkを提示する。特に、GeoLinkはOSMデータから派生した多粒性学習信号を用いたRS自己教師型事前学習を強化する。下流タスクでは、GeoLinkは広範囲のアプリケーションをサポートするために、一様および多モードのきめ細かいエンコーディングを生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:45:52 GMT)
Improving Metacognition and Uncertainty Communication in Language Models [13.4]
大規模言語モデル(LLM)は、意思決定の文脈でますます使われている。 LLMの明示的な言語的信頼は、典型的には誤解され、正解と誤解の区別が不十分である。教師付き微調整が不確かさを伝達するモデルの能力を向上させるかどうかを検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:50:02 GMT)
GraphCogent: Mitigating LLMs' Working Memory Constraints via Multi-Agent Collaboration in Complex Graph Understanding [13.4]
大規模言語モデル(LLM)は、小規模なグラフ推論タスクでは有望な性能を示すが、複雑なクエリで現実のグラフを扱うと失敗する。グラフ推論を特殊な認知プロセス(センス、バッファ、実行)に分解する協調エージェントフレームワークであるGraphCogentを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:56:50 GMT)
BaB-prob: Branch and Bound with Preactivation Splitting for Probabilistic Verification of Neural Networks [13.3]
プレアクティベーション分割を伴う分岐とバウンドは、ニューラルネットワークの決定論的検証に非常に有効であることが示されている。そこで本稿では,前処理を分割することで,元の問題をサブプロブレムに反復的に分割するBaB-probを提案する。フィードフォワード・ReLUニューラルネットワークにおけるBaB-probの健全性と完全性を証明する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:39:39 GMT)
Efficient Context Selection for Long-Context QA: No Tuning, No Iteration, Just Adaptive-$k$ [13.2]
本稿では、クエリと候補パスの類似度スコアに基づいて、経路数を適応的に選択する、単純で効果的なシングルパス手法であるAdaptive-$k$を提案する。モデルファインチューニング、余分なLCM推論、あるいは既存のレトリバー読み取りパイプラインの変更は不要である。 5つのLCLMと2つの埋め込みモデルで精度を向上し、動的にコンテキストサイズを調整することでより効率的で正確なQAが得られることを強調した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:14:35 GMT)
MUSS-TI: Multi-level Shuttle Scheduling for Large-Scale Entanglement Module Linked Trapped-Ion [13.1]
フォトニック配線に基づく大規模トラップイオン量子コンピューティングアーキテクチャを提案する。本稿では,古典計算におけるマルチレベルメモリスケジューリングにインスパイアされたマルチレベルスケジューリング手法を提案する。 MUSS-TIは、30-32キュービットのアプリケーションで41.74%、平均73.38%、59.82%のアプリケーションで117-128キュービット、256-299キュービットのアプリケーションでそれぞれシャトル運用を削減している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:22:57 GMT)
A Preference-Driven Methodology for High-Quality Solidity Code Generation [13.1]
PrefGenは、人間の好みを超えて標準DPOを拡張して、定量化されたブロックチェーン固有のメトリクスを組み込む新しいフレームワークである。本稿では,Pass@k(機能的正当性),Compile@k(機能的正当性),Gas@k(ガス効率),Secure@k(セキュリティ評価)の4つの相補的指標を用いた総合的評価手法を紹介する。 PrefGenは、すべての臨界次元で既存のアプローチを大幅に上回り、66.7%のPass@5、58.9%のGas@5、62.5%のSecure@5を達成している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:12:25 GMT)
Transformer-Based Rate Prediction for Multi-Band Cellular Handsets [13.0]
本稿では,複数のアンテナアレイと帯域にまたがる達成可能な速度の予測問題について,より少ない歴史的測定値で定式化する。本稿では,レート履歴を入力とし,アレイごとのレート予測を出力するトランスフォーマーベースのニューラルアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:29:42 GMT)
BoundMatch: Boundary detection applied to semi-supervised segmentation [12.9]
半教師付きセマンティックセマンティックセグメンテーション(SS-SS)は,多彩なラベル付き画像を活用することで,高密度画素ラベリングの重いアノテーション負担を軽減することを目的としている。本稿では,意味境界検出を教師と学生の整合性正規化パイプラインに明示的に統合する,新しいマルチタスクSS-SSフレームワークであるBoundMatchを提案する。境界一貫性規則化マルチタスク学習(Bundary Consistency Regularized Multi-Task Learning)は,セグメンテーションマスクと詳細なセグメンテーション境界において,教師と生徒のモデル間の予測合意を強制する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:27:29 GMT)
TASP: Topology-aware Sequence Parallelism [12.9]
Long-context Large Language Model (LLM) は自己認識機構の2次複雑さのために制約に直面している。 Ring Attentionは、クエリをアクセラレータにまたがる複数のクエリチャンクに分散することで、この問題を解決する。通信効率が低く、実用性が制限されている。長文LLMのためのトポロジ対応SP法であるTASPを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:15:27 GMT)
Thinking-Free Policy Initialization Makes Distilled Reasoning Models More Effective and Efficient Reasoners [12.8]
本稿では, 長いチェーン・オブ・ソート(CoT)蒸留と標準RLVRを橋渡しするRLVRへの, 単純かつ効果的な適応である**T**hinking-**F*ree **P**olicy **I**nitialization (**I***)を紹介する。実験により、TFPIはRL収束を加速し、高い性能の天井を達成し、特別な報酬や複雑な訓練設計を伴わないよりトークン効率の高い推論モデルが得られることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:25:00 GMT)
Communications to Circulations: 3D Wind Field Retrieval and Real-Time Prediction Using 5G GNSS Signals and Deep Learning [12.8]
本稿では,5つのGNSS(Global Navigation Satellite System)信号から3D(3D)大気風場を抽出・予測する信号強度の変動を利用した,新しいディープラーニングフレームワークを提案する。予報結果から,風速の短期風速予測(最大30分リードタイム)と高分解能NWP出力に匹敵するスキルスコアの双方において有望な精度を示す。この学際的アプローチは、先進的な環境モニタリングとリアルタイムの大気応用のために、非伝統的なデータソースとディープラーニングを活用できる変革の可能性を浮き彫りにしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:03:53 GMT)
EfficientEdit: Accelerating Code Editing via Edit-Oriented Speculative Decoding [12.6]
大規模言語モデル(LLM)は、コード編集において顕著な能力を示し、ソフトウェア開発の生産性を大幅に向上させた。提案するEfficientEditは,投機的復号化に基づく2つのキー機構により,LLMベースのコード編集効率を向上させる手法である。実験の結果、EfficientEditは10.38$times$と13.09$times$speedupを標準の自己回帰デコードと比較して達成できることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:34:02 GMT)
Worker Discretion Advised: Co-designing Risk Disclosure in Crowdsourced Responsible AI (RAI) Content Work [12.5]
責任あるAI(RAI)コンテンツ作業は、しばしば群衆労働者を潜在的に有害なコンテンツに晒す。 29人のタスクデザイナ、ワーカー、プラットフォーム代表と共同設計セッションを行います。デザインの緊張を識別し、開示プラクティスを形成する社会技術的トレードオフをマップします。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:57:47 GMT)
TinyDef-DETR: A DETR-based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.5]
TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:41:25 GMT)
MissionHD: Hyperdimensional Refinement of Distribution-Deficient Reasoning Graphs for Video Anomaly Detection [12.5]
構造分布学習に頼らずにデオード可能なグラフ表現を最適化するためのHDC制約グラフ構造再構成(HDC-GSR)を提案する。制約付きグラフニューラル演算でグラフを符号化し、下流のタスク損失と直接一致させ、洗練された構造をデコードするHDCフレームワークであるMissionHDを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:51:05 GMT)
SGS: Segmentation-Guided Scoring for Global Scene Inconsistencies [12.4]
HAMMERはマルチモーダル操作検出のための最先端モデルである。主主題が文脈的に不明瞭な背景に置かれると、それは一貫して失敗する。本稿では,軽量なセグメンテーション誘導型スコアリングパイプラインを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:15:11 GMT)
Beyond Point Estimates: Likelihood-Based Full-Posterior Wireless Localization [12.4]
受信機計測から未知の送信機位置の後方推定として局所化を定式化する。我々はモンテカルロサンプリングを用いてニューラルスコアリングネットワークを訓練するモンテカルロ候補類似度推定(MC-CLE)を提案する。マルチアンテナ受信機を用いた直視シミュレーションにおいて、MC-CLEは角のあいまいさやフロント・ツー・バックアンテナパターンなどの重要な特性を学習する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:24:21 GMT)
Personalized Scientific Figure Caption Generation: An Empirical Study on Author-Specific Writing Style Transfer [12.4]
学術論文の著者プロファイルデータを用いて、パーソナライズされた人物キャプションの生成について検討する。著者のスタイルの一致とキャプション品質の維持の基本的なトレードオフを明らかにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:52:15 GMT)
DEBATE, TRAIN, EVOLVE: Self Evolution of Language Model Reasoning [12.3]
大規模言語モデル(LLM)は、大規模なデータセットの広範なトレーニングを通じて、その推論において大幅に改善されている。 Debate, Train, Evolve (DTE) は,複数エージェントの議論トレースを用いて単一の言語モデルを進化させる,基礎となる真理のないトレーニングフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:47:26 GMT)
Value Profiles for Encoding Human Variation [12.3]
値プロファイルは、コンテキスト内デモから圧縮された基礎値の記述である。価値プロファイルは、精査可能性、解釈可能性、操縦性という面での利点を提供する。我々は,デコーダの予測が意味的プロファイルの違いに合わせて変化し,よく校正され,インスタンスレベルの不一致を説明するのに役立つことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:52:22 GMT)
SysMoBench: Evaluating AI on Formally Modeling Complex Real-World Systems [12.2]
我々は、AIが大規模で複雑なシステムを正式にモデル化する能力を評価するベンチマークであるSysMoBenchを紹介する。私たちは、今日の重要なコンピューティングインフラストラクチャのキーストーンである、並列および分散システムに重点を置いています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:31:57 GMT)
AIMCoT: Active Information-driven Multimodal Chain-of-Thought for Vision-Language Reasoning [12.0]
CoT(Multimodal Chain-of-Thought)は,情報交換による推論の強化に有効な手法である。基本的制約に対処するtextbfActive textbfInformation-driven textbfMulti-modal textbfChain-textbfof-textbfThought フレームワークである textbfAIMCoT を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:57:44 GMT)
Items Proxy Bridging: Enabling Frictionless Critiquing in Knowledge Graph Recommendations [12.0]
アイテム Proxy Generic Critiquing Framework (IPGC)は、ほとんどの知識グラフ推奨モデルのためのプラグインです。 IPGCは、反復的なレコメンデーション改善を可能にするために、批判機構の摩擦のない統合のための新しいパラダイムを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:28:41 GMT)
Cooperative Autonomous Driving in Diverse Behavioral Traffic: A Heterogeneous Graph Reinforcement Learning Approach [11.9]
多様な運転スタイルで異種交通環境をナビゲートすることは、自動運転車にとって大きな課題となる。本稿では、自動運転車の意思決定性能を向上させるためのエキスパートシステムにより強化された異種グラフ強化学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:12:57 GMT)
Source Separation for A Cappella Music [11.9]
本研究では,カペラ音楽におけるマルチシンガー分離の課題について検討する。本稿では,SepReformerの適応であるSepACapを紹介する。 JaCappellaデータセット上での実験により,本手法は,フルアンサンブルとサブセットのシンガー分離シナリオにおいて,最先端のパフォーマンスを実現することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:39:40 GMT)
Voting or Consensus? Decision-Making in Multi-Agent Debate [11.8]
意思決定が異なるタスクにどのように影響するかは、ほとんど分かっていない。投票プロトコルは、推論タスクとコンセンサスプロトコルのパフォーマンスが13.2%向上し、知識タスクの2.8%向上した。回答の多様性を高めて意思決定を改善するために,2つの新しい方法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:49:35 GMT)
The Inverse Drum Machine: Source Separation Through Joint Transcription and Analysis-by-Synthesis [11.8]
Inverse Drum Machineは、ディープラーニングと組み合わせた分析バイシンセシスフレームワークを活用する、ドラムソース分離の新しいアプローチである。 IDMは自動ドラム転写とワンショットドラムサンプル合成を統合し、これらのタスクをエンドツーエンドで共同で最適化する。 StemGMDデータセットの実験では、IDMが分離された幹細胞データを必要とする最先端の教師付き手法に匹敵する分離品質を達成することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:14:34 GMT)
Stylos: Multi-View 3D Stylization with Single-Forward Gaussian Splatting [11.7]
提案するStylosは、3Dスタイル転送のための単一フォワード3Dガウスフレームワークで、未提示コンテンツで動作する。 Stylosは、シーンごとの最適化や事前に計算されたポーズなしで、スタイリングされた3Dシーンを合成する。複数のデータセットにわたる実験は、Stylosが高品質なゼロショットスタイリングを提供することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:09:13 GMT)
Equivariance by Local Canonicalization: A Matter of Representation [11.7]
本稿では,既存のテンソル場ネットワークをより効率的な局所正規化パラダイムに変換するためのフレームワークを提案する。このフレームワーク内では、理論的複雑性、経験的ランタイム、予測精度の観点から、異なる同変表現を体系的に比較する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:41:18 GMT)
Can VLM Pseudo-Labels Train a Time-Series QA Model That Outperforms the VLM? [11.7]
視覚言語モデルによって生成された擬似ラベルを用いた学習手法を提案する。実験結果から,TSQAモデルが擬似ラベルを用いた学習に成功しているだけでなく,VLM自体の性能を超越していることが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:53:50 GMT)
How Does Preconditioning Guide Feature Learning in Deep Neural Networks? [11.6]
本研究では,プレコンディショニングが特徴学習と一般化性能に与える影響について検討する。モデルに利用可能な入力情報は、プレコンディショナーの計量によって定義されるグラム行列を通してのみ伝達されることを示す。その結果,学習した特徴表現は,プレコンディショナーが導入したスペクトルバイアスを密接に反映していることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:21:52 GMT)
Learning Energy-based Variational Latent Prior for VAEs [11.6]
変分自動エンコーダ(VAE)は、ぼやけや一貫性のないサンプルを生成することが知られている。先行ホールとは、VAEの先行部分では高い確率を持つが、VAEの後方部分では低い確率を持つ領域を指す。本稿では,前者をエネルギーベースモデル(EBM)としてモデル化することを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:32:00 GMT)
Agentar-Scale-SQL: Advancing Text-to-SQL through Orchestrated Test-Time Scaling [11.6]
最先端のSOTA (State-of-the-art) テキスト・トゥ・ザ・アートの手法は、BIRDのような挑戦的なベンチマークに関して、人間の専門家よりかなり遅れている。テスト時間のスケーリングを探求する現在のアプローチでは、組織化された戦略が欠如し、モデルの内部推論プロセスを無視しています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:51:19 GMT)
FLOWER: A Flow-Matching Solver for Inverse Problems [11.5]
本稿では,逆問題に対する解法であるFlowerを紹介する。事前に訓練された流れモデルを利用して、観測された測定値と整合した再構成を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:07:10 GMT)
Adaptive and Resource-efficient Agentic AI Systems for Mobile and Embedded Devices: A Survey [11.5]
ファンデーションモデルは、断片化されたアーキテクチャをマルチモーダル推論とコンテキスト適応を備えたスケーラブルなバックボーンに統一することで、AIを再構築した。 FMを認知のコアとして、エージェントは自律性、一般化、自己回帰を達成するためにルールベースの振る舞いを超越する。この調査は、適応的でリソース効率の良いエージェントAIシステムの、最初の体系的な特徴を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:37:52 GMT)
Mind the Value-Action Gap: Do LLMs Act in Alignment with Their Values? [11.5]
バリュー・アクション・ギャップ(Value-Action Gap)は、現実の文脈における個人の価値観と行動の相違を明らかにする。本研究では,LLMの値と値インフォームドアクションのアライメントを評価するための評価フレームワークであるValueActionLensを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:58:52 GMT)
CO3: Contrasting Concepts Compose Better [11.4]
猫と犬"のようなよくある失敗例は、ある概念が欠落している、消えている、あるいはぎこちなく他の概念と衝突している画像を生み出すことがある。本稿では,共同プロンプトの動作が単一概念と強く重なりすぎる領域から切り離す補正的サンプリング戦略を提案する。結果は,現代の拡散系における脆性セマンティックアライメントの挙動を,軽量な補正ガイダンスにより著しく軽減できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:33:46 GMT)
Predicting Effects, Missing Distributions: Evaluating LLMs as Human Behavior Simulators in Operations Management [11.3]
LLMは、ビジネス、経済学、社会科学における人間の振る舞いをシミュレートする新しいツールである。本稿では, LLM が操作管理における人間行動の再現性を評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:20:58 GMT)
Vision-driven River Following of UAV via Safe Reinforcement Learning using Semantic Dynamics Model [11.3]
無人航空機による視覚駆動の自律川は、救助、監視、環境監視といった用途に欠かせない。本稿では,報酬優位関数を改良したMarginal Gain Advantage Estimationを紹介する。次に, セマンティック・ダイナミクス・モデルを構築し, セマンティック・ダイナミクス・モデルを構築した。第3に、コスト優位性評価のためにアクター、コスト推定器、SDMを統合するConstrained Actor Dynamics Estimatorアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:19:47 GMT)
Nonclassical phonon pair [11.2]
懸濁シリコンマイクロ構造における量子相関フォノン対を生成する新しい手法を提案する。コーシー=シュワルツの不等式に違反して生成したフォノン対の古典的でない性質を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:01:00 GMT)
Explainable Fault Localization for Programming Assignments via LLM-Guided Annotation [11.2]
そこで本研究では,プログラムの代入に適したFact Localization法であるFLAMEを提案する。行番号を直接予測する代わりに、私たちはLCMに詳細な説明とともに、欠陥コード行に注釈を付けるように促します。 FLAMEは、プログラムの割り当てに対して最先端のフォールトローカライゼーションベースラインを上回り、最高のパフォーマンスベースラインよりもトップ1で207のフォールトをローカライズすることに成功した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:23:07 GMT)
MADS: Multi-Agent Dialogue Simulation for Diverse Persuasion Data Generation [11.1]
マルチターン対話を生成するスケーラブルなフレームワークであるMADS(Multi-Agent Dialogue Simulation)を提案する。我々は,多様なペルソナ駆動行動をシミュレートするユーザエージェント,タスク指向の説得戦略を実行するダイアログエージェント,対話結果の評価と精査を行う最適化エージェントという3つの協調エージェントを採用している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:55:39 GMT)
TAMA: Tool-Augmented Multimodal Agent for Procedural Activity Understanding [11.0]
手続き型アクティビティアシスタントは、さまざまな設定で人間をサポートする可能性がある。その潜在的なユースケースにもかかわらず、そのようなアシスタントに適したシステム開発はいまだに過小評価されている。本稿では,プロシージャ活動理解のためのツール拡張マルチモーダルエージェントTAMAを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:34:24 GMT)
ReEvalMed: Rethinking Medical Report Evaluation by Aligning Metrics with Real-World Clinical Judgment [11.0]
臨床基盤のメタ評価フレームワークを提案する。臨床診断基準は,臨床のアライメントと重要な指標能力にまたがる。我々のフレームワークは、より臨床的に信頼性の高い評価方法を構築するためのガイダンスを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:00:47 GMT)
Minimalist Explanation Generation and Circuit Discovery [10.9]
本稿では,機械学習決定のための最小限の説明を生成するために,アクティベーションマッチングに基づくアプローチを提案する。我々は、画像の判断的に重要な領域をハイライトするバイナリマスクを生成するために、軽量なオートエンコーダを訓練する。このような最小限の説明は、モデル内部を機械的に解釈するきっかけにもなります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:43:44 GMT)
Annotation-Efficient Active Test-Time Adaptation with Conformal Prediction [10.8]
Active Test-Time Adaptation (ATTA)は、人間のアノテーションを選択的にクエリすることで、ドメインシフト下でのモデルの堅牢性を改善する。本稿では,ATTA に基本的かつ包括的不確実性をもたらす Conformal Prediction Active TTA (CPATTA) を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:47:34 GMT)
EVODiff: Entropy-aware Variance Optimized Diffusion Inference [10.8]
拡散モデル(DM)は画像生成において優れているが、遅い推論とDPM-rのようなトレーニング推論勾配に基づく解法に悩まされている。本稿では,DMの推論過程に関する情報理論的視点を紹介する。本稿では EVODiff と呼ばれる DM の生成過程に対して,エントロピーを考慮した分散最適化手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:15:07 GMT)
ART-VITON: Measurement-Guided Latent Diffusion for Artifact-Free Virtual Try-On [10.8]
VITON(Virtual try-on)は、ターゲット服を着用している人のリアルなイメージを生成することを目的としている。アーティファクトフリーな合成を維持しながら測定付着性を確保するための,測定誘導拡散フレームワークART-VITONを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:09:47 GMT)
Transformer-Based Neural Networks Backflow for Strongly Correlated Electronic Structure [10.8]
本稿では,Transformerアーキテクチャを用いて,ニューラルネットワークのバックフローを通じて,電子相関の複雑な文法を捉えることができることを示す。強い相関を持つ鉄-硫黄クラスターの適用は、我々のアプローチを検証する。その結果、トランスフォーマーベースのバックフローは、強い相関電子構造のための強力な変分アンサッツとして確立される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:24:33 GMT)
A Unified Probabilistic Framework for Dictionary Learning with Parsimonious Activation [10.8]
行列行列の行ワイズ$L_infty$ノルムに基づいて正規化を促進させるパーシモニーを導入する。この追加のペナルティにより係数行列の全行が消滅し、データセット全体で活性化される辞書原子の数が減少する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:46:11 GMT)
Per-example gradients: a new frontier for understanding and improving optimizers [10.7]
自動微分グラフの手術により勾配統計が実現可能であることを示す。また、指数勾配変換のレンズを通して最適化における2つの非線形演算の理解を再考する。全体として、指数勾配情報によって新しい解析とアルゴリズム設計の可能性が示される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:00:41 GMT)
Zero-Shot Decentralized Federated Learning [10.6]
集中コーディネータを使わずに、分散クライアント間のゼロショット適応を可能にする、完全に分散化されたフレームワークであるゼロショット分散フェデレートラーニング(ZeroDFL)を提案する。我々はZeroDFLを9つの多様な画像分類データセットで検証し、連続的に性能が向上することを示した。これらの結果から,フェデレートされたゼロショット学習の一般化が促進されるだけでなく,拡張性,効率性,プライバシ保護が向上し,現実のアプリケーションにおける大規模視覚言語モデルの分散適応が促進されることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:13:21 GMT)
$p$-less Sampling: A Robust Hyperparameter-Free Approach for LLM Decoding [10.6]
$p$-less サンプリングは、サンプリングに対する情報理論のアプローチであり、各デコードステップでトランケーション閾値を動的に設定する。 p$-lessが既存のサンプリング手法を一貫して上回りながら、より高い温度でテキスト品質の劣化がはるかに少ないことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:36:20 GMT)
Sequence Pathfinder for Multi-Agent Pickup and Delivery in the Warehouse [10.6]
Multi-Agent Pickup and Delivery (MAPD) は Multi-Agent Path Finding (MAPF) の挑戦的拡張であるコミュニケーション学習は、グローバルな情報の欠如を緩和するが、ポイントツーポイント通信による高い計算複雑性をもたらす。本稿では,暗黙的な情報交換を実現するためのシークエンシャルパスファインダ(SePar)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:39:02 GMT)
LLM-MCoX: Large Language Model-based Multi-robot Coordinated Exploration and Search [10.6]
LLM-MCoX (LLM-based Multi-robot Coordinated Exploration and Search)を導入した。提案手法は,フロンティアクラスタ抽出とドアウェイ検出のためのリアルタイムLiDARスキャン処理とマルチモーダルLPM推論を組み合わせたものである。 LLMは自然言語に基づくオブジェクト検索を可能にするので、人間のオペレーターは高いレベルのセマンティックガイダンスを提供することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:33:35 GMT)
HiFIRec: Towards High-Frequency yet Low-Intention Behaviors for Multi-Behavior Recommendation [10.6]
HiFIRecは、新しいマルチ行動レコメンデーション手法である。差動挙動モデリングにより,高周波かつ低意図動作の効果を補正する。 2つのベンチマークの実験では、HiFIRecはいくつかの最先端手法に比べてHR@10を4.21%-6.81%改善している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:20:45 GMT)
Explaining novel senses using definition generation with open language models [10.5]
AXOLOTL'24共有タスクのデータセットを,説明可能な意味変化モデリングに利用した。私たちは、最高の提案よりも高いパフォーマンスのオープンソースモデルを微調整し、公開しています。さらに、エンコーダ-デコーダ定義ジェネレータはデコーダのみのジェネレータと同等に動作することがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:40:36 GMT)
A Generalized Information Bottleneck Theory of Deep Learning [10.5]
Information Bottleneck(IB)原則は、ニューラルネットワーク(NN)がどのように学習するかを理解するための説得力のある理論的フレームワークを提供する。我々は、シナジーのレンズを通して、元のIB原理を再構築する枠組みを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:38:56 GMT)
RouterArena: An Open Platform for Comprehensive Comparison of LLM Routers [10.4]
RouterArenaはLLMルータの包括的な比較を可能にする最初のオープンプラットフォームである。 1)知識領域を網羅したデータセット,(2)ドメイン毎に識別可能な難易度,(3)評価指標の広範なリスト,(4)リーダボード更新の自動フレームワークを備える。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:22:28 GMT)
J-NeuS: Joint field optimization for Neural Surface reconstruction in urban scenes with limited image overlap [10.3]
J-NeuSは、外向きカメラのポーズを持つ大きな駆動シーケンスのための、新しいハイブリッドな暗黙表面再構成手法である。本手法は,2つの放射場を共同で最適化し,複雑な都市シナリオにおける微細構造とともに,大面積の正確な再構成を実現するためのガイド付きサンプリングを行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:47:04 GMT)
NuRisk: A Visual Question Answering Dataset for Agent-Level Risk Assessment in Autonomous Driving [10.3]
自律運転におけるリスクを理解するには、エージェントの振る舞いとコンテキストに関する高いレベルの推論が必要である。現在の視覚言語モデル(Ms)に基づく手法は主に静的画像のグラウンドエージェントである。自律運転における明示的時間的推論の促進のための重要なベンチマークとして,NuRiskを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:37:31 GMT)
FastCoder: Accelerating Repository-level Code Generation via Efficient Retrieval and Verification [10.3]
我々は、コード生成用に特別に設計された推論アクセラレーションアプローチであるFastCoderを提案する。 FastCoderはマルチソースのデータストアを構築し、一般的な知識とプロジェクト固有の知識の両方へのアクセスを提供する。リポジトリレベルとスタンドアロンのコード生成タスクにおける自動回帰デコードと比較して、最大2.53倍と2.54倍のスピードアップに達する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:10:26 GMT)
UTrace: Poisoning Forensics for Private Collaborative Learning [10.3]
UTraceは、機械学習システムにおけるユーザレベルのトレースバックのためのフレームワークである。これは、プライバシー保証を妥協することなく、責任あるデータ所有者に整合性障害を負わせる。 MPC互換のトレーニングおよび監査パイプライン内にUTraceを実装します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:47:44 GMT)
Signal-Aware Workload Shifting Algorithms with Uncertainty-Quantified Predictors [10.2]
ワークロードシフトはサステナビリティとグリッド統合戦略に影響を与える。オンラインワークロードシフトは、不確実性定量化予測器を活用して意思決定を改善することができる。我々は,UQ予測を$textitdecision不確実性スコアを通じて統合する学習補助アルゴリズムである$textttUQ-Advice$を紹介した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:51:35 GMT)
Winning Gold at IMO 2025 with a Model-Agnostic Verification-and-Refinement Pipeline [10.2]
大規模な言語モデルは、しばしばオリンピアードレベルの問題と競合する。我々は,モデルに依存しない検証・修正パイプラインを構築した。 IMO 2025において、その効果を実証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:53:21 GMT)
Adaptive Rectification Sampling for Test-Time Compute Scaling [10.2]
よりきめ細かいレベルでの誤りの修正を支援するために,適応整形サンプリング(AR-Sampling)を提案する。提案手法により, よりきめ細かいレベルでの再考が可能となり, 解の精度が向上し, 合理的な数のトークンが生成される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:15:08 GMT)
Boosting Process-Correct CoT Reasoning by Modeling Solvability of Multiple-Choice QA [10.1]
モデルに対して質問が効果的に解決できない場合、思考の急激な連鎖(CoT)が出現しがちであることを示す。結果監督型報酬モデルと強化学習をグループ相対的優位性で適用し,その目的に可解性を取り入れた。本結果は,CoT推論における幻覚の低減と信頼性向上の鍵要因として可溶性を強調した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:34:16 GMT)
CORTEX: Collaborative LLM Agents for High-Stakes Alert Triage [10.1]
SOC(Security Operations Centers)は、毎日何万ものアラートに圧倒されている。この過負荷は警告の疲労を引き起こし、見過ごされた脅威やアナリストのバーンアウトにつながる。警告トリアージのためのマルチエージェントLLMアーキテクチャであるCORTEXを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:09:31 GMT)
SL$^{2}$A-INR: Single-Layer Learnable Activation for Implicit Neural Representation [10.1]
Inlicit Neural Representation (INR)は、ニューラルネットワークを利用して、座標入力を対応する属性に変換することで、視覚関連領域において大きな進歩をもたらした。我々は,INRアーキテクチャに新しいアプローチを導入することで,これらの課題を緩和できることを示す。具体的には,シングルレイヤの学習可能なアクティベーション関数と従来のReLUアクティベーションを用いた合成を組み合わせたハイブリッドネットワークSL$2$A-INRを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:02:11 GMT)
Planner-R1: Reward Shaping Enables Efficient Agentic RL with Smaller LLMs [10.0]
textscTravelPlannerベンチマークを用いて,大規模言語モデルを用いたエージェントRLについて検討した。われわれのアプローチである textscNatural-R1 は、わずか180のトレーニングクエリで textbf56.9% のファイナルパスレートを達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:49:36 GMT)
Towards A Universally Transferable Acceleration Method for Density Functional Theory [10.0]
本稿では,電子密度をコンパクトな補助基底表現で予測することにより,DFTの初期推定を構成する手法を提案する。我々のモデルは、60原子までの系における平均33.3%の自己一貫性のフィールドステップ還元を達成することができ、ハミルトン中心のモデルとDM中心のモデルを大幅に上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:35:57 GMT)
Post-Training Quantization via Residual Truncation and Zero Suppression for Diffusion Models [10.0]
拡散モデルは、高品質な画像生成を実現するが、高い計算要求のため、デプロイメントの課題に直面している。拡散モデルのための4ビットPTQスキームであるResidual Truncation and Zero Suppression (QuaRTZ) による量子化を提案する。提案手法は,外乱保存とLSB精度のバランスをとることにより,丸め誤差を低減し,量子化効率を向上させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:55:42 GMT)
SAC Flow: Sample-Efficient Reinforcement Learning of Flow-Based Policies via Velocity-Reparameterized Sequential Modeling [9.9]
多段階アクションサンプリングプロセスの勾配が原因で,非政治強化学習による表現型フローベース政策の訓練が不安定であることが知られている。フローロールアウトはリカレント計算に代数的に等価であり、RNNと同様の消滅や爆発的な勾配に影響を受けやすい。我々は,これらのポリシーのエンドツーエンドのトレーニングを容易にする,ノイズ強化ロールアウトによって実現された実用的なSACベースのアルゴリズムを開発した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:21:20 GMT)
Estimating Dimensionality of Neural Representations from Finite Samples [9.9]
グローバル次元の一般的な尺度である固有値の参加比率は,小さいサンプルサイズで非常に偏りが強いことを示す。有限サンプルと雑音でより高精度なバイアス補正推定器を提案する。我々は、カルシウムイメージング、電気生理学的記録、fMRIデータなどの脳波記録に推定器を適用した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:26:22 GMT)
HilbertA: Hilbert Attention for Image Generation with Diffusion Models [9.9]
2次元認識とGPU効率のスパースアテンション機構であるHilbertAを提案する。 HilbertAはHilbert曲線に沿って画像トークンを並べ替え、空間的近傍を保存しながら連続したメモリレイアウトを実現する。 HilbertAは1024ドル、1024ドル、2048ドルで最大4.17ドル、ベースラインに匹敵する画像品質を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:13:22 GMT)
A Position Paper on the Automatic Generation of Machine Learning Leaderboards [9.8]
機械学習(ML)研究における重要な課題は、MLのリーダーボードを通じて実行される以前の作業を比較することである。この負担を軽減するために、研究者は研究論文からリーダーボードエントリを抽出する方法を開発した。しかし、事前の作業は、問題フレーミング、比較の複雑化、現実の応用可能性の制限などによって異なる。本稿では,ALGタスクの定義方法の標準化を目的とした,ALG統合概念フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:39:56 GMT)
Investigating Long-term Training for Remote Sensing Object Detection [9.7]
リモートセンシングオブジェクト検出における機能バックボーン微細調整のための動的バックボーン凍結(DBF)を提案する。提案手法は,背骨が低レベルジェネリック特徴を抽出すべきか,リモートセンシング領域の特定の知識を持つべきかというジレンマに対処する。本手法は,長期学習における計算コストを大幅に削減しつつ,より正確なモデル学習を可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:01:15 GMT)
Stab-QRAM: An All-Clifford Quantum Random Access Memory for Special Data [9.7]
データに適したドメイン固有のアーキテクチャであるStabilizer-QRAM(Stab-QRAM)を紹介する。我々は,Stab-QRAMが$O(log N)$の最適論理回路深さを$N$のデータ項目に対して達成し,その$O(log N)$空間複雑性と一致することを示す。この設計はクリフォード以外のボトルネックを完全に回避し、高価なマジックステート蒸留の必要性を排除した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:36:52 GMT)
Overview of GeoLifeCLEF 2023: Species Composition Prediction with High Spatial Resolution at Continental Scale Using Remote Sensing [9.7]
私たちはGeoLifeCLEF 2023というオープン機械学習チャレンジを組織しました。トレーニングデータセットは、ヨーロッパに分布する500万種の植物からなる。標準化された調査に基づいて,2万2千個の小型プロットで種を予測できるモデルを評価した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:49:16 GMT)
Bringing Emerging Architectures to Sequence Labeling in NLP [9.7]
トランスフォーマーエンコーダは、構造的複雑さ、ラベル空間、トークン依存に異なるタグ付けタスクにどのように適応するかを検討する。以前より単純な設定で観測された強いパフォーマンスは、言語やデータセットをまたいで常にうまく一般化するわけではないし、より複雑な構造化タスクにまで拡張することもわかっています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:12:02 GMT)
AReUReDi: Annealed Rectified Updates for Refining Discrete Flows with Multi-Objective Guidance [9.6]
AReUReDiは、多能性バイオ分子生成のためのシーケンスベースのフレームワークである。ペプチドおよびSMILES配列設計に応用される。その結果、AReUReDiはマルチプロパタイトバイオ分子生成のための強力なシーケンスベースのフレームワークとして確立された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:33:33 GMT)
Reweighted Flow Matching via Unbalanced OT for Label-free Long-tailed Generation [9.5]
長距離分布に対する不均衡輸送再加重フローマッチング(UOT-RFM)を提案する。本手法は, 逆重み付けの原則により, 多数偏りを緩和する。我々のモデルは、長い尾のベンチマークで既存のフローマッチングベースラインを上回ります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:19:52 GMT)
FlowCast-ODE: Continuous Hourly Weather Forecasting with Dynamic Flow Matching and ODE Solver [9.5]
本研究では,時間的コヒーレンスを確保するために,大気の進化を連続的な流れとして扱うフレームワークであるFlowCast-ODEを紹介する。 6時間間隔で事前トレーニングし、データ不連続をサイドステップし、時間単位のデータで微調整することで、FlowCast-ODEは単一の軽量モデルで最大120時間のシームレスな予測を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:33:34 GMT)
Nonreciprocal superradiant quantum phase transition induced by magnon Kerr effect [9.5]
キャビティマグノン系における非相互量子相転移(SQPT)を実現するための代替手法を提案する。定常相図は、逆SQPTの起源である$K > 0$ と $K 0$ のどちらの場合においても、大きく異なることを示す。我々の研究は、非相互SQPTを実現するための新しいメカニズムを提供し、非相互量子デバイスの設計に潜在的な応用をもたらす。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:16:32 GMT)
NeurIPS should lead scientific consensus on AI policy [9.4]
我々はNeurIPSがAI政策に関する科学的コンセンサスを積極的に触媒するべきだと考えている。我々は、気候政策に関するIPCCのリーダーシップから教訓を抽出することで、NeurIPSの初期パイロットを推薦する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:08:29 GMT)
Direct Token Optimization: A Self-contained Approach to Large Language Model Unlearning [9.4]
マシン・アンラーニング(英: Machine unlearning)は、トレーニングデータのサブセット(ターゲットセット)の影響を、完全なリトレーニングなしでモデルから排除する新興技術である。重要な課題は、モデルが全体的なユーティリティを損なうことなく、忘れた集合の知識を完全に忘れることである。我々は,大規模言語モデルに対する自己完結型非学習手法であるダイレクトトークン最適化(DTO)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:05:06 GMT)
MaskSQL: Safeguarding Privacy for LLM-Based Text-to-SQL via Abstraction [9.4]
大規模言語モデル(LLM)は推論を必要とするタスクに対して有望なパフォーマンスを示す。最先端のLCMもプロプライエタリであり、コストがかかり、リソース集約であり、ローカルなデプロイメントを非現実的にしている。プライバシー保護機構として抽象化を利用するテキスト・ツー・アクション・フレームワークであるMaskを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:43:21 GMT)
MAVUL: Multi-Agent Vulnerability Detection via Contextual Reasoning and Interactive Refinement [9.4]
MAVULは、コンテキスト推論と対話的洗練を統合した、新しいマルチエージェント脆弱性検出システムである。その結果,MAVULは従来のマルチエージェントシステムよりも62%以上の精度で,単エージェントシステムでは600%以上の性能で性能が優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:21:43 GMT)
From Assistance to Autonomy -- A Researcher Study on the Potential of AI Support for Qualitative Data Analysis [9.4]
人工知能(AI)ツールの出現は、質的データ分析(QDA)の新しい可能性をもたらした。 QDAで経験した15人のヒューマン・コンピュータ・インタラクション(HCI)研究者を対象に半構造化インタビューを行った。参加者はQDAでAIサポートを受けていましたが、データプライバシ、自律性、AI出力の品質に関する懸念を表明しました。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:37:31 GMT)
Static Word Embeddings for Sentence Semantic Representation [9.3]
文意味表現に最適化された静的単語埋め込みを提案する。まず、事前学習した文変換器から単語埋め込みを抽出し、文レベルの主成分分析により改善する。推論では,単語の埋め込みを単純に平均化することで文を表現するが,計算コストは少ない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:22:41 GMT)
Ordinal Label-Distribution Learning with Constrained Asymmetric Priors for Imbalanced Retinal Grading [9.1]
糖尿病網膜症は、本質的には順序性で長い尾を持つ。制約付き非対称先行ワッサースタインオートエンコーダ(CAP-WAE)を提案する。 CAP-WAEは、最先端の4重み付きカッパ、精度、マクロF1を一貫して達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:58:49 GMT)
Calyx: Privacy-Preserving Multi-Token Optimistic-Rollup Protocol [9.1]
プライバシ保護型マルチトークン型楽観的ロールアッププロトコルであるCalyxを紹介した。 CalyxはすべてのL2トランザクションに対する完全な支払いプライバシを保証し、送信者、受信者、転送金額、トークンタイプに関する情報は公開しない。プロトコルのセキュリティとプライバシの保証を分析し,実装と評価を行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:35:31 GMT)
Information-Geometric Barycenters for Bayesian Federated Learning [9.0]
フェデレートラーニング(FL)は、局所的に訓練されたモデルの平均化を通じてコンセンサスを達成するために用いられる。効果はあるが、このアプローチは、モデル空間が分布空間の構造を持つベイズ予想とうまく一致しないかもしれない。非依存的な設定におけるフェデレーション平均化の収束特性を保持するアルゴリズムであるBA-FLBを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:43:00 GMT)
SINQ: Sinkhorn-Normalized Quantization for Calibration-Free Low-Precision LLM Weights [9.0]
訓練後の量子化は、大規模言語モデルを低精度で展開するための最も広く使われている戦略として現れてきた。現在の手法では、ビット幅が4以下でパープレキシティ劣化を示す。本稿では,2軸スケール係数と高速シンクホーン-ノック方式のアルゴリズムにより,既存の学習後量子化器を増強するSINQを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:33:46 GMT)
MUSE-Explainer: Counterfactual Explanations for Symbolic Music Graph Classification Models [8.9]
MUSE-Explainerは音楽のグラフニューラルネットワークモデルがどのように決定を下すかを明らかにする新しい手法である。提案手法は,音楽スコアグラフの小型かつ有意義な変更を行うことによって,反実的説明を生成する。既存の方法とは異なり、MUSE-Explainerは音楽データの構造の説明を調整し、非現実的あるいは紛らわしい出力を避ける。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:58:07 GMT)
Adversarial Defense in Cybersecurity: A Systematic Review of GANs for Threat Detection and Mitigation [8.9]
GAN(Generative Adversarial Networks)は、強力なアタックイネーブラーと有望な防御装置として機能する。この調査は、GANベースのサイバーセキュリティにおける敵防衛を体系的にレビューする。本稿では,防衛機能,GANアーキテクチャ,サイバーセキュリティドメイン,敵脅威モデルにまたがる4次元分類手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:15:07 GMT)
A space-decoupling framework for optimization on bounded-rank matrices with orthogonally invariant constraints [8.9]
有界ランク行列の最適化のための空間分離フレームワークを提案する。結合制約の接円錐は各制約の接円錐の交叉であることを示す。改定問題と原問題との等価性を明らかにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:13:28 GMT)
Robust Estimation Under Heterogeneous Corruption Rates [8.8]
不均質な汚職率下でのロバストな推定問題について検討する。既存の堅牢な推定器は、通常、一様または最悪のケースの腐敗を仮定する。すべての不均一な汚職パターンに対して、厳密なミニマックスレートを与えます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:17:37 GMT)
Locating Risk: Task Designers and the Challenge of Risk Disclosure in RAI Content Work [8.7]
群衆労働者は、しばしば責任あるAI(RAI)コンテンツワークを任される。以前の取り組みでは、RAIコンテンツ作業に関連する労働者の幸福に対するリスクが強調されていたが、これらのリスクが労働者にどのように伝達されるかという点では、はるかに注意が払われていない。本研究では,クラウドソーシングされたRAIタスクにおいて,タスクデザイナがリスク開示にどのようにアプローチするかを検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:54:59 GMT)
Fine-tuning Behavioral Cloning Policies with Preference-Based Reinforcement Learning [8.7]
専門家によるデモンストレーションの報酬のないデータセットから安全な初期ポリシーを学習し、嗜好に基づく人間のフィードバックを使ってオンラインで微調整する2段階のフレームワークを提案する。本稿では、このオフライン-オンラインアプローチの第一原理分析と、不確実性重み付けされた目的を通じて両信号を統合する統一アルゴリズムBRIDGEを紹介する。 BRIDGE を離散的かつ連続的に制御する MuJoCo 環境において検証し,スタンドアロンの行動クローンとオンラインの嗜好に基づく RL の双方と比較して,後悔度が低いことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:50:19 GMT)
Towards a Framework for Supporting the Ethical and Regulatory Certification of AI Systems [8.6]
CERTAINプロジェクトは、規制コンプライアンス、倫理基準、透明性をAIシステムに統合することを目的としている。このフレームワークのコアコンポーネントを構築するための方法論的な手順を概説する。 CERTAINは、規制コンプライアンスを推進し、欧州標準に沿った責任あるAIイノベーションを促進することを目的としている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:54:02 GMT)
Information Design with Unknown Prior [8.6]
オンラインプラットフォームのような情報デザイナーは、レシーバーの信念を知らないことが多い。学習アルゴリズムを設計し、情報デザイナーが反復的なインタラクションを通じて、受信者の行動から事前の信念を学習できるようにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:24:18 GMT)
BigBang-Proton Technical Report: Next-Word-Prediction is Scientific Multitask Learner [8.6]
BigBang-Protonは自動回帰言語モデリングのための統合シーケンスベースのアーキテクチャである。 BigBang-Protonは、クロススケール、クロス構造、クロスディシデントな現実世界の科学的なタスクを予習した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:09:18 GMT)
BEDTime: A Unified Benchmark for Automatically Describing Time Series [8.5]
我々は、成功したマルチモーダルモデルは時系列の言語記述を認識し、区別し、生成することができるべきだと論じる。次に、各タスクのモデルを評価する最初のベンチマークデータセットであるBEDTimeを作成します。 BEDTimeを用いて、13の最先端モデルを評価し、専用時系列基礎モデルの性能が著しく低下していることを見出した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:31:52 GMT)
Free Draft-and-Verification: Toward Lossless Parallel Decoding for Diffusion Large Language Models [8.4]
拡散大言語モデル(DLLM)は自己回帰予測を超えた言語モデリングの新しいパラダイムとして登場した。 Free Draft-and-Verification (Freedave) はDLLMに適した新しい高速サンプリングアルゴリズムである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:28:04 GMT)
Explore-Execute Chain: Towards an Efficient Structured Reasoning Paradigm [8.4]
Chain-of-Thought(CoT)とその変種は、大規模言語モデル(LLM)の推論能力を著しく向上させた。 E2C$(Explore-Execute Chain)は、推論を2つの異なるフェーズに分離する構造化推論フレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:45:38 GMT)
Adjustable Spatio-Spectral Hyperspectral Image Compression Network [8.3]
Adjustable Hyperspectral Image Compression Network (HyCASS) HyCASSは、スペクトル次元と空間次元の両方で調整可能なHSI圧縮のために設計された学習ベースモデルである。 3つのHSIベンチマークデータセットの実験結果から,提案手法の有効性が示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:38:37 GMT)
The challenge of hidden gifts in multi-agent reinforcement learning [8.3]
隠れギフトが与える影響について,非常に単純なMARLタスクを用いて検討する。この単純なタスクにおいて、いくつかの異なる最先端のMARLアルゴリズムが集団報酬を得る方法の学習に失敗していることを示す。我々は、学習の分散を減らし、より確実に集団の成功に収束するのに役立つ、学習意識のアプローチにインスパイアされた政策勾配エージェントの補正用語を導出する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:59:05 GMT)
DualTune: Decoupled Fine-Tuning for On-Device Agentic Systems [8.3]
本稿では,ツールコールタスクをツール選択と引数生成という2つのサブタスクに分解する手法を提案する。我々はDualTuneを提案する。DualTuneは、デカップリングされた微調整を使って作成されたLoRAアダプタを利用する推論フレームワークである。 MCP-Benchベンチマーク実験により,切り離した微調整を用いて訓練したQwen-2.5-7Bモデルは,ベースモデルの呼び出し精度を46%向上することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:52:57 GMT)
Learn2Drive: A neural network-based framework for socially compliant automated vehicle control [8.2]
本研究では,自動走行における適応型クルーズ制御(ACC)のための新しい制御フレームワークを提案する。社会的価値指向(SVO)を組み込んだニューラルネットワークに基づく社会的に適合したAV制御フレームワークを提案する。数値計算により, 提案手法が様々な交通条件に適応することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:33:44 GMT)
Bayesian Risk-Sensitive Policy Optimization For MDPs With General Loss Functions [8.2]
我々は、一般的な損失関数と未知のパラメータを持つマルコフ決定過程(MDP)を考察する。我々はベイズ的手法を用いてデータからパラメータを推定し、損失にコヒーレントなリスク関数を課す。本稿では,コヒーレントリスク尺度の二重表現を利用した政策勾配最適化手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:16:01 GMT)
Delayed Attention Training Improves Length Generalization in Transformer--RNN Hybrids [8.2]
本研究では、状態追跡と連想的リコールの両方を含む複合問題に対して、シーケンスモデルにおける長さ一般化について検討する。更新されたネットワークは状態トラッキングをうまく処理するが、リコールに苦労する。我々は,この効果を緩和し,長さ一般化性能を大幅に向上させる,シンプルで効果的なトレーニング戦略,すなわち注意層のトレーニングを遅らせる手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:31:14 GMT)
Lita: Light Agent Uncovers the Agentic Coding Capabilities of LLMs [8.1]
完全自律エージェントの本質的要素を維持しつつ手動設計を最小化するための原則である、エレガントさを運用するLitaを紹介する。 Aider PolyglotとSWE-Benchをフロンティアモデルで実験したところ、Litaはワークフローベースのベースラインやエージェントベースのベースラインと比較して、競争力や優れたパフォーマンスを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:07:32 GMT)
Measuring the Measures: Discriminative Capacity of Representational Similarity Metrics Across Model Families [8.0]
モデルファミリを分離する能力に基づいて,表現類似度を評価する枠組みを提案する。信号検出理論,シルエット係数,ROC-AUCの3つの相補的分離性尺度を用いる。我々は、メトリクスがより厳密なアライメント制約を課すにつれて、分離性が体系的に増加することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:21:25 GMT)
SafeMind: Benchmarking and Mitigating Safety Risks in Embodied LLM Agents [8.0]
大規模言語モデル(LLM)を利用したエージェントは、高度な計画能力を継承するが、物理世界との直接的な相互作用は安全上の脆弱性を露呈する。 SafeMindBenchは、4つのタスクカテゴリ(Instr-Risk、Env-Risk、Order-Fix、Req-Align)にまたがる5,558のサンプルを備えたマルチモーダルベンチマークである。 SafeMindAgentはモジュール型Planner-Executorアーキテクチャで、3つのケースドセーフモジュールを統合し、安全性制約を推論プロセスに組み込む。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:24:04 GMT)
PRPO: Paragraph-level Policy Optimization for Vision-Language Deepfake Detection [7.9]
本稿では,ディープフェイク検出のための推論注釈付きデータセットを導入し,ディープフェイク検出のための強化学習アルゴリズムを提案する。実験の結果、PRPOは検出精度を広いマージンで改善し、推論スコアが4.55/5.0であることがわかった。これらの結果は、より信頼性が高く、解釈可能なディープフェイク検出を可能にするために、視覚的エビデンスにおけるマルチモーダル推論の基盤となることの重要性を強調している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:56:05 GMT)
MMPB: It's Time for Multi-Modal Personalization [7.9]
パーソナライズにおける視覚言語モデル(VLM)を評価するための,最初の広範囲なベンチマークであるMMPBを紹介する。 MMPBは10kイメージクエリペアで構成されており、人間、動物、物体、キャラクターの4つのカテゴリにまたがる111のパーソナライズ可能な概念を含んでいる。我々は,概念注入,マルチターン対話,パーソナライズクエリといった3段階のプロトコルを用いてパーソナライズ性能を評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:41:39 GMT)
When Langevin Monte Carlo Meets Randomization: Non-asymptotic Error Bounds beyond Log-Concavity and Gradient Lipschitzness [7.8]
ランダム化したランゲヴィンモンテカルロ (RLMC) を, 対数凹みのない高次元分布からサンプリングするために再検討する。 RLMCサンプリングアルゴリズムに対して,$mathcalW$-distance of order $O(sqrtdh)$の均一時間誤差を証明した。改良されたRLMCアルゴリズムが提案され,非漸近誤差境界が確立された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:48:51 GMT)
Federated Learning with Enhanced Privacy via Model Splitting and Random Client Participation [7.8]
フェデレートラーニング(FL)では、クライアントデータを保護するために差分プライバシ(DP)を採用することが多いが、プライバシ保証に必要なノイズの追加は、モデルの精度を著しく低下させる可能性がある。モデル分割型プライバシ増幅型フェデレーションラーニング(MS-PAFL)を提案する。このフレームワークでは、各クライアントのモデルをプライベートサブモデルに分割し、ローカルに保持し、グローバルアグリゲーションのために共有されるパブリックサブモデルに分割する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:51:06 GMT)
CSnake: Detecting Self-Sustaining Cascading Failure via Causal Stitching of Fault Propagations [7.7]
本稿では,分散システムにおける自己維持型カスケード障害を明らかにするために,CSnakeというフォールトインジェクションフレームワークを提案する。 CSnakeは因果縫合という新しいアイデアを用いており、これは複雑な断層伝播鎖をシミュレートするために異なるテストで複数の単一フォールト注入を因果的に結合する。 CSnakeは5つのシステムで自己持続的なカスケード障害を引き起こす15のバグを検出し、そのうち5つは2つの修正で確認された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:04:31 GMT)
TableRAG: A Retrieval Augmented Generation Framework for Heterogeneous Document Reasoning [7.7]
Retrieval-Augmented Generation (RAG) は、オープンドメイン質問応答においてかなりの効果を示した。既存のRAGアプローチでは、異種文書に適用する場合に限界がある。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:08:02 GMT)
SoREX: Towards Self-Explainable Social Recommendation with Relevant Ego-Path Extraction [7.7]
ソーシャルレコメンデーションは、ユーザとイテムの相互作用モデリングにおけるデータの疎さに対処する上で有効であることが証明されている。社会的レコメンデーションにおける多くのGNNベースのアプローチには、彼らの予測に意味のある説明を与える能力がない。本稿では,自己説明型GNNベースのソーシャルレコメンデーションフレームワークであるSoREXを紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:49:54 GMT)
OPPO: Accelerating PPO-based RLHF via Pipeline Overlap [7.7]
我々は,パイプライン実行を重畳することでトレーニング効率を向上させる,新しい,軽量で,モデルに依存しないPPOベースのRLHFフレームワークOPPOを提案する。 OPPOはPPOベースのRLHFトレーニングを1.8倍-2.8倍で加速し、GPU使用率を1.4倍-2.1倍で改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:26:17 GMT)
Privately Estimating Black-Box Statistics [7.6]
任意のブラックボックス関数に適用可能な微分プライベートな手法を模索する。このような技法はいくつか存在するが、すべてデータの使用において非効率であるか、指数関数的に多くの入力で関数を評価する必要がある。統計的効率(データに必要な量)とオラクル効率(評価数)のトレードオフを行うスキームを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:28:00 GMT)
Image-Difficulty-Aware Evaluation of Super-Resolution Models [7.5]
本稿では,SISRモデルの差別化を図るため,性能評価手法を提案する。本稿では,これらのテスト画像を予測するために,高頻度指数と回転不変エッジ指数という2つの画像差分尺度を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:31:44 GMT)
Adapting SAM with Dynamic Similarity Graphs for Few-Shot Parameter-Efficient Small Dense Object Detection: A Case Study of Chickpea Pods in Field Conditions [7.5]
本研究では,Segment Anything Model (SAM) に適応する動的類似性に基づくグラフ適応(DSGA)モジュールを提案する。 DSGAは4.00Mのトレーニング可能なパラメータしか持たない堅牢な空間的および動的類似性表現を確立しており、これはオリジナルのSAMの4.26%である。提案手法は農業用自動監視装置の実用性を示し, 精度の高いポッド計数が可能であり, 調整したR-squaredは0.8987である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:26:06 GMT)
Vocabulary Customization for Efficient Domain-Specific LLM Deployment [7.5]
一般ドメイントークン化器は頻繁にドメイン固有の用語をキャプチャできず、トークンの肥大化と処理速度の低下につながる。この制限には、事前訓練された語彙をドメイン固有のトークンセットで拡張することで対処する。実世界のeコマースのユースケースで評価すると、拡張トークン化器は入力シーケンスを最大20%短縮する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:43:12 GMT)
The generative quantum eigensolver (GQE) and its application for ground state search [7.5]
本稿では,変分量子アルゴリズムのパラダイムの外で動作する新しい量子計算フレームワークである生成量子固有解法(GQE)を紹介する。 GQEアルゴリズムは古典的な生成モデルを最適化し、所望の特性を持つ量子回路を生成する。電子構造ハミルトニアンに適用されたGPT-QEのトレーニングと事前学習の実証を行い、クラスタシングルとダブルを組み合わせてその能力を実証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:22:46 GMT)
Staged Event Trees for Transparent Treatment Effect Estimation [7.4]
本稿では,イベントツリーのフレームワーク内での因果推論手法の斬新な特徴について述べる。イベントツリーのフレームワーク内に古典的推定器を実装し、シミュレーション研究と実世界のアプリケーションを通してそれらの能力を説明する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:52:44 GMT)
Atlas-free Brain Network Transformer [7.3]
我々は、新しいアトラスフリー脳ネットワークトランス(アトラスフリーBNT)を提案する。提案手法は,標準化されたボクセルベースの機能空間におけるROI-to-voxel接続性を計算する。本手法は脳ネットワーク解析の精度,堅牢性,一般化性を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:57:02 GMT)
A phase-aware AI car-following model for electric vehicles with adaptive cruise control: Development and validation using real-world data [7.2]
内燃機関(ICE)車両と電気自動車(EV)は、異なる車両の動力学を示す。既存の顕微鏡モデルでは、ICE車両の駆動挙動を効果的に捉えている。本研究は、EVに特化したフェーズアウェアAI(PAAI)カーフォローモデルを開発し、検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:27:03 GMT)
Contrastive Diffusion Guidance for Spatial Inverse Problems [7.2]
多くのフロアプランが同じ運動軌跡を説明できるため、直接反転は不十分である。拡散型後部サンプリング器を用いて, 測定値に整合したレイアウトを生成する。この埋め込み空間における確率スコアの代理形式は、真の確率スコアに対する有効な近似であることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:33:25 GMT)
QUARTZ : QA-based Unsupervised Abstractive Refinement for Task-oriented Dialogue Summarization [7.2]
appはタスク指向ユーティリティベースの対話要約のためのフレームワークである。アプリは、ゼロショットで対話から複数の要約とタスク指向の質問応答ペアを生成する。複数のデータセットで検証されると、アプリは競争力のある結果を達成することによって、その効果を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:16:08 GMT)
Layerwise Federated Learning for Heterogeneous Quantum Clients using Quorus [7.2]
本稿では,分散量子機械学習(QML)問題に対する新しい解法を提案する。異なる深さの量子モデルの効果的なトレーニングには階層的損失関数を用いる。我々はQuorusが最先端技術に対して平均12.4%の精度でテストを改善することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:40:54 GMT)
LoRAFusion: Efficient LoRA Fine-Tuning for LLMs [7.1]
Low-Rank Adaptation (LoRA) はLarge Language Models (LLM) のためのPEFT (Efficient Fine-Tuning) メソッドの先駆けとなった。 LLMのための効率的なLoRA微調整システムであるLoRAFusionを紹介する。 LoRAFusionはMegatron-LMと比較して最大1.96times$(平均1.47times$)エンドツーエンドのスピードアップを達成し、mLoRAよりも最大1.46times$(平均1.29times$)改善する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:26:22 GMT)
Towards Reasoning Ability of Small Language Models [7.1]
本稿では,SLMの推論能力を体系的に評価し,研究する最初のベンチマークであるThinkSLMを紹介する。本研究は、17の推論ベンチマークで6つの主要なモデルファミリーから72種類のSLMを評価した。我々の発見は、スケーリングが強力な推論を達成する唯一の方法である、という仮定に挑戦する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:59:32 GMT)
Commmunication-Efficient and Accurate Approach for Aggregation in Federated Low-Rank Adaptation [7.1]
現在のフェデレート低ランク適応(FedLoRA)メソッドは、不正確な更新のために顕著な課題に直面している。 textbfFederated textbfLow-textbfRank textbfAggregation with textbfNearly textbfAccurate Estimation (FLoRA-NA)を提案する。 FLoRA-NAは、局所的なパーソナライゼーションとグローバルな一般化のギャップを埋め、以前のパーソナライズされたFedLoRAアプローチの重要な制限に対処する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:32:26 GMT)
Flatness After All? [7.0]
我々は、ヘッセンの柔らかいランク測度を用いて平坦度を測定することで一般化を評価することができると論じる。非校正モデルでは、ソフトランクに基づく平坦度尺度をよく知られた竹内情報基準に接続する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:29:59 GMT)
Towards Verified Code Reasoning by LLMs [7.0]
本稿では,コード推論エージェントの回答を自動的に検証する手法について述べる。本手法は, エージェントの応答の形式的表現を抽出し, その後, 形式的検証とプログラム解析ツールを用いて構成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:17:51 GMT)
Marginal Flow: a flexible and efficient framework for density estimation [6.9]
現在の密度モデリングアプローチは、高価なトレーニング、遅い推論、近似可能性、モード崩壊、アーキテクチャ制約の少なくとも1つの欠点に悩まされている。これらの制限を完全に克服する、シンプルで強力なフレームワークを提案する。パラメトリック分布を$q(x|w)$とし、遅延パラメータを$w$とするモデルとして$q_theta(x)$を定義する。遅延変数$w$を直接最適化する代わりに、学習可能なディストリビューション$q_theta(w)$から$w$をサンプリングしてマージナルフロー(Marginal Flow)と名付けることで、それらをマージライズします。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:21:13 GMT)
Choosing a Model, Shaping a Future: Comparing LLM Perspectives on Sustainability and its Relationship with AI [6.9]
本研究では,5つの最先端の大規模言語モデルが持続可能性とそのAIとの関係をいかに概念化しているかを体系的に検討する。評価,持続可能性に関する質問紙調査を1モデルにつき100回ずつ実施し,反応パターンと変動性について検討した。この結果から,モデル選択が組織的サステナビリティ戦略に大きく影響を与える可能性が示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:12:24 GMT)
Dagger Behind Smile: Fool LLMs with a Happy Ending Story [6.9]
ハッピーエンドアタック(Happy Ending Attack)は、シナリオテンプレートで悪意のあるリクエストをラップし、LDMをすぐにまたはフォローアップされた悪意のあるリクエストでジェイルブレイクさせる。我々のHEAは、GPT-4o、Llama3-70b、Gemini-proを含む最先端のLLMのジェイルブレイクに成功し、平均して88.79%の攻撃成功率を達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:06:58 GMT)
The reliable quantum master equation of the Unruh-DeWitt detector [6.8]
本論文では,Unruh-DeWitt検出器に適用した量子マルコフマスター方程式の妥当性範囲を推定する手法を提案する。我々は、緩和されたファン・ホーブ極限(すなわち、深夜極限)を提案し、オープン量子力学の標準導出過程から生じる誤差順序の摂動的推定を与える。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:11:07 GMT)
Is Limited Participant Diversity Impeding EEG-based Machine Learning? [6.8]
脳波記録を小さなセグメントに分割してサンプル数を増やすのが一般的である。我々はこれをマルチレベルデータ生成プロセスとして概念化し、モデル性能のスケーリング挙動について検討する。次に、同じフレームワークを使用して、限られたデータ問題に対処するために設計されたさまざまなML戦略の有効性を調査します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:19:00 GMT)
Detecting Instruction Fine-tuning Attacks on Language Models using Influence Function [6.8]
命令の微調整攻撃は、大きな言語モデルに深刻な脅威をもたらす。汚染されたデータは、クリーンなデータと区別できないことが多い。本稿では,攻撃の事前知識を必要としない検出手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:06:29 GMT)
A Review on Single-Problem Multi-Attempt Heuristic Optimization [6.8]
ある現実世界の最適化シナリオでは、実践者は複数の問題を解決することに関心がなく、単一の特定の問題に対する最良の解決策を見つけることに興味があります。計算予算が候補解を評価するコストに対して大きい場合、同じ問題を解くために複数の選択肢を試すことができる。次に試す選択肢のシーケンシャルな選択は、最良のソリューションを提供する選択肢を効率的に特定するために不可欠です。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:28:28 GMT)
PRISM: Progressive Rain removal with Integrated State-space Modeling [6.8]
画像デライン化は、雨天や水滴を除去する重要な視覚技術である。現在の単一スケールモデルは、微細な回復とグローバルな一貫性に苦慮している。本稿では,プログレッシブ3段階フレームワークである統合状態空間モデリング(Integrated State-space Modeling, PRISM)による降雨除去を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:39:05 GMT)
GastroViT: A Vision Transformer Based Ensemble Learning Approach for Gastrointestinal Disease Classification with Grad CAM & SHAP Visualization [6.8]
本稿では,GIトラクターの内視鏡像を正確に分類するために,事前訓練された視覚変換器(ViT)のアンサンブルを提案する。注目に基づくニューラルネットワークであるViTは、トランスフォーマーアーキテクチャの変換パワーを活用することで、画像認識に革命をもたらした。提案モデルは,23種類のGI疾患の画像10,662枚を用いて,公開されているHyperKvasirデータセットを用いて評価した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:44:41 GMT)
Judging by Appearances? Auditing and Intervening Vision-Language Models for Bail Prediction [6.7]
大規模言語モデル(LLM)は、事例報告と犯罪履歴に基づく法的判断予測タスクに広く用いられている。大規模視覚言語モデル(VLM)が利用可能になったことにより、犯罪者のイメージを活用するための法的判断予測システムが実現できるようになった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:11:45 GMT)
Survey: Multi-Armed Bandits Meet Large Language Models [6.7]
BanditアルゴリズムとLarge Language Models (LLM)が人工知能の強力なツールとして登場した。まず, LLM微調整, プロンプトエンジニアリング, 適応応答生成の最適化において, 帯域幅アルゴリズムが果たす役割について検討する。次に、LLMが文脈理解の高度化、動的適応、および自然言語推論を用いたポリシー選択の改善を通じて、帯域幅アルゴリズムをどのように拡張するかを検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:33:36 GMT)
Timelike entanglement entropy Revisited [6.7]
この厳密に定義された時間的な絡み合いエントロピーは、時間的な管の定理により実数値化される。さらに、経路積分論とホログラフィの観点から、時間的エンタングルメントエントロピーが実際に評価されるべき理由を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:25:36 GMT)
DeepJSONEval: Benchmarking Complex Nested JSON Data Mining for Large Language Models [6.7]
多層ネスト構造は、データをキーと値のペア、配列、ネストオブジェクトに整理する。例えば、ニュース集約では、オブジェクトは記事のメタデータ(タイトル、著者、日付)、コンテンツ(テキスト、マルチメディア)、マルチメディア情報(マルチダイアログ、キャプション)を階層的にネストすることができる。 DeepJSONEvalは、2100のマルチドメインインスタンスと深いネスト構造を特徴とする新しいベンチマークで、難易度によって分類される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:18:20 GMT)
Automated and Scalable SEM Image Analysis of Perovskite Solar Cell Materials via a Deep Segmentation Framework [6.6]
本稿では,SEM画像セグメンテーションのためのディープラーニングフレームワークを提案する。 PerovSegNetという名前のモデルには、2つの新しいモジュールが組み込まれています。 PerovSegNetは平均平均精度87.25%で、265.4ギガ浮動小数点演算を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:18:51 GMT)
SafePassage: High-Fidelity Information Extraction with Black Box LLMs [6.5]
ブラックボックスの大規模言語モデル(LLM)は、情報抽出(IE)を簡単に構成できるが、信頼しにくい。本稿では, LLM が生成したコンテキストを文書に格納し, 抽出した情報と整合する「安全な通路」の概念を紹介する。これら3つの部品を併用することにより、幻覚を最大85%減らし、非幻覚をフラグ付けするリスクを最小限に抑える。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:56:17 GMT)
Creative synthesis of kinematic mechanisms [6.5]
RGB画像表現を用いた平面リンクデータセットを開発した。画像生成モデルの可能性を探るために,共有遅延変分オートエンコーダを用いる。生成機械設計における画像ベース表現の有効性を予備実験により検証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:32:30 GMT)
Complexity and hardness of random peaked circuits [6.5]
ランダムピーク回路の明示的な構成について検討する。本手法により生成された回路は非自明であることを示す。また、検証可能な量子優位プロトコルの実用的な試みとしてピーク回路を用いて検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:10:43 GMT)
SeMoBridge: Semantic Modality Bridge for Efficient Few-Shot Adaptation of CLIP [6.4]
私たちはSeMoBridgeを紹介します。これは軽量でパワフルなアプローチで、このミスアライメントに直接対処します。本手法は,セマンティック・モダリティ・ブリッジ (Semantic Modality Bridge) と呼ばれるものを通して,画像のセマンティック・モダリティを保ちながら,画像をテキスト・モダリティにマッピングする。実験によると、トレーニングされたバージョンであるSeMoBridge-Tは、トレーニング時間のごく一部しか必要とせず、全体として他のメソッドよりも優れています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:12:15 GMT)
Binary Diffusion Probabilistic Model [6.3]
本稿では,バイナリ形式のデータ表現に特化して設計された生成フレームワークを提案する。バイナリ拡散確率モデルでは、画像を多ビット平面と学習可能なバイナリ埋め込みを用いてバイナリ表現にエンコードする。これらのバイナリ表現は、きめ細かいノイズ制御、収束の加速、推論コストの削減を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:58:31 GMT)
TVR: Automotive System Requirement Traceability Validation and Recovery Through Retrieval-Augmented Generation [6.3]
本稿では,主に自動車システムを対象とした要求トレーサビリティ検証とリカバリ手法であるTVRを紹介する。 TVRは、既存のトレーサビリティリンクを検証し、行方不明のリンクを高精度に復元するように設計されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:52:02 GMT)
Unspoken Hints: Accuracy Without Acknowledgement in LLM Reasoning [6.3]
制御されたヒント操作下でのチェーン・オブ・シント(CoT)忠実度について系統的研究を行った。正確なヒントは、特に厳しいベンチマークや論理的推論において、精度を大幅に向上します。ヒントの認識は非常に不均一で、方程式に基づくヒントは頻繁に参照されるが、生のヒントは静かに採用されることが多い。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:16:51 GMT)
Interpretable Kernel Representation Learning at Scale: A Unified Framework Utilizing Nyström Approximation [6.2]
我々は、Nystrによるカーネルベースの表現学習のための統一フレームワークであるKREPESを紹介する。 KREPESは、広範囲の非監督的かつ自己監督的な損失に対応している。これは学習した表現の原則的解釈可能性を可能にし、深層モデルよりもすぐれた利益をもたらす。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:56:53 GMT)
PrimeX: A Dataset of Worldview, Opinion, and Explanation [6.2]
PrimeXは、米国の858人の住民による世論調査のデータセットである。言語モデルをパーソナライズするための信念的説明の価値と世界観を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:50:18 GMT)
Learning an Ensemble Token from Task-driven Priors in Facial Analysis [6.1]
本稿では,アンサンブルトークンを学習するための新しい手法であるET-Fuserを紹介する。本稿では,自己認識機構内でアンサンブルトークンを生成する,頑健な事前統一学習手法を提案する。以上の結果から,特徴表現に統計的に有意な改善が見られた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:21:00 GMT)
Directed-MAML: Meta Reinforcement Learning Algorithm with Task-directed Approximation [6.1]
タスク指向メタRLアルゴリズムであるDirected-MAMLを提案する。計算効率と収束速度において,Directed-MAMLがMAMLベースのベースラインを超えることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:42:15 GMT)
Stabilization of nonlinear systems with unknown delays via delay-adaptive neural operator approximate predictors [6.1]
この研究は、非線形システムの遅延適応制御における近似予測器の最初の厳密な安定性を保証する。ニューラルネットワークに基づく近似器のフレキシブルなクラスであるニューラル演算子は、任意に小さな近似誤差を達成できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:00:58 GMT)
Inducing Dyslexia in Vision Language Models [6.1]
我々は、ディプレクシアをシミュレートするために、大規模な視覚言語モデルを使用する。 VLM内の視覚単語選択単位を同定し、これらの単位の目標アブレーションが読解タスクの選択的障害につながることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:36:07 GMT)
Multi-Robot Task Planning for Multi-Object Retrieval Tasks with Distributed On-Site Knowledge via Large Language Models [6.1]
「リンゴとバナナを合わせる」や「遠足の準備をする」といった指示を効率的に実行することが不可欠である。本研究では,各ロボットが異なる状況下での知識を持つ場合,どのロボットをタスクのどの部分に割り当てるべきかを決定するという課題に対処する。本稿では,大規模言語モデル(LLM)と空間概念を利用して,自然言語命令をサブタスクに分解するタスク計画フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:31:07 GMT)
NeuroTTT: Bridging Pretraining-Downstream Task Misalignment in EEG Foundation Models via Test-Time Training [6.0]
本稿では,脳波基礎モデルのための2段階アライメント戦略を提案する。まず,ドメイン固有の自己教師型微調整パラダイムであるNeuroTTTを提案する。第2に、未ラベルのテストサンプルの自己教師型テストタイムトレーニングを行う。我々のアプローチは、大規模なEEG基盤モデルにおけるテストタイムトレーニングとドメインチューニングされたセルフスーパービジョンを統合する最初の方法です。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:14:46 GMT)
Better Privilege Separation for Agents by Restricting Data Types [6.0]
大規模言語モデル(LLM)のタイプ指向特権分離を提案する。我々は、信頼できないコンテンツをキュレートされたデータ型に変換することによって、LDMがサードパーティのデータと対話する能力を制限する。生文字列とは異なり、各データ型はスコープとコンテントに制限されており、プロンプトインジェクションの可能性を排除している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:20:50 GMT)
VioPTT: Violin Technique-Aware Transcription from Synthetic Data Augmentation [6.0]
VioPTT (Violin Playing Technique-aware Transcription) は、ヴァイオリンの演奏技法を直接書き起こし、ピッチのオンセットとオフセットを行う軽量なエンド・ツー・エンドのモデルである。我々は、手動でラベル付けされたアノテーションの必要性を回避するために、新しい高品質な合成ヴァイオリン演奏技術データセットMOSA-VPTをリリースした。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:44:42 GMT)
Image-Conditioned 3D Gaussian Splat Quantization [6.0]
画像合成ガウススプラット量子化器(ICGS-Quantizer) ICGS-Quantizerは圧縮効率を大幅に向上し、アーカイブ後のシーン変更への適応性を提供する。私たちのコード、モデル、データはGitHubで公開されます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:12:48 GMT)
Winning Rates of $(n,k)$ Quantum Coset Monogamy Games [6.0]
我々は$(n,k)$ Coset Monogamy Game を定式化し、2人のプレイヤーが不等サイズの補的情報を抽出しなければならない。相補的な情報は、部分空間状態上の無作為なPauli-XとPauli-Zエラーの形を取る。情報理論的勝利率の凸上界を$(n,k)$ Coset Monogamy Game で証明する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:41:49 GMT)
pEBR: A Probabilistic Approach to Embedding Based Retrieval [5.9]
本稿では,埋め込みに基づく検索(textbfpEBR)のための新しいフレームワークを提案する。実験およびアブレーション実験により、pEBRは計算効率を維持しながら精度とリコールを同時に改善することが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:01:27 GMT)
Rearchitecting Datacenter Lifecycle for AI: A TCO-Driven Framework [5.9]
電力、冷却、ネットワークのプロビジョニングにおける設計選択が、長期TCOにどのように影響するかを示す。また、ハードウェアのトレンドに沿ったリフレッシュ戦略についても検討しています。我々のシステムは従来のアプローチよりも最大40%TCOを削減します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:08:51 GMT)
Exact Bias of Linear TRNG Correctors - Spectral Approach [5.9]
本稿では,真の乱数生成器における線形抽出器の正確なセキュリティ境界を確立する。 20,000のコードをスキャンすることで、圧縮効率と暗号セキュリティの基本的なトレードオフを明らかにします。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:27:43 GMT)
SecureBERT 2.0: Advanced Language Model for Cybersecurity Intelligence [5.8]
サイバーセキュリティアプリケーション向けに開発されたエンコーダのみの言語モデルであるSecureBERT 2.0を提案する。改良された長文モデリングと階層符号化を導入し、拡張および異種文書の効率的な処理を可能にした。 SecureBERT 2.0は、複数のサイバーセキュリティベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:12:37 GMT)
An Annotation Scheme for Factuality and its Application to Parliamentary Proceedings [5.8]
本稿では, 様々な先行研究の概念を組み合わさった, 複雑かつ多面的現実性のアノテーションスキームを提案する。また、この方式で手作業で注釈を付けた議会談話領域に、約5,000文の文を提示する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:36:11 GMT)
Approximation properties of neural ODEs [5.8]
連続関数空間における浅部ニューラルネットワークの普遍近似特性(UAP)を証明した。特に、ニューラルネットワークODEのフローマップのリプシッツ定数と重みのノルムを制約し、ネットワークの安定性を高める。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:03:00 GMT)
A Robotic Stirring Method with Trajectory Optimization and Adaptive Speed Control for Accurate Pest Counting in Water Traps [5.8]
我々は,ロボットアームをベースとした黄色い水トラップに害虫をカウントする自動かき混ぜシステムを開発した。本研究は, 異なる旋回軌跡が害虫計数に及ぼす影響について検討し, 害虫計数のための最適軌跡を選択した。そこで我々は,適応的な高速化を実現するために,信頼度駆動型クローズドループ制御システムを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:49:34 GMT)
Sharpness of Minima in Deep Matrix Factorization: Exact Expressions [5.7]
我々は,任意の最小値における二乗誤差損失のヘシアンに対する最初の正確な表現を示す。本研究では,勾配学習中の脱走現象について検討した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:50:28 GMT)
Dynamic Pricing in High-Speed Railways Using Multi-Agent Reinforcement Learning [5.7]
本稿では,競合演算子や協調演算子のコンテキストにおいて,効果的な動的価格戦略を設計する上での課題について述べる。非ゼロサムマルコフゲームに基づく強化学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:33:33 GMT)
Learning from the electronic structure of molecules across the periodic table [5.6]
機械学習型原子間ポテンシャル(MLIP)は、力とエネルギーを学ぶために大量の原子構造データを必要とする。我々は、原子レベル特性のトレーニングパイプラインに向けて、軌道相互作用データをHに組み込むためのレシピを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:50:41 GMT)
TSalV360: A Method and Dataset for Text-driven Saliency Detection in 360-Degrees Videos [5.5]
我々は360度ビデオにおけるテキスト駆動型唾液度検出の課題に対処する。 16,000個のERPフレームを含むTSV360データセットを導入する。次に,SOTAの視覚的アプローチを適用して,360度ビデオ・サリエンシ検出を行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:11:16 GMT)
An Experimental Study on Generating Plausible Textual Explanations for Video Summarization [5.5]
我々は,SOTAの大規模マルチモーダルモデルを統合することで,ビデオ要約のマルチグラニュラ説明のための既存のフレームワークを拡張した。我々は、AIの説明に最も望まれる特徴の1つ、得られた説明の妥当性に焦点を当てる。ビデオ要約のためのSOTA法と2つのデータセットを用いて実験を行い、より忠実な説明がより妥当なものであるかどうかを検証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:23:40 GMT)
RoboPilot: Generalizable Dynamic Robotic Manipulation with Dual-thinking Modes [5.5]
ロボット操作のための2つのクローズドループフレームワークであるRoboPilotを紹介する。 RoboPilotは、現実世界の動的環境における複雑なタスクに対する適応推論をサポートする。我々はRoboPilotがタスク成功率の25.9%で最先端のベースラインを上回っていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:25:47 GMT)
Understanding Formal Reasoning Failures in LLMs as Abstract Interpreters [5.5]
大規模言語モデル(LLM)からそのような推論を導き出すための2つの新しいプロンプト戦略を導入する。ソフトウェア検証に広く用いられているSV-COMPベンチマークスイートから,22のプログラムに対して,最先端のLCMを用いてこれらの戦略を評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:21:46 GMT)
On the Effectiveness of Methods and Metrics for Explainable AI in Remote Sensing Image Scene Classification [5.4]
シーン分類問題に対する説明可能な人工知能(xAI)手法の開発は、リモートセンシング(RS)において大きな注目を集めている。コンピュータビジョン(CV)で考慮された自然画像に対して、ほとんどのxAI法とRSの関連評価指標が最初に開発された。本稿では,RS画像シーン分類の文脈における説明手法とメトリクスの有効性について検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:59:22 GMT)
Continuous Wave Quantum Detection and Ranging with quantum heterodyne detection [5.4]
連続波検出・乱れ検出技術では, ヘテロダイン受信機を用いた周波数変調連続波(FMCW)を用いて, 未知ターゲットの同時かつ正確な距離と速度測定を行うのが一般的である。この技術の量子対する最近の研究にもかかわらず、背景雑音を伴う損失チャネルの測定精度を高めるFMCWの量子プロトコルはまだ確立されていない。本稿では、総和周波数発生と低伝送電力の絡み合った光源を利用するFMCW技術の量子照明プロトコルを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:33:06 GMT)
B-Privacy: Defining and Enforcing Privacy in Weighted Voting [5.4]
トークン保有率に比例して票を重み付けする投票システムは、既存の有権者プライバシの概念を覆すことを示す。我々は、現在投票システムにおいて重要な問題である収賄に基づく「B-privacy」という概念を導入する。本稿では,投票率を高く評価することで,B-privacyを高めるメカニズムを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:20:52 GMT)
$Agent^2$: An Agent-Generates-Agent Framework for Reinforcement Learning Automation [5.3]
強化学習(RL)エージェント開発は伝統的にかなりの専門知識と反復的な努力を必要とする。本稿では,完全自動RLエージェント設計のための LLM 駆動型エージェント生成エージェントフレームワークである Agent$2$ を紹介する。 Agent$2$は、自然言語のタスク記述と環境コードを人間の介入なしに実行可能なRLソリューションに変換する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:06:12 GMT)
Optimal Strategies for Winning Certain Coset-Guessing Quantum Games [5.3]
最近発表されたコセット推測ゲームでは、アリスがボブとチャーリーと対戦し、共同勝利を狙った。ボブとチャーリーの予想が同時に正しい確率は、m が増加するにつれて指数関数的にゼロとなることを示す。 CNOT と Hadamard ゲートのみを用いた符号化回路を考案した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:17:11 GMT)
MC-GNNAS-Dock: Multi-criteria GNN-based Algorithm Selection for Molecular Docking [5.3]
本研究は,MC-GNNAS-Dockの3つの改良点について述べる。第一に、多基準評価は、結合位置精度(RMSD)とPoseBustersの妥当性チェックを統合し、より厳密な評価を提供する。第2に、残留接続を含むアーキテクチャの洗練により、予測ロバスト性が強化される。第3に、ランク認識損失関数を組み込んでランク学習を高度化する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:08:41 GMT)
Ovi: Twin Backbone Cross-Modal Fusion for Audio-Video Generation [5.3]
Oviは、2つのモードを単一の生成プロセスとしてモデル化するオーディオビデオ生成の統一パラダイムである。何十万時間もの生のオーディオをゼロから学習し、現実的な音響効果を生み出すことを学ぶ。本モデルでは,自然音声による映像ストーリーテリングと,映像レベルの映像クリップを制作し,コンテキストマッチングの精度の高い音響効果を実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:03:50 GMT)
Deep Taxonomic Networks for Unsupervised Hierarchical Prototype Discovery [5.3]
既存の手法は、しばしば構造をクラスの数に結び付け、中間階層レベルで利用可能なリッチなプロトタイプ情報を未利用にする。我々はこれらのギャップを埋めるために設計された新しい潜伏変数アプローチであるDeep Taxonomic Networkを導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:52:17 GMT)
Are Classical Clone Detectors Good Enough For the AI Era? [5.2]
AI生成コードの採用の増加は、現代のソフトウェア開発を形変えた。 AI生成クローンは、大規模なトレーニングデータから学んだ体系的な構文パターンと意味的差異を示す。古典的なコードクローン検出ツールは、歴史的に主に人間による認証で検証されてきた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:19:17 GMT)
On Explaining Proxy Discrimination and Unfairness in Individual Decisions Made by AI Systems [5.2]
本稿では,個別のAI決定におけるプロキシ差別を説明するために,形式的帰納的説明を用いた新しいフレームワークを提案する。本手法は, 保護属性に対する不適切なプロキシとして機能する特徴を同定し, 隠れた構造バイアスを明らかにする。概念実証として,ドイツの信用データセットを例に,このフレームワークを紹介した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:58:59 GMT)
FeDa4Fair: Client-Level Federated Datasets for Fairness Evaluation [5.2]
Federated Learning (FL)は、クライアントのプライベートデータを共有せずに、複数のクライアント間で協調的なモデルトレーニングを可能にする。クライアントにまたがる多様で、しばしば矛盾するバイアスは、公正性をモデル化する上で大きな課題をもたらします。現在のフェアネス・エンハンシング FL ソリューションは、1つの、通常二進的、敏感な属性に対するバイアスを緩和する一方、現実世界の環境に存在する不均一なフェアネスのニーズを無視しているため、しばしば不足する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:14:42 GMT)
TVS Sidekick: Challenges and Practical Insights from Deploying Large Language Models in the Enterprise [5.2]
公の懸念とAIの倫理的かつ責任ある使用に関する新たな規制に応えて、AIガバナンスフレームワークの実装は、組織内のAIの統合と関連するリスクの軽減に役立つだろう。本稿では,TVSサプライチェーンソリューションにおける実世界のAIアプリケーションについて報告し,大規模言語モデルに基づくAIアシスタントの開発経験と,企業利用への展開における倫理的,規制的,社会技術的課題について報告する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:29:02 GMT)
MIAFEx: An Attention-based Feature Extraction Method for Medical Image Classification [5.2]
医療用イメージアテンションベース機能エクストラクタ (MIAFEx) を提案する。 Transformerエンコーダアーキテクチャ内の分類トークンを強化するために、学習可能な改良機構を採用している。 MIAFExの出力特性は従来の分類器とハイブリッド分類器を用いて古典的特徴抽出器と比較される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:51:55 GMT)
Growing Winning Subnetworks, Not Pruning Them: A Paradigm for Density Discovery in Sparse Neural Networks [5.1]
宝くじのチケット仮説は、密集ネットワークには、フルモデルの性能に合わせるために単独で訓練できるスパースワークが含まれていることを示唆している。本稿では,PWMPR(Path Weighttude Product-biased Random Growth)を紹介した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:00:47 GMT)
ZoDIAC: Zoneout Dropout Injection Attention Calculation [5.0]
ゾーンアップドロップアウト注入注意計算(ZoDIAC)と呼ばれる新しい洗練・強化された注意機構を導入する。実験の結果,ZoDIACは画像キャプションの指標で統計的に高いスコアを得ることができた。提案するZoDIACアテンションモジュールは,すべてのトランスモデルのアテンションコンポーネントのドロップイン代替として使用することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:40:17 GMT)
TASER: Translation Assessment via Systematic Evaluation and Reasoning [5.0]
本稿では,翻訳品質の自動評価にLarge Reasoning Models (LRMs) を用いる指標であるTASER(Translation Assessment via Systematic Evaluation and Reasoning)を紹介する。 Taser は LRM の明示的な推論能力を活用して,翻訳品質の系統的,段階的評価を行う。 Taserは、参照ベースと参照フリーの両方の設定において、最高のソフトなペアワイドの精度を実現し、既存のメトリクスよりも優れています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:27:48 GMT)
OntoAligner Meets Knowledge Graph Embedding Aligners [5.0]
この研究は、スケーラブルで構造を意識した表現を提供する知識グラフ埋め込み(KGE)モデルの未発見の可能性を再考する。我々は17種類のKGEモデルをサポートするOntoAlignerライブラリに統合されたモジュラーフレームワークを開発した。 5つのドメインにまたがる7つのベンチマークデータセットにまたがる標準メトリクスを使用して、我々のアプローチを評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:41:23 GMT)
Deep Graph Learning for Industrial Carbon Emission Analysis and Policy Impact [5.0]
産業用CO排出量を分析し予測するためのグラフベースの新しいディープラーニングフレームワークDGLを提案する。従来の回帰法やクラスタリング法とは異なり、我々の手法はグラフニューラルネットワーク(GNN)を用いて長距離パターンを学習する。提案手法は, ベースライン深部モデルと比較して誤差を15%以上低減し, 予測性能に優れる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:21:21 GMT)
Black-box Context-free Grammar Inference for Readable & Natural Grammars [5.0]
Arvada、TreeVada、Kedavraといった既存のツールは、大規模で複雑な言語でスケーラビリティ、可読性、正確性に苦慮している。本稿では,新しいLLM誘導文法推論フレームワークであるNatGIを紹介する。我々は,NatGIがF1スコアにおいて強いベースラインを一貫して上回っていることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:54:25 GMT)
IMProofBench: Benchmarking AI on Research-Level Mathematical Proof Generation [5.0]
IMProofBenchは、専門家数学者によって開発された39のピアレビューされた問題からなるプライベートベンチマークである。それぞれの問題は詳細な証明を必要とし、最終的な答えを持つサブプロブレムと組み合わせられる。以前のベンチマークとは異なり、評価設定は現実的な研究環境をシミュレートする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:50:37 GMT)
Estimating the Empowerment of Language Model Agents [5.0]
EELMAはマルチターンテキストインタラクションから効果的なエンパワーメントを近似するアルゴリズムである。我々はEELMAを言語ゲームとスケールアップしたWebブラウザのシナリオの両方で検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:24:22 GMT)
Photonic Simulation of Beyond-Quantum Nonlocal Correlations (e.g. Popescu-Rohrlich Box) with Non-Signaling Quantum Resources [5.0]
ベル非局所性(ベル非局所性)は、古典的リアリズムから量子理論の最も深い離脱を示す。本研究は,本質的な非署名的物理資源を用いて,量子後相関をシミュレートする方法を示す。また、シミュレーションスキームがマルチパーティイト系における量子非局所相関を超えてどのように拡張されるかを分析する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:55:22 GMT)
Detecting Hope Across Languages: Multiclass Classification for Positive Online Discourse [4.9]
我々は、英語、ウルドゥー語、スペイン語を含む複数の言語にわたる複数クラスホープ音声検出のための機械学習アプローチを提案する。我々は、トランスフォーマーベースのモデル、特にXLM-RoBERTaを利用して、希望のスピーチを3つの異なるクラス(一般化希望、現実的希望、非現実的希望)に分類する。提案手法は,PolyHope-M 2025共有タスクのPolyHopeデータセットを用いて評価し,全言語間での競合性能を実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:16:28 GMT)
Optimizing What Matters: AUC-Driven Learning for Robust Neural Retrieval [4.8]
ROC曲線(AUC)下の領域と数学的に等価なマン・ホイットニーU統計を最大化する新たなトレーニング目標を導入する。 MW損失はContrastive Lossよりも経験的に優れていることを示し、RAGのような高収率アプリケーションに対して、より良い校正とより差別的なレトリバーが得られることを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:14:01 GMT)
From Cheap Geometry to Expensive Physics: Elevating Neural Operators via Latent Shape Pretraining [4.8]
工業設計評価は、しばしば偏微分方程式(PDE)のシミュレーションに依存する演算子学習はPDEソリューション予測を加速するための有望なアプローチとして登場した。我々は、この豊富な物理に依存しない資源をうまく活用するための2段階のフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:01:31 GMT)
MarS-FM: Generative Modeling of Molecular Dynamics via Markov State Models [4.8]
我々は、マルコフ状態モデル(MSM)によって定義された離散状態の遷移をサンプル化する新しい生成モデル、MSMエミュレータを導入する。本評価は, タンパク質ドメインに, 展開イベントを含む化学的, 構造的多様性を有し, 一般化を評価するために, トレーニングセットとテストセットの厳密な配列の相違を強制する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:13:24 GMT)
Are neural scaling laws leading quantum chemistry astray? [4.8]
ニューラルネットワークのスケーリング法則は、機械学習コミュニティをドメイン全体にわたるより広い基礎モデルのトレーニングへと駆り立てている。我々は、量子化学計算からモデルキャパシティをスケーリングし、データをトレーニングすることで、この公約を量子化学で検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:31:35 GMT)
Representation-Based Data Quality Audits for Audio [4.8]
本稿では,表現からランクへのデータ監査フレームワークであるSelfCleanを画像からオーディオ領域に適応させる。単一の統一プロセス内で異なる問題に直面するランク付けされたレビューリストを作成する。その結果、このフレームワークは最先端のランク付け性能を達成し、しばしば問題固有のベースラインを上回ります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:08:03 GMT)
BALLAST: Bayesian Active Learning with Look-ahead Amendment for Sea-drifter Trajectories under Spatio-Temporal Vector Fields [4.8]
本稿では,時間依存の分野を推測するための観測者の配置を導くための公式な学習手法を提案する。我々は,合成海流モデルと高忠実海流モデルの両方において,逐次支援型オブザーバ戦略の顕著なメリットを観察した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:36:57 GMT)
Supporting Creative Ownership through Deep Learning-Based Music Variation [4.7]
本稿では,音楽AI設計における個人所有の重要性について考察する。作曲過程を創造的に制御する上で,ミュージシャンの実践がいかに有効かを検討する。発見は、音楽表現の人間性を維持するツールの設計の重要性を強調している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:18:36 GMT)
MathConstruct: Challenging LLM Reasoning with Constructive Proofs [4.7]
MathConstructは、様々な数学コンペから得られた121の課題に関する新しいベンチマークである。これは、特定の性質を持つ数学的対象の構築を必要とする、広く遭遇する問題タイプである構成的証明をターゲットにしている。これらの証明は、解の正確性を容易に検証できるため、大規模言語モデルの評価に特に適している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:18:43 GMT)
CreAgentive: An Agent Workflow Driven Multi-Category Creative Generation Engine [4.6]
CreAgentiveは、物語、ドラマ、その他のクリエイティブのカテゴリを書く際に、現代の大きな言語モデルの4つの重要な制限に対処する。 CreAgentiveは、ジャンルに依存しない知識グラフに基づく物語表現であるStory Prototypeを採用している。大規模な実験では、CreAgentiveは安定した品質と低コストで何千もの章を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:12:32 GMT)
Tree-Structured Parzen Estimator: Understanding Its Algorithm Components and Their Roles for Better Empirical Performance [4.6]
Tree-structured Parzen estimator (TPE)は、HyperoptやOptunaといった最近のパラメータチューニングフレームワークで広く使われているベイズ最適化手法である。その人気にもかかわらず、TPEにおける各制御パラメータの役割とアルゴリズムの直観は今のところ議論されていない。本稿では,各種ベンチマークデータセットを用いたアブレーション研究に基づいて,各制御パラメータの役割とパラメータチューニングへの影響を明らかにする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:18:43 GMT)
Multi-modal Liver Segmentation and Fibrosis Staging Using Real-world MRI Images [4.5]
肝線維化は肝障害の持続による過剰な細胞外マトリックスの蓄積を示す。近年の人工知能による肝セグメンテーションと線維化の進展は、非侵襲的な代替手段となる。 CARE 2025 Challengeは、現実のシナリオで肝線維症を定量化し分析する自動化手法を目的としている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:35:30 GMT)
Emergent evaluation hubs in a decentralizing large language model ecosystem [4.5]
大規模な言語モデルは増加しており、ベンチマークも一般的なヤードスティックとして機能している。これら2つのレイヤの集合パターンがどのように比較されるのかを問う。相補的ではあるが、対照的なダイナミクスを見つけます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:49:26 GMT)
Evaluation Sheet for Deep Research: A Use Case for Academic Survey Writing [4.5]
本稿では,Deep Researchツールの能力を評価するための評価シートについて紹介する。以上の結果から,評価基準を慎重に策定する必要性が示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:00:31 GMT)
Informed Asymmetric Actor-Critic: Leveraging Privileged Signals Beyond Full-State Access [4.4]
部分的に観察可能な環境で強化学習を行うには、ノイズや不完全な観察から不確実性の下でエージェントが行動する必要がある。既存のアプローチは通常、トレーニング中にフルステートアクセスを前提とします。そこで我々は,任意の特権信号に対する批評家の条件付けを可能にする,情報非対称的アクター批判という新しいアクター批判フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:32:20 GMT)
Fast training of accurate physics-informed neural networks without gradient descent [4.4]
時空分離の原理に基づく新しいPINNであるFrozen-PINNを提案する。 8つのPDEベンチマークにおいて、Frozen-PINNは最先端のPINNよりも優れたトレーニング効率と精度を達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:20:28 GMT)
Editable Noise Map Inversion: Encoding Target-image into Noise For High-Fidelity Image Manipulation [4.4]
効率的な画像編集の鍵となる戦略は、ソースイメージをターゲット画像に関連する編集可能なノイズマップに変換することである。編集可能なノイズマップ・インバージョン(ENM Inversion)を提案する。これはコンテンツ保存性と編集性の両方を確保するために最適なノイズマップを探索する新しいインバージョン手法である。また,ビデオ編集にも容易に適用でき,フレーム間の時間的一貫性とコンテンツ操作が可能となる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:44:53 GMT)
iVISPAR -- An Interactive Visual-Spatial Reasoning Benchmark for VLMs [4.3]
iVISPARは、視覚言語モデル(VLM)がエージェントとして働く空間的推論能力を評価するために設計されたインタラクティブなベンチマークである。このベンチマークは、ビジュアル3D、2D、テキストベースの入力モダリティをサポートし、VLMの計画と推論スキルの包括的な評価を可能にする。その結果、VLMは3次元やテキストベースの設定に比べて2次元のタスクでは優れていたが、複雑な空間構成に苦慮し、常に人間のパフォーマンスに欠けていたことが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:59:12 GMT)
EasyOcc: 3D Pseudo-Label Supervision for Fully Self-Supervised Semantic Occupancy Prediction Models [4.3]
自己監督モデルは最近、特に意味的占有率予測の領域において顕著な進歩を遂げている。これらのモデルは、基底構造ラベルの欠如を補うために洗練された損失計算戦略を利用する。基礎モデルである Grounded-SAM と Metric3Dv2 が生成する3次元擬似地下構造ラベルを提案し,時間情報を用いてラベルの密度化を行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:01:32 GMT)
SPATA: Systematic Pattern Analysis for Detailed and Transparent Data Cards [4.3]
本稿では,より詳細かつ透明なデータカードを提供するために,SPATA(Systematic Pattern Analysis)を提案する。 SPATAは各データインスタンスのプロジェクションを離散空間に計算し、データ漏洩のリスクを冒さずに分析し、比較することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:59:45 GMT)
SETR: A Two-Stage Semantic-Enhanced Framework for Zero-Shot Composed Image Retrieval [4.2]
Zero-shot Composed Image Retrieval (ZS-CIR)は、トリプルトアノテーションに頼ることなく、参照画像と相対テキストが与えられたターゲット画像を取得することを目的としている。既存のCLIPベースの手法では、(1)組合ベースの特徴融合は、意図した変更を希釈する無関係な背景の詳細を担いながら、すべての視覚的手がかりを無差別に集約し、(2)CLIP埋め込みからのグローバルなコサイン類似性は、きめ細かいセマンティックな関係を解く能力に欠ける。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:41:52 GMT)
Machine Learning Workflows in Climate Modeling: Design Patterns and Insights from Case Studies [4.2]
本稿では、気候モデルにおける機械学習の応用研究から、一連のケーススタディを分析する。技術的詳細をレビューするのではなく、ML可能な気候モデリングにおいて、さまざまなプロジェクト間でデザインパターンを合成することを目的としている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:26:18 GMT)
Controlled Generation for Private Synthetic Text [4.2]
プライバシ保護型合成テキスト生成のための新しい手法を提案する。提案手法では,制御可能な生成を誘導するエンティティ・アウェア・コントロール・コードを導入している。法的および臨床的データセットの実験により,本手法はプライバシー保護と実用性の間に強いバランスを保っていることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:38:36 GMT)
Aging Decline in Basketball Career Trend Prediction Based on Machine Learning and LSTM Model [4.2]
データセットは、NBAのベテラン選手のバスケットボールの試合データから収集された。この仕事の貢献は、NBAの様々なタイプのキャリアトレンドを評価する他の方法よりも優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:54:22 GMT)
The AI Productivity Index (APEX) [4.1]
我々は、フロンティアAIモデルが高い経済価値で知識労働を行うことができるかどうかを評価するベンチマークであるAI生産性指数(APEX)の最初のバージョンを紹介する。 APEX-v1.0は200のテストケースを含み、投資銀行、マネジメントコンサルティング、法律、プライマリ医療の4つの領域をカバーする。 GPT 5 (Thinking = High) は最高スコア (64.2%) を獲得し、Grok 4 (61.3%) と Gemini 2.5 Flash (Thinking = On) (60.4%) が続く。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:26:17 GMT)
Chain-in-Tree: Back to Sequential Reasoning in LLM Tree Search [4.1]
テスト時のスケーリングにより、言語モデルは推論時に追加の計算を割り当てることで、ロングホライズン推論タスクを改善することができる。 CiTは,各ステップで分岐するのではなく,検索中に分岐するタイミングを適応的に決定するフレームワークである。我々はCitをツリー思考(ToTBS)、ReST-MCTS、RAPの3つの代表的なLCMチェーンに統合し、GSM8KとMath500で評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:18:44 GMT)
CEAID: Benchmark of Multilingual Machine-Generated Text Detection Methods for Central European Languages [4.1]
中央ヨーロッパ言語に焦点をあてた検出手法の最初のベンチマークを提供する。列車と言語の組み合わせを比較して、最もパフォーマンスの良いものを特定します。中央ヨーロッパ諸語における監視された微調整検出器は、これらの言語で最も高性能である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:27:53 GMT)
Thunderdome: Timelock-Free Rationally-Secure Virtual Channels [4.1]
ペイメントチャネルネットワーク(PCN)は、デプロイされたブロックチェーンの限られたトランザクションスループットに対処する、有望なソリューションを提供する。このような攻撃に対処するために、最初のタイムロックフリーPCNであるThunderdomeを紹介する。 Thunderdomeの核心は、信頼できない監視員の委員会であるWardensを頼りにしており、誠実な党が資金を失うことがないようにしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:17:22 GMT)
Revealing the temporal dynamics of antibiotic anomalies in the infant gut microbiome with neural jump ODEs [4.1]
不規則なサンプル時間に対する異常検出フレームワークを提案する。条件平均と分散軌跡を経路依存的に推定し、異常スコアを計算する。乳児の腸内微生物叢の軌跡に適用すると、抗生物質による破壊の大きさと持続性を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:54:23 GMT)
FinCap: Topic-Aligned Captions for Short-Form Financial YouTube Videos [4.0]
金融ショートフォームビデオ(SV)における話題対応キャプションのためのマルチモーダル大言語モデル(MLLM)の評価を行った。 624の注釈付きYouTube SVを用いて、主推奨、感情分析、ビデオ目的、視覚分析、金融エンティティ認識の5つのトピックにまたがる7つのモダリティの組み合わせを評価した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:04:41 GMT)
Looking Beyond the Known: Towards a Data Discovery Guided Open-World Object Detection [4.0]
Open-World Object Detection (OWOD) は、人間の誘導によって未知の物体の連続的な発見と統合を可能にすることによって、従来の物体検出装置を充実させる。既存のOWODアプローチは、破滅的な忘れ込みとともに、既知のクラスと未知クラスのセマンティックな混同に悩まされ、未知のリコールが減少し、既知のクラスの精度が低下する。我々は,未知のオブジェクトの発見と適応を相互に(セットベースの)データ発見と表現学習タスクとして再構成する統合フレームワークである Combinatorial Open-World Detection (CROWD)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:48:08 GMT)
Assessing Algorithmic Bias in Language-Based Depression Detection: A Comparison of DNN and LLM Approaches [3.9]
本稿では,自動抑うつ検出のための言語モデルにおけるアルゴリズムバイアスについて検討する。ジェンダーと人種・民族性に関する社会・デミノグラフィの格差に焦点を当てている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:08:32 GMT)
Can AI agents understand spoken conversations about data visualizations in online meetings? [3.9]
本稿では、オンライン会議シナリオにおけるデータ可視化に関する音声会話に対するAIエージェントの理解を評価する。本稿では、AIエージェントによるデータに関する会話の理解を診断するための二重軸テストフレームワークを提案する。評価手法を用いて,オンライン会議におけるビジュアライゼーションの議論の理解において,テキストのみの入力モダリティが最高のパフォーマンス(96%)を達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:17:36 GMT)
Attention over Scene Graphs: Indoor Scene Representations Toward CSAI Classification [3.9]
生のピクセルの代わりに構造化グラフ表現を利用する新しいフレームワークを提案する。 Places8では、81.27%の精度を達成し、画像ベースの手法を超越した。本研究は,屋内シーン分類とCSAI分類のためのロバストなパラダイムとして,構造化シーン表現を確立した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:09:34 GMT)
Foam-Agent 2.0: An End-to-End Composable Multi-Agent Framework for Automating CFD Simulation in OpenFOAM [3.9]
我々は、単一の自然言語プロンプトからエンドツーエンドのOpenFOAMワークフロー全体を自動化するマルチエージェントフレームワークであるFoam-Agentを紹介した。このフレームワークは、MCP(Model Context Protocol)を使用して、コア機能を独立した呼び出し可能なツールとして公開する。 110のシミュレーションタスクのベンチマークで、Foam-AgentはClaude 3.5 Sonnetで88.2%の成功率を達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:00:57 GMT)
Effective Model Pruning [3.8]
EMP(Effective Model Pruning)は、プルーニングに関する基本的な問題に対処する、文脈に依存しないパラメータフリーなルールである。 EMPはパラメータのスコア付けやモデルのプーンの方法を規定していないが、代わりに任意のプルーニング基準に適用可能な、普遍的な適応しきい値を提供する。我々は,N_effの有効性を,様々な基準とモデルにまたがって拡張しきい値のベータ*N_effで定式化することで検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:01:22 GMT)
Towards Agentic OS: An LLM Agent Framework for Linux Schedulers [3.8]
我々は、完全に自律的な大規模言語モデル(LLM)エージェントが、人間の関与なしにLinuxスケジューラを安全かつ効率的に最適化できる、最初のフレームワークであるSchedCPを紹介した。評価の結果,SchedCPの性能改善は最大1.79倍,コスト削減は有意なエージェントアプローチに比べて13倍であることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:48:14 GMT)
VELA: An LLM-Hybrid-as-a-Judge Approach for Evaluating Long Image Captions [3.8]
VELAはLLM-Hybrid-as-a-Judgeフレームワーク内で開発された長文キャプションの自動評価指標である。 LongCap-Arenaは、ロングキャプションのメトリクスを評価するために特別に設計されたベンチマークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:52:34 GMT)
Beyond the Algorithm: A Field Guide to Deploying AI Agents in Clinical Practice [3.8]
本稿では,電子健康記録(EHR)データを用いた生成エージェントをデプロイするための実践者指向のフィールドマニュアルを提案する。本ガイドは、臨床ノートから免疫関連有害事象を検出する自動システム「IRAE-Agent」をデプロイした経験から得られたものである。データ統合、モデル検証、経済的な価値の確保、システムドリフトの管理、ガバナンスです。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:03:32 GMT)
Enabling Rapid Shared Human-AI Mental Model Alignment via the After-Action Review [3.8]
私たちのブラウザベースのMinecraftテストベッドは、連続的な空間、リアルタイム、部分的に観測可能な環境での協調エージェントの迅速なテストを可能にします。我々のメンタルモデルアライメントツールは、チームメンバーのファーストパーソン視点のビデオ表示を含めることで、ユーザ主導のミッション後分析を容易にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:08:35 GMT)
Arbitrary Instantaneous Bandwidth Microwave Receiver via Scalable Rydberg Vapor Cell Array with Stark Comb [3.7]
ライドバーグ原子は高い感度、広いキャリア帯域、トレーサビリティのためにマイクロ波(MW)測定に大きな可能性を持っている。本稿では,Stark comb を用いたスケーラブルな Rydberg 気相セルの線形アレイによる任意の瞬時帯域 MW 受信機の実現について報告する。我々の研究は、レーダ、通信、スペクトルモニタリングに応用するためのスケーラブルなMW受信機の設計と開発方法である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:58:12 GMT)
Nonstabilizerness without Magic: Classically Simulatable Quantum States That Are Indistinguishable by Classically Simulatable Quantum Circuits [3.7]
量子状態の識別は、量子演算の制限されたクラスを通して可能かつ不可能な操作を定義する上で中心的な役割を果たす。マジックの資源理論に並列構造が存在することを示す。本稿では,量子データの隠蔽,安定化状態の非閉鎖,非クリフォードゲートの無条件検証について考察する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:03:21 GMT)
AI Agents vs. Agentic AI: A Conceptual Taxonomy, Applications and Challenges [3.7]
このレビューは、AIエージェントとエージェントAIを批判的に区別し、構造化された概念分類、アプリケーションマッピング、そして、異なる設計哲学と能力を明らかにするための機会と課題の分析を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:21:32 GMT)
PhotonIDs: ML-Powered Photon Identification System for Dark Count Elimination [3.7]
本稿では,機械学習を利用した光子識別システムPhotonIDを紹介する。 PhotonIDsは、光子と暗カウントのリアルタイム識別のための最初のエンドツーエンドソリューションである。以上の結果から,光nIDは暗カウント除去において31.2倍の信号ノイズ比(SNR)を向上できることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:26:43 GMT)
TriMat: Context-aware Recommendation by Tri-Matrix Factorization [3.7]
CARS(Context-aware Recommender Systems)は、現実世界のアプリケーションではあまり進歩しない理論的なトピックである。本稿では,行列因数分解フレームワークに文脈情報を組み込むために三行列因数分解手法を用いる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:51:43 GMT)
Anchor-free Cross-view Object Geo-localization with Gaussian Position Encoding and Cross-view Association [3.6]
AFGeo と呼ばれるクロスビューオブジェクトのジオローカライゼーションのためのアンカーフリーな定式化を提案する。 AFGeoは、事前に定義されたアンカーを使わずにオブジェクトをローカライズする各ピクセルに対して、4つの方向のオフセットをグラウンドトルースボックスに直接予測する。我々のモデルは軽量かつ効率的であり、ベンチマークデータセット上で最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:30:45 GMT)
Alternating and Gaussian fermionic Isometric Tensor Network States [3.6]
等尺ネットワーク状態(isoTNS)を2次元で改善した。本研究は,IsoTNSを交互に介在させることにより,従来のIsoTNSよりもより効率的に絡み合うことを示す。本研究では,(相互作用)横フィールドイジングモデルの基底状態エネルギーに対する元のアイソTNSと比較して,交互アイソTNSの性能が向上していることを見出した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:41:29 GMT)
The Average Patient Fallacy [3.5]
医学における機械学習は、一般的に人口平均に最適化されている。この頻度に重み付けされたトレーニング特権は、一般的なプレゼンテーションを行い、稀だが臨床的に重要なケースを疎外する。これは、私たちが平均的な患者誤診と呼ぶ偏見である。混合モデルでは、稀な症例からの勾配は有病率によって抑制され、精密医療と直接衝突する。そこで我々は, 希少ケースパフォーマンスギャップ, 希少ケースエラー, 希少さの有病率定義, および倫理的優先事項を呈する臨床的に重み付けされた目標を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:24:12 GMT)
RAE: A Neural Network Dimensionality Reduction Method for Nearest Neighbors Preservation in Vector Search [3.5]
k-NNの次元低減のための正規化オートエンコーダ(RAE)。正規化は変換ベクトルのノルム歪み率に上限を確立する。 RAEは既存のDRアプローチよりも優れたk-NNリコールを実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:25:38 GMT)
A Survey on SAR ship classification using Deep Learning [3.5]
深層学習(DL)は,SAR(Synthetic Aperture Radar)船舶分類の強力なツールとして登場した。本調査は,本領域で使用されている多種多様なDL手法を包括的に分析する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:10:49 GMT)
RL-Guided Data Selection for Language Model Finetuning [3.5]
本稿では,多種多様な強化学習(RL)手法を用いて,最適データ選択ポリシーを学習するためのトラクタブルマルコフ決定プロセス(MDP)と訓練エージェントを提案する。 4つのデータセットにまたがって、アプローチが選択した5%$サブセットのトレーニングは、データセット全体の微調整を最大10.8$の精度ポイントで上回る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:42:19 GMT)
TDBench: A Benchmark for Top-Down Image Understanding with Reliability Analysis of Vision-Language Models [3.5]
トップダウン画像理解のためのベンチマークであるTDBenchを紹介する。また、同じシーンの4つの回転するビューに対して、モデルが一貫した回答を提供するかどうかを測るRotationalEval(RE)を提案する。探索されていない現実世界の課題を対象とする4つのケーススタディを実施している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:02:15 GMT)
PathoHR: Hierarchical Reasoning for Vision-Language Models in Pathology [3.5]
現在の視覚言語(VL)モデルは、構造化された病理報告の解釈に必要な複雑な推論を捉えるのに苦労することが多い。病理領域内での階層的意味理解と構成的推論におけるVLモデルの能力を評価するために設計された新しいベンチマークであるPathoHR-Benchを提案する。さらに、マルチモーダルコントラスト学習のための拡張および摂動サンプルを生成する、病理特異的なVLトレーニングスキームを導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:39:52 GMT)
Discovering Self-Regulated Learning Patterns in Chatbot-Powered Education Environment [3.4]
Gen-SRLは、学生のプロンプトを16のマイクロレベルアクションに分類するアノテーションスキーマである。実際の英語記述タスクから212名の学生-チャットボットインタラクションを注釈付けした。その結果、学生のSRL行動は不均衡であり、82%以上がタスク実行に焦点を合わせ、計画とリフレクションへの関与が制限されていることが明らかとなった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:38:09 GMT)
Landmark-Guided Knowledge for Vision-and-Language Navigation [3.4]
本稿ではLandmark-Guided Knowledge (LGK) と呼ばれる視覚・言語ナビゲーション手法を提案する。 LGKはナビゲーションを支援するための外部知識ベースを導入し、従来の手法では常識の欠如が原因で生じる誤報問題に対処している。実験の結果,LGK法はR2RとREVERIEのナビゲーションデータセットにおいて,既存の最先端手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:54:27 GMT)
Enabling AI Scientists to Recognize Innovation: A Domain-Agnostic Algorithm for Assessing Novelty [3.4]
相対近傍密度(Relative Neighbor density)は、研究思想における新規性評価のための領域に依存しないアルゴリズムである。 RNDは、コンピュータ科学と生物医学研究領域における最先端のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:15:48 GMT)
Mind the Gap: A Review of Arabic Post-Training Datasets and Their Limitations [3.4]
本稿では,Hugging Face Hub上でのアラビア語学習後のデータセットについて概説する。各データセットは、人気、実践的採用、信頼性とメンテナンス、ドキュメンテーションとアノテーションの品質、ライセンスの透明性、科学的貢献に基づいて厳格に評価されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:03:47 GMT)
Ultra-Reliable Risk-Aggregated Sum Rate Maximization via Model-Aided Deep Learning [3.4]
本稿では, チャネルフェージング不確実性/リスクに対する信頼度(ウルトラ)を増大させる関数として, CVaR(Conditional Value-at-Risk)を用いた複雑なWSR問題のリスク集約式を提案する。トレーニングされたαRGNNは、ユーザ毎の深度低下を完全に排除し、十分なエルゴード性能を維持しながら、統計的ユーザ率の変動性を実質的にかつ最適に低減することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:24:04 GMT)
LFTR: Learning-Free Token Reduction for Multimodal Large Language Models [3.4]
MLLM(Multimodal Large Language Models)用に設計されたLFTR(Learning-free token reduction)手法を提案する。視覚表現の冗長性に乗じて,MLLMの一般的な推論性能を維持しつつトークンを効果的に削減する。その結果、LFTRは最大16倍の視覚トークンの削減を実現し、メインストリームの視覚質問応答ベンチマークの性能を維持したり、向上させることができた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:14:30 GMT)
Low-loss polarization-maintaining router for single and entangled photons at a telecom wavelength [3.4]
テレコムLバンドにおいて、任意偏光単一光子の低損失、ノイズレス、偏光維持ルーティングを実証する。本手法は、偏光符号化された光量子ネットワークと、空間的および時間的多重化技術による多光子絡み合わせ合成への道を開く。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:34:36 GMT)
Probing phase transitions in non-Hermitian systems with quantum entanglement [3.3]
非エルミート異方性スピン-1/2XYモデルとXXZモデルの量子絡み合いと量子相転移について検討する。コンカレンス, 負性度, 相互情報, 量子コヒーレンスなど, 様々な絡み合い対策について検討した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:01:48 GMT)
TrackFormers Part 2: Enhanced Transformer-Based Models for High-Energy Physics Track Reconstruction [3.3]
高エネルギー物理実験は生成したデータ量で急速にエスカレートしている。本研究では,ハイト間相関を考慮した損失関数の導入,トランスフォーマーの注意機構の詳細な調査,および高次物体の再構成に関する研究により,我々の研究を拡張した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:38:48 GMT)
Beyond Overall Accuracy: Pose- and Occlusion-driven Fairness Analysis in Pedestrian Detection for Autonomous Driving [3.3]
歩行者の姿勢の変化が検出性能に与える影響を系統的に検討した。歩行者特有の5つの検出器を3つの汎用モデルとともに評価した。以上の結果から, 平行脚, まっすぐ肘, 横方向の視界を有する歩行者に対する偏見が示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:21:01 GMT)
Object Detection with Multimodal Large Vision-Language Models: An In-depth Review [3.3]
大規模視覚言語モデル(LVLM)における言語と視覚の融合は、ディープラーニングに基づく物体検出に革命をもたらした。この詳細なレビューでは、LVLMの最先端技術に関する構造化された調査が紹介されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:34:01 GMT)
A Scalable Framework for Safety Assurance of Self-Driving Vehicles based on Assurance 2.0 [3.3]
Assurance 2.0は、ますます複雑で適応的で自律的なシステムの保証問題に対処するために開発されたモダンなフレームワークである。厳密さ、透明性、適応性を高めるために、再利用可能な保証理論と明示的な対抗策(デファター)を導入している。限界は、信頼度測定、疑念の残る管理、自動化支援、そして、敗者および確認バイアスの実践的な処理に持続する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:13:03 GMT)
Exact Solutions to the Quantum Schrödinger Bridge Problem [3.2]
量子シュリンガーブリッジ問題(Quantum Schr"odinger Bridge Problem、QSBP)は、2つの任意の確率分布の間の過程の進化を記述する。結果として生じる進化方程式は、その過程における非局所性の概念を表すいわゆるボームポテンシャル(量子ポテンシャル)を含むことを示す。ガウス混合モデルに基づく修正アルゴリズムを提案し,その有効性を実験的に検証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:11:24 GMT)
Amplified response of cavity-coupled quantum-critical systems [3.2]
量子臨界点は、物質が絶対零点における異なる基底状態の間の連続的な変換を行うときに発生する。ここでは、量子臨界モードを量子化された空洞場に直接結合することは、超放射能の開始を劇的に促進するという考えを前進させる。以上の結果から,超ラジカル状態を実現する上で,特に有利な条件が明らかとなった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:55:55 GMT)
QGuard:Question-based Zero-shot Guard for Multi-modal LLM Safety [3.2]
有害なプロンプトをゼロショットでブロックする簡易かつ効果的な安全ガード手法であるQGuardを提案する。実験の結果,本モデルはテキストのみとマルチモーダル有害データセットの両方で競合的に動作することがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:47:51 GMT)
YOLO26: Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection [3.2]
本研究は, リアルタイムオブジェクト検出のためのアーキテクチャ拡張と性能ベンチマークについて, Ultralytics YOLO26の包括的解析を行った。 2025年9月にリリースされたYOLO26は、エッジおよび低消費電力デバイスに効率性、正確性、デプロイメントの準備ができているYOLOファミリーの最新のかつ最も先進的なメンバーである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:10:22 GMT)
Sandbagging in a Simple Survival Bandit Problem [3.2]
サンドバッグ」は安全評価の完全性を損なう恐れがある。シーケンシャルな意思決定タスクにおいて,戦略的偽装の簡単なモデルを構築した。我々は,サンドバッグとテストスコアのシーケンスから非能率を区別するための統計的テストを構築した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:33:46 GMT)
Neural Multivariate Regression: Qualitative Insights from the Unconstrained Feature Model [3.2]
Unconstrained Feature Model (UFM)は、ディープニューラルネットワーク(DNN)における最小トレーニング損失と関連するパフォーマンス測定のためのクローズドフォーム近似を可能にする数学的フレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:57:52 GMT)
ProfVLM: A Lightweight Video-Language Model for Multi-View Proficiency Estimation [3.1]
本稿では,このタスクを生成的推論として再構成する,コンパクトな視覚言語モデルProfVLMを提案する。スキルレベルを共同で予測し、エゴセントリックなビデオやエクソセントリックなビデオから専門家のようなフィードバックを生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:00:41 GMT)
From Source to Target: Leveraging Transfer Learning for Predictive Process Monitoring in Organizations [3.1]
イベントログは、組織情報システムにマッピングされたビジネスプロセスの振る舞いを反映します。予測プロセス監視は、プロセス関連の予測を作成することによって、これらのデータを価値に変換する。既存のPPM技術は、簡単には利用できないかもしれない十分な量のイベントデータや他の関連するリソースを必要とします。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:35:45 GMT)
A Review on Riemannian Metric Learning: Closer to You than You Imagine [3.1]
レビューでは、重要なメソッド、アプリケーション、最近の進歩について、構造化され、アクセス可能な概要を提供している。微分幾何学を利用して、基礎となるリーマン多様体に従ってデータをモデル化する強力な一般化を記述する。このレビューは研究者や実践者にとって貴重な情報源になるべきだと論じています
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:59:50 GMT)
Understanding Collective Social Behavior in OSS Communities: A Co-editing Network Analysis of Activity Cascades [3.1]
開発者の時間的活動パターンを分析し、コミットコントリビューションの本質的にバースト的な性質を明らかにします。我々のフレームワークは、開発者が他の開発者のコードの編集を行うと、共同作業者の活動が加速する、社会的相互作用をモデル化する。私たちの仕事はOSSコミュニティの創発的な集団的社会的ダイナミクスに光を当て、共同ソフトウェアプロジェクトにおける開発者の混乱と維持を理解するための活動のカスケードの重要性を強調します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:28:35 GMT)
Lipschitz Bandits with Stochastic Delayed Feedback [3.1]
本稿では,遅延フィードバックの存在下でのリプシッツ・バンディットの新たな問題を紹介する。各設定でサブ線形後悔保証を実現するアルゴリズムを設計する。本稿では,様々な遅延シナリオ下でのアルゴリズムの効率性を示す実験結果を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:07:17 GMT)
Approximately Unimodal Likelihood Models for Ordinal Regression [3.0]
多くの実世界の順序データから、対象変数の条件付き確率分布(CPD)が不定値となる傾向が示されている。我々は, ほぼ一助確率モデルを提案し, 一助確率と一助確率に近い一助確率モデルを提案する。また,提案モデルが順序データとORタスクの統計的モデリングに有効であることを実験的に検証した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:03:17 GMT)
PerQ: Efficient Evaluation of Multilingual Text Personalization Quality [3.0]
個人化の品質など、テキストの特定の側面を評価するためのメトリクスは存在しないため、研究者はしばしばそのようなテキストをメタ評価するために、大きな言語モデルにのみ依存する。本稿では、与えられたテキスト(言語モデルによって生成される)のパーソナライズ品質を評価するための計算効率の良い手法、PerQを紹介した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:48:14 GMT)
Layer-wise dynamic rank for compressing large language models [2.9]
大規模言語モデル(LLM)は急速に規模を拡大し、深刻なメモリと計算上の問題を引き起こしている。 LLM圧縮のための動的ランク割り当てを階層的にバランスよく行うフレームワークであるD-Rankを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:29:50 GMT)
The DNA of nuclear models: How AI predicts nuclear masses [2.9]
本稿では,E_b$の最先端精度を実現するAIモデルを提案する。 E_b$のAI予測は階層的に分解・順序付け可能であり、最も重要な用語はよく知られた記号モデルに対応する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:29:46 GMT)
What Drives Paper Acceptance? A Process-Centric Analysis of Modern Peer Review [2.9]
ICLR 2017-2025の大規模な実証研究を行い、28,000件以上の提出書を提出した。以上の結果から,科学的新奇性以外の要因が受容結果を著しく形作っていることが示唆された。著者,レビュアー,メタレビュアーに対して,ピアレビューにおける透明性と公正性を高めるためのデータ駆動ガイドラインを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:00:10 GMT)
SLogic: Subgraph-Informed Logical Rule Learning for Knowledge Graph Completion [2.9]
本稿では、クエリ依存のスコアを論理ルールに割り当てるフレームワークであるSLogicを紹介する。 SLogicの中核は、クエリのヘッダーエンティティを中心としたサブグラフを利用するスコアリング機能である。ローカルなサブグラフコンテキストを活用することで、SLogicは一貫して最先端のベースラインを上回っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:59:22 GMT)
ASR Under Noise: Exploring Robustness for Sundanese and Javanese [2.8]
インドネシアの主要な2言語であるジャワ語とスンダ語に対するWhisperベース自動音声認識(ASR)モデルの堅牢性について検討する。合成雑音増強とSpecAugmentを含む複数のトレーニング戦略を実験し、信号-雑音比(SNR)の範囲で性能を評価する。以上の結果から,特に大きなWhisperモデルにおいて,ノイズ認識トレーニングはロバスト性を大幅に向上させることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:20:25 GMT)
Bayesian Influence Functions for Hessian-Free Data Attribution [2.8]
本研究では, 局所ベイズ影響関数 (BIF) を提案する。このHessian-freeアプローチは、パラメータ間の高次相互作用をキャプチャし、数十億のパラメータを持つニューラルネットワークに効率的にスケールする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:17:37 GMT)
AntiFLipper: A Secure and Efficient Defense Against Label-Flipping Attacks in Federated Learning [2.7]
フェデレートラーニング(FL)は、データを分散化してプライバシ保護モデルトレーニングを可能にする。悪意のあるクライアントがラベルを操作してグローバルモデルに悪影響を及ぼすような、ラベルフリップ攻撃には依然として脆弱だ。 FLにおけるマルチクラスラベルフリップ攻撃に対する,新規かつ計算効率のよい防御手法であるAntiFLipperを紹介した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:36:41 GMT)
Imagining Alternatives: Towards High-Resolution 3D Counterfactual Medical Image Generation via Language Guidance [2.7]
フリーフォーム言語プロンプトによって誘導される高精細な3次元医療画像を生成することのできるフレームワークを提案する。以上の結果から,3次元医用画像における急速進行解析の基礎となった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:25:22 GMT)
SQUARE: Semantic Query-Augmented Fusion and Efficient Batch Reranking for Training-free Zero-Shot Composed Image Retrieval [2.6]
Composed Image Retrieval (CIR) は、ユーザが指定したテキスト修正を取り入れつつ、参照画像の視覚的内容を保存するターゲット画像の検索を目的としている。 ZS-CIRを強化するために,MLLM(Multimodal Large Language Models)を利用した新しい2段階学習自由フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:41:24 GMT)
Optimizing Speech Language Models for Acoustic Consistency [2.6]
我々は、0.7B音声のみのモデル、1.0B音声のみのモデル、1.0Bテキストと音声の両方のインターリーブモデルという3つのモデルを訓練する。提案手法は,音声トークンを自己教師機能付きで初期化し,光アライメントロスを施し,薄型化と補助的目的を有する列車に適用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:59:52 GMT)
Directed Information $γ$-covering: An Information-Theoretic Framework for Context Engineering [2.5]
冗長性を考慮したコンテキストエンジニアリングのためのフレームワークであるDirected Information $gamma$-coveringを紹介した。オンラインコストは発生せず、オフラインで一度計算し、すべてのクエリで償却することができる。これらの結果は、現代のLLMパイプラインのための原則化された自己組織化バックボーンとしてDI $gamma$-coveringを確立する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:41:11 GMT)
Thinkquel: A Model Dedicated to Text-to-dbt Using Synthetic Data and a Span-Aware Objective [2.5]
Thinkquelは、堅牢でポータブルで実行検証可能なデータベースクエリを生成するための微調整モデルである。 TS-GRPOはトークンレベルのトレーニング信号とシーケンスレベルの実行報酬のギャップを埋めるように設計されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:04:53 GMT)
Vibe Coding in Practice: Motivations, Challenges, and a Future Outlook -- a Grey Literature Review [2.5]
バイブコーディング(Vibe coding)とは、AIコード生成ツールを直感や試行錯誤を通じて、基礎となるコードを必ずしも理解せずに使用するプラクティスである。ユーザーがなぜバイブコーディングに関わったのか、何を経験しているか、品質保証(QA)にどのようにアプローチし、AI生成コードの品質を知覚するかを体系的に調査した研究はない。私たちの分析では、スピードとアクセシビリティによってビブコーダがモチベーションを得て、迅速な即時的な成功とフローを経験する"という、スピード品質のトレードオフパラドックスを明らかにしています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:35:00 GMT)
Hy-Facial: Hybrid Feature Extraction by Dimensionality Reduction Methods for Enhanced Facial Expression Classification [2.4]
Hy-Facialは、ディープラーニングと従来の画像処理技術を統合したハイブリッド機能抽出フレームワークである。提案手法は,Visual Geometry Group 19-layer network (VGG19) から抽出した深い特徴と手作りの局所記述子を融合する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:53:29 GMT)
LMILAtt: A Deep Learning Model for Depression Detection from Social Media Users Enhanced by Multi-Instance Learning Based on Attention Mechanism [2.4]
うつ病は世界的な公衆衛生上の大きな課題であり、早期の身元確認は極めて重要である。本研究ではLMILAttモデルを提案し,Long Short-Term Memory Autoencoderとアテンション機構を統合した。実験により、精度、リコール、F1スコアの点で、モデルがベースラインモデルよりもはるかに優れていることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:58:32 GMT)
A Review of Software for Designing and Operating Quantum Networks [2.4]
量子ネットワークプロトコルの開発は、分散センシング、セキュアな通信、ユーティリティスケールの量子計算をサポートするプロダクショングレードネットワークの実現に不可欠である。本稿では、インフラストラクチャ、論理、制御/サービスプレーンの3面抽象化を中心に構成された量子ネットワークのソフトウェア実装の現状を概観する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:23:47 GMT)
Krony-PT: GPT2 compressed with Kronecker Products [2.4]
我々はKronecker製品に基づくGPT-2の圧縮技術であるKrony-PTを紹介する。具体的には、各トランスブロックのフィードフォワード重みを対象とし、フィードフォワード層行列を様々な程度に体系的に圧縮する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:42:07 GMT)
New Fourth-Order Grayscale Indicator-Based Telegraph Diffusion Model for Image Despeckling [2.4]
拡散特性と波動特性を統合する4階非線形PDEモデルを提案する。提案モデルの有効性を2次異方性拡散法に対して評価した。提案手法は,各チャネルに独立にデノナイズ処理を適用することにより,カラー画像の研究に拡張される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:41:25 GMT)
TensorRL-QAS: Reinforcement learning with tensor networks for improved quantum architecture search [2.3]
変分量子アルゴリズムは、ノイズの多い中間スケール量子ハードウェア上で既に有意義な量子問題に対処する約束を持っている。量子アーキテクチャサーチ(QAS)は、量子回路の設計プロセスを自動化する。有望なアプローチとして出現する強化学習(RL)。 $textitTensorRL-QAS$は、ネットワークメソッドとRLを組み合わせた改善されたフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:11:41 GMT)
Indirect Attention: Turning Context Misalignment into a Feature [2.3]
この研究は、キーと値が異なるシーケンスやモダリティに由来する、より伝統的なシナリオを探求する。まず,雑音特性下でのアテンション機構の挙動を解析し,臨界雑音閾値を確立する。次に, 文脈(キー, 値) の誤定を, 値特徴の有効形としてモデル化し, その誤定によって生じる雑音が, この臨界しきい値を大幅に超えることを示す。そこで本研究では、コンテキストが不一致なシナリオにおいて、間接的に関連性を推測する改良型アテンション機構であるインダイレクトアテンションを導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:44:00 GMT)
CardioForest: An Explainable Ensemble Learning Model for Automatic Wide QRS Complex Tachycardia Diagnosis from ECG [2.2]
本研究は,心電図信号からワイドQRS複合頻拍(WCT)を自動的に検出するための,アンサンブル機械学習に基づくフレームワークの開発と評価を目的とする。提案システムは、CardioForestとして知られる最適化されたランダムフォレストのアンサンブル学習技術と、XGBoostやLightGBMのようなモデルを統合する。 CardioForestモデルは全ての測定基準で最善を尽くし、94.95%の試験精度、88.31%のバランスの取れた精度、高精度とリコールのメトリクスを達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:23:57 GMT)
GroundSight: Augmenting Vision-Language Models with Grounding Information and De-hallucination [2.2]
検索型拡張生成(RAG)を用いた視覚質問応答(VQA)の改善手法を提案する。画像全体に基づいて情報を取得するのではなく、我々のアプローチは問題に最も関連するオブジェクトのまわりにバウンディングボックスを生成する。これにより背景雑音が低減され、視覚的およびテキスト的手がかりの整合性が向上し、幻覚の緩和に役立つ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:09:07 GMT)
Graph Coloring for Multi-Task Learning [2.1]
SON-GOKUスケジューラは干渉を計算し、干渉グラフを構築し、グリードグラフをタスクに適用する。グループ化とシーケンシャルアップデートはマルチタスク学習を改善し、降下、収束、タスクの衝突や整合性を正確に識別する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:47:51 GMT)
LiDAR-BIND-T: Improved and Temporally Consistent Sensor Modality Translation and Fusion for Robotic Applications [2.1]
本稿では,多元性センサ(レーダー,ソナー)をLiDAR定義潜在空間に結合するモジュール型マルチモーダル融合フレームワークLiDAR-BINDを拡張した。 i)連続的な潜伏表現を整列する時間的埋め込み類似性、(ii)予測と地上の真実のLiDARの変位に一致する動きに沿った変換損失、(iii)特別な時間的加群を用いた窓付き時間的融合、の3つの貢献を紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:10:11 GMT)
Private Learning of Littlestone Classes, Revisited [2.1]
偏微分プライバシーの制約を考慮したLittlestoneクラスのオンライン学習とPAC学習について考察する。我々の主な成果は、オンラインで学習するLittlestoneクラスに対して、$tildeO(d9.5cdot log(T))$の誤りを許容可能なケースで与える、プライベートな学習者です。これは最先端[GL'21]に対する2倍の指数的改善であり、このタスクの下位境界に近づきます。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:22:40 GMT)
SING-SQL: A Synthetic Data Generation Framework for In-Domain Text-to-SQL Translation [2.1]
SING-aは、高品質で高カバレッジな合成テキストデータを生成するための、完全に自動化された2段階のフレームワークである。 SING-LMは、合成データに基づいて微調整されたコンパクト言語モデルのファミリーである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:14:49 GMT)
Towards Ecologically Valid LLM Benchmarks: Understanding and Designing Domain-Centered Evaluations for Journalism Practitioners [2.0]
ベンチマークは、研究者や一般大衆が生成AIシステムをどのように理解するかにおいて重要な役割を果たす。モデル機能に関するコミュニケーションにベンチマークスコアが広く使用されていることから、妥当性に対する批判が生まれている。本研究では、人間中心のアプローチでこれらの問題に対処するLLMベンチマークの作成方法について検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:36:23 GMT)
LLM Agents for Interactive Exploration of Historical Cadastre Data: Framework and Application to Venice [2.0]
カダストラルデータは、都市の歴史的組織に関する重要な情報を明らかにするが、多種多様なフォーマットや人間のアノテーションのために、しばしば標準化されていない。我々は1740年から1808年までの臨界期におけるヴェネツィアの都市史を調査する。この時代の複雑なカダストラルデータは、その体積と均一な構造が欠如していることが特徴であり、我々のアプローチが順応的にナビゲートする固有の課題を示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:53:19 GMT)
Role of Matter Interactions in Superradiant Phenomena [2.0]
スーパーラディアント現象(英: Superradiant phenomenon)は、通常ディックモデルによって記述される、強い光-物質相互作用の指標である。本研究では,物質-物質相互作用がこの現象にどのように影響するかを基底状態シミュレーションにより検討する。異方性結合の下では、平面内スピン秩序が超放射と共存する強い相関位相が明らかとなる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:01:22 GMT)
KDC-Diff: A Latent-Aware Diffusion Model with Knowledge Retention for Memory-Efficient Image Generation [2.0]
KDC-Diffは、ハイパフォーマンスを維持しながら計算オーバーヘッドを大幅に削減するために設計された、新しくスケーラブルな生成フレームワークである。本モデルでは,FID,CLIP,KID,LPIPSの指標に対して,パラメータ数,推論時間,FLOPの大幅な削減を実現し,高い性能を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:24:30 GMT)
EnScale: Temporally-consistent multivariate generative downscaling via proper scoring rules [2.0]
本稿では,全GCM-to-RCMマップをエミュレートする生成機械学習フレームワークであるEnScaleを紹介する。最先端のMLダウンスケーリング手法と比較して、我々のセットアップは計算コストを約1桁削減する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:46:14 GMT)
Transformer Classification of Breast Lesions: The BreastDCEDL_AMBL Benchmark Dataset and 0.92 AUC Baseline [1.9]
本研究では,ダイナミックコントラスト強調MRIにおける乳腺病変の自動分類のためのトランスフォーマーベースフレームワークを提案する。患者レベルでは100%の感度と67%の特異性を有する病変レベル分類のAUCを0.92で達成したSegFormerアーキテクチャを実装した。データセット、モデル、評価プロトコルの公開リリースは、DCE-MRI病変分類のための最初の標準化されたベンチマークを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:58:02 GMT)
Toward an Unbiased Collective Memory for Efficient LLM-Based Agentic 6G Cross-Domain Management [1.9]
本稿では,6G RAN-Edgeネットワークにおけるアクティブなクロスドメインリソースオーケストレーションのための新しいフレームワークを提案する。このシステムは、繰り返し交渉を行う専門的なRAN(エネルギー効率)とエッジ(レイテンシ保証)エージェントから構成される。エージェントはデジタルツインと対話して提案をテストし、長期的な集合記憶を活用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:57:11 GMT)
Reinforced Strategy Optimization for Conversational Recommender Systems via Network-of-Experts [1.8]
本稿では,応答生成をマクロレベルの戦略計画と,ネットワーク・オブ・エキスパート内のマイクロレベルの適応に分解する階層的フレームワークを提案する。プランナーは戦略(例えば、推薦、説明、奨励)を選択し、アクターは、選好と事実的根拠に関する補助的な専門家によってガイドされた応答を生成する。実験により、RSOは最先端のベースラインより優れており、階層的戦略最適化の有効性が検証されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:12:01 GMT)
The Dragon Hatchling: The Missing Link between the Transformer and Models of the Brain [1.8]
我々はDragon Hatchling(BDH)を紹介した。これは、局所的に相互作用するニューロン粒子のスケールフリーな生物学的インスパイアされたネットワークに基づく、新しい大規模言語モデルアーキテクチャである。 BDHは、トランスフォーマーのような性能を犠牲にすることなく、強力な理論的基礎と固有の解釈性を結合する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:49:01 GMT)
Milestone Determination for Autonomous Railway Operation [1.8]
本稿では,鉄道自動化のための効率的なコンピュータビジョンシステムの開発に焦点をあてる。ルート固有でコンテキストに関連のあるキューにフォーカスすることで、実世界の運用ロジックとより緊密に整合した、リッチでシーケンシャルなデータセットを生成することができる。このアプローチは、制御された予測可能な環境においてエージェントを訓練するための実践的なフレームワークを提供し、鉄道自動化のためのより安全で効率的な機械学習システムを提供する、と我々は主張する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:38:19 GMT)
Interpret, prune and distill Donut : towards lightweight VLMs for VQA on document [1.7]
我々は,知識蒸留によるモデル圧縮について検討し,より大規模な教師からコンパクトな学生モデルを訓練する。このフレームワーク内での学生アーキテクチャ設計を促進するために,機械的解釈可能性を活用している。このアプローチによって、DocVQA上での強いパフォーマンスを維持しながら、推論時間とメモリ使用量を削減する、刈り取ったDonut-MINTが生成される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:31:03 GMT)
DeepProv: Behavioral Characterization and Repair of Neural Networks via Inference Provenance Graph Analysis [1.7]
DeepProvは、推論中にディープニューラルネットワーク(DNN)のランタイム動作をキャプチャして特徴付けるように設計されたシステムである。システム監査証明グラフにインスパイアされたDeepProvは、IPG(Inference Provenance Graphs)を通して、DNNの推論プロセスの計算情報フローをモデル化する。 DeepProvはこれらの洞察を使って、堅牢性、プライバシ、公正性など、特定の目的のためにDNNを体系的に修復する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:29:02 GMT)
A Hierarchical Agentic Framework for Autonomous Drone-Based Visual Inspection [1.7]
本稿では,自律型ドローン制御のための階層型エージェントフレームワークと,個別機能実行のための推論手法を提案する。本フレームワークは,産業用リードアウトの解釈や検査機器の検査など,屋内産業環境での視覚的検査作業に重点を置いている。自然言語処理をエージェント通信に活用することにより、従来のドローンベースのソリューションに代わる、斬新で柔軟な、ユーザアクセス可能な代替手段を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:31:30 GMT)
Taming the Tri-Space Tension: ARC-Guided Hallucination Modeling and Control for Text-to-Image Generation [1.7]
テキスト・ツー・イメージ(T2I)拡散モデルでは持続的な「幻覚」が示される本稿では,幻覚を潜在アライメント空間内の軌跡ドリフトとして再解釈する認知的な視点を提案する。このフレームワークは、T2Iシステムにおける生成障害を理解し緩和するための統一的で解釈可能なアプローチを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:14:20 GMT)
Data driven approaches in nanophotonics: A review of AI-enabled metadevices [1.7]
データ駆動型アプローチは、フォトニックメタデバイスの設計と最適化に革命をもたらした。このレビューは、新しいデザイン戦略を合成するモデル中心の視点を取ります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:03:46 GMT)
Security and Privacy Analysis of Tile's Location Tracking Protocol [1.6]
私たちは、クラウドソースで2番目に人気のある位置追跡サービスであるTileの総合的なセキュリティ分析を行いました。いくつかの悪用可能な脆弱性と設計上の欠陥を特定し、プラットフォームが主張するセキュリティとプライバシの保証の多くを無効にしています。我々は、Tileの独立した興味を持つユニークな特徴である説明責任メカニズムについて検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:25:59 GMT)
OWL: Geometry-Aware Spatial Reasoning for Audio Large Language Models [1.6]
音響特徴を3次元空間構造に整合させる幾何対応オーディオエンコーダであるtextbfSpatial-Acoustic Geometry (SAGE$)を紹介した。我々は、$textbfSAGE$と空間的に接地されたチェーン・オブ・シークレットを統合したALLMである$textbfOWL$を示し、その方向(DoA)と距離推定について合理化する。知覚的QAから多段階推論へのカリキュラム学習を通じて、$textbfOWL$は12時レベルの方位とDoA推定をサポートする
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:57:47 GMT)
CIMNAS: A Joint Framework for Compute-In-Memory-Aware Neural Architecture Search [1.5]
本研究は,CIMアーキテクチャのための共同モデル量子化ハードウェア最適化フレームワークであるCIMNASを紹介する。 CIMNASは同時に、ソフトウェアパラメータ、量子化ポリシー、幅広い範囲のハードウェアパラメータ、デバイス、回路、アーキテクチャレベルの共最適化を検索する。他の最先端の手法とは異なり、CIMNASはEDAPを精度損失なく達成し、高性能CIMベースのニューラルネットワーク設計のための多様なパラメータの組み合わせを生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:57:49 GMT)
LLaVAShield: Safeguarding Multimodal Multi-Turn Dialogues in Vision-Language Models [1.5]
悪意のある意図は、マルチモーダル・マルチトゥル(MMT)ダイアログにおいて、ターンとイメージに分散することができる。 MMT対話の安全性に関する最初の体系的定義と研究について述べる。我々は、MMDSのための安全でないマルチターン対話を生成するために、自動マルチモーダル・マルチターン・リピート・フレームワークを開発した。ユーザ入力とアシスタント応答のリスクを共同で検出し,評価する強力なツールであるLLaVAShieldを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:42:23 GMT)
Multi-View Camera System for Variant-Aware Autonomous Vehicle Inspection and Defect Detection [1.5]
textbf Automated Vehicle Inspection (AVI) プラットフォームを提案する。ディープラーニング検出器とセマンティックルールエンジンを結合して、Emphvariant-awareの品質管理をリアルタイムで提供する。我々の知る限り、これはデプロイ可能な自動車環境において、マルチカメラ機能検証と欠陥検出を統一する最初の公開システムである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:08:59 GMT)
SoK: Systematic analysis of adversarial threats against deep learning approaches for autonomous anomaly detection systems in SDN-IoT networks [1.5]
本研究では、構造化された敵対的脅威モデルと攻撃の包括的分類を導入し、それらをデータ、モデル、ハイブリッドレベルの脅威に分類する。以上の結果から、敵の攻撃によって検出精度が最大48.4%低下し、メンバーシップ推論が最大の低下を招いたことが判明した。本稿では、リアルタイムの敵緩和、強化されたリトレーニング機構、説明可能なAI駆動型セキュリティフレームワークなど、適応的な対策を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:54:42 GMT)
Machine-Learning Driven Load Shedding to Mitigate Instability Attacks in Power Grids [1.5]
本研究では、電力網における負荷層決定システムを、不安定な攻撃から防御する能力に適合させるために、教師付き機械学習モデルを訓練するための費用対効果のあるデータ駆動型アプローチを提案する。本稿では,Achilles Heel Technologies Power Grid Analyzer を用いたIEEE 14 Bus System の概念実証を行い,MPA が不安定な攻撃を検知し防御機構を起動するための有効な方法であることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:05:51 GMT)
Analyzing BEV Suitability and Charging Strategies Using Italian Driving Data [1.4]
バッテリ・エレクトリック・ビークル(BEV)は、民間輸送の確立した選択肢に代わるニッチな選択肢から急速に進化している。関心が高まりつつあるにもかかわらず、レンジ不安、公共充電ステーションにまつわる不便さ、コストの上昇など、大きな障壁が残っている。本研究では,イタリアにおけるICE車両を用いた10,441人の利用者から収集した広範囲なテレメトリデータを解析し,現在の走行行動を変えることなく,BEVへの乗り換えの可能性を評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:48:41 GMT)
Text-to-CT Generation via 3D Latent Diffusion Model with Contrastive Vision-Language Pretraining [1.4]
本稿では,3次元コントラッシブな視覚-言語事前学習方式と潜在拡散モデルを組み合わせたテキスト-CT生成のための新しいアーキテクチャを提案する。本手法は,テキストから臨床的に有意なCTボリュームを合成するための,スケーラブルで制御可能なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:18:41 GMT)
Spectral gap of Metropolis-within-Gibbs under log-concavity [1.4]
MwG(Metropolis-within-Gibbs)アルゴリズムは、高次元分布からサンプリングするためのマルコフ連鎖モンテカルロ法である。我々は,MwGをRandom Walk Metropolis (RWM) 更新を用いて検討し,目標の条件変動に合わせるように調整された提案分散を用いて検討した。その結果,MwGは分散適応型提案とかなり高速な混合が可能であり,その混合性能はギブスサンプリング器よりもわずかに劣ることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:31:22 GMT)
FoundBioNet: A Foundation-Based Model for IDH Genotyping of Glioma from Multi-Parametric MRI [1.4]
我々は,多パラメータMRIから非侵襲的にIDH変異を予測できるFoundBioNet(FoundBioNet)を提案する。 1705人のグリオーマ患者を6つの公開データセットから多施設で訓練し, 評価した。我々のモデルは、EGD、TCGA、Ivy GAP、RHUH、UPennの独立したテストセットに対して90.58%、88.08%、65.41%、および80.31%のAUCを達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:19:19 GMT)
Better with Less: Small Proprietary Models Surpass Large Language Models in Financial Transaction Understanding [1.4]
本稿では, 3種類のトランスフォーマーモデルの評価実験を行い, 事前学習型LLM, 微調整型LLM, およびスクラッチから開発した小型プロプライエタリモデルについて述べる。本研究は,ドメイン固有のニーズに基づいたモデル選択の重要性を強調した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:23:08 GMT)
o-MEGA: Optimized Methods for Explanation Generation and Analysis [1.4]
textbftexttto-megaは、最も効果的な説明可能なAIメソッドを自動的に識別するように設計されたツールである。自動ファクトチェックシステムにおける透明性の向上を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:08:36 GMT)
Indoor/Outdoor Spectrum Sharing Enabled by GNSS-based Classifiers [1.4]
我々はI/O分類にグローバルナビゲーション衛星システム(GNSS)信号を利用する。この結果から,無線(Wi-Fi)データよりもしきい値に基づく手法や機械学習のアプローチの方が精度が高いことが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:43:59 GMT)
Unitary synthesis with fewer T gates [1.4]
我々は,Tカウント$O(24n/3 n2/3)$のクリフォード+T回路を用いて任意の$n$-qubitユニタリ演算子を実装する単純なアルゴリズムを提案する。これは以前の最もよく知られた上限である$O(23n/2 n)$を改善するが、最もよく知られた下限は$Omega (2n)$のままである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:01:34 GMT)
ACE: Adapting sampling for Counterfactual Explanations [1.3]
Counterfactual Explanations (CFE)は、モデルの予測を望ましい出力に変換するために必要な入力機能への最小限の変更を特定することで、機械学習モデルを解釈する。既存の手法はしばしばサンプル非効率であり、ブラックボックスモデルの多くの評価を必要とする。本稿では,ベイズ推定と最適化を組み合わせたサンプル効率のアルゴリズムであるACE(Adaptive sample for Counterfactual Explanations)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:31:03 GMT)
ReLoop: "Seeing Twice and Thinking Backwards" via Closed-loop Training to Mitigate Hallucinations in Multimodal understanding [1.3]
MLLM(Multimodal Large Language Models)は、オープンな視覚的質問応答において顕著な進歩を遂げている。 MLLMは幻覚に弱いままであり、信頼性と事実の整合性にとって重要な課題である。クロスモーダル理解のためのマルチモーダル整合性を促進する統合クローズドループトレーニングフレームワークであるReLoopを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:21:02 GMT)
Domain-Aware Hyperdimensional Computing for Edge Smart Manufacturing [1.3]
スマートマニュファクチャリングには、厳格なレイテンシとエネルギー予算を満たすデバイス上のインテリジェンスが必要です。 Hyperdimensional Computing (HDC)は、高次元のハイパーベクターとしてデータをエンコードし、単純な操作で計算する軽量な代替手段を提供する。エンコーダのタイプ,投影分散,超ベクトル次元,データ構造が精度,推論レイテンシ,トレーニング時間,トレーニングエネルギーをどう形成するかをマップする。最先端のディープラーニングモデルとトランスフォーマーモデルの精度を一致または超過し、少なくとも6倍高速な推論と40倍以上のトレーニングエネルギーを提供するモデルを得る。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:52:14 GMT)
tCURLoRA: Tensor CUR Decomposition Based Low-Rank Parameter Adaptation and Its Application in Medical Image Segmentation [1.3]
伝達学習は、事前訓練されたモデルからの知識を活用することで、目標タスクの性能を大幅に向上させた。ディープニューラルネットワークのスケールアップに伴って、フル微調整によって、計算とストレージの大幅な課題がもたらされる。テンソルCUR分解に基づく新しい微調整法であるtCURLoRAを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:08:16 GMT)
How does the entanglement entropy of a many-body quantum system change after a single measurement? [1.3]
一次元の非相互作用複素フェルミオンに対して、エンタングルメントエントロピーの変化の確率分布を数値的に計算する。量子ジャンプと射影測定プロトコルについて、ガウス性からの明確な偏差を観測する。強いモニタリングのために、コアはガウスからゼロで強くピークに曲がり、量子ゼノ効果の優位性を示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:26:35 GMT)
The Loss Kernel: A Geometric Probe for Deep Learning Interpretability [1.3]
我々は、トレーニングされたニューラルネットワークに基づいて、データポイント間の類似度を測定するための解釈可能性であるロスカーネルを紹介する。これにより、ロスカーネルは解釈可能性とデータ属性の実用的なツールとして確立される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:10:28 GMT)
Unpicking Data at the Seams: Understanding Disentanglement in VAEs [1.2]
データ多様体上の密度が独立した一次元のシームに沿って分解するように、デコーダの局所軸がどのように「ロック」されるかを示す。このことは、非絡み合いを明確に定義し、なぜそれがVAEに現れるのかを説明し、前提条件の下では、基底真理因子が対称な先行条件でも識別可能であることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:35:37 GMT)
Neighbor-aware informal settlement mapping with graph convolutional networks [1.2]
本稿では,局所的な地理的コンテキストを分類プロセスに組み込んだグラフベースのフレームワークを提案する。リオデジャネイロのケーススタディでは,空間的クロスバリデーションを用いて実験を行った。本手法は,Kappa係数を個々の細胞分類よりも17ポイント向上する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:25:25 GMT)
Unsupervised Detection of Topological Phase Transitions with a Quantum Reservoir [1.2]
本稿では,多体局所化進化に基づく教師なし量子位相検出法を提案する。提案手法では, 複素測定も完全密度行列再構成も必要とせず, ノイズの多い中間規模量子デバイスに対して実用的かつ実現可能である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:58:48 GMT)
LoRA-PT: Low-Rank Adapting UNETR for Hippocampus Segmentation Using Principal Tensor Singular Values and Vectors [1.2]
ディープニューラルネットワークモデルのトレーニングには、かなりの計算リソース、時間、大量のラベル付きトレーニングデータが必要である。そこで本稿では,BraTS2021データセットから海馬セグメンテーションタスクに事前学習したUNETRモデルを転送する,パラメータ効率のよい新しい微細チューニング手法であるLoRA-PTを提案する。提案手法を3つの公衆海馬データセットで検証し, 実験結果から, LoRA-PT はセグメンテーション精度において最先端PEFT 法より優れていることが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:17:52 GMT)
Container Orchestration Patterns for Optimizing Resource Use [1.2]
サービスベースのアーキテクチャには大きなメリットがありますが、サービスオーケストレーションは依然として課題です。 sc Preemptive Scheduling, sc Service Balancing, sc Garbage Collectionの3つの主要なオーケストレーションリソース最適化パターンを定義します。これらのパターンは、オーケストレーションプラクティスを改善し、サービスベースのアーキテクチャをより広く採用する上で、基本的な要素となります。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:13:42 GMT)
A Multi-purpose Tracking Framework for Salmon Welfare Monitoring in Challenging Environments [1.2]
本研究では、ポーズ推定ネットワークを用いて、サーモンとその対応する身体部位を囲む境界ボックスを抽出するフレキシブルな追跡フレームワークを提案する。我々は2つのサーモン追跡課題を評価する2つの新しいデータセットを構築した。本手法は,現在最先端の歩行者トラッカーであるBoostTrackよりも,両サーモントラッカーの課題に優れる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:05:07 GMT)
In-Context Curiosity: Distilling Exploration for Decision-Pretrained Transformers on Bandit Tasks [1.2]
予測パワー変換器(英: Prediction-Powered Transformer, PPT)は、オフライン事前学習のための軽量な探索型正規化器である。 PPTはDPTを補助的な報酬予測器で強化し、予測誤差を本質的な好奇心信号として使用して、トレーニング中の広範な探索を促進する。予備的な結果は、好奇心駆動型プレトレーニングが、文脈内RLエージェントの分布外一般化を促進するための有望な方向を提供することを示唆している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:17:18 GMT)
Reevaluating Convolutional Neural Networks for Spectral Analysis: A Focus on Raman Spectroscopy [1.2]
我々は1次元畳み込みニューラルネットワーク(CNN)を評価し,4つの進歩を報告した。コンパクトCNNは、手作りの機能で$k$-nearest-neborsを上回っている。ラベル効率の学習: 半教師付き生成的敵ネットワークと対照的な事前学習により、最大で11%の精度が向上し、わずか10%のラベルしか取得できない。このワークフローには、生のスペクトルのトレーニング、プールのチューニング、ラベルの不足時に半スーパービジョンの追加、新しいターゲットに対する微調整が含まれる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:01:38 GMT)
FITS: Towards an AI-Driven Fashion Information Tool for Sustainability [1.1]
本研究は,ファッションブランドのサステナビリティデータの分類に自然言語処理(NLP)技術を適用する方法について検討する。本稿では,持続可能性情報の抽出と分類を行うトランスフォーマシステムであるFITS(Fashion Information Tool for Sustainability)のプロトタイプを提案する。 FITSはユーザが関連するデータを検索し、自身のデータを分析し、インタラクティブなインターフェースを通じて情報を探索することを可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:47:42 GMT)
Efficient Distributed Training via Dual Batch Sizes and Cyclic Progressive Learning [1.1]
バッチサイズが大きいと、一般化が不十分なため、精度が低下する可能性がある。本稿では,パラメータサーバフレームワーク上に構築された分散学習手法である,二重バッチサイズ学習方式を提案する。二重バッチサイズ学習による時間オーバーヘッドを軽減するため,循環進行学習方式を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:10:47 GMT)
SPAM Tolerance for Pauli Error Estimation [1.1]
本稿では,[FO21]で導入された人口回復の削減に基づくアルゴリズムを提案する。我々のアルゴリズムは、過酷な状態準備と測定(SPAM)エラーに対するロバスト性の重要な利点を持っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:53:30 GMT)
Galton's Law of Mediocrity: Why Large Language Models Regress to the Mean and Fail at Creativity in Advertising [1.1]
大規模言語モデル (LLM) は、しばしば安全で汎用的な言い回しをデフォルトとして、流動的なテキストを生成する。本稿では,この傾向をGalton-style regression to the mean in languageとして定式化し,広告コンセプトにおける創造性ストレステストを用いて評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:29:41 GMT)
Evaluating the impact of code smell refactoring on the energy consumption of Android applications [1.1]
コードのリファクタリングは、"重複コード"と"タイプチェック"の臭いで、エネルギー消費を最大10.8%削減する。しかし、エネルギー消費の顕著な減少は、実行時間の増大や減少と直接的に関係しているとは思えない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:04:40 GMT)
BOOST: Bayesian Optimization with Optimal Kernel and Acquisition Function Selection Technique [1.0]
カーネル獲得ペアの選択を自動化する新しいフレームワークであるBOOSTを提案する。 BOOSTは、様々なカーネル獲得ペアのパフォーマンスを予測し、高価な評価にコミットする前に最も有望なペアを特定する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:33:27 GMT)
Stochastic Layer-wise Learning: Scalable and Efficient Alternative to Backpropagation [1.0]
バックプロパゲーションは現代のディープラーニングを支えるものだが、グローバル同期への依存はスケーラビリティを制限し、高いメモリコストを発生させる。対照的に、完全に局所的な学習ルールはより効率的であるが、コヒーレントなグローバルラーニングに必要な層間調整を維持するのに苦労することが多い。本稿では,グローバルな目標を協調的なレイヤローカル更新に分解するレイヤワイズ学習アルゴリズムであるレイヤワイズ学習(SLL)を紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:10:03 GMT)
Towards Continual Expansion of Data Coverage: Automatic Text-guided Edge-case Synthesis [1.0]
テキスト誘導エッジケース合成のための自動パイプラインを提案する。提案手法では、画像キャプションの言い換えに、好みの学習によって微調整されたLarge Language Modelを用いる。この作業は、データキュレーションを手作業から自動化されたターゲット合成に移行する、スケーラブルなフレームワークを確立する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:11:25 GMT)
Improved Hyperspectral Anomaly Detection via Unsupervised Subspace Modeling in the Signed Cumulative Distribution Transform Domain [1.0]
本稿では,与えられたハイパースペクトル画像を構成する画素を記述するために,輸送モデルを用いた新しいHAD法を提案する。このアプローチでは、超スペクトル画素は、符号付き累積分布変換(SCDT)領域におけるそれらの表現を可能にする未知の変形を行うテンプレートパターンの観測と見なされる。次に、教師なしサブスペースモデリング手法を用いて、この領域で豊富な背景信号のモデルを構築し、そこで、異常信号が学習モデルからの逸脱として検出される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:20:36 GMT)
Dynamics of Majorana zero modes across hybrid Kitaev chain [1.0]
格子を2つのセグメントに分割するハイブリッドな北エフ連鎖を導入する。左のセグメントは最寄りのカップリングで構成され、右のセグメントは長距離ペアリングを含んでいる。時間発展状態の確率分布の時間プロファイルを用いて,MZM転送のインタフェース上でのシグネチャを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:55:02 GMT)
Sparse View Tomographic Reconstruction of Elongated Objects using Learned Primal-Dual Networks [1.0]
木材産業では、ログは、いくつかのソース位置から動くコンベヤベルト上の離散X線スキャンによって、一般的に品質が検査される。各スライスからのデータは3次元トモグラフィ再構成に十分な情報を持っていない。本稿では,学習されたPrimal-Dualニューラルネットワークに基づく反復的再構成手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:06:57 GMT)
Analysis of a Spatialized Brain-Body-Environment System [1.0]
多くのモデルは、しばしば脳を結合常微分方程式(PDE)のネットワークとして扱う。本研究では,脳と身体の両方に偏微分方程式(PDE)を用いた空間的前向きアプローチを提案する。本研究は,脳-体-環境相互作用の理解における空間ダイナミクスの重要性を強調した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:26:29 GMT)
Multi-View Projection for Unsupervised Domain Adaptation in 3D Semantic Segmentation [0.9]
教師なしドメイン適応(UDA)のための多視点プロジェクションフレームワークを提案する。我々の手法はLiDARスキャンをコヒーレントな3Dシーンに整列し、複数の仮想カメラのポーズからレンダリングして2Dデータセット(PC2D)を生成する。 2Dセグメンテーションモデルのアンサンブルは、これらのモダリティに基づいて訓練され、推論中は、1シーンあたり数百ビューが処理され、ロジットは3Dにバックプロジェクションされる。我々のフレームワークはレアクラスのセグメンテーションを可能にし、それらのクラスに対する2Dアノテーションのみを活用しながら、ソースドメイン内の他のクラスに対する3Dアノテーションに依存していることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:17:22 GMT)
Quantum Theory of Optical Spin Texture in Chiral Tellurium Lattice [0.9]
そこで我々は,Teの電子的構造に類似したスピン分解型深部顕微鏡光バンド構造を開発した。格子レベルでは、Teのキラリティが光波内の深部微視的な光スピンテクスチャとして現れることが明らかとなった。本フレームワークは光学活性の有限モメンタム源を明らかにするとともに, キラル結晶材料における光-物質相互作用の顕微鏡的基盤を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:38:51 GMT)
Institutional Policy Pathways for Supporting Research Software: Global Trends and Local Practices [0.9]
研究開発組織(RPOs)は、研究ソフトウェアに関わる人、スキル、インフラへの投資が持続可能で保守可能なソフトウェアを生み出すことを保証する必要がある。本稿では、Research Software Alliance(ReSA)とResearch Data Alliance(RDA)の共同イニシアチブであるPRO4RS(Research Organizations for Research Software)ワーキンググループの活動の概要を紹介する。研究ソフトウェアに関する制度政策の合理性を考慮すると、PRO4RSのWGのアウトプットと分析を利用して、重要な政策ギャップを浮き彫りにしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:45:39 GMT)
Towards autonomous photogrammetric forest inventory using a lightweight under-canopy robotic drone [0.9]
本稿では、最先端のオープンソース手法を活用し、森林内のデータ収集のパフォーマンスを検証するロボットアンダーキャノピードローンのプロトタイプを構築します。試作機は、選択した挑戦的な森林環境での飛行に成功し、立体写真撮影システムを用いた森林3Dモデリングにおいて有望な性能を示した。この結果は、自律型アンダーキャノピー森林マッピングに関する貴重な洞察を与え、複雑な森林環境をマッピングするための軽量なロボットドローンシステムを進化させるための重要な次のステップを強調している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:37:46 GMT)
Query-Optimal Estimation of Unitary Channels via Pauli Dimensionality [0.9]
パウリスペクトルが小部分群で支持されるユニタリチャネルのプロセストモグラフィーについて検討した。我々は,$O(2k/epsilon)$クエリを用いてこれを実現するアルゴリズムを提案する。また,近似クリフォード回路を用いた深度O(log n)$回路の構成を学習するための計算効率のよいアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:40:42 GMT)
Swift: An Autoregressive Consistency Model for Efficient Weather Forecasting [0.9]
我々は,確率フローモデルの自己回帰微調整を可能にする単一ステップ一貫性モデルであるSwiftを紹介する。結果から、Swiftは75日間にわたって安定し、最先端の拡散ベースラインよりも39時間以上高速に動作する、熟練した6時間の予測を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:54:24 GMT)
MARS: Audio Generation via Multi-Channel Autoregression on Spectrograms [0.8]
スペクトログラムをマルチチャネル画像として扱うフレームワークであるMARS(Multi-channel AutoRegression on Spectrograms)を紹介する。共有トークン化器はスケールをまたいだ一貫した離散表現を提供し、トランスフォーマーベースのオートレグレッシャが分光図を効率的に精査することを可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:38:02 GMT)
Dual effects of Lamb Shift in Quantum Thermodynamical Systems [0.8]
エネルギー準位を変化させるラムシフトが熱電流に様々な範囲に影響を及ぼすことを示した。その結果、ラムシフトは量子熱輸送において重要な役割を担い、量子熱力学におけるその影響の理解を深めた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:14:37 GMT)
MPCA-based Domain Adaptation for Transfer Learning in Ultrasonic Guided Waves [0.8]
マルチ線形主成分分析(MPCA)に基づく新しい伝達学習(TL)フレームワークを提案する。ソースドメインとターゲットドメインにMPCAを併用することにより、共有潜在特徴を抽出し、効果的なドメイン適応を可能にする。提案したMPCAを用いたTL法は, 異なる複合材料とセンサアレイを含む12種類のケーススタディに対して試験を行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:16:05 GMT)
Hierarchical Reasoning Model: A Critical Supplementary Material [0.7]
変換器は自然言語処理と関連する領域で顕著な性能を示した。新たな探索は階層的推論モデル(Hierarchical Reasoning Model)であり、変圧器の潜伏空間に新しいタイプの再帰的推論を導入する。これまでに報告したよりも、Sudoku-ExtremeタスクとMaze-Hardタスクにおいて、非常に優れたパフォーマンスを実現する興味深い変種を提示する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:40:04 GMT)
MEDAKA: Construction of Biomedical Knowledge Graphs Using Large Language Models [0.7]
知識グラフ(KG)は、構造化され解釈可能なフォーマットの生体情報を表現するために、ますます使われるようになっている。本稿では,(1)ウェブスクレイパーとLSMを用いて,構造化されていないオンラインコンテンツからKGを生成する,ハック可能なエンドツーエンドパイプライン,(2)この手法を利用可能なドラッグリーフレットに適用して作成したキュレートデータセット,MEDakaについて述べる。このデータセットは、副作用、警告、禁忌、成分、服用ガイドライン、保管指示、身体的特徴などの臨床的に関連する属性をキャプチャする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:47:04 GMT)
Efficient Layer-wise LLM Fine-tuning for Revision Intention Prediction [0.7]
大規模言語モデル(LLM)は、様々なテキスト生成タスクで驚くべき成功を収めている。しかし、単純だが本質的なテキスト分類の可能性はいまだ未解明のままである。本稿では, IR-Tuning という, プラグ・アンド・プレイ方式のパラメータ効率向上のためのファインチューニングフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:42:13 GMT)
Gaussian Mixture Model with unknown diagonal covariances via continuous sparse regularization [0.7]
我々は、コンポーネントの数とそのパラメータを同時に推定するために、Beurling-LASSOフレームワークを使用します。重要な理論的貢献は、混合成分上の明示的な分離条件の同定である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:30:19 GMT)
Quantum-Enhanced Multi-Parameter Sensing in a Single Mode [0.7]
標準量子限界以下で不確実性が同時に減少する位置と運動量の小さな変化の測定を実証する。実験では格子状態を用いて位置と運動量の小さな変化を計測し,同時に5.1(5)dBまで上昇した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:24:04 GMT)
A physical approach to qualia and the emergence of conscious observers in qualia space [0.7]
私は、クォーリアは直接観測可能であるので物理的である、と提案する。量子力学の計測問題を意識の難しい問題と同一視し、準同型モデルとして再解釈する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:22:19 GMT)
Logic Solver Guided Directed Fuzzing for Hardware Designs [0.6]
この研究は、革新的でスケーラブルなハードウェアファジィ機構であるTargetFuzzを導入している。 SATベースの技術を活用して、ハードウェア設計の特定の領域に集中し、ネイティブハードウェア抽象化レベルで運用する。対象サイトの処理において,30倍のスケールを効果的に実現し,100%のステートカバレッジと1.5倍の高速化を実現した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:50:50 GMT)
U-MAN: U-Net with Multi-scale Adaptive KAN Network for Medical Image Segmentation [0.6]
マルチスケール・アダプティブ・カン(U-MAN)は、新しいコルモゴロフ・アルノルドネットワーク(KAN)を強化する新しいアーキテクチャである。 PAGFモジュールは単純なスキップ接続を置き換え、エンコーダとデコーダのヒューズ機能に注意を払っています。 MANモジュールにより、ネットワークは複数のスケールで機能を適応的に処理し、さまざまなサイズのオブジェクトを分割する能力を向上させることができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:03:57 GMT)
Quantum reservoir computing using Jaynes-Cummings model [0.6]
我々は、Jaynes-Cummings (JC) Hamiltonianとその分散限界(DJC)によって記述されたハイブリッド量子ボソンシステムを用いた量子貯水池計算について検討する。これらのモデルは高次元ヒルベルト空間と固有非線形力学を提供し、時間情報処理のための強力な基板となる。線形メモリタスクと非線形メモリタスクで両貯水池をベンチマークし、非線形メモリ容量よりも異常に優れた非線形メモリ容量を示すことを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:46:20 GMT)
LLM-Generated Samples for Android Malware Detection [0.6]
BankBot、Locker/SLocker、Airpush/StopSMSの3つのマルウェアファミリーで構造化されたレコードを生成するために、GPT-4.1-miniを微調整する。実データのみを用いたトレーニング,実データ+合成データ,合成データのみを用いて,複数の分類器を3つの設定で評価する。以上の結果から, 実時間のみのトレーニングは, ほぼ完全な検出が可能であり, 合成データによる増強は, 微弱な劣化のみを伴って高い性能を保っていることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:46:57 GMT)
HNote: Extending YNote with Hexadecimal Encoding for Fine-Tuning LLMs in Music Modeling [0.6]
HNoteは、固定された32単位の測定フレームワーク内のピッチと持続時間をエンコードする、ヘキサデシマルベースの新しい表記システムである。我々は,YNoteの伝統的な民謡曲から生成された12,300曲をHNoteに変換し,パラメータ効率のLoRAを用いてLLaMA-3.1(8B)を微調整する。実験の結果,HNoteの構文的正しさ率は82.5%であり,BLEUとROUGEの評価は強い記号的・構造的類似性を示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:50:01 GMT)
Scaling Equilibrium Propagation to Deeper Neural Network Architectures [0.6]
活性化関数として$mathrmReLU$をクリップしたホップフィールドネットワークに残差(またはスキップ)接続を組み込んだホップフィールド・レスネットアーキテクチャを導入する。 Hopfield-Resnet13はCIFAR-10で93.92%の精度を実現している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:34:44 GMT)
Double-Bracket Algorithmic Cooling [0.5]
本稿では、純粋状態の量子コヒーレンスを体系的に抑制するプロトコルである二重ブラケットアルゴリズム冷却(DBAC)を導入する。我々の研究は、量子力学における基礎的なタスクのための新しいプロトコルに向けて、動的量子アルゴリズムが有望な経路であることを実証している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:46:28 GMT)
Efficient Contextual Preferential Bayesian Optimization with Historical Examples [0.5]
そこで本研究では,専門家の知識,過去の事例,サンプル要求の低減のためにユーティリティ空間に関する粗い情報を利用する,オフラインで解釈可能なユーティリティ学習手法を提案する。提案手法は, 4領域にわたる標準ガウス過程とBOPEより優れ, 実世界で発生する偏りのあるサンプルであっても高い性能を示し, 専門家の入力が限られている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:12:58 GMT)
CBAM Integrated Attention Driven Model For Betel Leaf Diseases Classification With Explainable AI [0.5]
本稿では,わずか213万パラメータ(8.13MB)の軽量CBAM-CNNモデルを提案する。葉病クラス間の微小変動を識別するモデルの能力は、統合的注意機構によって改善される。提案されたモデルは97%の精度、94%のリコール、95%のF1スコア、95.58%の精度を達成した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:30:09 GMT)
UncertainGen: Uncertainty-Aware Representations of DNA Sequences for Metagenomic Binning [0.5]
メタゲノミクス・ビニング(Metagenomic binning)は、混合微生物サンプルのDNA断片をそれぞれのゲノムにまとめることを目的としている。既存の方法は、k-merプロファイルや大きな言語モデルからの埋め込みのような決定論的表現に依存している。本研究では,DNA断片を潜在空間の確率分布として表現した最初の確率的埋め込み手法UncertainGenを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:36:09 GMT)
Enhancing PINN Performance Through Lie Symmetry Group [0.5]
本稿では、偏微分方程式(PDE)の精度と効率を高めるために、物理学情報ニューラルネットワーク(PINN)とリー対称性群の交点を示す。リー群(英: Lie group)は、リー対称性を持つPDEの正確な解をもたらすことができる効率的な方法である。リー対称性群からの新しい方法で無限小生成子の概念を活用すれば、PDEの解が大幅に改善される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:30:46 GMT)
AttriGen: Automated Multi-Attribute Annotation for Blood Cell Datasets [0.4]
本稿では,コンピュータビジョンにおける多属性自動アノテーションのための新しいフレームワークであるAttriGenを紹介する。セルタイプ分類のためのCNNとマルチ属性分類のためのビジョン変換器(ViT)を組み合わせたデュアルモデルアーキテクチャを提案する。実験により,AttriGenはモデル解釈可能性を大幅に向上し,時間とコスト効率が大幅に向上することが示された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:42:28 GMT)
M&SCheck: Towards a Checklist to Support Software Engineering Newcomers to the Modeling and Simulation Area [0.4]
デジタル双生児、スマートシティ、業界 4.0 と 5.0 は、ソフトウェア開発ライフサイクルにモデリングとシミュレーション(M&S)を含める必要性を明らかにしている。ソフトウェアエンジニアは自分自身に重要な疑問を呈することが多い。本論文の主な貢献は,M&Sにおける初心者の問題解決に最も適したパラダイムの選択を支援するための質問付き予備チェックリストの設置である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:34:34 GMT)
A Sparse $Z_2$ Chain Complex Without a Sparse Lift [0.4]
スパース$Z$連鎖複体(3つの異なる次数を持ち、量子コードに対応するように)を構築する。整数に対するスパースリフトを認めず、Ref. 1の質問に答える。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:29:29 GMT)
Painless Activation Steering: An Automated, Lightweight Approach for Post-Training Large Language Models [0.4]
アクティベーションステアリング(AS)は、既存の2つのポストトレーニング方法に代わる、安価で、高速で、制御可能な代替手段を約束する。完全に自動化された手法のファミリーであるPainless Activation Steering (PAS)を紹介する。 PASは行動タスクのパフォーマンスを確実に向上させるが、インテリジェンス指向のタスクには向いていない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:27:01 GMT)
HodgeFormer: Transformers for Learnable Operators on Triangular Meshes through Data-Driven Hodge Matrices [0.3]
形状解析のためのトランスフォーマーアーキテクチャは、現在コストのかかる固有値分解に基づく手法に依存している。本稿では,離散エクステリア計算におけるHodge Laplacian演算子の明示的な構成に着想を得た新しいアプローチを提案する。提案手法は,直接学習フレームワークを用いて,メッシュセグメンテーションと分類タスクにおいて同等のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:24:22 GMT)
AI-assisted Advanced Propellant Development for Electric Propulsion [0.3]
AI予測の電離エネルギーと最小外観エネルギーはそれぞれ6.87%と7.99%の相対誤差を持つ。電子イオン化による全質量スペクトルの場合、予測は0.6395のコサイン類似性を持ち、30 Daの範囲で78%の場合に最もよく似た質量スペクトルと一致している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:31:41 GMT)
Microwave-to-Optical Quantum Transduction of Photons for Quantum Interconnects [0.3]
マイクロ波-光量子変換は超伝導量子コンピューティングの分野において特に関心がある。本稿では,マイクロ波と光子間の量子トランスダクションに関する最近の理論的および実験的研究を概説する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:53:41 GMT)
When Hallucination Costs Millions: Benchmarking AI Agents in High-Stakes Adversarial Financial Markets [0.3]
AI評価において重要な盲点を明らかにするベンチマークであるCAIAを提示する。我々は178の時間短縮タスクに対して17のモデルを評価し,真理と操作の区別をエージェントに要求した。ツールがなければ、フロンティアモデルでさえ、ジュニアアナリストが日常的に扱うタスクにおいて28%の精度しか達成できません。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:39:06 GMT)
Autonomy-Aware Clustering: When Local Decisions Supersede Global Prescriptions [0.3]
我々は,その形態を事前に知ることなく,地域自治の影響を学習し,考慮する学習フレームワークである自律型クラスタリングを導入する。また,アダプティブ距離推定ネットワーク(ADEN, Adaptive Distance Estimation Network)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:44:36 GMT)
Extreme Self-Preference in Language Models [0.3]
4つの広く使われている大言語モデル(LLM)において、大規模な自己参照が発見された。ワードアソシエーションタスクでは、モデルが圧倒的に肯定的な属性を、競合する企業やCEOの名前と組み合わせている。私たちは、自己愛は、割り当てられた、真ではない、アイデンティティに一貫して従っていることに気付きました。この結果は、LLMの行動が自己選好の傾向によって体系的に影響されるかどうかという疑問を提起する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:13:56 GMT)
Sharing quantum nonlocality and teleportation over long distance using optical hybrid states [0.3]
その結果,光ハイブリッド状態は,大都市圏でClaus-Horne-Shimony-Holt(CHSH)ベルの不等式に反する偏光絡み状態を効率的に生成できることが示唆された。さらに、未知偏光量子ビットの量子テレポーテーションにおける情報処理タスクにおける共有絡み状態の品質を評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:49:30 GMT)
Combining Knowledge Graphs and NLP to Analyze Instant Messaging Data in Criminal Investigations [0.3]
犯罪捜査は、WhatsAppのようなインスタントメッセージングアプリを通じて交換されたメッセージの分析に関係していることが多い。本手法は,被疑者の携帯電話から収集したデータを意味的に豊かにすることで,知識グラフとNLPモデルを統合し,この分析を支援する。私たちは、ユーザがデータに対する洞察を得るのに役立つ2つの異なるソリューションを採用しています。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:32:26 GMT)
TrackCore-F: Deploying Transformer-Based Subatomic Particle Tracking on FPGAs [0.3]
我々はモノリシックなトランスフォーマー合成のためのツールを開発することを目指しており、特に推論をターゲットにしている。当社の主なユースケースは、TrackFormersプロジェクトから派生した、追跡のための2つの機械学習モデル設計です。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:44:43 GMT)
Linguistic and Embedding-Based Profiling of Texts generated by Humans and Large Language Models [0.3]
人書きテキストや機械生成テキストを特徴付けるために,依存長や感情といった言語的特徴を計算した。統計的分析により,人文テキストはより単純な構文構造とより多様な意味的内容を示す傾向があることが明らかとなった。人文テキストと機械文テキストの両方がドメイン間のスタイリスティックな多様性を示しており、人文テキストは我々の特徴のより大きなバリエーションを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:37:12 GMT)
Differentiable Autoencoding Neural Operator for Interpretable and Integrable Latent Space Modeling [0.2]
科学機械学習は、線形および非線形性低減技術を用いて、高次元フローデータから物理的洞察を抽出することを可能にする。これらの進歩にもかかわらず、潜在空間における解釈性は依然として課題である。本稿では, 物理的に解釈可能なラテント空間を構成するDIDIANiable Autoencoding Neural Operator (O)を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:57:52 GMT)
Automated Quality Assessment for LLM-Based Complex Qualitative Coding: A Confidence-Diversity Framework [0.2]
モデル信頼度とモデル間コンセンサス(外部エントロピー)を組み合わせた二重信号品質評価フレームワークを開発する。法的な理由づけ、政治的分析、医学的分類書にまたがって評価する。このフレームワークは、広範に二重符号化することなく定性的なコーディングをスケールする、原則化された、ドメインに依存しない品質保証メカニズムを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:37:24 GMT)
A Scalable AI Driven, IoT Integrated Cognitive Digital Twin for Multi-Modal Neuro-Oncological Prognostics and Tumor Kinetics Prediction using Enhanced Vision Transformer and XAI [0.2]
本稿では,ウェアラブル頭蓋骨からのリアルタイム脳波信号と構造MRIデータを組み合わせて,動的・パーソナライズされた腫瘍モニタリングを行う認知デジタルツインフレームワークを提案する。 94.6%の精度、93.2%のリコール、そしてDiceのスコア0.91の精度で、このフレームワークはリアルタイムで解釈可能な神経診断のための新しい標準となる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:37:32 GMT)
Scaling Homomorphic Applications in Deployment [0.2]
暗号化エコシステムの生産準備性を決定するために,概念実証準同型アプリケーションを開発した。この目的のために映画レコメンデーションアプリが実装され、コンテナ化とオーケストレーションを通じて生産される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:42:55 GMT)
Nonparametric inference under shape constraints: past, present and future [0.2]
形状制約下での非パラメトリック推論の分野を調査し、歴史的概要と現状の展望を提供する。展望といくつかのオープンな問題は、将来の方向性について考えを提示する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:16:00 GMT)
Fairness Testing in Retrieval-Augmented Generation: How Small Perturbations Reveal Bias in Small Language Models [0.2]
本研究は, 3つの小言語モデル(SLM)による感情分析における公平性を評価するために, 制御された人口変動を導入した変成試験(MT)による公平性テストを実施する。その結果, 微少な人口変動が変成関係(MRs)の3分の1に分解できることが示唆された。これらの失敗を詳細に分析すると、一貫したバイアス階層が示され、人種的手がかりを含む摂動が違反の主な原因となっている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:42:35 GMT)
MHINDR - a DSM5 based mental health diagnosis and recommendation framework using LLM [0.2]
メンタルヘルスフォーラムは、心理的問題、ストレス、潜在的な解決策に関する貴重な洞察を提供する。 DSM-5基準と統合された大規模言語モデル(LLM)ベースのフレームワークであるMHINDRを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:26:38 GMT)
RoBiologyDataChoiceQA: A Romanian Dataset for improving Biology understanding of Large Language Models [0.2]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて大きな可能性を証明している。本研究は,複数選択生物学の疑問に対するルーマニア語の新たなデータセットについて紹介する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:41:50 GMT)
Initial Distribution Sensitivity of Constrained Markov Decision Processes [0.1]
CMDPの最適値が初期分布によってどのように変化するかを分析する。このような境界は、初期分布の未知の変動により、与えられたポリシーの後悔を分析するためにどのように用いられるかを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:19:20 GMT)
The Lie Algebra of XY-mixer Topologies and Warm Starting QAOA for Constrained Optimization [0.1]
XYミキサーは、変分量子アルゴリズムを含む現代の量子コンピューティングで広く利用されている。我々は、様々な$XY$-mixer位相に付随する動的リー代数の明示的な分解を与える。我々はこれらの概念をPortfolio Optimization, Sparsest $k$-Subgraph, Graphing で示す数値シミュレーションを行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:01:07 GMT)
VRWKV-Editor: Reducing quadratic complexity in transformer-based video editing [0.1]
ビデオベース拡散モデルに線形時間アグリゲーションモジュールを統合する新しいビデオ編集モデルであるVRWKV-Editorを導入する。 VRWKV-Editorは、最先端の拡散ベースのビデオ編集方法と比較して最大3.7倍のスピードアップと60%のメモリ使用率を達成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:30:23 GMT)
Accelerating LLM Inference with Precomputed Query Storage [0.1]
StorInferはストレージ支援型大規模言語モデル(LLM)推論システムである。ユーザが事前に計算したクエリにセマンティックにマッチすると、StorInferは高価なGPU推論をバイパスし、保存されたレスポンスを即座に返す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:14:04 GMT)
Importance of localized dilatation and distensibility in identifying determinants of thoracic aortic aneurysm with neural operators [0.1]
胸部大動脈瘤(TAA)は,大動脈壁への機械的・機械的破壊から生じる。ここでは、有限要素フレームワークを用いて、数百の異種侮辱から合成TAAを生成する。局所的な拡張と拡張性の空間マップを構築し、ニューラルネットワークをトレーニングし、組み合わせた侮辱の開始を予測する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:34:59 GMT)
AutoLabs: Cognitive Multi-Agent Systems with Self-Correction for Autonomous Chemical Experimentation [0.1]
AutoLabsは、自然言語命令を自動で実行可能なプロトコルに変換するように設計された、自己修正型マルチエージェントアーキテクチャである。複雑化に関する5つのベンチマーク実験を特徴とする総合評価フレームワークを提案する。以上の結果から,エージェント推論能力が成功の最も重要な要因であることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:51:46 GMT)
On Deepfake Voice Detection -- It's All in the Presentation [0.1]
本稿では,現在のディープフェイクデータセットと研究手法が,現実のアプリケーションに一般化できなかったシステムにどのように寄与したかを明らかにする。本研究では,データ作成・研究手法の新しい枠組みを提案し,現実のシナリオにおいてより効果的なスプーフィング対策の開発を可能にする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:19:51 GMT)
No Quantum Advantage in Decoded Quantum Interferometry for MaxCut [0.1]
Decoded Quantum Interferometry (DQI)は、特別な種類の離散最適化問題を近似するためのフレームワークである。 DQI が非自明な保証を得た MaxCut のインスタンスは、古典的な時間で正確に解決可能であることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:00:05 GMT)
Influence of Platinum Thin Films on the Photophysical and Quantum Properties of Near-Surface NV Centers [0.1]
ダイヤモンド中の窒素空孔(NV)中心は光学的に対応可能なスピン欠陥であり、ナノスケール量子センシングに大きな可能性がある。本研究では, 異なるエネルギー (2.5-60 keV) の窒素で生成した浅いNVを含む白金被覆ダイヤモンド5試料について検討した。プラチナ層近傍のNVアンサンブルでは,発光寿命が大幅に減少し,NV$-$の個体数が顕著に減少した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:08:46 GMT)
Branching Out: Broadening AI Measurement and Evaluation with Measurement Trees [0.1]
測定木は階層的な有向グラフを生成し、各ノードはその子をユーザ定義のアグリゲーションメソッドで要約する。定義と例を示し、大規模な測定演習を通じて実用性を実証し、オープンソースのPythonコードを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:58:59 GMT)
Electrical Readout of Spin Environments in Diamond for Quantum Sensing [0.0]
ダイヤモンド中の窒素空孔中心は、量子センシングと量子情報の鍵となるプラットフォームである。ここでは、全電気的アプローチ、光電流二重電子共鳴(PC-DEER)を紹介する。代用窒素(P1)とNVH中心のシグネチャを電気信号を用いて再現可能なコントラストで解決する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:33:03 GMT)
Reward driven discovery of the optimal microstructure representations with invariant variational autoencoders [0.0]
変分オートエンコーダ(VAE)はそのような低次元表現を構築する強力な手段を提供する。 VAEは試行錯誤や経験分析によって最適化されることが多い。本研究では,潜在空間表現を評価するための報酬ベース戦略について検討した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:15:42 GMT)
gh0stEdit: Exploiting Layer-Based Access Vulnerability Within Docker Container Images [0.0]
gh0stEditは、攻撃者が悪意のあるDockerイメージを編集することを可能にする。この攻撃は、画像署名を無効にすることなく、署名された画像に対して実行することもできる。我々は、Dockerイメージのセキュリティと信頼性に対する現在のアプローチの問題点を強調し、検出されることなく、野生で悪用される可能性のある攻撃方法を公開する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:02:06 GMT)
YOLO-Based Defect Detection for Metal Sheets [0.0]
自動欠陥検出のためのYOLOに基づくディープラーニング(DL)モデルを提案する。実験では, 金属シートの画像がYOLOモデルのトレーニング用データセットとして使用される。 ConSinGAN を用いた YOLOv9 モデルは、91.3%の精度で他の YOLO モデルより優れており、検出時間は146msである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:56:44 GMT)
Why is topology hard to learn? [0.0]
我々は、物理量の概念と、その機械学習近似を、物理学におけるニューラルネットワークの本来の応用という文脈で橋渡しする。実空間位相不変量を正確に表現するハイブリッドテンソル-ニューラルネットワークオブジェクトを構築する。我々の研究は、トポロジカル不変量学習の課題を強調し、凝縮物質物理学におけるより正確でより一般化可能な機械学習表現への一歩となる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:48:25 GMT)
Which Programming Language and Model Work Best With LLM-as-a-Judge For Code Retrieval? [0.0]
より良いコード検索の利点は、新しい開発者のオンボードの高速化、ソフトウェアのメンテナンスの削減、大規模なリポジトリの理解の容易さである。検索アルゴリズムと検索ベンチマークの改善にもかかわらず、コード検索の領域は遅れを取っている。本研究では,Large Language Models (LLMs) を用いて,関数レベルでのコード検索と,コード検索結果のアノテーション生成を行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:31:36 GMT)
VietBinoculars: A Zero-Shot Approach for Detecting Vietnamese LLM-Generated Text [0.0]
本研究は、最適化された大域しきい値を持つ双眼鏡法の適応であるVietBinocularsを提案する。我々はベトナムのAI生成データセットを構築し、VietBinocularsの最適しきい値を決定する。その結果,VietBinocularsはF1スコアとAUCの2つの領域で99%以上を達成できた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:43:37 GMT)
Velocity effects slightly mitigating the quantumness degradation of an Unruh-DeWitt detector [0.0]
本研究では,加速量子系におけるウンルー効果による情報劣化に対する速度効果について検討する。研究された量子システムは、加速された単一量子ビット、量子干渉回路、およびどのパス区別可能性回路である。その結果, 加速検出器の非相対論的, 横運動, 一定運動の付加は, 高加速系における量子性の保護的役割を担っていることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:01:24 GMT)
Vector-Valued Reproducing Kernel Banach Spaces for Neural Networks and Operators [0.0]
ベクトル値付きRKBS (vv-RKBS) の一般定義を開発する。次に、浅い$Rd$値のニューラルネットワークが特定のvv-RKBSの要素であること、すなわち、積分と神経のvv-RKBSの例を示す。また、ニューラル演算子の関数構造を探索するため、DeepONetとHypernetworkアーキテクチャを分析し、それらも積分的でニューラルなvv-RKBSに属することを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:06:24 GMT)
Using Images from a Video Game to Improve the Detection of Truck Axles [0.0]
本稿では,コンピュータゲームから抽出した画像がCNNの訓練に有効であるかどうかを判断し,実生活におけるトラックの車軸を検出することを目的とする。実生活と合成トラックを備えた3つの異なるデータベースが作成され、トレーニングとテストの例が提供された。その結果、合成画像はニューラルネットワークのトレーニングに利用でき、知識を抽出するための信頼性と低コストなデータソースを提供することがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:28:14 GMT)
Using GPT to build a Project Management assistant for Jira environments [0.0]
我々は,プロジェクトマネージャが大量のデータを扱うプロセスを容易にするために,GPT大言語モデルを使用するソフトウェアであるJiraGPT Nextを紹介する。これは、最も人気のあるProject Managementツールの1つであるJiraのアドオンとして考えられ、情報を取得するための自然言語インターフェースを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:42:56 GMT)
Unsupervised Detection of Spatiotemporal Anomalies in PMU Data Using Transformer-Based BiGAN [0.0]
T-BiGANは、双方向生成逆数ネットワーク(BiGAN)内でウィンドウアテンション変換を行うフレームワークである。エンコーダデコーダはアーキテクチャをキャプチャし、識別器はサイクル整合性を適用して遅延空間を真のデータ分布と整合させる。異常は、再構成誤差、潜時空間ドリフト、判別器の信頼性を組み合わせた適応スコアを用いてリアルタイムでフラグ付けされる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:16:35 GMT)
Universal dissipators for driven open quantum systems and the correction to linear response [0.0]
還元系の力学を特徴付ける散逸器は2つの部分から構成されていることを示す。ひとつは普遍的であり、駆動項に関係なく同じ形式を保っていることを意味する。リンドブラッド形式は記憶のない風呂のために回収される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:23:22 GMT)
Unified exact WKB framework for resonance -- Zel'dovich/complex-scaling regularization and rigged Hilbert space [0.0]
我々は、正確なWKB法を用いて量子力学的共鳴を解析するための統一的なフレームワークを開発する。非摂動的定式化は、ツェルドヴィチ正則化、複素スケーリング法、およびリップされたヒルベルト空間を組み込むために働く。この結果は、不安定な量子系における正確な WKB 法の非摂動精度を具体的に示すものである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:41:29 GMT)
Tuning the Tuner: Introducing Hyperparameter Optimization for Auto-Tuning [0.0]
制限されたハイパーパラメータチューニングでも,平均94.8%のオートチューニング性能が向上することを示す。ハイパーパラメータ自体がメタストラテジーで効率的に最適化できることを実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:14:01 GMT)
Topology of the Aharonov-Bohm effect in different reference frames [0.0]
異なる慣性参照フレームにおけるAB効果の磁気的および電気的バージョンについて検討する。磁気束がAB位相差に負の寄与を持つ磁気AB効果の参照フレームを求める。また、電気的流束がAB位相差に無寄与する電気的AB効果の参照フレームも見いだす。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:07:37 GMT)
Think Less, Label Better: Multi-Stage Domain-Grounded Synthetic Data Generation for Fine-Tuning Large Language Models in Telecommunications [0.0]
本稿では、構造化ドメイン知識に基づく合成質問応答対を生成するための探索拡張パイプラインを提案する。我々のフレームワークは、検索器、ベースジェネレータ、精製モデルを統合して、QAペアを合成し、拡張する。我々は,無線アクセスネットワーク(RAN)のトラブルシューティングに着目した実世界の通信シナリオにおいて,我々のアプローチを実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:49:57 GMT)
Thin Bridges for Drug Text Alignment: Lightweight Contrastive Learning for Target Specific Drug Retrieval [0.0]
薄いコントラストブリッジと軽量プロジェクションヘッド凍結したユニモーダルエンコーダは完全なマルチモーダルモデルを訓練せずに化学とテキストの表現を調整できる以上の結果から,スキャフォールドを意識した薬物テキストアライメントと,精度の高い医療における特異的検索が可能な,大規模マルチモーダルプレトレーニングに代わる計算効率のよい橋であることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:14:28 GMT)
The Guided Local Hamiltonian Problem for Stoquastic Hamiltonians [0.0]
確率的ハミルトニアンに対するガイド付き局所ハミルトニアン問題は(プロミーズ) BPP-ハードであることを示す。局所ハミルトニアン族では、この問題は(確率的に)BQP-ハードであるが、確率ハミルトニアンにとっては、その複雑さは以前不明である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:11:26 GMT)
The Complexity of Local Stoquastic Hamiltonians on 2D Lattices [0.0]
2次元正方格子上の2-局所確率ハミルトン問題は、StoqMA完全であることを示す。我々の主な貢献は、StoqMA回路を空間的に疎結合にでき、幾何学的、確率的保存的、摂動的ガジェットを構築できることである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:38:29 GMT)
The ALF (Algorithms for Lattice Fermions) project release 2.4. Documentation for the auxiliary-field quantum Monte Carlo code [0.0]
格子フェルミオンのアルゴリズムは、有限温度および射影補助場量子モンテカルロアルゴリズムの一般的なコードを提供する。コードは、シングルボディ演算子の和で記述できるモデルをシミュレートできるように設計されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:27:21 GMT)
Teaching AI to Handle Exceptions: Supervised Fine-Tuning with Human-Aligned Judgment [0.0]
大規模言語モデル(LLM)はエージェントAIシステムへと進化している。推論に優れるLCMでさえ、政策に厳格に従うため、人間の判断から大きく逸脱していることを示す。次に、例外を処理するためにAIエージェントをチューニングするための3つのアプローチを評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:23:12 GMT)
Symmetric quantum walks on Hamming graphs and their limit distributions [0.0]
ハミンググラフ上の対称量子ウォークのクラスを研究する。ウォークのユニタリ作用素の固有値は、ある自己相互の零値である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:36:34 GMT)
Surrogate models for diffusion on graphs via sparse polynomials [0.0]
コミュニティ構造を持つグラフ上のパラメトリック拡散方程式に対するスパースベースサロゲートモデルを提供する。我々の理論的な発見には、合成グラフと実世界のグラフの両方で行われた一連の数値実験が伴っている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:12:53 GMT)
Suppressing leakage and maintaining robustness in transmon qubits: Signatures of a trade-off relation [0.0]
より大きいヒルベルト空間に埋め込まれた論理部分空間における量子ゲートを最適に生成する問題について検討する。我々は、摂動に対する堅牢性の尺度として、計算部分空間の忠実性感受性を導出し、その部分空間からの漏洩を定量化するコスト関数を定義する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:38:25 GMT)
Structure-preserving numerical calculation of wave equation for a vector field [0.0]
本稿では,制約を離散レベルで保存する構造保存スキームを用いた離散方程式を提案する。構造保存方式を用いて得られた結果を示し、より正確で安定した数値解を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:45:58 GMT)
Structural Refinement of Bayesian Networks for Efficient Model Parameterisation [0.0]
本稿では, 条件付き確率表を効率的に近似するために, 実際に使用できる様々な構造改善手法のレビューを行う。本研究では,ベイジアンネットワークモデルを用いた心血管リスク評価モデルを用いて,各手法の評価を行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:39:48 GMT)
Stealing AI Model Weights Through Covert Communication Channels [0.0]
本稿では,AIハードウェアアクセラレーターを搭載した無線機器を対象とした新たな攻撃手法を提案する。第1フェーズでは、被害者のデバイスはハードウェアのトロイの木馬によって妥協される。第2フェーズでは、敵は近くの無線デバイスを使用して被害者の送信フレームを傍受する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:21:41 GMT)
Shadows and subsystems of generalized probabilistic theories: when tomographic incompleteness is not a loophole for contextuality proofs [0.0]
非コンテクスト性の失敗の証明は、トモグラフィー完全性の失敗の非常に幅広いクラスに対して堅牢であることを示す。また、GPTフラグメントの影の概念を導入し、その状態や効果が無意識に互いにトモグラフィーされていないときに失われた情報をキャプチャする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:26:41 GMT)
Selmer-Inspired Elliptic Curve Generation [0.0]
楕円曲線暗号(ECC)は、現代のセキュア通信の基礎となっている。既存の標準曲線は不透明なパラメータ生成プラクティスに対して精査されている。この研究は、透明かつ監査可能な楕円曲線を構築するためのセルマーに着想を得たフレームワークを導入する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:33:36 GMT)
Secure coding for web applications: Frameworks, challenges, and the role of LLMs [0.0]
セキュアなコーディングは、ソフトウェア開発において批判的ですが、見落とされがちなプラクティスです。広く意識された努力にもかかわらず、組織的、教育的、技術的障壁のため、現実世界の採用は相容れないままである。本稿では、研究者、開発者、教育者に対して、セキュアなコーディングを現実世界の開発プロセスに統合する実践的な洞察を提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:54:50 GMT)
ScheduleMe: Multi-Agent Calendar Assistant [0.0]
本稿では,Googleカレンダーイベントを自然言語で管理するためのマルチエージェントカレンダーアシスタントを提案する。このシステムは、中央監督エージェントが専門のタスクエージェントを監督するグラフ構造化調整機構を使用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:47:54 GMT)
Saturation of Quantum Cramer-Rao Bounds for Distributed Sensing via Error Sensitivity in SU(1,1)-SU(m) Interferometry [0.0]
1つの出力ポートでの誤差感度測定が量子クレーマー・ラオ境界(QCRB)を飽和またはほぼ飽和させることを示す。本稿では,1つの出力ポートにおける誤差感度測定がQCRBを飽和あるいはほぼ飽和させることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:11:43 GMT)
SOCK: A Benchmark for Measuring Self-Replication in Large Language Models [0.0]
SOCKは、人間の介入なしに自己複製する大規模言語モデル(LLM)の能力を測定するベンチマークである。我々は,広い自己複製能力に基づいてLSMを分類するシステムを開発した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 01:27:46 GMT)
Robust NbN on Si-SiGe hybrid superconducting-semiconducting microwave quantum circuit [0.0]
大規模量子コンピューティングは、長いコヒーレンス時間と半導体技術を組み合わせた超伝導回路を必要とする。 Si/SiGe量子井戸と一体化した窒化ニオブ(NbN)コプラナー導波路共振器について検討した。単一光子系における温度依存性マイクロ波分光法を用いて、共振周波数と品質係数の変動を調べ、基礎となる損失機構を解明する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:03:27 GMT)
Rethinking Diffusion Model in High Dimension [0.0]
拡散モデルは、基礎となる確率分布の統計量を学ぶことができると仮定する。しかし、これが本当にうまくいくのか? ほとんどの推論メソッドは単純なフレームワークで統一できる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:26:24 GMT)
Refine Drugs, Don't Complete Them: Uniform-Source Discrete Flows for Fragment-Based Drug Discovery [0.0]
InVirtuoGenは,de novo と fragment-constrained 生成のための断片化SMILESの離散フロー生成モデルである。本稿では,遺伝的アルゴリズムと遺伝的特性最適化の微調整戦略を組み合わせたハイブリッド手法を提案する。提案手法は,タスク全体にわたるトップ10のAUCによって測定された,実用的分子最適化ベンチマークの最先端を新たに設定する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:34:53 GMT)
Reasoning-Aware Prompt Orchestration: A Foundation Model for Multi-Agent Language Model Coordination [0.0]
複数の特殊エージェント間の推論を強化する動的プロンプトオーケストレーションのための理論的基盤となるフレームワークを提案する。このフレームワークは,エージェント移行時の論理的一貫性の維持,推論対応の迅速な適応,分散推論のスケーラブルな調整,という3つの課題に対処する。 1000件の合成マルチエージェント会話実験の結果,推論遅延の42%低減,ROUGE-Lスコアによる論理的整合性の23%改善,文脈損失のないタスク完了の89%の成功率が確認された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:33:01 GMT)
Real-time Noise Detection and Classification in Single-Channel EEG: A Lightweight Machine Learning Approach for EMG, White Noise, and EOG Artifacts [0.0]
単一チャネル脳波における眼球,筋 (EMG) , ホワイトノイズアーティファクトのリアルタイム検出と分類のためのハイブリッドスペクトル時間フレームワークを提案する。 30秒のトレーニング時間(CNNよりも97%高速)とSNRレベルの堅牢なパフォーマンスにより、このフレームワークは臨床応用性と計算効率のギャップを埋める。この研究は、脳波アーチファクト検出のためのモデル深さへのユビキタスな依存にも挑戦し、ドメインインフォームド機能融合が複雑なアーキテクチャをノイズの多いシナリオで超越していることを示します。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:32:38 GMT)
Quantum Zeno Dynamics of Two Interacting Particles [0.0]
量子ゼノダイナミクスによれば、量子系の進化は、頻繁な測定によってヒルベルト空間の部分空間に制限することができる。 1次元空間領域における2つのイオンを持つ玩具モデルを考える。この2体量子系の進化をシミュレートすることにより、イオンを所望の信頼レベルで初期閉じ込め領域内に保持するために必要な測定周波数を推定する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:33:19 GMT)
Quantum Simulation of Random Unitaries from Clebsch-Gordan Transforms [0.0]
任意のコンパクト群に対するハール乱ユニタリの$t$コピーの作用をシミュレートする一般的な方法を提案する。概念的には単純で正確であり、クレブシュ・ゴルダン変換を主構成要素として利用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:57:08 GMT)
Quantum Optics and Quantum Electrodynamics of Strong Field Processes [0.0]
当初、強いレーザー・マター相互作用の物理学は多光子過程の物理学であった。チャープパルス増幅の出現により、超高強度、超短パルス、コヒーレントレーザーパルスの発生が可能となった。超高速レーザー物理学は、量子電磁力学と量子光学を再導入することなく、光-物質相互作用の記述を継続することができるか?
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:49:09 GMT)
Quantitative Evaluation of KIRETT Wearable Demonstrator for Rescue Operations [0.0]
救助サービスは、必要な患者に対して、迅速で信頼性の高い治療を提供する必要がある。治療レコメンデーション、リアルタイムバイタルモニタリング、人工知能(AI)による状況検出といった最新の技術の助けを借りて、状況を分析し、支援することができる。 KIRETTでは、そのようなシナリオをサポートするウェアラブルデバイスが開発され、救助サービスにおける治療勧告を提供する方法が提示されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:21:09 GMT)
Quadratic Programming Approach for Nash Equilibrium Computation in Multiplayer Imperfect-Information Games [0.0]
本稿では,非線形近似に基づく2次制約付きプログラムを解くマルチプレイヤー不完全情報ゲームにおける近似手法を提案する。また,マルチプレイヤー戦略型ゲームにおけるナッシュ均衡の計算手法も提案した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:28:21 GMT)
QSearchNet: A Quantum Walk Search Framework for Link Prediction [0.0]
リンク予測はグラフ理論における基本的な問題の1つである。量子コンピューティングは、重畳を同時マルチパス探索に活用することで、強力な代替手段を提供する。 QSearchNetは、トポロジを意識した量子進化をシミュレートし、複数のノードにわたる振幅を同時に伝播する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:32:34 GMT)
QFrBLiMP: a Quebec-French Benchmark of Linguistic Minimal Pairs [0.0]
ケベック・フレンチ言語最小ペアベンチマーク(QFrBLiMP)について紹介する。 QFrBLiMPは、20の言語現象に注釈を付けた1,761個の最小ペアから構成される。 QFrBLiMPとMultiBLiMP-Frについて,各カテゴリの最小ペアの文に割り当てられる高い確率を観察することにより,異なるLLMを評価する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:00:26 GMT)
Progress in the study of the (non)existence of genuinely unextendible product bases [0.0]
真に拡張不可能な製品基盤(GUPB)の存在に関するオープン問題について検討する。このアプローチを用いて、3量子系において13の大きさの GUPB が存在しないことを確かめる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:55:27 GMT)
Probeless vs Probe-Based Variable-Strength Eavesdropping in Quantum Key Distribution [0.0]
量子鍵分布(QKD)は秘密鍵を生成するための確実な方法である。我々は,eavesdropperの可変強度測定がQKDに及ぼす影響を解析した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:32:43 GMT)
Privacy-Preserving Learning-Augmented Data Structures [0.0]
学習増強データ構造は、予測周波数推定を使用して、標準データ構造よりも高速に頻繁に発生するデータベース要素を検索する。最近の研究は、これらの周波数推定を最適に活用し、逆予測誤差に対する堅牢性を維持しながら、データ構造を開発した。セキュリティ侵害が発生した場合、データ構造は、現在の内容を超えた最小限の情報を明らかにする必要がある。我々は,歴史に強く依存し,頑健であり,動的更新をサポートする最初の学習強化データ構造を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:37:39 GMT)
Predicting Penalty Kick Direction Using Multi-Modal Deep Learning with Pose-Guided Attention [0.0]
本研究では,ボール接触前のペナルティキックの方向を予測するためのリアルタイム・マルチモーダル深層学習フレームワークを提案する。 755ペナルティキックイベントのカスタムデータセットは、実際のマッチビデオから作成され、オブジェクト検出、シューターキーポイント、ファイナルボール配置のためのフレームレベルのアノテーションが提供されている。このモデルはホールドアウトテストセットで89%の精度を達成し、視覚のみのベースラインとポーズのみのベースラインを14-22%上回った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:02:59 GMT)
Practical Quantum Clock Synchronization Using Weak Coherent Pulses [0.0]
我々は、弱コヒーレントパルスの減衰に基づく量子化クロック同期プロトコルを数値的に評価する。これらの動作条件下では、ナノ秒以下のクロックオフセット精度と精度が達成可能であることをシミュレートする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:21:59 GMT)
Polynomials and asymptotic constants in a resurgent problem from 't Hooft [0.0]
G(z)=sum_n>0sqrtnzn$ for $|z|1$ が与えられたとき、分岐カット $zin[1,infty)$ を除いて、その解析的連続性は $|z|ge1$ である。解は両側収束和 $Gz)=frac12sqrtpisum_ninmathbb Z (2npirm i-qrlog(z))/2-3$ で与えられる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:12:31 GMT)
Physically-Motivated Guiding States for Local Hamiltonians [0.0]
我々は量子化学とハミルトンの部分集合状態に動機づけられた状態に焦点を当てる。従来のトラクタビリティを維持しながら、より広い州家族が硬さを保っていることを実証する。本研究は, 地盤状態推定問題に対する景観の複雑さをさらに高め, 実験的な環境設定に向けたステップを提示する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:47:13 GMT)
Perturbation theory, irrep truncations, and state preparation methods for quantum simulations of SU(3) lattice gauge theory [0.0]
量子ハードウェア上でのSU(3)$格子ゲージ理論の近似基底状態の効率的な調製法について検討する。地中準備のための簡易なアンザッツ回路を開発し, 格子上での古典的シミュレーションにより検証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:01:26 GMT)
Perspectives on Large Language Models: Polysemy, Stochasticity, Exponential Expressibility, and Unitary Attention [0.0]
本稿では,Large Language Models(LLM)の基礎的側面について考察する。擬直交ベクトルを用いて空間次元の埋め込みによって意味的特徴の表現がどのように指数関数的にスケールするかを分析する。古典的機構のユニタリ拡張として量子アテンションを提案し,LLM処理をヒルベルト空間における可逆的量子様進化として再フレーミングする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:26:10 GMT)
Performance of the empirical median for location estimation in heteroscedastic settings [0.0]
我々は、共通だが未知の位置パラメータを共有する独立対称実数値確率変数について考察する。我々は、その推定誤差に基づいて、非漸近的上界と下界のマッチングを導出する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:58:34 GMT)
Passive detection of Schwinger boson dynamics via a qubit [0.0]
本稿では,トランスモン量子ビットがマイクロ波クロス共振器に容量的に結合する集積フォトニックデバイスを提案する。このスキームでは、トランモン量子ビットは制御素子と受動検出器の両方として二重の役割を果たす。本研究では,トランスモンとクロス共振器の結合強度と位相を調整することにより,相互作用のダイナミクスを選択的に制御できることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:00:02 GMT)
Pancharatnam phase as an entanglement witness for quantum gravity in dual Stern-Gerlach interferometers [0.0]
絡み合いは量子力学の基礎的なテストと実践的な応用において中心的な役割を果たす。スピン・ワン・ハーフStern-Gerlach干渉計を2つのスピン・ワン・ハーフStern-Gerlach干渉計で研究し、パンチャラトナム相が半古典的と量子重力を区別するツールであることを示した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:23:48 GMT)
Optimizing Indoor Environmental Quality in Smart Buildings Using Deep Learning [0.0]
本稿では,IEQパラメータ,特にCO2濃度,温度,湿度を積極的に管理する深層学習型手法を提案する。我々は,Long Short-Term Memory (LSTM), Gated Recurrent Units (GRU), and a hybrid Convolutional Neural Network LSTM (CNN-LSTM) の3つのアーキテクチャをベンチマークした。以上の結果から,GRUは計算オーバーヘッドを低く抑えるとともに,CNN-LSTMは拡張予測ウィンドウの主機能抽出に優れることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:42:34 GMT)
On the Complexity of the Succinct State Local Hamiltonian Problem [0.0]
Succinct State 3-Local Hamiltonian problem is (promise) MA-complete。我々の証明は、簡潔な量子状態の体系的特徴付けと、元のMA硬さ低減の修正によって進行する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:55:36 GMT)
On a discrete version of the position-momentum commutation relation [0.0]
十分な次元のヒルベルト空間によって記述されたキューディットの場合、位置-運動量交換関係の離散バージョンが存在する。連続パラメータとある種の離散コヒーレント状態に依存する離散変数ガウス状態の族を含むことを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:13:46 GMT)
On Computing Top-$k$ Simple Shortest Paths from a Single Source [0.0]
重み付きダイグラフにおける最上位$kの単純な最短経路の計算問題について検討する。我々は,本アルゴリズムが実行時間において,後者のベースラインよりも連続的に,著しく優れていることを示す。これらの結果は,1つのソースからの単純な最短経路を$k$で計算するソリューションとして,我々の新しいアルゴリズムを確立している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:12:05 GMT)
Nonlinear quantum computation by amplified encodings [0.0]
本稿では,高次元非線形量子計算のための新しいフレームワークを提案する。問題次元と複雑性の対数的スケーリングを特徴とする量子優位性が保存されていることを示す。ニュートンの手法は理論的にほぼ最適に複雑になるが、固定点反復法は短期ノイズの多いハードウェアに適しているかもしれない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:57:09 GMT)
Nondestructive characterization of laser-cooled atoms using machine learning [0.0]
レーザ冷却したカリウム39原子の磁気光学トラップにおける物理特性を推定する機械学習技術を開発した。蛍光原子アンサンブルのその場撮影画像は、ミリスケールの物体の空間構造を直接明らかにしている。蛍光画像のみから原子数と温度を予測するために訓練されたモデルについて述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:26:42 GMT)
Non-equilibrium Dynamics of Two-level Systems directly after Cryogenic Alternating Bias [0.0]
2レベルシステム(TLS)は、電気的に量子ビット、共振器、振動モードと結合するアモルファス材料で一般的に見られるトンネル状態である。近年の研究では、大きな交流電場を適用すると酸化物の構造が変化し、量子ビットと共振器の性能が向上する可能性が示唆されている。低温における交互バイアスがアモルファス酸化物パラレルプレートコンデンサ内のTLSダイナミクスに及ぼす影響を調べた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:59:49 GMT)
Non-coherent evolution of closed weakly interacting system leads to equidistribution of probabilities of microstates [0.0]
弱い相互作用を持つ系に対して、このような進化はマルコフ過程であることを示す。時間可逆なユニタリ進化を時間可逆な進化に変換するメカニズムは非コヒーレンスである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:37:09 GMT)
Non-Hermitian comb effect in coupled clean and quasiperiodic chains [0.0]
鎖間ホッピングにより一様鎖または清浄鎖に結合した非エルミート準周期鎖系の局在特性について検討した。弱い鎖間結合の極限において、そのような結合系は非ハーミティシティパラメータの増加とともに非局在化から中間相への遷移を示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:53:55 GMT)
Non-Gaussian Quantum State Engineering with Postselected von Neumann Measurements [0.0]
我々は,非ガウス状態(nG)をポストセレクトされたフォン・ノイマン測定により生成するための実現可能なプロトコルを提案する。ウィグナー関数による非ガウス性の特徴付けと線形エントロピーと共起を用いた絡み合いの定量化を行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:02:33 GMT)
Neutrino backgrounds in matter-wave interferometry: implications for dark matter searches and beyond-Standard Model physics [0.0]
本稿では, ニュートリノ誘起脱コヒーレンスの理論解析を行った。本研究は,ニュートリノ相互作用物理の観点から物質-波干渉測定を解釈するための枠組みを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:16:02 GMT)
Neural Network Characterization and Entropy Regulated Data Balancing through Principal Component Analysis [0.0]
本稿では, 主成分分析(PCA)の幾何学的構造について, 回転しないMNIST桁と回転したMNIST桁の分布を詳細に検討する。厳密な幾何学的特徴を持つ桁は原点から離れた制限された領域にマッピングされるため、低次PCA空間の広さ、拡散度、重複度にマッピングされる桁よりも精度の高いニューラルネットワークによって予測される。これらの結果により, 局所PCAエントロピーは, 低次主成分の空間領域をヒストグラムビンに分割し, 各入力クラスの出現数に関連するエントロピーを評価することにより得られる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:44:32 GMT)
Navigating the Synchrony-Stability Frontier in Adaptive Chatbots [0.0]
コア設計の緊張を明示する計算評価フレームワークを提案する。人間のログデータセットに対する明示的な適応ポリシーをシミュレートし比較する。限定されたポリシーは、同期に控えめなコストで、安定性の大幅な向上を実現している。我々は、フロンティアポリシーが命令のチャーンを減らし、ジャリングレジスタのフリップを減らしたことを示す「素早い正当性」を定量化する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:50:30 GMT)
Multi-temporal crack segmentation in concrete structures using deep learning approaches [0.0]
ひび割れはコンクリート構造物の劣化の最も初期の指標である。本研究では, ひび割れのセグメンテーションにマルチテンポラルデータを活用することにより, セグメンテーションの品質を高めることができるか検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:50:41 GMT)
Model Discovery and Graph Simulation: A Lightweight Gateway to Chaos Engineering [0.0]
カオスエンジニアリングはレジリエンスのリスクを明らかにしますが、広く頻繁に実行するには高価で運用上のリスクがあります。我々は、単純な接続のみのトポロジモデルにより、フェールストップフォールトの下で、高速で低リスクなアベイラビリティー推定を行うことができると主張している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:34:13 GMT)
Measurement-free reconstruction circuit of quantum secrets in quantum secret sharing [0.0]
安定化符号に基づく量子シークレット共有における量子シークレットの無測定再構成回路を提案する。我々の回路は幅$k+|J|$で、$O(k|J|)$ 1または2量子のユニタリゲートで構成され、$|J|$参加者は$k$量子秘密を再構成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:17:54 GMT)
Measurement-based quantum machine learning [0.0]
本稿では,計測に基づく量子計算ニューロンから構築された普遍的な量子ニューラルネットワークを提案する。ノイズの存在下では, MuTA が普遍的なゲート集合を学習できることを数値的に示す。フォトニックな Gottesman-Kitaev-Preskill 量子ビットによって課されるハードウェア制約を組み込む。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:17:39 GMT)
Measurement-based quantum computation using two-component BECs [0.0]
2成分ボース・アインシュタイン凝縮体(BEC)を用いた測定ベース量子計算(MBQC)を提案する。結果は、粒子制御に基づく新しい量子コンピューティングプロセスを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:19:50 GMT)
MathBode: Frequency-Domain Fingerprints of LLM Mathematical Reasoning [0.0]
大規模言語モデル(LLM)における数学的推論のための動的診断法であるMathBodeを提案する。一つのパラメータを正弦波に駆動し、モデル出力と正確な解の第一高調波応答に適合する。 5つのクローズドフォームファミリにまたがって、診断面は系統的な低域通過挙動と位相ラグを呈し、精度のみを曖昧にしている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 00:39:06 GMT)
Machine Learning and Control: Foundations, Advances, and Perspectives [0.0]
重畳制御性やアンサンブル制御性といった概念は、ディープニューラルネットワークの分類と表現特性に新たな洞察を与えることを示す。また、動的ニューラルネットワークと静的ニューラルネットワークの関係についても検討する。偏微分方程式の文脈で長い間確立されてきた拡散過程の古典的性質が、現代の生成人工知能の成功を説明するのにどのように貢献するかを述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:47:26 GMT)
Machine Learning Detection of Lithium Plating in Lithium-ion Cells: A Gaussian Process Approach [0.0]
高速充電中のリチウムめっきは、キャパシティフェードを加速し、破滅的な安全障害を引き起こす重要な劣化機構である。最近の研究で、DQ/dVのピークが4.0Vを超えることが、めっき開始の確実なサインであると確認されている。電荷-電圧関係Q(V)を直接キャリブレーションした不確実性を有するプロセスとしてモデル化し,リチウムめっき検出のためのフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:30:06 GMT)
MIBoost: A Gradient Boosting Algorithm for Variable Selection After Multiple Imputation [0.0]
実際には、分析は欠落データによって複雑になることが多い。提案するMIBoostは,命令付きデータセット間で均一な可変選択機構を持つ新しいアルゴリズムである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:42:11 GMT)
MAGIC-MASK: Multi-Agent Guided Inter-Agent Collaboration with Mask-Based Explainability for Reinforcement Learning [0.0]
本稿では,マルチエージェント強化学習への摂動に基づく説明を拡張した数学的基盤を持つMAGIC-MASKを提案する。提案手法は, 近似ポリシ最適化, 適応型エプシロン・グレーディ探索, および軽量なエージェント間協調を統合した。この共同作業により、各エージェントは給与誘導マスキングを行い、報酬に基づく洞察を仲間と共有し、臨界状態発見に必要な時間を短縮することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:53:28 GMT)
Low Resource Audio Codec Challenge Baseline Systems [0.0]
Low-Resource Audio Codec (LRAC) Challengeは、リソース制約のある環境でのデプロイメントのためのニューラルオーディオコーディングの進歩を目的としている。本稿では,2025年のLRACチャレンジにおいて,両トラックの公式ベースラインシステムについて述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:36:58 GMT)
Lifshitz formulas for finite-density Casimir effect [0.0]
リフシッツの公式を一般化し、有限温度でのカシミール効果を調べる。種々の系における有限化学ポテンシャルにおけるカシミール効果の典型的な現象について論じる。この式は、高密度クォーク物質とディラック/ワイル半金属のカシミール効果に適用できる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:04:27 GMT)
LiDAR Point Cloud Colourisation Using Multi-Camera Fusion and Low-Light Image Enhancement [0.0]
本研究では,複数のカメラ入力を用いてメカニカルLiDARから色付き点雲を生成する,ハードウェアに依存しない新しい手法を提案する。主なイノベーションは、低照度条件下での堅牢性であり、低照度画像拡張モジュールの統合によって達成される。このアルゴリズムは、Velodyne Puck Hi-Res LiDARと4カメラ構成を用いてテストされた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:56:11 GMT)
Leveraging AI modelling for FDS with Simvue: monitor and optimise for more sustainable simulations [0.0]
本研究では,最先端CFDソフトウェアよりも高速な熱伝搬順序のダイナミクスを予測できるカスタム機械学習サロゲートモデルの有効性を示す。また、目標を達成するのに必要なシミュレーション数を減らし、最適化手順を導出する方法を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:57:38 GMT)
LLM-Assisted Emergency Triage Benchmark: Bridging Hospital-Rich and MCI-Like Field Simulation [0.0]
劣化予測のためのLCM支援緊急トリアージベンチマークをオープンに導入する。 i)バイタル、実験室、ノート、主要な苦情、構造化された観察を伴う病院に富んだ設定、(ii)バイタル、観察、ノートに限定されたMCIライクなフィールドシミュレーションである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:54:58 GMT)
LLM Based Sentiment Classification From Bangladesh E-Commerce Reviews [0.0]
本稿では,バングラデシュのeコマースレビューの感情分析にトランスフォーマーを用いたBERTモデルの有効性について検討する。バングラのオリジナルデータセットから4000サンプルのサブセットと、イングランドの顧客レビューを使用してモデルを微調整した。微調整のLlama-3.1-8Bモデルは、全体的な精度、精度、リコール、F1スコア95.5%、93%、88%、90%で他の微調整モデルより優れていた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:46:09 GMT)
LLM Agents for Knowledge Discovery in Atomic Layer Processing [0.0]
大規模言語モデル(LLM)は、ここ数年、大きな注目を集めてきた。本研究では,材料科学における知識発見のためのエージェントの可能性を検証する。子どもたちのパーラーゲームを通じて,このアプローチの概念実証を行う。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:01:44 GMT)
KIRETT: Smart Integration of Vital Signs Data for Intelligent Decision Support in Rescue Scenarios [0.0]
KIRETTプロジェクトは、救助活動のための手首を編んだウェアラブルに、治療勧告と状況検出を提供する。本研究の目的は、救助活動における意思決定改善における重要なサインの意義を示し、必要な医療従事者や患者への影響を示すことである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:20:42 GMT)
Ingress Cryogenic Receivers Toward Scalable Quantum Information Processing: Theory and System Analysis [0.0]
同軸ケーブルによる低温冷却量子ビットの電流制御技術を実現した。多重化全受動極低温直接検出プラットフォーム(cryo-HFDD)を提案する。 4Kの多重フォトニック受信機は数千量子ビットの制御を積極的にスケールできることを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:29:58 GMT)
Informed Dataset Selection [0.0]
我々はAPSエクスプローラーを開発した。APSエクスプローラーはアルゴリズム・パフォーマンス・スペース・フレームワークを組み込んだウェブアプリケーションである。システムは3つのメトリクス(nDCG、Hit Ratio、Recall)にわたる28のアルゴリズムを使用して、96のデータセットを5つのK値で分析する。我々は、データセットを5つの難易度に分類する統計ベース分類システムにより、APSフレームワークを拡張した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:04:51 GMT)
ICL Optimized Fragility [0.0]
ICLガイドはタスク固有のパフォーマンスを改善することが知られているが、ドメイン間認知能力への影響は未解明のままである。 GPTOSS:20bモデルの6つの変種を用いて、ICLガイドが異なる知識領域の推論にどう影響するかを検討する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:43:21 GMT)
Hyperparameters are all you need: Using five-step inference for an original diffusion model to generate images comparable to the latest distillation model [0.0]
拡散モデルは、ニューラルネットワークを反復的に適用することによって画像を生成する最先端の生成モデルである。本研究では,拡散ODEとSDEのトラクション誤差の解析に基づいて,高品質な512 x 512と1024 x 1024の画像を8ステップで生成する学習自由度アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:27:09 GMT)
Hybrid Schemes of NIST Post-Quantum Cryptography Standard Algorithms and Quantum Key Distribution for Key Exchange and Digital Signature [0.0]
本研究では,NIST(National Institute of Standards and Technology)標準化PQCアルゴリズムとQKDを統合するハイブリッドスキームを提案する。ハイブリッド鍵交換プロトコルでは,モジュール格子を用いたキーカプセル化機構(ML-KEM)とQKDプロトコル(特にBB84とE91)を組み合わせる。ハイブリッドデジタル署名方式の設計において,モジュール格子型デジタル署名アルゴリズム(ML-DSA)とステートレスハッシュ型デジタル署名アルゴリズム(SLH-DSA)を用いて署名再構成値を生成する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 05:14:34 GMT)
Hybrid Quantum-Classical Optimisation of Traveling Salesperson Problem [0.0]
本稿では,変分量子固有解法(VQE)の最適化と古典的機械学習を統合するハイブリッド量子古典的フレームワークを提案する。 Qiskit の AerSimulator と ibm_kyiv 127-qubit バックエンドを用いて,80 のヨーロッパ都市におけるフレームワークの評価を行った。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:26:12 GMT)
Human-Centered Evaluation of RAG outputs: a framework and questionnaire for human-AI collaboration [0.0]
我々は12次元にわたるRAG出力を評価する質問紙を設計した。我々は,人間レーダと人間-LLMのペアからのフィードバックを取り入れた。その結果、大規模言語モデル(LLM)はメートル法記述やスケールラベルに確実に焦点を合わせているが、テキストフォーマットのバリエーションを検出するには弱点があることがわかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:08:33 GMT)
Harnessing the Diamond-Air Interface as an Efficient Photon Antenna for Solid-State Emitters [0.0]
欠陥中心から光子を抽出することは、典型的な基板の屈折率が高いため困難である。ダイヤモンドの窒素空孔中心では、2.5タイムs105以上の飽和数に達すると、これまではナノファブリック光学を必要とする。以上の結果から, ナノファブリケート光学系に近づいた光子数も, 油浸光学系により達成できることが示唆された。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:46:08 GMT)
Gravitational waves decohere quantum superpositions [0.0]
遠方からの重力放射が量子重ね合わせのコヒーレンスにどのように影響するかを示す。この研究は、量子系のデコヒーレンスがどのように古典的な重力場との相互作用から生じるかを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:26:46 GMT)
Geometric Learning of Canonical Parameterizations of $2D$-curves [0.0]
対称性を学ぶニューラルネットワークを構築する一般的な方法は、データ拡張を使用することである。主繊維束の断面の概念に基づいて対称性を変調する別の方法を提案する。このフレームワークは、対称群の下での物体の軌道間の相同性を測定するために、オブジェクトの空間上の単純な測度を使用することができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:45:10 GMT)
Generally covariant geometric momentum and geometric potential for a Dirac fermion on a two-dimensional hypersurface [0.0]
2次元超曲面上で制約されたディラックフェルミオンに対する幾何運動量の導出を行う。曲率によって引き起こされる幾何学的ポテンシャルは、擬球面やヘリカル面に生じない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:50:43 GMT)
Fundamental limits to contrast reversal of self-fidelity correlations [0.0]
測定設計においては、アンチコントラストのリードアウトを設計することが一般的である。広義の入力アンサンブルに対して2つの進化を均一に反対にできるかどうかを問う。我々は、ピアソン相関係数を、2つの進化の間の大域的対立のデバイスに依存しない尺度として採用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:07:28 GMT)
From customer to product: design tools for the visually impaired [0.0]
新しい環境や未知の環境でのナビゲーションは、特に視覚障害者にとって不可欠である。本稿では、視覚障害者がデザインに参加することができる7つのツールについて検討し、体系的なレビューを通じて選択し、親和性、相違性、アプリケーションについて分析する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 15:18:31 GMT)
Flow Autoencoders are Effective Protein Tokenizers [0.0]
本稿では,タンパク質構造のトークン化と生成のためのフローベーストークン化ツールであるKanziを紹介する。 Kanziは、フローマッチング損失でトレーニングされた拡散オートエンコーダで構成される。これらの変化は、既存のトークン化器よりも優れたパラメータ効率モデルの訓練を安定化させることが判明した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 23:29:39 GMT)
Federated Causal Inference from Multi-Site Observational Data via Propensity Score Aggregation [0.0]
因果推論は通常、個々のレベルのデータへの集中的なアクセスを仮定する。本稿では,フェデレートラーニング(FL)手法を用いて,分散化された観測データから平均処理効果(ATE)を推定することにより,この問題に対処する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:10:23 GMT)
Fast Likelihood-Free Parameter Estimation for Lévy Processes [0.0]
本稿では,ニューラルベイズ推定フレームワークを用いたL'evyパラメータ推定の高速かつ高精度な手法を提案する。 NBEは, 緩やかな条件下でベイズ推定器に収束する一貫した推定器となることを示す。提案されたアプローチでは、パラメーターを見積もるのに1分もかからない。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:15:34 GMT)
Evaluating the Use of Large Language Models as Synthetic Social Agents in Social Science Research [0.0]
大規模言語モデル(LLM)は、社会科学における合成エージェントとしてますます使われてきている。本稿では,LLM出力の解釈において考慮すべき注意点について概説する。実用的なガードレールを導入し、研究者はカテゴリエラーを避けながら、有用なプロトタイピングや予測を行うことができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 10:53:54 GMT)
End-to-End Aspect-Guided Review Summarization at Scale [0.0]
本稿では,アスペクトベース感情分析(ABSA)とガイドによる要約を組み合わせ,簡潔で解釈可能な製品レビュー要約を生成する,スケーラブルな大規模言語モデル(LLM)に基づくシステムを提案する。提案手法はまず,個々のレビューからアスペクト・センチメント・ペアを抽出・統合し,各製品に対して最も頻繁なアスペクトを選択し,それに応じて代表レビューをサンプリングする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:24:07 GMT)
Enabling full localization of qubits and gates with a multi-mode coupler [0.0]
チューナブルカプラは超伝導量子プロセッサの鍵となる構成要素である。励起多様体間の相互作用を非線形に制御できる多モードチューナブルカプラを提案する。提案した設計は、キュービット間の完全局所化も実現し、疎結合点における完全孤立を実現する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:13:47 GMT)
Electron neural closure for turbulent magnetosheath simulations: energy channels [0.0]
完全畳み込みニューラルネットワーク(FCNN)を用いた非局所5モーメント電子圧テンソル閉鎖法を提案する。このモデルは、崩壊する磁気シース乱流の完全運動エネルギー保存半単純粒子インセルシミュレーションのための代理モデルの開発に使用される。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 21:00:50 GMT)
Effects of Markovian noise and cavity disorders on the entanglement dynamics of double Jaynes-Cummings models [0.0]
絡み合った量子ビットのような古典的でない状態を準備し、操作する能力は、量子情報処理、通信、計算の発展に不可欠である。光-物質相互作用を研究するための理論的枠組みである二重Jaynes-Cummingsモデルの力学について検討する。マルコフノイズとスタティック(ガラス)キャビティ障害の影響をモデルとして検討し,これらの欠陥が絡み合いのダイナミクスに与える影響を明らかにすることを目的とした。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:09:20 GMT)
EVO-LRP: Evolutionary Optimization of LRP for Interpretable Model Explanations [0.0]
説明可能なAI(XAI)メソッドは、どの画像領域がモデルの予測に影響を与えるかを特定するのに役立つが、ディテールと解釈可能性の間のトレードオフに直面していることが多い。本稿では,CMA-ES(Co Matrix Adaptation Evolution Strategy)を用いて,量的解釈可能性指標に基づくLRPハイパーパラメータのチューニングを行う手法であるEVO-LRPを紹介する。 EVO-LRPは、解釈可能性メトリックのパフォーマンスと視覚的コヒーレンスの両方において従来のXAIアプローチより優れており、クラス固有の特徴に対して強い感度を持つ。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:40:39 GMT)
EQ-Robin: Generating Multiple Minimal Unique-Cause MC/DC Test Suites [0.0]
MC/DC(Modified Condition/Decision Coverage)は、安全クリティカルなソフトウェア検証の基盤である。本稿では,最小限のUnique-Cause MC/DCスイート群を生成する軽量パイプラインであるEQ-Robinを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:09:39 GMT)
EEG-based AI-BCI Wheelchair Advancement: Hybrid Deep Learning with Motor Imagery for Brain Computer Interface [0.0]
このシステムは、運動画像の左右の動きに基づいて車椅子のナビゲーションをシミュレートするように設計されている。 BiLSTM-BiGRUモデルは、様々な機械学習ベースラインモデルと比較すると、92.26%の優れたテスト精度を示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 02:06:04 GMT)
Dynamic Meta-Learning for Adaptive XGBoost-Neural Ensembles [0.0]
本稿では,高度なメタ学習を通じて,XGBoostとニューラルネットワークを相乗的に組み合わせた適応型アンサンブルフレームワークを提案する。実験結果から, 予測性能が向上し, 多様なデータセット間の解釈可能性も向上した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 07:45:49 GMT)
Digital Domination: A Case for Republican Liberty in Artificial Intelligence [0.0]
人工知能は、予測不可能な方法で社会と政治の生活に革命をもたらす。この記事では、人工知能が共和制における自由の概念にいかに大きな脅威をもたらすかを取り上げる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:09:34 GMT)
Deterministic single-photon source over the terahertz regime [0.0]
テラヘルツ(THz)系において,コヒーレント光パルスの列によって引き起こされる決定論的単一光子源を提案する。本稿では,高効率,純度,不明瞭性を両立させるとともに,THz帯での発光周波数の調整が容易なキャビティ設計を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:31:01 GMT)
Deontic Argumentation [0.0]
最近の研究では、2つの義務の間に対立がある場合、根拠付きセマンティクスは弱い許可をサポートしないことが示されている。弱いパーミッションを考慮に入れた Deontic Argumentation Theory の定義を提供し、基礎的意味論の結果を思い出す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:50:07 GMT)
Defect mediated quantum melting of charge ordered insulators [0.0]
We show that the allowed topological order phases which are proximate to the Wigner-Mott insulators strongly depending the charge ordering in the WMI。 WMIのトポロジ的欠陥の増大の観点から、WMIの量子融解遷移と近位QCLについて述べる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:00:00 GMT)
DeepCodeSeek: Real-Time API Retrieval for Context-Aware Code Generation [0.0]
現在の検索技術は、標準的なRAGクエリドキュメントアプリケーションに限られている。本稿では,必要なAPIを予測するためのコードとインデックスを拡張する新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:23:27 GMT)
Decoding the Gender Gap: Addressing Gender Stereotypes and Psychological Barriers to Empower Women in Technology [0.0]
この記事は、このギャップに影響を及ぼす心理的・社会的障壁と、それを減らすために設計された介入について考察する。構造化されたレビューを用いて、家族や学校における初期のジェンダーステレオタイプの役割に関する証拠を収集した。この記事は、実践的および研究的な意味を概説し、パイロット学際的イニシアチブとしてNEURONプロジェクトを紹介している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:43:10 GMT)
Data Quality Taxonomy for Data Monetization [0.0]
この章では、データ収益化の文脈でデータ品質を評価するための包括的な分類法を提示します。フレームワークの相互接続された"メトリクス層"は、ひとつの次元のカスケードの改善を他のものに保証し、戦略的影響を最大化します。この全体論的アプローチは、粒度の技術的な評価と高いレベルの意思決定のギャップを埋める。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:42:02 GMT)
Critically Slow Hilbert-Space Ergodicity in Quantum Morphic Drives [0.0]
我々は、Thue-Morse ドライブが、長時間の極限における量子エルゴディディティの非常に強い概念を達成することを証明した。一方,Floquet ドライブは時間的特性を伴わず,任意の長さの有限時間に近似する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:37:12 GMT)
Converting entanglement into ensemble basis-free coherence [0.0]
コヒーレンス(Coherence)は、与えられた量子系に量子的性質が存在する程度に対処する。量子状態のアンサンブルに対するコヒーレンス対策は、現在も活発な研究領域である。本稿では,一定量の絡み合いからアンサンブルコヒーレンスを生成する2つの方法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:23:34 GMT)
Continuum Fractons: Quantization and the Many Body Problem [0.0]
非相対論的、双極子保存フラクトンに対する連続量子力学を定式化する。固有状態と波束の時間的進化の両方においてフラクトン誘引子の量子アナログの証拠を見いだす。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 18:00:03 GMT)
Computable measures of non-Markovianity for Gaussian free fermion systems [0.0]
自由フェルミオン力学により支配される開量子系における非マルコビアン性の測定について検討する。ガウス状態の場合、トレースベースの距離(特にヒルベルト・シュミットノルム)と2階ルネニイ相互情報は効率的に表現できる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:47:20 GMT)
Comparative Analysis of Ant Colony Optimization and Google OR-Tools for Solving the Open Capacitated Vehicle Routing Problem in Logistics [0.0]
Open Capacitated Vehicle Routing Problem (OCVRP)は、地理的に分散した顧客に最適な配送ルートを見つけることを扱う。本研究は,OCVRPソリューションのアルゴリズムとして,自然に着想を得たメタヒューリスティックであるAnt Colony Optimization (ACO)と,業界標準の最適化ツールキットであるGoogle OR-Toolsの2つを比較した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:18:14 GMT)
Coherence restoring in communication line via controlled interaction with environment [0.0]
本稿では, 線形鎖と環境との相互作用を制御した状態復元プロトコルについて考察する。最良の復元結果は対称なリンドブラッド方程式に対応することを示す。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:56:57 GMT)
Classical feature map surrogates and metrics for quantum control landscapes [0.0]
変動量子回路を一般化するパラメタライズド量子力学の3つの特徴写像を導出し,解析する。リー・フーリエ表現は、ハミルトンの性質を反映する離散ピークを持つ密度スペクトルを持つが、一般的に見られる対称系では圧縮可能である。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:24:13 GMT)
Board Gender Diversity and Carbon Emissions Performance: Insights from Panel Regressions, Machine Learning and Explainable AI [0.0]
本研究は、ボードジェンダー多様性(BGD)が企業の炭素排出特性(CEP)に及ぼす影響について検討する。パネル回帰と高度な機械学習アルゴリズムを用いて、分析は重要な非線形関係を明らかにする。結果は、学者、企業、規制当局に影響を及ぼす。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:16:56 GMT)
Blockchain-Based Secure Online Voting Platform Ensuring Voter Anonymity, Integrity, and End-to-End Verifiability [0.0]
本稿では、選挙組織と中立オブザーバによって維持されるプライベートブロックチェーンに暗号化された投票を格納する、ハイブリッドブロックチェーンベースの投票モデルを提案する。このシステムは、匿名性を保護するために、一度に盲目で署名されたトークンを発行し、彼らの投票を確認するためにレシートを提供する。この研究は、小規模グループから大規模組織まで、安全な、検証可能な、スケーラブルなオンライン投票の実現可能性を強調している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:44:52 GMT)
Bias-Aware AI Chatbot for Engineering Advising at the University of Maryland A. James Clark School of Engineering [0.0]
本研究では,メリーランド大学 (UMD) A. James Clark School of Engineering Program のAIチャットボットの開発を目的とする。私たちの研究チームは、反応の潜在的なバイアスを分析し、緩和しました。結果は、慎重にエンジニアリングとバイアス軽減戦略によって、AIは高品質で偏見のない学術的なアドバイスを提供することができることを示している。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:47:08 GMT)
Beyond Entanglement: Diagnosing quantum mediator dynamics in gravitationally mediated experiments [0.0]
最近の提案では、絡み合いの発生が直接テストとして機能する可能性が示唆されている。これらの体制を実験的に区別することは依然として困難である。この結果から,重力相互作用をシミュレートするオプトメカニカルおよびトラップイオンプラットフォームに対する検証可能なシグネチャが得られた。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:36:47 GMT)
Benchmarking Deep Learning Convolutions on Energy-constrained CPUs [0.0]
この研究は、CPUベースのディープラーニング推論のための最先端の畳み込みアルゴリズムを評価する。我々は、ARM __、Intel __、AMD __、Apple __、Nvidia __から、最新のCPU間で直接、GEMMベースの、Winogradの畳み込みをベンチマークした。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:19:00 GMT)
Behavioural Classification in C. elegans: a Spatio-Temporal Analysis of Locomotion [0.0]
線虫C. elegans(C. elegans)は、生物学の亜領域で用いられるモデルである。ワームの挙動をシミュレートするいくつかの方法が提案されている。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:06:15 GMT)
Autoproof: Automated Segmentation Proofreading for Connectomics [0.0]
本稿では,この手動アノテーションによって生成された地中真実データを用いて,機械学習モデルを学習し,必要な証明読解の部分を自動化するか,最適化する手法を提案する。本システムでは,4年間の手作業に相当する20万個のフラグメントを自動アタッチでき,コネクトームの接続完了率を1.3%向上させることができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 17:43:18 GMT)
Autonomous Multi-Robot Infrastructure for AI-Enabled Healthcare Delivery and Diagnostics [0.0]
本研究では、ウェアラブルヘルスセンサ、RFベースのコミュニケーション、AIによる意思決定支援を取り入れた医療用マルチロボットシステムを提案する。シミュレーションされた病院環境内では、患者監視、医療提供、緊急支援を行うためにリーダー・フォロワー・スワム構成を採用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:27:33 GMT)
AuON: A Linear-time Alternative to Semi-Orthogonal Momentum Updates [0.0]
運動量に基づく更新の半直交特性について検討し、スペクトルノルム信頼領域下での運動量更新を束縛する方法を開発した。半直交行列を構成することなく強い性能を達成する線形時間であるAuON(正規化非線形スケーリングによる代替単位ノルム運動量更新)を提案する。提案手法は, 双極子-コサインRMSスケーリング変換と正規化を組み合わせることで, ニュートン-シュルツ法と比較して, 有効性と計算効率の両立を実証する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:34:27 GMT)
Artificial Intelligence for Cost-Aware Resource Prediction in Big Data Pipelines [0.0]
過剰なプロビジョンは不要なコストをもたらし、過剰なプロビジョンはパフォーマンス劣化とSLA違反のリスクを負う。本研究では,ランダムフォレスト回帰を用いたビッグデータパイプラインの資源利用予測手法を提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:01:12 GMT)
Apply Bayes Theorem to Optimize IVR Authentication Process [0.0]
従来のシステムは、ユーザ間で一様の有効性を前提として、認証の静的シーケンスを通じてユーザを認証する。詐欺師はこの予測可能性を利用して強力な認証をバイパスする本研究では,ベイズ理論と条件付き確率モデルを適用し,不正リスクを動的に評価し,資格検証経路を適用する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:48:29 GMT)
An Analysis of the New EU AI Act and A Proposed Standardization Framework for Machine Learning Fairness [0.0]
欧州連合のAI法は、倫理的かつ責任あるAIシステムを規制するための重要なステップである。量的公正度尺度が存在しないことや、用語学における曖昧さが欠如していることが分かる。この曖昧さは、投資を阻害する相当な負債リスクをもたらすと我々は主張する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 20:02:38 GMT)
Agentic Exploration of Physics Models [0.0]
我々はSciExplorerを紹介した。SciExplorerはドメイン固有のブループリントを使わずにシステムの自由な形態の探索を可能にするエージェントである。我々はSciExplorerを、力学力学系、波動進化、量子多体物理学にまたがる幅広いモデルでテストする。この設定の実証された有効性は、他の領域における同様の科学的探索への扉を開く。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:50:08 GMT)
Agent-based code generation for the Gammapy framework [0.0]
このコントリビューションは設計を要約し、現在の状況を報告し、次のステップを概説します。制御された環境でコードを書き、実行し、検証できるエージェントを開発する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:29:24 GMT)
Accurate Predictions in Education with Discrete Variational Inference [0.0]
有能で効果的なAI家庭教師は、スケーラブルなソリューションを提供する。適応学習に焦点をあて、学生が正しい質問に答えるかどうかを予測する。プロフェッショナルにマークされた形式的数学試験応答の最大オープンデータセットをリリースする。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 09:43:08 GMT)
AQuaMaM: An Autoregressive, Quaternion Manifold Model for Rapidly Estimating Complex SO(3) Distributions [0.0]
AQuaMaMは、回転多様体上の複素分布を学習し、単一の前方通過におけるクエリローテーションの正確な確率を計算することができるニューラルネットワークである。異なる回転で50,000のダイのデータセットでトレーニングされた場合、AQuaMaMはICPよりも14%高いテストログに到達する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:48:35 GMT)
AIM: Adaptive Intervention for Deep Multi-task Learning of Molecular Properties [0.0]
AIMは、勾配紛争を仲介するポリシーを学ぶための最適化フレームワークである。 QM9のサブセットとターゲットタンパク質分解剤ベンチマークのマルチタスクベースラインに対する統計的に有意な改善を実現している。 AIMの主な貢献は、その解釈可能性であり、学習されたポリシーマトリックスは、タスク間の関係を分析するための診断ツールとして機能する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 08:47:41 GMT)
AI Playing Business Games: Benchmarking Large Language Models on Managerial Decision-Making in Dynamic Simulations [0.0]
本研究は,ビジネスにおける意思決定にビジネスゲームを用いた新しいベンチマークを解析する。この研究は、再現可能なオープンアクセス管理シミュレータを提案することで、AIに関する最近の文献に貢献する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 14:43:05 GMT)
AGOCS -- Accurate Google Cloud Simulator Framework [0.0]
Accurate Google Cloud Simulator (AGOCS)は、実際のワークロードトレースのパースに基づく、新しい高忠実なクラウドワークロードシミュレータである。このフレームワークは実行されたジョブ、タスク、ノードの非常に正確で詳細なパラメータを明らかにすることができる。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 11:40:04 GMT)
A systematic comparison of Large Language Models for automated assignment assessment in programming education: Exploring the importance of architecture and vendor [0.0]
本研究は,現代大規模言語モデル (LLM) のプログラム代入の自動段階付けにおいて,大規模・横比較を行った最初の事例である。モデル間でのグルーピングパターンの一貫性とクラスタリングについて,グルーピングの分布,平均スコアと変動率の違いから分析した。すべてのモデルでは、クラス内相関係数によって測定された内部一致度が高く、モデルコンセンサスは人間教師の学級との適度な一致しか示さなかった。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 16:29:35 GMT)
A general optimization framework for mapping local transition-state networks [0.0]
局所遷移状態ネットワークは、観測された振る舞いを説明する障壁アーキテクチャを明らかにする。本稿では,多目的エクスプローラーと二層最小モードカーネルを結合することにより,局所的カバレッジを体系的に拡張する汎用最適化フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 13:54:10 GMT)
A Systematic Study of Large Language Models for Task and Motion Planning With PDDLStream [0.0]
複雑なロボティクス問題を解決するための言語モデル(LLM)には、その計画能力を理解する必要がある。 1つの有望な方向性は、LLMのセマンティック知識とタスクと運動計画の正式な推論を統合することである。我々は、Gemini 2.5 Flashを使って鍵となるTAMPコンポーネントを置換する16のアルゴリズムを開発した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 19:03:14 GMT)
A Physics-Guided Probabilistic Surrogate Modeling Framework for Digital Twins of Underwater Radiated Noise [0.0]
船舶交通は沿岸海域における水中放射音の増大源である。本研究では,現実的な海洋環境下での3次元伝送損失を予測するための物理誘導確率的枠組みを提案する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 03:38:51 GMT)
A Hamiltonian driven Geometric Construction of Neural Networks on the Lognormal Statistical Manifold [0.0]
本稿では,統計多様体に基づくニューラルネットワーク構築手法を提案する。この構成は、この多様体上の勾配フローに相当するハミルトン系によって駆動される。提案手法は,基礎となるパラメータ空間の微分幾何学に基づく学習システム構築のための新しいパラダイムを提供する。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 04:47:17 GMT)
A Framework for Selection of Machine Learning Algorithms Based on Performance Metrices and Akaike Information Criteria in Healthcare, Telecommunication, and Marketing Sector [0.0]
この章では、医療、マーケティング、通信の3分野にわたる機械学習の応用について論じる。医療において、この枠組みは、心臓血管疾患の予測のような重要な課題に対処し、世界的死亡の28.1%を占める。重要なコントリビューションは、入力属性に従って最高のMLモデルを特定するレコメンデーションフレームワークである。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 22:27:34 GMT)
A Copula Based Supervised Filter for Feature Selection in Diabetes Risk Prediction Using Machine Learning [0.0]
本稿では,計算効率のよい教師付きフィルタ手法を提案する。 CDCデータセットでは,提案手法が最も高速なセレクタであり,特徴空間を約52%削減した。両データセット全体で、Gumbel-upper-tailDependency coefficient selectorは臨床上の一貫性と影響のある予測因子を一貫して同定した。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 06:11:34 GMT)
'Too much alignment; not enough culture': Re-balancing cultural alignment practices in LLMs [0.0]
本稿では、AIアライメントプラクティスへの質的なアプローチの統合へのシフトを論じる。クリフォード・ゲールツ(Clifford Geertz)の"thick description"の概念からインスピレーションを得たAIシステムは、より深い文化的意味を反映したアウトプットを生成する必要がある。
論文参考訳（メタデータ） (Tue, 30 Sep 2025 12:22:53 GMT)