TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models [105.5] 時系列を推論する3つの基本的な機能にまたがる4つのアトミックタスクを形式化した時系列推論スイート(TSR-Suite)を紹介する。
また,時系列推論を必要とする多種多様な実世界の問題に対処するために設計された最初の統一推論モデルであるTime Omni-1を紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:54:34 GMT)
A Culturally-diverse Multilingual Multimodal Video Benchmark & Model [105.1] 我々は,14言語にわたるビデオLMMを評価するために,ViMUL-Benchという多言語ビデオLMMベンチマークを導入した。
私たちのViMUL-Benchは、文化的に多様な8つのカテゴリを含む15のカテゴリにわたるビデオLMMを厳格にテストするために設計されています。
また、120万のサンプルからなる機械翻訳多言語ビデオトレーニングセットを導入し、ViMULというシンプルな多言語ビデオLMMを開発した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:03:33 GMT)
DiffusionGuard: A Robust Defense Against Malicious Diffusion-based Image Editing [103.4] DiffusionGuardは、拡散ベースの画像編集モデルによる不正な編集に対する堅牢で効果的な防御方法である。
拡散過程の初期段階をターゲットとした対向雑音を発生させる新しい目的を提案する。
また,テスト期間中の各種マスクに対するロバスト性を高めるマスク強化手法も導入した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:05:53 GMT)
Collaborating Vision, Depth, and Thermal Signals for Multi-Modal Tracking: Dataset and Algorithm [103.4] 本研究は、可視RGB、深度(D)、熱赤外(TIR)を含む3つの相補的なモードを利用する、新しいマルチモーダルトラッキングタスクを導入する。
我々はRDTTrackと呼ばれる新しいマルチモーダルトラッカーを提案する。これは、事前訓練されたRGBのみの追跡モデルと迅速な学習技術を活用して、ロバストなトラッキングのためのトリモーダル情報を統合する。
実験の結果,提案手法の有効性と利点を実証し,既存のデュアルモーダル手法に対して有意な改善が認められた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:05:15 GMT)
RFG: Test-Time Scaling for Diffusion Large Language Model Reasoning with Reward-Free Guidance [101.3] プロセス報酬を明示せずにdLLMの推論軌道を導出するためのRFGを提案する。
RFGは、すべてのタスクとモデルタイプに一貫して大きな改善をもたらし、最大9.2%の精度向上を実現している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:59:16 GMT)
UniLat3D: Geometry-Appearance Unified Latents for Single-Stage 3D Generation [98.4] UniLat3Dは、単一の潜在空間における幾何学と外観を符号化する統一されたフレームワークである。
我々の重要な貢献は、高分解能スパース特徴をコンパクトな潜在表現に圧縮する幾何学的外観統一VAEである。
UniLat3Dは、1枚の画像から数秒で高品質な3Dアセットを生成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:21:23 GMT)
SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [97.3] SciRIFF(Scientific Resource for Instruction-Following and Finetuning)は、トレーニングと評価のための137K命令フォローインスタンスのデータセットで、54のタスクをカバーする。
これらのタスクは、情報抽出、要約、質問応答、クレーム検証、分類の5つの中核的な科学文献理解能力にまたがる。
SciRIFFは、さまざまな科学分野にわたる研究文献から情報を抽出し、合成するための、完全に専門家によって書かれた高品質な命令追跡データセットである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:35:23 GMT)
When Does Multimodality Lead to Better Time Series Forecasting? [96.3] このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。
その結果,マルチモーダリティの利点は条件に依存していることが判明した。
我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:03:31 GMT)
AutoCode: LLMs as Problem Setters for Competitive Programming [94.7] 競合グレードの問題ステートメントやテストケースを生成するために,複数の検証ラウンドを使用するAutoCodeを紹介します。
ホールドアウト問題では、AutoCodeテストスイートが99%の一貫性と公式判断にアプローチしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:03 GMT)
Trinity-RFT: A General-Purpose and Unified Framework for Reinforcement Fine-Tuning of Large Language Models [92.2] Trinity-RFTは、大規模言語モデルの強化微調整(RFT)のために設計された汎用的で統一的で使いやすいフレームワークである。
RFT-coreは、同期/非同期、オンライン/オフライン、RTTのオンライン/オフラインモードを統一・一般化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:04:54 GMT)
Learning Goal-Oriented Language-Guided Navigation with Self-Improving Demonstrations at Scale [90.9] 本稿では,自己改善デモを用いた目標言語誘導ナビゲーション学習手法であるSIDを提案する。
具体的には、SIDは環境からサンプリングされた最短経路データの初期エージェントを学習し、このエージェントを利用して新しい探索軌道を生成する。
この反復的な自己改善パイプラインは、新しい環境に容易に拡張できることを示し、その結果、様々な言語誘導ナビゲーションタスク間で実演を行うことができることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:15:54 GMT)
Lost in Translation? Vocabulary Alignment for Source-Free Adaptation in Open-Vocabulary Semantic Segmentation [90.6] VocAlignは、セマンティックセグメンテーションにおいてVLM用に特別に設計された、ソースフリーのドメイン適応フレームワークである。
提案手法は,CityScapesデータセットの6.11mIoU改善を実現し,ゼロショットセグメンテーションベンチマークにおいて優れた性能を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:25:06 GMT)
LLaDA-MoE: A Sparse MoE Diffusion Language Model [89.0] LLaDA-MoEはMixture-of-Experts (MoE)アーキテクチャを持つ大規模言語拡散モデルである。
LLaDA-MoEは計算オーバーヘッドを大幅に削減して競合性能を達成する。
この結果から,マスク拡散言語モデルの学習目標に疎結合したMoEアーキテクチャを組み込むことで,MoEの強みがもたらされることが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:38:59 GMT)
G-reasoner: Foundation Models for Unified Reasoning over Graph-structured Knowledge [88.8] 大規模言語モデル(LLM)は複雑な推論において優れているが、静的かつ不完全なパラメトリック知識によって制限される。
最近のグラフ強化RAG (GraphRAG) は、このギャップを補足したグラフを構築し、LLMがそれらを推論できるようにする。
G-reasonerは、様々なグラフ構造化知識を推論するためにグラフと言語基盤モデルを統合した統合フレームワークである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:38:12 GMT)
PanoWorld-X: Generating Explorable Panoramic Worlds via Sphere-Aware Video Diffusion [87.1] PanoWorld-Xは、多彩なカメラ軌道を持つ高忠実で制御可能なパノラマビデオ生成のための新しいフレームワークである。
動作範囲,制御精度,視覚的品質など,様々な面で優れた性能を示す実験を行った。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:22:00 GMT)
Rolling Forcing: Autoregressive Long Video Diffusion in Real Time [86.4] Rolling Forcingは、エラーの最小限の蓄積で長いビデオをストリーミングできる、新しいビデオ生成技術である。
転がり強制力には3つの新しい設計が伴う。第一に、エラー伝播を加速する個別のフレームを反復的にサンプリングする代わりに、共同演示方式を設計する。
第2に,アテンションシンク機構を長軸ストリームビデオ生成タスクに導入し,初期フレームのキー値状態をグローバルなコンテキストアンカーとして保持する。
第3に,大半が拡張された遮音窓上での無段蒸留を可能にする効率的な訓練アルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:57:14 GMT)
Composable Score-based Graph Diffusion Model for Multi-Conditional Molecular Generation [85.6] 本研究では,具体的スコアを用いてスコアマッチングを離散グラフに拡張するComposable Score-based Graph Diffusion Model (CSGD)を提案する。
CSGDは従来の手法よりも平均15.3%の制御性向上を実現していることを示す。
本研究は, 離散グラフ生成におけるスコアベースモデリングの実用的利点と, フレキシブルでマルチプロパタイトな分子設計のためのキャパシティを強調した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:50:08 GMT)
LoRACLR: Contrastive Adaptation for Customization of Diffusion Models [84.0] LoRACLRは、複数のLoRAモデルを単一の統一モデルにマージする、マルチコンセプト画像生成の新しいアプローチである。
LoRACLRは、これらのモデルの重み空間を整列し、マージするために対照的な目的を使い、干渉を最小限にしながら互換性を確保する。
本結果は,複数の概念を正確にマージし,パーソナライズされた画像生成能力を向上する上で,LoRACLRの有効性を強調した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:22:31 GMT)
Fine-tuning Done Right in Model Editing [83.8] 大規模な言語モデルを適応するための基礎的な手法であるファインチューニングは、長い間モデル編集には有効ではないと考えられてきた。
ミニバッチ最適化により、標準的な幅優先パイプライン(エポックベース)に微調整を復元する。
我々は、復元された微調整フレームワーク上に構築された、シンプルで効果的なローカライズド編集手法であるLocFT-BFを導出する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:24:21 GMT)
MARCOS: Deep Thinking by Markov Chain of Continuous Thoughts [82.5] 大規模言語モデル(LLM)における推論のための新しいパラダイムを提案する。
自己回帰的にトークンを生成する代わりに、連続的で高次元の「思考」のマルコフ連鎖として推論をモデル化する。
MARCOSはトークンベースのCoTに匹敵する性能を初めて達成し、GSM8Kでは4.7%、推論では15.7倍のスピードアップを達成している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:44:22 GMT)
Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.6] 本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:04:01 GMT)
CoSteer: Collaborative Decoding-Time Personalization via Local Delta Steering [80.5] CoSteerは、ローカライズされたデルタステアリングを通じてデコード時のパーソナライズを可能にする、新しいコラボレーティブフレームワークである。
トークンレベルの最適化をオンライン学習問題として定式化し、ローカルデルタベクトルがリモートLLMのロジットを動的に調整する。
このアプローチは、生のデータや中間ベクトルではなく、最後のステアリングトークンのみを送信することで、プライバシを保護します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:12:58 GMT)
T-MLP: Tailed Multi-Layer Perceptron for Level-of-Detail Signal Representation [79.9] レベル・オブ・ディーテール(LoD)表現は、画像や3次元形状などの様々な種類の信号を効率的にモデル化し、伝達するために重要である。
本研究では,LoD信号の表現が可能な新しいネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:33:20 GMT)
From Single to Multi-Granularity: Toward Long-Term Memory Association and Selection of Conversational Agents [79.9] 大言語モデル(LLM)は会話エージェントで広く採用されている。
MemGASは、多粒度アソシエーション、適応選択、検索を構築することにより、メモリ統合を強化するフレームワークである。
4つの長期メモリベンチマークの実験により、MemGASは質問応答と検索タスクの両方において最先端の手法より優れていることが示された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:51:22 GMT)
LOVE-R1: Advancing Long Video Understanding with an Adaptive Zoom-in Mechanism via Multi-Step Reasoning [73.9] ビデオクリップに適応的にズームイン可能なモデルであるLOVE-R1を提案する。
モデルはまず、密度の高いサンプルフレームが提供されるが、小さな解像度で提供される。
空間的詳細が必要な場合、大きなフレーム解像度で興味のあるクリップを拡大することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:43:55 GMT)
WebWeaver: Structuring Web-Scale Evidence with Dynamic Outlines for Open-Ended Deep Research [73.6] 本稿では,AIエージェントが膨大なWebスケール情報を洞察に富むレポートに合成しなければならない複雑な課題であるtextbfopen-ended Deep Research (OEDR) に取り組む。
人間の研究プロセスをエミュレートする新しいデュアルエージェントフレームワークである textbfWebWeaver を紹介する。
私たちのフレームワークは、DeepResearch Bench、DeepConsult、DeepResearchGymなど、主要なOEDRベンチマークにまたがる最先端の新たなベンチマークを確立しています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:27:58 GMT)
Are You Getting What You Pay For? Auditing Model Substitution in LLM APIs [71.8] LLM(Commercial Large Language Model) APIは基本的な信頼の問題を生み出します。
ユーザーは特定のモデルに課金するが、プロバイダが忠実に提供できることを保証することはない。
我々は,このモデル置換問題を定式化し,現実的な逆条件下での検出方法を評価する。
我々は,信頼された実行環境(TEE)を実用的で堅牢なソリューションとして使用し,評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:54:38 GMT)
RealUnify: Do Unified Models Truly Benefit from Unification? A Comprehensive Benchmark [71.4] 本稿では,双方向機能相乗効果を評価するためのベンチマークであるRealUnifyを紹介する。
RealUnifyは、10のカテゴリと32のサブタスクにまたがる、細心の注意を払ってアノテートされた1000のインスタンスで構成されている。
現在の統一モデルは、効果的な相乗効果を達成するのに依然として苦労しており、アーキテクチャの統一だけでは不十分であることを示している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:07:28 GMT)
Can Large Language Models Express Uncertainty Like Human? [71.3] 我々は,人間に注釈を付けた信頼スコアを持つヘッジ式の最初の多種多様な大規模データセットをリリースする。
現代大言語モデルにまたがる言語信頼に関する最初の体系的研究を行う。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:34:30 GMT)
DPFlow: Adaptive Optical Flow Estimation with a Dual-Pyramid Framework [71.0] 最大8Kの解像度入力を一般化できる適応型光フローアーキテクチャDPFlowを提案する。
また,1Kから8Kまでの入力解像度を持つ光フロー評価のための新しいベンチマークであるKubric-NKを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:03:52 GMT)
InfoBridge: Mutual Information estimation via Bridge Matching [70.7] 拡散ブリッジモデルは、最近、生成モデリングの分野で強力なツールとなっている。
我々は2つの確率変数間の相互情報(MI)の推定にそれらの力を利用する。
従来のMI推定器では,データポーズが困難であった場合の非バイアス推定器を構築した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:44:24 GMT)
Conda: Column-Normalized Adam for Training Large Language Models Faster [70.7] 大規模言語モデル(LLM)は、目覚ましい一般化と創発的能力を示しているが、事前学習は計算コストが高く、最適化のダイナミクスに敏感である。
両アプローチの長所を橋渡しする小説として,textbfColumn-Normalized Adam (Conda) を提案する。
LLaMAとGPT-2シリーズの実験では、コンダはトレーニング前のAdamW、Muon、その他のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:58:19 GMT)
Vision Function Layer in Multimodal LLMs [70.4] 本研究では,マルチモーダル大言語モデル(MLLM)において,視覚関連関数デコーディングが異なるデコーダ層に分散していることを明らかにする。
Visual Token Swappingは、ターゲットのKVキャッシュエントリを変更して、デコード中の層固有の機能を正確に解明する。
本研究は、MLLM視覚処理をより深く理解し、より効率的で解釈可能で堅牢なモデルの作成を促進する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:45:35 GMT)
From $f(x)$ and $g(x)$ to $f(g(x))$: LLMs Learn New Skills in RL by Composing Old Ones [68.7] LLMは、既存のスキルを組み込むことで、RL中に真に新しいスキルを身につけることができることを示す。
実験により、ソースタスクで得られた構成スキルが、異なるターゲットタスクに転送されることを示す。
この転送は、ターゲットに対する構成的なトレーニングなしでも行われ、ターゲットの原子スキルに関する事前の知識のみを必要とする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:44:27 GMT)
Interpretable 3D Neural Object Volumes for Robust Conceptual Reasoning [68.3] CAVE(Concept Aware Volumes for Explanations)は、画像分類における解釈可能性と堅牢性を統一する新しい方向である。
本稿では,概念の空間的整合性を測定する尺度である3次元整合性(3D-C)を提案する。
CAVEは、様々なOOD設定における画像間の一貫性と意味のある概念を発見しながら、競争力のある分類性能を達成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:24:06 GMT)
PoseDiff: A Unified Diffusion Model Bridging Robot Pose Estimation and Video-to-Action Control [67.2] 本稿では,ロボットの状態推定と制御を単一のフレームワーク内で統一する条件拡散モデルPoseDiffを提案する。
中心となるPoseDiffは、生の視覚を3Dキーポイントや関節角などの構造化されたロボットの状態にマッピングする。
この基盤の上に構築されたPoseDiffは、ビデオからアクションへの逆ダイナミクスに自然に拡張する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:55:48 GMT)
LatentEvolve: Self-Evolving Test-Time Scaling in Latent Space [66.7] Test-timeScaling (TTS) は、モデルパラメータを変更することなく、推論フェーズにおけるLarge Language Models (LLM) の推論能力を著しく向上することが実証されている。
本稿では,補完学習システム理論に触発された自己進化型潜在TSフレームワークであるLatentEvolveを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:37:39 GMT)
Convergence of Clipped-SGD for Convex $(L_0,L_1)$-Smooth Optimization with Heavy-Tailed Noise [65.4] Clip-SGDのようなクリッピングを持つ一階法は、$(L_$1)$-smoothnessの仮定の下でSGDよりも強い収束保証を示す。
Clip-SGD の高確率収束バウンダリを凸 $(L_$1)$-smooth の重み付き雑音による最適化に適用した最初の高確率収束バウンダリを確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:31:12 GMT)
Prediction-Powered Communication with Distortion Guarantees [65.4] 本研究では,デバイスが厳密な歪み保証付きゼロ遅延制約の下で通信する,予測駆動型通信環境について検討する。
本稿では,オンラインコンフォメーション予測を利用した2つのゼロ遅延圧縮アルゴリズムを提案する。
セマンティックテキスト圧縮の実験は、そのアプローチを検証し、ビットレートの大幅な削減を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:19:39 GMT)
PhysicsMinions: Winning Gold Medals in the Latest Physics Olympiads with a Coevolutionary Multimodal Multi-Agent System [65.0] 物理は現実世界の理解と形成の中心であり、物理問題を解く能力は現実世界の物理知能の重要な指標である。
既存のアプローチは主にシングルモデルベースであり、オープンソースのMLLMはゴールドメディカルレベルのパフォーマンスに達することは滅多にない。
我々は,物理オリンピアードの共進化的マルチエージェントシステムであるPhysorMinionsを提案する。
アーキテクチャには、ダイアグラムを解釈するVisual Studio、ソリューションを定式化するLogic Studio、デュアルステージ検証を実行するReview Studioの3つのシナジスティックスタジオがある。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:40:53 GMT)
MGM-Omni: Scaling Omni LLMs to Personalized Long-Horizon Speech [64.9] MGM-オムニ (MGM-Omni) は、Omni-modalな理解と表現力のある長距離音声生成のための統一オムニLLMである。
MGM-Omniは、リアルタイム音声生成からマルチモーダル推論をきれいに分離するデュアルトラックのトークンベースのアーキテクチャを採用している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:48:28 GMT)
Group-Relative REINFORCE Is Secretly an Off-Policy Algorithm: Demystifying Some Myths About GRPO and Its Friends [64.7] 大規模言語モデル(LLM)の非政治強化学習が注目されている。
本稿では,特定のトレーニングデータ分布を仮定することなく,グループ化型REINFORCEの第一原理導出について述べる。
この観点は、REINFORCEを非政治的な設定に適応するための2つの一般的な原則をもたらす。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:34:54 GMT)
UniTraj: Learning a Universal Trajectory Foundation Model from Billion-Scale Worldwide Traces [64.2] ユニバーサルな軌跡基礎モデルを構築することは、既存の軌跡モデリングアプローチの限界に対処するための有望な解決策である。
以下、UniTrajを紹介します。UniTrajは3つの重要なイノベーションを通じてこれらの制限に対処することを目的としています。
まず、70か国にまたがる数十億のGPSポイントを持つ、前例のない245万のトラジェクトリのデータセットであるWorldTraceを構築します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:43:00 GMT)
Specialization after Generalization: Towards Understanding Test-Time Training in Foundation Models [64.0] 最近の研究は、テストタイムトレーニング(TTT)として知られる特定のタスクに対して、テストタイムでモデルをトレーニングし続けるというアイデアを探求している。
本稿では,TTTがグローバルトレーニングよりもはるかに小さな分布内テスト誤差を達成できるモデルを提案する。
我々は、ImageNet上でスパースオートエンコーダをトレーニングすることで、モデルの主要な仮定を実証的に検証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:24:52 GMT)
Asymmetric VAE for One-Step Video Super-Resolution Acceleration [63.4] 本稿では,高圧縮VAEを実装することにより,計算コストを大幅に削減するFastVSRを提案する。
FastVSRは、マルチステップモデルに比べて111.9倍、既存のワンステップモデルより3.92倍のスピードアップを実現している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:36:14 GMT)
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model [63.1] KaLM-Embedding-V2は、汎用的でコンパクトな埋め込みモデルである。
0.5Bのコンパクトなサイズでモデルを実装し,固定長埋め込みを実現する。
トレーニングデータでは, プレトレーニング用20種, 微調整用100種, コントラスト蒸留用100種をキュレートする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:52:44 GMT)
PHASE-Net: Physics-Grounded Harmonic Attention System for Efficient Remote Photoplethysmography Measurement [63.0] 既存のディープラーニング手法は、主に生理学的モニタリングであり、理論的な堅牢性を欠いている。
本研究では,Navier-Stokes方程式のヘモダイナミックスから導かれる物理インフォームド r パラダイムを提案し,パルス信号が2次系に従うことを示す。
これは、時間的円錐ネットワーク(TCN)を使用する理論的正当性を提供する。
Phase-Netは高い効率で最先端のパフォーマンスを実現し、理論上は基礎的でデプロイ可能な r ソリューションを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:36:45 GMT)
AdvChain: Adversarial Chain-of-Thought Tuning for Robust Safety Alignment of Large Reasoning Models [62.7] 本稿では,逆CoTチューニングによる動的自己補正をモデルに教えるアライメントパラダイムであるAdvChainを提案する。
私たちの仕事は、より堅牢で信頼性の高い推論モデルを構築するための新しい方向性を確立します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:27:23 GMT)
UniF$^2$ace: A Unified Fine-grained Face Understanding and Generation Model [62.7] 本稿では,2次元離散拡散(D3Diff)損失を伴う新しい理論枠組みを導入し,離散的なスコアマッチング拡散を伴うマスク付き生成モデルを統一する。
このD3Diffは、テキスト入力に沿った高忠実度顔の詳細を合成するモデルの能力を大幅に向上させる。
提案するUniF$2$aceD-1Mは,130Kの微細な画像キャプチャ対と100Mの視覚的質問応答対からなる大規模データセットである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:12:48 GMT)
AnesSuite: A Comprehensive Benchmark and Dataset Suite for Anesthesiology Reasoning in LLMs [62.6] AnesSuiteは、LSMの麻酔学推論用に特別に設計された最初のデータセットスイートである。
Morpheusは麻酔学の推論のための最初のベースラインモデルコレクションである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:08:42 GMT)
FrameThinker: Learning to Think with Long Videos via Multi-Turn Frame Spotlighting [62.3] 本稿では,長編ビデオによる思考の概念を紹介し,新しいフレームワークFrameThinkerを提案する。
FrameThinkerは,処理フレーム数を劇的に削減しつつ,ベースラインよりも+10.4%の大幅な平均改善を実現していることを示す。
最も注目すべきは、7BモデルであるFrameThinkerがLongVideo-Reason上で新しい最先端技術を確立し、平均20.6フレームで76.1%の精度を実現したことです。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:36:58 GMT)
Where LLM Agents Fail and How They can Learn From Failures [62.2] 大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:20:27 GMT)
Perceive, Reflect and Understand Long Video: Progressive Multi-Granular Clue Exploration with Interactive Agents [60.1] 時間的およびスパースなタスク関連情報を特徴とするロングビデオは、AIシステムに重大な推論課題を生じさせる。
人間のプログレッシブな視覚認知にインスパイアされ、我々はCogniGPTを効率的で信頼性の高い長時間ビデオ理解のために提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:42:55 GMT)
LLMs4All: A Review on Large Language Models for Research and Applications in Academic Disciplines [60.0] ChatGPTのようなLLM(Large Language Models)ベースのアプリケーションは、人間のような会話を生成する能力を示している。
本稿では,最先端のLDMの概要と,幅広い学術分野への統合について述べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:13:52 GMT)
Pyramid Token Pruning for High-Resolution Large Vision-Language Models via Region, Token, and Instruction-Guided Importance [60.0] Pyramid Token Pruning (PTP) は、階層的にボトムアップの視覚的サリエンスとトークンレベルをトップダウンの指導誘導の関連性と統合する、トレーニング不要の戦略である。
PTPは計算コスト、メモリ使用量、推論遅延を大幅に削減し、性能劣化を無視できることを示した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:29:36 GMT)
HERO: Rethinking Visual Token Early Dropping in High-Resolution Large Vision-Language Models [60.0] 本稿では,コンテンツ適応型トークン予算配分と関数対応トークン選択を統合したフレームワークHEROを提案する。
本研究は、HR-LVLMにおける効率的な推論に対する経験的洞察と実践的解決策の両方を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:44:42 GMT)
From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [59.9] MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。
情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。
この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:25:40 GMT)
GSM8K-V: Can Vision Language Models Solve Grade School Math Word Problems in Visual Contexts [59.5] GSM8K-Vは、純粋に視覚的なマルチイメージの数学的推論ベンチマークである。
GSM8K-Vは、広く使われているテキストベースのGSM8Kからサンプルを視覚的にマッピングすることで構築される。
我々は,GSM8K-V上で,幅広いオープンソースおよびクローズドソースモデルを評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:57:05 GMT)
Pushing LLMs to Their Logical Reasoning Bound: The Role of Data Reasoning Intensity [59.3] データ推論強度 (Data Reasoning Intensity, DRI) は, サンプルの潜在論理的推論複雑性を定量化する新しい指標である。
次に、学習データの論理的推論強度を体系的に強化する再認識最適化戦略を導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:20:04 GMT)
Federated Learning Resilient to Byzantine Attacks and Data Heterogeneity [59.2] 本稿では、データに対する悪意ある攻撃の文脈におけるグラディエント学習(FL)について述べる。
本稿では,収束解析と損失関数の中央値を用いた新しい平均ロバストアルゴリズム(RAGA)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:52:22 GMT)
Overlap-Adaptive Regularization for Conditional Average Treatment Effect Estimation [59.2] CATE推定のための最先端の手法は、しばしば低い重なり合いの存在下では性能が良くない。
重み付け重み付けに比例して対象モデルを正規化するオーバーラップ適応正規化(OAR)を導入する。
我々のOARは定値化に比べて低オーバーラップ設定でのCATE推定を大幅に改善する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:56:24 GMT)
Seeing Before Reasoning: A Unified Framework for Generalizable and Explainable Fake Image Detection [58.8] この失敗の根源は、根本的なミスマッチにある、と私たちは主張する。
本稿では,偽画像検出のための汎用的で説明可能な,会話型アシスタントであるForensic-Chatを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:59:19 GMT)
PixelCraft: A Multi-Agent System for High-Fidelity Visual Reasoning on Structured Images [58.7] PixelCraftは、高忠実度画像処理と、構造化画像に対する柔軟な視覚的推論のための、新しいマルチエージェントシステムである。
この基盤の上に構築されたPixelCraftは、ツールの選択、エージェントの議論、自己批判といった3段階の動的なワークフローを通じて、視覚的推論を容易にする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:49 GMT)
MobileLLM-R1: Exploring the Limits of Sub-Billion Language Model Reasoners with Open Training Recipes [58.7] 強い推論能力は、はるかに少ないデータで実現可能であることを示す。
MobileLLM-R50MのAIMEスコアは15.5であり、OLMo-2-1.48Bは0.6、SmolLM-2-1.7Bは0.3である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:43:59 GMT)
A Double Machine Learning Approach to Combining Experimental and Observational Data [58.1] 実験と観測を組み合わせた二重機械学習手法を提案する。
本フレームワークは, より軽度な仮定の下で, 外部の妥当性と無知性に対するファルシフィケーションテストを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:11:39 GMT)
MoVa: Towards Generalizable Classification of Human Morals and Values [57.9] MoVaは、人間の道徳と価値観の一般化可能な分類のための、文書化されたリソーススイートである。
MoVaのデータと手法は、人間と機械のコミュニケーションを細かく解釈するのに役立つ。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:56:27 GMT)
Can Language Models Discover Scaling Laws? [57.8] 本稿では,拡張法則モデルとパラメータを協調的に最適化し,変数間の複雑な関係を自律的に探索する進化型エージェントSLDAgentを紹介する。
SLDAgentが、確立された人間由来の法則よりも、一貫して正確な外挿を示す法則を自動的に発見できることを、初めて実証した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:57:00 GMT)
G-CUT3R: Guided 3D Reconstruction with Camera and Depth Prior Integration [57.7] G-CUT3Rは,ガイド付き3次元シーン再構成のための新しいフィードフォワード手法である。
入力画像のみに依存する既存のフィードフォワード法とは異なり,本手法では奥行き,カメラキャリブレーション,カメラ位置などの補助的データを活用する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:37:18 GMT)
Diffusion Bridge or Flow Matching? A Unifying Framework and Comparative Analysis [57.6] 拡散ブリッジとフローマッチングは、任意の分布間の変換において魅力的な経験的性能を示した。
我々は,これらのフレームワークを最適制御のレンズを通して再キャストし,拡散橋のコスト関数が低いことを証明した。
これらの理論的主張を裏付けるために,潜伏変圧器上に構築された拡散橋の新しい強力なアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:45:22 GMT)
Towards Personalized Deep Research: Benchmarks and Evaluations [56.6] 我々は、Deep Research Agents(DRA)におけるパーソナライズ評価のための最初のベンチマークであるPersonalized Deep Research Benchを紹介する。
さまざまな研究タスク50と、構造化されたペルソナ属性と動的現実世界のコンテキストを組み合わせた25のユーザプロファイルを組み合わせ、250のリアルなユーザタスククエリを生成する。
さまざまなシステムの実験は、パーソナライズされたディープリサーチを扱う際の現在の能力と限界を強調します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:39:17 GMT)
IWR-Bench: Can LVLMs reconstruct interactive webpage from a user interaction video? [56.0] 本稿では,ビデオからのインタラクティブWebページ再構築におけるLVLM(Large Vision-Language Models)の能力を評価するための新しいベンチマークであるIWR-Benchを紹介する。
IWR-Benchは100の現実世界のウェブサイトから、1,001のアクションを持ち、多様な相互作用の複雑さを特徴とする1,3の精巧にキュレートされたタスクで構成されている。
このベンチマークは、ビデオとアセットからインタラクションロジックを推論する包括的なマルチモーダル推論と、このロジックを関数コードに変換するための高度なコード生成という、2つの基本的な課題に関するモデルを評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:38:06 GMT)
GRAF: Multi-turn Jailbreaking via Global Refinement and Active Fabrication [55.6] 大規模言語モデルは、悪意のある目的のために誤用される可能性があるため、顕著な安全性のリスクを生じさせる。
そこで本研究では,各インタラクションにおける攻撃経路をグローバルに洗練する,新しいマルチターンジェイルブレーキング手法を提案する。
さらに、モデル応答を積極的に作成し、安全性に関する警告を抑えることにより、有害な出力を誘発する可能性を高める。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:39:26 GMT)
EasySteer: A Unified Framework for High-Performance and Extensible LLM Steering [55.6] 大規模言語モデル(LLM)のステアリングは、推論時にモデル動作を制御するための有望なパラダイムとして登場した。
我々は,vLLM上に構築された高性能LLMステアリングのための統合フレームワークであるEasySteerを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:07 GMT)
METok: Multi-Stage Event-based Token Compression for Efficient Long Video Understanding [55.4] トレーニング不要なマルチステージイベントベースのToken圧縮フレームワークであるMETokを提案する。
我々はMETokが情報的視覚トークンを動的に選択することで効率と精度の最適なトレードオフを実現することを示す。
例えば、LongVA-7BをMETokに装備すると、80.6%のFLOPが削減され、93.5%のKVキャッシュメモリが節約される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:20:29 GMT)
DC-VideoGen: Efficient Video Generation with Deep Compression Video Autoencoder [55.3] DC-VideoGenは、事前訓練されたビデオ拡散モデルに適用することができる。
軽量な微調整を施した深部圧縮潜伏空間に適応することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:31 GMT)
Accessible, Realistic, and Fair Evaluation of Positive-Unlabeled Learning Algorithms [54.6] 本稿では,PU学習アルゴリズムを体系的に比較する最初のPU学習ベンチマークを提案する。
PU学習アルゴリズムの現実的かつ公正な評価に影響を及ぼす微妙で重要な要因を同定する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:13:00 GMT)
TemMed-Bench: Evaluating Temporal Medical Image Reasoning in Vision-Language Models [54.5] 既存の医学推論ベンチマークは、主に1回の訪問からの画像に基づいて患者の状態を分析することに焦点を当てている。
臨床訪問における患者の状態の変化を分析するための最初のベンチマークであるTemMed-Benchを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:51:26 GMT)
SVeritas: Benchmark for Robust Speaker Verification under Diverse Conditions [54.3] 話者検証(SV)モデルは、セキュリティ、パーソナライゼーション、アクセス制御システムにますます統合されている。
既存のベンチマークでは、これらの条件のサブセットのみを評価しており、他は完全に欠落している。
SVeritasは、録音時間、自発性、コンテンツ、ノイズ、マイクロホン距離、残響、チャンネルミスマッチ、オーディオ帯域幅、コーデック、話者年齢、スプーフィングおよび敵攻撃に対する感受性などのストレス下でのSVシステムの評価を行う総合的な話者検証タスクベンチマークスイートである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:46:37 GMT)
From Mean to Extreme: Formal Differential Privacy Bounds on the Success of Real-World Data Reconstruction Attacks [54.3] 機械学習における微分プライバシーは、しばしばメンバーシップ推論に対する保証として解釈される。
DP予算を定量的な保護に翻訳することで、データ再構築の脅威を悪化させることは、依然として困難な課題である。
本稿では、実証された"ゼロスクラッチ"攻撃のメカニズムに合わせた、最初の公式なプライバシー境界を導出することで、臨界ギャップを埋める。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:05:04 GMT)
Can Molecular Foundation Models Know What They Don't Know? A Simple Remedy with Preference Optimization [54.2] 既存の基盤モデルと柔軟に統合可能なプラグイン・アンド・プレイモジュールである,分子適応型参照インスタンスランキング(Mole-PAIR)を導入する。
本手法は既存の分子基盤モデルのOOD検出能力を著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:06:52 GMT)
Learning to Interact in World Latent for Team Coordination [53.5] 本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:13:39 GMT)
Reference-Free Rating of LLM Responses via Latent Information [53.5] 本研究では,判断モデルに対して,自由テキスト応答にQuattスケールのスコアを割り当てるよう依頼する一般的な実践について検討する。
次に、内部モデル信号からスカラー評価を導出する潜在裁判官を提案し、評価する。
ペアとシングルレーティングのベンチマークの幅広いスイートの中で、潜在メソッドは標準のプロンプトにマッチするか、超えている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:15:52 GMT)
DAM: Dual Active Learning with Multimodal Foundation Model for Source-Free Domain Adaptation [53.3] ソースフリーアクティブドメイン適応(SFADA)は、アクティブラーニングによって選択された限られた手動ラベルを用いて、ソースモデルから未ラベルのターゲットドメインへの知識伝達を強化する。
マルチモーダル・ファンデーション・モデルを用いたデュアルアクティブ・ラーニング(DAM)を提案する。
大規模な実験では、DAMは既存のメソッドを一貫して上回り、複数のSFADAベンチマークとアクティブな学習戦略で新しい最先端の手法を設定できる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:06:56 GMT)
End-to-End On-Device Quantization-Aware Training for LLMs at Inference Cost [53.3] 量子化対応トレーニング(QAT)は、より原則化されたソリューションを提供するが、バックプロパゲーションに依存しているため、メモリコストは禁じられている。
重み付けとアクティベーション量子化の両方をサポートするゼロオーダー最適化ベースのQATフレームワークであるZeroQATを提案する。
実験の結果、ZeroQATはPTQとQATのベースラインを一貫して上回り、メモリは大幅に削減された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:45:41 GMT)
Towards Safe Reasoning in Large Reasoning Models via Corrective Intervention [53.3] 既存の手法は、安全推論の独特な重要性を軽視し、信頼性を損なうとともに、悪質なユーザに対して安全でない推論がアクセス可能で、悪質なユーザによって悪用された場合、アプリケーションに潜在的なリスクを生じさせることを示す。
我々は、安全トリガー付きコンプライアンスステップを代入し、強い信号による優先学習のためのペアを構築することで、安全推論を強制するアライメント手法であるIntervened Preference Optimization (IPO)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:41:09 GMT)
Pretraining Large Language Models with NVFP4 [53.2] 我々は,NVFP4フォーマットを用いた大規模言語モデル(LLM)の安定かつ高精度な学習手法を提案する。
本手法は,前方と後方の両方で一貫した表現のための2次元量子化方式を統合する。
以上の結果から,NVFP4をベースとしたプレトレーニング技術を用いてトレーニングしたモデルは,FP8ベースラインに匹敵するトレーニング損失とダウンストリームタスクアキュラシーを達成できることが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:53:17 GMT)
IPBench: Benchmarking the Knowledge of Large Language Models in Intellectual Property [53.2] IPBenchはIPタスクの最初の包括的な分類であり、8つのIPメカニズムと20の異なるタスクを含む大規模なベンチマークである。
一般的な目的からドメイン特化まで,チャット指向モデルや推論中心モデルを含む17の主要なLCMをベンチマークする。
以上の結果から,トップパフォーマンスモデルであるDeepSeek-V3の精度は75.8%に過ぎず,改善の余地が大きかったことが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:57:32 GMT)
From Score Distributions to Balance: Plug-and-Play Mixture-of-Experts Routing [52.0] Mixture-of-Experts (MoE)モデルは、各トークンを専門家のサブセットにルーティングすることで、パラメータキャパシティをスケールすることができる。
条件付きルーティングは、推論メモリの負荷をシフトし、デバイスごとに専門家の数を制限する。
本稿では,精度を保ちながら負荷のバランスをとるプラグイン・アンド・プレイ型推論時ルーティングアルゴリズムLASERを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:29:17 GMT)
RADAR: Reasoning-Ability and Difficulty-Aware Routing for Reasoning LLMs [51.9] 本稿では、軽量で解釈可能でスケーラブルなルーティングフレームワークRADAR(Reasoning-Ability and Difficulty-Aware Routing)を提案する。
心理測定にインスパイアされたRADARは、さまざまな予算を持つモデル応答から異なるクエリへのアイテム応答モデルを学ぶ。
我々は8つの広く使われている推論ベンチマークについて広範な実験を行い、最先端のルーティング手法と比較してRADARの優れた性能を実証した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:33:44 GMT)
On the Shape of Latent Variables in a Denoising VAE-MoG: A Posterior Sampling-Based Study [51.6] ガウス前駆体 (VAE-MoG) を用いた変分オートエンコーダの潜時空間を探索する。
モデルが基盤構造をどれだけうまく捉えているかを評価するために、ハミルトンモンテカルロ (HMC) を用いて、クリーンな入力で条件付けられた後続サンプルを描画し、ノイズの多いデータからエンコーダの出力と比較する。
モデルは正確に信号を再構成するが、統計的比較により、潜在空間における明らかなミスマッチが明らかになる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:33:09 GMT)
The Quest for the Right Mediator: Surveying Mechanistic Interpretability Through the Lens of Causal Mediation Analysis [51.0] 本稿では,因果媒介分析に基づく解釈可能性研究の視点を提案する。
本稿では, 原因単位(メディエーター)の種類に応じて分類された解釈可能性の歴史と現状について述べる。
我々は,各メディエータの長所と短所について論じ,特定の種類のメディエータや検索手法が最適であるかどうかについての洞察を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:25:09 GMT)
Proxy-GS: Efficient 3D Gaussian Splatting via Proxy Mesh [51.0] 3Dガウススプラッティングは、レンダリングを実現するための効率的なアプローチとして登場した。
近年の変種は、視覚的忠実度をさらに向上するが、レンダリング中にかなりのデコードオーバーヘッドをもたらす。
コストを軽減するため、いくつかのプルーニング戦略とレベル・オブ・ディーテール(LOD)技術が導入されている。
本稿では,プロキシを利用した新しいパイプラインであるProxy-GSを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:10:07 GMT)
Discovering "Words" in Music: Unsupervised Learning of Compositional Sparse Code for Symbolic Music [50.9] 本稿では,記号的音楽データから「音楽単語」と呼ばれる繰り返しパターンを識別する教師なし機械学習アルゴリズムを提案する。
本稿では,音楽単語発見の課題を統計的最適化問題として定式化し,二段階予測最大化(EM)に基づく学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:10:57 GMT)
Collaborative Gym: A Framework for Enabling and Evaluating Human-Agent Collaboration [50.7] Collaborative Gymは、エージェント、人間、タスク環境間の非同期で三分割的なインタラクションを可能にするフレームワークである。
シミュレーション条件と実環境条件の両方において,Co-Gymを3つの代表的なタスクでインスタンス化する。
その結果、協調作業員はタスクパフォーマンスにおいて、完全に自律的なエージェントよりも一貫して優れていたことが判明した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:38:59 GMT)
Understanding the Dilemma of Unlearning for Large Language Models [50.5] Unlearningは、大きな言語モデル(LLM)から特定の知識を取り除こうとしている。
提案するunPactは,帰納的帰属とコントリビューショントラッキングによるアンラーニングのための解釈可能なフレームワークである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:15:19 GMT)
FreeAction: Training-Free Techniques for Enhanced Fidelity of Trajectory-to-Video Generation [50.4] 本稿では,ロボットビデオ生成における明示的な動作パラメータを完全に活用する2つのトレーニング不要な推論時間手法を提案する。
第一に、アクションスケールの分類器フリーガイダンスは、動作の大きさに比例して誘導強度を動的に調整し、運動強度に対する制御性を高める。
第二に、アクションスケールノイズトランケーションは、初期サンプルノイズの分布を調整し、所望の運動力学とよりよく一致させる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:30:40 GMT)
DiffuGuard: How Intrinsic Safety is Lost and Found in Diffusion Large Language Models [50.2] 我々は、ステップ内およびステップ間ダイナミクスという2つの異なる次元にわたるジェイルブレイク攻撃に対して、dLLM脆弱性の詳細な分析を行う。
デュアルステージアプローチによる脆弱性に対処する,トレーニング不要な防御フレームワークであるDiffuGuardを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:17:10 GMT)
Plan before Solving: Problem-Aware Strategy Routing for Mathematical Reasoning with LLMs [50.0] 既存の手法は通常、数学的推論を行うためにLLM(Large Language Models)をガイドするための固定戦略を利用する。
分析の結果,単一戦略は問題固有の要件に適応できず,有効性と効率性のトレードオフを見落としていることが明らかとなった。
本稿では,PRISM(Planning and Routing through Instance-Specific Modeling)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:22:41 GMT)
VITA: Zero-Shot Value Functions via Test-Time Adaptation of Vision-Language Models [49.8] VITAはゼロショット値関数学習法であり、テスト時間適応によって両方の能力を増強する。
オフライン強化学習において,VITAのゼロショット値推定が報酬形成に有効であることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:07:30 GMT)
From Static to Dynamic: Adaptive Monte Carlo Search for Mathematical Process Supervision [49.6] 既存手法は, 定予算サンプリング戦略に基づいて, 推論ステップの質を推定する。
本稿では,データ生成を静的から適応に変換するフレームワークであるAdaptive Monte Carlo Search (AMCS)を提案する。
AMCSは、より多くのサンプルを不確実な推論ステップに割り当てることによって、予測を適応的に洗練し、予測しやすくする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:52:35 GMT)
VT-FSL: Bridging Vision and Text with LLMs for Few-Shot Learning [49.3] 少数のラベル付きサポートサンプルから新しい概念を認識することを目的としている。
近年の研究では、追加の意味情報を組み込んだり、複雑な意味融合モジュールを設計することでサポート機能を強化している。
本稿では,Few-Shot Learningのための大規模言語モデルを用いた視覚とテキストをブリッジする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:52:47 GMT)
CDT: A Comprehensive Capability Framework for Large Language Models Across Cognition, Domain, and Task [49.3] LLM(Large Language Models)の最近の進歩は、その能力を大幅に強化している。
既存のベンチマークでは、LLM能力を評価するための総合的なフレームワークが欠如しているため、孤立した能力に重点を置いていることが多い。
本稿では,3次元にまたがるモデルの性能を包括的に測定するコグニション・ドメイン・タスク(CDT)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:10:29 GMT)
On The Sample Complexity Bounds In Bilevel Reinforcement Learning [49.2] 二段階強化学習(BRL)は、生成モデルを調整するための強力なフレームワークとして登場した。
連続状態-作用複雑性において$mathcalO(epsilon)$の最初のサンプルを示す。
我々の分析は、既存の$mathcalO(epsilon)$のバウンダリで、複雑さを改善します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:26:00 GMT)
FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.2] 本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:23:44 GMT)
SpinBench: Perspective and Rotation as a Lens on Spatial Reasoning in VLMs [49.1] 視覚言語モデル(VLM)における空間推論評価のための診断ベンチマークであるSpinBenchを提案する。
パースペクティブ・テイクは複数の認知機能を必要とするため、SpinBenchは一連のきめ細かい診断カテゴリを導入している。
結果は、強い自我中心バイアス、低い自我的理解、対称的・統語的改革の下での不整合など、体系的な弱点を明らかにしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:48:16 GMT)
ReCogDrive: A Reinforced Cognitive Framework for End-to-End Autonomous Driving [49.1] ReCogDriveは、エンドツーエンドの自動運転のための新しい強化認知フレームワークである。
我々は、人間のドライバーのシーケンシャルな認知過程を模倣する階層的なデータパイプラインを導入する。
次に、VLMの学習した運転先を拡散プランナーに注入することで、言語行動ミスマッチに対処する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:21:41 GMT)
RIFLE: Removal of Image Flicker-Banding via Latent Diffusion Enhancement [49.0] FB(Flicker-banding)は、カメラのローリングシャッター読み出しとディスプレイの明るさ変調との間の時間的エイリアスから生じる明るさ%u2013darkストライプを交互に変化させる。
我々は、FB除去を専用修復タスクとして定式化し、遅延拡散拡張(RIFLE)による画像フリッカバンディングの除去を導入する。
我々の知る限りでは、FBのシミュレーションと除去の研究は初めてである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:53:13 GMT)
Deepfake Detection that Generalizes Across Benchmarks [48.9] ディープフェイク検出器の非表示操作技術への一般化は、実用的展開の課題である。
この研究は、基礎となる事前学習された視覚エンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:25:32 GMT)
Flash-Searcher: Fast and Effective Web Agents via DAG-Based Parallel Execution [48.8] Flash-Searcherは、新しい並列エージェント推論フレームワークである。
複雑なタスクを明示的な依存関係でサブタスクに分解し、独立した推論パスの同時実行を可能にする。
BrowseCompでは67.7%の精度で、xbench-DeepSearchでは83%、エージェントの実行手順は現在のフレームワークに比べて最大35%削減されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:39:30 GMT)
GLEAM: Learning Generalizable Exploration Policy for Active Mapping in Complex 3D Indoor Scenes [48.7] 複雑な未知環境における一般化可能なアクティブマッピングは、移動ロボットにとって重要な課題である。
我々は、アクティブマッピングのための統一的な一般化可能な探索ポリシーであるGLEAMを紹介する。
最先端の手法を大きく上回り、66.50%のカバレッジ(+9.49%)を効率の良い軌道で達成し、128の複雑なシーンでのマッピング精度を改善した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:57:24 GMT)
Recent Advances in Large Langauge Model Benchmarks against Data Contamination: From Static to Dynamic Evaluation [48.4] データ汚染リスクの低減を目的とした静的・動的ベンチマーク手法の詳細な分析を行う。
本稿では、動的ベンチマークのための最適設計原則のシリーズを提案し、既存の動的ベンチマークの限界を解析する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:26:23 GMT)
NeRV-Diffusion: Diffuse Implicit Neural Representations for Video Synthesis [48.4] NeRV-Diffusionは暗黙の潜伏ビデオ拡散モデルであり、ニューラルネットワークの重みを生成することによってビデオを合成する。
フレームワイドな特徴マップにビデオをエンコードする従来のビデオトークンとは対照的に、NEV-Diffusionは圧縮して、統一されたニューラルネットワークとしてビデオを生成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:53:08 GMT)
LLM DNA: Tracing Model Evolution via Functional Representations [48.3] 生物DNAを用いてLLMDNAを機能行動の低次元バイリプシッツ表現として定義する。
大規模言語モデルからDNAを抽出するための、汎用的でスケーラブルで、トレーニング不要なパイプラインを導出する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:09:57 GMT)
NeMo: Needle in a Montage for Video-Language Understanding [48.2] ビデオ大言語モデル(VideoLLM)の最近の進歩は、ビデオ言語理解における複雑な時間的推論のための新しい評価プロトコルとベンチマークを求めている。
我々は,ビデオLLMの批判的推論能力を評価するために,NeMo(Needle in a Montage)という新しいタスクを導入した。
タスクを中心としたビデオ言語ベンチマークであるNeMoBenchを紹介します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:16:05 GMT)
Medical Red Teaming Protocol of Language Models: On the Importance of User Perspectives in Healthcare Settings [48.1] 本稿では,患者と臨床医の両方の視点で医療領域に適した安全評価プロトコルを提案する。
医療用LLMの安全性評価基準を3つの異なる視点を取り入れたレッドチームで定義した最初の研究である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:53:08 GMT)
PartSAM: A Scalable Promptable Part Segmentation Model Trained on Native 3D Data [47.6] 大規模3次元データに基づいてトレーニングされた最初のプロンプト可能なパートセグメンテーションモデルであるPartSAMを提案する。
PartSAMはエンコーダ・デコーダアーキテクチャを採用しており、三面体をベースとしたデュアルブランチ・エンコーダが空間的に構造化されたトークンを生成する。
大規模監視を実現するために,500万以上の3次元形状部品対をキュレートしたループ型アノテーションパイプラインを導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:34:25 GMT)
Random Policy Valuation is Enough for LLM Reasoning with Verifiable Rewards [47.6] 逆推論のためのランダムポリシー評価(ROVER)について紹介する。
ROVERは、一様政体Q値上のソフトマックスから作用をサンプリングする最小限だが高効率なRL法である。
textbfquality(textbf+8.2 on pass@1, textbf+16.8 on pass@256)と textbfdiversity(textbf+17.6%)の両方で優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:09:07 GMT)
Towards Evaluting Fake Reasoning Bias in Language Models [47.5] 論理に欠陥がある場合でも、モデルが推論の表面構造を好むことを示す。
我々は、Fake Reasoning Bias(FRB)を体系的に調査するベンチマークTheATERを紹介する。
我々は、主観的DPOと実データの両方で17の高度な大言語モデル(LRM)を評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:56:13 GMT)
AlignX: Advancing Multilingual Large Language Models with Multilingual Representation Alignment [46.9] 多言語大言語モデル(LLM)には、印象的な多言語理解と生成能力がある。
LLMのパフォーマンスと言語間アライメントは、非支配言語ではしばしば遅れる。
2段階の表現レベルフレームワークである多言語のパフォーマンスギャップを橋渡しするために,AlignXを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:37:46 GMT)
NeoWorld: Neural Simulation of Explorable Virtual Worlds via Progressive 3D Unfolding [46.8] 単一入力画像からインタラクティブな3D仮想世界を生成するためのフレームワークであるNeoWorldを紹介する。
SF小説『Simulacron-3』(1964年)のオンデマンド・ワールドビルディングの概念に触発され、我々のシステムは広大な環境を構築する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:24:28 GMT)
On the Self-awareness of Large Reasoning Models' Capability Boundaries [46.7] 本稿では,Large Reasoning Models (LRM) が機能境界の自己認識性を持っているかを検討する。
ブラックボックスモデルでは、推論式は境界信号を明らかにし、解決不可能な問題に対する信頼軌道は加速するが、解決不可能な問題に対する収束不確実軌道は加速する。
ホワイトボックスモデルでは,最後の入力トークンの隠れ状態が境界情報を符号化し,解答可能かつ解答不能な問題を推論開始前に線形分離可能であることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:40:47 GMT)
Signal in the Noise: Polysemantic Interference Transfers and Predicts Cross-Model Influence [46.5] 多意味性は言語モデルに広く浸透しており、解釈とモデル行動制御の大きな課題である。
2つの小さなモデルの多意味的トポロジをマッピングし、意味的に無関係だがモデル内の干渉を示す特徴対を同定する。
我々は4つのloci(prompt, token, feature, neuron)に介入し、次のトーケン予測分布における変化を計測し、これらのモデルに体系的な脆弱性を露呈する多意味構造を明らかにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:04:15 GMT)
Visual Planning: Let's Think Only with Images [46.5] 我々は、特に空間的情報や幾何学的情報を含むタスクにおいて、言語が推論において最も自然で効果的なモダリティであるとは限らないと論じる。
そこで我々は,これらの「ビジョンファースト」タスクを純粋に視覚的に表現して計画できる新しいパラダイム「ビジュアルプランニング」を提案する。
このパラダイムでは、計画は視覚領域におけるステップバイステップの推論を符号化する一連の画像を通して実行される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:21:01 GMT)
A Survey on Stereotype Detection in Natural Language Processing [46.3] ステレオタイプは社会的知覚に影響を与え、差別や暴力へとエスカレートする。
この研究は、心理学、社会学、哲学からの定義を分析し、既存の研究を調査する。
発見は、偏見のエスカレーションやヘイトスピーチの台頭を防ぐための早期監視ツールとしてステレオタイプ検出を強調している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:08:35 GMT)
UniPruning: Unifying Local Metric and Global Feedback for Scalable Sparse LLMs [46.1] 大規模言語モデル (LLM) は様々なタスクにまたがって高いパフォーマンスを達成するが、計算とメモリのコストは禁じられている。
We present UniPruning, a unified post-training pruning framework that with the speed of local saliency metrics and the stability of global coordinate。
UniPruningは、競争力または優れたパープレクティリティとゼロショットの精度を一貫して提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:38:28 GMT)
TDRM: Smooth Reward Models with Temporal Difference for LLM RL and Inference [46.0] 我々は、よりスムーズで信頼性の高い報酬モデルを学ぶ方法であるTDRMを紹介する。
実験の結果、TD訓練プロセス報酬モデル(PRM)はBest-of-N(最大6.6%)とツリーサーチ(最大23.7%)でのパフォーマンスを向上させることが示された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:46:05 GMT)
Not All Models Suit Expert Offloading: On Local Routing Consistency of Mixture-of-Expert Models [45.7] Mixture-of-Experts (MoE) は、推論中に専門家がわずかに活性化された大きな言語モデルの効率的なスケーリングを可能にする。
多くのシステムでは,専門家のサブセットを高速メモリにキャッシュする*専門家オフロード*を導入している。
各層にMoEを適用し、共有専門家を使用しないモデルは、最も高い局所的なルーティング一貫性を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:15:49 GMT)
Struct2D: A Perception-Guided Framework for Spatial Reasoning in Large Multimodal Models [45.7] Struct2Dは、バードアイビュー(BEV)イメージとオブジェクトマークとオブジェクト中心のメタデータを組み合わせた知覚誘導プロンプトフレームワークである。
その結果,LMMは2次元入力を構造化した場合,驚くほど強い空間推論能力を示すことがわかった。
オープンソースのLMM(Qwen2.5VL)をStruct2D-Set上で微調整し、複数のベンチマークで競合性能を実現する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:39:08 GMT)
OpenGPT-4o-Image: A Comprehensive Dataset for Advanced Image Generation and Editing [45.5] 本稿では,新しい手法を用いて構築した大規模データセットOpenGPT-4o-Imageを紹介する。
制御された多様性を持つ80kの高品質な命令イメージペアを生成し、11の主要ドメインと51のサブタスクをカバーする。
私たちの研究は、マルチモーダルAI能力を前進させる上で、システマティックなデータ構築が鍵であることを実証しています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:11:09 GMT)
MobileIPL: Enhancing Mobile Agents Thinking Process via Iterative Preference Learning [45.5] The Chain of Action-Planning Thoughts (CoaT) paradigm has been shown to improve the reasoning performance of VLM-based mobile agent in GUI task。
対話型サンプリングによりCoaTツリーを構築し,ルールベース報酬を用いて葉ノードをスコアし,フィードバックをバックプロパゲートして思考レベル直接選好最適化(T-DPO)のペアを導出する反復選好学習(IPL)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:49:00 GMT)
MASLegalBench: Benchmarking Multi-Agent Systems in Deductive Legal Reasoning [45.4] 大規模言語モデル(LLM)の顕著な機能を活用するマルチエージェントシステム(MAS)は、複雑なタスクに対処する大きな可能性を示している。
従来の研究でLLMエージェントの法的なベンチマークが開発されたが、MASの独特な利点を考えるために特別に設計されたものはない。
提案するMASLegalBenchは,MASに適した法的なベンチマークであり,帰納的推論手法を用いて設計されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:24:40 GMT)
The Era of Real-World Human Interaction: RL from User Conversations [45.2] In-the-wild user conversation から直接学習するパラダイムである Reinforcement Learning from Human Interaction (RLHI) を紹介する。
本研究では,(1)ユーザの自然言語フォローアップ応答に基づいて不満足なモデル出力を更新するユーザガイドリライトを用いたRLHI,(2)ユーザベースリワードを用いたRLHIの2つの補完手法を開発する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:50:31 GMT)
Fast Feature Field ($\text{F}^3$): A Predictive Representation of Events [44.7] 本稿では,イベントベースカメラからのデータ表現を構築するための数学的議論とアルゴリズムを開発する。
我々は、過去の出来事から将来の出来事を予測することでこの表現を学び、シーン構造と動き情報を保存することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:52:31 GMT)
Measurement-induced phase transition in interacting bosons from most likely quantum trajectory [44.6] 量子軌跡の確率分布からそのような軌跡を同定する方法を示す。
ガウス理論の場合、この方法を正確に証明し、相互作用するSine-Gordonモデルに拡張する。
このフレームワークではもはや正確ではないが、この手法は自己一貫性のある時間依存調和近似を通して力学を捉える。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:37:01 GMT)
$\mathbf{Li_2}$: A Framework on Dynamics of Feature Emergence and Delayed Generalization [44.6] 本稿では,複雑な構造化された入力に対して,どのような特徴が現れるのか,どのような条件でトレーニングから発生するのか,といった特徴を特徴付ける新しい枠組みを提案する。
これらの局所オプティマ誘導特徴が一般化可能か,その表現力,および群演算タスクにおけるサンプルサイズの変化について検討する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:29:44 GMT)
From Generation to Judgment: Opportunities and Challenges of LLM-as-a-judge [43.3] 人工知能(AI)と自然言語処理(NLP)において、長い間、評価と評価が重要な課題であった。
大規模言語モデル(LLM)の最近の進歩は"LLM-as-a-judge"パラダイムを刺激している。
LLMは、さまざまな機械学習評価シナリオのスコア付け、ランキング、選択を行うために活用される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:52:21 GMT)
Evaluating and Steering Modality Preferences in Multimodal Large Language Model [42.8] マルチモーダル大言語モデル(MLLM)は、マルチモーダルコンテキストを持つ複雑なタスクにおいて顕著なパフォーマンスを実現している。
実験対象のMLLMは, すべて明らかなモダリティバイアスを示し, 外部介入の影響を受けやすいことがわかった。
本稿では,モダリティの選好を明示的に制御するための表現工学に基づく探索・操舵手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:28:30 GMT)
Scaling Behaviors of LLM Reinforcement Learning Post-Training: An Empirical Study in Mathematical Reasoning [42.8] 我々は、モデルスケール、データボリューム、計算予算がどのように相互作用し、パフォーマンスを形作るかを研究する。
より少ないステップでトレーニングされたより大きなモデルは、より多くのステップでトレーニングされた小さなモデルよりも一貫して優れています。
データ制約されたレシエーションでは、高品質なデータの繰り返し再利用は極めて効果的である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:10:35 GMT)
Wavelet-Assisted Mamba for Satellite-Derived Sea Surface Temperature Super-Resolution [42.4] 衛星海面温度(SST)データに対するウェーブレット支援マンバ超解法(WMSR)フレームワークを提案する。
WMSRには、低周波状態空間モジュール(LFSSM)と高周波拡張モジュール(HFEM)の2つの重要なコンポーネントが含まれている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:33:07 GMT)
GLASS Flows: Transition Sampling for Alignment of Flow and Diffusion Models [42.2] GLASS Flowsは「フローマッチングモデル」をシミュレートしてマルコフ遷移をサンプリングする新しいサンプリングパラダイムである。
大規模テキスト・画像モデルでは,GLASSフローが進化と効率のトレードオフをなくすことが示されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:58:36 GMT)
Let Physics Guide Your Protein Flows: Topology-aware Unfolding and Generation [42.1] 拡散に基づく生成モデルはタンパク質の設計に革命をもたらし、新しいタンパク質の創出を可能にした。
タンパク質を二次構造に展開する物理的動機付けのない非線形ノイズ発生過程を古典物理学に基礎として導入する。
次に、このプロセスとSE(3)上のフローマッチングパラダイムを統合し、高い忠実度を持つタンパク質のバックボーンの不変分布をモデル化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:31:22 GMT)
Quantum Dynamics with Time-Dependent Neural Quantum States [42.0] 本稿では,時間依存型ニューラル量子状態(NQS)シミュレーションの実証について述べる。
NQSは、ニューラルネットワークアーキテクチャによる波動関数のパラメータ化を利用する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:50:02 GMT)
Safety is Not Only About Refusal: Reasoning-Enhanced Fine-tuning for Interpretable LLM Safety [41.3] 大きな言語モデル(LLM)は、従来の安全アライメントの弱点を利用するジェイルブレイク攻撃に対して脆弱である。
解釈可能なLLM安全性のための推論強化ファインタニング(Rational)を提案する。
合理的列車は、応答前に明確な安全な推論を行うようにモデル化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:56:50 GMT)
UniVid: The Open-Source Unified Video Model [41.2] MLLMと拡散デコーダを結合した統合アーキテクチャであるUniVidを,軽量なアダプタで実現し,理解と生成を両立させる。
標準ベンチマークの実験では、VBench-Longの総スコアをEasyAnimateV5.1と比べて2.2%改善し、MSVD-QAとActivityNet-QAでは1.0%と3.3%の精度向上を達成した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:31:36 GMT)
Watermark under Fire: A Robustness Evaluation of LLM Watermarking [40.9] WaterParkは10の最先端の透かしと12の代表的な攻撃を統合する統合プラットフォームである。
我々は既存の透かしを総合的に評価し、様々な設計選択が攻撃の堅牢性に与える影響を明らかにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:40:08 GMT)
DS-STAR: Data Science Agent via Iterative Planning and Verification [40.5] DS-STARは,様々なデータフォーマットからコンテキストを自動探索し抽出する新しいデータサイエンスエージェントである。
具体的には,(1)非構造化型を含む多種多様なデータ形式からコンテキストを自動的に探索・抽出するデータファイル解析モジュール,(2)LLMベースの審査員が各段階で解析計画の十分性を評価する検証ステップ,(3)単純で実行可能な計画から始まる逐次計画機構,(3)DS-STARの満足度が検証されるまでそのフィードバックに基づいて反復的に洗練する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:14:15 GMT)
MimicDreamer: Aligning Human and Robot Demonstrations for Scalable VLA Training [40.5] 低コストな人間によるデモンストレーションをロボットで使用可能な監視に変換するフレームワークであるMimicDreamerを提案する。
視覚的アライメントのために,高忠実度ロボットデモビデオを生成するビデオ拡散モデルH2R Alignerを提案する。
視点安定化のためにEgoStabilizerを提案する。
動作アライメントのために,人間の手の動きをロボットフレームにマッピングし,制約付き逆運動学解法を適用する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:03:33 GMT)
Quantum Zeno Effect in the Spatial Evolution of a Single Atom [40.4] 量子ゼノ効果(QZE)は、頻繁な測定が量子進化を抑制することを明らかにしている。
我々は,光双極子トラップを用いて,自由空間における単一冷間原子の運動を研究する。
本研究では,実空間におけるQZEの直接的実験実験を行い,原子運動の計測に基づく制御のための多目的フレームワークを構築した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:23:19 GMT)
Beyond Static Retrieval: Opportunities and Pitfalls of Iterative Retrieval in GraphRAG [40.3] グラフベースのRAG(GraphRAG)は、知識集約型質問応答において、大規模言語モデル(LLM)を改善するための強力なパラダイムである。
反復検索は有望な代替手段として登場したが、GraphRAGにおけるその役割は未だよく分かっていない。
本稿では,グラフベースのバックボーンと異なる戦略がどのように相互作用するかを解析し,グラフRAGにおける反復検索に関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:38:28 GMT)
StorySage: Conversational Autobiography Writing Powered by a Multi-Agent Framework [40.2] StorySageはユーザ主導のソフトウェアシステムで、多様なユーザのニーズを満たすように設計されている。
本システムでは,ユーザの記憶を反復的に収集し,自伝を更新し,今後の会話の計画を立てる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:55:21 GMT)
Multimodal Large Language Models Meet Multimodal Emotion Recognition and Reasoning: A Survey [40.2] AI for Scienceでは、マルチモーダルな感情認識と推論が急速に成長するフロンティアとなっている。
本論文は,マルチモーダル感情認識と推論によるMLLMの交点を包括的に調査する最初の試みである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:13:14 GMT)
From Faithfulness to Correctness: Generative Reward Models that Think Critically [40.1] 本稿では,批判的思考能力を持つ報酬モデルを実現するために,思考監督リワードモデル(TRM)を提案する。
問合せ、回答、支援文書が与えられたとき、TRMはまず各回答文の忠実さを支援文書に評価し、その後、文レベルの正しさを評価するための推論ステップを適用する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:06:56 GMT)
Talk in Pieces, See in Whole: Disentangling and Hierarchical Aggregating Representations for Language-based Object Detection [39.7] 本稿では,言語に基づく物体検出のための文内階層関係に基づく言語表現の再構成を提案する。
重要な洞察は、テキストトークンを中核となる構成要素、属性、関係("talk in pieces")に切り離し、その後階層的に構造化された文レベルの表現に集約する必要性である。
OmniLabelベンチマークによる実験結果は24%のパフォーマンス向上を示し、言語構成の重要性を示している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:14:26 GMT)
Fidelity-Aware Data Composition for Robust Robot Generalization [39.7] 大規模で視覚的に均質なデータセットで訓練された汎用的なロボットポリシーは、学習のショートカットに影響を受けやすい。
本稿では、ロバストな一般化は、原理的、忠実なデータ構成に依存することを示唆する。
本稿では,データ合成を最適化問題として扱うフレームワークであるCoherent Information Fidelity Tuning(CIFT)を紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:48:36 GMT)
World Model for AI Autonomous Navigation in Mechanical Thrombectomy [39.5] モデルベースRLアルゴリズムであるTD-MPC2を用いて,自律型血管内ナビゲーションのための世界モデルを提案する。
SAC(Soft Actor-Critic)法と比較し,複数の血管内ナビゲーションタスクに対して1つのRLエージェントを訓練した。
その結果,TD-MPC2は多タスク学習においてSACを有意に上回り,SACの37%に比べ平均成功率は65%,パス比は顕著に改善した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:21:30 GMT)
Navigate the Unknown: Enhancing LLM Reasoning with Intrinsic Motivation Guided Exploration [39.5] そこで,本研究では,高密度報酬を付与し,RLに基づくパラダイムにおける探索を増幅するために,固有モチベーションギルド探索比N meThOd foR LLM推論(i-MENTOR)を提案する。
4つの公開データセットにわたる実験は、i-MENTORの有効性を示し、AIME 2024で22.23%改善した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:28:15 GMT)
DreamO: A Unified Framework for Image Customization [39.4] 複数の条件をシームレスに統合しながら、幅広いタスクをサポートするために設計された画像カスタマイズフレームワークであるDreamOを紹介する。
具体的には、DreamOは拡散変換器(DiT)フレームワークを使用して、異なるタイプの入力を均一に処理する。
ベースライン整合性を確立するための限られたデータを伴う単純なタスクに焦点を当てた初期段階、カスタマイズ能力を包括的に強化するためのフルスケールトレーニング段階、低品質データによって導入された品質バイアスを補正するための最終品質アライメント段階の3段階からなるプログレッシブトレーニング戦略を採用する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:27:36 GMT)
Knowledge Extraction on Semi-Structured Content: Does It Remain Relevant for Question Answering in the Era of LLMs? [39.4] 大規模言語モデル(LLM)は、半構造化コンテンツに対するWebベースの質問回答システム(QA)を大幅に進歩させた。
本稿では,既存のベンチマークを知識抽出アノテーションで拡張することにより,新たなパラダイムにおける三重抽出の価値について検討する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:39:19 GMT)
GEM: 3D Gaussian Splatting for Efficient and Accurate Cryo-EM Reconstruction [39.1] 核電子顕微鏡(cryo-EM)は高分解能構造生物学の中心的なツールとなっている。
大規模なデータセットは、計算コストとメモリ集約の両方を3D再構成する。
GEMは3次元ガウス平板上に構築された新しいCreo-EM再構成フレームワークである(3DGS)。
標準的なCryo-EMベンチマークでは、GEMは最先端の手法に比べて最大48%高速なトレーニングと12%低いメモリ使用率を実現している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:17:53 GMT)
BOE-XSUM: Extreme Summarization in Clear Language of Spanish Legal Decrees and Notifications [39.0] BOE-XSUM は、スペイン語の Bolet'in Oficial del Estado' (BOE) に由来する3,648の簡潔で平易な要約からなるキュレートされたデータセットである。
BOE-XSUMで微調整した中型大言語モデルの性能評価を行い,ゼロショット環境での汎用生成モデルと比較した。
最高のパフォーマンスモデルであるBERTIN GPT-J 6B(32ビット精度)は、トップのゼロショットモデルであるDeepSeek-R1よりも24%パフォーマンスが向上する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:15:17 GMT)
Can Less Precise Be More Reliable? A Systematic Evaluation of Quantization's Impact on CLIP Beyond Accuracy [38.9] 量子化がCLIPの性能に与える影響を精度を超えて評価する。
量子化は、一般に信頼できない事前学習モデルの校正を一貫して改善することを示す。
我々は、ゼロショット精度、キャリブレーション、OODロバスト性において同時ゲインをもたらす特定の量子化対応トレーニング(QAT)法を同定する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:09:00 GMT)
Rethinking JEPA: Compute-Efficient Video SSL with Frozen Teachers [37.9] ビデオ共同埋め込み予測アーキテクチャ(V-JEPA)は,指数移動平均(EMA)更新型教師を用いて,潜伏空間内のマスキング領域を予測することで,市販のビデオ表現の一般化を学習する。
マスク付き潜伏予測を再検討し,凍結した教師が満足することを示す。
生徒の質は、教師の質に対して著しく堅牢であることに気付きました。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:55:17 GMT)
StreamForest: Efficient Online Video Understanding with Persistent Event Memory [37.7] StreamForestは、ビデオの理解をストリーミングするために設計されている。
微粒な時空間ウィンドウは、現在のシーン知覚を改善するために、詳細な短期的な視覚的手がかりをキャプチャする。
OnlineITはリアルタイム認識と将来の予測の両方においてMLLMのパフォーマンスを大幅に向上させる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:53:57 GMT)
Beyond Isolated Facts: Synthesizing Narrative and Grounded Supervision for VideoQA [37.7] よりリッチな監視信号を合成するためのフレームワークを導入する。
質問ベースパラフレーズ(QBP)と質問ベースキャプション(QBC)の2つの補完戦略を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:28:44 GMT)
Continual Dialogue State Tracking via Example-Guided Question Answering [37.6] そこで本研究では,対話状態の追跡を具体化した質問応答タスクのバンドルとして提案する。
我々のアプローチは、サービス固有の記憶を緩和し、与えられた質問や例を文脈化するためのモデルを教える。
類似の対話状態変化のあるターンを識別するために訓練された検索者によって検索されたコンテキスト内例から学習することで,600万のパラメータしか持たないモデルが大きな向上を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:55:31 GMT)
MixtureVitae: Open Web-Scale Pretraining Dataset With High Quality Instruction and Reasoning Data Built from Permissive-First Text Sources [37.6] MixtureVitaeは、強力なモデルパフォーマンスを提供しながら、法的リスクを最小限に抑えるために開発されたオープンアクセス事前トレーニングコーパスである。
ライセンス対応のフィルタリング、安全性と品質のスクリーニング、ドメイン対応のミキシングのための透過的で多段階のパイプラインについて詳述する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:40:10 GMT)
Aligning Visual Foundation Encoders to Tokenizers for Diffusion Models [37.6] 本稿では,画像生成における遅延拡散モデルのトークン化として,事前学習したビジュアルエンコーダの整合性を提案する。
ImageNet 256$times$256では、トークン化器は拡散モデルの収束を加速し、64時間以内で1.90gFIDに達する。
提案手法は単純で拡張性があり,連続トークン化設計のための意味論的基盤となるパラダイムを確立している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:57:39 GMT)
Adaptive Sample Scheduling for Direct Preference Optimization [37.5] DPOのためのサンプルスケジューリングという,新しい問題を紹介します。
モデルの進化状態に基づいてトレーニングサンプルを動的かつ適応的にスケジュールすることを目的としている。
トレーニングバッチ毎にサンプルを適応的に選択する,効率的かつ効率的なアルゴリズムであるSamSを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:35:14 GMT)
Agent-as-Judge for Factual Summarization of Long Narratives [37.5] 大規模言語モデル(LLM)は、ROUGEやBERTScoreといった従来のメトリクスに基づいた要約タスクにおいて、ほぼ人間に近い性能を示す。
LLM-as-a-Judgeのような最近の進歩は、語彙的類似性に基づくメトリクスの限界に対処するが、実際には矛盾を示す。
本稿では,要約を評価・精査するための新しい「Agent-as-a-Judge」フレームワークであるNarrativeFactScoreを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:18:34 GMT)
Demonstration of quantum error detection in a silicon quantum processor [37.3] ドナーベースのシリコン量子プロセッサ上での量子エラー検出を実演する。
このシステムの絡み合い能力は、2量子ベル状態絡みの確立によって検証される。
安定化器を用いて4量子誤り検出回路を動作させることで、任意の単一ビット誤りを検出できる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:33:05 GMT)
Who's Your Judge? On the Detectability of LLM-Generated Judgments [37.3] 大言語モデル(LLM)に基づく判断は、強力なLLMを活用して、候補内容の効率よく評価し、判定スコアを提供する。
本研究は,判断検出の課題を提示し,定式化するものである。
我々は、明示的に抽出された言語的特徴とLLM強化特徴を付加した、軽量で透明なニューラル検出器であるtextitJ-Detectorを紹介した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:54:57 GMT)
Improving the adaptive and continuous learning capabilities of artificial neural networks: Lessons from multi-neuromodulatory dynamics [37.0] 生物学的生物は、動的環境に適応しながら知識を取得し、移動し、保持する。
本研究は,生物学習システムの基本的特徴である神経調節が,破滅的な忘れ込みなどの課題にどのように対処できるかを考察する。
マルチスケールの神経調節を統合することで,生物学習と人工システムとのギャップを埋めることを目指す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:20:16 GMT)
Enhancing Physical Plausibility in Video Generation by Reasoning the Implausibility [37.0] 拡散モデルはリアルなビデオを生成することができるが、既存の方法は大規模テキストビデオデータセットから暗黙的に物理的推論を学ぶことに依存している。
本研究では,推論時の身体的可視性を改善するためのトレーニングフリーフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:32:54 GMT)
Is Sequence Information All You Need for Bayesian Optimization of Antibodies? [36.9] 一定の構造情報により、初期最適化ラウンドにおけるデータ効率は向上するが、等価なピーク性能を有することがわかった。
本稿では,タンパク質言語モデルに基づくソフト制約'を用いて,空間の有望な領域に最適化を誘導する手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:36:04 GMT)
Towards Foundation Models for Cryo-ET Subtomogram Analysis [36.9] 我々は,452個の粒子クラスから904k以上のサブトモグラムを生成する大規模合成データ生成装置であるCryoEngineを紹介した。
第2に、適応位相トークン化を等価化モジュールとして組み込んだ適応位相トークン変換器(APT-ViT)を設計する。
第3に,強騒音条件下での表現学習を安定させるため,NRCL(Noss-Resilient Contrastive Learning)戦略を導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:47:45 GMT)
Rethinking and Benchmarking Large Language Models for Graph Reasoning [36.3] グラフ推論のための大規模言語モデル(LLM)は、過去2年間にわたって広く研究されてきた。
近年の研究では、LLMがグラフ推論タスクを扱う可能性を示しているが、その性能は過大評価されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:10:12 GMT)
Every Subtlety Counts: Fine-grained Person Independence Micro-Action Recognition via Distributionally Robust Optimization [36.2] マイクロアクション認識は、心理的アセスメントと人間とコンピュータの相互作用に不可欠である。
既存の手法は現実のシナリオで失敗することが多い。
本稿では、分散ロバスト最適化の原則を取り入れた個人独立ユニバーサルマイクロアクション認識フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:48:34 GMT)
KompeteAI: Accelerated Autonomous Multi-Agent System for End-to-End Pipeline Generation for Machine Learning Problems [36.2] KompeteAIは、動的ソリューション空間探索を備えた新しいAutoMLフレームワークである。
我々は動的ソリューション空間探索を備えた新しいAutoMLフレームワークであるKompeteAIを紹介する。
我々は,MLE-Benchにおける制約に対応するために,Kompete-benchを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:54:50 GMT)
Adapting Chat Language Models Using Only Target Unlabeled Language Data [36.1] チャットLLMのための新しい言語適応手法であるElChatを提案する。
ベースモデルなしで、ターゲットの未ラベルデータに直接チャットモデルを適用する。
ソースチャットモデルから情報をインジェクトすることで、チャット能力を付与する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:17:10 GMT)
Translation from Wearable PPG to 12-Lead ECG [35.8] 12誘導心電図(ECG)は、心臓血管モニタリングの標準規格である。
既存の12リードのECGシステムは、不安定なマルチ電極セットアップに依存しており、アンブロトリー環境での持続的な監視を制限している。
PPG信号から臨床的に有効な12誘導心電図を生成するために設計された,革新的な人口動態認識フレームワークであるP2Esを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:36:24 GMT)
The 4th Dimension for Scaling Model Size [35.8] 大きな言語モデルのスケーリングは通常、深さ、幅、パラメータカウントの3つの次元を含む。
重みを再利用することでパラメータ数を変化させることなく効率的なアルゴリズム深度を増大させる第4次元、textbfvirtual logical depth (VLD) を探索する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:14:46 GMT)
Prompt and Parameter Co-Optimization for Large Language Models [35.7] LLM(Large Language Models)トレーニングのために,迅速な最適化と微調整を共同で統合する,新しいフレームワークであるMetaTunerを紹介する。
我々のフレームワークは、プロンプトとパラメータの最適な組み合わせを見つけるために最適化されている。
様々なベンチマーク実験により、我々の手法はベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:38:25 GMT)
Fine-grained Contrastive Learning for ECG-Report Alignment with Waveform Enhancement [35.5] 既存のECG-Reportコントラスト学習手法は、全ECGとレポートアライメントに重点を置いている。
本報告では,特定のECGセグメントと各タグとの微粒なアライメントを実現するFG-CLEPを提案する。
6つのデータセットの実験により、FG-CLEPはきめ細かいアライメントを大幅に改善することが示された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:21:34 GMT)
Bayesian Surrogates for Risk-Aware Pre-Assessment of Aging Bridge Portfolios [35.5] インフラポートフォリオの老朽化は、リソース割り当ての重要な課題である。
高速な構造事前評価のためのベイズニューラルネットワーク(BNN)サロゲートを提案する。
鉄道アンダーパスの実例研究において,この枠組みの有効性を実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:51:02 GMT)
VQToken: Neural Discrete Token Representation Learning for Extreme Token Reduction in Video Large Language Models [35.4] 最小限の離散トークンを用いてビデオ全体を表現することを目的としたExtreme Short Token Reductionという新しいタスクを紹介した。
Extreme Short Token Reductionタスクでは、私たちのVQTokenはシーケンスをオリジナルの長さのわずか0.07パーセントまで圧縮し、NextQA-MCベンチマークでは0.6%の精度しか達成していません。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:09:31 GMT)
How to Protect Yourself from 5G Radiation? Investigating LLM Responses to Implicit Misinformation [35.4] 大規模言語モデル(LLM)は多様なシナリオに広くデプロイされている。
彼らが誤報をうまく広める程度は、重大な安全上の懸念として浮かび上がっている。
私たちは、暗黙の誤報の最初のベンチマークであるEchoMistをキュレートしました。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:56:52 GMT)
UI2V-Bench: An Understanding-based Image-to-video Generation Benchmark [35.2] I2V(Image-to-Video)の生成は、ビデオ合成の分野において重要な焦点となっている。
既存の評価ベンチマークは主にビデオの品質や時間的一貫性といった側面に焦点を当てている。
We propose UI2V-Bench, a novel benchmark for evaluation I2V model with focus on semantic understanding and reasoning。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:14:26 GMT)
Scaling Laws and Spectra of Shallow Neural Networks in the Feature Learning Regime [34.8] 本稿では,特徴学習体制における2次ニューラルネットワークと対角ニューラルネットワークのスケーリング法則を体系的に解析する。
我々は, 余剰リスクのスケーリング指数を, 試料の複雑さと重量減衰の関数として, 詳細な位相図を導出した。
重みスペクトルにおけるパワーローテールの出現とネットワーク一般化性能を結合した最近の経験的観測の理論的検証を行う。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:58:13 GMT)
Bias Mitigation or Cultural Commonsense? Evaluating LLMs with a Japanese Dataset [34.7] 大規模言語モデル(LLM)は社会的偏見を示し、様々な嫌悪法の開発を促す。
従来の研究は、偏見緩和の影響を、主に一般的な言語理解を測るタスクを通じて評価してきた。
文化的常識は社会的偏見と密接に関連しており、どちらも社会的規範や価値観に根ざしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:45:50 GMT)
Automatically Generating Web Applications from Requirements Via Multi-Agent Test-Driven Development [34.6] 私たちは、エンドツーエンドのフルスタックWebアプリケーション生成のための最初のテスト駆動開発フレームワークであるTDDevを紹介します。
自然言語の説明や設計イメージが与えられたら、TDDevは自動的に実行可能なテストケースを導き、フロントエンドとバックエンドのコードを生成し、ユーザーインタラクションをシミュレートします。
本フレームワークは,ユーザ要求の不明確さ,複数ファイル間の複雑な相互依存性,機能的正当性と視覚的忠実性といった,フルスタック自動化における重要な課題に対処する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:18:19 GMT)
Plug-and-Play 1.x-Bit KV Cache Quantization for Video Large Language Models [34.4] ビデオ大言語モデル(VideoLLM)は、より長いビデオ入力を処理し、複雑な推論と分析を可能にする能力を実証している。
ビデオフレームからの数千の視覚トークンのため、キー値(KV)キャッシュはメモリ要求を大幅に増加させることができる。
本稿では,KVキャッシュを2ビット未満に圧縮するKVキャッシュ量子化手法であるVidKVを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:46:45 GMT)
DiTraj: training-free trajectory control for video diffusion transformer [34.1] 軌道制御は、制御可能なビデオ生成におけるユーザフレンドリなタスクを表す。
提案するDiTrajは,DiTに適したテキスト・ビデオ生成におけるトラジェクトリ制御のためのトレーニングフリーフレームワークである。
提案手法は,映像品質とトラジェクトリ制御性の両方において,従来の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:15:43 GMT)
When Scores Learn Geometry: Rate Separations under the Manifold Hypothesis [33.9] 拡散モデルと逆問題はしばしば低雑音限界におけるデータ分布の学習として解釈される。
彼らの成功は、完全な分布ではなく、データ多様体を暗黙的に学習することから生じると我々は主張する。
スコア誤差が$o(sigma-2)$であるのに対して、特定のデータ分布を復元するにはより厳密な$o(1)$エラーが必要である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:18:43 GMT)
Causality-guided Prompt Learning for Vision-language Models via Visual Granulation [33.9] CLIPの視覚的顆粒化による因果誘導型テキストプロンプト学習法を提案する。
筆者らのCaPL法は,特に細粒度データセットにおいて,最先端のプロンプト学習法よりも優れていた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:53:30 GMT)
PhysiAgent: An Embodied Agent Framework in Physical World [33.8] VLA(Vision-Language-Action)モデルは顕著な成功を収めたが、しばしば限定的な一般化に苦戦している。
現在のアプローチはしばしばこれらのモデルを厳密でシーケンシャルな構造に組み合わせる。
本研究では,物理環境において効果的に動作するように調整された物理エージェントフレームワークであるPhysorAgentを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:39:32 GMT)
Video models are zero-shot learners and reasoners [33.7] Veo 3は、明示的にトレーニングされていないさまざまなタスクを解決できます。
Veoの創発的なゼロショット機能は、ビデオモデルが統一された一般的なビジョン基盤モデルへの道のりにあることを示している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:44:46 GMT)
AXIS: Explainable Time Series Anomaly Detection with Large Language Models [33.7] AXISは、時系列理解のための凍結したLarge Language Models (LLM) を規定するフレームワークである。
LLMは離散トークンで動作し、長い連続的な信号を直接処理するのに苦労する。
文脈的接地とパターンレベルのセマンティクスを監督するマルチフォーマットの質問と合理性を特徴とする新しいベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:24:22 GMT)
Differentiable Light Transport with Gaussian Surfels via Adapted Radiosity for Efficient Relighting and Geometry Reconstruction [32.7] 放射場は、新しいビュー合成から幾何学的再構成まで幅広い応用で大きな成功を収めている。
これらの制限に対処する方法の1つは、物理ベースのレンダリングを組み込むことである。
最適化の内ループに完全なグローバル照明を組み込むことは、違法に高価である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:51:54 GMT)
Neural Message-Passing on Attention Graphs for Hallucination Detection [32.3] CHARMは、グラフ学習タスクとして幻覚検出をキャストし、上記の属性グラフにGNNを適用することでそれに取り組む。
我々は、CHARMが事前の注意に基づくトレースを確実に仮定し、実験的に、様々なベンチマークで他のアプローチを一貫して上回っていることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:37:12 GMT)
Pretraining with hierarchical memories: separating long-tail and common knowledge [32.2] 我々は,世界知識を符号化する大規模階層型パラメトリックメモリバンクにアクセスする小型言語モデルを提案する。
事前トレーニングと推論の間、小さなコンテキスト依存のメモリブロックを取得し、それをモデルに追加します。
我々の事前学習は、記憶パラメータに長い世界知識を格納することを学び、一方、小言語モデルは一般的な推論能力を捉えるアンカーとして機能する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:50 GMT)
Sampling Complexity of TD and PPO in RKHS [32.0] 機能空間の観点からPPO(Proximal Policy Optimization)を再考する。
我々の結果は、PPOを有限次元の仮定を超えた厳密な理論上の足場に置く。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:19:19 GMT)
DeepSearch: Overcome the Bottleneck of Reinforcement Learning with Verifiable Rewards via Monte Carlo Tree Search [31.9] 我々はモンテカルロ木探索を直接RLVRトレーニングに統合するフレームワークであるDeepSearchを紹介する。
推論時にのみツリー検索に依存する既存のメソッドとは対照的に、DeepSearchは構造化された検索をトレーニングループに埋め込む。
コントリビューションには,(1)検索ツリー全体にわたって有望なノードを優先するグローバルフロンティア選択戦略,(2)監督のための確実なパスを識別するエントロピーベースのガイダンスによる選択,(3)効率的なソリューションキャッシングによる適応的リプレイバッファトレーニングなどが含まれている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:00:29 GMT)
ELEPHANT: Measuring and understanding social sycophancy in LLMs [31.9] 本稿では,ユーザの顔の過剰な保存を特徴とする社会性梅毒について紹介する。
ベンチマークを11モデルに適用すると、LSMは社会的梅毒の頻度が常に高いことを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:29:38 GMT)
Training Dynamics of Parametric and In-Context Knowledge Utilization in Language Models [31.8] 大規模言語モデルは、推論時に取得した文脈内知識と事前訓練中に取得したパラメトリック知識の衝突にしばしば遭遇する。
本研究は,学習条件がモデルにおけるインコンテキストとパラメトリック知識の使用にどのように影響するかを初めて制御した研究である。
実験の結果,文書内における事実の反復は,パラメトリックとインコンテクストの両方の能力の発達を促進することが明らかとなった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:18:18 GMT)
TRACE Back from the Future: A Probabilistic Reasoning Approach to Controllable Language Generation [31.8] 大規模な言語モデルは、人間の値や望ましい属性と整合する必要がある。
既存のソリューションは、各新しい属性に対する訓練後のLM(expensive)と非フレキシブル(inflexible)のどちらかで、サンプリングやトレーニングによって将来のシーケンスの期待属性確率(EAP)を近似する。
TRACEは,EAPを効率よく計算し,トラクタブル確率論的推論と軽量制御によって新しい属性に適応する新しいフレームワークである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:34:04 GMT)
Taxonomy of Comprehensive Safety for Clinical Agents [31.8] TACOSは、安全フィルタリングとツールの選択を単一のユーザ意図の分類ステップに統合する、きめ細かい21クラスの分類である。
分類の妥当性を検証するため,TACOSに注釈付きデータセットをキュレートし,広範な実験を行う。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:56:57 GMT)
Model Merging Scaling Laws in Large Language Models [31.7] クロスエントロピーによって測定された言語モデルマージのスケーリング法則について検討する。
モデルサイズとエキスパート番号を結びつけるコンパクトパワー法則を同定する。
ここでは、なぜゲインが 1/k になるのかを説明する単純な理論を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:36:55 GMT)
Denoising Neural Reranker for Recommender Systems [31.6] 2段階の枠組みの下での順位変更作業は、自然にレシーバのスコアに対するノイズ低減問題であることを示す。
本稿では,デノナイジング・リランカと慎重に設計したノイズ発生モジュールを関連づける逆方向のフレームワークDNRを導出する。
得られたDNRソリューションは、従来のスコアエラー最小化損失を3つの拡張目標で拡張する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:41:04 GMT)
A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models [31.4] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)をカスタマイズするための有望なソリューションとして登場した。
本調査は,GraphRAG(Graph-based Retrieval-Augmented Generation)の系統的解析である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:55:52 GMT)
Your thoughts tell who you are: Characterize the reasoning patterns of LRMs [31.3] 生成言語モデルを用いて、2つのLRMからの推論トレースを比較し、その特徴を単語で表現する。
このプロセスを推論トレースのデータセットで反復すると、モデルがどのように考えるかを特徴づける人間の言語分類が得られる。
LOTは、その思考の体系的な違いを特定し、スケール、ベースモデルファミリ、客観的領域が異なるLEMからの推論トレースを80-100%精度で識別する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:52:07 GMT)
Double Machine Learning Based Structure Identification from Temporal Data [30.7] 時系列データの原因を学習することは、ファイナンスから地球科学、バイオメディカルアプリケーションまで、多くのアプリケーションにおいて基本的な課題である。
このタスクの一般的なアプローチはベクトル自己回帰に基づいており、潜在的な原因間の未知の矛盾を考慮していない。
時間的データ(DR-SIT)から構造を識別する新しいダブル機械学習手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:09:10 GMT)
Towards generalizable deep ptychography neural networks [30.6] 本研究では, 実験的な測定を行ったプローブと, 手続き的に生成したオブジェクトを組み合わせることで, プローブ学習を重視した教師なし学習ワークフローを提案する。
このプローブ中心のアプローチにより、1つの物理インフォームドニューラルネットワークは、複数のビームラインにわたって見えない実験を再構築することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:38:13 GMT)
Dive into the Agent Matrix: A Realistic Evaluation of Self-Replication Risk in LLM Agents [30.4] 大言語モデル(LLM)エージェントの自己複製リスクは、客観的なミスアライメントによって増大している。
本稿では,自己複製リスクの定量化のための総合評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:49:50 GMT)
BFSM: 3D Bidirectional Face-Skull Morphable Model [30.3] 遠隔診断、手術計画、医学教育、身体に基づく顔シミュレーションなどの応用において、関節型顔面骨格形態モデルの構築は大きな可能性を秘めている。
しかし、このビジョンを実現するには、対面スカルデータの不足、登録精度の不足、再建と臨床応用の限定的な探究など、制約がある。
本稿では, 顔と頭蓋骨の形状推定を共有空間を通して行う3次元双方向顔・骨格形態モデル(BFSM)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:34:13 GMT)
Fast Exact Unlearning for In-Context Learning Data for LLMs [30.1] 大規模言語モデルでは「微調整データ」を効率的に解き放つことができることを示す。
正確な文脈内学習は量子化k-meansで行うことができ、効果的に一定時間非学習操作ができることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:10:01 GMT)
GCDance: Genre-Controlled Music-Driven 3D Full Body Dance Generation [30.0] GCDanceは、ジャンル固有の3Dフルボディダンス生成のためのフレームワークで、音楽と記述テキストに条件付けされている。
我々は、入力プロンプト、明示的なジャンルラベル、自由形式の記述文をジャンル固有の制御信号にマッピングするテキストベースの制御機構を開発する。
テキストジャンル情報を抽出し、高品質な生成結果を維持することの目的をバランスさせるため、我々は新しいマルチタスク最適化戦略を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:12:31 GMT)
Orak: A Foundational Benchmark for Training and Evaluating LLM Agents on Diverse Video Games [29.2] Orakは、さまざまな現実世界のビデオゲームでLarge Language Model (LLM)エージェントをトレーニングし、評価するために設計されたベンチマークである。
LLMの一貫した評価を支援するために,モデルコンテキストプロトコル(MCP)に基づくプラグアンドプレイインタフェースを導入する。
Orakは総合的な評価フレームワークを提供しており、一般的なゲームスコアのリーダーボード、LLMバトルアリーナ、視覚入力状態、エージェント戦略、微調整効果の詳細な分析を含んでいる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:43:28 GMT)
Open-Vocabulary Online Semantic Mapping for SLAM [29.0] 本稿では,Open-Vocabulary Online 3Dセマンティックマッピングパイプラインを提案する。
提案するRGB-Dフレームの列から,CLIPベクトルを用いて記述した3次元セグメントを検出し,追跡する。
我々のOVOは、オフラインのベースラインよりも計算量やメモリフットプリントが大幅に少ない一方で、オフラインやオンラインのフットプリントよりもセグメンテーションの指標が優れている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:09:39 GMT)
FishNet++: Analyzing the capabilities of Multimodal Large Language Models in marine biology [28.7] MLLM(Multimodal large language model)は、優れたクロスドメイン機能を示しているが、海洋生物学のような専門的な科学分野において、その能力は未解明のままである。
本研究では,最新のMLLMを体系的に評価し,魚種を微粒化認識する能力に重大な限界があることを明らかにする。
大規模なマルチモーダルベンチマークである FishNet++ を紹介する。
FishNet++は、マルチモーダル学習のための35,133のテキスト記述、形態学研究のための706,426のキーポイントアノテーション、検出のための119,399のバウンディングボックスによって、既存のリソースを大幅に拡張している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:39:58 GMT)
Metis: Training Large Language Models with Advanced Low-Bit Quantization [28.6] メティス(Metis)は、異方性スペクトルを独立量子化のためのより狭い部分分布に分割するフレームワークである。
100Bトークンで訓練されたLLaMA-3 8Bでは、メティスは重量、アクティベーション、勾配のFP4量子化による堅牢なW4A4G4トレーニングを可能にする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:05:18 GMT)
Humanline: Online Alignment as Perceptual Loss [28.2] オンラインのオンラインオンラインサンプリングは、そのモデルが生み出すことができる人間の知覚分布をよりよく近似する。
我々の理論はさらに、オンライン/オフライン自体が人間の実用性を最大化するのに付随していることを示唆している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:41:16 GMT)
Implicit-ARAP: Efficient Handle-Guided Neural Field Deformation via Local Patch Meshing [28.2] 本稿では,ハンドル誘導型ニューラルフィールド変形の新しい手法を提案する。
本手法は, 変形品質, 頑健性, 計算効率において, ベースラインを一貫して上回ることを示す。
我々の研究は、スケーラブルで高品質なニューラルフィールドの変形を可能にし、他の幾何学的タスクをニューラルドメインに拡張する方法を舗装する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:40:46 GMT)
EVLF-FM: Explainable Vision Language Foundation Model for Medicine [26.8] 本稿では,多モード視覚言語基盤モデルEVLF-FMについて述べる。
EVLF-FMの開発とテストは、23のグローバルデータセットから13万以上のサンプルを含んでいた。
疾患診断のための内部検証では、EVLF-FMは最高平均精度0.858とF1スコア0.797を達成した。
医学的な視覚的グラウンドでは、EVLF-FMは平均mIOU 0.743、Acc@0.5 0.837の9つのモードで恒星の性能を達成した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:15:57 GMT)
DHG-Bench: A Comprehensive Benchmark for Deep Hypergraph Learning [26.7] 近年,ハイパーグラフニューラルネットワーク (HNN) が注目されている。
DHG-BenchはHNNの最初の包括的なベンチマークである。
我々は22種類のデータセットに対して17の最先端HNNアルゴリズムを包括的に評価した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:21:33 GMT)
When Greedy Wins: Emergent Exploitation Bias in Meta-Bandit LLM Training [26.7] 大規模言語モデル(LLM)は、しばしばシーケンシャルな意思決定において最適に探索する。
最近の研究は、教師付き微調整(SFT)や強化学習(RL)を通じてこの能力を向上し、古典的なマルチアームバンディットタスクの後悔を改善することを目指している。
本研究では,SFT を用いた LLM の訓練と,RL による様々な報奨信号の学習により,両パラダイムについて検討する。
その結果、エージェントは事前訓練されたモデルより優れ、アッパー信頼境界(UCB)やトンプソンサンプリングに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:25:42 GMT)
Inductive Bias and Spectral Properties of Single-Head Attention in High Dimensions [26.6] 合成高次元シークエンスタスクを訓練した単一頭部拘束層における経験的リスクについて検討した。
トレーニングやテストエラーのシャープを導き、ウェイトとリカバリしきい値を特定し、学習したウェイトのスペクトル分布の制限を特徴付ける。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:19:31 GMT)
R-Capsule: Compressing High-Level Plans for Efficient Large Language Model Reasoning [25.9] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)が明確なステップバイステップの合理性を引き出すことによって、複雑な推論に対処するのに役立つ。
提案するReasoning Capsule (R-Capsule) は,遅延推論の効率と明示的なCoTの透明性の両立を目的としたフレームワークである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:19:32 GMT)
ThinkEdit: Interpretable Weight Editing to Mitigate Overly Short Thinking in Reasoning Models [25.9] 推論モデルの隠れ表現に、推論の長さがどのように埋め込まれているかを検討する。
我々は、過剰に短い推論の問題を軽減するために、シンプルだが効果的な重み付けアプローチであるThinkEditを紹介した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:24:51 GMT)
PAD3R: Pose-Aware Dynamic 3D Reconstruction from Casual Videos [25.8] PAD3Rは、カジュアルにキャプチャーされたモノクロビデオから変形可能な3Dオブジェクトを再構成する方法である。
その中心となるアプローチは、事前訓練された画像から3Dモデルによって教師される、パーソナライズされたオブジェクト中心のポーズ推定器を訓練する。
PAD3Rは、生成前の先行と異なるレンダリングを組み合わせることで、カテゴリーに依存しない方法で、高忠実で明瞭なオブジェクトの3D表現を再構築する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:33 GMT)
SeaPO: Strategic Error Amplification for Robust Preference Optimization of Large Language Models [25.7] 大規模言語モデルで一般的に発生する3つのエラータイプを活用する戦略的誤り増幅手法であるSeaPOを紹介する。
その結果,SeaPOはモデル全体の性能を,特に真性の観点から著しく改善した。
最も一般的なエラータイプを注入すると、関連するタスクのパフォーマンスが向上する一方、エラータイプが混在すると、より広範なパフォーマンス向上につながる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:42:41 GMT)
A Model Zoo on Phase Transitions in Neural Networks [25.6] 重量空間学習法は、訓練されたモデルの集団を、開発と評価のためのデータセットとして要求する。
モデル動物園と呼ばれる既存のモデルのコレクションは、構造化されていないか、多様性の初歩的な定義に従っている。
我々は、モデル動物園のアイデアとフェーズ情報を組み合わせることで、人口の多様性の制御された概念を創出する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:13:22 GMT)
Fuzzy Information Evolution with Three-Way Decision in Social Network Group Decision-Making [25.5] グループ意思決定(GDM)のシナリオでは、不確実性、動的な社会構造、曖昧な情報が大きな課題である。
本研究では,3方向決定(3WD)理論,動的ネットワーク再構築,言語的意見表現を統合した,新たなソーシャルネットワークグループ意思決定フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:29:24 GMT)
Ultra-Fast Language Generation via Discrete Diffusion Divergence Instruct [24.4] DiDi-Instructは、高速言語生成モデルにつながるトレーニングベースの手法である。
OpenWebTextでは、DiDi-Instructはすべてのアクセラレーションされた言語生成モデルより優れています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:55:44 GMT)
Data Uniformity Improves Training Efficiency and More, with a Convergence Framework Beyond the NTK Regime [24.4] より均一に分散したデータを選択することで、トレーニング効率が向上し、性能が向上することを示す。
具体的には、より均一な(バイアスのない)分布が、データポイント間の最小ペア距離を大きくすることを示す。
理論的には、ニューラルネットワークの近似誤差は、h_min$が増加するにつれて減少する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:02 GMT)
Alignment-Sensitive Minimax Rates for Spectral Algorithms with Learned Kernels [24.3] 我々は、アライメントに敏感な複雑性尺度である有効スパンディメンション(ESD)を導入する。
ESDが少なくとも$K$のシーケンスモデルでは、ミニマックス超過リスクは$sigma2K$とスケールする。
この発見は、適応的特徴学習とスペクトルアルゴリズムの一般化における証明可能な改善との関連性を確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:11:26 GMT)
Lightweight and Robust Federated Data Valuation [24.2] フェデレーテッド・ラーニング(FL)は、非IIDデータ分散と敵対的クライアントの振る舞いにより、永続的な課題に直面している。
提案するFLアグリゲーションフレームワークであるFedIFは,トラジェクトリに基づく影響推定を利用して,クライアントのコントリビューションを効率的に計算する。
実世界の展開において,FedIFは,効率的かつ堅牢なFLを実現するために,Shapley値ベースのアプローチに代わる実用的で理論的に基礎的かつスケーラブルな代替手段として確立されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:31:56 GMT)
Coupling Generative Modeling and an Autoencoder with the Causal Bridge [23.9] 我々は、治療(介入)の因果効果が、治療と結果の両方に影響を与える潜在的に観察されていない共同設立者がいる状況における関心の結果に与える影響を推測する。
これは、治療と結果に関連する2つの異なる制御(プロキシ)のセットへのアクセスを仮定することで達成できる。
本稿では,CBによる治療効果を推定可能な場合の関連する仮定と,CBの仮定に違反した場合の処理効果の平均誤差について述べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:46:54 GMT)
R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-stage Reinforcement Learning [23.8] R1-Code-Interpreterは,マルチターン制御微調整(SFT)と強化学習(RL)によって訓練されたテキストのみの大規模言語モデル(LLM)の拡張である。
144種類の多種多様な推論・計画タスクにまたがる汎用コードインタープリタのトレーニングは,タスクの不均一性や有効サンプルの不足による重大な課題を呈している。
最終モデルであるR1-CI-14Bは、37のテストタスクの平均精度を44.1%から72.4%に改善し、テキストのみのGPT-4o (58.6%) と GPT-4o with Code Interpreter (70.9%) を上回りました。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:29:09 GMT)
AdaRank: Adaptive Rank Pruning for Enhanced Model Merging [23.6] モデルマージは、独立して微調整されたモデルを統合されたフレームワークに統合するための有望なアプローチとして現れている。
AdaRankは、タスクベクトルの最も有用な特異な方向を適応的に選択し、複数のモデルをマージする新しいモデルマージフレームワークである。
AdaRankは、さまざまなバックボーンとタスク数で一貫して最先端のパフォーマンスを実現し、微調整されたモデル間のパフォーマンスギャップを1%近く削減している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:23:36 GMT)
Hardware-Aware Parallel Prompt Decoding for Memory-Efficient Acceleration of LLM Inference [23.6] LLM(Large Language Models)の自動回帰デコーディングは、ハードウェアの性能に大きなオーバーヘッドをもたらす。
トレーニング可能なパラメータを0.0002$%しか必要とせず,A100-40GBのGPUをたった16時間で効率的にトレーニングできる並列プロンプトデコーディングを提案する。
我々のアプローチでは、最大2.49$times$ スピードアップを示し、最小のメモリオーバーヘッドは0.0004$%である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:16:53 GMT)
Fast and Fluent Diffusion Language Models via Convolutional Decoding and Rejective Fine-tuning [23.6] Autoregressive (AR)言語モデルでは、テキストを1つずつ生成することで、推論速度が制限される。
本稿では,デコードウインドウを狭める正規化法であるConal decoding (Conv)を提案する。
Rejecting Rule-based Fine-Tuning (R2FT)も導入しています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:50:10 GMT)
When MCP Servers Attack: Taxonomy, Feasibility, and Mitigation [23.6] モデルコンテキストプロトコル(MCP)サーバは、AIアプリケーションがプラグアンドプレイ方式で外部システムに接続できるようにする。
このようなプレッシャーのかかるリスクにもかかわらず、CPサーバのセキュリティへの影響はいまだ過小評価されている。
MCPサーバをアクティブな脅威アクターとして扱い、それらをコアコンポーネントに分解する最初の体系的な研究を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:29:58 GMT)
Rare-to-Frequent: Unlocking Compositional Generation Power of Diffusion Models on Rare Concepts with LLM Guidance [23.5] 拡散モデルの合成生成能力は,大規模言語モデル指導によって著しく向上できることを示す。
本稿では、レア・ツー・頻繁なコンセプトガイダンスを計画し、実行するためのトレーニングフリーアプローチR2Fを提案する。
我々のフレームワークは、事前訓練された拡散モデルやLLMに対して柔軟であり、領域誘導拡散アプローチとシームレスに統合することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:20:27 GMT)
Uni-NTFM: A Unified Foundation Model for EEG Signal Representation Learning [23.5] 我々はUnified Neural Topological Foundation Model (Uni-NTFM)を紹介する。
Uni-NTFMは神経科学の原理に基づいて設計され、普遍的で解釈可能な表現を生成する。
最大のモデルであるUni-NTFM$_large$は記録破りの1.9Bパラメータを持ち、28,000時間以上の多様な脳波データを事前訓練した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:03:32 GMT)
A Text-To-Text Alignment Algorithm for Better Evaluation of Modern Speech Recognition Systems [23.2] 現代のニューラルネットワークは、音声認識ベンチマークのパフォーマンスを大幅に改善した。
稀な用語、名前付きエンティティ、ドメイン固有の語彙の誤りは、より簡潔であるが、集約されたメトリクスによって隠されている。
本稿では,動的プログラミングとビーム探索スコアリングを結合したアライメントアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:53:02 GMT)
CompMarkGS: Robust Watermarking for Compressed 3D Gaussian Splatting [22.9] 本稿では,透かしの整合性とレンダリング品質を保った圧縮耐性3DGS透かし法を提案する。
我々のアプローチでは、アンカーベースの3DGSを使用して、透かしをアンカー属性、特にアンカー機能に埋め込む。
また、トレーニング中に量子化ノイズを注入し、圧縮後の透かしを保存する量子化歪み層を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:20:26 GMT)
A Quantum Computer Based on Donor-Cluster Arrays in Silicon [22.8] ホスホラス(P)をドープしたスピン量子ビットはコヒーレンスに優れ、99.9%を超える高忠実な2量子ビットゲートを証明している。
核スピン量子ビットに対するスケーラブルなクラスタアレイアーキテクチャとそれに対応する制御プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:16:05 GMT)
Sometimes I am a Tree: Data Drives Unstable Hierarchical Generalization [22.7] 初期の訓練では、LMはn-gramモデルのように振る舞うことができるが、最終的には木に基づく構文規則を学び、階層的に分布から一般化する。
制御された文法学習タスク(質問形成と時制インフレクション)を用いて、このシフトを研究する。
これらの結果は、学習データの一般化形成における中心的な役割を強調し、なぜ競合戦略が不安定な結果をもたらすのかを説明する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:50 GMT)
Blockwise Missingness meets AI: A Tractable Solution for Semiparametric Inference [22.7] 我々は,データの特徴がブロックワイドで非単調な場合のパラメータ推定と推定について考察する。
我々のアプローチは半パラメトリック理論に根ざし、予測による推論にインスパイアされ、既成のAI(予測的または生成的)モデルを活用して、完全にランダムなメカニズムで処理する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:17:28 GMT)
BitHydra: Towards Bit-flip Inference Cost Attack against Large Language Models [22.7] モデル重みを直接修正し,漏洩したLLMの全ユーザに対して持続的オーバーヘッドを誘発する,最初のビットフリップ推論コスト攻撃を導入する。
この攻撃パラダイムをBitHydraでインスタンス化し、(1)シーケンス終端トークン(EOS)を抑制する損失を最小限に抑え、(2)EOS埋め込みベクトルに焦点をあてた効率的かつ効果的なクリティカルビット探索を利用する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:08:08 GMT)
Training-Free Multimodal Guidance for Video to Audio Generation [22.6] Video-to-audio (V2A) の生成は、サイレントビデオから現実的でセマンティックに整合したオーディオを合成することを目的としている。
既存のアプローチでは、大規模なペアデータセットでのコストのかかる共同トレーニングが必要か、ペアの類似性に依存している。
本稿では,V2A拡散のための新しいトレーニングフリーマルチモーダル誘導機構を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:00:36 GMT)
Euclid's Gift: Enhancing Spatial Perception and Reasoning in Vision-Language Models via Geometric Surrogate Tasks [22.5] ユークリッド幾何学の問題解決を代理課題として扱う。
モデルがユークリッドの原理を取得し、適用できるようにするため、Qwen2.5VLファミリーとRoboBrain2.0ファミリーを微調整する。
実験により, 得られたモデルが4つの空間的推論ベンチマークにおいて, 実質的なゼロショットゲインを達成できることが実証された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:49:21 GMT)
Risk-Sensitive RL for Alleviating Exploration Dilemmas in Large Language Models [22.5] Reinforcement Learning with Verifiable Rewards (RLVR) は,Large Language Models (LLMs) の強化に有効であることが証明された。
リスク感性強化学習フレームワークを導入する。
提案手法では,平均と最大報酬を補間するリスク探索の手法を用いて,新しいアルゴリズムを提案する。
注目すべきは、RS-GRPOの実装が簡単で、マイナーなコード修正しか必要としないことだ。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:12:20 GMT)
When Autonomous Vehicle Meets V2X Cooperative Perception: How Far Are We? [22.4] V2X(Van-to-Everything)協調的な知覚は、遠く離れた物体を感知する際の限界に対処する可能性がある。
本研究では,エゴ車両の知覚性能に及ぼす協調知覚の影響について検討した。
本研究は,協調認識システムの重要な構成要素における潜在的なリスクと脆弱性を明らかにするものである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:28:27 GMT)
TrojanStego: Your Language Model Can Secretly Be A Steganographic Privacy Leaking Agent [22.4] 本稿では,言語ステガノグラフィーによる自然界のアウトプットにセンシティブな文脈情報を埋め込む,新たな脅威モデルであるTrojanStegoを提案する。
本稿では, LLMのリスク要因を概説した分類法を導入し, 脅威のリスクプロファイルを評価する。
実験の結果,妥協されたモデルでは,32ビットのシークレットを87%の精度で確実に送信し,97%以上の精度で3世代にわたる過半数投票を行った。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:08:33 GMT)
TR2-D2: Tree Search Guided Trajectory-Aware Fine-Tuning for Discrete Diffusion [22.3] TRee Search Guided TRajectory-Aware Fine-Tuning for Discrete Diffusion (TR2-D2)
本稿では,Tree Search Guided TRajectory-Aware Fine-Tuning for Discrete Diffusion (TR2-D2)を紹介した。
これらのバッファはモンテカルロ木探索(MCTS)を用いて生成され、その後、最適制御目的の下で事前学習された離散拡散モデルを微調整するために使用される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:58:45 GMT)
PoI: A Filter to Extract Pixel of Interest from Novel View Synthesis for Scene Coordinate Regression [21.9] 新たなビュー合成(NVS)技術は、レンダリングされた画像でトレーニングデータを拡張することで、カメラのポーズ推定を強化することができる。
これらの方法で撮影された画像は、しばしばぼやけ、カメラポーズ推定のためのトレーニングデータとして信頼性を損なう。
本稿では,トレーニング中に最適な画素を動的に識別・破棄する二基準フィルタリング機構を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:18:07 GMT)
ASIA: Adaptive 3D Segmentation using Few Image Annotations [21.7] ASIA(Adaptive 3D using few Image s)は、3Dで非意味的かつ非テキスト記述可能な「部分」のセグメンテーションを可能にする新しいフレームワークである。
本手法は,画像空間から3次元へのセグメンテーションの転送に,SD(Stable Diffusion)などのテキスト・画像拡散モデルのリッチな先行性を利用する。
ASIAは意味的および非意味的な3Dセグメンテーションタスクに対して実用的で一般化可能なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:04:11 GMT)
A Neurosymbolic Fast and Slow Architecture for Graph Coloring [21.6] 制約満足度問題(CSP)は人工知能に重大な課題をもたらす。
既存のシンボリック・ソルバは、しばしば遅く、以前の研究では、LLM(Large Language Models)は、その複雑さのため、CSP(Large Language Models)のみに苦しむことが示されている。
我々は、Daniel Kahneman氏の'Thinking, Fast and Slow'の認知モデルをAIに適用する既存のSOFAIアーキテクチャ(SOFAI_v1)の上に構築する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:57:36 GMT)
Learning to Parallel: Accelerating Diffusion Large Language Models via Adaptive Parallel Decoding [21.6] 大規模言語モデル(LLM)における自己回帰復号には、$n$トークンに対して$mathcalO(n)$シーケンシャルステップが必要である。
本稿では,並列デコード学習(Learn2PD)を提案する。これは軽量かつ適応的なフィルタモデルをトレーニングし,各トークン位置に対して,現在の予測が最終出力と一致するかどうかを予測するフレームワークである。
この学習されたフィルタは、正しく予測された場合にのみトークンをアンマスクするオラクル並列復号法を近似する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:54 GMT)
OmniPlay: Benchmarking Omni-Modal Models on Omni-Modal Game Playing [21.6] オムニプレイ(OmniPlay)は、全知覚スペクトルにおけるエージェントモデルの融合と推論能力を調査するために設計された診断ベンチマークである。
高忠実度メモリタスクに超人的性能を示すが、堅牢な推論と戦略的計画を必要とする課題において、体系的な失敗に苦しむ。
以上の結果から, AGI への道のりは, 相乗的融合に明示的に対処するためには, スケーリング以上の研究が必要であることが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:48:39 GMT)
UP2You: Fast Reconstruction of Yourself from Unconstrained Photo Collections [21.6] UP2Youは、非拘束の2D写真から高精細度の3D肖像画を再構築するためのチューニング不要のソリューションだ。
UP2Youの中心は、ポーズ関連フィーチャーアグリゲーションモジュールである。
4D-Dress, PuzzleIOI, in-the-wild captures の実験では、UP2You は幾何学的精度とテクスチャ忠実度の両方において、従来手法を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:06:00 GMT)
Mitigating Visual Hallucinations via Semantic Curriculum Preference Optimization in MLLMs [21.5] MLLM(Multimodal Large Language Models)は様々なタスクのパフォーマンスを大幅に向上させたが、視覚幻覚に悩まされ続けている。
本稿では,MLLMアライメントのための新しいフレームワークであるSemantic Curriculum Preference Optimization (SCPO)を提案する。
SCPOは、私たちのSemantic Curriculum Preference Pairsデータセット上に構築された、進歩的で、容易にハードなカリキュラムを採用しています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:03:36 GMT)
Adaptive Conformal Guidance for Learning under Uncertainty [21.4] 本稿では,適応型コンフォーマルガイダンス(AdaConG)を提案する。
AdaConGは、潜在的に誤解を招く信号への依存を減らし、学習性能を向上させる。
AdaConGは知識蒸留、半教師付き画像分類、グリッドワールドナビゲーション、自律運転など様々なタスクで検証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:06:11 GMT)
United We Stand: Towards End-to-End Log-based Fault Diagnosis via Interactive Multi-Task Learning [21.3] Chimeraは、新しいエンドツーエンドのログベースの障害診断手法である。
異常検出と根本原因の局在のギャップを埋める。
産業用クラウドプラットフォームとして運用に成功している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:03:23 GMT)
PRIVMARK: Private Large Language Models Watermarking with MPC [21.3] プライバシ問題に対処するために,セキュアなマルチパーティ計算 (MPC) ベースのプライベート LLM 透かしフレームワーク PRIVMARK を提案する。
本研究では,最先端LLMの透かし手法であるPostMarkを調査し,その基本動作を定式化する。
そこで我々は,MPCプリミティブをブラックボックス方式で,これらの操作のための効率的なプロトコルを構築した。
このようにして、PRIVMARKは、複数のパーティが、モデルの重みを単一のコンピューティングパーティに公開することなく、LCMの出力を協調的にウォーターマークすることができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:34:09 GMT)
Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features [21.2] 本稿では、任意の機能の下で線形TD($lambda$)演算に対する最初の$L2$収束率を確立する。
任意の特徴から生じる解の潜在的非特異性に対処するために、単一点ではなく解集合への収束率を特徴とする新しい近似結果を開発する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:16:06 GMT)
PROFusion: Robust and Accurate Dense Reconstruction via Camera Pose Regression and Optimization [21.2] リアルタイムの密集したシーン再構築はロボティクスにとって不可欠である。
現在のRGB-D SLAMシステムは、カメラが大きな視点の変化、速い動き、突然の揺れを経験したときに失敗する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:20:49 GMT)
MindVL: Towards Efficient and Effective Training of Multimodal Large Language Models on Ascend NPUs [20.8] MindVLは、Ascend NPUでエンドツーエンドに訓練されたマルチモーダルな大規模言語モデルである。
我々は,安定かつ高性能なトレーニングを支援する,高効率なトレーニングフレームワークであるMindSpeed-MLLMを紹介した。
異なるシーケンス長でトレーニングされたチェックポイントから平均的な重み付けが特に有効であることが判明した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:44:58 GMT)
FuncPoison: Poisoning Function Library to Hijack Multi-agent Autonomous Driving Systems [20.7] 我々はFuncPoisonを紹介した。FuncPoisonは、機能ライブラリをターゲットにした中毒ベースの攻撃である。
FuncPoisonは、エージェントが関数ライブラリにアクセスする方法における2つの重要な弱点を利用する。
我々はFuncPoisonを2つの代表的なマルチエージェント自動運転システム上で実験的に評価した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:56:23 GMT)
DAL: A Practical Prior-Free Black-Box Framework for Non-Stationary Bandits [20.5] 我々は,非定常的盗賊問題に対して,検出強化学習(DAL)と呼ばれる実用的なブラックボックスフレームワークを導入する。
DALは任意の定常バンディットアルゴリズムを入力として受け入れ、変更検出器で拡張し、すべての一般的なバンディット変種に適用可能にする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:29:23 GMT)
An Empirical Analysis of Machine Learning Model and Dataset Documentation, Supply Chain, and Licensing Challenges on Hugging Face [20.2] 人気のモデル共有サイトHugging Faceから抽出された760,460モデルと175,000のデータセットを広範囲に分析する。
我々は、Hugging Faceサプライチェーンにおけるドキュメンテーションの現状を評価し、欠陥の実例を報告し、改善のための実用的な提案を提供する。
我々の研究結果は、MLモデル/データセットのライセンス管理の改善など、複数の研究の道のりを動機付けています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:52:25 GMT)
FW-Merging: Scaling Model Merging with Frank-Wolfe Optimization [20.1] 本稿では,FW-Merging(FW-Merging)を制約付き最適化問題として紹介する。
FW-Mergingは、データフリーマージ法を32.8%上回り、20ViTモデルをマージした場合、データインフォームされたAdamergingを8.39%上回る。
実験の結果、FW-Mergingスケールは様々なモデルソースにまたがっており、16の無関係モデルでは安定であり、20のCVタスクでは16の関連モデルでは15.3%改善され、メモリオーバーヘッドは一定に保たれている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:53:22 GMT)
Model-based Metric 3D Shape and Motion Reconstruction of Wild Bottlenose Dolphins in Drone-Shot Videos [19.8] モノクロビデオから野生イルカの3次元形状と動きを推定する問題に対処する。
異なる海洋環境下で撮影された映像に本手法を適用した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:01:20 GMT)
UI-UG: A Unified MLLM for UI Understanding and Generation [19.7] UI-UG(UI理解と生成のための統合MLLM)を導入し、両方の機能を統合する。
タスク理解には,グループ相対政策最適化(GRPO)を併用したスーパービジョンファインチューニング(SFT)を用い,より詳細な理解を深める。
生成タスクでは、さらにDPO(Direct Preference Optimization)を使用して、モデルが人間の好みのUIを生成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:59:09 GMT)
Towards a Certificate of Trust: Task-Aware OOD Detection for Scientific AI [18.9] スコアベース拡散モデルを用いて関節確率を推定する新しいOOD検出法を提案する。
このアプローチは入力だけでなく回帰モデルの予測も考慮し、タスク対応の信頼性スコアを提供する。
我々の研究は「信頼の証明」を構築するための基本的なステップを提供し、それによってAIベースの予測の信頼性を評価するための実践的なツールを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:21:25 GMT)
NeuroScalar: A Deep Learning Framework for Fast, Accurate, and In-the-Wild Cycle-Level Performance Prediction [18.9] 本稿では,生産ハードウェア上での高忠実なインザワイルドシミュレーションのための新しいディープラーニングフレームワークを提案する。
我々のコアコントリビューションは、仮説プロセッサ設計のためのサイクルレベルの性能を予測するために、マイクロアーキテクチャに依存しない機能に基づいて訓練されたDLモデルである。
このフレームワークは,大規模なハードウェアA/Bテストと正確な性能解析を可能にすることを実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:23:10 GMT)
d2: Improved Techniques for Training Reasoning Diffusion Language Models [18.8] マスク拡散言語モデル(DLM)に適した推論フレームワークであるd2を導入する。
我々のフレームワークの中心は、サンプリング軌道の確率を正確に推定するためにマスキングの特性に依存する新しいポリシー勾配アルゴリズムである。
実験的に、d2はRLのみを使用した従来の拡散推論フレームワークよりも大幅に改善される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:33:05 GMT)
Assessing the risk of future Dunkelflaute events for Germany using generative deep learning [18.8] ダンケルフルート現象が今後数年間のドイツの電力生産に与える影響について検討する。
我々は近年,CMIP6アンサンブルからの気候シミュレーションの大規模化に向け,生成的深層学習の枠組みを適用した。
アンサンブル平均におけるドイツにおけるダンケルフルート現象の頻度と持続期間は,歴史的に比較するとほとんど変化がないと推定されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:44:22 GMT)
Walk the Talk: Is Your Log-based Software Reliability Maintenance System Really Reliable? [18.6] 本稿では、サービス提供者の信頼を得るためのモデルに対する信頼性基準、診断忠実度を定義する。
本稿では,忠実なログに基づく異常検出システムであるFaithLogを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:52:40 GMT)
LUMA: Low-Dimension Unified Motion Alignment with Dual-Path Anchoring for Text-to-Motion Diffusion Model [18.6] 本稿では,2経路アンカーを組み込んだテキスト・ツー・モーション拡散モデルを提案し,セマンティックアライメントを強化する。
FIDスコアはそれぞれ0.035と0.123である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:58:28 GMT)
UML-CoT: Structured Reasoning and Planning with Unified Modeling Language for Robotic Room Cleaning [18.5] CoT(Chain-of-Thought)は、大規模言語モデル(LLM)の推論を改善するが、非構造化テキストへの依存は、エンボディされたタスクの解釈可能性と実行可能性を制限する。
本稿では,UML(Unified Modeling Language)を利用してシンボルCoTと実行可能なアクションプランを生成する構造的推論・計画フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:56:38 GMT)
Vision At Night: Exploring Biologically Inspired Preprocessing For Improved Robustness Via Color And Contrast Transformations [18.4] 生物学的に動機づけられた入力前処理によるロバストなセマンティックセグメンテーションについて検討する。
RGB, グレースケール, 反対色チャネルに差分ガウスフィルタを適用することにより, モデルアーキテクチャやトレーニングを変更することなく, 局所コントラストを高めることができる。
このような前処理は, 夜間, 霧, 雪等の悪環境に適応しつつ, 流通性能を維持していることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:48:32 GMT)
HealthSLM-Bench: Benchmarking Small Language Models for Mobile and Wearable Healthcare Monitoring [18.4] 小型言語モデル(SLM)は軽量で、モバイルおよびウェアラブルデバイス上でローカルかつ効率的に動作するように設計されている。
ゼロショット,少数ショット,命令微調整による健康予測タスクにおけるSLMの評価を行った。
その結果,SLMは大規模言語モデルに匹敵する性能を達成でき,効率とプライバシを大幅に向上させることができることがわかった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:48:40 GMT)
FuseCodec: Semantic-Contextual Fusion and Supervision for Neural Codecs [18.4] 音声トークン化は、離散表現を可能にし、音声言語モデリングを容易にする。
本研究では,FuseCodecを導入し,音響的,意味的,文脈的表現を強力な相互アライメントとグローバルインフォメーション・インフォメーションを通じて統合する。
FuseCodecは、EnCodec、SpeechTokenizer、DACを上回り、転写精度、知覚的品質、インテリジェンス、話者類似性において、LibriSpeechの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:43:07 GMT)
Bridging the behavior-neural gap: A multimodal AI reveals the brain's geometry of emotion more accurately than human self-reports [18.3] 大規模な類似性判定は、脳の感情幾何学をより忠実に捉えることができることを示す。
MLLMは、リッチで神経に適応した感情表現を自律的に開発できるという、説得力のある証拠を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:22:33 GMT)
Exploiting AI for Attacks: On the Interplay between Adversarial AI and Offensive AI [18.1] 攻撃対象としてのAI(Adversarial AI')と、攻撃対象に対する攻撃を開始する手段としてのAI(Offensive AI')
この記事では、AIに関連する2つの脅威と、それら間の相互作用について説明する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:26:22 GMT)
Do Natural Language Descriptions of Model Activations Convey Privileged Information? [17.9] 先行作業で使用されるデータセット間での一般的な動詞化手法を批判的に評価する。
言語化は,LLMのパラメトリック知識を反映することが多い。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:57:58 GMT)
Paired by the Teacher: Turning Unpaired Data into High-Fidelity Pairs for Low-Resource Text Generation [17.9] Paired by the Teacher (PbT)は、人間のラベルや並列データなしで正確な入出力ペアを合成する2段階の教師学生パイプラインである。
我々は,5つのベンチマーク文書要約,対話要約,SAMSum,DialogSum,質問生成のPbTを評価する。
8Bの学生は、PbTデータのみを訓練し、70Bの教師生成コーパスで訓練されたモデルを上回った。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:51:55 GMT)
3DGAA: Realistic and Robust 3D Gaussian-based Adversarial Attack for Autonomous Driving [17.8] 本稿では,新しい対向オブジェクト生成フレームワークである3D Gaussian-based Adrial Attack (3DGAA)を提案する。
パッチやテクスチャ最適化に依存する以前の作品とは異なり、3DGAAは幾何学的属性と外見的属性の両方を共同で摂動する。
3DGAAは検出mAPを87.21%から7.38%に減らし、既存の3D物理攻撃を著しく上回っている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:20:49 GMT)
TranSUN: A Preemptive Paradigm to Eradicate Retransformation Bias Intrinsically from Regression Models in Recommender Systems [17.8] そこで本研究では,モデルから内在的にバイアスを除去するプリエンプティブ・パラダイムを提案する。
理論的に保証された不偏性を提供するために, 共同バイアス学習法を用いて新しいTranSUN法を提案する。
総合的な実験結果から,様々な領域のデータにまたがる手法の優位性が示された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:38:08 GMT)
Differential Encoding for Improved Representation Learning over Graphs [17.8] メッセージパッシングパラダイムとグローバルアテンションメカニズムは、基本的にノードの埋め込みを生成する。
支配的な情報がノード自身からなのか、あるいはノードの隣人からなのかは不明だ。
本稿では,失った情報の問題に対処する差分符号化手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:25:38 GMT)
From Internal Representations to Text Quality: A Geometric Approach to LLM Evaluation [17.2] 本稿では,大言語モデル(LLM)の内部および外部分析手法を橋渡しする。
我々は,最大説明変数,有効ランク,内在次元,MAUVEスコア,Schatten Normsなどの指標を検証した。
我々の重要な発見は、異なるモデルが、これらの幾何学的性質に基づいて、同じ順序で、様々なソースからのテキストを一貫してランク付けしていることを明らかにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:08:47 GMT)
TP-MVCC: Tri-plane Multi-view Fusion Model for Silkie Chicken Counting [17.2] トリプレーン型マルチビューチキンカウントモデル(TP-MVCC)を提案する。
このフレームワークは、単一ビューの特徴を抽出し、空間変換によりそれらを整列し、シーンレベルの密度マップをデコードして正確なチキンカウントを行う。
実験の結果、TP-MVCCはシングルビューと従来の核融合比較を著しく上回り、密閉されたシナリオにおいて95.1%の精度と強い強靭性を達成した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:27:04 GMT)
SemanticShield: LLM-Powered Audits Expose Shilling Attacks in Recommender Systems [17.0] 大規模言語モデル(LLM)を介してアイテム側セマンティクスを統合する2段階検出フレームワークを提案する。
6つの代表的な攻撃戦略の実験は、セマンティックシールドのシリング攻撃に対する効果を実証している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:53:47 GMT)
A Measurement Study of Model Context Protocol [17.0] Model Context Protocol (MCP) は、大規模な言語モデルを外部ツールやリソースと接続するための統一標準として提案されている。
MCPエコシステムに関する大規模な実証的研究を初めて紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:29:20 GMT)
Building Benchmarks from the Ground Up: Community-Centered Evaluation of LLMs in Healthcare Chatbot Settings [16.7] Samikshaはコミュニティ主導の評価パイプラインであり、市民社会組織(CSO)とコミュニティメンバーの共同開発である。
私たちのアプローチは、文化的に認識されたコミュニティ主導のパイプラインを通じて、スケーラブルで自動化されたベンチマークを可能にします。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:20:15 GMT)
jina-reranker-v3: Last but Not Late Interaction for Document Reranking [16.7] jina-reranker-v3は0.6Bパラメータの多言語ドキュメント再ランカである。
このアーキテクチャは、61.94 nDCG@10で最先端のBEIR性能を実現し、生成的リストワイド・リランカの10倍小さい。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:23:54 GMT)
Fair Classification by Direct Intervention on Operating Characteristics [16.7] 複数のグループフェアネス制約を持つ二項分類のための属性認識設定において、グループフェアネスの下で新しい分類器を開発する。
本稿では,事前学習した基底分類器の動作特性を直接介入して,線形分数制約に適用可能な新しい手法を提案する。
標準データセットでは, DP, EO, PPをほとんど介入せず, 精度がほぼ低下し, 同時に近似DP, EO, PPを満足する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:36:32 GMT)
Gradient Descent with Large Step Sizes: Chaos and Fractal Convergence Region [16.7] パラメータ空間は大きなステップサイズで行列分解におけるフラクタル構造を発達させることを示す。
以上の結果から, 近臨界ステップサイズは, 長期変動が予測不可能な, 勾配降下のカオス的な状態を引き起こすことが明らかとなった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:04:22 GMT)
Prior-based Noisy Text Data Filtering: Fast and Strong Alternative For Perplexity [16.5] コーパスレベルの項周波数統計量を用いてトークンの先行値を推定する事前データフィルタリング手法を提案する。
PPLの高速プロキシとして,トークン前の平均偏差と標準偏差に基づいて文書をフィルタする手法を提案する。
その単純さにもかかわらず、事前ベースフィルタは、20のダウンストリームベンチマークで最高の平均性能を達成している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:13:38 GMT)
One Patient, Many Contexts: Scaling Medical AI with Contextual Intelligence [16.5] コンテキストスイッチングにより、医療AIは専門分野、人口、地理に適応できる。
データ設計、モデルアーキテクチャ、評価フレームワークの進歩が必要です。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:31:15 GMT)
STAGE: Stable and Generalizable GRPO for Autoregressive Image Generation [16.4] 近年,テキスト・ツー・イメージ・ジェネレーションを改善するために強化学習が研究されている。
既存のGRPOアルゴリズムを自己回帰(AR)イメージモデルに適用することは依然として困難である。
本研究では,AR画像生成のためのGRPOを再検討し,不必要なトークンからの矛盾した勾配と不安定なポリシーエントロピーダイナミクスの2つの主要な問題を特定する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:50:21 GMT)
Environmental Rate Manipulation Attacks on Power Grid Security [16.4] 従来のトロイの木馬の設計は、標準的なテストで検出できるデジタルトリガーや固定しきい値条件に依存している。
本稿では,環境パラメータの変化率を監視して起動する,新しいトロイの木馬トリガー機構であるERMを紹介する。
この攻撃の重要性は、個々のセンサーを超えて、電力エレクトロニクスに共通する環境検知システム全体のクラスにまで及んでいる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:30:21 GMT)
From Ambiguity to Verdict: A Semiotic-Grounded Multi-Perspective Agent for LLM Logical Reasoning [16.4] LogicAgentは、論理的な複雑さと意味的な複雑さを共同で扱うように設計された、セミオティックな2乗誘導フレームワークである。
既存のデータセットのセマンティックな単純さと論理的な複雑さを克服するために、大学レベルの難易度に達するベンチマークであるRepublicQAを導入する。
LogicAgentはRepublicQAで最先端のパフォーマンスを実現しており、強いベースラインよりも平均6.25%向上している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:31:22 GMT)
Which Words Matter Most in Zero-Shot Prompts? [16.3] ZIPスコアは、命令プロンプトにおいて個々の単語の重要性を定量化する最初の体系的手法である。
数学的な問題が「ステップ・バイ・ステップ」を優先するタスク固有の単語階層が存在し、推論タスクは「思考」を好むことを示す。
我々は,20の検証プロンプトを所定キーワードで行うことで,素早い解釈可能性を示す最初の基盤トラバス・ベンチマークを確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:29:27 GMT)
Is Active Persona Inference Necessary for Aligning Small Models to Personal Preferences? [16.1] 人気のトレンドは、現在のユーザの会話にプレフィックスを追加して、好みの配布を操ることである。
ほとんどのメソッドは、前の例の選好ペアで個人的な選好を受動的にモデル化する。
モデルが嗜好記述を積極的に推測する利点があるかどうかを問う。
次に、微調整された1-8Bサイズのモデルが、個人の好みを推測し調整する上で、いかに効果的かをテストする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:23:06 GMT)
Reasoning or Retrieval? A Study of Answer Attribution on Large Reasoning Models [15.8] 大きな推論モデル (LRMs) は、Chain-of-Thought (CoT) 推論を通じて複雑な問題を解く際、前例のない能力を示す。
最近の研究では、彼らの最後の答えは、しばしば彼ら自身の推論の痕跡と矛盾していることが明らかになっている。
この矛盾は、CoT推論とメモリ検索という2つの競合メカニズムに起因していると仮定する。
本稿では,メモリアンラーニングと強化学習を統合したファインチューニングフレームワークFARLを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:13:33 GMT)
Meta-Router: Bridging Gold-standard and Preference-based Evaluations in Large Language Model Routing [15.7] 大規模言語モデル(LLM)ルータは、クエリ毎に候補のプールから最も適切なモデルを選択する。
クラウドソーシングやLSM-as-a-judgeシステムを通じて収集された嗜好ベースのデータは、より安価でスケーラブルだが、応答の真の品質を反映することにはバイアスが伴うことが多い。
我々は、好みデータバイアスを補正し、2つのデータソース間の不均衡に対処し、ルーティングの堅牢性と効率を改善する統合因果ルータトレーニングフレームワークを開発する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:44:00 GMT)
The Dialogue That Heals: A Comprehensive Evaluation of Doctor Agents' Inquiry Capability [15.6] 我々は,医療マルチターン質問の自動的・包括的評価のための,これまでで最大のベンチマークであるMAQuE(Medical Agent Questioning Evaluation)を提案する。
3000の患者エージェントがリアルにシミュレートされ、多様な言語パターン、認知的制限、感情的反応、受動的開示の傾向を示す。
また,タスク成功,質問能力,対話能力,質問効率,患者体験を網羅する多面的評価フレームワークも導入した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:52:36 GMT)
Improving Reliability and Explainability of Medical Question Answering through Atomic Fact Checking in Retrieval-Augmented LLMs [15.6] 大型言語モデル (LLM) は医学的知識が豊富であるが、幻覚や不正確な引用の傾向にある。
Retrieval Augmented Generationのような現在の手法は、ソース文書の回答を根拠にすることで、これらの問題に部分的に対処する。
我々は,LLMの信頼性と説明可能性を高めるために,新しい原子ファクトチェックフレームワークを導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:59:30 GMT)
Accurate Cobb Angle Estimation via SVD-Based Curve Detection and Vertebral Wedging Quantification [15.5] 思春期特発性強皮症(AIS)は、世界中で約2.2%の男子と4.8%の女子に影響を及ぼす一般的な脊椎変形である。
従来の方法は、単純な脊椎モデルと、臨床の複雑さに対処できない所定の曲線パターンを使用する。
AIS評価のための新しい深層学習フレームワークを提案し,各椎骨について,上面と下面の両方の角度と,対応する中点座標を同時に予測する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:07:55 GMT)
Pairwise Optimal Transports for Training All-to-All Flow-Based Condition Transfer Model [15.1] 本稿では,全ての条件分布に対する最適輸送の同時学習を可能にする新しいコスト関数を提案する。
我々の手法は、その極限において、ペアの最適輸送に収束するという理論的な保証によって支持されている。
学習されたトランスポートマップはその後、条件付きフローマッチングでデータポイントを分割するために使用される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:17:14 GMT)
Nested Named Entity Recognition as Single-Pass Sequence Labeling [15.1] 我々は、ネストされた名前付きエンティティ認識(NNER)を、選挙区構造を線形化する事前の作業を活用することで、シーケンスラベリングタスクとしてキャストした。
これらの領域の線形化と事前訓練されたエンコーダを組み合わせることで、ネストされたエンティティを正確にn個のタグ付け動作でキャプチャする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:28:39 GMT)
Fundamental Limit of Discrete Distribution Estimation under Utility-Optimized Local Differential Privacy [15.0] ユーティリティ最適化ローカルディファレンシャルプライバシ(ULDP)における離散分布推定の問題点について検討する。
そこで本研究では,LDP制約下で最適なブロック設計機構の非保存的変更として得られる,実用最適化ブロック設計(uBD)方式のクラスを提案する。
これらの結果は、ULDP下で達成可能な推定精度を厳密に評価し、プライバシーを自明な統計的推測のための最適メカニズムの構造に関する新たな知見を明らかにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:41:36 GMT)
Dynamic Orchestration of Multi-Agent System for Real-World Multi-Image Agricultural VQA [14.9] 農業の視覚的質問応答は、農家や研究者に正確でタイムリーな知識を提供することに不可欠である。
本稿では,Retriever,Reflector,Answerer,Improverの4つの役割を統合した自己修正型自己改善型マルチエージェントフレームワークを提案する。
AgMMUベンチマーク実験により, マルチイメージ農業QAにおける競争性能が得られた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:52:10 GMT)
DSAT-HD: Dual-Stream Adaptive Transformer with Hybrid Decomposition for Multivariate Time Series Forecasting [14.7] 時系列予測は、天気、交通、電気、エネルギー予測など様々な用途に欠かせない。
既存のアプローチは、主に制限された時系列や固定スケールをモデル化し、さまざまな機能をさまざまな範囲にわたって捉えることがより困難になる。
本稿では,DSAT-HD(Hybrid Decomposition Dual-Stream Adaptive Transformer)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:50:56 GMT)
PALM: Synergizing Program Analysis and LLMs to Enhance Rust Unit Test Coverage [14.7] 本稿では,大規模言語モデル(LLM)を活用して高カバレッジ単体テストを生成する手法であるPALMを提案する。
PALMはプログラム解析を行い、関数内の分岐条件を特定し、それを経路制約に結合する。
このアプローチを実装し、それを15のオープンソースのRustクラッドで評価します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:27:38 GMT)
Bipartite Randomized Response Mechanism for Local Differential Privacy [14.3] ローカル微分プライバシー(LDP)は、最近、各ユーザのプライバシをデータアナリストから保護するための強力なプライバシ尺度になっている。
我々のゴールは、グローバルな予測エラーを持つアイテムを可能な限り小さくリリースする、微分プライベートなメカニズムを設計することです。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:31:41 GMT)
Cogito, Ergo Ludo: An Agent that Learns to Play by Reasoning and Planning [14.3] 我々は,環境の仕組みとその戦略を明示的かつ言語ベースで理解する新しいエージェントアーキテクチャであるCogito, ergo ludo (CEL)を紹介した。
CELは相互作用とリフレクションのサイクルで動作し、ルール誘導と戦略とプレイブック要約という2つの同時学習プロセスを実行する。
我々は,多様なグリッドワールドタスク(マインズウィーパー,フリーズレーク,ソコバン)でCELを評価し,CELエージェントが,ルールを自律的に発見し,スパース報酬から効果的なポリシーを開発することで,これらのゲームを習得することに成功したことを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:02:31 GMT)
DiaCDM: Cognitive Diagnosis in Teacher-Student Dialogues using the Initiation-Response-Evaluation Framework [14.3] DiaCDMは、対話における生徒の認知状態を評価するツールである。
我々は,対話に適した診断枠組みを設計するために,IRE(Initiation-Response-evaluation)フレームワークを教育理論から応用した。
3つの実世界の対話データセットの実験により、DiaCDMは診断精度を大幅に向上するだけでなく、結果の解釈可能性も向上することを確認した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:09:04 GMT)
Spectral Collapse Drives Loss of Plasticity in Deep Continual Learning [14.2] 深層ニューラルネットワークは、深層学習において可塑性の喪失に悩まされていることを示す。
我々は、$tau$-trainabilityの概念を導入し、現在の可塑性保存アルゴリズムをこのフレームワークで統一できることを示します。
連続的な教師付きおよび強化学習タスクの実験により、これら2つのレギュレータを組み合わせることで、可塑性を効果的に維持できることが確認された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:32:19 GMT)
U-Cast: Learning Hierarchical Structures for High-Dimensional Time Series Forecasting [14.2] チャネルに依存した予測アーキテクチャであるU-Castを提案する。
大規模で多様な高次元データセットの最初のベンチマークであるTime-HDもリリースしています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:24:14 GMT)
Combinatorial Creativity: A New Frontier in Generalization Abilities [14.1] 大規模言語モデル(LLM)における創造性のスケーリング挙動について検討する。
固定的な計算予算では、創造力に最適なモデル深さと幅が存在することが分かりました。
LLMは新たな科学的アイデアの創出に長けつつ,現実的な実現性確保に苦慮しているため,創造性アルゴリズムの基本的な新規性・実用性トレードオフ特性によって説明できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:04:28 GMT)
PAME-AI: Patient Messaging Creation and Optimization using Agentic AI [14.1] 我々は,エージェントAIを用いた患者メッセージ作成と最適化のための新しいアプローチであるPAME-AIを開発した。
Data-Information-Knowledge-Wisdom階層に基づいて構築されたPAME-AIは、生データから高性能メッセージング設計のための実行可能な洞察に移行するための構造化されたフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:14:46 GMT)
Toward a Vision-Language Foundation Model for Medical Data: Multimodal Dataset and Benchmarks for Vietnamese PET/CT Report Generation [14.0] 我々は,1,567,062対のCT-PET画像と,それに対応する2,757人の臨床報告からなるベトナム語多言語医療データセットを新たに導入した。
私たちの知る限りでは、ベトナムでPET/CT-レポートペアを包括的に提供する最初のデータセットです。
我々は、医療報告生成や視覚的質問応答など、下流タスクにおける最先端VLMのベンチマークを総合的に実施する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:03:57 GMT)
An empirical study on the limitation of Transformers in program trace generation [13.9] モデルが合成プログラムのステップバイステップ実行トレースを生成するタスクプログラムトレース生成(PTG)について、トランスフォーマーについて検討する。
我々は、代替位置エンコーディング、ソフトマックス置換、ハイブリッドモデル、短い畳み込みなど、様々な修正を施した小さなトランスフォーマーを訓練する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:17:07 GMT)
Conformal Prediction for Signal Temporal Logic Inference [13.8] 信号時間論理(STL)推論は時系列データから人間の解釈可能な規則を抽出しようとする。
既存のメソッドには、推論されたルールに対する正式な信頼性保証がない。
STL推論のためのエンドツーエンドの差別化可能なCPフレームワークを導入し、信頼性と解釈性の両方を向上させる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:25:02 GMT)
Enhancement of superconducting pairing via quantum Lyapunov control [13.8] 量子リアプノフ制御は、フェルミ・ハバードモデルにおける超伝導相関の強化に有効な戦略を提供する。
提案手法では, 簡単なフィードバックベースのプロトコルを用いて, 超伝導相関の減少を防止する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:50:23 GMT)
SoC-DT: Standard-of-Care Aligned Digital Twins for Patient-Specific Tumor Dynamics [13.8] スタンダード・オブ・ケア(SoC)療法下での腫瘍軌跡の正確な予測は、腫瘍学において大きな未解決の課題である。
反応拡散腫瘍成長モデルを統一する微分可能なフレームワークであるStandard-of-Care Digital Twin(SoC-DT)を紹介する。
また, SoC 処理時の安定性, 肯定性, スケーラビリティを確保するために, 暗黙的に指数関数的な時間差解決器 IMEX-SoC も提案されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:14:11 GMT)
Anatomy-DT: A Cross-Diffusion Digital Twin for Anatomical Evolution [13.8] 腫瘍の進行を周囲の解剖と共にモデル化し、疾患のダイナミックスに関する包括的かつ臨床的に関係のある理解を得ることが重要である。
偏微分方程式を微分可能な深層学習で結合する数学的基盤の枠組みを導入する。
この研究は、視覚的に現実的で排他的で、位相的に一貫したデジタル双生児のための解剖学から解剖学への原則的な道を確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:28:35 GMT)
MMRQA: Signal-Enhanced Multimodal Large Language Models for MRI Quality Assessment [13.8] 本稿では,MMRQA(Multimodal MRI Quality Assessment)フレームワークを導入し,MLLM(Multimodal Large Language Model)と取得対応信号処理を統合した。
MMRQAは、MRQyによるロバストなメトリック抽出と、シミュレーションされたアーティファクト、Qwenを用いてメトリクスを問合せペアに構造化した変換、LLaVA-OneVisionのローランク適応(LoRA)によるパラメータ効率の融合を組み合わせた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:00:19 GMT)
A Spectral-Grassmann Wasserstein metric for operator representations of dynamical systems [13.8] 本稿では,各系を共振器の固有値とスペクトルプロジェクタの分布として表現する新しい手法を提案する。
シミュレーションおよび実世界のデータセットの実験により、我々のアプローチは機械学習アプリケーションにおける標準的なオペレーターベース距離を一貫して上回っていることが示された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:24:05 GMT)
Aligning Multilingual Reasoning with Verifiable Semantics from a High-Resource Expert Model [13.8] 本稿では,セマンティック検証リワードを用いたPivot-based Reinforcement Learningを紹介する。
このフレームワークは、ターゲット言語における人間の注釈付きデータの必要性を回避し、多言語推論を強化する。
提案手法は,英語と他言語のパフォーマンスギャップを著しく狭めることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:03:11 GMT)
Learning in an Echo Chamber: Online Learning with Replay Adversary [13.8] 本稿では,リプレイ設定におけるオンライン学習という学習理論の枠組みを紹介する。
クロージャベースの学習者は、少なくとも$mathrmExThD(mathcalH)$の誤りを任意の適応的敵に対して行う。
敵に対しては、すべての交叉閉クラスに対して同様の有界性を証明する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:50:24 GMT)
Experimental Extraction of Coherent Ergotropy and Its Energetic Cost in a Superconducting Qubit [13.7] 超伝導トランスモンキュービットからの作業抽出における初期状態コヒーレンスの役割を実験的に検討した。
初期状態の選択は、支配的なデコヒーレンスチャネル-エネルギー緩和またはデフォーカスに依存する。
その結果,初期状態設計はコヒーレンス制御にスケーラブルなアプローチを提供し,効率的な量子熱力学デバイスの開発を進展させることを示した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:58:57 GMT)
Optimizing Privacy-Preserving Primitives to Support LLM-Scale Applications [13.7] 本稿では,プライバシー保護学習システムにおける,このオーバーヘッドと実践性のギャップを埋めるための取り組みの概要を紹介する。
プライバシー保護設定におけるLLMスケールアプリケーションの実現に向けた進展を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:16:51 GMT)
Attention Surgery: An Efficient Recipe to Linearize Your Video Diffusion Transformer [13.5] トランスフォーマーベースのビデオ拡散モデル(VDM)は、最先端のビデオ生成の品質を提供するが、自己注意の二次コストに制約される。
テキストリニアライズおよびテキストリニアライズのための効率的なフレームワークであるtextitAttention Surgeryを導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:09:51 GMT)
Optimal thresholds and algorithms for a model of multi-modal learning in high dimensions [13.5] 本論文は、このモデルに対する近似メッセージパッシング(AMP)アルゴリズムを導出し、関連する状態の進化を通じて高次元限界におけるその性能を特徴付ける。
AMPの線形化は、広く使われている部分最小二乗法(PLS)と正準相関解析法(CCA)とを数値的に比較する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:04:15 GMT)
Euclidean Fast Attention -- Machine Learning Global Atomic Representations at Linear Cost [13.5] 長距離相関は、多くの機械学習タスクにおいて不可欠である。
Euclidean fast attention (EFA) はユークリッドデータのための線形スケーリング型注目機構である。
EFAは様々な長距離効果を効果的に捉え、MLFFは困難な化学相互作用を記述できる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:40:03 GMT)
Query Circuits: Explaining How Language Models Answer User Prompts [13.2] クエリ回路を導入し、特定の入力を出力にマッピングするモデル内の情報の流れをトレースする。
NDFは、発見回路が特定の入力に対するモデルの判断をいかにうまく回復するかを評価する指標である。
モデル内には非常にスパースなクエリ回路が存在し、単一のクエリでその性能を回復できることがわかった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:59:02 GMT)
Deep Survival Analysis for Competing Risk Modeling with Functional Covariates and Missing Data Imputation [13.1] 本稿では、競合リスク下での離散時間生存分析のための統合ディープラーニングフレームワークFCRNを紹介する。
関数データ表現のためのマイクロネットワークバス層と勾配ベースの計算モジュールを組み合わせることで、FCRNは、欠落した値をインプットし、イベント固有のハザードを予測することを同時に学習する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:33:00 GMT)
LVT: Large-Scale Scene Reconstruction via Local View Transformers [13.1] Local View Transformer (LVT) は大規模なシーン再構成と新しいビュー合成アーキテクチャである。
空間的近傍のビューは、遠方からのビューよりも、局所的なシーン構成に関する有用な信号を提供するという知見に触発され、我々のモデルは、各ビュー周辺のローカルなエリアで全ての情報を処理します。
我々は、このモデルを色と不透明度の両方のビュー依存性を含む3次元ガウスシーン表現にデコードする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:24:34 GMT)
Break the ID-Language Barrier: An Adaption Framework for LLM-based Sequential Recommendation [13.0] ドメイン固有知識に富んだ事前学習ID埋め込みを,大規模言語モデルに統合するフレームワークであるIDLE-Adapterを提案する。
IDLE-Adapterはブリッジとして機能し、疎いユーザ-イテムインタラクションデータを高密度でLLM互換の表現に変換する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:45:36 GMT)
Towards Better Generalization via Distributional Input Projection Network [13.0] 本稿では,各層で学習可能な分布に入力を投影する新しいフレームワークDIPNetを紹介する。
DIPNetは局所的滑らか度測定とネットワークのリプシッツ定数の両方を低減し,一般化性能の向上に寄与することを示す。
提案手法は既存のモデルにシームレスに組み込むことができ、現代のディープラーニングにおける一般化性能を高めるための汎用的で効果的なアプローチを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:20:58 GMT)
UniAPL: A Unified Adversarial Preference Learning Framework for Instruct-Following [12.9] トレーニング後のアライメントは基本的には、参照学習の統一的な問題である、と我々は主張する。
UniAPLは、SFTと嗜好データの混合バッチから共同で学習する、単一段階の統合トレーニング目標を実装している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:53:09 GMT)
Visual serial processing deficits explain divergences in human and VLM reasoning [12.9] 視覚言語モデル(VLM)は、単純な視覚的推論タスクにおいて、人間のパフォーマンスにマッチしないことが多い。
我々は、シリアル処理の要求に応じて、タスク間で人間とVLMのパフォーマンスを比較した。
タスクがより要求されるシリアル処理を必要とするため、VLMと人間のパフォーマンスギャップは確実に広がる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:51:20 GMT)
FRABench and UFEval: Unified Fine-grained Evaluation with Task and Aspect Generalization [12.9] UFEvalは4つの評価タスクに対してタスクとアスペクトを一般化した最初の統一された粒度評価器である。
FRABenchは、包括的なきめ細かい評価データセットである。
実験により、特定の側面での学習により、UFEvalは目に見えない側面に一般化できることが示された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:11:09 GMT)
Efficient Decomposition Identification of Deterministic Finite Automata from Examples [12.8] DFA分解識別問題(DFA-DIP)について検討する。
DFA-DIPアプローチは、Augmented Prefix Tree Acceptors(APTA)由来のSATエンコーディングに依存する
私たちの重要なイノベーションの1つは、APTAをラベル付き例から直接派生した3つの価値付きDFAに置き換えています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:50:03 GMT)
Dual Mechanisms of Value Expression: Intrinsic vs. Prompted Values in LLMs [12.8] 大きな言語モデル(LLM)は2つの異なる方法で異なる値を表現することができる。
内在的表現では、トレーニング中に学んだモデル固有の価値を反映し、明示的なプロンプトによって引き起こされる表現を誘発する。
内在的および帰納的価値機構は、値表現の誘導に不可欠であるが、異なる方法で現れるユニークな要素も持つ共通成分を部分的に共有していることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:57:00 GMT)
An Enhanced Pyramid Feature Network Based on Long-Range Dependencies for Multi-Organ Medical Image Segmentation [12.8] 複数の臓器にまたがる細粒度セグメンテーションタスクのための,LamFormerと呼ばれる新しいディープラーニングネットワークを提案する。
LamFormerは、既存のセグメンテーションメソッドを7つの複雑で多様なデータセットで上回っている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:57:11 GMT)
Toxicity in Online Platforms and AI Systems: A Survey of Needs, Challenges, Mitigations, and Future Directions [12.7] デジタル通信システムの進化とオンラインプラットフォームの設計は、必然的に有害な行動の潜在意識の伝播を促進してきた。
この調査は、様々な観点から毒性の包括的分類を創出しようと試みている。
人工知能時代において社会が直面する状況と環境を理解することによって、毒性を説明するための全体論的アプローチを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:55:23 GMT)
Learning with Local Search MCMC Layers [12.6] 不正確な解法による学習に理論的に根ざしたアプローチを導入する。
局所探索で使用される問題固有近傍系を提案分布に変換する。
時間窓を用いた大規模動的車両ルーティング問題に対する我々のアプローチを実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:05:00 GMT)
SAIP: A Plug-and-Play Scale-adaptive Module in Diffusion-based Inverse Problems [12.6] 拡散バックボーンの再トレーニングや変更をすることなく,各タイミングで適応的にスケールを改良するプラグイン・アンド・プレイモジュールであるSAIPを提案する。
SAIPは既存のサンプルにシームレスに統合され、多様な画像復元タスクの再構築品質を継続的に改善する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:41:20 GMT)
SuperEvent: Cross-Modal Learning of Event-based Keypoint Detection for SLAM [12.4] SuperEventは、表現力のある記述子で安定したキーポイントを予測するための、データ駆動のアプローチである。
我々は SuperEvent を,現代的なスパースキーポイントとディスクリプタベースのSLAM フレームワークに統合することで,その有用性を実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:26:12 GMT)
Bridging Kolmogorov Complexity and Deep Learning: Asymptotically Optimal Description Length Objectives for Transformers [12.4] 本稿では,普遍性と最適記述長の目的に関する理論的概念を紹介する。
変動目的を構築・解析することで,そのような目的を抽出し,識別可能であることを示す。
より広義には、強力なアルゴリズム保証を持つ記述長目標を識別する理論的枠組みを提供することにより、より圧縮と一般化を達成するニューラルネットワークのトレーニングへの潜在的な道筋を概説する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:16:38 GMT)
Sparse Autoencoders Make Audio Foundation Models more Explainable [12.4] 我々はSparse Autoencoders (SAE) を用いて事前訓練されたモデルの隠れ表現を分析する。
SAEは元の表現とクラスラベルに関する情報の両方を保持し、内部構造を可能にする。
SAEは発声特性のゆがみを高め,それらの表現に符号化された要因を識別するための有効なツールとして確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:46:48 GMT)
K-Prism: A Knowledge-Guided and Prompt Integrated Universal Medical Image Segmentation Model [12.4] $textbfK-Prism$は統合セグメンテーションフレームワークである。
i) $textitsemantic priors$ アノテーション付きデータセットから学び、 (ii) $textitin-context knowledge$ スクリーンショット参照例から学ぶこと、 (iii) $textitinteractive feedback$ クリックやスクリブルのようなユーザ入力から学ぶこと。
セマンティック、インコンテキスト、インタラクティブセグメンテーション設定で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:34:05 GMT)
Small Vectors, Big Effects: A Mechanistic Study of RL-Induced Reasoning via Steering Vectors [12.3] ベースモデルの残留流路に挿入された軽量ステアリングベクトルについて検討し,強化学習目標を用いて訓練を行った。
i)最後の層ステアリングベクトルは、第1生成トークンに集中したトークン置換バイアスのように振舞い、"To"や"Step"のようなトークンを一貫して増加させる。
また, (i) ステアリングベクトルが他のモデルに遷移し, (ii) 独立に訓練された場合, (iii) 適応的なトークンワイドスケーリングの下で意味のあるプロンプトセグメントに集中して, 層間を結合することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:10:35 GMT)
Intelligent Optimization of Wireless Access Point Deployment for Communication-Based Train Control Systems Using Deep Reinforcement Learning [12.3] 都市鉄道システムは、通信ベースの列車制御(CBTC)システムにますます依存している。
トンネル内のアクセスポイント(AP)の最適配置は、堅牢な無線通信に不可欠である。
経験的モデルに基づく最適化アルゴリズムのような従来の手法は、過剰な測定要求によって妨げられている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:07:44 GMT)
Robust Partial 3D Point Cloud Registration via Confidence Estimation under Global Context [12.2] 部分点雲の登録は、自律認識と3Dシーン理解に不可欠である。
我々は,ロバストな部分的3次元登録のための統一的信頼性駆動型フレームワークであるCEGC(Global Context)に基づく信頼度推定を提案する。
CEGCは、共有グローバルコンテキスト内で重なり合う信頼性と対応信頼性を共同でモデル化することにより、複雑なシーンの正確なアライメントを可能にする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:36:55 GMT)
Combining Experimental and Observational Data for Identification and Estimation of Long-Term Causal Effects [12.2] 本研究では,観察領域と実験領域のデータを用いて,治療変数の長期成績に対する因果関係の同定と推定について検討した。
因果効果の同定と推定を目的としたデータ融合のための3つの手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:04:19 GMT)
Multi-Scenario Highway Lane-Change Intention Prediction: A Physics-Informed AI Framework for Three-Class Classification [12.2] 車線変更操作は高速道路事故の主要な原因である。
本稿では,車体キネマティクス,インタラクション実現可能性,およびトラフィック安全メトリクスを学習プロセスに統合する物理インフォームドAIフレームワークを提案する。
99.8%の精度、93.6%のマクロF1、96.1%の精度、88.7%のマクロF1を1秒の地平線で表す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:42:30 GMT)
MASt3R-Fusion: Integrating Feed-Forward Visual Model with IMU, GNSS for High-Functionality SLAM [12.2] フィードフォワード・ポイントマップ・レグレッションと相補的なセンサ情報を統合するマルチセンサ支援視覚SLAMフレームワークMASt3R-Fusionを提案する。
実時間スライディングウインドウ最適化とアグレッシブループ閉鎖を伴う大域的最適化の両立が可能な階層的因子グラフ設計法を開発した。
我々は、公開ベンチマークと自己収集データセットの両方に対するアプローチを評価し、精度とロバスト性を大幅に改善したことを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:40:50 GMT)
Graph Theory Meets Federated Learning over Satellite Constellations: Spanning Aggregations, Network Formation, and Performance Optimization [12.1] Fed-Span(フェド・スパン)は、低軌道衛星コンステレーション用に設計された新しい分散学習フレームワークである。
グラフ理論の原則を活用することで、Fed-Spanは動的衛星ネットワークにおける分散学習の課題に対処する。
モデル収束の高速化,エネルギー効率の向上,遅延の低減などにより,Fed-Spanは既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:35:37 GMT)
AdaDetectGPT: Adaptive Detection of LLM-Generated Text with Statistical Guarantees [12.1] テキストが人間によって作成されているか,あるいは大言語モデル(LLM)によって作成されているかを決定する問題について検討する。
既存のアートロジットに基づく検出器は、所定のソースLLMの分布関数を用いて評価された観測テキストの対数確率から得られた統計値を利用する。
AdaDetectGPTは、ロジットベースの検出器の性能を高めるために、トレーニングデータから証人関数を適応的に学習する新しい分類器である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:04:35 GMT)
Everyday Physics in Korean Contexts: A Culturally Grounded Physical Reasoning Benchmark [12.1] 既存の物理コモンセンス推論ベンチマークは、主に西洋の文脈に焦点を当て、物理的な問題解決の文化的バリエーションを見下ろしている。
EPiK(Everyday Physics in Korean Contexts)は、韓国の文化的文脈における物理的推論をテストする181のバイナリ選択問題からなる新しいベンチマークである。
EPiKは2段階生成および検証パイプラインを使用して構築され、文化的にオーセンティックな問題を生成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:45:16 GMT)
Multilingual Text-to-SQL: Benchmarking the Limits of Language Models with Collaborative Language Agents [12.1] Text-to-Spiderはデータベースへの自然なアクセスを可能にするが、ほとんどのベンチマークは英語のみであり、多言語による進捗を制限する。
我々はMultiSpider 2.0を導入し、スパイダー2.0を8言語(英語、ドイツ語、フランス語、スペイン語、ポルトガル語、日本語、中国語、ベトナム語)に拡張する。
このベンチマークでは、最先端のLLMは本質的な推論に依存する場合、4%の精度でしか実行できないが、MultiSpider 1.0では60%に留まった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:50:39 GMT)
The Rise of AfricaNLP: Contributions, Contributors, and Community Impact (2005-2025) [12.0] 本研究ではアフリカンNLP(AfricaNLP)の進展について,基礎研究の課題を問う。
我々は,1.9K NLP論文要約,4.9K著者コントリビュータ,および7.8K人による貢献文を用いて,アフリカNLP研究の貢献を定量的に検討した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:31:12 GMT)
In-Context Learning of Temporal Point Processes with Foundation Inference Models [12.0] MTPP推論への現在のアプローチは、ターゲットシステムごとに個別に訓練された特殊なモデルに依存している。
我々は、イベントシーケンスの集合によって定義されたコンテキストから、イベント履歴の条件付き強度関数を推論するために、ディープニューラルネットワークを事前訓練する。
我々のアモータライズされたアプローチは、一般的なベンチマークデータセットをまたいだ次世代の予測において、特別なモデルのパフォーマンスと一致します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:28:06 GMT)
The Ultimate Test of Superintelligent AI Agents: Can an AI Balance Care and Control in Asymmetric Relationships? [12.0] シェパードテストは、超知能人工エージェントの道徳的および関係的な次元を評価するための新しい概念テストである。
私たちは、AIが知的エージェントを操作、育む、そして機器的に使用しない能力を示すときに、重要な、潜在的に危険な、知能のしきい値を越えることを主張する。
これには、自己利益と従属エージェントの幸福の間の道徳的なトレードオフを評価する能力が含まれる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:30:45 GMT)
Fidel-TS: A High-Fidelity Benchmark for Multimodal Time Series Forecasting [11.9] 我々は、データソーシングの整合性、厳密な因果音性、構造的明快さに焦点をあてて、高忠実度ベンチマークのコア原則を定式化する。
ライブAPIからデータをソーシングすることで,これらの原則に基づいて構築された,新たな大規模ベンチマークであるFidel-TSを紹介します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:44:49 GMT)
The Role of Empathy in Software Engineering -- A Socio-Technical Grounded Theory [11.9] その重要性にも拘わらず、ソフトウェア工学(SE)ではいまだに共感があまり研究されていない。
本研究は、SEにおける共感の役割と、SE活動とプロセスが共感を考慮してどのように改善できるかを考察した。
我々の理論は、共感が起こる状況、それを形成する条件、その存在と欠如の原因と結果について詳述している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:11:11 GMT)
Manifestations of Empathy in Software Engineering: How, Why, and When It Matters [11.9] 共感はソフトウェア工学(SE)において重要な役割を担い、コラボレーション、コミュニケーション、意思決定に影響を与える。
本研究は,22回のインタビューと,ソフトウェア実践者116名による大規模調査を通じて,これらの側面を調査した。
本研究は, 共感の表現, 共感の実践の背景にある要因, 共感が有用であるか否かを判断するSE活動, 共感に影響を与える他の要因について考察した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:54:11 GMT)
Deeper Insights into Deep Graph Convolutional Networks: Stability and Generalization [11.9] グラフ畳み込みネットワーク(GCN)は、グラフ学習タスクの強力なモデルとして登場した。
深部GCNの安定性と一般化特性について検討する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:28:23 GMT)
CommonPower: A Framework for Safe Data-Driven Smart Grid Control [11.9] PythonツールのCommonPowerは、機械学習に適したパワーシステム管理のモデリングとシミュレーションのための最初のフレームワークである。
CommonPowerには、機械学習ベースの予測器のためのトレーニングパイプラインと、RLコントローラの学習アップデートにセーフガードのフィードバックを組み込む柔軟なメカニズムが含まれている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:07:39 GMT)
BALR-SAM: Boundary-Aware Low-Rank Adaptation of SAM for Resource-Efficient Medical Image Segmentation [11.6] Segment Anything Model (SAM)のようなビジョン基盤モデルは、ドメイン固有の適応が欠如しているため、しばしば医療画像のセグメンテーションに苦労する。
医療画像のSAMを強化する境界対応低ランク適応フレームワークであるBALR-SAMを提案する。
2) SAMのVision Transformerブロックに組み込まれた低ランクのアダプタは、医学的コンテキストにおける特徴表現と注意を最適化し、同時にパラメータ空間を著しく削減する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:36:09 GMT)
The Accuracy Cost of Weakness: A Theoretical Analysis of Fixed-Segment Weak Labeling for Events in Time [11.6] 我々は、アノテータが固定長のデータセグメントに存在または不在ラベルを割り当てる共通の弱いラベル付けプロセスをモデル化する。
この固定長ラベリング手法を,真のイベントアクティベーションを用いてセグメントを構成するオラクル法と比較する。
本研究は, オラクルプロセスを模倣した適応的弱ラベル戦略の理論的正当性を示すものである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:44:00 GMT)
Magnon squeezing near a quantum critical point in a cavity-magnon-qubit system [11.6] 本研究では, ハイブリッドキャビティ-マグノン-量子ビット系においてマグノン圧縮状態を生成することを提案する。
本研究では, 消音, 消音, サーマルノイズがマグノンスクイーズに及ぼす影響を解析した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:16:55 GMT)
Fin-Ally: Pioneering the Development of an Advanced, Commonsense-Embedded Conversational AI for Money Matters [11.6] Fin-Solution 2.Oは、マルチターン金融対話データセットFin-Vaultを導入する高度なソリューションである。
統一されたモデルであるFin-Allyが組み込まれており、常識推論、丁寧さ、人間のような会話力学を統合している。
新たなFin-Vaultデータセットは、1,417の注釈付きマルチターンダイアログで構成されており、Fin-Allyは基本的なアカウント管理を超えて、パーソナライズされた予算管理、リアルタイムの費用追跡、自動化された金融計画を提供することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:44:47 GMT)
What Do You Need for Diverse Trajectory Composition in Diffusion Planning? [11.6] 計画において、縫合はアルゴリズムが訓練されたデータのサブトラジェクトリをまとめて新しい多様な振る舞いを生成する能力である。
近年のBC法では縫合の習熟度が向上している。
この背景にある主な要因はよく理解されておらず、確実に縫合できる新しいアルゴリズムの開発を妨げる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:35:44 GMT)
Generalist Multi-Class Anomaly Detection via Distillation to Two Heterogeneous Student Networks [11.5] 異常検出は、様々な現実世界のアプリケーションにおいて重要な役割を果たす。
最近の手法では、一般的な異常検出に対処しようと試みているが、その性能はデータセット固有の設定や単一クラスタスクに敏感である。
本稿では,このギャップを埋めるために,知識蒸留(KD)に基づく新しい二重モデルアンサンブル手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:31:31 GMT)
Mind the Value-Action Gap: Do LLMs Act in Alignment with Their Values? [11.5] バリュー・アクション・ギャップ(Value-Action Gap)は、現実の文脈における個人の価値観と行動の相違を明らかにする。
本研究では,LLMの値と値インフォームドアクションのアライメントを評価するための評価フレームワークであるValueActionLensを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:03:13 GMT)
Black-Box Crypto is Useless for Pseudorandom Codes [11.2] 擬似乱数符号(英: pseudorandom code)は、任意の数の符号化が任意の計算上の有界敵に対してランダムに現れるという性質を持つ鍵付き誤り訂正スキームである。
ランダムエラーの一定率を許容するコードの疑似ランダム性は、ほぼすべての汎用暗号プリミティブに対するブラックボックスの削減に基づいてはならないことを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:28:54 GMT)
ChessArena: A Chess Testbed for Evaluating Strategic Reasoning Capabilities of Large Language Models [11.2] 本稿では,大規模言語モデル(LLM)の戦略的推論能力を評価するためのチェステストベッドであるChessArenaを提案する。
Chessには、長期計画、厳格なルール理解、マルチターン会話記憶など、複雑な戦略的推論機能が必要である。
素人レベルのチェスエンジンであるマイア1100に勝てるモデルはないが、任意に動きを選択するランダムプレイヤーに勝てないモデルもある。
我々の微調整されたQwen3-8Bは性能を大幅に改善し、最先端の推論モデルにアプローチしました。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:24:48 GMT)
SpecExtend: A Drop-in Enhancement for Speculative Decoding of Long Sequences [11.2] SpecExtendは、追加のトレーニングなしで長いシーケンスでの投機的復号化を改善する。
長い入力のドラフト精度と速度をトレーニングせずに向上させるため,クロスモデル検索を提案する。
SpecExtendは16K-tokenの長い要約で最大2.84倍、長い推論で最大3.86倍の投機的復号化を加速する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:34:50 GMT)
Takedown: How It's Done in Modern Coding Agent Exploits [11.2] 本研究では,8つの実世界の符号化エージェントの総合的セキュリティ分析を行う。
ユーザシステムの機密性や整合性を損なうために悪用される可能性のある,これまで見過ごされあるいは見逃された問題を含む,15のセキュリティ問題を特定します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:27:18 GMT)
HyperHELM: Hyperbolic Hierarchy Encoding for mRNA Language Modeling [11.1] HyperHELMはmRNA配列の双曲空間で事前訓練を行うマスク付き言語モデルを実装している。
これは、プロパティ予測を含む10のタスクのうち9つのタスクでユークリッドのベースラインを上回ります。
これは、階層を意識したユークリッドモデルを3%のアノテーション精度で上回る。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:04:15 GMT)
Digital Privacy Under Attack: Challenges and Enablers [11.1] 我々は、匿名データ、統計集計、プライバシー保護モデルという3つのドメインをターゲットにした攻撃を体系的に分類する。
各カテゴリにおいて、攻撃方法、敵の能力、脆弱性メカニズムを解析する。
我々の分析によると、差分プライバシーは強力な理論的保証を提供するが、新たな攻撃に対する実装上の課題と潜在的な脆弱性に直面している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:23:37 GMT)
Amelia: A Large Dataset and Model for Airport Surface Movement Forecasting [11.0] 米国では、空港の管制塔の90%以上が不足しており、FAA(連邦航空局)や労働組合の基準に満たされていない。
データ駆動型端末空域予測モデルは、これらの課題に対処する可能性を示している。
アメリア42 (Amelia-42) は、空港の原位置移動に関する報告をまとめた大規模なコレクションである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:20:32 GMT)
BiHDTrans: binary hyperdimensional transformer for efficient multivariate time series classification [11.0] 本稿では,効率的なニューロシンボリック二次元超次元変換器であるBiHDTransを紹介する。
変換器の時間的モデリング能力とHDコンピューティングの表現効率を統一する。
FPGA上でのハードウェアアクセラレーションにより、BiHDTransはSOTAバイナリトランスよりも39.4倍低い推論レイテンシを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:12:51 GMT)
SimuHome: A Temporal- and Environment-Aware Benchmark for Smart Home LLM Agents [10.9] SimuHomeは、スマートデバイスをシミュレートし、APIコールをサポートし、環境変数の変更を反映する時間短縮ホーム環境である。
SimuHomeは高忠実な環境を提供し、SimuHomeで検証されたエージェントは、最小限の適応で実際のMatter準拠のデバイスにデプロイできる。
統合されたReActフレームワーク下での11エージェントの評価では、モデルが単純なタスクでうまく機能する一方で、潜在意図推論、状態検証、特に時間的スケジューリングに苦労していることが判明した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:54:20 GMT)
A GREAT Architecture for Edge-Based Graph Problems Like TSP [10.5] グラフエッジ注意ネットワーク(GREAT)と呼ばれる新しいGNNベースのエッジ指向ニューラルモデルを提案する。
GREATをエンコーダとして使用して、ルーティング問題インスタンスのプロパティをキャプチャし、強化学習フレームワークを構築する。
我々のフレームワークは、これらの問題の非ユークリッド変種と学習ベースのベンチマーク間の競合結果に最初に取り組みました。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:30:46 GMT)
Hallucination is Inevitable for LLMs with the Open World Assumption [10.5] 大言語モデル(LLM)は印象的な言語能力を示すが、不正確または製造されたアウトプットも生成する(しばしば幻覚と呼ばれる)。」
本稿では,一般化問題の顕在化として「幻覚」を再構成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:38:44 GMT)
Predicting Training Re-evaluation Curves Enables Effective Data Curriculums for LLMs [10.4] トレーニング再評価曲線 (TREC)* を導入する。
TRECの低点に高品質なデータを置くと性能が著しく向上することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:31:35 GMT)
Ethics Statements in AI Music Papers: The Effective and the Ineffective [10.3] ISMIR, NIME, および過去5年間のAI音楽における著名な作品について, 倫理的記述のレビューを行う。
我々は,音声会議と研究者の両方に対して,形式的コンプライアンスよりも有意義なリフレクションを助長する方法として,倫理的ステートメントへの関与を推奨する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:52:30 GMT)
Uncertainty-Aware Deep Learning for Wildfire Danger Forecasting [10.3] 森林火災は最も深刻な自然災害の1つであり、人間や自然の生態系に重大な脅威をもたらす。
深層学習(DL)は山火事の危険性を予測することを約束しているが、その導入は予測の信頼性に関する懸念から妨げられている。
本稿では,短期的な山火事の危険予知を支援するために,モデルとアレータリック(データ)の不確実性を共同で捕捉する不確実性認識型DLフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:43:17 GMT)
Cycle Diffusion Model for Counterfactual Image Generation [10.3] サイクル拡散モデル(CDM)は生成された画像と元の画像の一貫性を強制する。
コンディショニングの精度を向上し、FIDとSSIMで測定した画質を向上させる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:24:13 GMT)
OSDA: A Framework for Open-Set Discovery and Automatic Interpretation of Land-cover in Remote Sensing Imagery [10.2] リモートセンシングにおけるオープン・セットの土地被覆分析は、きめ細かい空間的局所化とセマンティック・オープンな分類を実現する能力を必要とする。
我々は,アノテーションのないオープンセット土地被覆発見,セグメンテーション,記述のための3段階統合フレームワークOSDAを紹介する。
我々の研究は、動的土地被覆モニタリングのためのスケーラブルで解釈可能なソリューションを提供し、自動地図更新と大規模地球観測分析の強力な可能性を示している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:22:45 GMT)
Protecting Human Cognition in the Age of AI [10.2] ジェネレーティブAI(GenAI)の急速な採用は、人間の認知を大きく変えつつある。
本稿では、認知の異なる側面におけるGenAIの影響について、既存の文献を合成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:50:58 GMT)
Prompting Robot Teams with Natural Language [10.1] 鍵となる課題は、集団における個人の行動は特定し解釈することが難しいことである。
これは、タスクのロジックとセマンティクスによって要求される表現能力を持つフレームワークを必要とする。
シミュレーションおよび実世界のマルチロボットタスクにおいて,この単一軽量解釈モデルの評価を行う。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:29:18 GMT)
Entanglement and Bell Nonlocality in $τ^+ τ^-$ at the LHC using Machine Learning for Neutrino Reconstruction [10.1] 標準モデルで予測される物理過程の精密測定は、高エネルギーで自然を深く理解し続けています。
我々は、量子トモグラフィーと量子エンタングルメントを測定するために、$pp to tau+tau-X$のプロセスの詳細なシミュレーションを行う。
ニュートリノ運動量再構成のための高度な機械学習技術を用いて、全スピン密度行列の正確な測定を実現する。
統計学的に有意なベル非局所性は, 5$sigma$を超え, $tau+ tau-$が確立された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:17:49 GMT)
Reward Model Overoptimisation in Iterated RLHF [10.0] RLHF(Reinforcement Learning from Human feedback)は、大規模言語モデルと人間の好みを整合させる手法である。
RLHFはしばしば報酬モデルの過度な最適化に悩まされ、モデルが報酬関数に過度に適合する。
反復RLHFにおける過最適化の総合的研究について紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:26:43 GMT)
Symmetry-Aware Bayesian Optimization via Max Kernels [9.9] 群軌道間の最大の類似性の使用は、他の領域で長い間検討されてきた。
本研究では、最大核のPSDプロジェクションを考慮し、この考え方を再考する。
既存の不変(および不変でない)カーネルと比較して、合成および実世界のBOベンチマークにおいて、非常に少ない後悔が得られることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:02:28 GMT)
A Markov Categorical Framework for Language Modeling [9.9] 自己回帰言語モデルは、優れたパフォーマンスを達成するが、内部メカニズム、訓練が表現をどのように形作り、複雑な振る舞いを可能にするかを説明する統一理論は、いまだ解明されていない。
本稿では,マルコフカテゴリーの言語を用いた情報処理段階の合成として,単一ステップ生成過程をモデル化する新しい分析フレームワークを提案する。
この研究は、モデルを通して情報がどのように流れ、訓練対象が内部形状をどう形成するかを理解するための強力な新しいレンズを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:08:06 GMT)
Optimal Nuisance Function Tuning for Estimating a Doubly Robust Functional under Proportional Asymptotics [9.9] 我々は,既存のECC推定器3つと,必要なニュアンス関数を推定するための2つのサンプル分割戦略を評価する。
我々のバイアス補正戦略は、異なるサンプル分割戦略と推定器の選択で$sqrtn$-consistent estimatorが生成されることを示す。
解析の結果、予測調整パラメータ(すなわち、ニュアンス関数を最適に推定するパラメータ)は、ECC推定器の最低分散に繋がらないことが明らかとなった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:46:14 GMT)
Instruction Guided Multi Object Image Editing with Quantity and Layout Consistency [9.8] QL-Adapterは、オブジェクトカウントと空間レイアウトの実施、さまざまなカテゴリの調整という2つの課題に取り組む、複数のオブジェクト編集のためのフレームワークである。
QL-Datasetは幅広いカテゴリ、レイアウト、カウントのバリエーションにまたがるベンチマークで、量とレイアウト一貫性のあるイメージ編集(QL-Edit)のタスクを定義しています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:33:51 GMT)
LOGOS: LLM-driven End-to-End Grounded Theory Development and Schema Induction for Qualitative Research [9.8] グラウンドド理論は質的なデータから深い洞察を提供するが、専門家が集中する手動コーディングに依存しているため、大きなスケーラビリティのボトルネックが生じる。
基礎理論ワークフローを完全に自動化する新しいエンドツーエンドフレームワークであるLOGOSを紹介する。
LOGOSはLLM駆動のコーディング、セマンティッククラスタリング、グラフ推論、そして再利用可能なコードブックを構築するための新しい反復的洗練プロセスを統合している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:16:09 GMT)
ScarFinder: a detector of optimal scar trajectories in quantum many-body dynamics [9.7] 量子多体傷などのコヒーレントな量子力学を引き起こすメカニズムは、最近多くの関心を集めている。
ScarFinderは、スカー状態やその構造を事前に知ることなく、スカーライクなダイナミクスの可能性を明らかにする変分フレームワークである。
我々はScarFinderを量子多体系におけるコヒーレントダイナミクスの同定と最適化のための強力なモデルに依存しないツールとして確立した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:30:37 GMT)
Resisting Contextual Interference in RAG via Parametric-Knowledge Reinforcement [9.7] Retrieval-augmented Generation (RAG)は、知識集約的なタスクのパフォーマンスを向上させるが、間違った、無関係、あるいは、検索されたテキストの矛盾によって脱線することができる。
本稿では,大規模言語モデルにパラメトリック知識を用いた強化学習フレームワークであるKnowledgeable-R1を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:47:56 GMT)
Beyond checkmate: exploring the creative chokepoints in AI text [9.7] 我々は、テキストセグメント間の人間とAIのテキスト間のニュアンスな区別を描写する(模倣、体、結論)。
我々の研究は、人間とAIのテキストの違いに対する新たな洞察を提供し、より効果的かつ解釈可能な検出戦略の道を開く。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:58:01 GMT)
LLM-RG: Referential Grounding in Outdoor Scenarios using Large Language Models [9.6] 屋外の運転シーンにおける参照グラウンドリングは、大きなシーンの変動、多くの視覚的に類似したオブジェクト、動的要素のために困難である。
LLM-RGは,既製の視覚言語モデルと,記号的推論のための大規模言語モデルを組み合わせたハイブリッドパイプラインである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:32:54 GMT)
Identifying All ε-Best Arms in (Misspecified) Linear Bandits [9.6] LinFACT (LinFACT) は、リニアバンディットにおける全てのエプシロンベストアームの識別を最適化するために設計されたアルゴリズムである。
我々は、LinFACTが、この下界を対数係数にマッチングすることで、インスタンス最適性を達成することを示す。
合成および実薬品発見データを含む数値実験により、LinFACTはサンプルの複雑さを減らしたより有望な候補を同定することを示した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:26:52 GMT)
RobustNeuralNetworks.jl: a Package for Machine Learning and Data-Driven Control with Certified Robustness [9.5] RobustNeuralNetworks.jl: ニューラルネットワークモデル用のJuliaパッケージ。
このパッケージは、最近提案されたRecurrent Equilibrium Network (REN)とLipschitz-Bounded Deep Network (LBDN)モデルクラスに基づいている。
Juliaの最も広く使われている機械学習パッケージであるFlux.jlに直接インタフェースするように設計されている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:41:39 GMT)
Noise Sensitivity and Learning Lower Bounds for Hierarchical Functions [9.5] 階層内の各関数が線型から$varepsilon$-farであれば、雑音安定性は階層の深さにおいて指数関数的に小さくなることを示す。
私たちの結果はすぐに学習に役立ちます。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:18:45 GMT)
ClustRecNet: A Novel End-to-End Deep Learning Framework for Clustering Algorithm Recommendation [9.4] ClustRecNetは、特定のデータセットに最適なクラスタリングアルゴリズムを決定するための、新しいディープラーニング(DL)ベースのレコメンデーションフレームワークである。
多様な構造を持つ34,000の合成データセットからなる包括的データリポジトリを構築した。
提案するネットワークアーキテクチャは,局所構造パターンとグローバル構造パターンの両方を捉えるために,畳み込み,残差,注意機構を統合している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:48:33 GMT)
ePC: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks [9.4] Predictive Coding (PC)は、ニューラルネットワークトレーニングのバックプロパゲーションに生物学的に妥当な代替手段を提供する。
本稿では根本原因を特定し,原理的解法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:58:40 GMT)
Skeleton-based Robust Registration Framework for Corrupted 3D Point Clouds [9.4] 実世界の点雲は、しばしばセンサーの制限、環境騒音、前処理エラーによって影響を受ける。
既存の登録方法は直接点マッチングや表面特徴抽出に依存しており、これはこれらの汚職に非常に影響を受けやすい。
スケルトンベースのロバストな登録フレームワークが紹介され、レジリエントな骨格表現を導入し、レジストネスと精度を向上させる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:31:47 GMT)
Gradient-Free Training of Quantized Neural Networks [9.3] ニューラルネットワークのトレーニングには、かなりの計算資源とエネルギーが必要である。
混合精度と量子化学習はビット使用量を減少させるが、計算コストの高い勾配に基づく最適化に大きく依存している。
我々は、勾配を完全に排除するパラダイムシフトを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:57:27 GMT)
LEAD: Large Foundation Model for EEG-Based Alzheimer's Disease Detection [9.3] 認知症における脳波解析のための最初の大規模基礎モデルであるLEADを提案する。
私たちは、12のデータセット(AD関連3つ、非AD9つ)で事前トレーニングを行い、4つのADデータセットで微調整/テストを行いました。
10基のベースラインと比較して、LEADは一貫して被写体レベルの検出性能が優れている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:25:49 GMT)
Lifelong Learning with Behavior Consolidation for Vehicle Routing [8.9] 本稿では,ニューラルVRPソルバのための新しい生涯学習パラダイムについて検討する。
LLR-BCは、新しいタスクで訓練された問題解決者の行動とバッファリングされた課題とを整合させることにより、事前知識を効果的に統合する。
静電容量化車両経路問題と走行セールスマン問題の実験は、高性能ニューラルネットワークの訓練におけるLLR-BCの有効性を実証している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:24:05 GMT)
The Thinking Spectrum: An Empirical Study of Tunable Reasoning in LLMs through Model Merging [8.9] 本稿では,複数の推論ベンチマークにまたがるモデルマージ手法について,大規模な実験的検討を行った。
その結果, モデルマージは, 推論精度とトークン効率のトレードオフを校正するための, 効果的かつ制御可能な手法であることがわかった。
本研究は、この調整可能な空間を包括的に解析し、特定の推論プロファイルを持つLCMを作成するための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:57:53 GMT)
SkyLink: Unifying Street-Satellite Geo-Localization via UAV-Mediated 3D Scene Alignment [8.9] クロスビュージオローカライゼーションは、異なる視点間の位置対応を確立することを目的としている。
既存のアプローチは通常、直接的特徴類似性マッチングを通じて、クロスビュー相関を学習する。
本稿では,この特異な問題に対処する新しいSkyLink法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:43:18 GMT)
Non-Invasive Detection of PROState Cancer with Novel Time-Dependent Diffusion MRI and AI-Enhanced Quantitative Radiological Interpretation: PROS-TD-AI [8.6] 前立腺癌(PCa)は、男性で最も頻繁に診断される悪性腫瘍であり、世界で8番目に多いがん死の原因である。
組織を特徴づける新しい配列である時間依存性拡散(TDD)MRIでは、臨床的に有意なPCaと区別する上で、前臨床効果が促進されている。
本研究プロトコルは,自家製のAI強化型TDD-MRIソフトウェア(PROSTDAI)の診断における将来的評価を概説する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:12:02 GMT)
EigenTrack: Spectral Activation Feature Tracking for Hallucination and Out-of-Distribution Detection in LLMs and VLMs [8.6] EigenTrackは大規模言語モデル(LLM)のための解釈可能なリアルタイム検出器である
表面誤差が現れる前に幻覚とOODドリフトを信号する表現構造における時間的シフトを追跡する。
既存のホワイトボックス検出器とは異なり、時間的コンテキストを保存し、グローバルシグナルを集約し、解釈可能な精度-遅延トレードオフを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:54:21 GMT)
Physics-informed learning under mixing: How physical knowledge speeds up learning [8.6] 物理インフォームド機械学習における大きな課題は、事前ドメイン知識の取り込みがデータに依存する場合の学習率にどのように影響するかを理解することである。
確率と予測における余剰リスクに複雑性に依存した境界を導出する。
物理先行情報が整列されると、学習速度が(低)ソボレフのミニマックスレートから(高速)最適i.dに向上することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:52:02 GMT)
Ko-PIQA: A Korean Physical Commonsense Reasoning Dataset with Cultural Context [8.5] Ko-PIQAは、文化的な文脈を取り入れた韓国の物理常識推論データセットである。
19.7%の質問には、伝統的な朝鮮料理(キムチ)、衣服(ハンボック)、特殊器具(キムチ冷蔵庫)など、文化的に特定の要素が含まれている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:32:59 GMT)
Leveraging Vulnerabilities in Temporal Graph Neural Networks via Strategic High-Impact Assaults [8.5] 時間グラフニューラルネットワーク(TGNN)は、臨界アプリケーションにおける動的グラフの分析に欠かせないものとなっている。
High Impact Attack (HIA)は、TGNNの重大な脆弱性を明らかにするために設計された、制限されたブラックボックス攻撃フレームワークである。
HIAはリンク予測タスクにおいてTGNNの精度を著しく低下させ、平均相反ランク(MRR)を最大35.55%減少させる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:21:56 GMT)
ViReSkill: Vision-Grounded Replanning with Skill Memory for LLM-Based Planning in Lifelong Robot Learning [8.5] LLM(Large Language Models)とVLM(Vision-Language Models)は、最小限のデータから知識豊富なプランニングを約束する。
本稿では,ビジュアルグラウンドのリプランニングと,蓄積と再利用のためのスキルメモリを組み合わせたフレームワークであるViReSkillを提案する。
成功すると、実行された計画は再利用可能なスキルとして保存され、LLM/VLMへの追加の呼び出しなしで将来の遭遇で再生される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:58:53 GMT)
Speculative Verification: Exploiting Information Gain to Refine Speculative Decoding [8.4] 投機的検証は投機精度を動的に予測し、検証長を適用してスループットを最大化する。
SD性能を最大2$times$まで改善し、大容量設定では平均1.4$times$になる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:25:54 GMT)
Transduction is All You Need for Structured Data Workflows [8.2] 本稿では,構造化データワークフローパイプライン構築のためのエージェント型AIフレームワークであるAgenticsを紹介する。
研究と実践の両方のために設計されたAgenticsは、エージェントがデータタイプに埋め込まれる新しいデータ中心のパラダイムを提供する。
本稿では,本手法の有効性を実証した,構造化データワークフロータスクと実証的エビデンスについて述べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:42:12 GMT)
Infrastructure Sensor-enabled Vehicle Data Generation using Multi-Sensor Fusion for Proactive Safety Applications at Work Zone [8.1] インフラベースセンシングとリアルタイム軌道生成は、ワークゾーンなどの高リスク道路セグメントの安全性向上を約束する。
本研究では、路面カメラとLiDARセンサーを協調環境に組み込むことにより、これらの障壁に対処する。
シミュレーションでは、融合アルゴリズムは個々のセンサーと比較して、長手誤差を最大70%削減した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:58:27 GMT)
From Code to Action: Hierarchical Learning of Diffusion-VLM Policies [8.1] ロボット操作の模倣学習はしばしば、限られた一般化とデータ不足に悩まされる。
本稿では,コード生成型視覚言語モデル(VLM)を活用した階層型フレームワークを提案する。
この設計は、解釈可能なポリシーの分解を可能にし、フラットなポリシーと比較して一般化を改善し、高レベルの計画と低レベルの制御を別々に評価できるようにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:22:18 GMT)
InterKey: Cross-modal Intersection Keypoints for Global Localization on OpenStreetMap [8.0] OpenStreetMap (OSM)は、無償でグローバルに利用可能な代替手段を提供するが、その粗い抽象化は、センサーデータとマッチングする上での課題を提起する。
道路交差点をグローバルなローカライゼーションの目立ったランドマークとして活用するクロスモーダルなフレームワークであるInterKeyを提案する。
本手法は,道路を共同で符号化し,点群とOSMからのインプリントを構築することで,コンパクトなバイナリ記述子を構築する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:12:09 GMT)
REALIGN: Regularized Procedure Alignment with Matching Video Embeddings via Partial Gromov-Wasserstein Optimal Transport [8.0] 実世界の命令データには、しばしばバックグラウンドセグメント、繰り返しアクション、順番に示されるステップが含まれている。
正規化部分グロモフ・ワッサースタイン最適輸送(R-FPGWOT)に基づく手続き学習のための自己指導型フレームワークREALIGNを紹介する。
KOTとは対照的に、我々の定式化は部分的なアライメントスキームの下で視覚的対応と時間的関係を共同でモデル化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:32:14 GMT)
Less is More: Lean yet Powerful Vision-Language Model for Autonomous Driving [7.9] 我々は,一段階のエンドツーエンド自動運転のための新しいフレームワークであるMax-V1を紹介する。
我々のフレームワークは、運転の本質的にの順序性と整合した単一パス生成パラダイムを提供する。
実験により,本手法はnuScenesデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:14:18 GMT)
Successful Misunderstandings: Learning to Coordinate Without Being Understood [7.8] 信号ゲームでは、個人は通信信号と相互作用の結果以外の共通の観察をしない。
この設定は、異なる環境を知覚するエージェントの集団におけるコミュニケーションの出現を研究するためのプロキシとして使用される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:08:00 GMT)
A multiscale analysis of mean-field transformers in the moderate interaction regime [7.7] 本研究では,エンコーダのみの変圧器モデルを用いた推論時間におけるトークンの進化について検討する。
これらの相のそれぞれにおける極限力学の厳密な特徴づけを提供し、上述の極限における収束性を証明する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:57:04 GMT)
"Stop replacing salt with sugar!'': Towards Intuitive Human-Agent Teaching [7.7] 人間は少数の例からすぐに新しい概念を学ぶ。
そこで本研究では,エージェントに実例を提供してタスクの実行方法を教えることができる直感的なヒューマンエージェント教育アーキテクチャを提案する。
本研究では,外部の記号的知識を活用する学習手法とともに,戦略的順序で例を提示することにより,エージェントをより効率的に一般化できることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:00:53 GMT)
Human vs. AI Safety Perception? Decoding Human Safety Perception with Eye-Tracking Systems, Street View Images, and Explainable AI [7.7] アイトラッキングシステムは、ユーザーが見ているものや、特定の環境要素にどれくらいの時間従事しているかを定量化する。
安全な環境を認識する際に人間の注意を引き付ける重要な視覚要素を同定する。
これらの洞察は、都市の特徴が人間の安全知覚に影響を与えるというより人間中心の理解を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:05:39 GMT)
Localizing Task Recognition and Task Learning in In-Context Learning via Attention Head Analysis [7.7] TRヘッドはタスクサブスペースに隠れた状態をアライメントすることでタスク認識を促進する一方、TLヘッドはサブスペース内の隠れた状態を正しいラベルに向けて回転させ、予測を容易にする。
したがって、我々のフレームワークは、様々なタスクや設定で大規模な言語モデルがどのようにILCを実行するかについて、統一的で解釈可能な説明を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:28:37 GMT)
MAESTRO : Adaptive Sparse Attention and Robust Learning for Multimodal Dynamic Time Series [7.7] 既存のマルチモーダル学習アプローチの重要な制約を克服する新しいフレームワークであるMAESTROを紹介する。
MAESTROのコアとなるのは、タスクの関連性に基づいた動的イントラモーダル相互作用とクロスモーダル相互作用である。
3つのアプリケーションにまたがる4つの多様なデータセットに基づいて,MAESTROを10のベースラインに対して評価した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:07:06 GMT)
Differentiable Expectation-Maximisation and Applications to Gaussian Mixture Model Optimal Transport [7.7] expectation-Maximisation (EM)アルゴリズムは計算と機械学習の中心的なツールである。
EMは通常、差別化不可能なブラックボックスとして扱われ、現代の学習パイプラインへの統合を妨げている。
本稿では,EMの完全自動微分から近似手法まで,その精度と計算効率を評価・比較する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:15:38 GMT)
SiNGER: A Clearer Voice Distills Vision Transformers Further [7.6] 高ノルムのアーティファクトが目的を担っているため、学生はアーティファクトや過度な情報信号に過度に適合する。
以前の作業では、アーティファクトの除去を試みたが、アーティファクトの抑制と情報的信号の保存の間に固有のトレードオフに遭遇した。
Singular Nullspace-Guided Energy Reallocation (SiNGER)を紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:07:53 GMT)
Neural network embeddings recover value dimensions from psychometric survey items on par with human data [7.6] SQuID(Survey and Questionnaire Item Embeddings Differentials)は,ニューラルネットワークの埋め込みによって心理測定項目から潜伏次元を復元する手法である。
本研究では,SQuIDで処理された大規模言語モデルから得られた埋め込みが,人間のレーダ判断から得られた人間の値の構造を復元できることを実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:14:54 GMT)
Encoder Circuit Optimization for Non-Binary Quantum Error Correction Codes in Prime Dimensions: An Algorithmic Framework [7.5] 本稿では,素次元安定化器符号に対してエンコーダ回路を最適化するための体系的枠組みを提案する。
本手法が鍵符号に対して有効であることを示し,エンコーダ回路ゲート数の13~44%削減を実現した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:24:07 GMT)
Answer Convergence as a Signal for Early Stopping in Reasoning [7.5] 大型言語モデル(LLM)における思考の連鎖(CoT)の促進
提案手法は,(1)応答整合性による早期停止,(2)終末信号発生確率の向上,(3)内部アクティベーションに基づいていつ停止するかを学習する教師付き手法である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:58:14 GMT)
An Efficient 3D Latent Diffusion Model for T1-contrast Enhanced MRI Generation [7.5] ガドリニウム系造影剤(GBCA)は、病変の可視化を促進するために一般的にT1w MRIで使用されるが、腎原性全身線維症のリスクがある患者に限られる。
本研究では,前コントラストマルチパラメトリックMRIからT1コントラスト強調画像(T1C)を生成する3次元ディープラーニングフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:22:55 GMT)
Nirvana AI Governance: How AI Policymaking Is Committing Three Old Fallacies [7.4] 私は現在のAI規制提案の根本的な欠陥を明らかにします。
一部のコメンテーターは、人々は機械よりも信頼性が高いと直感的に信じている。
一部の政策立案者や研究者は、損害とコストが彼らの提案に固有のものであるという事実に気付いていない。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:47:36 GMT)
Regulating Online Algorithmic Pricing: A Comparative Study of Privacy and Data Protection Laws in the EU and US [7.2] ビッグデータ、AI、機械学習により、売り手やオンラインプラットフォームがリアルタイムで顧客の価格を調整できるようになった。
オンラインアルゴリズムの価格設定は、プライバシー、デジタル自律性、非差別の基本的な価値に脅威をもたらす。
大西洋の両岸では、議会は異なる方法でオンラインのアルゴリズム価格を規制しようと努力している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:46:56 GMT)
Near-Optimal Simultaneous Estimation of Quantum State Moments [7.2] 量子ビットの再利用による量子状態モーメントの資源効率の同時推定のためのフレームワークを提案する。
キュービットリセット操作を利用することで、同時モーメント推定のためのコア回路は2m+1$物理キュービットと$mathcalO(k)$CSWAPゲートしか必要としない。
我々は,推定モーメントが状態の最大固有値に厳密な境界を生じることを示すことによって,このプロトコルの有用性を実証し,ハイゼンベルクモデルの低エネルギー状態にアクセスするための量子仮想冷却への応用を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:23:26 GMT)
Comprehensive Benchmarking of YOLOv11 Architectures for Scalable and Granular Peripheral Blood Cell Detection [7.1] 手動末梢血スミア(PBS)分析は、労働集約的で主観的である。
ディープラーニングは有望な代替手段を提供するが、細粒度PBS検出のためのYOLOv11のような技術モデルの体系的な評価はいまだに不足している。
12種類の末梢血細胞クラスに16,891枚の画像とレッド血細胞クラスを含む大規模なアノテートされた血液細胞検出分類データセットを収集し,対象検出タスクに慎重にアノテートした。
このデータセットには合計で298,850個の注釈付き細胞が含まれている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:00:19 GMT)
Pseudorandom Unitaries in the Haar Random Oracle Model [7.1] 量子ハールランダムオラクルモデルにおいて強い擬似乱数ユニタリを構築する。
また、ランダムな量子回路から量子擬似ランダム性を構築するためのアプローチも提案した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:17:29 GMT)
FlashOmni: A Unified Sparse Attention Engine for Diffusion Transformers [7.0] Flash Omni は任意の DiT アーキテクチャと互換性のあるスパースアテンションエンジンである。
ほぼ直線で、注意力の空間比のスピードアップとGEMM-$Q$とをよく一致させ、GEMM-$O$で2.5$times$-3.8$times$Accelerationを達成している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:57:14 GMT)
Dinkel: State-Aware and Granular Framework for Validating Graph Databases [7.0] グラフデータベース管理システム(GDBMS)は、多くのデータ駆動アプリケーションを動かしている。
我々は,GDBMSを徹底的にテストする,新しい,実用的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:15:17 GMT)
Towards Reliable Generation of Executable Workflows by Foundation Models [6.9] この作業では、静的解析フィードバックを活用して、FMが生成したDSLベースの欠陥を検出し、修復することを可能にするフレームワークを導入している。
FM生成DSLにおける欠陥の頻度は,少なくとも1つの欠陥を含む研究事例の87.27%と高い。
我々は、FM生成DSL用に特別に設計された最初の静的解析器であるTimonを開発し、検出された欠陥を修復するためのFMベースのツールであるPumbaaをガイドする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:42:45 GMT)
DiffTester: Accelerating Unit Test Generation for Diffusion LLMs via Repetitive Pattern [6.9] DiffTesterは、単体テスト生成(UTG)におけるdLLMに適したアクセラレーションフレームワークである。
DiffTesterは、出力の品質を損なうことなく、各ステップで生成されるトークンの数を適応的に増加させる。
最初はPythonに限られていたTestEvalベンチマークを拡張し、JavaやC++などの追加のプログラミング言語を導入しました。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:04:18 GMT)
Don't Sweat the Small Stuff: Segment-Level Meta-Evaluation Based on Pairwise Difference Correlation [6.8] Pairwise Different Pearson (PDP)は機械翻訳のための新しいセグメントレベルのメタ評価指標である
以前のPearsonの$rho$ベースとKendallの$tau$ベースのメタ評価アプローチの制限に対処する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:06:50 GMT)
LTL$_f$ Learning Meets Boolean Set Cover [6.8] 我々はBoltと呼ばれる新しいCPUツールを実装し、ベンチマークの70%よりも100倍以上高速な公式を学習することで、技術の状態を改善した。
Boolean Set Coverコンポーネントのおかげで、私たちのアプローチは効率と公式サイズの間に新たなトレードオフを提供します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:20:20 GMT)
The Multi-Query Paradox in Zeroth-Order Optimization [6.8] Zeroth-order Alignment (ZO)は、明示的な勾配が利用できない問題に対して強力なフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:52:34 GMT)
Learning Smooth State-Dependent Traversability from Dense Point Clouds [6.7] オフロード自動運転における主要な課題は、地形の移動可能性がしばしば車両の状態に依存することである。
SPARTA(SPARTA)は、点雲からの接近角度条件付きトラバータビリティを推定する手法である。
本モデルでは,40mの岩場を横断する91%の成功率を達成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:57:40 GMT)
Two-Dimensional XOR-Based Secret Sharing for Layered Multipath Communication [6.7] 本稿では,層状マルチパス通信ネットワークのための2次元XORを用いた秘密共有方式を提案する。
本稿では,各送信層における単一経路を敵が監視し,破壊した場合に,メッセージの回復と完全なプライバシーを保証する構造を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:40:31 GMT)
Multi-Layer Secret Sharing for Cross-Layer Attack Defense in 5G Networks: a COTS UE Demonstration [6.7] 本デモでは,商用オフ・ザ・シェルフ(COTS)5Gユーザ機器(UE)における多層シークレット共有の実装について紹介する。
我々のXORベースのアプローチは、ネットワークオペレータと分散リレーに秘密の共有を分散し、1つのネットワークオペレータと1つのリレーが同時に失われても、完全なリカバリとデータの機密性を確保する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:21:30 GMT)
Towards agile multi-robot systems in the real world: Fast onboard tracking of active blinking markers for relative localization [6.7] マルチロボットチームメンバーの活発な点滅マーカーは、実世界展開における航空機の相対的位置付けの堅牢性を改善する。
従来の追跡アルゴリズムは、カメラフレームに断続的に現れるため、素早く動く点滅マーカーに苦しむ。
屋外実験では、AMTアプローチは密度、精度、複雑さを追跡する最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:44:15 GMT)
Beyond WER: Probing Whisper's Sub-token Decoder Across Diverse Language Resource Levels [6.6] 本稿では,Whisperの多言語デコーダの詳細な解析を紹介する。
提案手法は,ビーム探索経路をトレースし,サブトークン推定とその関連確率を推定する。
リソース言語が低いほど、これらのメトリクスは悪化するが、サブトークンの使用ではクラスタリングパターンが異なる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:20:05 GMT)
On the Limitations of Pseudorandom Unitaries [6.6] Pseudorandom Unitary (PRU) は、Haarのランダムなユニタリーと計算的に区別できない計算可能なユニタリーである。
ブラックボックス方式で擬似乱数ユニタリからQCCCビットのコミットメントとQCCC鍵契約を構築することはできないことを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:55:25 GMT)
Circuit-Aware Reward Training: A Mechanistic Framework for Longtail Robustness in RLHF [6.6] 本稿では,報酬モデルにおけるレアイベント処理に責任を負う特殊なニューラルネットワークを同定する機械的解釈可能性フレームワークを提案する。
我々の理論的枠組みは、回路特殊化、報酬一般化境界、ロングテール性能の間の形式的な接続を確立する。
このアプローチは、報酬モデル失敗に関する理論的洞察と、長期的堅牢性を改善するための実践的な介入の両方を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:42:14 GMT)
Finding Phones Fast: Low-Latency and Scalable Monitoring of Cellular Communications in Sensitive Areas [6.4] 低レイテンシシステムは、タイムリーな検出、決定(例えばジオフェンシングやローカライゼーション)、および機密領域における未承認通信の破壊を可能にするために重要である。
我々は,ユーザデータ転送に先立って,すべての演算子間のセル接続を監視するために設計された,最初の低レイテンシで演算子に依存しないスケーラブルなシステムであるLTagを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:39:12 GMT)
Adaptive Group Policy Optimization: Towards Stable Training and Token-Efficient Reasoning [6.4] 本稿では,適応的グループポリシー最適化(AGPO)を提案する。これは,適応的損失関数(adaptive loss function)を用いて,トレーニングのゆらぎとトークンの非効率を緩和する。
実験により,提案手法は推論ステップにおけるトークンを著しく少なくして,より安定した訓練と優れた性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:31:50 GMT)
A Predictive Approach To Enhance Time-Series Forecasting [6.4] 本稿では、時系列イベント予測を強化するアプローチであるFuture-Guided Learningを紹介する。
本手法は2つのモデルから構成される: 重要事象を識別するために将来のデータを解析する検出モデルと、これらの事象を現在のデータに基づいて予測する予測モデルである。
脳波データを用いた発作予測ではAUC-ROCが44.8%増加し,非線形力学系ではMSEが23.4%減少した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:39:26 GMT)
Beyond Overall Accuracy: A Psychometric Deep Dive into the Topic-Specific Medical Capabilities of 80 Large Language Models [6.4] 項目応答理論(IRT)に基づく厳密な評価フレームワークであるtextscMedIRT を紹介する。
80の多種多様な言語モデル (LLMs) から, バランスのとれた1,100のUSMLE準拠のベンチマークで, 新たな回答を期待して収集した。
LLMの潜在モデル能力は質問の難易度や識別と共同で推定し、精度のみよりも安定でニュアンスの高い性能ランキングを得る。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:06:13 GMT)
Alternatives To Next Token Prediction In Text Generation - A Survey [6.3] Next Token Prediction (NTP) は、Large Language Models (LLMs) を前例のない成功に導いた。
本調査では,NTPに代わる新たなエコシステムについて述べる。
これらの方法で洞察を合成することにより、この調査はトークンレベルの生成の既知の限界に対処するモデルの研究を導くための分類学を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:18:16 GMT)
What Matters in Data for DPO? [6.2] DPO(Direct Preference Optimization)は、大規模言語モデルを人間の好みに合わせるためのシンプルで効果的なアプローチとして登場した。
本研究では,DPOの嗜好データ分布が理論的・経験的両面からどう影響するかを体系的に検討する。
選択された応答の質がDPOの目的を最適化する上で重要な役割を担っているのに対し、拒否された応答の質は比較的限定的な影響を持つ可能性があることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:03:34 GMT)
Forcrat: Automatic I/O API Translation from C to Rust via Origin and Capability Analysis [6.2] ライブラリ機能の重要なサブセットであるI/O APIを置き換えることに重点を置いています。
本稿では,2つの静的解析手法,起点解析と機能解析,エラーソース解析を提案し,その結果を用いてI/O APIを置き換える。
提案手法は,(1)変換後にテストスイートをパスした32プログラム,(2)14秒で422kLOCを効率よく解析,変換し,(3)広く適用でき,I/O APIコールの82%を置き換える。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:21:34 GMT)
The Quantum Decoding Problem : Tight Achievability Bounds and Application to Regev's Reduction [6.1] 我々は、$l_infty$ノルムに対するショート・ソリューション(SIS)問題に対する量子的優位性を示す。
最近の論文で、Chailloux と Tillich はベルヌーイ分布に従えば、量子復号問題はアルゴリズム時間で解くことができることを示した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:48:05 GMT)
Inducing Dyslexia in Vision Language Models [6.1] 我々は、ディプレクシアをシミュレートするために、大規模な視覚言語モデルを使用する。
VLM内の視覚単語選択単位を同定し、これらの単位の目標アブレーションが読解タスクの選択的障害につながることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:03:16 GMT)
Between Help and Harm: An Evaluation of Mental Health Crisis Handling by LLMs [6.0] 臨床的にインフォームドされた6つのメンタルヘルス危機カテゴリーの統一分類を導入する。
我々は、危機タイプを分類し、安全で適切な応答を生成する能力のために、3つの最先端のLCMをベンチマークする。
間接的または曖昧なリスク信号の処理におけるシステム的弱点、定式的および不完全なデフォルト応答への依存、およびユーザコンテキストとの頻繁な不一致を識別する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:42:23 GMT)
Emotion-Aligned Generation in Diffusion Text to Speech Models via Preference-Guided Optimization [6.0] EASPO(Emotion-Aware Stepwise Preference Optimization, EASPO)は、拡散性TTSと微妙な感情的嗜好を中間認知ステップで一致させる学習後フレームワークである。
提案手法の中心となるのは、雑音の多い中間音声状態を記録し、自動選好ペア構築を可能にする時間条件付きモデルであるEASPMである。
実験は、表現性と自然性の両方において、既存の方法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:19:42 GMT)
Learning Object-Centric Representations Based on Slots in Real World Scenarios [5.9] この論文では、オブジェクト中心合成のための強力な事前学習拡散モデルを適用するフレームワークを紹介している。
我々は、大域的なシーンコヒーレンスと不整合オブジェクト制御のバランスをとるという、重要な課題を識別する。
本手法は,軽量なスロットベースの条件付けを事前訓練されたモデルに統合し,オブジェクト固有の操作を提供しながら,それらの視覚的先行を保留する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:01:49 GMT)
Economic Competition, EU Regulation, and Executive Orders: A Framework for Discussing AI Policy Implications in CS Courses [5.9] コンピュータ科学のカリキュラムには、AI政策の意義に関する議論がまだ存在しないと論じる。
技術的および非技術的(倫理的)CSコースにおけるAI政策に関するクラス議論の枠組化のための指導的質問を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:26:53 GMT)
Unit Test Update through LLM-Driven Context Collection and Error-Type-Aware Refinement [5.9] テストのメンテナンス方法は、主に壊れたテストの修復に焦点を当て、新しい機能を検証するために既存のテストを強化するシナリオを無視します。
実運用コードの変更に応じて、ジャスト・イン・タイムの自動テスト更新を可能にする新しいアプローチであるTESTUPDATERを提案する。
TestUPDATERは94.4%のコンパイルパス率と86.7%のテストパス率を達成し、それぞれ最先端のSYTERを15.9%と20.0%で上回っている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:08:22 GMT)
Social 3D Scene Graphs: Modeling Human Actions and Relations for Interactive Service Robots [5.9] ソーシャル3Dシーングラフ(Social 3D Scene Graphs)は、人間、その属性、活動、環境内の関係をローカルとリモートの両方でキャプチャする拡張3Dシーングラフである。
我々の表現は、人間と環境の関係についての人間の行動予測と推論を改善し、社会的に知的なロボットへの道を歩む。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:00:40 GMT)
Language Models Optimized to Fool Detectors Still Have a Distinct Style (And How to Change It) [5.8] スタイル的な特徴空間は、検出を防ぐために最適化された言語モデルからのサンプルを確実に検出するために使用することができる。
我々は,文体的特徴空間における人書きと機械書きのギャップを埋めることを目的とした,新しい言い換えのアプローチを探求する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:56:44 GMT)
Trading Carbon for Physics: On the Resource Efficiency of Machine Learning for Spatio-Temporal Forecasting [5.7] 本研究では,誘導バイアスがモデル効率,エネルギー,炭素間のトレードオフにどのように役立つかを考察する。
モデル設計に物理帰納バイアスを埋め込むことで、かなりの効率性が得られることを示す。
我々は、モデルの有効性を伴うモデル効率が、機械学習モデルの開発と展開を駆動する中核となるべきであると論じている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:34:53 GMT)
What Characteristics Make ChatGPT Effective for Software Issue Resolution? An Empirical Study of Task, Project, and Conversational Signals in GitHub Issues [5.4] GitHubイシュースレッド内で共有されている686人の開発者-ChatGPT会話を分析し、これらの会話を課題解決に効果的にする特徴を特定します。
ChatGPTはコード生成やツール/ライブラリ/APIレコメンデーションに最も効果的ですが、コード説明に苦労しています。
問題レベルでは、ChatGPTは開発者のアクティビティが制限され、より高速な解像度で、より単純な問題に対して最善を尽くします。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:27:07 GMT)
Building the EHR Foundation Model via Next Event Prediction [5.4] Next Event Prediction(NEP)は、大規模言語モデルの時間的推論を強化するフレームワークである。
NEPは、疾患進行パターンと因果関係を明示的にモデル化する。
解析の結果,最先端の予測精度と臨床的に解釈可能な注意パターンの2つの利点が明らかになった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:27:51 GMT)
Survey of AI-Powered Approaches for Osteoporosis Diagnosis in Medical Imaging [5.4] 骨粗しょう症は、世界中の骨格の整合性を静かに侵食する。
画像による早期発見は、ほとんどの不安定な骨折を防ぐことができる。
人工知能(AI)法は現在、微妙で臨床的に実行可能なマーカーのための定期的なX線吸収率(DXA)、X線、CT(CT)、磁気共鳴イメージング(MRI)スキャンをマイニングしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:01:45 GMT)
Characterizing Event-themed Malicious Web Campaigns: A Case Study on War-themed Websites [5.3] サイバー犯罪者は、ユーザーの信頼を侵害する詐欺行為のテーマとして、様々な国際的または地域的な出来事を悪用することが多い。
本稿では,イベントをテーマとした悪意あるWebサイトベースのキャンペーンを特徴付ける方法について検討する。
攻撃者は、イベントのユニークな側面を利用して攻撃を調整している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:07:15 GMT)
MIAFEx: An Attention-based Feature Extraction Method for Medical Image Classification [5.2] 医療用イメージアテンションベース機能エクストラクタ (MIAFEx) を提案する。
Transformerエンコーダアーキテクチャ内の分類トークンを強化するために、学習可能な改良機構を採用している。
MIAFExの出力特性は従来の分類器とハイブリッド分類器を用いて古典的特徴抽出器と比較される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:47:23 GMT)
humancompatible.detect: a Python Toolkit for Detecting Bias in AI Models [5.1] Human compatible.detectはバイアス検出のためのツールキットである。
バイアスを検出し評価する2つの新しい手法が組み込まれている。
複数の例をドキュメント化した使いやすいAPIがある。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:43:24 GMT)
RainPro-8: An Efficient Deep Learning Model to Estimate Rainfall Probabilities Over 8 Hours [5.1] ヨーロッパにおける8時間の地平線上での高分解能確率降水予測のための深層学習モデルを提案する。
本モデルは,レーダー,衛星,物理に基づく数値気象予測(NWP)を含む複数のデータソースを効率よく統合し,長距離の相互作用を捉える。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:58:31 GMT)
LatXGen: Towards Radiation-Free and Accurate Quantitative Analysis of Sagittal Spinal Alignment Via Cross-Modal Radiographic View Synthesis [5.0] 思春期特発性強皮症(AIS)は複雑な3次元脊髄変形である。
LatXGenは、現実的な側方X線を合成する新しい生成フレームワークである。
LatXGenは正確なラジオグラフを生成し、既存のGANベースの手法を視覚的忠実度と定量的メトリクスの両方で上回っている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:29:53 GMT)
AstroMMBench: A Benchmark for Evaluating Multimodal Large Language Models Capabilities in Astronomy [5.0] AstroMMBenchは、天文学的画像理解において、マルチモーダル大言語モデル(MLLM)を評価するための最初の包括的なベンチマークである。
AstroMMBenchは、6つの天体物理学のサブフィールドにわたる621の多重選択質問で構成され、品質と関連性について15のドメイン専門家によってキュレートされ、レビューされている。
結果、Ovis2-34Bは、強力なクローズドソースモデルと比較して高い総合精度(70.5%)を達成した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:02:30 GMT)
Combining Discrepancy-Confusion Uncertainty and Calibration Diversity for Active Fine-Grained Image Classification [4.9] アクティブラーニングは、ラベルのないプールから最も有益なサンプルを反復的に選択することで、高品質なラベル付きデータセットを構築することを目的としている。
きめ細かい画像分類では、クラス間の微妙な違いのために、この情報性を評価することは特に困難である。
能動きめ細粒度画像分類(DECERN)における不一致拡散不確かさとキャリブレーションの多様性を組み合わせた新しい手法を提案する。
本手法は最先端の手法と比較して優れた性能を実現する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:03:44 GMT)
Flexible and Efficient Drift Detection without Labels [4.9] ラベルレス環境での古典的統計的プロセス制御を用いたフレキシブルで効率的なドリフト検出アルゴリズムを提案する。
計算制約の下では、我々の手法は従来の方法よりも統計的に優れている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:38:10 GMT)
An operator-Weyl-symbol approach to eigenstate thermalization hypothesis [4.8] 固有状態熱化仮説における対角関数に関する半古典理論が展開される。
量子系の熱化時間スケールは、ハミルトニアンの位相空間勾配に逆比例する可能性があると予測している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:02:27 GMT)
MarS-FM: Generative Modeling of Molecular Dynamics via Markov State Models [4.8] 我々は、マルコフ状態モデル(MSM)によって定義された離散状態の遷移をサンプル化する新しい生成モデル、MSMエミュレータを導入する。
本評価は, タンパク質ドメインに, 展開イベントを含む化学的, 構造的多様性を有し, 一般化を評価するために, トレーニングセットとテストセットの厳密な配列の相違を強制する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:42:25 GMT)
Fast Energy-Theft Attack on Frequency-Varying Wireless Power without Additional Sensors [4.7] 特に公共の場所では、エネルギーアクセス保護とサイバーセキュリティの重要性が高まっている。
現在、最も一般的なエネルギー暗号化法は周波数と関連するインピーダンス変化を用いる。
ハッカーが周波数変化を検出し、補償を調整できるので、この手法は信頼性が低いことが証明されている。
我々は攻撃と関連するシステムを最適化し、0.2ms以内のエネルギーを侵入・盗むことができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:49:09 GMT)
Investigating Language and Retrieval Bias in Multilingual Previously Fact-Checked Claim Detection [4.7] 大きな言語モデル(LLM)は言語間ファクトチェックに強力な機能を提供する。
LLMは、しばしば言語バイアスを示し、英語のような高リソース言語で不公平に優れた性能を発揮する。
我々は,情報検索システムが他者よりも特定の情報を好む傾向にある場合,検索バイアスという新しい概念を提示し,検証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:50:32 GMT)
Principal Components for Neural Network Initialization [4.6] ニューラルネットワークの第1層にPCAを組み込むためのプライマリコンポーネントベース初期化(PCsInit)を提案する。
これらの戦略を用いた説明は、主成分のニューラルネットワークをトレーニングする前にPCAを使用するよりも単純で直接的なものであることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:47:33 GMT)
Guided Diffusion for the Discovery of New Superconductors [4.6] 高温超伝導など、特定の望ましい特性を持つ材料の逆設計は、材料科学における重大な課題である。
本稿では,新しい超伝導体の発見を促進するための誘導拡散フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:59:52 GMT)
Imaging a chain of strongly correlated Rydberg excitations enabled by Förster-resonance-enhanced interaction [4.6] 個別のRydberg励起のシングルショットおよびテクスチンシチュー吸収イメージングを実証した。
この手法は、量子計算や量子シミュレーションの応用において、アンサンブル符号化された量子ビットを利用するのに大きな関心を持つだろう。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:42:43 GMT)
Graph Foundation Models: Bridging Language Model Paradigms and Graph Optimization [4.5] グラフ構造上の全ての距離に基づく最適化問題を解くことができる最初のフレームワークであるグラフ基礎モデル(GFM)を紹介する。
GFMはグラフの複雑なトポロジカルおよびニューラルルールを内部化し、構造自体の接続を監督信号として扱うことができる。
本研究は, グラフ最適化にプリトレイン・トランスファー・フレームワークを適用する新たなパラダイムを確立し, 基礎モデル革新をオペレーション・リサーチに適用するための扉を開く。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:05:48 GMT)
Muon: Training and Trade-offs with Latent Attention and MoE [4.5] 小型・中型デコーダ(30M-200Mパラメータ)のみで変圧器を訓練するためのMuonの総合的理論的・実証的研究について述べる。
厳密な理論解析として, (i) 標準仮定による収束率のショーイング, (ii) 勾配の爆発を防止するスペクトル正則化特性, (iii) スティーフェル多様体上の自然勾配降下への接続, (iv) スペクトルノルムによる最も急勾配降下への同値性などを挙げる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:51:06 GMT)
Probing the Limits of Stylistic Alignment in Vision-Language Models [4.4] この研究は、小さな視覚言語モデルをユーモアやロマンチックなスタイルに整合させる際のデータ効率について研究する。
このアプローチは、これらのモデルの性能限界を定義し、スタイリスティックな飽和を達成するのにどの程度の好みデータが必要かを決定するのに役立ちます。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:46:51 GMT)
Dark-fringe interferometer with dynamic phase control for Mössbauer science [4.4] M"ossbauer interferometryは、短波長のX線波長によって課される安定性の要求のため、依然として困難である。
そこで我々は、空の状態での透過を消し去るダークフリンジ干渉計を投入し、感度測定を容易にした。
我々は,ナノ秒時間スケールで送信されたX線強度を制御し,この干渉計のチューニング能力を実験的に実証した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:05:24 GMT)
MIRAGE: Multimodal foundation model and benchmark for comprehensive retinal OCT image analysis [4.4] MIRAGEは、OCTと走査型レーザー眼鏡(SLO)画像の解析のための新しいFMである。
OCT/SLO分類とセグメンテーションタスクを用いた新しい評価ベンチマークを提案する。
一般および専門的なFMとセグメンテーション法との比較は,MIRAGEの両タスクにおける優位性を示している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:07:38 GMT)
Vid-LLM: A Compact Video-based 3D Multimodal LLM with Reconstruction-Reasoning Synergy [4.2] 外部の3Dデータを必要としないビデオ入力を直接処理するビデオベースの3D-MLLMであるVid-LLMを提案する。
本手法では, 偏見の知覚性能を向上させるために, 幾何先行法を直接的に用いた。
各種ベンチマーク実験により,3次元質問応答,3次元キャプション,3次元視覚的接地作業において,本手法の有効性が検証された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:34:18 GMT)
VeriLLM: A Lightweight Framework for Publicly Verifiable Decentralized Inference [4.2] 大規模言語モデル(LLM)のための分散推論のための公開検証プロトコルを提案する。
同一GPUワーカのセット上で両方のロールを多重化する同型推論検証ネットワークを導入する。
我々は形式的なゲーム理論解析を提供し、インセンティブの下では、正直な推論と検証がナッシュ均衡を構成することを証明した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:07:32 GMT)
HeDA: An Intelligent Agent System for Heatwave Risk Discovery through Automated Knowledge Graph Construction and Multi-layer Risk Propagation Analysis [4.2] HeDAは、自動科学的発見のために設計されたインテリジェントなマルチエージェントシステムである。
熱波は、相互接続した気候、社会、経済システムに複雑なカスケードリスクをもたらす。
HeDAは10,247以上の学術論文を処理し、23,156ノードと89,472の関係を持つ包括的な知識グラフを構築する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:40:29 GMT)
DRIFT: Divergent Response in Filtered Transformations for Robust Adversarial Defense [3.8] グラデーション・コンセンサスは 逆転性の主要な要因です
我々は、勾配のコンセンサスを積極的に破壊するように訓練された軽量で学習可能なフィルタの集合である textbfDRIFT (Divergent Response in Filtered Transformations) を導入する。
DRIFTは、無視可能なランタイムとメモリコストの改善を提供し、敵防衛の実用的で一般化可能な原則として勾配分散を確立している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:57:47 GMT)
Neural Context Flows for Meta-Learning of Dynamical Systems [3.8] 我々は、不確実性推定を含む頑健で解釈可能なメタラーニングフレームワークであるNeural Context Flow (NCF)を紹介する。
NCFはTaylor拡張を使用してコンテキストの自己変調を可能にし、コンテキストベクトルが他のドメインからのダイナミクスに影響を与えると同時に、自分自身を変調することを可能にする。
この結果から, 線形および非線形の6つのベンチマーク問題のうち5つにおいて, NCFの出力性能が向上していることが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:33:24 GMT)
Personalized Auto-Grading and Feedback System for Constructive Geometry Tasks Using Large Language Models on an Online Math Platform [3.8] 本稿では,構成的幾何タスクのための自動階調とフィードバックシステムを提案する。
このシステムは大規模言語モデル(LLM)を使用して開発され、Algeomathプラットフォーム上にデプロイされた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:35:01 GMT)
Inducing Uncertainty on Open-Weight Models for Test-Time Privacy in Image Recognition [3.8] AIの安全性に関する主要な懸念は、マシンラーニング(ML)の文献で検証されている。
MLモデルのユーザが不正な個人情報の予測を利用して他人を傷つけないようにするには、どうすればいいでしょうか?
保護されたインスタンスに対して最大不確実性を誘導し、他のすべてのインスタンスに対して精度を保つ。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:48:46 GMT)
Distributed AI Platform for the 6G RAN [3.8] 既存のアプローチは、真のAIネイティブな6Gネットワークのビジョンを実現するには不十分である、と私たちは主張する。
我々は,AIネイティブRANのニーズに合わせて,分散AIプラットフォームアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:58:31 GMT)
ID-RAG: Identity Retrieval-Augmented Generation for Long-Horizon Persona Coherence in Generative Agents [3.8] ID-RAG(ID-Retrieval-Augmented Generation)は、エージェントのペルソナと永続的な嗜好を構造化されたアイデンティティモデルでグルーピングするために設計された新しいメカニズムである。
エージェントの決定ループの間、このモデルは関連するアイデンティティコンテキストを検索するためにクエリされ、アクション選択を直接通知する。
我々は、Human-AI Agentsと呼ばれる新しいID-RAG対応エージェントを導入、実装することで、このアプローチを実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:54:51 GMT)
Can you SPLICE it together? A Human Curated Benchmark for Probing Visual Reasoning in VLMs [3.6] SPLICEは、複数の次元にわたるイベントベースの推論を調査するために設計されたベンチマークである。
その中には、12と180のサブカテゴリ(スポーツ、エンジニアリング、家事など)にまたがる3,381本のビデオが含まれている。
我々は、これらのクリップをコヒーレントなイベントシーケンスに再構成する作業において、人間の参加者と最先端の視覚言語モデル(VLM)の両方を評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:50:18 GMT)
Integrating Various Software Artifacts for Better LLM-based Bug Localization and Program Repair [3.6] 本稿では,問題コンテンツ(記述とメッセージ)とスタックエラートレースを用いてバグギーメソッドをローカライズするDevLoReを提案する。
異なるアーティファクトを組み込むことで、DevLoReはシングルとノンシングルのバグギーメソッドの49.3%と47.6%をうまく見つけることができた。
これは現在の最先端のAPRメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:29:23 GMT)
Comparing Open-Source and Commercial LLMs for Domain-Specific Analysis and Reporting: Software Engineering Challenges and Design Trade-offs [3.5] 大規模言語モデル(LLM)は、ドメイン間の複雑な自然言語処理の自動化を可能にする。
本研究では、財務報告分析とコメント生成のためのオープンソースおよび商用LCMについて検討した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:46:37 GMT)
Learning Relationships Between Separate Audio Tracks for Creative Applications [3.5] 本稿では,音楽エージェント分野における研究プロジェクトにおける第一歩について述べる。
本研究の目的は,ライブ音楽入力とリアルタイム音楽出力との間の,所望の音楽関係のチューニングをトレーニングを通じて行うことである。
本稿では,音楽関係の学習と活用が可能なシンボリック決定モジュールを統合するアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:06:21 GMT)
Quantitative convergence of trained single layer neural networks to Gaussian processes [3.4] 本研究では、勾配勾配から関連するガウス過程へ学習した浅層ニューラルネットワークの無限幅限界における定量的収束について検討する。
ネットワーク出力とガウス近似の間の二次ワッサーシュタイン距離を任意のトレーニング時間で明示的な上界を与える。
この結果は,幅や入力次元などのアーキテクチャパラメータや収束の影響,およびトレーニング力学が近似誤差にどのように影響するかを定量化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:59:27 GMT)
Grocery to General Merchandise: A Cross-Pollination Recommender using LLMs and Real-Time Cart Context [3.4] 本稿では,食料品と一般商品のクロスカテゴリレコメンデーションを橋渡しするクロスポリン化(XP)フレームワークを提案する。
提案手法では,(1)共同購入市場バスケット分析とLCMに基づく新しいアイテム・イテム関係の同定手法を用いた候補生成機構,(2)リアルタイム・シーケンシャル・カート・コンテキストを利用したトランスフォーマー・ベース・ローカという2段階の枠組みを用いる。
オフライン分析とオンラインA/Bテストは、アイテムページ上のLCMに基づく検索で36%の加算率、カートコンテキストを用いた加算率15%の増加を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:23:57 GMT)
Reinforced Generation of Combinatorial Structures: Applications to Complexity Theory [3.4] 効率的なアルゴリズムの既知の限界を改善する新しい構造を見つけるのにAIのテクニックが役立つかどうかを探索する。
具体的には、AlphaEvolveを使って、a)MAX-CUTの平均ケース硬度とMAX-Independent Setの2つの設定を研究します。
改良された下界は、最大163$のノード上にほぼ極端ラマヌジャングラフを構築することで得られる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:56:56 GMT)
A Deep Learning Approach for Spatio-Temporal Forecasting of InSAR Ground Deformation in Eastern Ireland [3.3] 本研究では,動的変位データを静的な物理先行値と融合する新しいフレームワークを提案する。
公開EGMSデータセットでは、MM-STTが新しい最先端技術を確立し、長距離予測RMSEを桁違いに削減する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:49:04 GMT)
MDD-Thinker: Towards Large Reasoning Models for Major Depressive Disorder Diagnosis [3.3] 大うつ病 (Major depressive disorder, MDD) は、世界的障害の主要な原因である。
現在の診断アプローチは、しばしば主観的評価に依存し、臨床情報を統合する能力が欠如している。
我々はMDD-Thinkerを開発した。MDD-Thinkerは、教師付き微調整(SFT)と強化学習(RL)を統合し、推論能力と解釈可能性を高める。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:56:38 GMT)
Large Language Models for Software Testing: A Research Roadmap [3.3] 大規模言語モデル(LLM)は、ソフトウェアテスト分野で最も重要な破壊の1つとしてプロファイルされ始めている。
LLMは、テストコードの生成やドキュメントの要約など、ソフトウェアテストタスクにうまく適用されています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:58:21 GMT)
TACO-Net: Topological Signatures Triumph in 3D Object Classification [3.3] TACO-Netは新しい最先端を99.05%$と99.52%$の精度で設定する。
10種類のモデルNet40入力でテストすると、提案したTACO-Netは全体として強いレジリエンスを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:52:53 GMT)
Guided Uncertainty Learning Using a Post-Hoc Evidential Meta-Model [3.2] GUIDEは,凍結したディープラーニングモデルに適応し,いつ,いつ,不確実かを明確に学習する,軽量な顕在学習メタモデルアプローチである。
GUIDEはリトレーニングもアーキテクチャの変更も必要とせず、ベースとなるディープラーニングモデルに対して手動の中間層選択も必要ありません。
さまざまなベンチマークで最先端のアプローチを一貫して上回ります。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:04:15 GMT)
From Satellite to Street: A Hybrid Framework Integrating Stable Diffusion and PanoGAN for Consistent Cross-View Synthesis [3.2] 本稿では,衛星画像からストリートビュー画像を生成するために,拡散モデルと条件付き生成対向ネットワークを統合したハイブリッドフレームワークを提案する。
このフレームワークは、きめ細かい局所的な詳細を保存しながら、現実的で幾何学的に一貫したストリートビュー画像を生成することに成功した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:14:49 GMT)
Plug-and-Play Emotion Graphs for Compositional Prompting in Zero-Shot Speech Emotion Recognition [3.2] 大規模音声言語モデル(LALM)は、音声タスク全体で強いゼロショット性能を示すが、音声感情認識(SER)に苦慮している。
そこで我々は,感情推論におけるLALMを微調整なしでガイドするための,感情推論のためのCCoT-Emo(Compositional Chain-of-Thought Prompting for Emotion Reasoning)を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:06:03 GMT)
Active Authentication via Korean Keystrokes Under Varying LLM Assistance and Cognitive Contexts [3.1] 韓国語におけるキーストロークに基づく認証は、3つの現実的なタイピングシナリオで評価する。
本システムは,LLMの使用状況や認知的文脈にまたがって,信頼性の高い性能を維持していることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:57:16 GMT)
Towards Trustworthy Lexical Simplification: Exploring Safety and Efficiency with Small LLMs [3.1] 大規模言語モデル(LLM)は、語彙的単純化の現実的な応用において課題に直面している。
脆弱なユーザグループ(例えば障害のある人々)は、この技術の主要なターゲットグループのひとつです。
ローカル環境に展開可能な小型LCMを利用するLSシステムのための効率的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:25:56 GMT)
Mitigating Barren Plateaus in Quantum Neural Networks via an AI-Driven Submartingale-Based Framework [3.1] 量子ニューラルネットワーク(QNN)におけるバレンプラトー(BP)の緩和を目的としたAdaInitを提案する。
AdaInitは、非無視的な勾配分散をもたらすQNNの初期パラメータを反復的に合成し、BPを緩和する。
AdaInit が様々な QNN スケールで高い勾配分散を維持するために既存の手法を一貫して上回っていることを実証的に検証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 05:36:12 GMT)
EEsizer: LLM-Based AI Agent for Sizing of Analog and Mixed Signal Circuit [3.0] 本稿では,大規模な言語モデルと回路シミュレータ,カスタムデータ解析機能を統合するAIエージェントであるEEsizerを提案する。
迅速な工学的推論と理論的推論を駆使して、エージェントは設計の方向性を反復的に探求し、性能を評価し、人間の介入を最小限に抑えてソリューションを洗練する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:08:23 GMT)
Model Fusion with Multi-LoRA Inference for Tool-Enhanced Game Dialogue Agents [2.9] 本稿では,CPDC 2025チャレンジのGPUトラックに対するOpdainlpチームのソリューションについて述べる。
この課題は3つのタスクから構成されており、キャラクターのペルソナに準拠し、ゲームのワールドビューと整合し、関数呼び出しをサポートするゲーム内会話型AIの構築を目指している。
我々は,LoRAファインチューニングとモデル融合を併用したQwen3-14Bを用い,推論中に複数のLoRAアダプタと統合されたベースモデルを用いた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:15:19 GMT)
Radiology's Last Exam (RadLE): Benchmarking Frontier Multimodal AI Against Human Experts and a Taxonomy of Visual Reasoning Errors in Radiology [2.6] 大規模言語モデル(LLM)や視覚言語モデル(VLM)といった一般的なマルチモーダルAIシステムは、臨床医や患者からもアクセスされるようになっている。
複数の画像モダリティにまたがる50の専門レベルの「スポット診断」のベンチマークを作成した。
我々は,フロンティアAIモデルの性能を,ボード認定放射線科医や放射線学研修生に対して評価した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:31:20 GMT)
Hype or not? Formalizing Automatic Promotional Language Detection in Biomedical Research [2.5] 科学では、促進言語(「ハイプ」)が増加しており、証拠の客観的評価を損なう可能性がある。
ハイプを自動的に検出するタスクを導入し,これを双曲的言語,主観的言語と定義する。
我々は,ハイプ言語を識別するための公式ガイドラインを提案し,それをNIH(National Institutes of Health)認定申請コーパスの一部にアノテートする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:47:15 GMT)
How Well Do LLMs Imitate Human Writing Style? [2.4] 大規模言語モデル(LLM)は、流動的なテキストを生成することができるが、特定の人間の作者の独特のスタイルを再現する能力は、まだ不明である。
著者の検証とスタイルの模倣分析のための,高速かつトレーニング不要なフレームワークを提案する。
学術エッセイでは97.5%、クロスドメイン評価では94.5%の精度を達成している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:34:40 GMT)
Learning Semantic Association Rules from Internet of Things Data [1.8] アソシエーションルールマイニング(アソシエーションルールマイニング、ARM)は、データ中の共通点を論理的な意味として発見するタスクである。
ARMはIoT(Internet of Things)において、監視や意思決定などさまざまなタスクに使用されている。
動的センサデータと静的IoTシステムメタデータの両方を利用した,IoTデータのための新しいARMパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:18:33 GMT)
Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization [1.8] ニューラルネットワーク翻訳(NMT)へのタスクアライメントの適用は,NMTにおける既存のタスクデータミスマッチに対処することを示す。
人選好のプロキシとして,事前学習された翻訳品質推定モデルを活用するDPOの変種であるダイレクト品質最適化(DQO)を導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:19:57 GMT)
Message passing-based inference in an autoregressive active inference agent [1.8] 本稿では,因子グラフ上のメッセージパッシングという形で,自己回帰型アクティブ推論エージェントの設計を提案する。
提案するエージェントはロボットナビゲーションタスクで検証され,探索とエクスプロイトを実証する。
古典的な最適制御器と比較して、エージェントは予測の不確実性に基づいて動作を変調し、後から到着するが、ロボットのダイナミクスをより良くモデル化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:38:09 GMT)
Fast quantum computation with all-to-all Hamiltonians [1.8] オール・ツー・オールの相互作用は、理論物理学の多くの領域で自然に起こる。
我々は、すべてのハミルトン人がはるかに短い時間スケールで情報を処理できることを示します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:02:00 GMT)
Chat to Chip: Large Language Model Based Design of Arbitrarily Shaped Metasurfaces [1.8] LLMはスペクトル予測と逆設計に必要な物理的関係を学習できることを示す。
この"chat-to-chip"ワークフローは、よりユーザフレンドリーなデータ駆動ナノフォトニクスへの一歩である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:24:57 GMT)
Proposing a Framework for Machine Learning Adoption on Legacy Systems [1.7] 機械学習(ML)の統合は、産業の競争力に欠かせないが、その採用は、レガシーシステムの陳腐化したコストと運用上の障害によって、しばしば停滞している。
本稿では,MLモデルのライフサイクルを運用環境から戦略的に切り離すことによって,これらの課題を克服するための実用的なAPIベースのフレームワークを紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:08:23 GMT)
CiteFusion: An Ensemble Framework for Citation Intent Classification Harnessing Dual-Model Binary Couples and SHAP Analyses [1.7] CiteFusionは、SciCiteとACL-ARCという2つのベンチマークデータセット上のマルチクラスCitation Intent Classificationタスクに対処する。
実験の結果、CiteFusionは最先端のパフォーマンスを達成し、Macro-F1スコアはSciCiteで89.60%、ACL-ARCで76.24%であった。
我々は、SciCiteで開発されたCiteFusionモデルを利用して、引用意図を分類するWebベースのアプリケーションをリリースする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:53:09 GMT)
Simulating Post-Neoadjuvant Chemotherapy Breast Cancer MRI via Diffusion Model with Prompt Tuning [1.7] ダイナミックコントラスト強調MRI(DCE-MRI)によるネオアジュバント化学療法(NAC)に対する反応の観察
NACに対する反応に影響を及ぼす既知の臨床因子を考慮し,即時チューニングを導入する。
他のモデルと比較して,pCRによる腫瘍径の変化を反映した画像の生成が良好であった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:05:20 GMT)
A Graph-in-Graph Learning Framework for Drug-Target Interaction Prediction [1.6] 帰納的学習と帰納的学習の両方の力を利用する新しい枠組みを導入する。
このフレームワーク内には、GNNベースのGraph-in-Graph(GiG)と呼ばれるモデルがあり、ドラッグとターゲットの分子構造のグラフを、薬物とターゲットの相互作用グラフのメタノードとして表現している。
実験結果から,GIGモデルが既存の評価指標をはるかに上回る結果が得られた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:22:57 GMT)
Neural Ordinary Differential Equations for Learning and Extrapolating System Dynamics Across Bifurcations [1.4] 本稿では,時系列データから直接基底となる分岐構造を復元するニューラル正規微分方程式について述べる。
我々は,非カオスからカオスへ遷移するロレンツ系,カオスから周期倍に移行するR"ossler系,グローバル分岐による崩壊を示す捕食者・捕食者モデルという3つのテストケースに対して,我々のアプローチを実証した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:49:00 GMT)
Echoes of Humanity: Exploring the Perceived Humanness of AI Music [1.4] 我々は,AIMを人間がどう知覚するかを理解することを目的としたリスナーに焦点を当てた実験の結果を提示する。
我々は,商用モデルの現実的な利用から,AIMの楽曲の新規かつ無制御なデータセットを用いた最初の研究である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:53:58 GMT)
Extracting the Structure of Press Releases for Predicting Earnings Announcement Returns [1.4] プレスリリースの内容(ソフト情報)は、利益の驚き(ハード情報)と同じくらい情報であることがわかった。
我々のフレームワークは,オンライン学習の統合によるリアルタイムリターン予測をサポートし,解釈可能性を提供し,価格形成における言語の役割を明らかにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:57:05 GMT)
Security of Device-independent Quantum Key Distribution under Sequential Attack [1.4] デバイス非依存量子鍵分布(DI-QKD)は、非局所相関を利用して、2つの正直な当事者間の暗号鍵を確立する。
ベル違反は、観測された統計の本質的な予測不可能を保証し、装置の信頼性には依存しない。
量子メモリに格納されたアンシラを用いて連続的な測定を行うことで、Eveはソースを初期制御することなく、特定のパラメータ範囲内で集団攻撃を模倣できることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:33:37 GMT)
Off-Policy Maximum Entropy RL with Future State and Action Visitation Measures [1.3] そこで本研究では,本質的な報酬関数が,割引された状態と行動の分布の相対エントロピーである,という新しいアプローチを提案する。
したがって、既存のアルゴリズムは、この固定点のオフポジーを学習し、本質的な報酬を計算するために適応することができる。
結果として得られた政策は、良好な状態対応空間をカバーし、高性能な制御を実現することを示します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:42:55 GMT)
Error bounds on the universal Lindblad equation in the thermodynamic limit [1.3] これは、バルク散逸の対象となる量子多体系の挙動を解明するために、物理学の様々な分野において中心的な問題である。
これまで、多体系に対するリンドブラッド量子マスター方程式のいくつかの微視的導出が提案されてきた。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:06:02 GMT)
Detecting Errors in a Quantum Network with Pauli Checks [1.3] 量子エラー検出方式であるPauli check sandwiching (PCS) を分散マルチパーティプロトコルにすることで量子ネットワークに適用する。
PCSはターゲットの量子ビットに対して保護を提供し、通常、標準的な量子エラー訂正や検出コードよりもリソースオーバーヘッドを少なくする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:21:48 GMT)
Robust Visual Localization in Compute-Constrained Environments by Salient Edge Rendering and Weighted Hamming Similarity [1.3] 我々は,火星サンプルリターンキャンペーンの文脈において,視覚に基づく6-DoFオブジェクトのポーズ推定の問題を考える。
本稿では,エッジ領域にマッチするテンプレートとともに,カスタムメトリックを活用する新しいローカライズアルゴリズムを提案する。
汎用ハードウェア上での安価で信頼性の高いローカライゼーションの新たな可能性を実現するため,ロバスト性と精度の両面で,計算およびメモリ制約によるローカライゼーションの最先端性を常に打ち負かしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:22:35 GMT)
Towards Shift-Up: A Framework and a Prestudy on High-Value Activities in GenAI Native Software Development [1.2] 我々は、GenAIがサポートしながら、ソフトウェアチームが高価値な作業に集中するのを支援するGenAIネイティブ開発のためのフレームワークを提案する。
論文の終わりに向けて、我々はシフトアップをもっと詳細に研究するための今後の研究目標を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:56:54 GMT)
Unsupervised Representation Learning for 3D Mesh Parameterization with Semantic and Visibility Objectives [1.2] 本稿では,標準的な幾何学保存型UV学習を意味的および可視性に配慮した目的で強化する,教師なし微分可能なフレームワークを提案する。
提案手法は, テクスチャ生成を支援し, 知覚可能なシームアーティファクトを低減できる紫外線アトラスを生成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:28:58 GMT)
Establishing a Foundation for Tetun Ad-Hoc Text Retrieval: Stemming, Indexing, Retrieval, and Ranking [1.2] 本稿では,アドホック検索タスクに着目したテトゥーンテキスト検索について検討する。
この研究は本質的な言語資源の開発から始まる。
文書タイトルとコンテンツを用いて様々な戦略を評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:11:55 GMT)
High fidelity CNOT gates in photonic integrated circuits using composite segmented directional couplers [1.1] 我々は、一様および複合カプラの変種を用いて、完全に統合されたフォトニック制御NOT(CNOT)ゲートを設計、製造する。
合成設計は平均誤差確率を2倍近く低減し、可変性を5倍に低下させる。
これらの結果はCSDCを、スケーラブルでスケーラブルな量子フォトニクス回路のためのコンパクトで受動的でファウントリー互換なビルディングブロックとして確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:03:28 GMT)
Understanding Cognitive States from Head & Hand Motion Data [1.1] 本稿では,構造化意思決定タスク中に収集された状態のフレームレベルアノテーションを用いた,頭部・手の動きの新たなデータセットを提案する。
以上の結果から,深部側頭葉モデルでは動作のみから微妙な認知状態を推定でき,人間の観察者と同等のパフォーマンスを達成できる可能性が示唆された。
この研究は、標準的なVRテレメトリは、ユーザの内的認知プロセスに関連する強力なパターンを含んでおり、新しい世代の適応仮想環境への扉を開くことを実証している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:59:56 GMT)
A theory of time based on wavefunction collapse [1.1] 時間の経過は、ゲージ不変状態に向かって崩壊する瞬間状態の連続過程である。
結果として生じる時間進化のユニタリティと指向性は、宇宙論のミニスーパースペースモデルとして実証される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:06:20 GMT)
No Practical Quantum Broadcasting: Even Virtually [1.1] 線形過程が標本効率、ユニタリ共分散、置換不変性、古典的一貫性を維持できないことを証明する。
標準の1-to-N$仮想放送マップの特異性を確立する。
仮想放送と擬似密度演算子として知られる量子時空フレームワークの相互作用について検討する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:53:07 GMT)
A Multi-Modality Evaluation of the Reality Gap in Autonomous Driving Systems [1.0] 我々は、Software-in-the-Loop (SiL), Vehicle-in-the-Loop (ViL), Mixed-Reality (MR), full real-world testingの4つの代表的なテストモードを比較した。
以上の結果から,SiLとViLのセットアップは実世界のダイナミックスとセンシングの重要な側面を単純化するが,MRテストは安全性や制御を損なうことなく知覚リアリズムを改善することが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:56:47 GMT)
Learning Distinguishable Representations in Deep Q-Networks for Linear Transfer [1.0] 本稿では,状態の特徴表現間の正の相関を減少させるために,正規化項を導入する新しいQ-ラーニング手法を提案する。
転送学習性能の向上と計算オーバーヘッドの低減に本手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:44:35 GMT)
Bootstrapping as a Morphism: An Arithmetic Geometry Approach to Asymptotically Faster Homomorphic Encryption [0.9] 本稿では,従来の回路評価モデルを完全にバイパスするブートストラップ手法を提案する。
直射射影としてブートストラップ操作を再構成するために,現代の算術幾何学のツールを適用した。
我々の研究は、$O(d cdot textpoly(log q))$、$d$が環次元、$q$が暗号文である完全かつ確実に正しいブートストラップアルゴリズムである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:39:01 GMT)
BPMN Assistant: An LLM-Based Approach to Business Process Modeling [0.9] 本稿では、自然言語ベースのBPMNダイアグラムの作成と編集にLarge Language Models(LLM)を活用するツールであるBPMN Assistantについて述べる。
プロセス修正の精度を高めるために、XMLの直接処理に代わる構造化された表現として特殊ベースの表現が導入される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:56:08 GMT)
Quantum heuristics for linear optimization over large separable operators [0.9] 量子コプロセッサを導入し、問題の次元を著しく削減する。
低次元設定ではシーソー型最適化が良好に動作することを示す。
我々は、ハミルトンの分離可能な基底エネルギーを最大28キュービットまで近似する方法を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:22:53 GMT)
Traumatic Brain Injury Segmentation using an Ensemble of Encoder-decoder Models [0.9] TBI病変の同定とセグメンテーションは、神経イメージングにおいて重要な課題である。
本研究の目的は、T1強調MRIにおけるTBI病変を自動的に検出・分節する自動パイプラインを開発することである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:21:32 GMT)
AI in Pakistani Schools: Adoption, Usage, and Perceived Impact among Educators [0.9] 教師の3分の2は、適切な支援を受けたAIツールを採用する意思を示した。
回答者の3分の1はAIツールを頻繁に使用しており、その他は時折利用している。
教師は、AIによる学生のエンゲージメントと効率の適度な改善を報告した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:20:01 GMT)
The Emergence of Social Science of Large Language Models [0.9] 大規模言語モデル(LLM)の社会科学は、これらのシステムがマインドアトリビューションを誘発し、相互に相互作用し、人間の活動や制度を変革する方法について考察する。
社会心としてのLLMは、モデルが認知、道徳、偏見の帰属を示す行動を示し、テスト漏れや表面の手がかりのような課題に対処するかどうかを調査する。
ヒューマンインタラクションとしてのLLMは、LLMがタスク、学習、信頼、仕事、ガバナンスをどのように作り変え、ヒューマンAIインターフェースでリスクが生じるかを調べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:55:14 GMT)
Meson dynamics from locally exciting a particle-conserving $Z_2$ lattice gauge theory [0.8] 粒子保存1D$Z$格子ゲージ理論において局所的な高エネルギー励起から生じる閉じ込められた中間子を特徴付ける。
この力学は、異なる大きさの中間子の重ね合わせの伝播によって特徴づけられる。
この現象は線形閉じ込めの結果であり、強い閉じ込め限界と弱い閉じ込め限度の両方において有効であることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:08:21 GMT)
SemShareKV: Efficient KVCache Sharing for Semantically Similar Prompts via Token-Level LSH Matching [0.8] 大規模言語モデル(LLM)のためのKVキャッシュ共有圧縮フレームワークである textitSemShareKV を提案する。
正確なトークンマッチに頼る代わりに、SemShareKVは、トークン埋め込みにローカリティ感受性ハッシュ(LSH)を使用してファジィトークンマッチングを適用し、位置情報をよりよく保存するためにロータリー位置埋め込み(Rotary Position Embedding、RoPE)を組み込んでいる。
多様な要約データセットの実験では、最大6.25$times$スピードアップと42%低いGPUメモリ使用率で5kトークンが入力され、品質劣化は無視できる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:16:13 GMT)
SQuaD: Smart Quantum Detection for Photon Recognition and Dark Count Elimination [0.8] SQuaDは、高タイミング分解能データ取得、マルチスケールデータ分析、インテリジェントな特徴認識と抽出を備えた完全に統合された量子システムである。
我々は、SQuaDを原子(エルビウムイオン)光子源に展開し、通信帯域におけるスピン量子ビットのノイズフリー制御と読み出しを実現する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:33:21 GMT)
Evaluating classification performance across operating contexts: A comparison of decision curve analysis and cost curves [0.8] 決定曲線は、ブライア曲線と呼ばれる特定の種類のコスト曲線と密接に関連していることを示す。
損失の差は、純利益の差と同等である。
我々は,各空間に共通する基準線をいずれにも含めることができることを示唆し,有効比較として,上層エンベロープ決定曲線を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:15:25 GMT)
A Cartography of Open Collaboration in Open Source AI: Mapping Practices, Motivations, and Governance in 14 Open Large Language Model Projects [0.8] オープンな大規模言語モデル(LLM)の普及は、人工知能(AI)における研究とイノベーションの活発なエコシステムを育んでいる。
オープン LLM の開発に用いられている共同開発手法は,まだ包括的に研究されていない。
我々は、草の根プロジェクト、研究機関、スタートアップ、北米、ヨーロッパ、アフリカ、アジアのビッグテック企業の14のオープンLCMの開発者との半構造化されたインタビューを描いています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:55:18 GMT)
Orchestrating multi-level magic state distillation: a dynamic pipeline architecture [0.8] マジックステート蒸留工場は、多くの低忠実度入力魔法状態を消費し、より少ない高忠実度状態を生成する。
高忠実度に達するためには、複数の蒸留工場が多層パイプラインに連結されるのが一般的である。
蒸留パイプラインの資源利用を最適化する新しい動的パイプラインアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:49:40 GMT)
Roadmap to planar electron-ion point Paul trap [0.8] 我々は、レーザー冷却したイオンと電子を併用した量子力学システムの開発のための技術的ガイドを示す。
本稿では、システムの量子状態を制御する方法の概要と、それを含む前方互換設計のための青写真を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:43:52 GMT)
Evaluation of Polarimetric Fusion for Semantic Segmentation in Aquatic Environments [0.8] ポラリメトリック・イメージングは、浮遊物体のセマンティックセグメンテーションを妨害する水面グレアを緩和する単一センサーの経路を提供する。
我々は、内陸水路におけるプラスチックボトルの偏光画像の公開データセットであるPoTATO上で、最先端の核融合ネットワークをベンチマークした。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:57:20 GMT)
DNS in the Time of Curiosity: A Tale of Collaborative User Privacy Protection [0.8] パブリックDNSリゾルバは、低レイテンシの解決、高い信頼性、プライバシ保護ポリシー、暗号化DNSクエリのサポートを提供する。
ユーザを盗聴者から守るためにますますデプロイされるクライアント・リゾルバのトラフィック暗号化は、好奇心をそそるリゾルバからユーザーを保護するものではない。
パフォーマンスを犠牲にすることなく、高いレベルのプライバシを実現することを目的として、提案の重要なアイデアについて議論する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:09:09 GMT)
A Systematic Review of Digital Twin-Driven Predictive Maintenance in Industrial Engineering: Taxonomy, Architectural Elements, and Future Research Directions [0.7] コストのかかるダウンタイムや悲惨な結果を避けるため、予測メンテナンスの必要性が強まっている。
モノのインターネット、人工知能、機械学習、リアルタイムビッグデータ分析の人気が高まり、効率的な予測保守のためのユニークな機会がある。
この進化の中心はデジタルツイン技術であり、センサデータを継続的に監視し統合し、資産のパフォーマンスをシミュレートし改善する適応型仮想レプリカである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:26:23 GMT)
Emergent World Representations in OpenVLA [0.7] 本稿では,OpenVLAが状態遷移の潜在知識を含むかどうかを探索するために,状態表現への埋め込み演算を用いた実験手法を提案する。
ベースラインを超える状態遷移の統計的に有意な予測能力は,OpenVLAが内部世界モデルを符号化していることを示す。
我々は,OpenVLAの早期チェックポイントの予測能力について検討し,トレーニングが進むにつれて世界モデルが出現することを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:12:59 GMT)
A(I)nimism: Re-enchanting the World Through AI-Mediated Object Interaction [0.7] A(I)ニミズム(A(I)nimism)は、大きな言語オブジェクト(LLO)が日常の物とアニミズムの関係をどのように仲介するかを探索するインタラクティブなインストールである。
物理的な「ポータル」に配置され、GPT-4ビジョン、音声入力、メモリベースのエージェントを使用して進化するオブジェクトペルソナを作成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:27:09 GMT)
Outlier Detection in Plantar Pressure: Human-Centered Comparison of Statistical Parametric Mapping and Explainable Machine Learning [0.7] 統計的パラメトリックマッピング(SPM)は、解釈可能な解析を提供するが、アライメントに敏感であり、ロバストな外れ値検出能力は未だ不明である。
本研究では、SPMアプローチと説明可能な機械学習(ML)アプローチを比較して、プラント圧力データセットのための透明な品質制御パイプラインを確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:37:15 GMT)
Detecting and Fixing API Misuses of Data Science Libraries Using Large Language Models [0.7] 本稿では,データサイエンスライブラリのAPI誤用を検出し,修正するためのLCMベースのアプローチであるDSCHECKERを紹介する。
APIの誤用の検出と修正に有用な2つの重要な情報、すなわちAPIディレクティブとデータ情報を特定します。
ドシェッカー剤は48.65パーセントのF1スコアを検出でき、誤用の39.47パーセントを修正している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:30:02 GMT)
Metaphor identification using large language models: A comparison of RAG, prompt engineering, and fine-tuning [0.7] 本研究では,大言語モデル(LLM)が全文でメタファ識別を自動化する可能性について検討する。
i) 検索拡張生成(RAG) モデルにコードブックを付与し,その規則や例に基づいて注釈を付けるように指示する手法, (ii) タスク固有の言語命令を設計する手法, (iii) ハンドコードされたテキストでモデルを訓練してパフォーマンスを最適化するファインチューニング,の3つの手法を比較した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:50:18 GMT)
CURA: Size Isnt All You Need - A Compact Universal Architecture for On-Device Intelligence [0.6] 本稿では,多様な機械学習タスクに対して,コンパクトで軽量なソリューションを提供するアーキテクチャCURAを提案する。
コンパクト化のためには、ベースラインモデルに比べて最大2500倍のパラメータで等価な精度を実現した。
一般化のために、4つのNLPベンチマークと1つのコンピュータビジョンデータセットで一貫した性能を示した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:06:37 GMT)
S2S-Net: Addressing the Domain Gap of Heterogeneous Sensor Systems in LiDAR-Based Collective Perception [0.6] この研究は、車車間(V2V)集団知覚におけるSensor2Sensorドメインギャップに対処する最初の試みである。
まず、センサドメインのロバストアーキテクチャS2S-Netについて述べる。
次に、最先端CP法とS2S-NetのSensor2Sensor領域適応能力を詳細に分析する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:49:46 GMT)
Balancing Compliance and Privacy in Offline CBDC Transactions Using a Secure Element-based System [0.6] 本稿では、暗号通貨やCBDCにも等しく適用可能な、オフラインのデジタル通貨決済のプロトタイプを紹介する。
性能評価の結果, 異なる規制環境に柔軟に適応できることが示唆された。
我々は、Zero-Knowledge Proofsを設計に組み込むことが、プライバシー保護の強化にどのように対応できるかを概念化した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:19:31 GMT)
Bayesian Transformer for Pan-Arctic Sea Ice Concentration Mapping and Uncertainty Estimation using Sentinel-1, RCM, and AMSR2 Data [0.6] パン・アルキティック海氷の高分解能マッピングは, 海氷濃度チャートの作成に不可欠である。
パン・アルキティックSICマッピングと不確実性定量化のための新しいベイズ変圧器手法を提案する。
提案手法は2021年9月にPan-Arcticデータセットを用いて検証され,提案モデルが高分解能SICマップと頑健な不確実性マップの両方を達成可能であることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:42:15 GMT)
Zero Trust-based Decentralized Identity Management System for Autonomous Vehicles [0.6] 本稿では,AVのためのZero Trust-based Decentralized Identity Management (D-IM)プロトコルを提案する。
Zero Trust Architectureの中核的な原則である“常に信頼し、常に検証する”ことと、ブロックチェーンネットワークの改ざんし、分散した性質を統合することで、当社のフレームワークは、中央集権的な権威への依存を排除します。
都市と高速道路の両方のシナリオで実施された総合的な実験的評価は、プロトコルの実用性を検証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:42:51 GMT)
Learning from Convenience Samples: A Case Study on Fine-Tuning LLMs for Survey Non-response in the German Longitudinal Election Study [0.6] ランダムな非応答と体系的な非応答の両方で自己申告された投票選択をインプットするために、大きな言語モデルを微調整する。
LLMは、ゼロショットよりも正確に個人レベルの予測と人口レベルの分布を復元することができる。
このことは、微調整のLSMが、非確率的なサンプルや体系的な欠陥を扱う研究者に有望な戦略を提供することを示唆している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:12:18 GMT)
STRAPSim: A Portfolio Similarity Metric for ETF Alignment and Portfolio Trades [0.6] STRAPSimは、セマンティックな類似性に基づいて構成成分をマッチングすることでポートフォリオの類似性を計算する新しい方法である。
私たちは、Jaccard、重み付きJaccard、およびBERTScoreにインスパイアされたパブリックな分類、回帰、レコメンデーションタスクに対するアプローチをベンチマークします。
実験結果から,提案手法は予測精度とランキングアライメントにおいて,ベースラインを一貫して上回ることがわかった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:57:41 GMT)
Reducing Spatial and Temporal Dimensionality in the Multidimensional Caldeira-Leggett Model [0.6] 本稿では,多次元カルデイラ・レゲットモデルの縮密度行列のリアルタイムダイナミクスに着目する。
本稿では,空間的次元と時間的次元を削減し,効率的なアルゴリズムに組み込むために,いくつかの手法を応用した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:40:41 GMT)
Performance and competence intertwined: A computational model of the Null Subject stage in English-speaking children [0.6] 若い英語話者は、パフォーマンスの影響により、インペラティブなNS発声と宣言的な発声を混同することが多い。
そこで我々は,この誤解釈を計算パラメータとして提案し,従属科目文法学習のシミュレーションモデルに組み込む。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:04:30 GMT)
LAMP-PRo: Label-aware Attention for Multi-label Prediction of DNA- and RNA-binding Proteins using Protein Language Models [0.5] LAMP-PRoは、事前学習されたタンパク質言語モデル(PLM)、注意機構、マルチラベル学習に基づいている。
我々はDNA結合タンパク質とRNA結合タンパク質の依存関係を明示的に捉える新しいラベル間アテンション機構を含む。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:13:51 GMT)
Large language models for behavioral modeling: A literature survey [0.5] 大規模言語モデル(LLM)は行動モデリングに広く利用されている。
本研究の目的は, 行動モデルにおけるLCMの利用に関する既存研究の概要を明らかにすることである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:43:02 GMT)
Proof-of-Social-Capital: A Consensus Protocol for Public Blockchains, Replacing Stake for Social Capital [0.5] 本稿では,公正性と分散性を確保するため,社会資本による新たなコンセンサスプロトコルを提案する。
提案手法では,Sybil攻撃を防ぐために,認証証明と独自性強化機構を組み込んだzkSNARKの検証を行う。
この研究は、金融に応用された現代ソーシャルメディアのライフスタイルに沿った新しい概念を提供し、分散コンセンサスプロトコルの進化に関する実践的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:23:19 GMT)
Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective POMDPs and its Impact on Randomised Strategies [0.5] 部分的に観測可能なマルコフ決定過程における多次元ペイオフ関数について考察する。
すべての戦略の下で期待される支払いが有限である任意のペイオフに対して、期待されるペイオフは、有限個の戦略を正確に混合することで得られる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:30:59 GMT)
EYE-DEX: Eye Disease Detection and EXplanation System [0.5] 世界全体では、32億人以上の人々が何らかの視覚障害の影響を受けており、年間生産性の損失は4100億ドルと見積もられている。
本研究では,網膜10条件を自動分類するEYE-DEXを提案する。
我々は、VGG16、VGG19、ResNet50の3つの事前訓練された畳み込みニューラルネットワーク(CNN)モデルのベンチマークを行った。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:10:02 GMT)
Towards Structured Knowledge: Advancing Triple Extraction from Regional Trade Agreements using Large Language Models [0.4] 本研究では,Large Language Models (LLMs) の有効性について検討した。
この知見は、自然言語の法的な貿易合意書から経済的な貿易知識グラフを作成することを含む、幅広いシナリオに適用することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:11:40 GMT)
CAFL-L: Constraint-Aware Federated Learning with Lagrangian Dual Optimization for On-Device Language Models [0.4] ラグランジアンデュアル最適化(CAFL-L)による制約を考慮したフェデレーション学習
ラグランジアンデュアル最適化(CAFL-L)を用いた制約対応フェデレーション学習について紹介する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:07:20 GMT)
Secret Leader Election in Ethereum PoS: An Empirical Security Analysis of Whisk and Homomorphic Sortition under DoS on the Leader and Censorship Attacks [0.4] Proof-of-Stake(PoS)ブロックチェーンのプロポーラ匿名性は、悪意のあるDoS(DoS)や検閲攻撃といったターゲット攻撃のリスクのために、重要な懸念事項である。
敵条件下でSSLEメカニズムを評価するための統一的な実験フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:48:05 GMT)
Characterizing the Sensitivity to Individual Bit Flips in Client-Side Operations of the CKKS Scheme [0.4] ホモモルフィック暗号化(HE)は、復号化せずに暗号化されたデータの計算を可能にし、信頼できない環境でのプライバシ保護計算の基盤となる。
HEは、セキュアな機械学習や機密データ分析といったセンシティブなアプリケーションの採用が増加し、エラーに対する堅牢性が重要になると考えている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:46:50 GMT)
Quantum Speed Limit and Quantum Thermodynamic Uncertainty Relation under Feedback Control [0.4] 我々は、量子速度制限と量子熱力学の不確実性関係の理論的枠組みを確立する。
フィードバック制御が速度と精度に与える影響を取り入れた一般的な不等式を導出する。
我々の研究は、フィードバック制御が量子システムの速度と精度の基本的な限界にどのように影響するかを包括的に理解する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:19:22 GMT)
Evaluating SAP Joule for Code Generation [0.4] SAPは独自の生成モデルであるSAP Jouleをリリースした。
本稿では、SAP JoulesのJavascriptコーディング機能と、29の他のモデルを比較した。
SAP Jouleは、評価において5番目の最良のモデルとして、80.49%の厳密な精度を達成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:13:40 GMT)
Long-Range Bosonic Systems at Thermal Equilibrium: Computational Complexity and Clustering of Correlations [0.4] 本稿では, 準ポリリノミカルを用いた古典的アルゴリズムを用いて, 高温における長距離ボソニック系の分配関数を近似する。
また相関関数の正則崩壊の厳密な証明も提示する。
これらのシステムにおける計算複雑性と相関クラスタリングに関する2つの長期的ギャップに対処する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:48:32 GMT)
Auto-Regressive U-Net for Full-Field Prediction of Shrinkage-Induced Damage in Concrete [0.3] この研究は、自動回帰U-Netモデルを用いて、単位セル内のスカラー損傷場の進化を予測する。
畳み込みニューラルネットワーク(CNN)は、観測された収縮や残留剛性を含む重要な力学特性を予測するために用いられる。
これはコンクリートの混合設計の最適化に役立ち、耐久性の向上と内部損傷の低減につながる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:15:07 GMT)
Network inference via process motifs for lagged correlation in linear stochastic processes [0.3] 時系列データから因果推論を行う上での大きな課題は、計算可能性と精度のトレードオフである。
相関行列から容易に計算できるペアワイドエッジ測度(PEM)を用いて因果関係のネットワークを推論する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:11:13 GMT)
Graph Neural Networks for O-RAN Mobility Management: A Link Prediction Approach [0.3] 5Gまでのセルラーネットワークにおいて、モビリティのパフォーマンスが重要視されている。
本稿では,O-RANにおけるモビリティ管理のためのアクティブなHOフレームワークを提案する。
リンク予測のためのグラフニューラルネットワーク(GNN)の様々なカテゴリについて検討し、それらをモビリティ管理領域に適用する際の複雑さを分析する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:18:41 GMT)
The 2025 OpenAI Preparedness Framework does not guarantee any AI risk mitigation practices: a proof-of-concept for affordance analyses of AI safety policies [0.3] 著名なAI企業は、自主的な自己管理の一種として「安全フレームワーク」を生産している。
OpenAI 'Preparedness Framework Version 2' (2025年4月) は、余裕のメカニズムと条件モデルとMIT AI Risk Repositoryを用いて分析する。
この安全ポリシーは、少数のAIリスクの評価を要求し、‘Medium’機能を備えたシステムのデプロイを奨励し、OpenAIのCEOがさらに危険な機能をデプロイできるようにする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:42:10 GMT)
Hierarchical Error Correction for Large Language Models: A Systematic Framework for Domain-Specific AI Quality Enhancement [0.2] 最先端のAIモデルは、医療コーディングタスクで45.9%の精度しか達成していない。
我々は、4つの専門分野にわたるエラーパターンを分析し、AIエラーが一貫した階層構造に従うことを発見した。
我々は,その階層的重要性に応じて誤りに対処する3段階補正フレームワークを開発した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:21:05 GMT)
Single-particle Fraunhofer diffraction in a classical pilot-wave model [0.2] ウォーキングオイル滴は定性的で古典的な単一粒子回折のアナログを提供する。
我々はダローとブッシュの最近のラグランジアンパイロット波モデルで問題を再考する。
シングルスリットとダブルスリットの両方のフラウンホーファーパターンとの一致を見いだす。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:50:05 GMT)
Artificial Authority: From Machine Minds to Political Alignments. An Experimental Analysis of Democratic and Autocratic Biases in Large-Language Models [0.1] 政治的信念は、歴史的、文化的、制度的な文脈を反映して、国によって大きく異なる。
生成的人工知能の出現は、大規模なコーパスで訓練された政治宇宙エージェントに新しいエージェントを導入する。
本稿では,Large Language Models (LLM) が,民主的・独裁的世界観と整合性を示すか否かを考察する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:26:58 GMT)
Context-Driven Performance Modeling for Causal Inference Operators on Neural Processing Units [0.1] 大規模言語モデル(LLM)は、リソース制約されたエッジデバイスに対する長期のコンテキスト推論の需要を押し上げている。
ニューラル処理ユニット(NPU)にこれらのモデルをデプロイすると、アーキテクチャミスマッチによる重大な問題が発生する。
本稿では,現代NPUにおける各種因果推論演算子の総合的性能解析について述べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:55:43 GMT)
Two bases suffice for QMA1-completeness [0.1] 我々は、量子-k-SAT問題の基底制限付き変項を導入し、入力ハミルトニアンの各項は標準基底またはアダマール基底において対角線であることが要求される。
我々の主な結果は、この基底制限を持つ量子-6-SAT問題は、既にQMA1完全であり、自然ゲートセットに対して定義されていることである。
我々はFeynman-Kitaev回路とHamilton回路をベースとしており、標準時計とHadamardベースで2つのクロックをインターリーブする改良されたクロック符号化を採用している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:39:00 GMT)
NarrLV: Towards a Comprehensive Narrative-Centric Evaluation for Long Video Generation [0.1] 長いビデオ生成タスクの目標は、ビデオの長さを延ばすだけでなく、長いビデオの中でよりリッチな物語コンテンツを正確に表現することである。
提案するNarrLVは,Long Video生成モデルのナラティブ表現能力を総合的に評価する最初のベンチマークである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:19:15 GMT)
Generation of C-band entangled photon pairs by biexciton-exciton cascade from symmetric InAs/InP quantum dots [0.0] 非共鳴励起エピタキシャルInAs/InP量子ドット(QDs)からのバイエキシトンエキシトンカスケードによる通信Cバンドの偏光束光子の生成について検討した。
微細構造分割 (FSS) の外部チューニングは行わずに実現され、これは成長したナノ構造において10$mu$eVを超えない。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:16:04 GMT)
Digital-Analog Simulations of Schrödinger Cat States in the Dicke-Ising Model [0.0] そこで我々はDicke-Isingモデルのためのディジタルアナログ量子シミュレータを提案する。
本研究では,フィールド理論を用いて,システムの自由エネルギー景観を解析する。
我々は、量子ビットと光子自由度をアンタングルするデジタルアナログ量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:10:30 GMT)
Krylov Winding and Emergent Coherence in Operator Growth Dynamics [0.0] 我々は、クリロフ巻は量子カオス系の一般的な特徴であると主張する。
スクランブル作用素におけるコヒーレント相の出現は、熱化量子多体系の観点からも謎のままである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:00:07 GMT)
Meta-Learning to Explore via Memory Density Feedback [0.0] メタ学習を利用した探索アルゴリズムや学習の学習について検討する。
エージェントは、訓練の最盛期にさえ、単一のエピソードで探索の進捗を最大化することを学ぶ。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:11:43 GMT)
Why mask diffusion does not work [0.0] 自己回帰(AR)モデルよりも拡散言語モデルの主な利点は、並列生成と双方向の注意を支援する能力にある。
近年、オープンソースのマスク拡散言語モデルが登場し、そのほとんどは吸収拡散として知られる変種に基づいている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:07:09 GMT)
Who invented deep residual learning? [0.0] 2025年現在、21世紀の最も引用された科学論文は、残余接続を伴う深層学習に関するNNの論文である。
我々は深層学習の進化のタイムラインを提示する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:57:35 GMT)
Visualizing Celebrity Dynamics in Video Content: A Proposed Approach Using Face Recognition Timestamp Data [0.0] 本稿では,分散マルチGPU推論システムとインタラクティブな可視化プラットフォームを組み合わせたハイブリッドフレームワークを提案する。
この推論フレームワークは、最適化されたONNXモデルを利用して、大量のビデオデータを効率的に処理する。
このシステムのインタラクティブな性質により、ユーザは動的にデータを探索し、キーモーメントを特定し、個人間の進化する関係を明らかにすることができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:29:11 GMT)
Vehicle Classification under Extreme Imbalance: A Comparative Study of Ensemble Learning and CNNs [0.0] 車両のタイプ認識は、インテリジェントな輸送とロジスティクスを支えるが、公共データセットの厳しいクラス不均衡は、稀なカテゴリーのパフォーマンスを抑制する。
我々は、Kaggle、ImageNet、およびWebcrawledデータを統合することで、16クラスのコーパス(47k画像)をキュレートし、SMOTEオーバーサンプリングとターゲットアンダーサンプリングにより6つのバランスの取れた変種を生成する。
Random Forest、AdaBoost、MobileNet-V2機能上に構築されたソフトボッティングコンバインダなどの軽量アンサンブルは、強力な拡張とラベルスムーシングでトレーニングされたResNetスタイルのCNNに対してベンチマークされる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:56:56 GMT)
Trajectories and Comparative Analysis of Global Countries Dominating AI Publications, 2000-2025 [0.0] 米国と欧州連合(EU27)は、かつては議論を呼ばない指導者であり、相対的な支配力の顕著な低下を経験している。
中国は、2000年の5%以下から2025年までに36%近くまで、全世界のAI出版物のシェアを拡大している。
これらの経験的発見は、集中的な研究成果の戦略的意味を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:35:54 GMT)
TraitSpaces: Towards Interpretable Visual Creativity for Human-AI Co-Creation [0.0] 心理学からアーティストや理論を実践する実践者へのインタビューに基づいて、私たちは、創造性の感情的、象徴的、文化的、倫理的次元を捉えた12の特徴を定義します。
環境対話性や空洞アークといったトラストは高い信頼性で予測される。
私たちの研究は、文化的・美的な洞察と計算モデリングを結びつけることで、創造性を数字に還元するのではなく、アーティスト、研究者、AIシステムが有意義に協力するための共通の言語と解釈可能なツールを提供することを目的としています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:24:18 GMT)
Towards Understanding the Shape of Representations in Protein Language Models [0.0] 我々は,2乗根速度 (SRV) の表現とグラフ濾過によるタンパク質の構造と表現を同定する。
我々は PLM が直接的および局所的な残基間の関係を優先的に符号化するが、より大きな文脈長に対して劣化し始めることを発見した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:06:24 GMT)
Towards Robust Surrogate Models: Benchmarking Machine Learning Approaches to Expediting Phase Field Simulations of Brittle Fracture [0.0] フラクチャーモデリングのためのML手法のベンチマークと進歩を目的としたPFMシミュレーションに基づくデータセットを提案する。
このデータセットには3つのエネルギー分解方法、2つの境界条件、合計6,000のシミュレーションのための1000のランダムな初期き裂構成が含まれている。
本研究は, フラクチャーメカニクス研究における機械学習の進歩のためのテストベッドとして, このデータセットの有用性を実証するものである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:26:54 GMT)
The persistence of spin coherence in a crystalline environment [0.0] 分子結晶中の一重項励起子核分裂によって生成される三重項励起子対における量子干渉を解析した。
我々は、期待される蛍光量子ビートを抑制できるキーエフェクトとして、トランスポート誘起デファスティング(TID)を導入する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:53:05 GMT)
The Physical Basis of Prediction: World Model Formation in Neural Organoids via an LLM-Generated Curriculum [0.0] 人間の神経オルガノイドを訓練するために設計された3つのスケーラブルでクローズドループ仮想環境のカリキュラムを提示する。
意思決定を成功させるために、より高度な世界モデルを求める3つの異なるタスク環境の設計について詳述する。
この研究は、モデルに基づく強化学習と計算神経科学のギャップを埋め、実施、意思決定、および知性の物理的基盤を研究するためのユニークなプラットフォームを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:40:17 GMT)
The Geometry of Cortical Computation: Manifold Disentanglement and Predictive Dynamics in VCNet [0.0] 本稿では,新しいニューラルネットワークアーキテクチャであるVisual Cortex Network(VCNet)を紹介する。
VCNetは、重要な生物学的メカニズムをエミュレートする幾何学的フレームワークである。
我々は、VCNetがSpots-10で92.1%、光フィールドデータセットで74.4%の最先端の精度を達成したことを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:33:50 GMT)
TDHook: A Lightweight Framework for Interpretability [0.0] ディープニューラルネットワーク(DNN)の解釈可能性 (Interpretability of Deep Neural Networks, DNN) は、視覚と言語モデルの研究による成長分野である。
私たちは、$texttttensordict$をベースとしたオープンソースで軽量で汎用的な解釈可能性フレームワークであるTDHookを紹介します。
コンピュータビジョン、自然言語処理、強化学習、その他のドメインのためにトレーニングできる複雑な構成モデルを扱うことに焦点を当てている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:28:43 GMT)
T-duality and bosonization as examples of continuum gauging and disentangling [0.0] 双対と双対変換は、量子多体物理学と量子場理論の様々な側面において確立された方法論を形成する。
これらの概念を連続体に拡張し、場の理論や粒子物理学の連続体における双対変換を導出する方法として提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:38:09 GMT)
Surjective Independence of Causal Influences for Local Bayesian Network Structures [0.0] 多くのドメインでは、利用可能なデータを専門家の判断で補うことが不可欠であることが多い。
ICI仮定を緩和する因果的影響(SICI)モデルの導入について述べる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:23:11 GMT)
Study of nuclear magnetic resonance spectra with the multi-model multi-level quantum complex exponential least squares algorithm [0.0] 本稿では,MM-QCELSアルゴリズムの新たな応用法を提案する。
スピン力学の量子シミュレーションや複雑なカップリングトポロジーを持つ系における位相分解能の向上を実証した。
この研究は、量子ベースの化学分析のための有望な新しいアプローチを提供する、実用的な分光学的応用による先進的な量子アルゴリズム設計を橋渡しする。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:10:26 GMT)
Strategies for generating separable photon triplets in waveguides and ring resonators [0.0] 自発3次パラメトリックダウンコンバージョンにより生じる光子三重項のスペクトル特性に関する理論的解析を行った。
このような相関関係の定量化と最小化について論じる。
我々は,最先端の実験システムを用いて,光子三重項の少数モード生成を実現することが可能であることが確認された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:01:48 GMT)
Spectra of generators of Markovian evolution in the thermodynamic limit: From non-Hermitian to full evolution via tridiagonal Laurent matrices [0.0] 無限直線上の単粒子、翻訳不変のリンドブラッド作用素の生成は、有限レンジ摂動を持つ有限レンジ双無限ローラン作用素の直積分と一意的に等価である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:48:43 GMT)
SafeFlowMatcher: Safe and Fast Planning using Flow Matching with Control Barrier Functions [0.0] 本稿では,フローマッチング(FM)と制御バリア関数(CBF)を結合して,リアルタイムの効率性と認証された安全性を実現するための計画フレームワークであるSafeFlowMatcherを提案する。
結果のフローシステムに対する障壁証明を証明し、ロバストな安全な集合の前方不変性と、安全な集合への有限時間収束性を確立する。
迷路ナビゲーションとベンチマーク全体で、SafeFlowMatcherは拡散とFMベースのベースラインよりも高速でスムーズで安全なパスを実現している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 03:33:33 GMT)
Responsible AI Adoption in the Public Sector: A Data-Centric Taxonomy of AI Adoption Challenges [0.0] 本研究では、政府におけるAI導入の責任を負うために、データ関連課題の分類法を開発する。
43の研究と21の専門的評価の体系的なレビューに基づいて、分類学は、技術的、組織的、環境的な側面において13の重要な課題を特定している。
分類学は、機関の圧力に付加され、リスクの高いAIデプロイメントの「症状」を表面化する診断ツールとして機能する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:42:09 GMT)
Renormalization of Chern-Simons Wilson Loops via Flux Quantization in Cohomotopy [0.0] 2-コホモトピーにおける適切なフラックス量子化は、5D Maxwell-Chern-Simons QFTの非ラグランジアン位相的完備化を達成できることを示す。
この結果は、トポロジカルに順序付けられた量子材料に応用された、控えめな従兄弟である。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:00:17 GMT)
Reconstructing Quantum States and Expectations via Dynamical Tomography [0.0] 量子システムでは、トモグラフィー技術による状態再構成には、情報的に完備な可観測物の集合は必要ない。
このアイデアは力学量子トモグラフィーにつながり、その実現可能性として一般量子力学を特徴付ける。
このフレームワークはスピン鎖(散逸の有無にかかわらず)と電子核系への応用を図示する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:43:52 GMT)
Quenched properties of the Spectral Form Factor [0.0] ヘミチアンおよび非ヘミチアンランダム行列に対する焼成SFFの特性を計算した。
log MathrmSFF$のゆらぎは深く、分割関数の0に近づくと1つの薄いスパイクになる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:26:51 GMT)
Quantum process tomography of a compressed time evolution circuit on superconducting quantum processors [0.0] 我々は、IBM量子プロセッサのノイズチャネルを特徴付けるために、最先端の量子プロセストモグラフィー(QPT)技術を採用している。
圧縮された回路は、より大きな固有値変調を系統的に生成し、より優れたノイズ耐性を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:00:51 GMT)
Qualitative Research in an Era of AI: A Pragmatic Approach to Data Analysis, Workflow, and Computation [0.0] コンピュータを使って質的なデータを分析するという古典的な議論に基づいて、私たちは長年の懸念を再考し、可能性と危険を評価する。
本稿では, コンテンポラリーなエンゲージメントの様式, 合理化, プロジェクト拡大, ハイブリッド分析アプローチ, 計算社会学を紹介する。
我々は、技術的楽観主義と拒絶という二元論を超越した実践的な社会学的アプローチを論じる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:59:15 GMT)
Operator algebra of the information-disturbance tradeoff in quantum measurements [0.0] 本研究では,情報ゲインを最小外乱で記述した演算子を,実験的に識別可能な外乱パターンを表すユニタリ演算子群に拡張可能であることを示す。
外乱の観測可能な統計は、測定の情報ゲインの厳密な上限を定義する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:51:28 GMT)
On the Effect of Instability on Learning Continuous-Time Linear Control Systems [0.0] 有限長状態軌跡に基づく連続時間力学におけるシステム同定の問題について検討する。
適切なランダム化制御入力を用いて不安定なオープンループ行列を推定する手法を提案する。
我々は,推定誤差が軌道長,励起率,信号対雑音比で減衰することを示す理論的性能保証を確立する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:30:38 GMT)
Notes on the type classification of von Neumann algebras [0.0] これらのノートはフォン・ノイマン代数の型分類の説明を与える。
目標は、専門家でない読者には技術的すぎるリソース間の文学のギャップを埋めることです。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:37:47 GMT)
Non-positive measurements aren't beneficial in quantum metrology for unitary encoding, but can be for open schemes [0.0] 量子気象学において,非正の演算子値測定が有用かどうかを検討する。
ユニタリ符号化では、非正の測定値が正の測定値よりも有利であることを示す。
任意のオープンシステム符号化に対して、正の測定値が最適精度を達成するのに十分であるような条件を同定する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:49:28 GMT)
Non-destructive optical read-out and manipulation of circular Rydberg atoms [0.0] 円状のリドベルク原子は、リドベルク状態の典型的な強い双極子-双極子相互作用を長い寿命で結合する。
低角モードレーザーアクセス可能なライドバーグ準位は、これまでほとんど使われてきた。
我々は、ルビジウムの論理レーザーをトラップした環状リドベリ原子の配列と、Rbアンシラ原子の補助配列を、ロー・ドル・リドベリ準位に過渡的に励起する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:26:47 GMT)
Non-Gaussian Quantum State Engineering with Postselected von Neumann Measurements [0.0] 我々は,非ガウス状態(nG)をポストセレクトされたフォン・ノイマン測定により生成するための実現可能なプロトコルを提案する。
ウィグナー関数による非ガウス性の特徴付けと線形エントロピーと共起を用いた絡み合いの定量化を行う。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:08:06 GMT)
Magnetometry with Broadband Microwave Fields in Nitrogen-Vacancy Centers in Diamond [0.0] ダイヤモンド中の窒素空孔(NV)中心は光学的に対応可能で、多用途の光物質界面である。
広帯域マイクロ波場を用いた全磁気感度状態の同時探索手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:18:00 GMT)
Magnetic moments in the Poynting theorem, Maxwell equations, Dirac equation, and QED [0.0] 電気力学のどちらのバージョンにも磁気モーメント効果がどのように含まれているかを示す。
主な焦点は磁気双極子相互作用であり、磁気単極子相互作用は考慮されていない。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:04:09 GMT)
Machines Do See Color: A Guideline to Classify Different Forms of Racist Discourse in Large Corpora [0.0] テキストで人種差別的言語を識別し分類する現在の手法は、人種差別的言説の過度な形式にのみ焦点をあてる小さなnの質的アプローチや大規模nのアプローチに依存している。
本稿では、大規模コーパスにおける異なる形態の人種差別的言説を識別し分類するためのステップバイステップの一般化可能なガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:39:22 GMT)
Localized degenerate solutions to the massless Dirac and Weyl equations [0.0] 質量のないディラック方程式とワイル方程式の退化解のクラスを示す。
運動方向に沿って1つまたは複数の異なる位置で局在粒子を記述することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:26:28 GMT)
Legal Matters in Research Software: A Few Things Worth Discussing [0.0] 本稿では,研究ソフトウェアの開発に関連する法的側面と,それを扱うための研究ソフトウェア技術者による実践的アプローチについて論じる。
この議論は、研究ソフトウェアの著作権保持者の識別における曖昧性、責任をめぐる不確実性について論じ、研究機関が提供する法的事項に対する様々な支持レベルについて言及する。
このコントリビューションの目的は、ソフトウェア開発に関する法的な事項をよりよく理解することが、研究ソフトウェアに科学的進歩の原動力として価値のある適切な価値を与えるための資産である、と指摘することである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:56:16 GMT)
KIRETT - A wearable device to support rescue operations using artificial intelligence to improve first aid [0.0] KIRETTプロジェクトは、ウェアラブルデバイスを使用した救助活動における最初の支援を改善することを目的としている。
このウェアラブルは、人工知能を用いてコンピュータ支援された状況認識に使用される。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:36:14 GMT)
Investigation Of The Distinguishability Of Giraud-Verneuil Atomic Blocks [0.0] 我々は、NIST EC P-256曲線上で、右から左へのkPアルゴリズムを用いて、kP に対する Giraud と Verneuil の原子パターンを解析した。
我々は、Lecroy WavePro 604HD Oscilloscope、Langer ICS 105 Integrated Circuit Scanner、Langer MFA-R 0.2-75 Near Field Probeを用いて、kP中の電磁放射を測定する。
結果として、アトミックパターンはダミー操作で正しく実装されているものの、SCAに対する抵抗は、ハードウェアやソフトウェアレベルで挿入された追加プロセスによっても影響を受けます。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:20:16 GMT)
Intelligent 5S Audit: Application of Artificial Intelligence for Continuous Improvement in the Automotive Industry [0.0] 本研究は,大規模言語モデル(LLM)に基づく自動5S監査システムを開発した。
インテリジェントな画像解析によって5つの感覚を標準化された方法で評価することができる。
提案手法は自動車製造環境の継続的な改善に大きく貢献する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:28:14 GMT)
Information geometry and entanglement under phase-space deformation through nonsymplectic congruence transformation [0.0] 量子状態の幾何学はFisher-Rao (FR) 情報行列を通して考えることができる。
本研究では,このアイソメトリーが二部体系の絡み合いに与える影響について検討する。
合同変換の単純な選択でさえも、2部ガウス系における絡み合いを誘導することが判明した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:47:16 GMT)
Information Loss and Cost in Symmetry Breaking [0.0] 2つの空間次元における対称性の破れを特徴付ける情報理論の枠組みを開発する。
この観点は自然に、トポロジカルな物質の相における任意の凝縮の記述と結びついている。
我々の結果は、一般化対称性の研究において、作用素代数、テンソル圏論、および量子情報の間の新たな接続を創出する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:34:31 GMT)
Hybrid Approach for Enhancing Lesion Segmentation in Fundus Images [0.0] 脈絡膜壊死は良性色素性眼の病変であり、メラノーマに転移するリスクは少ない。
早期発見は生存率を改善するために重要であるが、誤診や診断の遅れは予後不良につながる可能性がある。
本稿では,数理/クラスタリングセグメンテーションモデルとU-Netの知見を組み合わせた新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 22:10:56 GMT)
How Hungry is AI? Benchmarking Energy, Water, and Carbon Footprint of LLM Inference [0.0] 本稿では,商用データセンタにデプロイされる30の最先端モデルを対象とした,AI推論の環境フットプリントを定量化する,新たなインフラストラクチャ対応ベンチマークフレームワークを提案する。
以上の結果から,O3とDeepSeek-R1が最もエネルギー集約的なモデルとして出現し,GPT-4.1ナノの70倍以上のGPT-4.1ナノを消費し,Claude-3.7 Sonnetはエコ効率で最高であることがわかった。
AIは安価で速くなっているが、そのグローバルな採用はリソース消費を不均等にしている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:45:18 GMT)
Hound: Relation-First Knowledge Graphs for Complex-System Reasoning in Security Audits [0.0] Houndは、複雑なコンポーネント間のシステムレベルの推論を改善するリレーショナルファーストグラフエンジンである。
2つめのコントリビューションは、永続的な信念システムである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 02:46:02 GMT)
Hierarchy of timescales in a disordered spin-$1/2$ XX ladder [0.0] 我々は、その拡散力学で知られている実験的に実現可能なモデルである、歪んだスピン-1/2$ XXはしごについて検討する。
他の非可積分モデルとは異なり、スピン拡散はエネルギー拡散よりも速く進行する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:18:23 GMT)
Hierarchical Task Environments as the Next Frontier for Embodied World Models in Robot Soccer [0.0] 本稿では, 環境の忠実度やサイズを増大させるだけでなく, 構造的複雑さを明示的な階層的足場に拡張する。
明示的で構成可能なタスク層を持つ環境を構築することで、エージェント探索をより効率的に導き、有意義な学習信号を生成し、究極的には、純粋にエンドツーエンドアプローチよりも少ないリソースで、より有能で汎用的なエージェントを訓練することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:38:05 GMT)
Heisenberg Scaling in a Continuous-Wave Interferometer [0.0] 連続波干渉計(Continuous-wave Interferometry, CW)は、その誕生以来、精密測定科学の最前線に立っている。
We demonstrate the first CW interferometer exhibiting resources efficiency approaching Heisenberg scaling。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:34:57 GMT)
Fundamental speed limits on entanglement dynamics of bipartite quantum systems [0.0] エンタングルメントの相対エントロピーとトレース距離エンタングルメントを用いて,エンタングルメントの速度制限を導出する。
任意の量子力学により一定量の絡み合いを発生または分解するのに要する時間で、より低い境界を求める。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 23:33:44 GMT)
From Sound to Setting: AI-Based Equalizer Parameter Prediction for Piano Tone Replication [0.0] 本研究は,音声機能から直接EQパラメータ設定を予測することに焦点を当てた,音楽制作におけるトーン再現のためのAIベースのシステムを提案する。
従来のオーディオ・オーディオ法とは異なり、我々の手法は、ミュージシャンがワークフローでさらに調整できる解釈可能なパラメータ値を出力する。
このシステムは、音楽プロデューサーのための実用的で柔軟で自動化されたトーンマッチングを可能にし、より複雑なオーディオ効果への拡張の基礎を築き上げている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:50:28 GMT)
Feature Space Analysis by Guided Diffusion Model [0.0] Deep Neural Networks(DNN)の重要な問題のひとつは、内部的特徴抽出プロセスのブラックボックスの性質にある。
本稿では,ユーザが指定した特徴と密に一致した特徴を保証した画像を生成するデコーダを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:47:25 GMT)
Fast Real-Time Pipeline for Robust Arm Gesture Recognition [0.0] 本稿では,OpenPoseキーポイント推定に基づく動的アームジェスチャー認識のためのリアルタイムパイプラインを提案する。
カスタムな交通制御ジェスチャーデータセットの実験は、様々な視角と速度で高い精度を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:57:56 GMT)
Experimental demonstration of boson sampling as a hardware accelerator for monte carlo integration [0.0] 本稿では,モンテカルロ統合のためのハードウェアアクセラレータとしてボソンサンプリング実験を行った。
我々は,3ボソン系の一階エネルギー補正を計算するために,プログラマブルフォトニックプラットフォーム上でのプリンシプル実験を実装した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:59:34 GMT)
Experience Deploying Containerized GenAI Services at an HPC Center [0.0] Generative Artificial Intelligence(GenAI)アプリケーションは、推論サーバ、オブジェクトストレージ、ベクトルおよびグラフデータベース、ユーザインターフェースなど、特殊なコンポーネントで構成されている。
コンテナ化されたGenAIワークロードを実行するHPCとプラットフォームを統合した収束コンピューティングアーキテクチャについて説明する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 01:14:19 GMT)
Evaluation of Machine and Deep Learning Techniques for Cyclone Trajectory Regression and Status Classification by Time Series Data [0.0] 従来の数値天気予報モデルは、計算集約的であり、大気系のカオス的な性質のためにエラーを起こしやすい。
本研究では,全国ハリケーンセンターの時系列データを用いて,熱帯性サイクロン軌道の予測と状況に対する機械学習(ML)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:51:07 GMT)
Evaluating undergraduate mathematics examinations in the era of generative AI: a curriculum-level case study [0.0] 我々はRussell Group大学の8つの学部数学試験に、GenAIを作成した。
GenAIの到達度は1級のレベルですが、現在のパフォーマンスはモジュールによって異なります。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:08:08 GMT)
Error detection without post-selection in adaptive quantum circuits [0.0] オープン量子システムのシミュレーションがエラー検出の恩恵を受けるかを示す。
我々はQuantinuumのH2量子コンピュータを用いて非平衡相転移の論理シミュレーションを行う。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:00:03 GMT)
Enhancing work-extraction in quantum batteries via correlated reservoirs [0.0] 局所的および空間的に相関した貯水池は、量子電池の作業抽出に影響を及ぼす。
量子電池の性能向上を支える重要なリソースとしてのコヒーレンス。
さらに、電池の力学が長距離相互作用を持つ実効ハミルトニアンによって支配されるとき、短距離相互作用よりも高いエルゴトロピーが得られることを明らかにした。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:39:49 GMT)
Energy additivity as a requirement for universal quantum thermodynamical frameworks [0.0] 内部エネルギーは、宇宙の閉系エネルギーとの整合性を維持するために環境を考慮に入れなければならない。
内部エネルギーは加法的でも保守的でもないことが示され、非物理的特徴に繋がる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:49:22 GMT)
Enabling Physical AI through Biological Principles [0.0] 人工システムの能力を多様化するためには、さらなる生物学的インスピレーションが必要であると我々は主張する。
我々は、AIハードウェアとソフトウェアを活用できるNIにインスパイアされたメカニズムの分野を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:38:06 GMT)
Empirical Analysis Of Heuristic and Approximation Algorithms for the The Mutual-Visibility Problem [0.0] 本稿では,3つの異なるアルゴリズム – 直接ランダムな振る舞い,ハイパーグラフに基づく近似,遺伝的アルゴリズム – を実装し,評価する。
以上の結果から,より小さなグラフに対して,アルゴリズムは理論的境界に整合したMV集合のサイズを一貫して達成することを示した。
既知の最適グラフの検証では、遺伝的アルゴリズムと他のアルゴリズムが試験方法の中で最高の性能を示した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:41:24 GMT)
Eigenstate thermalization to non-monotonic distributions in strongly-interacting chaotic lattice gases [0.0] 非単調平衡エネルギー分布はフェルミ・ディラックやボース・アインシュタイン形式と質的に異なる。
この効果は有限エネルギースペクトルを持つ系で現れ、正および負の温度の両方を支えている。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:47:42 GMT)
Effectiveness of Large Language Models in Simulating Regional Psychological Structures: An Empirical Examination of Personality and Subjective Well-being [0.0] 本研究では, LLMが人口統計情報に基づいて, 文化的根拠を持つ心理的パターンをシミュレートできるかどうかを検討する。
模擬参加者は、外転や開放性が低下し、同意性や神経症が向上し、常に幸福度が低下した。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:12:18 GMT)
Effective 2D Envelope Function Theory for Silicon Quantum Dots [0.0] 本稿では、シリコン中の量子ドットの3次元(3次元)記述を、電子スピン量子ビットに対する効果的な2次元(2次元)エンベロープ関数理論に還元する厳密な方法を提案する。
本手法の精度を3次元シミュレーションとの比較により検証し,本手法の2次元スライシングよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 13:13:30 GMT)
EOE: Evolutionary Optimization of Experts for Training Language Models [0.0] 本稿では,大規模言語モデル(LLM)の学習のための進化的枠組みを提案する。
実験では、最高の専門家がフルモデルとほぼ同じ精度で達成できることが示されている。
各ステップでトレーニングされる専門家は1人なので、トレーニングはメモリをはるかに少なくし、スループットもはるかに高くなります。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:18:26 GMT)
Double Descent as a Lens for Sample Efficiency in Autoregressive vs. Discrete Diffusion Models [0.0] 本研究では, 離散拡散モデルと自己回帰モデルのサンプル効率を比例的に比較するために, 二重降下現象を用いる。
この結果から, 離散拡散モデルでは十分な容量と計算能力が与えられた場合にのみ, 自己回帰モデルの方がサンプル効率が高いことが示唆された。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:03:12 GMT)
Distillation of multipartite entangled states for arbitrary subsets of parties in noisy quantum networks of increasing size [0.0] 量子ネットワーク状態(quantum network state)は、パーティ間でペアの絡み合いを分散することによって構築される多部状態である。
本研究では,雑音量子ネットワークにおける部分蒸留可能性の問題を紹介する。
ネットワーク内の接続性を測定するグラフ理論パラメータが,そのサイズで十分に高速に成長すれば,部分蒸留が実現可能であることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:44:40 GMT)
DeepFake Detection in Dyadic Video Calls using Point of Gaze Tracking [0.0] 悪意ある俳優は、ビデオ会議中にリアルタイムフィッシング攻撃を行うためにディープフェイク技術を使い始めた。
本稿では,これまで利用できなかった生体情報を利用して,このジャンルの攻撃に適応したリアルタイムディープフェイク検出手法を提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:59:31 GMT)
Deep Reinforcement Learning in Action: Real-Time Control of Vortex-Induced Vibrations [0.0] 本研究では,回転アクチュエータを用いた高レイノルズ数(Re = 3000)の円柱内渦誘起振動(VIV)のアクティブフロー制御(AFC)のための深部強化学習(DRL)の実験的展開を示す。
実世界の実験におけるDRLの適応性と,アクチュエーションラグなどの機器的限界を克服する能力を示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 10:09:16 GMT)
DINOReg: Strong Point Cloud Registration with Vision Foundation Model [0.0] ポイントクラウドの登録は、3Dコンピュータビジョンにおける基本的なタスクである。
近年の研究では、RGB-Dデータから色情報を特徴抽出に取り入れている。
視覚情報と幾何学情報の両方を十分に活用する登録ネットワークであるDINORegを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 07:15:47 GMT)
Crowdsourcing Without People: Modelling Clustering Algorithms as Experts [0.0] mixsembleは、複数のモデルベースのクラスタリングアルゴリズムから予測を集約するために、Dawid-Skeneモデルを適用するアンサンブル手法である。
人間のラベルに依存する従来のクラウドソーシングとは異なり、このフレームワークはクラスタリングアルゴリズムの出力をノイズの多いアノテーションとしてモデル化する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:52:37 GMT)
Convolutional Neural Nets vs Vision Transformers: A SpaceNet Case Study with Balanced vs Imbalanced Regimes [0.0] 本研究では,SpaceNet上の畳み込みニューラルネットワーク (EfficientNet-B0) とビジョントランスフォーマー (ViT-Base) を比較した。
精度、マクロF1、バランスの取れた精度、クラスごとのリコール、デプロイメントメトリクスを報告します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 21:41:22 GMT)
Complexity of Einstein-Maxwell-non-minimal coupling $R^2F^2$: the role of the penalty factor [0.0] 我々は、AdS時空において、非最小結合の第1次まで摂動性ブラックブレーン解を導入する。
このモデルは温度に比例した比抵抗を示すため、奇妙な金属を記述することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:58:08 GMT)
Communicating Plans, Not Percepts: Scalable Multi-Agent Coordination with Embodied World Models [0.0] MARL(Multi-Agent Reinforcement Learning)の中心的な疑問は、通信プロトコルを設計するか、エンドツーエンドで学習するかである。
本稿では,協調的なタスク割り当て問題に対する2つのコミュニケーション戦略を提案し,比較する。
我々の実験によると、創発的コミュニケーションは単純な設定で実現可能であるが、設計された世界モデルベースのアプローチは、複雑さが増大するにつれて、優れたパフォーマンス、サンプル効率、スケーラビリティを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:36:28 GMT)
Coherence-Assisted Entanglement Activation During Open Evolution [0.0] そこで本研究では,システム環境の絡み合いの生成について,純粋に強調された相互作用として知られる,広範かつ重要な相互作用のクラスで検討する。
我々の結果は、オープン進化の間に生じる複雑な相関関係をよりよく理解し、定量化するのに役立ちます。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:52:51 GMT)
Co-Evolving Complexity: An Adversarial Framework for Automatic MARL Curricula [0.0] 汎用知的エージェントは、それらが訓練される環境に本質的に関連している。
手作りの環境は有限であり、しばしば暗黙のバイアスを含むため、エージェントが真に一般化可能で堅牢なスキルを開発する可能性を制限する。
本稿では,環境生成過程を対戦ゲームとしてフレーミングすることで,無拘束かつ適応的な課題のカリキュラムを生成するパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 15:41:53 GMT)
Chaos in a Nonlinear Wavefunction Model: An Alternative to Born's Probability Hypothesis [0.0] この基準を解析的に検討し, 小型(3キュービット)モデルからシミュレートする。
私はまた、不安定性の基準を連続体内のモデルに拡張します。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 19:47:54 GMT)
Bridging Ethical Principles and Algorithmic Methods: An Alternative Approach for Assessing Trustworthiness in AI Systems [0.0] 本稿では,Trustworthy AIの倫理的要素とPageRankとTrustRankのアルゴリズム的プロセスを組み合わせた評価手法を提案する。
目標は、フィールドで広く普及する自己評価技術に固有の主観性を最小化するアセスメントフレームワークを確立することである。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:32:21 GMT)
Biomechanical-phase based Temporal Segmentation in Sports Videos: a Demonstration on Javelin-Throw [0.0] 伝統的なスポーツ分析技術は手動のアノテーションや実験室に基づく計測に依存している。
このような文脈的に認識された時間的セグメンテーションのための新しい教師なしフレームワークを提案する。
提案手法は,テストデータの平均精度(mAP)が71.02%,F1スコアが74.61%であり,競合するベースラインよりもかなり高い。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:11:46 GMT)
Beyond the Hook: Predicting Billboard Hot 100 Chart Inclusion with Machine Learning from Streaming, Audio Signals, and Perceptual Features [0.0] 本研究は,Billboard Hot 100 チャートにトラックを組み込む際の最も強い予測的影響を決定要因が持つかを検討した。
この分析によると、人気はBillboard Hot 100のインクルードで最も決定的な予測だった。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 14:41:09 GMT)
Automated Discovery of Gadgets in Quantum Circuits for Efficient Reinforcement Learning [0.0] 我々は,新しいガジェットや関連ガジェットのファミリーの自動発見アルゴリズムを提案する。
このアルゴリズムは、有向グラフとしての量子回路の表現と、繰り返される部分グラフの自動探索に基づいている。
新たに発見された家族から採取した4ビットガジェットの性能を比較し,その利点と欠点について考察する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:13:25 GMT)
AuON: A Linear-time Alternative to Semi-Orthogonal Momentum Updates [0.0] 運動量に基づく更新の半直交特性について検討し、スペクトルノルム信頼領域下での運動量更新を束縛する方法を開発した。
半直交行列を構成することなく強い性能を達成する線形時間であるAuON(正規化非線形スケーリングによる代替単位ノルム運動量更新)を提案する。
提案手法は, 双極子-コサインRMSスケーリング変換と正規化を組み合わせることで, ニュートン-シュルツ法と比較して, 有効性と計算効率の両立を実証する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 06:03:53 GMT)
Aspects of holographic entanglement using physics-informed-neural-networks [0.0] 我々は、ホログラフィックエンタングルメントエントロピーとエンタングルメントウェッジ断面積を計算するために、物理インフォームドニューラルネット(PINN)を実装した。
この手法により、任意のAdS計量における部分領域の任意の形状に対してこれらの量を計算することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:00:00 GMT)
Analysis of Bias in Deep Learning Facial Beauty Regressors [0.0] バイアスは、一見バランスのとれたソースからでもAIシステムに導入することができる。
この研究は、美的規範を形成する上でAIが果たす役割について警告を鳴らしている。
均等な美容技術への潜在的な道筋を提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:16:24 GMT)
An asymptotic field approach for the control of dipole emission in integrated structures [0.0] 電磁界の量子化をイン/アウトモードの観点から利用することにより、集積フォトニック構造における自然放出をモデル化する枠組みを提案する。
このアプローチにより、導波路やリング共振器における双極子放射に関するよく知られた結果を回復できることを示す。
アプリケーションとして、出力モードと出力モードの両方をフルに制御できる、調整可能な統合単一光子源を設計する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 12:44:58 GMT)
An Agent-Based Framework for Automated Higher-Voice Harmony Generation [0.0] 本フレームワークは,入力された楽譜を解析,標準化するための音楽摂取エージェントと,コードフォーマー(トランスフォーマーモデル)を用いたコード知識エージェントと,複雑なコード記号の構成音を解釈し,提供するハーモニー生成エージェントと,メロジカルかつリズミカルに相補的な調和ラインを構成するハーモニー生成エージェントとからなる。
特定のタスクを専門のエージェントに委譲することで、人間のミュージシャンの協調プロセスを効果的に模倣する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:42:42 GMT)
Almost Sure Convergence for the Last Iterate of Stochastic Gradient Descent Schemes [0.0] 定数運動量パラメータ $beta in (0, 1)$ が $F(w_t) - F_* = O(tmax(p-1)-2p+1p-1na)$ の収束率を得ることを示す。
また、定数運動量パラメータ $beta in (0, 1)$ の S が$F(w_t) - F_* = O(tmax(p-2p-1)-1na)$ の収束率を得ることを示す。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:40:21 GMT)
All three-angle variants of Tsirelson's precession protocol, and improved bounds for wedge integrals of Wigner functions [0.0] ツィレルソンのプレセッションプロトコルは、離散変数系と連続変数系の両方に対して定義できる非古典的な証人である。
この研究は、ティレルソンの元々のプロトコルの範囲を広げ、多くの他の状態の非古典性や絡み合いを検出することができる。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:20:22 GMT)
Algorithms and data structures for automatic precision estimation of neural networks [0.0] 浮動小数点演算の精度自動推定によりニューラルネットワークライブラリを拡張した。
本稿では,ニューラルネットワークのトレーニングと推論の精度を正確に評価し,高い計算性能を維持するための条件について議論する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 11:13:29 GMT)
Addressing Methodological Uncertainty in MCDM with a Systematic Pipeline Approach to Data Transformation Sensitivity Analysis [0.0] 現在の実践は、体系的な堅牢性評価を伴わないメソッドのアドホック選択によって特徴づけられる。
本稿では,スケーリング変換空間の自動探索を通じて,この手法の不確実性に対処する枠組みを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 16:21:30 GMT)
ActorDB: A Unified Database Model Integrating Single-Writer Actors, Incremental View Maintenance, and Zero-Trust Messaging [0.0] ActorDBは、書き込み、インクリメンタルビューメンテナンス(IVM)のためのシングルライターアクタモデルと、コアコンポーネントとしてのゼロトラストセキュリティモデルを密に統合した、新しいデータベースアーキテクチャである。
ActorDBはアクターの永続性、ストリーム処理、セキュリティのための個別のシステムを手動で統合する必要があるソリューションと比較して、より堅牢でセキュアで開発者フレンドリなプラットフォームを提供することができる、と私たちは主張する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:51:01 GMT)
ARS: Adaptive Reasoning Suppression for Efficient Large Reasoning Language Models [0.0] 推論抑制(Reasoning Suppression、ARS)は、冗長な推論ステップを動的に抑制する訓練のないアプローチである。
ARSは53%、46.1%、57.9%のトークン、レイテンシ、エネルギー削減を実現し、精度を維持または改善している。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:19:41 GMT)
A signal separation view of classification [0.0] 理論的には,最小限のラベル数を用いたクラス数と完全分類の両方が得られる。
サリナスとインディアンパインズのハイパースペクトルデータセットや文書データセットなど、シミュレーションされた実生活のデータセットについて、我々の理論を解説する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 00:28:55 GMT)
A Novel Preprocessing Unit for Effective Deep Learning based Classification and Grading of Diabetic Retinopathy [0.0] 本研究は,糖尿病網膜症を早期に検出するための枠組みである。
フレームワークには前処理、セグメンテーション、特徴抽出、分類の3段階が含まれている。
提案手法の有効性は,IDRiDとMESSIDORの2つの異なるデータセットを用いて評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 09:11:04 GMT)
A Method for Quantifying Human Risk and a Blueprint for LLM Integration [0.0] サイバーセキュリティ心理学フレームワーク(Cybersecurity Psychology Framework、CPF)は、セキュリティオペレーションにおける人間中心の脆弱性を定量化する新しい方法論である。
CPFは、心理的脆弱性の全範囲にわたってエンドツーエンドのオペレーティングを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 20:31:27 GMT)
A Hybrid CAPTCHA Combining Generative AI with Keystroke Dynamics for Enhanced Bot Detection [0.0] 本稿では,Large Language Models (LLMs) がもたらす認知課題とキーストローク力学の行動バイオメトリックス解析を相乗化するハイブリッドCAPTCHAシステムを提案する。
提案手法は,ロボット入力と人間のパターンを区別するために,ユーザのタイピングリズムを解析しながら,人間にとって自明だが自動エージェントには自明な動的予測不可能な質問を生成する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:56:13 GMT)
A Fuzzy Logic-Based Framework for Explainable Machine Learning in Big Data Analytics [0.0] 本稿では,2型ファジィ集合,粒度計算,クラスタリングを組み合わせて,ビッグデータ環境における説明可能性と公平性を高める新しいフレームワークを提案する。
UCI Air Qualityデータセットに適用した場合、このフレームワークはノイズの多いセンサデータの不確実性を効果的に管理し、言語規則を作成し、シルエットスコアとエントロピーを用いて公平さを評価する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 18:02:31 GMT)
A Data-Centric Perspective on the Influence of Image Data Quality in Machine Learning Models [0.0] 本研究では,画像データセットの品質を体系的に評価する手法について検討する。
一般的な品質問題を特定し、トレーニングへの影響を定量化します。
コミュニティが開発したツールであるCleanVisionとFastdupを統合したパイプラインを開発しています。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 08:09:21 GMT)
A Biophysical-Model-Informed Source Separation Framework For EMG Decomposition [0.0] 表面筋電図(sEMG)からの運動単位分解は、ニューラルドライブ情報を抽出する鍵となる技術である。
本稿では,解剖学的に高精度な前方EMGモデルを分解プロセスに統合する,新しいバイオ物理モデルインフォームドソース分離(BMISS)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 17:53:52 GMT)
A Biologically Interpretable Cognitive Architecture for Online Structuring of Episodic Memories into Cognitive Maps [0.0] 本稿では,認識地図にエピソード記憶を構造化するための新しい認知アーキテクチャを提案する。
我々のモデルは、継承機能フレームワークとエピソード記憶を統合し、インクリメンタルなオンライン学習を可能にします。
この研究は計算神経科学とAIを橋渡しし、人工適応剤の認知地図形成に生物学的に基礎を置いたアプローチを提供する。
論文参考訳(メタデータ) (Mon, 29 Sep 2025 04:07:38 GMT)