Human-MME: A Holistic Evaluation Benchmark for Human-Centric Multimodal Large Language Models [118.4] MLLM(Multimodal Large Language Models)は視覚的理解タスクにおいて大きな進歩を見せている。
Human-MMEは、人間中心のシーン理解におけるMLLMのより総合的な評価を提供するために設計された、キュレートされたベンチマークである。
我々のベンチマークは、単一対象の理解を多対多の相互理解に拡張する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:18:47 GMT)
Image Quality Assessment for Embodied AI [103.7] Embodied AIは近年急速に発展しているが、現在も主に実験室に配備されている。
具体的タスク、すなわちロボットの知覚品質における画像のユーザビリティを評価するためのIQA手法は存在しない。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:39:20 GMT)
VideoLucy: Deep Memory Backtracking for Long Video Understanding [102.4] 我々は、長いビデオ理解のためのディープメモリバックトラックフレームワークであるVideoLucyを提案する。
粗いものから細かいものへの人間の再コンパイルプロセスにインスパイアされたVideoLucyは、階層的なメモリ構造で、段階的に粒度が細かい。
VideoLucyは、複数の長いビデオ理解ベンチマークで最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:59:19 GMT)
Omni-Captioner: Data Pipeline, Models, and Benchmark for Omni Detailed Perception [97.3] 我々は、データパイプライン、モデル、ベンチマークの観点から、Omniの詳細な認識を体系的で包括的に調査する。
ツールコールを統合したエージェントデータ生成パイプラインであるOmni-Detectiveを提案する。
Omni-Detectiveで生成されたデータに基づいて、2つのキャプションモデル:音声のみの詳細な知覚のためのオーディオ・キャプション・キャプション・モデルと、音声視覚による詳細な知覚のためのOmni-Captionerを訓練する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:00:09 GMT)
REACT3D: Recovering Articulations for Interactive Physical 3D Scenes [96.3] REACT3Dは静的な3Dシーンを一貫した幾何学を持つシミュレーション可能なインタラクティブなレプリカに変換するフレームワークである。
室内の様々な場面における検出・分離・調音計測における最先端性能について検討した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:16:39 GMT)
AI Agents as Universal Task Solvers [94.5] 我々は,過去のデータを用いて,普遍的な解法が達成できる最適なスピードアップが,アルゴリズム情報と密接な関係があることを示す。
我々は、推論モデルをスケールする際に最適化する重要な量は時間であり、学習における重要な役割は、これまでは間接的にのみ考慮されてきたと論じている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:17:54 GMT)
Learning Adaptive and Temporally Causal Video Tokenization in a 1D Latent Space [94.1] AdapTokは、ビデオコンテンツに基づいて異なるフレームに対してフレキシブルにトークンを割り当てる適応的時間的因果的ビデオトークンライザである。
AdapTokは、異なるトークン予算の下で、再構築品質と生成パフォーマンスを継続的に改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:11:06 GMT)
A Survey of Vibe Coding with Large Language Models [93.9] 視覚符号化(Vibe Coding)は、開発者が成果観察を通じてAI生成の実装を検証する開発手法である。
変革の可能性にもかかわらず、この創発的パラダイムの有効性は未解明のままである。
この調査は、大規模な言語モデルによるVibe Codingの総合的かつ体系的なレビューを初めて提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:26:56 GMT)
Oyster-I: Beyond Refusal -- Constructive Safety Alignment for Responsible Language Models [93.6] コンストラクティブ・セーフティ・アライメント(CSA)は、悪意のある誤用を防ぎつつ、脆弱性のあるユーザを安全で有益な結果へと積極的に誘導する。
Oy1は、高度な汎用能力を保ちながら、オープンモデル間の最先端の安全性を達成する。
私たちは、責任あるユーザ中心AIをサポートするために、Oy1、コード、ベンチマークをリリースしています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:33:00 GMT)
Orthogonal Finetuning Made Scalable [92.3] OFT(Orthogonal Finetuning)は、壊滅的な忘れ込みを防止しつつ、パラメータ効率の高い適応を提供するが、実行時とメモリの要求が高いため、実際のデプロイメントが制限される。
ここでは,OFTの計算ボトルネックを重み中心の実装とみなす。
本稿では,行列ベクトル乗法(行列フリー計算)を用いて,計算コストを2次に削減する入力中心の変換法OFTv2を提案する。
これらの変更により、OFTv2は最大10倍の高速トレーニングと3倍のGPUメモリ使用率を達成することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:19:55 GMT)
HoneyBee: Data Recipes for Vision-Language Reasoners [90.8] いくつかのデータキュレーション手法を導入し、視覚言語モデル(VLM)への影響について検討する。
我々は、コンテキスト(イメージと質問ペア)ソースの効果を分析し、対象とするデータ介入を実装し、画像、質問、チェーン・オブ・思想(CoT)ソリューションのスケールアップを探る。
これらの知見に触発されたHoneyBeeは、大規模で高品質なCoT推論データセットであり、350万のイメージ検索ペアからなる2.5万のサンプルがある。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:23:44 GMT)
Disentangling Neurodegeneration with Brain Age Gap Prediction Models: A Graph Signal Processing Perspective [90.0] 脳年齢ギャップ予測(BAGP)モデルは、データから予測される脳年齢と時系列年齢との差を推定する。
本稿では、BAGPの概要と、グラフ信号処理(GSP)の最近の進歩に基づく、このアプリケーションのための原則化されたフレームワークを紹介する。
VNNは強力な理論的基盤と操作的解釈可能性を提供し、脳年齢差予測の堅牢な推定を可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:44:45 GMT)
Understanding the Mixture-of-Experts with Nadaraya-Watson Kernel [87.6] Mixture-of-Experts (MoE)は最近の最先端の大規模言語モデル(LLM)の基盤となっている。
伝統的に、MoEはエキスパート出力を集約するためにルータスコア関数として$mathrmSoftmax$に依存している。
mathrmSoftmax$の代替として,textbfzero-additional-cost Kernel Router with Normalization (KERN)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:04:14 GMT)
Think Natively: Unlocking Multilingual Reasoning with Consistency-Enhanced Reinforcement Learning [85.7] 本稿では,言語一貫性報酬と言語間思考アライメント報酬によって訓練されたM-Thinkerを提案する。
M-Thinkerは2つのマルチ言語ベンチマークで100%近い言語一貫性と優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:32:05 GMT)
Lost at the Beginning of Reasoning [85.2] 第1の推論ステップが最終予測に不当に大きな影響を与えることを示す。
本稿では、報酬モデルを利用して高品質な第1推論ステップを特定し、維持する効率的なサンプリング戦略を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:32:12 GMT)
MetaCaptioner: Towards Generalist Visual Captioning with Open-source Suites [84.4] 一般的なビジュアルキャプションは、一連のビジュアルキューをキャプションに統合し、様々なビジュアルドメインを扱う必要がある。
本稿では,新しいマルチエージェントコラボレーションワークフローであるCapFlowを提案する。
オープンソースモデルを利用することで、様々なドメインでGPT-4.1と同等のキャプション品質を89.5%のコストで達成することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:03:25 GMT)
Epistemic-aware Vision-Language Foundation Model for Fetal Ultrasound Interpretation [83.0] 医療用AIシステムFetalMindについて報告する。
本稿では、専門家による2部グラフをモデルに注入し、ビュー・ディスリーズ関連を分離するSED(Salient Epistemic Disentanglement)を提案する。
FetalMindはすべての妊娠期のオープンソースおよびクローズドソースベースラインを上回り、平均利得は+14%、臨界条件では+61.2%高い。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:57:03 GMT)
Malice in Agentland: Down the Rabbit Hole of Backdoors in the AI Supply Chain [83.0] 自分自身のインタラクションからのデータに対する微調整のAIエージェントは、AIサプライチェーン内の重要なセキュリティ脆弱性を導入している。
敵は容易にデータ収集パイプラインに毒を盛り、検出しにくいバックドアを埋め込むことができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:35:32 GMT)
FlexAC: Towards Flexible Control of Associative Reasoning in Multimodal Large Language Models [80.6] マルチモーダルな大規模言語モデル(MLLM)は、忠実さと創造性の間に固有のトレードオフに直面します。
既存の方法には、この推論強度を調節する柔軟性がない。
本稿では,連想推論を柔軟に制御する機構を備えたMLLMを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:01:01 GMT)
UNCAP: Uncertainty-Guided Planning Using Natural Language Communication for Cooperative Autonomous Vehicles [79.1] 不確実性誘導自然言語協調自律計画(UNCAP)は、視覚言語モデルに基づく計画手法である。
CAVは、意思決定における認識の不確実性を明示的に考慮しながら、軽量な自然言語メッセージを介して通信することができる。
多様な運転シナリオに対する実験では、通信帯域幅が63%減少し、運転安全スコアが31%増加し、決定の不確実性が61%減少し、衝突距離マージンが4倍増加した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:09:09 GMT)
One Life to Learn: Inferring Symbolic World Models for Stochastic Environments from Unguided Exploration [77.8] シンボリック・ワールド・モデリングは、実行可能プログラムとして環境の遷移力学を推論し、表現する必要がある。
OneLifeは、条件付きアクティベートされたプログラム法則を通じて世界ダイナミクスをモデル化するフレームワークである。
OneLifeは、最小限の、ガイドなしのインタラクションから、キー環境のダイナミクスをうまく学べる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:49:32 GMT)
Are Large Reasoning Models Interruptible? [77.5] LRM(Large Reasoning Models)は複雑な推論において優れているが、伝統的に静的な「凍った世界」設定で評価されている。
静的な設定で高い精度を達成できる最先端のLEMでさえ、割り込みやコンテキストの変化に晒された場合、予測不能に失敗する可能性があることを示す。
我々の分析ではさらに、漏れの原因、パニック、自己疑念など、いくつかの新しい障害モードを明らかにしている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:45:53 GMT)
SCAN: Self-Denoising Monte Carlo Annotation for Robust Process Reward Learning [76.6] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)におけるより深い推論プロセスを促進する
PRMは、人間の注釈付きデータの高いコストと限られたスケーラビリティのために開発が困難である。
本稿では,効率的なデータ合成と耐雑音性学習フレームワークであるSelf-Denoising Monte Carlo CAN (SCAN)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:57:11 GMT)
NinA: Normalizing Flows in Action. Training VLA Models with Normalizing Flows [75.7] 拡散モデルは、複雑なマルチモーダルな動作分布をモデル化できるため、アクションデコーダとして広く採用されている。
我々は、Vision-Language-Action(VLA)モデルのための拡散型デコーダの高速かつ表現性の高い代替品であるNinAを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:06:39 GMT)
SceneAdapt: Scene-aware Adaptation of Human Motion Diffusion [74.7] テキスト条件付モーションモデルにシーン認識を注入するフレームワークであるSceneAdaptを紹介する。
主要なアイデアは、2つの異なるデータセットをブリッジするプロキシタスクとして、テキストなしで学習可能なモーションインテリシングを使用することだ。
その結果,SceneAdaptはシーン認識をテキスト・トゥ・モーション・モデルに効果的に注入することがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:42:10 GMT)
DeepPlanner: Scaling Planning Capability for Deep Research Agents via Advantage Shaping [74.3] 我々は、ディープリサーチエージェントの計画能力を効果的に向上するエンドツーエンドのRLフレームワークであるDeepPlannerを提案する。
提案手法は,高エントロピートークンの大幅な更新を割り当てるエントロピーに基づく用語を用いてトークンレベルの優位性を形作るとともに,計画集約ロールアウトに対するサンプルレベルの優位性を選択的に向上させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:47:05 GMT)
ERA: Transforming VLMs into Embodied Agents via Embodied Prior Learning and Online Reinforcement Learning [73.4] 先行知識学習とオンライン強化学習を統合したフレームワークである TextitEmbodied Reasoning Agent (ERA) を提案する。
ERAはスケーラブルなエンボディドインテリジェンスへの実践的なパスを提供し、将来のエンボディドAIシステムに対する方法論的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:25:46 GMT)
AsynFusion: Towards Asynchronous Latent Consistency Models for Decoupled Whole-Body Audio-Driven Avatars [71.9] 全体オーディオ駆動型アバターポーズと表現生成は、生命に似たデジタル人間を作るための重要なタスクである。
本稿では,拡散変換器を応用し,結合表現とジェスチャ合成を実現する新しいフレームワークAsynFusionを提案する。
AsynFusionは、リアルタイムで同期された全身アニメーションを生成する際に最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:40:58 GMT)
ViCO: A Training Strategy towards Semantic Aware Dynamic High-Resolution [71.7] 既存のMLLM(Multimodal Large Language Models)は、画像入力によって導入された視覚トークンの追加により、推論コストが増大する。
本研究では,異なる数の視覚トークンを用いて,様々な複雑度の画像を表現可能な,新しい学習アルゴリズムであるVisual Consistency Learning (ViCO)を提案する。
実験の結果,モデルの知覚,推論,OCR能力を維持しつつ,視覚トークンの数を最大50%削減できることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:58:10 GMT)
LLM-REVal: Can We Trust LLM Reviewers Yet? [70.6] 大規模言語モデル(LLM)は研究者に、学術的なワークフローに広く組み込むよう刺激を与えている。
本研究は、LLMのピアレビューと研究プロセスへの深い統合が学術的公正性にどのように影響するかに焦点を当てる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:30:20 GMT)
TTT3R: 3D Reconstruction as Test-Time Training [69.5] テストタイムトレーニングの観点から3次元再構築基盤モデルを再考する。
メモリ状態と受信した観測値のアライメントの信頼性を利用して、クローズドフォーム学習率を導出する。
この訓練のない介入はTTT3Rと呼ばれ、長さの一般化を大幅に改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:57:11 GMT)
Reasoning in the Dark: Interleaved Vision-Text Reasoning in Latent Space [66.8] マルチモーダル推論は、最終回答に到達する前に中間推論ステップを組み込むことでMLLMの能力を高めることを目的としている。
本稿では,視覚情報とテキスト情報の両方を潜在空間内の推論プロセスに注入するInterleaved Vision-Text Latent Reasoning (IVT-LR)を提案する。
M3CoTとScienceQAの実験により、我々のIVT-LR法は5.45%の精度で平均的な性能向上を実現し、同時に既存の手法に比べて5倍以上の速度向上を実現した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:58:25 GMT)
Learning to Grasp Anything by Playing with Random Toys [65.5] ロボットはランダムに組み立てられた物体を用いて、一般化可能な把握を学習できることを示す。
この一般化の鍵は、提案した検出プーリング機構によって誘導されるオブジェクト中心の視覚表現である。
この研究は、ロボット操作におけるスケーラブルで汎用的な学習への、有望な道のりを提供する、と私たちは信じています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:56:10 GMT)
FedLoDrop: Federated LoRA with Dropout for Generalized LLM Fine-tuning [65.3] 大規模言語モデル(LLM)は、特定のタスクに汎用モデルを適用するために不可欠である。
本稿では,FedLoDropを用いたFederated LoRAを提案する。FedLoDropは,Federated LoRAのトレーニング可能な行列の行と列にドロップアウトを適用する新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:40:45 GMT)
When Personalization Tricks Detectors: The Feature-Inversion Trap in Machine-Generated Text Detection [64.2] パーソナライズされた設定における検出ロバスト性を評価するための最初のベンチマークであるデータセットを紹介する。
実験により, 個別設定における検出器間の性能差が大きいことが示された。
パーソナライズされた設定における検出性能変化を簡易かつ信頼性の高い予測方法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:10:23 GMT)
Frame Context Packing and Drift Prevention in Next-Frame-Prediction Video Diffusion Models [64.0] ビデオ生成のための次フレーム(または次フレーム)予測モデルをトレーニングするためのニューラルネットワーク構造であるFramePackを提案する。
FramePackは入力フレームコンテキストをフレーム単位の重要度で圧縮し、より多くのフレームを固定されたコンテキスト長内にエンコードする。
既存のビデオ拡散モデルをFramePackで微調整できることを示し、異なるパッキングスケジュールの違いを分析する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:28:39 GMT)
DRL: Discriminative Representation Learning with Parallel Adapters for Class Incremental Learning [63.7] 本稿では,これらの課題に対処するための差別的表現学習(DRL)フレームワークを提案する。
逐次学習を効果的かつ効率的に行うために、DRLのネットワークはPTM上に構築される。
我々のDRLは、CIL時代を通して、他の最先端の手法よりも一貫して優れています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:19:15 GMT)
Enhancing Representations through Heterogeneous Self-Supervised Learning [63.5] 本稿では,HSSL(Heterogeneous Self-Supervised Learning)を提案する。
HSSLは、構造的変化を伴わない表現学習方式で、ベースモデルに新しい特徴を付与する。
HSSLは、様々な自己教師型メソッドと互換性があり、様々な下流タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:51:58 GMT)
KaLM-Embedding-V2: Superior Training Techniques and Data Inspire A Versatile Embedding Model [63.1] 本稿では, 汎用的でコンパクトな埋め込みモデルである KaLM-Embedding-V2 を提案する。
モデルアーキテクチャでは、0.5Bのコンパクトなサイズでモデルを実装し、固定長の埋め込みを生成する。
トレーニングデータでは, プレトレーニング用20種, 微調整用100種, コントラスト蒸留用100種をキュレートする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:50:35 GMT)
DeepMMSearch-R1: Empowering Multimodal LLMs in Multimodal Web Search [61.8] DeepMMSearch-R1は,オンデマンドでマルチターンWeb検索が可能な,最初のマルチモーダルな大規模言語モデルである。
DeepMMSearch-R1は、画像検索をより効果的にするために、入力画像の関連する作物に基づいてWeb検索を開始することができる。
我々は、アプローチの優位性を実証するために、知識集約型ベンチマークを幅広く実施する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:59:58 GMT)
Multi-Agent Autonomous Driving Systems with Large Language Models: A Survey of Recent Advances [61.5] 大規模言語モデル(LLM)は、ハイレベルな意思決定をサポートするために、自律運転システム(ADS)に統合されている。
LLMは、限られた認識、不十分な協調、高い計算要求の3つの大きな課題に直面している。
マルチエージェントADSの最近の進歩は、言語によるコミュニケーションとコーディネーションを活用して、エージェント間コラボレーションを強化している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:00:34 GMT)
FlashVSR: Towards Real-Time Diffusion-Based Streaming Video Super-Resolution [61.3] FlashVSRは、リアルタイムVSRに向けた最初の拡散ベースのワンステップストリーミングフレームワークである。
A100 GPUで768x1408ビデオの約17FPSで動作する。
超高解像度に確実にスケールし、従来の1ステップ拡散VSRモデルよりも最大12倍のスピードアップで最先端の性能を達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:25:54 GMT)
Reference-Specific Unlearning Metrics Can Hide the Truth: A Reality Check [60.8] 本研究では,非学習モデルと参照モデル間の分布類似度を測定する新しい尺度であるFADE(Functional Alignment for Distributional Equivalence)を提案する。
FADEは出力分布全体の機能的アライメントをキャプチャし、真の未学習の原則的評価を提供する。
これらの知見は、現在の評価実践における根本的なギャップを明らかにし、FADEが真に効果的な未学習手法を開発し評価するための、より堅牢な基盤を提供することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:50:30 GMT)
DeepDive: Advancing Deep Search Agents with Knowledge Graphs and Multi-Turn RL [60.5] 我々は、ディープサーチエージェントを進化させるためにDeepDiveを提示する。
オープンな知識グラフから複雑で難解な質問を自動的に合成する戦略を提案する。
深層探索によるLLMの長距離推論を強化するために, エンドツーエンドのマルチターン強化学習を適用した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:54:24 GMT)
SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer [60.2] 悲観的領域ランダム化によるSim-to-realの略称であるSPiDRを提案する。
SPiDRは、安全なsim-to-real転送を保証するスケーラブルなアルゴリズムである。
我々は,SPiDRが性能を維持しつつ,シミュレートとリアルのギャップを保ちながら,安全性を効果的に確保できることを実証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:34:29 GMT)
EmboMatrix: A Scalable Training-Ground for Embodied Decision-Making [60.2] 身体的意思決定は、エージェントが物理世界における継続的な相互作用を通じて、高レベルの目標を実行可能なアクションに変換することを可能にする。
大きな言語モデル(LLM)とその一般的な意思決定能力は、この可能性を実現するための有望な道を提供する。
本稿では,タスクとシーンシミュレーション,具体的インタラクション,フィードバック信号を提供する総合的な基盤であるトレーニング場の概念を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:26:52 GMT)
EduDial: Constructing a Large-scale Multi-turn Teacher-Student Dialogue Corpus [59.7] EduDialは総合的な多ターン教師/学生対話データセットである。
EduDialは345のコアナレッジポイントをカバーし、教師と学生エージェントの対話によって生成された34,250の対話セッションで構成されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:18:43 GMT)
Efficient Real-World Deblurring using Single Images: AIM 2025 Challenge Report [59.6] 本稿では,単体画像チャレンジを用いたAIM 2025高効率実世界のデブロアリングについてレビューする。
この課題は、よく知られたRSBlurデータセットに基づいた新しいテストセットに基づいている。
最高性能のアプローチは、PSNRの31.1298 dBを達成し、この領域における効率的な手法の可能性を示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:57:04 GMT)
Voronoi-Assisted Diffusion for Computing Unsigned Distance Fields from Unoriented Points [59.5] Voronoi-Assisted Diffusion (VAD) は、Unsigned Distance Fields (UDF) を計算するための軽量でネットワークフリーな方法である。
VADは水密面と開面を強く扱い、複雑な非多様体と非配向幾何学も扱う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:49:53 GMT)
Not in Sync: Unveiling Temporal Bias in Audio Chat Models [59.1] 大規模音声言語モデル(LALM)は、音声理解やマルチモーダル推論にますます応用されている。
LALMにおける時間バイアスに関する最初の体系的研究を行い,その時間スタンプ予測における重要な限界を明らかにした。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:29:40 GMT)
Quantum Circuit Synthesis and Compilation Optimization: Overview and Prospects [59.1] 本調査では,アルゴリズムレベルから量子ハードウェアにまたがる,統合設計および最適化スキームの実現可能性について検討する。
手動設計のコストを削減し、実行の精度と効率を高め、ハードウェア上での量子アルゴリズムの優位性の実装と検証を容易にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:11:59 GMT)
CryoFastAR: Fast Cryo-EM Ab Initio Reconstruction Made Easy [58.9] 我々はCryo-EMノイズ画像から直接ポーズを予測できる最初の幾何学的基礎モデルであるCryoFastARを紹介した。
CryoFastARは、マルチビュー機能と、大規模シミュレーションされたCryo-EMデータに現実的なノイズとCTF変調を統合することで、ポーズ推定精度と一般化を向上する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:10:49 GMT)
A Survey on Parallel Reasoning [58.7] まず、並列推論の形式的定義を示し、その区別をChain-of-Thoughtのような関連する概念と明確にする。
次に、非対話的推論、対話的推論、効率を重視した復号戦略を含む、新しい分類法に基づく高度な手法を編成し、議論する。
並列推論の中核的な課題を強調し,今後の研究の方向性を示唆する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:42:19 GMT)
Rethinking the Role of Dynamic Sparse Training for Scalable Deep Reinforcement Learning [58.5] ニューラルネットワークのスケーリングは機械学習における画期的な進歩をもたらしたが、このパラダイムは深層強化学習(DRL)では失敗している。
我々は、動的スパーストレーニング戦略が、アーキテクチャの改善によって確立された主要なスケーラビリティ基盤を補完するモジュール固有の利点を提供することを示す。
アーキテクチャ改善の利点を生かした実践的なフレームワークであるModule-Specific Training (MST) にこれらの知見を精査し、アルゴリズムの修正なしに様々なRLアルゴリズムをまたいだ大幅なスケーラビリティ向上を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:03:08 GMT)
A Comprehensive Taxonomy of Negation for NLP and Neural Retrievers [57.6] 我々は、哲学的、言語的、論理的定義から派生した否定の分類を導入した。
ニューラルネットワーク検索モデルの性能評価に使用できるベンチマークデータセットを2つ生成する。
本稿では,既存のデータセットの検索モデルの性能を解析するために,論理に基づく分類機構を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:20:07 GMT)
Diffusion Language Models Know the Answer Before Decoding [57.0] 拡散言語モデル (DLM) は自己回帰的アプローチの代替として登場した。
我々の研究は、DLMの早期回答収束の見過ごされた特性を強調し、活用する。
Prophetは、早期コミット復号を可能にするトレーニングフリーの高速復号化パラダイムである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:42:04 GMT)
SPEED: Scalable, Precise, and Efficient Concept Erasure for Diffusion Models [56.8] モデルパラメータを直接編集する効率的な概念消去手法であるSPEEDを導入する。
Speedyは、パラメータ更新がターゲット以外の概念に影響しないモデル編集スペースであるnullスペースを検索する。
たった5秒で100のコンセプトを消去しました。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:04:46 GMT)
IWR-Bench: Can LVLMs reconstruct interactive webpage from a user interaction video? [56.3] IWR-Benchは、ビデオからインタラクティブなWebページ再構築におけるLVLM(Large Vision-Language Models)の機能を評価するための新しいベンチマークである。
IWR-Benchは100の現実世界のウェブサイトから1,001のアクションで1,3の精巧にキュレートされたタスクで構成されている。
このベンチマークは、ビデオとアセットからインタラクションロジックを推論する包括的なマルチモーダル推論と、このロジックを関数コードに変換するための高度なコード生成という、2つの基本的な課題に関するモデルを評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:28:36 GMT)
Can Graph Descriptive Order Affect Solving Graph Problems with LLMs? [55.6] 大規模言語モデル(LLM)は、数学的推論や論理的推論を含む推論タスクにおいて大きな成功を収めた。
従来の研究は様々な手法を用いてLSMのグラフ推論能力について研究してきた。
重要な要素は、主に見過ごされ、グラフ記述がモデルに提示される即時順序である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:34:26 GMT)
Towards Inference-time Scaling for Continuous Space Reasoning [55.4] 推論時間スケーリングは、大規模言語モデルにおけるテキストベースの推論に有効であることが証明されている。
本稿では,そのような確立された手法が連続空間における推論にうまく適応できるかどうかを考察する。
本研究では,ドロップアウト型サンプリングによる多種多様な推論経路の実現可能性を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:53:41 GMT)
On the Role of Preference Variance in Preference Optimization [55.4] 直接選好最適化(DPO)トレーニングの有効性に対する選好分散(PVar)の影響について検討する。
PVarより高いプロンプトは、ランダムに選択されたプロンプトまたは低いPVarより優れたプロンプトを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:34:52 GMT)
Finding Dori: Memorization in Text-to-Image Diffusion Models Is Not Local [55.3] 近年の緩和努力は、動詞の学習データ複製を誘発する原因となる重みの特定と刈り取りに重点を置いている。
この仮定に疑問を呈し、たとえ刈り取られたとしても、以前軽減されたプロンプトのテキスト埋め込みに対する小さな摂動が、データ複製を再トリガーできることを実証する。
本研究は,テキスト・ツー・イメージDMにおける暗記の性質に関する新たな知見を提供し,DMの暗記に対するより信頼性の高い軽減策の開発を知らせるものである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:59:43 GMT)
Dr.LLM: Dynamic Layer Routing in LLMs [55.1] Dr.LLMは、事前訓練されたモデルに軽量な層ごとのルータを装備し、ブロックをスキップ、実行、繰り返すように決定する、適合性のあるフレームワークである。
ARC(logic)とDART(math)では、Dr.LLMは平均で5つのレイヤを保存しながら、最大3.4%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:51:26 GMT)
CAMERA: Multi-Matrix Joint Compression for MoE Models via Micro-Expert Redundancy Analysis [55.1] MoE(Mixture-of-Experts)を備えた大規模言語モデルは、計算と記憶のオーバーヘッドに悩まされる。
行列にまたがるより微細な圧縮ユニットとしてマイクロエキスパートを導入する。
マイクロエキスパートのための構造化プルーニングフレームワークであるCAMERA-Pと、マイクロエキスパート向けに設計された混合精度量子化アイデアであるCAMERA-Qを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:41:25 GMT)
The Price of a Second Thought: On the Evaluation of Reasoning Efficiency in Large Language Models [54.9] モデルが全体の効率を向上し,問題の難しさが効率に影響を及ぼすことを示す。
インストラクションモデルが簡単なアウトラインをドラフトし,思考モデルがそれを拡張する,シンプルな2段階パイプラインであるCOTHINKを提案する。
GSM8K、MATH500、AIME24では、COTHINKはトークンの使用量を21.1%削減し、4つの思考モデルの精度を維持し、強力な効率のベースラインと競争し続ける。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:02:25 GMT)
Mitigating the Noise Shift for Denoising Generative Models via Noise Awareness Guidance [54.9] ノイズアウェアネスガイダンス (NAG) は、事前に定義された騒音スケジュールと整合性を保つために、サンプリング軌道を明示的に制御する補正手法である。
NAGは一貫してノイズシフトを緩和し、主流拡散モデルの生成品質を大幅に改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:31:34 GMT)
AngularFuse: A Closer Look at Angle-based Perception for Spatial-Sensitive Multi-Modality Image Fusion [54.8] 本稿では,空間感性画像融合(AngularFuse)のための角度に基づく知覚フレームワークを提案する。
ラプラシアンエッジエンハンスメントと適応ヒストグラムを組み合わせることで、よりリッチなディテールとよりバランスの取れた明るさで参照画像を生成する。
MSRS、RoadScene、M3FDのパブリックデータセットの実験は、AngularFuseが既存の主流メソッドよりも明確なマージンで優れていることを示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:13:15 GMT)
Mamaba Can Learn Low-Dimensional Targets In-Context via Test-Time Feature Learning [54.0] Mambaは、強い経験的性能を持つ線形時間列モデルである。
単一インデックスモデル $y approx g_* (langle boldsymbolbeta, boldsymbolx rangle)$ の文脈内学習について検討する。
勾配に基づく手法で事前学習したMambaは,テスト時間特徴学習によって効率的なICLを実現することができることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:21:20 GMT)
G4Splat: Geometry-Guided Gaussian Splatting with Generative Prior [53.8] 我々は,3次元シーン再構成を効果的に活用するための基本的な前提条件として,正確な幾何学を同定する。
生成パイプライン全体にこの幾何学的ガイダンスを導入し、可視性マスク推定を改善し、新しいビュー選択をガイドし、ビデオ拡散モデルに着色した場合の多視点一貫性を向上させる。
本手法は,屋内および屋外の両方のシナリオにおいて,高い一般化性を有するシングルビュー入力とアンポーズ映像を自然にサポートする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:06:28 GMT)
PolySim: Bridging the Sim-to-Real Gap for Humanoid Control via Multi-Simulator Dynamics Randomization [53.7] 複数の異種シミュレータを統合するWBCトレーニングプラットフォームであるPolySimを紹介する。
理論的には、PolySimは単シミュレータトレーニングよりもシミュレータ誘導バイアスの強い上限が得られることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:23:19 GMT)
Ivan-ISTD: Rethinking Cross-domain Heteroscedastic Noise Perturbations in Infrared Small Target Detection [53.7] Ivan-ISTD は ISTD におけるクロスドメインシフトと異方性雑音摂動の2つの課題に対処するように設計されている。
Ivan-ISTDはクロスドメインシナリオにおいて優れた堅牢性を示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:48:31 GMT)
Macro-from-Micro Planning for High-Quality and Parallelized Autoregressive Long Video Generation [53.6] 現在の自己回帰拡散モデルは、ビデオ生成時に優れるが、一般的には短時間の時間に限られる。
長期ビデオ生成のためのマクロからマイクロプランニング(MMPL)を主眼としたプランニング・テーマ・ポピュレーション・フレームワークを提案する。
MMPLは、マイクロプランニングとマクロプランニングという2つの階層的なステージを通じて、ビデオ全体のグローバルなストーリーラインをスケッチします。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:48:09 GMT)
Efficient Perceptual Image Super Resolution: AIM 2025 Study and Benchmark [53.6] 我々は,厳密な効率制約を満たしつつ,Real-ESRGANの知覚結果を再現または改善することを目的としている。
提案手法は,500枚の4K解像度の試験画像からなる新しいデータセット上で評価され,それぞれが複数の劣化型を用いて劣化した。
最高パフォーマンスのアプローチは、すべてのベンチマークデータセットでReal-ESRGANを上回ります。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:45:22 GMT)
Dual Learning with Dynamic Knowledge Distillation and Soft Alignment for Partially Relevant Video Retrieval [53.5] 実際には、ビデオは通常、より複雑な背景コンテンツによって、長い時間で切り離される。
本稿では,大規模視覚言語事前学習モデルから一般化知識を抽出する新しい枠組みを提案する。
実験により,本モデルがTVR,ActivityNet,Charades-STAデータセット上での最先端性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:38:20 GMT)
Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models [53.3] 大きな言語モデル(dLLM)に強化学習を適用する上で重要な課題は、その可能性関数の抽出性である。
本稿では,ELBOに基づく目的の特別に構築された下界を最大化するメモリ効率のRLアルゴリズムを提案する。
実験によると、BGPOは数学の問題解決、コード生成、計画タスクにおいて、dLLMの以前のRLアルゴリズムよりも大幅に優れていた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:26:10 GMT)
DriveVLA-W0: World Models Amplify Data Scaling Law in Autonomous Driving [52.6] 将来の画像の予測に世界モデリングを利用するトレーニングパラダイムである textbfDriveVLA-W0 を提案する。
このタスクは、運転環境の基礎となる力学を学ぶためにモデルを補完する密集した自己教師信号を生成する。
NAVSIM v1/v2ベンチマークと680倍の社内データセットの実験は、DriveVLA-W0がBEVとVLAのベースラインを大きく上回っていることを示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:59:47 GMT)
HALF: Harm-Aware LLM Fairness Evaluation Aligned with Deployment [52.4] HALF(Harm-Aware LLM Fairness)は、現実的なアプリケーションにおけるモデルバイアスを評価し、有害度によって結果を評価するフレームワークである。
HALFは、以前のベンチマークの成功とデプロイメントの準備の整合性の間に明らかなギャップがあることを示します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:13:26 GMT)
Detect Anything via Next Point Prediction [51.6] Rex-Omniは最先端の物体認識性能を実現する3BスケールのMLLMである。
COCOやLVISのようなベンチマークでは、Rex-Omniは回帰ベースのモデルに匹敵するパフォーマンスを得る。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:59:54 GMT)
Scope: Selective Cross-modal Orchestration of Visual Perception Experts [51.3] SCOPEはMixture-of-Encodersフレームワークで、インスタンスレベルのルーティングを通じて画像テキストペアごとに1つの特別なエンコーダを動的に選択する。
軽量ルータは、テキストプロンプトと共有視覚特徴間の相互アテンションを使用して、ルーティングされたエンコーダから最適なエンコーダを選択する。
注目すべきは、共有された1つプラス1つのルーティングエンコーダを持つSCOPEは、4つの余分なエンコーダを同時に使用し、計算量を24-49%削減する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:33:01 GMT)
State Space Prompting via Gathering and Spreading Spatio-Temporal Information for Video Understanding [50.9] 本稿では,映像理解のためのステートスペース・プロンプティング(SSP)手法を提案する。
SSPはフレーム内のプロンプトを組み合わせて、ビデオ内の重要な時間情報を集約し、伝達する。
我々のSSPは、既存のSOTA法を平均2.76%上回っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:30:36 GMT)
Class-aware Domain Knowledge Fusion and Fission for Continual Test-Time Adaptation [50.8] 連続的なテスト時間適応のためのクラス認識ドメイン知識融合とフィッション法を提案する。
ドメイン知識フィッション(KFI)モジュールは、新しいドメイン知識をペア化されたクラス認識ドメインプロンプトプールから適応的に分離するように設計されている。
ドメイン知識融合(KFU)モジュールはさらに、分裂した新しい知識を最小限のコストで既存の知識プールにマージするように設計されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:09:50 GMT)
OST-Bench: Evaluating the Capabilities of MLLMs in Online Spatio-temporal Scene Understanding [50.7] エージェントの観点から,オンライン時空間理解を評価するためのベンチマークOST-Benchを紹介する。
効率的なデータ収集パイプライン上に構築されたOST-Benchは、ScanNet、Matterport3D、ARKitScenesから収集された1.4kのシーンと10kの質問応答ペアで構成されている。
複雑な空間的推論要求と長期記憶検索要求の両方が、2つの別々の軸に沿ってモデル性能を著しく低下させることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:20:45 GMT)
EgoBrain: Synergizing Minds and Eyes For Human Action Understanding [50.5] EgoBrainは、長期にわたって人間の脳の自我中心の視覚と脳波を同期させる、世界初の大規模な、時間的に整列したマルチモーダルデータセットである。
このデータセットは、毎日29種類の活動に携わる40人の参加者から、同期された32チャンネル脳波記録と1対1のビデオの61時間からなる。
すべてのデータ、ツール、取得プロトコルはオープンに共有され、認知コンピューティングにおけるオープンサイエンスを育む。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:55:59 GMT)
Time-Correlated Video Bridge Matching [49.9] Time-Correlated Video Bridge Matching (TCVBM) は、Bridge Matching (BM) をビデオ領域の時間関連データシーケンスに拡張するフレームワークである。
TCVBMは、複数の量的指標にまたがって優れた性能を達成し、生成品質の向上と再構成の忠実性を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:35:30 GMT)
SAIL-Embedding Technical Report: Omni-modal Embedding Foundation Model [49.7] マルチモーダル埋め込みモデルは、多様なクロスモーダルタスクに力を与える情報的統一表現を提供することを目的としている。
SAIL-Embeddingはオムニモーダルな埋め込み基盤モデルで、これらの問題に適切なトレーニング戦略とアーキテクチャ設計を通して対処する。
具体的には、コンテンツ対応プログレッシブトレーニングは、さまざまな下流タスクへのモデルの適応性を高め、より豊かなクロスモーダル習熟度を習得することを目的としている。
協調型レコメンデーション強化トレーニングは、シークエンス・ツー・テムとID・ツー・テムの埋め込みから知識を抽出することにより、レコメンデーションシナリオのマルチモーダル表現をさらに適応させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:43:22 GMT)
VR-Thinker: Boosting Video Reward Models through Thinking-with-Image Reasoning [49.6] マルチモーダル報酬モデル(RM)は、視覚生成モデルのトレーニング後を大幅に改善した。
VideoReward Thinker (VR-Thinker)は、RMに視覚的推論操作と視覚的メモリウィンドウを備えた思考とイメージのフレームワークである。
提案手法は,映像選好ベンチマークにおいて,オープンソースモデル間で最先端の精度を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:02:36 GMT)
Multi-stage Prompt Refinement for Mitigating Hallucinations in Large Language Models [49.4] MPR(Multi-stage Prompt Refinement)は、複数のステージにわたる不整形プロンプトを体系的に改善するためのフレームワークである。
MPRは、追加の文脈でプロンプトの明快さを反復的に強化し、最も関連する入力を優先順位付けするためにランク付けされた自己回帰機構を使用する。
幻覚ベンチマークの結果、MPRは原型と比較して85%以上の勝利率を達成した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:31:36 GMT)
CPR: Mitigating Large Language Model Hallucinations with Curative Prompt Refinement [49.4] Curative Prompt Refinement (CPR) は、CPR (Culative Prompt Refinement) のためのプラグイン・アンド・プレイフレームワークである。
CPRは、不正なプロンプトをクリーン化し、追加の情報的タスク記述を生成する。
CPRは元のプロンプトに対して、外部の知識なしに90%以上の勝利率を達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:27:46 GMT)
Open and Sustainable AI: challenges, opportunities and the road ahead in the life sciences (October 2025 -- Version 2) [49.1] 我々は、AI研究成果に対する信頼の侵食の増加についてレビューする。
我々は、AIエコシステムの断片化されたコンポーネントと、OpenとSustainable AIを最大限にサポートするためのガイドパスの欠如について論じる。
私たちの研究は、研究者と関連するAIリソースを結びつけることで、持続可能な、再利用可能な、透過的なAIの実装を容易にします。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:23:04 GMT)
SVAG-Bench: A Large-Scale Benchmark for Multi-Instance Spatio-temporal Video Action Grounding [48.6] 本研究では,ビデオ中のすべての参照オブジェクトを同時に検出,追跡,時間的ローカライズするモデルを必要とする新しいタスクである,SVAG(Spatio-temporal Video Action Grounding)を紹介する。
SVAG-Benchは688の動画、19,590の注釈付きレコード、903のユニークな動詞からなる大規模ベンチマークである。
実験の結果、既存のモデルではSVAG、特に密集したシーンや複雑なシーンでは性能が良くないことがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:10:49 GMT)
BrowserAgent: Building Web Agents with Human-Inspired Web Browsing Actions [48.2] BrowserAgentは、事前に定義されたブラウザアクションのセットを通じて、Playwright経由で生のWebページで直接動作する。
ステップ間で重要な結論を格納するための明示的なメモリ機構を導入し、モデルの推論能力をさらに強化する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:54:57 GMT)
Leveraging Importance Sampling to Detach Alignment Modules from Large Language Models [48.2] 伝統的なアライメント手法では、しばしば大きな事前訓練されたモデルを再訓練する必要がある。
本稿では,アライメント処理を重要サンプリングの一種として形式化する新しいtextitResidual Alignment Model (textitRAM) を提案する。
本稿では,トークンレベルの復号化を反復的に行う再サンプリングアルゴリズムを開発した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:57:53 GMT)
CurriFlow: Curriculum-Guided Depth Fusion with Optical Flow-Based Temporal Alignment for 3D Semantic Scene Completion [47.5] CurriFlowは、光学フローに基づく時間的アライメントとカリキュラム誘導深度融合を統合する、新しいセマンティック占有予測フレームワークである。
我々は,CurriFlowが16.9の平均IoUで最先端性能を実現し,カメラによる3Dセマンティックシーンの完成のための動作誘導設計とカリキュラム認識設計の有効性を検証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:25:26 GMT)
CoRA: Covariate-Aware Adaptation of Time Series Foundation Models [47.2] Time Series Foundation Models (TSFM) は、そのモデル容量、スケーラビリティ、ゼロショットの一般化を通じて、大きな影響を与えている。
TSFMのための一般共変量認識適応(CoRA)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:20:00 GMT)
HardcoreLogic: Challenging Large Reasoning Models with Long-tail Logic Puzzle Games [47.2] 大規模推論モデル(LRM)は、論理パズルゲームを含む複雑なタスクにおける印象的なパフォーマンスを実証している。
既存のコーパスは、9x9 Sudokuのような人気のパズルに焦点を当てており、標準フォーマットに過度に適合し、ソリューションパターンを記憶するリスクがある。
HardcoreLogicは10ゲームにわたる5000以上のパズルの挑戦的なベンチマークである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:23:24 GMT)
GeoVLM-R1: Reinforcement Fine-Tuning for Improved Remote Sensing Reasoning [47.1] 多様な地球観測タスクへの推論に基づくRLモデルの効果的な適応を可能にするために,タスク意識報酬を取り入れた新しいポストトレーニングフレームワークを提案する。
このトレーニング戦略は、リモートセンシング画像の推論機能を強化し、最適化を安定化し、堅牢性を向上させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:30:43 GMT)
Aligning Language Models with Investor and Market Behavior for Financial Recommendations [46.9] 本稿では,Large Language Models (LLMs), Knowledge Graphs (KGs), Kahneman-Tversky Optimization (KTO)を統合した新しいフレームワークFLARKOを提案する。
FLARKOは、ユーザーのトランザクション履歴と資産動向を構造化されたKGとしてエンコードし、LLMの解釈可能かつ制御可能なコンテキストを提供する。
FAR-Transデータセットに基づいて、FLARKOは、行動アライメントと共同利益性に基づく最先端のレコメンデーションベースラインを一貫して上回る。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:24:20 GMT)
Many-body post-processing of density functional calculations using the variational quantum eigensolver for Bader charge analysis [46.9] 変動量子固有解法を用いて、多体ハミルトニアンを解くことにより、様々な周期系のバダー電荷を計算する。
本手法は, 標準DFTと比較して, 強相関遷移金属酸化物に対するBader電荷値を大幅に改善することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:01:40 GMT)
Multi-Agent Debate for LLM Judges with Adaptive Stability Detection [46.7] エージェントが協調して判断し、反復的に応答を洗練するマルチエージェントの議論判断フレームワークを提案する。
議論の過程を数学的に定式化し、エージェントの相互作用を分析し、議論が静的アンサンブルと比較して正確さを増幅することを証明する。
複数のベンチマークやモデルを用いた実験により,本フレームワークは計算効率を維持しつつ,多数決よりも判定精度を向上させることが示された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:30:30 GMT)
Causal Agent based on Large Language Model [46.6] 大規模言語モデル(LLM)は様々な領域で大きな成功を収めている。
因果問題と因果論が引き継がれた複雑性は、それらを自然言語で正確に記述する上で困難を生じさせる。
我々は,LLMに因果的ツールを,因果的エージェント(Causal Agent)というエージェント・フレームワーク内に組み込んで,因果的問題に対処できるようにした。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:38:39 GMT)
Demystifying Hybrid Thinking: Can LLMs Truly Switch Between Think and No-Think? [46.4] 制御可能性に影響を与える要因を分析し,最も重要な4つの要因を同定する。
本稿では,標準学習と比較して,両方のモードで精度を維持できる実践的なレシピを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:19:44 GMT)
BrainOmni: A Brain Foundation Model for Unified EEG and MEG Signals [46.1] 異種脳波とMEG記録を対象とする脳基礎モデルBrain Omniを提案する。
多様なデータソースを統一するために、脳の活動を離散表現に定量化する最初のトークンであるBrainTokenizerを紹介します。
EEGの合計1,997時間、MEGデータの656時間は、事前トレーニングのために公開されているソースからキュレーションされ、標準化されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:01:41 GMT)
Probing Latent Knowledge Conflict for Faithful Retrieval-Augmented Generation [46.0] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の現実性を高めるための強力なパラダイムとして登場した。
既存の文脈忠実性を改善するアプローチは、プロンプトエンジニアリング、デコード制約、報酬に基づく微調整など、外部からの介入に依存している。
文脈を微粒な文レベルの知識に分解するフレームワークであるCLEAR(Conflict-Localized and Enhanced Attention for RAG)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:48:24 GMT)
Adaptive vector steering: A training-free, layer-wise intervention for hallucination mitigation in large audio and multimodal models [45.9] 本稿では,適応ベクトルステアリングによる音声コンテンツのより良い生成を提案する。
実験では、2つのモデルと2つのベンチマークで一貫したパフォーマンス向上を示している。
我々の知る限りでは、オーディオにおける幻覚を軽減するためにベクトルステアリングを適用した最初の研究である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:52:18 GMT)
SoundnessBench: A Soundness Benchmark for Neural Network Verifiers [45.9] NN検証のための新しいベンチマーク「SoundnessBench」を開発した。
SoundnessBenchは、敵の攻撃から隠された意図的に挿入された反例を持つインスタンスで構成されている。
我々のトレーニングは,隠れた反例を効果的に生成し,SoundnessBenchは最先端のNN検証器のバグの同定に成功したことを実証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:22:14 GMT)
HYPE: Hybrid Planning with Ego Proposal-Conditioned Predictions [45.7] Egoの提案条件付き予測を用いたハイブリッドプランニングを提案する。
学習された提案モデルからの多モード軌道提案を事前としてモンテカルロ木探索の改良に統合する。
提案手法を考慮し,コスト関数設計を大幅に単純化する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:11:04 GMT)
On the Interplay between Human Label Variation and Model Fairness [45.6] 本稿では,多数投票ラベルの学習とHLV手法の比較により,その相互作用について検討する。
本実験により, HLVトレーニング法は, 明らかな偏りがなければ, 公平性に肯定的な影響を及ぼすことが示された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:43:48 GMT)
Vectorized Video Representation with Easy Editing via Hierarchical Spatio-Temporally Consistent Proxy Embedding [45.6] 提案した表現はより少ないパラメータで高い映像再構成精度を実現する。
複雑なビデオ処理タスクをサポートし、ビデオのインペイントや時間的に一貫したビデオ編集を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:05:30 GMT)
Too Open for Opinion? Embracing Open-Endedness in Large Language Models for Social Simulation [45.6] 大規模言語モデル(LLM)は、世論やその他の社会現象をシミュレートするためにますます使われている。
最近の研究の多くは、これらのシミュレーションを、スコアリングと比較の容易さのために、複数選択またはショートアンサー形式に制限している。
LLMのトピックや視点,推論過程をキャプチャする自由形式のテキストを用いたオープンディペンデンスは,現実的な社会シミュレーションには不可欠である,と我々は主張する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:40:21 GMT)
CSI-4CAST: A Hybrid Deep Learning Model for CSI Prediction with Comprehensive Robustness and Generalization Testing [44.0] 本稿では、畳み込みニューラルネットワーク残基、適応補正層、ShuffleNetブロック、Transformerの4つの重要なコンポーネントを統合するハイブリッドディープラーニングアーキテクチャであるCSI-4CASTを紹介する。
データセットは、複数のチャネルモデル、広範囲の遅延スプレッドとユーザ速度、さまざまなノイズタイプと強度度にまたがる。
実験の結果,CSI-4CASTは計算コストを大幅に削減して予測精度が向上した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:19:52 GMT)
A Review of Longitudinal Radiology Report Generation: Dataset Composition, Methods, and Performance Evaluation [44.0] 本調査は, 縦断的放射線診断レポート生成(LRRG)の総括的検討である。
提案手法は, データセット構築戦略, レポート生成アーキテクチャ, 縦に調整された設計, 評価プロトコルについて検討する。
我々は、今後の発展に向けての有望な方向性を概説し、この新興分野を前進させるための基盤を築くことを目的とする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:26:23 GMT)
Tracing Back the Malicious Clients in Poisoning Attacks to Federated Learning [44.0] 毒殺攻撃は、連合学習の訓練段階を損なう。
FLForensics, FLForensics, the first poison-forensics method。
FLForensicsは、良質なクライアントと悪質なクライアントを正確に区別できることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:32:25 GMT)
ARM2: Adaptive Reasoning Model with Vision Understanding and Executable Code [43.9] 大規模推論モデル(LRM)は、しばしば過剰な思考の問題に悩まされ、単純なタスクに対する不必要に長い推論を引き起こす。
ARM2は、複数のフォーマットにわたる推論性能と効率を適応的にバランスさせる統一モデルである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:35:24 GMT)
One Prompt Fits All: Universal Graph Adaptation for Pretrained Models [43.7] Graph Prompt Learning (GPL)は、グラフ事前学習モデルと下流シナリオをブリッジする有望なパラダイムとして登場した。
提案するUniPromptは,事前学習されたモデルに適応し,入力グラフを保存しながら事前学習されたモデルの性能を解放する手法である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:01:27 GMT)
Competitive Advantage Attacks to Decentralized Federated Learning [43.7] SelfishAttackは、分散連邦学習(DFL)に対する新たな攻撃ファミリーである
SelfishAttackでは、利己的なクライアントのセットは、残りの非利己的なクライアントよりも競争上の優位性を達成することを目指している。
本稿では,自己学習型クライアントと非自己学習型クライアントとの精度差を,SelfishAttackが向上させることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:23:09 GMT)
Self-Supervised Selective-Guided Diffusion Model for Old-Photo Face Restoration [43.1] 古い写真による顔の復元は、破壊、失明、激しいぼやけなどの複合的な劣化のために重大な課題となる。
本稿では,事前学習した拡散モデルにより生成された擬似参照面を弱い誘導下で活用する自己監督選択拡散法を提案する。
SSDiffは、知覚品質、忠実度、および地域制御性において、既存のGANベースおよび拡散ベースの手法より優れている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:34:15 GMT)
DiffEM: Learning from Corrupted Data with Diffusion Models via Expectation Maximization [42.7] 本稿では,予測最大化(EM)を用いた拡散モデルの学習手法を提案する。
提案手法は条件拡散モデルを用いてE段階の観測からクリーンなデータを再構成し,M段階の条件拡散モデルを改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:25:02 GMT)
SafeMT: Multi-turn Safety for Multimodal Language Models [42.6] 画像に付随する有害なクエリから発生する様々な長さの対話を特徴付けるベンチマークであるSafeMTを紹介する。
このベンチマークは合計1万のサンプルで構成されており、17の異なるシナリオと4つのjailbreakメソッドを含んでいる。
このベンチマークを用いて17種類のモデルの安全性を評価し、有害な対話のターン数が増加するにつれて、これらのモデルに対する攻撃が成功するリスクが増加することを明らかにする。
本稿では,会話中に隠された悪意のある意図を検知し,MLLMに関連する安全ポリシーを提供する対話安全モデレータを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:24:07 GMT)
Can GRPO Help LLMs Transcend Their Pretraining Origin? [42.2] グループ相対政策最適化は、大規模言語モデル(LLM)の推論能力を高めるための主要なアプローチである
広く採用されているにもかかわらず、GRPOの利益はしばしば矛盾している。
GRPOはどの条件で推論を改善し、アウト・オブ・ディストリビューション(OOD)を一般化するのか?
まず、GRPOは基本モデルの分布に縛られ、完全に新しい解を見つけることができない保守的な再重み付けスキームであることを理論的に証明する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:37:52 GMT)
Hybrid Explanation-Guided Learning for Transformer-Based Chest X-Ray Diagnosis [42.1] 本稿では,自己指導型制約と人間指導型制約を組み合わせたHybrid Explanation-Guided Learning(H-EGL)フレームワークを提案する。
The Vision Transformer (ViT) を用いて胸部X線分類のアプローチを検証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:39:02 GMT)
Vision Language Models Map Logos to Text via Semantic Entanglement in the Visual Projector [42.0] 視覚言語モデル(VLM)はマルチモーダル推論において顕著な進歩を遂げた。
しかし、視覚的な証拠はアウトプットを根拠にしていない幻覚に弱いままである。
本稿では,これまで見過ごされていた「ロゴ幻覚」について考察する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:42:58 GMT)
Dendrograms of Mixing Measures for Softmax-Gated Gaussian Mixture of Experts: Consistency without Model Sweeps [41.4] ゲーティングパラメータの共通翻訳、固有のゲート-エキスパート相互作用、およびタイトな数値-デノミネータ結合までの不特定性に対処する。
モデル選択には, 最適なパラメータ率を得る専門家の数を一貫したスイープフリーセレクタとして, デンドログラム誘導SGMoEを適応させる。
干ばつを識別できるトウモロコシの形質のデータセット上で、私たちのデンドログラム誘導SGMoEは2人の専門家を選別し、明確な混合階層を公開し、確率を早期に安定化し、解釈可能な遺伝子型フェノタイプマップを生成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:23:44 GMT)
Information Shapes Koopman Representation [41.3] 我々は、潜在変数が表現力と単純さのバランスをとるのに失敗する、最適下表現学習の難しさを論じる。
このレンズを通してクープマンの学習を再考し、潜伏した相互情報によって単純さが促進されるが、単純さに対する過度な強調は潜伏空間を崩壊させる可能性があることを示した。
本稿では, 単純さと表現性を両立させ, 安定かつ解釈可能なクープマン表現をもたらすラグランジアン定式化に基づく新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:48:06 GMT)
MCOP: Multi-UAV Collaborative Occupancy Prediction [40.6] Current Bird's Eye View (BEV)ベースのアプローチには2つの大きな制限がある。
本稿では,複数UAV共同占有予測フレームワークを提案する。
提案手法は最先端の精度を達成し,既存の協調手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:17:42 GMT)
AndesVL Technical Report: An Efficient Mobile-side Multimodal Large Language Model [40.5] AndesVLはQwen3のLLMと様々なビジュアルエンコーダに基づいて0.6Bから4Bのパラメータを持つモバイル側のMLLMのスイートである。
効率的なタスク適応とモデル圧縮を容易にするために,Quantization-Aware LoRA Fine-Tuningフレームワークとともに1+N LoRAアーキテクチャを導入する。
我々は、MediaTek Dimensity 9500チップにAndesVL-4Bをデプロイする際に、最大6.7倍のピーク復号率、最大30.9%のメモリ削減、1.8ビット/ウェイトを実現した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:05:14 GMT)
OrbitZoo: Real Orbital Systems Challenges for Reinforcement Learning [40.3] OrbitZooは、多機能なマルチエージェントRL環境であり、高忠実度業界標準ライブラリ上に構築されている。
衝突回避や協調操作のようなシナリオをサポートし、ロバストで正確な軌道力学を保証する。
実際の衛星星座であるスターリンクに対して検証され、実際のデータと比較すると平均絶対パーセンテージ誤差(MAPE)は0.16%に達する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:07:50 GMT)
Assessing Latency in ASR Systems: A Methodological Perspective for Real-Time Use [40.2] 自動音声認識(ASR)システムはリアルタイムの文字起こしを生成するが、人間の通訳が捉えたニュアンスを見逃すことも多い。
人間インタプリタはこれらのニュアンスを認識するだけでなく、リアルタイムで調整でき、精度が向上する一方、ASRは基本的な転写タスクを処理している。
本稿では,ASRシステムの遅延を計測し,実際の解釈シナリオで使用可能なかどうかを検証するための新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:37:45 GMT)
The Curious Case of Curiosity across Human Cultures and LLMs [39.5] 多様なトピックにまたがる実世界の多国間データセットであるAnswersを用いて,好奇心の文化的変動を調査した。
大規模言語モデルは異文化間の多様性をフラットにし、西洋諸国における好奇心の表現方法とより密接に一致している。
次に、LLMの好奇心を誘導する微調整戦略を検討し、人間モデルアライメントギャップを最大50%狭める。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:42:24 GMT)
Gaussian Semantic Field for One-shot LiDAR Global Localization [39.3] 3層シーングラフに基づく意味の曖昧さを特徴とするワンショットLiDARグローバルローカライゼーションアルゴリズムを提案する。
本稿では,ガウス過程の個体群から学習した連続関数を用いた意味分布をモデル化することにより,この問題を軽減することを提案する。
個別のセマンティックラベルと比較すると、連続関数はよりきめ細かいジオセマンティック情報をキャプチャし、対応確立のためのより詳細なメトリック情報を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:08:02 GMT)
AI Realtor: Towards Grounded Persuasive Language Generation for Automated Copywriting [39.1] 自動複写における説得的言語生成のために,大規模言語モデルを用いたエージェントフレームワークを開発した。
提案手法は,生成したコンテンツとユーザの好みを一致させると同時に,有用な事実属性を強調表示するように設計されている。
我々は、不動産マーケティングの分野において、潜在的住宅購入者の焦点を絞った体系的な人物実験を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:25:55 GMT)
Diff-XYZ: A Benchmark for Evaluating Diff Understanding [38.9] Diff-XYZは、3つの教師付きタスクを持つコード差分理解のためのコンパクトなベンチマークである。
ベンチマークのインスタンスは、$langle textitoldコード、textitnewコード、textitdiff rungle$をCommitPackFTの実際のコミットから引き出す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:23:01 GMT)
Graph2Eval: Automatic Multimodal Task Generation for Agents via Knowledge Graphs [38.9] マルチモーダル文書理解タスクとWebインタラクションタスクの両方を自動的に生成する知識グラフベースのフレームワークであるGraph2Evalを提案する。
Graph2Eval-Benchはドキュメントの理解とWebインタラクションのシナリオにまたがる1,319のタスクのキュレートされたデータセットです。
実験によると、Graph2Evalは、エージェントとモデルのパフォーマンスを区別するタスクを効率的に生成し、異なる設定間での推論、コラボレーション、Webインタラクションのギャップを明らかにする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:11:17 GMT)
From Next-Token to Mathematics: The Learning Dynamics of Mathematical Reasoning in Language Models [38.7] 大規模言語モデル (LLM) は、数学的推論に関わる幅広い問題を解くために学習する。
オープンウェイトLLMの数学的推論能力は,事前学習と後学習の間にどのように発達するかを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:32:31 GMT)
Towards Region-aware Bias Evaluation Metrics [38.6] 性別バイアスの地域差を同定し,バイアス評価のための地域別ボトムアップアプローチを提案する。
提案手法は,ある地域におけるジェンダー・アライメント・トピックを使用し,トピック・ペアの形でジェンダー・バイアス・ディメンションを識別する。
提案するバイアストピックペアのいくつかは、既存のものと比較して、これらの領域における性別バイアスに対する人間の認識に匹敵するものである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:45:19 GMT)
E-MoFlow: Learning Egomotion and Optical Flow from Event Data via Implicit Regularization [38.5] オプティカルフローと6-DoFエゴモーションの推定は、通常独立して対処されてきた。
ニューロモルフィック・ビジョンでは、ロバストなデータアソシエーションが欠如しているため、この2つの問題を別々に解決することは不十分な課題である。
本研究では,暗黙の空間的時間的・幾何学的正則化を通じて,運動と光の流れを協調的に最適化する,教師なしのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:33:44 GMT)
A Gradient Guided Diffusion Framework for Chance Constrained Programming [38.3] CCP(Chance constrained Diffusion)は、不確実性の下で最適化問題に対処する強力なフレームワークである。
本稿では,3つの重要なイノベーションを通じて問題に取り組む新しいGuidedOptベースのフレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:40:55 GMT)
K-frames: Scene-Driven Any-k Keyframe Selection for long video understanding [38.1] Kフレームは、時間的連続性を保存するシーン駆動の選択のための新しいパラダイムである。
個々のフレームを選択する代わりに、Kフレームは意味的に一貫性のあるクエリ関連クリップを予測する。
Kフレームは、様々なスケールで選択するための効果的な、解釈可能な、プラグアンドプレイソリューションを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:23:22 GMT)
Contrast Sensitivity in Multimodal Large Language Models: A Psychophysics-Inspired Evaluation [37.9] マルチモーダル大言語モデル(MLLM)におけるコントラスト感度関数(CSF)を推定するための行動的手法を提案する。
モデルは、特定の空間周波数でフィルタリングされた雑音に基づく刺激を観察しながら、構造化されたプロンプトでクエリされる。
以上の結果から,人間のCSFと形状やスケールが似ているモデルもあるが,どちらのモデルも捉えていないことが判明した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:55:45 GMT)
Persuasion at Play: Understanding Misinformation Dynamics in Demographic-Aware Human-LLM Interactions [37.7] 大規模言語モデル(LLM)は、大規模に説得的コンテンツを生成し、既存のバイアスを強化する。
本研究では,LLMと人間間の双方向的説得動態について,誤表現内容に曝露した場合に検討する。
以上の結果から, LLMの誤情報に対する感受性には, 人口統計学的要因が影響していることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:16:57 GMT)
BridgeVLA: Input-Output Alignment for Efficient 3D Manipulation Learning with Vision-Language Models [37.7] BridgeVLAは、3D入力を複数の2D画像に投影し、VLMバックボーンとの入力アライメントを保証する新しい3D VLAモデルである。
アクション予測に2Dヒートマップを使用し、一貫した2次元画像空間内の入力空間と出力空間を統一する。
10以上のタスクで96.8%の成功率を達成することができ、1タスクにつき3つの軌道しか持たず、異常なサンプル効率を誇示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:26:03 GMT)
Classical simulation of circuits with realistic odd-dimensional Gottesman-Kitaev-Preskill states [37.5] 本稿では,回路を符号化した Gottesman-Kitaev-Preskill (GKP) 状態でシミュレートするアルゴリズムを提案する。
私たちのアプローチは、最も困難なが実際は関係のある体制において特に効果的であるように調整されています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:18:59 GMT)
HccePose(BF): Predicting Front & Back Surfaces to Construct Ultra-Dense 2D-3D Correspondences for Pose Estimation [37.5] 観測対象の推定では、ニューラルネットワークを使用して2D画像上の物体表面の密集した3D座標を予測する。
本研究は、ポーズ間の3次元座標を密集して、物体の前面と後面の両方を3次元座標で予測する。
その結果,提案手法は7つの古典的BOPコアデータセットより優れていることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:12:01 GMT)
Feature Distillation is the Better Choice for Model-Heterogeneous Federated Learning [37.4] モデルヘテロジニアス・フェデレート・ラーニング(Hetero-FL)は、異種モデルからの知識を収集し、ローカルにプライベートデータを保持する能力に注目が集まっている。
クライアントからの知識を集約するため,グローバルアグリゲーションの後に,広範に利用され有効な技術であるアンサンブル蒸留が,グローバルモデルの性能を高めるためにしばしば用いられる。
そこで本研究では,新たな機能ベース・アンサンブル型知識蒸留パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:02:21 GMT)
Optimistic Multi-Agent Policy Gradient [37.1] 相対的過一般化 (Relative Over generalization, RO) は、エージェントが準最適結合ポリシーに向かって収束する際に起こる。
マルチエージェントポリシー勾配(MAPG)法では,ROに対処する手法は提案されていない。
本稿では,RO問題を緩和するMAPG手法の楽観的な更新を可能にする,汎用的でシンプルなフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:41:06 GMT)
Socially inspired Adaptive Coalition and Client Selection in Federated Learning [36.9] フェデレートラーニング(FL)は、プライバシ保護のための協調モデルトレーニングを可能にするが、その効果はクライアントデータの不均一性によって制限されることが多い。
i)合意に基づいてクライアントの非重複連立を動的に形成し、(ii)モデル更新のばらつきを最小限に抑えるために、各連立から1人の代表を選定するクライアント選択アルゴリズムを導入する。
提案手法は, 近距離行列をスペクトルクラスタリングに利用し, 集団の集合的意見を推定する最も情報性の高い個人を特定する手法として, ソーシャルネットワークモデリングに着想を得たものである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:58:15 GMT)
When to Trust Your Simulator: Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning [36.9] 本稿では,この問題に対する肯定的な回答を提供するために,Dynamics-Aware Hybrid Offline-and-Online Reinforcement Learning (H2O)フレームワークを提案する。
H2Oは動的に認識されたポリシー評価スキームを導入し、大きなダイナミックスギャップを持つシミュレーション状態-作用対上でQ関数学習を適応的にペナルティ化する。
我々は、他のドメイン間のオンラインおよびオフラインRLアルゴリズムに対してH2Oの優れた性能を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:47:03 GMT)
Artificial intelligence for simplified patient-centered dosimetry in radiopharmaceutical therapies [36.7] 放射線治療の急速な発展は、パーソナライズされた患者中心のドシメトリーの必要性の高まりを浮き彫りにしている。
患者フレンドリーなRTPに向けた簡易ドシメトリのためのAIの主な進歩について概説する。
RPTドシメトリにおけるAIの役割の今後の方向性について論じる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:55:36 GMT)
Estimating the Hallucination Rate of Generative AI [36.7] 本稿では,生成AIを用いたテキスト内学習における幻覚率の推定手法を提案する。
ICLでは、条件生成モデル(CGM)にデータセットと予測質問を入力し、応答を生成する。
我々は、ICL問題に対処し、CGMが幻覚を発生させる確率を推定する新しい方法を開発した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:30:56 GMT)
InternScenes: A Large-scale Simulatable Indoor Scene Dataset with Realistic Layouts [36.5] InternScenesは、およそ4万の多様なシーンからなる、大規模でシミュレート可能な屋内シーンデータセットである。
シーン内の大量の小さなアイテムを保存し、結果として、領域ごとの平均41.5オブジェクトの現実的で複雑なレイアウトを実現します。
InternScenesの価値を、シーンレイアウト生成とポイントゴールナビゲーションの2つのベンチマークアプリケーションで示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:26:36 GMT)
Unveiling the Vulnerability of Graph-LLMs: An Interpretable Multi-Dimensional Adversarial Attack on TAGs [35.9] Interpretable Multi-dimensional Graph Attack (IMDGA) は、グラフLLMのための新しい人間中心の敵攻撃フレームワークである。
IMDGAは既存の手法に比べて優れた解釈可能性、攻撃効果、ステルス性、堅牢性を示す。
この研究は、Graph-LLMの未調査の脆弱性のセマンティックディメンションを明らかにし、レジリエンスを改善するための貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:36:07 GMT)
VideoRFT: Incentivizing Video Reasoning Capability in MLLMs via Reinforced Fine-Tuning [35.6] Reinforcement fine-tuning (RFT) は人間レベルの推論能力を達成する上で非常に有望である。
VideoRFT は RFT の標準的な2段階スキームに従う: チェーン・オブ・シント(CoT)アノテーションによる細調整(SFT)と、一般化を改善するための強化学習(RL)である。
6つのビデオ推論ベンチマークにおいて,ビデオRFTが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:13:18 GMT)
QUICstep: Evaluating connection migration based QUIC censorship circumvention [35.5] 我々はQUICstepの軽量でアプリケーションに依存しないプロトタイプを開発し、現実世界のQUIC SNI検閲を回避する。
QUICstepは、多様な設定で完全に暗号化されたチャネルよりも優れているだけでなく、暗号化されたチャネルプロバイダのトラフィック負荷を大幅に削減できることがわかった。
我々はQUICstepを野生におけるQUIC接続マイグレーション支援を測定するツールとして使用し、接続マイグレーションのサポートが増加していることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:30:19 GMT)
GarmageNet: A Multimodal Generative Framework for Sewing Pattern Design and Generic Garment Modeling [35.5] GarmageNetは、2Dミシンパターンの作成を自動化する生成フレームワークである。
ガーマージ(Garmage)は、各パネルを構造的幾何学的イメージとしてエンコードする、新しい衣服表現である。
GarmageSetは14,801のプロフェッショナルデザインの衣服からなる大規模なデータセットである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:37:25 GMT)
When "Competency" in Reasoning Opens the Door to Vulnerability: Jailbreaking LLMs via Novel Complex Ciphers [35.2] 我々は、新しい暗号で悪意あるクエリをエンコードするジェイルブレイク技術である、カスタム暗号化(ACE)を用いたアタックを導入する。
次に、LACE (Layered Attacks using Custom Encryptions) を導入し、攻撃複雑性を増幅するために多層暗号を適用した。
暗号を復号化できるLLMは、LACEに対してより脆弱である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:25:21 GMT)
Cross-Modal Safety Alignment: Is textual unlearning all you need? [34.8] テキスト領域のみの未学習は、モダリティ間の安全アライメントに有効であることを示す。
実験の結果,マルチモーダルデータセットを用いたアンラーニングでは潜在的なメリットは得られず,計算要求が大幅に増加することがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:41:15 GMT)
Physics-Informed autoencoder for DSC-MRI Perfusion post-processing: application to glioma grading [34.5] DSC-MRI灌流解析のための物理インフォームドオートエンコーダを提案する。
本手法は,他のよく知られたデコンボリューションアルゴリズムに従ってグリオーマのグレーディングの信頼性を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:39:55 GMT)
Finite-time Convergence Analysis of Actor-Critic with Evolving Reward [33.9] 本稿では,進化する報酬関数の存在下で,単一時間スケールアクター・クリティカル・アルゴリズムの有限時間収束解析を行う。
第二の貢献として、マルコフサンプリングによる分布ミスマッチの新たな解析を導入し、静的回帰の場合、$log2T$の係数で最もよく知られたレートを改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:45:19 GMT)
BoN Appetit Team at LeWiDi-2025: Best-of-N Test-time Scaling Can Not Stomach Annotation Disagreements (Yet) [33.8] 現在,Best-of-N法は数学からLeWiDiタスクに移行していない。
実験の結果,Best-of-N法は現在,数学からLeWiDiタスクへ移行していないことが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:43:08 GMT)
Massive Activations are the Key to Local Detail Synthesis in Diffusion Transformers [33.8] Diffusion Transformers (DiT) は視覚生成の強力なバックボーンとして登場した。
近年の観察では, 内部特徴マップにemphMassive Activations (MA) が出現している。
ローカルなディテール忠実度を高めるためにtextbfDetail textbfGuidance (textbfDG) を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:40:48 GMT)
Evaluating and Mitigating LLM-as-a-judge Bias in Communication Systems [32.8] 大規模言語モデル(LLM)は、コミュニケーションシステムにおけるコンテンツの品質を自律的に評価するために、ますます使われている。
本稿では,2つのLLM-as-a-judgeモデルにおける判定バイアスをポイントワイド評価条件下で系統的に検討する。
我々は,実践的なコミュニケーションシナリオにおいて,公平かつ信頼性の高いAIを確保するための4つの潜在的な緩和戦略を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:52:29 GMT)
Provably Efficient RL under Episode-Wise Safety in Constrained MDPs with Linear Function Approximation [32.7] 制約決定過程(CMDP)における強化学習問題について検討する。
本稿では,リニアCMDPに対するRLアルゴリズムを提案する。
その結果,近年の線形CMDPアルゴリズムでは,制約に違反するか,指数計算コストに悪影響を及ぼす結果が得られた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:05:04 GMT)
BSGS: Bi-stage 3D Gaussian Splatting for Camera Motion Deblurring [32.5] Bi-Stage 3D Gaussian Splattingは、モーションブルー画像から3Dシーンを再構築する新しいフレームワークである。
両方のステージを最適化するために,サブフレーム勾配集約戦略を提案する。
提案手法の有効性を検証し,その有効性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:26:56 GMT)
BoxingGym: Benchmarking Progress in Automated Experimental Design and Model Discovery [32.4] 実験的な設計とモデル発見を評価するための10環境のベンチマークであるBoxingGymを紹介する。
予測情報ゲイン(EIG)は,実験が生成モデルのパラメータの不確実性をどの程度低減するかを測定する情報理論量である。
GPT-4oのような現在のLLMは、実験的な設計とモデル発見の両方に苦戦している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:35:27 GMT)
Layer-Aware Influence for Online Data Valuation Estimation [32.3] データ中心学習は、パフォーマンスを高めるために高品質なトレーニングサンプルのキュレーションを強調する。
中心的な問題は、トレーニングサンプルの影響を効率的に見積もることである。
我々は、損失から出力への勾配のみを必要とする層認識型オンライン推定器を開発した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:34:22 GMT)
Precise Attribute Intensity Control in Large Language Models via Targeted Representation Editing [32.2] 我々は,属性強度を正確に制御するLarge Language Model (LLM) の出力をユーザ定義の属性強度で改善する。
提案手法では, 属性強度の微粒化と連続制御が可能であり, 単純な方向アライメントを超えて移動することができる。
LLaMA-3.2-3b と Phi-4-mini の実験により,ユーザの属性強度に高い精度でテキスト生成を行うことができることを確認した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:50:22 GMT)
Diffusion Models for Reinforcement Learning: Foundations, Taxonomy, and Development [32.1] 拡散モデル(DM)は強化学習(RL)の重要な利点を提供する
このサーベイは拡散に基づくRLの包括的かつ最新の合成を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:03:46 GMT)
Dual Perspectives on Non-Contrastive Self-Supervised Learning [32.0] エムストップ勾配とエム指数移動平均反復手順は、自己教師あり学習への非競合的なアプローチで一般的に用いられる。
本発表では、最適化と動的システムの両面からこれらの手順を考察する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:45:29 GMT)
Follow-the-Perturbed-Leader for Decoupled Bandits: Best-of-Both-Worlds and Practicality [32.0] そこで,本研究では,学習者が探索用アームと各ラウンドでの活用用アームを1つ選択する,切り離されたマルチアームバンディット(MAB)問題について検討する。
本稿では,摂動を用いたFollow-the-Perturbed-Leaderフレームワークのポリシーを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:14:54 GMT)
SimULi: Real-Time LiDAR and Camera Simulation with Unscented Transforms [31.9] SimULiは任意のカメラモデルとLiDARデータをリアルタイムでレンダリングできる最初の方法である。
提案手法は,LiDARをサポートする複雑なカメラモデルをサポートする3DGUTを,自動タイリング戦略により拡張する。
SimULiはレイトレーシングのアプローチよりも10~20倍高速で、優先度ベースの作業よりも1.5~10倍高速である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:22:45 GMT)
Exploring the Frontier of Vision-Language Models: A Survey of Current Methodologies and Future Directions [31.7] VLM(Vision-Language Models)は、画像キャプションや視覚的質問応答といった複雑なタスクに対処できる高度なモデルである。
我々の分類では、VLMを視覚言語理解専用のモデル、マルチモーダル入力を処理するモデル、マルチモーダル入力とアウトプットの両方を受け付け、生成するモデルという3つのカテゴリに分類する。
我々は各モデルを慎重に識別し、基礎となるアーキテクチャ、データソースのトレーニング、および可能な限りの強度と限界を広範囲に分析する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:09:01 GMT)
Resource-Constrained Federated Continual Learning: What Does Matter? [31.5] Federated Continual Learning (FCL)は、エッジデバイスで異なる入ってくるデータのストリーム上で、シーケンシャルにプライバシ保護モデルトレーニングを可能にすることを目的としている。
現在のFCLの文献は、トレーニングのオーバーヘッドに制約を課すことなく、データプライバシの制限と、以前見たデータへのアクセスに重点を置いている。
本稿では,この問題を大規模ベンチマークで再検討し,資源制約の異なる条件下での最先端FCL手法の性能解析を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:56:02 GMT)
Fast Visuomotor Policy for Robotic Manipulation [31.3] エネルギー政策は、高周波ロボットタスクと資源制約システムのために設計されている。
単一のフォワードパスにおけるマルチモーダル動作を予測し、高速で高精度な操作を可能にする。
その結果、エネルギー政策は最先端の操作方法のパフォーマンスにマッチするか、超越しているかを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:18:45 GMT)
Reliable Fine-Grained Evaluation of Natural Language Math Proofs [31.0] 本稿では,0-7スケールの微粒なスコアをモデル生成数学の証明に割り当てる評価器を開発するための体系的手法を提案する。
ProofBenchは,6つの主要な数学コンペティションから145の問題にまたがる,詳細な証明評価のエキスパートによる最初のデータセットである。
本稿では,強力な推論バックボーンLMと参照解とマーキングスキームからのリッチコンテキストを組み合わせた評価器ProofGraderと,シンプルなアンサンブル手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:59:07 GMT)
ICL-Router: In-Context Learned Model Representations for LLM Routing [30.8] 本稿では,モデル機能を表現するために,コンテキスト内ベクトルを用いた新しいルーティング手法を提案する。
本手法は,分散処理とアウト・オブ・ディストリビューション処理の両方において,最先端のルーティング性能を実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:58:41 GMT)
DiSTAR: Diffusion over a Scalable Token Autoregressive Representation for Speech Generation [30.6] DISTARはゼロショットのテキスト音声合成フレームワークで、離散的残差ベクトル量子化符号空間で完全に動作する。
DISTARは、堅牢性、自然性、話者/スタイルの整合性において、最先端のゼロショットTSシステムを超えている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:03:29 GMT)
Generation Space Size: Understanding and Calibrating Open-Endedness of LLM Generations [30.5] 実効生成空間サイズ(英語版)(GSS)は、モデルがプロンプトに対して考慮する意味的に異なる出力の集合である。
GSSBench(英語版)は、異なるメトリクスを評価するために、GSS関係を持つプロンプトペアからなるタスクスイートである。
幻覚検出指標、特にEigenScoreは、標準の多様性と不確実な定量化指標を一貫して上回っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:31:34 GMT)
Prioritization First, Principles Second: An Adaptive Interpretation of Helpful, Honest, and Harmless Principles [30.4] Helpful, Honest, and Harmless(HHH)原則は、AIシステムを人間の価値と整合させるためのフレームワークである。
我々は,HHH原理の適応的解釈を論じ,多様なシナリオへの適応のための参照フレームワークを提案する。
この作業は、AIアライメントを改善するための実践的な洞察を提供し、HHH原則が現実のAIデプロイメントにおいて基礎的かつ運用的に有効であることを保証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:24:06 GMT)
MMOT: The First Challenging Benchmark for Drone-based Multispectral Multi-Object Tracking [30.3] MMOTは、ドローンベースのマルチスペクトルマルチオブジェクトトラッキングのための最初のベンチマークである。
125の動画シーケンスと8つのカテゴリにわたる488.8Kアノテーションがある。
スペクトル特徴の抽出と指向アノテーションの活用のために,マルチスペクトルおよび指向性を考慮したMOT方式を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:25:17 GMT)
Hierarchical Koopman Diffusion: Fast Generation with Interpretable Diffusion Trajectory [30.3] textbfHierarchical Koopman Diffusionは、一段階のサンプリングと解釈可能な生成軌道の両方を達成する新しいフレームワークである。
我々のフレームワークは,拡散モデルにおける高速サンプリングと解釈可能性のギャップを埋め,生成モデルにおける説明可能な画像合成の道を開く。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:17:35 GMT)
ManiAgent: An Agentic Framework for General Robotic Manipulation [30.2] 汎用操作のためのエージェントアーキテクチャであるManiAgentを紹介する。
複数のエージェントは、環境認識、サブタスク分解、アクション生成を行うためのエージェント間通信を含む。
ManiAgentはSimplerEnvベンチマークで86.8%、現実世界のピック・アンド・プレイスタスクで95.8%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:03:05 GMT)
A Survey of Multilingual Reasoning in Language Models [30.1] この調査は、言語モデルにおける多言語推論に関する、最初の詳細なレビューを提供する。
本稿では,LMにおける多言語推論のトレーニングに使用される標準データリソースの概要について述べる。
我々は,これらのベンチマークを用いて,様々な最先端手法とその性能を解析する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:09:35 GMT)
Constraint Matters: Multi-Modal Representation for Reducing Mixed-Integer Linear programming [30.0] 本稿では,MILPのための制約に基づく新しいモデル縮小手法を提案する。
提案手法は, 解法の品質を50%以上改善し, 時間を17.47%短縮することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:36:10 GMT)
PPA-Game: Characterizing and Learning Competitive Dynamics Among Online Content Creators [30.0] 本稿では, PPA-Game(Proportional Payoff Allocation Game)について紹介する。
こうしたダイナミクスは、YouTubeやTikTokなどのオンラインレコメンデーションシステム上でコンテンツクリエイターをシミュレートする。
本稿では,各エージェントの累積支払をT$ラウンドで行うことを容易にするオンラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:58:04 GMT)
Improving Generative Behavior Cloning via Self-Guidance and Adaptive Chunking [29.9] ジェネレーティブ・ビヘイビア・クローン(Generative Behavior Cloning)は、ロボット学習のためのシンプルで効果的なフレームワークである。
拡散政策の一貫性と反応性を高めるための2つの新しい手法を提案する。
提案手法は,多種多様なシミュレーションおよび実世界のロボット操作タスクにおいて,GBCの性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:16:34 GMT)
Tokens, the oft-overlooked appetizer: Large language models, the distributional hypothesis, and meaning [29.7] トークン化は多くの言語モデルの現在のアーキテクチャにおいて必要なコンポーネントである。
トークンと事前学習がバイアスやその他の望ましくないコンテンツのバックドアとして機能するかについて議論する。
トークン化アルゴリズムの目的関数が大規模言語モデルの認知に影響を及ぼす証拠を中継する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:25:13 GMT)
Functional Critic Modeling for Provably Convergent Off-Policy Actor-Critic [29.7] 本稿では,機能的批判モデルという新しい概念を導入し,新たなACフレームワークを提案する。
線形関数設定の理論的解析を行い、我々のフレームワークの証明可能な収束を確立する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:20:33 GMT)
Scene Coordinate Reconstruction Priors [29.7] シーン座標回帰(SCR)モデルは、3次元視覚のための強力な暗黙のシーン表現であることが証明されている。
本稿では,SCRモデルの確率論的再解釈について述べる。
より一貫性のあるシーンポイントの雲、より高い登録率、より良いカメラポーズが生まれるのです。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:13:31 GMT)
VIDMP3: Video Editing by Representing Motion with Pose and Position Priors [29.6] 我々は、ポーズと位置の先行を活かして、ソースビデオから一般化された動き表現を学習する新しいアプローチであるVidMP3を紹介する。
本手法により,構造的・意味的柔軟性を保ちながら,元の動きを維持できる新しい動画を生成することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:20:12 GMT)
ResearStudio: A Human-Intervenable Framework for Building Controllable Deep-Research Agents [29.6] 私たちはResearStudioを紹介します。ResearStudioは、リアルタイムなヒューマンコントロールをその中核に配置する最初のオープンソースフレームワークです。
階層的なPlanner-Executorは、すべてのステップをライブの'プラン・アズ・ドキュメント'に書きます。
ユーザーはいつでも、実行を一時停止し、計画やコードを編集し、カスタムコマンドを実行し、再開することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:40:11 GMT)
Optimal Regularization for Performative Learning [29.2] 高次元隆起回帰における影響を研究することにより、正規化がパフォーマンス効果にどう対処できるかを示す。
最適正則化は性能効果の総合的な強さでスケールし、この効果を期待して正則化を設定することができることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:00:08 GMT)
DefenderBench: A Toolkit for Evaluating Language Agents in Cybersecurity Environments [29.2] DefenderBenchは、犯罪、防衛、サイバーセキュリティ知識に基づくタスクに対して言語エージェントを評価するための実用的でオープンソースのツールキットである。
研究者にとって手頃で手頃な価格で手軽に利用でき、公正で厳格な評価を提供するように設計されている。
以上の結果から,Claude-3.7-sonnetが81.65点,Claude-3.7-sonnetが78.40点,Llama 3.3 70Bが71.81点,Claude-3.7-sonnetが71.81点,Claude-3.7-sonnetが最高性能を示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:54:56 GMT)
PAL: Probing Audio Encoders via LLMs - Audio Information Transfer into LLMs [29.0] 大規模言語モデル(LLM)への音声認識の統合は、機械聴取アプリケーションを実現するための新たな研究分野である。
軽量オーディオLLM統合(LAL)の効率的な代替案を提案する。
LALは、LLMの異なるブロックに統合するために、リッチな音声セマンティクスを適切な抽象化レベルでエンコードする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:14:40 GMT)
An Introduction to Sliced Optimal Transport [29.0] Sliced Optimal Transport (SOT) は、一次元OT問題のトラクタビリティを利用する最適輸送(OT)の分岐である。
本稿では, SOTの数学的基礎, 方法論の進歩, 計算方法, 応用について概説する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:29:47 GMT)
BEEP3D: Box-Supervised End-to-End Pseudo-Mask Generation for 3D Instance Segmentation [29.0] 3Dインスタンスのセグメンテーションは複雑な3D環境を理解するのに不可欠だが、完全に教師された手法では高濃度のポイントレベルのアノテーションを必要とする。
ボックスレベルのアノテーションは本質的に重複する領域の曖昧さを導入し、正確なポイント・ツー・インスタンスの割り当てを困難にしている。
最近の手法では、追加の訓練段階において、専用の擬似ラベルをトレーニングすることで擬似マスクを生成することで、この曖昧さに対処している。
BEEP3D-Boxによる3次元インスタンスセグメンテーションのためのエンドツーエンド擬似マスク生成を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:23:18 GMT)
Reinforced Preference Optimization for Recommendation [28.9] 本稿では,レコメンデーションのためのReinforced Preference Optimization for Recommendation (ReRe)を提案する。
ReReは制約ビーム探索を取り入れてサンプリング効率を改善し、ハードネガを多様化する。
ReRe は従来型と LLM ベースのレコメンデータのランク付け性能を一貫して上回っていることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:04:33 GMT)
OmniLens: Towards Universal Lens Aberration Correction via LensLib-to-Specific Domain Adaptation [28.8] オムニレンス(OmniLens)は、(i)堅牢なベースモデルを事前訓練するための包括的カバレッジを持つ説得力のあるLensLibを確立し、(ii)高速なLensLib-to-specificドメイン適応を介して、未知のレンズ記述を持つ特定のレンズ設計にモデルを適応させる。
EAODによって生成されたLensLibは、強力な一般化能力を持つ普遍的なCACモデルを効果的に開発し、PSNRにおいて0.35-1.81dBの非盲点レンズ固有法を改善できることを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:04:30 GMT)
Joint Embedding vs Reconstruction: Provable Benefits of Latent Space Prediction for Self Supervised Learning [28.7] 自己監視学習(SSL)における2つの主要なパラダイムとして再構築と共同埋め込みが登場している。
どちらのアプローチも強力なアドバンテージを提供するが、実践者はそれらを選択するための明確なガイドラインを欠いている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:45:33 GMT)
Retrieval-Augmented Generation with Estimation of Source Reliability [28.7] Reliability-Aware RAG (RA-RAG) は、ソースの信頼性を推定する新しいマルチソースRAGフレームワークである。
RA-RAGはまず、複数のソース間で情報をクロスチェックすることで、ソースの信頼性を推定する。
その後、上位$kappa$の信頼性と関連するソースからドキュメントを検索し、重み付けされた多数決投票(WMV)を使用して情報を集約する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:43:47 GMT)
Uncertainty Quantification for Hallucination Detection in Large Language Models: Foundations, Methodology, and Future Directions [28.6] 大規模言語モデル (LLMs) は、もっともらしいが事実的に誤りな出力を生成する幻覚の傾向にある。
不確実性定量化(UQ)は、この問題に対処する中心的な研究方向として現れている。
幻覚検出におけるUQの役割について検討し、不確実性の定量化が信頼できない世代を識別するメカニズムを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:49:04 GMT)
PricingLogic: Evaluating LLMs Reasoning on Complex Tourism Pricing Tasks [28.6] PricingLogicは、42の現実世界の価格ポリシーから派生した予約要求に基づく300の自然言語質問で構成されている。
LLMの行の評価は、ルール解釈と算術的推論の体系的な失敗を実証し、難易度層における急激な性能低下を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:42:15 GMT)
VLURes: Benchmarking VLM Visual and Linguistic Understanding in Low-Resource Languages [28.4] 本稿では,8つの視覚・言語タスクと,非関連タスクの先駆的機能を備えた新しいベンチマークVLUReを紹介する。
我々のデータセットには10の多様な画像カテゴリとリッチテキストコンテキストが含まれており、スワヒリ語とウルドゥー語に貴重な視覚言語リソースを導入しています。
最高のパフォーマンスモデルであるGPT-4oは、全体的な精度を90.8%、人間のパフォーマンスを6.7%向上させるが、オープンソースモデルでは差が大きい。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:41:43 GMT)
Improved Central Limit Theorem and Bootstrap Approximations for Linear Stochastic Approximation [28.3] 我々は、ポリャク=ジュディツキー中心極限定理によって予測される共分散行列を持つガウス分布による正規近似を考える。
平均化LSA推定器の再スケール誤差の分布を近似するために,乗算器ブートストラップ法の非漸近的妥当性を証明した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:50:10 GMT)
Graph Few-Shot Learning via Adaptive Spectrum Experts and Cross-Set Distribution Calibration [28.3] グラフによる数ショット学習は、ラベル付きノードに制限のある新しいタスクにモデルを迅速に適応できる能力によって、注目を集めている。
本稿では,アダプティブスペクトルの専門家とクロスセット分布キャリブレーション技術を統合した新しいグラフ数ショット LeRning フレームワーク GRACE を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:39:03 GMT)
Phenome-Wide Multi-Omics Integration Uncovers Distinct Archetypes of Human Aging [28.2] 我々は、多様な健康結果と将来の病気リスクを確実に予測するマルチオミクス老化時計を開発した。
マルチオミクスによる統合分子プロファイルの無監督クラスタリングにより、老化の異なる生物学的サブタイプが明らかになった。
これらの知見は、高齢者関連疾患の予防のためのパーソナライズされたヘルススパンモニタリングと精度戦略の基礎となった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:00:51 GMT)
MatSciBench: Benchmarking the Reasoning Ability of Large Language Models in Materials Science [28.1] MatSciBenchは1,340の問題からなる総合的な大学レベルのベンチマークである。
MatSciBenchは、物質科学の質問を6つの主要分野と31の亜分野に分類する構造的できめ細かな分類を特徴としている。
先行モデルの評価によると、最高のパフォーマンスモデルであるGemini-2.5-Proでさえ、大学レベルの材料科学の質問に対して80%未満の精度で達成されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:59:40 GMT)
Offline Fictitious Self-Play for Competitive Games [28.0] オフライン強化学習(RL)は、オンラインインタラクションなしで、固定データセットからポリシーの改善を可能にする。
本稿では,FF-FSPを提案する。
マトリックスゲーム、広角ポーカー、ボードゲームの実験は、OF-FSPが最先端のベースラインよりもはるかに低いエクスプロイラビリティを実現することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:01:55 GMT)
HEAL: An Empirical Study on Hallucinations in Embodied Agents Driven by Large Language Models [27.7] 本研究では,大規模な言語モデルにおいて,シーン・タスクの不整合下での長時間の作業を行う幻覚に関する最初の体系的研究について述べる。
私たちのゴールは、幻覚の発生範囲、どのような不整合が引き起こされるか、現在のモデルがどのように反応するかを理解することです。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:44:12 GMT)
Reasoning Pattern Matters: Learning to Reason without Human Rationales [27.7] 大規模言語モデル(LLM)は、広く採用されているSFT+RLVRパラダイムの下で顕著な推論能力を示している。
本稿では,推論性能を損なうことなく,合理的アノテーションのコストを大幅に削減する方法について検討する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:34:38 GMT)
Dimension Reduction with Locally Adjusted Graphs [27.6] LocalMAPは、この課題に対処するためにグラフを動的かつ局所的に調整する次元削減アルゴリズムである。
生物データセットのケーススタディを通じて、ローカルマップの利点を実証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:24:22 GMT)
A Non-overlap-based Conflict Measure for Random Permutation Sets [27.2] 置換質量関数で表される2つの証拠の衝突を測定することは、順に構造化された不確実な情報融合において、急激な研究課題である。
まず、ランクバイアスオーバーラップ(RBO)尺度に着想を得た順列間の不整合度尺度を定義し、さらにRPSに対する非オーバーラップベースの競合度測定法を提案する。
いくつかの数値的な例は、提案した競合尺度の挙動と性質を示すために用いられる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:35:03 GMT)
Hands-Free Heritage: Automated 3D Scanning for Cultural Heritage Digitization [27.1] ハンドヘルドトレーやセミオートマチックトレーを不要とした自動2ロボットスキャンシステムを提案する。
本システムは,走査空間を異なる領域にパラメータ化することで,スキャナ付きロボットとトレイハンドリングロボットの協調動作計画を可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:30:26 GMT)
Multi-Armed Bandits with Minimum Aggregated Revenue Constraints [27.1] 我々は、楽観的にパフォーマンスを優先するか、悲観的に制約満足度を強制するアルゴリズムを設計、分析する。
結果の時間的地平線への依存が一般に最適であることを示す下界を確立する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:47:34 GMT)
Neural Guided Sampling for Quantum Circuit Optimization [26.9] 量子回路を特定のハードウェアトポロジーに変換し、利用可能なゲートのセットを減らし、トランスパイレーション(transpilation)としても知られ、等価回路の長さが大幅に増加する。
効率的なトランスパイレーションに対処する1つの方法は、例えばランダムサンプリングとトークン置換戦略を用いて最適化から知られているアプローチに基づいている。
本稿では,量子回路の2次元表現が与えられた場合,ニューラルネットワークは量子回路のゲート群を予測する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:09:05 GMT)
On the Limits of Language Generation: Trade-Offs Between Hallucination and Mode Collapse [26.7] 未知の言語からのサンプルを考えると、言語モデルはトレーニングで見えない有効な文字列を生成するべきである。
そうでなければ、無効な文字列を出力することは「幻覚」を構成し、全範囲のキャプチャーに失敗すると「モード崩壊」につながる。
我々は,ゴールドとアングルインをベースとした統計的言語生成システムにおいて,これを検証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:07:45 GMT)
Attention-Aware GNN-based Input Defense against Multi-Turn LLM Jailbreak [26.7] 大規模言語モデル(LLM)は様々なアプリケーションで大きな注目を集めているが、その能力は建設的かつ悪意のあるエクスプロイトのリスクをもたらす。
近年、マルチターン攻撃の出現により、この脆弱性が強化されている。
本稿では,G-Guardを紹介した。G-Guardは,マルチターン・ジェイルブレイク攻撃に対する防御に特化して設計された,GNNベースの入力分類器である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:28:48 GMT)
Fairness-Constrained Optimization Attack in Federated Learning [26.4] フェデレーション・ラーニング(Federated Learning, FL)は、人口統計学における参加者間のコラボレーションを促進する、プライバシ保護機械学習技術である。
本稿では,クライアントが不正にバイアス付きモデルを送信する意図的公正攻撃を提案する。
我々は,現在最先端のビザンチン・ロバストとフェアネス・アウェア・アグリゲーション・スキームに対する,異なるデータセットに対する攻撃を評価した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:49:53 GMT)
Evolution of meta's llama models and parameter-efficient fine-tuning of large language models: a survey [26.3] 本稿では,Meta AIのLLaMA(Large Language Model Meta AI)シリーズの急速な進化を概観する。
まず,基礎モデルのLLaMAファミリとそのアーキテクチャ,重要な性能特性について述べる。
次に,PEFTの概念について述べる。PEFTは,少数のパラメータのみを更新することで,大規模な事前学習モデルに適応する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:12:44 GMT)
Doctor Rashomon and the UNIVERSE of Madness: Variable Importance with Unobserved Confounding and the Rashomon Effect [26.3] rashomon SEts (UNIVERSE) を用いた可変インポートアンセシスのためのunobservables and Inferenceについて紹介する。
我々のアプローチでは、データセットのほぼ最適モデルの集合であるRashomon集合に適応して、機能不足であっても真のVI上のバウンダリを生成します。
提案手法のロバスト性を理論的に保証し,半合成シミュレーションで高い性能を示し,その有効性を信用リスクタスクで実証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:12:28 GMT)
Stable Minima of ReLU Neural Networks Suffer from the Curse of Dimensionality: The Neural Shattering Phenomenon [26.0] 平坦さ/低(ロス)曲率の暗黙バイアスとそのReLUネットワークの一般化への影響について検討する。
平坦性は一般化を示唆するが, 入力次元が大きくなるにつれて収束速度は指数関数的に低下する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:49:26 GMT)
Highlighting What Matters: Promptable Embeddings for Attribute-Focused Image Retrieval [25.9] 我々は属性中心クエリの処理において,現在のテキスト・トゥ・イメージ(T2I)レトリバーを評価する。
CLIPライクなレトリバーは性能が悪く不均衡であることがわかった。
本稿では,これらのマルチモーダルレトリバーで実現可能な高速な画像埋め込みを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:54:44 GMT)
Tracing Multilingual Knowledge Acquisition Dynamics in Domain Adaptation: A Case Study of English-Japanese Biomedical Adaptation [25.9] 多言語ドメイン適応(ML-DA)は、言語間の新しいドメイン知識を大規模言語モデル(LLM)に学習するために広く用いられている。
本研究では,ML-DA における LLM の学習力学について検討する。
AdaXEvalは、トレーニングに使用される同じバイリンガルドメインコーパスから複数選択QAデータセットを構築する適応評価手法である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:34:17 GMT)
KVCOMM: Online Cross-context KV-cache Communication for Efficient LLM-based Multi-agent Systems [25.8] KVCOMMは、マルチエージェント推論における効率的なプリフィルを可能にする、トレーニング不要のフレームワークである。
KVCOMMはキャッシュされたサンプル終端アンカーのプールを参照することにより、共有コンテンツのKVキャッシュを推定し、調整する。
KVCOMMは多様なマルチエージェントワークロード間で70%以上の再利用率を達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:00:01 GMT)
$\mathbf{T^3}$: Reducing Belief Deviation in Reinforcement Learning for Active Reasoning [25.6] 本稿では,モデル信念の逸脱を追跡し,過剰な信念の逸脱を検出し,不定形尾を除去するために軌道を乱す単純な方法であるmathbfT3$を開発することを提案する。
$mathbfT3$は、トレーニングの安定性、トークン効率、最終的なパフォーマンスを継続的に向上し、ロールアウトトークンを約25%カットしながら最大30%のゲインを達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:14:49 GMT)
SENTINEL: A Multi-Level Formal Framework for Safety Evaluation of LLM-based Embodied Agents [25.6] 本稿では,Large Language Model(LLM)ベースのエンボディエージェントの物理的安全性を公式に評価する最初のフレームワークであるSentinelを紹介する。
我々は、VirtualHomeとALFREDにSentinelを適用し、多様な安全性要件に対して複数のLDMベースのエンボディエージェントを正式に評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:53:51 GMT)
Toward Reasoning-Centric Time-Series Analysis [25.1] 現実の環境では、効果的な分析は表面的な傾向を超えて、それらを動かす実際の力を明らかにする必要がある。
近年のLarge Language Models (LLMs) は時系列分析を再考する新たな機会を提供する。
本稿では,LLMを用いた時系列を因果構造と説明可能性の優先順位付け作業として再考する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:59:07 GMT)
Adaptive Dual Reasoner: Large Reasoning Models Can Think Efficiently by Hybrid Reasoning [24.8] 本稿では,2つの推論モード – 高速思考とスロー思考 – をサポートするアダプティブデュアル推論手法を提案する。
ADRは、推論中の文脈的複雑さに基づいて、これらのモードを交互に扱う。
最先端アプローチ間の推論性能と効率の効果的なバランスを実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:51:57 GMT)
A Survey on Collaborating Small and Large Language Models for Performance, Cost-effectiveness, Cloud-edge Privacy, and Trustworthiness [24.7] 大規模言語モデル(LLM)は、多くのドメインやアプリケーションに進化しているが、高い微調整コスト、推論レイテンシ、限定されたエッジデプロイ可能性、信頼性の懸念に直面している。
最近の研究は、SLMの特殊化と効率をLLMの一般化と推論と融合させ、多様な目的を満たすための協調的な枠組みを探求している。
性能向上,コスト効率,クラウドエッジプライバシ,信頼性の4つの目標を掲げた分類法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:16:47 GMT)
Taming Text-to-Image Synthesis for Novices: User-centric Prompt Generation via Multi-turn Guidance [24.4] DialPromptは対話ベースのTISプロンプト生成モデルで、初心者のユーザーエクスペリエンスを強調している。
これを実現するために、先進的なユーザからの高品質なプロンプトのための15の必須次元をマイニングし、マルチターンデータセットをキュレートした。
実験によると、DialPromptは既存のアプローチに比べてユーザ中心のスコアを大幅に改善している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:27:19 GMT)
MobileCity: An Efficient Framework for Large-Scale Urban Behavior Simulation [24.3] 我々は,高計算効率で現実的な都市移動をモデル化する軽量なシミュレーションプラットフォームMobileCityを提案する。
本稿では,複数の輸送モードを有する総合交通システムを導入し,回答者のアンケートデータを収集してエージェントプロファイルを構築する。
スケーラブルなシミュレーションを実現するため、エージェントは事前に生成されたアクション空間内でアクション選択を行い、ローカルモデルを使用してエージェントメモリの効率的な生成を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:38:21 GMT)
Structure-aware Propagation Generation with Large Language Models for Fake News Detection [24.3] ソーシャルメディアでのフェイクニュースの拡散は、公衆の信頼と社会的安定に深刻な脅威をもたらす。
最近の研究は、大規模な言語モデル(LLM)を利用して合成伝搬を生成するが、一般的には現実世界の議論の構造パターンを見落としている。
本研究では, 実伝搬から構造力学を完全に捉えるために, 構造認識型合成伝搬強調検出(StruSP)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:54:40 GMT)
Chimera: State Space Models Beyond Sequences [24.3] 我々は,データトポロジを直接原理的に組み込む統一モデルであるChimeraを紹介した。
実験の結果,Chimeraは言語,視覚,グラフ領域で高い性能を発揮することがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:27:57 GMT)
DMSC: Dynamic Multi-Scale Coordination Framework for Time Series Forecasting [24.2] 時系列予測(TSF)は、さまざまなスケールにわたる複雑な時間的依存関係をモデル化する上で、永続的な課題に直面します。
マルチスケールパッチ分解ブロック(EMPD)、トライアドインタラクションブロック(TIB)、適応スケールルーティングMoEブロック(ASR-MoE)を備えた新しい動的マルチスケールコーディネーションフレームワーク(DMSC)を提案する。
EMPDは、指数関数的にスケールした粒度を持つ階層的なパッチにシーケンスを動的に分割する組み込みコンポーネントとして設計されている。
TIBは、各レイヤの分解された表現の中で、パッチ内、パッチ間、およびクロス変数の依存関係を共同でモデル化する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:19:37 GMT)
KnowledgeSmith: Uncovering Knowledge Updating in LLMs with Model Editing and Unlearning [23.6] 知識編集と機械学習は、大規模言語モデル(LLM)が最新の状態を維持するための一般的なアプローチである。
本稿では,LLMの更新メカニズムを体系的に理解するための統合フレームワークであるKnowledgeSmithを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:32:32 GMT)
GeoRanker: Distance-Aware Ranking for Worldwide Image Geolocalization [23.3] 画像ジオローカライズのための距離対応ランキングフレームワークGeoRankerを提案する。
絶対距離と相対距離の両方をランク付けする多階距離損失を導入し、構造的空間関係をモデル化する。
GeoRankerは、2つの確立されたベンチマークで最先端の結果を達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:13:43 GMT)
Memory as Action: Autonomous Context Curation for Long-Horizon Agentic Tasks [23.2] 大規模言語モデルは、長期のエージェントタスクにおいて課題に直面します。
既存のワーキングメモリメソッドは、エージェントのコアポリシーから切り離された外部メカニズムに依存している。
本稿では,一貫したポリシーの一部として明示的な編集操作を実行することで,エージェントが作業メモリを積極的に管理する新しいフレームワーク,Memory-as-Actionを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:29:57 GMT)
SMILE: SeMantic Ids Enhanced CoLd Item Representation for Click-through Rate Prediction in E-commerce SEarch [23.1] セマンティックIDの融合アライメントに基づくアイテム表現拡張手法SMILEを提案する。
具体的には、RQ-OPQエンコーディングを用いてアイテムの内容と協調情報を定量化し、2段階のアライメントを行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:58:50 GMT)
Protein Design with Dynamic Protein Vocabulary [23.0] 機能記述のためのテキストエンコーダと、タンパク質を設計するためのタンパク質言語モデルと、タンパク質断片を動的に検索するフラグメントエンコーダを統合した、新規なタンパク質設計アプローチであるProDVaを紹介する。
最先端のモデルと比較して、ProDVaはトレーニングデータの0.04%未満で同等の機能アライメントを実現し、さらによく折りたたまれたタンパク質を設計する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:04:33 GMT)
ACCO: Accumulate While You Communicate for Communication-Overlapped Sharded LLM Training [22.9] 分散学習LLMのためのメモリ効率最適化アルゴリズムを提案する。
新しい処理を計算しながら遅延勾配を同期することにより、ACCOはGPUアイドル時間を短縮し、異種ハードウェアをサポートする。
ZeRO-1と比較して、我々のアプローチは大幅に高速で、異種ハードウェアで効果的にスケールできる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:26:33 GMT)
Investigating Faithfulness in Large Audio Language Models [22.9] 忠実さは、チェーンオブ思想表現がモデルの決定過程を正確に反映しているかどうかを測り、信頼性のある説明として使用することができる。
本稿では,複数のLALMが生成するCoTの忠実度を,対象とする介入を適用して検討する。
上記のいくつかのデータセットやタスクにわたる介入を経た上で、私たちの実験は、LALMが一般的に、根底にある意思決定プロセスに忠実であるように見えるCoTを生成することを示唆しています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:24:33 GMT)
Stratos: An End-to-End Distillation Pipeline for Customized LLMs under Distributed Cloud Environments [22.7] サーバとモデルの選択,知識蒸留,分散クラウド環境への展開を自動化する,エンドツーエンドのLCM蒸留パイプラインであるStratosを提案する。
実験の結果,Stratosは,逆合成データと知識注入を用いたドメイン固有のMahjong推論タスクに基づいて,GPT-4o教師ベースラインの4倍の精度で学生モデルを生成することがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:12:14 GMT)
Deep Generative Prior for First Order Inverse Optimization [22.6] 逆設計最適化は、観測された解からシステムパラメータを推論することを目的としている。
多くの系における明示的な数学的表現の欠如はこの過程を複雑にしている。
生成AIやベイジアン最適化を含む主流のアプローチは、これらの課題に対処するが、制限がある。
本稿では,代用機械学習モデルを用いた一階勾配に基づく逆最適化を実現する新しい手法であるDeep Physics Prior (DPP)を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:51:44 GMT)
OpenLex3D: A Tiered Evaluation Benchmark for Open-Vocabulary 3D Scene Representations [22.0] 3Dシーン理解は、自然言語による対話を可能にするオープン語彙言語モデルによって変換されている。
この研究はOpenLex3Dという3次元オープン語彙シーン表現を評価するためのベンチマークを提示する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:14:38 GMT)
An Investigation of Memorization Risk in Healthcare Foundation Models [21.9] 構造化されたEHRデータに基づいてトレーニングされた基礎モデルのプライバシー関連リスクを評価するためのブラックボックス評価テストスイートを導入する。
本フレームワークは, 組込みと生成の両レベルでの記憶の探索方法と, モデル一般化と有害記憶の区別を目的とした。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:55:07 GMT)
LazyEviction: Lagged KV Eviction with Attention Pattern Observation for Efficient Long Reasoning [21.8] Chain-of-Lazy推論はキー値(KV)キャッシュの増加によるメモリオーバーヘッドをもたらす。
既存のKVキャッシュ圧縮手法は、メモリボトルネックを軽減するが、長い推論タスクに苦労する。
textbfThoughtEvictionは、遅延繰り返しトークンを保持する観測窓ベースのラッチ消去フレームワークである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:14:57 GMT)
CompoDistill: Attention Distillation for Compositional Reasoning in Multimodal LLMs [21.7] 本研究では,学生の視覚認知能力を高めるために,教師の視覚的注意と教師の視覚的注意を一致させるフレームワークであるCompoDistillを提案する。
実験の結果,CompoDistillは視覚的知覚能力を必要とする構成的推論タスクの性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:27:26 GMT)
Beyond-classical computation in quantum simulation [21.5] 超伝導量子アニールプロセッサは、シュリンガー方程式の解と密に一致してサンプルを生成することができることを示す。
本研究では, 2次元, 3次元, 無限次元スピングラスの模型クエンチ力学における絡み合いの領域-法則スケーリングを実証する。
テンソルネットワークとニューラルネットワークに基づくいくつかの先行近似手法は、量子アニールと同様の精度を達成できないことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:21:53 GMT)
Triplet-Structured Knowledge Integration for Multi-Turn Medical Reasoning [21.4] 大規模言語モデル(LLM)は静的医療質問応答(QA)タスクにおいて高いパフォーマンスを示している。
本稿では,LLMの推論信頼性を高める三重構造アプローチであるTriMediQを紹介する。
2つのインタラクティブな医療QAベンチマークの実験によると、TriMediQは既存の5つのベースラインよりも最大10.4%精度が向上している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:40:04 GMT)
BIGFix: Bidirectional Image Generation with Token Fixing [21.4] サンプルトークンを反復精製することで画像生成を自己補正する手法を提案する。
我々は,ランダムトークンを文脈に注入し,ロバスト性を向上し,サンプリング中のトークンの固定を可能にする,新しいトレーニング手法によりこれを実現する。
我々は、ImageNet-256とCIFAR-10データセットを用いた画像生成と、UCF-101とNuScenesによるビデオ生成のアプローチを評価し、両モード間で大幅に改善した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:34:44 GMT)
Can LLMs Reason Structurally? An Evaluation via the Lens of Data Structures [21.4] DSR-Benchは,大規模言語モデルの構造的推論を体系的に評価する最初のベンチマークである。
ベンチマークは、20のデータ構造、35の操作、および、最小限の汚染で合成生成された4,140の問題インスタンスにまたがる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:24:23 GMT)
Learning Human Motion with Temporally Conditional Mamba [21.4] 本研究では,人間の動作生成のための新しいマンバモデルであるテンポラリーコンディショナル・マンバを紹介する。
提案手法は条件情報をMambaブロックの繰り返し力学に統合し,時間的整合性の向上を実現する。
我々のモデルは、最先端アプローチに対する時間的アライメント、動きリアリズム、条件整合性を大幅に改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:29:51 GMT)
Research in Collaborative Learning Does Not Serve Cross-Silo Federated Learning in Practice [21.3] クロスサイロ・フェデレーション・ラーニング(FL)は、プライベートデータを直接共有することなく、機械学習モデル開発におけるクロスオーガナイズ・コラボレーションを可能にする、有望なアプローチである。
HIPAAなどのデータ保護規制によって組織的関心が高まりつつあるにもかかわらず、実際にはクロスサイロFLの採用は限られている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:48:44 GMT)
Finite Sample Analysis of Linear Temporal Difference Learning with Arbitrary Features [21.2] 本稿では、任意の機能の下で線形TD($lambda$)演算に対する最初の$L2$収束率を確立する。
任意の特徴から生じる解の潜在的非特異性に対処するために、単一点ではなく解集合への収束率を特徴とする新しい近似結果を開発する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:30:58 GMT)
UVE: Are MLLMs Unified Evaluators for AI-Generated Videos? [21.2] 本稿では,AI生成ビデオ(AIGV)の統一評価手段として,マルチモーダル大言語モデル(MLLM)の有用性について検討する。
UVE-Benchは、最先端のVGMが生成したビデオを収集し、15の評価側面で相互に人間の好みのアノテーションを提供する。
実験結果から,高度なMLLMは人間の評価に遅れを取っているものの,AIGVの統一評価において有望な能力を示し,既存の評価手法をはるかに上回っていることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:43:05 GMT)
CrossAD: Time Series Anomaly Detection with Cross-scale Associations and Cross-window Modeling [21.1] 時系列異常検出は、幅広い現実世界の応用において重要な役割を果たす。
既存の手法は、しばしば個別にマルチスケール情報をモデル化するか、単純な機能融合戦略に依存している。
そこで我々は,クロススケールアソシエーションとクロスウィンドウモデリングを考慮した時系列異常検出のための新しいフレームワークであるCrossADを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:24:02 GMT)
Your Pre-trained LLM is Secretly an Unsupervised Confidence Calibrator [20.8] ポストトレーニングされた言語モデル(PoLM)は、しばしば過剰な自信に悩まされ、正しい出力と間違った出力の両方に高い信頼を割り当てる。
PoLMの校正における大きな障害は、個々の下流タスクのためのラベル付きデータの不足である。
本稿では,時間後信頼度校正におけるパラメータを最適化するために,DACA(Disagreement-Aware Confidence Alignment)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:57:00 GMT)
TreeDiffusion: Hierarchical Generative Clustering for Conditional Diffusion [20.8] 本稿では,学習した階層的クラスタ表現に拡散モデルを適用した,深い生成モデルであるTreeDiffusionを紹介する。
階層的クラスタ表現における条件付き拡散モデルにより,実世界のデータセットにおける生成性能が向上することが実証された。
提案手法は,VAEに基づくクラスタリング手法の学習構造を利用した生成的限界に対処する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:23:13 GMT)
EMSEdit: Efficient Multi-Step Meta-Learning-based Model Editing [20.7] EMSEditはメタラーニングベースのモデル編集の軽量な代替品である。
EMSEditは、シーケンシャルおよびバッチ編集の両方において、最先端のメソッドよりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:01:00 GMT)
Towards Robust and Realible Multimodal Misinformation Recognition with Incomplete Modality [20.6] ソーシャルメディアプラットフォーム上に巨大なマルチモーダルフェイクコンテンツが出現するに伴い、マルチモーダル誤情報認識が緊急課題となっている。
我々は、MMLNet(Multi-expert Modality-Incomplete Learning Network)と呼ばれる、新しい汎用的で堅牢なマルチモーダル融合戦略を提案する。
MMLNetを2つの言語にまたがる3つの実世界のベンチマークで評価し、最先端の手法と比較して優れた性能を示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:45:02 GMT)
Knowledge Fusion via Bidirectional Information Aggregation [20.3] 知識グラフ(KG)はセマンティックウェブの基盤であり、現実世界の実体と関係の最新の表現を提供する。
大規模言語モデル(LLM)は、事前トレーニング後にほとんど静的のままであり、内部知識は時代遅れになり、時間に敏感なWebアプリケーションでは実用性が制限される。
我々は,外部KGをパラメータ修正なしに,推論時にのみ外部KGをLLMに動的に統合する新しいフレームワークKGAを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:35:49 GMT)
HackWorld: Evaluating Computer-Use Agents on Exploiting Web Application Vulnerabilities [20.2] HackWorldは、視覚的インタラクションを通じてWebアプリケーションの脆弱性を悪用するコンピュータ利用エージェントの機能を評価するための最初のフレームワークである。
11のフレームワークと7つの言語にまたがる36の現実世界のアプリケーションが含まれており、インジェクションの脆弱性、認証バイパス、安全でない入力処理といった現実的な欠陥を特徴としている。
複雑なWebインターフェースをナビゲートしながら、これらの弱点を特定し、活用するためのCUAの能力をテストする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:52:15 GMT)
How to Train Your Metamorphic Deep Neural Network [20.2] ニューラル・メタモルファス(NeuMeta)は、様々な幅と深さのニューラルネットワークを生成するための最近のパラダイムである。
我々は,NeuMetaの能力を拡張したトレーニングアルゴリズムを提案し,精度の低下を最小限に抑えたフルネットワーク・メタモルフォーシスを実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:14:33 GMT)
Steering Large Language Models for Machine Translation Personalization [20.2] サンプルが少ない場合に自動的に生成された翻訳をパーソナライズするための様々な戦略を検討する。
スパース・オートエンコーダ (SAE) 潜入者による相対的ステアリングに着目し, パーソナライズ特性の同定を行った。
コントラスト型SAEステアリングは、堅牢なスタイル条件付けと翻訳品質をもたらし、推論時間の計算効率が向上することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:28:41 GMT)
Laminar: A Scalable Asynchronous RL Post-Training Framework [20.1] RL軌道生成における長い尾の歪みは、重いGPU不使用を引き起こす。
現在のRLシステムはアクターとロールアウト間のグローバルな重量同期に依存しており、厳密なモデル更新スケジュールを生成する。
完全に分離されたアーキテクチャ上に構築されたスケーラブルで堅牢なRLポストトレーニングシステムであるLaminarを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:29:14 GMT)
Stronger Together: On-Policy Reinforcement Learning for Collaborative LLMs [20.1] マルチエージェントシステム(MAS)と強化学習(RL)は,大規模言語モデル(LLM)のエージェント能力を高めるために広く利用されている。
政治上のRLをMASに適用することはまだ未熟であり、ユニークな課題を提示している。
我々は,エージェントとターンワイドなグループ化RLアルゴリズムをMASに適合させるAT-GRPOと,単一・複数政治体制をサポートするトレーニングシステムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:12:45 GMT)
Model-Based Ranking of Source Languages for Zero-Shot Cross-Lingual Transfer [20.0] NN-Rankは、言語間移動のためのソース言語ランキングのアルゴリズムである。
51のソース言語と56と72のターゲット言語をPOSとNERで評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:53:32 GMT)
GTCN-G: A Residual Graph-Temporal Fusion Network for Imbalanced Intrusion Detection (Preprint) [20.0] 本稿では,Gated Temporal Convolutional Network and Graph (GTCN-G) という新しいディープラーニングフレームワークを提案する。
本モデルでは,ネットワークフローから階層的時間的特徴を抽出するためのGated TCN (G-TCN) を,基礎となるグラフ構造から学習するためのグラフ畳み込みネットワーク (GCN) を用いて一意に融合させる。
中心となるイノベーションは、グラフ注意ネットワーク(GAT)を通じて実装された残留学習メカニズムの統合にある。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:01:16 GMT)
Physics-Informed Autonomous LLM Agents for Explainable Power Electronics Modulation Design [20.0] 電力変換器の変調設計を自動化するLLM駆動システムPHIA(Physics-Informed Autonomous Agent)を紹介する。
従来のパイプラインベースの手法とは対照的に、PHIAにはLLMベースの計画モジュールが組み込まれており、設計要件をインタラクティブに取得し検証している。
実験の結果、PHIAは第2のベンチマークと比べて標準平均絶対誤差を63.2%削減し、全体的な設計プロセスを33倍以上加速した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:10:53 GMT)
Over-Threshold Multiparty Private Set Intersection for Collaborative Network Intrusion Detection [20.0] プライバシを保存するIPアドレスのコレクションを提示する。
このプロトコルでは、$N$参加者は、他のIPアドレスに関する情報を公開せずに、少なくとも$t$参加者のセットに現れるIPアドレスを識別する。
通信オーバヘッドの増加によるセキュリティ保証の強化を実現するコラシオンセーフデプロイメントと,非凝固コレクタを前提とした非インタラクティブデプロイメントという,通信コストを大幅に削減する,2つのデプロイメントオプションを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:58:58 GMT)
Cottontail: Large Language Model-Driven Concolic Execution for Highly Structured Test Input Generation [19.9] CottontailはLLM(Large Language Model)による新しいコンコリック実行エンジンである。
より完全なプログラムパス表現であるExpressive Structure Coverage Tree (ESCT)が最初に構築され、構造を考慮したパス制約を選択する。
Solve-Complete パラダイムに基づく制約解法は、制約に適合するだけでなく、入力構文にも有効であるテスト入力を得るために、パス制約を解くように設計されている。
履歴誘導型シード取得を用いて、テスト開始前またはテストが飽和した後に、新しい高度に構造化されたテスト入力を得る。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:46:58 GMT)
GenCellAgent: Generalizable, Training-Free Cellular Image Segmentation via Large Language Model Agents [19.8] GenCellAgentは、スペシャリストセグメンタとジェネラリストビジョン言語モデルをオーケストレーションする、トレーニング不要なマルチエージェントフレームワークである。
新しいデータセットから得られる小胞体とミトコンドリアでは、GenCellAgentは専門モデルよりも平均IoUを37.6%改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:02:57 GMT)
Your VAR Model is Secretly an Efficient and Explainable Generative Classifier [19.6] 視覚自己回帰モデリングの最近の進歩に基づく新しい生成モデルを提案する。
VAR法は拡散法と根本的に異なる性質を示す。
特に, VARに基づく分類器は, 難易度が高いため, トークン単位の相互情報による視覚的説明が可能である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:59:01 GMT)
FlagEval Findings Report: A Preliminary Evaluation of Large Reasoning Models on Automatically Verifiable Textual and Visual Questions [19.5] 我々は,現在の大推理モデル (LRM) の評価を行い,いくつかの予備的な知見を得た。
また、視覚的手がかりから推論をテストすることを目的とした視覚言語モデルの評価ベンチマークROMEもリリースした。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:25:36 GMT)
Enhancing Neural Code Representation with Additional Context [19.4] 最近のディープラーニングモデルは一般的に、バージョン履歴や構造的関係といったコンテキスト情報を見渡すために、ソースコードのみに依存しています。
このような文脈信号によるコード表現の強化がニューラルモデルの性能に与える影響について実証的研究を行った。
5つの代表モデル(CodeBERT、GraphCodeBERT、CodeT5、PLBART、ASTNN)は、コード専用およびコンテキスト拡張設定の下で微調整される。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:45:42 GMT)
MedKGEval: A Knowledge Graph-Based Multi-Turn Evaluation Framework for Open-Ended Patient Interactions with Clinical LLMs [19.1] MedKGEvalは、臨床用大規模言語モデルのための新しいマルチターン評価フレームワークである。
知識グラフ駆動患者シミュレーション機構は、キュレートされた知識グラフから関連する医療事実を検索する。
ターンレベル評価フレームワークは、各モデル応答を臨床的適切性、事実的正当性、安全性について評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:22:26 GMT)
Limited Preference Data? Learning Better Reward Model with Latent Space Synthesis [19.1] リワードモデリングは、大きな言語モデルと人間の嗜好の整合に不可欠である。
既存のテキストデータ合成手法は計算コストが高い。
本稿では,言語に潜む埋め込み空間において,好みデータを直接合成するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:45:25 GMT)
MVP4D: Multi-View Portrait Video Diffusion for Animatable 4D Avatars [18.9] 我々は、単一の参照画像とターゲット表現に基づいて、デジタル人間のアニマタブルなマルチビュービデオを生成するビデオモデルを構築した。
MVP4Dは、最先端の訓練済みビデオ拡散モデルに基づいており、対象物体の周囲に最大360度まで変化する視点から数百フレームを同時に生成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:56:14 GMT)
IL3D: A Large-Scale Indoor Layout Dataset for LLM-Driven 3D Scene Generation [18.8] 大規模言語モデル(LLM)駆動の3Dシーン生成のための大規模データセットであるIL3Dを提案する。
IL3Dには、視覚言語タスクのための堅牢なマルチモーダル学習をサポートするために、インスタンスレベルの自然言語アノテーションが備わっている。
汎用的で堅牢な資源として、IL3Dは3Dシーン生成とインボディードインテリジェンスの研究を著しく進めている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:02:33 GMT)
DoctorAgent-RL: A Multi-Agent Collaborative Reinforcement Learning System for Multi-Turn Clinical Dialogue [18.8] 大規模言語モデル (LLMs) は, バイオメディカルな質問応答の分野で優れた能力を発揮してきたが, 実際の臨床研究への応用はいまだに課題に直面している。
我々は,医療相談を不確実性下での動的意思決定プロセスとしてモデル化する,強化学習(RL)に基づくマルチエージェント協調フレームワークであるOursを提案する。
本手法は,医療資源の配分を最適化し,労働力不足を緩和する戦略の草分けとして,時間的プレッシャーによる誤診リスクの低減,複雑な症例に対する臨床医の解放,医療資源配分の最適化,労働力不足の緩和など,極めて実践的な価値を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:26:01 GMT)
The Robustness of Differentiable Causal Discovery in Misspecified Scenarios [18.8] 因果発見は、変数間の因果関係をターゲットデータから学習することを目的としている。
異なる因果発見法は,構造的ハミング距離と構造的干渉距離の指標の下で堅牢性を示すことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:33:06 GMT)
Adaptive Generation of Bias-Eliciting Questions for LLMs [18.6] 大規模言語モデル(LLM)は現在、ユーザ向けアプリケーションに広くデプロイされており、世界中で数億に達しています。
我々は,性,人種,宗教などのセンシティブな属性に対して,現実的でオープンな質問を自動的に生成する,反現実的バイアス評価フレームワークを導入する。
また、非対称な拒絶や偏見の明示的な認識など、ユーザインタラクションにますます関係する異なる応答次元も捉えています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:08:10 GMT)
StyleDecipher: Robust and Explainable Detection of LLM-Generated Texts with Stylistic Analysis [18.4] StyleDecipherは堅牢で説明可能な検出フレームワークである。
組み合わせた特徴抽出器を用いてテキスト検出を再検討し、構造的差異を定量化する。
常に最先端のドメイン内精度を達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:07:27 GMT)
PAINT: Parallel-in-time Neural Twins for Dynamical System Reconstruction [18.3] 我々はニューラルツインを、実際のシステムのデジタルレプリカを作成することを目的として、ニューラルサロゲートの進歩として想定する。
神経双生児はテスト時に測定値を消費して状態を更新し、コンテキスト固有の意思決定を可能にする。
本稿では,動的システムを計測からモデル化するためのアーキテクチャに依存しない手法であるParallel-in-time Neural Twins (PAINT)を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:22:45 GMT)
Faster State Preparation with Randomization [18.3] 階層的な振幅構造を持つ状態の精度・コストトレードオフを改善するランダム化プロトコルを提案する。
ランダム化アンサンブルは, 決定論的トラルンケーション法に対して, トレース距離誤差の2次的改善を実現することを厳密に証明する。
この方法は、短期および耐故障性量子デバイスで準備可能な状態のクラスを広げる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:57:06 GMT)
Simulating and Understanding Deceptive Behaviors in Long-Horizon Interactions [18.2] 大規模言語モデルにおける偽造の探索と評価のための最初のシミュレーションフレームワークを紹介する。
11のフロンティアモデルで実験を行い、クローズドシステムとオープンソースシステムの両方にまたがっています。
詐欺はモデルに依存しており、イベントプレッシャーの増加とともに増加し、常に監督的信頼を損なう。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:30:52 GMT)
From Knowledge to Treatment: Large Language Model Assisted Biomedical Concept Representation for Drug Repurposing [18.0] 既存の方法は、現実世界の研究室で常識的なバイオメディカル概念の知識を見落としている。
LLaDR(Large Language Model-assisted framework for Drug Repurposing)を提案する。
ベンチマークに基づく実験は、LLaDRがさまざまなシナリオで最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:15:36 GMT)
AdaptJobRec: Enhancing Conversational Career Recommendation through an LLM-Powered Agentic System [18.0] AdaptJobRecは、自律エージェントを活用してパーソナライズされたレコメンデーションアルゴリズムツールを統合する、最初の会話型ジョブレコメンデーションシステムである。
このシステムは、応答遅延を最小限に抑えるために、ユーザクエリの複雑さを識別するメカニズムを採用している。
AdaptJobRecは、競合するベースラインと比較して平均レスポンスレイテンシを最大53.3%削減する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:12:32 GMT)
PromptFlow: Training Prompts Like Neural Networks [17.9] 大規模言語モデル(LLM)は自然言語処理(NLP)タスクに大きな影響を与えている。
プロンプトエンジニアリングの最近の進歩は、広範囲な再訓練に代わる有望な代替手段を提供する。
本稿では,メタプロンプト,演算子,最適化,評価器にインスパイアされたモジュール型トレーニングフレームワークであるPromptFlowを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:56:12 GMT)
Conformal Inference for Open-Set and Imbalanced Classification [17.9] 本稿では,高度不均衡条件とオープンセット条件の整列予測手法を提案する。
既存のアプローチでは有限で既知のラベル空間が必要であり、典型的にはランダムなサンプル分割を伴う。
我々は、新しいデータポイントが以前に見つからなかったクラスに属するかどうかをテストすることができる、新しいコンフォーマルなp-値の族を計算し、統合する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:19:06 GMT)
A Text-Image Fusion Method with Data Augmentation Capabilities for Referring Medical Image Segmentation [17.6] 最近のマルチモーダル学習は、参照またはテキスト誘導画像セグメンテーションとして知られるセグメンテーションのためのテキストとイメージを統合する。
本稿では,拡張前のテキストと視覚的特徴を組み合わせた早期融合フレームワークを提案する。
本手法は,3つの医用画像タスクと4つのセグメンテーション・フレームワークを用いて評価し,最先端の結果を得た。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:18:34 GMT)
The Silent Judge: Unacknowledged Shortcut Bias in LLM-as-a-Judge [17.6] 大規模言語モデル(LLM)は、要約、対話、創造的執筆といったタスクにおいてシステム出力を評価する自動判断器として、ますます多くデプロイされている。
提案手法では,現行のLLM審査員は,プロンプトに導入したショートカットに頼って,両方のカウントでフェールすることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:41:30 GMT)
Self-Verifying Reflection Helps Transformers with CoT Reasoning [17.5] 先進的な大規模言語モデル(LLM)は、しばしば思考の連鎖(CoT)の推論に反映される
自然言語のない小型変圧器の基本的な自己検証リフレクションを支援するための最小主義的推論フレームワークを提案する。
数百万のパラメータしか持たない小さなトランスフォーマーは、トレーニングとリフレクティブ実行の両方において自己検証の恩恵を受ける。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:22:50 GMT)
MoBiLE: Efficient Mixture-of-Experts Inference on Consumer GPU with Mixture of Big Little Experts [17.5] MoBiLEは、プラグイン・アンド・プレイのオフロードベースのMoE推論フレームワークで、大手専門家のテキストミキサーを備えている。
MoBiLEは、コンシューマGPUシステムのベースラインと比較して1.60倍から1.72倍のスピードアップを実現し、精度の劣化は無視できる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:22:44 GMT)
Optimized Layerwise Approximation for Efficient Private Inference on Fully Homomorphic Encryption [17.4] 本研究では、プライバシー保護型ディープニューラルネットワークのための最適化レイヤワイド近似(OLA)フレームワークを提案する。
効率的な近似のために、各アクティベーション関数の実際の入力分布を考慮し、階層的精度を反映する。
その結果、OLA法はResNet-20モデルとResNet-32モデルの推論時間をそれぞれ3.02倍と2.82倍に削減した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:07:18 GMT)
MetaMind: Modeling Human Social Thoughts with Metacognitive Multi-Agent Systems [17.4] メタ認知の心理学理論に触発されたマルチエージェントフレームワークであるMetaMindを紹介する。
我々のフレームワークは3つの挑戦的なベンチマークで最先端のパフォーマンスを実現し、実世界の社会的シナリオは35.7%改善した。
この研究は、共感的対話や文化的に敏感な相互作用に応用して、人間のような社会知性に向けてAIシステムを前進させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:30:04 GMT)
Cognition-of-Thought Elicits Social-Aligned Reasoning in Large Language Models [17.4] 大きな言語モデル(LLM)は複雑な推論において優れているが、それでも有害な振る舞いを示すことができる。
本稿では,認知的自己監視ループにLCMを組み込んだ新しい復号時間フレームワークCooTを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:38:48 GMT)
RAID: Refusal-Aware and Integrated Decoding for Jailbreaking LLMs [17.3] RAID(Refusal-Aware and Integrated Decoding)は、拡散を保ちながら制限されたコンテンツを誘導する敵の接尾辞を作成するフレームワークである。
RAIDは,最近のホワイトボックスやブラックボックスのベースラインよりもクエリが少なく,計算コストも低く,攻撃成功率が高いことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:33:09 GMT)
TaskAudit: Detecting Functiona11ity Errors in Mobile Apps via Agentic Task Execution [17.2] TaskAuditは、シミュレーションインタラクションによる関数a11ityエラーの検出に焦点を当てたアクセシビリティ評価システムである。
実世界のアプリ評価では,54のアプリ画面から48のファンクタ11ityエラーを検出する方法が,既存のチェッカーでは4~20であるのに対し,我々の戦略は48のファンクタ11ityエラーを検出する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:28:49 GMT)
Multiplicative Loss for Enhancing Semantic Segmentation in Medical and Cellular Images [17.2] 医用画像と細胞画像のセマンティックセグメンテーションのための2つの新しい損失関数であるMultiplelicative LossとConfidence-Adaptive Multiplicative Lossを提案する。
我々のフレームワークは、調整された加算関数と既存の損失関数を一貫して上回る。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:07:02 GMT)
SpikePool: Event-driven Spiking Transformer with Pooling Attention [17.2] スパイキングニューラルネットワーク(SNN)は、トランスフォーマーアーキテクチャとますます統合されている。
現在のアプローチは主に、基礎となる信号処理特性を解析せずにアーキテクチャの変更に焦点を当てている。
我々は周波数スペクトル領域を通してスパイキングトランスを解析し、ハイパスフィルタとして振る舞うことを発見した。
スパイクベースの自己アテンションを最大プールアテンションに置き換えたSpikePoolを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:08:49 GMT)
GraphRAG under Fire [17.2] この研究は、GraphRAGの攻撃に対する脆弱性を調べ、興味深いセキュリティパラドックスを明らかにする。
既存のRAG中毒攻撃は、GraphRAGのグラフベースのインデックスと検索により、従来のRAGよりも効果が低い。
GragPoisonは、基礎となる知識グラフの共有関係を利用して、有害なテキストを作る新しい攻撃だ。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:06:06 GMT)
Prompt-guided Representation Disentanglement for Action Recognition [17.0] ProDA(Prompt-Guided Disentangled Representation for Action Recognition)を提案する。
ProDAは、特定のアクションをマルチアクションシーンから切り離す。
動的重みを使って情報を集約するビデオ適応型グラフパーシングニューラルネットワーク(GPNN)を設計する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:00:07 GMT)
The Invisible Handshake: Tacit Collusion between Adaptive Market Agents [16.9] 本研究では,内因性価格形成を伴う市場における適応取引業者間の暗黙の共謀の出現について検討する。
エージェントが自身の富を最大化するために単純な学習アルゴリズムに従うと、結果として得られるダイナミクスは合理的戦略プロファイルに収束する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:28:33 GMT)
Interpretable Reward Model via Sparse Autoencoder [16.9] 本稿では,Sparse Autoencoder-enhanced Reward Model(SARM)を紹介する。
SARMはLLMベースのRMの隠れた活性化を解釈可能でスパースで単意味的な特徴空間にマッピングする。
実験的な評価では、SARMは報酬割り当ての直接的特徴レベルの帰属を促進し、好みのシフトを動的に調整し、従来の報酬モデルよりも優れたアライメント性能を実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:03:00 GMT)
Human-in-the-Loop Bandwidth Estimation for Quality of Experience Optimization in Real-Time Video Communication [16.8] リアルタイム通信の帯域幅推定は依然としてオープンな課題である。
そこで本稿では,これらの課題に対処するための帯域幅推定のための,ヒューマン・イン・ザ・ループ(Human-in-the-loop)なデータ駆動フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:18:30 GMT)
Traveling Salesman-Based Token Ordering Improves Stability in Homomorphically Encrypted Language Models [16.7] ホモモルフィック暗号化(HE)は、暗号化されたデータ上で直接計算を行うことによって、原則化されたソリューションを提供する。
テキスト生成の課題、特に次世代の予測は、あまり注目されていない。
暗号化されたテキスト生成の難しさに対処するTSPベースのトークン再注文戦略を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:56:50 GMT)
Beyond Seeing: Evaluating Multimodal LLMs on Tool-Enabled Image Perception, Transformation, and Reasoning [16.7] MLLM(Multimodal Large Language Models)は、ユーザが提供するイメージが不完全である実世界のシナリオにおいて、ますます適用されてきている。
我々は、複雑な視覚・テクスチャタスクに対してMLLMの知覚、変換、推論能力を評価する、画像・システムとの対話的推論であるIRISを紹介する。
評価の結果,現在のMLLMは視覚と汎用ツールの効果的な統合を必要とするタスクに苦慮していることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:50:49 GMT)
GTPBD: A Fine-Grained Global Terraced Parcel and Boundary Dataset [16.7] GTPBDは、ピクセルレベルのバウンダリラベル、マスクラベル、パーセルラベルを含む3レベルラベルを持つ47,537の高解像度画像で構成されている。
中国と大陸横断性気候圏の7つの主要地域をカバーしている。
GTPBDは、リモートセンシング研究において重要なギャップを埋め、きめ細かい農業地形解析のための基盤となる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:35:39 GMT)
Uncertainty-Supervised Interpretable and Robust Evidential Segmentation [16.6] 不確実性の推定は、信頼性を提供するツールとして、医用画像セグメンテーションにおいて広く研究されている。
従来手法では、不確実性推定の効果的な監督が欠如していた。
本研究では,不確実性の学習を指導する自己教師型アプローチを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:38:06 GMT)
GraphShaper: Geometry-aware Alignment for Improving Transfer Learning in Text-Attributed Graphs [16.6] マルチジオメトリ・スペシャライゼーションによるグラフエンコーディングを強化した幾何認識フレームワークである textbfGraphShaper を紹介する。
我々のアプローチでは、異なる幾何学的空間に合わせた専門家ネットワークを使用し、動的に融合重みを計算し、幾何学的特性を適応的に統合する。
引用ネットワークでは9.47%、ゼロショット設定では7.63%の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:48:50 GMT)
GOAT: A Training Framework for Goal-Oriented Agent with Tools [16.5] 大規模言語モデル(LLM)は、インタラクティブエージェントとして機能するために、最近、従来のテキスト生成を超えて拡張されている。
本研究では,人間のアノテーションを含まない環境下でのLDMエージェントの微調整を可能にする新しいトレーニングフレームワークGOATを提案する。
広範な実験により,GOAT学習エージェントは,複数の既存の目標指向ベンチマークにおいて最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:14:50 GMT)
Learning Mean-Field Games through Mean-Field Actor-Critic Flow [16.5] 我々は平均場ゲーム(MFG)を解くための連続学習力学である平均場アクター・クライブ(MFAC)フローを提案する。
このフレームワークは、偏微分方程式(PDE)が支配する結合勾配に基づく更新を通じて、制御(アクター)、値関数(批判)、分布成分を共同で進化させる。
中心的な革新は最適輸送測地管流(OTGP)であり、ワッサーシュタイン2測地線に沿った平衡方向の分布を駆動している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:15:32 GMT)
DiaCDM: Cognitive Diagnosis in Teacher-Student Dialogues using the Initiation-Response-Evaluation Framework [16.5] DiaCDMは、対話における生徒の認知状態を評価するツールである。
我々は,対話に適した診断枠組みを設計するために,IRE(Initiation-Response-evaluation)フレームワークを教育理論から応用した。
3つの実世界の対話データセットの実験により、DiaCDMは診断精度を大幅に向上するだけでなく、結果の解釈可能性も向上することを確認した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:34:10 GMT)
Refine Thought: A Test-Time Inference Method for Embedding Model Reasoning [16.4] テキスト埋め込みモデルのセマンティック表現を強化する手法であるRT(Refine Thought)を提案する。
実験の結果、RTはBRIGHTと人事マッチングベンチマークPJ1で意味論的推論タスクを大幅に改善した。
以上の結果から,RTが有効であることは,事前学習時に学習した意味的推論能力をさらに活性化させることを示唆している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:35:27 GMT)
From Rational Answers to Emotional Resonance: The Role of Controllable Emotion Generation in Language Models [16.4] 大規模言語モデル(LLM)は、一貫性があり、制御可能で、文脈的に適切な方法で感情を表現するのに苦労する。
感情ベクトル(EV)に基づく制御可能な感情生成フレームワークを提案する。
本手法は、追加のトレーニングやアーキテクチャの変更なしに、感情のトーンを微調整し、連続的に調整することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:07:40 GMT)
Performance of Gaussian Boson Sampling on Planted Bipartite Clique Detection [16.3] ガウスボソンサンプリング (GBS) が, 植込み双立問題の解法に有効であるかどうかを考察する。
これは、植木構造が小さいとき、古典的に難しいと広く信じられているグラフ問題である。
本研究は, 植林した斜めの大きさが予想される硬質状態に収まると, ノード重みの自然変動がバイアス信号を支配することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:51:31 GMT)
L2M-AID: Autonomous Cyber-Physical Defense by Fusing Semantic Reasoning of Large Language Models with Multi-Agent Reinforcement Learning (Preprint) [16.3] L2M-AIDは多エージェント強化学習を用いた自律型産業防衛のための新しいフレームワークである。
大規模言語モデル(LLM)によって駆動される協調エージェントのチームを編成し、適応的でレジリエンスなセキュリティを実現する。
その結果,L2M-AIDは従来のIDS,ディープラーニング異常検出器,単一エージェントRLベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:56:55 GMT)
Calibration and Uncertainty for multiRater Volume Assessment in multiorgan Segmentation (CURVAS) challenge results [16.1] 深層学習(DL)が医用画像セグメンテーションの主流となっている。
この課題は、より包括的な基盤真理を確立する上で、複数のアノテータが果たす重要な役割を強調している。
我々は,DLモデルが不確実性をどのように扱うか,信頼度推定が真のセグメンテーション性能と一致しているかを評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:43:00 GMT)
Narrow Finetuning Leaves Clearly Readable Traces in Activation Differences [16.1] 狭い微調整はLLM活性化に強いバイアスをもたらし、微調整領域を理解するために解釈できることを示す。
これらのバイアスは、モデル差分法による単純なツールを使って見つけることができる。
これらの分析はLLMベースの解釈可能性エージェントを作成することによって重要な情報を含むことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:05:59 GMT)
How Vulnerable Is My Learned Policy? Universal Adversarial Perturbation Attacks On Modern Behavior Cloning Policies [16.0] Demonstration(LfD)アルゴリズムからの学習は、ロボット操作タスクにおいて有望な結果を示している。
しかし、オフラインの普遍的摂動攻撃に対する彼らの脆弱性は、まだ解明されていない。
本稿では,従来のアルゴリズムと最近提案されたアルゴリズムの両方に対する敵攻撃の包括的研究について述べる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:44:00 GMT)
Concise Reasoning in the Lens of Lagrangian Optimization [15.9] 本稿では,PALU(Principald Strategy, Performance-Aware length update)を導入する。
原理的アルゴリズムとして、PALUは制約付き最適化問題として簡潔推論を定式化する。
PALUは、DeepSeek-Distill-Qwen-1.5Bに適用すると、出力長を65%削減し、精度を15%向上させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:39:32 GMT)
Deploying Atmospheric and Oceanic AI Models on Chinese Hardware and Framework: Migration Strategies, Performance Optimization and Analysis [15.8] 我々は,PyTorchからMindSporeへ大規模大気モデルと海洋モデルを移行し,中国のチップを最適化するためのフレームワークを提案する。
この研究は、大気および海洋AIモデル開発における中国の国内チップとフレームワークを活用するための貴重な洞察と実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:41:56 GMT)
Digital adiabatic evolution is universally accurate [15.8] デジタル断熱進化は本質的に正確であり、シミュレーションエラーに対して堅牢である。
デジタル断熱進化は従来考えられていたよりもかなり効率的であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:39:30 GMT)
A Survey of Graph Unlearning [15.7] グラフアンラーニングは、トレーニングされたモデルからセンシティブなデータトレースを削除する手段を提供する。
グラフ機械学習がデータプライバシや敵攻撃に敏感であることは明らかである。
この調査は、研究者にグラフアンラーニングの分野をさらに前進させようとしている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:26:38 GMT)
Who's Asking? Evaluating LLM Robustness to Inquiry Personas in Factual Question Answering [15.6] アイデンティティや専門知識,信念などの属性を伝達するユーザプロファイルを調査するペルソナに対して,ロバスト性を評価する。
このような手法はQAの精度を有意に変化させ、拒絶、幻覚的制限、役割の混乱といった障害モードを誘発する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:59:15 GMT)
Chinese ModernBERT with Whole-Word Masking [15.6] ハードウェア対応の32k BPE語彙である Chinese ModernBERT を紹介した。
我々は、CCI3-HQ、CCI4(中国語)、Cosmopedia- Chineseから1.2Tの中国トークンを事前訓練する。
CLUEでは、中国のModernBERTは、統一された微調整プロトコルの下で強力な中国のエンコーダと競合している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:41:22 GMT)
PET Head Motion Estimation Using Supervised Deep Learning with Attention [15.6] 頭部運動は脳ポジトロン断層撮影(PET)において重要な課題である。
本稿では,1秒の3次元生データから剛性な頭部運動を予測するために,クロスアテンション(DL-HMC++)を用いた深層学習型頭部運動補正手法を提案する。
DL-HMC++は、最先端のデータ駆動モーション推定法より一貫して優れている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:37:12 GMT)
Reinforcement Learning for Out-of-Distribution Reasoning in LLMs: An Empirical Study on Diagnosis-Related Group Coding [15.6] 大言語モデル(LLM)は、タスクの配布外の性質のため、診断関連グループ(DRG)コードと競合する。
本稿では,大規模強化学習(RL)を用いてDRGの自動符号化を行うDRG-Sapphireについて紹介する。
我々のモデルはMIMIC-IVベンチマークで最先端の精度を達成し、DRG代入に対する医師公認推論を生成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:07:33 GMT)
Multi-Copy Security in Unclonable Cryptography [15.2] Unclonablecryptgraphy は、暗号機能のコピー-プロテクトに量子ノクローニングの原理を利用する。
我々は,マルチコピーセキュリティを実現するために,コラシオン耐性の非拘束プリミティブをアップグレードするジェネリックコンパイラを導入する。
我々は、独立した関心を持つと信じている、最初のマルチチャレンジセキュアな非拘束型暗号化スキームを構築した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:23:42 GMT)
Time-IMM: A Dataset and Benchmark for Irregular Multimodal Multivariate Time Series [15.2] Time-IMMは、マルチモーダル時系列における原因駆動不規則を捉えるために設計されたデータセットである。
IMM-TSFは不規則なマルチモーダル時系列を予測するためのベンチマークライブラリである。
実験結果から,不規則な時系列データ上でのマルチモーダリティを明示的にモデル化すると,予測性能が大幅に向上することが示された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:43:14 GMT)
DRIFT: Decompose, Retrieve, Illustrate, then Formalize Theorems [14.6] DRIFTは、非公式な数学的ステートメントをより小さく、より扱いやすい'サブコンポーネント'に分解するフレームワークである。
これは、モデルが形式化タスクにおいてより効果的に前提を使用するのを助けるために、イラストラティブな定理を回収する。
我々は,様々なベンチマーク(ProofNet,ConNF,MiniF2F-test)でDRIFTを評価し,前提条件の検索を継続的に改善することを発見した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:15:04 GMT)
MCP Security Bench (MSB): Benchmarking Attacks Against Model Context Protocol in LLM Agents [14.5] Model Context Protocol(MCP)は、大規模な言語モデル(LLM)エージェントが外部ツールを発見し、記述し、呼び出す方法を標準化する。
我々は,MSB (MCP Security Benchmark) について述べる。MSB (MCP Security Benchmark) は,LCM エージェントが MCP 固有の攻撃にどの程度抵抗するかを測定する最初のエンドツーエンド評価スイートである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:36:25 GMT)
Elevating Medical Image Security: A Cryptographic Framework Integrating Hyperchaotic Map and GRU [14.5] カオスシステムは、初期条件への感受性、エルゴード性、複雑なダイナミクスにより、現代の画像暗号化において重要な役割を果たす。
本稿では,これらの問題に対処する新しい暗号化フレームワークであるKun-IEを提案する。
2D Sin-Cos Pi Hyperchaotic Mapの開発と、新しい置換戦略であるKun-SCANの導入である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:48:07 GMT)
Time Travel is Cheating: Going Live with DeepFund for Real-Time Fund Investment Benchmarking [14.4] LLM(Large Language Models)は、財務タスクにまたがる顕著な機能を示す。
複雑なファンド投資を管理するための現実的な効果は、まだ不十分に評価されている。
我々は,LLMをリアルタイム市場環境で厳格に評価するために設計された,ライブファンドベンチマークツールであるDeepFundを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:28:29 GMT)
General Exploratory Bonus for Optimistic Exploration in RLHF [14.4] 現在の定式化は、参照モデルの高確率領域に対する意図しない偏見探索である。
我々は,楽観主義の原理を確実に満足する理論的枠組みであるGEB(General Exploratory Bonus)を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:34:23 GMT)
A Risk Taxonomy and Reflection Tool for Large Language Model Adoption in Public Health [14.2] 我々は、公衆衛生の専門家や生活経験のある個人と焦点を合わせ、懸念を解き放つ。
参加者の視点をリスク分類にまとめる。
この分類は、個人に対するリスクの4つの次元、人間中心のケア、情報エコシステム、および技術説明責任を強調している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:42:42 GMT)
Can LLMs Reconcile Knowledge Conflicts in Counterfactual Reasoning [14.2] 大規模言語モデルには、そのパラメータに広範な世界的知識が含まれており、多くの知識集約的なタスクに対する印象的なパフォーマンスを実現している。
しかし、新しい設定で展開する場合、LLMはしばしば、パラメトリック知識を新しい情報や馴染みのない情報と統合しなければならない状況に遭遇する。
この研究は、LLMが文脈内知識とパラメトリック知識を対実的推論のレンズを通して組み合わせることができるかどうかを考察する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:46:19 GMT)
Multi-View Graph Learning with Graph-Tuple [14.0] 効率的なグラフニューラルネットワーク(GNN)のためのマルチビューグラフタプルフレームワークを提案する。
グラフタプルフレームワークはグラフを1つのグラフの代わりに非結合部分グラフに分割し、主要な局所的な相互作用とより弱い長距離接続をキャプチャする。
我々は2つの科学的領域の枠組みをインスタンス化し、特徴量を持つクーロン行列からの分子特性予測と幾何学的点雲からの宇宙パラメータ推定を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:11:26 GMT)
Evaluating Style-Personalized Text Generation: Challenges and Directions [13.8] スタイルのパーソナライゼーションは、すべてのユーザに対して非常に具体的であり、実用的コンテキストに強く依存する。
BLEU, 埋め込み, LLMs-as-judgesなど, この分野で最も一般的な測定値の有効性について検討した。
多様な評価指標のアンサンブルを用いることで、単一評価手法よりも一貫して優れているという強い証拠が得られます。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:40:05 GMT)
PRoH: Dynamic Planning and Reasoning over Knowledge Hypergraphs for Retrieval-Augmented Generation [13.8] 本稿では,知識ハイパーグラフフレームワーク上での動的計画と推論を行うPRoHを提案する。
PRoHは3つの中核的なイノベーションを取り入れている: (i) 局所的なKH地区をスケッチして構造的基盤を持つ推論計画生成をガイドするコンテキスト対応計画モジュール; (ii) 動的に進化するダイレクトアサイクリックグラフ(DAG)としてサブクエストを組織する構造化された質問分解プロセス。
複数の領域にわたる実験により、PRoHは最先端のパフォーマンスを達成し、以前のSOTAモデルであるHyperGraphRAGを平均19.73%、生成評価(G-E)スコア8.41%上回った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:13:23 GMT)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [13.8] シュロディンガーブリッジ (Schrodinger Bridges, SBs) は、有限時間で操る拡散過程であり、与えられた初期分布を、適切なコスト関数を最小化する。
そこで本研究では,低次元の問題を解決するための一組の実行可能なポリシーの解析的パラメトリゼーションを提案する。
本稿では,オートエンコーダの空間における画像から潜時変換,マルチマージ運動量SBを用いた細胞動態の学習など,低次元問題におけるこのアプローチの可能性を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:55:17 GMT)
Who cares about testing?: Co-creations of Socio-technical Software Testing Experiences [13.8] 本研究は,テストに関する彼らの意見がどう変わるかを明らかにするために,ソフトウェア開発者の生きた経験を考察する。
ソフトウェア開発者との深い半構造化されたインタビュー19件のデータを体系的に分析して理論を構築する。
テストプラクティスの適用と適応の条件として機能する状況の11のカテゴリを開発します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:52:01 GMT)
Towards Engineering Multi-Agent LLMs: A Protocol-Driven Approach [13.8] 本稿では,マルチエージェントのための3つの中核SE設計原則をインスタンス化するプロトコル層方法論である,SEMAP(Software Engineering Multi-Agent Protocol)を紹介する。
コード開発では、機能レベルの開発が69.6%減少し、デプロイメントレベルの開発が56.7%に達する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:49:30 GMT)
Simplicial Gaussian Models: Representation and Inference [13.7] 本稿では, 単純ガウスモデル (SGM) を提案する。
我々のモデルは離散ホッジ理論に基づいており、独立なランダム成分を通してすべての位相レベルで不確かさを取り入れている。
応用によって動機付けられ、ノードレベルと三角形レベルの変数を潜在変数として扱いながら、辺辺レベルの分布に焦点をあてる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:51:56 GMT)
H4G: Unlocking Faithful Inference for Zero-Shot Graph Learning in Hyperbolic Space [13.7] 現在のアプローチは過大な双曲型ラジイで動作し、多スケール構造情報を均一な高レベルの抽象化に圧縮する。
この抽象化による情報損失は、正確な予測に不可欠な重要な局所パターンを曖昧にする。
学習可能なブロック対角スケーリング行列とM"obius matrix multiplicationを用いて,埋め込みラジイを体系的に低減するフレームワークである textbfH4G を提案する。
実験により、H4Gはヘテロフィルグラフおよびホモグラフのtextbf12.8%の改善により最先端のゼロショット性能を達成することが示された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:58:57 GMT)
IBCL: Zero-shot Model Generation under Stability-Plasticity Trade-offs [13.6] 本稿では,特定のトレードオフの下での連続学習の課題を解決するために,IBCL(Imrecise Bayesian Continual Learning)を提案する。
IBCLはリトレーニングを一定時間凸の組み合わせで置き換える。
実験の結果、IBCLはタスク毎の精度の平均で少なくとも44%の分類を改善した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:46:42 GMT)
Efficient Inference for Coupled Hidden Markov Models in Continuous Time and Discrete Space [13.5] 本稿では,システム内の各マルコフ連鎖の生成元をパラメータ化するモデルクラスであるLatent Interacting Particle Systemsを紹介する。
提案手法は,グラフ上の潜伏SIRSモデルに対する挑戦的後部推論タスクと,実データに基づいて訓練された山火事拡散動態のニューラルモデルに有効であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:42:12 GMT)
Budget-constrained Active Learning to Effectively De-censor Survival Data [13.5] 我々は、現在最先端の予算付き学習アルゴリズムを生存データに適用する方法を示す。
これは現実世界のデータ収集のモデルとして機能し、検閲された患者とのフォローアップが常に非検閲につながるとは限らない。
我々のアプローチは、標準のアクティブラーニング手法であるBatchBALDに匹敵する境界時間と時間を与える。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:53:30 GMT)
Targeted Pooled Latent-Space Steganalysis Applied to Generative Steganography, with a Fix [13.5] 生成された画像専用のステレオグラフィースキームは、潜在空間のシードベクトルを変更してメッセージを埋め込む。
本稿では,潜伏ベクトルのノルムの統計的分布をモデル化し,潜伏空間におけるステガナリシスを実現することを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:46:47 GMT)
Repairing Reward Functions with Human Feedback to Mitigate Reward Hacking [13.4] そこで本稿では,人為的に規定された代行報酬関数を,優先事項から付加的かつ遷移依存的な補正項を学習することで修復する自動フレームワークを提案する。
PBRRは、好みから報酬関数をスクラッチから学習するベースラインを一貫して上回り、他のアプローチを使用してプロキシ報酬関数を変更する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:18:24 GMT)
Incomplete Multi-view Clustering via Hierarchical Semantic Alignment and Cooperative Completion [13.4] 本稿では,階層的セマンティックアライメントと協調補完(HSACC)に基づく,新しい不完全なマルチビュークラスタリングフレームワークを提案する。
HSACCはデュアルレベルのセマンティック空間設計により、堅牢なクロスビュー融合を実現する。
実験の結果、HSACCは5つのベンチマークデータセットで最先端の手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:58:10 GMT)
SAFER: Probing Safety in Reward Models with Sparse Autoencoder [13.4] 拡張リワードモデル(textbfSAFER)のためのスパースオートエンコーダを提案する。
我々は、報酬モデルアクティベーションにおける人間解釈可能な特徴を明らかにし、安全関連意思決定の洞察を可能にする。
実験の結果、SAFERは最小限のデータ修正で精度を低下させるか、安全アライメントを強化することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:23:11 GMT)
NewVEM: A Newton Vertex Exchange Method for a Class of Constrained Self-Concordant Minimization Problems [13.4] 一般化された単純点への射影を計算するための高効率半平滑なニュートン法を提案し,解析する。
提案アルゴリズムの実用的な性能を数値実験により実証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:23:26 GMT)
MEASURE: Multi-scale Minimal Sufficient Representation Learning for Domain Generalization in Sleep Staging [13.3] 本稿では,睡眠段階分類に不可欠な時間的・スペクトル的特徴を保ちながら,ドメイン関連情報を効果的に低減する新しいMEASUREフレームワークを提案する。
提案手法は、利用可能な睡眠ステージリングベンチマークデータセットの実験において、常に最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:20:50 GMT)
Toward Fair Graph Neural Networks Via Dual-Teacher Knowledge Distillation [13.3] このFairDTDはDual-Teacher Distillation上に構築された新しいFair表現学習フレームワークである。
また,FairDTDは高モデルユーティリティを保ちながら最適な公正性を実現し,その有効性をGNNの公正表現学習で示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:28:16 GMT)
MAPS: Masked Attribution-based Probing of Strategies- A computational framework to align human and model explanations [13.2] 人工ニューラルネットワーク(ANN)から導かれる説明が人間の視覚にも応用できるかどうかを調べるためのツールであるMAPS(Masked Attribution-based Probing of Strategies)を提案する。
MAPSは、属性マップを説明マスク付き画像(EMI)に変換し、これらの最小画像上の画像毎の精度と、全刺激に対する精度の限られたピクセル予算を比較する。
ヒトとマカクに応用すると、MAPSはANN-Explanationの組合せを識別し、その説明は生物学的ビジョンと最も密接に一致し、より少ない行動試験を必要としながら、バブルマスクの行動妥当性を達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:40:23 GMT)
LLM Probability Concentration: How Alignment Shrinks the Generative Horizon [13.2] また,アライメント調整によってモデル出力分布が大幅に向上することを示す。
この洞察に基づいて、この一貫性は複雑な推論に驚くべき意味を持つ。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:47:33 GMT)
Evolution of AI Agent Registry Solutions: Centralized, Enterprise, and Distributed Approaches [13.1] AIエージェントはクラウド、エンタープライズ、分散ドメインを横断して動作し、発見、能力交渉、アイデンティティ保証を可能にするレジストリインフラストラクチャの需要を生成する。
我々は,(1)MCPレジストリ(mcp.の分散出版),(2)A2Aエージェントカード(分散自己記述機能マニフェスト),(3)AGNTCYエージェントディレクトリサービス(IPFSカデミリアコンテンツルーティング,OCIアーティファクトストレージ,シグストア支援完全性),(4)Microsoft EntraエージェントID(暗号化,プライバシ保護ファクトモデル,認証されたアサーションを含む),(5)NANDAインデックスエージェントFactsの5つの重要なアプローチを分析する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:08:24 GMT)
Information Extraction from Conversation Transcripts: Neuro-Symbolic vs. LLM [13.1] 本稿では,農業領域におけるニューロシンボリック(NS)とLLMベースのIEシステムを比較した。
実世界のアプリケーションにNLPシステムをデプロイする際の "隠れたコスト" を強調した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:10:24 GMT)
UniFusion: Vision-Language Model as Unified Encoder in Image Generation [12.8] We present UniFusion, a diffusion-based generative model conditioned on a frozen large vision- language model (VLM) that serve as an unified multimodal encoder。
LAPは、VLMから編集の鍵となる拡散モデルへの視覚情報の生成と忠実な伝達のために、テキストイメージアライメントにおいて、他の浅層融合アーキテクチャよりも優れていることを示す。
本稿では,VLMが生成するテキストトークンにのみ拡散変換器(DiT)を条件として,フレキシブル推論を用いたVLM-Enabled Rewriting Injectionを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:57:56 GMT)
A Multilingual, Large-Scale Study of the Interplay between LLM Safeguards, Personalisation, and Disinformation [12.6] 本稿では,大規模言語モデルによるペルソナ目的の偽情報生成に関する,最初の大規模・多言語的実証研究について述べる。
AI-TRAITSは8つの最先端のLCMによって生成される約1.6万のテキストからなる新しいデータセットである。
以上の結果から, 簡単なパーソナライズ戦略を駆使すれば, 全研究LSMに対する脱獄の可能性が著しく高くなることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:10:50 GMT)
Persistent Homology via Ellipsoids [12.6] 我々は、Rips型楕円体複合体と呼ばれる、幾何学的に情報を得る新しいタイプの単体複合体を構築した。
この複合体は、楕円体が接方向に沿って、データをよりよく近似するという考えに基づいている。
楕円体バーコードは入力データに連続的に依存し, k-ジネリック・ポイント・クラウドの小さな摂動が結果として生じる楕円体バーコードに比例的に小さな変化をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:35:56 GMT)
In the Eye of MLLM: Benchmarking Egocentric Video Intent Understanding with Gaze-Guided Prompting [12.6] EgoGazeVQAは、エゴセントリックな視線誘導型ビデオ質問応答ベンチマークである。
実験の結果,既存のMLLMはユーザの意図を正確に解釈するのに苦労していることがわかった。
我々の視線誘導インテントプロンプト法は性能を著しく向上させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:18:37 GMT)
PubSub-VFL: Towards Efficient Two-Party Split Learning in Heterogeneous Environments via Publisher/Subscriber Architecture [12.4] PubSub-VFLは、高い計算効率で双方向協調学習に最適化された新しいVFLパラダイムである。
PubSub-VFLは、精度を損なうことなく2 sim 7times$でトレーニングを加速するが、計算資源の利用率も最大91.07%に達する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:27:33 GMT)
Understanding Language Prior of LVLMs by Contrasting Chain-of-Embedding [12.4] 大規模視覚言語モデル(LVLM)における言語の最初の体系的解析について述べる。
それぞれのモデルが視覚統合ポイント(VIP)を示しており、視覚情報が隠れた表現を意味的に再形成し、デコードに影響を与える重要な層である。
9つの現代のLVLMと6つのベンチマークにまたがる54のモデル-データセットの組み合わせにおいて、VIPは一貫して出現し、TVIは言語の強さを確実に予測することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:10:23 GMT)
Extremely low-bitrate Image Compression Semantically Disentangled by LMMs from a Human Perception Perspective [12.3] 人間のプログレッシブ・コンプレッション・メカニズムにインスパイアされたセマンティック・ディスタングル・イメージ・圧縮フレームワークを提案する。
我々はLMMを利用して、全体記述、オブジェクト詳細記述、セマンティックセグメンテーションマスクを含む重要なセマンティックコンポーネントを抽出する。
本研究では,事前学習したControlNet上に構築され,オブジェクトレベルのテキスト記述やセマンティックマスクによって条件付けられたオブジェクトの詳細を復元する,注意誘導型オブジェクト復元モデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:36:33 GMT)
Structure-Aware Spectral Sparsification via Uniform Edge Sampling [12.3] スペクトルクラスタリングにおける一様エッジサンプリング-単純な構造に依存しない戦略-が有効かどうかを考察する。
我々は、$O(gamma2 n log n / epsilon2)$ edges, where $gamma$ is the Laplacian condition number, yield a sparsifier that top $(n-k)$-dimensional eigenspace is almost to the cluster indicators。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:05:02 GMT)
Understanding the Modality Gap: An Empirical Study on the Speech-Text Alignment Mechanism of Large Speech Language Models [12.3] LSLM(End-to-end Large Speech Language Models)では,会話生成能力が顕著に向上している。
粗くきめ細かなテキストと音声表現の両方を解析する。
表現類似性はモダリティギャップと強く相関していることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:34:38 GMT)
OmniDraft: A Cross-vocabulary, Online Adaptive Drafter for On-device Speculative Decoding [12.2] OmniDraftは、単一のドラフトモデルを任意のターゲットモデルで操作可能な統合フレームワークである。
本研究では, 混合蒸留微調整によるオンラインn-gramキャッシュを導入し, ドラフトモデルとターゲットモデル間の語彙間ミスマッチに対処する。
本稿では,算数推論,コーディング,テキスト生成タスクにおいて,オンライン学習を行うことで,フレームワークの習熟度を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:05:11 GMT)
SHAN: Object-Level Privacy Detection via Inference on Scene Heterogeneous Graph [12.2] プライバシオブジェクト検出は、画像内のプライベートオブジェクトを正確に見つけることを目的としている。
既存の手法は、精度、一般化、解釈可能性の重大な欠陥に悩まされている。
本稿では、画像からシーン異質グラフを構成するモデルであるSHAN(Scene Heterogeneous Graph Attention Network)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:19:49 GMT)
AgentBuilder: Exploring Scaffolds for Prototyping User Experiences of Interface Agents [12.2] エージェント体験プロトタイピングにおける重要な活動とエージェントプロトタイピングシステムの望ましい能力を明らかにする。
In situ agent prototyping study with 14 participants using AgentBuilder to validation the design requirements。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:45:52 GMT)
Lifting Manifolds to Mitigate Pseudo-Alignment in LLM4TS [12.2] 擬似アライメント(Pseudo-alignment)は、時系列モデル(LLM4TS)の大規模言語モデルにおいて、広範囲にわたる課題である。
LLM4TSにおける擬似配向の根本原因を調査し,LLMにおける擬似配向と円錐効果の関連性を構築する。
この問題を緩和し、予測性能を向上させるために設計された新しいテクニックであるtextittextbfTimeSUP を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:34:12 GMT)
Preserving Privacy Without Compromising Accuracy: Machine Unlearning for Handwritten Text Recognition [12.0] 忘れられる権利のような規制は、完全なリトレーニングなしで機密性のあるトレースを削除するモデルを必要とする。
マルチヘッドトランスHTRモデルのための2段階のアンラーニングフレームワークを提案する。
また,書き手IDの均一な分布に従うことを強制するメソッドであるWriter-ID Confusion(WIC)も提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:20:50 GMT)
The EmpathiSEr: Development and Validation of Software Engineering Oriented Empathy Scales [11.9] EmpathiSEr-P, EmpathiSEr-U。
実践的インフォームドの概念的枠組みに根ざした尺度は、認知的共感、感情的共感、共感的反応の3つの側面を含む。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:10:14 GMT)
Benefits and Limitations of Communication in Multi-Agent Reasoning [11.8] マルチエージェントシステムの表現性を解析するための理論的枠組みを提案する。
i) タスクを正確に解くために必要なエージェントの数, (ii) エージェント間通信の量と構造, (iii) 達成可能なスピードアップを問題サイズとコンテキストスケールとして導出する。
本研究は,コミュニケーションが有益である状況を特定し,エージェント数と帯域幅のトレードオフを明確化し,いずれのリソースにも制約がある場合の本質的な制約を明らかにする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:04:27 GMT)
Learning to Recognize Correctly Completed Procedure Steps in Egocentric Assembly Videos through Spatio-Temporal Modeling [11.7] 手順ステップ認識(PSR)のための2重ストリームフレームワークを提案する。
STORM-PSRはMECCANOとIndustRealのデータセットで評価される。
実際の組立工程の完了までの平均遅延を、それぞれ11.2%、26.1%削減する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:03:30 GMT)
Effective regions and kernels in continuous sparse regularisation, with application to sketched mixtures [11.7] 本稿では,BLASSO(Bourling-LASSO)を用いた計測における連続スパース正規化の理論を推し進める。
信号回復と混合問題に使用される sinc-4'' カーネルが LPC の仮定を満たすことを証明した。
また、既知のBLASSO保証をノイズレベルに適応させることができることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:14:20 GMT)
IP-Augmented Multi-Modal Malicious URL Detection Via Token-Contrastive Representation Enhancement and Multi-Granularity Fusion [11.7] 悪意のあるURL検出は依然として重要なサイバーセキュリティの課題だ。
3つの重要なイノベーションを取り入れた高度なマルチモーダル検出フレームワークであるCURL-IPを提案する。
大規模実世界のデータセットに対する我々の評価は、このフレームワークが最先端のベースラインを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:20:06 GMT)
DE3S: Dual-Enhanced Soft-Sparse-Shape Learning for Medical Early Time-Series Classification [11.5] 医療応用における早期時系列分類(ETSC)は、集中治療単位(ICU)における敗血症予測などの時間感受性シナリオに不可欠である
本稿では,3つのイノベーションを通じて,形状を正確に把握する新しいソフト形状学習フレームワークを提案する。
6つの実世界の医療データセットの実験は、最先端のパフォーマンスを示し、アブレーション研究はコンポーネントの有効性を確認した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:10:05 GMT)
PAGS: Priority-Adaptive Gaussian Splatting for Dynamic Driving Scenes [11.5] ダイナミックな3D都市シーンの再構築は、自動運転に不可欠である。
現在の手法は、忠実さと計算コストの間の大きなトレードオフに直面している。
本稿では,タスク認識型セマンティック・プライオリティを3次元再構成・レンダリングパイプラインに直接注入するフレームワークであるプライオリティ適応ガウス・スプレイティング(PAGS)を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:36:09 GMT)
DrivingScene: A Multi-Task Online Feed-Forward 3D Gaussian Splatting Method for Dynamic Driving Scenes [11.5] 本研究では、2つの連続したサラウンドビュー画像から4次元動的シーンを再構成するオンラインフレームワークであるDrivingSceneを提案する。
私たちの重要なイノベーションは、カメラごとの動的オブジェクトの非剛性動作を予測する軽量な残留フローネットワークです。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:32:46 GMT)
Do Large Language Models Respect Contracts? Evaluating and Enforcing Contract-Adherence in Code Generation [11.4] PACTは、プログラムアセスメントおよび契約順応評価フレームワークである。
契約違反に焦点を当てた包括的なテストスーツコーパスを提供する。
様々なプロンプト条件下でのコード生成の体系的解析を可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:12:37 GMT)
Revisiting Meta-Learning with Noisy Labels: Reweighting Dynamics and Theoretical Guarantees [11.4] 本稿では,平均重み付け,行シフト,ラベル署名による変調を統合したメタリウェイト化のための軽量サロゲートを提案する。
合成および実雑音ラベルベンチマーク全体において,本手法は強い再重み付け/選択ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:00:12 GMT)
An Adaptive Edge-Guided Dual-Network Framework for Fast QR Code Motion Deblurring [11.4] 本稿では,エッジガイド型アテンションブロック (EGAB) を提案する。
EGABをベースとしたエッジガイド型リストーマー(EG-Restormer)は,粗いQRコードの復号率を大幅に向上させる効果のあるネットワークである。
さらに,これらの2つのネットワークをadaptive Dual-network (ADNet) に統合し,入力のぼやけた重大度に基づいて適切なネットワークを動的に選択する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:03:47 GMT)
Locket: Robust Feature-Locking Technique for Language Models [11.2] ペイ・トゥ・アンロック・スキームを実現するための最初の堅牢でスケーラブルなFLoTEである Locket を紹介します。
Locketは有効(ロックされた機能に対する100ドル%の拒絶)、ユーティリティ保存(アンロックされた機能におけるユーティリティの低下)、ロバスト(5ドル%の攻撃成功率)、複数の機能やクライアントにスケールする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:35:59 GMT)
SAIP-Net: Enhancing Remote Sensing Image Segmentation via Spectral Adaptive Information Propagation [11.0] 本稿では,新しい周波数対応セグメンテーションフレームワークであるSAIP-Netを紹介する。
SAIP-Netは適応周波数フィルタリングとマルチスケールの受容場拡張を採用している。
実験では、最先端の手法よりも大幅に性能が向上した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:50:12 GMT)
StrikeWatch: Wrist-worn Gait Recognition with Compact Time-series Models on Low-power FPGAs [10.9] 歩行パターンが良くなると、特に専門家のフィードバックなしに怪我につながることがある。
Wrist-wornウェアラブルは、実用的で非侵襲的な代替手段を提供する。
本稿では,デバイス上でリアルタイム歩行認識を行う小型手首輪システムであるStrikeWatchを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:28:31 GMT)
Continuous Uniqueness and Novelty Metrics for Generative Modeling of Inorganic Crystals [10.9] 生産的な人工知能モデルが開発され、機能性物質の大きな化学空間を効率的にサンプリングすることができる。
これらは典型的には、選択された結晶距離関数に依存する特異性と新規性メトリクスを用いて評価される。
本稿では,これらの制約を理論的に克服する特異性と新規性を評価するために2つの連続距離関数を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:38:21 GMT)
RIGNO: A Graph-based framework for robust and accurate operator learning for PDEs on arbitrary domains [10.9] 本稿では,任意の領域の点クラウド上のデータからPDEソリューション演算子を学習するために,エンドツーエンドグラフニューラルサンプリング(GNN)に基づくニューラル演算子を提案する。
我々のモデルはRIGNOと呼ばれ、様々な時間依存型で安定したPDEで構成された、様々なドメインで定義されたベンチマークスイートでテストされる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:58:18 GMT)
Structured Sparsity and Weight-adaptive Pruning for Memory and Compute efficient Whisper models [10.9] 本稿では,Whisperの微調整版を設計するためのフレームワークを提案する。
Sparse Group LASSOペナルティをロスレギュレータとして、構造化されたスパーシティーを施行する。
重み付きプルーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:01:29 GMT)
MapAgent: A Hierarchical Agent for Geospatial Reasoning with Dynamic Map Tool Integration [10.7] MapAgentは、地図統合地理空間推論のためのカスタマイズされたツールセットとエージェントスキャフォールドを備えた階層的なマルチエージェントプラグイン・アンド・プレイフレームワークである。
高レベルプランナーは複雑なクエリをサブゴールに分解し、特別なモジュールにルーティングする。
マップベースのサービスのようなツールの多いモジュールでは、関連するAPIを効率的にオーケストレーションする専用のMap-toolエージェントを設計します。
この階層設計は認知的負荷を低減し、ツールの選択精度を改善し、類似したAPI間の正確な調整を可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:15:07 GMT)
DSPO: Stable and Efficient Policy Optimization for Agentic Search and Reasoning [10.7] textbfDynamic-filter textbfSequence-level textbfPolicy textbfOptimization (DSPO)を導入する。
我々は、RLを通して純粋にモデルをトレーニングし、マルチターン探索と推論をインターリーブし、教師付きデモデータの必要性を回避した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:15:40 GMT)
Local Differential Privacy for Federated Learning with Fixed Memory Usage and Per-Client Privacy [10.7] ローカルディファレンシャルプライバシ(LDP)は、各参加者が送信前に更新を民営化することで、強力な保護を提供する。
これらの問題は、HIPAAやフェデレーテッドラーニングのような規則に対するモデル一般化可能性、公正性、コンプライアンスを損なう。
本稿では,L-RDPを提案する。L-RDPはLCP用に設計されたDP方式であり,メモリ使用量が少なく,ドロップアウトを低減し,より厳密なクライアント毎のプライバシー保証を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:32:08 GMT)
Learning-To-Measure: In-context Active Feature Acquisition [10.6] 我々はメタAFA問題を定式化し、そこでは様々なタスクで獲得ポリシーを学習することを目的としている。
本稿では,未確認タスクに対する信頼性の高い不確実性定量化と,不確実性誘導機能獲得エージェントであるL2Mを紹介する。
L2Mは、振り返り不足のあるデータセットを直接操作し、メタAFAタスクをコンテキスト内で実行する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:23:32 GMT)
UniGS: Unified Geometry-Aware Gaussian Splatting for Multimodal Rendering [10.6] 3D Splatting に基づく統一地図表現と識別可能な属性再構成である UniGS を提案する。
我々のフレームワークは、写真リアルなRGB画像、幾何学的に正確な深度マップ、一貫した表面正規化、セマンティックロジットを同時にレンダリングできるマルチモーダルビューアを統合している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:07:57 GMT)
Beating Harmful Stereotypes Through Facts: RAG-based Counter-speech Generation [10.5] 本稿では,音声対音声生成を知識ワイドテキスト生成プロセスとしてモデル化する新しいフレームワークを提案する。
我々のフレームワークは、先進的なレトリーバル拡張生成(RAG)パイプラインを統合し、8つの主要なターゲットグループに対する信頼性の高い対音声の生成を保証する。
我々は、MultiTarget-CONANデータセットを使用して、標準メトリクスと人的評価の両方を通して、生成した反音声の品質を実証的に評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:20:01 GMT)
A Generalized Information Bottleneck Theory of Deep Learning [10.5] Information Bottleneck(IB)原則は、ニューラルネットワーク(NN)がどのように学習するかを理解するための説得力のある理論的フレームワークを提供する。
我々は、シナジーのレンズを通して、元のIB原理を再構築する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:46:14 GMT)
Backdoor Mitigation via Invertible Pruning Masks [10.4] 本稿では,メインタスクとバックドアタスクの両方に必須なパラメータを識別する,学習したEmphselection機構を備えた新しいプルーニング手法を提案する。
これを二段階最適化問題として定式化し、選択変数、スパース可逆マスク、サンプル固有のバックドア摂動を共同で学習する。
提案手法は,既存のプルーニング方式のバックドア緩和手法より優れ,限られたデータ条件下での強い性能を維持し,最先端の微調整手法と比較して競争力のある結果が得られる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:39:40 GMT)
Learning to Explore in Diverse Reward Settings via Temporal-Difference-Error Maximization [10.4] 本研究では,密度,疎度,探索-逆報酬設定に対して頑健な,新しい探索手法である安定誤差探索(SEE)を提案する。
本手法では,遠方政治学習による不安定性の軽減,累積的TDエラーをエピソード設定で最大化する関心の対立,TDエラーの非定常的性質の3つの設計選択を導入する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:08:47 GMT)
SpineBench: Benchmarking Multimodal LLMs for Spinal Pathology Analysis [10.4] 脊髄領域におけるマルチモーダル言語モデル(MLLM)の評価のためのベンチマークであるSpineBenchを紹介する。
SpineBenchは、40,263の脊椎画像から64,878のQAペアで構成され、2つの重要な臨床的タスクを通じて11の脊髄疾患をカバーしている。
SpineBenchは、オープンソースの脊椎疾患データセットからイメージラベルペアを統合し、標準化することによって構築される。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:19:22 GMT)
Engineering atomic superradiance scaling in cavity QED system with collective and individual emission channels [10.2] 原子-光子カップリングは、個々の原子放出に関連するスケーリングを高めながら、集合超ラジカルスケーリングを抑えるという発光挙動を著しく変えることができる。
我々の研究は、最先端の実験プラットフォームにおける制御可能な集団放出への道筋を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:48:51 GMT)
FedMMKT:Co-Enhancing a Server Text-to-Image Model and Client Task Models in Multi-Modal Federated Learning [10.2] テキスト・ツー・イメージ(T2I)モデルは幅広いアプリケーションでその汎用性を実証している。
特殊なタスクへのT2Iモデルの適応は、プライバシの懸念によるタスク固有のデータの提供によって制限されることが多い。
本稿では,サーバT2Iモデルとクライアントタスク固有のモデルの共同構築を可能にする新しいフレームワークであるFederated Multi-modal Knowledge Transfer (FedMMKT)を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:04:11 GMT)
Fine-grained Analysis of Brain-LLM Alignment through Input Attribution [10.1] 我々は,脳-LLMアライメントにおいて最も重要な単語を識別する,詳細な入力属性法を提案する。
以上の結果から,BAとNWPは単語サブセットに大きく依存していることが判明した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:19:01 GMT)
Data-Model Co-Evolution: Growing Test Sets to Refine LLM Behavior [10.0] 大きな言語モデル(LLM)により、開発者はプロンプト命令を編集することでモデルの振る舞いを制御できる。
我々はこのパラダイムを対話型システムで運用し、微妙でドメイン固有のポリシーをインシデントインストラクションにエンコードするという課題に対処する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:07:37 GMT)
Few Shot Semi-Supervised Learning for Abnormal Stop Detection from Sparse GPS Trajectories [9.9] 都市間交通における異常な停止検知は、乗客の安全、運転の信頼性、規制の遵守を保証するために重要である。
既存の方法は、しばしば密度の高いサンプリングや規則的な動きパターンを仮定し、適用性を制限する。
本研究では,局所空間時間密度に基づいてセグメント境界を適応的に定義するスパーシティ・アウェア (SAS) 手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:22:34 GMT)
Aixel: A Unified, Adaptive and Extensible System for AI-powered Data Analysis [9.9] 我々はAIを利用したデータ分析のための統一的で適応的で準最適システムであるAixelを提案する。
システムはアプリケーション、タスク、モデル、データという4つのレイヤにまたがる作業を整理する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:34:35 GMT)
WW-FL: Secure and Private Large-Scale Federated Learning [9.9] Federated Learning(FL)は、クライアントデバイス上でトレーニングデータを保持することによって、データのプライバシを保証する、大規模分散機械学習の効率的なアプローチである。
最近の研究でFLの脆弱性が発見され、毒殺攻撃によってセキュリティとプライバシーの両方に影響を及ぼした。
データとグローバルモデルのプライバシを保証するために,セキュアなマルチパーティ計算と階層的なFLを組み合わせた,革新的なフレームワークであるWW-FLを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:01:57 GMT)
Boosting Generic Semi-Supervised Medical Image Segmentation via Diverse Teaching and Label Propagation [9.9] 3つのタスク全てをマスターする汎用フレームワークを開発する。
この問題を解決する鍵は、ラベルのないデータに対して信頼できる擬似ラベルを生成する方法にある。
提案するフレームワークを5つのベンチマークデータセットで評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:25:54 GMT)
DSAS: A Universal Plug-and-Play Framework for Attention Optimization in Multi-Document Question Answering [9.8] 大規模言語モデル (LLM) は様々な分野において有望である。
マルチドキュメント質問応答(Multi-doc QA)タスクの処理には、注目すべき制限がある。
2つのモジュールを含むDual-Stage Adaptive Sharpening (DSAS)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:01:59 GMT)
MaxPoolBERT: Enhancing BERT Classification via Layer- and Token-Wise Aggregation [9.8] MaxPoolBERTは、新たな事前トレーニングやモデルサイズの大幅な増加を必要とせずに、BERTの分類精度を向上させる。
GLUEベンチマークの実験では、MaxPoolBERTは低リソースタスクにおける標準的なBERTベースモデルよりも一貫して優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:59:02 GMT)
Empowering LLM Agents with Geospatial Awareness: Toward Grounded Reasoning for Wildfire Response [9.8] 既存の統計的アプローチは意味的な文脈を欠くことが多く、イベント全体にわたって一般化し、限定的な解釈性を提供する。
地空間認識層(Geospatial Awareness Layer, GAL)を導入し, LLMエージェントを地球構造データに固定する。
GALは、外部ジオデータベースからインフラストラクチャ、人口統計、地形、気象情報を自動的に取得し、統合する。
このリッチなコンテキストにより、エージェントはエビデンスベースのリソース割り当てレコメンデーションを作成することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:59:02 GMT)
Split Conformal Classification with Unsupervised Calibration [9.7] 分割共形予測法は、キャリブレーションサンプルを利用して、任意の予測規則をセット予測規則に変換する。
本稿では,分類タスクの教師なしキャリブレーションによる共形予測を分割する効果的な手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:41:50 GMT)
Health-promoting Potential of Parks in 35 Cities Worldwide [9.7] 都市公園は公衆衛生上重要であるが、福祉支援における特定の空間の役割はよく理解されていない。
我々は,身体,マインドフルネス,自然鑑賞,環境,社会,文化の6種類の健康関連活動を定義した。
私たちはこれらの活動を支援する能力に基づいて、世界中の35都市で23,477の公園を記録しました。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:15:00 GMT)
Which Word Orders Facilitate Length Generalization in LMs? An Investigation with GCG-Based Artificial Languages [9.7] 言語モデル (LM) は, 稀で不明瞭な言語モデルよりも, 典型的に頻繁な文法的特性を優先する帰納的バイアスを持つかを検討する。
我々は、一般化カテゴリー文法(GCG)を採用することにより、文脈自由ALの形式化を拡大する。
我々の評価は、未確認の長文を処理できるLMの一般化能力に重点を置いている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:00:19 GMT)
Deliberate Lab: A Platform for Real-Time Human-AI Social Experiments [9.7] Deliberate Labは、大規模でリアルタイムな行動実験のためのオープンソースのプラットフォームである。
人間の参加者と大きな言語モデル(LLM)ベースのエージェントの両方をサポートする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:02:24 GMT)
Content Anonymization for Privacy in Long-form Audio [9.7] ロングフォームオーディオは、インタビュー、電話、会議のようなドメインで一般的な場所である。
同じ話者からの複数の発声が与えられた場合、攻撃者は個人の語彙、構文、言い回しを活用できる。
このリスクに対処する新しいコンテンツ匿名化手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:52:50 GMT)
High-efficiency and long-distance quantum memory-assisted device-independent quantum secret sharing with single photon sources [9.7] デバイス非依存(DI) QSSは、量子ネットワークの最高セキュリティレベルを提供する。
単一光子源に基づく量子メモリ支援(QMA)DI QSSプロトコルを提案する。
本プロトコルは,既存のDI QSSプロトコルよりも7桁高いキー生成効率を実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:49:27 GMT)
Credal Transformer: A Principled Approach for Quantifying and Mitigating Hallucinations in Large Language Models [9.7] 大きな言語モデル(LLM)は幻覚を生じさせ、事実的に間違っているが確実なアサーションを生み出します。
本稿では,通常の注意をCAM(Credal Attention Mechanism)に置き換えるCredal Transformerを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:31:49 GMT)
Playmate2: Training-Free Multi-Character Audio-Driven Animation via Diffusion Transformer with Reward Feedback [9.6] 任意の長さの音声ビデオを生成するための拡散変換器(DiT)ベースのフレームワークを提案する。
また,マルチキャラクタ・オーディオ駆動アニメーションの学習自由化手法についても紹介する。
実験により,本手法は既存の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:50:05 GMT)
Humanoid Artificial Consciousness Designed with Large Language Model Based on Psychoanalysis and Personality Theory [9.6] 精神分析の原理に基づく3つの人工意識を発達させる。
また,Mers-Briggs Type Indicator (MBTI) 型を表す個性が異なる16文字を設計する。
定量的および定性的な分析は、十分にシミュレートされた意識の可能性が高かった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:58:28 GMT)
Geometric optimization for quantum communication [9.5] チャネルの量子容量や共有状態の蒸留可能な絡み合いなどの量子通信の限界について検討する。
上界に対しては、既知の情報理論境界を最小化する状態拡張とチャネル拡張を探索する。
下界に対しては、ユニタリ多様体上の量子楽器をパラメータ化することにより、一方向の蒸留可能な絡み合いの下位境界を確立する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:32:47 GMT)
Improving Decision Trees through the Lens of Parameterized Local Search [9.4] 本研究では,これらの操作の1種類の固定数を実行することにより,分類誤差の最小化について検討する。
本稿では,本アルゴリズムの概念実証実装と実験結果について報告する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:06:13 GMT)
Bridging Idealized and Operational Models: An Explainable AI Framework for Earth System Emulators [9.4] 我々は地球系エミュレータのための説明可能なAIフレームワークを開発した。
再構成された潜在データ同化技術によってモデル階層をブリッジする。
理想化されたモデルから目標とする改善を通じて、グローバルな精度の向上を実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:02:40 GMT)
Hybrid Gaussian Splatting for Novel Urban View Synthesis [9.3] 本稿では,ICCV 2025のRealADSim Workshopで開催されているRealADSim-NVSチャレンジに対するQualcomm AI Researchソリューションについて述べる。
この課題は、ストリートシーンにおける新しいビューの合成に関するものであり、参加者は同じ都市環境のレンダリングを生成する必要がある。
本手法は,ガウススプラッティングと拡散モデルを組み合わせたシーン生成と生成シミュレータのハイブリッド手法に着想を得たものである。
世論調査の結果,提案案は総合スコア0.432に到達し,総合で2位となった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:09:13 GMT)
Shallow Robustness, Deep Vulnerabilities: Multi-Turn Evaluation of Medical LLMs [9.3] MedQA-Followupは,医療質問応答におけるマルチターンロバスト性を評価するためのフレームワークである。
MedQAデータセットの制御介入を用いて、5つの最先端LCMを評価する。
モデルは浅瀬の摂動下では合理的に良好に機能するが、マルチターン設定では深刻な脆弱性が現れる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:04:18 GMT)
SeqBench: Benchmarking Sequential Narrative Generation in Text-to-Video Models [9.2] 本稿では,T2V生成における逐次的物語コヒーレンスを評価するための総合ベンチマークであるSeqBenchを紹介する。
私たちは、さまざまな物語の複雑さにまたがる320のプロンプトのデータセットを使用しています。
我々のDTG基準は人間のアノテーションと強い相関を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:40:57 GMT)
Large Language Models in Operations Research: Methods, Applications, and Challenges [9.2] オペレーションリサーチ(OR)は、輸送、サプライチェーン管理、生産スケジュールなど、複雑なシステム決定を支援する。
専門家主導のモデリングと手動パラメータチューニングに依存する従来のアプローチは、しばしば大規模、動的、マルチ制約の問題に悩まされる。
本稿では,大規模言語モデル(LLM)をORに適用し,既存の手法を3つの経路に分類する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:36:21 GMT)
Dissipation-Driven Transition of Particles from Dispersive to Flat Bands [9.2] 結合の散逸は分散バンドから平らなバンドへと粒子を駆動できることを示す。
これにより、オープン量子系におけるFB物理学の新たな道が開かれる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:17:23 GMT)
Interpreting the Latent Structure of Operator Precedence in Language Models [9.2] 大きな言語モデル(LLM)は印象的な推論能力を示しているが、算術的なタスクに苦戦し続けている。
LLMは,LLaMA 3.2-3Bモデルを用いて,内部表現に先行する演算子を符号化するかどうかを検討する。
本稿では,演算子間で高インパクトな埋め込み次元を交換することにより,演算子優先性を変更する手法である部分埋め込みを導入する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:53:01 GMT)
Security and Privacy Assessment of U.S. and Non-U.S. Android E-Commerce Applications [9.1] MobSF, AndroBugs, RiskInDroid を用いて,92のAndroid Eコマースアプリ(米国ベース58, 海外34)を分析した。
我々の分析ではSSLと証明書の脆弱性が広く見られ、約92%が安全でないHTTPコネクションを使用している。
米国のアプリにはマニフェスト、コード、証明書の脆弱性が少なかったが、どちらのグループも同様のネットワーク関連の問題を示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:30:57 GMT)
Large language models management of medications: three performance analyses [9.1] GPT 4oは3つの薬物管理タスクで試験された。
薬物製剤マッチングの最初の課題として、GPT-4oは、すべての利用可能な製剤に適合するジェネリック医薬品の精度が49%であった。
薬物と薬物の相互作用を識別する第2のタスクでは、DDIペアを識別する精度は54.7%であった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:32:00 GMT)
Generative AI and Firm Productivity: Field Experiments in Online Retail [9.0] 我々は、大規模ランダム化フィールド実験を通じて、ジェネレーティブ・人工知能(GenAI)がしっかりとした生産性に与える影響を定量化する。
GenAIの採用によって売上が大幅に増加し、治療効果は0%から16.3%となった。
オンライン小売業におけるGenAIの生産性効果に関する新たな大規模因果的証拠を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:17:09 GMT)
Noisy Neighbor: Exploiting RDMA for Resource Exhaustion Attacks in Containerized Clouds [9.0] 本稿では,NVIDIA BlueField-3に対する2種類の資源枯渇攻撃を実験的に解析する。
実時間RDMA動詞テレメトリと適応リソース分類に基づく閾値駆動型フレームワークであるHT-Verbsを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:26:09 GMT)
Towards Cross-Modal Error Detection with Tables and Images [8.8] クロスモーダルなエラー検出は、eコマースやヘルスケアのようなドメインで一般的である。
従来のエラー検出手法は単一のモダリティ(典型的にはテーブル)に集中する傾向にある。
CleanlabとDataScopeは、強力なAutoMLフレームワークと組み合わせてベストを尽くします。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:59:54 GMT)
mmWave Radar-Based Non-Line-of-Sight Pedestrian Localization at T-Junctions Utilizing Road Layout Extraction via Camera [8.8] 我々は,NLoS歩行者の局所化のために,カメラから推定される道路レイアウトを通してレーダPCDを解釈する新しい枠組みを提案する。
提案手法の有効性を実車に搭載したレーダカメラシステムを用いて実験により検証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:16:20 GMT)
Artificial Intelligence Virtual Cells: From Measurements to Decisions across Modality, Scale, Dynamics, and Evaluation [8.8] 本稿では,演算子文法による学習を組織化するモデルに依存しないセル・ステート・ラテント視点を提案する。
演算子対応データ設計、リーク耐性分割、透過的な校正とレポートを推奨する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:31:40 GMT)
Nash Equilibria in Games with Playerwise Concave Coupling Constraints: Existence and Computation [8.8] プレイヤーの戦略が共有結合制約を受ける連続静的ゲームにおけるナッシュ均衡の存在と計算について検討する。
具体的には、プレイヤーワイド・コンケーブユーティリティとプレイヤーワイド・コンケーブ制約によって許容されるゲームのクラスに焦点を当てる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:25:18 GMT)
ThinkPilot: Steering Reasoning Models via Automated Think-prefixes Optimization [8.8] 大型共振モデル(LRM)は強力だが、それでも非効率性や標的外推論に悩まされている。
本稿では,LRM推論を自動的に最適化するトレーニングフリーフレームワークであるThinkPilotを紹介する。
それは進化過程を使って思考を生成するが、それは推論行動の分類によって進化する指示である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:02:19 GMT)
CTRL-Rec: Controlling Recommender Systems With Natural Language [8.7] 本稿では,従来のレコメンデータシステムの自然言語制御をリアルタイムに行う手法を提案する。
我々は、従来のレコメンデータシステムが最適化する信号の標準重み付けに、ユーザ要求に基づく予測を統合する。
本研究では,19名のレターボックスユーザを対象に,レコメンデーションによってユーザのコントロール意識と満足度を著しく向上させる手法について検討した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:20:04 GMT)
A Hierarchical Quantized Tokenization Framework for Task-Adaptive Graph Representation Learning [8.6] この研究は、複数のスケールにわたるタスク適応アグリゲーションのための自己重み付け機構を導入する階層的な量子化フレームワークを提案する。
ノード分類とリンク予測のためのベンチマークデータセットの実験では、同等の計算予算の下で、強いベースラインよりも一貫した改善が示されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:36:43 GMT)
CoIRL-AD: Collaborative-Competitive Imitation-Reinforcement Learning in Latent World Models for Autonomous Driving [8.6] CoIRL-ADは、競合を防止しながら知識交換を促進する競合ベースのメカニズムを導入している。
nuScenesデータセットの実験では、ベースラインへの衝突速度が18%減少し、より強力な一般化とロングテールシナリオのパフォーマンスが向上した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:21:52 GMT)
The Role of Parametric Injection-A Systematic Study of Parametric Retrieval-Augmented Generation [8.5] パラノイド検索拡張生成(PRAG)は、ドキュメントをモデルパラメータとしてエンコードし、推論中にこれらの表現をモデルに注入する。
PRAGは文書の部分的意味情報のみをキャプチャし,それに依存するだけでテキストレベルでのインタラクションよりも性能が劣ることを示す。
パラメータ化された文書とテキスト文書を組み合わせると、モデルは関連情報をより効果的に活用し、ノイズの多い入力に対してより堅牢になる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:05:01 GMT)
Detection of quantum information masking via machine learning [8.5] 本研究では、純量子ビット状態と混合量子ビット状態の両方における量子情報マスキングを検出するための教師付き機械学習について検討する。
純量子ビット状態に対して、対応する密度行列をランダムに生成し、量子情報マスキングを検出するためにXGBoostモデルを訓練する。
混合量子ビット状態の場合、トレーニングサンプルの選択を最適化してXGBoost法を改善する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:36:53 GMT)
Fast CZ Gate via Energy-Level Engineering in Superconducting Qubits with a Tunable Coupler [8.4] エネルギーレベル工学による高速制御Z(CZ)ゲートの実装手法を提案する。
数値シミュレーションにより17 nsの非断熱CZゲートが99.99%以上の忠実度で達成された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:48:02 GMT)
A Comprehensive Review of Diffusion Models in Smart Agriculture: Progress, Applications, and Challenges [8.4] 拡散モデルは、農業の画像処理、データ拡張、リモートセンシング分析に可能性を示している。
従来の生成逆ネットワーク(GAN)と比較して、拡散モデルはトレーニングの安定性が向上し、画像生成品質が向上する。
本稿では,農業における拡散モデルの適用の最近の進歩を概観し,作物病や害虫検出,リモートセンシング画像強調,作物の生育予測,農業資源管理における役割に注目した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:26:37 GMT)
Evaluating the Quality of Randomness and Entropy in Tasks Supported by Large Language Models [8.3] 大規模言語モデル(LLM)技術は様々な応用をもたらし、その多くが本質的にランダム性を必要とする。
本稿では,一連の実験を通してランダム性を伴うタスクを扱うためのLLMの能力について検討する。
実験では、ランダム番号の生成、パスワードなどのランダム文字列の生成、シャッフルアイテム、ランダムネスの品質評価など、さまざまなタスクがカバーされている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:43:08 GMT)
State-Change Learning for Prediction of Future Events in Endoscopic Videos [8.3] 本稿ではSurgFUTRを紹介する。
ビデオクリップはSinkhorn-Knoppクラスタリングを介して状態表現に圧縮される。
我々は,短期(トリップレット,イベント)と長期(手術期間,フェーズ,ステップ遷移)の地平線にまたがる5つの予測タスクを持つSFPBenchを確立する。4つのデータセットと3つの手順による実験は,一貫した改善を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:25:03 GMT)
Who is a Better Matchmaker? Human vs. Algorithmic Judge Assignment in a High-Stakes Startup Competition [8.0] HLSE(Hybrid Lexical-Semantic similarity Ensemble)は、ハーバード・プレジデントのイノベーション・チャレンジで開発された。
我々は,309ドル対の審査員から得たブラインドマッチ品質スコアを用いて,人間の専門家による課題に対する評価を行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:25:09 GMT)
BeSTAD: Behavior-Aware Spatio-Temporal Anomaly Detection for Human Mobility Data [8.0] 本研究では,大規模人口を対象とした個人行動シグネチャをキャプチャする,教師なしのフレームワークBeSTADを提案する。
BeSTADは、位置の意味と時間的パターンを統合する意味的に豊かなモビリティ表現を学習する。
BeSTADは、一貫したセマンティックアライメントとクロス周期の行動比較によって異常を識別する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:33:06 GMT)
Teaching Language Models to Faithfully Express their Uncertainty [8.0] 大きな言語モデル(LLM)は、しばしば不確実性を誤解する。
本稿では,FUT(Fithful Uncertainity Tuning)を導入し,不確かさを忠実に表現する指導用LLMを指導する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:42:40 GMT)
MultiFoodhat: A potential new paradigm for intelligent food quality inspection [8.0] MultiFoodChatは、ゼロショット食品認識のための対話駆動型マルチエージェント推論フレームワークである。
Object Perception Token (OPT) はきめ細かい視覚特性を捉え、Interactive Reasoning Agent (IRA) は文脈的手がかりを動的に解釈して予測を洗練させる。
複数の公開食品データセットの実験により、MultiFoodChatは、既存の教師なしおよび少数ショットの手法と比較して、認識精度と解釈性に優れることを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:39:03 GMT)
Unconditional CNN denoisers contain sparse semantic representation of images [7.9] 生成拡散モデルは、ノイズ除去のためにトレーニングされたニューラルネットワークを用いてスコアを推定することにより、多様な画像データセットの確率を学習する。
本稿では,完全畳み込み型無条件UNetにおけるスコア推定から生じる画像表現について検討する。
UNetの中間ブロックは、個々の画像を活性チャネルのスパース部分集合に分解し、これらのチャネルの空間平均のベクトルは、基礎となるクリーン画像の非線形表現を提供することができることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:11:58 GMT)
Tensor Completion via Monotone Inclusion: Generalized Low-Rank Priors Meet Deep Denoisers [7.9] 本稿では,モノトーン包摂パラダイムに基づく新しいテンソル補完フレームワークを提案する。
Davis Yin 分割方式に基づいて GTCTV DPC アルゴリズムを開発し,そのグローバルコンバージェンスを厳格に確立する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:01:32 GMT)
Local Background Features Matter in Out-of-Distribution Detection [7.9] アプリケーションの信頼性と安全性を確保するために、現実世界にディープニューラルネットワークをデプロイする際には、アウト・オブ・ディストリビューション(OOD)検出が不可欠である。
OOD検出における大きな課題の1つは、ニューラルネットワークモデルがOODデータ上で過信な予測を生成することが多いことだ。
そこで本研究では,モデル学習において,ローカルな背景特徴を偽のOOD特徴として活用する新しいOOD検出手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:12:49 GMT)
TFGA-Net: Temporal-Frequency Graph Attention Network for Brain-Controlled Speaker Extraction [7.8] 脳波(EEG)信号に基づくAADは、脳波駆動型ターゲット話者抽出の可能性を提供する。
本稿では,脳波を用いた話者抽出モデルを提案し,脳波を聴取者から記録した脳波を用いて対象音声を抽出する。
我々のTFGA-Netモデルは、ある客観的評価指標において最先端の手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:26:50 GMT)
Learning Equivariant Functions via Quadratic Forms [7.8] データから群に対応する二次形式 $xT A x$ を学習することにより、群(未知あるいは未知の)同変関数を学習する手法を提案する。
我々は、対応する一意対称行列とその固有の対角形を利用し、単純化され、効率的であるモデルを生み出す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:31:39 GMT)
Hey, wait a minute: on at-issue sensitivity in Language Models [7.7] 我々は対話自然性を評価するためにDGRC(Divide, Generate, Recombine, Compare)を用いる。
LMは、インストラクテッドモデルにおいて、インストラクテッドな内容の対話を継続することを好んでおり、この効果が強化されている。
インストラクションチューニングは、この変調を増幅しないが、このパターンは、成功した対話力学の目印を反映している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:17:20 GMT)
Hybrid Multi-stage Decoding for Few-shot NER with Entity-aware Contrastive Learning [7.6] 名前付きエンティティ認識は、ラベル付けされたいくつかの例に基づいて、新しいタイプの名前付きエンティティを識別できる。
MsFNER(Entity-Aware Contrastive Learning)を用いたFew-shot NERのためのハイブリッド多段復号法を提案する。
MsFNERは一般的なNERを、エンティティスパン検出とエンティティ分類の2つのステージに分割する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:09:47 GMT)
Sample-Efficient Omniprediction for Proper Losses [7.6] 本稿では,下流の利用者が行動を伝える際に,正確な判断につながる確率的予測を構築することの問題点を考察する。
一つの意思決定者にとって、最適な予測器を設計することは、その個人の負の効用に対応する適切な損失関数を最小化することと等価である。
複数の意思決定者にとって、我々の問題は、複数の損失を同時に最小化する単一の予測器を設計することを目的としている全方位の変種と見なすことができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:49:05 GMT)
LUMINA: Detecting Hallucinations in RAG System with Context-Knowledge Signals [7.6] Retrieval-Augmented Generation (RAG) は、検索した文書に応答を接地することで、大規模言語モデル(LLM)における幻覚を軽減することを目的としている。
しかし、RAGベースのLLMは、正確で十分なコンテキストが提供されても、まだ幻覚的である。
本稿では,RAGシステムにおける幻覚を検出する新しいフレームワークLUMINAを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:15:14 GMT)
Post-hoc Popularity Bias Correction in GNN-based Collaborative Filtering [7.6] 協調フィルタリング(CF)における人気バイアスを補正するポストホック人気度デバイアス法(PPD)を提案する。
提案手法は,GNNに基づくCFにおいて,人気バイアス補正のための最先端手法よりも優れている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:10:08 GMT)
Switchboard-Affect: Emotion Perception Labels from Conversational Speech [7.6] そこで我々は,Switchboard corpus を自然言語の有望な情報源として認識する。
群集に分類的感情と次元属性のデータセットをラベル付けするように訓練する。
我々は、最先端のSERモデルを評価し、特に一般化が貧弱な感情カテゴリーの様々なパフォーマンスを見いだした。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:23:04 GMT)
HiCoTraj:Zero-Shot Demographic Reasoning via Hierarchical Chain-of-Thought Prompting from Trajectory [7.6] 既存のモビリティに基づく人口推定研究は、人口統計ラベルを持つ大規模軌跡データに依存している。
ラベル付きトレーニングデータなしで人口推定を行うフレームワークであるHiCoTrajを提案する。
ゼロショットシナリオにおいて,HiCoTrajは複数の階層属性をまたいだ競合性能を実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:18:29 GMT)
MMD-Flagger: Leveraging Maximum Mean Discrepancy to Detect Hallucinations [7.5] MMD-Flagger という幻覚コンテンツにフラグを付ける手法を提案する。
高レベルの観点から、MDD-Flaggerは出力間のMDDを追跡し、様々な温度パラメータで生成されたものと対応するものを検査する。
この軌跡の形状を検査することは幻覚のほとんどを検出するのに十分であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:29:16 GMT)
Expert or not? assessing data quality in offline reinforcement learning [7.5] オフライン強化学習は静的データセットからのみ学習する。
実際には、そのようなデータセットは、専門家、準最適、さらにはランダムな軌跡など、様々な点で異なる。
ベルマン・ワッサースタイン距離(英: Bellman Wasserstein distance、BWD)は、データセットの行動ポリシーがランダムな参照ポリシーとどのように異なるかを測定する、最適輸送スコアである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:31:23 GMT)
Query Brand Entity Linking in E-Commerce Search [7.5] 名前の一致認識とマッチングを組み合わせた2段階のアプローチと、極端な多クラス分類を用いた新しいエンドツーエンドソリューションを提案する。
オフラインベンチマークとオンラインA/Bテストの影響でソリューションを検証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:00:45 GMT)
Early Signs of Steganographic Capabilities in Frontier LLMs [7.4] 大規模な言語モデルは、ステガノグラフィーによる監視を避けることができる。
我々は、エンコードされたメッセージの送信と、エンコードされた推論の実行という、2つのタイプのステガノグラフィに焦点を当てた。
モデルが単純な状態追跡問題において基本符号化推論を実行できるという早期の兆候を見出した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:36:42 GMT)
How Well Can Preference Optimization Generalize Under Noisy Feedback? [7.4] 優先最適化は、人間のフィードバックに基づいて、好ましくない応答と好ましくない応答を区別するモデルを訓練する。
既存の研究の多くはノイズのないフィードバックを前提としているが、これは人間の判断に固有の誤りや矛盾のため非現実的である。
本稿では,雑音フィードバックが優先最適化に与える影響を考察し,これらの条件下での一般化保証を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:58:04 GMT)
Can DPO Learn Diverse Human Values? A Theoretical Scaling Law [7.4] 嗜好学習は、人間のフィードバックに基づいて、好ましくない反応と好ましくない反応を区別するモデルを訓練する。
本稿では,値の多様性とサンプル量とともに一般化がいかにスケールするかを解析するための新しい理論的枠組みを提案する。
我々のフレームワークは、有限個の勾配ステップの後、モデルがどのように一般化するかを厳格に評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:53:53 GMT)
Causal Inspired Multi Modal Recommendation [7.4] マルチモーダルレコメンデーションシステムは、eコマースとオンライン広告におけるパーソナライズされたレコメンデーションを強化する。
既存の方法は、しばしば2つの重要なバイアス、すなわちモーダル・コンファウンディングと相互作用バイアスを見落としている。
本稿では,これらの課題に対処するためのCausal-inspired Multimodal Recommendationフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:29:07 GMT)
On Foundation Models for Temporal Point Processes to Accelerate Scientific Discovery [7.3] 医学から地震学まで、多くの科学分野は複雑なシステムを理解するために時間の経過とともに事象のシーケンスを分析することに依存している。
従来は、新しいデータセットごとにスクラッチから機械学習モデルを構築、トレーニングする必要がある。
ひとつの強力なモデルで、コンテキストにおけるイベントデータの基盤となるパターンを学習します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:33:53 GMT)
TISDiSS: A Training-Time and Inference-Time Scalable Framework for Discriminative Source Separation [7.2] 我々は、TISDiSS(Training-Time and Inference-Time Scalable Discriminative Source separation)を提案する。
TISDiSSは、早期分割型マルチロス監視、共有パラメータ設計、動的推論繰り返しを統合している。
標準音声分離ベンチマークの実験は、パラメータ数を削減した最先端性能を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:59:00 GMT)
Adapting Noise to Data: Generative Flows from 1D Processes [7.2] 一次元の雑音発生過程を用いて生成モデルを構築するための一般的なフレームワークを提案する。
このアプローチの柔軟性を示す例を概説する。
そこで本研究では,データに適応する量子関数を用いて雑音分布をパラメータ化することにより,その1Dプロセス自体が学習可能な新しいフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:30:28 GMT)
Survival Modeling from Whole Slide Images via Patch-Level Graph Clustering and Mixture Density Experts [7.1] スライド画像全体(WSI)から癌特異的生存を予測するためのモジュラーフレームワークを提案する。
大規模なWSIに対処するために,Quantile-based thresholding を用いた動的パッチ選択を用いて予後情報組織領域を分離する。
第3に、局所的な特徴を文脈化するために、クラスタ内関係とクラスタ間関係の両方をモデル化する注意機構を用いる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:06:44 GMT)
Contextuality-based quantum key distribution with deterministic single-photon sources [7.0] 本研究では,InAs(Ga)As量子ドットを用いた高純度単一光子源を量子情報キャリアとして利用する。
このようなオンデマンド単一光子が量子的文脈性を生み出すことを実証する。
この能力は、半デバイス非依存の量子鍵分布を自由空間チャネル上での新たなプロトコルを可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:41:14 GMT)
Tokenization Disparities as Infrastructure Bias: How Subword Systems Create Inequities in LLM Access and Efficiency [6.9] トークン化の格差は、人工知能への公平なアクセスを達成する上で重要な障壁となる。
本研究では,200以上の言語におけるトークン化効率の大規模クロス言語的評価を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:14:38 GMT)
Pruning Cannot Hurt Robustness: Certified Trade-offs in Reinforcement Learning [6.9] 我々は,国家のマルコフ決定プロセスにおけるプルーニングの下での確証された堅牢性に関する最初の理論的枠組みを開発する。
クリーンタスク性能,プルーニングによるパフォーマンス損失,ロバスト性向上を両立させる新しい3段階の後悔分解を導出する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:35:27 GMT)
The Philosophical Foundations of Growing AI Like A Child [6.8] 本稿では,人間と機械の認知発達の相違から生じる課題について論じる。
人間の中核知識の実証的な証拠を探究し、言語モデルがそれを取得できない理由を分析し、この制限は固有のアーキテクチャ上の制約ではないと主張する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:50:28 GMT)
Clutch Control: An Attention-based Combinatorial Bandit for Efficient Mutation in JavaScript Engine Fuzzing [6.8] 既存のアプローチでは、ランダムセレクションを使用して、JavaScriptコードでどこで突然変異を実行するかを決定する。
可変長JavaScriptテストケース表現を観察できる新しいディープバンディットであるCLUTCHを提案する。
CLUTCHは3つの最先端ソリューションと比較して,JavaScriptファジリングの効率が向上することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:10:51 GMT)
The whos, whats, and whys of issues related to personal data and data protection in open-source projects on GitHub [6.7] インダクティブコーディングを使用して、オープンソースのGitHubプロジェクトから652の問題を解析しています。
データ保護規制が施行された際には,レポートの大幅な増加が見られた。
すべての調査結果から、データ保護規則は、プライバシーソフトウェア開発コミュニティに関する議論を効果的に開始することを示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:30:01 GMT)
Adversarial Distilled Retrieval-Augmented Guarding Model for Online Malicious Intent Detection [6.7] ADRAGは、堅牢で効率的なオンライン悪意のある意図検出のための2段階のフレームワークである。
リアルタイムアプリケーションでは、毎秒300クエリで最大5.6倍のレイテンシを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:34:33 GMT)
Bayes or Heisenberg: Who(se) Rules? [6.6] 量子系は確率的状態ベクトルで表される確率方程式として再構成可能であることを示す。
これらの表現は、順番にBrain(TB)モデルのニューラルネットワークダイナミクスによって近似することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:27:18 GMT)
DPO-Tuned Large Language Models for Segmentation in Simultaneous Speech Translation [6.6] 同時音声翻訳は、翻訳品質とレイテンシのバランスをとるために正確なセグメンテーションを必要とする。
直接選好最適化(DPO)で訓練された大規模言語モデルに基づくセグメンテーションフレームワークを提案する。
提案手法は,好みのアライメントを活用することで,リアルタイム翻訳の要求を満たす自然なセグメンテーションポイントをLLMが予測することを可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:41:36 GMT)
AMStraMGRAM: Adaptive Multi-cutoff Strategy Modification for ANaGRAM [6.5] ANaGRAMで最適化されたPINNのトレーニングダイナミクスを解析する。
本稿では,ANaGRAMの性能をさらに向上するマルチカット適応戦略を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:10:42 GMT)
Decentralizing Multi-Agent Reinforcement Learning with Temporal Causal Information [6.4] 我々はエージェントに高度な記号的知識を提供することが、この設定のユニークな課題にどのように対処できるかを研究する。
特に、ローカルポリシーとチームタスクの互換性を確認するのに使用されるフォーマルなツールを拡張します。
DMARLにおける事象の時間的進化に関する記号的知識は,DMARLの学習過程を著しく向上させることができることを実証的に実証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:29:34 GMT)
Towards Fast Coarse-graining and Equation Discovery with Foundation Inference Models [6.4] 高次元記録における潜伏力学は、しばしばより小さな有効変数の集合によって特徴づけられる。
ほとんどの機械学習アプローチは、動的一貫性を強制するモデルとともにオートエンコーダをトレーニングすることで、これらのタスクに共同で取り組む。
我々は最近導入されたファンデーション推論モデル(FIM)を利用して2つの問題を分離することを提案する。
半円拡散を合成ビデオデータに埋め込んだ二重井戸系における概念実証は、高速で再利用可能な粗粒化パイプラインに対するこのアプローチの可能性を示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:17:23 GMT)
Improving Planning with Large Language Models: A Modular Agentic Architecture [6.4] 大規模言語モデル(LLM)は、多段階の推論や目標指向の計画を必要とするタスクに悩まされることが多い。
本稿では,特殊モジュールの反復的相互作用によって計画が達成されるエージェントアーキテクチャ,MAPを提案する。
MAPは両方の標準LLM法よりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:12:35 GMT)
Online Topological Localization for Navigation Assistance in Bronchoscopy [6.4] 術中ナビゲーション支援のための画像ベース気管支鏡トポロジカル・ローカライゼーション・パイプラインを提案する。
提案手法はファントムデータのみに基づいて学習し,高コストな実データラベリングを排除し,優れた一般化能力を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:40:09 GMT)
Enhanced Pre-training of Graph Neural Networks for Million-Scale Heterogeneous Graphs [6.4] 本稿では,大規模不均一グラフ上でのグラフニューラルネットワーク(GNN)の事前学習に有効なフレームワークを提案する。
我々はまず,異種グラフの構造特性を捉えることを目的とした,構造対応事前学習タスクを設計する。
そこで本研究では,意味的ミスマッチに対処するために,セマンティック・アウェア・プレトレーニングタスクを設計する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:31:04 GMT)
CurLL: A Developmental Framework to Evaluate Continual Learning in Language Models [6.3] 5歳から10歳までの発達軌跡を基盤とした総合的な連続学習データセットとベンチマーク(CurlL)を導入する。
CurlLは5歳から10歳までの5つの発達段階(0-4)にまたがっており、幅広いスキルを小さな能力に分解するスキルグラフによって支えられている。
我々は23.4Bの合成データセットを作成し、スキルの進歩、語彙の複雑さ、フォーマットの多様性を制御した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:56:03 GMT)
Pretraining in Actor-Critic Reinforcement Learning for Robot Motion Control [6.3] この研究は、ニューラルネットワークモデルを事前学習するためのパラダイムを定義することを目的としている。
タスクに依存しない探索に基づくデータ収集アルゴリズムを用いて、多様な動的遷移データを収集する。
事前訓練された重みはアクターネットワークと批評家ネットワークの両方にロードされ、実際のタスクのポリシー最適化をウォームスタートさせる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:25:40 GMT)
Multifractal-enriched mobility edges and emergent quantum phases in Rydberg atomic arrays [6.3] アンダーソン局在は障害によって引き起こされる相転移を記述し、局所化状態と拡張状態を区別する。
準周期系では、ユニークなエネルギーと波動関数によって特徴づけられる第3の多フラクタル状態が出現する。
本稿では,三状態共存量子相を同時にホストする完全解決可能な準周期格子モデルを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:53:29 GMT)
Unspoken Hints: Accuracy Without Acknowledgement in LLM Reasoning [6.3] 制御されたヒント操作下でのチェーン・オブ・シント(CoT)忠実度について系統的研究を行った。
正確なヒントは、特に厳しいベンチマークや論理的推論において、精度を大幅に向上します。
ヒントの認識は非常に不均一で、方程式に基づくヒントは頻繁に参照されるが、生のヒントは静かに採用されることが多い。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:11:17 GMT)
The Value of AI Advice: Personalized and Value-Maximizing AI Advisors Are Necessary to Reliably Benefit Experts and Organizations [6.2] 高度な設定でデプロイされるAIシステムは、専門家や組織間で常に価値を付加することができないことが多い。
AIアドバイザの設計と評価において、AIアドバイスが現実世界のコンテキストにもたらす価値を評価することの重要性を強調します。
我々の結果は、AIアドバイザの価値駆動開発の必要性を強調し、専門家の独特な行動に適応し、意思決定の改善と助言コストの間のコンテキスト固有のトレードオフに最適化されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:20:16 GMT)
Inclusive Fitness as a Key Step Towards More Advanced Social Behaviors in Multi-Agent Reinforcement Learning Settings [6.2] 本稿では,各エージェントが遺伝子型を割り当てられ,報酬関数が包括的適合性の概念に従ってモデル化される,新しいマルチエージェント強化学習フレームワークを提案する。
エージェントの遺伝物質は、他のエージェントと共有され、我々の包括的報酬機能は、自然にこれを説明します。
我々は、囚人のジレンマを伴う2種類のネットワークゲームにおける社会的ダイナミクスについて研究し、その結果が生物学の確立した原則と一致していることを見出した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:20:01 GMT)
A Unified Framework for Variable Selection in Model-Based Clustering with Missing Not at Random [6.2] 本稿では,これらの課題を同時に解決するための統合フレームワークを提案する。
提案手法では,データ駆動型ペナルティ行列をクラスタリングに組み込んで,より柔軟な変数選択を実現する。
一定の規則性の下で、提案するフレームワークは、欠落したデータが存在する場合でも、クラスタリングの一貫性と一貫性の両方を達成することを実証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:40:48 GMT)
A Connection Between Score Matching and Local Intrinsic Dimension [6.2] 局所固有データ(英: local intrinsic data, LID)は、信号処理と学習理論における基本的な次元量である。
近年の研究では、拡散モデルがスコア推定のスペクトルを通してデータのLIDを捉えていることが判明している。
その結果, LID は denoising score matching loss よりも低く, この denoising score matching loss を LID 推定器として活用することが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:35:41 GMT)
The Harder The Better: Maintaining Supervised Fine-tuning Generalization with Less but Harder Data [6.1] 我々は,データ選択とアノテーション指導のための認知科学に触発されたフレームワークTHTB(The Harder The Better)を提案する。
実験の結果、THTBは、データの5%しかトレーニングされていないモデルを、フルデータセットトレーニングを上回るパフォーマンスで実現している。
さらにTHTBは、垂直領域で効果的なガイダンスを提供するため、2%のデータでトレーニングされたモデルが、はるかに大きなデータセットでトレーニングされたモデルを上回ることができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:25:24 GMT)
Language Modeling for the Future of Finance: A Survey into Metrics, Tasks, and Data Opportunities [6.0] 近年の言語モデリングの進歩により、上位階層の自然言語処理施設の財務に関する論文が増えている。
我々は、2017年から2024年にかけて38のカンファレンスやワークショップで発行された374のNLP研究論文をレビューし、金融関連タスクに直接対処する221の論文の焦点を絞った分析を行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:39:10 GMT)
Zero-Shot CFC: Fast Real-World Image Denoising based on Cross-Frequency Consistency [5.9] 既存のゼロショット法は長い訓練時間に悩まされており、ノイズ独立とゼロ平均特性の仮定に依存している。
本稿では,ZSCFC(Cross-Frequency Consistency)に基づく実世界のノイズ除去手法であるZero-Shot Denoiserを提案する。
特に、画像テクスチャは異なる周波数帯域で位置類似性と内容整合性を示すが、ノイズは生じない。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:35:59 GMT)
Fixed Point Explainability [5.9] モデルと説明者の相互作用を評価するために、「なぜ回帰」原理に着想を得た固定点説明の形式的概念を導入する。
固定点説明は極小性、安定性、忠実さなどの特性を満足し、隠れたモデル行動と説明的弱点を明らかにする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:45:31 GMT)
O-Forge: An LLM + Computer Algebra Framework for Asymptotic Analysis [5.7] 大規模言語モデルは、最近、IMOとPutnamの問題を解決する高度な能力を実証した。
主な困難は検証である: 提案は妥当に見えるが、厳密なチェックなしには信頼できない。
コンピュータ代数システムとフロンティア LLM を結合する LLM+CAS というフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:07:53 GMT)
STRIDE-QA: Visual Question Answering Dataset for Spatiotemporal Reasoning in Urban Driving Scenes [5.7] STRIDE-QAは、都市運転における時間的推論のための視覚的質問応答データセットとして最大である。
空間的局所化と時間的予測を通じて、オブジェクト中心とエゴ中心の推論の両方をサポートする。
我々のベンチマークでは、既存のVLM(Vision-Language Models)が予測一貫性のほぼゼロのスコアを得るのに苦労していることが示されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:54:59 GMT)
VISaGE: Understanding Visual Generics and Exceptions [5.6] 概念的理解は,現実的先行の前提となる相似性の仮定が相反する画像に反した場合に低下することを示す。
この効果は、個々のインスタンスについてクエリする前のセマンティックの影響よりも強い。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:13:06 GMT)
Uncertainty Matters in Dynamic Gaussian Splatting for Monocular 4D Reconstruction [5.5] 本研究では,信頼性の高い動作キューを伝播させて4次元再構成を向上する,不確かさを意識した動的ガウス平滑化フレームワークを提案する。
我々の重要な洞察は、時間ごとの不確実性を推定し、それを利用して不確実性を考慮した最適化のための安定なグラフを構築することである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:47:11 GMT)
Large Language Models Inference Engines based on Spiking Neural Networks [5.5] 我々は、トランスモデルを設計するためにスパイキングニューラルネットワーク(SNN)を探索する。
大規模SNNのトレーニングにおける課題は、非効率で時間を要する。
推論のためのトランスフォーマーベースSNNを設計する手法であるNeurTransformerを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:02:02 GMT)
AgentBreeder: Mitigating the AI Safety Risks of Multi-Agent Scaffolds via Self-Improvement [5.5] 大規模言語モデル(LLM)をマルチエージェントシステムに置き換えることによって、複雑なタスクのパフォーマンスが向上することが多い。
我々は,足場上での多目的自己改善進化探索のためのフレームワークであるAgentBreederを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:49:14 GMT)
Formal Analysis of Metastable Failures in Software Systems [5.4] 要求応答サーバシステムにおけるメタスタビリティの数学的基礎を提供する。
プログラムのセマンティクスを近似した連続時間マルコフ連鎖(CTMC)の構築方法を示す。
定性的視覚分析は, 現場で数ミリ秒間観測された多くの転移能を捉え, 予測することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:37:45 GMT)
Computing Systemic Risk Measures with Graph Neural Networks [5.4] 本稿では,明確にモデル化された二元的負債の金融ネットワークに対するシステム的リスク対策について検討する。
本研究では,システム的リスクと最適ランダムアロケーションの近似の数値計算法について検討する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:49:25 GMT)
Statistical phase-space complexity of continuous-variable quantum channels [5.4] 本研究では、この量子状態の複雑性量子化器を用いて、単一モードボソニック量子チャネルの複雑さを研究する。
我々は、量子チャネルの複雑さを、最小の複雑さで初期状態から生成できる最大の複雑性量として定義する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:00:04 GMT)
Developing and Validating the Arabic Version of the Attitudes Toward Large Language Models Scale [5.4] 2つの尺度であるAT-GLLMとAT-PLLMを翻訳し、249人のアラビア語話者のサンプルを用いて検証した。
結果は、アラビア語に翻訳されたこの尺度が、アラブ人や言語に使える信頼性が高く有効なツールであることを示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:56:53 GMT)
Saving SWE-Bench: A Benchmark Mutation Approach for Realistic Agent Evaluation [5.3] SWE-Bench Verifiedのようなソフトウェアエンジニアリングエージェントを評価するための現在のベンチマークは、主にGitHubの問題に由来する。
既存のベンチマークを現実的なユーザクエリに変換する,新たなベンチマークフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:24:35 GMT)
iCodeReviewer: Improving Secure Code Review with Mixture of Prompts [5.3] iCodeReviewerは,大規模言語モデル(LLM)に基づいた,セキュアな自動レビューアプローチである。
実験結果は、F1の63.98%のセキュリティ問題同定とローカライゼーションにおけるiCodeReviewerの有効性を示す。
iCodeReviewerが生成したレビューコメントは、本番環境にデプロイされた場合の受け入れ率も最大84%に達する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:30:59 GMT)
Reframing Image Difference Captioning with BLIP2IDC and Synthetic Augmentation [5.2] BLIP2IDCは,画像差分キャプション(IDC)タスクへのBLIP2の適応であり,低コストで導入する。
我々は、実世界のIDCデータセットにおいて、2ストリームのアプローチよりも大きな差があることを示します。
また,IDCモデルの性能を非依存的に向上させるために合成拡張法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:40:05 GMT)
Personalized Federated Fine-Tuning of Vision Foundation Models for Healthcare [5.1] ファンデーションモデルは、医療にAIを使用する新たな可能性を開く。
そこで本研究では,LoRAアダプタを学習し,汎用知識とクライアント固有の知識を分離する,パーソナライズされたファインタニング手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:18:12 GMT)
TripScore: Benchmarking and rewarding real-world travel planning with fine-grained evaluation [5.1] 我々は、詳細な基準を1つの報酬に統一する旅行計画のための総合的なベンチマークを導入する。
我々の評価器は旅行専門家のアノテーション(60.75%)と適度に一致した。
ユーザ意図を一般化するための219のリアルタイムなフリーフォーム要求を含む,4,870の大規模クエリデータセットをリリースする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:10:44 GMT)
Clean First, Align Later: Benchmarking Preference Data Cleaning for Reliable LLM Alignment [5.1] 人間のフィードバックは、大きな言語モデル(LLM)と人間の嗜好の整合において重要な役割を果たす。
この問題を軽減するために様々な自動データクリーニング手法が提案されているが、その効果の体系的評価は依然として不十分である。
PrefCleanBenchは、アライメントパフォーマンスと一般化性の観点からクリーニング戦略を評価するための標準化されたプロトコルを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:47:29 GMT)
On the Robustness Evaluation of 3D Obstacle Detection Against Specifications in Autonomous Driving [5.0] 仕様に基づく摂動に対する3次元障害物検出モデルのロバスト性は未評価のままである。
業界グレードのLevel 4 ADSを含む5つの古典的3次元障害物検出モデルのロバスト性を評価するためにETを適用した。
PCDの非常に微妙な変化(すなわち2点の除去)でさえ、オブジェクトの安全性の非自明な低下をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:15:29 GMT)
Influence Dynamics and Stagewise Data Attribution [5.0] 特異学習理論に基づく段階的データ帰属のためのフレームワークを提案する。
我々は、発達遷移において、サインフリップや急激なピークを含む、影響が単調に変化する可能性があると予測する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:21:23 GMT)
Post-surgical Endometriosis Segmentation in Laparoscopic Videos [5.0] 本論文は, 子宮内膜症, すなわち暗い子宮内膜インプラントの出現頻度の高い視覚的外観の分節を訓練するシステムについて述べる。
このシステムは、腹腔鏡下手術ビデオを分析し、特定インプラント領域にマルチカラーオーバーレイを付加し、ビデオブラウジングを改善するための検出概要を表示する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:54:28 GMT)
Hierarchical Alignment: Surgical Fine-Tuning via Functional Layer Specialization in Large Language Models [4.9] 階層的アライメント(Hierarchical Alignment)は、モデルレイヤの異なる機能ブロックにターゲットDPOを適用する新しい手法である。
具体的には、局所的な層(ローカル・アライン)の整列は文法的な流感を高める。
グローバル層(Global-Align)の整合性は、仮説として事実整合性を改善するが、論理的コヒーレンスを強化するための最も効果的な戦略であることを証明している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:58:34 GMT)
Rethinking Knowledge Distillation: A Data Dependent Regulariser With a Negative Asymmetric Payoff [4.9] 我々は,知識蒸留の圧縮能力と,機能の観点から得られた知識伝達の定量化を行う。
その結果, 知識蒸留は圧縮機構として機能し, 負の非対称ペイオフを持つデータ依存正規化器として機能することが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:14:55 GMT)
A Function Centric Perspective On Flat and Sharp Minima [4.9] フラット・ミニマはディープ・ニューラル・ネットワークにおける一般化の改善と相関していると広く信じられている。
本稿では, 急激さを関数依存特性として理解することが, 一般化の信頼性の低い指標よりも重要であることを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:33:14 GMT)
MTOS: A LLM-Driven Multi-topic Opinion Simulation Framework for Exploring Echo Chamber Dynamics [4.8] 現実世界のネットワークでは、情報は複数の関連トピックにまたがり、意見の進化に挑戦する。
大規模言語モデル(LLM)に基づく既存の研究は、主に単一のトピックに焦点を当て、マルチトピック、クロスドメインのコンテキストにおける認知的伝達の捕捉を制限する。
一方、伝統的な数値モデルは、複雑な言語態度を離散的な値に単純化し、解釈可能性、行動整合性、複数のトピックを統合する能力に欠ける。
マルチトピック・オピニオン・シミュレーション(MTOS)を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:59:47 GMT)
An Empirical Study for Representations of Videos in Video Question Answering via MLLMs [4.7] マルチモーダルな大言語モデルは近年,ビデオ質問応答において顕著な進歩を遂げている。
ビデオ表現がMLLMに最も有効なのか、また、異なるモダリティがタスクの精度と計算効率のバランスをとるのかは、まだ不明である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:02:22 GMT)
Behavior Trees and State Machines in Robotics Applications [4.7] 状態機械は何十年もの間、振る舞いをモデル化するための言語として使われてきたが、最近はロボット工学者の間でビヘイビアツリーが注目を集めている。
動作ツリーDSLを解析し、ロボット工学:ステートマシンにおける行動モデルのための標準言語と比較する。
動作木と状態機械の類似性を言語設計とロボティクス領域のニーズを満たすために提供される概念で識別する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:13:21 GMT)
D2 Actor Critic: Diffusion Actor Meets Distributional Critic [4.7] D2ACは,オンライン上で表現的拡散政策を効果的に訓練するために設計された新しいモデルフリー強化学習(RL)アルゴリズムである。
その中核は政策改善の目標であり、典型的な政策勾配の高分散と時間経過によるバックプロパゲーションの複雑さを避ける。
この安定した学習プロセスは、我々の第2の貢献によって、ロバストな分布的批判によって可能となり、分布的RLとクリップされた二重Q-ラーニングを融合して設計する。
得られたアルゴリズムは非常に効果的で、ヒューマノイド、ドッグ、シャドウハンドを含む18のハードRLタスクのベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:08:10 GMT)
General Fourier Feature Physics-Informed Extreme Learning Machine (GFF-PIELM) for High-Frequency PDEs [4.7] 物理インフォームド・エクストリーム・ラーニング・マシン(GFF-PIELM)を提案する。
GFF-PIELMは、PIELMフレームワークの高精度、効率、簡易性を保ちながら、高周波問題を効果的に処理するFFMの能力を継承している。
提案したGFF-PIELMの有効性と妥当性を明らかにするために, 合計10個の数値例を用いて5つのケーススタディを行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:55:57 GMT)
TRIP: Coercion-resistant Registration for E-Voting with Verifiability and Usability in Votegral [4.6] Votegralは、認証発行問題に対処するために、個人登録の物理的なセキュリティを活用する、強制的な投票アーキテクチャである。
投票者は、どのクレデンシャルが本物であるかをプライバシーブースで学び検証できるが、その後、本物と偽のクレデンシャルは他人に区別できないように見える。
試行錯誤の結果から,Votegralは実世界の選挙において実用的かつ十分にスケーラブルであることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:29:23 GMT)
Beyond Per-Querier Budgets: Rigorous and Resilient Global Privacy Enforcement for the W3C Attribution API [4.5] 我々は、プライバシー保護広告測定のためのW3C標準であるAttribution APIのプライバシー保証を分析する。
個人, 伝統的DPのいずれにおいても, クエリごとの会計方式は適応性に乏しいことが示されている。
私たちは、この保証を強制するAttribution APIのプライバシー予算マネージャであるBig Birdを紹介します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:20:25 GMT)
Investigating Political and Demographic Associations in Large Language Models Through Moral Foundations Theory [4.5] 大規模言語モデル(LLM)は、多くのインターネットユーザーにとって日々の生活にますます取り入れられている。
これらの役割の重要性は、LLMが難しい政治的・道徳的な領域でどのように、どのように反応するかという疑問を提起する。
これまでの研究では、モラル財団理論(MFT)を使用して、政治的、国家的、文化的ラインに沿った人間の参加者の違いを測定してきた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:36:36 GMT)
Characterizing and Harnessing Correlations Featuring Independent Qubit Devices [4.5] 本稿では,ベルの量子ビット系における相関を特徴付ける枠組みを提案する。
次に、デバイスを参照し、必ずしも極端あるいは非局所的でない相関関係で絡み合いを検出するためのプロトコルを導入する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:04:25 GMT)
MIARec: Mutual-influence-aware Heterogeneous Network Embedding for Scientific Paper Recommendation [4.3] Mutual-Influence-Aware Recommendation (MIARec) モデルは、学者間の相互の学術的影響を測定し、特徴集約プロセスにこの影響を組み込む。
実世界のデータセットで実施された大規模な実験により、MIARecモデルは3つの主要な評価指標でベースラインモデルを上回っていることが示された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:47:25 GMT)
Quantum $f$-divergences and Their Local Behaviour: An Analysis via Relative Expansion Coefficients [4.3] 単式展開係数に結合可能な収縮係数と膨張係数について検討する。
グローバル(f$発散)と局所(リーマン)相対膨張係数が一対のチャネルに一致するような新しい$f$の族を同定する。
逆量子マルコフ収束定理を証明し、正の膨張係数を収束速度の定量的な下界に変換する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:40:38 GMT)
Semiclassical analytical solutions of the eigenstate thermalization hypothesis in a quantum billiard [4.3] 固有状態熱化仮説における対角関数および対角関数の解析解を導出する。
以上の結果から, ETHは単一粒子系および少数体系において重要な物理的意味を持っていることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:43:25 GMT)
Sparse Polyak: an adaptive step size rule for high-dimensional M-estimation [4.3] 我々は,高次元統計的推定問題を解くために,ポリアックの適応ステップサイズの変種であるスパース・ポリアックを提案し,研究する。
高次元では、リプシッツの滑らか度定数を推定することはもはや効果的ではない。
Sparse Polyakは、制限されたリプシッツの滑らか度定数を推定するためにステップサイズを変更することでこの問題を克服する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:13:13 GMT)
Leaking Queries On Secure Stream Processing Systems [4.2] ストリーム処理システムでは、クエリはアプリケーションロジックを含むため、データと同じくらい敏感である。
実行エンジンの確保にIntel SGXを使用するストリーム処理システムからクエリを抽出することは実用的であることを示す。
SecureStreamとNEXMarkを使って、人気のあるデータストリームベンチマークに基づいて攻撃を実装し、攻撃成功率を最大92%まで示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:01:14 GMT)
BrainForm: a Serious Game for BCI Training and Data Collection [4.2] 本研究では,2つの視覚刺激テクスチャの繰り返しセッションにおける制御スキルの発達と性能効果について検討した。
当社のBCIトレーニングシステムは,スケーラブルでユーザフレンドリなトレーニングツールであり,持続的なエンゲージメント低減のためのガイダンスを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:25:09 GMT)
Geometric Bound for Trade-off Relation in Quantum Tricycle [4.1] 我々は、外界によって駆動される量子三サイクルを開発し、低速運転体制における熱力学性能について検討する。
本研究は, 量子熱機械の性能に固有の限界を呈し, 有限時間熱力学を形成する上での幾何学的役割を強調した。
この研究は量子熱力学の基本的な理解を進め、次世代の量子技術の設計の指針となる原則を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:26:20 GMT)
Adding All Flavors: A Hybrid Random Number Generator for dApps and Web3 [4.1] 本稿では、信頼された実行環境(TEE)を備えたIoTデバイスをランダム性源とするハイブリッド乱数生成ソリューションを提案する。
この新しいアプローチでは、最終的な乱数の不偏性を保証するために、1つの正直なランダムソースしか必要としない。
改良の有効性を実証するために, 計算とガスコストを評価した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:59:12 GMT)
FedGTEA: Federated Class-Incremental Learning with Gaussian Task Embedding and Alignment [4.0] FedGTEA(Federated Gaussian Task Embedding and Alignment)と呼ばれる,FedGTEA(Federated Class Incremental Learning)のための新しいフレームワークを導入する。
FedGTEAは、タスク固有の知識を捉え、スケーラブルでコミュニケーション効率の良い方法で不確実性をモデル化するように設計されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:02:41 GMT)
Funny-Valen-Tine: Planning Solution Distribution Enhances Machine Abstract Reasoning Ability [4.0] 本稿では、RPM(progression)タスクとBongard-Logo(clustering)タスクの両方を排他する、統一された確率ハイライトベースラインであるValenを紹介する。
内部を解析すると、各タスクを主サンプルが適合しない分布として暗黙的に扱う。
ギャップを埋めるために最初に、Valenを正解密度に向ける対向アダプタであるTineを導入するが、対向訓練は不安定である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:32:20 GMT)
DSM: Constructing a Diverse Semantic Map for 3D Visual Grounding [4.0] 本稿では,VLM由来のセマンティクスのスペクトルを持つロバストな幾何学的モデルに富むシーン表現フレームワークであるDSM(Diverse Semantic Map)フレームワークを紹介する。
ScanReferのベンチマークでは、DSM-GroundingはIoU@0.5の59.06%の精度を達成し、他を10%上回っている。
セマンティックセグメンテーションでは、DSMは67.93%のF-mIoUを獲得し、特権のあるものを含むすべてのベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:11:32 GMT)
nuGPR: GPU-Accelerated Gaussian Process Regression with Iterative Algorithms and Low-Rank Approximations [3.9] 本稿では,GPRトレーニングに伴う高コストの課題に対処する新しいフレームワークであるnuGPRを提案する。
我々のフレームワークは、GPRの重要なステップにおける計算量を削減するために、数値線形代数からのいくつかのアイデアを含んでおり、それらを組み合わせてエンドツーエンドのトレーニングアルゴリズムを確立する。
nuGPRは、さまざまな合成および実世界のデータセット上で、トレーニング時間を最大2倍、ピークメモリ消費を最大12倍削減する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 04:06:02 GMT)
Unconditional Human Motion and Shape Generation via Balanced Score-Based Diffusion [3.8] スコアベース拡散モデルが非条件の人間の動作生成における最先端の結果と同等であることを示す。
提案手法を段階的に構築し,各コンポーネントに対する明確な理論的モチベーションを付与し,各追加提案の有効性を個別に示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:02:22 GMT)
One-shot distillation with constant overhead using catalysts [3.8] オーバヘッド蒸留の最小化は、量子計算やその他の技術の実現に不可欠である。
特に, マジック状態蒸留では, 分岐バッチサイズ問題に対処するための経路を舗装する。
動的量子資源に技法を拡張し、相互情報が一発触媒チャネル変換を決定することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:03:25 GMT)
ParsVoice: A Large-Scale Multi-Speaker Persian Speech Corpus for Text-to-Speech Synthesis [3.8] 既存のペルシア語のデータセットは、典型的には英語のデータセットよりも小さい。
ParsVoice はペルシャ語で最大の音声コーパスで、テキストから音声への応用に特化して設計された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:09:59 GMT)
Unlocking Zero-Shot Plant Segmentation with Pl@ntNet Intelligence [3.8] 農業画像に対するゼロショットセグメンテーション手法を提案する。
本手法は植物領域の特定にPlantnetの特化植物表現を利用する。
ベースDinoV2モデル上でPlanet-fine-tuned DinoV2を使用する場合,一貫した性能向上を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:38:32 GMT)
Hardware-aware Coding Function Design for Compressive Single-Photon 3D Cameras [3.6] 圧縮単光子3次元イメージングのための実用的な符号化関数を設計するための制約付き最適化手法を提案する。
我々は、帯域幅とピーク電力の制約の下で、符号化関数が従来の符号化設計より一貫して優れていることを示す広範なシミュレーションを通して示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:52:24 GMT)
DeepTrust: Multi-Step Classification through Dissimilar Adversarial Representations for Robust Android Malware Detection [3.5] この研究は、柔軟な分類器を順序づけられたシーケンスに配置する新しいメタヒューリスティックであるDeepTrustを提示する。
2025年のIEEE Conference SaTMLのRobust Android Malware Detectionコンペティションでは、DeepTrustが第一位を獲得し、最先端の結果を得た。
これは、非敵マルウェアの最も高い検出率と1%以下の偽陽性率を維持しながら達成される。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:10:23 GMT)
Context-Action Embedding Learning for Off-Policy Evaluation in Contextual Bandits [3.5] Inverse Propensity Score (IPS) 重み付けは、アクション空間が大きい場合や、コンテキスト-アクション空間の一部が過小評価されている場合、大きなばらつきに悩まされる。
最近導入されたMarginalized IPS (MIPS) 推定器は、アクション埋め込みを利用してこの問題を軽減する。
我々は、MIPSのMSEを最小限に抑えるために、オフラインデータからコンテキストアクション埋め込みを学習するMIPSのためのContext-Action Embedding Learningを導入する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:40:50 GMT)
FOCUS on Contamination: A Geospatial Deep Learning Framework with a Noise-Aware Loss for Surface Water PFAS Prediction [3.5] PFAS(per- and polyfluoroalkyl substances, PFAS)は、非スティック調理器具などの製品に含まれる化学物質で、健康リスクの高い環境汚染物質である。
本研究では,大規模水域におけるPFAS汚染を予測するため,ラベル付きノイズ認識損失関数を持つ深層学習フレームワークFOCUSを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:09:10 GMT)
MLRIP: Pre-training a military language representation model with informative factual knowledge and professional knowledge base [3.5] MLRIP(Military Language Representation with Integrated Prior)は、階層的な知識統合パイプラインを導入する新しい事前学習フレームワークである。
私たちのアプローチは、コマンド、サポート、エンゲージメント構造といった重要な依存関係をキャプチャします。
MLRIP は既存の BERT モデルよりもかなりのマージンで優れていることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:54:18 GMT)
Towards Foundation Inference Models that Learn ODEs In-Context [3.4] FIM-ODE(Foundation Inference Model for ODEs, FIM-ODE)を導入する。
合成データに基づいてトレーニングされたこのモデルは、フレキシブルなニューラル演算子を使用して、破損したデータからでも堅牢なODE推論を行う。
実験により,FIM-ODEが精度の高い推定値を提供し,その推定ベクトル場の構造を定性的に比較した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:44:54 GMT)
From Narratives to Probabilistic Reasoning: Predicting and Interpreting Drivers' Hazardous Actions in Crashes Using Large Language Model [3.3] 2車線の事故は、道路事故の約70%を占める。
Driver Hazardous Action (DHA)データは、一貫性のない、労働集約的な手動コーディングプラクティスによって制限される。
本稿では,微調整された大規模言語モデルを利用して,テキストによるクラッシュ物語からDHAを自動的に推測する,革新的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:35:47 GMT)
Proof of Cloud: Data Center Execution Assurance for Confidential VMs [3.3] Data Center Execution Assurance (DCEA)は、"Proofs of Cloud"を生成する設計である。
DCEAは、vTPMアンカレート測定を使用してCVMを基盤プラットフォームにバインドし、CVMの発射証拠とTPMの引用が同じ物理的シャーシを参照することを保証している。
当社のアプローチは、vTPMにアクセスし、クラウドプロバイダによって完全に制御されたソフトウェアスタック上で動作するCVMに適用されます。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:01:48 GMT)
Conditional Distribution Compression via the Kernel Conditional Mean Embedding [3.3] Kernel Herding (KH) のような既存の分散圧縮法は、元来、ラベルのないデータのために開発された。
本稿では,条件分布を比較するための自然な指標である平均条件平均離散性(AMCMD)を紹介する。
我々はKHのアイデアを拡張して,AMCMDを対象とする圧縮集合を構成する線形時間グリードアルゴリズムであるAverage Conditional Kernel Herding (ACKH)を開発した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:32:19 GMT)
Robot Learning: A Tutorial [3.3] このチュートリアルは、現代ロボット学習の風景をナビゲートし、強化学習の基本原理から汎用的な言語条件付きモデルへのコースをチャート化する。
我々のゴールは、ロボット学習の発展に貢献するために必要な概念的理解と実践的ツールを読者に提供することである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:36:46 GMT)
ACADATA: Parallel Dataset of Academic Data for Machine Translation [3.2] ACAD-TRAINには、96の言語方向にわたる150万の著者生成パラグラフが含まれている。
ACAD-BENCH(ACAD-BENCH)は、12方向をカバーする約6,000の翻訳をキュレートした評価セットである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:20:06 GMT)
UrbanTwin: Building High-Fidelity Digital Twins for Sim2Real LiDAR Perception and Evaluation [3.2] 本チュートリアルでは,高忠実度ディジタルツイン(HiFi DT)を構築するための再現可能なワークフローを導入し,リアルな合成データセットを生成する。
衛星画像やOpenStreetMap,センサ仕様などのオープンソースリソースを用いて,静的な地形,道路インフラストラクチャ,動的トラフィックをモデル化するための実践的な手順を概説する。
結果として得られる環境は、スケーラブルで費用効率のよいデータ生成をサポートし、堅牢なSim2Real学習を実現する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:28:16 GMT)
(R)evolution of Programming: Vibe Coding as a Post-Coding Paradigm [3.1] 我々は,開発者とAIシステム間の直感的,感情駆動的,即興的なインタラクションを強調する,新たなバイブコーディング(VC)パラダイムについて検討する。
我々の分析は、AI支援開発における一般的なコパイロットの視点と対比して、コドリフティングの比喩の中でVCを概念化している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:25:56 GMT)
Causal Ordering Without Effect Estimation: A Framework for Using Proxies in Treatment Prioritization [3.1] 予測プロキシを推論する決定中心のフレームワークを開発する。
プロキシが処理効果の優越的なモデレーターを反映した場合に保持する正しい効果順序をプロキシが回復する条件を同定する。
これらの条件が、個別選択設定において有用な近似としてどのように現れるかを示し、介入なしに行動する確率が説得を緩やかにすることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:29:13 GMT)
Deep SPI: Safe Policy Improvement via World Models [3.0] 政策更新を適切に定義された地区に制限することで、単調な改善と収束が保証されることを示す理論的枠組みを開発する。
この分析は、遷移と報酬予測損失を表現品質に関連付け、オフラインのRL文献から古典的なSPI定理の「深い」類似点を得る。
我々は、局所的な移行と報酬損失を規則化されたポリシー更新とを結合する、原則化されたオンライン政治アルゴリズムであるDeepSPIを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:11:24 GMT)
Efficient Fine-Tuning of DINOv3 Pretrained on Natural Images for Atypical Mitotic Figure Classification (MIDOG 2025 Task 2 Winner) [3.0] 非定型有糸分裂図(AMF)は予後不良に伴う細胞分裂を表わす。
MIDOG 2025チャレンジでは、複数のドメインにわたるAMF分類のベンチマークが導入されている。
我々は、低ランク適応(LoRA)を用いて、自然画像に事前訓練された最近発表されたDINOv3-H+視覚変換器を微調整した。
我々の微調整したDINOv3は病理組織学に効果的に移行し、最終テストセットで1位に達した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:55:38 GMT)
Hybrid Vision Transformer and Quantum Convolutional Neural Network for Image Classification [2.9] ViT-QCNN-FTは、微調整されたビジョントランスフォーマーと量子畳み込みニューラルネットワークを統合するハイブリッドフレームワークである。
均一に分散した絡み合いエントロピーを持つアンサーゼは、常に優れた非局所的特徴融合をもたらすことを示す。
QCNNを古典的なパラメータ数に置き換えると、劇的な29.36%の減少が起こり、量子優位性の明確な証拠が得られる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:52:14 GMT)
Sliding-Window Signatures for Time Series: Application to Electricity Demand Forecasting [2.8] そこで我々は,スライディングウインドウ上でのシグネチャ特徴を用いたリッジ回帰に基づく新しい予測フレームワークを提案する。
我々は、理論的な保証、すなわち、近似の普遍性とシグネチャの定常性を確立する。
その結果,シグネチャの特徴は時間的および非線形の依存関係を効果的に符号化し,専門家の知識に基づいて正確な予測を行うことができた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:49:30 GMT)
Responsible AI Technical Report [2.7] KTは、AIサービスの安全性と信頼性を保証するために、Responsible AI (RAI)アセスメント方法論とリスク軽減技術を開発した。
我々は、KTのAIリスク分類に基づくモデル安全性とロバスト性を検証する信頼性の高い評価手法を提案する。
また、特定されたAIリスクを管理し緩和するための実用的なツールも提供します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:14:20 GMT)
On Limits on the Provable Consequences of Quantum Pseudorandomness [2.7] 量子擬似ランダム性が他のものから構築される可能性は低いことを示すいくつかの証拠を示す。
我々は、1つの量子擬似ランダム性が存在するが、別の擬似ランダム性が存在しない新しい神託世界を研究する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:09:05 GMT)
VeilAudit: Breaking the Deadlock Between Privacy and Accountability Across Blockchains [2.7] ブロックチェーンシステムにおけるクロスチェーンの相互運用性は、ユーザのプライバシと規制説明責任の根本的な緊張を露呈する。
本稿では,Auditor Only Linkabilityを導入するクロスチェーン監査フレームワークであるVeilAuditを紹介する。
VeilAuditは、ユーザ生成のLinkable Audit Tagでこれを実現する。これは、ユーザマスタウォレットアドレスを公開せずに、その妥当性を証明するための知識証明をゼロに埋め込むものだ。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:16:23 GMT)
Discretion in the Loop: Human Expertise in Algorithm-Assisted College Advising [2.6] 本研究では、介入を指導し、学生の成功に影響を及ぼすアルゴリズムにおいて、アドバイザーがコンテキストを利用できない方法を研究する。
治療室の3つのうち2つが,非アルゴリズム的文脈を用いて,学生に対して「合理的に的を絞った」と推定した。
1つのスタイルは、学生に関するより包括的な情報をもたらし、卒業率の改善に結びついている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:43:20 GMT)
StegOT: Trade-offs in Steganography via Optimal Transport [2.6] 画像隠蔽はしばしばステガノグラフィ(steganography)と呼ばれ、同じ解像度のカバー画像に秘密画像を隠すことを目的としている。
本稿では、最適な輸送理論を取り入れたオートエンコーダに基づくステガノグラフィーモデルであるStegOTを提案する。
実験により,カバーとシークレットイメージのトレードオフを実現するだけでなく,ステゴ画像とリカバリ画像の両面の画質を向上させることができた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:16:42 GMT)
Deep Attention-guided Adaptive Subsampling [2.5] 3Dボリュームやビデオ分類タスクなど、多くの場合、すべてのスライスやフレームは固有の冗長性のために必要ではない。
ニューラルネットワークアーキテクチャに組み込むことができる新しい学習可能なサブサンプリングフレームワークを提案する。
MedMNIST3Dの3次元医用画像データセットと2つの超音波ビデオデータセットの分類作業における有効性を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:50:45 GMT)
One Dimensional CNN ECG Mamba for Multilabel Abnormality Classification in 12 Lead ECG [2.4] 2020年と2021年の心臓科におけるPhysioNet Computingに関する総合的な実験を行った。
提案したモデルでは, AUPRC と AUROC のスコアが, これまでに発表されたアルゴリズムよりもかなり高い結果を得た。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:51:35 GMT)
Is Misinformation More Open? A Study of robots.txt Gatekeeping on the Web [2.4] 評価可能なニュースサイトと誤報サイトがロボット.txtファイルの設定方法に異なるかどうかを検討する。
回答可能なサイトの60.0%は、ロボット.txtファイル内の偽情報サイトの9.1%に対して、少なくとも1つのAIクローラを禁止している。
我々の研究は、大規模言語モデルで利用可能なトレーニングデータを形成することができるコンテンツアクセシビリティの非対称性の増大に注目した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:07:30 GMT)
Transmon qutrit-based simulation of spin-1 AKLT systems [2.3] 量子回路に基づく量子回路は、局所的な次元が3である場合、回路全体の深さを減らし、ノイズの影響を減らしうる。
マイクロ波パルスゲートを低誤り率に校正し,トランスモンクォートを動作させる。
我々の研究は、トランモン四重項を用いたより一般的なスピン1物理シミュレーションへの経路を提供し、化学、磁性、トポロジカルな物質相に応用する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:55:48 GMT)
Superdiffusion resilience in Heisenberg Chains with 2D interactions on a quantum processor [2.2] 積分可能な1次元ハイゼンベルク模型のスピン輸送における超拡散スケーリングは、非平衡量子多体物理学における重要な発見の1つである。
現在の量子ハードウェアは、1Dハイゼンベルクモデルの超拡散をシミュレートすることで、そのような非平衡現象の研究においてその有用性を既に確認している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:26:49 GMT)
Compressibility Measures Complexity: Minimum Description Length Meets Singular Learning Theory [2.2] ニューラルネットワークのような特異モデルに最小記述長(MDL)の原理を拡張するために,特異学習理論を用いてニューラルネットワークの圧縮性を検討した。
局所学習係数(LLC)に基づく複雑性推定が密接に、場合によっては圧縮性と線形に相関していることが判明した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:38:02 GMT)
The NPA hierarchy does not always attain the commuting operator value [2.2] 非局所ゲームの可換作用素値が1/2より厳密に大きいかどうかを決定できない。
非局所ゲームの可換演算子値が1/2より厳密に大きいかどうかを決定できないことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:51:19 GMT)
Runtime Composition in Dynamic System of Systems: A Systematic Review of Challenges, Solutions, Tools, and Evaluation Methods [2.2] 関心が高まりつつあるにもかかわらず、この文献は動的SoSにおけるランタイム構成の合成を欠いている。
本研究では、動的SoSにおけるランタイム構成の研究を合成し、コア課題、ソリューション戦略、サポートツール、評価方法を特定する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:14:57 GMT)
Gen-C: Populating Virtual Worlds with Generative Crowds [2.2] 本稿では,エージェントエージェントとエージェント環境の相互作用をキャプチャするクラウドシナリオを生成する生成フレームワークであるGenerative Crowds (Gen-C)を紹介する。
Gen-Cはデュアル変分グラフオートエンコーダ(VGAE)アーキテクチャを採用しており、接続パターンと、テキスト信号と構造信号で条件付けられたノードの特徴を共同で学習する。
我々は、大学キャンパスや駅など多様な行動のシナリオにおけるGen-Cの有効性を実証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:00:07 GMT)
Wasserstein-based Kernel Principal Component Analysis for Clustering Applications [2.1] 本稿では,カーネルとワッサーシュタイン距離を組み合わせ,分散データをクラスタリングするための教師なしフレームワークを提案する。
このフレームワークはベクトルデータと分散データの両方に対応でき、様々な分野のアプリケーションを可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:15:08 GMT)
Of Mice and Machines: A Comparison of Learning Between Real World Mice and RL Agents [2.1] 近年の強化学習(RL)は,複雑な意思決定タスクにおいて顕著な能力を示した。
また, RL エージェントは自己保存本能の欠如を一貫して示し, 「死を危険にさらす」 と限界効率の向上を示唆している。
我々はRL剤のより自然主義的なリスク回避行動を促進する2つのメカニズムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:03:20 GMT)
Should I Run My Cloud Benchmark on Black Friday? [2.0] アプリケーションレベルでは、パフォーマンスの変動が観測可能であることを示す。
ブラックフライデーのような世界的な大イベントがパフォーマンスベンチマークの結果に影響を与えるかどうかを調べることで、この調査を拡張します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:22:01 GMT)
Reconstruction of SINR Maps from Sparse Measurements using Group Equivariant Non-Expansive Operators [2.0] グループ同変非拡張演算子(GENEOs)に基づく新しい再構成フレームワークを提案する。
我々の重要な洞察は、SINRマップのトポロジ的構造を保存するネットワーク管理は、ピクセル単位の誤差を最小限に抑えるよりも、しばしば重要であるということである。
以上の結果から,MSEは競争力を維持しつつも,トポロジカル忠実度において確立されたMLベースラインを劇的に上回っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:08:53 GMT)
Beyond Postconditions: Can Large Language Models infer Formal Contracts for Automatic Software Verification? [2.0] 大規模言語モデル(LLM)は、自然言語のヒントから正式な後条件を推測する際の約束を示す。
NL2Contractは,非公式な自然言語を形式的関数型コントラクトに変換するためにLLMを使用するタスクである。
NL2Contract with different LLMs and compared it to the task of postcondition generation nl2postcond。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:37:39 GMT)
MooseAgent: A LLM Based Multi-agent Framework for Automating Moose Simulation [2.0] 本稿では,マルチ物理シミュレーションフレームワークMOOSEのための自動解法フレームワークMooseAgentを提案する。
MooseAgentは、大規模事前訓練言語モデル(LLM)とマルチエージェントシステムを組み合わせる。
その結果,MooseAgentはMOOSEシミュレーションプロセスをある程度自動化できることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:08:19 GMT)
Dual-attention ResNet outperforms transformers in HER2 prediction on DCE-MRI [1.9] ダイナミックコントラスト造影MRI(DCE-MRI)による非侵襲的HER2像の予測は、診断を効率化し、生検への依存を減らすことができる。
我々は、RGB融合時間列を処理するトリプルヘッドデュアルアテンションResNetを用いて、強度正規化戦略のベンチマークを行った。
I-SPYテストデータ上では,0.75の精度,0.74のAUCを実現した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:08:17 GMT)
An efficient and exact noncommutative quantum Gibbs sampler [1.9] 任意の非可換ハミルトニアンのギブス状態に対して、効率よく実装可能で正確に詳細バランスの取れたリンドブラディアンを初めて構築する。
我々の構成は、メトロポリス・ハスティングスアルゴリズムの連続時間量子アナログと見なすこともできる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:44:29 GMT)
Measurement-induced entanglement in noisy 2D random Clifford circuits [1.9] ノイズ2次元ランダムクリフォード回路のカラム・バイ・カラムサンプリングにより生じる測定誘起絡みについて検討した。
一定の局所雑音は、長距離、体積法測定による絡み合いを損なうことが判明した。
テンソルネットワークに基づくアルゴリズムは雑音の多い2次元ランダムクリフォード回路から効率的にサンプリングできると推測する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:21:55 GMT)
SpareCodeSearch: Searching for Code Context When You Have No Spare GPU [1.9] キーワード検索は,大きなコンテキスト内で,関連性のある有用なコードコンテキストを検索するのに十分であることを示す。
私たちのソリューションで見つかるコードコンテキストの有用性は、コードコンテキストコンペティションのベンチマークでその完成結果を通じて示されます。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:48:50 GMT)
The Impact of Synthetic Data on Object Detection Model Performance: A Comparative Analysis with Real-World Data [1.9] 本研究では, オブジェクト検出モデルの性能に及ぼす合成データの影響について, 実世界のデータのみを用いて学習したモデルと比較して検討した。
倉庫環境でのパレット検出に焦点を当てた実験で、リアルおよび様々な合成データセット生成戦略を利用する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:59:51 GMT)
Guarding the Guardrails: A Taxonomy-Driven Approach to Jailbreak Detection [1.8] 脱獄技術は、大規模言語モデルの安全性に重大な脅威をもたらす。
ジェイルブレイク技術の有効性の理解を深めるために,構造化されたレッドチームチャレンジを実施した。
我々は、50のジェイルブレイク戦略の包括的な階層的な分類法を開発し、以前の分類を7つの広い家族に集約し拡張した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:34:41 GMT)
An AI-Based Behavioral Health Safety Filter and Dataset for Identifying Mental Health Crises in Text-Based Conversations [1.8] 大規模なモデルは、しばしば精神疾患を誤って扱い、有害または不適切なアドバイスを提供し、破壊的な行動を可能にする。
これには1,800のシミュレーションメッセージを含むVerily Mental Health Crisisデータセットと794メッセージにサブセットされたNVIDIA Aegis AI Content Safetyデータセットの2つのデータセットが評価されている。
我々はOpenAI Omni Moderation LatestとNVIDIA NeMo Guardrailsの2つのオープンソースコンテンツガードレールとの比較分析を行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:47:52 GMT)
A Customized SAT-based Solver for Graph Coloring [1.8] 本稿では,ZykovColorという新しいSATベースのアルゴリズムを導入し,グラフの着色問題を解く。
H'ebrard と Katsirelos (2020) のアプローチに基づく。
SATソルバの基盤となる利点を生かした新機能を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:48:56 GMT)
Hierarchical Federated Learning for Crop Yield Prediction in Smart Agricultural Production Systems [1.8] 本稿では,スマート農業生産システムと収量予測に特化して設計された,新しい階層型フェデレーション学習アーキテクチャを提案する。
本手法では,農耕期の始めに農作物が農作物特有のクラスターに合流する季節的な定期購読機構を導入する。
提案する3層アーキテクチャは,クライアントレベルでは個々のスマートファーム,中間層では作物特異的アグリゲータ,上位層ではグローバルモデルアグリゲータで構成されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:06:23 GMT)
Can ChatGPT support software verification? [1.7] ループ不変量で106個のCプログラムにアノテートするようChatGPTに依頼する。
本稿では,Frama-C と CPA Checker の2つの検証器に渡すことで,生成した不変量の妥当性と有用性を確認する。
評価の結果,ChatGPTはFrama-Cがこれまで解決できなかったタスクを検証できる有効かつ有用な不変量を生成することができることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:48:13 GMT)
Wavefront Coding for Accommodation-Invariant Near-Eye Displays [1.7] 立体表示における頂点調節競合問題に対処する新しい計算近目表示法を提案する。
本システムは、屈折レンズアイピースと、新しい波面符号化回折光学素子を統合する。
我々は、ウェーブフロント符号化光学と画像前処理モジュールを協調的に最適化するために、エンドツーエンドの学習を採用する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:52:28 GMT)
Going from a Representative Agent to Counterfactuals in Combinatorial Choice [1.7] 本稿では,二元多面体の集合からデータを抽出する意思決定問題について検討する。
本稿では,代表エージェントモデルに基づく非パラメトリックな非実例推論手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:03:27 GMT)
Generative AI for Requirements Engineering: A Systematic Literature Review [1.7] 生成事前学習型トランスモデルが現在の応用を支配している。
産業採用は未熟であり、90%以上の研究が初期開発に対応している。
GenAIベースのREの変革的な可能性にもかかわらず、いくつかの障壁は実践的な採用を妨げる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:49:56 GMT)
On the Use of Hierarchical Vision Foundation Models for Low-Cost Human Mesh Recovery and Pose Estimation [1.6] 我々は,ヒューマンメッシュリカバリ(HMR)とヒューマンポーズ推定(HPE)のためのシンプルで効率的なモデルの開発を目指している。
まず、対応する ViTPose モデルを適用することで、3つの軽量な HMR2.0 変異体を構築する。
さらに,階層型視覚基盤モデル(VFM)の初期段階をエンコーダとして活用することを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:57:40 GMT)
CoRGI: Verified Chain-of-Thought Reasoning with Post-hoc Visual Grounding [1.6] textbfCoRGI(textbfChain textbffof textbfReasoning with textbfGrounded textbfInsights)は、チェーンオブ思考出力のポストホック検証により、推論信頼性を高めるフレームワークである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:15:36 GMT)
Three Lenses on the AI Revolution: Risk, Transformation, Continuity [1.6] 人工知能(AI)は、歴史的技術革命の継続とそれに伴う潜在的破壊の両方として出現している。
この論文は、AIを3つのレンズで同時に見る必要がある、と論じている:textitriskは、その不可逆性とグローバルな外部性において、核技術に類似している、textittransformationは、生産性と労働の再編成を推進している汎用技術として産業革命と平行している、textitcontinuityは、パーソナルコンピューティングからインターネット、モバイルまで、50年間のコンピュータ革命の範囲を拡大している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:53:49 GMT)
Entanglement spectrum of gapless topological phases: a case study with topological superconductors [1.5] 相関スペクトルにおいて、エッジモードとバルクモードの両方を含む低エネルギースペクトルのシグネチャが現れることを示す。
この研究は、2d Li-Haldaneエンタングルメントスペクトルを、ギャップのないバルクを持つ2dトポロジカル系に一般化する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:46:44 GMT)
Robust Plant Disease Diagnosis with Few Target-Domain Samples [1.4] 優先サンプリングを用いた学習フレームワークTarget-Aware Metric Learningを提案する。
TMPSは、ターゲット(デプロイ)ドメインから限られた数のラベル付きサンプルにアクセスすると仮定して動作する。
TMPSは、同じソースとターゲットのサンプルを併用してトレーニングされたモデルを上回る。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:32:57 GMT)
Spectral analysis of hierarchical continuous-time quantum walks [1.4] 我々は、グローバル・ウォーカーとローカル・ウォーカーの2種類のランダム・ウォーカーを使用している。
グローバル・ウォーカーは各ステップごとにローカル・ウォーカーを選択し、選択したローカル・ウォーカーは1ステップずつ移動する。
多次元連続時間量子ウォーキングを定義する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:57:54 GMT)
Rademacher Meets Colors: More Expressivity, but at What Cost ? [1.3] グラフニューラルネットワーク(GNN)の表現力は、グラフ同型テストとの対応によって一般的に理解される。
この研究は、色付けアルゴリズムのレンズを通して表現性と一般化をリンクすることで、このトレードオフの理論的な説明を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:21:59 GMT)
Ax-Prover: A Deep Reasoning Agentic Framework for Theorem Proving in Mathematics and Quantum Physics [1.3] Ax-Proverは、リーンにおける自動定理証明のためのマルチエージェントシステムである。
様々な科学的領域にまたがる問題を解決し、自律的または協調的に人間の専門家と操作することができる。
我々は,2つの公的な数学ベンチマークと,抽象代数学と量子論の分野において導入される2つのリーンベンチマークにおいて,フロンティア LLM と特殊証明モデルに対するアプローチをベンチマークする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:57:04 GMT)
Efficient and Versatile Model for Multilingual Information Retrieval of Islamic Text: Development and Deployment in Real-World Scenarios [1.3] イラン語多言語コーパスの特徴を活用し、イスラムドメインのためのアドホックIRシステムを開発するための最適な戦略を検討する。
我々は,モノリンガル,クロスリンガル,トランスレーショナル・トレインオールの4つの訓練手法と,クロスリンガルとモノリンガルを併用した新しい混合手法を用いた11種類の検索モデルを構築した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:15:17 GMT)
Language Models Model Language [1.3] 我々はWitold Ma'nczakの経験主義的原理に対する視点の急激な変化を論じる。
彼は言語を「記号のシステム」や「脳の計算システム」ではなく、言葉の総体として定義している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:45:31 GMT)
Uncertainty Estimation on Graphs with Structure Informed Stochastic Partial Differential Equations [1.3] グラフニューラルネットワークは、様々なネットワークモデリングタスクで目覚ましい結果を得たが、グラフ上の不確実性を正確に推定することは難しいままである。
本稿では,SPDEへのガウス過程アプローチによる空間時空間雑音を取り入れた新しいメッセージパッシング方式を提案する。
提案手法は,空間的および時間的不確かさを同時に捕捉し,共分散カーネルのスムーズさを明示的に制御し,低ラベルと高ラベルの両方でグラフ上の不確かさを推定する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:34:48 GMT)
KonfAI: A Modular and Fully Configurable Framework for Deep Learning in Medical Imaging [1.3] KonfAIは、医療画像タスクに特化したモジュール式で完全なディープラーニングフレームワークである。
これにより、構造化YAML設定ファイルを通じて、完全なトレーニング、推論、評価を定義することができる。
KonfAIはオープンソースで、https://github.com/vboussot/KonfAIで入手できる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:17:59 GMT)
Attack-Specialized Deep Learning with Ensemble Fusion for Network Anomaly Detection [1.2] 従来の侵入検知システムは、頻繁な攻撃と稀な攻撃の両方で高い精度を維持するのに苦労している。
本稿では,特殊なディープラーニングモデルとアンサンブルメタ分類器を統合したハイブリッドな異常検出フレームワークを提案する。
提案システムでは,誤報を最小限に抑えたほぼ完全な検出率を実現し,その堅牢性と一般化性を強調した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:41:16 GMT)
Show Your Title! A Scoping Review on Verbalization in Software Engineering with LLM-Assisted Screening [1.2] 本稿では,ソフトウェア工学(SE)と心理学(PSY)の交差点における研究のスコーピングレビューについて述べる。
大規模な学際的レビューを実現するために,GPTを用いた大規模言語モデル(LLM)を用いた。
我々は、GPTのアウトプットをヒトレビュアーに対して検証し、13%の一致率で高い一貫性を示した。
著名なテーマは主にSEの工芸に結びついており、より人間中心のトピックは不足していた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:56:16 GMT)
Development and Benchmarking of a Blended Human-AI Qualitative Research Assistant [1.2] MuseはAIを使ったインタラクティブな質的研究システムだ。
十分に特定されたコードに対して、MuseとCohenの$0.71の人間の間には、ラッター間の信頼性がある。
また、障害モードを特定し、将来の改善をガイドし、人間のバイアスを修正する能力を示すために、堅牢なエラー解析も行います。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:17:34 GMT)
Multitask finetuning and acceleration of chemical pretrained models for small molecule drug property prediction [1.1] マルチタスク学習は以前,予測モデルの改善に成功している。
ケミカルプレトレーニンググラフニューラルネットワークモデルの微調整におけるマルチタスキングの実現により,性能が著しく向上することを示す。
我々は2つのマルチタスクADMETデータ分割を公開し、薬物特性予測のためのマルチタスク深層学習手法のより正確なベンチマークを可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:58:39 GMT)
Polynomial-Time Algorithms for Fair Orientations of Chores [1.0] 本稿では,雑用グラフの公平な配向を求める問題に対処する。
グラフのEF1 と EFX 配向は、たとえ自己ループが存在するとしても、そのグラフが存在するときのみコレを含む。
また、マルチグラフの EF1 と EFX の配向問題もNP完全であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:06:14 GMT)
Central Limit Theorems for Asynchronous Averaged Q-Learning [1.0] 非漸近的な中心極限定理を証明し、ワッサーシュタイン距離における収束速度は、反復数、状態-作用空間サイズ、割引係数、探索の質への依存を明示的に反映する。
汎函数中心極限定理を導出し、部分サム過程がブラウン運動に弱収束することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:23:21 GMT)
Multi-Action Self-Improvement for Neural Combinatorial Optimization [1.0] 自己改善モデルは、高品質なソリューションの生成と模倣によってポリシーを反復的に洗練する。
これらのアプローチは、複数のエージェントの協調に関わる問題の構造を活用できない。
共同マルチエージェント動作による自己改善を拡大する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:26:27 GMT)
Scaling Multi-Agent Epistemic Planning through GNN-Derived Heuristics [1.0] マルチエージェント・エピステミック・プランニング(Multi-agent Epistemic Planning、MEP)は、物理的世界とエージェントの信念の両方を推論するための自律的な計画フレームワークである。
MEPでは、状態はKripke構造、すなわち有向ラベル付きグラフとして表現する必要がある。
我々は、グラフニューラルネットワーク(GNN)を用いて、てんかん状態のパターンや関係構造を学習し、計画プロセスの導出を行う。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:07:20 GMT)
DarTwin made precise by SysMLv2 -- An Experiment [1.0] 我々は、Digital Twin(DT)進化のための既存のDarTwin表記を形式化するDSLであるDarTwin DSLを開発した。
私たちは、DarTwin DSLを実演していますが、グラフィカルな表記機能に関して、現在利用可能なSysMLv2のツールの制限についても指摘しています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:12:47 GMT)
Benchmarking foundation models for hyperspectral image classification: Application to cereal crop type mapping [0.9] 本研究は、ハイパースペクトル画像を用いた穀物作物マッピングの基礎モデル3つをベンチマークする。
成績は総合的精度(OA)、平均精度(AA)、F1スコアで測定した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:49:35 GMT)
A Critical Review of the Need for Knowledge-Centric Evaluation of Quranic Recitation [0.9] クラーニック・リサイクリング(タイウェド)の聖なる実践は、現代において重要な教育的課題に直面している。
デジタル技術は教育への前例のないアクセスを約束する一方で、評価のための自動ツールが広く普及または教育効果を達成できなかった。
本総説では, 言語知識と高度な音声分析を融合したハイブリッドシステムに, 自動クラニック評価の今後について考察する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:39:49 GMT)
Scaling LLM Planning: NL2FLOW for Parametric Problem Generation and Rigorous Evaluation [0.9] この作業では、ワークフロー計画問題の生成と評価のための完全に自動化されたパイプラインであるNL2Flowが導入されている。
NL2Flowは、構造化中間表現においてパラメトリックに問題を発生させ、それらを自然言語と形式PDDLの両方に翻訳する。
NL2Flowが生成した2296個の低微分問題に基づいて,オープンソースのインストラクション付きLLMを評価した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:19:05 GMT)
Green's function expansion for multiple coupled optical resonators with finite retardation using quasinormal modes [0.9] 電磁グリーンの機能は、現代のフォトニック量子デバイスの理論研究にとって重要な要素である。
マルチキャビティシステムの散乱電磁グリーン関数を数値的に効率的に計算する枠組みを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:41:24 GMT)
Quantum Krylov Subspace Diagonalization via Time Reversal Symmetries [0.9] クリロフ量子対角化法は量子コンピュータにとって有望なユースケースである。
既存の実装は制御された操作に依存しており、これは短期量子ハードウェアに課題をもたらす。
我々は、ハミルトン進化における時間反転対称性を活用することにより、これらのボトルネックを回避する新しいプロトコル、Krylov Time Reversal(KTR)を導入する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:37:47 GMT)
Cost Analysis of Human-corrected Transcription for Predominately Oral Languages [0.9] 実験室の条件下で1時間の音声データを正確に書き起こすのに30時間かかる。
フィールド条件下で1時間の音声データを正確に書き起こすには36時間を要する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:53:11 GMT)
CausalTrace: A Neurosymbolic Causal Analysis Agent for Smart Manufacturing [0.8] CausalTraceは、SmartPilotの産業用CoPilotに組み込まれた、ニューロシンボリック因果解析モジュールである。
リアルタイムオペレータインタラクションをサポートし、透過的で説明可能な意思決定サポートを提供することで、既存のエージェントを補完するように設計されている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:36:40 GMT)
Probing non-Markovian qubit noise and modeling Post Markovian Master Equation [0.8] ノイズ力学におけるメモリ効果を特徴付けるためにポストマルコフマスター方程式を用いる。
我々は,IBM量子デバイス上での超伝導量子ビットを用いたPMMEフレームワークを実験的に検証した。
我々は,情報理論を用いてクロストーク効果を定量化し,現在の量子ハードウェアにおいて観測された非マルコフ効果をクロストークが支配することを明らかにする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:08:15 GMT)
Quantum teleportation over thermal microwave network [0.8] マイクロ波系における量子通信は、分散量子コンピューティングとハイブリッド量子ネットワークにおいて重要な役割を果たす。
熱マイクロ波チャネル上での空間分離希釈冷凍機間のマイクロ波コヒーレント状態の量子テレポーテーションを, 最大4$Kまでの温度範囲で行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:49:01 GMT)
Toward LLM-Supported Automated Assessment of Critical Thinking Subskills [0.8] 批判的思考の根底にある「サブスキル」の測定の可能性を検討する。
我々は,学生エッセイのコーパスのための,確立したスキル進歩と完全な人間のコーディングに基づくコーディングルーリックを開発する。
我々は、ゼロショットプロンプト、少数ショットプロンプト、教師付き微調整の3つの異なる自動スコアリングアプローチを評価した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:36:19 GMT)
Probabilistic Links Between Quantum Classification of Patterns of Boolean Functions and Hamming Distance [0.8] 得られた分類確率はハミング距離とともに単調に減少することを示す。
これらの偏差はランダムではなく、体系的で予測可能であることを確認します。
分類確率に対して、初めて正確なハミング距離間隔を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:13:23 GMT)
Analysing Moral Bias in Finetuned LLMs through Mechanistic Interpretability [0.8] 大型言語モデル(LLM)は、微調整中に人間のようなバイアスを内部化する。
意図性における道徳的バイアスであるノベ効果は、微調整されたLLMに現れる。
対応する事前訓練されたモデルからのアクティベーションをいくつかの重要なレイヤにパッチすることは、その効果を排除するのに十分です。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:31:29 GMT)
Heterogeneous RBCs via deep multi-agent reinforcement learning [0.8] 本稿では,深いマルチエージェント強化学習と実業務サイクル(RBC)モデルを統合するフレームワークであるMARL-BCを紹介する。
MARL-BCは,(1)単一エージェントを用いた場合の教科書結果の復元,(2)多数の同一エージェントを用いた平均場KSモデルの結果の復元,(3)エージェント間の豊富な不均一性を効果的にシミュレートする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:26:18 GMT)
ProtoSiTex: Learning Semi-Interpretable Prototypes for Multi-label Text Classification [0.8] ProtoSiTexは、細粒度マルチラベルテキスト分類用に設計された半解釈可能なフレームワークである。
適応型プロトタイプとマルチヘッドアテンションを使用して、重複と矛盾するセマンティクスをキャプチャする。
ProtoSiTexは、忠実でヒューマンアラインな説明を提供しながら、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:59:28 GMT)
Towards Safe Maneuvering of Double-Ackermann-Steering Robots with a Soft Actor-Critic Framework [0.7] ダブルアッカーマン操舵ロボット(DASMR)の安全かつ高精度な操作のための強化学習フレームワークを提案する。
我々のフレームワークは、HER(Hindsight Experience Replay)とCrossQオーバーレイを利用して、障害物を避けながら、操作効率を高める。
重い四輪操舵ローバーによるシミュレーションの結果、学習方針は障害物を避けつつ、目標位置の97%までしっかりと到達できることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:59:35 GMT)
Using Kolmogorov-Smirnov Distance for Measuring Distribution Shift in Machine Learning [0.7] 特定のアプリケーションでは、このようなエラーはAIとMLシステムの安全性と信頼性にとって重要である可能性がある。
この問題に対処する1つのアプローチは、テストデータの確率分布の偏差をリアルタイムで監視し、測定することである。
我々は,KS距離を用いて分布シフトとそのAIエージェントの性能への影響を定量化する方法を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:35:55 GMT)
The Living Forecast: Evolving Day-Ahead Predictions into Intraday Reality [0.7] 本稿では,完全確率的日頭予測をトレーニングや再推論なしに日内予測に変換するベイズ更新機構を提案する。
家庭用電力消費と太陽光発電データを用いた実験により, 提案手法は, 可能性, サンプル, 定量, 点ベースで25%の精度で予測精度を向上することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:25:20 GMT)
SpyChain: Multi-Vector Supply Chain Attacks on Small Satellite Systems [0.7] 小さな衛星は科学的、商業的、防衛的な任務に不可欠なものであるが、商用オフ・ザ・シェルフ(COTS)のハードウェアに依存して攻撃面を広げる。
SpyChainは、小型衛星をターゲットとする独立したハードウェアサプライチェーンの、最初のエンドツーエンドの設計と実装である。
NASAの衛星シミュレーション(NOS3)を用いて、SpyChainがテストを避け、テレメトリを除去し、操作を妨害し、DoS攻撃を発射できることを実証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:08:46 GMT)
Contraction and entropy production in continuous-time Sinkhorn dynamics [0.6] 以前は非正としか知られていなかったシンクホーン流のエントロピー生成速度を正確に同定する。
この流れは, ターゲット境界面上の可逆マルコフ力学を, オンサーガー勾配流として誘導することを示す。
我々は、Sinkhorn LSIの即時的なユースケースとして、生成モデルを訓練する潜在空間の設計原理と、離散時間アルゴリズムの停止アルゴリズムの2つを挙げる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:32:15 GMT)
Denoised Diffusion for Object-Focused Image Augmentation [0.6] 本研究では、制約データ設定における動物の健康モニタリングを明確にするためのオブジェクト指向データ拡張フレームワークを提案する。
われわれのアプローチは動物を背景から切り離し、動物を変換と拡散に基づく合成によって強化し、現実的で多様なシーンを作り出す。
ドメイン固有のデータを生成することにより,データ共有シナリオにおいてもリアルタイムの動物健康モニタリングソリューションが有効になる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:47:16 GMT)
Mind the (Data) Gap: Evaluating Vision Systems in Small Data Applications [0.6] コンピュータビジョン研究は、ゼロショットと少数ショットの学習に注目する評価が増えているため、小さなデータ体制を無視していることを示す。
マルチモーダルな大言語モデル(MLLM)と視覚のみの手法を、様々なトレーニングセットサイズで比較する。
我々は、これらのアプローチの小規模データ文脈における最初の包括的比較を行い、実践的な展開による理論的進歩のブリッジを改善するために、AI研究における明らかな小規模データ評価を提唱する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:47:52 GMT)
From Delegates to Trustees: How Optimizing for Long-Term Interests Shapes Bias and Alignment in LLM [0.6] 我々は、AIシステムが委譲、表現された嗜好の反映、あるいは受託者として振る舞うべきかどうかを調査する。
長期的利益に重きを置く受託者スタイルの予測は、よく理解された問題に関する専門家のコンセンサスとより緊密に一致した政策決定を生み出す。
これらの発見は、人間の興味を表すAIシステムを設計する際の根本的なトレードオフを明らかにしている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:24:19 GMT)
Emergence of Internal State-Modulated Swarming in Multi-Agent Patch Foraging System [0.6] 活性粒子 (英: Active Particle) は、エネルギーを消費することによって持続的な平衡運動を維持する物質である。
非協力的な採餌作業を行っている間、群集における群集行動の出現は、環境の部分的観察可能性に起因する。
資源パッチが欠如している場合,群集の形で群集の出現を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:50:18 GMT)
Abmax: A JAX-based Agent-based Modeling Framework [0.6] JAXをベースとしたAbmaxは、複数のジャスト・イン・タイム(JIT)コンパイル可能なアルゴリズムを実装し、この機能を提供する。
標準捕食モデルベンチマークでは、Abmaxは最先端の実装に匹敵するランタイムパフォーマンスを達成する。
この機能はベクトル化可能であることも示し、類似したエージェントベースのモデルを並列に実行できるようにする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:34:25 GMT)
Unifying Vision-Language Latents for Zero-label Image Caption Enhancement [0.5] ViZerは画像キャプションにおけるゼロラベル学習を可能にする強化トレーニングフレームワークである。
人や合成アノテートされたデータセットに依存する従来のアプローチとは異なり、ViZerはトレーニング中に視覚と言語表現機能を積極的に調整する。
CIDErやBERTScoreのような自動キャプションメトリクスは、参照キャプションにない詳細をペナルライズすることが多いので、定性評価におけるViZerの利点を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:12:59 GMT)
APCE: Adaptive Progressive Context Expansion for Long Context Processing [0.5] 本稿では,処理において最も重要な入力チャンクを選択するためのコンテキスト認識ソリューションとしてAPCEを提案する。
入力を直接操作することで、APCEは基盤となるハードウェアやスケーラブルな環境への厳格な依存から切り離される。
実験により,APCEの総密度ベースラインに比べて,APCEの総和性能は優れていた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:26:36 GMT)
How hard is it to verify a classical shadow? [0.5] 本稿では,計算複雑性の観点から,古典的影の検証について検討する。
まず、局所的なクリフォード測定を利用して、[Huang, Kueng, Preskill, Nature Physics 2020] の単純な古典的なシャドウプロトコルであっても、CSVはQMA完全であることを示す。
また、指数関数的に多くの観測可能量に対するCSVは、量子階層の第2レベルの量子一般化のために完備であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:35:12 GMT)
Designing Tools with Control Confidence [0.5] ロボットのためのタスク条件自律型ハンドツール設計のための最適化ルーチンに、ニューラルインスパイアされた制御信頼項を導入する。
ツール使用時の環境不確実性に対して、制御信頼度で設計されたツールは、純粋な精度駆動の目的よりも、より堅牢であることを示す。
自律ツール設計のためのCMAESに基づく進化的最適化戦略は、他の最先端技術よりも優れています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:27:27 GMT)
InferA: A Smart Assistant for Cosmological Ensemble Data [0.5] InferAは、スケーラブルで効率的な科学的データ分析を可能にするマルチエージェントシステムである。
アーキテクチャの中核は、データ検索と分析の異なるフェーズに責任を持つ専門エージェントのチームを編成するスーパーバイザーエージェントである。
本フレームワークのユーザビリティを示すため,複数のテラバイトからなるHACC宇宙論シミュレーションから,アンサンブルランを用いたシステムの評価を行った。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:47:22 GMT)
AGENTIQL: An Agent-Inspired Multi-Expert Framework for Text-to-SQL Generation [0.5] AgentIQLはエージェントにインスパイアされたフレームワークで、質問分解のための推論エージェント、サブクエリ生成のためのコーディングエージェント、列選択のための洗練ステップを組み合わせたものだ。
我々は、Planner&Executorのマージ戦略を用いて、14Bモデルで最大86.07%のEXを達成し、Spiderベンチマークで AgentIQLを評価した。
正確性を超えて、AgentIQLは、中間的推論ステップを公開することによって透明性を高め、セマンティック解析に対する堅牢でスケーラブルで解釈可能なアプローチを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:24:04 GMT)
A Mathematical Structure for Amplitude-Mixing Error-Transparent Gates for Binomial Codes [0.5] エラー透明な操作は、操作中のエラー率を保存する方法のひとつです。
相ゲートのみが、二項符号化の明示的にエラー透過的な定式化を施されている。
修正可能な光子ジャンプのすべてに対する誤差透過性を示すが、ジャンプの誤りではない。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:31:20 GMT)
GRDD: A Dataset for Greek Dialectal NLP [0.5] 現代ギリシア語方言の計算研究のためのデータセットを提示する。
データセットはかなりの大きさであり、不均衡であるにもかかわらず、このタイプの大規模な方言資源を現代ギリシア語の方言のために作成する最初の試みである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:06:18 GMT)
Towards General Urban Monitoring with Vision-Language Models: A Review, Evaluation, and a Research Agenda [0.5] 視覚言語モデル(Vision-Language Models)は、自然言語の推論と視覚的理解を統合したモデルである。
都市インフラの状況について、機械は市民のように「見る」ことができるのか?
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:27:46 GMT)
CoVLA: Comprehensive Vision-Language-Action Dataset for Autonomous Driving [0.4] CoVLA(Comprehensive Vision-Language-Action)データセットは、80時間以上にわたる現実世界の運転ビデオで構成されている。
このデータセットは、堅牢で解釈可能で、データ駆動の自動運転システムのためのフレームワークを確立する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:54:47 GMT)
The Open Source Advantage in Large Language Models (LLMs) [0.4] 大規模言語モデル(LLM)は急速に進歩した自然言語処理を持ち、テキスト生成、機械翻訳、ドメイン固有の推論といったタスクにおいて大きなブレークスルーを引き起こしている。
GPT-4のようなクローズドソースモデルは、最先端のパフォーマンスを提供するが、アクセシビリティを制限し、外部の監視を行う。
LLaMAやMixtralといったオープンソースフレームワークはアクセスを民主化し、コラボレーションを促進し、多様なアプリケーションをサポートする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:48:35 GMT)
Biased-Attention Guided Risk Prediction for Safe Decision-Making at Unsignalized Intersections [0.4] 本稿では, バイアスアテンション機構と統合された深層強化学習(DRL)意思決定フレームワークを提案する。
このフレームワークはSoft Actor-Critic (SAC)アルゴリズムに基づいている。
提案手法は交差点における交通効率と車両の安全性の両方を効果的に向上させる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:05:51 GMT)
CrossRay3D: Geometry and Distribution Guidance for Efficient Multimodal 3D Detection [0.4] クロスモダリティ検出器は、Bird's-Eye-View(BEV)検出器よりも多くの利点を提供している。
既存のスパース検出器はトークン表現の質を見落とし、準最適品質と限られた性能を残している。
本稿では,形状構造とクラス分布がスパース検出器の性能向上の鍵であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:11:16 GMT)
CARVQ: Corrective Adaptor with Group Residual Vector Quantization for LLM Embedding Compression [0.4] 大規模言語モデル(LLM)はトークンの埋め込みに多数のパラメータを依存しているため、かなりのストレージ要件とメモリフットプリントに繋がる。
本稿では, グループ残差ベクトル量子化を併用したポストトレーニング小説Corrective AdaptorであるCARVQを紹介する。
CarVQは、低ビットストレージをサポートするための特別なハードウェアを必要とせず、約1.6ビットまで圧縮するためにオリジナルのモデルを模倣している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:00:13 GMT)
General Demographic Foundation Models for Enhancing Predictive Performance Across Diseases and Populations [0.4] デモグラフィックの属性は、電子的な健康記録に普遍的に存在している。
その重要性にもかかわらず、人口統計学的特性はモデル設計において補助として扱われることが多い。
本研究は、人口統計特性に合わせた基礎モデルとして、一般デモグラフィック事前学習(GDP)モデルを開発する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:57:09 GMT)
From Literal to Liberal: A Meta-Prompting Framework for Eliciting Human-Aligned Exception Handling in Large Language Models [0.4] エージェントAIシステムの推論エンジンとして,大規模言語モデル(LLM)がますます普及している。
明確な規則に固執し、人間の常識や意図に反する決定を下す。
本稿では,LLMにおけるヒューマンアラインな例外処理をゼロショット方式で導入するルール・インテント・ディチネンション(RID)フレームワークを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:42:52 GMT)
Can outcome communication explain Bell nonlocality? [0.4] 量子情報の中枢的な側面は、絡み合った状態を共有する空間のような分離された観測者間の相関が局所隠れ変数(LHV)モデルによって再現できないことである。
特に、2ビットの古典的通信で強化されたLHVモデルは、任意の2ビット状態の相関を説明することができる。
モデルがすべての射影測度を再現しなければならないなら、任意の qubit-qudit 状態に対して、答えは No である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:01:14 GMT)
Low-Field Magnetic Resonance Image Quality Enhancement using a Conditional Flow Matching Model [0.4] 条件付きフローマッチング(CFM)は、雑音分布と目標データ分布の間の連続的な流れを学習する。
本フレームワークは,対応する低フィールド入力から高フィールド型MR画像を再構成するように設計されている。
実験により、CFMは最先端の性能を達成するが、分布内データと分布外データの両方に頑健に一般化することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:41:27 GMT)
Deep Associations, High Creativity: A Simple yet Effective Metric for Evaluating Large Language Models [0.4] PACEを提案し,LLMに対して,その創造性を評価するためのアソシエーション・チェーンの創出を依頼する。
PACEはデータ汚染のリスクを最小限に抑え、単純で高効率な評価を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:26:28 GMT)
Global symmetries of quantum lattice models under non-invertible dualities [0.3] 離散群 $G$ を (1+1)-次元量子格子モデル(英語版)の文脈でゲージする非可逆双対性の下での大域的対称性の変化について検討する。
二重コセットの代数環を形成する双対モデルの大域対称性の一般予想を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:58:04 GMT)
Bayesian Optimization for Dynamic Pricing and Learning [0.3] ダイナミックな価格設定は、市場の需要に応じて企業の収益を最大化するために製品の販売価格を調整するプラクティスである。
従来の手法では需要関数の特定のパラメトリック形式を前提としており、強化学習(RL)を用いて最適に近い価格戦略を特定できる。
本稿では,制約付きモデリング仮定を避けるために,動的価格に対する非パラメトリックなアプローチを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:28:06 GMT)
Leveraging Teleconnections with Physics-Informed Graph Attention Networks for Long-Range Extreme Rainfall Forecasting in Thailand [0.3] 正確な降雨予測、特に極端な出来事は、気候学と地球システムにおいて重要な課題である。
本稿では,新しい物理インフォームドグラフニューラルネットワーク(GNN)と極値解析技術を組み合わせることで,タイ全土のゲージステーション降雨予測を改善することを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:34:14 GMT)
Trapping an Atomic Ion using Time-Division Multiplexed Digital-to-Analog Converters [0.3] 表面電極トラップにTDMを用いた電圧制御システムを適用し,40mathrmCa+$イオンのトラップに成功した。
このアプローチは、捕捉されたイオンに基づく高度な量子コンピューティングシステムに対して、リソース効率が高くスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:12:26 GMT)
Metrological approach to the emergence of classical objectivity [0.3] 量子フィッシャー情報は、古典的客観性が出現する速度を評価するのに有用な指標であることを示す。
我々のフォーマリズムは、計測の選択が、観測者がシステムの状態を決定できる精度にどのように影響するかを探索することを可能にする。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:13:46 GMT)
AI Alignment vs. AI Ethical Treatment: 10 Challenges [0.3] AI開発の道徳的に許容できるコースは、2つの危険を避ける必要がある。
本稿は、これらの2つの危険が相互作用し、道徳的考慮に値するAIシステムを作る場合、これら2つの危険を同時に回避することは極めて困難である、と論じる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 00:13:23 GMT)
On the Capacity of Self-Attention [0.3] 本稿では,自己保持能力に関するキャパシティに基づくスケーリング法を提案する。
D_K$は、広いグラフのクラスにおいて、$m'$関係を回復するのに必要かつ十分であることを示す。
また、固定されたD_K$を多数の小さな頭部に割り当てることで干渉を緩和することを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:49:26 GMT)
Constrained Sensing and Reliable State Estimation with Shallow Recurrent Decoders on a TRIGA Mark II Reactor [0.3] ショート・リカレント・デコーダ・ネットワーク(Shallow Recurrent Decoder network)は、正確な状態推定を提供することのできる新しいデータ駆動手法である。
本研究では,実システムに適用した場合のシャローリカレントデコーダの性能について検討する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:31:34 GMT)
Geopolitics, Geoeconomics and Risk:A Machine Learning Approach [0.2] このデータセットを用いて、感情動態が主権リスクをいかに形成するかを研究する。
世界的な金融変数は主権リスクの主要な要因である。
しかし、地政学的リスクや経済政策の不確実性も重要な役割を担っている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:51:36 GMT)
Towards Robust Artificial Intelligence: Self-Supervised Learning Approach for Out-of-Distribution Detection [0.2] 本稿では,ラベル付きデータを必要としないOOD検出手法を提案する。
提案手法は自己教師付き学習の原理を利用して,ラベルのないデータから有用な表現を学習する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:55:25 GMT)
On the Design and Evaluation of Human-centered Explainable AI Systems: A Systematic Review and Taxonomy [0.2] 本稿では,XAIシステムの評価を行う65のユーザ・スタディについて概説する。
我々は,XAIシステムの人間中心設計(設計目標)の目的を提案する。
AI初心者にとって、関連する設計目標には、責任ある使用、受け入れ、ユーザビリティが含まれる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:52:43 GMT)
Shielded RecRL: Explanation Generation for Recommender Systems without Ranking Degradation [0.2] Shielded RecRLは、レコメンダシステムのためのパーソナライズされた説明を生成するための強化学習アプローチである。
以上の結果から,Shieled RecRLは,コアレコメンデーションの精度を低下させることなく,リッチでパーソナライズされた説明を通じて,レコメンデーションのユーザ側の側面を強化することが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:37:48 GMT)
Classical Simulations of Low Magic Quantum Dynamics [0.2] 低レベルの魔法を持つ状態を生成する適応量子回路のアルゴリズムを開発する。
これらのアルゴリズムは、特にパウリ測定率の高い回路に適している。
回路深度単位当たりのTゲートのサブ指数速度で全対全監視量子回路のダイナミクスについて検討する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:44:48 GMT)
Resource-sensitive but language-blind: Community size and not grammatical complexity better predicts the accuracy of Large Language Models in a novel Wug Test [0.2] 目的は、モデル精度が人間の能力に近似するかどうかを決定することである。
その結果, モデルが形態素過程を一般化し, 人間のような精度で未知の単語を認識できることが示唆された。
スペイン語や英語のようなより大きな話者コミュニティと強力なデジタル表現を持つ言語は、カタルーニャ語やギリシャ語のような低リソースの言語よりも高い精度を示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:52:57 GMT)
Digital Twin Simulations Toolbox of the Nitrogen-Vacancy Center in Diamond [0.1] ダイヤモンド中の窒素空孔中心は、量子技術にとって重要なプラットフォームである。
一般的な実験条件下でNVスピンダイナミクスをシミュレーションするためのPythonライブラリを提示する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:37:59 GMT)
Quantum Annealing for Staff Scheduling in Educational Environments [0.1] 複数の学校サイトと教育レベルの協力者の組織化に生じる新たなスタッフ割り当て問題に対処する。
この問題は、イタリア、カラブリアの公立学校での実際のケーススタディから発生し、幼稚園、小学校、中学校にスタッフを分散させ、可用性、能力、公正さの制約を課す必要がある。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:29:58 GMT)
Simulation-Based Pretraining and Domain Adaptation for Astronomical Time Series with Minimal Labeled Data [0.1] 本稿では,実観測からラベル付きサンプルの必要性を大幅に低減し,シミュレーションを活用する事前学習手法を提案する。
我々のモデルは、複数の天文学調査(ZTFとLSST)のシミュレーションデータに基づいて訓練され、下流のタスクに効率的に移行する一般化可能な表現を学習する。
注目すべきは、既存の望遠鏡(ZTF)データのみをトレーニングすると、将来の望遠鏡(LSST)シミュレーションに匹敵する性能を達成できる、効果的なゼロショット転送能力を示すことだ。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:07:14 GMT)
Reinforcing Competitive Multi-Agents for Playing 'So Long Sucker' [0.1] 本稿では,マルチエージェント強化学習(MARL)の新たなベンチマークとして,戦略ゲームSo Long Sucker(SLS)について検討する。
グラフィカルなユーザインタフェースと強化学習アルゴリズムのベンチマークサポートを備えた,SLS用の初の公開計算フレームワークを紹介した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:11:58 GMT)
Hard Examples Are All You Need: Maximizing GRPO Post-Training Under Annotation Budgets [0.1] 最も難しい例(ベースモデルが最も失敗する部分)の10%をトレーニングすると、劇的なパフォーマンスが最大47%向上する。
ハードサンプルは、AIME2025ベンチマークで有意義な利得を達成しているのは、ハードトレーニングされたモデルのみである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:03:28 GMT)
Decoding across transversal Clifford gates in the surface code [0.1] 回転しない曲面符号に対して任意のウィンドウゲート列をデコードする方法を示す。
完全効率的な復号化問題に対処する論理的可観測整合デコーダを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:24:57 GMT)
CiteBART: Learning to Generate Citations for Local Citation Recommendation [0.0] 本稿では,エンコーダ-デコーダアーキテクチャにおける励磁型事前学習について述べる。
著者による引用トークンは、ローカル引用レコメンデーション(LCR)を満たすためにそれらを再構築することを学ぶためにマスクされる
CiteBART-GlobalはFullTextPeerReadデータセットを除いて、LCRベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:29:53 GMT)
Hierarchical Reasoning with Vision-Language Models for Incident Reports from Dashcam Videos [0.0] 本稿では,ダッシュカムビデオからのインシデントレポート生成のための階層的推論フレームワークを提案する。
視覚言語モデルにフレームレベルのキャプション、インシデントフレームの検出、微粒化推論を統合する。
公式の2COOOLオープンリーダーボードでは、29チーム中2位にランクされ、最高のCIDEr-Dスコアを獲得しています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 06:36:41 GMT)
Probabilistic Super-Resolution for Urban Micrometeorology via a Schrödinger Bridge [0.0] 本研究では,都市部における2m温度の超解像を実現するために,Schr"odinger橋問題に対する解を求めるニューラルネットワークを用いた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:04:04 GMT)
Topological Signatures of ReLU Neural Network Activation Patterns [0.0] 本稿では、ReLU活性化機能を備えたフィードフォワードニューラルネットワークについて検討し、ネットワークによって誘導される特徴空間のポリトープ分解を解析する。
双対グラフのファイドラー分割は、二項分類の場合、決定境界と相関していることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:36:34 GMT)
Prethermal gauge structure and surface growth in $\mathbb{Z}_2$ lattice gauge theories [0.0] 数千の相互作用を持つ(2+1)$Dスピン系の平均場を数値的に研究する。
我々のモデルは量子シミュレーター用のテストベッドを提供し、Rydberg原子の大規模配列で直接実装可能である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:59:58 GMT)
Why the noise model matters: A performance gap in learned regularization [0.0] ノイズモデルが明示的に学習されていない場合、異なるタイプの正規化が異なる結果をもたらすことを示す。
本研究は,データ駆動型正規化におけるノイズ統計の正確なモデリングやコラーニングの意義を明らかにするものである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:44:35 GMT)
VQArt-Bench: A semantically rich VQA Benchmark for Art and Cultural Heritage [0.0] VQArt-Benchは、文化遺産ドメインの大規模なビジュアル質問回答ベンチマークである。
特殊なエージェントが協力して、ニュアンス、検証、言語学的に多様な質問を生成する、新しいマルチエージェントパイプラインを使用して構築されている。
このベンチマークによる14の最先端MLLMの評価は、現在のモデルに重大な制限があることを示唆している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:29:52 GMT)
Using Medical Algorithms for Task-Oriented Dialogue in LLM-Based Medical Interviews [0.0] そこで我々は,DAG (Directed Acyclic Graph) として構成された課題指向対話フレームワークを開発した。
本システムは,(1)医療アルゴリズムとガイドラインを臨床質問コーパスに変換する体系的パイプライン,(2)階層的クラスタリングに基づくコールドスタート機構を用いて,患者の事前情報のない効率的な初期質問を生成する,(3)適応的な分岐とバックトラッキングを可能にする拡張・プル機構を統合した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:24:21 GMT)
Ultrafast switching of telecom photon-number states [0.0] 単一モードファイバにおける光カー効果を用いて,光子数6光子の超高速全光スイッチングを実演した。
スイッチング効率は2.3 ps、挿入損失は2.27pm0.08$dB、信号対雑音比は32,000である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:25:07 GMT)
Tunable quantum Mpemba effect in long-range interacting systems [0.0] 磁場存在下でのパワー-ロー減衰相互作用を持つ1次元スピン-1/2XYZモデルにおける量子Mpemba効果(QME)について検討した。
Hohenberg-Mermin-Wagner の定理により、QME は相互作用が十分に短距離であるときにのみ生じる。
我々はこの相互作用を体系的に探求し、初期状態によって設定された有効温度に対するQMEの依存性を分析する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:00:02 GMT)
Topological Phases of Many-Body Localized Systems: Beyond Eigenstate Order [0.0] 多体局在は物質の非平衡相に顕著な堅牢性を与える。
このような位相は、その基底と励起状態における位相的および対称性の破れ秩序を示すことができる。
それらはまた、異常な局所化位相(ALT相)に属することもある。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:57:35 GMT)
ToPolyAgent: AI Agents for Coarse-Grained Topological Polymer Simulations [0.0] ToPolyAgentは、トポロジカルポリマーの分子動力学シミュレーションを実行するためのマルチエージェントAIフレームワークである。
多様なポリマーアーキテクチャをまたいだインタラクティブなシミュレーションと自律的なシミュレーションの両方をサポートする。
自律的でマルチエージェントな科学研究エコシステムの基礎を築いている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:54:19 GMT)
Time-dependent Variational Principles for Hybrid Non-Unitary Dynamics: Application to Driven-Dissipative Superconductors [0.0] オープン量子多体系の非単位ダイナミクスについて検討する。
非エルミート極限はハイブリッド散逸ダイナミクスの特異極限として作用することを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:13:29 GMT)
Thermodynamics of quantum processes: An operational framework for free energy and reversible athermality [0.0] 我々は、量子過程(量子チャネル)の熱力学を、チャネルに対する自由エネルギーを公理的に導入することによって探求する。
我々の研究は、自由エネルギー、エネルギー、エントロピー、最大抽出可能な量子プロセスのコア熱力学的概念を、その情報処理能力に結びつけている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:58:01 GMT)
The logic of quantum mechanics [0.0] 量子論理プログラムは1936年のG. BirkhoffとJ. von Neumannによる論文から生まれた。
テンソル積の存在と星の進化は状態空間の定義のための唯一の前提条件である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:33:05 GMT)
The counterfactual account of Lüders' rule is sufficient to rule out ontological models of quantum mechanics [0.0] L'uders' 則の反実的な説明は、本質的に量子形式論とは相容れない存在論的モデルを示す。
これは、オントロジーモデル、あるいは文脈モデルでさえ、私たちが期待するもの(通常は暗黙的に仮定される量子状態の更新規則)と異なる振る舞いをしなければならないか、あるいは量子的振る舞いをモデル化できないことを暗示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:12:08 GMT)
The Infra-Red Road to Quantum Gravity [0.0] 凝縮物質物理学から量子重力まで幅広い分野の研究を概観する。
議論を説明するのに、さまざまな例を使っています。
我々の見解では、量子重力の低エネルギー理論は、我々の見解では、この分野で前進する正しい方法である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:40:11 GMT)
The Distribution of Dependency Distance and Hierarchical Distance in Contemporary Written Japanese and Its Influencing Factors [0.0] 文長の増加に伴う平均依存距離(MDD)と平均階層距離(MHD)の変化を分析した。
その結果, 日本語におけるMDDとMHDのトレードオフ関係の背景にある要因は, 述語の正当性であることがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:25:13 GMT)
The Cultural Gene of Large Language Models: A Study on the Impact of Cross-Corpus Training on Model Values and Biases [0.0] 大規模言語モデル(LLM)は世界中に展開されているが、その根底にある文化的・倫理的な前提は未解明のままである。
西洋中心モデル (GPT-4) と東洋中心モデル (ERNIE Bot) を比較した。
人間のアノテーションは両次元に有意かつ一貫した相違を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:26:39 GMT)
The Algorithmic Regulator [0.0] 規制の定理は、ある条件下では、任意の最適コントローラーは、それが規制するシステムのモデルを具現化しなければならないと述べる。
この原理は、自由エネルギー原理(Free-Energy Principle)やコルモゴロフ/アルゴリトミックエージェント理論(Kolmogorov/Algorithmic Agent theory)のような神経科学と予測的脳理論の基盤となっている。
Delta$が大きければ大きいほど、高い相互アルゴリズム情報を持つワールドレギュレータペアが好まれる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:28:41 GMT)
Tensor Logic: The Language of AI [0.0] 私は、トランスフォーマー、フォーマルな推論、カーネルマシン、グラフィカルモデルを含む、テンソル論理において、ニューラルネットワーク、象徴的、統計的AIのキーフォームをどのように実装するかを示します。
これは、ニューラルネットワークのスケーラビリティと学習性とシンボリック推論の信頼性と透明性を組み合わせることで、AIの普及の基盤となる可能性がある。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:24:08 GMT)
Temperature and conditions for thermalization after canonical quenches [0.0] 我々は、1つのハミルトニアンの正準平衡状態で準備され、異なるハミルトニアンの下で時間的に一元的に進化する量子系のクエンチを考える。
まず, クエンチ前温度における平衡特性から, クエンチ後の系の温度を予測する方法を示す。
ハミルトニアン以外の保存量の存在下では、(ポストクエンチ)正準アンサンブルへの熱化に必要な条件の階層を得る。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:29:16 GMT)
Symmetric entanglers for non-invertible SPT phases [0.0] 我々は、非可逆対称性が固定電荷双対性(FCD)で連結されたSPT位相を持つ場合、対称エンタングルは1+1$d系に対して存在するべきであると主張する。
行列積ユニタリ(MPU)として$mathrmRep(A_4)$-symmetricを持つ2つのSPT相に対する対称エンタングルの明示的な例を構築する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:53:29 GMT)
Stable bi-frequency spinor modes as Dark Matter candidates [0.0] ユカワ結合を有するディラック・クライン・ゴルドン系のようなスカラー自己相互作用を持つスピノル系は、一般に二周波孤立波解を持つことを示す。
両周波数モードのみが動的に安定であることを示し、安定な両周波数モードがダークマターのストレージとして機能することを示唆する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:21:37 GMT)
Space-based cm/kg-scale Laser Interferometer for Quantum Gravity [0.0] LISAパスファインダ(LPF)にインスパイアされた空間型干渉計を提案する。
本設計では, LPFとは異なり, シールドを1K以下に囲み, 横方向の位置を1cm程度の分離で配置した2kgスケールの金プラチナ試験体を用いている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:52:01 GMT)
Snapshot renormalization group for quantum matter [0.0] スナップショットデータセットに直接適用可能な正確な再正規化グループ(RG)変換を導入する。
我々のSnapshotRGは実空間で動作するが、測定設定の抽象データ空間内のRGに直接変換することもできる。
データ空間におけるスナップショットデータセットは連続的な位相遷移において自己相似性を示すことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:50:16 GMT)
Single-shot and measurement-based quantum error correction via fault complexes [0.0] フォトニクスは、スケーラブルなフォールトトレラント量子コンピュータへの実行可能なパスを提供する。
葉は耐障害性グラフ状態の構築である。
本稿では,動的量子誤り訂正プロトコルの表現であるフォールトコンプレックスを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:39:10 GMT)
Simulation-Free Fidelity Estimation via Quantum Output Order Statistics [0.0] 本研究では,高絡み合いのカオス状態からの出力確率の順序統計に基づいて,大規模量子回路の忠実度を推定するシミュレーションフリー手法を提案する。
本研究では,クロスエントロピーベンチマークが高価であり,直接忠実度推定が難しい中間規模量子回路の実用性を実証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:53:29 GMT)
Sentiment and Emotion-aware Multi-criteria Fuzzy Group Decision Making System [0.0] グループ意思決定(GDM)システムは、様々な好みを持つ参加者間の合意を促進することで重要な役割を果たす。
本稿では,グループ設定におけるコンセンサス取得の有効性を高めるために,感情と感情を意識した多基準ファジィGDMシステムを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:12:21 GMT)
Scattering resonances and pairing in a Rabi-coupled Fermi gas [0.0] 2つのフェルミオン種(スピン)がRabiと結合し、第3の未結合種と相互作用するシナリオを考察する。
最小限の低エネルギーモデル内での正確な計算を用いて、有効散乱長と有効範囲に関する解析式を導出する。
一般化されたThouless criterionにより、散乱特性がRabi結合フェルミガスの超流動遷移に直接的な影響を与えることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 23:35:19 GMT)
Same model, better performance: the impact of shuffling on DNA Language Models benchmarking [0.0] 大規模言語モデルは、複雑な生物学的配列をデコードする可能性から、ゲノム学でますます人気がある。
DNA LMの評価は、ゲノムのドメイン固有の課題と機械学習の方法論を交差させる複雑なタスクであることを示す。
ストレージの前にデータを事前シャッフルすることで、効率を保ちながらハードウェア依存をなくすという簡単な解決策を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:16:56 GMT)
SPORTS: Simultaneous Panoptic Odometry, Rendering, Tracking and Segmentation for Urban Scenes Understanding [0.0] 本稿では,全体像理解のための新しいフレームワーク SPORTS を提案する。
Video Panoptic (VPS)、Visual Odometry (VO)、Scene Renderingタスクを反復的で統一された視点に統合する。
我々の注意に基づく特徴融合は、計測、追跡、セグメンテーション、新しいビュータスクにおいて、既存の最先端の合成方法よりも優れています。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:28:19 GMT)
SG-XDEAT: Sparsity-Guided Cross-Dimensional and Cross-Encoding Attention with Target-Aware Conditioning in Tabular Learning [0.0] 本稿では,表データの教師あり学習のための新しいフレームワークであるSG-XDEATを提案する。
中心となるSG-XDEATはデュアルストリームエンコーダを使用し、各入力機能を2つの並列表現に分解する。
これらの双対表現は、注意に基づくモジュールの階層的なスタックを通して伝播される。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:56:40 GMT)
Rabi transport and the other finite-size effects in one-dimensional discrete-time topological quantum walk [0.0] 一次元量子ウォークにおける位相的に異なる位相の境界における局在状態の出現を示す。
有限格子に対して、トポロジーは局所化および双局在化状態を誘導し、有限サイズ効果による縮退の結果としてラビ様輸送をもたらすことを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:33:31 GMT)
Quantumness near the Schwarzschild black hole based on W-state [0.0] W状態を利用したシュワルツシルトブラックホール近傍の量子度について検討する。
我々は、ブラックホールのホーキング効果が破壊するだけでなく、量子絡み合いを高めると結論付けた。
3つの物理的にアクセス可能なモードを持つ系では、ホーキング効果は量子コヒーレンスに肯定的な影響を与える。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 03:06:18 GMT)
Quantum thermodynamics of Gross-Pitaevskii qubits [0.0] 非線形量子ビットで動作する量子オットーエンジンは線形エンジンよりも著しく優れていることを示す。
興味深いことに、非線形力学は相関した複雑な量子多体系の効果的な記述と考えることができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:52:50 GMT)
Quantum correlations versus spin magnitude: Transition to the classical limit [0.0] 熱平衡における量子スピン(j$,1/2)系におけるそのような遷移を研究する。
量子エンタングルメントのしきい値温度はスピン$j$の増加とともに減少し、極限$jtoinfty$で完全に消失する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:45:38 GMT)
Quantum Network-Based Prediction of Cancer Driver Genes [0.0] 本稿では,突然変異スコアとネットワークトポロジを結合した教師付き量子フレームワークを提案する。
QMMEはノードの即時および二階隣人の突然変異スコアの低次統計モーメントを符号化し、この情報を量子状態に符号化する。
実証的なPPIネットワーク上のシミュレーションは、古典的なベースラインよりも12.6%のリコール率で競争性能を示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:25:30 GMT)
Quantum Key Distribution in the Iberian Peninsula [0.0] 量子鍵分布(QKD)は、古典的な方法では達成できない情報理論のセキュリティを提供する。
本稿では,マドリードとバルセロナ,ビルバオ,リスボンを結ぶ衛星ベースのQKD構成を提案し,評価する。
以上の結果から,病院間のセキュアな通信など,現実の応用に十分なキーレートが,既存のプロトコルで実現可能であることが示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:55:36 GMT)
Quantizer Design for Finite Model Approximations, Model Learning, and Quantized Q-Learning for MDPs with Unbounded Spaces [0.0] 有限モデル近似誤差について, [Kara et. al. JMLR'23] で表される洗練された上界について述べる。
また、量子化Q-ラーニングと経験モデルラーニングにおける量化器設計の意義についても考察する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:14:06 GMT)
Probing the spatial distribution of k-vectors in situ with Bose-Einstein condensates [0.0] 本稿では,Bose-Einstein condensate (BEC) を移動プローブとして,光子運動量の空間分布をレーザビームにマッピングする方法を提案する。
BECを分解することにより、レーザービームの異なる位置で原子干渉計により光子反動を測定する。
この方法は、波面歪みを正確に特徴づける新しい方法を提供し、原子干渉法に基づく量子センサにおける主要な系統的バイアス源の1つを評価する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:32:48 GMT)
Probability-Phase Mutual Information [0.0] コヒーレンス測度は密度行列内の重ね合わせを定量化するが、純状態の異なる分布を通して同じ混合状態を生成するアンサンブルを区別することはできない。
まず,確率位相相互情報$I(P;Phi)$を導入し,測定可能確率と計測不能位相との統計的相関をアンサンブル全体で測定する。
我々は,アンサンブルコヒーレンスと密度行列コヒーレンスとの関連性を示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:51:06 GMT)
Padé Approximant Neural Networks for Enhanced Electric Motor Fault Diagnosis Using Vibration and Acoustic Data [0.0] 本研究の主な目的は,Pad'e Approximant Neuron(PAON)モデルを用いて誘導機械の故障診断を強化することである。
我々は,1次元CNN,Self-ONN,Pad'eNetsの3つのディープラーニングアーキテクチャの診断能力の評価と比較を行った。
Pad'eNetsは、診断精度99.96%、98.26%、97.61%、98.33%の加速度計1, 2, 3, と音響センサーをそれぞれ達成し、ベースラインモデルより一貫して優れていた。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:20:03 GMT)
Order from Chaos: Comparative Study of Ten Leading LLMs on Unstructured Data Categorization [0.0] 本研究では,非構造化テキスト分類に適用された10種類の最先端大規模言語モデル(LLM)の比較評価を行った。
この分析では、8,660人の注釈付きサンプルと同一のゼロショットプロンプトの統一データセットを使用して、すべてのモデルにおける方法論的一貫性を確保した。
その結果,現代LLMは,平均スコアが34%,精度が42%,リコールが45%,F1スコアが41%であった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:15:01 GMT)
Optimization of the time-multiplexed SPDC source at 900-950 nm range [0.0] 本稿では,SPDCプロセスに基づく時分割HSPSの実証について述べる。
これは、時間多重化の応用後の単一の光子の確率の分析と近似を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:20:38 GMT)
Optimally Deep Networks -- Adapting Model Depth to Datasets for Superior Efficiency [0.0] モデル深度とタスクの複雑さのバランスを提供するOptimally Deep Networks (ODNs)を導入する。
ODNは与えられたデータセットに対して最適な深さしか使用せず、冗長なレイヤを削除する。
その結果、MNIST と SVHN の ResNet-18 と ResNet-34 の最適深さは 98.64 % と 96.44 % のメモリフットプリントを実現し、それぞれ 99.31 % と 96.08 % の競合精度を維持した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:17:25 GMT)
Optimal Work Extraction from Finite-Time Closed Quantum Dynamics [0.0] 閉量子系からの有限時間最適作業抽出の問題について検討する。
解析的あるいは数値的に効率的に抽出可能な形式に最適な作業抽出問題を還元するために、リー代数に基づく一般的なフレームワークを導入する。
その結果,最大出力を達成するための高速プロトコルの必要性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:53:32 GMT)
Nonlinear Phase Gates as Airy Transforms of the Wigner Function [0.0] 低次非線形位相ゲートはボゾン系に対する多目的高次非線形性の構築を可能にする。
位相空間における任意の多モード量子状態に対する準有界立方体ゲートの作用は、ウィグナー関数のエアリー変換として理解できることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:00:49 GMT)
Modular interface for efficient optical readout of diamond quantum memory at cryogenic temperatures via single-mode optical fibers [0.0] デバイスおよび温度に関する変化から構造的に分離されたダイヤモンドにおける色中心のモジュラーインタフェースを提案する。
我々は,ゼロフォノンライン分光を含む単一モード光ファイバーによる高効率光子収集を室温および低温の両方で達成した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:06:18 GMT)
Mirror Descent Actor Critic via Bounded Advantage Learning [0.0] Mirror Descent Value Iteration (MDVI)は、Kulback-Leiblerの発散とエントロピーを、その値とポリシー更新の正則化として使用している。
本稿では,MDVIのアクター・アクター・アクター・アクター・クリティカル(MDAC)を連続的なアクション・ドメインに対するアクター・アクター・アクター・アクター・アクター・アクター・クリティ(MDAC)として提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:30:11 GMT)
Metaplectic operators with quasi-diagonal kernels [0.0] メタプレクティック作用素の核は対角的ではない。しかし、我々が証明するように、それらは適切な条件下で準対角的である。
本研究の動機は,最終節で論じる時間周波数解析の問題点に端を発する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:07:15 GMT)
Max It or Miss It: Benchmarking LLM On Solving Extremal Problems [0.0] 数学的極端問題を解くためのベンチマークデータセットExtremBenchを紹介する。
我々は、Qwen3、GPT-OSS、DeepSeekなど、最先端のオープンソースモデルファミリーで評価を行う。
その結果、LLMの極端解法推論能力は、現在の数学ベンチマークと必ずしも一致しないことがわかった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:23:37 GMT)
Machine Learning-Based Ultrasonic Weld Characterization Using Hierarchical Wave Modeling and Diffusion-Driven Distribution Alignment [0.0] この研究は、音響溶接検査のための機械学習(ML)ワークフローを提案することにより、データキュレーションと信号の破損の課題に対処する。
減階モデル、拡散に基づく分布アライメント、U-Netに基づくセグメント化とインバージョンを提案する。
このフレームワークは、実データの自動溶接検査のためのエンドツーエンドソリューションを提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:38:57 GMT)
Logarithmic Mathematical Morphology: theory and applications [0.0] グレーレベル関数の数学的形態学では、ある画像は構造関数と呼ばれる別の画像によって解析される。
照明変動を示す画像では、構造関数の振幅は画像強度に応じて変化すべきである。
新しい枠組みは、構造関数の振幅が画像振幅に応じて変化する付加法則で定義される。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:26:27 GMT)
LiteVPNet: A Lightweight Network for Video Encoding Control in Quality-Critical Applications [0.0] NVENC AV1エンコーダの量子化パラメータを正確に予測するための軽量ニューラルネットワーク(LiteVPNet)を提案する。
ビットストリーム特性、ビデオ複雑性測定、CLIPベースのセマンティック埋め込みなど、低複雑さの機能を使用します。
LiteVPNetは、さまざまな品質目標に対して、平均VMAFエラーを1.2ポイント以下で達成する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:51:49 GMT)
Leveraging Language Semantics for Collaborative Filtering with TextGCN and TextGCN-MLP: Zero-Shot vs In-Domain Performance [0.0] パラメータフリーグラフ畳み込み層を LLM の項目タイトル埋め込みに直接適用する textbfTextGCN を提案する。
言語意味論とグラフメッセージパッシングを組み合わせることで、このアーキテクチャは最先端のゼロショット性能を実現する。
また,TextGCNを拡張したTextbfTextGCN-MLPも導入した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:50:11 GMT)
Learning to sample fibers for goodness-of-fit testing [0.0] 離散指数族モデルに対する完全適合性テストを構築することの問題点を考察する。
この問題をマルコフ決定プロセスに変換し、サンプリングのための「よい動きを学ぶための強化学習アプローチ」を示す。
提案アルゴリズムは,評価可能な収束性を持つアクタ・クリティカル・サンプリング方式に基づいている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:09:20 GMT)
Learning at the Speed of Physics: Equilibrium Propagation on Oscillator Ising Machines [0.0] 自然にエネルギー降下を行う物理システムは、機械学習への直接的な経路を提供する。
我々は,OIMがグローバルなバックプロパゲーションを伴わずに競争精度を達成することを示す。
これらの結果は、OIMを神経形学習のための高速でエネルギー効率の高い基質として確立する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:15:49 GMT)
Learning Latent Energy-Based Models via Interacting Particle Langevin Dynamics [0.0] 我々は、エネルギーに基づく先行モデルを用いた潜在変数モデル学習のための相互作用粒子アルゴリズムを開発した。
具体的には、微分方程式(SDE)を定義することにより、潜時エネルギーベースモデルを学習するための連続時間フレームワークを提供する。
我々はこれらのSDEの離散化として実用的アルゴリズムを取得し、提案アルゴリズムの収束に関する理論的保証を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:10:37 GMT)
Keep Calm and Avoid Harmful Content: Concept Alignment and Latent Manipulation Towards Safer Answers [0.0] 大きな言語モデルは、ビルトインの安全ガードレールをバイパスするジェイルブレイク攻撃の影響を受けやすい。
本稿では,有害な概念を抑える推論時間法であるtextbfCALMを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:08:22 GMT)
Joint Denoising of Cryo-EM Projection Images using Polar Transformers [0.0] 完全なエンドツーエンド再構築アプローチでは、複数のイメージからの情報を統合するニューラルネットワークアーキテクチャが必要になる。
極性表現と変圧器を組み合わせた新しいニューラルネットワークアーキテクチャである極性変換器を紹介する。
シミュレーションデータセットでは、平均二乗誤差(MSE)を0.02ドルの信号対雑音比(SNR)で最大2ドル削減できる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:31:30 GMT)
J-RAS: Enhancing Medical Image Segmentation via Retrieval-Augmented Joint Training [0.0] 本稿では,探索モデルとセグメンテーションモデルを統合したガイド画像セグメンテーションのジョイントトレーニング手法を提案する。
どちらのモデルも最適化されており、セグメンテーションモデルは取得した画像とマスクのペアを利用して解剖学的理解を深めることができる。
2つのベンチマークデータセット上で、U-Net、TransUNet、SAM、SegFormerを含む複数のセグメンテーションバックボーンにわたるJ-RASを検証する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:57:51 GMT)
Inverse Design in Nanophotonics via Representation Learning [0.0] ナノフォトの逆設計は、標的電磁応答(EM)の鍵となるツールとなっている。
機械学習(ML)が出現し、これらのボトルネックに効果的に対処している。
このレビューでは、レンズ表現学習を通じてMLを2つのカテゴリ(出力側と入力側)に分類する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:09:50 GMT)
Increase Alpha: Performance and Risk of an AI-Driven Trading Framework [0.0] 金融市場は非効率で、価格、ボリューム、断続的な関係が明らかにされていない。
increase Alphaでは、800以上の米国株を毎日の方向信号にマッピングするディープラーニングフレームワークを構築しました。
私たちは、透過的で業界標準のメトリクスを通してリアルタイムのパフォーマンスを評価します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:17:31 GMT)
Implementing the Quantum Approximate Optimization Algorithms for QUBO problems Across Quantum Hardware Platforms: Performance Analysis, Challenges, and Strategies [0.0] 量子コンピュータは複雑な最適化問題を解く上で大きな利点をもたらすことが期待されている。
本稿では,標準QAOAと適応微分組立QAOAの両方の性能について検討する。
本研究は、QAOAベースの手法を短期量子ハードウェアに展開するための課題、トレードオフ、戦略を概観する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:46:23 GMT)
HybridFlow: Quantification of Aleatoric and Epistemic Uncertainty with a Single Hybrid Model [0.0] 不確かさの定量化は、高度な機械学習アプリケーションにおいて堅牢性を保証するために重要である。
本稿では,アレータリックおよびてんかんの不確実性のモデリングを統一するモジュール型ハイブリッドアーキテクチャであるHybridFlowを紹介する。
そこで,HybridFlowにより定量化された不確実性は校正され,モデル誤差と整合性が良好であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:49:39 GMT)
Hash chaining degrades security at Facebook [0.0] ハッシュアルゴリズムの規範に従えば、パスワードストレージのアドホックなアップグレードは、予期せぬ脆弱性をもたらす可能性がある。
これはMeta Platformsが世界中で数十億人の月間ユーザーをサービスしているパスワードストレージ方式の例だ。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:00:04 GMT)
Fused Lasso Improves Accuracy of Co-occurrence Network Inference in Grouped Samples [0.0] 共起ネットワーク推論アルゴリズムは、通常、単一の環境ニッチから収集されたサンプル内の微生物の関連を分析する。
我々は,マイクロバイオーム・コミュニティ・ネットワークの推論において,完全に新しいアルゴリズムであるfuserを提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:27:16 GMT)
Formal Models and Convergence Analysis for Context-Aware Security Verification [0.0] 本稿では,ML強化適応システムに対する証明可能な保証を確立する,文脈認識型セキュリティ検証のための公式なフレームワークを提案する。
1)適応的検証が成功した場合のサンプル複雑性境界,(2)コンテキストリッチネスと検出能力に関する情報理論制限,(3)MLベースのペイロードジェネレータの収束保証。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:21:36 GMT)
Exploring Compositional Generalization (in COGS/ReCOGS_pos) by Transformers using Restricted Access Sequence Processing (RASP) [0.0] 本研究では,トランスフォーマーデコーダが構成一般化(COGS)と意味論的に等価なReCOGS_posを実行できることを示す。
我々の RASP モデルは COGS と ReCOGS_pos 上の構造一般化分割の完全スコアに近い。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:25:21 GMT)
Experimental verification of multi-copy activation of genuine multipartite entanglement [0.0] 真のマルチパーティ・エンタングルメント(GME)は、双分離性を超えた相関である。
これは複雑な量子システムの特徴付けとベンチマークに関係している。
二つの分離可能な量子状態の複数のコピーから活性化することができる。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 12:43:21 GMT)
Evaluation of Real-Time Preprocessing Methods in AI-Based ECG Signal Analysis [0.0] FACEプロジェクトは、長期心電図を解析するための革新的な機械学習ソリューションを開発することを目的としている。
ECG信号の様々な前処理ステップは、プロジェクトにおける適用性について分析される。
エッジ領域における適切な手法の選択は、特にエネルギー効率、処理能力、リアルタイム能力などの基準に基づいている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:04:13 GMT)
Evaluating End-User Device Energy Models in Sustainability Reporting of Browser-Based Web Services [0.0] ウェブベースのサービスのサステナビリティレポートは、単純化されたエネルギーと炭素モデルに依存している。
本稿では,そのようなモデルが実際のエネルギー消費をいかに反映しているかを実証研究する。
その結果, 一般に適用されている定電力近似は, 測定エネルギーから大きく逸脱する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:25:26 GMT)
Ethic-BERT: An Enhanced Deep Learning Model for Ethical and Non-Ethical Content Classification [0.0] 本稿では,4つの領域(Commonsense, Justice, Virtue, Deontology)にまたがる倫理コンテンツ分類モデルであるEthic-BERTを紹介する。
提案手法では,厳密な事前処理によって語彙空間と文脈のあいまいさに対処し,フルモデル凍結,勾配蓄積,適応学習率スケジューリングといった高度な微調整戦略を取り入れている。
実験結果は、Ethic-BERTがベースラインモデルよりも優れていることを示し、標準テストで平均82.32%の精度を達成した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:42:14 GMT)
Escaping Local Optima in the Waddington Landscape: A Multi-Stage TRPO-PPO Approach for Single-Cell Perturbation Analysis [0.0] 単一セル摂動ポリシーモデリングのための多段階学習強化アルゴリズムを提案する。
まず自然摂動ベクトルと共役型KLPO信頼解決器を更新し、政策モデリングの安全な第一歩を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:20:56 GMT)
Entanglement detection in quantum materials with competing orders [0.0] 2つの異なる物理的メカニズムから生じる集団的絡み合いの検出について述べる。
後者の場合、検出は自発的対称性の破れに直接関係しない集団交絡相の形成を示す。
これらの結果は、量子材料における競合する順序の絡み合う性質の新しい視点を開く。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:31:56 GMT)
Entanglement and the density matrix renormalisation group in the generalised Landau paradigm [0.0] 我々は、ギャップ付き対称量子格子モデルの基底状態の絡み合い構造を決定する。
エンタングルメントスペクトルの退化は、元のモデルからユニークな双対モデルへの双対変換によって生じることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:20:20 GMT)
Enhancing the reliability of machine learning for gravitational wave parameter estimation with attention-based models [0.0] 重力波信号のスペクトルから有効スピンとチャープ質量を推定する2つの独立した機械学習モデルを開発した。
注意マップを使用して、予測を行う際に、モデルが重視する領域を視覚化します。
モデルがグリッチに重きを置くと、パラメータ推定結果がより強くバイアスを受けることが示される。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 01:33:35 GMT)
Efficient Adaptive Transformer: An Empirical Study and Reproducible Framework [0.0] EATはオープンソースのベンチマークパイプラインを提供し、GLUEタスク間でのデータ処理、タイミング、アブレーションを自動化する。
主なコントリビューションは、スクリプト、CSVロギング、分析ユーティリティを備えた、オープンでエンドツーエンドの再現可能なフレームワークである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:40:48 GMT)
Digital quantum simulation of many-body localization crossover in a disordered kicked Ising model [0.0] 乱れたフロッケ多体系における非平衡問題として多体局所化クロスオーバーをシミュレーションする。
我々は、多体ローカライゼーションクロスオーバーの指標として、時間外順序付き相関器を計算した。
2つの独立誤差緩和法を比較することにより, 結果の有効性を確認した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:08:04 GMT)
Design and Dynamics of High-Fidelity Two-Qubit Gates with Electrons on Helium [0.0] 高速で高忠実な2ビットゲートは超流動ヘリウムシステムで実現可能であることを示す。
特に、$sqrtimathrmSWAP$とCZ Gatesの操作をシミュレートし、それぞれ2.9 nsと9.4 nsの実行時間で0.999と0.996の忠実度を得る。
この研究から得られた知見により、ヘリウム上の電子を用いた2量子ゲートの実験的な実現が可能であると信じている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 08:49:18 GMT)
Deep Learning-Based Visual Fatigue Detection Using Eye Gaze Patterns in VR [0.0] 仮想現実(VR)システムへの長時間の露出は、視覚的疲労を引き起こし、ユーザの快適さ、パフォーマンス、安全性を損なう。
既存の疲労検出アプローチは、主観的なアンケートや、脳波、心拍数、点眼数などの侵入的な生理的信号に依存している。
本稿では,VRで記録された連続的視線軌跡を用いた視覚疲労検出のための深層学習に基づく研究を紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:13:10 GMT)
Decoding Multimode Gottesman-Kitaev-Preskill Codes with Noisy Auxiliary States [0.0] 実測結果とマルチモードGKP状態に影響を及ぼす実際の誤差の相関を利用して、論理誤差の確率を少なくとも1桁減少させることができることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:14:33 GMT)
Data for Inclusion: The Redistributive Power of Data Economics [0.0] 本稿では、財政的に排除された経済において、肯定的な信用情報へのアクセス拡大による再分配的・効率的影響を評価する。
ウルグアイの2021年の世帯調査のマイクロデータを用いて、3つのデータレシエーションをシミュレートする。
以上の結果から、より広範なデータ共有の実現は、財政コストを大幅に削減し、金利分散を圧縮し、信用負担のギニ係数を低下させることが明らかとなった。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 22:32:52 GMT)
DPL: Spatial-Conditioned Diffusion Prototype Enhancement for One-Shot Medical Segmentation [0.0] 1ショットの医用画像セグメンテーションは、注釈付きデータに制限があり、患者間で解剖学的変動があるため、プロトタイプ表現の基本的な課題に直面している。
従来のプロトタイプベースの手法は、サポート機能の決定論的平均化に依存しており、堅牢な一般化に不可欠なクラス内の多様性を捉えるのに失敗する脆い表現を生成する。
拡散に基づく特徴空間探索によってプロトタイプ構築を再構築する新しいフレームワークであるDiffusion Prototype Learningを紹介する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 05:28:58 GMT)
DIANet: A Phase-Aware Dual-Stream Network for Micro-Expression Recognition via Dynamic Images [0.0] マイクロ表現は短く、不随意的な顔の動きであり、通常は半秒未満で、しばしば本物の感情を表わす。
本稿では、位相認識動的画像を利用する新しいデュアルストリームフレームワークDIANetを提案する。
3つのベンチマークMERデータセットを用いて行った実験は、提案手法が従来の単相DIベースのアプローチよりも一貫して優れていることを示した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 07:15:29 GMT)
Crosscap Quenches and Entanglement Evolution [0.0] クロスキャップクエンチ(crosscap quench)と呼ばれる新しいクエンチプロトコルを提案する。
我々は共形場理論(CFT)を解析し、絡み合いエントロピーの時間進化における普遍的特徴を導出する。
非可積分スピン系および可積分スピン系における数値シミュレーションによりこれらの知見を検証した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 16:23:51 GMT)
Coordination Requires Simplification: Thermodynamic Bounds on Multi-Objective Compromise in Natural and Artificial Intelligence [0.0] コーディネート・フォーカスポイントとして機能する最大効用を持つ解は、精度よりもエージェント間で発見可能な選択圧力がはるかに高いことを示す。
この枠組みを熱力学的コーディネート理論 (TCT) と呼び、協調には急進的な情報損失が必要であることを示す。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:38:12 GMT)
Convolutional Attention in Betting Exchange Markets [0.0] このケーススタディは、世界有数の賭け取引所Betfairのプリライブステージ中の英国からウィンホースレーシング市場に焦点を当てている。
提案したアーキテクチャは、モデルトレーニングと新しいデータに対するその後のテストを含む、標準的な教師付き学習アプローチに従う。
また、本研究では、開発モデルを用いた自動機能エンジニアリングと市場インタラクションのための完全なエンドツーエンドフレームワークも提示している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:45:12 GMT)
Constructing a Real-World Benchmark for Early Wildfire Detection with the New PYRONEAR-2025 Dataset [0.0] PYRONEAR-2025は、画像とビデオの両方からなる新しいデータセットであり、煙管検出モデルのトレーニングと評価を可能にする。
i) 野火検出のための公共のカメラネットワークからの山火事のビデオ、(ii) 社内のカメラネットワークからの映像、(iii) 合成画像と実際の画像の一部。
このデータセットには5万のイメージに対する15万のマニュアルアノテーションが含まれており、640の山火事をカバーしている。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:40:02 GMT)
Conditions for Time-Independence of N-level Systems under the Rotating Wave Approximation (RWA) and Dipole Selection Rules [0.0] 我々は、回転波近似と双極子選択規則の下で、Nレベルシステムの時間依存性を分析する。
奇数やパリティレベルが1つしか持たないシステムは、時間依存を実現する。
対照的に、他のものは時間依存性を達成するためにレーザーデチューニングの条件を満たさなければならない。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:18:10 GMT)
Classical-quantum systems breaking conservation laws [0.0] 古典粒子と相互作用する量子ビットを考察し、対応するハイブリッド系が角運動量保存に反することを示す。
これは、保存則に反する完全に正のダイナミクスを持つ完全に閉じた、回転不変な古典量子系の明示的な例である。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:36:16 GMT)
Certification of energy-restricted entanglement depth with simple measurements [0.0] 多部シナリオにおける絡み合いの認定は、量子技術の進歩に不可欠である。
本稿では,複数の距離および非特性のパーティによってプレイされる状態判別ゲームに基づいて,限られたエネルギーで量子状態のアンサンブルにおける絡み合いを認証する手法を提案する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 17:43:02 GMT)
Censorship of quantum resources against catalytic account sharing [0.0] 量子資源の完全消去を必要としない検閲プロトコルを導入する。
検閲がどの条件で安全か、いつ失敗するかを調査する。
検閲プロトコルは、量子ネットワークセキュリティに関する新しい視点を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:00:02 GMT)
Cardi-GPT: An Expert ECG-Record Processing Chatbot [0.0] Cardi-GPTは、心電図の解釈を効率化し、臨床コミュニケーションを強化するために設計されたエキスパートシステムである。
12個の心電図データを処理するために、16個の残留ブロック畳み込みニューラルネットワーク(CNN)を使用しており、24個の心条件で0.6194の重み付け精度を実現している。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:58:33 GMT)
COSTAR-A: A prompting framework for enhancing Large Language Model performance on Point-of-View questions [0.0] 既存のCOSTAR手法を強化する新しいプロンプトエンジニアリングフレームワークであるCOSTAR-Aを紹介する。
従来のCOSTARフレームワークは,高速な明快さを向上し,より大きなLCMに対して出力を整列させるが,より小型で局所的に最適化されたモデルとの整合性は低いことが実証された。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:31:21 GMT)
CADE 2.5 - ZeResFDG: Frequency-Decoupled, Rescaled and Zero-Projected Guidance for SD/SDXL Latent Diffusion Models [0.0] SD/SDXL遅延拡散モデルのためのサンプルレベルガイダンススタックであるFDG 2.5(Comfy Adaptive Detail Enhancer)を紹介する。
ZeResFDGは、(i)誘導信号の低周波成分と高周波成分を再重み付けする周波数分離誘導、(ii)誘導予測のサンプルごとの大きさと正の分岐に一致するエネルギー再スケーリング、(iii)非条件方向と平行な成分を除去するゼロ投影を統一する。
SD/SDXLサンプリング装置全体では、ZeResCADEはシャープネスを改善し、順応し、調整することなく適度なスケールで制御する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 19:57:58 GMT)
Brillouin-Mandelstam Scattering-based Cooling of Traveling Acoustic Waves from Cryogenic Temperatures [0.0] ブリュアン冷却は、波長 GHz から 74 K までの導波路における熱フォノンの効率の低下を示すために用いられている。
フォノンの個体数は69パーセント減少し, 最終温度は24.3K, 50K低下した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 11:55:29 GMT)
Breaking Guardrails, Facing Walls: Insights on Adversarial AI for Defenders & Researchers [0.0] 本稿では,参加者が一般的な手法を用いて簡単に単純なAIガードレールをバイパスしたことを示す。
階層化された多段階防衛は依然として重要な課題であり、より安全なAIシステムを構築するための具体的な洞察を提供する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 15:01:59 GMT)
Behavioral Biometrics for Automatic Detection of User Familiarity in VR [0.0] 経験のないユーザが増えれば、仮想現実(VR)システムに関わるようになるでしょう。
本研究では,パスコードを用いたドア開閉作業中の手の動きパターンを解析し,VRの親しみやすさの自動検出について検討する。
本結果は,VRアプリケーションにおけるユーザ親しみのリアルタイム検出に手動バイオメトリックスを用いることの約束を裏付けるものである。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 21:00:05 GMT)
Attribution Quality in AI-Generated Content:Benchmarking Style Embeddings and LLM Judges [0.0] 大規模言語モデル(LLM)の時代における著者の貢献は、機械による散文が人間の文章に匹敵するものとして、ますます困難になっている。
2つの相補的帰属機構をベンチマークする。
ヒューマンAIパラレルコーパスの固定スタイル埋め込みと命令調整LDMジャッジ(GPT-4o)。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 18:54:03 GMT)
Attention as an Adaptive Filter [0.0] 本稿では,学習可能な動的モデルを注意重みの計算に直接組み込む新しい注意機構であるAdaptive Filter Attention (AFA)を紹介する。
連続時間線形時間不変系を仮定することにより、微分リアプノフ方程式の閉形式解を用いて、キーからクエリへのダイナミックスを通して不確かさを効率的に伝播させることができる。
注意の一般化は、この線形SDEの軌道をフィルタリングする極大解として自然に生じ、注意重みは、伝播されたクエリキー精度の頑健な残差に基づく再重み付けに対応する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:25:03 GMT)
An Empirical Study of Reducing AV1 Decoder Complexity and Energy Consumption via Encoder Parameter Tuning [0.0] AV1エンコーダ, libaom-av1 と SVT-AV1 における, 各種符号化ツールの無効化と符号化パラメータの調整の影響を解析した。
リボームav1ではCDEFを無効にすると、ループ内フィルタによりデコードサイクルを10%削減できる。
SVT-AV1では、内蔵のfast-decode=2プリセットを使用してデコードサイクルを24%削減する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 10:52:24 GMT)
A universal approach to saddle-point methods in attosecond science [0.0] ピカール=レフシェッツ理論を時間積分と半古典的軌道の普遍的かつ堅牢な結合として導入する。
2色レーザー場を駆動したHHGにおけるストークス遷移とスペクトル因果性について検討した。
我々は、量子軌道に基づくアプローチの厳密な応用の基盤をアト秒科学に設定した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 14:08:06 GMT)
A large-scale, unsupervised pipeline for automatic corpus annotation using LLMs: variation and change in the English consider construction [0.0] 大規模言語モデル(LLM)を用いた語彙コーパスにおける文法アノテーションの自動化のためのスケーラブルで教師なしパイプラインを提案する。
提案手法では,4段階のワークフロー,即時エンジニアリング,事前評価,自動バッチ処理,ポストホック検証を用いる。
GPT-5をOpenAI API経由で使用し,過去アメリカ英語コーパス(COHA)の143,933文を60時間以内で注釈し,2つの高度なアノテーション手順において98%以上の精度を達成した。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 09:06:14 GMT)
A Review on Domain Adaption and Generative Adversarial Networks(GANs) [0.0] 本稿では、ドメイン適応とそれを実装する様々な方法について議論する。
主なアイデアは、特定のデータセットでトレーニングされたモデルを使用して、同じ種類の異なるドメインからのデータを予測することだ。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 02:32:10 GMT)
A Multimodal XAI Framework for Trustworthy CNNs and Bias Detection in Deep Representation Learning [0.0] 本稿では,注目機能融合,Grad-CAM++に基づく局所的な説明,バイアス検出と緩和のためのReveal-to-Reviseフィードバックループを統一する新しいフレームワークを提案する。
分類精度は93.2%,F1スコア91.6%,説明忠実度78.1%(IoU-XAI)である。
私たちの仕事は、パフォーマンス、透明性、公正性のギャップを埋め、センシティブなドメインにおける信頼できるAIの実践的な経路を強調します。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 20:06:09 GMT)
A Cooperative Approach for Knowledge-based Business Process Design in a Public Authority [0.0] 本稿では,ビジネスプロセス設計におけるビジネスエキスパートを支援する知識ベース手法を提案する。
知識ベースの構築は、シンプルでテキストベースの知識アーチファクトから始まり、より構造化され、形式化された表現へと進む。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:38:17 GMT)
$m$-step rational extensions of the trigonometric Darboux-Pöschl-Teller potential based on para-Jacobi polynomials [0.0] 1ステップのダルブックスによって得られる三角度ダルブックス-P"オシュラーポテンシャルの正則な有理拡大の以前の構成について研究した。
離散パラメータ$m$に依存する例外変換のいくつかの新しい族が研究されている。
有理拡張正則性条件によるこれらのパラメータに課される制限を詳細に研究する。
論文参考訳(メタデータ) (Tue, 14 Oct 2025 13:33:01 GMT)