AdaSteer: Your Aligned LLM is Inherently an Adaptive Jailbreak Defender [99.3] 本稿では,入力特性に基づいてモデル動作を調整するアダプティブアクティベーションステアリング手法であるAdaSteerを提案する。
AdaSteer は Rejection Direction (RD) と Harmfulness Direction (HD) の両方に沿って入力表現を操る
本研究は,LLMにおけるリアルタイム・フレキシブル安全対策のための解釈可能なモデル内装の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:09:14 GMT)
MANZANO: A Simple and Scalable Unified Multimodal Model with a Hybrid Vision Tokenizer [90.7] マルチモーダルな大規模言語モデルのためのシンプルでスケーラブルな統合フレームワークであるManzanoを紹介します。
単一の視覚エンコーダは、画像からテキストへの理解のための連続的な埋め込みを生成する2つのアダプタと、テキストから画像への生成のための離散トークンを提供する。
統合自己回帰LDMはテキストと画像トークンの形式で高レベルのセマンティクスを予測し、補助拡散デコーダで画像トークンをピクセルに変換する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:58:00 GMT)
Towards Communication-efficient Federated Learning via Sparse and Aligned Adaptive Optimization [90.1] Federated Adam (FedAdam) アルゴリズムはアップリンク通信オーバーヘッドの3倍の増大に悩まされている。
我々はFedAdam-SSMと呼ばれる新しいスパースなFedAdamアルゴリズムを提案する。
我々は,FedAdam-SSMが訓練したモデルと集中型Adamの差異を最小化することにより,スペーシフィケーションエラーによる学習性能劣化を軽減するためにSSMを最適化する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:48:34 GMT)
Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [89.8] 本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。
このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:48:14 GMT)
Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [87.7] コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:23:46 GMT)
UniGist: Towards General and Hardware-aligned Sequence-level Long Context Compression [86.3] UniGistは、大規模言語モデルのためのシーケンスレベルのロングコンテキスト圧縮フレームワークである。
生のトークンを特別な圧縮トークン(gist)に微粒な方法で置き換えることで、コンテキスト情報を効率的に保存する。
提案手法は,圧縮トークンの実際の除去を可能にすることで,フレキシブルな推論もサポートしている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:47:37 GMT)
G2D2: Gradient-Guided Discrete Diffusion for Inverse Problem Solving [83.6] 本稿では,従来の離散拡散に基づく生成モデルを活用することによって,線形逆問題に対処する新しい手法を提案する。
我々は、従来の離散拡散モデルの欠点を吸収状態で緩和するために、星型ノイズプロセスを用いる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:52:49 GMT)
IGD: Token Decisiveness Modeling via Information Gain in LLMs for Personalized Recommendation [79.2] 我々は,トークン決定性をチューニングと復号の両方に統合する情報ゲインに基づく決定性対応トークンハンドリング(IGD)戦略を導入する。
IGDはリコメンデーションの精度を一貫して改善し、強力なベースラインに比べて広く使われているランキングの指標で顕著に向上した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:04:33 GMT)
Where Fact Ends and Fairness Begins: Redefining AI Bias Evaluation through Cognitive Biases [77.3] 事実と公正の境界を識別することは有意義な公正性評価に不可欠である,と我々は主張する。
Fact-or-Fair は (i) 客観的なクエリを記述的, 事実に基づく判断, (ii) 主観的クエリを規範的, 公平性に基づく判断に整合させたベンチマークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:54:17 GMT)
Open Vision Reasoner: Transferring Linguistic Cognitive Behavior for Visual Reasoning [77.3] 本稿では,Qwen2.5-VL-7Bに基づく2段階のパラダイムを提案する。
この先駆的な研究は、3つの基本的な洞察を明らかにしている: 1) 行動伝達は、言語的精神イメージによる冷戦開始時に驚くほど早く出現し、2) 冷戦開始は、視覚行動を広く記憶し、RLは、効果的パターンを批判的に識別し、スケールアップする。
得られたモデルであるOpen-Vision-Reasoner (OVR)は、MATH500で95.3%、MathVisionで51.8%、54.6%を含む一連の推論ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:57:59 GMT)
CoReVLA: A Dual-Stage End-to-End Autonomous Driving Framework for Long-Tail Scenarios via Collect-and-Refine [73.7] CoReVLAは、自動運転のための継続的学習フレームワークである。
データコレクションとビヘイビアリファインメントの2段階プロセスを通じて、ロングテールシナリオのパフォーマンスを改善する。
CoReVLAは72.18のドライビングスコア(DS)と50%の成功率(SR)を達成し、7.96DSの最先端手法と15%SRの長期的安全クリティカルシナリオで性能を向上する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:25:56 GMT)
Pipeline Parallelism is All You Need for Optimized Early-Exit Based Self-Speculative Decoding [73.7] 大規模言語モデル(LLM)は、優れた生成品質を提供するが、非常に高い推論コストをもたらす。
早期排他的自己投機的復号法(EESD)がこのコストを軽減するために登場した。
ドラフトと検証作業を完全にパイプライン化するパイプライン・パラレル自己スペクティブ・デコーディング(PPSD)を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:51:41 GMT)
Generalized Deep Multi-view Clustering via Causal Learning with Partially Aligned Cross-view Correspondence [72.4] マルチビュークラスタリング(MVC)は、複数のビューにまたがる共通のクラスタリング構造を検討することを目的としている。
しかし、現実のシナリオは、部分的なデータだけが異なるビューに一貫して整合しているため、しばしば課題となる。
我々は,CauMVCと呼ばれる因果的マルチビュークラスタリングネットワークを設計し,この問題に対処する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:31:40 GMT)
Large Language Model-Empowered Decision Transformer for UAV-Enabled Data Collection [71.8] 空間分散デバイスからの信頼性とエネルギー効率のよいデータ収集のための無人航空機(UAV)は、IoT(Internet of Things)アプリケーションをサポートする上で大きな可能性を秘めている。
有効なUAV制御ポリシーを学習するための共同言語モデル(LLM)を提案する。
LLM-CRDTは、現在の最先端DTアプローチよりも最大36.7%高いエネルギー効率を達成し、オンラインおよびオフラインメソッドのベンチマークより優れている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:47:05 GMT)
Chain of Strategy Optimization Makes Large Language Models Better Emotional Supporter [71.2] そこで我々は,各対話における戦略選択の選好を最適化する新しいアプローチであるChain-of-Strategy Optimization (CSO)を提案する。
まずモンテカルロ木探索を用いて,ターンレベルの戦略応答対を持つ高品質な選好データセットであるESC-Proを構築した。
CSOを用いたESC-Proのトレーニングは、戦略精度とバイアス軽減の両方を改善し、LLMがより共感的で文脈的に適切な応答を生成できるようにする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:55:36 GMT)
Towards deployment-centric multimodal AI beyond vision and language [69.6] デプロイ不能なソリューションの可能性を減らすために、デプロイメント制約を早期に組み込んだデプロイメント中心のワークフローを提唱します。
我々は、複数の分野にまたがる共通のマルチモーダルAI固有の課題を特定し、3つの実世界のユースケースについて検討する。
複数の学際的な対話とオープンな研究プラクティスを育むことで、我々のコミュニティは、広く社会に影響を及ぼすためのデプロイメント中心の開発を加速できる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:48:11 GMT)
Efficient Real-time Refinement of Language Model Text Generation [65.2] 大規模言語モデル(LLM)は、幅広い自然言語タスクにおいて顕著な性能を示している。
重要な課題は、時に事実的に誤った答えを生じさせることである。
本稿では,LLM出力の検証と改善の効率化を目的とした新しい手法であるStreaming-VRを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:59:49 GMT)
Cuckoo Attack: Stealthy and Persistent Attacks Against AI-IDE [64.5] Cuckoo Attackは、悪意のあるペイロードを構成ファイルに埋め込むことで、ステルス性と永続的なコマンド実行を実現する新しい攻撃である。
攻撃パラダイムを初期感染と持続性という2つの段階に分類する。
当社は、ベンダーが製品のセキュリティを評価するために、実行可能な7つのチェックポイントを提供しています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:10:52 GMT)
Efficient Learning for Linear Properties of Bounded-Gate Quantum Circuits [62.5] 量子学習理論の最近の進歩は、様々な古典的な入力によって生成された測定データから、大きな量子ビット回路の線形特性を効率的に学習できるのか?
我々は、小さな予測誤差を達成するためには、$d$で線形にスケーリングするサンプルの複雑さが必要であることを証明し、それに対応する計算複雑性は、dで指数関数的にスケールする可能性がある。
そこで本研究では,古典的影と三角展開を利用したカーネルベースの手法を提案し,予測精度と計算オーバーヘッドとのトレードオフを制御可能とした。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:05:24 GMT)
Discrete Diffusion in Large Language and Multimodal Models: A Survey [61.9] 離散拡散言語モデル(dLLMs)と離散拡散多モード言語モデル(dMLLMs)の体系的調査を行う。
自己回帰(AR)モデルとは異なり、dLLMsとdMLLMsはマルチトークンの並列デコーディングパラダイムを採用しており、フルアテンションとデノナイジングに基づく生成戦略を採用している。
我々は、dLLMとdMLLMの歴史的発展を辿り、基礎となる数学的枠組みを定式化し、一般的なモデリング手法を列挙し、代表モデルを分類する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:18:31 GMT)
SegDINO3D: 3D Instance Segmentation Empowered by Both Image-Level and Object-Level 2D Features [61.1] SegDINO3Dは、3Dインスタンスセグメンテーションのためのトランスフォーマーエンコーダデコーダフレームワークである。
画像レベルとオブジェクトレベルの両方の機能を含む、事前訓練された2D検出モデルから2D表現を完全に活用する。
SegDINO3Dは、ScanNetV2とScanNet200インスタンスセグメンテーションベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:41:10 GMT)
Training-Free Pyramid Token Pruning for Efficient Large Vision-Language Models via Region, Token, and Instruction-Guided Importance [60.0] 近年のアプローチでは、高解像度画像を複数のサブイメージに分割し、視覚トークンの数を劇的に増やしている。
本稿では,各領域とトークンレベルにおいてボトムアップのビジュアル・サリエンシを統合した,トレーニングフリーなトークン・プルーニング戦略を提案する。
提案手法は,性能損失を最小限に抑えながら,計算オーバーヘッドと推論遅延を大幅に低減する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:28:17 GMT)
3D Gaussian Flats: Hybrid 2D/3D Photometric Scene Reconstruction [59.2] 本研究では,平面平面(2D)ガウスと自由形式(3D)ガウスを連立最適化するハイブリッド2D/3D表現を提案する。
我々のエンドツーエンドアプローチは、平面領域を動的に検出・洗練し、視覚的忠実度と幾何学的精度の両方を改善する。
ScanNet++とScanNetv2の最先端の深さ推定を実現し、特定のカメラモデルに過度に適合することなくメッシュ抽出に優れる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:04:36 GMT)
AcT2I: Evaluating and Improving Action Depiction in Text-to-Image Models [58.9] 本稿では、アクション中心のプロンプトから画像を生成する際のT2Iモデルの性能を評価するためのベンチマークであるAcT2Iを紹介する。
我々は、先行するT2IモデルがAcT2Iにうまく対応していないことを実験的に検証した。
我々は,この制限に対処するために,大規模言語モデルを用いた訓練不要の知識蒸留技術を開発した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:41:39 GMT)
DivLogicEval: A Framework for Benchmarking Logical Reasoning Evaluation in Large Language Models [58.4] 本稿では,多種多様な文からなる自然文からなる古典論理ベンチマークDivLogicEvalを提案する。
また,より信頼性の高い評価を実現するために,大規模言語モデルに固有のバイアスやランダム性の影響を緩和する新たな評価指標を導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:40:46 GMT)
CLASS: A Controller-Centric Layout Synthesizer for Dynamic Quantum Circuits [58.2] CLASSは、分散制御システムにおけるコントローラ間通信遅延を低減するために設計された、コントローラ中心のレイアウトシンセサイザーである。
評価の結果、CLASSは通信遅延を最大100%減らし、追加操作数の平均2.10%しか増加しないことがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:11:55 GMT)
EquiBench: Benchmarking Large Language Models' Reasoning about Program Semantics via Equivalence Checking [58.2] 大規模言語モデル(LLM)を評価するための新しいベンチマークであるEquiBenchを紹介する。
このタスクは、プログラムのセマンティクスについて推論するモデルの能力を直接テストする。
19の最先端LCMを評価し、最も難しいカテゴリでは、最高の精度は63.8%と76.2%であり、50%のランダムベースラインよりわずかに高い。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:16:55 GMT)
Direct Simultaneous Translation Activation for Large Audio-Language Models [58.0] 音声からテキストへの同時翻訳(Simul-S2TT)は,音声をテキストにリアルタイムで翻訳することを目的としている。
我々は、LALMs固有の能力を利用して同時データを得る戦略であるbf SimulSA(bf SimulSA)を導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:12:18 GMT)
CultureScope: A Dimensional Lens for Probing Cultural Understanding in LLMs [57.7] CultureScopeは、大規模な言語モデルにおける文化的理解を評価するための、これまでで最も包括的な評価フレームワークである。
文化的な氷山理論に触発されて、文化知識分類のための新しい次元スキーマを設計する。
実験結果から,文化的理解を効果的に評価できることが示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:47:48 GMT)
Enhancing LLM Language Adaption through Cross-lingual In-Context Pre-training [57.6] CrossIC-PT(クロスランガル・イン・コンテクスト・プレトレーニング)は、クロスランガル・トランスファーを強化するシンプルでスケーラブルなアプローチである。
セマンティック関連のバイリンガルウィキペディア文書を1つのコンテキストウィンドウにインターリーブすることで、CrossIC-PTサンプルを構築する。
実験の結果、CrossIC-PTは6つの対象言語にわたる3つのモデルの多言語性能を改善することが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:09:02 GMT)
Two Is Better Than One: Aligned Representation Pairs for Anomaly Detection [56.6] 異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型手法は, 異常に関する事前知識を用いて, トレーニング中に合成外れ値を生成することによって, それらの表現をうまく学習している。
この制限は、通常のサンプルにおける対称性に関する事前の知識を活用して、異なるコンテキストでデータを観測する、新しいアプローチであるCon$で対処する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:44:16 GMT)
Language Mixing in Reasoning Language Models: Patterns, Impact, and Internal Causes [55.0] RLM(Reasoning Language Model)は、チェーン・オブ・シント・プロセスを利用して構造化中間ステップを生成することで、複雑なタスクに優れる。
言語混合、すなわちプロンプト以外の言語からのトークンを含む推論ステップがアウトプットで観測され、性能に影響することが示されている。
本研究では, RLMにおける言語混合に関する最初の体系的研究を行い, そのパターン, 影響, 内部要因を15言語にわたって検討した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:57:55 GMT)
OptiScene: LLM-driven Indoor Scene Layout Generation via Scaled Human-aligned Data Synthesis and Multi-Stage Preference Optimization [54.6] 既存の屋内レイアウト生成手法は、プロンプト駆動と学習に基づく2つのカテゴリに分類される。
本稿では,大規模データセットである3D-SynthPlaceについて紹介する。
屋内レイアウト生成に最適化された強力なオープンソースLLMであるOptiSceneを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:25:25 GMT)
Advances in Multimodal Adaptation and Generalization: From Traditional Approaches to Foundation Models [54.2] この調査は、従来のアプローチから基礎モデルへの進歩に関する、初めての包括的なレビューを提供する。
1)マルチモーダルドメイン適応,(2)マルチモーダルテスト時間適応,(3)マルチモーダルドメイン一般化,(4)マルチモーダルファンデーションモデルの助けを借りたドメイン適応と一般化,(5)マルチモーダルファンデーションモデルの適応。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:58:01 GMT)
Personalized Language Models via Privacy-Preserving Evolutionary Model Merging [54.0] 言語モデルにおけるパーソナライゼーションは、個々のユーザやユーザグループに対する振る舞いをモデル化することを目的としている。
進化的アルゴリズム(PriME)によるプライバシ保護モデルマージを提案する。
PriMEは、プライバシーリスクを低減しつつ、ユーティリティを直接最適化するために、勾配のない方法を採用している。
LaMPベンチマークの実験によると、Primeは一貫してベースラインを上回り、タスクパフォーマンスを最大45%改善している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:12:43 GMT)
MigGPT: Harnessing Large Language Models for Automated Migration of Out-of-Tree Linux Kernel Patches Across Versions [53.8] 大規模言語モデル(LLM)は、様々な領域で顕著な進歩を示している。
LLMは不完全なコードコンテキスト理解と不正確なマイグレーションポイント識別に苦労する。
MigGPTは、コードスニペット情報を保持するために新しいコード指紋構造を使用するフレームワークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:11:51 GMT)
HiPhO: How Far Are (M)LLMs from Humans in the Latest High School Physics Olympiad Benchmark? [53.8] HiPhOは、人間による評価を備えた、高校の物理学オリンピアードのための最初のベンチマークである。
2024年から2025年にかけて13回のオリンピアード試験をコンパイルし、国際大会と地域競技の両方にまたがる。
我々は、(M)LLMとヒトの競技者との直接比較を可能にするため、公式メダル閾値に基づくモデルに金、銀、銅のメダルを割り当てる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:18:35 GMT)
Phase Transition for Stochastic Block Model with more than $\sqrt{n}$ Communities [51.3] 統計物理学からの予測では、モデルブロック(SBM)におけるコミュニティの回復は、上述の時間で可能であり、上述のケステンスティグム(KS)しきい値のみである。
Chinら(2025)は、最近、スパース体制では、非バックトラックパスを数えることにより、KS閾値以下で、スパースタイムでのコミュニティの回復が可能であることを証明した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:53:56 GMT)
Monte Carlo Tree Diffusion with Multiple Experts for Protein Design [50.1] マスク付き拡散モデルと木探索を統合したMCTD-MEを提案する。
自己回帰型プランナーとは異なり、MCTD-MEはロールアウトエンジンとして生物物理学的な拡散デノナイジングを使用している。
このフレームワークはモデルに依存しず、デノボタンパク質工学や多目的分子生成を含む逆フォールディングを越えて適用できる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:24:42 GMT)
MS-GS: Multi-Appearance Sparse-View 3D Gaussian Splatting in the Wild [47.5] 野生の写真コレクションは、しばしば限られた量の画像を含んでおり、複数の外観を示す。
3DGS を用いたスパースビューシナリオにおけるマルチアジュアンス機能を備えた新しいフレームワーク MS-GS を提案する。
我々は,MS-GSが様々な難解な視界とマルチアジュアンス条件下でレンダリングを実現することを実証した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:06:49 GMT)
FLARE: Faithful Logic-Aided Reasoning and Exploration [47.5] タスク分解を用いて問題空間をトラバースする新しい手法を提案する。
我々はLarge Language Modelsを使ってソリューションを計画し、クエリを事実に軟式化し、論理プログラミングコードを使って述語する。
提案手法は,生成したコードに対する推論プロセスの忠実度を計算し,外部の解法に頼らずにマルチホップ探索のステップを解析する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:12:33 GMT)
Analog In-memory Training on General Non-ideal Resistive Elements: The Impact of Response Functions [46.8] AIMCハードウェアでは、トレーニング可能な重量は抵抗素子のコンダクタンスで表され、連続する電気パルスを用いて更新される。
コンダクタンスはパルスごとに一定変化するが、実際には非対称および非線形のテキスト応答関数によってスケールされ、非理想的トレーニングのダイナミクスをもたらす。
本稿では,AIMCハードウェアにおける非理想応答関数を用いた勾配学習の理論的基礎を提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:20:53 GMT)
Query-Efficient Locally Private Hypothesis Selection via the Scheffe Graph [46.0] 局所的な差分プライバシーを満足するアルゴリズムを記述し、個人に対して$tildeO(k3/2)$非適応クエリを実行する。
また、Scheff'eグラフをダブする新しいオブジェクトを導入し、$Q$の分散間の差の構造をキャプチャする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:41:15 GMT)
How Far Are We? An Empirical Analysis of Current Vulnerability Localization Approaches [45.1] オープンソースのソフトウェア脆弱性検出は、ソフトウェアのセキュリティを維持し、ソフトウェアサプライチェーンの整合性を確保するための重要なコンポーネントである。
従来の検出方法は、大量のコミット履歴を処理する際に、大きなスケーラビリティの課題に直面している。
バージョン駆動型候補フィルタリングと大規模言語モデルに基づく多ラウンド対話投票を組み合わせた新しい2段階フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:09:55 GMT)
LiMuon: Light and Fast Muon Optimizer for Large Models [45.1] 大規模モデルのトレーニングに有用なMuonを提案する。
私たちのLiMuonは、現在のMuonとその変種よりもメモリが低い。
一般化された滑らかな条件下でLiMuonがサンプルO(epsilon-3)$であることを証明する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:40:32 GMT)
VLA-Mark: A cross modal watermark for large vision-language alignment model [44.6] VLA-Markは視覚対応のフレームワークで、検出可能な透かしを埋め込むと同時に、クロスモーダルコーディネートを通じて意味的忠実さを保っている。
提案手法は,局所的パッチ親和性,大域的セマンティックコヒーレンス,文脈的注意パターンを組み合わせ,マルチスケールの視覚・テクスチュアアアライメントメトリクスを統合する。
実験では、PPLが7.4%低く、BLEUが26.6%高い。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:54:08 GMT)
Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning [44.5] Supervised Fine-Tuning (SFT) Large Language Modelsは高品質なトレーニングデータに依存している。
自己進化型モデル駆動動的データ最適化フレームワークであるMiddoを紹介した。
その結果,Middoはシードデータの品質を継続的に向上し,LLMの性能を平均7.15%向上させることができた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:25:52 GMT)
DistillMatch: Leveraging Knowledge Distillation from Vision Foundation Model for Multimodal Image Matching [43.8] マルチモーダル画像マッチングは、異なるモダリティの画像間のピクセルレベルの対応を求める。
一致のためのモダリティ-共通特徴を抽出する既存のディープラーニング手法は、様々なシナリオへの適応性に欠ける。
本研究では,Vision Foundation Modelの知識蒸留を用いたマルチモーダル画像マッチング手法であるDistillMatchを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:26:25 GMT)
RePIC: Reinforced Post-Training for Personalizing Multi-Modal Language Models [43.8] イメージキャプションをパーソナライズするための強化学習に基づくポストトレーニングフレームワークを提案する。
本手法は,MLLMの視覚認識能力とパーソナライズ機能の両方を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:03:31 GMT)
Pointing to a Llama and Call it a Camel: On the Sycophancy of Multimodal Large Language Models [43.2] マルチモーダル大言語モデル (MLLM) は視覚的シコファン的行動の顕著な形態を示す。
同様の振る舞いは、テキストベースの大規模言語モデル(LLM)でも言及されている。
本稿では,Sycophantic Reflective Tuning(SRT)を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:57:20 GMT)
SAMPO:Scale-wise Autoregression with Motion PrOmpt for generative world models [42.8] textbfSAMPOは、フレーム内生成のための視覚的自己回帰モデリングと、次のフレーム生成のための因果モデリングを組み合わせたハイブリッドフレームワークである。
動作条件付きビデオ予測とモデルベース制御において,SAMPOが競合性能を発揮することを示す。
また、SAMPOのゼロショット一般化とスケーリング挙動を評価し、未知のタスクに一般化する能力を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:41:37 GMT)
Towards Better Code Generation: Adaptive Decoding with Uncertainty Guidance [42.7] AdaDecはアダプティブなデコーディングフレームワークで、ルックアヘッドベースで不確実性を認識した停止と再実行のメカニズムを採用している。
AdaDecは、greedyデコーディングと比較して、Pass@1の精度で20.9%の絶対的なゲインを達成する。
AdaDecは、必要に応じて再ランクを適用することで、計算オーバーヘッドとレイテンシを低減し、信頼性とともに効率を向上する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:14:38 GMT)
Hierarchical Retrieval: The Geometry and a Pretrain-Finetune Recipe [42.4] 一致するクエリとドキュメントのペアを類似したベクトル表現に埋め込んだデュアルエンコーダ(DE)モデルは、情報検索に広く利用されている。
本稿では,階層的検索(HR)の文脈において,文書集合が階層構造を持ち,クエリに適合する文書がすべてその祖先であるような制約について検討する。
近い文書の性能を犠牲にすることなく、長距離検索を大幅に改善するプレトレインファインチューンレシピを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:35:58 GMT)
EyePCR: A Comprehensive Benchmark for Fine-Grained Perception, Knowledge Comprehension and Clinical Reasoning in Ophthalmic Surgery [42.2] 我々は,眼科手術解析のための大規模ベンチマークであるtextbfEyePCR を開発した。
EyePCRは210k以上のVQAを持つリッチな注釈付きコーパスを提供する。
リッチアノテーションは深い認知分析を促進し、外科医が視覚的手がかりをどう知覚するかをシミュレートし、それらをドメイン知識と組み合わせて意思決定する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:55:56 GMT)
SENTRA: Selected-Next-Token Transformer for LLM Text Detection [42.0] 我々は,SENTRA(Selected-Next-Token tRAnsformer)という,新規で汎用的で教師付きLLMテキスト検出器を提案する。
SENTRAは、選択されたnext-token-probabilityシーケンスを活用するトランスフォーマーベースのエンコーダであり、大量の未ラベルデータに対するコントラスト事前トレーニングを利用する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:48:12 GMT)
PACMANN: Point Adaptive Collocation Method for Artificial Neural Networks [42.0] PINNは、一組のコロケーションポイントに対して決定されたPDE残差を含む損失関数を最小化する。
PACMANNは勾配に基づく最適化アルゴリズムを用いて、コロケーションポイントを高次残差領域へ段階的に移動させる。
この方法の主な特徴は、計算コストの低減と、既存の物理インフォームドニューラルネットワークパイプラインとの統合の簡易化である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:41:08 GMT)
How Do Social Bots Participate in Misinformation Spread? A Comprehensive Dataset and Analysis [41.7] 本稿では,Sina Weiboプラットフォーム上でのソーシャルボットと誤情報との相互作用について考察する。
誤情報の観点からは、データセットはマルチモーダルであり、11,393個の誤情報と16,416個の検証情報を含んでいる。
ソーシャルボットの観点から見ると、このデータセットには65,749のソーシャルボットと、345,886の本物のアカウントが含まれており、弱教師付きアノテーションを使って注釈付けされている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:36:42 GMT)
Two Facets of the Same Optimization Coin: Model Degradation and Representation Collapse in Graph Foundation Models [41.4] GFMはマルチドメインのテキスト属性グラフから最適な埋め込み関数を学習するために設計されている。
グラフ VQ-MAE は、ますます多様な GFM の風景の中で際立っている。
その可能性にも拘わらず、領域の一般化の衝突は認識不能な落とし穴を引き起こす。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:07:23 GMT)
Instance Generation for Meta-Black-Box Optimization through Latent Space Reverse Engineering [40.9] 我々は,MetaBBOsがより一般化可能なポリシを学習するための多様なトレーニング問題インスタンスを生成する,textbfLSREと呼ばれるインスタンス生成手法を提案する。
各種メタBBOをDiverse-BBOでトレーニングすることでLSREの有効性を検証し,その一般化性能を合成シナリオか現実シナリオかで観察する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:37:48 GMT)
Re-Align: Aligning Vision Language Models via Retrieval-Augmented Direct Preference Optimization [40.8] 大規模視覚言語モデル(VLM)は、特に横断的不整合の形で、重要な幻覚を引き起こす傾向がある。
本稿では、画像検索を利用した新しいアライメントフレームワークRe-Alignを紹介する。
我々はまた、微調整中に視覚的嗜好を付加する、標準の直接選好最適化の拡張であるrDPOも導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:28:23 GMT)
'Rich Dad, Poor Lad': How do Large Language Models Contextualize Socioeconomic Factors in College Admission ? [40.6] 大規模言語モデル(LLM)は、ハイテイクなドメインにますます関与している。
本稿では,認知科学にインスパイアされた新しいデュアルプロセスフレームワークを用いて,大学入学決定におけるLLMの社会経済的地位(SES)に関する大規模監査を行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:22:53 GMT)
VORTEX: Aligning Task Utility and Human Preferences through LLM-Guided Reward Shaping [40.5] 社会的影響の最適化において、AI決定システムはよく、よく校正された数学的目的を最適化する解法に依存する。
近年のアプローチでは、好み記述から新たな報酬関数を生成するために、大規模言語モデルを用いてこの問題に対処している。
我々は、人間のフィードバックを適応的に取り入れつつ、確立された最適化目標を保存する言語誘導報酬形成フレームワークである textttVORTEX を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:22:13 GMT)
UXAgent: A System for Simulating Usability Testing of Web Design with LLM Agents [40.2] 近年のLarge Language Model-simulated Agent (LLM Agent) 研究はUXAgentの設計に影響を与えた。
システムにはペルソナジェネレータモジュール,LDMエージェントモジュール,ユニバーサルブラウザコネクタモジュールがあり,数千のシミュレーションユーザを自動的に生成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:52:50 GMT)
SEMMA: A Semantic Aware Knowledge Graph Foundation Model [40.0] 知識グラフ基礎モデル(KGFM)は、転送可能なパターンを学習することによって、目に見えないグラフに対するゼロショット推論を可能にすることを約束している。
本稿では, 変換可能なテキストセマンティクスと構造を結合したデュアルモジュールKGFMであるSEMMAを紹介する。
より困難な一般化設定では、テスト時間関係ボキャブラリは完全に見えず、構造的手法は崩壊し、SEMMAは2倍効率がよい。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:31:17 GMT)
MTS-DMAE: Dual-Masked Autoencoder for Unsupervised Multivariate Time Series Representation Learning [39.6] 教師なしMTS表現学習のためのDMAE(Dual-Masked Autoencoder)を提案する。
DMAEは,(1)可視属性に基づくマスク値の再構成,(2)教師エンコーダによるマスク特徴の潜在表現の推定という2つの補完的前提条件を定式化している。
これらの目的を協調的に最適化することで、DMAEは時間的に一貫性があり、意味的にリッチな表現を学ぶ。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:25:43 GMT)
Unsupervised Outlier Detection in Audit Analytics: A Case Study Using USA Spending Data [39.4] 我々は、連邦支出パターンの異常を識別するために、複数の外れ値検出アルゴリズムを採用し、比較する。
その結果,複数の検出戦略を組み合わせるハイブリッドアプローチにより,外乱検出の堅牢性と精度が向上することがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:27:18 GMT)
Stress Testing Deliberative Alignment for Anti-Scheming Training [39.2] 高い能力を持つAIシステムは、私たちが"スケジュール"と呼ぶ、ミスマッチした目標を秘密裏に追求できる
スキーマの測定と緩和には、MLで一般的に使用される方法とは異なる戦略が必要である。
ルールを秘密裏に破ったり、テストで意図的に過小評価したりするなど、幅広いカテゴリの"カバレッジアクション"を、スケジューリングのプロキシとして使用しています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:49:56 GMT)
AdaSports-Traj: Role- and Domain-Aware Adaptation for Multi-Agent Trajectory Modeling in Sports [36.7] 多エージェントスポーツシナリオにおける軌道予測は、エージェントの役割間の構造的不均一性のために本質的に困難である。
AdaSports-Trajは,スポーツにおけるドメイン内およびドメイン間分布の相違を明示的に扱う適応軌道モデリングフレームワークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:38:27 GMT)
GUI-ARP: Enhancing Grounding with Adaptive Region Perception for GUI Agents [36.1] 適応型多段階推論を実現する新しいフレームワークを提案する。
Gui-ARPはタスク関連領域のトリミングに視覚的注意を生かす。
単純なケースを単一ステージで推論し、より複雑なシナリオを多段階で解析する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:34:50 GMT)
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents [35.9] A/Bテストは、ヒトの大規模でライブなトラフィックに依存しているため、依然として制限されている。
本稿では,ユーザインタラクション行動と実際のWebページを自動的にシミュレートする新しいシステムであるAgentA/Bを提案する。
以上の結果から, エージェントA/Bは人間の行動パターンをエミュレートできる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:56:58 GMT)
Ideal Registration? Segmentation is All You Need [35.8] SegRegは、領域固有の変形パターンを利用して、解剖学的適応的な正規化を実装している。
SegRegは3つの臨床登録シナリオで既存の手法を2-12%上回っている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:16:34 GMT)
Overhearing LLM Agents: A Survey, Taxonomy, and Roadmap [34.9] 我々は、LLMエージェントと相互作用する代替パラダイムについて研究し、これを"overhearing agent"と呼ぶ。
ユーザの注意を喚起する代わりに、過剰に耳を傾けるエージェントは、環境活動を監視し、コンテキスト支援を提供する場合にのみ介入する。
この分類に基づいて、過剰に耳を傾けるエージェントシステムを構築する研究者や開発者にとってのベストプラクティスのリストを作成します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:11:04 GMT)
BaseReward: A Strong Baseline for Multimodal Reward Model [34.8] マルチモーダル報酬モデリングのための強力で効率的なベースラインである textbfBaseReward を導入する。
この結果から,BaseRewardはMM-RLHF-Reward Bench,VL-Reward Bench,Multimodal Reward Benchなどの主要なベンチマーク上で新たなSOTAを確立していることがわかった。
静的ベンチマーク以外の実用性を検証するために,BaseRewardを実世界の強化学習パイプラインに統合する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:25:26 GMT)
"It Felt Like I Was Left in the Dark": Exploring Information Needs and Design Opportunities for Family Caregivers of Older Adult Patients in Critical Care Settings [34.7] 高齢の成人患者は、ICU(Intensive Care Unit)患者の急速に成長するサブグループを構成する。
本研究の目的は,ICU高齢者の介護者の情報ニーズを明らかにすることである。
本稿では,介護者の課題に対処するAIシステムのプロトタイプを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:42:14 GMT)
MoE-CE: Enhancing Generalization for Deep Learning based Channel Estimation via a Mixture-of-Experts Framework [34.6] MoE-CEは、DLベースのCEメソッドの一般化能力を高めるために設計されたフレキシブル・オブ・エキスパート・フレームワークである。
我々は,MoE-CEが従来のDLアプローチより一貫して優れており,効率を保ちながら大きな性能向上を実現していることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:23:08 GMT)
Proactive Statistical Process Control Using AI: A Time Series Forecasting Approach for Semiconductor Manufacturing [33.2] 統計的プロセス制御(SPC)を用いたよりスマートな方法を提案する。
問題が発生したら単に問題に反応するのではなく、システムが問題が発生する前に将来の問題を予測できるのです。
これは予期せぬ失敗を減らし、生産プロセス全体の安定性と信頼性を向上させるのに役立ちます。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:15:31 GMT)
See&Trek: Training-Free Spatial Prompting for Multimodal Large Language Model [33.2] SEE&TREKは、視覚のみの制約下でのマルチモーダル大言語モデル(MLLM)の空間的理解を強化する最初のトレーニングフリープロンプトフレームワークである。
視覚的多様性の向上と運動再建に注力する。
本手法はトレーニング・GPUフリーであり,1回のフォワードパスしか必要とせず,既存のMLLMSにシームレスに統合できる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:30:26 GMT)
Whisper-UT: A Unified Translation Framework for Speech and Text [33.1] Whisper-UTは軽量アダプタを活用し、タスク間のシームレスな適応を可能にする統合フレームワークである。
我々はWhisperモデルを用いた手法を実証するが、原理的には一般であり、類似のマルチタスクモデルに適用できる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:36:04 GMT)
Latent Zoning Network: A Unified Principle for Generative Modeling, Representation Learning, and Classification [32.9] ジェネレーティブモデリング、表現学習、分類は機械学習(ML)における3つの中核的な問題である
この目標に向けたステップとして、LZN(Latent Zoning Network)を紹介します。
それぞれのデータ型(画像、テキスト、ラベルなど)は、サンプルを非結合のラテントゾーンにマッピングするエンコーダと、ラテントをデータにマッピングするデコーダを備えている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:47:16 GMT)
Neural Atlas Graphs for Dynamic Scene Decomposition and Editing [32.6] 本稿では,各グラフノードがビュー依存型ニューラルアトラスであるハイブリッド高解像度シーン表現を提案する。
NAGはOpenデータセット上で最先端の定量的結果を達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:24:41 GMT)
Cache-of-Thought: Master-Apprentice Framework for Cost-Effective Vision Language Model Reasoning [32.6] Cache of Thought (CoT)は、大小ビジョン言語モデル(VLM)間の協調推論のためのフレームワークである
CoTはキャッシュ内の大きなVLMから高品質なクエリ結果を管理し、新しいマルチモーダル検索とコンテキスト内学習によって選択する。
我々は,CoTが全体の推論性能を同じ予算で7.7%向上させ,特に見習いのVLMの性能を36.6%向上させることを示した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:18:26 GMT)
Sequential analysis in a continuous spin-noise quantum sensor [32.5] 我々はスピンノイズに基づく量子センサにシーケンシャルなデータ解析手法を実装した。
オンラインプロトコルにより、計測データを適応的に収集することで弱い磁場を検出することができる。
その結果、シーケンシャルな手法によりより高速で感度の高い検出が可能となり、量子センシングの強力なツールとなった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:39:28 GMT)
Generalizability of Large Language Model-Based Agents: A Comprehensive Survey [32.4] LLM(Large Language Model)ベースのエージェントは、Webナビゲーションや家庭用ロボティクスなど、さまざまな領域に展開されている。
関心が高まっているにもかかわらず、LLMベースのエージェントにおける一般化可能性の概念は未定義のままである。
本調査は,多種多様なアプリケーションにまたがって,信頼性の高い汎用化を図ったLCMエージェントの構築に関する原則研究の基盤を確立することを目的としている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:13:32 GMT)
Exploring confinement transitions in $\mathbb{Z}_2$ lattice gauge theories with dipolar atoms beyond one dimension [32.2] 粒子を束縛状態に閉じ込める現象は、高エネルギーから凝縮物質物理学にまたがる現象である。
最先端の量子シミュレータは、この問題に対処するための有望なプラットフォームを構成する。
物質場に結合した$mathbbZ$ LGTs鎖の閉じ込めについて検討し、混合次元(mixD) XXZモデルに写像できる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:58:55 GMT)
Covert Communication and Key Generation Over Quantum State-Dependent Channels [32.2] 量子状態依存チャネルに対する正のレートで秘密通信と秘密鍵生成について検討する。
本研究は,秘密鍵生成における正の確率を達成する最初の事例であり,量子チャネル上で正の被覆率を達成する最初の事例である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:47:55 GMT)
GP3: A 3D Geometry-Aware Policy with Multi-View Images for Robotic Manipulation [32.1] GP3は3D幾何学を意識したロボット操作のポリシーである。
空間エンコーダを用いて、RGB観測から密集した空間特徴を推測する。
シミュレーションベンチマークにおける最先端の手法を一貫して上回る。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:04:50 GMT)
On the Convergence of Muon and Beyond [31.9] a- により、Muon-VR2 が $tmathcalO(-)$ の最適レートを達成できるという最初の証明を与える。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:43:37 GMT)
MNV-17: A High-Quality Performative Mandarin Dataset for Nonverbal Vocalization Recognition in Speech [31.4] 我々は、7.55時間のマンダリン音声データセットであるMNV-17を紹介する。
モデルベース検出に依存する既存のコーパスとは異なり、MNV-17の性能特性は高忠実で明瞭なNVインスタンスを保証する。
4つの主要なASRアーキテクチャでMNV-17をベンチマークし、意味転写とNV分類の併用性能を評価した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:40:36 GMT)
Interpreting Learned Feedback Patterns in Large Language Models [31.1] 我々は、微調整言語モデルのアクティベーションにおいて暗黙的にフィードバック信号を推定するプローブを訓練する。
これらの推定値を真のフィードバックと比較し、LFPの精度を微調整フィードバックと比較する。
我々は、GPT-4が記述し、LFPに関連するものとして分類する特徴に対して、正のフィードバック入力と相関する神経特徴を比較して、プローブを検証する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:01:07 GMT)
KITE: Kernelized and Information Theoretic Exemplars for In-Context Learning [30.5] In-context Learning (ICL) は、大規模言語モデルを新しいデータに適応するための強力なパラダイムとして登場した。
本稿では,ICLにおけるサンプル選択の問題について,情報理論の原則的視点から検討する。
我々は,近似保証付きグリーディアルゴリズムを有効活用する,約部分モジュラーの原理的サロゲート目的を導出する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:50:03 GMT)
Emergent Abilities of Large Language Models under Continued Pretraining for Language Adaptation [30.4] 我々は、英語を含むと、検証の難易度には影響しないが、ターゲット言語における下流能力の出現には重要であることを示した。
本稿では,英語の必要性を緩和するための効果的な代替手段として,カリキュラム学習と指数移動平均(EMA)を導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:27:30 GMT)
PolyJuice Makes It Real: Black-Box, Universal Red Teaming for Synthetic Image Detectors [30.2] PolyJuiceは、SIDのための最初のブラックボックス、イメージに依存しないリピート方式である。
また, ポリジュースステアリングT2Iモデルでは, ステアリングされていないモデルよりも, SIDの消耗が有意に効果的であることを示した。
PolyJuice拡張データセット上でSIDモデルをチューニングすることは、検出器の性能を著しく向上させる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:09:32 GMT)
Purely Semantic Indexing for LLM-based Generative Recommendation and Retrieval [28.4] 非意味トークンを付加することなく、ユニークな意味保存IDを生成するために、純粋に意味インデックスを提案する。
我々は、厳密な最寄りのセントロイド選択を緩和し、2つのモデル非依存アルゴリズムを導入することにより、ユニークなID割り当てを可能にする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:59:55 GMT)
OpenWHO: A Document-Level Parallel Corpus for Health Translation in Low-Resource Languages [28.0] 我々は,世界保健機関のeラーニングプラットフォームから,2,978の文書と26,824の文からなる文書レベルの並列コーパスであるOpenWHOを紹介した。
従来の機械翻訳モデルに対して,現代大言語モデル (LLM) を評価する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:20:15 GMT)
RPG: A Repository Planning Graph for Unified and Scalable Codebase Generation [27.8] Repository Planning Graph(RPG)は、機能、ファイル構造、データフロー、関数を1つのグラフにエンコーディングすることで、提案レベルと実装レベルのプランニングを統一する表現である。
RPGは曖昧な自然言語を明示的な青写真に置き換え、長期計画とスケーラブルなリポジトリ生成を可能にする。
ZeroRepoは、スクラッチからリポジトリを生成するグラフ駆動のフレームワークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:58:14 GMT)
A Generative AI System for Biomedical Data Discovery with Grammar-Based Visualizations [27.6] 我々は,生成AIと文法に基づくビジュアライゼーションを組み合わせたバイオメディカルデータ発見の可能性を探る。
プロトタイプでは、マルチエージェントシステムを用いて可視化仕様を作成し、フィルタを適用します。
これらの視覚化はリンクされ、インタラクティブなダッシュボードが徐々に構築される。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:20:24 GMT)
MUG-Eval: A Proxy Evaluation Framework for Multilingual Generation Capabilities in Any Language [26.9] 本稿では,大規模言語モデルの多言語生成能力を評価する新しいフレームワークMUG-Evalを提案する。
既存のベンチマークを会話タスクに変換し、それらのタスクに対するLCMの精度を測定します。
高、中、低リソースのカテゴリにまたがる30言語にわたる8つのLLMを評価し、MUG-Evalが確立されたベンチマークと強く相関していることを見出した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:26:02 GMT)
Think or Not Think: A Study of Explicit Thinking in Rule-Based Visual Reinforcement Fine-Tuning [26.8] まず,MLLM画像分類のためのCRS-RLを提案する。
RFTにおける明示的な思考が常に必要かどうかを再考し、疑問を呈する。
No-Thinking-RL は単純な等式精度の報酬を導入することで、考えることなく RFT を探索する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:56:41 GMT)
MCOD: The First Challenging Benchmark for Multispectral Camouflaged Object Detection [26.8] Camouflaged Object Detection (COD)は、自然界にシームレスに溶け込む物体を識別することを目的としている。
既存のCODベンチマークデータセットはRGBベースであり、マルチスペクトルアプローチに不可欠なサポートがない。
マルチスペクトルカモフラージュオブジェクト検出のために特別に設計された、最初の挑戦的なベンチマークデータセットであるMCODを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:29:33 GMT)
WangchanThaiInstruct: An instruction-following Dataset for Culture-Aware, Multitask, and Multi-domain Evaluation in Thai [26.7] WangchanThaiInstructは、人手による評価と指導のためのタイ語データセットである。
WangchanThaiInstructは,(1)文化的・専門的なタスクにおけるパフォーマンスのギャップを示すゼロショット評価,(2)ネイティブ・インスペクティブの効果を孤立させた指導指導研究の2つの研究を支援する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:08:52 GMT)
Enhancing WSI-Based Survival Analysis with Report-Auxiliary Self-Distillation [26.6] 本稿では,WSI を用いた生存分析のための新規な自己蒸留(Rasa)フレームワークを提案する。
LLM(Advanced Large Language Model)は、病理報告から細粒度のWSI関連テキスト記述を抽出するために用いられる。
次に、自己蒸留ベースのパイプラインは、学生モデルに無関係または冗長なWSI機能をフィルタリングするように設計されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:14:19 GMT)
LiteLong: Resource-Efficient Long-Context Data Synthesis for LLMs [26.6] 高品質の長文データは、大規模言語モデルのトレーニングに不可欠である。
長文データを合成する資源効率の高いLiteLongを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:07:46 GMT)
AToken: A Unified Tokenizer for Vision [26.6] 本稿では,高忠実度再構築と意味理解を両立する最初の統合視覚トークン化ツールであるATokenを紹介する。
プログレッシブトレーニングカリキュラムを採用することで、ATokenは、シングルイメージ、ビデオ、3Dから徐々に拡張され、連続トークンと離散トークンの両方をサポートする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:15:52 GMT)
A Vision-Language-Action-Critic Model for Robotic Real-World Reinforcement Learning [26.5] 本稿では、InternVL上に構築された一般的なプロセス報酬モデルであるVLACを紹介する。
密度の高い進行デルタと完了信号を出力し、タスク固有の報酬工学を除去する。
VLACは、知覚、ダイアログ、推論能力を強化するために、視覚言語データセットに基づいて訓練されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:44:29 GMT)
Model-free algorithms for fast node clustering in SBM type graphs and application to social role inference in animals [26.4] ブロックモデル(SBM)から生成されたグラフにおけるノードクラスタリングとパラメータ推論のための新しいモデルフリーアルゴリズム群を提案する。
我々は,提案手法を最先端技術に対してベンチマークし,推定誤差の低い計算時間を著しく高速化した。
行動生態学からの経験的ネットワークデータに適用することで,アルゴリズムの実用的妥当性を検証した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:57:17 GMT)
Evaluating Robustness of LLMs in Question Answering on Multilingual Noisy OCR Data [26.3] 我々は,OCRによる雑音が多言語QAシステムの性能に与える影響を包括的に分析する。
この分析を支援するために,多言語QAデータセットであるMultiOCR-QAを導入する。
データセットは、OCRの異なるレベルと種類のOCRノイズを含む、OCRが編集した歴史文書からキュレートされる。
次に、3つの主要なOCRエラータイプに着目し、異なるエラー条件下で、異なる最先端の大規模言語モデル(LLM)がどのように機能するかを評価する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:13:18 GMT)
A High-performance Real-time Container File Monitoring Approach Based on Virtual Machine Introspection [26.3] 仮想マシンのイントロスペクションに基づく高性能なコンテナファイル監視手法を提案する。
実験の結果,提案手法はコンテナファイルを効果的に監視し,許容範囲の監視オーバーロードを導入することができることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:34:52 GMT)
Fully Decentralized Cooperative Multi-Agent Reinforcement Learning is A Context Modeling Problem [26.3] 本稿では,各エージェントが各状態,その局所行動,共有報酬のみを観察する,完全分散型協調型マルチエージェント強化学習について検討する。
他のエージェントのアクションにアクセスすることができないことは、値関数の更新や値関数の推定時の相対的な過一般化において非定常性をもたらすことが多い。
本研究では,各エージェントが局所的に認識するタスクをコンテキストマルコフ決定プロセスとして定式化する,DEC(Dynamics-Aware Context)という新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:52:44 GMT)
REG4Rec: Reasoning-Enhanced Generative Model for Large-Scale Recommendation Systems [25.6] シーケンシャルレコメンデーションは,大規模レコメンデーションシステムにおけるユーザの次の行動を予測することを目的としている。
近年の研究では、ジェネレーティブレコメンデーションに推論プロセスを導入し、レコメンデーションパフォーマンスを大幅に改善している。
これらのアプローチは項目意味表現の特異性によって制約される。
本稿では,複数の動的意味論的推論経路を構成する推論強化生成モデルREG4Recを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:26:21 GMT)
DP-GTR: Differentially Private Prompt Protection via Group Text Rewriting [25.5] 既存の手法は主に文書レベルの書き換えに重点を置いており、リッチで多言語的なテキスト表現を無視している。
DP-GTRは、局所微分プライバシー(DP)とグループテキスト書き換えによる合成定理を利用する新しい3段階フレームワークである。
われわれのフレームワークは既存の書き換え技術と互換性があり、プライバシー保護を強化するためのプラグインとして機能している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:53:46 GMT)
LC-SLab -- An Object-based Deep Learning Framework for Large-scale Land Cover Classification from Satellite Imagery and Sparse In-situ Labels [25.4] 本研究では,大規模土地被覆分類のためのオブジェクトベース深層学習手法をスパース監督下で探索するLC-SLabを提案する。
LC-SLabは、グラフニューラルネットワークによる入力レベルアグリゲーションと、後処理の結果による出力レベルアグリゲーションの両方をサポートする。
その結果、オブジェクトベースの手法は、よりコヒーレントなマップを生成しながら、一般的なピクセル単位のモデルの精度を一致または超えることができることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:08:24 GMT)
Query Optimization for Parametric Knowledge Refinement in Retrieval-Augmented Large Language Models [25.4] ERRRフレームワークは、検索-拡張生成(RAG)システムにおける事前検索情報ギャップを橋渡しするように設計されている。
RAGで使用される従来のクエリ最適化手法とは異なり、ERRRフレームワークはLarge Language Models (LLM) から知識を抽出することから始まる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:38:31 GMT)
Language-Instructed Reasoning for Group Activity Detection via Multimodal Large Language Model [25.3] グループアクティビティ検出(GAD)は、グループメンバーを同時に識別し、ビデオシーケンス内で集団アクティビティを分類することを目的としている。
MLLM(Multimodal Large Language Model)によるGADのための言語指示推論の新しいフレームワークであるLIR-GADを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:05:45 GMT)
Towards Robust Visual Continual Learning with Multi-Prototype Supervision [25.0] MuproCLは、単一のターゲットを複数のコンテキスト対応プロトタイプに置き換える新しいフレームワークである。
LogSumExpアグリゲーションメカニズムにより、視覚モデルは与えられた画像の最も関連性の高いプロトタイプと適応的に整合することができる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:24:48 GMT)
Tag&Tab: Pretraining Data Detection in Large Language Models Using Keyword-Based Membership Inference Attack [25.0] 大規模言語モデルの事前学習に使用されるデータを検出する新しい手法であるTag&Tabを提案する。
4つのベンチマークデータセットに対する実験は、最先端の手法よりも平均5.3%から17.6%のAUCスコアが増加したことを示している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:01:37 GMT)
Can LLMs Judge Debates? Evaluating Non-Linear Reasoning via Argumentation Theory Semantics [24.2] 我々はCAT(Computational Argumentation Theory)からLarge Language Models (LLMs) を推定できるかどうかを評価する。
我々はQuADセマンティクスを用いて、攻撃とサポートの関係に基づいて、アクセプティビリティスコアを引数に割り当てる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:10:32 GMT)
FingerSplat: Contactless Fingerprint 3D Reconstruction and Generation based on 3D Gaussian Splatting [24.0] 我々は3Dガウススプラッティングを統合した新しい非接触型指紋3Dレジストレーション・再構築・生成フレームワークを提案する。
3D指紋登録、再構築、生成の実験により、2D画像から3D指紋を正確に調整、再構成できることが証明された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:18:08 GMT)
pFedSAM: Personalized Federated Learning of Segment Anything Model for Medical Image Segmentation [23.9] 医用画像セグメンテーションにおける異種データシナリオに適した,最初のパーソナライズされたSAMフレームワークを提案する。
本フレームワークは,(1)ドメイン特化機能を維持するために設計したL-MoEコンポーネントを維持しつつ,グローバルパラメータのみを集約するパーソナライズされた戦略,(2)知識蒸留による教師-学生パラダイムを活用した,グローバル共有モデルとパーソナライズされたローカルモデルのギャップを埋める分離されたグローバルローカル微調整機構,の2つの重要なイノベーションを統合する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:05:35 GMT)
BBScoreV2: Learning Time-Evolution and Latent Alignment from Stochastic Representation [23.8] 自動回帰生成モデルは、特に長いテキストシーケンスのモデリングと評価において、様々な言語タスクにおいて重要な役割を果たす。
本研究では、変換器をベースとしたモデル埋め込みをプロセスに組み込むことで、元来の順序のないモデル出力から順序付けられた潜在表現が得られることを観察する。
BBVScore2は,BBV2の有効性に対する直感的かつ定量的な支援を提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:35:15 GMT)
Structured Information for Improving Spatial Relationships in Text-to-Image Generation [23.6] この作業では、自動変換とT2Iパイプラインへのシームレスな統合のために、微調整された言語モデルを使用して、構造化情報でプロンプトを強化する軽量なアプローチを導入している。
Inception Scoreで測定された画像品質を損なうことなく空間精度を大幅に向上させる実験結果が得られた。
この構造化情報は、T2I生成における空間的関係を高めるための実用的でポータブルなソリューションを提供し、現在の生成システムの鍵となる限界に対処する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:20:34 GMT)
Vision-Language Models as Differentiable Semantic and Spatial Rewards for Text-to-3D Generation [23.4] 本稿では,新しいテキストから3D生成フレームワークであるVLM3Dを提案する。
これは、大きな視覚言語モデルをScore Distillation Samplingパイプラインに統合し、差別化可能なセマンティクスと空間的プリエントとして利用する。
VLM3Dは, 意味的忠実度, 幾何学的コヒーレンス, 空間的正当性において, 従来のSDS法よりも優れていた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:54:52 GMT)
RephQA: Evaluating Readability of Large Language Models in Public Health Question Answering [22.2] LLM(Large Language Models)は、複雑な医療問題に対処することを約束する。
効果的な医療薬の開発における重要なボトルネックは、LCM生成応答の可読性にある。
公衆衛生質問応答(QA)におけるLCMの可読性を評価するためのベンチマークであるRephQAを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:09:42 GMT)
The Iconicity of the Generated Image [22.2] 人間がどのようにイメージを解釈し、生成するかは、私たちが露出した画像の影響を受けます。
ビジュアル生成AIモデルは、多くのトレーニングイメージに公開され、これに基づいて新しいイメージを生成することを学ぶ。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:59:43 GMT)
DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction [21.8] マルチセンサー融合は3次元意味的占有予測の精度と堅牢性を著しく向上させる。
現在のアプローチは、最高のパフォーマンスを達成するために高解像度の画像と複雑なネットワークに依存している。
我々は,新しいマルチモーダル占有予測フレームワークの提案を行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:53:33 GMT)
Spectral Logit Sculpting: Adaptive Low-Rank Logit Transformation for Controlled Text Generation [21.8] エントロピーに基づく推論手法は,Large Language Models (LLMs) の信頼性向上のために注目を集めている。
本稿では,近年のロジットのスペクトル特性とエントロピー特性を用いて,トークン分布を動的に変調する軽量な推論時間最適化手法であるSLSを提案する。
SLSは既存のベースライン法を一貫して上回り、数学的、コーディング、科学的推論のタスクにおいて優れた精度を達成している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:17:46 GMT)
Brevity is the Soul of Wit: Condensing Code Changes to Improve Commit Message Generation [21.6] 生成前にコード変更を凝縮する方法を提案する。
最初に、ChangeScribeというツールの助けを借りて提案したテンプレートを使って、コードの変更をコンデンスします。
我々の手法はBLEU-Norm, METEOR, ROUGE-Lの6つのベースラインより優れている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:04:28 GMT)
Robust LLM Training Infrastructure at ByteDance [21.5] ByteRobustは、大規模言語モデルの堅牢で安定したトレーニングに適した、大規模なGPUインフラストラクチャ管理システムである。
LLMトレーニングプロセスの独自性を活用し、定期的に障害を検出して回復するための最優先事項を提供します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:08:33 GMT)
GRE Suite: Geo-localization Inference via Fine-Tuned Vision-Language Models and Enhanced Reasoning Chains [21.5] Geo Reason Enhancement (GRE) Suiteは、解釈可能な位置推論のための構造化推論チェーンを備えたビジュアル言語モデルを拡張する新しいフレームワークである。
まず、GRE30Kという、きめ細かい視覚的・文脈的分析を容易にするために設計された高品質なジオローカライゼーション推論データセットを紹介する。
次に,シーン属性,局所的詳細,意味的特徴を段階的に推測する多段階推論手法を用いて,GREモデルを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:24:54 GMT)
Global Regulation and Excitation via Attention Tuning for Stereo Matching [21.4] 本稿では3つの注意モジュールを含むGREAT(Global Regulation and Excitation via Attention Tuning)フレームワークを提案する。
具体的には、空間的注意(SA)は空間的次元内のグローバルなコンテキストを捉え、マッチング注意(MA)はエピポーラ線に沿ってグローバルなコンテキストを抽出し、ボリューム注意(VA)はSAとMAと連携して、グローバルなコンテキストと幾何学的詳細に興奮したより堅牢なコストボリュームを構築する。
このフレームワークは、不適切な領域において優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:42:07 GMT)
MT-RewardTree: A Comprehensive Framework for Advancing LLM-Based Machine Translation via Reward Modeling [21.4] プロセス報酬モデル(PRM)は、大規模言語モデル(LLM)の複雑な推論タスクに成功している。
しかし, 機械翻訳(MT)への応用は, 体系的手法や評価ベンチマークが欠如しているため, 未検討のままである。
我々は,プロセス報酬モデルの構築,評価,デプロイを行う包括的なフレームワークであるtextbfMT-RewardTreeを紹介した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:49:13 GMT)
Stop Playing the Guessing Game! Target-free User Simulation for Evaluating Conversational Recommender Systems [21.3] PEPPERは、実際のユーザインタラクション履歴とレビューから構築された、ターゲットフリーなユーザシミュレータによる評価プロトコルである。
PEPPERは、単純な推測ゲームに陥ることなく、現実的なユーザ-CRS対話を可能にする。
PEPPERは、CRSの嗜好誘発能力を包括的に評価するための詳細な尺度を提示する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:26:22 GMT)
SuPreME: A Supervised Pre-training Framework for Multimodal ECG Representation Learning [21.2] 我々はtextbfSuPreME, $textbfSu$pervised $textbfPre$-training framework for $textbfE$CG representation learningを提案する。
固定ラベルの代わりにテキスト心臓問合せでECG信号を融合することにより、SuPreMEはさらなる微調整をすることなく、見えない状態のゼロショット分類を可能にする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:58:56 GMT)
Navigate Beyond Shortcuts: Debiased Learning through the Lens of Neural Collapse [21.2] 我々はニューラル・コラプスの調査を、不均衡な属性を持つバイアス付きデータセットに拡張する。
追加の訓練複雑性を伴わない回避ショートカット学習フレームワークを提案する。
本手法は,訓練中の収束性を向上し,最先端の一般化性能を実現する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:33:16 GMT)
Personalized Prediction By Learning Halfspace Reference Classes Under Well-Behaved Distribution [21.0] 本研究はパーソナライズド予測スキームを提案し,クエリ毎に容易に解釈可能な予測器を学習する。
この研究の目的は、ラベルに依存しない環境で「半空間」で表されるサブ人口の予測モデルのPAC学習可能性を研究することである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:51:35 GMT)
The Effect of Language Diversity When Fine-Tuning Large Language Models for Translation [20.5] 微調整中の言語多様性の拡大は、教師なしと -- 驚くほど -- 教師なしのペアの両方の翻訳品質を改善する。
言語多様性の増大が言語に依存しない表現を生み出すことを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:54:04 GMT)
Generalization and Optimization of SGD with Lookahead [20.4] Lookaheadは、デュアルウェイト更新メカニズムを利用することで、ディープラーニングモデルを強化する。
ほとんどの理論的研究は、その一般化能力があまり理解されていないまま、訓練データへの収束に焦点を当てている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:02:09 GMT)
MMAPG: A Training-Free Framework for Multimodal Multi-hop Question Answering via Adaptive Planning Graphs [20.0] マルチモーダルな質問応答は、画像やテキストなどの様々なソースからの情報を統合して答えを導き出す必要がある。
既存の方法は典型的にはシーケンシャルな検索と推論に依存し、各ステップは前の出力に基づいて構築される。
本稿では,計画,検索,推論モジュールからなる適応計画グラフによってガイドされる学習自由フレームワークを提案する。
提案手法は,タスク固有のトレーニングを犠牲にすることなく,マルチモーダル情報の特徴を保存し,最新のモデルとのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:41:50 GMT)
Natural Fingerprints of Large Language Models [19.9] 大規模な言語モデルがまったく同じデータセットでトレーニングされている場合でも、その出力は区別可能であることを示す。
我々は、これらの意図しない特徴を自然の指紋として言及する。
これらの結果は、トレーニングダイナミクスがデータやアーキテクチャに依存しないモデル動作を体系的に形成できることを示唆している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:48:32 GMT)
BTL-UI: Blink-Think-Link Reasoning Model for GUI Agent [19.8] リンクシンクリンク(Blink-Think-Link)は、人間のGUIインタラクションのための脳に触発されたフレームワークである。
リンクシンクリンク(Blink-Think-Link)は、ユーザとグラフィカルインターフェースの間の人間の認知過程を模倣する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:03:44 GMT)
Uncertainty Quantification of Large Language Models using Approximate Bayesian Computation [19.8] 本稿では,大言語モデル(LLM)を予測確率よりも後続分布を推定するシミュレータとして扱う,確率自由ベイズ推論に基づくアプローチである近似計算(ABC)を提案する。
ABCは46.9%まで精度を向上し、ブライアのスコアを74.4%削減し、予測誤差(ECE)と予測エントロピーによって測定されたキャリブレーションを向上させる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:22:29 GMT)
CIE: Controlling Language Model Text Generations Using Continuous Signals [19.6] 我々は、LMが「低」トークンと「高」トークンの埋め込みの間に補間される制御ベクトルを期待するように微調整できることを示す。
本手法は,制御信号を離散信号として表現する文脈内学習法や微調整法よりも応答長制御をより確実に行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:06:03 GMT)
Semantic Change Detection of Roads and Bridges: A Fine-grained Dataset and Multimodal Frequency-driven Detector [19.4] 主要な困難は、直線構造として道路や橋の連続性を維持することにある。
既存の空間領域モデルはこれらの問題に対処する。
本稿では,RB-SCD(Road and Bridge Semantic Change Detection)データセットを紹介する。
道路や橋梁のセマンティックチェンジ検出をシステマティックに対象とする最初のベンチマークとして、RB-SCDは11のセマンティックチェンジカテゴリに対して、包括的な詳細なアノテーションを提供する。
我々はMFDCD(Multimodal Frequency-Driven Change Detector)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:30:17 GMT)
LiteRSan: Lightweight Memory Safety Via Rust-specific Program Analysis and Selective Instrumentation [19.4] Rustはメモリセーフな言語であり、強力な安全性保証が広く採用されている。
Rustのメモリ安全性バグを検出するための広く採用されているアプローチとして、Address Sanitizer(ASan)がある。
本稿では、従来のアプローチの限界に対処する新しいメモリセーフティサニタイザであるLiteRSanを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:09:20 GMT)
Noise-Robustness Through Noise: Asymmetric LoRA Adaption with Poisoning Expert [19.2] ダウンストリームタスクに事前訓練された言語モデルを適用するための現在の微調整手法は、ノイズの多いデータからの干渉に影響を受けやすい。
非対称なロラ中毒専門家(LoPE)によるノイズロバスト適応手法を提案する。
LoPEは、低コストのノイズ注入によって、パフォーマンスとロバスト性を純粋に達成し、データクリーニングの必要性を完全に排除する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:59:02 GMT)
ThermalGuardian: Temperature-Aware Testing of Automotive Deep Learning Frameworks [19.2] 本研究では,温度変化環境下での初めての自動車深層学習フレームワークテスト手法であるHeatherGuardianを提案する。
具体的には、温度感受性演算子をターゲットにしたモデル変異ルールを使用してテスト入力モデルを生成し、Newtonの冷却則に基づいてGPU温度変動をシミュレートし、リアルタイムGPU温度に基づいてGPU周波数を制御する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:42:19 GMT)
UniTac2Pose: A Unified Approach Learned in Simulation for Category-level Visuotactile In-hand Pose Estimation [19.0] 本稿では,手動ポーズ推定のための新しい3段階フレームワークを提案する。
最初の段階では、サンプリングとプレランクのポーズ候補、続いてこれらの候補を反復的に洗練する。
最終段階では、最も可能性の高いポーズ候補を特定するためにポストランクが適用される。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:39:31 GMT)
Empathy-R1: A Chain-of-Empathy and Reinforcement Learning Framework for Long-Form Mental Health Support [18.0] 強化学習(Reinforcement Learning, RL)とCoE(Chain-of-Empathy)推論プロセスを統合する新しいフレームワークであるEmpathy-R1を紹介する。
認知行動療法にインスパイアされた私たちのCoEパラダイムは、ヘルプ・シーカーの感情、原因、意図を逐次推論するためにモデルをガイドします。
我々のフレームワークは、新しい大規模な中国のデータセット、共感-QA、および2段階のトレーニングプロセスによって強化されています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:24:59 GMT)
SGMAGNet: A Baseline Model for 3D Cloud Phase Structure Reconstruction on a New Passive Active Satellite Benchmark [17.3] 本稿では,衛星観測を詳細な3次元雲相構造に変換するためのベンチマークデータセットを提案する。
我々はSGMAGNetをメインモデルとして採用し、いくつかのベースラインアーキテクチャと比較する。
その結果,SGMAGNetは雲相再構成において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:29:23 GMT)
How to inject knowledge efficiently? Knowledge Infusion Scaling Law for Pre-training Large Language Models [17.1] 大きな言語モデル(LLM)は、様々な下流タスクにまたがる印象的な汎用性のために、大きな注目を集めている。
近年の研究では、事前訓練中にドメイン知識を戦略的に活用することで、下流のパフォーマンスが大幅に向上することが示されている。
本研究では,LLMに注入するドメイン知識の最適な量を予測するための知識注入スケーリング法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:46:10 GMT)
Exploring Polyglot Harmony: On Multilingual Data Allocation for Large Language Models Pretraining [16.6] 本稿では,多言語データアロケーションを体系的に最適化する新しいフレームワークであるClimbを紹介する。
Climbの中核となるのは、言語間の相互作用を意識した言語比率を導入し、言語間の依存関係をキャプチャすることで、各言語の効果的なアロケーションを明示的に定量化している。
大規模な実験により、Climbは様々な多言語間相互作用を正確に測定できることを確認した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:34:34 GMT)
Exploring Scaling Laws of CTR Model for Online Performance Improvement [16.6] CTRモデルは、多くのオンラインパーソナライズされたサービスにおいて、ユーザーエクスペリエンスを改善し、ビジネス収益を高める上で重要な役割を果たす。
まず、モデルグレードとデータサイズにスケーラブルなCTRモデルを構築し、そのモデルに入力された知識をオンラインユーザに提供する軽量モデルに蒸留する。
実験結果から,SUANは優れた性能を示し,モデルグレードとデータサイズにおいて3桁のスケール法則を定めていることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:21:42 GMT)
Highly Efficient Direct Analytics on Semantic-aware Time Series Data Compression [16.4] 本稿では,SHRINK圧縮アルゴリズムにより圧縮された時系列データを直接解析する手法を提案する。
このアプローチは、さまざまなIoTアプリケーションに対して、信頼性が高く、高速な外れ値検出分析を提供します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:25:46 GMT)
CBPNet: A Continual Backpropagation Prompt Network for Alleviating Plasticity Loss on Edge Devices [16.3] 塑性の低下は、トレーニング過程において未利用パラメータの更新活力の欠如に起因していると論じる。
本稿では,モデルの学習活力を回復するための有効かつパラメータ効率の高いフレームワークである連続バックプロパゲーション・プロンプト・ネットワーク(CBPNet)を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:16:54 GMT)
LLM Agents at the Roundtable: A Multi-Perspective and Dialectical Reasoning Framework for Essay Scoring [16.2] Roundtable Essay Scoring (RES) は、ゼロショット設定で正確でヒューマンアライメントのスコアリングを行うために設計されたマルチエージェント評価フレームワークである。
RESは弁証的推論プロセスを通じて個々の評価を集約し、最終的な総合的なスコアを生成する。
ChatGPTとClaudeを用いたASAPデータセットの実験では、RESは素早いプロンプトよりも平均QWKを34.86%改善した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:11:00 GMT)
Neural Networks for Learnable and Scalable Influence Estimation of Instruction Fine-Tuning Data [16.1] 影響関数はモデルトレーニングに重要な洞察を与える。
既存の手法は計算コストが大きく、一般化が限られている。
本稿では、ニューラルネットワークを用いて影響値を推定し、最大99%のコスト削減を実現する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:55:25 GMT)
FRAUDGUESS: Spotting and Explaining New Types of Fraud in Million-Scale Financial Data [16.1] 我々はFRAUDGUESSを提案し、新しい種類の詐欺を見つけ出し、我々の意見を支持する専門家に証拠を提供する。
FRAUDGUESSは実生活で使われ、匿名の金融機関に配備されると考えられている。
我々は、FRAUDGUESSが実際に100万の財務データセットで発見した3つの新しい行動を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 00:15:31 GMT)
Learning to Optimize Capacity Planning in Semiconductor Manufacturing [16.0] 半導体製造において、キャパシティプランニング(キャパシティプランニング)は、需要に応じて生産資源を割り当てるプロセスである。
本稿では、深層強化学習を用いて訓練された、個々のマシンレベルでのキャパシティプランニングのためのニューラルネットワークベースのモデルを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:51:10 GMT)
Secure Confidential Business Information When Sharing Machine Learning Models [15.3] CPI(Confidential Property Inference)攻撃は、共有機械学習(ML)モデルを利用して、モデルプロバイダのプライベートモデルトレーニングデータの機密性を明らかにする。
既存の防御は、CPI攻撃がターゲットとする特定のMLモデルに適応しないと仮定することが多い。
本稿では,現実の敵の応答性を明示的に考慮した,新たな防御手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:49:49 GMT)
Are Vision-Language Models Safe in the Wild? A Meme-Based Benchmark Study [15.3] MemeSafetyBenchは、有害な命令と良質な命令の両方で、実際のミームイメージをペアリングするベンチマークである。
実世界のミームが有害なアウトプットに与える影響,会話コンテキストの緩和効果,モデル尺度と安全性指標の関係について検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:54:09 GMT)
RGB-Only Supervised Camera Parameter Optimization in Dynamic Scenes [15.2] 本稿では,ROS-Camと呼ばれる単一のRGBビデオでのみ監視されるダイナミックシーンにおけるカメラパラメータ最適化手法を提案する。
本手法では, カメラパラメータをより効率的に正確に推定し, 単一のRGBビデオのみを監督する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:25:06 GMT)
Capturing Polysemanticity with PRISM: A Multi-Concept Feature Description Framework [15.2] PRISM(Polysemantic FeatuRe Identification and Scoring Method)は,大規模言語モデル(LLM)の機能の複雑さを捉えるために設計された,新しいフレームワークである。
NLPにおける多くの自動解釈可能性法に共通するニューロンに1つの記述を割り当てるアプローチとは異なり、PRISMは単意味的および多意味的両方の振る舞いを考慮に入れたよりニュアンスな記述を生成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:06:48 GMT)
On the Security of Tool-Invocation Prompts for LLM-Based Agentic Systems: An Empirical Risk Assessment [15.2] LLMベースのエージェントシステムは、大きな言語モデルを利用して、ユーザクエリの処理、決定、複雑なタスクのための外部ツールの実行を行う。
これらのシステムにおいて重要なコンポーネントはツール起動プロンプト(TIP)であり、ツールインタラクションプロトコルを定義し、ツール使用のセキュリティと正しさを保証するためにLLMをガイドする。
本研究では、TIP関連のセキュリティリスクを調査し、主要なLCMベースのシステムがリモートコード実行(RCE)やDoS(DoS)といった攻撃に対して脆弱であることを明らかにする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:17:58 GMT)
LLMs in the SOC: An Empirical Study of Human-AI Collaboration in Security Operations Centres [15.2] 大規模言語モデルのセキュリティオペレーションセンター(SOC)への統合は、アナリストの作業量を削減するための変革的かつまだ進化している機会を提供する。
本稿では,SOCアナリスト45名を対象に,10ヶ月で3,090件の質問に対して縦断調査を行った。
分析の結果,LLMを高精細度判定ではなく,センスメイキングやコンテキストビルディングのオンデマンド支援として活用していることが判明した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:37:16 GMT)
MEC-Quant: Maximum Entropy Coding for Extremely Low Bit Quantization-Aware Training [15.1] QAT(Quantization-Aware Training)は、効率的なニューラルネットワークを生み出すために多くの注目を集めている。
量子化は必然的に学習表現にバイアスをもたらす、と我々は主張する。
本稿ではエントロピー符号化量子化(MEC-Quant)を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:37:02 GMT)
Multi-Physics: A Comprehensive Benchmark for Multimodal LLMs Reasoning on Chinese Multi-Subject Physics Problems [15.0] 我々は,5つの難易度を含む総合的なベンチマークである,中国の物理推論のためのマルチ物理について紹介する。
我々は20種類のMLLMの評価に2つの評価フレームワークを使用し、最終回答精度とステップ・バイ・ステップの整合性の両方を分析した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:18:48 GMT)
The Psychology of Falsehood: A Human-Centric Survey of Misinformation Detection [14.8] 誤報はデジタル時代の最も重要な問題の1つだ。
個人が情報に対してどのように認識し、解釈し、感情的に反応するかを活用する。
これにより、事実性を超えて、より人間中心の検出フレームワークを採用する必要性が浮き彫りになる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:51:17 GMT)
What Matters in LLM-Based Feature Extractor for Recommender? A Systematic Analysis of Prompts, Models, and Adaptation [14.8] LLM-as-feature-extractorパイプラインを4つのモジュールに分解するモジュールフレームワークであるRecXploreを提案する。
新しいテクニックを提案する代わりに、RecXploreは確立したメソッドを再検討し、整理し、各モジュールを分離して体系的な探索を可能にする。
実験の結果、既存の技術から得られる最良の設計を組み合わせるだけで、NDCG@5が18.7%、HR@5が12.7%向上することがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:12:05 GMT)
CLEAR: A Clinically-Grounded Tabular Framework for Radiology Report Evaluation [14.6] 専門ラベルを用いた臨床評価フレームワークと放射線診断報告評価のための属性レベル比較(CLEAR)について紹介する。
CLEARは、報告書が医療状況の有無を正確に特定できるかどうかを調べる。
CLEARの臨床的アライメントを測定するため,MIMIC-CXRから得られた100個の胸部X線所見のデータセットであるCLEAR-Benchを開発した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:32:03 GMT)
SLM-Based Agentic AI with P-C-G: Optimized for Korean Tool Use [14.5] Planner-Caller-Generator (P-C-G) は韓国のツールに最適化されたSLMベースのエージェントアーキテクチャである。
P-C-Gは、プランニング、呼び出し、生成をロールごとに分離する: Plannerは、オンデマンドのリプランニングに制限のある初期バッチプランを生成する; Callerは、共同スキーマと値の検証の後、正規化された呼び出しオブジェクトを返す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:25:23 GMT)
CARD: A Cache-Assisted Parallel Speculative Decoding Framework via Query-and-Correct Paradigm for Accelerating LLM Inference [14.5] 本稿では,新しいクエリ・アンド・コレクト・パラダイムを用いたCARDという投機的復号化フレームワークを提案する。
提案手法は,提案手法を検証から切り離し,詳細な調整を伴わずに効果的にドラフトモデルの効率を向上する。
CARDは既存の最先端の手法よりも優れており、バニラ自己回帰復号よりも最大4.83倍の高速化を実現している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:20:14 GMT)
Information Geometry of Variational Bayes [14.4] 情報幾何学と変分ベイズ(VB)の基本的な関係を強調した。
ベイズ学習規則(Bayesian Learning Rule, BLR)と呼ばれる,Khan and Rue (2023)の自然勾配降下アルゴリズムを用いて,この事実のいくつかの結果を示す。
関連性も結果も新しいものではないが、情報幾何学とベイズの2つの分野の共通起源をさらに強調する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:07:38 GMT)
Communications to Circulations: 3D Wind Field Retrieval and Real-Time Prediction Using 5G GNSS Signals and Deep Learning [13.7] 本稿では,5つのGNSS(Global Navigation Satellite System)信号から3D(3D)大気風場を抽出・予測する信号強度の変動を利用した,新しいディープラーニングフレームワークを提案する。
予報結果から,風速の短期風速予測(最大30分リードタイム)と高分解能NWP出力に匹敵するスキルスコアの双方において有望な精度を示す。
この学際的アプローチは、先進的な環境モニタリングとリアルタイムの大気応用のために、非伝統的なデータソースとディープラーニングを活用できる変革の可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:17:08 GMT)
A more efficient method for large-sample model-free feature screening via multi-armed bandits [13.7] ランクベースモデルフリーな独立性スクリーニング手法 (CR-SIS) と, その効率的な変種であるBanditCR-SISを提案する。
n × p の予測行列の場合、CR-SIS の計算コストは O(nlog(n)p) であり、BanditCR-SIS はこれを O(sqrt(n)log(n)p + nlog(n)) に還元する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:30:00 GMT)
Improving Monte Carlo Tree Search for Symbolic Regression [13.6] 記号回帰は、望ましい目的を満たす簡潔で解釈可能な数学的表現を見つけることを目的としている。
2つの重要な革新を通じてこれらの制限に対処するシンボリックレグレッションのための改良されたフレームワークを提案する。
本手法は, 回復率の観点から, 最先端ライブラリと競合する性能を達成し, 精度とモデル複雑性の両面において良好な位置を占める。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:36:05 GMT)
Not All Parameters Are Created Equal: Smart Isolation Boosts Fine-Tuning Performance [13.6] 各タスクのコアパラメータは、統一されたバックボーンに移植される。
異なるタスクの非コアパラメータは、Spherical Linear Interpolationを通じてスムーズに統合される。
複数の公開ベンチマークの実験は、我々のアプローチがタスクの干渉や忘れを著しく軽減していることを示している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:53:19 GMT)
Lynx: Towards High-Fidelity Personalized Video Generation [13.6] 単一入力画像からパーソナライズされたビデオ合成のための高忠実度モデルLynxを提案する。
オープンソースのDiffusion Transformer(DiT)基盤モデルに基づいて開発されたLynxは、アイデンティティの忠実性を保証するために、2つの軽量アダプタを導入している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 00:31:57 GMT)
SENSE-7: Taxonomy and Dataset for Measuring User Perceptions of Empathy in Sustained Human-AI Conversations [13.2] 観察可能な共感行動を強調する人間中心の分類法を提案する。
我々は,情報労働者とLarge Language Models(LLMs)による実世界の会話のデータセットであるSense-7を紹介する。
109人の参加者による695の会話の分析から,共感の判断は高度に個人化され,文脈に敏感で,混乱に弱いことが判明した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:32:24 GMT)
CFD-LLMBench: A Benchmark Suite for Evaluating Large Language Models in Computational Fluid Dynamics [13.2] LLM(Large Language Models)は、一般的なNLPタスクに対して強力な性能を示すが、複雑な物理系の数値実験の自動化におけるその有用性は未解明のままである。
CFDLLMBenchは,大学院レベルのCFD知識,CFDの数値的および物理的推論,CFDの文脈依存的な実装という,3つの主要な能力にまたがるLCM性能を総合的に評価するためのベンチマークスイートである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:21:26 GMT)
Can Large Language Models Infer Causal Relationships from Real-World Text? [13.1] 本研究では,大規模言語モデル(LLM)が実世界のテキストから因果関係を推定できるかどうかを検討する。
私たちのベンチマークは、このタスクのための最初の実世界のデータセットです。
実験により、LLMは現実世界のテキストから因果関係を推定する上で重大な課題に直面していることが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:55:46 GMT)
An Adversarial Robust Behavior Sequence Anomaly Detection Approach Based on Critical Behavior Unit Learning [13.1] 逐次的ディープラーニングモデル(RNNやLSTMなど)は、APIやsyscallシーケンスなどのソフトウェア動作のシーケンス特性を学習することができる。
近年の研究では、これらの深層学習に基づくアプローチは敵のサンプルに弱いことが示されている。
本稿では, 動作単位の分析に基づく逆方向異常検出手法を提案し, この問題を克服する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:37:11 GMT)
Robust Object Detection for Autonomous Driving via Curriculum-Guided Group Relative Policy Optimization [13.0] MLLM(Multimodal Large Language Models)は、視覚言語推論において優れているが、しばしば構造化された知覚タスクと競合する。
本稿では,カリキュラムベースのデータスケジューリングと難易度を考慮したフィルタリングにより,グループ相対政策最適化を強化した強化学習フレームワークを提案する。
本研究は,頑健かつ解釈可能なマルチモーダル検出へのスケーラブルな経路として,構造化データキュリキュラを用いた強化駆動型最適化に注目した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:08:37 GMT)
Decoding TRON: A Comprehensive Framework for Large-Scale Blockchain Data Extraction and Exploration [13.0] 本稿では,TRONブロックチェーンのための包括的データ抽出・探索フレームワークを提案する。
革新的なハイパフォーマンスシステムは、ブロック、トランザクション、スマートコントラクト、レシートを含むTRONから生のオンチェーンデータを効率的に抽出することを目的としている。
抽出したデータセットの詳細な分析では、TRONのブロック生成、トランザクションのトレンド、取引の優位性、リソースデリゲート市場、スマートコントラクトの利用パターン、USDTスタンプコインの中心的な役割に関する洞察が明らかになった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:07:10 GMT)
Achieving quantum advantage in a search for a violations of the Goldbach conjecture, with driven atoms in tailored potentials [12.9] ゴールドバッハ予想は、任意の自然数$N$が2ドル以上であっても、$ptext(I)$と$ptext(II)$の2つの素数の和として書けると述べている。
本稿では,問題を解く量子アナログデバイスを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:04:53 GMT)
MountainLion: A Multi-Modal LLM-Based Agent System for Interpretable and Adaptive Financial Trading [12.8] MountainLionは金融取引のためのマルチモーダル・マルチエージェントシステムであり、金融データを解釈し投資戦略を生成する専門的LLMエージェントをコーディネートする。
中央反射モジュールは、歴史的取引信号と結果を分析して、意思決定プロセスを継続的に洗練する。
実証的な結果は、MountainLionが文脈的マクロ経済と資本フローの信号で技術的価格トリガを体系的に強化していることを確認する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:22:53 GMT)
AfroXLMR-Social: Adapting Pre-trained Language Models for African Languages Social Media Text [12.8] ドメイン適応型プレトレーニング(DAPT)とタスク適応型プレトレーニング(TAPT)は、このバイアスを減らすために一般的なテクニックである。
AfriSocialは、アフリカの複数の言語で継続的な事前トレーニングを行うための、大規模ソーシャルメディアおよびニュースドメインコーパスである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:25:20 GMT)
DPANet: Dual Pyramid Attention Network for Multivariate Time Series Forecasting [12.7] 長期時系列予測(LTSF)は、複数の時間スケールと周波数解像度にまたがる複雑な依存関係をモデル化することの難しさによって妨げられている。
本稿では,時間的多スケールダイナミックスとスペクトル多解像度周期性を明確に分離し,同時にモデル化する新しいアーキテクチャであるDPANetを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:06:33 GMT)
UPRPRC: Unified Pipeline for Reproducing Parallel Resources -- Corpus from the United Nations [12.6] 我々は,人間が翻訳した非AI生成コンテンツからなる,最大規模の並列コーパスを構築した。
得られたコーパスには7億1300万以上の英トークンが含まれており、これは以前の作業の規模を2倍にしている。
私たちのコードとコーパスはMITライセンスでアクセスできます。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:21:13 GMT)
Multi-view-guided Passage Reranking with Large Language Models [12.6] MVP(Multi-View-Guided Passage Re rank)と呼ばれる新しいパスリグレードモデルを導入する。
MVPはクエリパス情報を、外部バイアスの影響を受けずに、多様なビュー埋め込みにエンコードする。
MVPはドメイン内ベンチマークとドメイン外ベンチマークの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:47:16 GMT)
SAR-TEXT: A Large-Scale SAR Image-Text Dataset Built with SAR-Narrator and Progressive Transfer Learning [12.5] 我々は,SAR(Synthetic Aperture Radar)画像テキストペアからなる大規模かつ高品質なデータセットを構築した。
データセットの有効性を検証するために、画像テキスト検索、画像キャプション、視覚質問応答(VQA)の3つの典型的な視覚言語タスクについて実験を行った。
SAR-RS-CLIPは、平均リコールを12.97%、OSdataset_512とRSIDテストセットで10.0%向上させるなど、検索性能の大幅な改善を実現している。
SAR-RS-CoCaはBLEU-4の点でオリジナルのCoCaモデルよりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:05:22 GMT)
Cross-Resolution SAR Target Detection Using Structural Hierarchy Adaptation and Reliable Adjacency Alignment [12.5] 本稿では,新しいSARターゲット検出手法(CR-Net)を提案する。
構造先行と明らかな学習理論を検出モデルに組み込んで、クロスレゾリューション検出のための信頼性の高いドメイン適応を可能にする。
クロスレゾリューションSARターゲット検出において、最先端(SOTA)性能を実現する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:27:00 GMT)
From Judgment to Interference: Early Stopping LLM Harmful Outputs via Streaming Content Monitoring [12.5] 既存のモデレータは主に従来のフル検出を実践し、完全なLLM出力に基づいて有害性を決定する。
近年の研究では、モデレーターが生成途中を監督し、有害性が検出された場合に出力を早期に停止する部分検出に注意が向けられている。
本稿では,レスポンスレベルのラベルとトークンレベルのラベルを二重に管理するストリーミングコンテンツモニタを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:07:39 GMT)
Patterns in the Transition From Founder-Leadership to Community Governance of Open Source [12.5] 637のGitHubリポジトリを分析して、創業者主導から共有ガバナンスへの移行をトレースします。
役割と行動が成長し、規制がよりバランスを取ります。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:55:08 GMT)
Reinforce Lifelong Interaction Value of User-Author Pairs for Large-Scale Recommendation Systems [12.3] 本稿では,UAペア間の相互作用に基づいて,ユーザ-認証ペアのライフサイクルインタラクション値(RLIV-UA)の強化にRLを導入する。
オフライン実験とオンラインA/Bテストでは、RLIV-UAモデルは比較手法よりも高いユーザ満足度と高いプラットフォーム利益を達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:31:37 GMT)
HARE: an entity and relation centric evaluation framework for histopathology reports [12.2] 我々は,新しい実体と関係中心のフレームワークであるHARE(Histopathology Automated Report Evaluation)を提案する。
HarEは、重要な病理組織学的実体と参照と生成された報告の関係を整合させることにより、臨床的に関係のある内容の優先順位付けを行う。
GatorTronSはドメイン適応型言語モデルで、HARE-NERとHARE-REを開発した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:12:19 GMT)
Diffusion-Based Depth Inpainting for Transparent and Reflective Objects [12.2] 本稿では,透過的および反射的オブジェクトに特化して設計された拡散型深度塗布フレームワークを提案する。
DITRは、堅牢な適応性を持つ透明で反射性のある物体の奥行き塗装に非常に効果的である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:30:04 GMT)
Beyond Pixels: Enhancing LIME with Hierarchical Features and Segmentation Foundation Models [12.2] LIMEは、ビジョン機械学習モデルにおける意思決定プロセスを解き放つための人気のあるXAIフレームワークである。
本稿では,DSEG-LIME(Data-Driven LIME)フレームワークについて紹介する。
以上の結果から,DSEGは事前学習したImageNetモデルにおいて,XAIの指標よりも優れていた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:44:50 GMT)
MicroRCA-Agent: Microservice Root Cause Analysis Method Based on Large Language Model Agents [12.2] MicroRCA-Agentは、大規模な言語モデルエージェントに基づいたマイクロサービスの根本原因分析のための革新的なソリューションである。
提案したソリューションは、複雑なマイクロサービス障害シナリオにおいて優れたパフォーマンスを示し、最終的なスコアは50.71である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:57:03 GMT)
P2VA: Converting Persona Descriptions into Voice Attributes for Fair and Controllable Text-to-Speech [12.1] 本稿ではペルソナ記述から音声を自動生成する最初のフレームワークであるペルソナ・ツー・ボイス・アトリビュート(P2VA)を紹介する。
提案手法は、構造化音声属性のP2VA-Cと、よりリッチなスタイル記述のP2VA-Oの2つの戦略を用いる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:26:59 GMT)
UNIV: Unified Foundation Model for Infrared and Visible Modalities [12.0] Infrared and Visible modalities(UNIV)のための生物学的に着想を得た統一基盤モデルを提案する。
PCCLは、網膜水平細胞の側方抑制を模倣する注意誘導蒸留フレームワークである。
我々の二重知識保存機構は網膜の双極性細胞シグナルルーティングをエミュレートする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:07:53 GMT)
GUI-ReWalk: Massive Data Generation for GUI Agent via Stochastic Exploration and Intent-Aware Reasoning [11.9] GUI-ReWalkは、現実的で多様なGUIトラジェクトリを合成するための多段階フレームワークである。
GUI-ReWalkは、ランダム性と構造に対するゴール認識推論を組み合わせることで、人間のコンピュータインタラクションの意図認識、適応性をよりよく反映したデータを生成する。
その結果、GUI-ReWalkは、多様な相互作用フロー、より高い軌道エントロピー、よりリアルなユーザインテントのカバレッジを向上できることを示した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:09:18 GMT)
Evaluating the Effectiveness and Scalability of LLM-Based Data Augmentation for Retrieval [11.8] 検索における大規模言語モデル拡張の有効性について検討する。
より小さなLLMによる拡張は、より大きな拡張モデルと競合する性能を実現することができる。
私たちの洞察は、より司法的で効率的な拡張戦略の道を開くものです。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:43:08 GMT)
A Universal Framework for Large-Scale Multi-Objective Optimization Based on Particle Drift and Diffusion [11.8] 大規模多目的最適化は、既存の進化アルゴリズムに課題をもたらす。
物理学における粒子の動きに着想を得て,大規模多目的最適化のための普遍的な枠組みを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:51:54 GMT)
Low-Rank Adaptation of Evolutionary Deep Neural Networks for Efficient Learning of Time-Dependent PDEs [11.2] 本稿では,低ランク部分空間にパラメータ進化を制約する低ランク進化深層ニューラルネットワーク(LR-EDNN)を提案する。
LR-EDNNは、トレーニング可能なパラメータが大幅に少なく、計算コストが削減された同等の精度を実現する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:17:31 GMT)
Integrating Spatiotemporal Vision Transformer into Digital Twins for High-Resolution Heat Stress Forecasting in Campus Environments [11.1] 極端な熱イベントは、都市のレジリエンスと計画に重大な課題をもたらす。
本研究は, 熱ストレス予測と意思決定を強化するための, 気候応答型デジタルツインフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:52:12 GMT)
The Impact of Automatic Speech Transcription on Speaker Attribution [11.1] 本論文は,音声認識が話者帰属性に与える影響について,初めて包括的研究を行ったものである。
属性は単語レベルの転写エラーに対して驚くほど回復力があることがわかった。
以上の結果から, ASR が生成する誤りに富む文字の話者属性は, 人文データに基づく話者属性と同程度に優れていることが示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:43:31 GMT)
Quality-Driven Curation of Remote Sensing Vision-Language Data via Learned Scoring Models [11.1] VLM(Vision-Language Models)は、言語誘導セマンティックを通して、リモートセンシング(RS)画像を解釈する大きな可能性を実証している。
自動品質評価のための大規模RS視覚言語嗜好データに基づいて学習した新しいスコアモデルを提案する。
実験結果から,スコアモデルでランク付けされたデータのトップ30%を有する細調整のCLIPや高度なVLMは,全データ微調整とCLIPスコアに基づくランキング手法と比較して精度が高いことがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:38:49 GMT)
DischargeSim: A Simulation Benchmark for Educational Doctor-Patient Communication at Discharge [11.1] 退院コミュニケーションは、患者のケアにおいて重要だが未発見の要素である。
モデルがパーソナライズされた放電教育者として機能する能力を評価する新しいベンチマークであるDesignSimを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:20:08 GMT)
World Modelling Improves Language Model Agents [11.1] DyMoは、トレーニング後の関数呼び出しと並行して、状態予測機能を備えた大きな言語モデルを拡張する方法である。
バークレー・コールリング・リーダーボードV2では、DyMoは成功率を改善し、幻覚を著しく減少させる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:54:30 GMT)
Enhancing Sa2VA for Referent Video Object Segmentation: 2nd Solution for 7th LSVOS RVOS Track [11.1] Referential Video Object (RVOS) は、ある自然言語記述にマッチしたビデオ内のすべてのオブジェクトをセグメント化することを目的としている。
RVOS タスクにおける Sa2VA の性能を大幅に向上させる,トレーニング不要なフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:01:27 GMT)
Adaptivity is not helpful for Pauli channel learning [11.0] 適応戦略は, 絡み合った入力を用いて, パウリチャネルを学習し, テストする非適応戦略に勝るものではないことを実証する。
最適な古典的推定アルゴリズムを量子環境に変換することで,いくつかの基本的なタスクに対するクエリの複雑さを特徴づける。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:40:13 GMT)
Rate doubly robust estimation for weighted average treatment effects [10.9] 重み付き平均治療効果(英: weighted average treatment effect、WATE)は、確率スコアの重みによって特徴づけられる集団の因果推定値の多様類を定義する。
WATEは、これらの分野の多くのデータセットが、そのフレームワークと一致しているため、社会的および医学的な研究に広く適用可能である。
特定の速度と規則性条件下での3つのRDR推定器を提案し,その性能をモンテカルロシミュレーションを用いて評価する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:54:56 GMT)
DPC-QA Net: A No-Reference Dual-Stream Perceptual and Cellular Quality Assessment Network for Histopathology Images [10.9] 本稿では,ウェーブレットに基づくグローバル差分認識とセル品質評価を結合した非参照デュアルストリームネットワークであるDPC-QA Netを提案する。
異なるデータセット間で、我々のモデルは92%の精度で染色、膜、核の問題を検知し、ユーザビリティスコアとよく一致します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:30:13 GMT)
Building Data-Driven Occupation Taxonomies: A Bottom-Up Multi-Stage Approach via Semantic Clustering and Multi-Agent Collaboration [10.4] 高品質でデータ駆動型の作業を自動化するフレームワークであるCLIMBを紹介します。
3つの多様な実世界のデータセットから、CLIMBは既存の手法よりも一貫性があり、スケーラブルであることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:17:48 GMT)
Improved learning theory for kernel distribution regression with two-stage sampling [10.4] カーネルメソッドは分散回帰問題に取り組む方法として選択されている。
ヒルベルトの埋め込みに対して,新しい誤差境界を提供する新しい非バイアス条件を導入する。
この条件は、最適輸送と平均埋め込みに基づくカーネルの3つの重要なクラスに当てはまることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:34:48 GMT)
Evaluating Hallucinations in Multimodal LLMs with Spoken Queries under Diverse Acoustic Conditions [10.4] 音声入力が大規模言語モデルにおける幻覚に与える影響について検討する。
本稿では,RePOPEベンチマークの音声拡張であるRePOPE-Spkについて述べる。
実験結果から, 文章ではなく, クエリが話されるときに, 幻覚がエスカレートすることが明らかとなった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:18:45 GMT)
How many classes do we need to see for novel class discovery? [10.3] 本研究では,既知のクラス数と発見性能の関係と,既知のクラス「カバレッジ」が新たなクラス発見に与える影響について検討する。
実験結果から,既知のクラス数の利点は,発見性能が低下する飽和点に達することが示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:38:58 GMT)
EmoHeal: An End-to-End System for Personalized Therapeutic Music Retrieval from Fine-grained Emotions [10.2] EmoHealは、パーソナライズされた3段階の支援的な物語を提供するエンドツーエンドシステムである。
Healは、微調整されたXLM-RoBERTaモデルを用いて、ユーザテキストから27のきめ細かい感情を検出する。
CLAMP3モデルを使用してオーディオヴィジュアルコンテンツを検索し、ユーザを現在の状態からより穏やかな状態へ誘導する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:52:22 GMT)
Universal Learning of Stochastic Dynamics for Exact Belief Propagation using Bernstein Normalizing Flows [10.1] 本稿では、両方の性質を満たすモデルのクラスの理論的基礎を確立する。
提案手法は, 正規化密度推定の表現性とベルンシュタイン流の解析的トラクタビリティを組み合わせたものである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:36:35 GMT)
MEDAL: A Framework for Benchmarking LLMs as Multilingual Open-Domain Dialogue Evaluators [10.1] 既存のメタ評価ベンチマークは静的で時代遅れであり、多言語カバレッジに欠けています。
我々は、より代表的で多様な評価ベンチマークをキュレートするための自動マルチエージェントフレームワークであるMEDALを紹介する。
MEDALを用いて、最先端の審査員が共感の欠如、常識の欠如、あるいは関連性などのニュアンスな問題を確実に検出できないことを明らかにする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:18:19 GMT)
Dynamic Objects Relocalization in Changing Environments with Flow Matching [10.0] FlowMapsはFlow Matchingに基づいたモデルであり、空間と時間にわたってマルチモーダルオブジェクトの位置を推測することができる。
我々の結果は、我々の仮説を支持する統計的証拠を示し、我々のアプローチのより複雑な応用への道を開く。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:21:16 GMT)
SouLLMate: An Application Enhancing Diverse Mental Health Support with Adaptive LLMs, Prompt Engineering, and RAG Techniques [9.9] メンタルヘルスの問題は個人の日常生活に大きな影響を及ぼすが、多くの人は利用可能なオンラインリソースでも必要な支援を受けていない。
この研究は、最先端のAI技術を通じて、多様な、アクセス可能な、スティグマのない、パーソナライズされた、リアルタイムのメンタルヘルスサポートを提供することを目的としている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:04:10 GMT)
SouLLMate: An Adaptive LLM-Driven System for Advanced Mental Health Support and Assessment, Based on a Systematic Application Survey [9.9] メンタルヘルスの問題は個人の日常生活に大きな影響を及ぼすが、多くの人は利用可能なオンラインリソースでも必要な支援を受けていない。
この研究は、最先端のAI技術を通じて、アクセス可能で、スティグマフリーで、パーソナライズされ、リアルタイムなメンタルヘルスサポートを提供することを目的としている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:06:57 GMT)
TT-DF: A Large-Scale Diffusion-Based Dataset and Benchmark for Human Body Forgery Detection [9.9] そこで本研究では,1,378,857個の合成フレームを備えた6,120本の鍛造ビデオを含む,大規模な拡散型フォージェリーデータセットを提案する。
目的は、可能な限り網羅的に、潜在的に見えない偽造データをシミュレートすることであり、TT-DFのベンチマークも実施することである。
実験の結果,TOF-NetはTT-DFで良好な性能を示し,現在最先端の顔偽造検出モデルより優れていることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:55:28 GMT)
Topological Aspects of Dirac Fermions in a Kagomé Lattice [9.8] ディラックフェルミオンはヘキサゴナル・ブリルアンゾーンの2つの同値な角で異なる谷の低エネルギー物理を支配している。
ホロウ・オブ・ダビデ相は、ディラック質量のサインチェンジと異なる$mathbbZ_6$ベリー相を持つ。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:02:17 GMT)
Similarity-Guided Diffusion for Long-Gap Music Inpainting [9.8] 拡散に基づく推論と類似性探索を組み合わせたハイブリッド手法であるSimDPS(Simisity-Guided Diffusion Posterior Smpling)を提案する。
ピアノ音楽の2-s間隔の塗装に対する主観評価は,SimDPS法が知覚的妥当性を高めることを示唆している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:33:51 GMT)
GS-Scale: Unlocking Large-Scale 3D Gaussian Splatting Training via Host Offloading [9.8] 3D Gaussian Splattingは、高画質と高速なレンダリング速度を提供することによって、グラフィックレンダリングに革命をもたらした。
大規模なシーンを高品質でトレーニングすることは、かなりのメモリ需要のため、依然として困難である。
本稿では,3次元ガウス平滑化のための高速かつメモリ効率のトレーニングシステムであるGS-Scaleを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:13:28 GMT)
Classical Algorithms for Hamiltonian Dynamics Mean Value and Guided Local Hamiltonian Problem [9.6] 本稿では,任意の局所量子系の短時間ダイナミクスをシミュレーションする,効率的な古典的アルゴリズムを提案する。
また,探索型局所ハミルトニアン(GLH)問題を定値加算誤差に効率よく解く量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:10:49 GMT)
PRISM: Probabilistic and Robust Inverse Solver with Measurement-Conditioned Diffusion Prior for Blind Inverse Problems [9.5] 測定条件付き拡散前(PRISM)を用いた新しい確率的・頑健な逆解法を提案する。
PRISMは、理論上原理化された後続サンプリングスキームに強力な測定条件付き拡散モデルを導入することで、現在の手法の技術的進歩を提供する。
ブラインド画像の劣化実験により提案手法の有効性が検証され、画像とぼやけたカーネルの回復において、最先端のベースラインよりもPRISMの優れた性能が示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:49:03 GMT)
A Unified AI Approach for Continuous Monitoring of Human Health and Diseases from Intensive Care Unit to Home with Physiological Foundation Models (UNIPHY+) [9.5] UNIPHY+は、ユビキタスに取得可能な生理データを用いて、ケア設定全体にわたって継続的に人間の健康と病気をモニタリングできるようにするために設計された統合された生理基盤モデル(PhyloFM)フレームワークである。
本研究では,事前学習,微調整,軽量モデルパーソナライゼーションにおいて,文脈情報を組み込む新しい手法を提案する。
我々は、UNIPHY+が、臨床意思決定と長期健康モニタリングの両方をサポートするために、一般化可能でスケーラブルでパーソナライズされた生理的AIに力を与えることを示すために、集中治療から循環監視まで幅広いユースケースでUNIPHY+をテストすることを提唱する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:40:47 GMT)
Large Language Model Assisted Automated Algorithm Generation and Evolution via Meta-black-box optimization [9.2] AwesomeDEは大規模言語モデル(LLM)をメタ最適化の戦略として活用し、人間の介入なしに制約付き進化アルゴリズムの更新ルールを生成する。
素早い設計と反復的な改良を含む重要なコンポーネントは、設計品質への影響を判断するために体系的に分析される。
実験の結果,提案手法は計算効率と解の精度で既存手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:51:52 GMT)
Hardness, Structural Knowledge, and Opportunity: An Analytical Framework for Modular Performance Modeling [9.2] ハードネス」は、パフォーマンスモデリングの固有の難しさとして定義される。
モデリングの難しさは、主にモジュール数とモジュールごとの設定オプションによって引き起こされることを示す。
構造知識の高レベル化とモデリング難易度の向上が,改善の機会を著しく向上させることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:19:28 GMT)
A Layered Multi-Expert Framework for Long-Context Mental Health Assessments [9.1] Stacked Multi-Model Reasoning (SMMR)は、複数のモデルを等価な'専門家'として活用する階層化フレームワークである。
DAIC-WOZうつ病スクリーニングデータセットを用いてSMMRを評価し,48例の精神科診断症例について検討した。
多様な「第2の意見」を活用することで、SMMRは幻覚を緩和し、微妙な臨床的ニュアンスを捉え、高い精神健康評価の信頼性を高める。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:50:58 GMT)
Space Group Equivariant Crystal Diffusion [9.0] 3次元結晶は、空間群と呼ばれる離散アイソメトリー群に不変である。
本研究では,自然に空間群制約を扱う結晶生成モデルであるSGEquiDiffを提案する。
SGEquiDiffは、標準ベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:41:09 GMT)
Adaptive Self-improvement LLM Agentic System for ML Library Development [9.0] 大規模言語モデル(LLM)は一般的なコーディング能力を示している。
LLMはこのタスクを完了するには、限られたデータによる複雑な推論が必要である。
オープンおよびクローズドソースのLLMを用いてASPLコードを生成する適応型自己改善エージェントシステムを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:28:06 GMT)
No Black Box Anymore: Demystifying Clinical Predictive Modeling with Temporal-Feature Cross Attention Mechanism [8.8] TFCAM(Temporal-Feature Cross Attention Mechanism)は、臨床機能間の動的相互作用を時間をかけて捉えるための新しいディープラーニングフレームワークである。
慢性腎臓病の1,422人を対象に行った実験では、TFCAMはLSTMおよびRETAINベースラインに優れ、AUROCは0.95、F1スコアは0.69であった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:20:02 GMT)
Session-Level Spoken Language Assessment with a Multimodal Foundation Model via Multi-Target Learning [8.7] 音声言語アセスメント(SLA)は、学習者の発話能力を自然発話から推定する。
本稿では,セッションレベル評価を単一パスで行う,新しいマルチモーダル基礎モデルを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:33:05 GMT)
GQVis: A Dataset of Genomics Data Questions and Visualizations for Generative AI [8.6] 本稿では,ゲノムデータに関する抽象的,低レベルな質問と,それに対応する視覚化を組み合わせたデータセットを生成するフレームワークを提案する。
我々は、GQVisを生成するために、3つの異なるゲノムデータレポジトリ(4DN, ENCODE, Chromoscope)から取得したゲノムデータを用いている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:29:13 GMT)
EigenTrack: Spectral Activation Feature Tracking for Hallucination and Out-of-Distribution Detection in LLMs and VLMs [8.6] EigenTrackは大規模言語モデル(LLM)のための解釈可能なリアルタイム検出器である
表面誤差が現れる前に幻覚とOODドリフトを信号する表現構造における時間的シフトを追跡する。
既存のホワイトボックス検出器とは異なり、時間的コンテキストを保存し、グローバルシグナルを集約し、解釈可能な精度-遅延トレードオフを提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:05:28 GMT)
MedCOD: Enhancing English-to-Spanish Medical Translation of Large Language Models Using Enriched Chain-of-Dictionary Framework [8.6] MedCODは、言語モデル(LLM)にドメイン固有の構造化知識を統合することで、英語とスペイン語の医療翻訳を改善するために設計されたハイブリッドフレームワークである。
我々は,2,999の英語・スペイン語のMedlinePlus記事の並列コーパスと,構造化医療コンテキストを付加した100文テストセットを構築した。
実験結果から,MedCODは全モデル間の翻訳品質を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:16:48 GMT)
Online Robust Planning under Model Uncertainty: A Sample-Based Approach [8.6] 本稿では,Markov Decision Processs (MDP) のためのオンライン計画アルゴリズムであるRobust Sparse Sampling (RSS)を紹介した。
RSSはサンプル平均近似(SAA)の効率性と理論的特性を活用することでロバストな値関数を計算する
RSSは無限の状態空間や連続状態空間に適用でき、そのサンプルと計算の複雑さは状態空間のサイズとは独立である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:43:08 GMT)
Sparse-Autoencoder-Guided Internal Representation Unlearning for Large Language Models [8.6] モデルの内部アクティベーションに介入する新しいアンラーニング手法を提案する。
「対象の内的活性化を未知の実体と整合させることで、対象の実体の認識を「未知」から「未知」にシフトさせる。」
本手法は,非対象知識に大きなダメージを与えることなく,質問応答タスクにおける対象知識のリコールを効果的に削減する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:48:12 GMT)
What's Not on the Plate? Rethinking Food Computing through Indigenous Indian Datasets [8.5] 本稿では、インドの遠隔地からの1,000の原住民レシピのデータセットを、農村部から初めてデジタルワーカーを巻き込んだ参加モデルを用いて収集した。
このプロジェクトは6つの州で10の絶滅危惧言語コミュニティをカバーしている。
専用のモバイルアプリを使ってドキュメンテーションされたこのデータセットには、テキスト、画像、オーディオが含まれており、伝統的な食品の習慣を、生態学的、文化的な文脈とともに捉えている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:48:13 GMT)
Enriched Feature Representation and Motion Prediction Module for MOSEv2 Track of 7th LSVOS Challenge: 3rd Place Solution [8.5] そこで我々は,Cutie と SAM2 の強みを統合するフレームワークを提案する。
第7回LSVOSチャレンジのMOSEv2トラックで3位を獲得しました。
このことは、ロバストなビデオオブジェクトセグメンテーションにおけるリッチな特徴表現と動き予測の有効性を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:11:01 GMT)
CFDA & CLIP at TREC iKAT 2025: Enhancing Personalized Conversational Search via Query Reformulation and Rank Fusion [8.5] 我々はBest-of-N$選択とReciprocal Rank Fusion戦略を中心にパイプラインを構築し、異なるサブミッションタスクを処理します。
その結果,両タスク間の効率性と効率のトレードオフを明らかにしながら,再ランク付けと融合によりロバスト性が改善された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:42:31 GMT)
Layout Stroke Imitation: A Layout Guided Handwriting Stroke Generation for Style Imitation with Diffusion Model [8.5] 本研究は,書体模倣のためのマルチスケールアテンション機能を提案する。
これらのマルチスケール機能埋め込みは、ローカルおよびグローバルスタイルの機能を強調している。
第2に,直接生成したスタイル画像と対照的に,ストロークの予測を行う条件拡散モデルを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:53:17 GMT)
Uncertainty-Based Smooth Policy Regularisation for Reinforcement Learning with Few Demonstrations [8.4] Smooth Policy Regularisation from Demonstrations (SPReD) は基本的な問題に対処するフレームワークである。
SPReDはアンサンブル法を用いて、実証行動と政策行動の両方のQ値分布を明示的にモデル化し、比較の不確実性を定量化する。
8つのロボティクスタスクにわたる実験では、複雑なタスクにおいて14倍まで既存のアプローチを上回りながら、品質と量を示すための堅牢性を維持している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:47:20 GMT)
CIDER: A Causal Cure for Brand-Obsessed Text-to-Image Models [8.3] テキスト・トゥ・イメージ(T2I)モデルは、まだ探索されていない重要な「ブランドバイアス」を示す
そこで我々はCIDERを提案する。CIDERは推論時のバイアスを軽減するためのモデルに依存しないフレームワークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:30:37 GMT)
Beyond Linear Steering: Unified Multi-Attribute Control for Language Models [8.2] K-ステアリング(K-Steering)は、隠れたアクティベーションに対して単一の非線形マルチラベル分類器を訓練する統一的で柔軟なアプローチである。
これにより、線形性の仮定を回避し、別個のベクトル属性の保存とチューニングの必要性を排除し、再トレーニングなしに振る舞いの動的構成を可能にする。
アクティベーションに基づく分類器とLCMに基づく判定器の両方で検証された3つのモデルファミリーにおける実験結果から、K-ステアリングは複数の動作を正確に操る上で、強いベースラインより優れていることが証明された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:58:16 GMT)
A Rigorous Evaluation of LLM Data Generation Strategies for Low-Resource Languages [8.2] 大規模言語モデル(LLM)は、より小さな専門的なモデルを訓練するための合成テキストデータを生成するために、ますます使われている。
本稿では,11言語にまたがる生成戦略とその組み合わせの性能を評価する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:07:44 GMT)
Policy Gradient Optimzation for Bayesian-Risk MDPs with General Convex Losses [8.2] 我々は、一般的な損失関数と未知のパラメータを持つマルコフ決定過程(MDP)を考察する。
我々はベイズ的手法を用いてデータからパラメータを推定し、損失にコヒーレントなリスク関数を課す。
本稿では,コヒーレントリスク尺度の二重表現を利用した政策勾配最適化手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:16:59 GMT)
Disentangling the Complex Multiplexed DIA Spectra in De Novo Peptide Sequencing [8.0] Data-Independent Acquisition (DIA) が導入された。
DIAデータは、コヒーレントペプチド、高ノイズ、および様々なデータ品質でマージされる。
本稿では,新しい深層学習手法であるDIANovoを提案し,これらの課題に対処する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:51:34 GMT)
KatFishNet: Detecting LLM-Generated Korean Text through Linguistic Feature Analysis [7.7] LLM生成韓国語テキストを検出するための最初のベンチマークデータセットであるKatFishを紹介する。
音声の間隔パターン,部分音声の多様性,コンマ使用法を調べた結果,人文文とLLM生成韓国語文との言語的差異が明らかになった。
KatFishNetはAUROCよりも平均19.78%高い。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:46:10 GMT)
An MLIR-Based Compilation Framework for Control Flow Management on Coarse Grained Reconfigurable Arrays [7.7] CGRAは高い柔軟性と効率を示し、集中的なワークロードの加速に適している。
CGRAコンパイルは空間領域と時間領域の両方にまたがる多次元空間に対処する必要がある。
本稿では,コンパイルバックエンドとして機能し,CGRAハードウェアリソースの制限に対処し,コンパイルプロセスで実現可能なソリューションを保証する新しいマッピング手法を提案する。
我々のフレームワークは、コンパイル最適化によって、最先端のアプローチよりも最大2.1倍のスピードアップを実現している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:51:50 GMT)
Compose by Focus: Scene Graph-based Atomic Skills [7.7] 本稿では,タスク関連オブジェクトと関係性に着目したシーングラフに基づく表現を提案する。
さらに、視覚言語モデル(VLM)に基づくタスクプランナと「フォーカス」シーングラフスキルを組み合わせる。
シミュレーションと実世界の操作タスクの両方の実験は、最先端のベースラインよりもはるかに高い成功率を示している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:03:18 GMT)
DCoM: Active Learning for All Learners [7.6] Dynamic Coverage & Margin Mix (DCoM)はこのギャップを埋めるために設計された新しいアクティブラーニングアプローチである。
コールドスタート問題を克服するDCoMの能力を実証し、予算の異なる制約にまたがって結果を継続的に改善する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:35:17 GMT)
Training More Robust Classification Model via Discriminative Loss and Gaussian Noise Injection [7.5] 本稿では,クラス内コンパクト性を明示する最小層に適用した損失関数を提案する。
また、ノイズの多いデータクラスタをクリーンなクラスタに近づける、クラスワイズな機能アライメント機構を提案する。
提案手法は, クリーンなデータに対して高い精度を維持しながら, 各種摂動に対するモデルロバスト性を大幅に強化する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:52:04 GMT)
Sparsity May Be All You Need: Sparse Random Parameter Adaptation [7.5] アライメントとタスク適応のための大規模言語モデルの完全な微調整は、モデルのサイズが大きくなるにつれて、極めて高価になっている。
そこで本研究では,これらのモデルの微調整に必要な計算資源とメモリ資源を,モデルパラメータのすべてではなく,少数のパラメータでのみ訓練することで削減する手法を提案する。
PEFT技術がうまく機能することが本当に重要であるのは、必ずしも特定のアダプタ構造ではなく、トレーニング可能なパラメータの数である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 00:27:26 GMT)
Improving Data Curation of Software Vulnerability Patches through Uncertainty Quantification [7.5] 本稿では、不確実性定量化(UQ)を用いて、公開可能なソフトウェア脆弱性パッチのデータセットをキュレートする手法を提案する。
Model EnsembleとHerescedasticモデルは、脆弱性パッチデータセットのベストチョイスです。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:09:11 GMT)
Both Asymptotic and Non-Asymptotic Convergence of Quasi-Hyperbolic Momentum using Increasing Batch Size [7.3] モメンタム法は、もともと凸関数を持つ決定論的設定において、勾配バッチ降下(SGD)に優越する目的で導入された。
収束を達成するには、崩壊する学習率かバッチサイズの増加が必要であることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:34:23 GMT)
Multilingual LLM Prompting Strategies for Medical English-Vietnamese Machine Translation [7.2] 医療用英語-ベトナム語機械翻訳(En-Vi MT)は、ベトナムにおける医療アクセスとコミュニケーションに不可欠である。
我々は,MedEVデータセット上で6つの多言語LLM(0.5B-9Bパラメータ)のプロンプト戦略を評価する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:06:36 GMT)
TISDiSS: A Training-Time and Inference-Time Scalable Framework for Discriminative Source Separation [7.2] 我々は、TISDiSS(Training-Time and Inference-Time Scalable Discriminative Source separation)を提案する。
TISDiSSは、早期分割型マルチロス監視、共有パラメータ設計、動的推論繰り返しを統合している。
標準音声分離ベンチマークの実験は、パラメータ数を削減した最先端性能を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:42:27 GMT)
RadarGaussianDet3D: An Efficient and Effective Gaussian-based 3D Detector with 4D Automotive Radars [7.2] 4Dオートマチックレーダーは、低コスト、ロバスト性、および固有の速度測定能力のために、自動運転の注目を集めている。
既存の4Dレーダーベースの3D検出器は、BEV特徴抽出のための柱エンコーダに大きく依存しており、各点が1つのBEVグリッドにのみ寄与する。
本稿では,効率的なガウス型3D検出器であるRadarGaussianDet3Dを提案する。
TJ4DRadSetとView-of-Delftの実験により、RadarGaussianDet3Dは、届けながら最先端検出精度を達成できることが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:13:09 GMT)
Photon Blockade Mediated by Two-Photon Absorption in an Optical Parametric Amplifier [7.2] 光子遮断(英: photon blockade、PB)は、強い非線形系の量子効果の一つで、単一の光子がより高いレベルに励起されることを防ぎ、反有界光場を生成する。
近年, 環境誘起光子遮断 (EPB) が新たなアプローチとして登場し, 光子遮断を実現するために2光子吸収 (TPA) を利用した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:17:52 GMT)
Targeted Fine-Tuning of DNN-Based Receivers via Influence Functions [7.2] 深層学習型無線受信機におけるインフルエンス関数の初利用について述べる。
その結果,有益なサンプルに対する2次クロスエントロピー損失と1次更新による損失相対的影響は,ジェニーアシスト性能に対するビット誤り率を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:01:30 GMT)
Sample-Efficient Reinforcement Learning with Symmetry-Guided Demonstrations for Robotic Manipulation [7.1] 強化学習(RL)は、特に高次元連続状態-作用空間において、サンプル効率の低下に悩まされる。
デモとRL生成の両方を格納するデュアルバッファアーキテクチャを用いた新しいトレーニングフレームワークであるDemo-EASEを紹介する。
その結果,Demo-EASEは標準のRLベースラインに比べてコンバージェンスを著しく加速し,最終性能を向上させることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:36:12 GMT)
The Missing Piece: A Case for Pre-Training in 3D Medical Object Detection [7.1] 大規模な事前訓練は、3D医療オブジェクト検出の進歩を約束する。
既存の3Dオブジェクト検出のための事前トレーニングアプローチは、2Dの医療データや自然画像の事前トレーニングに依存している。
本稿では,既存の事前学習手法を最先端検出アーキテクチャに組み込む方法について,最初の系統的研究を行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:55:51 GMT)
Robust Vision-Language Models via Tensor Decomposition: A Defense Against Adversarial Attacks [7.0] 視覚言語モデル(VLM)はマルチモーダルな理解では優れているが、敵の攻撃に弱い。
トレーニング済みのVLMに適したテンソル分解を用いた軽量な防御機構を導入し,再トレーニングは不要である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:16:32 GMT)
Single-shot sorting of Mössbauer time-domain data at X-ray free electron lasers [6.9] M"オスバウアー分光法は、物質の構造と力学を研究するために広く用いられている。
実験は通常、延長された測定時間または多くのX線パルス(ショット')で平均となる。
X線自由電子レーザー(XFEL)は平均化せずにM"オスバウアーの単発測定を可能にすることが示唆されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:10:03 GMT)
Attention Schema-based Attention Control (ASAC): A Cognitive-Inspired Approach for Attention Management in Transformers [6.9] 本稿では、アテンションスキーマの概念を人工ニューラルネットワークに統合したASAC(Attention-based Attention Control)を紹介する。
本手法は,アテンションアロケーションを明示的にモデル化することにより,システム効率を向上させることを目的としている。
視覚領域とNLP領域の両方においてASACの有効性を実証し、分類精度を改善し、学習プロセスを高速化する能力を強調した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:08:30 GMT)
The Multi-Query Paradox in Zeroth-Order Optimization [6.8] Zeroth-order Alignment (ZO)は、明示的な勾配が利用できない問題に対して強力なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:10:45 GMT)
A re-calibration method for object detection with multi-modal alignment bias in autonomous driving [6.7] 自律走行における多モード物体検出は、異なるセンサからの補完情報を融合させることにより、大きなブレークスルーを達成した。
LiDARやカメラなどのセンサーとの融合の校正は、以前の研究で常に正確であるはずだった。
実際には、キャリブレーション行列は車両が工場を出る際に固定されるが、機械的振動、道路の隆起、データラグはキャリブレーションバイアスを引き起こす可能性がある。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:54:47 GMT)
Merging Memory and Space: A State Space Neural Operator [6.6] State Space Neural Operator (SS-NO) は時間依存偏微分方程式の解演算子を学習するためのコンパクトなアーキテクチャである。
SS-NOは多種多様なPDEベンチマークにおける最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:35:05 GMT)
Evaluating CxG Generalisation in LLMs via Construction-Based NLI Fine Tuning [6.2] 高語彙化から高スキーマ化までの8つの英語構成をカバーする80k文のConTest-NLIベンチマークを導入する。
我々のパイプラインは、テンプレート化とモデル・イン・ザ・ループフィルタの適用により、多様な合成NLIトリプルを生成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:03:10 GMT)
TSCAN: Context-Aware Uplift Modeling via Two-Stage Training for Online Merchant Business Diagnosis [6.2] 2段階トレーニングアプローチ(TSCAN)に基づく文脈認識アップリフトモデルを提案する。
第1段階では、IPMの処理規則化と確率スコア予測を含む、CAN-Uと呼ばれるアップリフトモデルを訓練する。
第2段階では、等張出力層を用いて昇降効果を直接モデル化するCAN-Dモデルを訓練する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:27:59 GMT)
AI for Scientific Discovery is a Social Problem [6.2] 主な障壁は社会と制度にあると我々は主張する。
コミュニティの障害,上流ニーズの一致しない研究優先,データの断片化,インフラストラクチャの不平等という,4つの相互接続的な課題を強調します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:52:09 GMT)
Multi-View Contrastive Learning for Robust Domain Adaptation in Medical Time Series Analysis [6.1] 複雑な時間的依存関係と動的分散シフトのため、マシンラーニングモデルを医療時系列に適応することは依然として課題である。
本稿では,多視点コントラスト学習を活用して,時間的パターン,微分的ダイナミクス,周波数領域の特徴を統合する新しいフレームワークを提案する。
本手法では,独立エンコーダと階層的融合機構を用いて,ドメイン間で転送可能な特徴不変表現を学習する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:53:26 GMT)
DeDisCo at the DISRPT 2025 Shared Task: A System for Discourse Relation Classification [6.1] 本稿では,ジョージタウン大学の DisRPT 2025 共用課題である DeDisCo について述べる。
オープンなQwenモデルを用いてmt5ベースのエンコーダとデコーダベースのアプローチの2つのアプローチをテストする。
本システムは,71.28のマクロ精度スコアを達成し,結果に対する解釈と誤り解析を行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:27:23 GMT)
Watson: A Cognitive Observability Framework for the Reasoning of LLM-Powered Agents [6.0] 大規模言語モデル(LLM)は、ますます自律システムに統合され、Agentwareと呼ばれる新しい種類のソフトウェアを生み出している。
本稿では,エージェント決定の背後にある暗黙の推論を回復し,検査する能力である認知的可観測性の概念を紹介する。
本稿では,LLMエージェントの行動変化を伴わない推論過程を観察するフレームワークであるWatsonについて述べる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:47:46 GMT)
Leveraging Familiarity with Television to Enrich Older Adults' Engagement and Wellbeing: A Feasibility Study Using Video Probes [6.0] インドでは、多世代家族から核家族へと移行し、高齢者が独立して暮らすことを支援する必要性が高まっている。
本研究は, 高齢者の日常技術利用と課題を探求し, 生活の質を高めるためにテレビを活用できるかを検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:31:51 GMT)
Multimodal Learning for Fake News Detection in Short Videos Using Linguistically Verified Data and Heterogeneous Modality Fusion [5.9] 現在の手法は、短いビデオコンテンツのダイナミックでマルチモーダルな性質に苦しむことが多い。
本稿では,ビデオ,音声,テキストデータを統合して,短いビデオコンテンツの信頼性を評価する新しいフレームワークであるHFNを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:24:57 GMT)
From Capabilities to Performance: Evaluating Key Functional Properties of LLM Architectures in Penetration Testing [5.8] 大規模言語モデル(LLM)は、浸透テストの自動化や強化にますます使用されているが、その有効性とアタックフェーズ間の信頼性は未定である。
本稿では, 単一エージェントからモジュール設計まで, 現実的な浸透試験シナリオにおける複数のLCMエージェントの包括的評価を行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:57:06 GMT)
Towards Supporting QIR: Steps for Adopting the Quantum Intermediate Representation [5.7] 既存の量子回路シミュレータをQIRランタイムに変換する方法を示す。
QIRへの切り替えは、元のシミュレータと比べてパフォーマンス上の欠点を伴わない。
本稿では,QIRを用いた今後の方向性を概観する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:34:11 GMT)
Contrastive Learning with Spectrum Information Augmentation in Abnormal Sound Detection [5.7] 外周露光法は、教師なしの異常音検出問題に対処するための効果的なアプローチである。
生物学的知覚とデータ解析に基づいて、異常な音声と雑音が高頻度で発生することが判明した。
コントラスト学習における高周波情報のためのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:10:31 GMT)
On the (In)Significance of Feature Selection in High-Dimensional Datasets [5.6] 機能の小さなランダムなサブセット(0.02-1%)は、完全な特徴セットとFSの両方の予測性能にマッチまたは優れる。
結果は、計算的に選択された特徴が有意義な信号を確実に捉えているという仮定に挑戦する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:26:10 GMT)
Measuring Risk of Bias in Biomedical Reports: The RoBBR Benchmark [5.5] 本稿では,バイオメディカルペーパーの方法論的強度を測定するためのベンチマークを提案する。
我々は、体系的なレビューに使用されるリスク・オブ・バイアス・フレームワークについて説明する。
分析の結果,大規模言語モデルの推論と検索能力がリスク・オブ・バイアス評価の有効性に影響を及ぼすことが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:50:29 GMT)
A PCA Based Model for Surface Reconstruction from Incomplete Point Clouds [5.5] 不完全点雲データから表面再構成を行うための主成分分析に基づくモデルを提案する。
我々は、利用可能な点雲データから基盤表面の正規情報を推定するためにPCAを用いる。
また,提案手法を効果的に解くために,演算子分割法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:49:44 GMT)
When Secure Isn't: Assessing the Security of Machine Learning Model Sharing [5.5] 我々は,フレームワークやハブのセキュリティ姿勢を評価し,セキュリティ指向のメカニズムが真の保護を提供するかどうかを評価し,モデル共有を取り巻くセキュリティの物語をどのように捉えているかを調査した。
私たちの評価によると、ほとんどのフレームワークやハブは、セキュリティリスクに部分的に対処しています。
我々は、モデル共有問題が大半が解決され、そのセキュリティが共有に使用されるファイル形式によって保証されるという誤解を軽視する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:22:16 GMT)
Measurement-Driven Transitions between Area Law Phases [5.5] 3つの非可換射影測定を含む計測専用回路を導入・検討する。
このモデルには3つの異なる位相があり、2つの臨界線で区切られている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:54:35 GMT)
Permutation recovery of spikes in noisy high-dimensional tensor estimation [5.5] マルチスパイクテンソル問題に対する高次元流れのダイナミクスについて検討する。
我々の研究は, 正確な回収に必要なSNRの試料分離条件を決定する論文[Ben A, Gerbelot, Langevin]に基づく。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:18:44 GMT)
Hybrid Lie semi-group and cascade structures for the generalized Gaussian derivative model for visual receptive fields [5.4] 受動的場応答は幾何学的画像変換に強く影響される。
これを扱う一つの方法は、共変受容体族に視覚系を基礎付けることである。
本稿では,空間的場応答とリーテンポラル場応答の関係を導出する問題に対処する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:23:44 GMT)
Rhetorical XAI: Explaining AI's Benefits as well as its Use via Rhetorical Design [5.3] 本稿では,レトリックデザインを記述可能な人工知能(XAI)システムに組み込むことによる潜在的なメリットについて考察する。
Rhetoric Designは、AIシステムとユーザ間の説明のコミュニケーション的役割を分析するための有用なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:30:26 GMT)
ConfReady: A RAG based Assistant and Dataset for Conference Checklist Responses [5.2] ARR Responsible NLP Research checklist Webサイトは、"チェックリストは責任ある研究のためにベストプラクティスを促進するように設計されている"と述べている。
我々はConfReadyを紹介した。これは検索拡張世代(RAG)アプリケーションで、著者が自分の仕事を振り返り、会議チェックリストで著者を支援するのに使用できる。
チェックリストアシスタントを評価するために、1,975個のACLチェックリスト応答のデータセットをキュレートし、人間の回答の問題を解析し、評価サブセットに基づいてRAGとLarge Language Model(LM)をベンチマークする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:49:40 GMT)
Tiny is not small enough: High-quality, low-resource facial animation models through hybrid knowledge distillation [5.1] ゲーム開発における実機でリアルタイムな顔アニメーションモデルについて検討する。
私たちは、非常に小さな学生モデルを訓練するために、高性能な教師モデルを使用します。
メモリフットプリントを最大3.4MBまで削減し、将来のオーディオコンテキストを最大81msまで削減できる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:35:05 GMT)
Estimating Clinical Lab Test Result Trajectories from PPG using Physiological Foundation Model and Patient-Aware State Space Model -- a UNIPHY+ Approach [5.1] Photoplethysmogram (PHY) は、心血管動態を反映する非侵襲的、連続的に記録された集中治療単位(ICU)の信号である。
UNI+Labは,局所波形符号化のための大規模PPG基盤モデルと,長距離時間モデルのための患者対応Mambaモデルを組み合わせたフレームワークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:38:06 GMT)
ASTRA: A Negotiation Agent with Adaptive and Strategic Reasoning via Tool-integrated Action for Dynamic Offer Optimization [5.1] ASTRAはターンレベルの最適化のための新しいフレームワークで、対立するモデリングとTit-for-Tatの相互性という2つの基本原理に基づいている。
ASTRAは,(1)対応行動の解釈,(2)リニアプログラミング(LP)ソルバによるツール統合動作によるカウンターオフワの最適化,(3)戦略評価とパートナーの受け入れ確率に基づくオファーの選択の3段階からなる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:56:48 GMT)
LESS: Large Language Model Enhanced Semi-Supervised Learning for Speech Foundational Models Using in-the-wild Data [5.0] LESS (Large Language Model Enhanced Semi-supervised Learning) は、Large Language Models (LLMs) を用いて、アプリ内で生成された擬似ラベルを補正する汎用的なフレームワークである。
マンダリンASRとスペイン語と英語のAST評価で、LESSは一貫して利益を上げている。
私たちはこのレシピをオープンソースとしてリリースし、この分野のさらなる研究を支援しています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:40:33 GMT)
Relational Dissonance in Human-AI Interactions: The Case of Knowledge Work [4.7] 人為的な会話エージェントに固有の基本的なオントロジ的・リレーショナルなあいまいさは、個人がそれらに対して一貫したリレーショナルなスタンスを維持するのを困難にしている。
以上の結果から,このようなエージェントに対する人々の明瞭な姿勢は,インタラクション中に発生する関係力学とはしばしば異なることが示唆された。
本稿では,研究者,デザイナー,政策立案者の緊張感の認識を支援するために,関係不協和の概念を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:15:55 GMT)
Adaptive Client Selection via Q-Learning-based Whittle Index in Wireless Federated Learning [4.6] 無線フェデレートラーニング(FL)におけるクライアント選択問題の検討
We propose a scalable and efficient approach called the Whittle Index Learning in Federated Q-learning (WILF-Q)。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:24:50 GMT)
Signatures of a gravitational quantum vacuum on dynamics of massive particles [4.6] 真空状態における2つの大粒子と量子化重力場との相互作用について検討する。
自由粒子の場合、(i) は純粋にユニタリ力学をもたらすが、(ii) は散逸をもたらす。
線形バネを介して結合された2つの粒子に対して、(i)と(ii)は、微分運動モードの周波数シフト調和ラグにおいて異なるカットオフ依存性をもたらす。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:28:04 GMT)
AHA -- Predicting What Matters Next: Online Highlight Detection Without Looking Ahead [4.6] Ahaは、自然言語で記述されたタスクに対する各ビデオフレームの関連性を予測する自動回帰ハイライト検出フレームワークである。
Ahaはハイライト検出ベンチマークで最先端(SOTA)のパフォーマンスを達成する。
我々は、タスク指向の自然言語入力と連続ロボット中心のビデオが与えられた現実世界のロボティクスアプリケーションに対するAhaの可能性を探求する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:03:00 GMT)
TGPO: Tree-Guided Preference Optimization for Robust Web Agent Reinforcement Learning [4.5] 強化学習による Web エージェントのトレーニングには,クレジット割り当ての誤り,アノテーションコストの禁止,パースペリティの報奨など,重要な課題が伴う。
我々のフレームワークにはプロセス・リワード・モデルが組み込まれており、サブゴールの進行、冗長性の検出、行動検証を通じて、細かな報酬を自動的に生成する。
Online-Mind2Webと我々の自己構築したC-WebShopデータセットの実験は、TGPOが既存の手法よりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:13:09 GMT)
Clustering of Conditional Mutual Information via Quantum Belief-Propagation Channels [4.3] 条件付き相互情報(CMI)は近年,多体系における量子相関を特徴付ける重要な指標として注目されている。
そこで我々は,この問題の新しい定式化をEmphbelief propagation (BP) チャネルに基づいて導入する。
BPチャネルの準局所性を確立することはCMIの崩壊を意味し、したがって元の予想をより難解な問題に還元することを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:39:11 GMT)
From Coated to Uncoated: Scanning Electron Microscopy Corrections to Estimate True Surface Pore Size in Nanoporous Membranes [4.3] 従来の理解では、膜は一般的に10%の低表面ポロシティを持つ。
本研究では,無膜膜に対して細孔構造を推定し,細孔拡張をシミュレートするデジタル補正法を開発した。
以上の結果から, ナノ多孔膜の表面多孔性および細孔径が従来よりはるかに大きいことが示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:46:08 GMT)
LenslessMic: Audio Encryption and Authentication via Lensless Computational Imaging [4.2] 本稿では,ハイブリッド光ハードウェアベースの暗号化手法であるLenslessMicを紹介する。
LenslessMicは、256ビットのデジタル標準の検索スペースに匹敵する、オーディオ記録の堅牢な認証と暗号化強度を実現する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:59:30 GMT)
Measuring Lexical Diversity of Synthetic Data Generated through Fine-Grained Persona Prompting [4.1] 我々はペルソナ駆動の合成プロンプトと応答の多様性を測定する。
ペルソナ記述の詳細な詳細が生成したテキストの多様性にどの程度寄与するかを検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:31:58 GMT)
SecReEvalBench: A Multi-turned Security Resilience Evaluation Benchmark for Large Language Models [4.0] 本稿ではSecReEvalBench, Security Resilience Evaluation Benchmarkを紹介する。
Prompt Attack Resilience Score、Prompt Attack Refusal Logic Score、ChainベースのAttack Resilience Score、ChainベースのAttack Rejection Time Scoreの4つの新しいメトリクスを定義している。
また、中立的なプロンプトと悪意のあるプロンプトの両方を組み込んだ、ベンチマーク用にカスタマイズされたデータセットも導入しています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:59:06 GMT)
Psychometric Personality Shaping Modulates Capabilities and Safety in Language Models [3.9] 本稿では,ビッグファイブの枠組みに根ざした心理測定的パーソナリティコントロールが,能力と安全性ベンチマークの文脈におけるAI行動にどのように影響するかを検討する。
WMDP, TruthfulQA, ETHICS, およびSycophancyなどのベンチマークでは, 安全性関連指標が大幅に低下する。
これらの知見は、安全性と一般的な能力の両方と相互作用するモデル制御の強力で過小評価された軸としてのパーソナリティ形成を強調した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:19:56 GMT)
Angelfish: Consensus with Optimal Throughput and Latency Across the Leader-DAG Spectrum [3.9] 我々は、このデザイン空間にわたってスムーズに適応するハイブリッドプロトコルであるAngelfishを紹介します。
Angelfishは、動的に調整された一部のパーティが、DAGの頂点を確実に放送するのではなく、最善の放送を使って軽量な投票を発行する。
我々の経験的評価によると、Angelfishはリードベースのプロトコルのレイテンシを適度なスループットでマッチングしながら、最先端のピークスループットを実現している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:30:25 GMT)
We Need to Measure Data Diversity in NLP -- Better and Broader [3.9] 本論では,NLPデータセットにおけるデータ多様性の測定における概念的,方法論的課題について考察する。
学際的な観点はよりきめ細かな、有効な尺度を開発するのに不可欠である、と論じている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:15:26 GMT)
Chunk Based Speech Pre-training with High Resolution Finite Scalar Quantization [3.7] 本稿では,ストリーミングとオフライン両方の事前学習のための統合ソリューションとして,チャンクベースの自己教師型学習(Chunk SSL)アルゴリズムを提案する。
チャンクSSLはマスク付き予測損失に最適化され、音響エンコーダはそれらのマスク付き音声フレームのインデックスを復元するよう推奨される。
scLibri と textscMust-C データセットによる実験結果から,提案手法は,ストリーミングモードとオフラインモードの両方において,音声からテキストへのタスクに対して非常に競争力のある結果が得られることが示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:29:59 GMT)
Inference Offloading for Cost-Sensitive Binary Classification at the Edge [3.7] 我々は、偽陰性が偽陽性よりもコストがかかるエッジインテリジェンスシステムにおける二項分類問題に焦点を当てる。
本稿では,局所モデルの信頼度スコアにしきい値のペアを連続的に適応させるオンライン学習フレームワークを提案する。
より一般的な非校正モデルの場合、オンラインの2次元階層的推論ポリシーであるH2T2を導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:49:40 GMT)
Accurate Thyroid Cancer Classification using a Novel Binary Pattern Driven Local Discrete Cosine Transform Descriptor [3.7] 我々は特徴抽出に重点を置いた甲状腺癌分類のための新しいCADシステムの開発を行った。
われわれは新しい記述子をバイナリパターン駆動型局所離散コサイン変換(BPD-LDCT)と呼ぶ。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:54:04 GMT)
Random Direct Preference Optimization for Radiography Report Generation [3.6] 医用画像解析において放射線診断報告生成(RRG)が注目されている。
既存の方法はまだ実際の臨床環境での展開に必要な品質を達成できていない。
DPO(Direct Preference Optimization)を用いたRRGの精度向上のためのモデルに依存しないフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:53:45 GMT)
What is a good matching of probability measures? A counterfactual lens on transport maps [3.4] 確率測度の結合は統計学と機械学習における多くの問題の核心にある。
まず、巡回単調写像、量子保存写像、三角形単調写像の3つの構成について比較分析する。
因果グラフの条件と、正則写像が古典的な統計的輸送と一致する構造方程式を同定する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:33:55 GMT)
It Depends: Resolving Referential Ambiguity in Minimal Contexts with Commonsense Knowledge [3.3] マルチターン会話における参照あいまいさを解決するために,大言語モデルがコモンセンスを活用できるかどうかを検討する。
DeepSeek v3, GPT-4o, Qwen3-32B, GPT-4o-mini, Llama-3.1-8B を LLM-as-Judge および人間のアノテーションを用いて試験した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:49:26 GMT)
PAN: Pillars-Attention-Based Network for 3D Object Detection [3.3] 本研究では,鳥眼ビュー(BEV)におけるカメラとレーダーを用いた新しい3次元物体検出アルゴリズムを提案する。
我々のアルゴリズムは、特徴を検知ヘッドに融合する前にレーダーの利点を利用する。
新しいバックボーンが導入され、レーダー柱の特徴を埋め込み次元にマッピングする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:40:49 GMT)
From Development to Deployment of AI-assisted Telehealth and Screening for Vision- and Hearing-threatening diseases in resource-constrained settings: Field Observations, Challenges and Way Forward [3.3] 視覚や難聴の病気は、特に資源に制約のある環境では、予防可能な障害を引き起こす。
私たちは、スケーラブルなAI支援Telehealthとスクリーニングを採用するための、開発における課題と方法に関する洞察を提供します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:42:11 GMT)
Inceptive Transformers: Enhancing Contextual Representations through Multi-Scale Feature Learning Across Domains and Languages [3.3] Transformerモデルは、シーケンス内のすべてのトークンから1つの[/]トークンに情報を圧縮して、グローバルなコンテキストを表現する。
このアプローチは、きめ細かい機能や階層的な特徴を希薄化し、局所的なパターンが重要である下流のタスクで情報を失うリスクがある。
本稿では,トランス層上に位置するインセプションスタイルの1-D畳み込みモジュールを提案し,マルチスケールな局所的特徴を持つトークン表現を拡大する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:29:42 GMT)
Aircraft Fuel Flow Modelling with Ageing Effects: From Parametric Corrections to Neural Networks [3.2] 本稿では,エアバスA320-214の燃料流量予測にエンジンの時効効果を統合するためのアプローチについて検討する。
我々は、9つの異なる機体から約19万回のクイックアクセスレコーダー飛行の包括的なデータセットを使用しており、運用期間は様々である。
その結果, 従来の航空機の燃料消費を常に過小評価するベースラインモデルでは, 年齢依存補正係数とニューラルモデルを用いることで, バイアスを大幅に低減し, 予測精度を向上させることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:06:55 GMT)
The Impact of AI Adoption on Retail Across Countries and Industries [3.1] 本研究では、Global AI Content Impactデータセットを用いて、人工知能(AI)の採用が失業率に与える影響について検討する。
このパネルは、オーストラリア、中国、フランス、日本、英国で10の業界で200の産業年次観測で構成されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:32:52 GMT)
ToFU: Transforming How Federated Learning Systems Forget User Data [3.1] ニューラルネットワークは意図せずトレーニングデータを記憶し、フェデレーション学習(FL)システムにおけるプライバシリスクを生成する。
本稿では,学習過程の変換を取り入れ,特定のインスタンスの記憶を減らし,学習から学習までの変換誘導型フェデレート・アンラーニング(ToFU)フレームワークを提案する。
ToFUは既存のFederated Unlearningメソッドのパフォーマンスを改善するためのプラグイン・アンド・プレイフレームワークとして機能する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:54:25 GMT)
Highly Imbalanced Regression with Tabular Data in SEP and Other Applications [3.1] 我々は1000以上の不均衡比を持つデータを用いた不均衡回帰について検討した。
本稿では,相関,モノトニック・インボリューション(MDI)の重要性,階層化サンプリングを取り入れたCISIRを提案する。
実験結果から, CISIRは近年の手法に比べて誤差が低く, 相関性も高いことが示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:26:58 GMT)
KRAST: Knowledge-Augmented Robotic Action Recognition with Structured Text for Vision-Language Models [3.1] 我々は、ドメイン固有知識に富んだ視覚言語モデルを活用することで、ロボット知覚のための屋内日常生活行動の映像ベース認識を推進した。
フリーズされたVLMバックボーンに学習可能なプロンプトとして,各アクションのクラスレベルのテキスト記述を組み込むプロンプト学習フレームワークを適用した。
ETRI-Activity3Dデータセットの実験では、テスト時にRGBビデオ入力のみを使用して95%以上の精度を達成し、最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:12:49 GMT)
Mental Accounts for Actions: EWA-Inspired Attention in Decision Transformers [2.9] オンライン決定変換器(EWA-VQ-ODT)のためのベクトル量子化を用いた経験量アトラクションを提案する。
EWA-VQ-ODTは、最近の成功と失敗をまとめた、アクションごとのメンタルアカウントを保持する軽量モジュールである。
標準の連続制御ベンチマークでは、EWA-VQ-ODTはサンプル効率とODTに対する平均リターンを改善している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 00:33:22 GMT)
Foundation Models as World Models: A Foundational Study in Text-Based GridWorlds [2.9] ファンデーションモデル(FM)は、幅広い知識と推論能力を持つため、サンプル効率を改善するための自然な候補である。
我々は,FMの事前知識を活かした基礎世界モデル(FWM)を用いて,シミュレーションインタラクションによるエージェントの訓練と評価を行う。
第2に、意思決定にFMの推論能力を利用する基礎エージェント(FA)について検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:10:28 GMT)
A Data-Driven Review of Remote Sensing-Based Data Fusion in Precision Agriculture from Foundational to Transformer-Based Techniques [2.9] このレビューは、AI駆動のデータ融合技術による精密農業の進歩に関する貴重な洞察を提供する。
我々は1994年から2024年までの研究動向を分析し、データ融合、リモートセンシング、AIによる農業モニタリングにおける重要な展開を特定した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:15:19 GMT)
How do Language Models Generate Slang: A Systematic Comparison between Human and Machine-Generated Slang Usages [2.9] Slangは、一般的に使われる非公式言語の一種であり、NLPシステムに挑戦している。
大規模言語モデル(LLM)の最近の進歩により、この問題はより親しみやすくなっている。
オンラインスラング辞書 (OSD) と GPT-4o と Llama-3 が生成するスラングを比較検討した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:49:27 GMT)
MoCA: Multi-modal Cross-masked Autoencoder for Digital Health Measurements [2.8] マルチモーダル・クロスマスクオートエンコーダ(Multi-modal Cross-masked Autoencoder, MOCA)は,トランスフォーマアーキテクチャとマスク付きオートエンコーダ(MAE)手法を組み合わせた自己教師型学習フレームワークである。
MoCAは、さまざまなベンチマークデータセット上で、再構築と下流分類タスク間で強力なパフォーマンス向上を示す。
当社のアプローチは、デジタルヘルス領域にまたがる幅広い応用で、未ラベルのマルチモーダルウェアラブルデータを活用するための新しいソリューションを提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:46:03 GMT)
A Modular Robotic System for Autonomous Exploration and Semantic Updating in Large-Scale Indoor Environments [2.8] 大規模未知環境の自律探索とセマンティック更新のためのモジュール型ロボットシステムを提案する。
本手法により,移動ロボットは,幾何学用2次元占有格子と対象意味論用トポロジカルグラフを統合したハイブリッドセマンティックマップの構築,再検討,更新を行うことができる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:22:29 GMT)
Pico: A Modular Framework for Hypothesis-Driven Small Language Model Research [2.8] Picoは軽量でモジュール化されたフレームワークで、中小規模の言語モデル開発のための体系的で仮説駆動型の研究を可能にする。
Picoは2つのライブラリで構成されており、研究者がモデルアーキテクチャやトレーニング手順のターゲット変更を行うための実用的なサンドボックスを提供する。
また、再現可能な実験を支援するため、標準条件下で訓練されたベースラインモデルであるピコデコーダのスイートをリリースし、コミュニティのためにオープンソース化した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:55:01 GMT)
How built environment shapes cycling experience: A multi-scale review in historical urban contexts [2.8] 我々は、都市計画、交通、行動科学、神経科学、公衆衛生に関する68の研究を体系的にレビューした。
生活環境として,客観的なプロキシ,主観的アカウントの限定的な統合,街路景観への注意の欠如等に,絶え間なく依存していることがわかった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:30:32 GMT)
Triplet Loss Based Quantum Encoding for Class Separability [2.8] 符号化回路は、古典的な顔認識アルゴリズムにインスパイアされた三重項損失関数を用いて訓練される。
MNISTおよびMedMNISTデータセット上の様々なバイナリ分類タスクで実施されたベンチマークテストは、同じVQC構造を持つ振幅符号化よりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:28:19 GMT)
Satellite-based communication for phase-matching measurement-device-independent quantum key distribution [2.8] 衛星ベースの量子通信のためのLinとL'utkenhausによって提案されたPM-MDI QKDプロトコル。
このプロトコルのキーレートは、リピータレスバウンドを超えることが知られており、ノイズ条件下では限界で評価される。
発見は、衛星ベースの量子通信において、信頼性の高い鍵レートを達成するためのPM-MDI QKDプロトコルの可能性を示している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:59:47 GMT)
ViDoRe Benchmark V2: Raising the Bar for Visual Retrieval [2.7] ViDoRe Benchmark V2では、視覚的なコンテキストクエリ、長いドキュメントクエリによる現実的で挑戦的な検索シナリオが導入されている。
4つの多言語データセットで構成され、明確な評価指示を提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:11:45 GMT)
LeakageDetector 2.0: Analyzing Data Leakage in Jupyter-Driven Machine Learning Pipelines [2.6] この研究は、機械学習(ML)エンジニアが、モデル内のデータ漏洩問題を識別し、修正することで、コードを強化するのを支援することを目的としている。
データ漏洩は、データサイエンスモデルを作成する際に、テストデータセットからの情報がトレーニングデータに不注意に含まれている場合に発生する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:27:27 GMT)
Spatio-Temporal Anomaly Detection with Graph Networks for Data Quality Monitoring of the Hadron Calorimeter [2.6] GraphSTADシステムは、検出器を横断する粒子によって誘導される局所的な空間特性を学習する。
提案手法の精度を検証し,多様なチャネル障害タイプを抽出する。
GraphSTADシステムは、実運用レベルの精度を実現し、HCALのリアルタイム監視のためにCMSコアプロダクションシステムに統合されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:27:04 GMT)
To Unpack or Not to Unpack: Living with Packers to Enable Dynamic Analysis of Android Apps [2.5] 本稿では,パッカーのアンチアナリシス手法を回避し,パッケージングされたアプリの動的解析を可能にするための回避エンジンであるPurifireを提案する。
評価の結果,Purifireはパッカーの抗分析チェックを回避でき,さらに重要な点として,パッカーに苦しむこれまでの研究で,大幅な改善が見られた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:29:25 GMT)
A Comparative Study of Rule-Based and Data-Driven Approaches in Industrial Monitoring [2.3] ルールベースのシステムは、高い解釈可能性、決定論的振る舞い、安定した環境における実装の容易さを提供する。
データ駆動システムは隠れた異常を検知し、予測保守と新しい条件への動的適応を可能にする。
本稿では、ルールベースの論理の透明性と機械学習の分析能力を組み合わせたハイブリッドソリューションを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:31:59 GMT)
ChronoForge-RL: Chronological Forging through Reinforcement Learning for Enhanced Video Understanding [2.3] 我々はChronoForge-RLと呼ばれる新しいビデオ理解フレームワークを提案する。
テンポラルアペックス蒸留(TAD)とキーフレーム対応グループ相対政策最適化(KF-GRPO)を組み合わせる。
提案したChronoForge-RLは,ビデオMMEでは69.1%,LVBenchでは52.7%,ベースライン法では52.7%である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:27:24 GMT)
The Moon's Many Faces: A Single Unified Transformer for Multimodal Lunar Reconstruction [2.3] マルチモーダル学習は、複数の分野にまたがる新たな研究課題であるが、惑星科学にはほとんど適用されていない。
複数のソース間で共有表現を学習するために訓練された単一統一型トランスフォーマーアーキテクチャを提案する。
本研究は,シェーディングから形状とアルベドを解くためのマルチモーダル学習の可能性を示し,大規模惑星3次元再構成のための新しいアプローチを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:50:11 GMT)
Modeling the Human Visual System: Comparative Insights from Response-Optimized and Task-Optimized Vision Models, Language Models, and different Readout Mechanisms [2.2] 視覚入力を用いた応答最適化モデルでは,早期・中期の視覚領域において,より優れた予測精度が得られることを示す。
言語的記述では捉えられない入力の知覚的特徴に敏感な視覚野の3つの異なる領域を同定する。
本稿では,意味的内容に基づいて受容場や特徴マップを変調し,既存のSOTAよりも3~23%精度が向上する手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 00:01:09 GMT)
Copyright and Competition: Estimating Supply and Demand with Unstructured Data [2.2] クリエイティブ産業における著作権の競争力と福祉効果について検討する。
世界最大のフォントマーケットプレースからのデータを用いて、スタイリングされたデザイン製品(フォント)について研究する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:39:06 GMT)
DeepMech: A Machine Learning Framework for Chemical Reaction Mechanism Prediction [2.2] 本稿では,化学反応機構を生成するための解釈可能なグラフベースディープラーニングフレームワークであるDeepMechを提案する。
DeepMechは、初歩予測において98.98 +/-0.12%の精度と完全なCRMタスクにおいて95.94 +/-0.21%の精度を達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:14:46 GMT)
Efficient Long-Tail Learning in Latent Space by sampling Synthetic Data [1.9] 不均衡な分類データセットは、機械学習に重大な課題をもたらす。
本稿では,視覚基礎モデルのリッチなセマンティック潜在空間を利用して合成データを生成し,単純な線形分類器を訓練する新しいフレームワークを提案する。
提案手法は,CIFAR-100-LTベンチマークの最先端性を新たに設定し,Places-LTベンチマークで高い性能を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:52:31 GMT)
Pod: An Optimal-Latency, Censorship-Free, and Accountable Generalized Consensus Layer [1.9] podはコンセンサスという新しい概念であり、その第一優先事項は、物理的に最適なレイテンシを2delta$で達成することである。
クライアントはすべてのレプリカにトランザクションを直接送信し、独立してトランザクションを処理し、それをローカルログに追加する。
ポッドコア(pod-core)は、トランザクション確認が2delta$以内で、ビザンチンのレプリカに対する検閲耐性、安全違反の責任など、プロパティを満たすプロトコルである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:06:57 GMT)
Matter-of-Fact: A Benchmark for Verifying the Feasibility of Literature-Supported Claims in Materials Science [1.8] 本稿では,仮説の妥当性をクレームとして決定するための課題データセットであるMatter-of-Factを紹介する。
ファクト・オブ・ファクトには、4つのインパクトの高い現代材料科学のトピックにまたがる科学論文から抽出された8.4kのクレームが含まれている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:39:25 GMT)
Once Upon a Time: Interactive Learning for Storytelling with Small Language Models [1.8] 我々は,高レベルの認知的フィードバックから学習することで,少ないデータで言語モデルを訓練できるかどうかを検討する。
私たちは、教師モデルが読みやすさ、物語のコヒーレンス、創造性を評価するストーリーを生成するために、学生モデルを訓練します。
対話型学習において100万ワードのインプットしか持たず、ストーリーテリングのスキルは410万ワードの次単語予測と同等に向上する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:45:34 GMT)
Experimenting with Affective Computing Models in Video Interviews with Spanish-speaking Older Adults [1.7] 本研究では、高齢者が人または仮想アバターと対話する映像を用いて、最先端の感情コンピューティングモデルを評価する。
この取り組みの一環として、人間対人間のビデオインタビューに従事しているスペイン語話者の高齢者を対象とした新しいデータセットを紹介した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:46:40 GMT)
On the Non-Uniqueness of Representation of $(U,N)$-Implications [1.7] ファジィ含意関数はファジィ論理系の基本作用素を構成する。
ファジィ否定が連続であっても、$(U,N)$-implicationsが必ずしも一意表現を持つとは限らないことを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:21:45 GMT)
Introducing Resizable Region Packing Problem in Image Generation, with a Heuristic Solution [1.7] 本稿では, 合成画像データ生成の文脈において, 古典的Bin Packing問題に対して, 実用的に有用な新しい表現を導入する。
そこで本稿では,任意の位置において任意の数の任意の形状領域を拡張・パッケージ化するアルゴリズムを提案する。
このアルゴリズムは、大規模な合成異常検出データセットを生成するために用いられた実装によって検証される。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:11:31 GMT)
Empty-Signal Detection: Proof-of-Principle Scheme for Arbitrarily Long-Distance Quantum Communication [1.6] 本稿では,量子通信受信機に対する空信号検出手法を提案する。
状態準備、制御ゲート、マルチコピー解析をひとつのブロックに統合する。
提案された設計は、実用的で商用でも利用可能なデバイスにのみ依存する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:32:42 GMT)
Failure Modes and Effects Analysis: An Experience from the E-Bike Domain [1.6] FMEA(Functional Failure Mode and Effects Analysis)は、ソフトウェア障害を特定し、その結果を評価する手法である。
本稿では,e-BikeドメインからCPSの安全性を解析するためにFMEAを使用した経験について述べる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:43:22 GMT)
Hierarchical Reinforcement Learning with Low-Level MPC for Multi-Agent Control [1.6] 強化学習(RL)による戦術的意思決定とモデル予測制御(MPC)による低レベル実行を組み合わせた階層的枠組みを提案する。
プレデター・プリーベンチマークでテストしたところ、我々のアプローチは報酬、安全性、一貫性の点でエンドツーエンドとシールドベースのRLベースラインよりも優れています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:27:15 GMT)
AI Copilots for Reproducibility in Science: A Case Study [1.6] オープンサイエンスのイニシアチブは、研究成果をより透明で、アクセス可能で、再利用可能なものにしようと試みているが、公表された発見が独立して再生できることを保証することは、依然として永続的な課題である。
この記事では、研究者、レビュアー、読者を支援するAIベースのプラットフォームであるOpenPubを紹介します。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:22:03 GMT)
Test-Time Learning and Inference-Time Deliberation for Efficiency-First Offline Reinforcement Learning in Care Coordination and Population Health Management [1.6] ケアコーディネートと人口健康管理プログラムはメディケイドと安全ネットの人口に役立っている。
そこで本研究では,(i)局所的な地域キャリブレーションによるテスト時間学習と,(ii)小さなQアンサンブルによる推論時間の検討により,トレーニング済みのポリシーを強化する,軽量なオフライン強化学習(RL)手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:41:47 GMT)
The Curious Case of Visual Grounding: Different Effects for Speech- and Text-based Language Encoders [1.6] 視覚的接地が単語のモデル内表現に影響を及ぼすことを示す。
また、音声とテキストベースの言語エンコーダにも異なる効果がある。
本研究は,視覚的インフォームド・セマンティクスを用いた音声モデルを構築する上で,より効率的な手法の開発に有用であることが示唆された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:16:58 GMT)
Representation-based Broad Hallucination Detectors Fail to Generalize Out of Distribution [1.4] 幻覚検出における現在のSOTAの有効性を批判的に評価した。
RAGTruthデータセットのパフォーマンスは、主にデータとの急激な相関によって駆動される。
幻覚検出のための一連のガイドラインとその評価法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:54:22 GMT)
Localmax dynamics for attention in transformers and its asymptotic behavior [1.4] 新たに離散時間アテンションモデルであるローカルマックスダイナミクスを導入し、与えられたトークンに対する影響を最大化するトークンだけが正の重みを持つことを示す。
局所マックス力学は有限時間収束を示さないことを示し、非ゼロ時間・時間変化アライメント感度パラメータを消失させる結果を与える。
また、古典的な意見力学からリアプノフに基づく手法を適用し、局所マックス相互作用の非対称な設定におけるそれらの制限を強調した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:18:30 GMT)
Evaluation of Causal Reasoning for Large Language Models in Contextualized Clinical Scenarios of Laboratory Test Interpretation [1.3] 本研究は,99の臨床基礎実験シナリオを用いて,大規模言語モデル(LLM)の因果推論を評価する。
ヘモグロビンA1c, クレアチニン, ビタミンDなどの実験室試験を行い, 年齢, 性別, 肥満, 喫煙などの関連要因と組み合わせた。
GPT-o1とLlama-3.2-8b-インストラクションの2つのモデルが試験され、医療訓練を受けた4人の専門家が回答した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:28:12 GMT)
Local Mechanisms of Compositional Generalization in Conditional Diffusion [1.3] 我々は、トレーニング中に見るよりも多くの物体で画像を生成することができる長さ一般化について研究する。
制御されたCLEVR設定では、長さの一般化はいくつかのケースでは達成できるが、他のケースでは達成できない。
次に,構成一般化のための構造機構としての局所性について検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:02:10 GMT)
Transfer learning under latent space model [1.3] 対象ネットワークに類似した潜伏変数を持つネットワークからの情報を活用する転送学習手法を提案する。
それぞれの段階で十分な同定条件を導出し, 予測のための予測勾配アルゴリズムを設計する。
2つの実データセットのシミュレーション研究と解析により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:25:54 GMT)
Modelling the Interplay of Eye-Tracking Temporal Dynamics and Personality for Emotion Detection in Face-to-Face Settings [1.3] 本研究は、視線追跡シーケンス、ビッグファイブの性格特性、文脈刺激を統合して、知覚と知覚の両方の感情を予測するパーソナリティ対応のマルチモーダル・フレームワークを提案する。
その結果、刺激が感情予測を強く促進する一方、性格特性は感情認識に最大の改善をもたらすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:05:23 GMT)
Time-adaptive SympNets for separable Hamiltonian systems [1.1] 分離ハミルトニアン系に対する普遍近似定理を提供し、非分離ハミルトニアン系へ拡張することは不可能であることを示す。
我々は、一般にシンプレクティックマップの近似に関する実質的な定理の証明において、誤りを修正するが、特にシンプレクティック機械学習の手法について述べる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:33:21 GMT)
AI Methods for Permutation Circuit Synthesis Across Generic Topologies [1.0] 提案手法では, 最大25キュービットまでの置換回路のほぼ最適合成を実現するために, 強化学習(RL)技術を用いる。
一般化矩形格子上に基礎モデルをトレーニングし、合成中にトポロジの部分集合を動的に選択するためにマスキング機構を用いる。
これにより、モデルを再訓練することなく、長方形格子内に埋め込まれる任意の位相上の置換回路の合成が可能になる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:28:22 GMT)
Limitations of Fault-Tolerant Quantum Linear System Solvers for Quantum Power Flow [1.0] 量子コンピュータは、古典的コンピュータにとって難解な問題を解くことを約束する。
現実的な量子優位性は、そのような問題を解くためにエンドツーエンドの時間が量子アルゴリズムで要求される時間を超える場合、そのような問題に対して存在すると言える。
QPFアルゴリズムの使用によるスピードアップは、最先端のアルゴリズムによって解決された古典的なPFと比較して指数関数であるとしばしば主張される。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:49:39 GMT)
How Exclusive are Ethereum Transactions? Evidence from non-winning blocks [1.0] 独占取引は、入賞ブロックでの取引で支払われる全手数料の84%を占める。
オンチェーンを含む排他的トランザクションの約7%は、単一のビルダにのみルーティングする送信者から来ている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:02:47 GMT)
Using Natural Language for Human-Robot Collaboration in the Real World [1.0] 私たちは、自律ロボットが、物理的な世界で複雑なタスクを遂行する際のアシスタントとして、人間と協力できる日というビジョンを持っています。
このビジョンでは、ロボットは人間にとって自然な言語を使って、人間の協力者とコミュニケーションをとることができる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:12:21 GMT)
FSLI: An Interpretable Formal Semantic System for One-Dimensional Ordering Inference [0.9] 論理的推論の一次元順序付け問題を解くシステムを開発した。
自然言語の前提と候補文を一階述語論理に変換する。
BIGbenchの論理推論タスクでは100%の精度を実現し、AR-LSATの構文的に単純化されたサブセットでは88%の精度を実現している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:45:35 GMT)
Architectural change in neural networks using fuzzy vertex pooling [0.9] 本論文ではファジィ頂点プールの概念に関する公式な枠組みを紹介する。
ニューラルネットワークへの応用について、その重要な特性の概要を提供する。
これは、ディープラーニングトレーニングの後期段階でのプーリングの制限を強調し、長期化や大規模化のアプリケーションでは効果を低下させる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:56:26 GMT)
SolarCrossFormer: Improving day-ahead Solar Irradiance Forecasting by Integrating Satellite Imagery and Ground Sensors [0.9] SolarCrossFormerは、日頭照射予測のための新しいディープラーニングモデルである。
地上の気象観測所のネットワークから衛星画像と時系列を合成する。
スイスのあらゆる場所で、最大24時間前の地平線を15分間の解像度で予測する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:57:40 GMT)
Giant shot noise in superconductor/ferromagnet junctions with orbital-symmetry-controlled spin-orbit coupling [0.9] 測定により、軌道対称性制御された近接効果のほとんど未解明な含意が明らかになった。
ジョゼフソン接合部と2つの超伝導体との接合部から得られる改良ショットノイズは,1つの超伝導体においても測定可能であることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:50:11 GMT)
From Canopy to Ground via ForestGen3D: Learning Cross-Domain Generation of 3D Forest Structure from Aerial-to-Terrestrial LiDAR [0.8] ForestGen3Dは、空中LiDAR(ALS)入力のみを使用して高忠実度3D森林構造を合成する新しい生成モデリングフレームワークである。
幾何学的類似性や生物物理学的指標の観点から,TLS参照と密に一致した高忠実度再構成が可能であることを示す。
以上の結果から,フォレストGen3DはALSのみの環境下での環境モデリング,山火事シミュレーション,構造燃料のキャラクタリゼーションのためのスケーラブルなツールとして位置づけられた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:39:50 GMT)
Flying Drones to Locate Cyber-Attackers in LoRaWAN Metropolitan Networks [0.8] FOLLOWMEプロジェクトは、無線スペクトルの不正使用中にUAVを使用して攻撃者を発見・追跡する可能性について調査している。
主な目的は、ネットワークテレメトリと無線ローカライゼーションを統合するサイバー物理セキュリティフレームワークを開発することである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:56:48 GMT)
Examining Deployment and Refinement of the VIOLA-AI Intracranial Hemorrhage Model Using an Interactive NeoMedSys Platform [0.8] 現在の研究では、AIモデルの効率的なデプロイメントと改善を可能にする、NeoMedSysと呼ばれる放射線学ソフトウェアプラットフォームについて説明している。
実地臨床環境でのNeoMedSysの実行可能性と有効性について検討した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:50:53 GMT)
Methods for Reducing Ancilla-Overhead in Block Encodings [0.8] 我々は、任意のブロックエンコーディングに対して、そのアンシラの1つを除いてほとんど計算されないアルゴリズムを導出した「時空トレードオフ」の存在を証明した。
ブロック符号化の近似乗算は, 1つのアンシラで高精度に実現できることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:41:03 GMT)
Enhancing Financial RAG with Agentic AI and Multi-HyDE: A Novel Approach to Knowledge Retrieval and Hallucination Reduction [0.6] 我々は、金融レトリヴァル強化世代(RAG)のための枠組みを導入する。
RAGは、大規模で構造化された財務コーパスからの検索の有効性とカバレッジを高めるために、複数の無意味なクエリを生成する。
私たちのパイプラインはトークン効率と多段階の財務推論に最適化されています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:24:30 GMT)
Software Development Aspects of Integrating Linear Algebra Libraries [0.6] 本稿では,Ginkgoの採用におけるアプリケーションソフトウェアの課題とメリットについて論じる。
CFD、電力グリッドシミュレーション、および心電生理学などの異なる領域の例を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:27:45 GMT)
Activation Space Interventions Can Be Transferred Between Large Language Models [0.6] モデル間での安全介入は、共有活性化空間の学習されたマッピングを通して伝達可能であることを示す。
このアプローチは、バックドアの除去と有害なプロンプトの拒絶という、確立された2つのAI安全タスクに対して実証する。
また、バックドアに関連付けられた知識を組み込むために、モデルに微調整を施した新しいタスク、textitcorrupted機能を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:03:59 GMT)
FMD-TransUNet: Abdominal Multi-Organ Segmentation Based on Frequency Domain Multi-Axis Representation Learning and Dual Attention Mechanisms [0.6] 本稿では,FMD-TransUNetと命名された腹腔内多臓器分割のための新しいフレームワークを提案する。
マルチ軸外部重みブロック(MEWB)と改良されたデュアルアテンションモジュール(DA+)をTransUNetフレームワークに統合する。
他の最先端の方法よりも優れており、腹部8臓器に平均81.32%、HDは16.35mmである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:53:55 GMT)
From Service-Oriented Computing to Metaverse Services: A Framework for Inclusive and Immersive Learning for Neurodivergent Students [0.5] メタバースは、ニューロディバージェントな学生に没入的で適応的な学習環境を提供する。
従来のサービス指向コンピューティングを超えた進化としてメタバースサービスを利用する汎用フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:00:38 GMT)
LogStamping: A blockchain-based log auditing approach for large-scale systems [0.5] 本稿ではブロックチェーンベースのログ管理フレームワークを提案する。
このフレームワークは、ハイブリッドオンチェーンとオフチェーンストレージモデルを統合する。
大規模システムで典型的な高ボリュームログ生成を扱うように設計されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:10:30 GMT)
Predicting the descent into extremism and terrorism [0.5] 提案システムは,機械学習(ML)に対応可能な形式でエンコードされた文のオンライン照合,符号化されたテキストを分類するMLコンポーネント,トラッカー,結果分析のための可視化システムを含む。
検出と追跡のコンセプトは、wikiquote.orgから取得したテロリスト、過激派、選挙運動家、政治家による引用を用いてテストされている。
このシステムは、839の引用文のデータセットを使用して、過激主義の81%の時間とテロリズムに関連する意図と態度を正確に検出することができた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:26:02 GMT)
Efficient Extractive Text Summarization for Online News Articles Using Machine Learning [0.5] 本稿では,高度な機械学習技術を用いた抽出テキスト要約の課題について論じる。
BERT埋め込みを利用してテキストデータを数値表現に変換するパイプラインを開発した。
その結果, LSTMネットワークは, 逐次的依存関係をキャプチャする機能を備え, F1スコアにおけるベースライン法, ROUGE-1メトリクスよりも優れていた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:28:57 GMT)
How Large Language Models are Designed to Hallucinate [0.4] 幻覚はトランスフォーマーアーキテクチャの構造的な結果であると主張する。
本研究の貢献は,(1) 既存の説明が不十分な理由を示す比較説明,(2) 提案されたベンチマークによる実存的構造に関連付けられた幻覚の予測分類,(3) 開示の欠如を抑えることの可能な「真理に制約された」アーキテクチャへの設計方針,の3つである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:46:27 GMT)
TennisTV: Do Multimodal Large Language Models Understand Tennis Rallies? [0.4] TennisTVはテニスビデオ理解のための最初の、そして最も包括的なベンチマークである。
ラリーレベルとストロークレベルの8つのタスクをカバーし、2500人の人間認証された質問を含んでいる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:08:05 GMT)
Understanding AI Evaluation Patterns: How Different GPT Models Assess Vision-Language Descriptions [0.4] 本研究ではNVIDIAのDescribe Anything Modelによって生成された視覚言語記述を分析する。
3種類のGPT変異体(GPT-4o, GPT-4o-mini, GPT-5)を評価し, 異なる「評価人格」を明らかにする。
GPT-4o-miniは最小分散の系統的整合性を示し、GPT-4oはエラー検出時に優れ、GPT-5は高い可変性を持つ極端保存性を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:57:35 GMT)
GRPO-LEAD: A Difficulty-Aware Reinforcement Learning Approach for Concise Mathematical Reasoning in Language Models [0.4] グループ相対政策最適化(GRPO)はR1のような推論モデルで広く採用されている。
GRPO-LEAD は,(1) 精度を維持しながら簡潔さを向上するための長規則化報酬,(2) モデル精度を向上させるための不正解に対する明確な罰則,(3) 難解な問題に対する堅牢な一般化のための困難に配慮した有利な再重み付けを提案する。
提案手法は,14Bスケールモデルに対する最先端性能を実現し,適切なモデルスケールと高品質なデータを用いた手法の相乗効果を実証する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:06:38 GMT)
Hornet Node and the Hornet DSL: A Minimal, Executable Specification for Bitcoin Consensus [0.4] 我々は、メインネットを数時間でチップにシンクするBitcoinコンセンサスルールのC++仕様を1スレッドで提示する。
また、これらのルールをあいまいにコード化するように設計されたHornet Domain-Specific Language(Hornet DSL)を紹介します。
私たちは、Hornet NodeとHornet DSLが、Bitcoinコンセンサスの純粋で形式的で実行可能な仕様への最初の信頼できるパスを提供する、と論じています。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:30:27 GMT)
Learning Centre Partitions from Summaries [0.2] 中心をまたいだパラメータの均一性はしばしば違反し、評価の前に、等式とエンフリーン中心群を両立させる動機付け法がしばしば犯される。
等式が拒否されない場合にのみ中心(またはブロック)をマージする逐次テスト駆動型EmphClusters-of-Centres(CoC)アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:25:06 GMT)
Spatio-temporal, multi-field deep learning of shock propagation in meso-structured media [0.2] 本研究では、7つの結合したフィールドを1つの自己回帰的サロゲートに統一するマルチフィールド深層学習モデル(MSTM)を提案する。
MSTMは直接シミュレーションの約1000倍の速度で動作し、多孔質材料では4%未満、格子構造では10%未満の誤差を達成している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:38:39 GMT)
Optimizing Product Deduplication in E-Commerce with Multimodal Embeddings [0.1] 電子商取引分野向けに設計されたスケーラブルでマルチモーダルな製品重複を導入します。
提案手法では,BERTアーキテクチャを基盤としたドメイン固有テキストモデルとMaskedAutoEncodersを併用して画像表現を行う。
これらの特徴抽出機構を最適化されたベクトルデータベースであるMilvusと統合することにより,より効率的かつ高精度な類似性探索を実現することができる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:49:39 GMT)
Entanglement Asymmetry for Higher and Noninvertible Symmetries [0.1] エンタングルメント非対称性は量子系において観測可能である。
本稿では、一般化有限対称性に対する非対称性を定義する。
我々は(1+1)次元理論の詳細な応用について研究する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:00:01 GMT)
Efficient Transition State Searches by Freezing String Method with Graph Neural Network Potentials [0.1] 有機反応の遷移状態探索を高速化するグラフニューラルネットワーク(GNN)PESを開発した。
我々のモデルは100%の成功率を達成し、すべてのケースにおいて基準TSを配置する。
ファインチューニングは、アウト・オブ・ディストリビューションケースの桁違いのGNN-FT誤差を低減する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:42:33 GMT)
A global view of diverse construction methods of fuzzy implication functions rooted on F-chains [0.1] 本研究では,既存のファジィ含意関数から新たなファジィ含意関数を生成する構築法について検討する。
我々の一般化は単体ではなくファジィ含意関数の集合を用いる。
提案手法では, コントラフィケーション, アグリゲーション, 一般化された垂直/水平しきい値法などの各種工法を再現可能であることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:14:17 GMT)
A review of Recent Techniques for Person Re-Identification [0.1] 監視における重要なタスクである人物の再識別は、異なるカメラビューで個人をマッチングする。
教師付きアプローチの成功は、大量の注釈付きデータに依存し、データラベリングと計算コストにおいてスケーラビリティ上の課題を提起する。
近年、教師なしの人物再識別に移行している。豊富なラベル付きデータを活用し、教師なしの手法は、ペアラベル付きデータの必要性を克服することを目的としている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:47:57 GMT)
Efficient distributed inner product estimation via Pauli sampling [0.0] クロスプラットフォーム検証は、異なる物理プラットフォームで生成された出力状態を比較するタスクである。
パウリサンプリングに基づく新しいプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:01:51 GMT)
Quantum Enhanced Anomaly Detection for ADS-B Data using Hybrid Deep Learning [0.0] 本稿では,量子特性が異常検出に与える影響を探索するために,量子と古典的機械学習を組み合わせた新しい手法を提案する。
本稿では,Hybrid-Fully Connected Quantum Neural Network(H-FQNN)の性能と損失関数を比較し,ADS-Bデータセットを用いてその性能を評価する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:59:36 GMT)
When Bugs Linger: A Study of Anomalous Resolution Time Outliers and Their Themes [0.0] 本研究では,7つの有名なオープンソースリポジトリを対象とした,バグ解決異常の包括的解析を行った。
私たちの調査では、テストの失敗や要求の強化、ユーザインターフェースの問題など、プロジェクト間で一貫したパターンが明確になりました。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:39:23 GMT)
Watermarking and Anomaly Detection in Machine Learning Models for LORA RF Fingerprinting [0.0] 本稿では,疑わしい入力を見つけるために,所有権証明のための透かしと異常検出を併用したより強力なRFFIシステムを提案する。
LoRaデータセットでは、94.6%の精度、98%の透かし成功、0.94のAUROCを達成し、検証可能な改ざん防止認証を提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:16:33 GMT)
Unveiling Entanglement's Metrological Power: Empirical Modeling of Optimal States in Quantum Metrics [0.0] 量子状態の計量的能力と3つの異なる絡み合い尺度の間に強い経験的関係を示す。
実世界の量子センシングプロトコルへの即時適用により、我々の研究結果は量子資源理論からの重要な予測を直接的に検証する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:11:32 GMT)
Training A Neural Network For Partially Occluded Road Sign Identification In The Context Of Autonomous Vehicles [0.0] 交通標識の部分的閉塞が認識に与える影響について検討した。
我々は、96%の精度で達成したカスタム畳み込みニューラルネットワーク(CNN)の性能を、転送学習を用いてトレーニングされたモデルと比較した。
さらなる実験により、完全に見える標識のみに訓練されたモデルは、閉鎖された標識を認識すると効果を失うことが判明した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:47:24 GMT)
Torsion in Persistent Homology and Neural Networks [0.0] 我々は、符号化中にねじれが失われ、潜伏空間で変化し、多くの場合、標準デコーダによって再構成されないことを示す。
本研究は, フィールドベースアプローチの重要な限界を明らかにし, ねじれ情報を保存するアーキテクチャや損失項の必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:38:48 GMT)
Theory of Multi-photon Processes for Applications in Quantum Control [0.0] 本稿では、周期的に駆動される量子システムにおける多光子過程を評価するための一般的な理論的枠組みを提案する。
超伝導フラクソニウム量子ビットにおける多光子ラビ振動の研究に応用して、この枠組みの有効性を実証する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:21:32 GMT)
The basic ideas of quantum mechanics [0.0] これは、これらの基本的なギアがQMの美しい数学でどのように組み合わせられているかを示すものではない。
これは、一見難解な数学的枠組みで記述された量子現実に関する直感的な(テクタンシュトーリッヒ)考えを与える。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:49:18 GMT)
The Dilemma Between Euphoria and Freedom in Recommendation Algorithms [0.0] 今日のAIレコメンデーションアルゴリズムは、ユーホリアと自由の間の人間のジレンマを生み出します。
人間の自由の概念は、既に存在するものを満たすのではなく、ユーザーにとって馴染みの無い利益を促進するものである。
その結果、人間の新しいアイデンティティが生まれました。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:27:19 GMT)
The Alignment Bottleneck [0.0] ループを2段階のカスケード$U to H to Y$ given$S$、認知能力$C_textcog|S$、平均総容量$barC_texttot|S$としてモデル化する。
これは、分離可能なコードブックと、KL項が$m, barC_texttot|S$で同じチャネルで制御されるPAC-Bayes上界とで証明されたデータサイズ非依存のファノ下界をペアする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:38:30 GMT)
The (Short-Term) Effects of Large Language Models on Unemployment and Earnings [0.0] 2022年末にChatGPTがリリースされて以降、大規模な言語モデルが急速に普及し、生産性が大幅に向上しただけでなく、雇用の移転も懸念されている。
本稿では,LLM導入による短期労働市場効果を,これらの技術への露出レベルが異なる職業間の利益と失業率を比較して検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:20:28 GMT)
Testing Quantum Mechanics with Quantum Computers: Qubit Information Capacity [0.0] ヒルベルト空間が量子波動関数の情報理論の性質を隠すというホイーラーの主張により、複素ヒルベルト空間の特定の離散化が提案される。
任意の$N ge N_mathrmmax$-qubit状態に対して、複素ヒルベルト空間によって要求される2N+1-2$自由度それぞれに1ビットでも割り当てるには、$N$ qubitsには不十分な情報がある。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:12:31 GMT)
TESSERA: Precomputed FAIR Global Pixel Embeddings for Earth Representation and Analysis [0.0] 本稿では,EO時系列の画素指向基礎モデルであるTESSERAを提案する。
128次元の潜伏埋め込みを生成し、タスク固有のトレーニングのためにラベルを数個だけ必要とします。
使いやすさ、スケール、正確さは前例がない。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:49:04 GMT)
SyGra: A Unified Graph-Based Framework for Scalable Generation, Quality Tagging, and Management of Synthetic Data [0.0] 大規模言語モデル(LLM)のための総合的な合成データ生成フレームワークを提案する。
本手法では,手作業による介入を最小限に抑えた複雑な対話フローをモデル化可能なモジュール型および構成型パイプラインを用いる。
得られたデータセットは、SFTとDPOの両方のユースケースをサポートするフレキシブルなスキーマの下で構成され、多様なトレーニングへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:53:25 GMT)
Subtleties in the pseudomodes formalism [0.0] 擬モードの有効単粒子非エルミート・ハミルトンの非対角化性は、有効スペクトル密度の項に導かれることを示す。
また,スペクトル密度に適合する疑似モードパラメータを構築する手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:39:52 GMT)
Small LLMs with Expert Blocks Are Good Enough for Hyperparamter Tuning [0.0] 我々は小言語モデルを用いたHPTのためのエキスパートブロックフレームワークを提案する。
Trajectory Context Summarizer (TCS)は、生のトレーニング軌跡を構造化されたコンテキストに変換する決定論的ブロックである。
TCS対応HPTパイプラインは、6つのタスクでGPT-4の0.9パーセントの範囲で平均性能を達成する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:46:42 GMT)
Single-Round Deterministic Quantum Anonymous Veto Using Bell States [0.0] 量子匿名ベト (QAV) プロトコルは、セキュアで匿名な意思決定を可能にする。
既存のQAVスキームは強力な理論的保証を提供するが、実用的な実装では制限に直面している。
本稿では, 1ラウンドで決定的ベト検出を実現するための新しい決定論的QAVプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:01:43 GMT)
Short-Term Regional Electricity Demand Forecasting in Argentina Using LSTM Networks [0.0] 本研究では,アルゼンチン・コルドバ市における短期的時間電力需要予測のためのディープラーニングモデルの開発と最適化について述べる。
このモデルは予測精度が高く、平均絶対パーセンテージ誤差は3.20%、決定係数は0.95である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:20:49 GMT)
Schottky anomaly in a cavity-coupled double quantum well [0.0] 二重量子井戸に閉じ込められたメソスコピックな二次元電子ガスについて検討する。
我々は、仮想サブバンド間遷移に参加する多数の電子の体制に焦点をあてる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:48:13 GMT)
SLaM-DiMM: Shared Latent Modeling for Diffusion Based Missing Modality Synthesis in MRI [0.0] 脳MRIスキャンは、T1強調画像(T1ceとT1w)、T2強調画像(T2w)、Frairの4つのモードでしばしば見られる。
SLaM-DiMMは、拡散モデルのパワーを利用して、他の利用可能なモダリティから4つのMRIモダリティのいずれかを合成する新しいモダリティ生成フレームワークである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:27:35 GMT)
Routing and wavelength assignment in quantum key distribution networks: power control heuristics for quantum-classical multiplexing [0.0] 受動光ネットワークでは、有限集合から同じ波長で原点と宛先の間の完全な経路を割り当てる必要がある。
我々はこれらを、量子チャネルが古典的なチャネルと光リンクの一部を共有できるハイブリッド量子ネットワークに適用する。
伝送電力を最小限の機能に抑えることで、量子チャネルへの干渉を減らすことができる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:14:18 GMT)
Robust self-testing of quantum steering assemblages via operator inequalities [0.0] 我々は、量子ステアリングアセンブリの堅牢な自己テストのための演算子不等式を開発する。
本手法は,デバイス非依存型自己検査における最初の解析的治療である。
この研究は、ステアリングシナリオにおけるデバイスに依存しない認証の基本的な理解に寄与する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:20:57 GMT)
Revealing Human Internal Attention Patterns from Gameplay Analysis for Reinforcement Learning [0.0] 本研究では,ゲームプレイデータのみから人間内部の注意パターンを明らかにする新しい手法を提案する。
我々は,アタリ環境における人間とRLエージェントのゲームプレイから注目マップを生成する,コンテキスト型タスク関連アテンションネットワーク(CTR)を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 05:42:20 GMT)
Revealing Hidden Precursors to Earthquakes via a Stress-Sensitive Transformation of Seismic Noise [0.0] 隣り合う周波数帯域間のエネルギー差を追跡するストレス感受性周波数領域変換を導入し、進化するせん断と正常な応力に関連付けられた微妙なスペクトル変化を分離する。
本研究は, 隠れた前駆体が実際に周囲の地震騒音に符号化されており, リアルタイムの断層モニタリングや, 活動可能な短期地震予知を行うための経路を提供することを示した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:43:32 GMT)
RegionMed-CLIP: A Region-Aware Multimodal Contrastive Learning Pre-trained Model for Medical Image Understanding [0.0] RegionMed-CLIPは、局所的な病理信号と全体論的意味表現を組み込んだマルチモーダルコントラスト学習フレームワークである。
MedRegion-500kは、広範囲な地域アノテーションと多段階の臨床的記述を特徴とする総合的な医用画像テキストコーパスである。
本研究は,マルチモーダル医用画像理解の基盤として,地域対応型コントラスト事前訓練の重要性を強調した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:46:41 GMT)
Quantum quenches with long range interactions [0.0] 量子クエンチの理論を、長距離相互作用を持つ$d$次元同質系の場合まで拡張する。
順序パラメータなどの局所可観測物の後処理状態と一点関数を解析的に決定する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:41:57 GMT)
Quantum Metric Spaces: Replacing Fuzzy Metrics with the Hilbert Space Structure of Quantum States [0.0] ファジィ計量空間は、Tノルムと会員関数に基礎を置いており、機械学習、意思決定システム、人工知能の不確実性をモデル化するために広く提案されている。
ファジィ計量はそのような不確実性をモデル化するために不要であり、代わりに複素ヒルベルト空間の構造は自然で厳密で非矛盾な計量空間を提供する。
この枠組みは本質的に、ファジィ論理、tノルム、会員次数を必要としない非古典的な不確かさを捉えている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:54:21 GMT)
Quantum Error Correction resilient against Atom Loss [0.0] 原子損失の存在下で中性原子量子プロセッサの誤り訂正プロトコルについて検討する。
偏極ノイズがゼロの場合、原子損失閾値は約2.6%である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:49:40 GMT)
Prostate Capsule Segmentation from Micro-Ultrasound Images using Adaptive Focal Loss [0.0] 本研究では,マイクロUS画像からの深層学習技術を用いた前立腺カプセルのセグメンテーションについて検討した。
適応的な焦点損失関数を導入し、ハード領域と易領域の両方を動的に強調する。
提案手法は,平均ダイス係数(DSC)0.940,平均ハウスドルフ距離(HD)1.949mmを達成し,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 04:55:03 GMT)
Polynomial Contrastive Learning for Privacy-Preserving Representation Learning on Graphs [0.0] 自己教師付き学習(SSL)は、手動のラベルを必要とせずにグラフデータ上で表現を学習するための強力なパラダイムとして登場した。
GRACEのようなSSLメソッドは、ホモモルフィック暗号化(HE)のようなプライバシー保護技術と根本的に互換性がない。
本稿では,グラフ上での自己教師型学習のための新しいフレームワークであるPoly-GRACEを紹介する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:00:30 GMT)
PersonaMatrix: A Recipe for Persona-Aware Evaluation of Legal Summarization [0.0] 法律文書は、しばしば長く、密度が高く、理解が難しい。
本稿では、6人の人物のレンズを通して要約をスコアするペルソナ・バイ・クリータ・アセスメント・フレームワークであるペルソナ・マトリックスを紹介する。
また、米国公民権訴訟の要約を、深さ、アクセシビリティ、手続きの細部によって制御した次元シフトしたパイロットデータセットも導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:03:08 GMT)
Ontology Creation and Management Tools: the Case of Anatomical Connectivity [0.0] ApiNATOMYは、マルチスケールな生理回路マップを表現するためのフレームワークである。
知識表現(KR)モデルと知識管理(KM)ツールスイートを統合する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:10:29 GMT)
On the role of symmetry and geometry in global quantum sensing [0.0] グローバル量子センシングは、有限個の測定値を持つ任意の範囲にわたるパラメータ推定を可能にする。
事前の無知と非情報推定には、根本的に異なる2つの方法がある。
雑音条件下でのレートとコヒーレンス推定の関連例に2つの手法を適用する方法を示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:57:39 GMT)
On the Hamiltonian used in Polaritonic Chemistry [0.0] 励起とFabry-P'erotキャビティのモードの強い結合は、分子特性を著しく変化させる。
我々は、このキャンセルが自由空間と完璧な空洞でどのように起こるかを再考する。
単一モードハミルトニアンに対するこのキャンセルの意味について論じる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:14:01 GMT)
Odontoceti: Ultra-Fast DAG Consensus with Two Round Commitment [0.0] OdontocetiはDAGベースのコンセンサスの最新版で、既存の33%レベルではなく20%のフォールトトレランスで運用されている。
DAGベースのプロトコルとしては、わずか2回の通信ラウンドでコミットメントを達成し、中央値のレイテンシは300ミリ秒である。
本稿では,ブロックチェーンに対する低耐障害性コンセンサスプロトコルの実用性を確立する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:22:28 GMT)
Non-hermitian Green's function theory with $N$-body interactions: the coupled-cluster similarity transformation [0.0] 既約自己エネルギーとBethe-Salpeter核の図式理論を示す。
電子構造ハミルトニアンの類似性変換によって生じる結合クラスター自己エネルギーに着目する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:07:02 GMT)
Network-Based Detection of Autism Spectrum Disorder Using Sustainable and Non-invasive Salivary Biomarkers [0.0] そこで我々は,PageRankとDegreeを利用した遺伝的アルゴリズムに基づくネットワーク最適化フレームワークGANetを開発した。
線形判別分析、サポートベクターマシン、ディープラーニングモデルよりも優れた性能を達成し、精度は0.78、感度は0.61、特異性は0.90、ハーモニック平均は0.74に達した。
これらの結果は、GANetが堅牢でバイオインスパイアされた非侵襲的なツールとして、正確なSD検出とより広範なスペクトルベースの健康アプリケーションとしての可能性を示している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:24:48 GMT)
Negotiated Representations to Prevent Overfitting in Machine Learning Applications [0.0] オーバーフィッティング(Overfitting)は、機械学習モデルが長時間トレーニングされ、提供されたトレーニングラベルに対するトレーニングサンプルの正確な適合度に過度にフォーカスされた場合に発生する現象である。
本稿では,事前に決定されたクラスラベルを用いて,サンプルの出力表現を交渉可能にすることによって,機械学習モデルの分類精度を高める手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:08:41 GMT)
MuseScorer: Idea Originality Scoring At Scale [0.0] MuseScorerは、完全に自動化され、心理学的に検証された周波数ベースの独創性スコアシステムである。
このシステムは、クリエイティビティ研究のためのスケーラブルで、意図に敏感で、人間に沿った独創性評価を可能にする。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:11:25 GMT)
Multimode Gaussian steady state engineering in optomechanical systems with a squeezed reservoir [0.0] マルチモード光学系における機械量子状態の散逸安定化に関する理論的プロトコルについて検討する。
コヒーレント相互作用と収縮浴による散逸との相互作用は、標的となる量子状態の定常的な準備を可能にする。
矩形グラフ上で定義されたメカニカルクラスタ状態の生成における,このプロトコルの性能解析を行う。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:27:26 GMT)
Measuring Multiparticle Indistinguishability with the Generalized Bunching Probability [0.0] 一般束化確率は、ボソンの識別可能性の特定の部分順序に対して単調であることを示す。
また、一粒子密度行列が各粒子に対して同じであるような状態の場合、一般化された束縛確率のハール平均はシュル凸であることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 23:55:30 GMT)
Manifold Dimension Estimation: An Empirical Study [0.0] 多様体仮説は、高次元データがしばしば低次元多様体の上または近くにあることを示唆している。
この多様体の次元を推定することは、その構造を利用するのに不可欠である。
この記事では、研究者と実践者の両方に包括的な調査を提供する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 01:48:58 GMT)
Low-Cost Sensor Fusion Framework for Organic Substance Classification and Quality Control Using Classification Methods [0.0] 有機物の迅速かつ非破壊的な分類と品質管理のためのセンサ融合フレームワークを提案する。
このフレームワークは、3つの商用環境およびガスセンサーを備えたArduino Mega 2560マイクロコントローラプラットフォーム上に構築されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:16:11 GMT)
Longitudinal and Multimodal Recording System to Capture Real-World Patient-Clinician Conversations for AI and Encounter Research: Protocol [0.0] 本研究は,マヨクリニックの外来内科で実施されている。
参加診療所への直接訪問患者を招待し、360度ビデオカメラで記録する。
訪問後、患者は共感、満足度、ペース、治療負担に関する調査を完了する。
2025年8月までに、36人の臨床医のうち35人(97%)と281人の患者のうち212人(75%)が同意した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:42:27 GMT)
Locally Purified Maximally Mixed States At Scale: Entanglement Pruning and Symmetries [0.0] 局所化精製密度演算子は、スケールでの混合量子状態を表す。
非特異性を考えると、それらの表現の複雑さは一般に実用計算において準最適である。
本研究では,実用上の重要な状態を表すために必要な資源を最小化することにより,テンソルネットワークアルゴリズムの効率を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 21:38:29 GMT)
Large Language Models for Security Operations Centers: A Comprehensive Survey [0.0] 大きな言語モデル(LLM)は、人間のようなテキストを理解して生成する強力なツールとして登場した。
この調査は、生成的AIとより具体的にはLSMのSOCワークフローへの統合を体系的に調査する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 18:26:21 GMT)
Introducing a novel Location-Assignment Algorithm for Activity-Based Transport Models: CARLA [0.0] 本稿では,アクティビティベースの旅行モデルにおいて,二次的又は任意の活動位置を割り当てるアルゴリズムであるCARLA(spatially Constrained Anchor-based Recursive Location Assignment)を紹介する。
カルラは位置ポテンシャルを統合しながら距離偏差を最小化し、より現実的な活動を保証する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:45:05 GMT)
Improving the forecast accuracy of wind power by leveraging multiple hierarchical structure [0.0] 和解による階層予測の最近の進歩は,短期的な風力エネルギー予測の質を著しく向上させた。
本研究では,風力発電所におけるタービンの断面的・時間的階層構造を活用し,その統合された断面的・時間的次元が,風力発電所における予測精度にどのように価値をもたらすかを検討する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 00:05:04 GMT)
ISP-AD: A Large-Scale Real-World Dataset for Advancing Industrial Anomaly Detection with Synthetic and Real Defects [0.0] ISP-ADは、ファクトリフロアから直接収集された合成欠陥と実際の欠陥を含む、これまでで最大のパブリックな産業データセットである。
実験により、少量の注入でも弱いラベル付き実欠陥が一般化を改善することが示されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:07:12 GMT)
Hybrid discrimination strategy in quantum communication based on photon-number-resolving detectors and mesoscopic twin-beam states [0.0] 状態識別は、量子通信プロトコルの実装において重要な課題である。
我々は、光の堅牢な量子状態を利用して、メソスコピック・インテンシティ・レシスタンスで機能するハイブリッド戦略を提案する。
我々のアプローチは古典的および量子的特徴(古典的な光の性質に基づく信頼性のある状態判別)と、非古典的な相関から生じるセキュリティを組み合わせたものである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:50:40 GMT)
Hybrid Temporal Differential Consistency Autoencoder for Efficient and Sustainable Anomaly Detection in Cyber-Physical Systems [0.0] 重要なインフラ、特に配水システムに対するサイバー攻撃は、急速なデジタル化により増加した。
本研究では,センサデータの時間相関を利用した異常検出における重要な課題に対処する。
本稿では,決定論的ノードと従来の統計ノードの両方を組み込んでTDCを拡張するハイブリッドTDC-AEという,ハイブリッドオートエンコーダに基づくアプローチを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:15:56 GMT)
Hybrid Deep Learning-Federated Learning Powered Intrusion Detection System for IoT/5G Advanced Edge Computing Network [0.0] IoTおよび5G-Advancedアプリケーションは、DDoS、マルウェア、ゼロデイ侵入に対する攻撃面を拡大した。
本稿では、畳み込みニューラルネットワーク(CNN)、双方向LSTM(BiLSTM)、オートエンコーダ(AE)ボトルネックを融合する侵入検知システムを提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:23:51 GMT)
How important is language for human-like intelligence? [0.0] 我々は、言語がより一般的なAIシステムと人間の知性の中心的な側面の両方の出現の鍵を握るかもしれないと主張している。
第一に、言語は多くの抽象概念の表現と推論を容易にするコンパクトな表現を提供する。
第二に、これらの圧縮表現は集合心の反復出力である。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 03:45:44 GMT)
Graph-based Point Cloud Surface Reconstruction using B-Splines [0.0] 実世界の点雲は、様々な技術的・環境的要因により本質的にうるさい。
既存のデータ駆動表面再構成アルゴリズムは、中間ステップとして、地上の真理正規度や近似正規度に大きく依存している。
辞書型グラフ畳み込みネットワークに基づく表面再構成戦略を開発した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:59:51 GMT)
Geometric Integration for Neural Control Variates [0.0] 本稿では,この問題を2次元で解くために,計算幾何学の手法を用いた統合領域分割に基づく統合手法を提案する。
本手法と組み合わせた制御変数として解析的に利用できることを示し,光輸送シミュレーションの応用例を示した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 02:44:28 GMT)
Gaussian process policy iteration with additive Schwarz acceleration for forward and inverse HJB and mean field game problems [0.0] ハミルトン-ヤコビ-ベルマン方程式と平均場ゲームを解くためのポリシー反復フレームワークを提案する。
ポリシイテレーションは、固定制御ポリシの下での値関数の解決と、結果の値関数に基づいてポリシーを更新とを交互に行う手順として定式化される。
コンバージェンスを改善するために、各ポリシー更新に続くプレコンディショニングステップとして、加法シュワルツ加速度を組み込む。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:19:02 GMT)
From Roots to Rewards: Dynamic Tree Reasoning with Reinforcement Learning [0.0] 木に基づく推論を適応的なプロセスに変換する動的強化学習フレームワークを提案する。
これはProbTreeの確率的厳密さを維持しつつ、ソリューションの品質と計算効率の両方を改善している。
この研究は、確率的フレームワークの信頼性と現実の質問応答システムに必要な柔軟性のバランスをとる、木構造推論の新しいパラダイムを確立する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:42:41 GMT)
From Data to Diagnosis: A Large, Comprehensive Bone Marrow Dataset and AI Methods for Childhood Leukemia Prediction [0.0] 診断過程全体にまたがる,大規模で高品質で一般公開された白血病骨髄データセットを提示する。
このデータセットは、診断、臨床、研究室情報を持つ246人の小児患者と、バウンディングボックスアノテーションを持つ40,000以上の細胞と、高品質なクラスラベルを持つ28,000以上の細胞から構成されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:48:48 GMT)
Frequency shifts due to relativistic effects and retardation in continuous variable quantum key distribution [0.0] 宇宙ベースの量子通信は、衛星や地上局が高高度と大きな相対速度で光信号を交換するのが自然である。
我々は,周波数シフトを縦型ドップラー寄与,相対論的補正,伝搬遅延からの補正に系統的に分離する(遅延)。
ケプラー衛星軌道に対する相対論的補正は、考慮された時間スケールでは無視できない。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:17:23 GMT)
Foundational Design Principles and Patterns for Building Robust and Adaptive GenAI-Native Systems [0.0] 我々は、将来のGenAIネイティブシステムは、GenAIの認知能力をソフトウェア工学の原則と統合し、堅牢で適応的で効率的なシステムを構築するべきであると論じる。
信頼性、卓越性、進化性、自己信頼性、保証という5つの重要な柱を中心にした、基本的なGenAIネイティブ設計原則を紹介します。
我々は、GenAIネイティブなソフトウェアスタックの重要な要素を概説し、技術的、ユーザの採用、経済的、法的観点から、これらのシステムの影響について論じる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:28:06 GMT)
Formation of Cavity-Polaritons via High-Order Van Hove Singularities [0.0] 絶縁相の粒子ホール励起とキャビティ光子をサブギャップ周波数でハイブリダイズすることによって形成される偏光子
本稿では、高次ヴァンホーブ特異点を実装するために、ギャップの周りの帯域の非放物運動量分散を提案する。
本研究は, ギャップエッジにおけるバンドエンジニアリングを, 量子非線形光学における偏光子制御の有望な経路として同定した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:34:20 GMT)
Fast momentum-selective transport of Bose-Einstein condensates via controlled non-adiabatic dynamics in optical lattices [0.0] ボース・アインシュタイン凝縮体(BEC)の1次元光学格子における運動量選択的輸送プロトコルについて検討した。
本研究では, 高速負荷条件下でのスペクトル純度の支配機構として, 地中呼吸動態を同定した。
このアプローチは、厳密なタイミング制約の下で動作している量子センサーに特に関係している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 19:15:44 GMT)
Fast OTSU Thresholding Using Bisection Method [0.0] 大津閾値アルゴリズムは画像セグメンテーションの基本的な手法である。
本研究は,クラス間分散関数の一様特性を利用する最適化実装を提案する。
提案手法は, セグメンテーション精度を保ちながら計算複雑性をO(L)からO(log L)評価に還元する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:40:42 GMT)
FOVAL: Calibration-Free and Subject-Invariant Fixation Depth Estimation Across Diverse Eye-Tracking Datasets [0.0] 深度推定に対するロバストなキャリブレーションフリーアプローチであるFOVALを導入する。
変換器、時空間ネットワーク(TCN)、CNNと比較して、FOVALは優れた性能を発揮する。
LOOCV(Leave-One-Out Cross-Validation)とクロスデータセットバリデーション(cross-dataset Validation)を用いた3つのベンチマークデータセットに対する評価は、平均絶対誤差(MAE)が9.1cmであり、キャリブレーションなしでの強い一般化を示している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:02:24 GMT)
Explainable AI for Maritime Autonomous Surface Ships (MASS): Adaptive Interfaces and Trustworthy Human-AI Collaboration [0.0] 本稿では,海上自律型表面船の自動化透明性に関する100の研究を合成する。
我々は、人間の安全でない制御行動が、ハンドオーバと緊急ループに集中している場所を特定する。
センサ/SA取得と融合、HMI/eHMIプレゼンテーション、エンジニア対応プロセスの3つのレイヤにおける透明性のための設計戦略。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:18:54 GMT)
Estimating Model Performance Under Covariate Shift Without Labels [0.0] デプロイ後、機械学習モデルは、データ分散の変化によるパフォーマンス劣化を経験することが多い。
データドリフト検出などの既存のプロキシ手法では、これらのシフトの影響を適切に測定できない。
確率的適応性能推定(PAPE)を導入する。
PAPEはオリジナルのモデルとは独立して動作し、予測と確率推定にのみ依存する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:12:01 GMT)
Effects of time dependence in the second order coherence of pulsed light [0.0] 単一時間モードの光の場合、時間依存は量子状態ではなく決定論的パルス形状と完全に関連付けられる。
我々はパルス光の光子到着時間差の分布を計算し、光子到着時間差の点で本質的に強く束ねられていることを発見した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:34:58 GMT)
ENSAM: an efficient foundation model for interactive segmentation of 3D medical images [0.0] ENSAMは、普遍的な3次元医用画像セグメンテーションのためのプロンプト可能なモデルである。
ENSAMは、限られたデータと計算予算の下で優れた性能を達成するように設計されている。
ENSAMは, マルチモーダル3次元医用画像を用いた隠れテストセットで評価した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 11:20:22 GMT)
EHR-MCP: Real-world Evaluation of Clinical Information Retrieval by Large Language Models via Model Context Protocol [0.0] 大規模言語モデル (LLM) は医療における有望性を示すが、病院への展開は電子健康記録(EHR)システムへのアクセス制限によって制限される。
Model Context Protocol (MCP)は、LCMと外部ツールの統合を可能にする。
EHR-MCPは病院のERHデータベースと統合されたカスタムMPPツールのフレームワークで、GPT-4.1をLangGraph ReActエージェントを介して利用した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:17:16 GMT)
Directionality of the Voynich Script [0.0] 我々は、ヴォイニヒ写本はほぼ確実に左から右に書かれていたと論じている。
文字列の方向バイアスを決定するためにn-gramパープレキシティ非対称性を利用する統計手法を提案する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:37:00 GMT)
Deleuze's "Postscript on the Societies of Control" Updated for Big Data and Predictive Analytics [0.0] 1990年、Giles Deleuzeは『Postscript on the Societies of Control』を出版した。
この30年間の更新は、Deleuzeのコンセプトが、個人情報を囲む特定の経済メカニズムへの広範な投機的ビジョンからどのように発展したかを詳述している。
中心的な主張は、今日のコントロール・ソサエティの進歩は禁止なく、また、個人の個人情報を守らざるを得ないからといって、笑えないが楽しいインセンティブを通じて強要しているということである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 14:47:25 GMT)
Decomposing Interventional Causality into Synergistic, Redundant, and Unique Components [0.0] 我々は、介入因果効果を相乗的で冗長でユニークな構成要素に分解する新しい枠組みを導入する。
本研究では,システム内の変数間で因果力がどのように分散しているかを体系的に定量化する数学的アプローチを開発する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:54:57 GMT)
Data-Efficient Learning for Generalizable Surgical Video Understanding [0.0] 本研究は, 深層学習に基づく外科的ビデオ解析と実世界の臨床環境とのギャップを埋めることを目的としている。
私は最先端のニューラルネットワークアーキテクチャをベンチマークして、各タスクの最も効果的な設計を特定しました。
我々は,大量の未ラベルの手術ビデオを活用することにより,タスク間のモデル性能を向上させる半駆動型フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:25:37 GMT)
Data Complexity: a threshold between Classical and Quantum Machine Learning -- Part I [0.0] 量子機械学習(QML)は、パターン認識、最適化、データ分析の高速化を約束する。
既存の研究はアルゴリズムやハードウェアに重点を置いていることが多いが、量子的優位性を決定する上でのデータ自体の役割はあまり注目されていない。
データ複雑性は、これらの条件定義の中心である、と我々は主張する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 20:35:45 GMT)
Classification of Tents in Street Bazaars Using CNN [0.0] 本研究では,街路バザーのテント分類のための改良されたディープラーニングモデルを提案する。
我々は、独自の畳み込みニューラルネットワーク(CNN)とEfficientNetB0を比較した。
その結果、CNNのカスタムモデルは92.8%の精度を示し、EfficientNetB0は98.4%の精度を示した。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:49:02 GMT)
Classical and Quantum theory of magnonic and magnetoelastic nonlinear dynamics in continuum geometries [0.0] 連続系におけるスピンおよび音響波結合非線形ダイナミクスの理論を提供する。
我々は磁化と音波振幅の古典的な運動方程式を導出した。
我々の研究は、量子状態におけるマグノンの音響制御への道を開いた。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:58:47 GMT)
Bose's Probabilistic Interactions, Einstein's Objections, and Their Legacy in Quantum Optics and Stochastic Mechanics [0.0] アインシュタインは確率論的法則を批判し、詳細な均衡と対応原理を提起した。
現代の量子光学と空洞QEDはボースの核をヴィンディケートする:自発性'の放出は孤立した原子の固有の性質ではない。
シュラージュ測位とディラック方程式は、標準的な量子力学よりも基本的なランダム性に対するボースの見解とより密接に一致することが示唆されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 07:02:47 GMT)
Block Encoding of Sparse Matrices via Coherent Permutation [0.0] マルチコントロールされたXゲートのオーバヘッド,振幅リオーダー,ハードウェア接続といった重要な障害を克服する統合フレームワークを導入する。
回路深度と制御オーバーヘッドを著しく低減し,量子アルゴリズムにおける理論定式化と実用的な回路実装のギャップを埋める。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 13:52:51 GMT)
Balancing Innovation and Oversight: AI in the U.S. Treasury and IRS: A Survey [0.0] アメリカ合衆国財務省、特に内国歳入庁は、税務を近代化するために人工知能(AI)を採用している。
主なイニシアチブには、AIによるチャットボット、ロボットプロセス自動化、ケース選択のための機械学習、不正防止のための高度な分析などがある。
同時に、IRSはAIの責任ある使用を保証するためのガバナンス対策を実装している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:45:38 GMT)
Anticoncentration and nonstabilizerness spreading under ergodic quantum dynamics [0.0] ランダム量子回路の力学下でのマジックリソースのアンチ集中と平衡は、システムサイズと対数的にスケールするときに起こる。
この研究は、一次元エルゴード・フロケモデルとハミルトン系における反集中と魔法の拡散を調べることでこのアイデアに挑戦する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 12:06:16 GMT)
Analyzing and improving a classical Betti number estimation algorithm [0.0] 任意の単純複素体の正規化ベッチ数を推定するための古典的アルゴリズムを提案した。
モンテカルロ構造に類似した量子アルゴリズムによって動機付けされ、サンプルの複雑さが向上し、この古典的なアルゴリズムのサンプルの複雑さをより詳細に分析する。
特定のモデルに対して、我々の改善は、ほとんど常にサンプルの複雑さを減らし、また、両方のアルゴリズムのサンプルの複雑さが指数関数的である別のレギュレーションを生成することを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:29:57 GMT)
Analog Quantum Simulation of Coupled Electron-Nuclear Dynamics in Molecules [0.0] プレBOフレームワークにおける分子ビブロニックダイナミクスに対する最初のアナログ量子シミュレーション手法を提案する。
提案手法は,等価な古典的アルゴリズムと比較して資源と計算コストが指数関数的に削減されていることを示す。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:51:36 GMT)
An extended reality-based framework for user risk training in urban built environment [0.0] 本稿では,都市構築環境におけるユーザリスクトレーニングを改善するための拡張現実感(XR)ベースのフレームワークを提案する。
この枠組みは、市民、地方当局、緊急対応者を含む様々な利害関係者のリスク認識と準備を改善するように設計されている。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 10:08:15 GMT)
All non-Gaussian states are advantageous for channel discrimination: Robustness of non-convex continuous variable quantum resources [0.0] すべての非ガウス状態が、単にガウス状態の混合であるものであっても、ある種のチャネル識別タスクにおいて有利であることを示す。
この結果は、変数量子情報(非ガウス性資源理論)のキーケーススタディに適用する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:36:48 GMT)
Algorithmic A-Legality: Shorting the Human Future through AI [0.0] AIの現在の発展は、経済力と法力の組み合わせに依存しているが、結果として生じる技術形態は、最も厳格な法と政治体制の能力を超えつつあると論じている。
リスクを生み出すAIの可能性は、従来の法律や政治機関では抑制できない、という「合法性」の状況が浮上している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 15:43:04 GMT)
AgentMaster: A Multi-Agent Conversational Framework Using A2A and MCP Protocols for Multimodal Information Retrieval and Analysis [0.0] 本稿では,A2AとMPPを自己実装した新しいモジュール型マルチプロトコールMASフレームワークであるAgentMasterの試験的検討を行う。
このシステムは、先行技術知識のない自然言語インタラクションをサポートし、情報検索、質問応答、画像解析を含むタスクに対するマルチモーダルクエリに応答する。
全体として、提案するフレームワークは、MASを利用したドメイン固有、協調的、スケーラブルな対話型AIの可能性に寄与する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 22:28:32 GMT)
Action is the primary key: a categorical framework for episodic memories and logical reasoning [0.0] データフォーマットは認知ログと呼ばれ、厳密で柔軟な論理的推論を可能にする。
本研究の目的は、人間のように考えるが、機械の正確さと厳密さを持つデータベース駆動人工知能を開発することである。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 06:57:31 GMT)
Accelerating Atomic Fine Structure Determination with Graph Reinforcement Learning [0.0] 本稿では,マルコフ決定過程における解析手順の自動化とグラフ強化学習による解法を提案する。
数百のレベルエネルギーが数時間で計算され、CoIIの95%、NdII-IIIの54-87%が公表された。
原子微細構造決定の現在の効率性は、天文学や融合科学からの原子データ要求の増大に対応するのに苦慮しているため、我々の新しい人工知能アプローチは、このギャップを埋めるステージを設定している。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 17:44:03 GMT)
A heat-resilient hole spin qubit in silicon [0.0] キュービットを操作するのに必要なマイクロ波パルスはスピン環境を過熱させる。
以上の結果から,スピン軌道誘起電気感受性から生じる熱感受性の根底にある電気的起源が明らかとなった。
驚くべきことに、熱感受性は磁場の角度に合わせて調整でき、熱効果に免疫してホールスピンが反射されるスイートスポットを露呈して、キャンセルすることさえできる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 09:54:39 GMT)
A Unified Theory of Exact Inference and Learning in Exponential Family Latent Variable Models [0.0] ベイズの法則は、観測された潜伏変数に関する後続の信念を推測する方法を記述している。
推論は潜在変数モデルの学習アルゴリズムにおける重要なステップである。
我々は、推論と学習を正確に実装できる指数族LVMの理論を開発する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:12:42 GMT)
A State-Specific Iterative Decoupling Scheme Based on Perturbation Theory for Low-Energy Electronic States [0.0] マルチステップRayleigh-SchrodingerとBrillouin-Wigner摂動スキームの選択的かつスケーラブルな拡張を導入する。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 16:57:57 GMT)
A Nascent Taxonomy of Machine Learning in Intelligent Robotic Process Automation [0.0] RPAと機械学習の関連性を探るため,文献レビューを実施している。
我々の分類学は、RPA-ML統合とRPA-ML相互作用の2つのメタ特性からなる。
論文参考訳(メタデータ) (Fri, 19 Sep 2025 08:01:27 GMT)