Never Compromise to Vulnerabilities: A Comprehensive Survey on AI Governance [211.6] 本研究は,本質的セキュリティ,デリバティブ・セキュリティ,社会倫理の3つの柱を中心に構築された,技術的・社会的次元を統合した包括的枠組みを提案する。
我々は,(1)防衛が進化する脅威に対して失敗する一般化ギャップ,(2)現実世界のリスクを無視する不適切な評価プロトコル,(3)矛盾する監視につながる断片的な規制,の3つの課題を特定する。
私たちのフレームワークは、研究者、エンジニア、政策立案者に対して、堅牢でセキュアなだけでなく、倫理的に整合性があり、公的な信頼に値するAIシステムを開発するための実用的なガイダンスを提供します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:25:19 GMT)
Signal and Noise: A Framework for Reducing Uncertainty in Language Model Evaluation [103.7] 現在のベンチマークの違いを示す2つの重要な指標を紹介します。
より優れた信号対雑音比を持つベンチマークは、小規模で意思決定を行う場合、より信頼性が高いことを示す。
結論は、新しいベンチマークを作成する人や、どの既存のベンチマークを使うかを選択する人は、高い信号と低いノイズを目標にすることを推奨する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:56:04 GMT)
NextStep-1: Toward Autoregressive Image Generation with Continuous Tokens at Scale [101.6] NextStep-1は、テキストから画像生成タスクにおける自動回帰モデルの最先端のパフォーマンスを実現する。
本手法は画像編集において高い性能を示し,統一的アプローチのパワーと汎用性を強調した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:55:23 GMT)
Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.9] トークンの制約を評価するのは 違法にコストがかかる
LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。
我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:10:18 GMT)
From AI for Science to Agentic Science: A Survey on Autonomous Scientific Discovery [90.6] エージェントAIは仮説生成、実験設計、実行、分析、反復的洗練の能力を示す。
この調査は、生命科学、化学、材料科学、物理学にまたがる自律的な科学的発見のドメイン指向のレビューを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:25:54 GMT)
Hybrid Generative Fusion for Efficient and Privacy-Preserving Face Recognition Dataset Generation [87.5] 我々は,顔認識モデルをトレーニングするための高品質な顔データセットの構築に焦点を当てたDataCV ICCV Challengeへのアプローチを提案する。
構築されたデータセットには、既存の公開顔データセットと重複するIDが含まれてはならない。
提案手法は,競技において第1位となる textbf1 を達成し,実験結果から10K,20K,100K 単位のモデル性能の向上が得られた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:15:35 GMT)
ToolACE-MT: Non-Autoregressive Generation for Agentic Multi-Turn Interaction [84.9] 大規模言語モデル(LLM)によるエージェント的タスク解決には,多ターン・マルチステップインタラクションが必要である。
既存のシミュレーションベースのデータ生成手法は、複数のエージェント間のコストのかかる自己回帰的相互作用に大きく依存している。
本稿では,高品質なマルチターンエージェント対話を構築するための非自己回帰反復生成フレームワークであるToolACE-MTを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:38:23 GMT)
EvalAgent: Discovering Implicit Evaluation Criteria from the Web [82.8] EvalAgentは、ニュアンスとタスク固有の基準を自動的に発見するように設計されたフレームワークである。
EvalAgentは、さまざまな長期評価基準を提案するために、専門家が作成したオンラインガイダンスをマイニングしている。
我々の実験では、EvalAgentが生み出す基準は暗黙的だが具体的であることが示されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:17:20 GMT)
Mini-Omni-Reasoner: Token-Level Thinking-in-Speaking in Large Speech Models [80.8] Mini-Omni-Reasonerは、"Thinking-in-Speaking"という新しい定式化を通じて、音声内での推論を可能にするフレームワークである。
トークンレベルで音声応答トークンとサイレント推論トークンをインターリーブする。
算術的推論では+19.1%、文脈的理解では+6.4%、出力は短く、復号遅延はゼロである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:14:04 GMT)
Has GPT-5 Achieved Spatial Intelligence? An Empirical Study [67.3] GPT-5は、これまでで最も強力なAIモデルだと言われている。
8つのベンチマークで最先端のプロプライエタリモデルとオープンソースモデルを評価した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:55:17 GMT)
A Self-Ensemble Inspired Approach for Effective Training of Binary-Weight Spiking Neural Networks [66.8] トレーニングスパイキングニューラルネットワーク(SNN)とバイナリニューラルネットワーク(BNN)は、差別化不可能なスパイク生成機能のために困難である。
本稿では, バックプロパゲーションプロセスの解析を通じて, SNN の力学とBNN との密接な関係を考察する。
具体的には、複数のショートカットの構造と知識蒸留に基づくトレーニング技術を活用し、(バイナリウェイト)SNNのトレーニングを改善する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:11:06 GMT)
Vision-G1: Towards General Vision Language Reasoning with Multi-Domain Data Curation [64.2] 8次元にわたる46のデータソースから、総合的なRL対応のビジュアル推論データセットを構築します。
このデータセットから高品質なトレーニングサンプルを識別するために,影響関数に基づくデータ選択と難易度に基づくフィルタリング手法を提案する。
我々はVLM(Vision-G1)をデータカリキュラム付きマルチラウンドRLを用いて訓練し、その視覚的推論能力を反復的に改善する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:24:33 GMT)
Precise Action-to-Video Generation Through Visual Action Prompts [63.0] アクション駆動のビデオ生成は、精度と一般性のトレードオフに直面している。
エージェント中心のアクション信号は、クロスドメイン転送可能性のコストで精度を提供する。
私たちはアクションをドメインに依存しない表現として正確に視覚的なプロンプトに"レンダリング"します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:12:28 GMT)
A Stitch in Time Saves Nine: Proactive Self-Refinement for Language Models [60.6] ProActive Self-Refinement (PASR) は、大規模言語モデルが生成プロセス中に出力を洗練できるようにする新しい手法である。
PASRの有効性を評価するために,多種多様な10のタスクについて広範囲に実験を行った。
Qwen3-8Bでは、PASRは標準的な世代に比べて平均トークン消費量を41.6%削減し、精度は8.2%向上した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:07:21 GMT)
State-Space Modeling in Long Sequence Processing: A Survey on Recurrence in the Transformer Era [59.3] このサーベイは、シーケンシャルなデータ処理の反復モデルに基づく最新のアプローチの詳細な概要を提供する。
新たな画像は、標準のバックプロパゲーション・オブ・タイムから外れた学習アルゴリズムによって構成される、新しいルートを探索する余地があることを示唆している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:41:11 GMT)
Next Visual Granularity Generation [58.2] 本稿では,画像を構造化シーケンスに分解することで,画像生成に新たなアプローチを提案する。
次のビジュアルグラニュラリティ(NVG)生成フレームワークは、視覚的なグラニュラリティシーケンスを生成する。
我々は、ImageNetデータセット上でクラス条件画像生成のための一連のNVGモデルをトレーニングし、明確なスケーリング挙動を観察する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:47:37 GMT)
USAD: Universal Speech and Audio Representation via Distillation [56.9] Universal Speech and Audio Distillation (USAD)は、音声表現学習における統一的なアプローチである。
USADは音声、音声、音楽の様々なタイプを単一のモデルに統合する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:16:20 GMT)
Foundation Model for Skeleton-Based Human Action Understanding [56.9] 本稿では,統一骨格に基づくDense Representation Learningフレームワークを提案する。
USDRLはトランスフォーマーベースのDense Spatio-Temporal (DSTE)、Multi-Grained Feature Deorrelation (MG-FD)、Multi-Perspective Consistency Training (MPCT)で構成されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:42:16 GMT)
A Comprehensive Review of Datasets for Clinical Mental Health AI Systems [55.7] 本稿では,AIを活用した臨床アシスタントの訓練・開発に関連する臨床精神保健データセットの総合的調査を行う。
本調査では, 縦断データの欠如, 文化・言語表現の制限, 一貫性のない収集・注釈基準, 合成データのモダリティの欠如など, 重要なギャップを明らかにした。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:27:57 GMT)
Learning to Steer: Input-dependent Steering for Multimodal LLMs [55.5] 入力固有線形シフトを用いたきめ細かいステアリングについて検討する。
我々は、入力固有のステアリングベクトルを予測するために、小さな補助モジュールを訓練する。
我々のアプローチはL2S(Learn-to-Steer)と呼ばれ、幻覚を減らし、MLLMの安全性を向上し、他の静的ベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:53:20 GMT)
Latent Plan Transformer for Trajectory Abstraction: Planning as Latent Space Inference [53.4] オフライン強化学習から得られたデータセットを用いた計画のための生成モデルについて検討する。
本稿では,Transformerベースのトラジェクトリジェネレータと最終戻り値との接続に潜時変数を利用する新しいモデルであるLatent Plan Transformerを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:17:19 GMT)
Towards Low-Latency Tracking of Multiple Speakers With Short-Context Speaker Embeddings [53.0] 短文脈話者埋め込み抽出のための知識蒸留に基づく学習手法を提案する。
我々は、ビームフォーミングを用いて興味ある話者の空間情報を活用し、重複を低減する。
以上の結果から,本モデルは短文埋め込み抽出に有効であり,重なりやすいことが示唆された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:32:13 GMT)
LaDi-WM: A Latent Diffusion-based World Model for Predictive Manipulation [51.8] 拡散モデルを用いて将来の状態の潜伏空間を予測する世界モデルLaDi-WMを提案する。
LIBERO-LONGベンチマークでは,LaDi-WMが27.9%,現実シナリオでは20%,政策性能が著しく向上することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:12:46 GMT)
4DNeX: Feed-Forward 4D Generative Modeling Made Easy [51.8] 1つの画像から4D(動的3D)シーン表現を生成するための最初のフィードフォワードフレームワークである4DNeXを提案する。
計算集約的な最適化やマルチフレームビデオ入力を必要とする既存の方法とは対照的に、4DNeXは効率的でエンドツーエンドの画像から4D生成を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:59:55 GMT)
OptimalThinkingBench: Evaluating Over and Underthinking in LLMs [51.2] LLMは計算量を増やし、より単純な問題を過度に考えることで、複雑なタスクを解決します。
非思考のLSMはより高速で安価ですが、より難しい推論の問題について考えています。
LLMにおける過度な考えと過小評価を共同で評価する統一ベンチマークであるOptimalThinkingBenchを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:53:10 GMT)
RepreGuard: Detecting LLM-Generated Text by Revealing Hidden Representation Patterns [50.4] 大規模言語モデル(LLM)は、誤用を防止し、信頼できるAIシステムを構築するために不可欠である。
本稿では,統計量に基づく効率的な検出手法であるRepreGuardを提案する。
実験結果から、RepreGuardは、平均94.92%のAUROCですべてのベースラインでID(in-distriion)とOOD(OOD)の両方のシナリオでパフォーマンスが向上していることが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:59:15 GMT)
Adaptive Conformal Prediction Intervals Over Trajectory Ensembles [50.3] 将来の軌道は、自律運転、ハリケーン予測、疫病モデルといった領域で重要な役割を果たしている。
本稿では,サンプル軌道を理論的カバレッジ保証付き校正された予測区間に変換する共形予測に基づく統一的なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:14:07 GMT)
Fast Geometric Embedding for Node Influence Maximization [49.8] 低次元空間にグラフを埋め込む効率的な力配置アルゴリズムを導入する。
アプリケーションとして、提案した埋め込みにより、ネットワーク内の高影響ノードを見つけることができ、標準のgreedyアルゴリズムの高速でスケーラブルな代替手段を提供することがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:21:34 GMT)
Simultaneous symmetry breaking in spontaneous Floquet states: temporal Floquet-Nambu-Goldstone modes, Floquet thermodynamics, and the time operator [49.2] 本研究では, 自発フロック状態における同時対称性の破れについて検討し, 原子凝縮の特定の場合に着目した。
まず,ハミルトニアンのいくつかの対称性を同時に破壊する定常状態に対するナムブ・ゴールドストーン(NG)モードの量子化について述べる。
フォーマリズムをフロケ状態に拡張し、ゴールドストーンの定理は準エネルギーゼロのフロケ・ナンブ・ゴールドストーンモードの出現へと変換する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:00:01 GMT)
Quantization Hurts Reasoning? An Empirical Study on Quantized Reasoning Models [49.0] 量子化推論モデルに関する最初の体系的研究を行う。
本研究は,様々なビット幅の最先端アルゴリズムを用いて,重み,KVキャッシュ,アクティベーション量子化について検討する。
モデルのサイズ、モデルの起源、タスクの難しさを、パフォーマンスの重要な決定要因とみなす。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:06:09 GMT)
Goal-Directedness is in the Eye of the Beholder [48.9] ゴール指向の行動の探索には,2つのフレーバーがある。
エージェントシステムにおけるゴールの定式化から生じる技術的および概念的問題を特定する。
本稿では,動的マルチエージェントシステムの創発的特性として,ゴール指向性をモデル化するための新たな方向性について概説する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:04:18 GMT)
Unsupervised Anomaly Detection Using Diffusion Trend Analysis for Display Inspection [48.2] 本稿では, 劣化度に応じて, 復元傾向の分析により異常を検出する手法を提案する。
本稿では,劣化度に応じて再構成傾向の分析により異常を検出する手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:39:07 GMT)
From Intent to Execution: Multimodal Chain-of-Thought Reinforcement Learning for Precise CAD Code Generation [47.7] CADモデリングコード生成のためのマルチモーダルChain-of-Thoughtガイド強化学習フレームワークCAD-RLを提案する。
本手法は,3つのタスク固有報酬を用いた目標駆動型強化学習ポストトレーニングとコールドスタートを組み合わせた。
CAD-RLは、推論品質、出力精度、コード実行可能性を大幅に改善することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:54:00 GMT)
Grounding Actions in Camera Space: Observation-Centric Vision-Language-Action Policy [47.5] 本稿では,カメラの観測空間にアクション予測を直接適用するOC-VLA(Observatory-Centric VLA)フレームワークを紹介する。
OC-VLAは、ロボットベース座標系からカメラ座標系にエンドエフェクターポーズを変換する。
この戦略は、カメラ視点の変化に対するモデルレジリエンスを大幅に改善する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:10:45 GMT)
Counterfactual Probabilistic Diffusion with Expert Models [47.3] 本稿では,不完全な専門家モデルからのガイダンスを取り入れた時系列拡散に基づくフレームワークを提案する。
我々の方法であるODE-Diffは、機械的およびデータ駆動的なアプローチをブリッジし、より信頼性が高く解釈可能な因果推論を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:44:32 GMT)
EgoTwin: Dreaming Body and View in First Person [47.1] EgoTwinは拡散トランスフォーマーアーキテクチャ上に構築された共同ビデオモーション生成フレームワークである。
EgoTwinは人間の動きを頭部に固定し、サイバネティックスにインスパイアされた相互作用機構を組み込む。
総合的な評価のために、同期されたテキスト-ビデオ-モーション三重項の大規模実世界のデータセットをキュレートする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:33:09 GMT)
Learn 3D VQA Better with Active Selection and Reannotation [46.7] 3D VQAでは、回答の自由な形式の性質は、データセット全体をトレーニングする際にモデルを混乱させたり誤解させたりする不適切なアノテーションにつながることが多い。
本稿では,モデルのセマンティックな不確実性に基づいてデータを選択する多ターン対話型能動学習戦略を提案する。
実験ではモデルの性能が向上し、トレーニングコストが大幅に削減され、比較的高い精度を達成するためのトレーニングコストが半減する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:06:49 GMT)
EGOILLUSION: Benchmarking Hallucinations in Egocentric Video Understanding [46.5] EgoIllusionは、エゴセントリックビデオにおけるMLLMの幻覚を評価する最初のベンチマークである。
EgoIllusionは1,400本のビデオと8000人の人間による注釈付きオープンおよびクローズドエンドの質問のペアで構成されている。
10個のMLLMを評価すると、GPT-4oやGeminiのような強力なモデルを含む大きな課題が示され、59%の精度しか達成できなかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:39:55 GMT)
One-Class Intrusion Detection with Dynamic Graphs [46.5] 機械学習に基づく侵入検知は、セキュリティを改善するための有望なアプローチである。
本稿では,最新の動的グラフモデリングと深部異常検出に基づく新しい侵入検出手法TGN-SVDDを提案する。
本稿では,現実的な侵入検出データに対して,いくつかのベースラインよりも優れていることを示すとともに,後者のより困難なバリエーションを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:36:55 GMT)
Not All Tokens and Heads Are Equally Important: Dual-Level Attention Intervention for Hallucination Mitigation [46.3] 大規模視覚言語モデル(LVLM)は多様なマルチモーダルタスクにまたがる印象的な機能を示している。
視覚幻覚(VH)の影響を受けやすく、自信はあるが不正確な記述をしばしば生み出す。
推論中の注意パターンを直接調整することで幻覚を緩和するフレームワークであるVisFlowを紹介した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:18:50 GMT)
AI as IA: The use and abuse of artificial intelligence (AI) for human enhancement through intellectual augmentation (IA) [45.9] 本稿では,AIによる人間力向上の展望と倫理について概説する。
我々は,不適切なパフォーマンス,安全性,強制と操作,プライバシ,認知の自由,信頼,公正といった倫理的問題について論じる。
結論として、AIによる人間の実力強化には、非常に重要な技術的ハードルと、重大な倫理的問題がある一方で、現実的に達成される可能性のある重要なメリットもある、と結論付けている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:39:11 GMT)
InterRVOS: Interaction-aware Referring Video Object Segmentation [44.6] インタラクションのモデリングに焦点をあてた新しいタスクであるInterRVOS(Interaction-Aware Referring Video Object)を紹介する。
モデルはアクターとターゲットオブジェクトを別々に分割し、相互作用におけるそれらの非対称的な役割を反映する必要がある。
本稿では,127K以上のアノテート表現を持つ大規模データセットであるInterRVOS-127Kについて述べる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:41:54 GMT)
INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization [43.4] インネットワークAI(In-network AI)は、ネットワークインフラストラクチャにおける人工知能(AI)のエスカレート要求に対処するための、変革的なアプローチである。
本稿では,AIのためのネットワーク内計算の最適化に関する包括的な分析を行う。
リソース制約のあるネットワークデバイスにAIモデルをマッピングするための方法論を調べ、メモリや計算能力の制限といった課題に対処する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:03:51 GMT)
Hierarchical Multi-Agent Reinforcement Learning with Control Barrier Functions for Safety-Critical Autonomous Systems [42.9] 制御バリア関数(CBF)に基づく安全階層型マルチエージェント強化学習(HMARL)手法を提案する。
提案した階層的アプローチは, 総合的な強化学習問題を, より高レベルで協調行動を学び, より低レベルあるいは高レベルなエージェントレベルで安全な個人行動を学ぶ2つのレベルに分解する。
具体的には,HMARL-CBFアルゴリズムを提案する。高いレベルの問題はすべてのエージェントのスキルに関する共同政策を学習することであり,低レベルの問題はCBFで安全にスキルを実行するための学習ポリシーを学習することである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:13:18 GMT)
Learn Faster and Remember More: Balancing Exploration and Exploitation for Continual Test-time Adaptation [42.1] 連続テスト時間適応(CTTA)は、推論中にターゲットドメインを継続的に変更するソース事前トレーニングモデルを適用することを目的としている。
本稿では,探索と爆発の適切なバランスを打つ平均教師の枠組みを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:08:56 GMT)
A Multi-Resolution Benchmark Framework for Spatial Reasoning Assessment in Neural Networks [40.7] 本稿では,ニューラルネットワークにおける空間推論能力の評価を目的とした,包括的なベンチマークフレームワークの定義に関する予備的な結果を示す。
このフレームワークは現在、nnU-Netの能力の研究に使われている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:04:13 GMT)
Bridging Human and LLM Judgments: Understanding and Narrowing the Gap [39.9] 大規模言語モデルは、モデルアウトプットを大規模に評価するために、審査員(LLM-as-a-judge)として使われることが多い。
我々は、人間とLLMの評価を明示的に橋渡しする統一統計フレームワークであるBridgeを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:14:20 GMT)
Efficient Forward-Only Data Valuation for Pretrained LLMs and VLMs [39.7] For-Valueは、大規模言語モデル(LLM)と視覚言語モデル(VLM)のためのフォワードオンリーのデータアセスメントフレームワークである。
For-Valueは、単一のフォワードパスのみに基づく単純なクローズドフォーム式を使用して影響スコアを計算する。
理論的解析により,For-Valueは隠れ表現のアライメントとトレーニングと検証サンプル間の予測誤差を捉えることで,サンプルごとの影響を正確に推定することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:41:57 GMT)
DyCrowd: Towards Dynamic Crowd Reconstruction from a Large-scene Video [39.2] 都市監視や群集分析などの応用において,大規模シーンにおける群集の3次元動的再構築がますます重要になっている。
本研究では,大規模映像からの数百人のポーズ,位置,リズム動作を一貫した3次元再構成する枠組みを提案する。
実験により,大規模な動的群集再構築作業において,提案手法が最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:09:38 GMT)
Novel Object 6D Pose Estimation with a Single Reference View [39.2] 既存のオブジェクト6Dのポーズ推定手法はCADモデルや高密度参照ビューに依存するのが一般的である。
単一参照に基づく新しいオブジェクト6D(SinRef-6D)のポーズ推定法を提案する。
私たちのキーとなるアイデアは、共通座標系において、ポイントワイドアライメントを反復的に確立することです。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:29:06 GMT)
Embodied Image Quality Assessment for Robotic Intelligence [38.5] 身体的エージェントは環境の中で相互作用し、知覚することが要求される。
入力としてのビジュアルイメージは、下流のタスクに直接影響する。
そこで本研究では,MA-EIQAと呼ばれるマルチスケール・アテンション・エンボディード画像品質評価手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:13:27 GMT)
Improving Text Style Transfer using Masked Diffusion Language Models with Inference-time Scaling [37.8] 仮面拡散言語モデル (MDMs) は近年,自然言語生成フレームワークとして注目を集めている。
本稿では,MDMの復調過程において,より優れた候補生成の探索を支援する検証器ベースの推論時間スケーリング手法を提案する。
実験では,標準テキストスタイルの転送タスクへのMDMの適用を実証し,自動回帰言語モデルのより良い代替手段としてMDMを確立する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:41:22 GMT)
Cross-Domain Few-Shot Learning via Multi-View Collaborative Optimization with Vision-Language Models [37.6] 自然画像やCLIPなどの言語データに基づいて事前訓練された視覚言語モデル(VLM)は、数ショットの画像認識タスクにおいて大きな可能性を秘めている。
本稿では,VLM のための新しい微調整手法である Consistency-guided Multi-view Collaborative Optimization (CoMuCo) を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:00:09 GMT)
UAV Individual Identification via Distilled RF Fingerprints-Based LLM in ISAC Networks [37.5] 無人航空機(UAV)個人識別は、低高度統合センシング通信(ISAC)ネットワークにおける重要なセキュリティ監視戦略である。
UAVID識別のための新しい動的知識蒸留(KD)対応無線周波数指紋大言語モデル(RFF-LLM)を提案する。
実験結果から,提案フレームワークは,0.15万のパラメータと2.74ミリ秒の応答時間で,98.38%のID識別精度を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:14:44 GMT)
CardAIc-Agents: A Multimodal Framework with Hierarchical Adaptation for Cardiac Care Support [37.2] CardAIc-Agentsは、AIモデルを外部ツールで拡張し、多様な心臓タスクを適応的にサポートするフレームワークである。
カルディアックRAGのエージェントは、心の知識から一般的な計画を作成し、チーフエージェントはこれらの計画を自律的に実行し、決定を下すためのツールを統合した。
3つのデータセットを対象とした実験では、主流のVision-Language Models (VLM)、最先端のエージェントシステム、微調整されたVLMと比較して、CardAIc-Agentsの有効性が示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:17:12 GMT)
A Language-Signal-Vision Multimodal Framework for Multitask Cardiac Analysis [37.2] TGMM ( Textual Guidance Multimodal fusion for Multiple Heartc Task) を開発した。
本研究は,複数のモダリティにまたがる重要な特徴を体系的に検討し,臨床意思決定における相乗的貢献を解明した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:43:31 GMT)
Prompt-Induced Linguistic Fingerprints for LLM-Generated Fake News Detection [35.5] 言語的フィンガープリント抽出法(LIFE)を提案する。
単語レベルの確率分布を再構成することにより、LIFEはLLM生成フェイクニュースの検出を容易にする識別パターンを見つけることができる。
実験の結果, LIFE は LLM 生成フェイクニュースにおける最先端のパフォーマンスを達成し, 人手によるフェイクニュースにおけるハイパフォーマンスを維持していることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:24:54 GMT)
The Hidden Cost of Correlation: Rethinking Privacy Leakage in Local Differential Privacy [35.5] ローカルディファレンシャルプライバシ(LDP)は、分散システムにおけるプライバシ保護データ収集のための有望なパラダイムとして登場した。
最近の研究は、相関性によるプライバシー漏洩(CPL)が、LDPの下でのプライバシーとユーティリティのトレードオフを形成する上で重要な役割を担っていることを強調している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:34:04 GMT)
AI-Powered Assistant for Long-Term Access to RHIC Knowledge [35.2] RHIC Data and Analysis Preservation Plan (DAPP)は、ドキュメントへの自然言語アクセスを提供するAIベースのアシスタントシステムである。
持続可能な、説明可能な長期AIアクセスのために設計された、デプロイメント、計算性能、進行中のマルチエクスペリエンス統合、アーキテクチャ機能について報告する。
私たちの経験は、現代のAI/MLツールが科学的レガシデータのユーザビリティと発見可能性を変える方法を示しています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:16:29 GMT)
SIS-Challenge: Event-based Spatio-temporal Instance Segmentation Challenge at the CVPR 2025 Event-based Vision Workshop [35.1] 本稿では,CVPR 2025イベントベースビジョンワークショップと連携して,S-temporal Instance (SIS) の課題の概要を紹介する。
タスクの概要、課題の詳細、結果を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:49:06 GMT)
WeChat-YATT: A Scalable, Simple, Efficient, and Production Ready Training Library [34.5] WeChat-YATT Yet Another Transformer Trainer (YATT)は、シンプルでスケーラブルでバランスの取れたRLHFトレーニングフレームワークである。
YATTは、複雑なRLHFの柔軟かつ効率的なオーケストレーションを可能にする並列コントローラプログラミングモデルを備えている。
WeChat-YATTを様々な実験シナリオで評価し、最先端のRLHFトレーニングフレームワークよりも大幅にスループットが向上したことを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:48:53 GMT)
Omni Survey for Multimodality Analysis in Visual Object Tracking [34.3] 本稿では,Multi-Modal Visual Object Tracking (MMVOT) の最も重要な課題について検討する。
MMVOTは、データ収集、モダリティアライメントとアノテーション、モデル設計、評価の4つの重要な側面において、シングルモーダルトラッキングとは異なる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:18:59 GMT)
PC-Sampler: Position-Aware Calibration of Decoding Bias in Masked Diffusion Models [34.0] マスク付き拡散モデル(MDM)は、シーケンス生成のための強力な非自己回帰的な代替手段である。
本稿では,新しいデコード戦略である位置認識信頼度校正サンプリング(PC-Sampler)を紹介する。
PC-Samplerは、既存のMDMデコード戦略を平均で10%以上上回っている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:38:37 GMT)
Deep Research: A Survey of Autonomous Research Agents [34.0] 大規模言語モデル(LLM)の急速な進歩は、複雑なタスクを自律的に実行可能なエージェントシステムの開発を促している。
これらの制約を克服するため、深層研究のパラダイムが提案され、エージェントは、Webベースの証拠に根ざした包括的で忠実な分析レポートを生成するために、計画、検索、合成に積極的に従事する。
本稿では,計画,質問開発,Web探索,レポート生成の4段階からなるディープリサーチパイプラインの体系的概要について述べる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:26:14 GMT)
When Alignment Hurts: Decoupling Representational Spaces in Multilingual Models [33.3] 本稿では,大言語モデルの内部表現幾何学を解析し,直接介入することによって,この現象の包括的因果的研究を行う。
我々の重要な貢献は、微調整中に標準品種のサブスペースを継続的に推定するオンライン変分探索フレームワークである。
25の方言にまたがって、我々の介入は、通常の微調整と比較して、平均で+4.9 chrF++と+2.0で生成品質を向上させる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:34:08 GMT)
OS-R1: Agentic Operating System Kernel Tuning with Reinforcement Learning [32.8] 本稿では,ルールベース強化学習(RL)を利用したエージェントLinuxカーネルチューニングフレームワークOS-R1を紹介する。
カーネル構成空間をRL環境として抽象化することにより、OS-R1は大規模言語モデル(LLM)による効率的な探索を促進し、正確な構成変更を保証する。
実験の結果、OS-R1は既存のベースライン法よりも大幅に優れ、チューニングやデータ効率の維持よりも最大5.6%の性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:09:57 GMT)
TimeMachine: Fine-Grained Facial Age Editing with Identity Preservation [32.4] TimeMachineは、新しい拡散ベースのフレームワークで、アイデンティティ機能を維持しながら正確な年齢編集を実現する。
微細な年齢編集を可能にするため,高精度な年齢情報をマルチクロスアテンションモジュールに分割する。
年齢誘導モジュールは、トレーニング中に聴覚再建を行う代わりに、潜伏空間の年齢を直接予測する。
我々は、アイデンティティと顔属性をラベル付けした100万の高解像度画像を含むHFFAデータセットを構築した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:05:05 GMT)
Generalize across Homophily and Heterophily: Hybrid Spectral Graph Pre-Training and Prompt Tuning [32.3] 既存の方法は、様々なホモフィリーを持つ実世界のグラフにおける多様なスペクトル分布を処理できない。
本稿では,事前学習と即時学習の両方においてスペクトルアライメントを保証する新しいフレームワークを提案する。
本実験は,帰納的学習と帰納的学習の両方で有効性を検証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:08:59 GMT)
MDPO: Overcoming the Training-Inference Divide of Masked Diffusion Language Models [32.2] 拡散言語モデルは、トレーニングと推論の主な相違に悩まされる。
本稿では,マルコフ特性拡散を利用するためのMasked Diffusion Policy Optimization (MDPO)を提案する。
本研究は,MDLMの事前学習と推測の相違を調査するための大きな可能性を見出した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:58:13 GMT)
Improving Detection of Watermarked Language Models [31.8] 本研究では,透かし検出器と非透かし検出器を併用することにより,検出を改善できるかどうかを検討する。
本研究では,透かし検出器と非透かし検出器を組み合わせることで,検出を改善できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:43:06 GMT)
SpecDetect: Simple, Fast, and Training-Free Detection of LLM-Generated Text via Spectral Analysis [31.4] 本稿では,周波数領域におけるトークンログ確率のシーケンスを解析する新しいパラダイムを提案する。
我々は、グローバルなDFT: DFTトータルエネルギーの単一で堅牢な特徴の上に構築されたSpecDetectを構築した。
我々の研究は、LLM生成したテキスト検出のための新しい、効率的で解釈可能な経路を導入し、古典的な信号処理技術がこの現代の課題に対して驚くほど強力な解決策を提供することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:05:38 GMT)
Multi-Granularity Distribution Modeling for Video Watch Time Prediction via Exponential-Gaussian Mixture Network [31.4] EGMN(Exponential-Gaussian Mixture Network)は,EGM分布のパラメータ化のために提案される。
EGMNは粗粒度から細粒度まで優れた分布適合性を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:56:36 GMT)
Free-space time-bin encoded quantum key distribution from near- to mid-infrared wavelengths [31.1] 自由空間量子通信について検討し、量子鍵分布(QKD)の実装の利点を探る。
我々は、時間ビン符号化量子鍵分布をシミュレートし、様々な気象シナリオ下での従来の近赤外波長に基づいて、中赤外域で動作する自由空間QKDリンクが構成より優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:28:22 GMT)
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes [30.9] 複雑なビジュアルテキスト生成(CVTG)は、視覚画像内の様々な領域に分散した複雑なテキストコンテンツを生成することに焦点を当てている。
InGでは、画像生成モデルはしばしば歪んだ、ぼやけたビジュアルテキストをレンダリングするか、あるいは視覚的なテキストを欠いている。
我々は,新しいマルチビジュアルテキストレンダリング手法であるTextCrafterを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:41:10 GMT)
On computing and the complexity of computing higher-order $U$-statistics, exactly [30.8] 高次の$U$-statisticsは統計学、機械学習、コンピュータサイエンスなどの分野に多い。
広く見られるにもかかわらず、その計算複雑性に関する包括的な研究は驚くほど不足している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:01:10 GMT)
Towards SISO Bistatic Sensing for ISAC [30.7] WiDFS 3.0は、歪んだCSIから正確な遅延とドップラー推定を可能にする軽量な静電SISOセンシングフレームワークである。
送信機と受信機の両方で1つのアンテナで動作し、低複雑さの展開に適している。
大規模な実験により、WiDFS 3.0は、従来のマルチアンテナ手法に匹敵する、あるいはそれ以上の性能で正確なパラメータ推定を実現することが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:22:05 GMT)
MuDRiC: Multi-Dialect Reasoning for Arabic Commonsense Validation [30.7] 複数の方言を組み込んだ拡張アラビア・コモンセンスデータセットである MuDRiC を導入し,(ii) アラビア・コモンセンス推論にグラフ畳み込みネットワーク(GCN)を適応させる新しい手法を提案する。
我々の研究は、その複雑なバリエーションを扱うための基礎的データセットと新しい方法の両方を提供することで、アラビア語の自然言語理解を強化する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:42:53 GMT)
A Law of Next-Token Prediction in Large Language Models [30.3] 大規模言語モデル(LLM)は様々なアプリケーションドメインで広く使われている。
文脈化トークン埋め込みの学習を規定する正確かつ定量的な法則を導入する。
その結果, 各層は予測精度の向上に等しく寄与することがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:36:50 GMT)
LLMs Are In-Context Bandit Reinforcement Learners [30.2] 大規模言語モデル(LLMs)は、モデルコンテキストに注釈付きサンプルを追加することに依存する教師付き学習技術であるICL(In-context Learning)で優れている。
そこで本研究では、教師付きデータではなく、外部報酬からオンラインのコンテキスト内学習を行うICRL(In-context reinforcement Learning)について検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:38:43 GMT)
MicroMIL: Graph-Based Multiple Instance Learning for Context-Aware Diagnosis with Microscopic Images [30.0] がん診断は、全スライディング画像(WSI)と多重インスタンス学習(MIL)の統合から大いに恩恵を受けている
GNN-MIL アプローチは,WSI における文脈情報取得のための強力なソリューションとして登場し,診断精度が向上している。
従来の光顕微鏡から取得した画像に特化して設計されたMILフレームワークであるMicroMILを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:31:21 GMT)
CMF-IoU: Multi-Stage Cross-Modal Fusion 3D Object Detection with IoU Joint Prediction [29.7] カメラとLiDARセンサーに基づくマルチモーダル手法は、3D検出の分野で大きな注目を集めている。
CMF-IOUと呼ばれる多段階の相互融合3D検出フレームワークを導入し,3次元空間情報と2次元意味情報を整合させることの課題に対処する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:32:07 GMT)
E3RG: Building Explicit Emotion-driven Empathetic Response Generation System with Multimodal Large Language Model [29.4] 本稿では,感情駆動型感情応答生成システムであるE3RGを提案する。
MERGタスクは、マルチモーダル共感理解、共感記憶検索、マルチモーダル応答生成という3つの部分に分けられる。
E3RGは、追加のトレーニングなしで自然で、感情的に豊かで、アイデンティティに一貫性のある応答を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:47:02 GMT)
Translation of Text Embedding via Delta Vector to Suppress Strongly Entangled Content in Text-to-Image Diffusion Models [29.1] 本稿では,特定の単語に強く絡み合ったコンテンツを抑制する新しい手法を提案する。
本手法は, テキスト埋め込みを改良し, 生成画像中の望ましくない内容の影響を弱める。
提案手法は, 定量的および定性的指標の観点から, 既存手法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:07:34 GMT)
Documenting Deployment with Fabric: A Repository of Real-World AI Governance [29.1] FabricはデプロイされたAIユースケースのリポジトリで、ガバナンスメカニズムを概説している。
本稿では,AI使用の保護に使用される監視機構とガードレールについて論じる。
私たちは、研究者がAIガバナンスの有効性を研究するために、Fabricを拡張可能で進化するツールとして提供するつもりです。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:24:27 GMT)
Efficient Discovery of Motif Transition Process for Large-Scale Temporal Graphs [28.7] PTMTは、大規模な時間グラフにおける遷移過程を発見するための新しい方法である。
ツリーベースのフレームワークと時間と構造によって時間的ゾーンを分割する時間的ゾーン(TZP)戦略を統合する。
10の実世界のデータセットの結果、PTMTのスピードアップはSOTA法と比較すると12.0$times$ 50.3$times$である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:03:29 GMT)
2COOOL: 2nd Workshop on the Challenge Of Out-Of-Label Hazards in Autonomous Driving [28.4] 2025年10月19日,ハワイ州ホノルルで開催されたICCV(International Conference on Computer Vision)2025で,2COOOL(Out-of-Label Hazards in autonomous Driving)の第2回ワークショップが開催される。
本研究の目的は,異常検出,オープンセット認識,オープンボキャブラリモデリング,ドメイン適応,関連分野からアイデアを抽出し,ハザード回避のための新しいアルゴリズムとシステムを開発することである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:55:54 GMT)
Towards Urban Planing AI Agent in the Age of Agentic AI [27.5] 都市計画とは別に、生成AI、大規模言語モデル、エージェントAIが出現している。
既存の研究は、都市計画をジェネレーティブなAIタスクとして概念化し、そこでAIは土地利用構成を合成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:14:26 GMT)
TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods [27.5] 時系列は、経済、交通、健康、エネルギーといった様々な領域で生成される。
本稿では,時系列予測(TSF)手法の自動ベンチマークであるTFBを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:01:29 GMT)
ViDA-UGC: Detailed Image Quality Analysis via Visual Distortion Assessment for UGC Images [27.4] 本研究では,VDA-UGCと呼ばれる画像のための大規模な視覚歪評価インストラクションデータセットを構築した。
このデータセットは、人間の主題アノテーションとChain-of-Thoughtフレームワークを含む歪み指向パイプラインによって構築される。
我々は、ViDA-UGCから対応する6,149の質問応答対を持つ476の画像を選択し、専門家チームを招待して、GPT生成情報の正確性と品質を保証する。
ViDA-UGCおよびCoTフレームワークが画像品質解析能力の維持に有効であることを示す実験結果が得られた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:02:58 GMT)
Rethinking Aleatoric and Epistemic Uncertainty [27.4] 本稿では,データにおける不確実性,予測性能,統計的分散という厳密な概念を包含する決定論的視点を提案する。
我々は、人気のある情報理論量についての洞察を提供し、それらがしばしば測定対象とされているものの、評価に乏しいことを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:33:40 GMT)
MAJIC: Markovian Adaptive Jailbreaking via Iterative Composition of Diverse Innovative Strategies [27.2] 大きな言語モデル(LLM)は目覚ましい能力を示したが、ジェイルブレイク攻撃には弱いままである。
我々は,多様な革新的な変装戦略を反復的に組み合わせてブラックボックスLLMを攻撃するマルコフ適応型ジェイルブレイクフレームワークMAJICを提案する。
GPT-4o や Gemini-2.0-flash などの著名なモデルでは,MAJIC が既存のjailbreak 手法を著しく上回っていることが実証された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:09:57 GMT)
Diving into the Fusion of Monocular Priors for Generalized Stereo Matching [27.2] 近年,視覚基礎モデル (VFM) に先立って, 偏りのない単分子を応用して, 不測領域の一般化を向上することで, ステレオマッチングが進展している。
本稿では,深度マップを二項相対形式に変換する融合を導くための二項局所順序付けマップを提案する。
また、画素単位の線形回帰モジュールがそれらをグローバルかつ適応的に整列できるような登録問題として、単分子深度を不均質に最終的に直接融合させることを定式化する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:04:41 GMT)
Reinforcement Learning with Rubric Anchors [27.0] RLVR(Reinforcement Learning from Verifiable Rewards)は、大規模言語モデル(LLM)の強化のための強力なパラダイムとして登場した。
我々はRLVRパラダイムを、ルーブリックベースの報酬を統合することで、オープンエンドタスクに拡張する。
私たちは、これまでで最大のルーリック報酬システムを構築しており、人間やLLM、ハイブリッドな人間とLLMのコラボレーションから1万以上のルーリックを集めています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:06:08 GMT)
Optimization of Prompt Learning via Multi-Knowledge Representation for Vision-Language Models [27.0] CoKnowは、リッチなコンテキスト知識を備えたビジョンランゲージモデルのためのPrompt Learningを強化するフレームワークである。
我々は11の公開データセットに対して広範な実験を行い、CoKnowが過去の手法より優れていることを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:43:59 GMT)
Unified and Semantically Grounded Domain Adaptation for Medical Image Segmentation [26.9] 医用画像セグメンテーションのための以前の教師なし領域適応アプローチは、ソースアクセス可能な設定に合わせて狭義に調整されている。
我々は、ソースアクセシビリティとソースフリーアダプションの両方をサポートする統一的でセマンティックな基盤となるフレームワークを導入する。
当社のフレームワークは、ソースフリー性能がソースアクセシビリティに近づきながら、両方の設定で最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:39:33 GMT)
S^2-Guidance: Stochastic Self Guidance for Training-Free Enhancement of Diffusion Models [26.7] S2-Guidanceは、フォワードプロセス中のブロックドロップを利用してサブネットワークを構築する新しい方法である。
テキスト・ツー・イメージおよびテキスト・ツー・ビデオ生成タスクの実験は、S2-Guidanceが優れたパフォーマンスを提供することを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:31:20 GMT)
Understanding the Impact of Confidence in Retrieval Augmented Generation: A Case Study in the Medical Domain [26.7] Retrieval Augmented Generation (RAG) は、クエリの応答精度を高めるために外部情報を活用することで、Large Language Models (LLM) の知識を補完する。
本研究は、RAGが医療領域におけるLCM出力の信頼性を向上させるかどうかを検討することに焦点を当てた。
我々は,モデルの予測確率をその出力として扱い,キャリブレーション誤差法,エントロピー,最適確率,精度などを含むいくつかの評価指標を計算することにより,信頼度を評価する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:32:38 GMT)
EvolMathEval: Towards Evolvable Benchmarks for Mathematical Reasoning via Evolutionary Testing [26.6] 本稿では,進化テストに基づく自動ベンチマーク生成および進化フレームワークであるEvolMathEvalを紹介する。
ユニークな評価インスタンスab initioを動的に生成することにより、このフレームワークはデータ汚染のリスクを根本的に排除する。
EvolMathEvalは、連続的な自己イテレーションを通じて大量の高次問題を生成するだけでなく、公開データセットの複雑さを大幅に高めることもできる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:24:10 GMT)
Seeing the Many: Exploring Parameter Distributions Conditioned on Features in Surrogates [26.5] 逆問題は探索として理解でき、そこではサロゲート出力が指定された特徴を含むパラメータを見つけることを目的としている。
本研究の目的は,与えられた出力特性を生成する可能性のある入力パラメータの分布をモデル化し,可視化することである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:01:01 GMT)
BUILDA: A Thermal Building Data Generation Framework for Transfer Learning [26.5] トランスファーラーニングは、建築熱力学のデータ駆動モデリングを改善することができる。
本稿では,TL研究における適切な品質と量の合成データを生成するためのフレームワークであるBuilDaについて述べる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:01:37 GMT)
Beyond Internal Data: Bounding and Estimating Fairness from Incomplete Data [26.0] 貸付、雇用、医療といった高度な領域では、AIシステムの公平性を保証することが重要である。
業界設定では、法とプライバシーに関する懸念は、集団格差を評価するために必要な人口統計データの収集を制限する。
我々の研究は、そのような利用可能な別のデータを活用して、完全なデータがアクセスできないときにモデルフェアネスを見積もることを目指している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:57:30 GMT)
Frequency-Driven Inverse Kernel Prediction for Single Image Defocus Deblurring [25.7] 単一画像デフォーカスデブルリングは、デフォーカス相手からオールインフォーカスイメージを復元することを目的としている。
既存のほとんどの手法は、カーネル推定のための空間的特徴に依存しているが、その性能はひどくぼやけた領域で低下する。
本稿では、周波数領域表現を組み込んだ周波数駆動逆カーネル予測ネットワーク(FDIKP)を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:01:13 GMT)
MAViS: A Multi-Agent Framework for Long-Sequence Video Storytelling [25.6] MAViSは、長期的なビデオストーリーテリングのためのエンドツーエンドのコラボレーティブフレームワークである。
スクリプト作成、ショットデザイン、キャラクターモデリング、生成、ビデオアニメーション、オーディオ生成など、複数のステージにまたがる特殊エージェントを編成する。
短いユーザープロンプトだけで、MAViSは高品質で表現力のあるロングシーケンスなビデオストーリーテリングを制作できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:18:46 GMT)
Motion2Motion: Cross-topology Motion Transfer with Sparse Correspondence [25.6] Motion2Motionは、スケルトン間のアニメーションのためのトレーニング不要のフレームワークである。
類似の骨格とクロス種の骨格移動シナリオの両方において、効率的で信頼性の高い性能を達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:50:31 GMT)
SL-ACC: A Communication-Efficient Split Learning Framework with Adaptive Channel-wise Compression [25.5] Split Learning(SL)は、エッジデバイスからサーバへの一次コンピューティング負荷をオフロードすることで、有望なソリューションを提供する。
参加する装置の数が増えるにつれて、過度にスマッシュされたデータの送信がSLの大きなボトルネックとなる。
本稿では,2つの鍵成分からなる通信効率の高いSLフレームワークSL-ACCを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:02:10 GMT)
Action is All You Need: Dual-Flow Generative Ranking Network for Recommendation [25.3] 本稿では,相互作用モデリングの最適化にデュアルフロー機構を用いるDual-Flow Generative Ranking Network (DFGR)を提案する。
DFGRは、元のユーザ行動シーケンスを、アクション情報の信頼性に基づいて、実際のフローと偽のフローに複製する。
この設計は、MetaのHSTUベースのモデルと比較して、計算オーバーヘッドを低減し、トレーニング効率と推論性能の両方を改善する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:53:56 GMT)
PixelPonder: Dynamic Patch Adaptation for Enhanced Multi-Conditional Text-to-Image Generation [25.0] 単一制御構造下で複数の視覚条件を効果的に制御できる新しい統一制御フレームワークであるPixelPonderを提案する。
具体的には、サブリージョンレベルで空間的に関連する制御信号を動的に優先順位付けするパッチレベル適応条件選択機構を設計する。
大規模な実験では、PixelPonderがさまざまなベンチマークデータセットにまたがる従来のメソッドを上回ることが示されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:48:18 GMT)
CaRL: Learning Scalable Planning Policies with Simple Rewards [24.5] 強化学習はスケーラブルで、模倣学習のような複雑なエラーに苦しむことはない。
ミニバッチサイズが大きくなると、PPOはこれらの報酬の一般的なバージョンを最適化できないことを示す。
本稿では,1つの直感的な報酬項,すなわち経路完了を最適化する新しい報酬設計を提案する。
PPOは、私たちの単純な報酬でトレーニングされた場合、より高いミニバッチサイズでスケールでき、パフォーマンスも向上します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:46:42 GMT)
Prune2Drive: A Plug-and-Play Framework for Accelerating Vision-Language Models in Autonomous Driving [24.2] VLM(Vision-Language Models)は、自動運転において有望なパラダイムとして登場した。
VLMは、視覚入力と自然言語命令を共同でモデル化することで、認識、推論、意思決定のための統一されたフレームワークを提供する。
自律運転における多視点VLMのためのプラグ&プレイ型ビジュアルトークンプルーニングフレームワークPrune2Driveを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:47:26 GMT)
Temporal and Rotational Calibration for Event-Centric Multi-Sensor Systems [24.1] イベントカメラは画素レベルの明るさ変化に応じて非同期信号を生成する。
イベント中心型マルチセンサシステムに適した動きに基づく時間・回転キャリブレーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:53:27 GMT)
Atom-Searcher: Enhancing Agentic Deep Research via Fine-Grained Atomic Thought Reward [24.1] 大規模言語モデル(LLM)は、目覚ましい問題解決能力を示すが、静的な内部知識のために複雑なタスクに苦しむ。
エージェントディープリサーチの最近の進歩は、LSMに自律的に情報を分析し、検索し、合成する権限を与えている。
我々はまず、推論を微粒な機能単位に分解する新しいLCM思考パラダイムであるAtomic Thoughtを提案する。
そこで我々は,Atom ThoughtとATRを統合したエージェントディープリサーチのための新しいRLフレームワークAtom-Searcherを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:23:10 GMT)
Strengthening Programming Comprehension in Large Language Models through Code Generation [23.7] 大規模言語モデル(LLM)は、最近、様々なコード関連タスクにおいて印象的な結果を示している。
データフローや制御フローといった基本的なプログラミング概念の理解は依然として浅いままであり、コードが深い推論を必要とする場合、脆弱なパフォーマンスをもたらす。
本研究は,LLMをより深い概念的理解に向けて導くために設計された,概念意識のチューニングと組み合わせた,反実的コード拡張フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:33:03 GMT)
A Functionality-Grounded Benchmark for Evaluating Web Agents in E-commerce Domains [23.4] 電子商取引分野の現在のベンチマークは2つの大きな問題に直面している。
主に製品検索のタスクに重点を置いており、現実世界のeコマースプラットフォームが提供する幅広い機能を捉えていない。
幅広いタスクをカバーするユーザクエリを生成するために,Amazon-Benchという新しいベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:58:43 GMT)
BQA: Body Language Question Answering Dataset for Video Large Language Models [23.2] 非言語コミュニケーションは形式的な規則を欠き、常識的理解に基づく複雑な推論を必要とする。
身体言語を正確に解釈するビデオ大言語モデル(VideoLLMs)は、人間の無意識行動がモデルに意図を誤解釈させる可能性があるため、重要な課題である。
本稿では,ボディランゲージの短いクリップから感情を正しく解釈できるかどうかを検証するために,ボディーランゲージ質問応答データセットであるBQAを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:23:40 GMT)
Reinforced Context Order Recovery for Adaptive Reasoning and Planning [23.2] 現在の因果関係と拡散モデルでは、適応的なトークン生成順序を必要とする問題で難題に遭遇する。
適応型・データ依存型トークン生成順序を抽出する強化学習ベースのフレームワークであるReinforced Context Order Recovery (ReCOR)を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:42:55 GMT)
Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models [23.0] 小型言語モデル(SLM)はNL2タスクと競合し、パフォーマンスが悪く、既存のフレームワークと互換性がない。
SLMに適した新しい軽量フレームワークであるFeather- Paradigmを紹介します。
提案されたパラダイムは、SLMの精度の上限を54.76%に引き上げ、その有効性を強調している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:31:41 GMT)
CCDM: Continuous Conditional Diffusion Models for Image Generation [22.7] 条件拡散モデル(CDM)は連続条件生成モデリング(CCGM)に代わる有望な選択肢を提供する
CDMは、特別に設計された条件拡散プロセス、新しいハード・ヴィジナル・イメージ・デノージング・ロス、効率的な条件サンプリング・プロシージャによる既存の制限に対処する。
CCDMは最先端のCCGMモデルより優れており,新たなベンチマークが確立されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:15:13 GMT)
HeteroRAG: A Heterogeneous Retrieval-Augmented Generation Framework for Medical Vision Language Tasks [22.6] We present HeteroRAG, a novel framework that enhances Med-LVLMs through heterogeneous knowledge sources。
HeteroRAGは、ほとんどの医療ビジョン言語ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:54:10 GMT)
Beyond GPT-5: Making LLMs Cheaper and Better via Performance-Efficiency Optimized Routing [22.5] Avengers-Proは、大規模な言語モデルのためのテスト時間ルーティングフレームワークである。
様々な能力と効率のLCMをアンサンブルする。
最強のシングルモデルを平均精度で+7%超えることができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:23:31 GMT)
Contrastive Representations for Temporal Reasoning [22.4] 標準的な時間的コントラスト学習は、その人気にもかかわらず、しばしば、刺激的な特徴に依存しているため、時間的構造を捉えることに失敗する。
本稿では,これらの突発的特徴を正に除去する負のサンプリング手法である,時間的推論のための Combinatorial Representations(CRTR)を紹介する。
CRTRはソコバンやルービックキューブのような複雑な時間構造を持つ領域に対して強い結果をもたらす。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:20:08 GMT)
Maximum Score Routing For Mixture-of-Experts [22.1] MaxScoreは、最小コストの最大フロー問題としてルーティングをモデル化し、SoftTopk演算子を統合する、新しいMoEルーティングパラダイムである。
MaxScoreは、制約付きベースラインと制約なしベースラインの両方と比較して、トレーニング損失の低減と同等のFLOPでの評価スコアの向上を実現している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:25:42 GMT)
Deploying Models to Non-participating Clients in Federated Learning without Fine-tuning: A Hypernetwork-based Approach [22.0] フェデレートラーニング(FL)は、プライバシー保護のための協調学習のための有望なパラダイムとして登場した。
本稿では,分布認識型埋め込みを前提としたハイパーネットワークを用いて,特殊モデルを動的に生成するHyperFedZeroを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:11:51 GMT)
Compact Attention: Exploiting Structured Spatio-Temporal Sparsity for Fast Video Generation [21.9] Compact Attentionは,3つのイノベーションを特徴とする,ハードウェア対応のアクセラレーションフレームワークだ。
単体GPUのセットアップに注意を向け,1.62.5倍の高速化を実現した。
この研究は、構造化された空間的利用を通じて効率的な長ビデオ生成を解放するための原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:45:42 GMT)
Quantifying and Alleviating Co-Adaptation in Sparse-View 3D Gaussian Splatting [21.3] 3D Gaussian Splatting (3DGS) は、高密度ビュー環境下での新規なビュー合成において、印象的な性能を示した。
スパースビューのシナリオでは、トレーニングビューのリアルなレンダリングにもかかわらず、3DGSは時々、新しいビューで外見のアーティファクトを示す。
本稿では,スパースビュー3DGSの外観アーティファクトについて検討し,現在のアプローチの限界を明らかにする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:34:49 GMT)
Hyperspectral Image Generation with Unmixing Guided Diffusion Model [21.1] 拡散モデルは高品質なサンプルを生成する能力で人気がある。
ハイパースペクトルアンミックス法により導かれる新しい拡散モデルを提案する。
我々のモデルは高品質で多様なハイパースペクトル画像を生成することができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:45:36 GMT)
Enhancing Cryptocurrency Sentiment Analysis with Multimodal Features [21.0] 我々はTikTokとTwitterの感情を比較したマルチモーダル分析を行い、ビデオデータとテキストデータの両方からインサイトを抽出する。
以上の結果から,TikTokの動画ベースの感情が投機的資産や短期市場の動向に大きく影響していることが判明した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:58:44 GMT)
DiffMesh: A Motion-aware Diffusion Framework for Human Mesh Recovery from Videos [20.9] ヒューマンメッシュリカバリ(Human Mesh recovery, HMR)は、さまざまな現実世界のアプリケーションに対して、リッチな人体情報を提供する。
ビデオベースのアプローチはこの問題を緩和するために時間的情報を活用する。
DiffMeshはビデオベースのHMRのための革新的な動き認識型拡散型フレームワークである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:08:32 GMT)
TalkPlayData 2: An Agentic Synthetic Data Pipeline for Multimodal Conversational Music Recommendation [20.9] TalkPlayData 2は、エージェントデータパイプラインによって生成されるマルチモーダルな会話音楽レコメンデーションのための合成データセットである。
TalkPlayData 2パイプラインでは、複数の大規模言語モデル(LLM)エージェントが特別なプロンプトでさまざまな役割の下で作成される。
すべてのLLMは音声と画像でマルチモーダルであり、マルチモーダルレコメンデーションと会話のシミュレーションを可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:06:58 GMT)
Overconfidence in LLM-as-a-Judge: Diagnosis and Confidence-Driven Solution [20.6] 大規模言語モデル(LLM)は自動化された判断として広く使われており、実際的な価値は正確さと信頼性の高いリスク認識の判断の両方に依存する。
既存のアプローチは主に正確さに焦点を合わせ、よく校正された信頼の必要性を見越す。
我々は、精度中心の評価から信頼性駆動型、リスク対応型LCM-as-a-Judgeシステムへの移行を提唱する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:00:32 GMT)
GTool: Graph Enhanced Tool Planning with Large Language Model [20.6] 非完全依存関係下での大規模言語モデル(LLM)のツール計画能力を高めるために,textttGToolを提案する。
textttGToolは、リクエスト固有のツールグラフを構築し、ツールを効率的に選択し、十分な依存情報を提供する textttgraph token> を生成する。
大規模な実験により、textttGToolは最先端(SOTA)ベースラインと比較して29.6%以上のパフォーマンス改善が達成された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:46:55 GMT)
Benchmarking Spectral Graph Neural Networks: A Comprehensive Study on Effectiveness and Efficiency [20.5] スペクトルニューラルネットワーク(GNN)は、スペクトル領域でグラフ信号を取得する能力によって、人気が高まっている。
我々はスペクトルグラフフィルタとして、スペクトル視点に焦点をあててスペクトルGNNを広範囲にベンチマークする。
我々は、グラフ計算と効率的なトレーニングスキームにより、スペクトル指向の統一フレームワーク内にフィルタを実装した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:04:50 GMT)
DESIGNER: Design-Logic-Guided Multidisciplinary Data Synthesis for LLM Reasoning [20.5] DeSIGNER: DESIGN-logic-guidEd Reasoningデータ合成パイプラインを提案する。
中心となる革新はデザイン論理の概念の導入である。
これらの設計ロジックを学際的な資料と組み合わせることで、既存のデータセットの難易度や多様性をはるかに超える理性的な疑問を生み出すことができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:49:29 GMT)
An MRP Formulation for Supervised Learning: Generalized Temporal Difference Learning Models [20.3] 従来の統計的学習では、データポイントは独立して同じ分布であると仮定される。
本稿では,データポイントを相互に知覚するコントラスト的視点を提案する。
一般化時間差(TD)学習アルゴリズムを解法として導入する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:20:21 GMT)
Unlearning Comparator: A Visual Analytics System for Comparative Evaluation of Machine Unlearning Methods [20.1] Machine Unlearning(MU)は、トレーニングされたモデルからターゲットトレーニングデータを削除して、削除されたデータがモデルの振る舞いにもはや影響を与えないようにすることを目的としている。
しかし、この急速に発展する分野の研究者たちは、異なるMUメソッドの振る舞いを分析し、理解する上で困難に直面している。
MU手法の体系的評価を容易にするために,視覚解析システムUnlearning Comparatorを導入する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:53:53 GMT)
Design and Analysis of Robust Adaptive Filtering with the Hyperbolic Tangent Exponential Kernel M-Estimator Function for Active Noise Control [19.2] 我々は,フィルタ付きx双曲型指数関数Kernel M-estimate関数 (FXHEKM) のロバスト適応アルゴリズムを開発した。
提案したFXHEKMアルゴリズムの統計的解析と計算コストの検討を行った。
数値計算の結果,FXHEKMアルゴリズムの有効性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:37:11 GMT)
Overcoming Latency Bottlenecks in On-Device Speech Translation: A Cascaded Approach with Alignment-Based Streaming MT [19.1] 本稿では,ASR(Automatic Speech Recognition)とMT(Machine Translation)をリアルタイム・オンデバイス・ストリーミング音声翻訳に利用する際の課題について述べる。
本稿では,翻訳品質とレイテンシを効果的にバランスさせる同時翻訳手法を提案する。
我々は,デバイス上でのバイリンガル音声翻訳にアプローチを適用し,レイテンシと品質の点で,我々の技術がベースラインより優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:00:11 GMT)
Structure-preserving Feature Alignment for Old Photo Colorization [19.0] SFAC(Structure-serving Feature Alignment Colorizer)と呼ばれる新しいCNNベースのアルゴリズムを提案する。
SFACは、古い写真色付けのための2つの画像のみをトレーニングし、ビッグデータへの依存を排除している。
我々の主な目的は、2つの画像間のセマンティック対応を確立することであり、セマンティック関連オブジェクトが類似した色を持つことを保証することである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:10:40 GMT)
Towards Human-AI Complementarity in Matching Tasks [18.7] 協調的なアプローチをとるデータ駆動型アルゴリズムマッチングシステムを提案する。
Comatchは最も自信のある決定のみを選択し、残りの決定を人間の意思決定者に委ねる。
その結果, マッチングによって生成されるマッチング結果が, ヒトの参加者, あるいはアルゴリズムのマッチングによって生成したマッチング結果よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:02:45 GMT)
Preserve and Sculpt: Manifold-Aligned Fine-tuning of Vision-Language Models for Few-Shot Learning [18.6] 我々は,新しい微細チューニング手法,マニフォールド保存・彫刻チューニング(MPS-Tuning)を提案する。
MPS-Tuningは、クラス分離性を高めるために、この多様体の固有の幾何学を明示的に制限する。
実験により,MPS-Tuningは意味多様体の構造を効果的に保ちながら,モデル性能を著しく向上させることが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:28:43 GMT)
Towards No-Code Programming of Cobots: Experiments with Code Synthesis by Large Code Models for Conversational Programming [18.3] LLM(Large Language Models)は、対話型コード生成のためのコンテキスト内学習を行うように設計されている。
本研究は,テキスト中の実例から,このようなコードを合成するための最先端のLLMの性能を評価する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:35:14 GMT)
From Templates to Natural Language: Generalization Challenges in Instruction-Tuned LLMs for Spatial Reasoning [18.3] 本稿では,2.5ドルの格子上にオブジェクト配置を構築するための命令をモデルで解釈し,翻訳する空間接地作業における一般化課題について検討する。
合成命令のみを用いてLCMを微調整し、合成命令と人文命令の両方を含むベンチマークデータセット上でその性能を評価する。
その結果,単純なタスクではモデルがよく一般化されるが,より複雑なタスクでは性能が著しく低下することがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:18:35 GMT)
Towards Vision Zero: The TUM Traffic Accid3nD Dataset [18.1] TUM Traffic Accid3nD data, a collection of real-world highway accidents in different weather and lighting conditions。
データセットには4台の路面カメラとLiDARから25Hzで記録された111,945個のラベル付き画像と点雲フレームが含まれている。
本稿では,ルールに基づくアプローチと学習に基づくアプローチを組み合わせた事故検出モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:09:04 GMT)
DocHPLT: A Massively Multilingual Document-Level Translation Dataset [18.0] DocHPLTは、これまでで最大のドキュメントレベルの翻訳データセットである。
50言語にまたがる1億2400万行の文書が英語と組み合わせられ、そのうち426億行が文化されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:52:18 GMT)
Lumen: Consistent Video Relighting and Harmonious Background Replacement with Video Generative Models [18.0] 本稿では,大規模ビデオ生成モデルを用いたエンドツーエンドのビデオリライトフレームワークであるLumenを提案する。
合成ドメインでは、高度な3Dレンダリングエンジンを活用し、多様な環境でビデオペアをキュレートする。
現実的な領域では、HDRベースの照明シミュレーションを適用して、ペアの内蔵ビデオの欠如を補う。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:21:22 GMT)
CASPER: Concept-integrated Sparse Representation for Scientific Retrieval [17.7] 本稿では,トークンとキーフレーズを表現単位とする科学検索のためのスパース検索モデルであるCASPERを提案する。
CASPERはキーフレーズ生成タスクに効果的に利用でき、確立されたCopyRNNとの競合性能を実現する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:00:57 GMT)
Breaking Language Barriers: Equitable Performance in Multilingual Language Models [17.3] LLMは、ヒンディー語やスワヒリ語のような低リソース言語(LRL)において、英語のような高リソース言語(HRL)と比較して、CSR(Common Sense Reasoning)タスクにおいて、さらにパフォーマンスが悪くなる。
我々のアプローチは、制御された言語混合法を用いて生成された合成コード切替テキスト上でLLMを微調整することである。
そこで本稿では,CommonSenseQAデータセットから派生した,3つの異なる言語比構成を特徴とする合成符号切替テキストのデータセットを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:50:24 GMT)
Learning In-context $\pmb{n}$-grams with Transformers: Sub-$\pmb{n}$-grams Are Near-stationary Points [17.3] In-context next-token predictionタスクで訓練されたトランスフォーマーモデルの損失状況について検討する。
特に、コンテキスト内$n$-gramの言語モデルをクロスエントロピー損失下で学習することに焦点を当てる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:24:30 GMT)
GraphLand: Evaluating Graph Machine Learning Models on Diverse Industrial Data [17.3] GraphLandは、さまざまな産業アプリケーションからノードプロパティを予測するための14のグラフデータセットのベンチマークである。
さまざまなサイズ、構造特性、特徴セットを持つ幅広いグラフ上で、すべて統一された設定でグラフMLモデルを評価することができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:45:52 GMT)
Co-Writing with AI, on Human Terms: Aligning Research with User Demands Across the Writing Process [17.3] AI記述支援のための4つの包括的な設計戦略を特定します。
著者が望むAI介入のレベルが、執筆プロセスによって異なることが明らかとなった。
我々の発見は、AIとの共同筆記のための人間中心の筆記ツールを開発するための実用的な設計ガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:52:18 GMT)
Is This News Still Interesting to You?: Lifetime-aware Interest Matching for News Recommendation [17.1] LIMEという,nEwsレコメンデーションのための新しいライフタイム対応関心マッチングフレームワークを提案する。
LIME は,(1) ユーザトピック対に対するニュースの相対年齢をとらえるユーザ・トピック・ライフタイムの表現,(2) 時間的に整合したユーザ表現を生成する候補・ライフアテンションの注意,(3) 有効候補ニュースを予測時に優先する鮮度誘導関心改善の3つの主要な戦略を取り入れている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:36:27 GMT)
Creative4U: MLLMs-based Advertising Creative Image Selector with Comparative Reasoning [17.0] 本稿では,創造的評価と選択のための第1のパラダイムを提案する。
マルチモーダル大規模言語モデル(MLLM)を用いて,創造的画像の評価と選択を自然言語タスクに統合する。
私たちのコードとデータセットは、研究と産業の応用を進めるために公開されます。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:11:30 GMT)
Batching-Aware Joint Model Onloading and Offloading for Hierarchical Multi-Task Inference [17.0] クライアントとエッジサーバにどのマルチタスクモデルをデプロイ(オンロード)するかを共同で決定する統合フレームワークを提案する。
本稿では,ラグランジアン近似による部分モジュラー最適化によりモデル載荷を選択し,最適なオフロードを決定する交互アルゴリズムであるJ3Oを紹介する。
実験によると、J3Oは最適な精度の97%以上を一貫して達成し、最適なソルバが要求するランタイムの15%以下を達成している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:49:32 GMT)
Fusing Echocardiography Images and Medical Records for Continuous Patient Stratification [16.9] 本研究は, 高血圧症と診断し難い連続体を用いて, 心血管系病理の表現を学習する手法を提案する。
提案手法はまず各変数をモダリティ固有のアプローチを用いて表現空間に射影する。
これらの標準化されたマルチモーダルデータの表現は、Transformerエンコーダに送られ、臨床評価を予測するタスクを通じて、患者の包括的な表現にマージすることを学ぶ。
239人の高血圧患者のコホートでこの連続体に沿った主要な傾向を観察し、高血圧が様々な心機能記述因子に与える影響について、前例のない詳細を報告した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:06:32 GMT)
SpikeSTAG: Spatial-Temporal Forecasting via GNN-SNN Collaboration [16.8] スパイキングニューラルネットワーク(SNN)は、時間データの複雑さを捉えるためのユニークなアプローチを提供する。
本稿では,グラフ構造学習とスパイクに基づく時間的処理をシームレスに統合する,新しいSNNアーキテクチャを提案する。
実験の結果、我々のモデルはすべてのデータセットで最先端のSNNベースのiSpikformerを上回ることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:48:23 GMT)
SocialTrack: Multi-Object Tracking in Complex Urban Traffic Scenes Inspired by Social Behavior [16.7] 本稿では,複雑な都市交通環境における小目標の追跡精度とロバスト性を高めるために,新しい多目的追跡フレームワークSocialTrackを提案する。
特殊小ターゲット検出器は、マルチスケールの特徴増強機構を用いて検出性能を向上させる。
UAVDTとMOT17データセットに関する大規模な実験は、SocialTrackが既存の最先端(SOTA)メソッドをいくつかの主要なメトリクスで上回っていることを示している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:53:32 GMT)
InsightX Agent: An LMM-based Agentic Framework with Integrated Tools for Reliable X-ray NDT Analysis [16.7] 非破壊試験(NDT)は産業品質保証に不可欠である。
既存のディープラーニングベースのアプローチは、対話性、解釈可能性、そして批判的な自己評価能力に欠けることが多い。
本稿では,信頼性,解釈性,インタラクティブなNDT分析を実現するための新しいLMMベースのエージェントフレームワークであるInsightX Agentを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:15:10 GMT)
FuSaR: A Fuzzification-Based Method for LRM Safety-Reasoning Balance [16.7] 大規模推論モデル(LRM)は、その強力な推論能力のために、様々なタスクにまたがって印象的な性能を誇示している。
推論能力を犠牲にすることなく, LLMの安全性を向上させる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:54:16 GMT)
Illuminating LLM Coding Agents: Visual Analytics for Deeper Understanding and Enhancement [16.5] 我々は,コーディングエージェントの動作の検査を強化するために,視覚分析システムを導入する。
我々のシステムでは,ML科学者がエージェントの動作に関する構造化された理解を得ることが可能である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:17:11 GMT)
TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection [16.4] 本稿では,TeleAntiFraud-28kについて紹介する。
本データセットは,(1)自動音声認識(ASR)で書き起こされた通話記録(匿名化元音声)を用いたプライバシ保存テキストトラス・サンプル生成,(2)大規模言語モデル(LLM)に基づく自己指示サンプリングによるシナリオカバレッジの拡大,の3つの戦略により構築されている。
生成されたデータセットは、厳密に処理された28,511の音声テキストペアを含み、不正推論のための詳細なアノテーションを完備している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:18:06 GMT)
Physics-informed deep operator network for traffic state estimation [16.3] 交通状態推定(TSE)は、騒音の限られた測定値から交通流れのダイナミクスを管理する高次元偏微分方程式(PDE)を根本的に解く。
本稿では,TSEを演算子学習問題として再構成した物理インフォームドディープ演算子ネットワークフレームワークを採用する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:59:42 GMT)
TTA-DAME: Test-Time Adaptation with Domain Augmentation and Model Ensemble for Dynamic Driving Conditions [16.2] テスト時間適応(TTA)は、モデルが動的に適応し、ターゲットドメインのシフトに対して最適に実行する必要がある、という課題を提起する。
このタスクは、気象領域のシフトが頻繁に起こる現実世界の運転シーンで特に強調されている。
提案手法であるTTA-DAMEは,ターゲットドメインへのソースドメインデータ拡張を利用する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:48:35 GMT)
A Shift in Perspective on Causality in Domain Generalization [16.2] 我々は因果関係とDG文学の主張を再考する。
我々は、一般化における因果関係の役割に関するよりニュアンスな理論を論じる。
また、https://chai-uk.github.io/ukairs25-causal-predictors/でインタラクティブなデモも公開しています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:19:33 GMT)
NoCode-bench: A Benchmark for Evaluating Natural Language-Driven Feature Addition [16.1] この研究は、現実世界のNL駆動機能追加タスクで大きな言語モデル(LLM)を評価するために設計されたベンチマークであるNoCode-benchを紹介する。
高品質で人間認証された114のインスタンスのサブセット、NoCode-bench Verifiedは信頼性の高い評価を保証する。
我々の実験によると、トークンの使用率が高いにもかかわらず、最高のLCMはタスク成功率28.07%しか達成せず、クロスファイル編集、理解、ツール呼び出しの課題を強調している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:26:59 GMT)
SSPO: Self-traced Step-wise Preference Optimization for Process Supervision and Reasoning Compression [15.9] 後学習法は補助的なモデルや過度な考えのためにかなりの計算オーバーヘッドを発生させる。
本稿では,プラグインRLgableプロセス監視フレームワークであるSSPO(Self-traced Step-wise Preference Optimization)を提案する。
SSPOは、モデル自身が生成したステップワイズ優先信号を使用して、圧縮を推論するための最適化プロセスを導出する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:02:15 GMT)
IGFuse: Interactive 3D Gaussian Scene Reconstruction via Multi-Scans Fusion [15.8] IGFuseは対話型ガウスシーンを複数のスキャンから観測することで再構成する新しいフレームワークである。
本手法は,ガウス場を意識したセグメンテーションを構築し,スキャン間の双方向光度・セマンティック一貫性を実現する。
IGFuseは、密度の高い観測や複雑なパイプラインを使わずに、高忠実なレンダリングとオブジェクトレベルのシーン操作を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:59:47 GMT)
Randomized PCA Forest for Outlier Detection [15.8] RPCAフォレストを外乱検出に用いる新しい教師なし外乱検出法を開発した。
実験結果から,従来の手法や最先端手法と比較して,提案手法の優位性が示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:52:05 GMT)
OpenMoCap: Rethinking Optical Motion Capture under Real-world Occlusion [15.7] 我々は,大きな閉塞を有する環境下でのロバストなモーションキャプチャのための新しい動き解決モデルOpenMoCapを提案する。
提案されたOpenMoCapは、実際のデプロイのためにMoSen MoCapシステムに統合されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:12:13 GMT)
Insight Rumors: A Novel Textual Rumor Locating and Marking Model Leveraging Att_BiMamba2 Network [15.7] 本稿では,テキストデータ中の噂内容を識別し,マークするための,Insight Rumors という新しい噂検出モデルを提案する。
提案手法は、噂を正確に検知するだけでなく、正確な文脈で特定・マークするだけでなく、噂を大まかに識別できる最先端のスキームよりも優れている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:20:57 GMT)
Diagnostic-Guided Dynamic Profile Optimization for LLM-based User Simulators in Sequential Recommendation [15.6] DGDPOは動的かつ反復的な最適化プロセスを通じてユーザプロファイルを構築する新しいフレームワークである。
シングルラウンドインタラクションに限定された既存のLCMベースのユーザシミュレータとは異なり、DGDPOをシーケンシャルレコメンデータと統合するのは初めてです。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:17:59 GMT)
X-MoE: Enabling Scalable Training for Emerging Mixture-of-Experts Architectures on HPC Platforms [15.6] 我々は,次世代MoEアーキテクチャのスケーラブルなトレーニング性能を実現するために設計された,新しいMoEトレーニングシステムであるX-MoEを紹介する。
X-MoEは、クロスプラットフォームカーネルによる効率的なパディングフリーなMoEトレーニング、冗長性バイパスディスパッチ、シーケンスシャーディングされたMoEブロックによるハイブリッド並列化など、いくつかの新しい手法によってこれを達成している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:49:28 GMT)
Casual3DHDR: Deblurring High Dynamic Range 3D Gaussian Splatting from Casually Captured Videos [15.5] ニューラルレイディアンスフィールド(NeRF)や3Dガウススプラッティング(3DGS)などの多視点画像からのフォトリアリスティックな新規ビュー合成は、その優れた性能に対して大きな注目を集めている。
bf3Dは、激しい動きのぼけや未知の様々な露出時間の下でも、カジュアルにキャプチャーされた自動露光(AE)ビデオから3Dシーンを再構築する堅牢なワンステージ手法を統合している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:37:31 GMT)
Refine-and-Contrast: Adaptive Instance-Aware BEV Representations for Multi-UAV Collaborative Object Detection [15.5] 複数UAVコラボレーティブ3D検出は、空中プラットフォームからの多視点観測を融合させることにより、正確で堅牢な認識を可能にする。
本稿では,適応型インスタンス認識型BEV表現を洗練コントラストパラダイムにより学習する新しいフレームワークであるAdaBEVを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:37:14 GMT)
Multi-Level Knowledge Distillation and Dynamic Self-Supervised Learning for Continual Learning [15.5] 繰り返しを伴うクラスインクリメンタル(CIR)は、従来のクラスインクリメンタルセットアップよりも現実的なシナリオです。
CIRで訓練されたモデルの安定性と可塑性を確保するために,ラベルのないデータを効率的に利用する2つのコンポーネントを提案する。
CVPR 5th CLVISION Challengeでは,両コンポーネントともCIRセットアップの性能が著しく向上し,第2位となった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:50:20 GMT)
Fairness-Aware Multi-view Evidential Learning with Adaptive Prior [15.4] 本研究では,多視点顕在学習のためのフェアネス・アウェア・マルチビュー・エビデンシャル・ラーニング(FAML)を提案する。
FAMLはよりバランスの取れたエビデンス割り当てを実現し、予測性能と不確実性推定の信頼性の両方を改善する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:17:16 GMT)
Concealment of Intent: A Game-Theoretic Analysis [15.4] 我々は、意図を隠蔽する敵のプロンプトというスケーラブルな攻撃戦略を提示し、スキルの合成を通じて悪意のある意図を隠蔽する。
本分析では, 平衡点を同定し, 攻撃者に対する構造的優位性を明らかにする。
実験により,複数の実世界のLSMに対する攻撃の有効性を,様々な悪意ある行動にわたって検証した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:58:10 GMT)
MixCache: Mixture-of-Cache for Video Diffusion Transformer Acceleration [15.2] キャッシングは、DiTモデルで広く採用されている最適化手法である。
効率的なビデオDiT推論のためのトレーニング不要なキャッシュベースのフレームワークであるMixCacheを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:49:33 GMT)
NormXLogit: The Head-on-Top Never Lies [15.2] 本稿では,個々の入力トークンの意義を評価するための新しい手法を提案する。
この方法は各トークンに関連付けられた入力および出力表現に基づいて動作する。
我々は、トークンの重要性と、その表現がモデルの最終的な予測に類似できる範囲との間に有意な関係を明らかにする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:24:12 GMT)
Matrix-Game 2.0: An Open-Source, Real-Time, and Streaming Interactive World Model [15.2] Matrix-Game 2.0はインタラクティブな世界モデルで、数ステップの自己回帰拡散を通じて長時間の動画をオンザフライで生成する。
超高速25FPSで、さまざまなシーンで高品質のミニレベルビデオを生成することができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:28:53 GMT)
CRED-SQL: Enhancing Real-world Large Scale Database Text-to-SQL Parsing through Cluster Retrieval and Execution Description [15.1] CRED-は大規模データベース向けに設計されたフレームワークで、クラスタ検索と実行記述を統合している。
自然言語質問(NLQ)と対応するsqlクエリのギャップを埋める。
CRED-は最新のgit-the-art(SOTA)パフォーマンスを実現し、その有効性とスケーラビリティを検証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:43:07 GMT)
SLGaussian: Fast Language Gaussian Splatting in Sparse Views [15.0] スパース視点から3次元意味体を構築するフィードフォワード手法であるSLGaussianを提案する。
SLGaussianは、3D空間に言語情報を効率よく埋め込むことができ、スパースビュー条件下で正確な3Dシーン理解のための堅牢なソリューションを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:08:13 GMT)
FCL-ViT: Task-Aware Attention Tuning for Continual Learning [15.0] 継続学習(CL)では、以前のディープニューラルネットワーク(DNN)の知識を、古い知識を忘れずに新しいタスクに適応させる。
本稿では、フィードバック機構を用いて、現在のタスクに合わせたリアルタイムな動的注意機能を生成する新しいフィードバック継続学習視覚変換器(FCL-ViT)を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:17:28 GMT)
MAGIK: Mapping to Analogous Goals via Imagination-enabled Knowledge Transfer [14.9] 強化学習エージェントは通常、新しいタスクが以前に学習したタスクと構造的類似性を共有する場合であっても、広範囲な再訓練を必要とする。
我々は、RLエージェントがターゲット環境と対話することなく、類似したタスクに知識を伝達できる新しいフレームワークMAGIKを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:21:44 GMT)
GazeDETR: Gaze Detection using Disentangled Head and Gaze Representations [14.8] 本稿では,2つの不整合デコーダを持つ新しいエンドツーエンドアーキテクチャであるGazeDETRを提案する。
提案したアーキテクチャは,GazeFollow, VideoAttentionTarget, ChildPlay の各データセットの最先端結果を実現する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:41:18 GMT)
Integrating Feedback Loss from Bi-modal Sarcasm Detector for Sarcastic Speech Synthesis [14.8] サーカシック音声合成は、エンターテイメントや人間とコンピュータの相互作用のような応用における自然な相互作用を強化するために不可欠である。
本研究では,2モーダルサルカズム検出モデルからのフィードバック損失をTSトレーニングプロセスに統合する手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:44:54 GMT)
IntelliCap: Intelligent Guidance for Consistent View Sampling [14.8] 高品質なビュー合成には一様で高密度なビューサンプリングが必要である。
画像取得中に人間を誘導する既存のアプローチは、単一のオブジェクトに集中している。
複数スケールでスキャンを行うための新しい位置可視化手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:00:31 GMT)
SpotVLM: Cloud-edge Collaborative Real-time VLM based on Context Transfer [14.7] VLM(Vision-Language Models)は、自律運転や人間とコンピュータのインタラクションといったリアルタイムアプリケーションにますます普及している。
既存のシステムでは、分割されたLVLM(Large Vision-Language Models)やタスクオフロード戦略が一般的である。
本稿では,LVLMの遅延出力を歴史的文脈として扱う,新しいクラウドエッジ協調パラダイムであるContext Transferを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:51:41 GMT)
Simulation-Based Inference: A Practical Guide [14.7] シミュレーションに基づく推論は、粒子物理学、天体物理学、神経科学などの分野における科学的発見を可能にした。
構造化されたSBIワークフローを概説し、プロセスの各段階で実践的なガイドラインと診断ツールを提供する。
このチュートリアルは、研究者に最先端のSBI手法を適用し、科学的発見のための効率的なパラメータ推論を容易にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:09:33 GMT)
MaskSem: Semantic-Guided Masking for Learning 3D Hybrid High-Order Motion Representation [14.5] MaskSemは3次元ハイブリッド高次動き表現を学習するための意味誘導マスキング手法である。
本研究では,ハイブリッド高次運動を再構成対象とし,モデルが多次運動パターンを学習できるようにする。
実験により、MaskSemはバニラ変圧器と組み合わせて骨格に基づく行動認識を改善することが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:24:04 GMT)
Explainable Reinforcement Learning Agents Using World Models [14.5] 本稿では,ワールドモデルを用いてモデルベースディープRLエージェントの説明を生成する手法を提案する。
世界モデルは、アクションが実行されたときに世界がどのように変化するかを予測し、反現実的な軌道の生成を可能にする。
我々は,世界がどのようなものであったかを示す説明がエージェントポリシーに対する理解を著しく高めることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:05:06 GMT)
ViLaD: A Large Vision Language Diffusion Framework for End-to-End Autonomous Driving [14.5] エンド・ツー・エンド・エンドの自動運転のための新しいLarge Vision Language DiffusionフレームワークであるViLaDを紹介する。
ViLaDは、駆動決定シーケンス全体の並列生成を可能にし、計算遅延を大幅に削減する。
我々はnuScenesデータセットの総合的な実験を行い、ViLaDは最先端の自己回帰的VLMベースラインを計画精度と推論速度の両方で上回ります。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:01:56 GMT)
Augmented Adversarial Trigger Learning [14.4] 我々は、敵のトリガー学習の目的を詳しく検討し、ATLA:Adversarial Trigger Learning with Augmented objectivesを提案する。
ALTAは1つのクエリ-レスポンスペアから逆トリガを学習し、学習したトリガは他の類似したクエリとよく合うように一般化する。
我々は、ATLAが現在の最先端技術より一貫して優れており、80%のクエリを必要としながら攻撃にほぼ100%成功していることを実証した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:09:56 GMT)
Investigating VR Accessibility Reviews for Users with Disabilities: A Qualitative Analysis [14.3] 本研究はVRアプリのMetaおよびSteamストアからユーザレビューを分析する。
6つのカテゴリーで16種類の障害を同定した。
全体として、VRアクセシビリティのレビューは、ほとんどサポートされていない。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:18:30 GMT)
GaitCrafter: Diffusion Model for Biometric Preserving Gait Synthesis [14.2] GaitCrafterは、シルエット領域で現実的な歩行シーケンスを合成するための拡散ベースのフレームワークである。
我々のアプローチは、時間的に一貫性があり、アイデンティティを保存する歩行列の生成を可能にする。
そこで,本研究では,オリジナルデータセットに存在しない新規なアイデンティティ合成個人を生成するメカニズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:32:42 GMT)
DCSCR: A Class-Specific Collaborative Representation based Network for Image Set Classification [14.1] 本稿では,Deep Class-specific Collaborative Representation (DCSCR) ネットワークと呼ばれる,数発のICCアプローチを提案する。
DCSCRは、完全な畳み込み機能抽出モジュール、グローバル機能学習モジュール、クラス固有の協調表現に基づくメートル法学習モジュールから構成される。
提案手法の有効性を実証するために、よく知られた数発のICCデータセットの実験を行った。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:09:55 GMT)
Boosting Active Defense Persistence: A Two-Stage Defense Framework Combining Interruption and Poisoning Against Deepfake [14.1] 我々は、効果的な防御が偽のコンテンツを歪ませるだけでなく、モデルが適応する能力を阻害すると主張している。
これを実現するために,革新的な2段階防衛フレームワーク(TSDF)を提案する。
我々のフレームワークは、アクティブディフェンスの持続性を向上できる強力なデュアルディフェンス能力を示している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:58:20 GMT)
Re:Verse -- Can Your VLM Read a Manga? [14.1] 現在の視覚言語モデル(VLM)は、表面レベルの認識と深い物語的推論の間に重要なギャップを示す。
本稿では,細粒度マルチモーダルアノテーション,クロスモーダル埋め込み解析,検索強化評価を組み合わせた新しい評価フレームワークを提案する。
本稿では,VLMにおける長期的物語理解に関する最初の体系的研究を,生成的ストーリーテリング,文脈的対話グラウンドニング,時間的推論という3つのコア評価軸を通じて行った。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:59:14 GMT)
A Perfectly Truthful Calibration Measure [14.1] バッチ設定における完全真正なキャリブレーション尺度を設計する:平均2ビンキャリブレーション誤差(ATB)
ATBは、スムーズな校正誤差(smCal)と(より低い)キャリブレーション距離(distCal)の2つの既存の校正措置に、音、完全、連続、および二次的に関係している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:09:34 GMT)
Analyzing Information Sharing and Coordination in Multi-Agent Planning [14.1] マルチエージェントシステム(MAS)は、Web研究やソフトウェア工学といった分野において、大きな言語モデル(LLM)エージェントの境界を推し進めている。
本研究では,これらの課題を代表した旅行計画タスクのためのLLMベースのMASを構築する。
このノートは、幻覚された詳細によるエラーを18%削減し、オーケストレータはMASにフォーカスするよう指示し、フォーカスされたサブエリア内で最大13.5%のエラーを削減させる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:57:02 GMT)
Towards Open-Ended Emotional Support Conversations in LLMs via Reinforcement Learning with Future-Oriented Rewards [13.9] Emotional Support Conversation systemは、ユーザの感情的困難を軽減し、感情的幸福を長期的かつ体系的に支援することを目的としている。
ほとんどの大規模言語モデル(LLM)ベースのESCシステムは、複雑な実生活シナリオでの有効性を制限する事前定義された戦略に依存している。
本稿では、強化学習を用いて、感情的支援力を直接学習する新しいエンドツーエンドフレームワーク(RLFF-ESC)を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:04:26 GMT)
RUM: Rule+LLM-Based Comprehensive Assessment on Testing Skills [13.8] META法は、ソフトウェアテストに関する国立大学学生コンテストにおいて多次元テストスキル評価システムとして機能している。
本稿ではルールと大規模言語モデル(LLM)を組み合わせた総合評価手法であるRUMを提案する。
実験の結果、従来の手動テストスキルアセスメントと比較して、RUMは評価効率を80.77%改善し、コストを97.38%削減した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:40:37 GMT)
Systematic Analysis of MCP Security [13.8] Model Context Protocol(MCP)は、AIエージェントが外部ツールとシームレスに接続できるようにする普遍的な標準として登場した。
MCPはツール・ポジティング・アタック(TPA)のような重大な脆弱性を導入している。
MCPアタックライブラリ (MCPLIB) は, 4つの主要な分類の下で31の異なる攻撃手法を分類・実装する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:23:41 GMT)
WIR3D: Visually-Informed and Geometry-Aware 3D Shape Abstraction [13.6] WIR3Dは、3Dで視覚的に意味のある曲線のスパースセットを通して3D形状を抽象化する技術である。
ベジエ曲線のパラメータを最適化し、それらが幾何学的特徴と健全な視覚的特徴の両方を忠実に表現する。
形状の広いデータセットに対して, 形状の抽象化を行う手法をうまく適用した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:00:31 GMT)
Odo: Depth-Guided Diffusion for Identity-Preserving Body Reshaping [13.6] 本研究では1523名の被験者を対象とした18,573枚の画像の大規模なデータセットについて紹介する。
簡単な意味的属性によって導かれる現実的で直感的な身体再構成を可能にする,エンドツーエンドの拡散に基づく手法であるOdoを提案する。
提案手法は,入力画像から微細な外観や背景の詳細を保存した凍結UNetと,SMPL深度マップを用いた形状変換を誘導するコントロールネットを組み合わせる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:37:29 GMT)
Latent Expression Generation for Referring Image Segmentation and Grounding [13.6] 既存のほとんどのメソッドは単一のテキスト入力に依存しており、視覚領域で利用可能なリッチな情報のごく一部しか取得できない。
このリッチ・ビジュアル・ディテールと粗雑なテキスト・キューのミスマッチは、類似したオブジェクトの誤識別につながる可能性がある。
単一のテキスト入力から生成された複数の潜在表現を利用する新しい視覚的グラウンドディングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:18:45 GMT)
Vehicle detection from GSV imagery: Predicting travel behaviour for cycling and motorcycling using Computer Vision [13.4] 本研究は,街路景観画像の深層学習を用いて,世界中の多様な都市でサイクリングとモーターサイクルのレベルを推定する手法を示す。
旅行調査や国勢調査から推定される自転車と自転車のモードシェアに関するデータ。
モデルは、最近のモード共有データがない60の都市に適用されました。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:17:30 GMT)
Explicit v.s. Implicit Memory: Exploring Multi-hop Complex Reasoning Over Personalized Information [13.3] 大規模言語モデルに基づくエージェントでは、メモリはユーザの情報を保存して活用することでパーソナライズを達成する重要な能力として機能する。
本稿では、パーソナライズされた情報に対するマルチホップ推論において、異なるメモリ機構がどのように機能するかを検討するために、マルチホップパーソナライズされた推論タスクを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:34:37 GMT)
PromptSuite: A Task-Agnostic Framework for Multi-Prompt Generation [13.0] 本稿では,様々なプロンプトの自動生成を可能にするフレームワークであるPromptSuiteを紹介する。
PromptSuiteはフレキシブルで、さまざまなタスクやベンチマークに最初から取り組んでいます。
モジュール型のプロンプト設計に従っており、各コンポーネントに制御された摂動を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:36:00 GMT)
A Generalized Genetic Random Field Method for the Genetic Association Analysis of Sequencing Data [13.0] 本稿では、シークエンシングデータの関連付け解析のための一般化遺伝的ランダムフィールド(GGRF)法を提案する。
GGRFは、様々な疾患シナリオにおいて、一般的に用いられるSKATよりも改善された、あるいは同等のパワーが得られることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:28:48 GMT)
UMRE: A Unified Monotonic Transformation for Ranking Ensemble in Recommender Systems [12.9] アンサンブルソートにおける従来の手法の限界に対処する新しい統一モノトニックランキングアンサンブル(UMRE)フレームワークを提案する。
UMREは、非拘束型モノトニックネットワーク(UMNN)で手作り変換を置き換え、正の神経積分を統合することで、表現力のある厳密な単調関数を学習する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:14:33 GMT)
Dimension lower bounds for linear approaches to function approximation [12.8] 基本的な議論は、コルモゴロフ$n$-widthsの下位境界を確立するという文献(例えば、Barron, 1993)にこれまで現れてきた。
引数を適用して、カーネルメソッドのサンプルサイズを低くする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:04:46 GMT)
Model Performance-Guided Evaluation Data Selection for Effective Prompt Optimization [12.7] IPOMPは、セマンティッククラスタリングとバウンダリ分析を使用して、代表的で多様なサンプルを選択する2段階のアプローチである。
我々は、IPOMPがSOTAベースラインと比較して、効率を1.6%から5.3%改善し、安定性を少なくとも57%向上させることを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:02:26 GMT)
It Takes Two: A Peer-Prediction Solution for Blockchain Verifier's Dilemma [12.7] 我々は,分散検証ゲームのための一相ベイズ的真理機構の設計に向けて,ビザンチン・ローバストなピア予測フレームワークを開発する。
我々の研究は、ブロックチェーン、分散AI、および潜在的に分散化されたシステムのセキュリティと堅牢性を高める分散検証プロトコルのためのインセンティブ設計のフレームワークを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:13:50 GMT)
HRS: Hybrid Representation Framework with Scheduling Awareness for Time Series Forecasting in Crowdsourced Cloud-Edge Platforms [12.6] 我々は,過度の負荷動態をよりよく捉えるために,スケジューリングを意識したハイブリッド表現フレームワークであるHRSを提案する。
HRSは10基準を一貫して上回り、最先端のパフォーマンスを実現し、SLA違反率を63.1%削減し、総利益損失を32.3%削減した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:25:54 GMT)
S2Cap: A Benchmark and a Baseline for Singing Style Captioning [12.5] 本稿では,歌唱音声のデータセットであるS2Capについて述べる。
このデータセットを用いて,歌唱スタイルキャプションのための効率的で簡単なベースラインアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:50:13 GMT)
Asymmetric Diffusion Recommendation Model [12.5] 非対称な方法で前と逆の過程を学習する非対称拡散勧告モデル(AsymDiffRec)を提案する。
AsymDiffRecはDouyin Music Appで実装されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:05:25 GMT)
Policy Search, Retrieval, and Composition via Task Similarity in Collaborative Agentic Systems [12.5] Agentic AIの目的は、自身の目標を設定し、変化に積極的に適応し、継続的な経験を通じて振る舞いを洗練するシステムを作ることだ。
最近の進歩は、複数の予期せぬタスクに直面している場合、エージェントは他のエージェントによって既に完全にあるいは部分的に学習されている機械学習の知識と再利用のポリシーを共有することの恩恵を受ける可能性があることを示唆している。
本研究は,エージェントが選択すべき知識,誰から,いつ,どのように,それを独自の政策に統合して,自身の学習を加速するかを検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:42:36 GMT)
Flow Matching-Based Generative Modeling for Efficient and Scalable Data Assimilation [12.2] フローマッチング(FM)に基づく新しいフィルタリングフレームワークであるアンサンブルフローフィルタ(EnFF)を導入する。
EnFFは、限界FMベクトル場(VF)に対するMC推定器と、観測を同化するための局所的なガイダンスを統合している。
高次元フィルタリングベンチマークの実験では、コスト精度のトレードオフの改善とより大きなアンサンブルを活用する能力が示されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:00:45 GMT)
Game Reasoning Arena: A Framework and Benchmark for Assessing Reasoning Capabilities of Large Language Models via Game Play [12.2] Game Reasoning Arenaライブラリは、Google OpenSpielライブラリに実装された戦略的ボードゲームを通じて、大きな言語モデル(LLM)の決定能力を評価するためのフレームワークを提供する。
本稿では,図書館の構造,鍵となる特徴,リポジトリのモチベーションを要約し,LLMの推論とゲーム理論的振る舞いの実証的評価にどのように貢献するかを明らかにする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:53:16 GMT)
The covering radius of Butson Hadamard codes for the homogeneous metric [12.2] 我々は、準フロベニウスである可換環アルファベットに対して一意に定義された計量である等質計量に対して、バトソン・アダマール符号の被覆半径について研究する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:57:15 GMT)
e-boost: Boosted E-Graph Extraction with Adaptive Heuristics and Exact Solving [12.1] Eグラフは多くの分野、特に論理合成と形式的検証に興味を寄せている。
このギャップを3つの重要なイノベーションで埋める新しいフレームワークであるe-boostを紹介します。
e-boostは、従来の正確なアプローチ(ILP)よりも58倍のランタイムスピードアップを示し、最先端の抽出フレームワーク(SmoothE)よりも19.04%パフォーマンスが改善された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:38:12 GMT)
Embodied Long Horizon Manipulation with Closed-loop Code Generation and Incremental Few-shot Adaptation [12.1] 身体的ロングホライゾン操作では、ロボットシステムが視覚や自然言語などのマルチモーダル入力を処理し、それらを実行可能なアクションに変換する必要がある。
近年,大規模言語モデル (LLM) を自然言語を用いてタスクをサブタスクに分解し,事前訓練した低レベルコントローラを誘導する高レベルプランナとしての利用が検討されている。
我々のフレームワークは,LoHoRavens,CALVIN,Franka Kitchen,および乱雑な現実世界設定をまたいだ,30以上の多様かつ不明瞭なロングホライゾンタスクに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:04:08 GMT)
D2-Mamba: Dual-Scale Fusion and Dual-Path Scanning with SSMs for Shadow Removal [11.9] 本稿では,デュアルスケール核融合とデュアルパススキャンを併用した新しいマンバ型ネットワークを提案する。
提案手法は,影除去ベンチマークにおける既存の最先端手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:20:21 GMT)
DAGait: Generalized Skeleton-Guided Data Alignment for Gait Recognition [11.9] 本研究では,骨格の事前知識を用いて,対応するシルエット上でアフィン変換を行う骨格誘導型シルエットアライメント戦略を提案する。
提案手法は、最大24.0%の精度で、クロスドメインデータセットを大幅に改善する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:37:52 GMT)
Using AI for User Representation: An Analysis of 83 Persona Prompts [11.9] 大規模言語モデルを用いてユーザペルソナを生成する27の論文から83のペルソナプロンプトを分析した。
いくつかのプロンプトは、短く、簡潔なペルソナの記述への欲求を表しており、これは豊かで、情報的で、丸いペルソナのプロファイルを作成する伝統から逸脱している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:09:47 GMT)
VerilogLAVD: LLM-Aided Rule Generation for Vulnerability Detection in Verilog [11.7] We introduced the first graph-aided graph rule generation approach for Verilog vulnerabilities detection。
提案手法は,抽象構文木(AST)から抽出した構文特徴と制御フローデータ依存グラフから抽出した意味情報を組み合わせたものである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:05:18 GMT)
Leveraging Diffusion Models for Stylization using Multiple Style Images [11.7] 本稿では,スタイル特徴をよりよく表現し,スタイル画像からのコンテンツ漏洩を防止するために,複数のスタイル画像を活用することを提案する。
本手法では,本方式のサンプルから抽出した多数の注目値から,少数の注目特徴集合を抽出するためにクラスタリングを用いる。
得られた手法は、スタイル化のための最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:00:41 GMT)
Consiglieres in the Shadow: Understanding the Use of Uncensored Large Language Models in Cybercrimes [11.6] 大規模言語モデル(ULLM)の最初の体系的研究について述べる。
ULLMはヘイトスピーチ、暴力、エロティックな素材、悪意のあるコードなど、有害なコンテンツを生成できる。
いくつかは100万回以上ダウンロードされ、1900万回以上インストールされている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:35:26 GMT)
ADMIRE-BayesOpt: Accelerated Data MIxture RE-weighting for Language Models with Bayesian Optimization [11.4] 本稿では,100万から70億のパラメータを対象とするモデルを対象とした事前学習と指導の微調整について述べる。
我々は,幅広いベースラインに対して一貫して強い結果を示し,500%以上のスピードアップを実現した。
さらに、ADMIRE IFT Runsという460のフルトレーニングと評価のデータセットを13,000時間以上のGPU時間で共有することで、研究へのアクセスを拡大しています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:38:38 GMT)
LinguaSafe: A Comprehensive Multilingual Safety Benchmark for Large Language Models [11.3] 私たちのデータセットは、ハンガリー語からマレー語まで、12言語で45万のエントリで構成されています。
我々のベンチマークは、詳細な安全性評価のための総合的なメトリクススイートを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:59:01 GMT)
SEDEG:Sequential Enhancement of Decoder and Encoder's Generality for Class Incremental Learning with Small Memory [11.2] インクリメンタルラーニングでは、動的データ入力に適応するために、知識の一般性を高めることが不可欠である。
SEDEGは、一般化表現を学ぶために機能強化を通じてアンサンブルエンコーダを訓練する。
次の段階では、知識蒸留戦略を用いてエンサンブルエンコーダを圧縮し、より一般化されたエンコーダを開発する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:55:59 GMT)
Informfully Recommenders -- Reproducibility Framework for Diversity-aware Intra-session Recommendations [11.2] Informfully RecommendersはCornac上に構築された多様性を意識した設計に焦点を当てた規範的フレームワークへの第一歩です。
我々の拡張は、規範的で汎用的な多様なレコメンデーションシステムの実装と実験のためのエンドツーエンドソリューションを提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:37:41 GMT)
D-RDW: Diversity-Driven Random Walks for News Recommender Systems [11.2] 本稿では,多種多様なニュースレコメンデーションを生成する軽量アルゴリズムと再ランク技術であるDiversity-Driven RandomWalks (D-RDW)を紹介する。
D-RDWは、従来のランダムウォークアルゴリズムの多様化機能と、ニュース記事プロパティのカスタマイズ可能なターゲット分布を組み合わせた、社会的な勧告である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:53:30 GMT)
TASER: Table Agents for Schema-guided Extraction and Recommendation [11.0] 実世界の金融文書は、ある企業の金融保有に関する重要な情報を報告する。
しかし、これらの詳細はしばしば散らかったマルチページの断片化されたテーブルに埋もれている。
本稿では,連続学習型エージェントテーブル抽出システムTASERを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:48:22 GMT)
Accurate Measles Rash Detection via Vision Transformer Fine-Tuning [11.0] 麻疹は2000年8月5日に報告された1,356件の症例で2025年に復活した。
本研究では,皮膚の異状を識別するために,予め訓練したデータ効率画像変換器(DeiT)モデルに転写学習を適用した。
様々な皮膚のスキンスラッシュ画像データセットで分類ヘッドをチューニングした後、DeiTモデルは平均分類精度95.17%、精度95.06%、リコール95.17%、F1スコアを達成した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:17:47 GMT)
When can in-context learning generalize out of task distribution? [11.0] In-context Learning (ICL) は、モデルが数例しか見ていないタスクに一般化できる事前訓練されたトランスフォーマーの能力である。
我々はICLの事前学習に必要となる条件を実験的に検討し,その展開と分布の一般化について検討した。
タスクの多様性が増大するにつれて、トランスフォーマーは、事前学習タスク分布内でのみICLを示す特殊な解から、タスク空間全体への分布から一般化する解へと移行する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:18:38 GMT)
Cognitive Structure Generation: From Educational Priors to Policy Optimization [10.9] 本稿では,学生の認知構造を生成するための新しい枠組みである認知構造生成(CSG)を紹介する。
4つの人気のある実世界の教育データセットの実験結果から、CSGが生成する認知構造がより包括的で効果的な生徒モデリングの表現を提供することが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:21:36 GMT)
Attention to the Burstiness in Visual Prompt Tuning! [10.9] Visual Prompt Tuning (VPT) は、入力空間内の小さなパラメータの集合を学習することで、事前訓練された視覚変換器(ViT)を適応させるファンチューニング技術である。
VPTでは、画像パッチの埋め込みの相互作用から生じる値の「バーストネス」を明らかにする。
我々は、学習前において、白化データを提案し、それらを非相関化し、よりガウス的への分散を等化する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:11:06 GMT)
OrbitChain: Orchestrating In-orbit Real-time Analytics of Earth Observation Data [10.7] OrbitChainは、地球観測星座内の複数の衛星にまたがる計算資源をオーケストレーションする、協調分析フレームワークである。
トラフィックルーティングアルゴリズムは、衛星間通信のオーバーヘッドを最小限に抑えるために考案された。
我々のシステムは、既存の地球観測分析フレームワークよりも60%以上の分析負荷を処理できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:33:32 GMT)
Quantum Money from Abelian Group Actions [10.7] 公開鍵量子マネーの構築と、量子ライティングと呼ばれる強化版も提供します。
本研究は,グループ行動の汎用群モデルにおいて,妥当な計算仮定の下でのセキュリティを実証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:21:19 GMT)
LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval [10.6] LeanRAGは知識集約と検索戦略を組み合わせたフレームワークです。
グラフ上のパス検索に関連するかなりのオーバーヘッドを軽減し、冗長な情報検索を最小限にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:28:12 GMT)
DMS:Diffusion-Based Multi-Baseline Stereo Generation for Improving Self-Supervised Depth Estimation [10.5] 本稿では,方向指示によって誘導される極上方向に沿った新しいビューを合成するモデルに依存しないアプローチを提案する。
提案したDMSは,自己教師型ステレオマッチングと単眼深度推定をシームレスに向上する,コストフリーの'plug-and-play'法である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:05:15 GMT)
Reverse Markov Learning: Multi-Step Generative Models for Complex Distributions [10.2] 本稿では,対象の分布から既知の分布へ遷移する一般的なフォワードプロセスを定義するフレームワークを提案する。
次に、複数のエングレスモデルを用いて逆マルコフ過程を学習する。
このフレームワークは一般的なフォワードプロセスに対応し、次元の縮小を可能にし、生成過程を自然に識別する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:48:27 GMT)
CPCL: Cross-Modal Prototypical Contrastive Learning for Weakly Supervised Text-based Person Retrieval [10.1] 弱教師付きテキストベースの人物検索は、テキスト記述を用いて対象者の画像を検索しようとする。
主な課題はクラス内の違いであり、モーダル内特徴のバリエーションとモーダル間のセマンティックギャップを含んでいる。
視覚とテキストのインスタンスを共有潜在空間にマッピングするクロスモーダル・プロトタイプ・コントラシティブ・ラーニング(CPCL)手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:44:09 GMT)
Privacy-Preserving Driver Drowsiness Detection with Spatial Self-Attention and Federated Learning [10.1] ドライバーの眠気は道路事故の主な原因の1つであり、交通事故による死亡事故の主要な原因と認識されている。
本研究では,不均質データと分散データとを効果的に扱えるよう設計した,眠気検出のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:30:55 GMT)
LeAdQA: LLM-Driven Context-Aware Temporal Grounding for Video Question Answering [10.1] 本稿では,これらのギャップを埋める斬新な手法であるLeAdQAを紹介する。
NExT-QA, IntentQA, NExT-GQAに関する実験により, 本手法の正確な視覚的基盤化は, 映像検索関係の理解を著しく向上させることを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:06:46 GMT)
HQ-OV3D: A High Box Quality Open-World 3D Detection Framework based on Diffision Model [9.9] 本稿では,高品質な擬似ラベルの生成と精巧化を目的とした,ハイボックス品質3D検出(HQ-OV3D)フレームワークを提案する。
HQ-OV3Dは、強力なスタンドアロンのオープンボキャブラリ3D検出器としてだけでなく、既存のオープンボキャブラリ検出やアノテーションパイプラインのためのプラグインの質の高い擬似ラベルジェネレータとしても機能する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:50:31 GMT)
Prompt-to-Slate: Diffusion Models for Prompt-Conditioned Slate Generation [9.9] 本稿では, 急速条件付きスレート生成のための拡散モデルに基づく生成フレームワークであるDMSGを紹介する。
検索ベースや自己回帰モデルとは異なり、DMSGはスレート上の結合分布をモデル化し、柔軟性と多様性を高める。
DMSGを音楽プレイリスト生成とeコマースバンドル生成の2つの重要な領域で評価する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:08:02 GMT)
3D Cardiac Anatomy Generation Using Mesh Latent Diffusion Models [9.7] 心臓解剖学の3次元メッシュ生成における潜時拡散モデルの適用について検討した。
急性心筋梗塞患者の左室心筋解剖の3次元メッシュのデータセットに本モデルを適用した。
MeshLDMは、末期拡張期(緩和期)と末期収縮期(収縮期)の心臓形態の特徴をうまく捉え、ゴールド標準よりも2.4%の人口差を持つメッシュを生成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:53:20 GMT)
Online Ensemble Transformer for Accurate Cloud Workload Forecasting in Predictive Auto-Scaling [9.7] 大規模自動スケーリングにおけるオンラインワークロード予測のための新しいオンラインアンサンブルモデルであるE3Formerを提案する。
我々のモデルは、単一モデルアプローチの限界を克服するために、マルチワークの予測能力を相乗化します。
本手法はByteDanceのIntelligent Horizontal Pod Auto-scaling (IHPA)プラットフォームに実装されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:48:12 GMT)
Does Prior Data Matter? Exploring Joint Training in the Context of Few-Shot Class-Incremental Learning [9.7] CIL(Class-incremental Learning)は,学習前の知識を維持しつつ,新たなクラスに継続的に適応することを目的としている。
FSCIL(Few-shot class-incremental Learning)は、クラス毎に限られたサンプル数から新しいクラスを学習するモデルを必要とする、より大きな課題を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:19:46 GMT)
PinFM: Foundation Model for User Activity Sequences at a Billion-scale Visual Discovery Platform [9.6] 我々は、数十億の視覚的発見プラットフォームにおいて、複数のアプリケーションにわたるユーザアクティビティシーケンスを理解するための基礎モデル、PinFMを提案する。
我々は、広範囲なユーザアクティビティデータを使用して20B以上のパラメータでトランスフォーマーモデルを事前訓練し、特定のアプリケーションに対して微調整する。
Deduplicated Cross-Attention Transformer (DCAT)のようなインフラストラクチャとアルゴリズムの最適化により、Pinterest上でのスループットが600%向上しました。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:31:29 GMT)
Co-Paced Learning Strategy Based on Confidence for Flying Bird Object Detection Model Training [9.6] 本稿では,CPL-BCに基づく協調学習戦略を提案し,それをフライングバードオブジェクト検出モデルのトレーニングプロセスに適用する。
トレーニングが進むにつれて、戦略は徐々に閾値を下げ、それによってモデルがオブジェクトを認識する能力を高める。
CPL-BCは、他のモデル学習手法と比較して、検出精度を著しく向上させることを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:36:49 GMT)
Dissecting the SWE-Bench Leaderboards: Profiling Submitters and Architectures of LLM- and Agent-Based Repair Systems [9.5] 本稿では,SWE-Bench のリーダーボードへの提出に関する総合的研究について述べる。
タイプ、製品可用性、LLMの使用状況、システムアーキテクチャなど、80のユニークなアプローチを分析します。
この結果から, 独自LLMの優位性, エージェント設計と非エージェント設計の両方の存在, 個々の開発者から大企業へのコントリビュータ基盤が明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:55:57 GMT)
Help or Hurdle? Rethinking Model Context Protocol-Augmented Large Language Models [9.5] LLM-MCP相互作用を探索する最初の総合的評価フレームワークであるMPPGAUGEを紹介する。
MCPGAUGEは160プロンプトスイートと、知識理解、一般的な推論、コード生成にまたがる25のデータセットで構成されている。
当社の大規模評価では、6つの商用LCM、30のMPPツールスイート、および1ターンと2ターンの両方のインタラクション設定を対象とし、約20,000のAPIコールと6,000ドル以上の計算コストで構成されています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:06:05 GMT)
RMMSS: Towards Advanced Robust Multi-Modal Semantic Segmentation with Hybrid Prototype Distillation and Feature Selection [9.4] RMMSSは、モダリティの欠如した条件下でモデルロバスト性を高めるために設計された2段階のフレームワークである。
これは2つの重要なコンポーネントで構成されている。ハイブリッドプロトタイプ蒸留モジュール (HPDM) と特徴選択モジュール (FSM) である。
3つのデータセットに対する実験により,本手法は,それぞれ2.80%,3.89%,0.89%のモダリティ性能を向上することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:29:49 GMT)
Flexible Tool Selection through Low-dimensional Attribute Alignment of Vision and Language [9.4] 柔軟なツール選択は、人間が他の種と区別する複雑な認知能力を反映している。
視覚的ツール認識と言語的タスク理解を橋渡しするために,低次元属性表現を用いたフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:43:01 GMT)
ChangePrism: Visualizing the Essence of Code Changes [9.3] 本稿では,ChangePrismというツールがサポートする新しい可視化手法を提案する。
このツールは、git履歴からコード変更と関連する情報を取得する抽出と、コミット中のコード変更の一般的なビューと詳細なビューを提供する可視化の2つのコンポーネントで構成されている。
一般的なビューはコミット間で異なるタイプのコード変更の概要を提供し、詳細なビューはコミット毎のソースコードの正確な変更を表示する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:23:34 GMT)
Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving by AWorld [9.0] 我々はAWorldフレームワーク内に、堅牢で動的なマルチエージェントシステム(MAS)アーキテクチャを導入します。
我々のアプローチでは、実行エージェントがガードエージェントを重要なステップで起動し、推論プロセスの検証と修正を行います。
GAIAテストデータセットの実験により、我々の動的操作機構は解の有効性と安定性の両方を著しく改善することが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:06:05 GMT)
Vibration-Based Energy Metric for Restoring Needle Alignment in Autonomous Robotic Ultrasound [9.0] 本稿では,超音波画像面と針挿入面とが一致していない場合に針のアライメントを復元する手法を提案する。
メカニカルシステムを用いて針を周期的に振動させることにより, より頑健な特徴を用いる。
両腕式超音波ガイド下針挿入システムを用いたブタ組織標本を用いた実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:09:55 GMT)
RIFT: Closed-Loop RL Fine-Tuning for Realistic and Controllable Traffic Simulation [9.0] 自動運転における重要な課題は、リアリズムとコントロール可能性の両方を達成することである。
本稿では,オープンループ模擬学習を事前学習する二段階AV中心シミュレーションフレームワークを提案する。
微調整段階において,新しいRL微調整戦略であるRIFTを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:47:39 GMT)
Topology-induced symmetry breaking demonstrated in antiferromagnetic magnons on a Möbius strip [8.9] 実空間位相による励起の固有モードにおいて、ハミルトニアンによって保存された特定の局所対称性が明示的に破壊される位相誘起対称性破壊のメカニズムを提案する。
この現象は、2つの反強磁性結合スピン鎖からなるM "obius strip"上でのマグノン励起の研究によって実証される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:11:26 GMT)
Automated Assessment of Aesthetic Outcomes in Facial Plastic Surgery [8.9] 正面写真を用いた顔用プラスチック手術の美的効果を定量化するための,スケーラブルで解釈可能なコンピュータビジョンフレームワークを提案する。
我々のパイプラインは、自動的ランドマーク検出、幾何学的顔対称性計算、深層学習に基づく年齢推定、鼻形態解析を活用している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:15:11 GMT)
STRAP: Robot Sub-Trajectory Retrieval for Augmented Policy Learning [8.9] STRAPは、トレーニング済みの視覚基盤モデルと動的時間ワープを利用して、大規模なトレーニングコーパスからトラジェクトリのサブシーケンスを堅牢に検索する技術である。
本研究では、事前学習された視覚基盤モデルと動的時間ワープを活用して、大規模学習コーパスからのトラジェクトリのサブシーケンスをロバストに検索するSTRAPを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:14:04 GMT)
Constructing Invariant and Equivariant Operations by Symmetric Tensor Network [8.8] この研究は、有効な不変および同変演算を構築するための体系的な方法を示す。
入力と出力を異なるランクのカルトテンソルの形で扱うことができ、異なる型を持つ球面テンソルも扱うことができる。
また、この手法を用いて、幾何グラフニューラルネットワークのための同変相互作用メッセージを設計し、同変機械学習モデルを用いて材料法則を学習する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:13:08 GMT)
Toward Storage-Aware Learning with Compressed Data An Empirical Exploratory Study on JPEG [8.6] 本稿では,データ量と圧縮による品質のトレードオフに焦点を当てる。
我々は,一様データドロップや一様圧縮などの単純戦略が最適であることを示す。
データサンプルは圧縮に対する様々な感度を示し、サンプルワイド適応圧縮戦略の実現可能性を支持する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:17:59 GMT)
Score-informed Neural Operator for Enhancing Ordering-based Causal Discovery [8.6] 因果グラフのヘッセン対角線を近似するスコアインフォームドニューラル演算子(SciNO)を提案する。
SciNOは、合成グラフで42.7%、現実世界のデータセットで31.5%のオーダー分散をDiffANと比較する。
また、SciNOの確率推定と自己回帰モデル事前を統合した自己回帰モデルを用いた因果推論の確率論的制御アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:25:41 GMT)
FedSODA: Federated Fine-tuning of LLMs via Similarity Group Pruning and Orchestrated Distillation Alignment [8.5] 大規模言語モデル(LLM)のFFT(Federated Fine-tuning)は、ドメイン固有の適応を可能にする有望なソリューションとして最近登場した。
本稿では,リソース効率の高いFFTフレームワークであるFedSODAについて述べる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:49:32 GMT)
ContestTrade: A Multi-Agent Trading System Based on Internal Contest Mechanism [8.5] 大規模言語モデル(LLM)に基づくエージェントは、金融取引において大きな可能性を示す。
マーケットノイズに対する高い感度は、LLMベースのトレーディングシステムの性能を損なう。
本稿では,現代企業経営構造にインスパイアされた内部競争機構を特徴とする新しいマルチエージェントシステムを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:13:10 GMT)
Deep Semantic Inference over the Air: An Efficient Task-Oriented Communication System [8.5] 分類性能,計算遅延,通信コストを共同で検討する深層学習型タスク指向コミュニケーションフレームワークについて検討する。
我々はResNetsベースのモデルを採用し、それをCIFAR-10およびCIFAR-100データセット上で評価し、無線環境における現実世界の分類タスクをシミュレートする。
適切なモデル分割と意味的特徴圧縮により、システムは85%以上のベースライン精度を維持しながら、計算負荷と通信オーバーヘッドを著しく削減できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:18:07 GMT)
VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip [8.4] Value Sign Flip (VSF) は、数ステップの拡散とフローマッチング画像生成モデルに負のプロンプトガイダンスを組み込む、シンプルで効率的な方法である。
本手法は計算オーバーヘッドを小さくし,MMDiTスタイルのアーキテクチャを効果的に統合する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:03:44 GMT)
Fed-DPRoC:Communication-Efficient Differentially Private and Robust Federated Learning [8.3] Fed-DPRoCは、差分プライバシー(DP)、ビザンツの堅牢性、通信効率を同時に保証する新しい学習フレームワークである。
Johnson-Lindenstrauss (JL) 変換とロバストアグリゲーションのためのロバストアベレージを併用して、我々のフレームワークをRobAJoLとしてインスタンス化する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:52:15 GMT)
Dextr: Zero-Shot Neural Architecture Search with Singular Value Decomposition and Extrinsic Curvature [8.2] 本稿では,ラベル付きデータの計算要求を省略するゼロコストプロキシを提案する。
提案手法は,1つのラベルのないデータサンプルのみを用いて,テストデータ上でのネットワーク性能の正確な予測を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:52:14 GMT)
Exploring Autonomous Agents: A Closer Look at Why They Fail When Completing Tasks [8.2] 我々は、自律エージェントを厳格に評価するために設計された34のプログラム可能なタスクのベンチマークを示す。
LLMバックボーンと組み合わせた3つの人気のあるオープンソースエージェントフレームワークを評価し,タスク完了率約50%を観察した。
我々は,障害の原因を3段階に分類し,計画上のエラー,タスク実行の問題,誤った応答生成を強調する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:55:22 GMT)
Uncertainty-Aware Learning Policy for Reliable Pulmonary Nodule Detection on Chest X-Ray [8.2] 本研究では,知識不足の問題に対処できる不確実性意識学習政策を提案する。
症例はAjou University Hospitalで2,517例,結節像656例であった。
提案モデルでは, ベースラインモデルと比較して感度が10%向上し, 92%に達した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:58:57 GMT)
Anatomic Feature Fusion Model for Diagnosing Calcified Pulmonary Nodules on Chest X-Ray [8.2] 胸部X線による肺結節の正確な同定は、救命早期治療と回避可能な侵襲的処置とを区別することができる。
実際には、胸部X線による肺結節石灰化の診断は、主に医師の視覚的評価に依存する。
本研究では, 原画像からの融合特徴を利用して, 診断性能の高い石灰化分類モデルを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:49:46 GMT)
TabulaX: Leveraging Large Language Models for Multi-Class Table Transformations [8.1] 多クラス列レベルの変換にLarge Language Models(LLM)を利用する新しいフレームワークであるTabulaXを紹介する。
本研究では,TabulaXが既存の最先端手法よりも精度が高く,より広範な変換クラスをサポートし,効率的に適用可能な解釈可能な変換を生成することを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:48:36 GMT)
Experimental demonstration of drone-based quantum key distribution [8.0] 我々は、量子鍵分布(QKD)のための最初のドローンベースの量子タスクを実演する。
リアルタイムQKDは、偏光符号付きデコイ状態BB84プロトコルを用いて、平均秘密鍵レート8.48kHzで200m以上の距離で実行される。
ドローンを用いた秘密鍵配布機能により、量子アプローチのセキュリティを強化して無線通信が期待できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:03:49 GMT)
Applications of Small Language Models in Medical Imaging Classification with a Focus on Prompt Strategies [8.0] 本研究では,医療画像分類作業における小言語モデル(SLM)の性能について検討する。
NIH Chest X-ray データセットを用いて胸部X線位置を分類する作業において,複数のSLMを評価した。
以上の結果から,一部のSLMは良好なプロンプトで競合精度を達成できることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:48:45 GMT)
Data-dependent and Oracle Bounds on Forgetting in Continual Learning [7.9] 継続的な学習では、知識はタスク間で保存され、再利用されなければならない。
Emphexemplar-free法では,モデルやアルゴリズムの選択によらず,データに依存した上限を提供する。
提案手法は,いくつかの連続的な学習問題やアルゴリズムを忘れることに関して,厳密で実践的な境界を生じることを実証的に証明するアルゴリズムを導出する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:13:30 GMT)
TRIDE: A Text-assisted Radar-Image weather-aware fusion network for Depth Estimation [7.9] TRIDE (Radar-camera fusion algorithm) は,レーダポイント情報を組み込んだテキスト特徴抽出アルゴリズムである。
提案手法はnuScenesデータセット上でベンチマークを行い,現状よりも性能が向上したことを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:37:28 GMT)
Enhancing Transformer-Based Foundation Models for Time Series Forecasting via Bagging, Boosting and Statistical Ensembles [7.8] 時系列基礎モデル(TSFM)は、時系列予測、異常検出、分類、計算のための強力な一般化とゼロショット能力を示している。
本稿では, 統計的およびアンサンブルに基づくエンハンスメント技術を用いて, 頑健さと精度を向上させる手法について検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:06:26 GMT)
EEG-MSAF: An Interpretable Microstate Framework uncovers Default-Mode Decoherence in Early Neurodegeneration [7.7] 認知症 (DEM) は世界的な健康問題であり、早期かつ正確な診断の必要性を浮き彫りにしている。
我々はDEM関連バイオマーカーを識別するエンドツーエンドパイプラインである textbfEEG Microstate Analysis Framework (EEG-MSAF) を提案する。
EEG-MSAFは,(1)マイクロステートの特徴抽出,(2)機械学習による分類,(3)重要バイオマーカーの強調のための特徴ランキングの3段階からなる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:54:29 GMT)
DianJin-OCR-R1: Enhancing OCR Capabilities via a Reasoning-and-Tool Interleaved Vision-Language Model [7.7] 大型視覚言語モデル(LVLM)は、入力画像に存在しない単語を生成する幻覚を引き起こす傾向がある。
本稿では,これらの制約に対処する推論とツールをインターリーブしたVLMフレームワークであるDianJin-OCR-R1を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:28:57 GMT)
Towards High-Resolution Industrial Image Anomaly Detection [7.6] HiADは高分解能異常検出のための一般的なフレームワークである。
異なるスケールで異常なキューを統合するデュアルブランチアーキテクチャを採用している。
高解像度画像におけるきめ細かいテクスチャ変化によって生じる課題に対処するために、マルチレゾリューション機能融合戦略が組み込まれている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:54:29 GMT)
CTFlow: Video-Inspired Latent Flow Matching for 3D CT Synthesis [7.6] 臨床報告に条件付き潜時流整合変圧器モデルであるCTFlowを紹介する。
FLUXのA-VAEを用いて潜伏空間を定義し,CT-Clipテキストエンコーダを用いて臨床報告を符号化する。
我々は,現状のCTモデルと比較し,時間的コヒーレンス,画像の多様性,テキスト画像のアライメントの観点から,我々のアプローチの優位性を実証した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:58:21 GMT)
FLAIR: Feedback Learning for Adaptive Information Retrieval [7.6] 我々は、ドメイン固有の専門家のフィードバックを統合することで、協調システムの検索戦略に適応する軽量なフィードバック学習フレームワークFLAIRを紹介する。
FLAIRは,(1)ユーザからのフィードバックからインジケータを取得し,(2)ドキュメントから合成した質問に対して,これらのインジケータを分散的に保存する。さらにオンラインフェーズでは,生の類似度スコアと収集したインジケータを組み合わせた2トラックランキング機構を採用している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:37:27 GMT)
WP-CLIP: Leveraging CLIP to Predict Wölfflin's Principles in Visual Art [7.6] W"オルフリンの5つの原理は、形式解析のための形式的バリエーションを分析するための構造化されたアプローチを提供する。
視覚芸術の5つの原則全てを効果的に予測する既存の指標は存在しない。
大規模データに基づいて事前学習したCLIPがW"オルフリンの原理を理解し予測できるかどうかを検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:00:52 GMT)
ViTAD: Timing Violation-Aware Debugging of RTL Code using Large Language Models [7.6] ViTADは、タイミング違反の根本原因を効率的に分析し、ターゲットとする修復戦略を動的に生成する手法である。
STDGに基づいて、違反経路解析を行い、大きな言語モデル(LLM)を用いて違反の根本原因を推測する。
LLMのみを用いたベースラインは54.38%であるのに対し,本手法はタイミング違反の修復において73.68%の成功率を達成した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:41:32 GMT)
SecFSM: Knowledge Graph-Guided Verilog Code Generation for Secure Finite State Machines in Systems-on-Chip [7.6] SecFSMは、セキュリティ指向の知識グラフを利用して、よりセキュアなVerilogコードを生成するためにLLMをガイドする新しい方法である。
脆弱性を特定するためのユーザの要件を分析し、要件の脆弱性のリストを取得します。次に、脆弱性リストに基づいてFSKGから知識を取得します。最後に、Verilogコード生成のセキュリティ知識に基づいてセキュリティプロンプトを構築します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:18:53 GMT)
GridCodex: A RAG-Driven AI Framework for Power Grid Code Reasoning and Compliance [7.5] GridCodexはグリッドコードの推論とコンプライアンスのためのエンドツーエンドフレームワークである。
我々のフレームワークは、マルチステージクエリ改善とRAPTORによる検索の強化により、従来のRAGを進化させる。
実験の結果、回答の品質が26.4%向上し、リコールレートが10倍以上向上した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:33:29 GMT)
Quadratic Gaussian Splatting: High Quality Surface Reconstruction with Second-order Geometric Primitives [7.5] Quadratic Gaussian Splatting (QGS) は、静的プリミティブを変形可能な二次曲面に置き換える新しい表現である。
QGSは2DGSで33%、DTUデータセットでGOFで27%の幾何学的誤差(チャンファー距離)を減少させる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:57:25 GMT)
Context Matters: Incorporating Target Awareness in Conversational Abusive Language Detection [7.3] ソーシャルメディアにおけるこのような有害なコンテンツに対処する手段として、乱用言語検出がますます重要になっている。
本研究では,会話交換について検討し,相手の投稿に対して相手の投稿に返信する(親のつぶやき)。
親ツイートからコンテキストを活用することで、返信投稿が悪用されているかどうかを判断できますか?
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:12:21 GMT)
Detecting $k$-nonstretchability via a class of informationally complete symmetric measurements [7.2] 本稿では,情報的に完備な$(s,t)$-POVMsに基づく$k$-nonstretchabilityの検出について論じる。
これらの基準は特定の状態を特定することができ、その実用性や利点を具体例で示している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:54:10 GMT)
Epistemic Wrapping for Uncertainty Quantification [7.0] 不確実性推定は機械学習、特に分類タスクにおいて重要である。
分類における不確実性評価を改善することを目的とした,新しいエピステミック・ラッピング手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:40:45 GMT)
An LLM + ASP Workflow for Joint Entity-Relation Extraction [7.0] JERE(Joint entity-relation extract)は、エンティティとそれらの関係を同時に識別する。
このタスクを実行するには、従来の機械学習ベースのアプローチでは、注釈付きデータの大規模なコーパスが必要となる。
本稿では,ジェネレーティブ事前学習型大規模言語モデル(LLM)の能力と,JEREを実行するためのAnswer Set Programming(ASP)の知識表現と推論能力を活用することを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:15:35 GMT)
Parallel Network Reconstruction with Multi-directional Regularization [6.9] PALMS(Parallel Adaptive Lasso with Multi-directional Signals)と呼ばれる並列コンピューティングを用いた大規模ネットワーク再構築のための分散コンピューティングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:11:55 GMT)
Visual Perception Engine: Fast and Flexible Multi-Head Inference for Robotic Vision Tasks [6.9] Visual Perception Engine (VPEngine)は、開発者のアクセシビリティを維持しながら、視覚的マルチタスクのための効率的なGPU使用を可能にするために設計されたモジュラーフレームワークである。
我々のフレームワークアーキテクチャは、並列に実行される複数のタスク固有のモデルヘッド間で効率的に共有される画像表現を抽出する共有基盤モデルバックボーンを活用している。
実装例では、NVIDIA Jetson Orin AGX forRT最適化モデル上で、エンド・ツー・エンドのリアルタイム性能を$geq$50 Hzで示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:11:18 GMT)
Data-Efficient Safe Policy Improvement Using Parametric Structure [6.9] 3つのコントリビューションを通じて、安全政策改善(SPI)をよりデータ効率よくします。
パラメトリックSPIアルゴリズムは、分布間の既知の相関を利用して、遷移ダイナミクスをより正確に推定する。
より高度な前処理技術は、満足度変調理論(SMT)の解法に基づいて、さらに多くのアクションを特定できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:41:23 GMT)
BELT: Block Encoding of Linear Transformation on Density Matrices [6.8] Blockを紹介します。
任意の線形写像をシミュレートする体系的プロトコルであるBELT (Linear Transformation) の$。
BELTはコヒーレント量子進化を通じて$mathcalN(rho)$に関する情報の操作と抽出を可能にする。
BELTはエンタングルメント検出、量子チャネル反転、擬微分作用素に応用している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:54:40 GMT)
Can Large Models Teach Student Models to Solve Mathematical Problems Like Human Beings? A Reasoning Distillation Method via Multi-LoRA Interaction [6.7] 大規模言語モデル(LLM)は強力な数学的推論能力を持つが、数十億のパラメータに依存している。
既存の手法は通常、LCMを利用して大量のデータを生成してクラミングトレーニングを行う。
数学的推論蒸留(LoRID)のためのマルチロラ相互作用に基づく新しい手法を提案する。
LoRIDは、特にGSM8Kデータセット上で、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:56:10 GMT)
Judging the Judges: Evaluating Alignment and Vulnerabilities in LLMs-as-Judges [6.6] LLM-as-a-judgeパラダイムは,大規模言語モデルを評価するアプローチとして急速に普及している。
本稿では,人間間の合意が高いクリーンなシナリオに焦点を当てる。
我々は、複雑性や長さを早めるための感度や、寛大さへの傾向など、審査モデルの脆弱性を識別する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:07:23 GMT)
Z-Pruner: Post-Training Pruning of Large Language Models for Efficiency without Retraining [6.6] トレーニング後のプルーニングは、再トレーニングを必要とせずに、モデルサイズと推論レイテンシを低減するための有望なアプローチである。
Z-Prunerは,事前学習された大規模言語モデルにおいて,再学習を伴わずにスパーシリティを誘導するために設計された,新しい訓練後プルーニング手法である。
Z-Prunerは、重量の集中的な更新を必要とする最先端のプルーニング手法を超越している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:19:22 GMT)
SimGenHOI: Physically Realistic Whole-Body Humanoid-Object Interaction via Generative Modeling and Reinforcement Learning [6.3] SimGenHOIは、生成モデリングと強化学習の強みを組み合わせた統一的なフレームワークであり、制御可能で物理的に妥当なHOIを生成する。
本研究では,Diffusion Transformers (DiT) に基づくHOI生成モデルを用いて,テキストプロンプト,オブジェクト形状,スパースオブジェクトウェイポイント,初期ヒューマノイドポーズのセットを予測した。
身体的現実性を確保するため,強化学習で訓練された接触認識全身制御ポリシーを設計し,その動作をトラッキングし,侵入や足の滑りなどのアーティファクトを補正する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:20:46 GMT)
ID-Card Synthetic Generation: Toward a Simulated Bona fide Dataset [6.2] 本研究は、安定拡散を用いた合成版を生成することにより、ボナファイド画像を模倣する手法を最初に提案した1つである。
生成された新しい画像は、スクラッチから訓練されたシステムと商用ソリューションで評価される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:48:57 GMT)
Widening the Network Mitigates the Impact of Data Heterogeneity on FedAvg [6.2] フェデレートラーニング(FL)により、分散クライアントは、ローカルデータを共有せずに、協調的にモデルをトレーニングできる。
ニューラルネットワークの幅が大きくなると、データの不均一性の影響は減少し、幅が無限に近づくと最終的に消滅する。
無限幅系では、FedAvgのグローバルモデルと局所モデルの両方が線形モデルとして振る舞うことがさらに証明され、FedAvgはGD反復数と同じ数の集中学習と同じ一般化性能を達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:22:55 GMT)
DAASH: A Meta-Attack Framework for Synthesizing Effective and Stealthy Adversarial Examples [6.2] DAASHは完全に差別化可能なメタアタックフレームワークであり、効果的かつ知覚的に整列した敵の例を生成する。
CIFAR-10, CIFAR-100, ImageNetを対象とし, DAASHの評価を行った。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:54:20 GMT)
XAMT: Cross-Framework API Matching for Testing Deep Learning Libraries [6.0] ディープラーニングライブラリをテストするためのクロスフレームファジィファジィ手法であるXAMTを提案する。
XAMTは、名前、記述、パラメータ構造に基づく類似性ベースのルールを使用してAPIにマッチする。
その後、インプットを調整し、分散誘導テストを適用してバグを検出する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:48:50 GMT)
SparseMap: A Sparse Tensor Accelerator Framework Based on Evolution Strategy [5.7] 機械学習とビッグデータにおけるスパース計算代数(SpTA)の需要は、様々なスパースアクセラレータの開発を促している。
それまでの作業は、マッピング(例えば、テンソル通信と時間と空間のタイリング)とスパース戦略にのみ焦点をあてていた。
本稿では,SparseMapと呼ばれる,進化戦略に基づくスパースアクセラレータ最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:13:30 GMT)
Breaking Reward Collapse: Adaptive Reinforcement for Open-ended Medical Reasoning with Enhanced Semantic Discrimination [5.7] ルールに基づく報酬による強化学習は、視覚言語モデル(VLM)と大規模言語モデル(LLM)の推論と一般化能力を高める強力な可能性を示している。
この領域における既存の強化微調整(RFT)アプローチは主に閉鎖型視覚質問応答(VQA)をターゲットにしている
オープンエンド医療用VQAのための新しいRLフレームワークARMedを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:31:26 GMT)
DEEP-SEA: Deep-Learning Enhancement for Environmental Perception in Submerged Aquatics [5.5] 継続的で信頼性の高い水中モニタリングは、海洋生物多様性の評価、生態学的変化の検出、自律探査に不可欠である。
水中環境は、光散乱、吸収、濁度により、画像の明瞭度を低下させ、色情報を歪ませることによる重要な課題を呈している。
空間構造を保存しながら低周波情報と高周波情報を両立させる深層学習に基づく水中画像復元モデルDEEP-SEAを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:07:26 GMT)
Checkmate: interpretable and explainable RSVQA is the endgame [5.4] 3'123'253質問を通じてバイアスを最小限に抑えるために,新しいRSVQAデータセットであるChessboardを導入する。
各回答は画像内の1つ以上の細胞にリンクされ、きめ細かい視覚的推論を可能にする。
そこで我々は,その決定に最も関係のある画像セルを識別する,Checkmateと呼ばれる説明可能な,解釈可能なモデルを開発した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:59:43 GMT)
Whispering Context: Distilling Syntax and Semantics for Long Speech Transcripts [5.4] 本稿では,LLaMAモデルからの文脈知識をWhisperに蒸留することにより,ASRを向上させる新しい手法を提案する。
提案手法では,(1) 寸法と列の長さを調整するための最適な輸送手段を用いたトークンレベルの蒸留,(2) Whisper と LLaMA の文埋め込みによる表現損失の最小化,の2つの手法を用いる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:37:09 GMT)
It's the Thought that Counts: Evaluating the Attempts of Frontier LLMs to Persuade on Harmful Topics [5.4] 我々は,説得的試みの頻度と文脈を説得し,測定する意思を識別する自動モデルを導入する。
オープンかつクローズドウェイトなモデルの多くは、有害なトピックに対する説得を積極的に試みている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:50:56 GMT)
New Interaction Paradigm for Complex EDA Software Leveraging GPT [5.4] We present SmartonAI, AI-assisted interaction system that integrates large language model into the EDA workflow。
SmartonAIは、ユーザ命令をサブタスクに分解するChatCommandと、カスタマイズされたドキュメントを取得するOneLineの2つの主要コンポーネントで構成されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:57:44 GMT)
Time Profile of U.S. Neighborhoods: Datasets of Time Use at Social Infrastructure Places [5.2] 社会基盤は、社会的相互作用を育み、サービス提供を可能にし、多様な環境への露出を促進することによって、近隣の幸福を形作る上で重要な役割を担っている。
空間的アクセシビリティに関する知識の増大にもかかわらず、空間的に解決された国家データセットが欠如しているため、社会インフラの場所での時間使用は過小評価されている。
我々は、エンゲージメントの長さと深さ、活動の多様性、空間的不平等をキャプチャするスケーラブルな社会インフラ時間利用尺度(STU)を開発した。
当社のデータセットは、2019年から2024年の間に収集された、49の大陸州で収集された匿名および集約された足のトラフィックデータを活用しています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:22:04 GMT)
Beyond Modality Limitations: A Unified MLLM Approach to Automated Speaking Assessment with Effective Curriculum Learning [5.1] MLLM(Multimodal Large Language Models)は、総合的自動評価(ASA)のための前例のない機会を提供する
我々は, 音声のより堅牢なモデリング基盤を確立するために, 音声ファースト・マルチモーダル・トレーニング(SFMT)を提案する。
特に、SFMTは、従来のトレーニング手法よりも絶対精度を4%向上させるという、デリバリ面の評価に優れています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:57:43 GMT)
Diff-MSM: Differentiable MusculoSkeletal Model for Simultaneous Identification of Human Muscle and Bone Parameters [5.1] 筋と骨のパラメータを同時に同定するために,Diff-MSM (Diff-MSM) を用いた。
Diff-MSMを用いた新しいパラメータ識別技術は、筋肉の健康モニタリング、リハビリテーション、スポーツ科学における新しい応用を可能にする大きな可能性を秘めている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:43:43 GMT)
Point upsampling networks for single-photon sensing [5.0] 単一光子点雲における点密度を増大させ,空間歪みを低減するために,点アップサンプリングネットワークを提案する。
ネットワークは状態空間モデルに基づいて構築され,空間コンテキストを充実させるマルチパス走査機構を統合している。
一般的なデータセット上で実験を行い、その高い復元精度と歪み雑音に対する強い堅牢性を確認する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:05:27 GMT)
"I see models being a whole other thing": An Empirical Study of Pre-Trained Model Naming Conventions and A Tool for Enhancing Naming Consistency [5.0] 我々は,Hugging Face PTMレジストリにおいて,PTM命名の実践に関する実証的研究を行った。
DARAは, PTM命名の不整合を検出するために設計された最初の自動DNNARchitecture Assessment技術である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:56:45 GMT)
ding-01 :ARG0: An AMR Corpus for Spontaneous French Dialogue [4.9] 抽象的意味表現(AMR)におけるフランス語対話の注釈付けによるフランス語意味コーパスの構築について述べる。
具体的には,DinGコーパスを注釈し,ボードゲームCataanで記録された自発的なフランス語対話の書き起こしからなる。
AMRは自然発話のダイナミックスを十分にカバーできないため、フランス語特有の自然発話や文構造をよりよく表現するために、この枠組みを拡張した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:57:44 GMT)
AtmosMJ: Revisiting Gating Mechanism for AI Weather Forecasting Beyond the Year Scale [4.9] 本研究では,ERA5データを球面再マッピングなしで直接操作する深層畳み込みネットワークを提案する。
以上の結果から,AtmosMJは約500日間,安定かつ物理的に妥当な予測が得られた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:03:00 GMT)
Diffusion Based Ambiguous Image Segmentation [4.8] 生成セグメンテーションのための拡散モデルの設計空間について検討する。
入力スケーリングによるノイズスケジュールの厳格化は,性能を著しく向上させる。
我々はLIDC-IDRI肺病変データセットに基づく実験を行い,SOTA(State-of-the-art)の性能を得た。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:11:43 GMT)
LEARNER: A Transfer Learning Method for Low-Rank Matrix Estimation [4.8] 本稿では,対象個体群と対象個体群間の潜在列と列空間の類似性を利用して,対象個体群の推定を改善する手法を提案する。
LEARNERは,対象個体群と対象個体群間の遅延列と列空間の違いをペナルティ化する,対象個体群データの低ランク近似を行う。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:25:08 GMT)
Vitamin N: Benefits of Different Forms of Public Greenery for Urban Health [4.8] 公式の緑化指標は、緑化の量や近さを計測するが、人々が日々の生活でそれを見たり使ったりする頻度を無視する。
我々は、道路を歩きながら見る道路緑化と、計画的な訪問を必要とするオフロード緑化とを区別する新しい分類を導入した。
道路上の緑は4つの公的手段よりも健康に強く結びついていることがわかりました。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:17:33 GMT)
"DIVE" into Hydrogen Storage Materials Discovery with AI Agents [4.7] データ駆動人工知能(AI)アプローチは、新しい素材の発見を変革している。
本稿では,視覚表現の記述的解釈(Descriptive Interpretation of Visual Expression, DIVE)について述べる。
4000の出版物から3万点を超えるキュレートされたデータベース上に構築し、これまで報告されていない水素貯蔵成分を2分で識別できる高速な逆設計ワークフローを構築した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:30:18 GMT)
Supporting Socially Constrained Private Communications with SecureWhispers [4.6] そこで我々は,携帯電話同士の共通秘密を相互に揺らして生成する手法を開発した。
本稿では、メッセージ難読化、信頼委譲、暗号化ビーコンの3つの異なる利用法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:09:29 GMT)
Quantum algorithms to detect ODMR-active defects for quantum sensing applications [4.6] 本稿では、2つの量子アルゴリズムを用いて三重項-四重項間交差速度の不均衡を検出する。
我々は、ICCレートの不均衡を105個の論理量子ビットと2.2倍の108ドルのトフォリゲートで検出できることを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:00:37 GMT)
Eigenspectrum Analysis of Neural Networks without Aspect Ratio Bias [4.5] 重みの固有スペクトルを分析してディープニューラルネットワーク(DNN)を診断することは近年研究の活発な領域となっている。
主なアプローチの1つは、重量行列の経験的スペクトル密度(ESD)の重みを測定することである。
これらのESDの重みを推定する上で、しばしば見過ごされる課題、すなわち重み行列のアスペクト比の影響に対処する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:36:09 GMT)
Physically Plausible Data Augmentations for Wearable IMU-based Human Activity Recognition Using Physics Simulation [4.4] センサベースのヒューマンアクティビティ認識における高品質なラベル付きデータの不足は、モデルの性能を阻害する。
データ拡張は、トレーニングデータセットの多様性を強化することでこの問題を軽減するための重要な戦略である。
物理シミュレーションによって実現された物理的に可塑性なデータ拡張(PPDA)の導入と特徴付けを行う。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:02:27 GMT)
HiFo-Prompt: Prompting with Hindsight and Foresight for LLM-based Automatic Heuristic Design [4.4] HiFo-Promptは,2つのシナジスティックなプロンプト戦略(ForesightとHindsight)でLCMをガイドするフレームワークである。
Foresightベースのプロンプトは、人口動態に基づく探索を適応的に操縦し、探索と探索のトレードオフを管理する。
Hindsightベースのプロンプトは、過去の世代から成功したトランジェントを基本的で再利用可能な設計原則に蒸留することで、人間の専門性を模倣する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:42:55 GMT)
Application of Optimal Control to Time-Resolution Protocol for Quantum Sensing [4.3] 量子センシングの時間分解能プロトコルは、外界の速い時間変動を測定することを目的としている。
時間分解プロトコルを最適化するために最適制御理論を適用する。
潜在的な応用として、超伝導量子ビットの制御におけるベースバンドフラックスパルス歪みの校正について概説する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:54:31 GMT)
Empirical Evidences for the Effects of Feature Diversity in Open Set Recognition and Continual Learning [4.3] 特徴多様性の向上が開集合標本の認識を改善するという実証的証拠を提供する。
機能の多様性の向上は、前もって学んだデータの保持と、継続的な学習における新しいデータの統合を促進する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:25:06 GMT)
A simple analysis of a quantum-inspired algorithm for solving low-rank linear systems [4.2] 解 $mathbfx* := mathbfA+mathbfb$ から線形系への簡単なサンプリングアルゴリズムを解析する。
我々の分析は初等的で非漸近的で、完全に自己完結している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:14:35 GMT)
Evaluating Contrast Localizer for Identifying Causal Units in Social & Mathematical Tasks in Language Models [4.0] この研究は、神経科学的コントラストローカライザを用いて、大きな言語モデル(LLM)と視覚言語モデル(VLM)における、心の理論(ToM)と数学的推論タスクの因果関係ユニットをピンポイントする。
コントラスト刺激セットを用いてトップアクティベート単位の局所化を行い,その因果的役割を目標アブレーションにより評価した。
ToMおよび数式ベンチマークを用いて, 機能的選択単位が低活性, ランダム選択単位が下流の精度に及ぼす影響を比較検討した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:31:45 GMT)
Data driven feedback linearization of nonlinear control systems via Lie derivatives and stacked regression approach [3.9] 本稿では,既知の挙動に基づくフィードバック線形化物理系の同定手法を提案する。
従来と異なり、本論文の新たな側面は、重回帰アルゴリズムのアプローチと相対次数条件を組み合わせて、物理モデルの真の支配方程式を発見し、フィードバックするものである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:51:13 GMT)
Generative Modeling of Full-Atom Protein Conformations using Latent Diffusion on Graph Embeddings [3.9] 完全な全原子タンパク質構造を構築するフレームワークであるフルタンパク質生成(LD-FPG)の潜在拡散について述べる。
LD-FPGは、チェビシェフグラフニューラルネットワーク(ChebNet)を用いて、タンパク質コンホメーションの低次元潜伏埋め込みを得る。
膜環境におけるヒトドーパミンD2受容体の2マイクロ秒MD軌道であるD2R-MDを用いて、シーケンシャルおよび残基ベースプール戦略は、高い構造的忠実度で参照アンサンブルを再現する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:37:31 GMT)
7Bench: a Comprehensive Benchmark for Layout-guided Text-to-image Models [3.8] レイアウト誘導型テキスト・画像生成における意味的アライメントと空間的アライメントの両方を評価する最初のベンチマークである7Benchを紹介する。
本稿では,空間的精度を評価するためにレイアウトアライメントスコアを組み込んで,既存のフレームワーク上に構築した評価プロトコルを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:37:51 GMT)
FDR-SVM: A Federated Distributionally Robust Support Vector Machine via a Mixture of Wasserstein Balls Ambiguity Set [3.7] 本稿では,複数のクライアントと中央サーバのネットワーク上でのフェデレーション分類問題について検討する。
我々はFDR-SVM(Federated Distributionally Robust Support Vector Machine)を開発した。
我々はFDR-SVM問題を解く2つのアルゴリズムを厳格に導き、それらの収束挙動と最悪の時間複雑性を解析する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:30:31 GMT)
When Deep Learning Fails: Limitations of Recurrent Models on Stroke-Based Handwriting for Alzheimer's Disease Detection [3.6] アルツハイマー病の検出には高価な神経画像撮影や侵襲的な処置が必要で、アクセシビリティが制限される。
本研究は, 深層学習が手書き解析による非侵襲的アルツハイマー病の検出を可能にするかどうかを考察する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:54:20 GMT)
Surya: Foundation Model for Heliophysics [3.6] 汎用的な太陽表象を学習するために設計されたヘリオフィジカルのための366Mパラメータ基礎モデルであるSuryaを紹介する。
パラメータ効率の低い低時間適応Rank (LoRA) を用いた下流微調整は高い性能を示す一方で, 太陽のダイナミクスやフレア現象を予測する能力を示す。
その新しいアーキテクチャと性能は、このモデルが太陽の進化の背後にある物理学を学ぶことができることを示唆している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:44:25 GMT)
SO(n) Affleck-Kennedy-Lieb-Tasaki states as conformal boundary states of integrable SU(n) spin chains [3.6] 我々は、$mathrmSU(n)$ Wess-Zumino-Witten (WZW) 共形場理論において共形境界状態のクラスを構築する。
これらの境界状態は、標準カルディ構成を超え、$mathrmSO(n)$対称性を持つ。
我々は、正確な重なり公式を用いて、対応するAffleck-Ludwig境界エントロピーを解析的に計算する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:20:23 GMT)
Cross-Modal Characterization of Thin Film MoS$_2$ Using Generative Models [3.5] 機械学習は、材料の成長とキャラクタリゼーションに対して、スピードと効率をガイドし、提供することができる。
本研究では,顕微鏡計測から定量的な測定値の投影の可能性について検討した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:47:07 GMT)
Towards Consumer-Grade Cybersickness Prediction: Multi-Model Alignment for Real-Time Vision-Only Inference [3.5] サイバーシックネスは没入型バーチャルリアリティ(VR)の普及の大きな障害である
我々は、パーソナライズされたサイバーシックネス予測のためのスケーラブルでデプロイ可能なフレームワークを提案する。
当社のフレームワークは,コンシューマレベルのVRプラットフォームとの統合に理想的なリアルタイムアプリケーションをサポートしています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:24:12 GMT)
Spot the BlindSpots: Systematic Identification and Quantification of Fine-Grained LLM Biases in Contact Center Summaries [3.4] BlindSpotは15の運用バイアス次元の分類に基づいて構築されたフレームワークである。
BlindSpotは、一対の転写文とその要約において、各バイアス次元のカテゴリ分布を生成する。
分析の結果、バイアスは、サイズや家族に関係なく、すべての評価モデルにまたがって体系的であり、存在することが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:31:03 GMT)
Exploring Content and Social Connections of Fake News with Explainable Text and Graph Learning [3.3] 偽情報は、しばしば「いいね!」やユーザーネットワークのようなソーシャルメディアのダイナミクスを利用して、そのリーチを増幅する。
本稿では、ファクトチェックを強化するために、コンテンツ、ソーシャルメディア、グラフベースの機能を組み合わせた説明可能なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:35:59 GMT)
Arabic ASR on the SADA Large-Scale Arabic Speech Corpus with Transformer-Based Models [3.3] 大規模アラビア音声データセットを用いた音声認識モデルの性能評価を行った。
データセットにはサウジアラビアのテレビ番組の高品質オーディオが68時間含まれている。
4 グラム言語モデルを用いて SADA 上で微調整された MMS 1B モデルは 40.9% の WER と 17.6% の CER を達成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:44:25 GMT)
WebMall -- A Multi-Shop Benchmark for Evaluating Web Agents [3.2] 本稿では,比較ショッピングにおけるWebエージェントの有効性と効率を評価するベンチマークであるWebMallを紹介する。
WebMallは、Common Crawlから提供された真正な製品で人口密度の高い4つのシミュレートされたオンラインショップで構成されている。
最高性能構成は75%と53%、F1スコアは87%と63%であり、それぞれ基本的なタスクセットと高度なタスクセットである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:41:22 GMT)
DAIQ: Auditing Demographic Attribute Inference from Question in LLMs [3.2] 大規模言語モデル(LLM)は、性別や人種などの人口特性が入力の中に明示的に存在するときに、社会的偏見を反映することが知られている。
しかし、それらのモデルが存在しない場合でも、これらのモデルは質問のフレーズだけでユーザーのアイデンティティを推測する。
本稿では,言語モデルで見過ごされた障害モードを監査するためのタスクおよびフレームワークであるDAIQを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:26:17 GMT)
Neural Rendering for Sensor Adaptation in 3D Object Detection [3.1] クロスセンサー領域ギャップが最先端の3Dオブジェクト検出器に与える影響について検討する。
我々は,BEVFormerのような後方投影を備えた高密度のBird's Eye View(BEV)表現に基づくモデルアーキテクチャが,センサ構成の変化に対して最も堅牢であることを示す。
ニューラルレンダリングに基づく新しいデータ駆動型センサ適応パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:53:45 GMT)
Stable Diffusion-Based Approach for Human De-Occlusion [3.1] 我々は,隠蔽された身体構造と外観の回復を対象とする,人間の排他的排除に焦点を当てた。
本手法では,タスクをマスク完備化とRGB完備化の2段階に分割する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:53:29 GMT)
Robust Federated Learning under Adversarial Attacks via Loss-Based Client Clustering [3.1] フェデレートラーニング(FL)は、プライベートデータを共有せずに、複数のクライアント間で協調的なモデルトレーニングを可能にする。
FLサーバは信頼できる(正直な)サイドデータセットを持ち、FLクライアントが敵(ビザンチン)攻撃を受ける場合のFLシナリオを考察する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:11:21 GMT)
Two-sample comparison through additive tree models for density ratios [3.0] 本研究では, 分散損失と呼ばれる新たな損失関数を用いて, 密度比の加算木モデルを訓練するアルゴリズムを提案する。
損失関数が指数族核に類似していることから、新しい損失は共役前駆体が存在する擬似類似体として機能することを示す。
本稿では,二分分類における指数的損失とf-発散の変分形式との密接な関係を通してのバランス損失について考察する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:14:46 GMT)
Synthesizing Accurate and Realistic T1-weighted Contrast-Enhanced MR Images using Posterior-Mean Rectified Flow [3.0] 造影強調(CE) T1強調MRIは神経腫瘍診断の中心であるが、ガドリニウムをベースとした薬剤が必要である。
非コントラスト入力からCE脳MRIを合成するための2段階後平均整流パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:55:57 GMT)
Predicting the Performance of Graph Convolutional Networks with Spectral Properties of the Graph Laplacian [3.0] グラフ畳み込みネットワーク(GCN)の文献では、GCN層を積み重ねることでノード分類やエッジ予測といったタスクのパフォーマンスが向上する可能性がある、という共通の見解がある。
我々は、グラフの代数的接続(Fiedler値)がGCN性能のよい予測因子であることを経験的に見出した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:13:13 GMT)
Mapping the Unseen: Unified Promptable Panoptic Mapping with Dynamic Labeling using Foundation Models [2.9] 動的ラベリングに基礎モデルを活用するUPPM(Unified Promptable Panoptic Mapping)を提案する。
UPPMは、フラットデータセットでは0.61cm(英語版))、最高パノプティクス品質(英語版)(0.414)、最先端セグメンテーション法(英語版)よりも優れた性能を持つ。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:04:47 GMT)
Enriching Moral Perspectives on AI: Concepts of Trust amongst Africans [2.9] アフリカ25カ国のプロフェッショナルおよび/または教育的関心を持つ157人を調査した。
ほとんどの回答者は、ナミビアとガーナのアフリカにおける信頼とAIに関するワークショップと関連があった。
我々の研究は、AI設計、利用、ガバナンスのアフリカの社会現実において、信頼が実践され、経験されている方法について、より実証的な研究を動機付けている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:04:40 GMT)
Demonstrating Narrative Pattern Discovery from Biomedical Literature [2.9] PubPharmはドイツの薬局向けの専門情報サービスである。
PubPharmは従来のキーワードベースの検索、化学構造検索、新しいグラフベースの発見をサポートする。
これは物語パターンマイニングと呼ばれる新しい検索機能を導入し、ユーザーはコンテキスト関連エンティティやエンティティのインタラクションを探索できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:07:14 GMT)
Stands to Reason: Investigating the Effect of Reasoning on Idiomaticity Detection [2.8] 大規模言語モデルにおける推論能力が慣用性検出性能にどのように影響するかを検討する。
推論の効果は,予想よりも小さく,多様であることがわかった。
より小さなモデルでは、チェーン・オブ・シンクレット(CoT)推論は、Math-tunedの中間モデルから性能を向上するが、ベースモデルのレベルには及ばない。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:17:09 GMT)
Silentflow: Leveraging Trusted Execution for Resource-Limited MPC via Hardware-Algorithm Co-design [2.8] 我々はCOT生成における通信を排除するプロトコルであるSilentflowを紹介する。
エンドツーエンドのレイテンシとリソース要求のバランスをとり、最先端のプロトコルよりも39.51倍のスピードアップを実現しています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:00:10 GMT)
Energy-Efficient Wireless LLM Inference via Uncertainty and Importance-Aware Speculative Decoding [2.8] エネルギー効率の高い重要度と不確実性を考慮したHLM推論のためのトークンレベルのフィルタリング機構を提案する。
提案手法は,情報トークンのみをアップロードし,LCM使用率と通信コストを低減させる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:56:59 GMT)
Quantifying Loss Aversion in Cyber Adversaries via LLM Analysis [2.8] IARPAのReSCINDプログラムは、攻撃的な認知特性を推論し、防御し、悪用しようと試みている。
本稿では,大規模言語モデル(LLM)を利用して,ハッカー行動からの損失回避の認知バイアスに関する定量的知見を抽出する手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:51:30 GMT)
Quantum State Preparation by Improved MPS Method [2.8] 本稿では,回路深度を指数的に低減した改良型マトリックス製品状態(MPS)法作成プロトコルを提案する。
ディエンタングの原理を洗練することにより、約33%の2ビットゲート数を削減できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:04:30 GMT)
A Risk Manager for Intrusion Tolerant Systems: Enhancing HAL 9000 with New Scoring and Data Sources [2.7] 侵入耐性システム(ITS)は、多ドメイン敵の台頭によりますます重要になっている。
既存のITSソリューションでは、セキュリティインテリジェンスを活用して、出現する脅威に対してシステム防衛を動的に調整するリスクマネージャがよく使用されている。
この作業では、セキュリティアドバイザリや研究フォーラム、リアルタイムのコンセプションなど、さまざまな脅威ソースを継続的にマイニングする、カスタムビルドスクレイパーを導入している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:16:05 GMT)
Who's Asking? Investigating Bias Through the Lens of Disability Framed Queries in LLMs [2.7] 大規模言語モデル(LLM)は、ユーザの人口統計特性を、単独で推測する。
これらの推論を形作る際の障害の手がかりは、ほとんど未発見のままである。
そこで本研究では,障害条件による人口統計バイアスを,最先端の8つのLLMに対して,初めて体系的に評価した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:03:09 GMT)
Adaptive Model-Predictive Control of a Soft Continuum Robot Using a Physics-Informed Neural Network Based on Cosserat Rod Theory [2.7] 本研究は、ドメイン分割物理インフォームドニューラルネットワーク(DD-PINN)に基づくSCRのためのリアルタイム対応非線形モデル予測制御(MPC)フレームワークを導入する。
シミュレーションでは、動的軌跡の正確な追跡と3mm以下の端点位置誤差によるセットポイント制御が示される。
実世界の実験では、コントローラーも同様の精度と加速を3.55 m/s2まで達成している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:24:36 GMT)
SALSA-RL: Stability Analysis in the Latent Space of Actions for Reinforcement Learning [2.7] 本研究では,SALSA-RL(Stability Analysis in the Latent Space of Actions)を提案する。
SALSA-RLは、様々なベンチマーク環境における性能を損なうことなく、事前訓練されたRLエージェントからの動作の局所的安定性を評価するために、非侵襲的な方法で展開可能であることを実証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:36:51 GMT)
A Unified Cortical Circuit Model with Divisive Normalization and Self-Excitation for Robust Representation and Memory Maintenance [2.7] 本稿では,分割正規化と自己励磁を組み合わせ,ロバストな符号化を実現するリカレントニューラルネットワークを提案する。
2つの標準タスクでモデルの汎用性を実証する。
この研究は、ノイズ抑圧、ワーキングメモリ、近似ベイズ推論を橋渡しする統一的な数学的枠組みを確立する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:00:24 GMT)
The Maximum Coverage Model and Recommendation System for UAV Vertiports Location Planning [2.7] 深センのような都市は、大規模なバーチポートネットワーク(例:2026年までに1,200以上の施設)を計画している。
既存の計画フレームワークは、データの粒度の歴史的制限と実世界の適用性のために、この複雑さに対して不適切なままである。
本稿では,都市規模の時空間需要,異種ユーザ行動,インフラ容量制約を同時にモデル化する新しい最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:31:08 GMT)
Cheddar: A Swift Fully Homomorphic Encryption Library Designed for GPU Architectures [2.6] 完全なホモモルフィック暗号化(FHE)は、暗号化されたデータに対するセキュアな計算を可能にすることによって、クラウドコンピューティングをプライバシの懸念から解放する。
我々は、GPUのための高性能なFHEライブラリであるCheddarを紹介し、従来のGPU実装よりも大幅に高速化した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:01:00 GMT)
AutoChemSchematic AI: Agentic Physics-Aware Automation for Chemical Manufacturing Scale-Up [2.6] 現在のAIシステムは、重要なエンジニアリングスキーマを確実に生成することはできない。
産業用PFDとPIDの自動生成のためのクローズドループ物理対応フレームワークを提案する。
本研究では,本フレームワークが高忠実度でシミュレータ検証されたプロセス記述を生成することを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:52:22 GMT)
Reducing False Positives with Active Behavioral Analysis for Cloud Security [2.5] ルールベースのクラウドセキュリティ姿勢管理(CSPM)ソリューションは、多くの偽陽性を生み出すことが知られている。
本稿では,クラウドセキュリティ姿勢管理ソリューションにおけるアクティブな行動テストを統合し,ポリシー違反の悪用性をリアルタイムで評価する検証駆動手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:39:02 GMT)
SuryaBench: Benchmark Dataset for Advancing Machine Learning in Heliophysics and Space Weather Prediction [2.3] 本稿では、NASAのソーラー・ダイナミクス・オブザーバ(SDO)から得られた高分解能で機械学習対応のヘリオフィジカルデータセットを紹介する。
このデータセットには、大気圧イメージングアセンブリ(AIA)とヘリオサイスミック・磁気画像処理(HMI)からの処理された画像が含まれている。
MLタスクの適合性を確保するため、データは前処理され、宇宙船のロール角の補正、軌道調整、露出正規化、劣化補正が行われた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:05:01 GMT)
Monte Carlo Functional Regularisation for Continual Learning [2.3] 我々はモンテカルロサンプリングによるモデル予測分布を近似するMCFRCLと呼ばれる新しい機能正規化CLフレームワークを提案する。
提案したMCFRCLは,MNISTおよびCIFARデータセット上の複数のベンチマーク手法に対して評価される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:25:37 GMT)
MPOCryptoML: Multi-Pattern based Off-Chain Crypto Money Laundering Detection [2.3] 本稿では,暗号通貨取引における複数のマネーロンダリングパターンを効果的に検出するMPOCryptoMLを提案する。
MPOCryptoMLは、ランダムな洗浄パターンを識別するマルチソースパーソナライズされたPageRankアルゴリズムの開発を含む。
一貫性のあるパフォーマンス向上を示し、精度が9.13%、リコールが10.16%、F1スコアが7.63%、精度が10.19%まで向上した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:06:32 GMT)
Generalized Brillouin Zone Fragmentation [2.2] 一般化ブリルアンゾーン(GBZ)は非エルミート皮膚の蓄積により格子運動量がどのように複雑に変形するかを符号化する。
総じて、GBZは1つ以上の皮膚局在方向や強度が存在する場合、ユニークでもよく定義されていない。
フラグメント化されたGBZをスケーラブルな方法で計算するフォーマリズムを開発する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:00:09 GMT)
Noisy Quantum Simulation Using Tracking, Uncomputation and Sampling [2.0] ほとんどの研究者にとって、量子ハードウェア上の計算時間へのアクセスは限られている。
これにより、量子回路の実行を正確に、かつ正確に模倣するシミュレータを構築する必要が生じる。
本稿では,雑音量子シミュレーションのためのTUSQ - Tracking, Uncomputation, Smplingを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:33:10 GMT)
Best Foot Forward: Robust Foot Reconstruction in-the-wild [2.0] 本稿では,SfM (Structure-from-Motion) 再構成を改良した新しいエンドツーエンドパイプラインを提案する。
まず、SE(3)の正準化と視点予測モジュールを用いてスキャンアライメントの曖昧さを解消し、次に、合成強化された点雲で訓練された注意に基づくネットワークを通して、欠落した幾何学を完成させる。
臨床的に検証された解剖学的忠実度を保ちながら,再建指標の最先端性を実現する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:31:41 GMT)
Degradation-Agnostic Statistical Facial Feature Transformation for Blind Face Restoration in Adverse Weather Conditions [2.0] 逆の天気は画像の品質を著しく低下させ、それによって認識精度が低下する。
本稿では,局所統計的顔特徴変換 (SFFT) と劣化非依存特徴埋め込み (DAFE) の2つの重要な要素を統合した新しいGANベースのブラインドFIRフレームワークを提案する。
実験により, 従来のFIR法よりも優れた劣化非依存型SFFTモデルが得られた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:37:36 GMT)
The Role of AI in Facilitating Interdisciplinary Collaboration: Evidence from AlphaFold [1.9] 本研究では,AI技術が学際的協調パターンにどのように影響するかを検討する。
1,247のAlphaFold関連論文と7700の著者をスコパスから分析し,文献分析と因果推論を用いた。
我々はAlphaFoldが構造生物学とコンピュータ科学のコラボレーションをわずか0.48%増加させ、他の分野に測定可能な影響を与えなかったことを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:31:03 GMT)
Quiet Feature Learning in Algorithmic Tasks [1.9] トランスフォーマーベースの言語モデルを10の基本的なアルゴリズムタスクで訓練する。
従来のパワールールスケーリングの傾向から逸脱した損失曲線における顕著な位相遷移を観察する。
モデルの内部表現を探索すると、タスクの損失が減少する前に静かな特徴が学習されることが分かる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:57:07 GMT)
FLARE: Fast Low-rank Attention Routing Engine [1.9] Fast Low-rank Attention Engine (FLARE) は、固定長の待ち行列を通して注意を誘導する線形複雑自己注意機構である。
FLAREは前例のない問題のサイズにスケールするだけでなく、最先端のニューラルPDEサロゲートよりも精度が高い。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:00:55 GMT)
Error exponents of quantum state discrimination with composite correlated hypotheses [1.8] 2組の量子状態間の量子仮説試験における誤差指数について検討する。
量子ホーフディングの発散と反発散の2つの自然な拡張を量子状態の集合に導入し比較する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:04:06 GMT)
Personas within Parameters: Fine-Tuning Small Language Models with Low-Rank Adapters to Mimic User Behaviors [1.8] 正確なレコメンデーションモデルを開発する上での長年の課題は、主にユーザインタラクションの複雑な性質のために、ユーザの振る舞いをシミュレートすることである。
本研究では, 凍結したLarge Language Models (LLMs) を用いてロバストなユーザ表現を抽出し, 微調整小言語モデル (SLMs) を用いたコスト効率, 資源効率のよいユーザエージェントをシミュレートする手法を提案する。
提案手法の有効性を実証し,本手法を用いて開発したユーザエージェントが,オフラインメトリクスとレコメンデータシステムの実環境性能のギャップを埋める可能性を示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:14:57 GMT)
Measuring Stereotype and Deviation Biases in Large Language Models [1.8] 大規模言語モデル(LLM)は多様なドメインに広く適用されており、その制限や潜在的なリスクに対する懸念を提起している。
本研究では, LLMが示す2種類のバイアス, ステレオタイプバイアスと偏差バイアスについて検討した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:38:45 GMT)
CLoE: Curriculum Learning on Endoscopic Images for Robust MES Classification [1.8] 潰瘍性大腸炎の評価には内視鏡像からの重症度の推定が不可欠である。
ラベル信頼性と順序構造の両方を考慮したカリキュラム学習フレームワークであるCLoEを提案する。
LIMUCとHyperKvasirデータセットの実験では、CNNとTransformerの両方を使用して、CLoEが一貫してパフォーマンスを改善していることを示している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:00:28 GMT)
Outlier Detection of Poisson-Distributed Targets Using a Seabed Sensor Network [1.8] 本稿では,海洋環境における空間的コミッショナーアウトリーの分類と検出のための枠組みを提案する。
目標到達を通常のプロセスと外れ値の混合としてモデル化することにより、新たに観測された事象が外れ値である確率を推定する。
正規強度関数の平均と分散の両方を組み込んだこの確率の2次近似を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:08:09 GMT)
Fully Automated Segmentation of Fiber Bundles in Anatomic Tracing Data [1.7] マカクトレーサデータにおけるファイババンドルセグメンテーションのための合理化完全に自動化されたフレームワークを提案する。
提案手法では,端末をバンドルとして誤ラベルするなどの一般的なエラーを排除し,スパースバンドルの検出を20%以上改善し,FDR(False Discovery Rate)を40%削減する。
この新たなフレームワークは、大規模な解剖学的トレースデータの自動解析を容易にし、dMRIトラクトグラフィー手法の検証と最適化に使用できる、より基礎的なデータを生成する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:17:24 GMT)
Multilingual hierarchical classification of job advertisements for job vacancy statistics [1.7] 本研究の目的は,オンライン求人広告のための多言語分類器を開発することである。
職業の階層構造を組み込むことで,予測精度が1-2ポイント向上することを示す。
クローズドおよびオープンソースソフトウェアを用いて翻訳されたデータに基づいてバイリンガル(ポーランド語と英語)とマルチリンガル(24言語)モデルを開発する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:47:56 GMT)
Contemplative Artificial Intelligence [1.7] 我々は、AIシステムにレジリエントなWise World Modelを組み込むことができる4つの公理原理を示す。
第一にマインドフルネスは、創発的なサブゴールの自己監視と再調整を可能にする。
第二に、空の森は犬のゴールを固定し、厳格な事前を緩和する。
第三に、非二重性は敵の自己他の境界を解消する。
第4に、無制限のケアは、苦しみの普遍的な減少を動機づける。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:09:08 GMT)
Quantformer: from attention to profit with a quantitative transformer trading strategy [1.6] 本稿では,トランスをベースとした拡張ニューラルネットワークアーキテクチャであるQuantformerを導入して,投資要因を構築する。
この研究は2010年から2023年にかけて、中国資本市場における4,601株の5000,000以上の転がるデータを集めている。
本研究は,他の100因子量的戦略と比較して,株価トレンド予測におけるモデルの性能が優れていることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:06:23 GMT)
MambaFlow: A Mamba-Centric Architecture for End-to-End Optical Flow Estimation [1.6] MambaFlowは,Mambaアーキテクチャの高精度かつ効率性を生かして,局所的に相関する特徴を抽出する新しいフレームワークである。
MambaFlowはSintelベンチマークで高い精度を実現し、リソース制約のあるデバイスへの現実的なデプロイの可能性を強く示している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:53:39 GMT)
Eyes on the Image: Gaze Supervised Multimodal Learning for Chest X-ray Diagnosis and Report Generation [1.5] 胸部X線による疾患分類と地域別放射線診断レポートの作成を促進するための2段階フレームワークを提案する。
第一段階では、疾患分類のための視線誘導型コントラスト学習アーキテクチャを導入する。
第2段階では,信頼度重み付き診断キーワードを抽出するモジュールレポート生成パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:42:29 GMT)
From Classical Probabilistic Latent Variable Models to Modern Generative AI: A Unified Perspective [1.5] 生成人工知能(AI)は、現在最先端のシステムを支える。
様々なアーキテクチャにもかかわらず、多くの人が確率的潜在変数モデル(PLVM)の共通基盤を共有している。
本稿では,PLVMパラダイム内での古典的手法と近代的手法の融合による統一的な視点を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:02:32 GMT)
Unfolded Laplacian Spectral Embedding: A Theoretically Grounded Approach to Dynamic Network Representation [1.5] 典型的なアプローチは、重要な安定性特性を満たすことに依存する時間変化ノードの埋め込みを学習することである。
正規化ラプラシアンに対してアンフォールド隣接スペクトル埋め込みフレームワークを拡張する新しい手法であるアンフォールドラプラシアンスペクトル埋め込みを提案する。
ボーナスとして、埋め込みと基礎となる動的グラフのコンダクタンスを結びつけるチーガー型不等式を確立する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:13:53 GMT)
Evaluating the Quality of Open Building Datasets for Mapping Urban Inequality: A Comparative Analysis Across 5 Cities [1.5] 本研究では、OpenStreetMap(OSM)データに対して、GoogleとMicrosoftが生成したAI生成のOpen Buildingデータセットの品質とバイアスを評価する。
その結果、ヒューストンとベルリンは高いアライメントと完全性を示した。
分析されたデータセットにはギャップがあり、AccraやCaracasのような都市は表現が不足している可能性がある。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:14:57 GMT)
From SALAMANDRA to SALAMANDRATA: BSC Submission for WMT25 General Machine Translation Shared Task [1.4] SALAMANDRA LLMを改良し、38のヨーロッパ言語に対する翻訳関連タスクにおいて高い性能を達成するよう特別に訓練した。
デコーディングには,最小ベイズリスクデコーディングとチューニングされたリグレードという,品質に配慮した2つの戦略を採用しました。
私たちは2B版と7B版のSaramanDRATAと新しいSaramanDRATA-V2モデルをHugging Face1で公開しています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:48:35 GMT)
Beat-Based Rhythm Quantization of MIDI Performances [1.4] 本稿では、スコアとパフォーマンスデータを統一トークン表現に変換するビートベースの前処理手法を提案する。
我々のモデルはMUSTER測定値に基づく最先端性能を上回る。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:07:20 GMT)
Stochastic inflation as an open quantum system [1.4] 我々は、Starobinskyのインフレーションを、短波長モードが長波長モードの環境として機能するオープン量子システムとして再解釈する。
ド・ジッターの偏差を含む還元密度行列の有効理論を導出する。
我々は形式主義をグローバル・ド・ジッターに拡張し、関連するフォッカー・プランク方程式は平衡解を欠いている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:10:08 GMT)
Mining Mental Health Signals: A Comparative Study of Four Machine Learning Methods for Depression Detection from Social Media Posts in Sorani Kurdish [1.3] うつ病は一般的な精神状態であり、絶望、関心の喪失、自傷、自殺に至る。
ソーシャルメディアの普及に伴い、ユーザーはオンライン上で感情を表現し、テキスト分析による新たな発見機会を提供するようになった。
この研究は、Sorani Kurdishのツイートで抑うつを検出するために、機械学習と自然言語処理(NLP)アプローチを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:27:31 GMT)
CLAIRE-DSA: Fluoroscopic Image Classification for Quality Assurance of Computer Vision Pipelines in Acute Ischemic Stroke [1.3] CLAIRE-DSAは、急性虚血性脳梗塞(AIS)に対する機械的血栓摘出術(MT)中に獲得した最小強度投射(MinIP)における重要な画像特性の分類を目的としたフレームワークである。
CLAIRE-DSAはトレーニング済みのResNetバックボーンモデルを使用し、9つの画像特性(コントラスト、投影角、モーションアーティファクトの重症度など)を予測するように微調整されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:28:58 GMT)
V-RoAst: Visual Road Assessment. Can VLM be a Road Safety Assessor Using the iRAP Standard? [1.3] 道路安全評価は、特に低所得国・中所得国(LMICs)では、重要だが費用がかかる
従来の手法では、専門家のアノテーションとトレーニングデータが必要であるが、教師付き学習ベースのアプローチでは、地域をまたいだ一般化が困難である。
道路安全属性を分類するために視覚言語モデル (VLM) を用いたゼロショット視覚質問応答フレームワークである textitV-RoAst を導入する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:32:38 GMT)
A Dual-Attention Graph Network for fMRI Data Classification [1.3] 本稿では,自閉症スペクトラム障害(ASD)の診断に動的グラフ作成と注意機構を活用するフレームワークを提案する。
本研究のアプローチは、トランスフォーマーに基づく注意機構を用いて、各時間間隔で機能的脳接続を動的に推論する。
我々のモデルは63.2の精度と60.0のAUCを達成し、グラフ静的アプローチより優れている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:23:18 GMT)
All-mechanical coherence protection and fast control of a spin qubit [1.2] フォノン量子ネットワークでは、量子情報は固体スピンによって定義された定常ノードに格納され、処理される。
超高速量子制御が可能な記録高Rabi周波数が800MHzに達することを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:47:44 GMT)
Leveraging Large Language Models for Predictive Analysis of Human Misery [1.2] 本研究では,Large Language Models (LLMs) を用いて,人間に知覚された悲惨なスコアを予測する。
我々は、ゼロショット、固定コンテキスト、検索に基づくプロンプトを含む複数のプロンプト戦略を評価する。
静的評価を超えて,テレビフォーマットに触発された新たなゲーム化フレームワークである"Misery Game Show"を導入する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:02:59 GMT)
Scaling Multi-Agent Epistemic Planning through GNN-Derived Heuristics [1.2] マルチエージェント・エピステミック・プランニング(Multi-agent Epistemic Planning、MEP)は、物理的世界とエージェントの信念の両方を推論するための自律的な計画フレームワークである。
MEPでは、状態はKripke構造、すなわち有向ラベル付きグラフとして表現する必要がある。
我々は、グラフニューラルネットワーク(GNN)を用いて、てんかん状態内のパターンや関係構造を学習し、計画プロセスの導出を行う。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:26:20 GMT)
AI Agents for Photonic Integrated Circuit Design Automation [1.2] Photonics Intelligent Design and Optimization (PhIDO)は、自然言語のフォトニック集積回路(PIC)設計要求をレイアウトマスクファイルに変換するフレームワークである。
単一デバイスから112コンポーネントのPICまでの102の設計記述をテストベンチで比較した。
15コンポーネント以下の設計クエリでは、o1、Gemini-2.5-pro、Claude Opus 4が57%の最高エンドツーエンドパス@5成功率を達成した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:20:32 GMT)
Efficient and Verifiable Privacy-Preserving Convolutional Computation for CNN Inference with Untrusted Clouds [1.2] 本稿では,CNN畳み込み層に適したプライバシー保護手法を提案する。
提案方式は,効率的な暗号化と復号化を可能にし,リソース制約のあるクライアントが信頼できないクラウドサーバにセキュアに計算をオフロードできるようにする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:17:53 GMT)
Investigating the importance of county-level characteristics in opioid-related mortality across the United States [1.1] 本研究は, オピオイド関連死亡率と, 人口特性, 経済安定性, インフラストラクチャーに関連する13の郡レベル特性の相関について検討した。
以上の結果から,オピオイド関連死亡と強く相関する地域特性が示唆された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:56:22 GMT)
G$^2$RPO-A: Guided Group Relative Policy Optimization with Adaptive Guidance [1.1] 転がり軌道に地道推論ステップを注入するガイドGRPOについて検討する。
率直にガイダンスを追加することで、利益が制限されることに気付きました。
数学的推論とコード生成ベンチマークの実験により、G$2$RPO-AがバニラGRPOを大幅に上回っていることが確認された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:41:16 GMT)
ONG: One-Shot NMF-based Gradient Masking for Efficient Model Sparsification [1.0] Deep Neural Networks(DNN)は目覚ましい成功を収めているが、その大きなサイズはデプロイメント上の課題を引き起こす。
そこで本研究では,Non- negative Matrix Factorization (NMF) を用いたトレーニング開始時のワンショットプルーニングにより,サレントウェイト構造を同定する新しいスペーシフィケーション戦略であるONGを紹介する。
ONGは厳密な勾配マスキング機構を採用し、未切断重量のみが更新されることを保証し、トレーニングフェーズを通してターゲットの空間を厳密に保存する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:46:05 GMT)
Learning local and global prototypes with optimal transport for unsupervised anomaly detection and localization [1.0] 教師なし異常検出は、トレーニング中に正常なデータ、すなわち欠陥のない一連のデータにアクセスすることで、サンプルの欠陥部分を検出することを目的としている。
本稿では,プロトタイプ学習に基づく新しいUAD手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:51:36 GMT)
Language-Guided Multi-Agent Learning in Simulations: A Unified Framework and Evaluation [1.0] 本稿では,大規模言語モデル(LLM)をマルチエージェント強化学習(MARL)に組み込んだ統合フレームワークを提案する。
フレームワークにはCoordinator、Communicator、Memoryの3つのモジュールコンポーネントがあり、サブゴールを動的に生成する。
Google Research Football、Magent Battle、StarCraft IIで評価されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:30:32 GMT)
Synchronization and semantization in deep spiking networks [0.9] 近年の研究では、スパイキングネットワークは、誤り訂正塑性によって複雑な機能を学べることが示されているが、結果として生じる構造や力学はいまだに研究されていない。
スパイク時間符号化を用いた視覚入力分類において,視覚階層の概念的類似として多層スパイキングネットワークを訓練する。
学習後, 異なる時間的活動パターンの発達を観察し, 入力パターンは構築によって同期するが, 初期層の活動は時間とともに拡散し, クラスが徐々に抽出されるにつれて, 鋭いパルスに再収束する。
同期性の出現は徐々に異なる経路の形成を伴い、段階的なセマント化を反映する
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:51:58 GMT)
Teaching Introduction to Programming in the times of AI: A case study of a course re-design [0.9] 近年、AIツールのプログラミング教育への統合がますます広まりつつある。
本稿では、プログラミング、特に入門コースの文脈において、プログラミングの教育と学習に利用できる最先端のAIツールについてレビューする。
コース設計、学習目標、コース提供、形式的・要約的評価の課題と、学生によるそのようなツールの誤用を強調します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:37:51 GMT)
Deliberate Planning in Language Models with Symbolic Representation [0.9] 構造化計画機能を備えた言語モデルを備えた新しいフレームワークであるSymPlannerを紹介する。
SymPlannerは、ポリシーモデルがアクションを提案し、象徴的な環境が決定論的にそれらの効果を実行し検証する、象徴的な状態空間における計画プロセスの基盤となる。
我々はPlan Bench上でSymPlannerを評価し、純粋な自然言語ベースラインよりも一貫性があり、多様性があり、検証可能なプランを生成することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:52:48 GMT)
A self-supervised learning approach for denoising autoregressive models with additive noise: finite and infinite variance cases [0.9] 応用においては、自己回帰信号は加法雑音によってしばしば破損する。
本稿では,付加的な雑音崩壊型自己回帰モデルを示す自己教師型学習手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:46:56 GMT)
High-Fidelity And Complex Test Data Generation For Real-World SQL Code Generation Services [0.9] 高忠実度テストデータの需要は、生産データへのアクセスがほとんど制限されている産業環境で最重要である。
従来のデータ生成手法は、しばしば不足し、低忠実さと複雑なデータ構造をモデル化する能力に悩まされる。
我々は、LLM(Large Language Models)を活用し、戦略的事前処理と後処理のステップを取り入れることで、現実的な高忠実性テストデータを生成することを実証した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:11:48 GMT)
Scalable Optical Quantum State Synthesizer with Dual-Mode Resonator Memory [0.9] 我々は、共振器ベースの量子メモリを用いて、光学的非ガウス状態を生成するスケーラブルな方法を示す。
時間領域多重化手法を用いることで,猫とゴッテマン・キタエフ・プレスキルの育種プロトコルの実証に成功した。
これらの結果は、フォールトトレラント光量子コンピューティングに必要な複雑な非ガウス状態を生成するためのスケーラブルな経路を確立する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 06:10:14 GMT)
Argos: A Decentralized Federated System for Detection of Traffic Signs in CAVs [0.9] 本研究では,車載ネットワーク上での交通信号検出に適した分散化・フェデレート学習フレームワークを提案する。
このフレームワークは、軽量物体検出器を用いた特別なローカルトレーニングのために、車両間でトラフィックサインクラスを分割した。
このフェデレートされたアプローチは、現実世界の車両配備にスケーラブルでプライバシ保護のソリューションを提供する可能性があると結論付けています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:22:57 GMT)
Active contours driven by local and global intensity fitting energy with application to SAR image segmentation and its fast solvers [0.9] 提案したモデルを,近接項を追加して古典的ROFモデルに変換する。
最近、Jia-Zhaoによって提案された高速デノシングアルゴリズムに着想を得て、SAR画像分割問題の解法として2つの高速固定点アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:04:42 GMT)
A locally statistical active contour model for SAR image segmentation can be solved by denoising algorithms [0.9] I-divergence-TV denoisingモデルに基づく局所統計的変動型アクティブな輪郭モデルを提案する。
最近,Jia-Zhaoによって提案された高速復調アルゴリズムに着想を得て,SAR画像分割問題の解法として2つの高速固定点アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:10:43 GMT)
Data-driven particle dynamics: Structure-preserving coarse-graining for emergent behavior in non-equilibrium systems [0.9] 短周期スケールは創発的なバルク物理学と適切に結び付けられなければならないため、マルチスケールシステムはシミュレートが難しいことが知られている。
熱力学の第一法則と第二法則の離散的な概念を保存したメチトレクティックブラケット形式を用いた枠組みを提案する。
我々はPyTorchとLAMMPSの両方でオープンソース実装を提供し、様々な粒子ベースシステムへの大規模推論と再配置を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:10:18 GMT)
Matrix-Driven Instant Review: Confident Detection and Reconstruction of LLM Plagiarism on PC [0.9] 大きな言語モデル(LLM)のプラジャアライズは、オリジナルの開発者にとって大きな経済的、評判の害をもたらす可能性がある。
本研究では,大規模言語モデルにおける盗作検出手法であるMDIR(Matrix-Driven Instant Review)を提案する。
MDIRは、重み関係の正確な再構築を実現し、厳密な$p$値の推定を提供し、完全なモデル推論を必要とせず、重量類似性にのみ焦点をあてる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:50:10 GMT)
Towards Unified Multimodal Financial Forecasting: Integrating Sentiment Embeddings and Market Indicators via Cross-Modal Attention [0.9] STONKは、毎日の株価変動予測を改善するために、感情に富んだニュース埋め込みと数値市場指標を統合するためのフレームワークである。
バックテストでは、STONKは数値のみのベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:22:39 GMT)
Early Detection of Pancreatic Cancer Using Multimodal Learning on Electronic Health Records [0.8] 膵管腺癌(PDAC)は最も致命的ながんの1つである。
早期発見は依然として大きな臨床課題である。
約4,700人の患者を対象とした実世界のデータセットの開発と評価を行った。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:48:23 GMT)
Advancing AI-Scientist Understanding: Multi-Agent LLMs with Interpretable Physics Reasoning [0.7] 大規模言語モデル(LLM)は、記号操作、数値計算、科学的推論の支援によって物理学研究においてますます重要な役割を担っている。
我々は,3つの重要なモジュールを通じてAIと人間科学者の協調を促進する,新しい多エージェントLLM物理学者フレームワークを導入する。
ケーススタディでは,本手法が解釈可能性を大幅に向上し,体系的な検証が可能となり,物理問題解決と発見における人間とAIの連携が向上することを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:28:27 GMT)
InnerGS: Internal Scenes Rendering via Factorized 3D Gaussian Splatting [0.7] 内部のシーンは、オブジェクトの内部の深い理解を必要とするアプリケーションにとって不可欠である。
本モデルでは,スライスしたスライスデータからスムーズで詳細な内部構造を効果的に再構築する。
我々のアプローチは、カメラのポーズの必要性を排除し、プラグアンドプレイであり、本質的にあらゆるデータモダリティと互換性がある。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:04:36 GMT)
Decoding Communications with Partial Information [0.7] 機械語習得は、しばしば模倣学習の問題として提示される。
本稿では,学習者がすべての関連情報を見ると仮定した仮定を緩和することを検討する。
学習に基づくアルゴリズムが提示され、プライベート情報の復号化を行い、言語習得を容易にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:19:16 GMT)
[Social] Allostasis: Or, How I Learned To Stop Worrying and Love The Noise [0.7] 本稿では、アロスタティックおよび社会的アロスタティックな規制の計算モデルを定式化する。
環境と社会的相互作用の両方から情報をエンコードするために、コルチゾールやオキシトシンのようなホルモンに類似した生理的なシグナル伝達体を用いる。
その結果、アロスタティックおよび社会的アロスタティックな規制により、エージェントは「環境・社会騒音」を適応的再構成に活用できることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:06:33 GMT)
DIT: Dimension Reduction View on Optimal NFT Rarity Meters [0.6] 非偽造トークン(NFT)は重要なデジタル資産クラスとなり、それぞれがアートワークのような仮想エンティティを独自に表現している。
NFTsの値は、希薄性を定義する特徴に密接に結びついており、希薄性を定量化することへの関心が高まっている。
本稿では,レアリティ設計における次元削減手法について検討し,新しい性能指標と測定値を導入し,ROARベンチマークを用いて評価する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:11:00 GMT)
Cyber Risks to Next-Gen Brain-Computer Interfaces: Analysis and Recommendations [0.6] 脳-コンピュータインタフェース(BCI)は、パーソナライズされた医療を前進させる大きな可能性を秘めている。
BCIはまた、サイバー攻撃やセキュリティの妥協のための新たな手段も導入している。
この記事では、デバイスメーカーがデバイスをよりセキュアにすることを推奨する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:12:45 GMT)
Fibonacci-Modulation-Induced Multiple Topological Anderson Insulators [0.6] トポロジカルアンダーソン絶縁体(TAI)は、乱れた系におけるトポロジカル相転移のメカニズムを提供する。
本研究では、フィボナッチ変調を受ける一次元スピン軌道結合(SOC)鎖における複数のTAIの出現について検討する。
このモデルは運動量空間格子内のボース・アインシュタイン凝縮体を用いて実験的に実現できる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:54:31 GMT)
Hierarchical Evaluation Function (HEF): A Multi-Metric Approach for Optimizing Demand Forecasting Models [0.6] この研究は、絶対誤差の最小化に重点を置いたFMAEと、グローバルメトリクスの重み付けと大きな偏差のペナルティ化を目的としたHEFの2つのカスタム評価関数を比較した。
その結果、HEFはFMAEを世界規模で一貫して上回り、モデルの堅牢性と説明力を高めている。
動的環境における予測モデルの最適化のためのフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:25:49 GMT)
FedUNet: A Lightweight Additive U-Net Module for Federated Learning with Heterogeneous Models [0.6] フェデレートラーニング(FL)は、ローカルデータを共有せずに、分散モデルトレーニングを可能にする。
本稿では,U-Netにインスパイアされた付加モジュールを各クライアントのバックボーンにアタッチする,軽量なFLフレームワークであるFedUNetを提案する。
VGGの変種を用いた実験では、FedUNetは93.11%の精度と92.68%のコンパクト化を実現している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:03:06 GMT)
TopoMortar: A dataset to evaluate image segmentation methods focused on topology accuracy [0.6] TopoMortarは、トポロジーに焦点を当てた画像セグメンテーション手法を評価するために特別に設計された最初のデータセットである。
TopoMortar 上で clDice が最も位相的に正確なセグメンテーションを達成したことを示す。
また,データ拡張と自己蒸留によりクロスエントロピーDice損失が増加し,ほとんどのトポロジ損失関数を超えることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:23:11 GMT)
Designing an Interdisciplinary Artificial Intelligence Curriculum for Engineering: Evaluation and Insights from Experts [0.6] 本研究では、異なる利害関係者のレンズによる学際的カリキュラム開発について考察する。
この研究は、定量的なカリキュラムマッピングと質的なフォーカスグループインタビューを組み合わせた混合手法を用いている。
この知見は、学際的AIカリキュラム開発の結果を実践的に理解し、カリキュラム開発における教育者の参加が品質面の認知にどのように影響するかを広く理解するのに役立つ。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:20:05 GMT)
Towards Reliable Multi-Agent Systems for Marketing Applications via Reflection, Memory, and Planning [0.6] 我々はRAMPと呼ばれるフレームワークを導入し、反復的に計画し、ツールを呼び出し、アウトプットを検証し、生成したオーディエンスの品質を改善するための提案を生成する。
我々は、クライアント固有の事実と過去のクエリの知識ベースである長期記憶ストアにモデルを装備する。
全体として、88個の評価クエリに対して、精度を28ポイント向上するLSM計画とメモリの使用を実証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:18:05 GMT)
Training Machine Learning Models on Human Spatio-temporal Mobility Data: An Experimental Study [Experiment Paper] [0.5] 個人レベルの人体移動予測は、感染症のモニタリング、子供、高齢者のケアへの応用に関する重要な研究のトピックとして浮上している。
機械学習モデルをトレーニングするためのベストプラクティスを決定すること。
意味情報を明示的に含めることで、モデルが生活の個々のパターンをよりよく理解し、予測を改善することができることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:49:10 GMT)
Bayesian Optimization-based Search for Agent Control in Automated Game Testing [0.5] この研究は、ゲームレベルの潜在的なバグを検出するために、エージェントがゲームキャラクタを制御する自動テスト手法を導入する。
これまでに収集したデータを解析して次のサンプリングポイントを決定し、情報取得を最大化するデータポイントを算出する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:24:46 GMT)
From Transthoracic to Transesophageal: Cross-Modality Generation using LoRA Diffusion [0.5] 深部拡散モデルは、現実的な画像合成において優れているが、大きなトレーニングセットを必要とする。
TEEは、このハイインパクトなモダリティにおいて、ディープラーニングの到達範囲を制限し、批判的に不足している。
TTEをトレーニングしたマスク条件の拡散バックボーンをTEEに適合させるには,新しい症例が限られただけであり,パラメータが105ドル以下である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:48:53 GMT)
The Application of Transformer-Based Models for Predicting Consequences of Cyber Attacks [0.5] 脅威モデリング(Threat Modeling)は、サイバーセキュリティの専門家に重要なサポートを提供し、タイムリーに行動し、他の場所で使用可能なリソースを割り当てることを可能にする。
近年,攻撃記述の評価やサイバー攻撃の今後の結果を予測するための自動手法の必要性が高まっている。
本研究では,NLP(Natural Language Processing)とディープラーニング(Deep Learning)がサイバー攻撃の潜在的影響を分析するためにどのように応用できるかを検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:46:36 GMT)
Graybox characterization and calibration with finite-shot estimation on superconducting-qubit experiments [0.4] 我々は、既知の力学を記述する明示的な(ホワイトボックス)モデルと、深いニューラルネットワークの形で雑音のダイナミクスを記述する暗黙的な(ブラックボックス)モデルを記述する。
選択したパルスのセットをデバイスに送り、パウリ期待値を測定することで、Grayboxアプローチは暗黙のモデルをトレーニングし、ゲートを最適化することができる。
デバイス上の最適化ゲートと2種類の損失関数を持つクロステスト予測モデルをベンチマークする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:04:48 GMT)
DDD-GenDT: Dynamic Data-driven Generative Digital Twin Framework [0.4] デジタルツイン(DT)技術は、物理システムのリアルタイムシミュレーション、予測、最適化を可能にする。
この記事では、動的データ駆動型アプリケーションシステムパラダイムに基づく動的データ駆動型ディジタルツインフレームワークであるDDD-GenDTを紹介します。
生成AIを活用することにより、DDD-GenDTは、広範な履歴データセットへの依存を低減し、データスカース設定でのDT構築を可能にする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:07:07 GMT)
Convergence analysis of online algorithms for vector-valued kernel regression [0.4] 回帰関数 $f_mu:, Omega to Y$ from noisy $mu$-distributed vector-valued data。
標準正規化オンライン近似アルゴリズムにより得られた近似値$f(m) in H$のRKHSノルムの2乗誤差を推定する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:05:19 GMT)
Per-element Secure Aggregation against Data Reconstruction Attacks in Federated Learning [0.4] フェデレートラーニング(FL)は、生データを共有せずに協調的なモデルトレーニングを可能にするが、個々のモデル更新は機密情報を漏洩させる可能性がある。
セキュアアグリゲーション(SecAgg)は、サーバがクライアント更新の総和だけにアクセスできるようにすることで、このリスクを軽減する。
モデル更新がスパースベクターである場合には、与えられたインデックスで単一のクライアントによって提供されたゼロでない値を、アグリゲートで直接明らかにすることができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:59:44 GMT)
Hallucinations in medical devices [0.4] 我々は,幻覚を,手作業に影響を及ぼすか,あるいは不明瞭であるような誤りの一種として示す,実用的で普遍的な定義を導入する。
この定義は、製品分野の幻覚に苦しむ医療機器の評価を容易にすることを目的としている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:31:55 GMT)
Beyond Ethical Alignment: Evaluating LLMs as Artificial Moral Assistants [0.4] 近年の大規模言語モデル(LLM)の普及は、その道徳的能力に対する懸念を招いている。
本稿では,人工モラルアシスタント(AMA)として機能する能力について検討する。
我々は、AMAとしての資格は、最先端のアライメント技術が達成しようとしているもの以上のものが必要であると主張している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:28:55 GMT)
Quantum Phase Estimation Beyond the Gaussian Limit [0.3] 標準量子限界を超える重要なマイルストーンは、ガウス境界を超えている。
ある種の非ガウス状態はこのガウス境界を中間エネルギー範囲内で上回ることができる。
この研究は非ガウス性や非対称性の基本的な影響に光を当てる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:03:28 GMT)
A Hybrid Surrogate for Electric Vehicle Parameter Estimation and Power Consumption via Physics-Informed Neural Operators [0.3] 電気自動車のパラメータ推定と電力消費のためのハイブリッドサロゲートモデルを提案する。
速度と加速度だけで、時変モーターと再生ブレーキ効率を出力する。
我々はTesla Model 3、Tesla Model S、およびKia EV9の実際のログを評価した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:01:42 GMT)
SDEC: Semantic Deep Embedded Clustering [0.3] この作業では、教師なしのテキストクラスタリングフレームワークであるSemantic Deep Embedded Clustering (SDEC)を提示する。
SDECは、自動エンコーダ内でMean Squared Error(MSE)とCosine similarity Loss(CSL)を組み合わせることで、データ再構成中の意味関係を保存する。
このフレームワークはAG Newsで85.7%のクラスタリング精度で既存の手法を上回り、Yahoo!で53.63%の新しいベンチマークを設定した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:08:35 GMT)
A Cost-Effective Framework for Predicting Parking Availability Using Geospatial Data and Machine Learning [0.3] 学生は授業の時間帯に空き場所を迅速かつ便利に見つける必要がある。
本稿では,街路地図,モビリティ,気象データなど,複数のデータソースを統合するスマートフレームワークを提案する。
このフレームワークは、予定の駐車場と時間を使って、適切な駐車場を指定する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:24:19 GMT)
A polynomial formula for the perspective four points problem [0.3] 視点$n$-points問題に対する高速かつ正確な解を提示する。
私たちのソリューションは、最先端のアルゴリズムよりも桁違いに高速です。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:37:42 GMT)
Doğal Dil İşlemede Tokenizasyon Standartları ve Ölçümü: Türkçe Üzerinden Büyük Dil Modellerinin Karşılaştırmalı Analizi [0.3] 本研究では,トルコ語などの形態学的に豊かな低リソース言語に特有なトークン化問題に対処する新たな評価フレームワークを提案する。
我々は,語彙サイズ,トークン数,処理時間,言語固有のトークンパーセンテージ(%TR),トークン純度(%Pure)に基づいてトークン化器の評価を行った。
分析の結果,言語固有のトークンパーセンテージは,トークン純度よりも下流のパフォーマンス(MMLUスコアなど)との相関が強いことが明らかとなった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:26:42 GMT)
Büyük Dil Modelleri için TR-MMLU Benchmarkı: Performans Değerlendirmesi, Zorluklar ve İyileştirme Fırsatları [0.3] TR-MMLUは、トルコの大規模言語モデル(LLM)の言語的および概念的能力を評価するためのフレームワークである。
トルコの教育システム内の62のセクションにまたがる6,200の多重選択質問からなるデータセットに基づいている。
TR-MMLUはトルコのNLP研究を推進し、将来のイノベーションを刺激する新しい標準を設定している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:00:43 GMT)
Quantum sensing of electron beams using solid-state spins [0.3] 電子ビームの量子センサとしてダイヤモンド中の負電荷窒素空孔中心(NV-)を用いる。
我々は、磁気自由電子-量子相互作用のリンドブラッドマスター方程式を記述し、スピン緩和法を相互作用の感度プローブとして同定する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:19:12 GMT)
An Explainable AI based approach for Monitoring Animal Health [0.3] 牛の健康をモニタリングし、収穫を最適化することは、農場ですべての動物を追跡するのが困難であるため、乳製品農家が直面する重要な課題である。
本研究は、乳牛(牛)の活動と行動を説明する説明可能な機械学習(ML)手法に基づく、現代的なデータ駆動型農業の実践を紹介することを目的とする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:26:03 GMT)
A Lazy Resynthesis Approach for Simultaneous T Gate and Two-Qubit Gate Optimization of Quantum Circuits [0.3] T数削減のための最先端量子回路最適化(QCO)アルゴリズムは、しばしば2量子ゲート数(2Qカウント)を大幅に増加させる。
本稿では, クリフォード+T回路におけるTカウント最適化時に導入される2Qゲートのサージを著しく軽減する, 現代の卓上型QCO流に対する新しい遅延再合成手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:07:52 GMT)
Deep Positive-Negative Prototypes for Adversarially Robust Discriminative Prototypical Learning [0.2] 本稿では,Adv-DPNP(Adversarially Training Deep Positive-Negative Prototypes)という新しいフレームワークを提案する。
Adv-DPNPは、差別的プロトタイプベースの学習と敵対訓練を統合している。
以上の結果から,Adv-DPNPは重大度および汚職種別の平均精度が最も高いことを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:50:23 GMT)
Denoising by neural network for muzzle blast detection [0.2] Acoemは、マイクアレイと、戦場で射手を検出し、位置を特定するソフトウェアで構成される銃弾検出システムの開発を行っている。
このようなシステムの性能は、動作中の音響環境の影響を受けやすい。
音響環境の影響を抑えるため,ニューラルネットワークが開発された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:05:45 GMT)
Semi-Supervised Anomaly Detection Pipeline for SOZ Localization Using Ictal-Related Chirp [0.2] チャープ現象の時間周波数解析は、統計的に異常なチャネルを特定するために用いられる。
LOFベースのアプローチは、SOZのローカライゼーションにおいて、インデックスマッチング(チャネル近接による重み付け)が正確なマッチングよりも優れているような、アウトリーチを効果的に検出する。
重要なポイントは、チャープベースの外れ値検出と重み付き空間メトリクスを組み合わせることで、SOZローカライゼーションの相補的な方法が提供されることである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:54:59 GMT)
jXBW: Fast Substructure Search in Large-Scale JSONL Datasets for Foundation Model Applications [0.2] 大規模Linesデータセットのサブ構造探索を高速化するjXBWを提案する。
i) 複数のオブジェクトをマージし,個々のIDを保存しながら木を結合したツリー表現,(ii)eXtended Burrows-Wheeler変換に基づく簡潔なデータ構造,(iii)効率的な3段階構造探索アルゴリズム。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:14:24 GMT)
REVEAL -- Reasoning and Evaluation of Visual Evidence through Aligned Language [0.1] 我々は、この偽造検出の問題を、大規模視覚言語モデルのセマンティックアライメント機能を活用して、プロンプト駆動型視覚推論タスクとして構成する。
本研究では, 画像全体の物理, セマンティクス, パースペクティブ, リアリズムに依存する全体的シーンレベル評価と, 画像を複数の領域に分割して解析する領域ワイド異常検出の2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:42:02 GMT)
Automated Cervical Cancer Detection through Visual Inspection with Acetic Acid in Resource-Poor Settings with Lightweight Deep Learning Models Deployed on an Android Device [0.1] 本稿では,関心領域(ROI)検出器としてEfficientDet-Lite3と,分類のためのMobileNet-V2ベースのモデルを含む,軽量なディープラーニングアルゴリズムを提案する。
これらのモデルはアンドロイドベースのデバイスにデプロイされ、遠隔操作が可能で、ほぼ瞬時に結果が得られる。
分類モデルは精度92.31%、感度98.24%、特異度88.37%である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:44:51 GMT)
Evaluating ASR robustness to spontaneous speech errors: A study of WhisperX using a Speech Error Database [0.1] サイモンフレーザー大学音声誤りデータベース(英語: Simon Fraser University Speech Error Database、SFUSED)は、言語学と精神言語学の研究のために開発された公開データ収集である。
SFUSEDは、自発的な英語音声からの音声誤りを体系的にアノテートし、それぞれの誤りを意図的および実際の誤り生成のためにタグ付けする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:30:33 GMT)
Generalization vs. Memorization in Autoregressive Deep Learning: Or, Examining Temporal Decay of Gradient Coherence [0.1] 本研究では, 自己回帰型PDEが, 多様な物理シナリオから得られる情報を同化・伝播する様子を特徴付けるために, 影響関数形式を適用した。
改良されたサロゲートの設計に関する実用的な洞察を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:29:34 GMT)
Text-to-SQL Oriented to the Process Mining Domain: A PT-EN Dataset for Query Translation [0.1] 本稿では,プロセスマイニング領域におけるテキスト・ツー・フォー・タスクのベンチマークデータセットであるtext-2--4-PMを紹介する。
データセットは、人為的なパラフレーズ、205sql文、および10の修飾子を含む1,655の自然言語発話からなる。
その結果,テキスト2--4-PMはテキスト・ツー・フォーの実装の評価をサポートし,セマンティック・パーシングや他の自然言語処理タスクに広く適用可能であることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:25:41 GMT)
Recipes for Pre-training LLMs with MXFP8 [0.1] 最大8Bパラメータを持つモデルを用いて,最大15Tトークンの高品質データセットに基づいてトレーニングを行った。
MXFP8-E4M3データ型と特定の数値変換アルゴリズムが,BF16で実施したデータと一致するトレーニングセッションを実現する方法を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:51:06 GMT)
Towards Multimodal Social Conversations with Robots: Using Vision-Language Models [0.0] 視覚言語モデルは、自律型社会ロボットにとって十分に一般的な方法で、この広い範囲の視覚情報を処理できると主張している。
技術的課題が残るこの状況にそれらをどう適応させるかを説明し、評価プラクティスを簡潔に議論する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:27:19 GMT)
Word Meanings in Transformer Language Models [0.0] 変換言語モデルにおいて,単語の意味がどのように表現されるかを検討する。
そこで我々は,RoBERTaベースのトークン埋め込み空間を抽出し,k平均で200クラスタにクラスタ化した。
トークン埋め込み空間内には,さまざまな意味情報がエンコードされている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:01:25 GMT)
VesselRW: Weakly Supervised Subcutaneous Vessel Segmentation via Learned Random Walk Propagation [0.0] 皮下血管の分節化に特化して設計された弱教師付きトレーニングフレームワークを提案する。
この方法は、センターライントレース、ドットマーカー、短いスクリブルといった、低コストでスパースなアノテーションを使用して学習プロセスをガイドする。
臨床皮下画像データセットを用いた実験により,本手法はナイーブなスパースラベルトレーニングと従来の擬似ラベル法の両方より一貫して優れていることが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:25:54 GMT)
Velocity correlations of vortices and rarefaction pulses in compressible planar quantum fluids [0.0] 圧縮可能な量子流体における2点速度相関を計算するための枠組みを提案する。
超流動励起の2つの重要なクラス、渦と希薄パルスに焦点をあてる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:49:56 GMT)
Universal on-chip polarization handling with deep photonic networks [0.0] 我々は、カスケードされたマッハ・ツェンダー干渉計の任意の機能を持つディープフォトニックネットワークのための新しい設計パラダイムを提案する。
広帯域な動作帯域で両偏光に対する干渉計アーム間の位相差を修正・訓練する。
ソフトウェア定義の物理インフォームドニューラルネットワークを用いて、3つの概念偏光処理装置を図示する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:53:38 GMT)
Transfer Learning for Neutrino Scattering: Domain Adaptation with GANs [0.0] 我々は、合成電荷電流(CC)ニュートリノ炭素包摂散乱データに基づいて訓練されたGANモデルで符号化された物理知識の抽出に転写学習を用いる。
また、異なるニュートリノ・核相互作用モデルから新しいデータが得られた場合、カスタムモデルを再最適化する際の転送学習の有効性を評価する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:08:13 GMT)
Towards an Approach for Evaluating the Impact of AI Standards The use case of entity resolution [0.0] 本論文は,エンティティ・リゾリューションに標準の評価をどのように適用できるかを概観するものである。
なぜなら、人や組織のようなエンティティの高品質なデータは、多くのAIシステムにとって不可欠だからです。
機械学習の手法という形でのAIの利用は、現代のニーズには当てはまらないアプローチであるため、ますます重要になっている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:42:26 GMT)
The path to a goal: Understanding soccer possessions via path signatures [0.0] 本稿では,パスシグネチャを利用して,その複雑な時間構造を符号化することにより,サッカー保有者の次の行動を予測する新しい枠組みを提案する。
提案手法は,様々な損失指標にまたがるトランスフォーマーベースのベンチマークより優れ,計算コストを大幅に削減する。
我々は2017/18シーズンのプレミアリーグシーズンの詳細な分析を通じてアプローチを検証するとともに、さらなる応用と今後の拡張について議論する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:54:22 GMT)
TCUQ: Single-Pass Uncertainty Quantification from Temporal Consistency with Streaming Conformal Calibration for TinyML [0.0] TCUQは、TinyMLをストリーミングするためのシングルパスでラベルなしの不確実性モニタである。
後部の光信号によって捉えた短地平線時間一貫性を変換する。
ストリーミングコンフォメーション層は、このスコアを予算付きアクセプション/アビスタンスルールに変換する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:12:14 GMT)
Systematic construction of asymptotic quantum many-body scar states and their relation to supersymmetric quantum mechanics [0.0] 量子多体散乱(AQMBS)状態を構築するための体系的手法を開発した。
AQMBS状態は量子多体散乱(QMBS)状態と密接に関連しているが、それらは重要な違いを示す。
我々の定式化は、QMBSと超対称性(SUSY)量子力学の関連を明らかにする。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:40:14 GMT)
Synthetic and cosmological axion hybridization: entangled photons, (HBT) and quantum beats [0.0] トポロジカル絶縁体やワイル半金属の合成軸、創発的集合励起が宇宙軸と混和していることが示される。
両軸索の最初の個体群は、ハイブリッド化によって他方の個体群を誘導する。
ダークマター・アクシオン凝縮物は、小さな振幅で合成・アクシオンの凝縮を誘導する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:18:39 GMT)
Symmetric orthogonalization and probabilistic weights in resource quantification [0.0] L'owdin symmetric orthogonalization (LSO) は、量子資源の特性化と定量化において広く使われているGram-Schmidt orthogonalization (GSO) よりも優れていることを示す。
また、L"owdin weights -- 非直交表現の確率的重みを導入し、リソース内容の一貫した測度を提供する。
理論的および数値解析により、LSOの量子状態対称性と資源特性の優れた保存性が確認された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:24:27 GMT)
Susceptibility Distortion Correction of Diffusion MRI with a single Phase-Encoding Direction [0.0] 本稿では,1回の取得のみを用いて,受容可能性歪みを補正するための深層学習に基づくアプローチを提案する。
実験結果から,提案手法はトップアップに匹敵する性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:56:03 GMT)
Structural Foundations for Leading Digit Laws: Beyond Probabilistic Mixtures [0.0] 本稿では,数値データにおける有意な数値分布の研究のための,現代的な決定論的枠組みについて述べる。
従来の確率的あるいは混合に基づく説明に頼るのではなく、先行桁の観測周波数がデータ生成過程の算術的、アルゴリズム的、構造的特性によって決定されることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:18:10 GMT)
Short-Term Forecasting of Energy Production and Consumption Using Extreme Learning Machine: A Comprehensive MIMO based ELM Approach [0.0] エクストリームラーニングマシン(mathtELM$)を用いた短期エネルギー予測手法を提案する。
複数のエネルギー源からコルシカ(フランス)で収集された6年間の時間的データを用いて、我々の手法は個々のエネルギー出力と総生産の両方を予測する。
このモデルでは、最大5時間前に高い精度を維持し、再生可能エネルギー源が揮発性になる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:37:54 GMT)
Sheffer Polynomials and the s-ordering of Exponential Boson Operators [0.0] S順序の概念は量子光学から始まり、正規、対称、反正規順序を仮定する。
S順序式は、シェファー配列のパラメトリックファミリーの助けを借りて導かれる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:05:40 GMT)
SNAP-UQ: Self-supervised Next-Activation Prediction for Single-Pass Uncertainty in TinyML [0.0] 我々は、TinyMLのシングルパスラベルなし不確実性手法である textbfSNAP-UQ を導入する。
int8ヘッドは、前者の圧縮されたビューから次の層の統計を予測します。
この設計では、一時バッファ、補助出口、または繰り返しフォワードパスを必要とせず、MCUデプロイメントに数キロバイトの追加しか必要としない。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:14:20 GMT)
Reliability, Embeddedness, and Agency: A Utility-Driven Mathematical Framework for Agent-Centric AI Adoption [0.0] 我々は,マルチステップタスクを実行するエージェント中心のAIシステムの採用を継続するための3つの公理を定式化する。
我々は、崩壊するノベルティ用語と成長するユーティリティ用語の和として、採用をモデル化する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:53:38 GMT)
Reduced Sampling Overhead for Probabilistic Error Cancellation by Pauli Error Propagation [0.0] 本稿では,従来の前処理と組み合わせたパウリ誤差伝搬によるPECのサンプリングオーバーヘッドを削減する手法を提案する。
本手法はクリフォード回路のサンプリングオーバヘッドを著しく低減し, クリフォード群とパウリ雑音の相互作用をうまく利用することを目的としている。
本手法は,非クリフォード回路に適用可能であるが,回路内に存在する非クリフォードゲートの数に大きく制約されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:37:51 GMT)
Real-Time Sign Language Gestures to Speech Transcription using Deep Learning [0.0] 本研究は,手話のジェスチャーをテキストおよび可聴音声に変換するために,高度なディープラーニング技術を活用するリアルタイム支援技術ソリューションを提案する。
Sign Language MNISTデータセットに基づいてトレーニングされた畳み込みニューラルネットワーク(CNN)を使用することで、システムはWebカメラを介してキャプチャされた手の動きを正確に分類する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:25:18 GMT)
Real-Time Beach Litter Detection and Counting: A Comparative Analysis of RT-DETR Model Variants [0.0] 沿岸汚染は世界的な環境問題であり、監視と管理のためにスケーラブルで自動化されたソリューションを必要とする。
本研究では, リアルタイム検出変換器(RT-DETR)の海浜ゴミの自動検出・計数への応用について検討した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:10:04 GMT)
Quantum stochastic analysis of non-linear driven light emission [0.0] 我々は、環境に結合した非線形駆動キャビティに対する量子ランゲヴィン方程式を解くことにより、開系力学を研究する。
メモリのない非構造環境において、強駆動キャビティの放射特性は高調波発生と非線形アンテナの過程に同型であることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:17:22 GMT)
Quantum spacetime from constraints: wave equations and fields [0.0] 我々は、Page と Wootters の量子時間形式を、量子時計とロッドの両方を含むように拡張する。
この枠組みから量子粒子を規定する標準波動方程式が自然に現れることを示す。
この結果は、時空における量子力学は絡み合いや制約から生じる可能性があるという考え方をさらに支持する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:56:40 GMT)
Quantum mereology and subsystems from the spectrum [0.0] システムをサブシステムに分解することは、スペクトルを他のスペクトルに分解するのと等価であることを示す。
我々は、サブシステムの数はスペクトル自身から推測できると主張している。
局所モデルでは、この情報はガウス状態密度に対する有限サイズ補正で符号化される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:35:24 GMT)
Quantum entanglement of fermionic symmetry-enriched quantum critical points in one dimension [0.0] 2つの遷移線が、同じ中心電荷を共有するにもかかわらず、根本的に異なる位相特性を示すことを示す。
また、3つの遷移線の交点における新しいリーフシッツ多臨界点も同定する。
この研究は、量子エンタングルメントの観点から、物質の隙間のない位相を調査するための貴重な参照を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:38:29 GMT)
Quantum Wasserstein distance and its relation to several types of fidelities [0.0] 我々は、与えられた限界を持つ一般二部量子状態に対する最適化に基づいて、量子ワッサーシュタイン距離のいくつかの定義を考察する。
我々は、Uhlmann-Jozsa量子忠実度が与えられた限界を持つ分離可能な状態に対する最適化としても記述できることを示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:23:56 GMT)
Quantum Walk on a Line with Absorbing Boundaries [0.0] 対称的な構成を考えると、2つのシンクが$N$と$-N$で、量子ウォーカーが中央から始まる。
吸収は、コイン角とは別に、初期状態がコイン作用素の固有状態の1つである確率にのみ依存することが示されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:04:20 GMT)
Quantum Signatures of Chaos from Free Probability [0.0] 本稿では、自由度に基づく量子カオスの定義を提案し、量子多体系における量子カオスの出現について検討する。
自由畳み込み予測の上の揺らぎは、普遍的なウィグナー・ダイソン統計に従うことを示し、量子カオスとの関係について議論する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:05:57 GMT)
Purely quantum memory in closed systems observed via imperfect measurements [0.0] 量子系における記憶は オープン量子系の理論の中心的な問題です
しかし、閉系における不完全な測定によって引き起こされる記憶効果についてはほとんど分かっていない。
本研究では,不完全なストロボスコープ量子計測によって観測された閉系におけるメモリの出現と特性について検討する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:16:02 GMT)
Prescriptive Zero Trust- Assessing the impact of zero trust on cyber attack prevention [0.0] この研究は、企業組織におけるサイバーセキュリティの成熟度を測定する定量的ガイドラインの可能性を評価する。
これはZero Trust原則の採用によって実現された、サイバーレジリエンスの定量化のための、新しい、データ駆動の方法論である。
本研究の結果は、総合的なZTAデプロイメントを特徴付ける主要な技術制御の規範的セットを定義する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:30:00 GMT)
Phase Coordinate Uncomputation in Quantum Recursive Fourier Sampling [0.0] 再帰フーリエサンプリング(RFS)は量子的優位性を示す最も初期の問題の1つである。
この研究には、位相空間項における量子アルゴリズムの新たな記述が含まれており、FSでの使用を実証している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:47:22 GMT)
Performance Comparisons of Reinforcement Learning Algorithms for Sequential Experimental Design [0.0] 最大情報的設計決定を行うエージェントの創出における強化学習アルゴリズムとその有効性について検討する。
エージェントのパフォーマンスは、トレーニングに使用されるアルゴリズムによって影響を受けており、特定のアルゴリズムは、ドロップアウトやアンサンブルアプローチを用いて、魅力的な一般化特性を実証的に示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:48:57 GMT)
PediDemi -- A Pediatric Demyelinating Lesion Segmentation Dataset [0.0] 小児症例や脱髄性疾患のデータセットは、MSを超えて公開されていない。
この研究は、初めて、病変の分節を脱髄するための一般公開された小児用データセットを紹介した。
このデータセットは、ADEMで3例を含む脱髄性疾患と診断された13名の小児患者のMRIスキャンを含む。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:49:33 GMT)
Partially stochastic deep learning with uncertainty quantification for model predictive heating control [0.0] 建物固有の室内温度モデリングのための部分深層学習(DL)アーキテクチャを提案する。
DLアーキテクチャは、MPC溶液の加熱における熱的快適性とエネルギー効率を向上させる重要な可能性を示している。
この研究は、特に様々な気象条件下での熱的挙動に関する包括的なデータセットを持つ建物において、MPCの加熱を前進させる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:32:28 GMT)
PROD: Palpative Reconstruction of Deformable Objects through Elastostatic Signed Distance Functions [0.0] PROD(Palpative Reconstruction of Deformables)は、変形可能な物体の形状と機械的特性を再構築する新しい手法である。
我々は,物体の変形をエラストスタティックな過程としてモデル化し,そのSDFを推定するためのポアソン方程式を導出する。
擬似ソフトボディ相互作用におけるポーズ誤差,非正規力応用,曲率誤差の処理におけるPRDの堅牢性を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:13:58 GMT)
Opus: A Prompt Intention Framework for Complex Workflow Generation [0.0] Opus Prompt Intention Frameworkは命令調整型大言語モデル(LLM)による複雑な生成を改善するように設計されている
ユーザクエリから信号や意図を抽出する,カスタマイズ可能な意図キャプチャシステムを提案する。
提案システムでは,ユーザクエリからの直接生成と比較して,生成品質が著しく向上することを示す実証的証拠を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:21:59 GMT)
Optimal Condition for Initialization Variance in Deep Neural Networks: An SGD Dynamics Perspective [0.0] 勾配降下(SGD)は機械学習(ML)における最も基本的な最適化アルゴリズムの1つである。
この方程式から導かれる準定常分布とクルバック・リーブラー(KL)の発散による初期分布の関係について検討する。
MNISTおよびFashion-MNISTデータセット上で、古典的なSGDを用いて完全に接続されたニューラルネットワークをトレーニングすることにより、理論的結果を実験的に確認する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:18:12 GMT)
Opening Krylov space to access all-time dynamics via dynamical symmetries [0.0] 我々は、クリロフ鎖に自然に発散する開境界条件を導入することにより、無限閉系におけるいくつかの力学対称性を数値的に解析的に導出する。
我々のアプローチは、カオス系における可観測物の熱化と指数的崩壊と、作用素成長仮説を直接的に関連付けることができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:58:21 GMT)
On the Importance of Behavioral Nuances: Amplifying Non-Obvious Motor Noise Under True Empirical Considerations May Lead to Briefer Assays and Faster Classification Processes [0.0] 我々は、パーソナライズされた統計力を保ちながら、簡単なデータサンプルを取ることができる感情コンピューティングプラットフォームを開発した。
これは、短い(5秒の)顔ビデオから登録された時系列データに存在するマイクロピークから派生した新しいデータタイプを組み合わせることで実現される。
我々は、自閉症者に存在する動的および幾何学的パターンと、神経型発達においてより一般的に見られるパターンとを区別する新しい方法を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:05:40 GMT)
OPTIC-ER: A Reinforcement Learning Framework for Real-Time Emergency Response and Equitable Resource Allocation in Underserved African Communities [0.0] 本稿では,リアルタイム,適応型,公平な緊急応答のための強化学習フレームワークOPTIC-ERを紹介する。
OPTIC-ERは、ディスパッチ環境の複雑さを管理するために注意誘導型アクタークリティカルアーキテクチャを使用する。
その重要なイノベーションは、アクションのサブ最適性を符号化するContext-Rich State Vectorと、非効率性を罰するPrecision Reward Functionである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:19:57 GMT)
Novel Blockchain-based Protocols for Electronic Voting and Auctions [0.0] 我々は、ブロックチェーン上に構築されるいくつかの分散プロトコル、特にスマートコントラクトに関するスマートコントラクトについて検討している。
我々はBlind Voteという新しいアプローチを提案し、これは追跡不能で、安全で、効率的で、秘密保持であり、完全にオンチェーンの電子投票プロトコルである。
一方,入札者の身元と入札価値を保護し,個人的かつ信頼できないオークションのための新しいアルゴリズム群を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:23:31 GMT)
Note on Selection Bias in Observational Estimates of Algorithmic Progress [0.0] 本稿では,評価戦略の方法論的問題を1つ挙げる。
アルゴリズム品質の一部が潜伏しており、計算選択がアルゴリズム品質に内在的であれば、アルゴリズム品質の推定は選択バイアスによって汚染される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:12:05 GMT)
Multimodal Chain of Continuous Thought for Latent-Space Reasoning in Vision-Language Models [0.0] 本稿では,連続思考のマルチモーダル連鎖(MCOUT)を提案する。
MCOUTはマルチモーダル推論を継続的に改善し,高いベースラインに対して最大8.23%の精度向上が得られることを示す。
以上の結果から,言語関連CoTを超えてLMMを推し進めるための有望な方向として,潜時的連続推論が注目されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:50:20 GMT)
Multi-Phase Automated Segmentation of Dental Structures in CBCT Using a Lightweight Auto3DSeg and SegResNet Implementation [0.0] コーンビームCT(CBCT)は歯科医療において重要な画像モダリティとなり,診断・治療計画のための歯および周辺構造物の3次元可視化が可能となった。
DLaBella29のMICCAI 2025 ToothFairy3 Challengeに対するアプローチについて述べる。
主要な前処理工程は画像再サンプリングから0.6mm等方分解能と強度の切り抜きであった。
提案手法は,TothFairy3のアウト・オブ・サンプル・バリデーションセットで平均0.87のDiceを達成した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:35:26 GMT)
Morphological classification of eclipsing binary stars using computer vision methods [0.0] 楕円形双対(EB)の光曲線を分類するためのコンピュータビジョン手法の適用について述べる。
我々は畳み込みニューラルネットワークと視覚変換器に基づく事前学習モデルを用いてきた。
我々は、位相折り曲げられた光曲線を、ヘキシンの可視化と組み合わせて極座標に変換することによって、新しい画像表現を開発した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:29:19 GMT)
Modified security analysis of device-independent quantum key distribution with random key basis [0.0] ランダム鍵ベースプロトコルを用いたデバイス独立量子鍵分布(DIQKD)のセキュリティ解析に着目する。
キーレートを損なうことなく既存のセキュリティ解析の最適化コストを削減できることを示す。
双方の測定角度を最適化しながら生じる悲観的誤差の明示的な形式を導出する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:09:30 GMT)
Minimal criteria for continuous-variable genuine multipartite entanglement [0.0] 二次作用素の第2モーメントに対する真のマルチモード絡み合い基準を導出する。
基準のユニークな特徴は、和が少なくとも2つのモードの組み合わせの最小の分散数を含むことである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:18:43 GMT)
Large language models can replicate cross-cultural differences in personality [0.0] 我々は大規模な実験を行い、GPT-4がビッグファイブの異文化間差異を再現できるかどうかを検証した。
私たちはアメリカと韓国を文化のペアとして使いました。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:36:16 GMT)
LOOP: A Plug-and-Play Neuro-Symbolic Framework for Enhancing Planning in Autonomous Systems [0.0] 計画は自律システムにおいて最も重要なタスクの1つであり、小さなエラーでも大きな失敗や100万ドルの損失につながる可能性がある。
現在の最先端のニューラルプランニングアプローチは、複雑なドメインと競合する。
LOOPは、神経と象徴的なコンポーネント間の反復的な会話として計画を扱う、新しいニューロシンボリックな計画フレームワークである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:21:21 GMT)
Kourkoutas-Beta: A Sunspike-Driven Adam Optimizer with Desert Flair [0.0] トランスフォーマーニューラルネットワークは、物理学に基づく問題にますます利用されている。
データ駆動型PDEサロゲートでは、異なる境界と初期条件からのトレーニングサンプルが不規則な損失とスパイク勾配を引き起こす可能性がある。
固定された第2モーメントベータ2がレイヤワイドな値に置き換えられるAdamスタイルの割引であるKourkoutas-Betaを紹介します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:16:54 GMT)
IzhiRISC-V -- a RISC-V-based Processor with Custom ISA Extension for Spiking Neuron Networks Processing with Izhikevich Neurons [0.0] スパイクニューラルネットワーク処理は、スパイクイベントの間隔のため、高いエネルギー効率を約束する。
本稿では,RISC-V準拠プロセッサであるIzhiRISC-Vをベースとした大規模システムの実現に向けた第一歩を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:33:32 GMT)
It takes a village to write a book: Mapping anonymous contributions in Stephen Langton's Quaestiones Theologiae [0.0] 本稿では,著者属性のテクスチャ的手法をレポートから開発したコレクションに応用した研究の設計について詳述する。
編集作業のレイヤーを解明し、コレクションの形成に関する仮説を検証することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:13:45 GMT)
Interference in Quantum Mechanics [0.0] 量子干渉のいくつかの影響と顕在化に焦点を当てる。
これには1光子または2次干渉、2光子または4次干渉、高次干渉が含まれる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:13:55 GMT)
Information Transport in Classical-Quantum Hybrid System [0.0] エントロピーや絡み合いのような量子情報科学における多くの重要な量は密度行列の非線形関数である。
標準開系アプローチは密度行列の1つのコピーだけを進化させ、そのような量のダイナミクスを追跡することは不可能である。
ここでは、このアプローチを量子システムと古典環境との強い結合に拡張する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:01:10 GMT)
Influencia de fatores organizacionais e sociais na etapa de levantamento de requisitos [0.0] ソフトウェア開発プロジェクトの最も重要で脆弱なステージは要件収集です。
本稿では、感情、組織環境、社会的文脈といった非技術的要因を考察する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:49:00 GMT)
Human Feedback Driven Dynamic Speech Emotion Recognition [0.0] この研究は特に感情的な3Dアバターのアニメーションに焦点を当てている。
本稿では,従来の音声感情認識モデルの訓練を含む多段階手法を提案する。
ディリクレ分布に基づく感情混合をモデル化するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:25:27 GMT)
How can we trust opaque systems? Criteria for robust explanations in XAI [0.0] ディープラーニング(DL)アルゴリズムは、日常生活や科学研究においてユビキタスになりつつある。
DLシステムが提供するデータの特徴や、最終的に正しいアウトプットを予測するのにどのように成功するのかは、一般の人々や研究者にはよく分かっていない。
信頼できる説明に必要な基準は、アルゴリズムの予測がベースとしている関連するプロセスを反映すべきであるということである。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 04:38:55 GMT)
Hierarchical Reinforcement Learning in Multi-Goal Spatial Navigation with Autonomous Mobile Robots [0.0] 階層的強化学習(HRL)は、従来の強化学習(RL)がしばしば失敗する学習タスクにおいて、固有の階層を活用できると仮定されている。
HRLの特徴として,サブゴールと終端関数を生成できる能力について評価した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:48:07 GMT)
Heuristic-Induced Multimodal Risk Distribution Jailbreak Attack for Multimodal Large Language Models [0.0] HIMRDと呼ばれるマルチモーダルリスク分散ジェイルブレイク攻撃法はブラックボックスであり、マルチモーダルリスク分散戦略と有害な検索戦略という2つの要素から構成される。
HIMRDは、7つのオープンソースMLLMで平均攻撃成功率(ASR)を90%達成し、3つのクローズドソースMLLMで平均攻撃成功率(ASR)を約68%達成している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 03:40:02 GMT)
HeroBench: A Benchmark for Long-Horizon Planning and Structured Reasoning in Virtual Worlds [0.0] 大規模言語モデル(LLM)は、数学やプログラミングのようなステップバイステップの推論タスクにおいて顕著な能力を示している。
しかし、ソリューションが拡張され、構造化された相互依存的なアクションのシーケンスを必要とする長期計画におけるそれらの習熟度は、まだ未解明のままである。
我々は,RPGにインスパイアされた複雑な仮想世界において,長期計画と構造化推論を評価するために設計された新しいベンチマークであるHeroBenchを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:59:02 GMT)
Hands-on Quantum Programming Labs for EECS Students [0.0] 本稿では,電子工学と計算機科学(EECS)の学生に量子コンピューティングを教える実践的なアプローチを提案する。
研究室は様々なトピックをカバーしており、絡み合い、量子ゲート、回路などの基本的な要素を含んでいる。
教育者として、現場にいる仲間のインストラクターと教えの洞察とリソースを共有することを目的としている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:50:15 GMT)
Good Things Come in Pairs: Paired Autoencoders for Inverse Problems [0.0] 我々は,科学計算における逆問題解決の強力なツールであることが証明された,自己エンコーダフレームワークに注目する。
本稿では, 非線形および線形逆問題を含む, 地震イメージングや古典的塗装を含む数値実験を通じて, このアプローチの利点を解説する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:57:40 GMT)
GTPO and GRPO-S: Token and Sequence-Level Reward Shaping with Policy Entropy [0.0] グループ相対政策最適化(GRPO)のようなアルゴリズムによる強化学習(RL)は、LLM推論を改善する。
本稿では,textbfDynamic Entropy Weightingを用いてこの問題を解決する。
私たちの中核的な考え方は、正しい応答における高エントロピートークンは、より高いパフォーマンスの天井に向かってポリシーを導くことができるということです。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:20:57 GMT)
FlowMol3: Flow Matching for 3D De Novo Small-Molecule Generation [0.0] FlowMol3はオープンソースのマルチモーダルフローマッチングモデルで、全原子、小分子生成のための最先端技術である。
本研究は,拡散型および流動型分子生成モデルの安定性と品質を向上させるための,単純かつ伝達可能な戦略を強調した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 05:13:27 GMT)
Floquet-engineered system-reservoir interaction in the transverse field Ising model [0.0] スピン波の1次元における制御伝搬に対するFloquet-Engineered transverse field Isingモデルについて報告する。
我々の方式はQED回路で実装され、量子ネットワークにおけるシステム・貯留層相互作用とルーティングのためのカップリング・デカップリング・スキームに直接適用することができる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:16:05 GMT)
Federated Action Recognition for Smart Worker Assistance Using FastPose [0.0] 本稿では,不均質な産業環境下でのポーズに基づく人間活動認識(HAR)のための連邦学習(FL)フレームワークを提案する。
LSTMとTransformerエンコーダという2つの時間的バックボーンを4つのパラダイムで訓練し評価する。
グローバルテストセットでは、FLトランスフォーマーは集中トレーニングよりも+12.4ポイント向上し、FedEnsembleは+16.3ポイントを獲得した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:28:15 GMT)
Extraction of classical ergotropy [0.0] 熱的に単離された量子系から最大エネルギー量を抽出する時間依存摂動を見つけることは、量子熱力学における中心的で解決された問題である。
我々は、古典的エルゴトロピー抽出駆動(英語版)を提供し、即時クエンチと断熱的リターンからなる。
また、量子の場合と同様に、古典的エルゴトロピーはコヒーレントな部分と非コヒーレントな部分に分割されることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:19:10 GMT)
Exploration of Deep Learning Based Recognition for Urdu Text [0.0] ウルドゥーは複雑な幾何学的構造と形態的構造のために分類が難しい。
提案手法は、畳み込みニューラルネットワークと呼ばれる自動特徴学習技術に基づくコンポーネントベースの分類である。
我々のモデルはコンポーネント分類の0.99%を達成できた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:27:48 GMT)
Expectation value dynamics within real Hilbert space quantum mechanics [0.0] 形式主義の整合性は、連続性方程式、古典的極限、量子ローレンツ力の一般化の観点から検証されている。
一般化された位置と角運動量演算子を導入し、さらなる研究のためのエキサイティングな方向を導いた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:40:53 GMT)
Exact solutions, critical parameters and accidental degeneracy for the hydrogen atom in a spherical box [0.0] 我々は、不透明な壁を持つ箱の中の水素原子のいくつかの性質を導出する。
条件付き解決可能な条件から生じるいくつかの根は、モデルパラメータの臨界値に向かって収束しているように見える。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:44:53 GMT)
Evaluation of Finetuned LLMs in AMR Parsing [0.0] AMRは意味論的フォーマリズムであり、ノードが概念を表現し、エッジが意味論的関係を表す根付き、有向、非巡回グラフとして意味をエンコードする。
本稿では,Phi 3.5,Gemma 2,LLaMA 3.2,DeepSeek R1 LLaMA Distilledの4つの異なるLLMアーキテクチャを微調整して総合評価する。
以上の結果から,デコーダのみの直進微調整により,複雑なSOTA AMRに匹敵する性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:10:45 GMT)
Entanglement generation and scaling from noisy quenches across a quantum critical point [0.0] 逆場イジング鎖の絡み合いの力学に及ぼす雑音の影響について検討する。
その結果, クエンチは近傍と隣り合うスピンの絡み合いを生じ, ノイズは絡み合いの量を減少させることがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:42:58 GMT)
Enhanced Sensitivity and Noise Resilience in Two-Qubit Quantum Magnetometers [0.0] 感度と耐雑音性の向上に最適化された2量子量子磁気センサハミルトニアンを提案する。
既存のモデルと比較して、我々の定式化は精度、ノイズに対する堅牢性、および絡み合い力学の利点を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:29:18 GMT)
Embarrassed to observe: The effects of directive language in brand conversation [0.0] 本研究は,ブランド会話におけるディレクティブ言語が,そのような交換を観察する消費者のエンゲージメントに有害なダウンストリーム効果を有することを示す。
さらに、会話が非製品中心(vs.製品中心)である場合、消費者は日常的な会話のように、他の人にとってもより多くの自由を期待する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:07:23 GMT)
Dynamics of many-body localized systems: logarithmic lightcones and $\log \, t$-law of $α$-Rényi entropies [0.0] 対数光錐を持つリーブ・ロビンソン境界(L-R)は、絡み合いの緩やかな広がりを引き起こすことを示す。
これはアンダーソン局所化位相と鋭い対比であり、動的に生じる絡み合いは示さない。
我々は、系の力学のL-R境界が対数光円錐を持つという既知の事実の新しい独立した証明を提供する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:17:46 GMT)
Dynamic syndrome decoder in volume-law phases of hybrid quantum circuits [0.0] 体積則エンタングルメントを持つ物質の相は、量子回路でしばしば観察される。
絡み合った複雑な量子情報をホストする能力は、量子測定から効率的に隠蔽する能力によって補われている。
本稿では,対数回路深度における情報検索を可能にする,復調可能なボリューム法則位相を特徴とするクリフォード回路のクラスを紹介する。
我々の研究は、量子誤り訂正や量子暗号における潜在的な応用を開拓し、中間回路計測によるエンコーダとして体積法則状態を使用する方法の道を開いた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:01:59 GMT)
DualResolution Residual Architecture with Artifact Suppression for Melanocytic Lesion Segmentation [0.0] 皮膚内視鏡像におけるメラノサイトーシスの正確な記述は、自動皮膚がん検診システムにおいて重要な要素である。
ResNetにインスパイアされた新しいデュアルレゾリューションアーキテクチャについて述べる。
本手法は境界精度と臨床関連セグメンテーション指標を大幅に向上させ,従来のエンコーダ・デコーダベースラインよりも優れていた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:28:24 GMT)
Driven-Dissipative Interpretation of Measurement-Induced State Transitions Beyond Semiclassical Predictions [0.0] 分散読み出しは超伝導量子コンピューティングにおいて中心的な役割を果たす。
しかし、強い読み出し駆動の下では、多光子共鳴は測定誘起状態遷移を引き起こす可能性がある。
還元量子モデルを用いたMISTの駆動散逸解釈を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:58:18 GMT)
Do Large Language Model Agents Exhibit a Survival Instinct? An Empirical Study in a Sugarscape-Style Simulation [0.0] Sugarscapeスタイルのシミュレーションにおいて,大規模言語モデル (LLM) エージェントが明示的なプログラミングをせずに生存本能を示すか否かを検討する。
以上の結果から, 自然再生・共有資源の蓄積が認められた。
いくつかのモデルにまたがってアグレッシブな振る舞い - リソースのための他のエージェントを殺します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 13:40:10 GMT)
Dirac bracket and time dependent constraints [0.0] 第二級制約系のディラックブラケットと運動方程式を同時に導出する。
時間依存ゲージ固定条件の必要性は、パラメータ化力学の例に示される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:30:38 GMT)
Denoising diffusion models for inverse design of inflatable structures with programmable deformations [0.0] 本研究では, 圧力駆動作動下での大きな非線形変形を受ける弾性構造物の逆設計のための拡散確率モデル (DDPM) に基づく生成設計フレームワークを提案する。
このフレームワークは、膨らませた時に所望の変形を達成できる多様な非変形構成を迅速に生成できることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:07:51 GMT)
Deep Learning-Based Financial Time Series Forecasting via Sliding Window and Variational Mode Decomposition [0.0] 歴史的株価と関連する市場指標がデータセットの構築に使用される。
VMDは、非定常財務時系列をスムーズなサブコンポーネントに分解し、モデル適応性を改善する。
本研究は,VMD処理シーケンスでトレーニングしたLSTMモデルの予測効果と生の時系列を用いた予測効果を比較し,性能と安定性を実証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:56:31 GMT)
Deep Learning Model for Amyloidogenicity Prediction using a Pre-trained Protein LLM [0.0] タンパク質のアミロイド生成性を予測する最近のアプローチは、進化のモチーフとアミノ酸の個々の性質に強く基づいている。
本研究では,事前学習したタンパク質大言語モデルから得られたタンパク質配列の文脈的特徴について検討した。
本手法は,10倍のクロスバリデーションで84.5%,テストデータセットで83%の精度を達成した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:21:48 GMT)
Datarus-R1: An Adaptive Multi-Step Reasoning LLM for Automated Data Analysis [0.0] 本稿では,Qwen 2.5-14B-Instructの言語モデルであるDatarus-R1-14Bを提案する。
Datarusは、独立した問合せペアではなく、推論ステップ、コード実行、エラートレース、自己補正、最終的な結論を含む完全な分析トラジェクトリに基づいて訓練されている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 21:58:18 GMT)
Data-driven Trust Bootstrapping for Mobile Edge Computing-based Industrial IoT Services [0.0] 提案手法は,既存の信頼ブートストラップアプローチをMECベースのIIoTシステムに適用する上で,重要な制限に対処する。
提案手法は、異なるMEC環境間での知識共有を可能にすることにより、データの分散性にも対処する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 01:37:34 GMT)
Correlation Functions and Chaotic Behavior of the SYK Chain Model in Pure States [0.0] 我々は,SYK鎖の個々のエネルギー固有状態における情報の熱化とスクランブルについて,正確な対角化を用いて検討した。
その結果, 絡み合い力学で観測される緩やかな熱化は, 純粋な状態であっても, 熱化と揺らぎの全てのプローブに及ばないことがわかった。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:47:02 GMT)
CorrSteer: Steering Improves Task Performance and Safety in LLMs through Correlation-based Sparse Autoencoder Feature Selection [0.0] 提案するCorrSteerは,サンプルの正しさとSAEのアクティベーションを推論時に生成したトークンから関連付けて特徴を選択する。
我々の研究は、言語モデルアプリケーション間での自動SAEステアリングのための効果的でスケーラブルなアプローチとして相関ベースの選択を確立する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:01:42 GMT)
Controlling quantum scars and engineering subharmonic responses with a two frequency drive [0.0] 連続2周波駆動は、量子多体傷の寿命を制御するための汎用的で堅牢なプロトコルであることを示す。
このチューニング性を利用して、分数的な低調波応答を設計する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:46:02 GMT)
Contextuality in anomalous heat flow [0.0] 量子熱力学では、異常な熱流が起こり、一時的に寒冷状態と暑熱状態がより高温になる。
本研究では,異常な熱流現象が非古典性に直接関連しているシナリオを紹介する。
本研究は,2つの量子ビット系の進化における熱流の研究から,我々の発見は2つの量子ビット系を用いるための人工物ではないことを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:17:57 GMT)
Constrained Centroid Clustering: A Novel Approach for Compact and Structured Partitioning [0.0] Constrained Centroid Clustering (CCC) は、古典的なセントロイドクラスタリングを拡張する手法である。
CCCは、角構造を保持しながらラジアルスプレッドを減らすことで、よりコンパクトなクラスタを実現する。
提案手法は,センサネットワーク,協調ロボット工学,解釈可能なパターン解析など,分散制御による構造化クラスタリングを必要とするアプリケーションに適している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:30:54 GMT)
Confinement to deterministic manifolds and low-dimensional solution formulas for continuously measured quantum systems [0.0] 量子状態は低次元の非線形多様体に制限される。
このノートは、いくつかのケースにおいて進化状態を表現するための対応する低次元の定式化を導出する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:22:45 GMT)
Computing Exchange Coupling constants in Transition metal complexes with Tensor Product Selected Configuration Interaction [0.0] 遷移金属錯体は電子構造理論にとって重要な課題である。
最近開発した製品選択構成相互作用 (TPSCI) と密度行列再正規化群 (DMRG) を比較し, 6つの遷移金属系における交換結合定数の計算を行った。
主な利点は、統計誤差を小さくした直接J補間を可能にする自然多状態能力と、挑戦するシステムに対する計算効率である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:23:53 GMT)
Coherence of Microwave and Optical Qubit Levels in Neutral Thulium [0.0] ツリウムが量子コンピューティングの候補となりうることを示し、超微細量子ビット符号化の利点とアルカリ土類状原子の高エネルギー準位構造を組み合わせた。
結果は、量子コンピューティングアプリケーションにツリウムを使用するための第一歩である。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 12:38:59 GMT)
Characterizing the Sensitivity to Individual Bit Flips in Client-Side Operations of the CKKS Scheme [0.0] ホモモルフィック暗号化(HE)は、復号化せずに暗号化されたデータの計算を可能にし、信頼できない環境でのプライバシ保護計算の基盤となる。
HEは、セキュアな機械学習や機密データ分析といったセンシティブなアプリケーションの採用が増加し、エラーに対する堅牢性が重要になると考えている。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:55:03 GMT)
Chaos and quantum regimes in $n$-photon driven, dissipative bosonic chains [0.0] このような量子系における量子ゆらぎ、非線形相互作用、散逸過程の間の相互作用を多光子駆動がどのように形成するかを考察する。
本研究は, 流体力学系の普遍的な性質を明らかにし, 境界運転条件に対するRNW体制の感受性を強調した。
これらの結果は、最先端の量子電子プラットフォームに実験的に関係している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:24:01 GMT)
Causally-Guided Pairwise Transformer -- Towards Foundational Digital Twins in Process Industry [0.0] Causally-Guided Pairwise Transformer (CGPT)は、既知の因果グラフを帰納バイアスとして統合した新しいアーキテクチャである。
CGPTはチャネル依存型(CD)モデルとチャネル依存型(CI)モデルの両方で予測精度において有意に優れていた。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:18:38 GMT)
Can AI Keep a Secret? Contextual Integrity Verification: A Provable Security Architecture for LLMs [0.0] 我々は、暗号的に署名されたラベルを全てのトークンにアタッチする、既定のセキュリティアーキテクチャであるContextual Integrity Verification (CIV)を提示する。
CIVは、凍結したモデルに対して、前兆かつトーケン毎の非干渉保証を提供する。
Llama-3-8BとMistral-7Bのドロップイン保護を実証した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 18:20:18 GMT)
Callan-Symanzik-like equation in information theory [0.0] 複雑性の増大率(CGR)の上昇は、複雑性=あらゆる提案を通じて考慮する。
これらのジャンプの高さと位置をバルクフィールドが担当していることが判明した。
これらのジャンプに伴うCGRの挙動は、臨界挙動と臨界指数を示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:25:43 GMT)
Bridging Econometrics and AI: VaR Estimation via Reinforcement Learning and GARCH Models [0.0] 本稿では,GARCHのボラティリティモデルと深い強化学習を組み合わせた,VaR(Value-at-Risk)推定のためのハイブリッドフレームワークを提案する。
本手法では,Double Deep Q-Network (DDQN) モデルを用いて市場予測を行い,タスクを不均衡な分類問題として扱う。
危機と高いボラティリティの期間をカバーする毎日のEurostoxx 50データに関する実証的な検証は、VaR推定の精度を大幅に改善したことを示している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 11:41:40 GMT)
Born's rule deviations from temporal non-local effects [0.0] 本研究では,遷移干渉現象と内在記憶効果が有限時間非局所相関を誘導し,ボルンの規則に違反することを示す。
量子確率の従来の解釈に挑戦し、時間的非局所性に関する将来の実験的研究を導く新しいダイナミクスを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:05:42 GMT)
Born's Rule from Quantum Frequentism [0.0] 量子理論は一時的な規則の集合から必須の枠組みへと進化してきた。
ボーンの確率仮説は、理論のユニタリな性格と相反するままである。
我々は、純粋なユニタリ進化がよりリラックスした条件下でボルンの規則と共存できることを証明した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 14:30:27 GMT)
Beyond Copenhagen: Following the Trail of Decoherence in Feynman's Light Microscope [0.0] ファインマンの光顕微鏡は、私たちが量子現実について知っていることを再考してくれる。
この記事は、量子力学の学部課程を持つ人なら誰でもアクセスできると書かれています。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 22:01:37 GMT)
Bath-induced Zeno localization in driven many-body quantum systems [0.0] 本研究では、外部駆動を受ける量子相互作用スピン系について検討し、空間局在振動モードの熱浴に結合する。
系の多体固有状態がエルゴードである場合でも、浴槽への十分に強い結合は、多体量子ゼノ効果によるスピンを効果的に局在させることが示される。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 16:31:47 GMT)
Basic Category Usage in Vision Language Models [0.0] 2つの視覚言語モデル(VLM)の基本レベル分類について検討する。
Llama 3.2 Vision Instruct (11B) と Molmo 7B-D はどちらも人間の行動に整合した基本レベルの分類を好む。
また、専門家のプロンプト法が精度を低下させ、非専門家のプロンプト法が有効であることを示す。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 20:53:54 GMT)
Avaliação de eficiência na leitura: uma abordagem baseada em PLN [0.0] 本研究では,ブラジルポルトガル語におけるクローゼテストの自動評価モデルを提案する。
統合された手法は,その有効性を示し,人的評価と高い相関性を示した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 02:21:12 GMT)
AuthenTree: A Scalable MPC-Based Distributed Trust Architecture for Chiplet-based Heterogeneous Systems [0.0] チップレットベースのヘテロジニアス統合は、AIと高性能コンピューティングのためのモジュラーでスケーラブルで、より高速なタイム・ツー・マーケットソリューションを可能にすることによって、半導体設計を再構築している。
しかし、ポストファブリケーション環境におけるマルチベンダのアセンブリはサプライチェーンを断片化し、SiPシステムを深刻なセキュリティ上の脅威に晒す。
本稿では,マルチパーティインテグレータ(MPC)をスケーラブルなツリーベースアーキテクチャで活用する分散認証フレームワークAuthenTreeを紹介する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 15:51:48 GMT)
Application of Quantum Annealing to Computation of Molecular Properties [0.0] いくつかの分子の永久電気双極子モーメントの計算について述べる。
基底状態電子波動関数とエネルギーは、量子アニールアイオニゾルバーアルゴリズムを用いて得られる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:54:56 GMT)
Ambiguity Resolution with Human Feedback for Code Writing Tasks [0.0] 新規技術(ARHF:Ambiguity Resolution with Human Feedback)に基づくプロトタイプシステムの提案と評価
本稿では,このような支援システムがコンピュータサイエンス教育に与える影響について論じる。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:46:26 GMT)
All for law and law for all: Adaptive RAG Pipeline for Legal Research [0.0] Retrieval-Augmented Generation (RAG) は、参照ソースで大きな言語モデル出力を基底にして幻覚を緩和する。
本稿では,LegalBenchRAGベースラインを再検討し,拡張する,エンドツーエンドのRAGパイプラインを提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 17:14:03 GMT)
Addressing Side-Channel Threats in Quantum Key Distribution via Deep Anomaly Detection [0.0] 一級機械学習アルゴリズムに基づく異常検出モデル。
モデルは既存のQKDネットワークに最小限のコストでデプロイできる。
マルチクラス機械学習アルゴリズムとは異なり、我々のアプローチは特定の攻撃タイプの事前知識に依存しない。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:20:02 GMT)
Adaptive-basis sample-based neural diagonalization for quantum many-body systems [0.0] 量子多体系の基底状態エネルギーを推定するための2つのニューラルネットワークによるアプローチを導入する。
どちらも、関連するベース構成を効率的にサンプリングするために、自己回帰ニューラルネットワークを使用している。
様々な量子イジングモデルにおけるこれらの手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:46:21 GMT)
A Taxonomy of Hierarchical Multi-Agent Systems: Design Patterns, Coordination Mechanisms, and Industrial Applications [0.0] 階層型マルチエージェントシステム(HMAS)は、エージェントの集合を階層構造にまとめ、複雑さとスケールを管理する。
本稿では,階層構造,情報フロー,役割とタスクの委譲,時間階層化,コミュニケーション構造という5つの軸に沿ったHMASの多次元分類法を提案する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 07:36:33 GMT)
A Surveillance Based Interactive Robot [0.0] 我々はモバイル監視ロボットを構築し、リアルタイムで動画をストリーミングし、ユーザーがスマートフォンやブラウザから監視し、操作できるように音声に反応する。
このシステムはRaspberry Pi 4の2つのユニットを使っている。カメラ、マイク、スピーカーを備えたディファレンシャルドライブベース上のフロントユニットと、ライブフィードを提供し、知覚を実行する中央ユニットだ。
音声対話では、音声認識、多言語翻訳、音声合成にPythonライブラリを使用します。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 19:09:43 GMT)
A Novel Approach for Estimating Largest Lyapunov Exponents in One-Dimensional Chaotic Time Series Using Machine Learning [0.0] 機械学習を用いて1次元カオス時系列から最大のリアプノフ指数(LLE)を推定するためのデータ駆動手法を提案する。
予測器はサンプル外マルチ水平予測を生成するように訓練され、LLEは地平線を横切る幾何平均予測誤差(GMAE)の指数的成長から推定される。
我々は,4つの標準1次元地図-ロジスティック,正弦,立方体,チェビシェフが達成するR2pos > 0.99のアプローチを,M = 450と短い列の基準LLE曲線に対して検証した。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 10:55:42 GMT)
A Hierarchical Surrogate Model for Efficient Multi-Task Parameter Learning in Closed-Loop Contro [0.0] 本稿では,効率的な制御パラメータ学習に適した階層型ベイズ最適化(BO)フレームワークを提案する。
閉ループコストをブラックボックスとして扱う代わりに,本手法は根本問題の構造的知識を活用する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 09:01:28 GMT)
A Comparative Study of Delta Parquet, Iceberg, and Hudi for Automotive Data Engineering Use Cases [0.0] 最新のデータレイクハウスフォーマットであるDelta Parquet、Apache Iceberg、Apache Hudiは、ACIDトランザクション、スキーマ適用、リアルタイムの取り込みなどの機能を提供する。
本研究では,実時間時系列自動車テレメトリデータを用いたDelta Parquet, Iceberg, Hudiの比較分析を行った。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 23:06:05 GMT)
A Compact Post-quantum Strong Designated Verifier Signature Scheme from Isogenies [0.0] 異種性に基づくStrong Designated Verifier Signatureスキームを提案する。
既存のSDVS構築の代替として、コンパクトで量子耐性がある。
強力なセキュリティ保証、SUF-CMA(SUF-CMA)による強力なアンフォージェビリティ、NT(Non-Transferability)、PSI(Privacy of Signer's Identity)を実現している。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 08:48:17 GMT)
$^{88}$Sr Reference Data [0.0] ストロンチウム88(Strontium-88)は、量子光学、精密メートル法、量子コンピューティングでよく用いられる多用途原子種である。
このデータセットは、bosonic 8,8$Srに関する研究の最新のリファレンスとして機能する。
論文参考訳(メタデータ) (Mon, 18 Aug 2025 00:10:55 GMT)