NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model [155.3] Nemotron-Nano-9B-v2は、推論処理のスループットを向上させるために設計されたハイブリッドのMamba-Transformer言語モデルである。
Nemotron-Nano-9B-v2はNemotron-Hアーキテクチャをベースにしており、共通のTransformerアーキテクチャの自己保持層の大部分をMamba-2層に置き換えている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:00:57 GMT)
G-LLaVA: Solving Geometric Problem with Multi-Modal Large Language Model [121.1] 大規模言語モデル(LLM)は、人間レベルの推論と生成能力に顕著な習熟性を示している。
G-LLaVAは幾何学的問題の解法において例外的な性能を示し、7Bパラメータしか持たないMathVistaベンチマークにおいて GPT-4-V を著しく上回っている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:45:11 GMT)
Self-supervised Learning of LiDAR 3D Point Clouds via 2D-3D Neural Calibration [107.6] 本稿では,自律走行シーンにおける3次元知覚を高めるための,新しい自己教師型学習フレームワークを提案する。
本稿では,画像とポイントクラウドデータの領域ギャップを埋めるために,学習可能な変換アライメントを提案する。
我々は剛性ポーズを推定するために密度の高い2D-3D対応を確立する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:15:24 GMT)
Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR [102.1] RLVRトレーニングのためのオンライン変分問題合成(SvS)戦略を提案する。
この戦略は、トレーニング中のポリシーのエントロピーを効果的に維持し、標準のRLVRと比較してPass@kを大幅に改善する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:21:25 GMT)
AlphaDent: A dataset for automated tooth pathology detection [98.2] このデータセットは、295人の患者の歯のDSLRカメラ写真に基づいており、1200枚以上の画像を含んでいる。
この記事では、データセットとラベリングフォーマットの詳細な説明を提供する。
その結果,高い予測精度が得られた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:15:59 GMT)
Compute-Optimal Scaling for Value-Based Deep RL [96.3] オンライン価値ベースディープRLの計算スケーリングについて検討する。
解析の結果,モデルサイズ,バッチサイズ,UTD間の微妙な相互作用が明らかになった。
この現象を理解するためのメンタルモデルを提供し、バッチサイズとUTDを選択するためのガイドラインを構築します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:54:21 GMT)
Repeating Words for Video-Language Retrieval with Coarse-to-Fine Objectives [93.3] 既存の方法はビデオ検索性能を向上させるために大規模な事前学習に依存している。
そこで我々は,より微粒な特徴を学習し,アライメントを改善するための新しいフレームワークを提案する。
追加のトレーニングなしでパフォーマンスを改善するための推論パイプラインも導入しています。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:03:56 GMT)
MCP-Universe: Benchmarking Large Language Models with Real-World Model Context Protocol Servers [86.0] MCP-Universeは,実世界のMPPサーバとのインタラクションを通じて,現実的かつ困難なタスクにおいてLLMを評価するために設計された,初めての総合ベンチマークである。
私たちのベンチマークでは、ロケーションナビゲーション、リポジトリ管理、財務分析、3Dデザイン、ブラウザ自動化、Web検索という、11の異なるMSPサーバにまたがる6つのコアドメインを網羅しています。
GPT-5 (43.72%) やGrok-4 (33.33%) やClaude-4.0-Sonnet (29.44%) のようなSOTAモデルでさえ、大幅な性能制限がある。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:28:58 GMT)
PersonaBench: Evaluating AI Models on Understanding Personal Information through Accessing (Synthetic) Private User Data [76.2] パーソナライゼーションは、AIアシスタント、特に個々のユーザーと連携するプライベートAIモデルのコンテキストにおいて重要である。
このようなデータのセンシティブな性質のため、AIモデルのユーザ理解能力を評価するためのデータセットは公開されていない。
多様なユーザプロファイルを作成する合成データ生成パイプラインと、人間の活動をシミュレートするプライベートドキュメントを導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:44:21 GMT)
VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness [74.2] 本稿では,本質的な忠実度を示すビデオ生成モデルを評価するためのベンチマークであるVBench-2.0を紹介する。
VBench-2.0は、人間の忠実さ、コントロール可能性、創造性、物理学、コモンセンスの5つの重要な次元を評価している。
我々は、人間の判断に一致した評価を確保するために、広範囲な人間のアノテーションを実行します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:49:30 GMT)
Snap-Snap: Taking Two Images to Reconstruct 3D Human Gaussians in Milliseconds [71.2] 本稿では,2つの画像から人体を再構築する上で,課題だが価値のある課題を提案する。
主な課題は、3D一貫性の構築の難しさと、高度にスパースな入力から欠落した情報を回復することにある。
実験の結果,1個のNVIDIA GTX 4090上で190msで人体全体を再構築できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:59:11 GMT)
Quantum Interference of Distinguishable Photons Based on Spatially-Resolved Measurements [67.4] 本稿では,2つの光子の量子干渉が横モーメントで識別可能であることを示す実験結果を示す。
我々は、空間分解測定で観測された量子干渉を、光子の位置の平均値が洗い流すような非親和性測定と対比した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:56:59 GMT)
Organ-Agents: Virtual Human Physiology Simulator via LLMs [66.4] オルガン-エージェント(Organ-Agents)は、LDM駆動のエージェントを介して人間の生理学をシミュレートする多エージェントフレームワークである。
症例は7,134例,コントロール7,895例で,9系統および125変数にわたる高分解能トラジェクトリを作成した。
臓器抗原は4,509人の保留患者に対して高いシミュレーション精度を達成し, システムごとのMSE0.16とSOFA系重症度層間の堅牢性を示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:58:45 GMT)
Markov Chain-based Model of Blockchain Radio Access Networks [65.6] 注意を引いた1つのワイヤレスアクセスアプローチはブロックチェーン対応RAN(B-RAN)である。
この研究はブロックチェーン技術をRANに統合するフレームワークを導入し、最先端モデルの限界にも対処する。
その結果、レイテンシの削減と同等のセキュリティにより、さまざまなアプリケーションシナリオに適したフレームワークが実現された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:28:30 GMT)
JudgeLRM: Large Reasoning Models as a Judge [65.1] 我々は,Large Language Models (LLMs) の判断が推論能力の強化から真に恩恵を受けるかどうかを考察する。
本稿では、強化学習(RL)を用いて学習した判断指向LLMのファミリーであるジャッジLRMを紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:01:52 GMT)
MetAdv: A Unified and Interactive Adversarial Testing Platform for Autonomous Driving [63.9] MetAdvは、現実的でダイナミックでインタラクティブな評価を可能にする、新しい対向テストプラットフォームである。
フレキシブルな3D車両モデリングと、シミュレートされた環境と物理的環境のシームレスな遷移をサポートする。
生理的信号のリアルタイムキャプチャとドライバからの行動フィードバックを可能にする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:30:56 GMT)
Understanding Data Influence with Differential Approximation [63.8] 我々は,Diff-Inと呼ばれる連続学習ステップ間の影響の差を蓄積することにより,サンプルの影響を近似する新しい定式化を導入する。
2次近似を用いることで、これらの差分項を高精度に近似し、既存の手法で必要となるモデル凸性を排除した。
Diff-In は既存の影響推定器に比べて近似誤差が著しく低いことを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:59:32 GMT)
Taming Transformer for Emotion-Controllable Talking Face Generation [61.8] 本稿では,感情制御可能な発話顔生成タスクを個別に行うための新しい手法を提案する。
具体的には、2つの事前学習戦略を用いて、音声を独立したコンポーネントに分解し、映像を視覚トークンの組み合わせに定量化する。
我々は、複数の感情的オーディオで調整された映像の感情を制御するMEADデータセット上で実験を行う。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:16:52 GMT)
ABC: Achieving Better Control of Multimodal Embeddings using VLMs [61.4] ビジュアル埋め込みモデルは、ビジュアル検索や分類のようなゼロショットタスクで優れている。
これらのモデルは曖昧さやユーザ命令を必要とするタスクには使用できない。
本稿では,視覚言語モデルバックボーンを用いたオープンソースのマルチモーダル埋め込みモデルABCを紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:09:06 GMT)
RotBench: Evaluating Multimodal Large Language Models on Identifying Image Rotation [59.8] MLLM(Multimodal Large Language Models)は、0deg, 90deg, 180deg, 270degで回転した入力画像の向きを正確に識別する。
このタスクは、方向に関係なく、回転キューを検出し、画像内の空間的関係を文脈化するための堅牢な視覚的推論機能を必要とする。
GPT-5, o3, Gemini-2.5-Pro など,最先端のオープンかつプロプライエタリなMLLM が入力画像の回転を確実に識別できないことを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:53:09 GMT)
Social Debiasing for Fair Multi-modal LLMs [59.6] MLLM(Multi-modal Large Language Models)は、研究分野を劇的に進歩させ、強力な視覚言語理解機能を提供する。
これらのモデルは、しばしば訓練データから根深い社会的偏見を継承し、人種や性別などの属性に対する不快な反応をもたらす。
本稿では,MLLMにおける社会的バイアスの問題を,複数の社会的概念を持つ包括的対実的データセットを導入することで解決する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:24:46 GMT)
Critique-GRPO: Advancing LLM Reasoning with Natural Language and Numerical Feedback [59.1] Critique-GRPOは、自然言語と数値フィードバックを統合して効果的なポリシー最適化を行うオンラインRLフレームワークである。
批判-GRPOは、教師付き学習とRLに基づく微調整法を8つの難解な数学、STEM、一般的な推論タスクで一貫して上回っていることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:10:05 GMT)
Six-CD: Benchmarking Concept Removals for Benign Text-to-image Diffusion Models [58.7] テキスト・ツー・イメージ(T2I)拡散モデルは、テキスト・プロンプトと密接に対応した画像を生成する際、例外的な機能を示す。
モデルは、暴力やヌードの画像を生成したり、不適切な文脈で公共の人物の無許可の肖像画を作成するなど、悪意ある目的のために利用することができる。
悪質な概念や望ましくない概念の発生を防ぐために拡散モデルを変更する概念除去法が提案されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:56:07 GMT)
DuCos: Duality Constrained Depth Super-Resolution via Foundation Model [56.9] ラグランジアン双対性理論に基づく新しい深度超解像フレームワークであるDuCosを紹介する。
DuCosは、ファンデーションモデルをプロンプトとして、さまざまなシナリオにおける一般化を著しく改善した最初の企業だ。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:25:05 GMT)
Incremental Object Detection with Prompt-based Methods [56.4] 視覚的プロンプトに基づく手法は、画像分類におけるインクリメンタルラーニング(IL)への関心が高まっている。
このような手法をインクリメンタルオブジェクト検出(IOD)に適用する以前の研究は、その一般化性は明らかになっていない。
本稿では,複雑なドメイン・インクリメンタル・ラーニング・セッティングの下で,3種類のプロンプトベースの手法を解析する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:34:31 GMT)
Is Contrastive Distillation Enough for Learning Comprehensive 3D Representations? [56.0] クロスモーダル・コントラスト蒸留は近年,有効3次元表現の学習のために研究されている。
既存の手法は主にモーダリティ共有の特徴に焦点を合わせ、事前学習過程におけるモーダリティ固有の特徴を無視している。
本稿では,これらの欠点に対処する新しいフレームワークCMCRを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:53:13 GMT)
A Systematic Survey of Model Extraction Attacks and Defenses: State-of-the-Art and Perspectives [55.6] 近年の研究では、敵が対象モデルの機能を複製できることが示されている。
モデル抽出攻撃は知的財産権、プライバシー、システムのセキュリティに脅威をもたらす。
本稿では,攻撃機構,防衛手法,計算環境に応じてMEAを分類する新しい分類法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:49:59 GMT)
Reasoning is about giving reasons [55.6] 高い精度の3つの一般的な推論データセットにおいて、自然言語の引数の論理構造を同定し、抽出できることが示される。
我々のアプローチは、自然言語の引数の論理構造に依存するあらゆる推論形式をサポートする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:26:53 GMT)
Non-representable quantum measures [55.2] 次数-$d$測度 a $sigma$-algebra $mathcalAsubseteq 2X$ over a set $X$ は弱加法的型条件の階層の1つを満たす測度の一般化である。
署名されたすべてのpoly measure $lambda$ on $(X,mathcalA)d$は、その対角的な$widetildelambda(A):=lambda(A,cdots,A)$としてグレード$d$測度を生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:47:24 GMT)
Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [54.7] 本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。
異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。
我々は、最先端のPTQ手法を実装し、複数のタスクタイプとモデル変種を包括的に評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:59:51 GMT)
MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [54.5] ディープフェイクは、最近、国民の間で重大な信頼問題とセキュリティ上の懸念を提起した。
ViT法はトランスの表現性を生かし,優れた検出性能を実現する。
この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:55:11 GMT)
SAND: Boosting LLM Agents with Self-Taught Action Deliberation [54.5] 大規模言語モデル(LLM)エージェントは、通常、ReActスタイルの専門家軌道の教師付き微調整や、ペアのロールアウトよりも好みの最適化で調整される。
本稿では,自己学習型アクチオN審議(SAND)フレームワークを提案する。
SANDは、初期教師付き微調整よりも平均20%改善し、また最先端のエージェントチューニングアプローチより優れている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:10:48 GMT)
Deceptive Sequential Decision-Making via Regularized Policy Optimization [54.4] 我々は,自律的なシステムをマルコフ決定プロセスとしてモデル化し,逆強化学習を用いて報酬関数を復元する。
本稿では,システム報酬に対する敵意を積極的に欺く政策合成問題に対する3つの規則化戦略を示す。
我々は,その最適かつ非知覚的価値の少なくとも97%の累積報酬を達成しつつ,反逆的,標的的,公平な詐欺が虚偽の信念に逆らうことを示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:19:50 GMT)
ShizhenGPT: Towards Multimodal LLMs for Traditional Chinese Medicine [53.9] 我々は、中国伝統医学(TCM)に適した最初の多モーダル言語モデルであるシージエンGPTを提示する。
シッシェンGPTは、深いTCM知識とマルチモーダル推論を達成するために、事前訓練され、訓練されている。
実験によると、ShizhenGPTはLLMよりも優れており、より大きなプロプライエタリモデルと競合する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:30:20 GMT)
UST-SSM: Unified Spatio-Temporal State Space Models for Point Cloud Video Modeling [53.2] ポイントクラウドビデオは、光と視点の変化の影響を低減しつつ3Dの動きを捉え、微妙で連続した人間の行動を認識するのに非常に効果的である。
SSM(Selective State Space Models)は、線形複雑性を伴うシーケンスモデリングにおいて優れた性能を示す。
我々は,SSMの最新の進歩をクラウドビデオに向け,統一時空間モデル(UST-SSM)を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:46:01 GMT)
Forgetting: A New Mechanism Towards Better Large Language Model Fine-tuning [51.9] Supervised Fine-tuning (SFT) は、事前訓練された大規模言語モデル (LLM) において重要な役割を果たす。
各コーパス内のトークンを、モデルパフォーマンスを改善するのに有用かどうかに基づいて、正と負の2つの部分に分類することを提案する。
我々は、よく確立されたベンチマークで実験を行い、この忘れるメカニズムが全体のモデル性能を向上するだけでなく、より多様なモデル応答を促進することを発見した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:26:21 GMT)
Towards the Use of Saliency Maps for Explaining Low-Quality Electrocardiograms to End Users [51.6] 診断に医用画像を使用する場合,画像が高品質であることが重要である。
遠隔医療において一般的な問題は、患者が診療所を退院した後にのみ、品質問題が警告されることである。
本稿では,低品質な医用画像をリアルタイムにフラグ付け,説明するためのAIシステムの開発について報告する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:08:27 GMT)
Bridging the Mobile Trust Gap: A Zero Trust Framework for Consumer-Facing Applications [51.6] 本稿では,信頼できないユーザ制御環境で動作するモバイルアプリケーションを対象としたZero Trustモデルを提案する。
デザインサイエンスの方法論を用いて、この研究は、実行時の信頼の強制をサポートする6つのピラーフレームワークを導入した。
提案したモデルは,デプロイ前コントロールを越えてモバイルアプリケーションをセキュアにするための,実用的で標準に準拠したアプローチを提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:42:36 GMT)
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models [51.1] 視覚生成モデルの評価には時間を要するし、計算コストもかかる。
本研究では,効率的,動的,多ラウンドな評価に人間的な戦略を用いる評価エージェントフレームワークを提案する。
1)効率性、2)多様なユーザニーズに合わせた迅速な評価、3)1つの数値スコア以上の説明可能性、4)さまざまなモデルやツールのスケーラビリティ。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:39:27 GMT)
Large Foundation Model for Ads Recommendation [50.7] 広告レコメンデーションのための全表現多言語移動フレームワーク LFM4Ads を提案する。
LFM4AdsはTencentの産業規模の広告プラットフォームで成功している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:18:01 GMT)
What Makes for Good Image Captions? [50.5] 我々のフレームワークは、優れた画像キャプションは、情報的に十分であり、最小限の冗長であり、人間によって容易に理解できるという3つの重要な側面のバランスをとるべきであると仮定している。
本稿では,局所的な視覚情報とグローバルな視覚情報を統合することで,豊かなキャプションを生成するParamid of Captions(PoCa)手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:41:38 GMT)
MS-CLR: Multi-Skeleton Contrastive Learning for Human Action Recognition [49.9] Multi-Skeleton Contrastive Learning (MS-CLR)は、同じシーケンスから抽出された複数のスケルトン規則間でポーズ表現を整列するフレームワークである。
MS-CLRは、強いシングルスケルトンコントラスト学習ベースラインよりも一貫してパフォーマンスを向上する。
マルチスケルトンアンサンブルはパフォーマンスをさらに向上させ、両方のデータセットに新たな最先端結果を設定する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:58:03 GMT)
Non-asymptotic bounds for forward processes in denoising diffusions: Ornstein-Uhlenbeck is hard to beat [49.2] 本稿では,全変動(TV)における前方拡散誤差の非漸近的境界について述べる。
我々は、R$からFarthestモードまでの距離でマルチモーダルデータ分布をパラメライズし、加法的および乗法的雑音による前方拡散を考察する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:57:26 GMT)
Machine Learning Approaches to Vocal Register Classification in Contemporary Male Pop Music [49.2] ポップミュージックでは、1人のアーティストが好みの質を達成するために様々な音色やテクスチャを使用する場合があり、歌手が使用するボーカル範囲内でのボーカルレジスタを特定することは困難である。
本稿では,メル・スペクトログラム画像のテクスチャ的特徴の分析を通じて,男性ポップミュージックの音声信号に声帯を分類する2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:44:02 GMT)
Argumentation for Explainable Workforce Optimisation (with Appendix) [48.8] 産業アプリケーションにおける抽象的な議論として労働管理を理解することにより、変化に適応し、忠実な説明を得ることができることを示す。
ユーザスタディでは、手作業による従来のソリューションよりも、私たちのツールと説明がより高速で正確な問題解決につながることが示されています。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:07:05 GMT)
On the notion of missingness for path attribution explainability methods in medical settings: Guiding the selection of medically meaningful baselines [48.7] 臨床的に正常ではあるが入力クローズ・カウンティファクトは、医療データに有意な特徴が欠如していることのより正確な表現である、と我々は主張する。
我々は,3つの異なる医療データセットに対するアプローチを評価し,反事実的ベースラインがより忠実で医療に関係のある属性をもたらすことを実証的に実証した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:13:41 GMT)
Towards LLM-generated explanations for Component-based Knowledge Graph Question Answering Systems [46.9] 本稿では,質問応答システム(QA)について説明する。
本稿では,コンポーネントの入力および出力データフローを動作を表現するためのソースとして考えるアプローチを提案する。
実験では,テンプレートベースの設定(ベースライン)や,異なる設定のLarge Language Models (LLM) を用いて説明を生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:14:48 GMT)
Pixie: Fast and Generalizable Supervised Learning of 3D Physics from Pixels [46.8] PIXIEは一般的なニューラルネットワークをトレーニングし、監督された損失を使って、複数のシーンにわたる物理的特性を3D視覚的特徴から予測する。
PIXIE は約 1.46-4.39 倍良く、テスト時間最適化法よりも桁違いに高速である。
CLIPのような事前訓練済みの視覚機能を活用することで、合成データのみをトレーニングしたにも関わらず、実世界のシーンにゼロショットで一般化することが可能になる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:24:04 GMT)
On the Role of Entity and Event Level Conceptualization in Generalizable Reasoning: A Survey of Tasks, Methods, Applications, and Future Directions [46.6] 本稿では,概念化されるインスタンスのタイプに基づいて,異なる概念化のタイプを4つのレベルに分類する。
本稿では,150以上の論文を包括的に調査し,概念化に関連するさまざまな定義,リソース,手法,下流アプリケーションについて調査する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:24:04 GMT)
Interpretable Evaluation of AI-Generated Content with Language-Grounded Sparse Encoders [46.5] Language-Grounded Sparses (LanSE)は、解釈可能な評価指標を作成する新しいアーキテクチャである。
LanSEは、生成品質、プロンプトマッチ、ビジュアルリアリズム、物理的妥当性、コンテンツ多様性の4つの重要な次元を定量化する、きめ細かい評価フレームワークを提供する。
LanSEは、解釈可能性と実用的な評価ニーズをブリッジすることによって、生成AIモデルのすべてのユーザに、モデル選択、合成コンテンツの品質管理、モデル改善のための強力なツールを提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:50:15 GMT)
Dynamic watermarks in images generated by diffusion models [46.1] 高忠実度テキストから画像への拡散モデルが視覚コンテンツ生成に革命をもたらしたが、その普及は重大な倫理的懸念を提起している。
本稿では,拡散モデルのための新しい多段階透かしフレームワークを提案する。
我々の研究は、モデルオーナシップの検証と誤用防止のためのスケーラブルなソリューションを提供することで、AI生成コンテンツセキュリティの分野を前進させます。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:14:01 GMT)
GLOV: Guided Large Language Models as Implicit Optimizers for Vision Language Models [44.8] GLOVは、大型言語モデル(LLM)が視覚言語モデル(VLM)の暗黙エンコーダとして機能することを可能にする。
GLOVは、オブジェクト認識のためのデュアルエンコーダ(CLIP)とVLデコーダ(LlaVA)モデルに対して、最大15.0%と57.5%の性能向上を示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:02:24 GMT)
TAIGen: Training-Free Adversarial Image Generation via Diffusion Models [44.6] 生成モデルからのアドリアック攻撃は、しばしば低品質の画像を生成し、かなりの計算資源を必要とする。
本稿では,効率的な対向画像生成のためのトレーニング不要なブラックボックス手法であるTAIGenを紹介する。
我々は,緑と青のチャネル上でのGradCAM誘導摂動を用いて,注意マップを赤チャネルに適用する選択的なRGBチャネル戦略を開発した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:21:51 GMT)
Generalizable Engagement Estimation in Conversation via Domain Prompting and Parallel Attention [44.5] 本稿では, DAPA(Domain-Adaptive Parallel Attention)を提案する。
DAPAは、学習可能なドメイン固有ベクトルを入力に先延ばしすることで、Domain Promptingメカニズムを導入する。
インタラクションの同期をキャプチャするために、Parallel Cross-Attentionモジュールも組み込まれている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:10:03 GMT)
Seeing Further on the Shoulders of Giants: Knowledge Inheritance for Vision Foundation Models [43.5] ビジョンファウンデーションモデル(VFM)は、主にデータ中心の手法を用いて開発されている。
多くのオープンソースビジョンモデルは、ドメイン固有のデータに基づいて事前訓練されている。
本稿では,共同知識の伝達と保存を通じてVFMを訓練するためのモデル駆動型アプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:30:23 GMT)
Rethinking the Potential of Layer Freezing for Efficient DNN Training [43.5] ネットワークトレーニングのコストを効果的に削減するための有望な手法として,レイヤ凍結技術が注目されている。
従来の凍結法では、凍結しない層の特徴マップを生成するために、前方伝播には凍結層が依然として必要である。
凍結した層から特徴マップを新しいデータセットとしてキャッシュし、後続の層が格納された特徴マップ上で直接トレーニングできる仮説解を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:54:41 GMT)
Tinker: Diffusion's Gift to 3D--Multi-View Consistent Editing From Sparse Inputs without Per-Scene Optimization [42.0] 我々は高忠実度3D編集のための多用途フレームワークであるTinkerを紹介する。
Tinkerは、1つか2つの画像から、堅牢でマルチビューで一貫した編集を提供する。
私たちは、Tinkerが真にスケーラブルでゼロショットの3D編集への重要な一歩だと信じています。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:02:59 GMT)
Knowledge Graph-Infused Fine-Tuning for Structured Reasoning in Large Language Models [41.6] 知識グラフ注入に基づく微調整アルゴリズムフレームワークを提案する。
事前訓練された言語モデルに基づいて構築され、補助学習のための構造化グラフ情報を導入している。
構造的推論やエンティティ抽出を含むシナリオにおいて、セマンティック一貫性とコンテキスト論理モデリングがより優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:52:12 GMT)
On the Comprehensibility of Multi-structured Financial Documents using LLMs and Pre-processing Tools [41.1] 本稿では,大規模言語モデル (LLMs) とマルチモーダル大規模言語モデル (MLLMs) の機能について考察する。
MLLM である GPT-4o は, 直接文書を送受信した場合, 複数構造化文書に対して 56% の精度が得られた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:52:35 GMT)
SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents [41.1] 大規模言語モデル(LLM)ベースのエージェントは、最近、複雑な推論とツールの使用において、環境とのマルチステップのインタラクションを通じて印象的な機能を示した。
これらの軌道にはリッチなフィードバックが含まれており、エージェントを正しい方向に誘導して問題を正しく解くことができる。
モンテカルロ木探索 (MCTS) のような一般的な手法は、探索と搾取を効果的にバランスさせることができるが、それらは様々な軌道間の相互依存を無視している。
エージェントが推論プロセスを反復的に最適化できる自己進化フレームワークSE-Agentを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:19:48 GMT)
NoteIt: A System Converting Instructional Videos to Interactable Notes Through Multimodal Video Understanding [40.2] NoteItは、新しいパイプラインを使用して、インストラクショナルビデオを対話可能なノートに自動的に変換するシステムである。
NoteItのインターフェースでは、ユーザはシステムと対話して、ノートの内容やプレゼンテーションフォーマットをさらにカスタマイズすることができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:45:18 GMT)
Diagnosing Memorization in Chain-of-Thought Reasoning, One Token at a Time [39.8] 本稿では,覚書レベル同定のための新しいフレームワークSTIMを紹介する。
ローカルな暗記がしばしばエラーの主要な要因であることを示し、間違ったトークンの最大67%に繋がる。
STIMは、モデル推論の診断と改善のための強力なツールを提供し、他の構造化ステップワイズ生成タスクに一般化することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:05:26 GMT)
Dark Miner: Defend against undesirable generation for text-to-image diffusion models [39.8] 我々は消去タスクを分析し、既存の手法では不要な生成の総確率の最小化を保証できないことを指摘した。
我々は、採掘、検証、回避を含む3段階のプロセスであるダークマイナーを提案する。
本手法は, 従来手法と比較して, 特に複数対逆攻撃において, 消去効果と防御効果が向上する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:18:43 GMT)
Nemotron-CC-Math: A 133 Billion-Token-Scale High Quality Math Pretraining Dataset [38.7] 我々は,Common Crawlから構築した大規模で高品質な数学的コーパスであるNemotron-CC-Mathを紹介する。
我々のパイプラインは、レイアウト対応のレンダリングをlynxとターゲットのクリーニングステージで活用することで、数学を回復する。
ネモトロン-T 8Bモデルの事前トレーニングに使用すると、我々のコーパスはMATHで+14.8ゲイン、MBPP+で+4.6ゲインを得る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:16:57 GMT)
Advancing Language Multi-Agent Learning with Credit Re-Assignment for Interactive Environment Generalization [38.7] 我々は,新しいマルチエージェントクレジット再割り当て戦略を備えたマルチエージェント強化学習フレームワークであるCollabUIAgentsを提案する。
我々は,マルチエージェントシステムの性能と環境横断の一般化性を両立させることを実証した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:42:24 GMT)
Source2Synth: Synthetic Data Generation and Curation Grounded in Real Data Sources [38.3] Source2 Synthは、実世界のデータソースに基盤を置く合成データ生成とキュレーションのためのスケーラブルなアプローチである。
提案手法は,その応答性に基づいて,低品質世代を廃棄することにより,データセットの品質を向上させる。
Wiki上のTQAは25.51%,HotpotQA上のMHQAは22.57%向上した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:27:42 GMT)
Impact of Clinical Image Quality on Efficient Foundation Model Finetuning [37.7] 医用画像の基礎モデルではラベルの効率が期待でき、下流のタスクで高いパフォーマンスを実現している。
可変画像品質がラベル効率の高い微調整に与える影響を,微調整モデルの一般化可能性の定量化により検討する。
以上の結果から,画像品質分布とその微視的ミスマッチがモデル性能に大きく影響していることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:42:48 GMT)
MMAD: Multi-label Micro-Action Detection in Videos [37.0] 本稿では、微妙で低強度な身体運動であるマイクロアクションとして知られる身体動作のサブセットに焦点を当てる。
現実のシナリオでは、人間のマイクロアクションはしばしば時間的に共起し、複数のマイクロアクションが時間内に重複する。
本稿では,ビデオ中のすべてのマイクロアクションを識別する,MMAD(Multi-label Micro-Action Detection)というタスクを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:53:21 GMT)
Efficient Long-duration Talking Video Synthesis with Linear Diffusion Transformer under Multimodal Guidance [37.0] 長期合成は、高品質、ポートレート、時間的一貫性、計算効率を同時に達成する上で、永続的な課題に直面している。
本稿では,マルチモーダルガイダンスと新しいメモリバンク機構を組み込んだトランスフォーマー拡散フレームワークであるLetsTalkを紹介する。
実験により、LetsTalkは時間的コヒーレントでリアルな会話ビデオを実現し、多様性と活力を高めつつ、従来の手法よりも8つのパラメータで顕著な効率を維持していることが示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:34:58 GMT)
Fast simulations of X-ray absorption spectroscopy for battery materials on a quantum computer [36.2] 本研究は,X線吸収のための時間領域アルゴリズムの高度に最適化された実装を提案する。
提案アルゴリズムの低コスト化により,耐故障性量子デバイスを用いた高容量電池陰極の開発・商業化が促進される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:56:21 GMT)
Virtual Community: An Open World for Humans, Robots, and Society [35.8] 私たちは、人間、ロボット、社会のためのオープンワールドプラットフォームであるVirtual Communityを紹介します。
1)ロボットが知的に協力するか、競争するか、2)人間がどのように社会関係を発達させ、コミュニティを構築するか、3)より重要なのは、知的なロボットと人間がオープンな世界でどのように共存できるかである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:59:32 GMT)
FOCUS: Frequency-Optimized Conditioning of DiffUSion Models for mitigating catastrophic forgetting during Test-Time Adaptation [35.3] テスト時適応により、モデルは進化するドメインに適応できる。
ドメインシフトへの適応は、タスク関連知識の忘れを招きかねない。
拡散駆動型入力適応フレームワークにおける周波数ベースの新しい条件付け手法であるFOCUSを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:44:29 GMT)
CUDA-L1: Improving CUDA Optimization via Contrastive Reinforcement Learning [35.1] 本稿では,新しい対照的なRLアルゴリズムを用いた最適化のための自動学習フレームワークを提案する。
--L1は最適化タスクで大幅なパフォーマンス改善を実現します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:41:45 GMT)
CRINN: Contrastive Reinforcement Learning for Approximate Nearest Neighbor Search [35.1] CRINNは,近似近傍探索(ANNS)アルゴリズムの新しいパラダイムである。
CRINNはANNS最適化を、実行速度が報奨信号となる強化学習問題として扱う。
実験により、CRINNは広範に使用されている6つのNNSベンチマークデータセットに対して有効であることが示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:47:01 GMT)
OneLoc: Geo-Aware Generative Recommender Systems for Local Life Service [35.0] ユーザの興味やリアルタイムの位置を考慮に入れたOneLocを提案する。
OneLocは、優れたオフラインおよびオンラインパフォーマンスを達成する。
OneLocはKuaishou Appのローカルライフサービスにデプロイされている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:57:48 GMT)
Lossless Token Sequence Compression via Meta-Tokens [34.8] LZ77と同様のタスク非依存のロスレス圧縮手法を導入し,入力トークン列の長さを平均27%,18%削減する。
提案手法はセマンティクス/構文の厳密な保存を必要とする2つのタスクに対して評価し、既存の損失圧縮手法がこの設定において不十分であることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:19:57 GMT)
Automated Optimization Modeling through Expert-Guided Large Language Model Reasoning [34.7] 我々は、ロジスティクスドメインからの新しい最適化モデリングベンチマークであるLogiORを導入し、標準化されたアノテーションに関するより複雑な問題を解決した。
我々は、プロセスを自動化するチェーンオブ思考推論を通じて、専門家レベルの最適化モデリング原則を活用する新しいフレームワークORThoughtを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:14:54 GMT)
MSNav: Zero-Shot Vision-and-Language Navigation with Dynamic Memory and LLM Spatial Reasoning [34.1] VLN(Vision-and-Language Navigation)は、自然言語の命令を解釈し、複雑な環境をナビゲートするエージェントである。
現在のアプローチでは、単一の大規模言語モデル(LLM)がエンドツーエンドで決定する、"ブラックボックス"パラダイムを採用することが多い。
3つのモジュールを相乗的アーキテクチャに融合するフレームワークであるメモリ空間ナビゲーション(MSNav)を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:41:22 GMT)
Causal Mechanism Estimation in Multi-Sensor Systems Across Multiple Domains [34.0] 本稿では,複数の領域にまたがる異種データから因果関係を推定する新しい3段階のアプローチを提案する。
因果転移学習(Causal Transfer Learning, CTL)の原理を活用することで, CICMEは十分なサンプルが与えられた場合に, ドメイン不変因果機構を確実に検出することができる。
CICMEは、プールされたデータに因果探索を適用し、各ドメインのデータに繰り返し適用することで利点を生かし、特定のシナリオ下では両方のベースライン手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:29:46 GMT)
Generative AI Against Poaching: Latent Composite Flow Matching for Wildlife Conservation [33.4] 密猟は野生生物や生物多様性に重大な脅威をもたらす。
密猟者の行動予測は、パトロール計画やその他の保護介入を通知することができる。
生成モデリングの最近の進歩は、より柔軟な代替手段を提供する。
実際のポーチデータのトレーニングでは、ポーチイベントの不完全な検出と限られたデータという、2つの中心的な障害に直面している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:35:51 GMT)
ISCA: A Framework for Interview-Style Conversational Agents [32.9] インタビュースタイルの会話エージェントを実装するための非生成システムを提案する。
ユースケースには、会話の流れに対する制御や標準化が望まれる姿勢形成や行動変化を追跡するアプリケーションが含まれる。
私たちのコードはオープンソースで、他の人が作業から構築し、追加機能の拡張を開発することができます。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:38:01 GMT)
MinD: Learning A Dual-System World Model for Real-Time Planning and Implicit Risk Analysis [32.1] 我々は、リアルタイム・リスク対応計画のためのデュアルシステム・ワールドモデルであるManipulate in Dream (MinD)を提案する。
MinDは2つの非同期拡散プロセスを使用する: 将来のシーンを予測する低周波ビジュアルジェネレータ(LoDiff)とアクションを出力する高周波拡散ポリシー(HiDiff)である。
私たちの重要な洞察は、ロボットポリシーが完全に認知されたフレームを必要とせず、単一の認知ステップで生成された低解像度の潜伏剤に頼ることができるということです。
MinDがRL-Benchで63%の成功率、実世界のFrankaタスクで60%、11.3FPSで稼働
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:07:13 GMT)
Potential and challenges of generative adversarial networks for super-resolution in 4D Flow MRI [31.7] GAN(Generative Adversarial Network)は、医学的でない超解像タスクにおいて、シャープな境界を復元する強力な機能を提供する。
GAN(Generative Adversarial Network)は、医学的でない超解像度タスクにおいて、シャープな境界を復元する強力な能力を示す、魅力的なソリューションを提供する。
その結果,提案したGANは非逆参照よりも壁面近傍の速度回復を改善できた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:07:23 GMT)
TransLight: Image-Guided Customized Lighting Control with Generative Decoupling [31.6] 我々は,光効果の高忠実かつ高自由度転送を可能にする新しいフレームワークであるTransLightを提案する。
まず,2つの微調整拡散モデルを用いて画像内容と光効果を正確に分離する生成デカップリングについて述べる。
次に、IC-Lightを生成モデルとし、基準照明画像を付加条件信号として注入し、三重項でモデルを訓練する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:05:12 GMT)
Improved Mapping Between Illuminations and Sensors for RAW Images [31.2] 照明とセンサマッピングのための軽量ニューラルネットワークアプローチを提案する。
私たちのデータセットには390の照明、4つのカメラ、18のシーンがあります。
ニューラルISPをトレーニングする下流タスクに対する我々のアプローチの有用性を実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:23:23 GMT)
MeshCoder: LLM-Powered Structured Mesh Code Generation from Point Clouds [30.7] MeshCoderは、ポイントクラウドから編集可能なBlender Pythonスクリプトに複雑な3Dオブジェクトを再構築する新しいフレームワークである。
我々は、3Dポイントクラウドを実行可能なBlender Pythonスクリプトに変換するマルチモーダルな大規模言語モデル(LLM)を訓練する。
本手法は形状と符号の再構成作業において優れた性能を実現し,直感的な幾何学的および位相的編集を容易にする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:50:15 GMT)
Structure As Search: Unsupervised Permutation Learning for Combinatorial Optimization [30.7] 本稿では,トラベリングセールスマン問題に対する非自己回帰的枠組みを提案する。
ハミルトンサイクルに類似性変換を適用することにより、モデルは連続緩和を通じて置換を近似することを学ぶ。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:25:21 GMT)
Translating Images to Road Network: A Sequence-to-Sequence Perspective [30.6] 道路網は高精細地図の生成に不可欠である。
既存のメソッドは、2つのタイプのデータドメインを効果的にマージするのに苦労しています。
我々は、ユークリッドデータと非ユークリッドデータの両方をRoadNet Sequenceと呼ばれる整数列に投影することで、両方のデータ領域の統一表現を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:47:40 GMT)
Marrying Autoregressive Transformer and Diffusion with Multi-Reference Autoregression [30.6] 本稿では,Autoregressive (AR) Transformerと拡散モデルを組み合わせた最初の画像生成モデルであるTransDiffを紹介する。
TransDiffはラベルと画像を高レベルのセマンティックな特徴にエンコードし、拡散モデルを用いて画像サンプルの分布を推定する。
ImageNet 256x256ベンチマークでは、TransDiffはスタンドアロンのARトランスフォーマーや拡散モデルに基づいて、他の画像生成モデルよりも大幅に優れている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:57:17 GMT)
Adversarial Generation and Collaborative Evolution of Safety-Critical Scenarios for Autonomous Vehicles [30.2] シミュレーションにおける安全クリティカルシナリオの生成は、社会に道路が配備される以前、自動運転車の安全性評価においてますます重要になっている。
我々は,新たなシナリオを推論し,複雑なトラフィックフローでそれらを増幅することにより,多彩な安全クリティカルシナリオを生成できるフレームワークであるScenGEを提案する。
実世界の車両テストと人間による評価を通じて、我々のフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:36:57 GMT)
Length Representations in Large Language Models [29.5] 本研究では,大言語モデルの内部表現に出力シーケンス長情報をエンコードする方法に関する実証的証拠を提供する。
モデル内の特定の隠蔽単位をスケーリングすることにより、生成したテキストの情報量を失うことなく、出力シーケンス長を制御できる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:32:57 GMT)
HERAKLES: Hierarchical Skill Compilation for Open-ended LLM Agents [29.4] HERAKLESは、2段階の階層的オートテリックエージェントによって、マスタ化された目標を低レベルポリシーに継続的にコンパイルすることを可能にするフレームワークである。
目標の複雑さを効果的にスケールし、スキルコンパイルによるサンプル効率を改善し、エージェントが時間とともに新しい課題に頑健に適応できるようにする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:50:28 GMT)
Virtual Multiplex Staining for Histological Images using a Marker-wise Conditioned Diffusion Model [29.4] マルチプレックスイメージングは、組織サンプル内の複数のバイオマーカーの同時可視化を可能にすることで、病理に革命をもたらす。
多重データ取得の複雑さとコストは、その普及を妨げている。
既存の大規模なH&E画像のリポジトリには、対応する多重画像がない。
本稿では,仮想多重染色のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:54:58 GMT)
XFinBench: Benchmarking LLMs in Complex Financial Problem Solving and Reasoning [29.0] 金融問題の解決における大規模言語モデルの能力を評価するための新しいベンチマークであるXFinBenchを紹介する。
O1は67.3%の精度で最高性能のテキストのみのモデルであるが、それでも12.5%の人間専門家にはかなり遅れている。
我々は,知識増強分析のための3,032の財務用語を持つ知識銀行を構築し,関連する知識が小さなオープンソースモデルに一貫した精度の向上をもたらすことを発見した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:23:35 GMT)
D^3-Talker: Dual-Branch Decoupled Deformation Fields for Few-Shot 3D Talking Head Synthesis [28.9] 3Dトーキングヘッド合成における重要な課題は、スクラッチから新しいモデルをトレーニングするために、長期にわたるトーキングヘッドビデオに依存することである。
近年,事前学習モデルを用いて音声から一般特徴を抽出し,この問題に対処する手法が提案されている。
本稿ではD3-Talkerを提案する。これは静的な3次元ガウス属性場を構築し,音声信号と顔信号を用いた新しいアプローチである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:12:33 GMT)
A Little Human Data Goes A Long Way [28.8] Fact Verification (FV) と Question Answering (QA) における合成データの利用について検討する。
純粋に合成されたデータに基づいてトレーニングされたモデルは、125個の人為的なデータポイントを含むことで、確実に改善できることがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:59:58 GMT)
Learnable Kernel Density Estimation for Graphs [28.6] グラフ密度推定の鍵となる課題は、構造パターンと意味的バリエーションの両方を捉えることである。
本研究は,グラフのカーネル密度推定を学習するLGKDEフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:50:41 GMT)
Ouroboros: Single-step Diffusion Models for Cycle-consistent Forward and Inverse Rendering [28.3] Ouroborosは2つの単一ステップ拡散モデルからなるフレームワークであり、相互強化により前方および逆レンダリングを処理する。
我々は,Ouroborosが動画分解に訓練なしで移行でき,ビデオシーケンスの時間的不整合を低減できることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:32:44 GMT)
Bench2ADVLM: A Closed-Loop Benchmark for Vision-language Models in Autonomous Driving [28.2] VLM(Vision-Language Models)は、自律運転(AD)において有望なパラダイムとして登場した。
VLMベースのADシステム(ADVLM)の現在の性能評価プロトコルは、静的入力を伴うオープンループ設定に限られている。
シミュレーションと物理プラットフォーム間のリアルタイム・インタラクティブなADVLM評価のための階層型クローズドループ評価フレームワークであるBench2ADVLMを紹介した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:27:04 GMT)
Hands-On: Segmenting Individual Signs from Continuous Sequences [28.0] 本稿では,署名とフレームセグメンテーションの時間ダイナミクスをモデル化したトランスフォーマーアーキテクチャを提案する。
我々のモデルはDGS Corpusの最先端結果を達成する一方、我々の機能はBSLCorpusの以前のベンチマークを上回る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:22:19 GMT)
Enhancing Depression-Diagnosis-Oriented Chat with Psychological State Tracking [28.0] Depression-diagnosis-oriented chatは、自己表現の患者を誘導し、うつ病検出の主要な症状を収集することを目的としている。
最近の研究は、面接に基づくうつ病の診断をシミュレートするために、タスク指向対話とchitchatを組み合わせることに焦点を当てている。
対話をガイドするための明確なフレームワークは検討されていない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:28:53 GMT)
Feature Distillation is the Better Choice for Model-Heterogeneous Federated Learning [27.8] モデルヘテロジニアス・フェデレート・ラーニング(Hetero-FL)は、異種モデルからの知識を収集し、ローカルにプライベートデータを保持する能力に注目が集まっている。
クライアントからの知識を集約するため,グローバルアグリゲーションの後に,広範に利用され有効な技術であるアンサンブル蒸留が,グローバルモデルの性能を高めるためにしばしば用いられる。
そこで本研究では,新たな機能ベース・アンサンブル型知識蒸留パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:59:30 GMT)
ReSpark: Leveraging Previous Data Reports as References to Generate New Reports with LLMs [27.3] ReSparkは、既存のレポートから分析ロジックをリバースエンジニアリングし、新しいデータセットに適応するシステムである。
比較およびユーザスタディを通じてReSparkを評価し,既存の解析コードに頼ることなく,データレポート生成の障壁を低くする効果を実証した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:44:52 GMT)
Fine-grained Image Quality Assessment for Perceptual Image Restoration [26.9] 画像復元のための画像品質評価データセットFGRestoreについて述べる。
既存のIQA測定値に対してベンチマークを行い,スコアベースIQA評価と微粒化復元品質の相違点を明らかにした。
画像復元に特化して設計された新しいIQAモデルであるFGResQを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:58:32 GMT)
Latent Interpolation Learning Using Diffusion Models for Cardiac Volume Reconstruction [26.8] 心臓共鳴画像(CMR)は心血管疾患の診断・管理に重要なツールである。
その効用は、しばしば2D短軸スライスをスパースに取得することで制限され、不完全なボリューム情報をもたらす。
既存の手法では、事前定義されたスキームへの依存、計算の非効率性、追加入力への依存など、課題に直面している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:09:09 GMT)
TransLLM: A Unified Multi-Task Foundation Framework for Urban Transportation via Learnable Prompting [26.8] 大規模ディープラーニングモデルはタスクハングリーとデータハングリーであり、さまざまなシナリオにおける一般化性を制限する。
学習可能なプロンプト合成により,大規模言語モデルとモデリングを統合した統合フレームワークであるTransLLMを提案する。
提案手法は,拡張時間畳み込みと2つの隣接グラフアテンションネットワークによって複雑な依存関係をキャプチャする軽量エンコーダを備える。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:27:49 GMT)
Diverse Negative Sampling for Implicit Collaborative Filtering [26.6] 負のトレーニングデータにおける多様性を考慮したDivNS(Diverse Negative Smpling)を提案する。
DivNSは、大きな好みスコアを持つハードネガティブアイテムを見つけ、ユーザ固有のキャッシュを構築する。
キャッシュからさまざまなネガティブアイテムのサブセットを選択し、ユーザのハードネガティブとの相違を保証します。
結果として得られる合成陰性は情報的かつ多様であり、推薦者はより広い項目空間を学習し、その一般化性を向上させることができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:48:54 GMT)
Handle-based Mesh Deformation Guided By Vision Language Model [26.6] トレーニング不要なハンドベースメッシュ変形法を提案する。
我々は、視覚言語モデルを利用してハンドルベースのインタフェースを解釈し、操作する。
私たちのアプローチは、高品質なメッシュ変形を一貫して提供します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:28:36 GMT)
Non-Equilibrium Criticality-Enhanced Quantum Sensing with Superconducting Qubits [26.5] 量子的特徴の爆発により、古典的なセンサーの容量をはるかに超える精度で外部パラメータを推定できる。
量子臨界度は、プローブサイズに関してそのような拡張を達成するための資源として特定されている。
非平衡プローブは力学を応用し、幅広いパラメータの時間に対する量子強調精度を実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:14:20 GMT)
Agent RL Scaling Law: Agent RL with Spontaneous Code Execution for Mathematical Problem Solving [26.4] 大規模言語モデル(LLM)は、正確で検証可能な計算を必要とする数学的推論タスクに苦慮することが多い。
結果に基づく報酬から強化学習(RL)がテキストベースの推論を強化する一方で、エージェントがコード実行のような外部ツールを活用するために自律的に学習する方法を理解することは依然として重要である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:20:55 GMT)
GM-Skip: Metric-Guided Transformer Block Skipping for Efficient Vision-Language Models [26.2] GM-Skipは、Transformerブロックスキップのためのフレキシブルでメトリック適応的なフレームワークである。
出力品質を維持しながらVLM推論を高速化する。
自動運転車に統合された場合、単一物体検出において最大45.4%の遅延低減を実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:53:28 GMT)
Reversible Unfolding Network for Concealed Visual Perception with Generative Refinement [26.2] 我々は、RUN++と呼ばれる、生成的洗練を伴う可逆的展開ネットワークを提案する。
Run++はまずCVPタスクを数学的最適化問題として定式化し、反復的なソリューションを多段階のディープネットワークに展開する。
このアプローチは、結果として生じる不確実性を解決するために拡散モデルを活用しながら、マスクとRGBドメインの両方にわたって可逆的モデリングを適用するための原則化された方法を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:45:40 GMT)
MAViS: A Multi-Agent Framework for Long-Sequence Video Storytelling [25.6] MAViSは、長期的なビデオストーリーテリングのためのエンドツーエンドのコラボレーティブフレームワークである。
スクリプト作成、ショットデザイン、キャラクターモデリング、生成、ビデオアニメーション、オーディオ生成など、複数のステージにまたがる特殊エージェントを編成する。
短いユーザープロンプトだけで、MAViSは高品質で表現力のあるロングシーケンスなビデオストーリーテリングを制作できる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:50:55 GMT)
Learning to Restore Heisenberg Limit in Noisy Quantum Sensing via Quantum Digital Twin [25.6] 量子センサーは非古典的資源を活用し、ハイゼンベルク限界でのセンシング精度を達成する。
重要な問題は、環境騒音が急激なデコヒーレンスを引き起こし、ハイゼンベルク限界の実現可能性を制限することである。
本稿では,この問題を克服するための量子デジタルツインプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:52:47 GMT)
Locality-aware Concept Bottleneck Model [25.4] 概念ボトルネックモデル(CBM)は、人間の理解可能な視覚的手がかりに基づいて予測を行う、本質的に解釈可能なモデルである。
そこで我々は,空間的局所性を保証するためにプロトタイプ学習を採用するLCBM(Locality-aware Concept Bottleneck Model)というフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:33:48 GMT)
Counterspeech for Mitigating the Influence of Media Bias: Comparing Human and LLM-Generated Responses [24.8] バイアスドニュースは社会的分極に寄与し、しばしば敵対的な読者のコメントによって補強される。
我々の研究は、攻撃的なコメントが偏見のあるコンテンツをサポートし、偏見を増幅し、標的とするグループや個人に害を与えることを明らかにした。
カウンタースピーチは、言論の自由を侵害することなく、このような有害な言論に対抗する効果的なアプローチである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:34:27 GMT)
CaRL: Learning Scalable Planning Policies with Simple Rewards [24.5] 強化学習はスケーラブルで、模倣学習のような複雑なエラーに苦しむことはない。
ミニバッチサイズが大きくなると、PPOはこれらの報酬の一般的なバージョンを最適化できないことを示す。
本稿では,1つの直感的な報酬項,すなわち経路完了を最適化する新しい報酬設計を提案する。
PPOは、私たちの単純な報酬でトレーニングされた場合、より高いミニバッチサイズでスケールでき、パフォーマンスも向上します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:00:45 GMT)
DocHop-QA: Towards Multi-Hop Reasoning over Multimodal Document Collections [23.4] 本稿では,マルチモーダル,マルチドキュメント,マルチホップ質問応答のための大規模ベンチマークであるDocHop-QAを提案する。
DocHop-QAはドメインに依存しないもので、テキストパス、テーブル、構造的なレイアウトキューなど、さまざまな情報フォーマットが組み込まれている。
我々は,構造化インデックス予測,生成応答,マルチモーダル統合の4つのタスクを通してDocHop-QAを評価した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:17:45 GMT)
DreamSwapV: Mask-guided Subject Swapping for Any Customized Video Editing [22.5] 本稿では,任意の動画の被写体をユーザ指定のマスクや参照画像に置き換えるマスク誘導・被写体非依存・エンドツーエンドのフレームワークを提案する。
我々のDreamSwapVは既存の手法よりも優れており、VBenchインジケータに関する包括的な実験によって検証されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:40:34 GMT)
ZPD-SCA: Unveiling the Blind Spots of LLMs in Assessing Students' Cognitive Abilities [22.5] 大規模言語モデル(LLM)は、教育応用の可能性を示しているが、読み物の認知的アライメントを正確に評価する能力は、まだ十分に研究されていない。
ステージレベルの中国語読解難易度を評価するための新しいベンチマークであるZPD-SCAを紹介する。
実験の結果,LLMはゼロショット学習のシナリオでは不十分であり,Qwen-max と GLM はランダムな推測の確率よりも低い値を示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:08:47 GMT)
aiXiv: A Next-Generation Open Access Ecosystem for Scientific Discovery Generated by AI Scientists [22.3] 私たちは、人間とAI科学者のための次世代オープンアクセスプラットフォームであるaiXivを紹介します。
我々の研究は、AI科学者のための次世代のオープンアクセスエコシステムの基礎を築いた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:16:41 GMT)
DEPTH: Hallucination-Free Relation Extraction via Dependency-Aware Sentence Simplification and Two-tiered Hierarchical Refinement [22.2] DEPTHは、関係抽出パイプラインに依存性を意識したsEntence simPlificationと2階層階層改良を統合するフレームワークである。
以上の結果から,DEPTHは平均幻覚率を7.0%まで下げる一方で,最先端のベースラインよりも平均F1スコアを17.2%向上させることを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:35:24 GMT)
The Man Behind the Sound: Demystifying Audio Private Attribute Profiling via Multimodal Large Language Model Agents [21.7] 本研究は,マルチモーダル大言語モデル(MLLM)に関連する新たなプライバシーリスクを明らかにする。
オーディオ・プライベート・属性・プロファイリングと呼ぶ手法であるオーディオ・データから機密性の高い個人属性を推測する能力は重大な脅威となる。
音声言語モデル(ALM)と大規模言語モデル(LLM)の相補的な長所を利用して推論能力を向上させるハイブリッドマルチエージェントフレームワークであるGiftsを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:04:41 GMT)
Towards Source-Free Machine Unlearning [21.5] 本稿では,学習を効率化するために重要な要素である未知のトレーニングデータのヘシアンを推定する手法を提案する。
提案手法は,ゼロショット・アンラーニングを効果的に行うとともに,アンラーニング性能に関する理論的確証を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:29:51 GMT)
Chain of Correction for Full-text Speech Recognition with Large Language Models [21.4] Chain of Correction (CoC) は、セグメンテーションごとにエラーセグメントを補正するマルチターンチャットフォーマットである。
実験により、CoCはフルテキストASR出力の修正において、ベースラインやベンチマークシステムよりも大幅に優れていることが示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:50:14 GMT)
Coupling without Communication and Drafter-Invariant Speculative Decoding [21.2] 通信不要のプロトコルは、emphCSDスキームのコントラクトに使用できる。
通信不要なプロトコルは,emphCSDスキームのコントラクトに利用できることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:38:08 GMT)
CurveFlow: Curvature-Guided Flow Matching for Image Generation [21.1] 既存の整流流モデルは、データと雑音分布の間の線形軌跡に基づいている。
この線形性はゼロ曲率を強制し、データ多様体の低確率領域を通して画像生成プロセスを必然的に強制することができる。
フローパスに曲率誘導を組み込むことで、スムーズで非線形な軌道を学習するための新しいフローマッチングフレームワークであるCurveFlowを紹介した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:06:13 GMT)
MoVieDrive: Multi-Modal Multi-View Urban Scene Video Generation [20.9] 本稿では,自律運転におけるマルチモーダルなマルチビュービデオ生成手法を提案する。
本手法では,マルチモーダルなマルチビュードライビングシーン映像を統一的なフレームワークで生成する。
実世界の自律走行データセットであるnuScenesに関する我々の実験は、高い忠実度と制御性でマルチモーダルなマルチビュー都市シーンビデオを生成することができることを示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:51:36 GMT)
Side Effects of Erasing Concepts from Diffusion Models [20.9] 概念消去技術 (Concept Erasure Techniques, CET) は、望ましくない標的の概念の生成を禁止するために開発された。
CETは容易に回避できることを示し、概念消去の副作用をいくつか提示する。
私たちはデータセット、コード、評価ツールをリリースし、堅牢な概念消去に向けた将来の作業を支援します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:16:01 GMT)
A Comprehensive Benchmark on Spectral GNNs: The Impact on Efficiency, Memory, and Effectiveness [20.5] スペクトルニューラルネットワーク(GNN)は、スペクトル領域でグラフ信号を取得する能力によって、人気が高まっている。
我々はスペクトルグラフフィルタとして、スペクトル視点に焦点をあててスペクトルGNNを広範囲にベンチマークする。
我々は、グラフ計算と効率的なトレーニングスキームにより、スペクトル指向の統一フレームワーク内にフィルタを実装した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:15:59 GMT)
Preparation of Hamming-Weight-Preserving Quantum States with Log-Depth Quantum Circuits [20.1] 我々は、量子機械学習におけるその強みを活用した、$psi_textHr = sum_textHW(x)=k alpha_x |xrangle$として定義されるハミング・ウェイト保存状態に注目した。
本稿では,$O(log n)$-depthを$O(m)$アシラリー量子ビットで生成するアルゴリズムを提案する。
具体的には、$n$-qubit木構造およびグリッド構造状態に対して、対応する準備回路における補助量子ビットの数
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:50:13 GMT)
Sharp Generalization for Nonparametric Regression in Interpolation Space by Over-Parameterized Neural Networks Trained with Preconditioned Gradient Descent and Early-Stopping [20.0] 我々は、新しいプレコンディション付きグラディエントDescent(PGD)アルゴリズムを用いてニューラルネットワークを訓練する。
ターゲット関数が空間$[mathcal H_K]s'$ with $s' ge 3$ であるとき、PGD が $mathcal O(n-frac2alpha2alpha+1)$ のシャープ回帰率を達成することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:20:54 GMT)
Linear Preference Optimization: Decoupled Gradient Control via Absolute Regularization [19.9] DPO(Direct Preference Optimization)は、その単純さと訓練安定性から、オフライン優先最適化アルゴリズムとして広く使われている。
3つの重要なイノベーションを特徴とする新しいアライメントフレームワークであるLinear Preference Optimization (LPO)を提案する。
まず,対数シグモイド関数を絶対差分損失に置き換え,最適化力学を分離することで勾配デカップリングを導入する。
第2に、選択された応答品質を維持するために、オフセット制約と正の正則化項を組み合わせることで安定性を向上させる。
第3に、直感的な推定を伴う勾配分離と、その相対確率の降下を線形に制御する調整可能な係数を用いて、制御可能な拒絶抑制を実装した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:17:29 GMT)
Tuning Random Generators: Property-Based Testing as Probabilistic Programming [19.8] プロパティベースのテスト(PBT)は、ランダムに生成された入力に基づいてソフトウェアを評価することで、実行可能な仕様に対してソフトウェアを検証する。
PBTユーザがテストインプットを生成する標準的な方法は、ランダムな選択を通じてテストインプットをサンプルする方法を記述するジェネレータ経由である。
発電機の自動およびオフラインチューニングのための技術を開発する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:45:13 GMT)
Emerson-Lei and Manna-Pnueli Games for LTLf+ and PPLTL+ Synthesis [19.4] DFA技術を利用したグラフ上でのゲームに基づくリアクティブf/PPLTL論理の実際の解法について述べる。
マナ・プヌエリゲームを導入し、マナ・プヌエリの目的をアリーナに埋め込む。
結果は、マンナ・プヌエリのゲームは、一般にはそうではないが、しばしば大きな利点をもたらすことを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:07:43 GMT)
Beyond Semantic Similarity: Reducing Unnecessary API Calls via Behavior-Aligned Retriever [19.3] ツール拡張大型言語モデル(LLM)は、その機能を拡張するために外部関数を活用する。
不正確な関数呼び出しは非効率とコストの増加につながる可能性がある。
既存の手法では、LLMを微調整したり、デモベースのプロンプトを使ってこの問題に対処している。
我々は行動整合性を示す行動整合性レトリバー(BAR)を訓練した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:35:50 GMT)
MultiStream-LLM: Bridging Modalities for Robust Sign Language Translation [19.2] 自動手話翻訳の限界を克服するモジュール型フレームワークであるMultiStream-LLMを紹介する。
本手法は, BLEU-4 スコア 23.5 と 73.2% の精度を持つ How2Sign ベンチマークで, ChicagoFSWildPlus のフィンガースペルスデータセット上で, 新たな最先端性を確立した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:44:47 GMT)
Detecting Reading-Induced Confusion Using EEG and Eye Tracking [18.3] 融合は、新しい情報が読者の理解や事前の知識と矛盾したり、あるいは超えたりすると自然に起こる。
脳波と視線追跡を用いた読影障害のマルチモーダル調査を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:56:17 GMT)
Superpixel-informed Continuous Low-Rank Tensor Representation for Multi-Dimensional Data Recovery [17.6] 低ランクテンソル表現(LRTR)は多次元データ処理の強力なツールとして登場した。
Superpixel-informed Continuous Low-rank Representation (SCTR)フレームワークは、多次元データの連続的かつ柔軟なモデリングを可能にする。
SCTRは、マルチスペクトル画像、ビデオ、カラー画像にまたがる既存のLRTR法よりも3~5dBのPSNRの改善を実現している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:20:47 GMT)
Sample Selection Bias in Machine Learning for Healthcare [17.5] サンプル選択バイアス(SSB, sample selection bias)は, 対象個体群が対象個体群に比例しない特定の種類の偏見である。
既存の機械学習技術は、主に研究と対象個体群の分布のバランスをとることによってバイアスを補正しようとする。
偏り補正ではなく,対象集団の同定に基づいて,SSBに対処するための新たな研究方向を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:33:07 GMT)
Physics-Constrained Diffusion Reconstruction with Posterior Correction for Quantitative and Fast PET Imaging [17.3] PET画像再構成のための後方物理補正(PET-DPC)を用いた条件拡散モデル
PET-DPCは、完全に修正されたOSEM画像と密に整合した再構築を行い、定量的メトリクスでエンドツーエンドのディープラーニングモデルより優れている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:39:55 GMT)
MedReseacher-R1: Expert-Level Medical Deep Researcher via A Knowledge-Informed Trajectory Synthesis Framework [17.1] 総合的なディープ・リサーチ・エージェントは医療分野の課題に苦しむ。
2つのコアイノベーションを通じてこれらの課題に対処する医療深層研究エージェントを提示する。
本手法は12の専門分野にまたがる2100以上の多様な軌道を生成し,それぞれが平均4.2のツールインタラクションを発生させる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:51:20 GMT)
Nonlinear Federated System Identification [17.0] フェデレートラーニングは、参加するクライアントの数が増えるにつれて、個々のクライアントの収束を継続的に改善します。
我々は、クライアントデバイスがi.d.入力とi.d.ランダム摂動を示す制御ポリシーによって駆動される物理的環境で、我々の理論を実験的に検証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:41:43 GMT)
Self-Disguise Attack: Induce the LLM to disguise itself for AIGT detection evasion [16.9] SDA(Self-Disguise Attack)は、大規模言語モデルがその出力を積極的に偽装できる新しいアプローチである。
SDA は,3 種類の LLM が生成するテキスト間での各種 AIGT 検出器の平均検出精度を効果的に低減することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:17:03 GMT)
FedEve: On Bridging the Client Drift and Period Drift for Cross-device Federated Learning [16.4] Federated Learning(FL)は、複数のクライアントがプライベートデータを公開せずに、共同で共有モデルをトレーニングできる機械学習パラダイムである。
データの不均一性はFLの基本的な課題であり、収束性の低下と性能劣化をもたらす可能性がある。
本稿では,これらの2種類のドリフトが相互に補償し,その全体的な影響を緩和する,予測オブザーブフレームワークを提案し,そのインスタンス化手法であるFedEveを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:42:34 GMT)
Offline Imitation Learning upon Arbitrary Demonstrations by Pre-Training Dynamics Representations [16.4] 遷移力学の因子化から導かれる動的表現を学習する事前学習段階を導入する。
提案アルゴリズムは,専門家の方針を1つの軌道で模倣できることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:23:20 GMT)
Boosting Chart-to-Code Generation in MLLM via Dual Preference-Guided Refinement [16.2] MLLM(Multimodal Large Language Models)は、きめ細かい視覚解析、正確なコード合成、堅牢なクロスモーダル推論を行う。
本稿では、フィードバック駆動の2つのモダリティ報酬機構と反復的な嗜好学習を組み合わせた2つの嗜好誘導改善フレームワークを提案する。
本フレームワークは汎用MLLMの性能を大幅に向上させ,高品質なプロットコードを生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:56:28 GMT)
A Study of the Scale Invariant Signal to Distortion Ratio in Speech Separation with Noisy References [16.2] 本稿では、教師付き音声分離における評価と訓練の目的として、SI-SDR(Scale-Invariant Signal-to-Distortion Ratio)を用いることの意味について検討する。
ノイズ参照によるSI-SDRの導出は、ノイズが達成可能なSI-SDRを制限すること、または分離された出力において望ましくないノイズを引き起こすことを明らかにする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:22:11 GMT)
Exploring Big Five Personality and AI Capability Effects in LLM-Simulated Negotiation Dialogues [16.1] 本稿では,ミッションクリティカルな交渉文脈におけるエージェントAIシステムの評価フレームワークを提案する。
ソトピアをシミュレーションテストベッドとして使用し、人格特性とAIエージェント特性が社会的交渉結果にどのように影響するかを体系的に評価する2つの実験を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:36:39 GMT)
No Metric to Rule Them All: Toward Principled Evaluations of Graph-Learning Datasets [16.0] グラフ学習データセットの品質を評価するためのフレキシブルでモード摂動フレームワークであるRingsを紹介した。
本フレームワークでは,評価ツールとして分離性とモード補完性という2つの尺度を提案する。
グラフ学習手法の評価を改善するための実用的な勧告を導出する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:43:47 GMT)
MUSE: Multi-Subject Unified Synthesis via Explicit Layout Semantic Expansion [15.8] 本稿では、参照対象の忠実な再構成と、特定の領域の正確な配置の両方を必要とするレイアウト制御可能な多目的合成(LMS)の課題に対処する。
本稿では,レイアウト仕様とテキストガイダンスをシームレスに統合する統合合成フレームワークMUSEを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:52:26 GMT)
Diagnostic-Guided Dynamic Profile Optimization for LLM-based User Simulators in Sequential Recommendation [15.6] DGDPOは動的かつ反復的な最適化プロセスを通じてユーザプロファイルを構築する新しいフレームワークである。
シングルラウンドインタラクションに限定された既存のLCMベースのユーザシミュレータとは異なり、DGDPOをシーケンシャルレコメンデータと統合するのは初めてです。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:07:07 GMT)
EoH-S: Evolution of Heuristic Set using LLMs for Automated Heuristic Design [15.6] 大規模言語モデル(LLM)駆動型自動ヒューリスティックデザイン(AHD)の新しい定式化を提案する。
AHSDの目的は、多様な問題インスタンスを提供するための小さな補完セットを自動生成することである。
AHSDの目的関数は単調で超モジュラーであることを示す。
相補的な集団管理と相補的なミーメティックサーチの2つの新しいメカニズムにより、EoH-Sは、高品質で相補的な一般化のセットを効果的に生成することができた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:33:40 GMT)
Boosting Payment Channel Network Liquidity with Topology Optimization and Transaction Selection [15.4] 我々は$p$のパーティに対するトランザクションの入力シーケンスについて検討する。
各トランザクションは、トランザクションサイズ、ソース、ターゲットで構成され、受け入れられるか、拒否される可能性がある。
チャネルの作成と拡張のコストを最小限に抑えるために、シーケンス内の各トランザクションに関する決定を出力します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:34:20 GMT)
HyperDiff: Hypergraph Guided Diffusion Model for 3D Human Pose Estimation [15.3] 本稿では,HyperGCNと拡散モデルを統合した新しい3次元ポーズ推定手法HyperDiffを提案する。
結果はHyperDiffがHuman3.6MとMPI-INF-3DHPデータセット上で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:03:55 GMT)
CRED-SQL: Enhancing Real-world Large Scale Database Text-to-SQL Parsing through Cluster Retrieval and Execution Description [15.1] CRED-は大規模データベース向けに設計されたフレームワークで、クラスタ検索と実行記述を統合している。
自然言語質問(NLQ)と対応するsqlクエリのギャップを埋める。
CRED-は最新のgit-the-art(SOTA)パフォーマンスを実現し、その有効性とスケーラビリティを検証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:11:10 GMT)
A Classification Program for Nonlocality Paradoxes of Three Qubits [14.9] 3量子パラドックスの新しい無限族をいくつか導入し、全3量子非局所性パラドックスの完全な分類に向けて詳細なロードマップを述べる。
我々は、非常にエキゾチックなパラドックスの例を示し、新しいエキゾチックなパラドックスの探索に制約を課す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:44:25 GMT)
CTA-Flux: Integrating Chinese Cultural Semantics into High-Quality English Text-to-Image Communities [14.9] 適応法は、中国語のテキスト入力を強力なテキスト・ツー・イメージ(TTI)生成モデルであるFluxに適合させる。
我々は、英語中心のTTIモデルコミュニティにおいて、互換性のある中国語の意味理解を橋渡しする新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:03:54 GMT)
Preguss: It Analyzes, It Specifies, It Verifies [14.7] 大規模言語モデル(LLM)は、最近、形式検証における自動化の度合いを高める可能性を実証している。
この記事では、フォーマルな仕様の生成と改善を自動化するモジュール式できめ細かいフレームワークであるPregussの概要を述べる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:40:22 GMT)
Artificial Intelligence-Based Multiscale Temporal Modeling for Anomaly Detection in Cloud Services [14.5] 本研究では,マルチスケール特徴認識を統合したTransformerアーキテクチャに基づく異常検出手法を提案する。
提案手法は,精度,リコール,AUC,F1スコアなどの主要な指標において,主流のベースラインモデルより優れている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:52:36 GMT)
Deliberate Reasoning in Language Models as Structure-Aware Planning with an Accurate World Model [14.5] 高精度世界モデル(SWAP)による構造認識計画
SWAPは構造化知識表現と学習計画を統合する。
SWAPは,数理推論,論理推論,コーディングタスクなど,多種多様な推論集約型ベンチマークで評価される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:44:04 GMT)
Cross-Modality Controlled Molecule Generation with Diffusion Language Model [14.4] 拡散言語モデル(CMCM-DLM)を用いたクロスモーダル制御分子生成
提案手法は,SCM(Structure Control Module)とPCM(Property Control Module)の2つのトレーニング可能なモジュールを組み込んだ,事前学習拡散モデルに基づく。
第1相は、初期の拡散過程において構造的制約を注入するためにSCMを使用し、分子のバックボーンを効果的に固定する。
第2相は、さらにPCMを導入して、推論の後半段階を誘導し、生成した分子を精製し、それらの化学的性質が指定された標的と一致することを保証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:48:44 GMT)
LongRecall: A Structured Approach for Robust Recall Evaluation in Long-Form Text [14.2] LongRecallは3段階のリコール評価フレームワークである。
答えを自己完結した事実に分解し、語彙的および意味的なフィルタリングを通じて妥当な候補マッチングを狭め、アライメントを検証する。
我々は,LongRecallを人間のアノテーションとLLMに基づく判断の両方を用いて,3つの挑戦的な長文QAベンチマークで評価した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:41:42 GMT)
GSFix3D: Diffusion-Guided Repair of Novel Views in Gaussian Splatting [14.2] GSFix3Dは,非拘束領域における視覚的忠実度を改善する新しいフレームワークである。
コアとなるGSFixerは、カスタマイズした微調整プロトコルによって得られた遅延拡散モデルである。
本稿では,GSFixerが失明した領域にペンキを塗ることを可能にするランダムマスク拡張戦略を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:49:53 GMT)
MISS: Multi-Modal Tree Indexing and Searching with Lifelong Sequential Behavior for Retrieval Recommendation [14.1] 大規模産業レコメンデーションシステムは通常、検索とランキングの2段階のパラダイムを採用している。
マルチモーダル・インデックス・ツリーとマルチモーダル・ライフロング・シーケンス・モデリング・モジュールを含むMISS(Multi-modal Indexing and Searching with Lifelong Sequence)を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:22:02 GMT)
Learning in Repeated Multi-Objective Stackelberg Games with Payoff Manipulation [14.1] 繰り返し多目的のStackelbergゲームにおけるペイオフ操作について検討する。
複数の目的に対する嗜好を表す従者の効用関数は未知だが線形であると仮定する。
このことは、優先順位決定と即時効用最大化のバランスをとる必要があるリーダーに、シーケンシャルな意思決定の課題をもたらす。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:29:24 GMT)
ETA: Energy-based Test-time Adaptation for Depth Completion [13.9] 本研究では,事前訓練した深度完了モデルの試験時間適応法を提案する。
本手法の要点は,震源データ分布に含まれる深度予測の可能性の定量化にある。
本手法は屋内3つのデータセットと屋外3つのデータセットにまたがって評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:11:51 GMT)
The Agent Behavior: Model, Governance and Challenges in the AI Digital Age [13.7] AIの進歩は、ネットワーク化された環境でエージェントが人間の振る舞いを反映するようになる。
本稿では,ネットワークの挙動を6段階に分割し,各段階における人間とエージェントの行動差を系統的に解析するネットワーク行動ライフサイクルモデルを提案する。
エージェントのためのエージェント(A4A)パラダイムと,5次元にわたる人間とエージェントの行動の根本的な区別を考察したHuman-Agent Behavioral Disparity(HABD)モデルについても紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:24:55 GMT)
Improving Actor-Critic Training with Steerable Action-Value Approximation Errors [13.4] 政治的でないアクター批判的アルゴリズムは、継続的な制御タスクに対する深い強化学習の強い可能性を示している。
我々は,俳優と批評家の双方に対して,悲観主義と楽観主義の独立的かつ解釈可能な制御を可能にするために,Utility Soft Actor-Critic (USAC)を提案する。
USACは一貫して最先端のアルゴリズムを上回り、実用性と実現可能性を示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:56:10 GMT)
DualNILM: Energy Injection Identification Enabled Disaggregation with Deep Multi-Task Learning [13.2] 我々は、NILMにおけるアプライアンス状態認識と注入エネルギー識別の2つのタスク用に設計された深層マルチタスク学習フレームワークであるDualNILMを提案する。
シークエンス・ツー・ポイントとシークエンス・ツー・シーケンス戦略をTransformerベースのアーキテクチャに統合することにより、DualNILMは集約電力消費パターンにおけるマルチスケールの時間依存性を効果的に捉えることができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:35:38 GMT)
Interpreting the linear structure of vision-language model embedding spaces [12.8] 我々は、4つの視覚言語モデルの埋め込み空間上でスパースオートエンコーダ(SAE)を訓練・リリースする。
学習方向の疎線形結合としてのSAEs近似モデル埋め込み、あるいは「概念」
異なる種や異なるデータダイエットでSAEをリトレーニングすることは、2つの発見につながる。SAEによって得られた稀で特異な概念は、劇的に変化するが、一般的に活性化される概念は、実行中に著しく安定していることも示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:43:41 GMT)
Multilingual Datasets for Custom Input Extraction and Explanation Requests Parsing in Conversational XAI Systems [12.8] 我々は5つのタイプ型的に多様な言語にまたがるCoXQLデータセットの多言語拡張であるMultiCoXQLを紹介した。
本稿では,多言語構文解析の性能向上を目的とした構文解析手法を提案する。
我々は、ConvXAIシステムにおけるカスタム入力抽出のために設計された新しい多言語データセットであるCompassを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:09:08 GMT)
Robust Estimation Under Heterogeneous Corruption Rates [12.7] 不均質な汚職率下でのロバストな推定問題について検討する。
既存の堅牢な推定器は、通常、一様または最悪のケースの腐敗を仮定する。
すべての不均一な汚職パターンに対して、厳密なミニマックスレートを与えます。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:29:33 GMT)
Transplant Then Regenerate: A New Paradigm for Text Data Augmentation [12.7] 大規模言語モデル(LLM)は、その"知識の出現"能力によって、テキスト拡張を強化している。
LLMを利用した新しいテキスト拡張パラダイムであるLMTransplantを提案する。
我々は,LMTransplantをテキスト関連タスク間で評価し,既存のテキスト拡張手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:05:18 GMT)
MAVIS: Multi-Objective Alignment via Value-Guided Inference-Time Search [12.7] 我々は、値誘導推論時間探索による多目的アライメントMAVISを紹介する。
ベースモデルの重みを変更することなく、LCMの挙動を動的に制御できる。
また,MAVISは,対象物ごとの微調整のベースラインよりも優れており,ポストホックと組み合わせていることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:57:38 GMT)
MetaWild: A Multimodal Dataset for Animal Re-Identification with Environmental Metadata [12.7] 本稿では,既存の視覚言語モデル(VLM)に基づくAnimal ReID手法に組み込む軽量モジュールを提案する。
MetaWildの実験では、ベースラインReIDモデルとMFAを組み合わせることでメタデータを組み込むことで、パフォーマンスが一貫して向上することが示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:02:32 GMT)
It Takes Two: A Peer-Prediction Solution for Blockchain Verifier's Dilemma [12.7] 我々は,分散検証ゲームのための一相ベイズ的真理機構の設計に向けて,ビザンチン・ローバストなピア予測フレームワークを開発する。
我々の研究は、ブロックチェーン、分散AI、および潜在的に分散化されたシステムのセキュリティと堅牢性を高める分散検証プロトコルのためのインセンティブ設計のフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:12:12 GMT)
6-DoF Object Tracking with Event-based Optical Flow and Frames [12.6] 本研究では,物体の動き計測のためのイベントベース光フローアルゴリズムを提案し,物体の6-DoF速度トラッカーを実装した。
追跡対象6-DoF速度とグローバルポーズ推定器からの低周波数推定ポーズを統合することにより、物体が高速に動いたときのポーズを追跡することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:22:51 GMT)
Deep Exploration with PAC-Bayes [12.6] 遅延報酬の下での継続的制御のための強化学習は、現実の応用において重要であるにもかかわらず、未探索の問題である。
本研究では,PAC-ベイジアンの視点からアクター・クリティカル・ラーニングの文脈において,この深層探査問題に初めて対処する。
提案アルゴリズムはPAC-Bayesian Actor-Critic (PBAC) と名付けられ, 連続制御タスクにおける遅延報酬を一定に検出する唯一のアルゴリズムである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:52:22 GMT)
Privileged Self-Access Matters for Introspection in AI [12.6] AIにおけるイントロスペクション(Introspection)とは、内部状態に関する情報を、第三者が利用できる等号または低額の計算コストのプロセスよりも信頼性の高いプロセスを通じて得るプロセスである。
AIにおけるイントロスペクション(Introspect in AI)とは、内部状態に関する情報を、サードパーティが利用可能な同等または低い計算コストのプロセスよりも信頼性の高いプロセスを通じて取得するプロセスである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:52:34 GMT)
Exact Shapley Attributions in Quadratic-time for FANOVA Gaussian Processes [12.5] シェープ値は、機械学習において入力特徴に重要性をもたらすための原則的手法として広く認識されている。
また,Shapley値の正確な計算量は特徴数とともに指数関数的にスケールすることを示した。
我々の研究は、構造化確率モデルによって生成される予測について、よりスケーラブルで、公理的に、そして不確実性を考慮した説明を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:39:14 GMT)
GeMS: Efficient Gaussian Splatting for Extreme Motion Blur [12.5] 本稿では、3Dガウススティング(3DGS)のためのフレームワークであるGeMSを紹介した。
私たちの知る限り、3DGS内の極端な動きのぼやけを、ひどくぼやけた入力から直接解決する最初のフレームワークです。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:55:21 GMT)
Anyon Theory and Topological Frustration of High-Efficiency Quantum Low-Density Parity-Check Codes [12.4] 量子低密度パリティチェック(QLDPC)符号は、低オーバーヘッドフォールトトレラント量子計算への有望な経路を提供する。
我々のレターはQLDPC符号の耐障害性を探るための厳密な理論的基礎を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:06:13 GMT)
Low-rank bias, weight decay, and model merging in neural networks [12.4] L2$正規化によって誘導される深層ニューラルネットワークのいくつかの特性を示す。
さらに,$L2$正規化と低ランクバイアスによって実現されるマルチタスク学習現象について検討した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:53:28 GMT)
SATURN: Autoregressive Image Generation Guided by Scene Graphs [12.3] 本稿では,シーングラフをサリエンス順序付きトークンシーケンスに変換する,VAR-CLIPの軽量拡張であるSATURNを紹介する。
ビジュアルゲノムデータセットでは、SATURNはFIDを56.45%から21.62%に削減し、インセプションスコアを16.03から24.78に引き上げている。
その結果,SATURNは構造的認識と最先端の自己回帰的忠実度を効果的に組み合わせていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:45:08 GMT)
Long Chain-of-Thought Reasoning Across Languages [11.8] ロングチェーン・オブ・シークレット(CoTs)による推論のスケーリングにより、大規模言語モデル(LLMs)における印象的な推論機能が解放された。
本研究では,2つの英文推論データセット,ファインチューン Qwen 2.5 (7B) および Qwen 3 (8B) モデルの翻訳版を構築し,フランス語,日本語,ラトビア語,スワヒリ語にまたがる長いCoT生成の体系的研究を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:22:51 GMT)
Consistent and Optimal Solution to Camera Motion Estimation [11.7] 画像ペア間の2Dポイント対応を考えると、カメラの動きを推定することはコンピュータビジョンのコミュニティにおいて基本的な問題である。
点数が数百の順序に達すると、推定器は推定精度とCPU時間で最先端の値より優れていることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:00:32 GMT)
Img2ST-Net: Efficient High-Resolution Spatial Omics Prediction from Whole Slide Histology Images via Fully Convolutional Image-to-Image Learning [11.6] Img2ST-Netは効率的な高分解能ST予測のための新しい組織学からST生成フレームワークである。
Img2ST-Netは完全な畳み込みアーキテクチャを用いて高密度のHD遺伝子発現マップを並列に生成する。
我々は高分解能ST予測のためのスケーラブルで生物学的に一貫性のあるフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:41:11 GMT)
Trace-Based Reconstruction of Quantum Circuit Dataflow in Surface Codes [11.6] この研究はトレースベースの再構成フレームワークであるTraceQを導入し、各エントリのパッチアクティビティを観察することで量子回路データフローを再構築する。
アクセストレースは幅広いシナリオでアプリケーションを持ち、量子プログラムとその上で実行されるハードウェアの分析とプロファイリングを可能にする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:40:32 GMT)
Correctness-Guaranteed Code Generation via Constrained Decoding [11.5] 本稿では,意味論的に正しいプログラムを生成するための制約付き実行時復号アルゴリズムを提案する。
提案手法は,任意の所定のスクリプティングAPIに従って,意味的に正しいプログラムを生成することができることを示す。
さらに、慎重に設計することで、我々のセマンティック保証が正当性にまで拡張され、ローグライクなビデオゲームにゲームメカニクスを発生させることで検証されることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:48:18 GMT)
Challenges and Opportunities for Participatory Design of Conversational Agents for Young People's Wellbeing [11.5] 本稿は,4カ国における子どもと若者の会話エージェント研究の課題と機会を概説する。
それは、AI技術が、社会的、文化的な文脈における子供の幸福をサポートする方法を探る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:34:08 GMT)
Common Data Format (CDF): A Standardized Format for Match-Data in Football (Soccer) [11.4] 本研究の目的は,CDF(Common Data Format)と呼ばれる,サッカーデータの均一かつ標準化されたフォーマットを提案することである。
CDFは、マッチシートデータ、ビデオ映像、イベントデータ、追跡データ、およびメタデータの5種類のマッチングデータに対して、最小限のスキーマを定義している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:24:51 GMT)
Enhancing Optimizer Stability: Momentum Adaptation of The NGN Step-size [11.4] 運動量と適応的なステップサイズを組み込んだ最適化アルゴリズムは、挑戦的なディープラーニングタスクのパフォーマンスを向上させる。
これらのパラメータのチューニングは、しばしば難しく、リソースを消費し、時間を要する。
本稿では,ステップサイズの選択に対する安定性を向上しつつ,最先端技術の性能に適合するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:14:17 GMT)
ChuLo: Chunk-Level Key Information Representation for Long Document Understanding [11.3] ChuLoは長い文書理解のための新しいチャンク表現手法である。
提案手法は,情報損失を最小限に抑え,トランスフォーマーモデルの有効性を向上させる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:47:22 GMT)
Cognitive Surgery: The Awakening of Implicit Territorial Awareness in LLMs [11.3] 我々は,大規模言語モデル (LLM) が,個人表現パラダイム (IPP) に基づく自己生成テキストと他の生成テキストとの区別に苦慮していることを示す。
次に、この失敗の原因を調査し、Implicit Territorial Awareness (ITA) という現象とみなす。
本研究では, LLM の ITA を実現するために, 表現抽出, 領域構築, 著者識別, 認知編集の4つの主要モジュールからなる新しいフレームワークである認知手術(CoSur)を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:08:18 GMT)
One-Layer Transformers are Provably Optimal for In-context Reasoning and Distributional Association Learning in Next-Token Prediction Tasks [11.1] そこで本研究では,一層変圧器の非雑音・雑音環境における近似能力と収束挙動について検討した。
我々の研究は、線形およびReLUの両方の注意を払って、確実にベイズ最適である一層変圧器のクラスが存在することを示すことによってギャップに対処する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:05:36 GMT)
TASER: Table Agents for Schema-guided Extraction and Recommendation [11.0] 実世界の金融文書は、ある企業の金融保有に関する重要な情報を報告する。
しかし、これらの詳細はしばしば散らかったマルチページの断片化されたテーブルに埋もれている。
本稿では,連続学習型エージェントテーブル抽出システムTASERを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:50:21 GMT)
Explicit Context Reasoning with Supervision for Visual Tracking [11.0] RSTrackは3つのコアメカニズムを通じてコンテキスト推論を明示的にモデル化し、監督する。
実験の結果,RSTrackは複数のベンチマークデータセット上で最先端のパフォーマンスを実現することがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:43:14 GMT)
FlightPatchNet: Multi-Scale Patch Network with Differential Coding for Flight Trajectory Prediction [10.9] 飛行軌跡予測のための差分符号付きマルチスケールパッチネットワークであるFlightPatchNetを提案する。
飛行軌道における多様な時間的パターンを十分に探求するために、マルチスケールパッチネットワークはバックボーンとして機能するように微妙に設計されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:13:13 GMT)
Versatile photonic frequency synthetic dimensions using a single Mach-Zehnder-interferometer-assisted device on thin-film lithium niobate [10.9] 我々はTFLNプラットフォーム上で2共振器の試作機を試作した。
強結合格子, トポロジカルホール・ラグ, クルーツ・ラグなどのよく知られたモデルを実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:42:22 GMT)
HiRQA: Hierarchical Ranking and Quality Alignment for Opinion-Unaware Image Quality Assessment [10.8] HiRQAは自己管理型の意見認識フレームワークで、ランキングと対照的な学習の組み合わせによって、階層的で品質を意識した埋め込みを提供する。
リアルタイムデプロイメントでは,画像当たり3.5ミリ秒の推論時間を持つ軽量版である textbfHiRQA-S を導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:48:21 GMT)
FMSD-TTS: Few-shot Multi-Speaker Multi-Dialect Text-to-Speech Synthesis for Ü-Tsang, Amdo and Kham Speech Dataset Generation [10.7] FMSD-TTS(FMSD-TTS)は、音声合成フレームワーク。
限られた参照音声と明示的な方言ラベルから並列方言音声を合成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:13:27 GMT)
Adaptive Experiments Under Data Sparse Settings: Applications for Educational Platforms [10.6] データスパース環境におけるコンテンツ関連意思決定を改善するために、重み付け割り当て確率調整型トンプソンサンプリング(WAPTS)を導入する。
WAPTSは寛大な後悔の原則によって導かれており、将来性のあるコンテンツを探求しながら、学習を加速する最適に近い割り当てを可能にしている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:46:43 GMT)
A Real-world Display Inverse Rendering Dataset [10.5] 逆レンダリングは、キャプチャされた画像から幾何と反射を再構成することを目的としている。
現在、ディスプレイカメラシステムを使ってキャプチャしたパブリックな現実世界データセットは存在しない。
ディスプレイベースの逆レンダリングのための最初の実世界のデータセットを紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:15:19 GMT)
Building and Measuring Trust between Large Language Models [10.5] 信頼を構築するための異なる戦略がどのように比較されるか、信頼がどのように暗黙的に測定されるか、そしてそれが信頼の明示的な尺度にどのように関係するかについて研究する。
我々は3つの方法で信頼を構築する。ラプポートを動的に構築すること、信頼を証明した事前記述スクリプトから始めること、LLMのシステムプロンプトに適応することである。
意外なことに、明示的な信頼の尺度は、暗黙的な信頼の尺度とほとんどあるいは非常に負の相関がないことがわかりました。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:38:38 GMT)
Vivid-VR: Distilling Concepts from Text-to-Video Diffusion Transformer for Photorealistic Video Restoration [10.4] 先進的なT2Vファンデーションモデルに基づいて構築されたDiTベースの生成ビデオ復元手法であるVivid-VRを提案する。
Vivid-VRは, 実世界のベンチマークと実世界のベンチマークの両方において, 既存のアプローチに対して良好に動作することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:14:01 GMT)
Generative Neural Operators of Log-Complexity Can Simultaneously Solve Infinitely Many Convex Programs [10.3] 普遍近似定理からの最悪のパラメータ境界は、ニューラル作用素(NOs)がほとんどの演算子学習問題を解決するために非現実的に多数のパラメータを必要とすることを示唆している。
本稿では,NOs,生成平衡作用素(GEOs)の特定のクラスに対するギャップを埋める。
本手法は,近似誤差の逆数にのみ対数的に増大するランク,深さ,幅で,任意の精度で対応する解を均一に近似できることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:32:36 GMT)
You Only Evaluate Once: A Tree-based Rerank Method at Meituan [10.2] 我々は、Exact Search Unit(ESU)のみを保持しながら、ジェネラルサーチユニット(GSU)を除去するワンステージリグレード手法であるYOLORを提案する。
YOLOR は、(1) リストレベルの有効性を達成するために階層的に複数のコンテキスト特徴を集約するツリーベースのコンテキスト抽出モジュール (TCEM) と、(2) 候補置換における効率的な機能の再利用を可能にするコンテキストキャッシュモジュール (CCM) を含む。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:36:25 GMT)
Beyond Individuals: Collective Predictive Coding for Memory, Attention, and the Emergence of Language [10.2] 言語は集合的に形成された外部表現として機能する、という仮説的考え方を導入する。
これは、言語構造を共有し、次の単語予測によって学習された集合世界モデルをどのように受け入れるか、グループレベルの認識を創出し形作るか、という新しい視点を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:20:17 GMT)
Static Analysis as a Feedback Loop: Enhancing LLM-Generated Code Beyond Correctness [10.2] 大規模言語モデル(LLM)は、HumanEvalやMBPPといったベンチマークで高いスコアを獲得することで、コード生成において印象的な能力を示している。
本研究では,PythonSecurityEvalベンチマークを用いて,複数の次元にまたがる高品質なコードを生成するLLMの能力を体系的に評価する。
本稿では、BanditとPylintを利用してコード品質の問題を特定し解決する、反復的な静的解析駆動プロンプトアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:31:31 GMT)
CoT-Segmenter: Enhancing OOD Detection in Dense Road Scenes via Chain-of-Thought Reasoning [10.1] 本稿では,道路異常シーンにおけるOOD検出を目的とした新しいChain-of-Thought(CoT)ベースのフレームワークを提案する。
我々のフレームワークは、標準ベンチマークと新たに定義されたRoadAnomalyデータセットの課題サブセットの両方において、常に最先端のメソッドを上回ります。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:14:24 GMT)
Endo-FASt3r: Endoscopic Foundation model Adaptation for Structure from motion [9.8] Endo-FASt3rは、両方のタスクに基礎モデルを使用する最初の単眼SSL深度とポーズ推定フレームワークである。
また、高階更新と高速収束を実現する新しい適応手法であるDoMoRAを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:41:54 GMT)
PinFM: Foundation Model for User Activity Sequences at a Billion-scale Visual Discovery Platform [9.6] 我々は、数十億の視覚的発見プラットフォームにおいて、複数のアプリケーションにわたるユーザアクティビティシーケンスを理解するための基礎モデル、PinFMを提案する。
我々は、広範囲なユーザアクティビティデータを使用して20B以上のパラメータでトランスフォーマーモデルを事前訓練し、特定のアプリケーションに対して微調整する。
Deduplicated Cross-Attention Transformer (DCAT)のようなインフラストラクチャとアルゴリズムの最適化により、Pinterest上でのスループットが600%向上しました。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:15:51 GMT)
MEGA: Second-Order Gradient Alignment for Catastrophic Forgetting Mitigation in GFSCIL [9.6] Graph Few-Shot Class-Incremental Learning (GFSCIL)は、大規模なベースデータセットで最初のトレーニングを行った後、新しいタスクの限られたサンプルからモデルを継続的に学習することを可能にする。
既存のGFSCILアプローチは通常、計量に基づくクラス表現にPN(Prototypeal Networks)を使用し、漸進的な学習段階においてモデルを微調整する。
本稿では,GFSCILの破滅的忘れを効果的に軽減することを目的とした,モデル非依存型メタグラフ連続学習(MEGA)を紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:45:29 GMT)
Leuvenshtein: Efficient FHE-based Edit Distance Computation with Single Bootstrap per Cell [9.6] 編集距離計算は、DNAシークエンスアライメントのようなファイナンスやゲノム学にまたがる応用において不可欠である。
本稿では,Leuvenshteinと呼ばれる距離計算の編集コストを大幅に削減する最適化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:40:06 GMT)
Quantum Long Short-term Memory with Differentiable Architecture Search [9.5] QLSTMのような量子リカレントモデルは、時系列予測、NLP、強化学習を約束している。
DiffQAS-QLSTMは、トレーニング中のVQCパラメータとアーキテクチャ選択の両方を最適化するエンドツーエンドの差別化可能なフレームワークである。
我々の結果は、DiffQAS-QLSTMが手作りのベースラインを一貫して上回り、多様なテスト設定で損失を減らしていることを示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:15:00 GMT)
Reward-Shifted Speculative Sampling Is An Efficient Test-Time Weak-to-Strong Aligner [9.4] 提案手法では,提案手法が人間の好みに合致する一方で,対象モデルも変化しない,報奨シフト型投機サンプリング(SSS)アルゴリズムを導入する。
本アルゴリズムは, 試験時間低強度アライメント実験において, 推定コストを著しく低減し, 優れた金報酬スコアを得る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:10:56 GMT)
JRDB-Reasoning: A Difficulty-Graded Benchmark for Visual Reasoning in Robotics [9.4] 本稿では,詳細な中間アノテーションを用いて,様々な複雑さの質問をカスタマイズ可能なクエリエンジンを提案する。
我々はJRDBデータセットを人間とオブジェクトの相互作用と幾何学的関係アノテーションで拡張し、JRDB-Reasoningを作成する。
本エンジンとベンチマークにより,視覚推論フレームワークのきめ細かい評価と視覚言語モデルの動的評価が可能となった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:35:01 GMT)
EvoCurr: Self-evolving Curriculum with Behavior Code Generation for Complex Decision-making [9.2] 大規模言語モデル(LLM)は、プログラミング、計画、意思決定など、様々な領域にまたがる顕著な能力を示している。
本稿では,新たな自己進化型フレームワークであるEvoCurrを提案する。
本手法は, 直接解法に比べて, タスク成功率と解解効率を著しく向上することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:50:49 GMT)
MoCHA-former: Moiré-Conditioned Hybrid Adaptive Transformer for Video Demoiréing [9.2] カメラのカラーフィルタアレイ(CFA)とディスプレイのサブピクセルの間の周波数エイリアスにより、モワールパターンが引き起こされ、撮影された写真やビデオが著しく劣化する。
MoCHA-formerは、Decoupled Moir'e Adaptive Demoir'eing (DMAD)とSpatio-Temporal Adaptive Demoir'eing (STAD)の2つの主要なコンポーネントから構成される。
モワールの特徴を質的,定量的に分析し,RAWドメインとsRGBドメインをカバーする2つのビデオデータセットを用いて評価した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:42:07 GMT)
Beyond the Protocol: Unveiling Attack Vectors in the Model Context Protocol (MCP) Ecosystem [9.1] Model Context Protocol(MCP)は、LLM(Large Language Model)アプリケーションと外部ツールやリソースとのシームレスな相互作用を可能にするために設計された新しい標準である。
本稿では,MPPエコシステムを対象とした攻撃ベクトルに関する最初の体系的研究について述べる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:42:06 GMT)
Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks [9.1] ゲーテッドニューラルネットワーク(RNN)は、適応的な学習速度の振る舞いを暗黙的に誘発する。
効果は状態空間の時間スケールとパラメータ空間のダイナミクスの結合から生じる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:10:59 GMT)
Securing Swarms: Cross-Domain Adaptation for ROS2-based CPS Anomaly Detection [9.1] サイバー物理システム(CPS)は、重要な応用にますます利用されている。
CPSはネットワークのみのシステムに比べて攻撃に弱い。
我々は、事前にラベル付けされたデータを必要とせずに、CPS内の攻撃を検知できる異常検出モデルを開発した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:02:28 GMT)
Electrically pumped ultrabright entangled photons on chip [9.0] 絡み合った光子源は量子科学と技術にとって不可欠である。
スケーラブルで高性能で、チップスケールのEPSを実証する。
このコンパクトで統合されたEPSは、高速量子鍵分布を含む鍵応用を可能にする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:37:26 GMT)
BadBlocks: Low-Cost and Stealthy Backdoor Attacks Tailored for Text-to-Image Diffusion Models [9.0] 拡散モデルはバックドア攻撃の影響を受けやすい。
BadBlocksは計算リソースの30%しか必要とせず、以前のバックドア攻撃で通常必要とされる20%のGPU時間を必要とする。
BadBlocksは既存の防御フレームワーク、特に注目ベースのバックドア検出メソッドをバイパスすることができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:11:26 GMT)
Enhancing Temporal Sensitivity of Large Language Model for Recommendation with Counterfactual Tuning [8.8] 我々は、アンダーライン勧告(CETRec)の枠組みを提案する。
CETRecは因果推論の原則に基づいており、時間情報の特定の影響をレコメンデーション結果に分離し、測定することができる。
私たちのコードはhttps://anonymous.4open.science/r/CETRec-B9CE/で利用可能です。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:09:56 GMT)
Towards Understanding Gradient Dynamics of the Sliced-Wasserstein Distance via Critical Point Analysis [8.8] 目的関数としてスライスされたワッサースタイン距離(SW)の特性について検討する。
本研究の目的は、SW目標の最適化から生じる臨界点を厳密に分析することである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:52:07 GMT)
From Slices to Structures: Unsupervised 3D Reconstruction of Female Pelvic Anatomy from Freehand Transvaginal Ultrasound [8.7] 本稿では,2次元経血管超音波(TVS)スイープから3次元解剖構造を再構築するための新しい枠組みを提案する。
本手法はガウス散乱の原理を超音波領域に適用し,スライスアウェアで微分可能な空間化器を導入する。
その結果、コンパクトで柔軟性があり、メモリ効率のよい表現となり、高い忠実さで解剖学的詳細を捉えます。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:09:06 GMT)
SMTrack: End-to-End Trained Spiking Neural Networks for Multi-Object Tracking in RGB Videos [8.7] 脳にインスパイアされたスパイキングニューラルネットワーク(SNN)は、低消費電力計算において大きな可能性を秘めている。
視覚タスクにおけるそれらの応用は、画像分類、オブジェクト検出、イベントベースのトラッキングに限られている。
SMTrack - 標準RGBビデオにおけるエンドツーエンドのマルチオブジェクト追跡のための、最初の直接訓練されたディープSNNフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:47:37 GMT)
AnchorSync: Global Consistency Optimization for Long Video Editing [8.7] AnchorSyncは、高品質で長期的なビデオ編集を可能にする新しい拡散ベースのフレームワークである。
提案手法は,進行的復調過程を通じて構造的整合性を強制し,マルチモーダル誘導による時間的ダイナミクスを保存する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:51:24 GMT)
Trust but Verify! A Survey on Verification Design for Test-time Scaling [8.4] テスト時スケーリング(TTS)は,大規模言語モデルのパフォーマンス向上のための新たなフロンティアとして登場した。
検証者は、復号プロセスから候補出力をスコアするのに役立つ報酬モデルとして機能する。
検証者は、素早いベースで、識別または生成モデルとして微調整することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:27:21 GMT)
VSF: Simple, Efficient, and Effective Negative Guidance in Few-Step Image Generation Models By Value Sign Flip [8.4] Value Sign Flip (VSF) は、数ステップの拡散とフローマッチング画像生成モデルに負のプロンプトガイダンスを組み込む、シンプルで効率的な方法である。
本手法は計算オーバーヘッドを小さくし,MMDiTスタイルのアーキテクチャを効果的に統合する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:50:41 GMT)
Disentanglement in T-space for Faster and Distributed Training of Diffusion Models with Fewer Latent-states [8.4] ノイズスケジュールを慎重に選択することで、少数の潜在状態に対してトレーニングされた拡散モデルが、多数の潜在状態に対してトレーニングされたモデルの性能と一致することを示す。
独立に訓練された1つの潜在状態モデルを組み合わせることで, 高精度なサンプルを容易に生成できることが示される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:21:26 GMT)
Quantization Meets Spikes: Lossless Conversion in the First Timestep via Polarity Multi-Spike Mapping [8.3] スパイキングニューラルネットワーク(SNN)は、イベント駆動コンピューティングによる計算効率の利点を提供する。
従来の人工ニューラルネットワーク(Ann)は、トレーニング中に高い計算とエネルギーコストに悩まされることが多い。
Anns-to-SNN変換アプローチは依然として価値があり実用的な代替手段である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:30:30 GMT)
Toward Responsible ASR for African American English Speakers: A Scoping Review of Bias and Equity in Speech Technology [8.3] 自動音声認識(ASR)において、公平性、偏り、公平性がどのように概念化され、運用されているかを検討する。
我々は、研究者がASR関連の害をどう理解するかという4つの主要な調査領域を特定した。
本稿では、ガバナンス中心のASRライフサイクルを、責任あるASR開発のための学際的なフレームワークとして提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:09:15 GMT)
Boundary Detection Algorithm Inspired by Locally Linear Embedding [8.3] 本稿では,広く使用されている局所的線形埋め込みアルゴリズムにインスパイアされた境界点検出手法を提案する。
高次元ノイズの存在下では,雑音データにおける境界検出の強化を目的としたフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:01:46 GMT)
Piecemaker: a resource-efficient entanglement distribution protocol [8.2] 量子スイッチを用いて複数のリモートエンドユーザーに安定化状態を提供するマルチパーティ・エンタングルメント分散プロトコルを提案する。
すべてのベルペアが所望の状態を分散する前に確立されるのを待つ既存のスキームとは異なり、我々のアプローチはベルペアの最小限のサブセットのみを格納する。
我々のプロトコルは, より広範囲の偏極速度とベルペア生成の成功確率において, 多粒子絡み合いに対する1/2の臨界忠実度しきい値を達成することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:33:40 GMT)
Revisiting Out-of-Distribution Detection in Real-time Object Detection: From Benchmark Pitfalls to a New Mitigation Paradigm [8.2] アウト・オブ・ディストリビューション(OoD)入力はディープラーニングモデルに永続的な課題をもたらす。
この研究は、物体検出におけるOoD検出の2つの見落としられた次元に対処する。
外部OoD検出器とは独立に動作する新しい訓練時間緩和パラダイムを導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:24:44 GMT)
ECHO: Frequency-aware Hierarchical Encoding for Variable-length Signal [8.2] そこで本研究では,帯域分割アーキテクチャと相対周波数位置埋め込みを融合した新しい基礎モデルを提案する。
機械信号符号化のための大規模ベンチマークであるSIRENについて評価を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:10:44 GMT)
Extending Foundational Monocular Depth Estimators to Fisheye Cameras with Calibration Tokens [8.2] 魚眼画像に対する基礎的単眼深度推定器(FMDE)の拡張手法を提案する。
本手法は,魚眼画像と視線画像とを符号化した潜伏埋め込みの分布を一致させる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:31:58 GMT)
ViT-FIQA: Assessing Face Image Quality using Vision Transformers [8.0] 顔画像品質評価(FIQA)は、顔認識(FR)システムにおける顔画像の有用性を予測することを目的としている。
ViT-FIQAは、学習可能なクオリティトークンを通じてFRに最適化された標準のViTバックボーンを拡張する新しいアプローチである。
挑戦的なベンチマークとCNNとViTベースのアーキテクチャを含むいくつかのFRモデルの実験は、ViT-FIQAが一貫してトップレベルのパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:59:44 GMT)
Structure-Aware Temporal Modeling for Chronic Disease Progression Prediction [8.0] 本研究は、症状進化の複雑さと時間依存性モデリングの不十分さの課題に対処する。
構造的知覚と時間的モデリングを統合した統合予測フレームワークを提案する。
その結果,提案手法はAUC,RMSE,IPW-F1の既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:55:24 GMT)
Identity Preserving 3D Head Stylization with Multiview Score Distillation [7.8] 3Dヘッドスタイリングは、リアルな顔の特徴を芸術的な表現に変換し、ゲームやバーチャルリアリティーアプリケーションにおけるユーザーのエンゲージメントを高める。
本稿では,PanoHeadモデルを活用することで,360度の総合的な視点から画像を合成することで,これらの課題に対処する。
本稿では, 否定対数類似蒸留(LD)を利用した新しい枠組みを提案し, アイデンティティの保存とスタイリゼーション品質の向上を図る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:41:03 GMT)
Deep Skin Lesion Segmentation with Transformer-CNN Fusion: Toward Intelligent Skin Cancer Analysis [7.8] 本稿では,改良されたTransUNetアーキテクチャに基づく高精度セマンティックセマンティックセマンティクス手法を提案する。
この方法はトランスフォーマーモジュールを従来のエンコーダ・デコーダフレームワークに統合し、グローバルな意味情報をモデル化する。
境界誘導型アテンション機構とマルチスケールアップサンプリングパスも、病変境界の局所化とセグメンテーションの整合性を改善するために設計されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:59:00 GMT)
Is neural semantic parsing good at ellipsis resolution, or isn't it? [7.8] ニューラルセマンティクスは、様々な言語現象に対して優れた総合的な性能を示し、90%以上のセマンティクスマッチングスコアに達した。
英語の動詞句 ellipsis は、すべての動詞句を1つの補助動詞で省略できる構造である。
そうでなければ、強力なセマンティクスとして知られていますが、エリプシスに対処できるのでしょうか?
我々は,120例のエリプシスのコーパスをその意味表現で構築し,ニューラルセマンティクスの大きな電池の挑戦セットとして利用した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:45:33 GMT)
Neural Restoration of Greening Defects in Historical Autochrome Photographs Based on Purely Synthetic Data [7.8] 初期の視覚芸術、特にカラー写真の保存は、老朽化と不適切な保存による劣化によって困難である。
欠陥アノテーション付きオートクロムのデータセットは公開されていない。
本稿では,デジタル化されたオートクロム写真における緑色欠陥を自動的に除去する手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:51:09 GMT)
Towards Skeletal and Signer Noise Reduction in Sign Language Production via Quaternion-Based Pose Encoding and Contrastive Learning [7.7] 本稿では,標準プログレッシブトランスフォーマー(PT)アーキテクチャの2つの拡張を提案する。
まず,四元数空間における骨回転を用いたポーズを符号化し,ジオデシックな損失を生かし,角関節運動の精度と明瞭さを向上させる。
第2に、グロスオーバーラップまたはSBERTベースの文類似性を用いて、意味的類似性による構造デコーダの埋め込みに対照的な損失を導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:52:51 GMT)
Evaluating Retrieval-Augmented Generation vs. Long-Context Input for Clinical Reasoning over EHRs [7.7] 大規模言語モデル(LLM)は、構造化されていないテキストの抽出と推論に有望なソリューションを提供する。
Retrieval-augmented Generation (RAG)は、EHR全体からタスク関連パスを検索する代替手段を提供する。
以上の結果から,新たなモデルがより長いテキストを扱えるようになったとしても,RAGは競争力と効率のよいアプローチであり続けていることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:09:37 GMT)
Successive Halving with Learning Curve Prediction via Latent Kronecker Gaussian Processes [7.7] 我々は,Kronecker Gaussian Processs に基づく学習曲線予測による逐次ハルヴィングの導出が限界を克服できるかどうかを考察する。
我々は、この予測アプローチを、現在のパフォーマンス値に基づく標準アプローチと比較する。
実験の結果, 予測手法は競争性能を達成できるが, 標準手法により多くの資源を投入するよりも最適ではないことがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:10:23 GMT)
Wormhole Dynamics in Deep Neural Networks [7.5] 本研究では,ディープニューラルネットワーク(DNN)の一般化挙動について検討する。
我々は、DNNが人間にランダムまたは非構造化に見える入力を確実に分類する「食物例」の現象に焦点を当てる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:41:53 GMT)
A Comprehensive Review of Agricultural Parcel and Boundary Delineation from Remote Sensing Images: Recent Progress and Future Perspectives [7.5] 本総説では,農業用パーセルの検知とデライン化のための農業用パーセル境界線法(APBD)について述べる。
本稿では,従来の画像処理手法(画素ベース,エッジベース,領域ベースを含む),従来の機械学習手法(ランダムフォレスト,決定木など),ディープラーニング方式の3つのクラスに分類する。
本稿では, APBD 関連応用の紹介と今後の APBD 研究の今後の展望と熱い話題について紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:24:42 GMT)
Rule-based Key-Point Extraction for MR-Guided Biomechanical Digital Twins of the Spine [7.5] サブピクセル精度の高いキーポイント抽出のためのルールベース手法を提案する。
本手法は,解剖学的に意味のあるランドマークを生成するために,頑健な画像アライメントと脊椎特異的な方向推定を取り入れたものである。
この研究は、正確な医用画像解析と生体力学シミュレーションのギャップを埋めることによって、デジタル双生児エコシステムに寄与する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:31:40 GMT)
Evaluating Sparse Autoencoders for Monosemantic Representation [7.5] 大きな言語モデルを解釈する鍵となる障壁は多意味性(polysemanticity)であり、ニューロンは複数の無関係な概念を活性化する。
スパースオートエンコーダ(SAE)は、高密度なアクティベーションをよりスパースで解釈可能な特徴に変換することでこの問題を軽減するために提案されている。
本稿では,単意味性に関する基礎モデルに対して,SAEを初めて体系的に評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:08:01 GMT)
Robust Finite-Memory Policy Gradients for Hidden-Model POMDPs [7.4] 部分的に観測可能なマルコフ決定プロセス(POMDP)は、不確実性の下でのシーケンシャルな意思決定において特定の環境をモデル化する。
我々は,HM-POMDPが異なる環境モデル,すなわち共有行動と観測空間を持つPOMDPをキャプチャすることを示す。
ポリシーが与えられたHM-POMDPに対して、それぞれのPOMDPに対して十分な性能を達成した場合、ロバストである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:45:49 GMT)
EgoDex: Learning Dexterous Manipulation from Large-Scale Egocentric Video [7.1] EgoDexは、これまでで最大かつ最も多様な人体操作のデータセットである。
ビデオの撮影時間は829時間で、3Dの手と指の追跡データをペアリングして記録する。
このデータセットは、194種類のテーブルトップタスクにおいて、日常的な家庭内オブジェクトとの多様な操作行動をカバーする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:48:50 GMT)
A Robust Large-Period Discrete Time Crystal and its Signature in a Digital Quantum Computer [7.1] 我々は、より非自明な周期四重奏法DTC(4T$-DTCs)をサポートする二層粒子の相互作用系を開発する。
このような4T$-DTCの明確なシグネチャを量子プロセッサで観測する。
本研究は, 標準周期双曲力学を超越した時間結晶性の明確な実現を示すことによって, 時間結晶挙動のランドスケープを拡張した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:58:53 GMT)
Improving in-context learning with a better scoring function [7.1] 大規模言語モデル(LLM)は、インコンテキスト学習(ICL)として知られるアナロジーによって学習する顕著な能力を示す。
本稿では,エムオールやエムのような一階量子化器を含むタスクや線形関数を持つICLにおけるこれらの制限について検討する。
我々は、Softmaxに代わる新しい代替品であるtextbfscaled signed averaging (SSA)を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:01:34 GMT)
DE-VAE: Revealing Uncertainty in Parametric and Inverse Projections with Variational Autoencoders using Differential Entropy [7.0] 学習されたパラメトリックおよび可逆射影を改善するための不確実性を考慮した変分AEであるDE-VAEを提案する。
固定投影が与えられた場合、2次元空間への写像と元の空間への逆写像を学ぶためにDE-VAEを訓練する。
以上の結果から, DE-VAE は他の AE 法と同等の精度でパラメトリックおよび逆射影を生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:31:03 GMT)
QA-VLM: Providing human-interpretable quality assessment for wire-feed laser additive manufacturing parts with Vision Language Models [7.0] 添加物製造(AM)における品質評価(QA)は、熟練した人間のオペレーターの専門知識と一定の注意に大きく依存することが多い。
本稿では,視覚言語モデル(VLM)の注意機構と推論機能を活用し,人間の解釈可能な品質評価を生成する新しいQA-VLMフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:51:55 GMT)
AFABench: A Generic Framework for Benchmarking Active Feature Acquisition [6.9] AFABenchはActive Feature Acquisitionの最初のベンチマークフレームワークです。
静的,欲求,強化学習に基づくアプローチを含む,すべての主要カテゴリの代表的アルゴリズムを実装し,評価する。
我々の結果は、異なるAFA戦略間の重要なトレードオフを浮き彫りにし、将来の研究に実用的な洞察を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:29:16 GMT)
Collab-REC: An LLM-based Agentic Framework for Balancing Recommendations in Tourism [6.9] Collab-RECは、人気バイアスに対処し、観光レコメンデーションの多様性を高めるために設計されたマルチエージェントフレームワークである。
ヨーロッパの都市クェリの実験では、Collab-RECは単一エージェントのベースラインに比べて多様性と全体的な妥当性を改善している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:49:06 GMT)
TolerantECG: A Foundation Model for Imperfect Electrocardiogram [6.9] TolerantECGは、ノイズに対して堅牢で、標準の12リードECGの任意のサブセットで機能するECG信号の基礎モデルである。
TolerantECGトレーニングは、コントラストと自己教師付き学習フレームワークを組み合わせて、ECG信号表現を共同で学習する。
ベンチマークの結果、TolerantECGは、様々なECG信号条件において、最高または第2位のパフォーマーとして一貫してランク付けされている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:07:02 GMT)
From Sound to Sight: Towards AI-authored Music Videos [6.8] ユーザが指定した、ボーカルまたは楽器の曲から、音楽ビデオを自動的に生成するための2つの新しいパイプラインを提案する。
音楽ビデオ制作者のマニュアルにインスパイアされた我々は、潜在機能に基づく技術がいかに音声を分析できるかを実験した。
次に、生成モデルを用いて、対応するビデオクリップを生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:54:53 GMT)
Addressing Graph Anomaly Detection via Causal Edge Separation and Spectrum [6.7] 現実の世界では、異常なエンティティは、他の異常なエンティティと直接リンクを隠しながら、より正当な接続を追加することが多い。
本研究は, 異性度が異なるノードのスペクトル分布を解析し, 異常ノードの不均一性がスペクトルエネルギーのシフトを引き起こすことを明らかにする。
異種グラフ上の異常検出のための因果エッジ分離に基づくスペクトルニューラルネットワークCES2-GADを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:59:22 GMT)
NeRC: Neural Ranging Correction through Differentiable Moving Horizon Location Estimation [6.7] 本稿では,ニューラルネットワークモジュールをトレーニングする作業目的として,ローカライズ関連メトリクスが使用される,堅牢なエンドツーエンドニューラル補正フレームワークを提案する。
比較的容易に取得可能な地道的位置を用いてニューラルネットワークを訓練する。
さらに,Euclidean Distance Field (EDF) のコストマップを用いた新たな学習パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:23:32 GMT)
On the Interplay between Graph Structure and Learning Algorithms in Graph Neural Networks [6.6] グラフニューラルネットワーク(GNN)における学習アルゴリズムとグラフ構造との相互作用について検討する。
本研究は,GNNにおけるグラフ構造と学習の相互作用を理解する上で,いくつかの重要な貢献をしている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:26:56 GMT)
A Non-Asymptotic Convergent Analysis for Scored-Based Graph Generative Model via a System of Stochastic Differential Equations [6.6] Score-based graph generative model (SGGMs) の非漸近収束解析について述べる。
解析の結果,収束境界に影響を及ぼすSGGMに特有のいくつかの特異な要因が明らかになった。
この研究は、SGGMの理論的理解を深め、重要な領域におけるそれらの適用性を実証し、効果的なモデルを設計するための実践的なガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:44:42 GMT)
Towards PerSense++: Advancing Training-Free Personalized Instance Segmentation in Dense Images [6.5] PerSenseは、例えば高密度画像において、エンドツーエンド、トレーニング不要、およびモデルに依存しないフレームワークである。
PerSenseは、インスタンスレベルの候補ポイントプロンプトを生成する新しいインスタンス検出モジュール(IDM)を使用している。
Point Prompt Selection Module (M)は、適応しきい値と空間ゲーティングによって偽陽性をフィルタリングする。
PerSense++には3つの追加コンポーネントが組み込まれている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:23:08 GMT)
Cohort-Aware Agents for Individualized Lung Cancer Risk Prediction Using a Retrieval-Augmented Model Selection Framework [6.5] 肺がんのリスク予測は、患者集団間の大きな変動と臨床環境のために依然として困難である。
本稿では,各患者に対して最も適切なモデルを動的に選択する,パーソナライズされた肺癌リスク予測エージェントを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:59:39 GMT)
Safety-Critical Learning for Long-Tail Events: The TUM Traffic Accident Dataset [6.4] 我々は,現実の高速道路事故の集合体であるTUM交通事故データセットを提示する。
294,924のラベル付き2Dと93,012のラベル付き3Dボックスと48,144のラベル付きフレームのトラックIDが4台の路面カメラとLiDARから10Hzで記録されている。
本稿では,ルールに基づくアプローチと学習に基づくアプローチを組み合わせた事故検出モデルであるAccid3nDを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:38:50 GMT)
Classification or Prompting: A Case Study on Legal Requirements Traceability [6.4] コンプライアンスの実証には、法的規定への要求の追跡が必要である。
大規模言語モデル(LLM)を含む言語モデルに基づく2つの自動解について検討する。
以上の結果から, 法的文脈における要求トレーサビリティは, 構造分類器によって簡単には対処できないことが示唆された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:37:19 GMT)
Reinitializing weights vs units for maintaining plasticity in neural networks [6.4] 可塑性の喪失は、ニューラルネットワークが非定常データで長時間訓練されたときに学習能力を失う現象である。
可塑性の喪失を防ぐ効果的な技術は、ネットワークの活性化である。
本稿では,ネットワーク内の最短重みを再初期化するための,テキスト選択的重み再初期化という新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:53:57 GMT)
PGF-Net: A Progressive Gated-Fusion Framework for Efficient Multimodal Sentiment Analysis [6.4] PGF-Netは,効率よく解釈可能なマルチモーダル感情分析のための新しいディープラーニングフレームワークである。
本稿では,音声と視覚ストリームの非言語的特徴を動的に問合せし統合するために,クロスアテンション機構を用いたプログレッシブ・イントラライヤー・フュージョン(Progressive intra-Layer Fusion)パラダイムを提案する。
第二に、モデルにはAdaptive Gated Arbitration機構が組み込まれており、元の言語情報のバランスをとるために動的コントローラとして機能する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:29:26 GMT)
Reliable Smoke Detection via Optical Flow-Guided Feature Fusion and Transformer-Based Uncertainty Modeling [6.3] スモークプラムは、照明の変動、流れのキネマティクス、環境騒音に影響される複雑なダイナミクスを示す。
単眼画像から抽出した煙の特徴表現を統合することで,情報融合フレームワークを提案する。
2相不確かさを意識したWindows Transformerを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:28:53 GMT)
Open-Universe Assistance Games [6.2] GOODは、人間との対話中に自然言語形式で目標を抽出する、データ効率のよいオンライン手法である。
GOODはLLMに、異なる複雑な意図を持つユーザをシミュレートするよう促し、その応答を使用して、候補目標に対する確率的推論を実行する。
我々は、テキストベースの食料品ショッピングドメインと、テキスト操作型家庭用ロボット環境におけるGOODの評価を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:07:10 GMT)
Redundant feature screening method for human activity recognition based on attention purification mechanism [6.2] マルチスケールネットワークに適したMSAPと呼ばれる汎用的な特徴浄化機構を提案する。
この機構は、マルチスケール特徴の重ね合わせによる特徴冗長性を効果的に解決する。
さらに,各ネットワークモジュールの層間をシームレスに統合するネットワーク補正モジュールを設計した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:16:23 GMT)
Emergent Crowds Dynamics from Language-Driven Multi-Agent Interactions [6.1] エージェントの動きを制御するために,大規模言語モデル(LLM)を利用する新しい手法を提案する。
社会的相互作用, ステアリング, 群集間の相互作用を実証する2つの複雑なシナリオで本手法を検証した。
本研究では,環境環境から自然に発生する集団行動を用いて,より現実的な群集シミュレーションを行う。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:15:14 GMT)
Poisson Midpoint Method for Log Concave Sampling: Beyond the Strong Error Lower Bounds [6.1] 過度に損傷/破壊されたランゲヴィン力学の中間点離散化を用いた$mathbbRd$上の強対数分布からのサンプリング問題について検討する。
2-ワッサーシュタイン距離(W$)における収束性を証明し、オイラー・丸山離散化に対する目標精度(epsilon$)に依存して立方体スピードアップを達成する。
特に、アンダーダムングランゲヴィン力学の場合、$W$収束の複雑さは$L2$の収束の複雑さの下限よりもはるかに小さいことを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:06:53 GMT)
Enabling Multi-Agent Systems as Learning Designers: Applying Learning Sciences to AI Instructional Design [6.1] 本研究は,教育的専門知識を利用者のプロンプトからLLMの内部アーキテクチャへシフトさせる。
二次数学と理科の学習活動を生成するための3つのシステムを検証した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:44:00 GMT)
Hilbert geometry of the symmetric positive-definite bicone: Application to the geometry of the extended Gaussian family [6.0] 拡張ガウス族のパラメータ空間は対称正半定値行列双錐を形成する。
そのような有界凸対称正定値双錐のヒルベルト幾何学を研究する。
拡張ガウス分布を扱うためのこの幾何学の潜在的な応用について触れる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:57:02 GMT)
Lifespan Pancreas Morphology for Control vs Type 2 Diabetes using AI on Largescale Clinical Imaging [5.9] 0歳から90歳までの形態計測で膵の大きさと形状を測定した。
我々の目標は、AIに基づく膵臓計測のための信頼性の高い臨床画像モダリティを特定し、基準的形態的加齢傾向を確立し、タイプ2糖尿病の潜在的な偏差を検出することである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:49:15 GMT)
PathGPT: Reframing Path Recommendation as a Natural Language Generation Task with Retrieval-Augmented Language Models [5.8] パスレコメンデーション(PR)は、ユーザの特定の好みや制約に合わせてカスタマイズされた旅行経路を生成することを目的としている。
本稿では,自然言語生成タスクとしてPRを概念化する代替パラダイムを提案する。
PathGPTは,歴史軌跡データと自然言語利用者の制約を生かした検索拡張大型言語モデル(LLM)システムである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:37:23 GMT)
DiffIER: Optimizing Diffusion Models with Iterative Error Reduction [5.8] 高品質な生成のための最適化手法であるDiffIERを提案する。
本稿では,各ステップにおける反復誤差最小化により,累積誤差を効果的に低減できることを実証する。
この方法は、テキスト・ツー・イメージ生成、画像超解像、テキスト・ツー・音声生成において一貫した成功を達成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:14:16 GMT)
Credence Calibration Game? Calibrating Large Language Models through Structured Play [5.6] 大きな言語モデル(LLM)は、決定クリティカルなドメインにますますデプロイされています。
既存の校正法は主にポストホック調整や補助モデル訓練に重点を置いている。
クレデンスゲームに触発された新しいプロンプトベースのキャリブレーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:33:38 GMT)
Each to Their Own: Exploring the Optimal Embedding in RAG [5.6] Retrieval-Augmented Generationは、低コストでパラメータチューニングの最小限の労力で有名である。
複数の埋め込みモデルの利点を組み合わせることでRAGを強化する2つの手法を提案し,検討する。
Confident RAGは、異なる埋め込みモデルを使用して複数のレスポンスを生成し、次に、最も信頼度の高いレスポンスを選択する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:44:38 GMT)
Evaluating Autoencoders for Parametric and Invertible Multidimensional Projections [5.6] パラメトリックおよび可逆プロジェクションを作成するための3つのオートエンコーダアーキテクチャを評価する。
与えられた射影に基づいて、2次元空間への写像と元の空間への逆写像を学ぶためにAEを訓練する。
この結果から,AEはフィードフォワードニューラルネットワークよりもスムーズなパラメトリックおよび逆プロジェクションを生成できることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:35:22 GMT)
Note on Dirac monopole theory and Berry geometric phase [5.6] この研究は、ディラック理論をパラメータ空間に拡張することで、ディラック単極理論とベリー幾何学相の間の本質的な関係を明らかにする。
このようなディラック弦によって誘導される非可積分位相因子が、よく知られたベリー接続と曲率を直接引き起こすことを示す。
この結果から、ベリー幾何学相は本質的にはパラメータ空間の終点を持つディラック弦によって誘導される非可積分位相因子であることが示唆された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:02:03 GMT)
Unsupervised Urban Tree Biodiversity Mapping from Street-Level Imagery Using Spatially-Aware Visual Clustering [5.5] 都市部の樹木の多様性は、気候の回復力、生態学的安定性、および都市の自由性に重要である。
フィールドベースの在庫はシャノンとシンプソンの多様性の信頼できる見積もりを提供するが、コストと時間を要する。
街路レベルの画像からの視覚的埋め込みと空間的植込みパターンを統合し,ラベルなしで生物多様性を推定する,教師なしクラスタリングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:25:04 GMT)
PepThink-R1: LLM for Interpretable Cyclic Peptide Optimization with CoT SFT and Reinforcement Learning [5.5] PepThink-R1は、大規模言語モデルとチェーン・オブ・ファインタニングと強化学習を統合した生成フレームワークである。
我々は,PepThink-R1が脂質分解能,安定性,暴露性を著しく増強した環状ペプチドを産生することを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:13:52 GMT)
Mapping the Course for Prompt-based Structured Prediction [5.5] 本稿では,LLMの予測力と推論手法による構造的整合性を組み合わせることを提案する。
構造的予測目標を用いたキャリブレーションと微調整が,課題に対する性能向上につながることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:00:28 GMT)
Learning Point Cloud Representations with Pose Continuity for Depth-Based Category-Level 6D Object Pose Estimation [5.5] HRC-Poseは,カテゴリレベルのオブジェクトポーズ推定のための,新しい奥行きのみのフレームワークである。
HRC-Poseはオブジェクトをローテーションと翻訳のコンポーネントに分解し、ネットワーク全体で個別にエンコードされ、活用される。
REAL275およびCAMERA25ベンチマークの結果、我々の手法は既存の深さのみの最先端手法よりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:09:02 GMT)
It's the Thought that Counts: Evaluating the Attempts of Frontier LLMs to Persuade on Harmful Topics [5.4] 我々は,説得的試みの頻度と文脈を説得し,測定する意思を識別する自動モデルを導入する。
オープンかつクローズドウェイトなモデルの多くは、有害なトピックに対する説得を積極的に試みている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:30:52 GMT)
UAV-ON: A Benchmark for Open-World Object Goal Navigation with Aerial Agents [5.4] UAV-ONは、オープンワールド環境における航空エージェントによる大規模目標航法(NavObject)のベンチマークである。
多様な意味領域と複雑な空間レイアウトを備えた14の高忠実なUnreal Engine環境で構成されている。
1270のアノテートされたターゲットオブジェクトを定義し、それぞれがカテゴリ、物理フットプリント、視覚ディスクリプタをエンコードするインスタンスレベルの命令によって特徴付けられる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:18:45 GMT)
Investigating Transcription Normalization in the Faetar ASR Benchmark [5.3] フェタール自動音声認識ベンチマークにおける転写不整合の役割について検討する。
手作りの小さな辞書の助けを借りて、我々は、不整合は転写に存在しているが、それらはタスクにおける主要な課題ではないと結論づける。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:19:36 GMT)
Near Optimal Non-asymptotic Sample Complexity of 1-Identification [5.3] 純粋探索における基本的多武装バンディット定式化である1同定問題について検討する。
目標は、平均報酬が少なくとも既知の閾値$mu_0$である腕が存在するかどうかを判断すること、またはそのような腕が存在しないと信じている場合、Noneを出力することである。
我々は,新しいアルゴリズムを設計し,非漸近的観点から理論的解析を行う。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:44:30 GMT)
Physics-Driven Autoregressive State Space Models for Medical Image Reconstruction [5.2] 本研究では,高忠実かつ効率的な画像再構成のための物理駆動自己回帰状態空間モデル(SSM)であるMambaRollを提案する。
MambaRollは、各カスケードが粗いスケールの表現でより微細な特徴マップを自動回帰予測するアンロールアーキテクチャを採用している。
MambaRoll は最新 CNN 法, Transformer- 法, SSM 法を常に上回っている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:04:12 GMT)
Improving OCR using internal document redundancy [5.1] 文書内の文字形状の冗長性を利用して、与えられたOCRシステムの不完全な出力を補正する教師なし手法を提案する。
回復したウルグアイ軍文書や17世紀から20世紀半ばのヨーロッパの新聞など、さまざまなレベルの文書の劣化を実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:21:43 GMT)
MissionHD: Data-Driven Refinement of Reasoning Graph Structure through Hyperdimensional Causal Path Encoding and Decoding [5.1] LLM(Large Language Models)からの推論グラフは、ビデオ異常検出(VAD)のような下流の視覚的タスクとよく一致しない。
既存のグラフ構造リファインメント(GSR)法は、これらの新しいデータセットレスグラフに不適である。
下流のタスクデータを用いてグラフ構造を直接最適化する新しいパラダイムであるデータ駆動型GSR(D-GSR)を紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:43:04 GMT)
OASIS: Open-world Adaptive Self-supervised and Imbalanced-aware System [5.1] 不均衡なデータに対して事前学習を行っても,オープンワールドの問題に効果的に対処する手法を提案する。
我々のコントラストベースの事前学習アプローチは、特に表現不足クラスにおいて、分類性能を高める。
提案手法は,様々なオープンワールドシナリオにおいて,精度と効率の両面で最先端の適応手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:09:05 GMT)
DGenCTR: Towards a Universal Generative Paradigm for Click-Through Rate Prediction via Discrete Diffusion [5.0] 離散拡散に基づく2段階CTRトレーニングフレームワーク(DGenCTR)を提案する。
本発明の2段階のフレームワークは、拡散ベースの生成前訓練段階と、CTRのためのCTRを標的とした微調整段階とを含む。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:42:21 GMT)
Improving Token-based Object Detection with Video [5.0] 本稿では、Pix2Seqオブジェクト検出器をビデオ用に拡張することで改善する。
オブジェクトを離散トークンの可変長シーケンスとして表現する。
ビデオオブジェクトは、完全に統合され、分割できない3Dボックスまたはトラックレットとして出力する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:50:02 GMT)
Improving Fairness in Graph Neural Networks via Counterfactual Debiasing [5.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データのモデリングに成功している。
GNNは、人種や性別などの属性に基づいた予測においてバイアスを示すことができる。
本稿では, バイアス軽減のためのデファクト・デファクト・データ拡張手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:59:05 GMT)
Distributional Adversarial Attacks and Training in Deep Hedging [4.9] 分布シフト下での古典的深層湿潤戦略の堅牢性について検討する。
本研究では, 深層湿潤戦略の堅牢性を高めるために, 対戦型トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:59:32 GMT)
Coprime Bivariate Bicycle Codes and Their Layouts on Cold Atoms [4.9] この研究は、量子誤り訂正に適した新しいBB符号のサブクラスに寄与する。
コード発見の前にパラメータが不明なバニラBB符号とは対照的に、提案された符号の速度は事前に決定できる。
このコリメ-BB構造を用いて、これまで知られていなかった驚くほど短小から中短の符号を発見した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:23:14 GMT)
RNDiff: Rainfall nowcasting with Condition Diffusion Model [4.9] 降水予測タスクに拡散モデルを導入する。
本研究では,過去の観測データに基づく条件拡散モデルを用いた短期降水量予測手法を提案する。
余分な条件デコーダモジュールをデノナイジングプロセスに組み込むことで、SRNDiffはエンドツーエンドの条件付き降雨予測を実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:53:20 GMT)
Generalized Statistics on Lattices [4.8] 我々は任意の次元の格子上でのアベリア励起の一般化統計量を決定する普遍的な顕微鏡的手法を開発した。
それぞれの統計不変量は一般化対称性の't Hooft anomaly'に対応することを示す。
これにより、顕微鏡格子異常と多体力学の正確な関係が確立される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:19:21 GMT)
Federated Distillation on Edge Devices: Efficient Client-Side Filtering for Non-IID Data [4.8] フェデレーテッド・ラーニングは、有望なコラボレーティブ・機械学習のアプローチとして登場した。
本稿では,クライアント側密度比推定の複雑さを低減し,資源効率の高いEdgeFD手法を提案する。
我々は、知識蒸留のためにサーバー上で事前訓練された教師モデルを必要とすることなく、強力な非IID、弱い非IID、およびクライアント上のIDデータ分布を含む様々な実践シナリオでEdgeFDを評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:17:59 GMT)
Kernel-based Equalized Odds: A Quantification of Accuracy-Fairness Trade-off in Fair Representation Learning [4.8] 本稿では、公平な表現学習のために、EO_k$と表記されるEqualized Odds criterionのカーネルベースの新しい定式化を提案する。
EO_k$は、前者の独立性と分離の両方を満たすことを示し、予測精度をユニークに保存する。
さらに、2次時間で計算できるカーネルベースの統計量である$hatEO_k$を実証的に定義する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:41:34 GMT)
GaussianArt: Unified Modeling of Geometry and Motion for Articulated Objects [4.7] 本稿では,3次元ガウスモデルを用いて幾何学と運動を共同でモデル化する統一表現を提案する。
この定式化により、運動分解の堅牢性が向上し、最大で20個の部分を持つ明瞭な物体をサポートする。
提案手法は, 広範囲な物体の形状復元と動き推定において, 常に優れた精度を達成できることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:59:08 GMT)
You Only Pose Once: A Minimalist's Detection Transformer for Monocular RGB Category-level 9D Multi-Object Pose Estimation [4.7] YOPOは、カテゴリレベルの9-DoF推定を2D検出の自然な拡張として扱う、単一ステージのクエリベースのフレームワークである。
YOPOは3つのベンチマークでその技術の新たな状態を設定する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:00:01 GMT)
Mitigating Data Exfiltration Attacks through Layer-Wise Learning Rate Decay Fine-Tuning [4.6] データレイクは、機密性の高い高価値の医療データセットで強力な機械学習モデルのトレーニングを可能にする。
近年の研究では、潜在表現をモデルパラメータに埋め込むことで、学習データを抽出できることが示されている。
本稿では,モデルパラメータを減衰層ワイド学習率で微調整することで,輸出時のモデルパラメータを摂動する簡易かつ効果的な緩和戦略を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:05:01 GMT)
Measuring IIA Violations in Similarity Choices with Bayesian Models [4.6] 類似性選択データは、例えば情報検索や埋め込み学習設定の文脈で、人間がターゲットと類似性に基づいて選択を行うときに発生する。
IIA違反は多くの個別選択設定で検出されているが、類似性選択設定には注意が払われている。
本稿では,古典的適合性テストと,後方予測チェックの枠組みに基づくベイズ的テストの2つの統計的手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:02:26 GMT)
Non-Equilibrium Probing of Topological Supersolids in Spin-Orbit-Coupled Dipolar Condensates [4.5] キラル超固体は、結晶秩序、超流動性、およびトポロジカルスピンテクスチャを同時に示す量子相である。
スピン軌道結合型双極子ボース-アインシュタイン凝縮体において, 調整可能な非平衡ダイナミクスを持つキラル超固体を実証した。
この結果は、スピントロニクス機能を持つトポロジカル物質を設計するためのプラットフォームとして双極性量子ガスを確立した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:34:01 GMT)
CEO-DC: Driving Decarbonization in HPC Data Centers with Actionable Insights [4.5] データセンターの急速な成長はエネルギー需要を増大させ、ICTセクターの炭素格差を拡大している。
この研究は、二酸化炭素排出量、経済コスト、計算資源のスケーリングに影響を与える調達決定における中心的なトレードオフに対処する。
CEO-DCをAIとHPCのトレンドに適用すると、72%のケースでは、プラットフォームの改善が需要増加に遅れていることが分かる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:43:35 GMT)
Can LLM Agents Solve Collaborative Tasks? A Study on Urgency-Aware Planning and Coordination [4.5] 大規模言語モデル(LLM)は、コミュニケーション、計画、推論において強力な能力を示している。
本研究は,マルチエージェント協調作業におけるLCMの強みと失敗モードに関する新たな知見を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:44:10 GMT)
A Comprehensive Evaluation of the Sensitivity of Density-Ratio Estimation Based Fairness Measurement in Regression [4.5] 本稿では, 種々の密度比推定コアを用いた公正度測定法を開発した。
実験により, 密度比推定コアの選択は, 公正度測定法の結果に大きく影響することが示された。
これらの観測は、回帰における密度比推定に基づく公平度測定の大きな問題を示唆している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:54:55 GMT)
Linkage Attacks Expose Identity Risks in Public ECG Data Sharing [4.5] 攻撃者が部分的知識で操作する現実的な条件下でのプライバシーリスクを評価する。
提案手法は,個人を公開データセットで再同定する際の精度を85%向上させる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:52:10 GMT)
MoEcho: Exploiting Side-Channel Attacks to Compromise User Privacy in Mixture-of-Experts LLMs [4.4] MoEchoは分析ベースのアタックサーフェスで、MoEベースのシステムのユーザのプライバシを侵害する。
大規模言語モデル(LLM)と視覚言語モデル(VLM)において,MoEアーキテクチャに基づくユーザプライバシを効果的に侵害する4つの攻撃を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:02:35 GMT)
MedCoT-RAG: Causal Chain-of-Thought RAG for Medical Question Answering [4.3] 大規模言語モデル (LLM) は医学的な疑問に答える上で有望であるが、幻覚や浅い推論に苦しむことが多い。
Retrieval-augmented Generation (RAG)は、外部の医療知識でLSMを強化するための実用的でプライバシー保護の手段を提供する。
MedCoT-RAGは、因果認識ドキュメント検索と構造化チェーン・オブ・シークレット・プロンプトを組み合わせたドメイン固有フレームワークである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:43:26 GMT)
Adaptive Anomaly Detection in Evolving Network Environments [4.3] 分布シフトは、ディープラーニングの異常検出システムにとって重要な課題である。
既存の異常検出システムは、しばしばこれらのシフトに適応するのに苦労する。
ネットワークデータにおける教師付き異常検出のためのフレームワークであるNetSightを導入し,分散シフトを継続的に検出し適応する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:31:57 GMT)
LoSiA: Efficient High-Rank Fine-Tuning via Subnet Localization and Optimization [4.2] LoSiA(Low-Resources Subnet Integration Adaptation)は、トレーニングプロセス中に重要なパラメータを動的にローカライズし最適化する革新的な手法である。
LoSiA-ProはLoSiAのより高速な実装で、LoRAと比較してトレーニングのレイテンシを約27%削減します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:33:10 GMT)
EmoTale: An Enacted Speech-emotion Dataset in Danish [4.2] エモテール(EmoTale)は、デンマーク語と英語の音声録音のコーパスである。
我々は,自己教師付き音声モデル埋め込みとopenSMILE特徴抽出器を用いて,EmoTaleのSERモデルと参照データセットを開発した。
最良のモデルでは、エモテール・コーパスで64.1%の未加重平均リコール(UAR)を達成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:01:54 GMT)
SurveyGen-I: Consistent Scientific Survey Generation with Evolving Plans and Memory-Guided Writing [4.2] SurveyGen-Iは、粗大な検索、適応計画、メモリ誘導生成を組み合わせた自動サーベイ生成フレームワークである。
4つの科学的領域にわたる実験では、SurveyGen-Iはコンテンツ品質、一貫性、引用カバレッジにおいて、従来よりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:03:46 GMT)
Quo Vadis, Code Review? Exploring the Future of Code Review [4.2] 今日、実践者がコードレビューをどのように反映し、近い将来に期待する変化について検討する。
次に、コードレビューの進化に対するこれらの予想される変化の長期的リスクとその協調ソフトウェアエンジニアリングにおける役割について論じる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:29:57 GMT)
Great GATsBi: Hybrid, Multimodal, Trajectory Forecasting for Bicycles using Anticipation Mechanism [4.0] 本稿では,自転車用ドメイン知識に基づくハイブリッドマルチモーダル軌道予測フレームワークであるGreat GATsBiを紹介する。
このモデルには、物理学に基づくモデリング(電動車両にインスパイアされた)と社会に基づくモデリング(歩行者運動にインスパイアされた)の両方が含まれており、自転車運動の二重性について明確に説明されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:31:35 GMT)
LLM4FS: Leveraging Large Language Models for Feature Selection [4.0] 大規模言語モデル(LLM)の最近の進歩は、意思決定に新たな機会をもたらした。
従来のデータ駆動方式とLCMを統合したLSM4FSというハイブリッド戦略を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:35:22 GMT)
DINOv3 with Test-Time Training for Medical Image Registration [4.0] 本稿では,凍結したDINOv3エンコーダと,特徴空間における変形場の試験時間最適化に依存する無トレーニングパイプラインを提案する。
2つの代表的なベンチマークで、この方法は正確であり、定期的に変形する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:58:19 GMT)
Generalizable Spectral Embedding with an Application to UMAP [3.9] スペクトル埋め込み(SE)は、様々な領域にまたがる次元還元法として一般的な方法である。
既存のSE実装では、これらの欠点のうち2つに対処することが多いが、残りの2つには対処できない。
Sep-SpectralNetは、3つの制限すべてに対処するために設計されたSE実装です。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:31:59 GMT)
AFLoRA: Adaptive Federated Fine-Tuning of Large Language Models with Resource-Aware Low-Rank Adaption [3.8] フェデレートされた微調整は、分散データを使用して下流タスクにファンデーションモデルを適用するための有望なアプローチとして現れている。
大規模言語モデルのための適応的で軽量なファインチューニングフレームワークであるAFLoRAを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:08:03 GMT)
Demonstrating Onboard Inference for Earth Science Applications with Spectral Analysis Algorithms and Deep Learning [3.8] CS-6は可視・近赤外域ハイパースペクトル計とニューラルネットワークアクセラレーションハードウェアを備えた衛星である。
深層学習およびスペクトル解析アルゴリズムを用いて,CS-6上でのデータ解析と推論を行う。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:37:31 GMT)
WISE-FUSE: Efficient Whole Slide Image Encoding via Coarse-to-Fine Patch Selection with VLM and LLM Knowledge Fusion [3.7] 計算病理学(CPath)における全スライド画像(WSI)は、ギガピクセルスケールのために大きな計算課題となる。
本稿では,病理領域の視覚言語モデルと大規模言語モデルを活用した適応型WSI符号化フレームワークWISE-FUSEを提案する。
WISE-FUSEは、WSIエンコーディング時間を3倍に削減し、また、徹底的なパッチ処理と同等以上の診断性能を実現している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:41:19 GMT)
One Subgoal at a Time: Zero-Shot Generalization to Arbitrary Linear Temporal Logic Requirements in Multi-Task Reinforcement Learning [3.6] 複雑で時間的に拡張されたタスク目標と安全制約への一般化は、強化学習(RL)における重要な課題である。
本稿では,任意の仕様に対してゼロショットの一般化を可能にするGenZ-LTLを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:06:22 GMT)
Power Stabilization for AI Training Datacenters [3.6] 数十万のGPUにまたがる大規模な人工知能(AI)トレーニングワークロードには、ユニークなパワーマネジメントの課題があります。
これは、訓練中の消費電力の変動が大きいためである。
AIトレーニングワークロードの安全なスケーリングを継続するためには、そのようなワークロードのパワーを安定化する必要があります。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:04:06 GMT)
Sealing The Backdoor: Unlearning Adversarial Text Triggers In Diffusion Models Using Knowledge Distillation [3.5] 学習データに知覚不可能なテキストトリガーを注入することで、モデルが操作された出力を生成する。
本稿では, 対人的テキストトリガと有毒なアウトプットの関連を除去するために, クロスアテンション誘導による自己知識蒸留(SKD-CAG)を提案する。
本手法は,画素バックドアの除去精度を100%,スタイルベース攻撃の93%で達成し,ロバスト性や画像の忠実さを犠牲にしない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:57:21 GMT)
Benchmarking graph construction by large language models for coherence-driven inference [3.5] 我々は、コヒーレンスグラフを再構築する大規模言語モデルの能力をベンチマークする。
LLMによる一貫性評価に対するコヒーレンス駆動推論は、マシン認知能力を向上させる可能性がある。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:10:14 GMT)
Distribution-Guided Auto-Encoder for User Multimodal Interest Cross Fusion [3.5] 本稿では,DMAE(Distributed-Guided Multimodal-Interest Auto-Encoder)を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:21:27 GMT)
Adaptively Robust LLM Inference Optimization under Prediction Uncertainty [3.5] 本稿では,Large Language Model (LLM) 推論スケジューリングを最適化し,全遅延を最小化する問題について検討する。
LLM推論の鍵となる課題は、実行時の長さが分かる一方で、メモリ使用量や処理時間に重大な影響を及ぼす出力長が不明であることである。
本稿では,各要求に対して間隔分類(min-max range)を提供すると仮定して,機械学習を利用して出力長を予測するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:55:26 GMT)
Comparison of parallel SMC and MCMC for Bayesian deep learning [3.5] この研究は、一貫した(漸近的に偏りのない)ベイズディープラーニングアルゴリズムの並列実装を体系的に比較する。
SMC$_parallel$に対して収束の証明を行い、理論上単一のモノリシックSMCサンプリング器と同じ収束のレベルを達成することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:50:33 GMT)
STEM: Efficient Relative Capability Evaluation of LLMs through Structured Transition Samples [3.4] 大規模言語モデル(LLM)の評価は、モデル機能が急速に進歩するにつれて、ますます困難になっている。
軽量かつ解釈可能な評価フレームワークとして textbfStructured textbfTransition textbfEvaluation textbfMethod (STEM) を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:52:00 GMT)
Multi-view Graph Condensation via Tensor Decomposition [3.3] グラフニューラルネットワーク(GNN)は、薬物発見、物体検出、ソーシャルメディア分析、レコメンダシステム、テキスト分類など、様々な現実世界の応用において顕著な結果を示してきた。
巨大なポテンシャルとは対照的に、それらを大規模グラフでトレーニングすることは、そのストレージと処理に必要なリソースのため、重大な計算上の課題を示す。
グラフ凝縮は、GNNの予測性能を維持しながら、元のグラフの本質的な情報を保存する合成コンパクトグラフを学習することで、これらの要求を減らすための有望な解決策として現れてきた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:02:18 GMT)
Synthetic vs. Gold: The Role of LLM Generated Labels and Data in Cyberbullying Detection [3.3] サイバーいじめは特に子供に強い脅威を与える。
子どもが使用する言語やコミュニケーションスタイルを特に反映したラベル付きデータには大きなギャップが残っている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:36:23 GMT)
Proto-Quipper with Reversing and Control [3.3] ダガー対称モノイド圏 R を用いて可逆かつ制御可能な回路のセマンティクスを定式化する。
すべての回路が可逆かつ/または制御可能であるわけではないので、可逆性と制御性を追跡するためにモダリティを持つ型システムを用いる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:43:27 GMT)
Fragile, Robust, and Antifragile: A Perspective from Parameter Responses in Reinforcement Learning Under Stress [3.3] 本稿では、内部および外部ストレス下でのネットワークパラメータを体系的に解析することにより、強化学習(RL)ポリシーの堅牢性について検討する。
神経科学においてシナプスの可塑性に触発され、シナプスのフィルタリングはパラメータを選択的に摂動することで内部のストレスをもたらす。
その結果、ストレス下での政策性能を高める反フレジブルパラメータの存在が強調され、RL政策適応性を向上させるためのターゲットフィルタリング技術の可能性が示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:21:01 GMT)
Bi-directional Model Cascading with Proxy Confidence [3.2] 本稿では,カスケード内の小型モデルと大規模モデルの信頼性を同時に考慮した,双方向なdeferralアプローチを提案する。
隠れ状態の分析を用いて、小型モデルの起動後信頼性を向上させる。
次に、これを小さなプロキシモデルと組み合わせて、大規模なモデルの起動前信頼性を推定します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:48:09 GMT)
Security Concerns for Large Language Models: A Survey [3.2] 大きな言語モデル(LLM)は自然言語処理に革命をもたらしたが、その能力は新たなセキュリティ脆弱性も導入している。
この調査は、脅威をいくつかの重要な領域に分類する、これらの新興懸念の包括的概要を提供する。
LLMが安全で有益であることを保証するために、堅牢で多層的なセキュリティ戦略を推進していくことの重要性を強調した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:03:48 GMT)
Hallucinations and Key Information Extraction in Medical Texts: A Comprehensive Assessment of Open-Source Large Language Models [3.1] 大規模言語モデル(LLM)は、このような要約の精度を自動化し改善する大きな可能性を示している。
放電報告から重要な事象を抽出するオープンソースLCMの有効性について検討する。
また,これらのモデルが生成した要約において,様々な種類の幻覚の出現率を評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:24:25 GMT)
Multiscale Video Transformers for Class Agnostic Segmentation in Autonomous Driving [3.1] 我々は、モーションキューのみを用いて未知の物体を検出するマルチスケールビデオトランスフォーマーを開発した。
ビデオのセグメンテーションとパノプティクスのセグメンテーションは、しばしば訓練中に見られる既知のクラスに依存し、新しいカテゴリーを見渡す。
光フローを使わずにクラス非依存のセグメンテーションを訓練した効率的なビデオトランスフォーマーを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:23:11 GMT)
Goals and the Structure of Experience [3.1] 本稿では,認知エージェントにおける目標指向状態表現の計算フレームワークについて述べる。
目的と等価な経験分布のクラスとして定義された,目標指向(telic)状態の構成を導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:05:24 GMT)
Online Incident Response Planning under Model Misspecification through Bayesian Learning and Belief Quantization [3.0] モデル不特定性に基づくインシデント対応計画のためのオンライン手法をMOBALと呼ぶ。
予測モデルを有限モデルに量子化し、動的プログラミングによる効率的な応答計画を可能にする。
CAGE-2ベンチマークの実験では、MOBALは不特定性に対する適応性と堅牢性の観点から、技術の現状よりも優れていた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:25:59 GMT)
Universal Reinforcement Learning in Coalgebras: Asynchronous Stochastic Computation via Conduction [3.0] 普遍強化学習(URL)と呼ばれるRLの分類的一般化を導入する。
論文の前半では、基本的なRLフレームワークをレビューし、RLにおけるカテゴリと関手の使用について説明し、それらが興味深い洞察にどのように導かれるかを示した。
我々は、RLで以前に研究された力学系モデルを拡張した、普遍的コガブラの広いファミリーについて述べる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:37:40 GMT)
When Machine Learning Meets Vulnerability Discovery: Challenges and Lessons Learned [3.0] 本稿では、脆弱性発見に機械学習を適用する際の課題について考察する。
まず、研究者はトレーニングデータセットに関する具体的な統計の提供に失敗することが多い。
第二に、モデルの選択とモデルが訓練される粒度は、そのような脆弱性発見アプローチの有効性にも影響を及ぼす。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:09:49 GMT)
An Open-Source HW-SW Co-Development Framework Enabling Efficient Multi-Accelerator Systems [2.9] 多様なAIワークロードに対する効率的なソリューションとして、不均一なアクセラレータ中心の計算クラスタが登場している。
本稿では,オープンソースのHW-SWフレームワークであるSNAXについて述べる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:04:21 GMT)
Enhancing Contrastive Link Prediction With Edge Balancing Augmentation [2.9] リンク予測におけるコントラスト学習のための最初の公式な理論解析を行う。
本稿では,グラフのノード度を拡張度として調整する新たなグラフ拡張手法であるエッジバランシング拡張(EBA)を提案する。
次に、提案するEBAと、モデル性能を改善するための新たなコントラスト損失を統合したContrastive Link Prediction with Edge Balancing Augmentation(CoEBA)という新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:58:01 GMT)
A Guide to Stakeholder Analysis for Cybersecurity Researchers [2.7] 利害関係者に基づく倫理分析は、現在、トップクラスのサイバーセキュリティ研究施設への提出の正式な要件となっている。
本ガイドは、利害関係者のタイプを列挙し、共通の実証研究手法にマッピングすることで、その要件を実践的に支援する。
私たちのゴールは、研究チームが混乱ではなく、信頼と明確さで新しい倫理規定を満たすのを支援することです。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:48:19 GMT)
Fusing Monocular RGB Images with AIS Data to Create a 6D Pose Estimation Dataset for Marine Vessels [2.7] 本稿では,単眼RGB画像とAISデータとを融合させることで,海洋生物の6次元ポーズ推定データセットを作成する手法を提案する。
提案手法は,手動のアノテーションを必要とせずに,6次元ポーズ推定データセットの作成を可能にする。
ポーズ推定のための3Dバウンディングボックスアノテーションを備えた3753画像からなる公開データセットであるNordelbe Kehrwieder(BONK-pose)について紹介する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:16:33 GMT)
The Digital Sous Chef -- A Comparative Study on Fine-Tuning Language Models for Recipe Generation [2.5] 本稿では,GPT-2大モデル(774M)とGPT-2小モデル(124M)と,RecipeDB 5-cuisineコーパス上の従来のLSTM/RNNベースラインとを比較検討した。
キーとなるコントリビューションは、23個の共通分数トークンとカスタム構造マーカーで語彙を拡大するトークン化戦略です。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:53:13 GMT)
A Novel Vascular Risk Scoring Framework for Quantifying Sex-Specific Cerebral Perfusion from 3D pCASL MRI [2.5] そこで本研究では,年齢および性別による基準的脳血流(CBF)分布から得られた生体情報に基づく血管リスクスコア(VRS)を提案する。
この指標は、神経変性疾患に対する早期低灌流の検出と血管の成層化のための、敏感でパーソナライズされたバイオマーカーを提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:28:01 GMT)
Synaptic bundle theory for spike-driven sensor-motor system: More than eight independent synaptic bundles collapse reward-STDP learning [2.5] 運動ニューロンの数や独立したシナプス束の数が限界を超えると,学習は崩壊する。
学習失敗の確率は、より少ない運動ニューロンによって増加するが、(iii) 学習が成功すれば、より速い学習につながる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:29:33 GMT)
Tighter Privacy Analysis for Truncated Poisson Sampling [2.4] 与えられた最大バッチサイズを超えると、バッチを切断するPoissonサンプリング変種であるTruncated Poissonサンプリングに対して、新しいプライバシー増幅分析を行う。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:00:23 GMT)
SBGD: Improving Graph Diffusion Generative Model via Stochastic Block Diffusion [2.3] グラフ拡散生成モデル(GDGM)は、高品質なグラフを生成する強力なツールとして登場した。
GDGMは、高いメモリ要求のため、大きなグラフにスケールするのに苦労している。
本稿では,グラフ表現をブロックグラフ空間に洗練するブロックグラフ拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:47:46 GMT)
Quantum teleportation over thermal microwave network [2.3] マイクロ波系における量子通信は、分散量子コンピューティングとハイブリッド量子ネットワークにおいて重要な役割を果たす。
熱マイクロ波チャネル上の2つの空間分離希釈冷凍機間でのマイクロ波コヒーレント状態の量子テレポーテーションを,温度4$Kで実現した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:17:22 GMT)
Data Fusion for High-Resolution Estimation [2.3] 人口の健康指標の高精度な推定は、精密な公衆衛生に不可欠である。
異なるデータソースを融合する高分解能推定法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:12:26 GMT)
From App Features to Explanation Needs: Analyzing Correlations and Predictive Potential [2.2] 本研究では,ユーザレビューから分類した説明要求が,アプリ特性に基づいて予測可能であるかを検討する。
メタデータに富んだ4,495のアプリレビューのゴールド標準データセットを分析した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:55:16 GMT)
Controllable Latent Space Augmentation for Digital Pathology [2.2] HistAugは、デジタル病理のための潜在空間における制御可能な拡張のための高速かつ効率的な生成モデルである。
提案手法では,複数パッチの処理を1回のフォワードパスで効率的に行うことができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:11:48 GMT)
A Guide for Manual Annotation of Scientific Imagery: How to Prepare for Large Projects [2.2] 本稿ではアノテーションプロジェクトのためのドメインに依存しない準備ガイドを提供する。
成功の度合い、アノテーションの主題、プロジェクトの目標、データ可用性、重要なチームの役割といった概念に対処します。
アノテーションの品質と効率を改善するためのツールと技術が推奨されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:52:10 GMT)
Evaluating Multilingual and Code-Switched Alignment in LLMs via Synthetic Natural Language Inference [2.2] 大規模言語モデル(LLM)は多言語的文脈においてますます適用されているが、言語間で一貫した論理的に根ざしたアライメントの能力は未定である。
本稿では、論理に基づく前提-仮説ペアを生成する多言語自然言語推論のフレームワークを提案し、それらを類型的に多様な言語に翻訳する。
コードスイッチングは劣化せず、性能も向上し、翻訳によって引き起こされる語彙の変化が正規化信号として機能することを示唆している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:30:34 GMT)
Reconstruction Using the Invisible: Intuition from NIR and Metadata for Enhanced 3D Gaussian Splatting [2.2] 農業シーンは3次元再構築法に特有の課題を呈している。
我々は、近赤外線(NIR)画像、RGB画像、テキストメタデータ、Depth、LiDARデータを含む新しいマルチモーダルデータセットであるtextbfNIRPlantを紹介する。
我々は,3Dポイントベース位置符号化とクロスアテンション機構を組み合わせた効果的なマルチモーダルガウススプラッティングアーキテクチャである textbfNIRSplat を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:58:07 GMT)
Do VLMs Have Bad Eyes? Diagnosing Compositional Failures via Mechanistic Interpretability [2.1] VLM(Vision-Language Models)は、画像キャプションや視覚的質問応答といったタスクの視覚情報とテキスト情報の統合において、顕著なパフォーマンスを示している。
これらのモデルは合成一般化とオブジェクト結合に苦慮する。
我々の研究は、機械的解釈可能性技術を用いて、これらの失敗の根本原因を探究する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:15:28 GMT)
DOPA: Stealthy and Generalizable Backdoor Attacks from a Single Client under Challenging Federated Constraints [2.1] フェデレーテッド・ラーニング(FL)は、プライバシー保護のための協調トレーニングにますます採用されているが、その分散した性質は、バックドア攻撃の影響を受けやすい。
しかし、既存の攻撃方法は、しばしば理想化された仮定に依存し、現実の制約の下で有効に保たない。
異種ローカルトレーニングのダイナミクスをシミュレートし,多種多様な最適化トラジェクトリ間のコンセンサスを求める新しいフレームワークであるDOPAを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:39:12 GMT)
ELATE: Evolutionary Language model for Automated Time-series Engineering [2.1] ELATE(Evolutionary Language Model for Automated Time-Series Engineering)を導入し、時系列データのための機能エンジニアリングを自動化する。
ELATEは時系列統計測度と特徴重要度を用いて特徴のガイドとプーンを行い、言語モデルは新しい文脈に関連のある特徴変換を提案する。
実験の結果,ELATEは様々な領域で平均8.4%の精度で予測精度を向上させることがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:36:29 GMT)
EventSSEG: Event-driven Self-Supervised Segmentation with Probabilistic Attention [2.1] 本研究では,イベントのみの計算と確率的注意機構を用いた道路セグメンテーション手法であるEventSSEGを紹介する。
EventSSEGはイベントベースの自己教師付き学習を採用しており、広範なラベル付きデータを必要としない。
DSEC-SemanticとDDD17の実験によると、EventSSEGは最小限のラベル付きイベントで、アートパフォーマンスの状態を達成している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:08:59 GMT)
CoFacS -- Simulating a Complete Factory to Study the Security of Interconnected Production [2.1] CoFacSはCumplete FACtory Simulationの最初のもので、生産ライン全体を複製し、実際の産業アプリケーションを統合することができる。
我々は,CoFacSが物理参照に最大0.11%ずれがあることを示し,物理的攻撃やネットワークベースのサイバー攻撃の影響を調査できることを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:36:55 GMT)
High-fidelity realisation of CNOT gate in Majorana-based optical platform [2.0] フォトニックプラットフォーム上でシミュレーションしたMajoranaゼロモードを用いたロバストCNOT量子ゲートの実験的実現について述べる。
終点でマヨラナゼロモードをサポートする3つのキータエフ連鎖は、2つの論理量子ビットを符号化するために用いられる。
結果は、マヨラナフェルミオンによるトポロジカル量子コンピューティングの大きな進歩を示し、高忠実な量子ゲートを実現するためのフォトニックプラットフォームの可能性を強調している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:48:15 GMT)
Sampling by averaging: A multiscale approach to score estimation [2.0] 複雑で正規化されていないターゲット分布から,マルチスケールのダイナミックスを活用することで,効率的なサンプリングを行うための新しいフレームワークを提案する。
MultALMCとMultCDiffの2つのアルゴリズムが開発された。
このフレームワークは、学生のtベースのノイズモデルと調整された高速プロセスダイナミクスを用いて、重次元のターゲット分布を扱うように拡張されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:09:34 GMT)
Fine-tuning foundational models to code diagnoses from veterinary health records [2.0] 本研究は,コロラド州立大学獣医学教育病院(VTH)が認定したSNOMED-CT診断符号7,739点を取り入れたものである。
また,手作業による獣医師訪問246,473件のフリーテキストノートに,13件の事前訓練済みLMを微調整した。
拡張ラベル付きデータを用いて比較的大規模な臨床用LMを微調整した際,最も正確な結果を得た。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:47:43 GMT)
Efficient nonclassical state preparation via generalized parity measurement [2.0] 本稿では,ボソニックモードとアシラリー2レベル原子とのJaynes-Cummings相互作用を利用した測定ベースのプロトコルを提案する。
我々は、望ましくない人口を効率的にフィルタリングし、ターゲットモードを所望のFock状態に向けて条件付きでプッシュすることができる。
我々のプロトコルは、測定値が3ドル未満で十分に高忠実なスピンアンサンブルのDicke状態に$|J1000,0rangle$を作成できる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:50:27 GMT)
TCFNet: Bidirectional face-bone transformation via a Transformer-based coarse-to-fine point movement network [2.0] そこで我々は,Transformer を用いた粗い点移動ネットワーク (TCFNet) を提案する。
TCFNetは、優れた評価指標と視覚化結果を達成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:02:16 GMT)
Towards a DSL to Formalize Multimodal Requirements [2.0] マルチモーダルシステムは、機械学習の進歩によって実現され、ソフトウェアシステムでますます普及しつつある。
これにより、これらの新しいタイプのユーザインタラクションに関連する要件を簡単に定義する必要が生じ、同時に複数のモダリティが関与する可能性がある。
マルチモーダルインタラクションの多様な性質に適応した言語やメソッドの欠如や、ユーザニーズを適切に満たさないAI強化システムを実装するリスクのため、これは依然としてオープンな課題である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:40:33 GMT)
Computing-In-Memory Dataflow for Minimal Buffer Traffic [1.9] 本稿では,データ再利用の最大化とメモリ利用の向上によりバッファトラフィックを大幅に削減する新しいCIMデータフローを提案する。
MobileNetとEfficientNetモデルに適用すると、データフローはバッファトラフィックを77.4~87.0%削減し、それぞれ10.1~17.9%と15.6~27.8%のレイテンシを削減します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:05:40 GMT)
When Good Sounds Go Adversarial: Jailbreaking Audio-Language Models with Benign Inputs [1.9] 本稿では,WhisperInjectについて紹介する。
最先端のオーディオ言語モデルを操作して有害なコンテンツを生成することができる。
提案手法は,人間の聴取者に不慣れな音声入力において,知覚不能な摂動を用いる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:08:28 GMT)
Hybrid-Hierarchical Fashion Graph Attention Network for Compatibility-Oriented and Personalized Outfit Recommendation [1.9] 本研究は、階層グラフ表現とグラフアテンション機構を併用してこの問題に対処するFGATという新しいフレームワークを提案する。
このフレームワークは、ユーザ、衣装、アイテムの3層グラフを構築し、視覚的特徴とテキスト的特徴を統合して、服の互換性とユーザの好みを共同でモデル化する。
FGATはHFGNなどの強力なベースラインよりも優れており、精度、精度、HR、リコール、NDCGの顕著な改善を実現している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:50:16 GMT)
A Complete and Natural Rule Set for Multi-Qutrit Clifford Circuits [1.8] n が任意の非負整数である n-量子クリフォード回路に対して完全な書き換え規則を示す。
これは奇素次元の任意の量子回路の断片に対する最初の完全性の結果である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:43:42 GMT)
MFTCXplain: A Multilingual Benchmark Dataset for Evaluating the Moral Reasoning of LLMs through Hate Speech Multi-hop Explanations [1.8] 本稿では,Large Language Models (LLM) の道徳的推論を評価するためのベンチマークデータセットを提案する。
このデータセットは、ポルトガル語、イタリア語、ペルシア語、英語の3000のツイートで構成され、二進的ヘイトスピーチラベル、道徳カテゴリー、テキストスパンレベルの合理性で注釈付けされている。
実証的な結果は、道徳的推論タスクにおけるLLM出力と人間のアノテーションの相違を浮き彫りにする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:30:40 GMT)
Deep Learning for Taxol Exposure Analysis: A New Cell Image Dataset and Attention-Based Baseline Model [1.8] 細胞レベルでの薬剤であるタキソールの効果のモニタリングは臨床評価と生医学研究の両方において重要である。
深層学習のアプローチは、医学的および生物学的画像解析において大きな可能性を秘めている。
現在、タキソール曝露に対する細胞反応の自動形態学的解析のための公開データセットは存在しない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:41:26 GMT)
Behind the Myth of Exploration in Policy Gradients [1.8] 実際には、本質的な探索用語を学習目的に含めることが一般的である。
学習目標に2つの基準,勾配推定に2つの基準を導入し,最適化後の政策の質について検討する。
まず、学習目的を円滑にし、グローバルな最大値を保ちながら局所的な最適性を排除できるようにする。
第2に、勾配推定を変更し、パラメータの更新が最終的に最適なポリシーを提供する確率を高める。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:43:37 GMT)
Personalized Counterfactual Framework: Generating Potential Outcomes from Wearable Data [1.7] 本稿では,ウェアラブルデータからパーソナライズされた対物モデルを学ぶためのフレームワークを提案する。
我々はまず,マルチモーダル類似性分析を用いて,類似患者のデータを用いて個々のデータセットを拡大する。
次に、時間的PC(Peter-Clark)アルゴリズムを用いて予測関係を探索する。
グラディエントブースティングマシンは、個々の特殊効果を定量化するためにこれらの関係に基づいて訓練されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 05:04:17 GMT)
A Vision-Based Shared-Control Teleoperation Scheme for Controlling the Robotic Arm of a Four-Legged Robot [1.7] 本研究は,視覚に基づくポーズ推定パイプラインを活用することで,直感的な遠隔操作を提案する。
このシステムはこれらの手首の動きをロボットアームのコマンドにマッピングし、ロボットの腕をリアルタイムで制御する。
軌道プランナは、障害物とロボットアーム自体との衝突を検出し防止することにより、安全な遠隔操作を保証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:31:57 GMT)
Clinical semantics for lung cancer prediction [1.7] 既存の臨床予測モデルは、しばしば臨床概念間の意味的関係を無視した特徴を用いて患者データを表現している。
本研究では,SNOMED医療用語階層を低次元双曲空間にマッピングすることで,ドメイン固有の意味情報を統合する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:29:47 GMT)
S3LoRA: Safe Spectral Sharpness-Guided Pruning in Adaptation of Agent Planner [1.6] LoRAのようなパラメータ効率のよい微調整技術を用いて、LLM(Large Language Models)を適用することで、LLMベースのエージェントで強力な機能を実現している。
既存の安全に配慮した適応手法では、ベースと命令で調整されたモデルチェックポイントの両方にアクセスする必要がある。
本稿では,軽量でデータフリーでモデルに依存しないフレームワークであるS3LoRAを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:08:29 GMT)
Benefiting from Negative yet Informative Feedback by Contrasting Opposing Sequential Patterns [1.6] 逐次レコメンデーションシナリオにおいて,肯定的フィードバックと否定的フィードバックの両方から学習するタスクを検討する。
本研究では,2つの変圧器エンコーダを2つの正および負の相互作用シーケンスで学習することを提案する。
本手法の有効性を,最先端のシーケンシャルレコメンデーション手法と比較して,真正の指標の増加の観点から示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:32:16 GMT)
Simplifying Random Forests' Probabilistic Forecasts [1.5] ランダムフォレスト(RF)は分類と回帰の両方に有用であることが証明されている。
本稿では,RFを用いた予測分布の簡易化について検討する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:31:24 GMT)
Bridging Research Gaps Between Academic Research and Legal Investigations of Algorithmic Discrimination [1.5] 法的な行動は、アルゴリズムの公平性の研究を引き合いに出し、アルゴリズムの差別の定義や検出方法などの質問を通知する。
現在のアルゴリズムフェアネスの研究は理論的には厳格であるが、しばしば法的な調査の実際的なニーズに対処することができない。
我々は、規制執行、集団訴訟、個人訴訟を含む、米国の15の公民権執行行為を特定し、分析する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:53:48 GMT)
From Chiral Topological Dynamics to Chiral Topological Amplification: Real vs Imaginary Parameters in a Hermitian Bosonic Chain [1.5] QBHハミルトニアンによって生成される力学は自然に非エルミート時間進化を再現することを示す。
この増幅は、動的行列の非自明な位相から生じることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:28:56 GMT)
Inserting Planar-Measured Qubits into MBQC Patterns while Preserving Flow [1.5] 量子回路への効率的な変換には流動条件が必要である。
これまでのほとんどの研究は、計算におけるキュービットの数を減らした書き直しに重点を置いてきた。
因果フローの定義を拡張して、YZ測定を可能にし、YZ挿入が因果フローを保存する条件を導出する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:43:56 GMT)
Foe for Fraud: Transferable Adversarial Attacks in Credit Card Fraud Detection [1.5] クレジットカード詐欺検出は、金融セクターにおける機械学習(ML)の重要な応用である。
敵の攻撃は 金融業界の安全と安定に 重大な脅威をもたらします
本稿では,CCFD MLモデルの対向的摂動に対する堅牢性を検討するための総合的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:23:28 GMT)
Causal Modelling of Cryptocurrency Price Movements Using Discretisation-Aware Bayesian Networks [1.4] 本研究では,ベイジアンネットワーク(BN)を用いた主要暗号通貨の価格変動に影響を及ぼす要因を明らかにする。
これは、離散化を意識したBNによる予測性能を向上させる。
マクロファイナンシャル指標(金、石油、MSCI、S、P500、USDX)とソーシャルメディア信号(ツイート量)の両方を、潜在的な価格要因として分析する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:22:20 GMT)
XAI-Driven Spectral Analysis of Cough Sounds for Respiratory Disease Characterization [1.4] 本稿では,eXplainable Artificial Intelligence (XAI) による呼吸疾患管理のためのコークス音響解析の理解を深める手法を提案する。
我々は、畳み込みニューラルネットワーク(CNN)によって処理されたコークススペクトログラムにおいて、関連するスペクトル領域をハイライトするために、オクルージョンマップを用いる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:59:13 GMT)
Aura-CAPTCHA: A Reinforcement Learning and GAN-Enhanced Multi-Modal CAPTCHA System [1.4] Aura-CAPTCHAは、従来の手法の脆弱性に対処するマルチモーダルCAPTCHAシステムとして開発された。
この設計では、動的画像課題を生成するためのGAN(Generative Adrial Networks)、適応的難易度チューニングのための強化学習(RL)、テキストと音声のプロンプトを作成するための大規模言語モデル(LLM)を統合した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:00:08 GMT)
Action Engine: Automatic Workflow Generation in FaaS [1.4] Action Engineは、カーネルでtoolaugmented large language model(LLM)を使用して、人間の言語クエリを解釈する。
Action Engineは、データ間の依存関係をシームレスに管理し、開発者のクエリが処理され、解決されることを保証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:32:06 GMT)
Adversarial Hospital-Invariant Feature Learning for WSI Patch Classification [1.4] 本研究は,病原体モデル(PFM)における病原体の特徴から生じる領域バイアスに関する最初の体系的研究である。
本稿では,エンコーダ自体を変更することなく,凍った表現から潜伏する病院特有の特徴を除去する軽量な対向フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:25:16 GMT)
Graph Structure Learning with Temporal Graph Information Bottleneck for Inductive Representation Learning [1.4] グラフ構造学習(GSL)と時間グラフ情報ボット(TGIB)を統合する汎用フレームワークを提案する。
ノード近傍を拡張・最適化する2段階のGSL構造拡張器を設計する。
TGIBは、情報ボトルネックの原則を時間グラフに拡張し、エッジと機能の両方を正規化することで、最適化されたグラフを洗練する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:13:19 GMT)
Generative AI in K-12 Education: The CyberScholar Initiative [1.3] 本稿では,K-12コンテキストにおける書込みの形式的フィードバックの提供を目的とした,ジェネレーティブAIアシスタントツールであるCyberScholarのパイロット化に焦点を当てる。
本研究は、英語、社会学、近代世界史の授業など、様々な分野において、学生がサイバースカラーとどのように協力するかを考察する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:58:04 GMT)
Sociotechnical Imaginaries of ChatGPT in Higher Education: The Evolving Media Discourse [1.3] 本研究では,2022年11月から2024年10月までの高等教育におけるChatGPTの使用状況について調査した。
その結果,メディアの言論は主に制度的反応に焦点が当てられ,政策変更や教育実践は時間とともに最も一貫性のある存在感と肯定的な感情を示した。
メディアの物語は、長期的、幅広い倫理的、社会的、労働関連の意味よりも、創造的AIに対する制度的反応を優先していることを示唆している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:17:56 GMT)
A Fuzzy-Enhanced Explainable AI Framework for Flight Continuous Descent Operations Classification [1.3] CDO(Continuous Descent Operations)は、水平離着陸を回避し、燃料燃焼、排出、騒音を低減させるスムーズなアイドルスラスト降下を含む。
軌道最適化などの関連分野における既存の手法は、航空に必要な透明性を欠いている。
本研究ではファジィ論理と機械学習を統合したファジィ拡張説明可能なAIフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:08:16 GMT)
Robust Symbolic Reasoning for Visual Narratives via Hierarchical and Semantically Normalized Knowledge Graphs [1.3] 本稿では,階層的物語知識グラフのための意味正規化フレームワークを提案する。
本稿では,語彙的類似性と埋め込みに基づくクラスタリングを用いて,意味的関連行動と事象を統合化する手法を提案する。
Manga109データセットからの注釈付きマンガストーリーのフレームワークを実演する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:43:13 GMT)
Fortifying the Agentic Web: A Unified Zero-Trust Architecture Against Logic-layer Threats [1.3] 本稿では,Zero-Trust IAMフレームワークを通じてエージェントWebを要塞化する統一セキュリティアーキテクチャを提案する。
このアーキテクチャは、分散ID(DID)と検証クレデンシャル(VC)を使用して、リッチで検証可能なエージェントIDの基礎の上に構築されている。
セキュリティはマルチレイヤのTrust Fabricを通じて運用される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:14:55 GMT)
Learning to Solve Related Linear Systems [1.3] パラメータ空間上の新しい確率線形解法を提案する。
これにより、解いた線形系からの情報を回帰的に利用し、効率的な後続平均と共分散を与える。
我々はこれを事前条件付き共役勾配法における共役回帰モデルとして用いることを提唱する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:37:36 GMT)
Leveraging Multi-Source Textural UGC for Neighbourhood Housing Quality Assessment: A GPT-Enhanced Framework [1.2] 本研究は,Dianping,Weibo,Government Message Boardのマルチソーステキストユーザ生成コンテンツ(UGC)を用いて,GPT-4oを用いて住宅品質の評価を行う。
11のカテゴリーに46の指標を持つ高精細住宅品質評価システムを開発し, 客観的客観的手法ギャップとプラットフォーム固有の焦点差を強調した。
GPT-4oはルールベースとBERTモデルに優れ、微調整設定で92.5%の精度を達成した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:29:40 GMT)
Benchmarking Pre-Trained Time Series Models for Electricity Price Forecasting [1.2] 我々は、電力価格予測のための確立された統計および機械学習(ML)手法に対して、最先端の事前訓練モデルをいくつかベンチマークする。
ドイツ、フランス、オランダ、オーストリア、ベルギーの2024日の日頭オークション(DAA)の電力価格を用いて、1日当たりの予想を下方修正する。
Chronos-BoltとTime-MoEはTSFMの中でも最強で、従来のモデルと同等のパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:59:08 GMT)
EffiFusion-GAN: Efficient Fusion Generative Adversarial Network for Speech Enhancement [1.1] 本稿では,音声強調のための軽量かつ強力なモデルであるEffiFusion-GANを紹介する。
モデルはマルチスケールブロック内に深度的に分離可能な畳み込みを統合し、様々な音響特性を効率的に捉える。
EffiFusion-GANはPSSQスコアが3.45で、同じパラメータ設定で既存のモデルより優れている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:36:43 GMT)
Universal and Transferable Adversarial Attack on Large Language Models Using Exponentiated Gradient Descent [1.1] 大規模言語モデル(LLM)は、ますます重要なアプリケーションにデプロイされている。
LLMは、ユーザプロンプトに付加された対逆トリガーによって実現されたジェイルブレイク攻撃に対して脆弱なままである。
逆接接尾辞トークンの緩和されたワンホット符号化を直接最適化する本質的な最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:03:32 GMT)
Who Sees What? Structured Thought-Action Sequences for Epistemic Reasoning in LLMs [1.1] 本研究では,LLMをベースとしたReActフレームワークの性能向上のための構造化例の可能性について検討した。
本稿では、最適ゴールパス(G型)、情報ノードパス(E型)、ステップバイステップの最適決定シーケンス(L型)の3つのカテゴリの例を生成する、構造化された解処理パイプラインを提案する。
L型の例は、明確化要求と全体的なアクションステップをわずかに削減するが、一貫性のある改善は得られない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:36:53 GMT)
Cooperative SGD with Dynamic Mixing Matrices [1.0] 分散環境では、勾配降下(SGD)に基づくアルゴリズムが理論的に収束することが示されている。
本稿では、動的トポロジを持つローカル更新SGDベースの分散アルゴリズムを網羅した統合フレームワークについて述べる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:37:07 GMT)
CUTE-MRI: Conformalized Uncertainty-based framework for Time-adaptivE MRI [1.0] この研究は、オブジェクトごとのスキャン時間を調整する、動的で不確実性を認識した買収フレームワークを導入している。
我々は整合予測を用いて、この不確かさを計量の厳密で校正された信頼区間に変換する。
この適応的手法は,最終的な画像の精度に関する公式な統計的保証を提供しながら,固定されたプロトコルと比較してスキャン時間を短縮することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:56:42 GMT)
QU-NLP at QIAS 2025 Shared Task: A Two-Phase LLM Fine-Tuning and Retrieval-Augmented Generation Approach for Islamic Inheritance Reasoning [1.0] 我々はLow-Rank Adaptation (LoRA)を用いてFanar-1-9B因果言語モデルを微調整し、それをRetrieval-Augmented Generationパイプラインに統合した。
GPT 4.5, LLaMA, Fanar, Mistral, ALLaM などの他の競合モデルに対してゼロショットプロンプトで評価した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:29:55 GMT)
Multi-player conflict avoidance through entangled quantum walks [1.0] 量子コンピューティングは、古典的なコンピューティングよりも、複雑な問題を迅速かつ効率的に解決する可能性がある。
量子ウォーク(QW)は多くの量子アルゴリズムの基礎となる。
本稿では,QWを用いた3人プレイの場合の意思決定競合を完全に排除する手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:27:05 GMT)
GOGS: High-Fidelity Geometry and Relighting for Glossy Objects via Gaussian Surfels [0.9] RGB画像からの光沢のある物体の逆レンダリングは、本質的には固有の曖昧さによって制限されている。
2次元ガウス波をベースとした新しい2段階フレームワークGOGSを提案する。
我々は、新しい照明下での幾何再構成、物質分離、光リアルリライティングにおける最先端性能を実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:35:40 GMT)
Quantum reservoir computing induced by controllable damping [0.9] 量子貯水池の各キュービットに制御された回転を適用することで減衰を誘導するアルゴリズムを提案する。
これにより、ゼロ状態の可変回路レベルの振幅増幅が可能となる。
量子ビット間の量子相関がメモリ保持率の向上をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:18:57 GMT)
Fragment-Wise Interpretability in Graph Neural Networks via Molecule Decomposition and Contribution Analysis [0.9] SEAL(Substructure Explanation via Attribution Learning)は、モデル予測を意味のある分子サブグラフに属性付ける、新しい解釈可能なグラフニューラルネットワークである。
SEALは入力グラフを化学的に関連する断片に分解し、出力に対する因果的影響を推定する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:15:53 GMT)
Mamba2 Meets Silence: Robust Vocal Source Separation for Sparse Regions [0.9] 正確な声質分離に適した新しい音源分離モデルを提案する。
間欠的に発生するボーカルをキャプチャできないTransformerベースのアプローチとは異なり、我々のモデルは最近の状態空間モデルであるMamba2を活用する。
実験の結果,本手法は最近の最先端モデルよりも優れ,11.03dBのcSDRを実現していることがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:19:11 GMT)
Seeing More with Less: Video Capsule Endoscopy with Multi-Task Learning [0.9] 本稿では,消化管内における正確な自己局在機能と,小腸の異常を単一モデルで検出する機能を組み合わせたマルチタスクニューラルネットワークを提案する。
本モデルでは, 局所化タスクでは93.63%, 異常検出タスクでは87.48%の精度が得られた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:59:44 GMT)
Enhanced Anomaly Detection for Capsule Endoscopy Using Ensemble Learning Strategies [0.9] 本研究は,ビデオカプセル内膜における異常検出タスクの課題に対処するためのアンサンブル戦略を導入する。
本稿では、異常検出フィールドから引き出された各種損失関数を用いて、各ネットワークをトレーニングする。
我々は、Kvasir-Capsuleで76.86%のAUCスコア、Galarデータセットで76.98%のAUCスコアを達成した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:53:26 GMT)
CaLiV: LiDAR-to-Vehicle Calibration of Arbitrary Sensor Setups [0.8] 自律システムでは、ダイナミック環境における安全かつ効率的なナビゲーションにはセンサキャリブレーションが不可欠である。
既存のLiDARキャリブレーション法の多くは、重なり合う視野を必要とするが、外部センサーデバイスを使ったり、機能豊富な環境を仮定するものもある。
本研究では,CaLiVと呼ばれるマルチLiDARシステムの外部センサ・センサ・センサ・バイヒクルキャリブレーションのための新しいターゲットベース手法を提案する。
このアルゴリズムは、重複しない視野で機能し、外部センサーデバイスを必要としない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:28:51 GMT)
High-Precision Multi-Qubit Clifford+T Synthesis by Unitary Diagonalization [0.8] クリフォード+Tゲートセットで表される量子回路の資源効率と高精度な近似合成は、フォールトトレラント量子コンピューティングにとって不可欠である。
探索に基づく手法を利用して、まずはユニタリを概略対角化し、解析的に逆解析する。
提案手法は,実量子アルゴリズムからユニタリを評価した場合に,一桁のオーダーで合成アルゴリズムの実装精度と実行時間を向上する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:38:51 GMT)
Topolow: Force-Directed Euclidean Embedding of Dissimilarity Data with Robustness Against Non-Metricity and Sparsity [0.8] Topolowは、そのような埋め込み問題に対する物理学に着想を得た、勾配のない最適化フレームワークである。
トポローは入力の相似性を計量として必要とせず、非計量測度を有効ユークリッド空間に埋め込む堅牢な解となる。
本稿では, 抗原マッピングにおけるTopolowとして最初に導入されたアルゴリズムを定式化した(Arhami and Rohani, 2025)。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:24:50 GMT)
Properties of the temporal transfer matrix in integrable Floquet circuits [0.8] 影響行列(IM)は、境界自由度の非平衡力学に関する完全な情報を符号化する量子状態と見なすことができる。
本稿では、IMが時間移動行列の特異な定常点であることを示す。
この設定で、さらに局所的な運動積分を発見し、ヨルダンブロックの次元と構造を解析できる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:46:29 GMT)
Microstructural and preliminary optical and microwave characterization of erbium doped CaMoO$_4$ thin films [0.8] 本研究は、ケイ素およびイットリア安定化ジルコニア(YSZ)基板上に成長したモリブデン酸カルシウム(CaMoO$_4$)薄膜を、Cバンドの潜在的固相系として探索する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:10:06 GMT)
Classical and Quantum Query Complexity of Boolean Functions under Indefinite Causal Order [0.8] 計算モデルは一般に、操作が一定の順序で適用されると仮定する。
近年、固定因果構造を持たない計算を考慮し、この仮定を緩和する研究がいくつか行われている。
正確なクエリの複雑さの分離は、今のところ発見されていない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:45:08 GMT)
Scalable Event-Based Video Streaming for Machines with MoQ [0.8] ニューロモルフィックイベントセンサの新しいクラスは、画像フレームではなく非同期のピクセルサンプルでビデオを記録する。
本稿では,Media Over QUICプロトコルのドラフトへの最新の追加に基づいて,新しい低レイテンシイベントストリーミングフォーマットを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:44:10 GMT)
Task-Oriented Automatic Fact-Checking with Frame-Semantics [0.8] 大規模構造化データに注釈を付けたPoitiFactから抽出した実世界のクレームのパイロットデータセットを紹介する。
このデータセットは、Voteセマンティックフレームを用いた投票関連クレームの調査と、経済協力開発機構(Organization for Economic Co-operation and Development)のデータソースに基づくさまざまなセマンティックフレームの探索という2つのケーススタディを基盤としている。
本研究は, ファクトチェックにおけるエビデンス検索と説明可能性の向上に, フレームセマンティクスの有効性を示すものである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:56:19 GMT)
A Comparative Evaluation of Teacher-Guided Reinforcement Learning Techniques for Autonomous Cyber Operations [0.8] 既存の自律サイバーオペレーション(ACO)アプリケーションは、エージェントがスクラッチから学ぶ必要があるため、収束が遅く、アーリーステージのパフォーマンスが低くなる。
我々は,シミュレートされたCybORG環境に4つの異なる指導指導手法を実装し,比較評価を行った。
この結果から,教師統合は早期政策性能と収束速度の観点から,指導効率を著しく向上させることができることが示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:30:27 GMT)
Applying Text Embedding Models for Efficient Analysis in Labeled Property Graphs [0.8] 本研究では、事前学習されたテキスト埋め込みモデルを用いて、そのようなグラフの効率的な意味解析を実現する。
提案手法は,言語モデルのグラフパイプラインへの埋め込みを構造を変化させることなく統合し,テキスト意味論がプロパティグラフ解析の精度と解釈可能性を大幅に向上させることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:04:34 GMT)
Gaussian Process Regression of Steering Vectors With Physics-Aware Deep Composite Kernels for Augmented Listening [0.8] 本稿では、マイクロホンの周波数と位置に対するステアリングベクトルの連続表現と拡張リスニングのための音源について検討する。
指向性波動とそれに続く散乱効果をモデル化した物理対応複合カーネルを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:29:14 GMT)
Post-hoc LLM-Supported Debugging of Distributed Processes [0.8] マクロレベルとマイクロレベルの両方において,任意のシステムに適用可能なアプローチを導入する。
このアプローチでは、生成AIとともにシステムのプロセスデータを使用して、自然言語の説明を生成する。
コンポーネントベースのJavaシステムにこのアプローチを取り入れたデモレータを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:45:53 GMT)
Entropy-Constrained Strategy Optimization in Urban Floods: A Multi-Agent Framework with LLM and Knowledge Graph Integration [0.7] 都市部での降雨は緊急時スケジューリングシステムに重大な課題をもたらす。
H-Jは、知識誘導的プロンプト、エントロピー制約生成、フィードバック駆動最適化を統合する階層的なマルチエージェントフレームワークである。
実験の結果,H-Jは交通のスムーズさ,タスク成功率,システムの堅牢性において,ルールベースおよび強化学習ベースラインよりも優れていた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:13:03 GMT)
Entropy Measures for Transition Matrices in Random Systems [0.7] ABBエントロピーの蒸留解釈は、遷移行列を構成するために用いられる2つの量子状態間の絡み合いの蒸留の成功確率と一致することを示す。
すべてのケースにおいて、遷移行列のSVDとABBエントロピーは、単一のランダム状態のサブシステムエンタングルメントエントロピーの挙動を密接に反映している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:53:12 GMT)
CuMoLoS-MAE: A Masked Autoencoder for Remote Sensing Data Reconstruction [0.7] 本報告では,CuMoLoS-MAE(Culriculum-Guided Monte Carlo Ensemble Masked Autoencoder)について述べる。
アップドラフトやダウンドラフトコア、せん断線、小さな渦などの微細な特徴を復元する。
また、大気圏上のデータ駆動の事前学習も行い、画素単位の不確実性を定量化する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:54:19 GMT)
\textit{adder-viz}: Real-Time Visualization Software for Transcoding Event Video [0.7] 本稿では,リアルタイムのイベントトランスコードプロセスとループ内アプリケーションを可視化するテキストタダ-ビズソフトウェアについて,多数の改良を加えている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:33:07 GMT)
MMHMER:Multi-viewer and Multi-task for Handwritten Mathematical Expression Recognition [0.7] 本稿では,CNNとTransformerの強みを効果的に統合できるマルチビューマルチタスクフレームワークを提案する。
我々のモデルは手書きの数学的表現の複雑さをうまく扱える。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:07:32 GMT)
The C-index Multiverse [0.6] タイム・ツー・エフェクトの結果に対するサンプル外識別性能の定量化は、モデル評価と選択の基本的なステップである。
利用可能な R および python ソフトウェアの間に C-index マルチバースが存在することを示す。
この記事では、マルチバースをナビゲートする際にアナリストを助け、統一されたドキュメンテーションを提供し、既存のソフトウェアの潜在的な落とし穴を強調します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:11:10 GMT)
Alpha Berkeley: A Scalable Framework for the Orchestration of Agentic Systems [0.6] スケーラブルなエージェントシステムのための実運用対応アーキテクチャであるAlpha Berkeley Frameworkを紹介した。
このフレームワークは、タスク毎の関連ツールのみを選択するための動的機能分類、プランファーストオーケストレーションモデル、コンテキスト対応タスク抽出を備えている。
本稿では,その汎用性について,チュートリアル型風力発電モニタリングの例と,Advanced Light Source ParticleAccelerでの展開という,2つのケーススタディを通じて実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:57:13 GMT)
Microscopic Theory of Squeezed Light in Quantum Dot Systems [0.6] マイクロキャビティに集積された半導体量子ドットから圧縮光を生成するキャビティ-QED理論を提案する。
不均一に拡張されたQDアンサンブルの運動方程式を定式化し、コヒーレントシードフィールドによって非整合的に励起され同時に駆動される。
この分析は、光子数変動をコヒーレント状態限界以下に減少させ、振幅4次スキーズを生じる動作条件を特定する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:02:36 GMT)
MOHAF: A Multi-Objective Hierarchical Auction Framework for Scalable and Fair Resource Allocation in IoT Ecosystems [0.6] 本稿では、コスト、QoS(Quality of Service)、エネルギー効率、公平性を共同で最適化する分散リソース割り当て機構を提案する。
3,553の要求と888のリソースからなるGoogle Cluster Dataトレースの実験では、完全な公正性(Jainのインデックス=1.000)を達成しつつ、MOHAFの優れたアロケーション効率(0.185)、First-Price(0.138)、Random(0.101)のオークションを実証した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:25:37 GMT)
String Diagrams for Defect-Based Surface Code Computing [0.6] サーフェスコードはフォールトトレラント量子コンピューティングを実装するための一般的な選択肢である。
2量子ゲートは、格子手術か、お互いの欠陥を編むことによって、最も近い隣り合う相互作用のみを用いて、これらの符号で実現することができる。
本研究は, 従来記述されていた欠陥ブレイディングのZX計算を用いて, 同様の記述を定式化したものである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:44:11 GMT)
On Defining Neural Averaging [0.6] Amortized Model Ensembling (AME)は、モデルの違いを疑似段階として扱い、神経量更新をガイドする、データフリーなメタ最適化アプローチである。
AMEは、個々の専門家とモデルスープベースラインの両方を上回り、平均的なニューラルネットワークを生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:28:08 GMT)
Readout-induced leakage of the fluxonium qubit [0.5] 分散読み出しは超伝導量子ビットの高忠実度測定に広く用いられている。
我々は、共振子光子の存在下でのフラキソニウム量子ビットの状態進化を図示する。
観察された非QND効果を説明するためには, 高励起状態への遷移と外部スプリアスモードへの結合が必要である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:53:25 GMT)
TOAST: Fast and scalable auto-partitioning based on principled static analysis [0.5] 本稿では,新しい静的コンパイラ解析とモンテカルロ木探索を組み合わせたシステムを提案する。
我々のシステムは、様々なハードウェアプラットフォームとモデルアーキテクチャで最先端の産業手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:01:09 GMT)
Dominated Actions in Imperfect-Information Games [0.5] 不完全情報ゲームにおける支配的行動の概念を定義し,研究する。
我々の主な成果は、アクションが混合戦略に支配されているかどうかを実証的に決定するアルゴリズムである。
我々は、"All In or Fold" No-Limit Texas Hold'em ポーカー変種における支配的な行動の役割を探求する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:33:06 GMT)
PerFairX: Is There a Balance Between Fairness and Personality in Large Language Model Recommendations? [0.5] LLM生成レコメンデーションにおけるパーソナライズと人口統計学的株式のトレードオフを定量化するためにPerFairXを提案する。
我々は、映画(MovieLens 10M)と音楽(Last.fm 360K)のデータセットで、最先端の2つのLLMであるChatGPTとDeepSeekをベンチマークする。
DeepSeekはより強い心理的適合性を達成するが、変化を促すために高い感度を示す一方、ChatGPTは安定しているがパーソナライズされていない出力を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:41:53 GMT)
Design and Evaluation of a Scalable Data Pipeline for AI-Driven Air Quality Monitoring in Low-Resource Settings [0.5] 本稿では,AirQoデータパイプラインの設計,実装,評価について述べる。
Apache Airflow、Apache Kafka、Google BigQueryといったオープンソースの技術を使って構築されている。
我々は、400以上の監視装置から毎月数百万の空気品質の測定を取り込み、変換し、分散するパイプラインの能力を実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:19:27 GMT)
Generative AI models enable efficient and physically consistent sea-ice simulations [0.4] 我々は、最初の生成AIベースのパンアーキティックモデルであるGenSIMを紹介する。
数値モデルや観測で観測された統計を強く再現する。
脆性のような短期的なダイナミクスを示す一方で、長期的な海氷の減少を描いている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:12:50 GMT)
Analytical bounds for decoy-state quantum key distribution with discrete phase randomization [0.4] 離散位相ランダム化に依存する量子鍵分布プロトコルの性能を解析する。
BB84の秘密鍵生成率と測定デバイスに依存しないQKDプロトコルに関する解析的境界を導出する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:28:50 GMT)
Benchmarking Vector, Graph and Hybrid Retrieval Augmented Generation (RAG) Pipelines for Open Radio Access Networks (ORAN) [0.4] 大きな言語モデル(LLM)は、RAN Intelligent Controller(RIC)プラットフォームから仕様とAPI定義を活用することで、xAppsとrAppsを生成するために特殊化することができる。
Retrieval-Augmented Generation (RAG)は、コンテキスト内学習を通じて実践的な代替手段を提供する。
本研究では,ORAN仕様を用いたベクトルRAG,GraphRAG,Hybrid GraphRAGの比較評価を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:37:28 GMT)
Energy-independent tomography of Gaussian states [0.3] 本稿では,効率よく実験可能なガウス状態トモグラフィーアルゴリズムを提案する。
我々のアルゴリズムは量子メロジとセンシングの応用に特に適している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:03:33 GMT)
In2x at WMT25 Translation Task [0.3] 本稿では、WMT25 General Machine Translation Shared TaskのためのIn2x研究チームによるオープンシステム提案について述べる。
本論文は日本語関連翻訳タスクに着目し,大規模言語モデル(LLM)を他の言語に拡張するための一般化可能なパラダイムを探究する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:52:42 GMT)
Detection states of ions in a Paul trap via conventional and quantum machine learning algorithms [0.3] トラップイオンは量子技術の主要なプラットフォームの一つである。
我々は、高感度カメラで得られた画像を用いて、イオン量子状態検出のための一連の方法を開発し、ベンチマークする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:59:48 GMT)
Real-time Neural Rendering of LiDAR Point Clouds [0.3] 1x1ピクセルを用いた出力ビューへの点雲の単純投影は高速であり、利用可能な詳細を保持するが、背景点が前景画素間に漏れるにつれて、認識不能なレンダリングをもたらす。
U-Netの形での深い畳み込みモデルを用いて、これらの射影を現実的な結果に変換する。
また,不完全整合な地上真実画像を扱うための合成訓練データを生成する手法についても述べる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:45:38 GMT)
TESSERA: Temporal Embeddings of Surface Spectra for Earth Representation and Analysis [0.2] オープンでグローバルな土地指向リモートセンシング基盤モデルであるTESSERAを提案する。
ピクセルレベルの衛星時系列データから10mスケールで埋め込みを生成する。
我々は、TESSERAの使いやすさ、最先端の性能、オープン性、そしてラベル付けされたデータ効率は、幅広い生態学的応用において変化しうると信じている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:28:55 GMT)
Challenges of Virtual Validation and Verification for Automotive Functions [0.2] 私たちはこの分野の専門家とワークショップを行い、重要な障害をブレインストーミングできるようにしました。
専門家は17の課題と提案された解決策を特定した。
特定された問題の多くは既に既知の解を持っている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:45:03 GMT)
What You See Is What It Does: A Structural Pattern for Legible Software [0.2] 今日のソフトウェアはしばしば"不可能"であり、コードと観察された振る舞いの直接的な対応が欠如している。
新しい構造パターンは、ポータビリティとモジュラリティを改善した。
同期のためのドメイン固有の言語は、振る舞いの特徴を粒度で宣言的な方法で表現することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:03:00 GMT)
Systematic Review Of Collaborative Learning Activities For Promoting AI Literacy [0.1] 協調学習アプローチは情報リテラシーに有効であることが証明されている。
我々は、2015-2023年の9つの研究で報告されたAIリテラシーの結果を理論的に分析するために、Interactive-Constructive-Active-Passiveフレームワークを使用しました。
CLは、さまざまなアクティビティ、設定、学習者のグループにわたって、AIリテラシーを効果的に向上させることが示唆されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:58:27 GMT)
Mapping Students' AI Literacy Framing and Learning through Reflective Journals [0.1] 本研究は、人工知能(AI)に関する大学生の自己認識学習に関する研究である。
学生がAIについて何、どのように、なぜ学習するかを理解することが重要である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:01:51 GMT)
Input Time Scaling [0.1] 本稿では,クエリにリソースを配置することで,従来のスケーリング手法を補完する,新しいスケーリングパラダイムであるInput Time Scalingを提案する。
一見データ品質の低いデータセットがハイパフォーマンスになることに驚きました。
AIME24 (76.7%) と AIME25 (76.7%) のパス@1。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:41:59 GMT)
ZX-calculus is Complete for Finite-Dimensional Hilbert Spaces [0.1] ZX計算(ZX-calculus)は、量子コンピューティングと量子情報理論のためのグラフィカル言語である。
有限次元ZX-計算の完全性を証明し、混合次元Z-スパイダーとqudit X-スパイダーのみをジェネレータとして組み込む。
我々のアプローチは、他のグラフィカル言語である有限次元ZW-計算の完全性に基づいており、これら2つの計算間の直接変換が可能である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:42:38 GMT)
Generating 3D Terrain with 2D Cellular Automata [0.1] 本稿では,2次元セルオートマトン (CA) を用いた簡易な付加手法による3次元地形の創出について検討する。
複数のCA遷移規則による実験は、興味深い美的なナビゲーション可能な風景を生み出し、ゲームにおける地形生成に適用可能であることを示唆した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:01:54 GMT)
The Renormalized Yukawa Hamiltonian: Spectrum, Parton Distribution Functons, and Resource Estimates for Quantum Simulation [0.1] 有効粒子の正規化群プロシージャを前形Yukawa Hamiltonianに適用する。
再正規化ハミルトニアンによって生成されるスペクトルとパルトン分布関数について検討する。
再正規化されたハミルトニアンを符号化するコストは、素ハミルトニアンを符号化するブロックに匹敵することを示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:39:10 GMT)
Toward a Consistent Definition of Holographic Entanglement Entropy in de Sitter Space [0.1] De Sitter 空間に対する静的パッチホログラフィーの枠組みにおけるホログラフィックエンタングルメントエントロピーの新たな定義について検討する。
レプリカ・トリックとツイスト作用素の形式主義を用いて、ド・ジッター・グリーンの函数を通して表現される3次元ド・ジッター空間のエントロピー函数を導出する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:02:19 GMT)
When Better Eyes Lead to Blindness: A Diagnostic Study of the Information Bottleneck in CNN-LSTM Image Captioning Models [0.0] 本稿では,基礎画像キャプションモデルの体系的かつ反復的な展開について述べる。
単純なCNN-LSTMエンコーダデコーダから、競合するアテンションベースのシステムへと進化する。
この実験は、アーキテクチャ拡張の影響をグラフ化し、古典的なCNN-LSTMパラダイムにおける重要な発見を実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:21:58 GMT)
WeedSense: Multi-Task Learning for Weed Segmentation, Height Estimation, and Growth Stage Classification [0.0] WeedSenseは包括的雑草分析のための新しいマルチタスク学習アーキテクチャである。
我々は,11週間の生育周期で16種の雑草を採集したデータセットを,画素レベルのアノテーション,高さ測定,時間ラベルを用いて提示した。
セグメント化では89.78%,高さ推定では1.67cm MAE,成長段階分類では99.99%,リアルタイム推定では160FPSの精度でmIoUを実現した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:21:52 GMT)
Variable selection for minimum-variance portfolios [0.0] 我々は、ファームレベル特性の大きなプールの関数として、最小分散ポートフォリオ重み付けをパラメータ化する。
MLを用いて関連する予測器を選択することで得られる利益は、かなり大きい。
ポートフォリオリスクの低減に役立つ選択された予測器のいくつかは、リターンも向上する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:14:39 GMT)
Vacuum Energy and Topological Mass from a Constant Magnetic Field and Boundary Conditions in Coupled Scalar Field Theories [0.0] 結合スカラー場理論における均一磁場と境界条件が真空エネルギーおよび位相質量生成に及ぼす影響について検討する。
プレートの単位面積当たりの真空エネルギーを計算し,境界および磁気的寄与からトポロジカル質量の出現を解析し,二ループ順序で一階結合定数補正を評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 23:08:16 GMT)
Universality in the Anticoncentration of Noisy Quantum Circuits at Finite Depths [0.0] 本研究では,異なるノイズ源の存在下での量子回路の反集束特性について検討する。
浅い深度では、ノイズ効果は摂動的に小さく、中間状態では、回路誘起のゆらぎとノイズは等速で競合する。
深い状態下では、出力分布はノイズ強度が指数関数的に小さい補正まで効果的に古典的になる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:00:07 GMT)
Uncertainty Quantification for Language Models: A Suite of Black-Box, White-Box, LLM Judge, and Ensemble Scorers [0.0] 幻覚はLarge Language Models(LLM)における永続的な問題である
実践者が実世界のユースケースに適用できるゼロリソース幻覚検出のための多用途フレームワークの概要を述べる。
柔軟性を高めるために,個々の信頼度スコアの組み合わせを組み込んだ調整可能なアンサンブルアプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:26:48 GMT)
Twin-Boot: Uncertainty-Aware Optimization via Online Two-Sample Bootstrapping [0.0] 本研究では,不確実性推定と勾配学習を統合したリサンプリングベーストレーニング手法を開発した。
深層ネットワークや複雑な高次元ニューラル問題において、この手法は収量を改善し、解釈可能な不確実性写像を生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:20:38 GMT)
Trapping and cooling of nanodiamonds in a Paul trap under ultra-high vacuum: Towards matter-wave interferometry with massive objects [0.0] 質量粒子を持つ物質波干渉計は、空間重畳原理を含む多くの基本的なアイデアをテストすることができる。
本研究は, ナノダイアモンドのスピンを試験粒子として利用することに焦点を当てる。
本研究では,ナノダイアモンドの10~8mbarでのトラップについて詳述し,短周期Stern-Gerlach干渉計の実現に十分適している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:05:23 GMT)
The importance of visual modelling languages in generative software engineering [0.0] GPT-4は、単に自然言語ではなく、画像とテキストの入力を受け入れる。
私たちの知る限りでは、マルチモーダルGPTを通じてソフトウェアエンジニアリングタスクが実行される同様のユースケースを調査する研究は他にありません。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:59:45 GMT)
The Prompting Brain: Neurocognitive Markers of Expertise in Guiding Large Language Models [0.0] 本稿では,脳の機能的接続とネットワーク活動の差異を専門家と中間的プロンプトエンジニアの間で調査した横断的fMRIによる研究結果について述べる。
以上の結果より,左中側頭回や左前頭極などの脳領域における機能的接続性の向上など,より迅速な工学的リテラシーに関連する神経症状が明らかとなった。
自然言語処理(NLP)におけるこれらの神経認知マーカーの意義について論じる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:31:53 GMT)
The NordDRG AI Benchmark for Large Language Models [0.0] NordDRG-AI-Benchmarkは、DRG推論のための最初の公開、ルール完全テストベッドである。
Grouper Softwareは、診断関連グループ(DRGs)を通じて、数十億ドルの医療費の大部分をルートする。
これは、ガバナンスグレードのトレーサビリティを備えた完全なNordDRGグルーパーロジックをエミュレートする最初の公開レポートである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:47:47 GMT)
The Loupe: A Plug-and-Play Attention Module for Amplifying Discriminative Features in Vision Transformers [0.0] このモジュールは、Swin Transformerのようなトレーニング済みのバックボーンに挿入されるように設計されている。
Loupeは、モデルを暗黙的に誘導し、最も差別的なオブジェクト部品にフォーカスする複合損失関数でエンドツーエンドに訓練されている。
挑戦的なCUB-200-2011データセットに関する実験により、The LoupeはSwin-Baseモデルの精度を85.40%から88.06%に改善し、2.66%の大幅な向上を示した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:07:21 GMT)
The Algebra of the Pseudo-Observables II: The Measurement Problem [0.0] 我々は、量子測定問題を解くために擬可観測体の代数の完全な数学的構造を開発する。
量子状態ベクトルは回収されるが、一連の観測で得られた情報を格納する補助的な擬似観測物として回収される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:02:06 GMT)
The Algebra of the Pseudo-Observables I: Why Quantum Mechanics is the ultimate description of Reality [0.0] 本稿では、擬可観測体の代数という、新しい強力な代数を紹介する。
オッカムのカミソリの原理を適用して、身体的現実の最小記述を得る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:48:19 GMT)
The Adaptive Communication Framework (ACF) for Extraterrestrial Intelligence Discovery [0.0] 潜在的な技術的発見を管理するためのエビデンスベースの危機コミュニケーションフレームワークは存在しない。
本稿では,危機コミュニケーション理論をレトリックインテリジェンスモデルSPECtrumと統合した適応通信フレームワーク(ACF)を提案する。
ACFは、Loeb Scale for Interstellar Object Significanceに完成したプロトコルを提供し、4つの修辞的インテリジェンスチャネルにまたがる特定のメッセージング戦略を提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:12:14 GMT)
Testing Components of the Attention Schema Theory in Artificial Neural Networks [0.0] 成長する証拠は、脳が注意スキーマ(注意の簡易なモデル)を使用して、その参加者を制御していることを示唆している。
注意スキーマの効果は、人工エージェントで調べることができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:19:18 GMT)
Tautological Tuning of the Kostant-Souriau Quantization Map with Differential Geometric Structures [0.0] 本稿では,タウトロジー調整量子化と呼ばれる座標独立量子化の代替手法を提案する。
物理的に重要な関数に焦点をあてると、タウトロジー的に調整された量子化は、伝統的な幾何量子化や変形量子化よりも、正準量子化のアドホックなアプローチに非常に近い。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:15:05 GMT)
Stoquasticity is not enough: towards a sharper diagnostic for Quantum Monte Carlo simulability [0.0] 量子モンテカルロ法(QMC)は、多くの量子体系をシミュレートする強力なツールであるが、その適用性は悪名高い符号問題によって制限される。
本稿では,QMCシミュラビリティの診断基準として,Vanishing Geometric Phases(VGP)を紹介する。
本稿では,手話問題重症度の定量的指標として機能するVGP誘発診断のファミリを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:22:16 GMT)
Stochastic Modeling of a Memory-Assisted Measurement-Device-Independent Quantum Key Distribution System in Free-Space Metropolitan Environments [0.0] 我々はMA-MDI-QKDスキームにおける鍵分配率を予測するための単純直感的モデルを提案する。
具体的には、自由空間リンクとフィールド展開可能な量子メモリに基づくシステムに適したシミュレーションを行う。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:11:34 GMT)
Spin versus Magic: Lessons from Gluon and Graviton Scattering [0.0] ヤン・ミルズ理論と一般相対性理論におけるグルーオンと重力子の2粒子散乱について検討する。
どちらの理論でも魔法は総じて生成されることを示し、また、量子ビットのスピンが増加するにつれて魔法は一般的に減少することを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:00:02 GMT)
Soliton resuscitations: asymmetric revivals of the breathing mode of an atomic bright soliton in a harmonic trap [0.0] 準1次元のボース=アインシュタイン凝縮体で実現された原子の明るいソリトンは、開量子系とみなすことができる。
徐々に呼吸の振幅が上昇し、その後、徐々に振幅が低下し、その後に再び発音されるようになる。
弱トラップソリトンに対するボゴリューボフ・ド・ジェンヌ周波数スペクトルに近接解析近似を導出することにより、非マルコフ再生におけるこの非対称再生パターンを説明する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:31:35 GMT)
Single-click protocols for remote state preparation using weak coherent pulses [0.0] リモート状態準備(RSP)は、あるパーティが別のパーティの量子ビット上の既知の量子状態を、絡み合いを使って遠隔で準備することを可能にする。
従来知られていたRSPプロトコルに,弱コヒーレントパルスデバイスを用いた2つの新しいプロトコルを導入する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:09:20 GMT)
Sideband Spectroscopy in the Strong Driving Regime: Volcano Transparency and Sideband Anomaly [0.0] スピンの2つの交差磁場に対する応答について検討した。
強い横方向駆動系では、放射スペクトルは、非対称ピークに囲まれた狭い中央透明領域を持つ特徴的な火山の線状構造を持つ。
十分に遅い長手領域では、放射スペクトルは異常な挙動を示し、右と左の両サイドバンドの共鳴が中心共鳴の同じ側にある。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:27:28 GMT)
Sensing Birefringence and Diattenuation with Undetected Light [0.0] 我々は、量子イメージング装置において、尋問光の制御可能な偏光を導入する。
非検出光による複屈折・拡張を同時に検出する非線形干渉計の可能性を示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:23:47 GMT)
Resurrecting Vanilla Power Law Inflation with the aid of Continuous Spontaneous Localization in the ACT era [0.0] 崩壊したパワー・ロー・インフレーションは、実際に観測によってその問題を回避できることを示す。
このようなインフレーションモデルもまた、より赤いタイル付きテンソルスペクトルを生成し、スカラースペクトルとテンソルスペクトルの両方に対してランニングを行わない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:39:20 GMT)
Reliable generation of isomorphic physics problems using ChatGPT with prompt-chaining and tool use [0.0] 本稿では,ChatGPTを用いた多数の同型物理問題を生成する手法を提案する。
このアプローチは、数値値や空間関係のような構造的変動を正確に制御し、問題本体の様々な文脈変化をサポートする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:58:05 GMT)
Reinforcement learning entangling operations on spin qubits [0.0] 本稿では,半導体ベースのシングルトリップレット量子ビットに対するエンタングリングプロトコルを二重量子ドットで探索するための強化学習手法を提案する。
従来の勾配に基づく手法のモデルバイアスを回避しつつ,RLエージェントが実行プロトコルを生成できることを実証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:05:38 GMT)
Realization of a fast triple-magic all-optical qutrit in strontium-88 [0.0] アルカリ土とアルカリ土のような原子の光学時計状態は、最先端の光学原子時計の基礎である。
ストロンチウム88の2つのクロック遷移に対する同時マジックトラップを実験的に実証した。
マジックアングル調整トラップで達成可能なコヒーレンスを探索し、715(30)msまでの準安定状態間の原子-原子コヒーレンス時間を求める。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:27:51 GMT)
Ranking by Lifts: A Cost-Benefit Approach to Large-Scale A/B Tests [0.0] A/Bテストは、特にデジタルプラットフォームや市場において、ビジネス実験における意思決定のための中核的なツールである。
本稿では、コスト重み付き偽発見率(FDR)の制約を受けることにより、期待される利益を最大化する決定論的枠組みを開発する。
提案手法は, 提案手法を用いて, 予測昇降率とコストとの比に基づいて実験をランク付けし, 局所的偽発見率(lfdr)を重要な統計量として組み込んだ実験ベイズ手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:28:11 GMT)
Quantum mechanics, non-locality, and the space discreteness hypothesis [0.0] 離散性仮説は、短距離における空間の性質が大距離における空間と根本的に異なることを主張する。
時を実変数とみなし、ディラック=ヴォン・ノイマンの形式主義を用いる。
また、光の明るい状態と暗い状態が自然に起こる2つのスリット実験のモデルについても論じる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:39:04 GMT)
Quantum Petri Nets with Event Structures semantics [0.0] 既存の 'quantum Petri nets' には、厳密な並行性と健全な量子意味論、分析ツール、展開理論が欠如している。
本稿では、Clayramba、De Visme、Winskelの量子イベント構造セマンティクスと互換性のある量子バリュエーションを備えた量子ペトリネットであるQuantum Petri Nets (QPNs)を紹介する。
これは、量子論、ブリッジングネット理論、量子プログラミングのセマンティックな基礎モデルを確立する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:39:23 GMT)
Quantized Neural Networks for Microcontrollers: A Comprehensive Review of Methods, Platforms, and Applications [0.0] マイクロコントローラなどのリソース制約のあるデバイス上での量子ニューラルネットワーク(QNN)は、モデルパフォーマンス、計算複雑性、メモリ制約のバランスをとる上での課題を導入している。
TinyML(Tiny Machine Learning)は、機械学習アルゴリズム、ハードウェアアクセラレーション、ソフトウェア最適化といった進歩を統合して、組み込みシステム上でディープニューラルネットワークを効率的に実行することで、これらの問題に対処する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:56:26 GMT)
Proposal for an autonomous quantum heat engine [0.0] コヒーレントマイクロ波発電は、非線形回路の量子電磁力学によって決定された回路を通る熱の流れからのみ現れる。
この研究は、オットーサイクルに基づく自律量子熱エンジンの初の実験的実現に向けた重要なステップである。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:10:42 GMT)
Probing the spatial distribution of k-vectors in situ with Bose-Einstein condensates [0.0] 本稿では, ボース・アインシュタイン凝縮体(BEC)を移動プローブとして, 光子運動量の空間分布をレーザビームにマッピングする方法を提案する。
BECを分解することにより、レーザービームの異なる位置で原子干渉計により光子反動を測定する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:04:51 GMT)
Prescriptive Agents based on RAG for Automated Maintenance (PARAM) [0.0] 本稿では,Large Language Model (LLM) をベースとしたインテリジェンスシステムについて述べる。
提案手法は,LLM処理のための自然言語に軸受振動データをシリアライズすることで,高精度に数発の異常検出を可能にする。
マルチエージェントコンポーネントは、ベクター埋め込みとセマンティックサーチを使用してメンテナンスマニュアルを処理し、ウェブ検索を行い、包括的な手続き的知識を検索する。
Geminiモデルは、即時アクション、インスペクションチェックリスト、修正措置、部品要件、タイムライン仕様を含む構造化されたメンテナンスレコメンデーションを生成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:08:28 GMT)
Precision over Noise: Tailoring S3 Public Access Detection to Reduce False Positives in Cloud Security Platforms [0.0] クラウドセキュリティソリューションによる過剰で急激なアラート生成は、アナリストの疲労と運用上の非効率の根本原因である。
本研究は,Amazon S3における,公にアクセス可能な警告からの偽陽性の長期的問題について検討した。
結果は、偽陽性の大幅な減少、より正確なアラートの正確性、およびセキュリティアナリストの大幅な時間節約を示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:55:19 GMT)
Precision measurement of Cs($nF_J$) quantum defects and calculations of scalar and tensor polarizabilities of the $nS_{1/2}$, $nP_J$ ,$nD_J$ , and $nF_J$ series [0.0] 我々は、$|6S_1/2, F = 3rangle rightarrow nF_5/2,7/2(n = 28-68)$ Rydberg 級数の絶対周波数測定を行い、133$Csのスペクトルを測定する。
修正リッツの公式に絶対周波数測定をグローバルに合わせることで、$nF_5/2$および$nF_7/2$シリーズの量子欠陥を決定する。
この結果は、衝突や崩壊率などの133ドルCの物性を計算するのに有用である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:22:00 GMT)
Power-Law Interactions Stabilize Time Crystals Realizing Quantum Energy Storage and Sensing [0.0] 一次元スピン-1/2鎖における周期的フロッケ駆動下でのパワー-ロー相互作用の離散時間-結晶相について検討した。
本研究は,量子エネルギーを蓄積し,メロジカルエンハンスメントを達成するためのロバストなプラットフォームとしてFloquetシステムと相互作用するパワーローを位置づけた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:59:51 GMT)
Polaronic Effect in High-Harmonic Generation [0.0] ホルスタイン相互作用をモデルとした電子-フォノンカップリングによるSu-Schrieffer-Heeger鎖の高調波発生(HHG)について検討した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:43:40 GMT)
Physics-Informed Neural Networks with Hard Nonlinear Equality and Inequality Constraints [0.0] KKT-Hardnetは、線形で非線形な等式制約と不等式制約を機械精度に課すニューラルネットワークアーキテクチャである。
KKT-Hardnetは多層受入可能なPINNと比較して厳密な制約満足度を達成する。
これにより、複雑なシステムの信頼性のあるモデリングに向けて、ドメイン知識を機械学習に統合することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:55:50 GMT)
Paired-Sampling Contrastive Framework for Joint Physical-Digital Face Attack Detection [0.0] 本物の自撮りと攻撃的な自撮りのペアは、モダリティに依存しない生き方を学ぶためにマッチする。
フレームワークは軽量(4.46 GFLOPs)で1時間以内の訓練が可能で、実際の配備に実用的である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:05:49 GMT)
PB-IAD: Utilizing multimodal foundation models for semantic industrial anomaly detection in dynamic manufacturing environments [0.0] 本稿では, PB-IAD (Prompt-based Industrial Anomaly Detection) を提案する。
データ分散性、アジャイル適応性、ドメインユーザ中心性という、動的運用環境の3つの重要な要件に対処する。
PatchCoreのような異常検出のための最先端のメソッドにベンチマークされる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:53:13 GMT)
Optimizing Hyper parameters in CNN for Soil Classification using PSO and Whale Optimization Algorithm [0.0] 土壌画像の分類は、土地管理の改善、農業生産の増大、環境問題に対する実践的な解決に寄与する。
本研究では,土壌の種類を分類するために畳み込みニューラルネットワークを用いたインテリジェントモデルを構築した。
畳み込みニューラルネットワークネットワークのハイパーパラメータを選択することにより,Swarmアルゴリズムが最高の性能を得ることができた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:30:19 GMT)
Operational reconstruction of Feynman rules for quantum amplitudes via composition algebras [0.0] 複素量子振幅のオリンとファインマンの規則」で表される運用モデルを再考する。
我々の方法論は、公理を数学から分離し、物理学から選択し、そこから導出することによって明確性を確立する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:12:11 GMT)
On-chip stencil lithography for superconducting qubits [0.0] ヨーゼフソン接合部(JJs)の影の蒸発によく用いられる有機レジストは、残留汚染、熱安定性の低下、典型的な表面洗浄条件下での相溶性に制限がある。
我々はJJ製造のための無機SiO$_3$N$_4$オンチップステンシルリソグラフィーマスクを開発した。
ステンシルマスクはアグレッシブ洗浄剤に耐性があり、1200degCまでの高温に耐え、JJ材料探索とインターフェース最適化のための新たな道を開く。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:03:12 GMT)
On the electronic normal modes of the Meyer-Miller-Stock-Thoss representation of non-adiabatic dynamics [0.0] メイヤー・ミラー・ストッキング-Ts表現の電子正規モードに関する最初の研究を示す。
観測可能条件は、通常、有限個の正規モードの関数ではない。
全体として、MMST変数は正確なQBD保存非線形力学法を得るのに最適ではないことが示唆される。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:22:37 GMT)
On spurious fixed points in iterative maximum likelihood reconstruction for quantum tomography [0.0] 真の解への収束は一般には、突発的な不動点の例を構築することによって保証されないことを示す。
アルゴリズムを一般化し、分解勾配降下と等価であることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:05:26 GMT)
On Traces in Categories of Contractions [0.0] 2014年、バーサはイソメトリーのモノイダル亜分類が追跡されていることを示した。
これは、量子プロセスの出力を、反復に類似した独自の入力に戻す可能性を示している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:41:03 GMT)
On Quantum Random Walks in Biomolecular Networks [0.0] 生体分子ネットワークは、生物学的システムの組織に関する貴重な洞察を提供する。
これらのネットワークは、細胞機能、疾患のメカニズム、治療標的の同定を理解するための鍵となる。
生体分子ネットワーク解析のための量子ランダムウォーク(QRW)の可能性を探る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 19:46:04 GMT)
Observation and mitigation of microwave echoes from dielectric defects in Josephson traveling wave amplifiers [0.0] Josephson-based Traveling Wave Parametric Amplifiers (JTWPA) は、量子限界に近い雑音を付加した記録帯域幅を示した。
本稿では,JTWPAが発するエコー信号の出現について報告する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:42:13 GMT)
Multimodal Quantum Vision Transformer for Enzyme Commission Classification from Biochemical Representations [0.0] 本稿では,酵素委員会(EC)分類を強化した新しいマルチモーダル量子機械学習フレームワークを提案する。
タンパク質配列の埋め込み,量子電子ディスクリプタ,分子グラフ構造,および2次元分子画像表現の4つの相補的な生化学的モダリティを統合する。
実験結果から,我々のマルチモーダルQVTモデルが85.1%のTop-1精度を実現し,シーケンスのみのベースラインを実質的なマージンで上回った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:56:41 GMT)
Multiclass Portfolio Optimization via Variational Quantum Eigensolver with Dicke State Ansatz [0.0] 本稿では,ポートフォリオ最適化のための新しい量子フレームワークを提案する。
このアンザッツの重要な強みは、量子系を実現可能な状態のみの重ね合わせで初期化することである。
その結果、CMA-ESと組み合わせると、Dicke状態のアンザッツは収束率、近似比、測定確率の点で優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:57:12 GMT)
Multi-scale species richness estimation with deep learning [0.0] 我々はサンプリング理論と深層学習を組み合わせて、任意に大きなサンプリング領域内の局所的な種多様性を予測する。
我々の深部SARモデルが、鍵となる生物多様性プロセスのマルチスケール効果に関する基礎的な洞察をいかに得るかを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:43:56 GMT)
Multi-agent Auditory Scene Analysis [0.0] 聴覚シーン分析(ASA)は、音源の位置、分離、分類の3つの主要なタスクを実行することで、音環境から情報を取得することを目的としている。
これらのタスクを実行すると、全体のレスポンス時間がリニアに増加し、最後のタスクは最初のタスク(ロケーション)のエラーに非常に敏感になる。
タスクを並列に実行し、各タスク間のフィードバックループでローカルエラーを補うためのマルチエージェントアプローチを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:18:03 GMT)
Making Pose Representations More Expressive and Disentangled via Residual Vector Quantization [0.0] 本稿では,残差ベクトル量子化(RVQ)を用いた連続的な動き特徴を持つコードベースの潜在表現を補足する手法を提案する。
この設計は、ポーズ符号の解釈可能性や操作性を維持しつつ、高周波詳細などの微妙な動き特性を効果的に捉えている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:29:21 GMT)
MGSC: A Multi-granularity Consistency Framework for Robust End-to-end Asr [0.0] 我々は、内部の自己整合性を強制するモデルに依存しないプラグイン・アンド・プレイモジュールであるMulti-Granularity Soft Consistencyフレームワークを紹介する。
私たちの研究は、この2つの一貫性の粒度の強力な相乗効果を初めて明らかにしました。
私たちの研究は、より堅牢で信頼性の高いAIを構築するための重要なステップとして、内部一貫性の実施を実証しています。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:51:49 GMT)
Low-density parity-check codes as stable phases of quantum matter [0.0] 量子エラー訂正符号が与えられたら、いつそれが物質の安定なギャップ付き量子位相を定義するのか?
低密度パリティチェック(LDPC)符号がこのような位相を定義し、全ての小天体の摂動に対して堅牢であることを示す。
また,量子トーリック符号相は空間的に非局所的な小体摂動に対して頑健であることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:21:21 GMT)
Lossless Compression of Neural Network Components: Weights, Checkpoints, and K/V Caches in Low-Precision Formats [0.0] 本研究では、ZipNNのアプローチをより高精度な浮動小数点点フォーマット、特にFP8とFP4に拡張する。
圧縮比はBF16が62%,FP8が83%であった。
また,キー値(K/V)キャッシュテンソルの圧縮性についても検討した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:46:50 GMT)
Learning from user's behaviour of some well-known congested traffic networks [0.0] 本稿では,トラフィック割り当て問題である平衡条件下での渋滞したトラフィックネットワークのユーザ行動予測の問題について考察する。
本稿では,ニューラルネットワークと固定点アルゴリズムを結合した2段階の機械学習手法を提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:53:13 GMT)
LaViPlan : Language-Guided Visual Path Planning with RLVR [0.0] VLM(Vision-Language Models)は,高レベルなシーン理解とユーザ対応の意思決定を提供することによって,このようなシナリオを扱う上で有望であることを示す。
既存のVLMは、言語に基づく推論とアクションレベルの計画に必要な低レベルの軌道との不一致を示すことが多い。
本稿では,RLVR(Reinforcement Learning with Verifiable Rewards)を利用したLaViPlanを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:32:37 GMT)
LLMs and Agentic AI in Insurance Decision-Making: Opportunities and Challenges For Africa [0.0] 我々は、保険におけるユニークな機会、課題、潜在的な経路を考察し、強調する。
我々は、アフリカの保険市場における重要なギャップを特定し、主要な地域努力、プレイヤー、そしてパートナーシップの機会を強調します。
私たちは、包括的で持続可能で公平なAI戦略とソリューションを作成することを目的とした協力的な取り組みを、アクチュアリー、保険会社、規制当局、および技術リーダーに呼びかけます。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:57:00 GMT)
Kourkoutas-Beta: A Sunspike-Driven Adam Optimizer with Desert Flair [0.0] トランスフォーマーニューラルネットワークは、物理学に基づく問題にますます利用されている。
データ駆動型PDEサロゲートでは、異なる境界と初期条件からのトレーニングサンプルが不規則な損失とスパイク勾配を引き起こす可能性がある。
固定された第2モーメントベータ2がレイヤワイドな値に置き換えられるAdamスタイルの割引であるKourkoutas-Betaを紹介します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:50:45 GMT)
Kernel Two-Sample Testing via Directional Components Analysis [0.0] 本稿では,カーネルHilbert空間(RKHS)において,よく見積もられた方向成分を同定し,利用するためのカーネルベースの2サンプルテストを提案する。
これらの方向に着目し、複数のカーネルにまたがる情報を集約することにより、特に高次元およびアンバランスなサンプル設定において、高いパワーとロバスト性を実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:04:18 GMT)
KIRETT: Knowledge-Graph-Based Smart Treatment Assistant for Intelligent Rescue Operations [0.0] 世界中の救助活動の必要性は急速に高まっている。
画像上の変化と怪我や健康障害のリスクは、緊急呼び出しの基礎となる。
最初の対応者は、可能な限り短時間で、パーソナライズされた最適化されたヘルスケアを提供できなければならない。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:56:09 GMT)
Inter-Class Relational Loss for Small Object Detection: A Case Study on License Plates [0.0] 一段階の多対象検出タスクでは、様々な結合(IoU)ベースのソリューションは、訓練中に目標付近で滑らかで安定した収束を目標とする。
小物体の勾配を効率的に更新するクラス間関係損失を提案する。
提案するICR損失ペナルティは,既存のIoUベースの損失に容易に付加でき,性能が向上する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:37:17 GMT)
Information-acquiring von Neumann architecture of a computer: Functionality and subjectivity [0.0] 我々は,コンピュータの情報取得型フォン・ノイマンアーキテクチャを,きめ細かなあるいは粗いモデルで設計する。
このアーキテクチャは、与えられた入力純状態からシステム内の他の出力純状態に変換するハミルトニアン過程(機能)と、情報を取得する物理過程(主観性)の両方を可能にする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:27:35 GMT)
Improving VQE Parameter Quality on Noisy Quantum Processors with Cost-Effective Readout Error Mitigation [0.0] 本研究は,VQE性能に及ぼす誤差緩和戦略の影響について検討する。
小分子系では、古い世代の5量子ビット量子処理ユニット(IBMQ Belem)が、誤差の軽減なしに156量子ビットデバイス(IBM Fez)から得られるものよりも、地上状態のエネルギー推定を桁違いに精度良く行うことを示す。
本研究は,分子シミュレーションにおけるノイズ量子ハードウェアの有用性を拡大する上で,誤差軽減が重要な役割を担っていることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:14:22 GMT)
Improving LLMs for Machine Translation Using Synthetic Preference Data [0.0] 比較的少ないデータ資源を用いて,機械翻訳において汎用的な命令をいかに改善できるかを考察する。
Slovene大言語モデルを用いて、優先度最適化(DPO)を用いたGaMSBインストラクトモデルを改善する。
我々は2つのLLM、GaMSBInstructとEuroLLM-9BInstructを使って、英語のウィキペディア記事を翻訳することでトレーニングを作成した。
ベースラインモデルと比較して、微調整されたモデルは、ウィキペディアの記事の翻訳でCOMETのスコアが0.04と0.02に達した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:24:16 GMT)
Hydra: A 1.6B-Parameter State-Space Language Model with Sparse Attention, Mixture-of-Experts, and Memory [0.0] Hydraは、ハイブリッド長文言語モデルのためのアーキテクチャ提案である。
条件付き計算、長期コンテキストメモリ機構、スパース・ミックス・オブ・エキスパートを組み合わせる。
SSM効率、選択的スパースアテンション、MoEキャパシティ、学習可能なメモリを組み合わせることで、Hydraはモジュール型の入力適応長文言語モデルへの道筋をスケッチする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:31:15 GMT)
HandCraft: Dynamic Sign Generation for Synthetic Data Augmentation [0.0] 手話認識モデルは、トレーニングデータの可用性が不十分なため、大幅なパフォーマンス上の制限に直面します。
本稿では,CMLPeに基づく新規かつ軽量な手話生成モデルを提案する。
このモデルは、合成データ事前学習アプローチと組み合わせて、認識精度を一貫して改善する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:38:24 GMT)
GasTwinFormer: A Hybrid Vision Transformer for Livestock Methane Emission Segmentation and Dietary Classification in Optical Gas Imaging [0.0] GasTwinFormerは、光ガスイメージングにおけるリアルタイムメタン放出セグメンテーションと食餌分類のためのハイブリッドビジョントランスフォーマーである。
OGIを用いた牛肉のメタン排出量の包括的分析を行い,11,694フレームのアノテート処理を行った。
GasTwinFormerは74.47% mIoUと83.63% mF1をセグメンテーションで達成し、3.348Mパラメータ、3.428G FLOP、114.9 FPS推論速度で例外的な効率を維持する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:45:10 GMT)
From Passive Tool to Socio-cognitive Teammate: A Conceptual Framework for Agentic AI in Human-AI Collaborative Learning [0.0] 我々は、ツールとしてのAIから、コラボレーションパートナとしてのAIへの移行をグラフ化する、新しい概念的フレームワークを提案する。
真の意識や共有意図を欠いたAIが真の協力者であるかどうかを検討する。
この区別は、教育におけるAIの教育、教育設計、そして将来の研究課題に重要な意味を持つ。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:17:32 GMT)
From Basic Affordances to Symbolic Thought: A Computational Phylogenesis of Biological Intelligence [0.0] 本稿では,2種類の階層的統合が基本的動的結合の上に最小限の要件であり,シンボリック思考を実現することを提案する。
我々はこの仮説を、17のシミュレーションの体系的なコレクションで検証し、多地点述語と構造マッピングの能力と能力を備えた認知アーキテクチャの能力について検討した。
結果は、人間の脳がどのように象徴的な思考をもたらすかを理解し、生物学的知性と機械学習に対する現代のアプローチの違いについて語る。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:38:06 GMT)
From Autonomy to Agency: Agentic Vehicles for Human-Centered Mobility Systems [0.0] 本稿では,エージェント自動車(AgVs)の概念を紹介する。
AgVはエージェントAIシステムを統合し、複雑な環境で推論、適応、相互作用を行う。
AgVが将来のモビリティシステムをどのように変え、システムが人間中心であることを保証するかを強調します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:50:10 GMT)
Free-Particle State Realized via Optimal Filtering in Optomechanics: Implications for Gravity-Induced Entanglement [0.0] 光学系におけるメカニカルミラーの条件量子状態の解析を行う。
この条件下では, 最適フィルタリングにより, 粒子状状態が効果的に実現できることが示されている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 01:23:38 GMT)
Finite-Dimensional Quantum Systems under the Fourth Law of Thermodynamics [0.0] ステッペストエントロピー・アセンション (SEA) アンザッツは、システムの不可逆的な進化を制御している。
SEAは、力学と熱力学を統一する第二法則に基づいている。
近似解析ツールとして固定ラグランジュ乗算器(FLM)法を開発した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 03:30:44 GMT)
Filling the Gap for Uzbek: Creating Translation Resources for Southern Uzbek [0.0] 南ウズベク語(南ウズベク語、英: Southern Uzbek)は、アフガニスタンの約500万人が話しているテュルク語族である。
多くの話者がいるにもかかわらず、南部ウズベク語は自然言語処理では不十分である。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:05:57 GMT)
FastTracker: Real-Time and Accurate Visual Tracking [0.0] 本稿では,複数のオブジェクトタイプを扱える汎用的な追跡フレームワークを提案する。
提案手法は,(1)密閉物体の識別を向上する隠蔽認識再識別機構,(2)道路構造認識トラックレット改質戦略の2つの重要な要素を組み込んだ。
大規模な実験結果から,提案手法は新たに導入されたデータセットといくつかの公開ベンチマークの両方で堅牢な性能を実現することが示された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:59:53 GMT)
Fast Symbolic Regression Benchmarking [0.0] 記号回帰はデータから数学的モデルを明らかにする。
ベンチマークは、"the one"式形式のリカバリを強調し、コンピュータ代数システムにのみ依存する。
我々は、許容可能な表現のキュレートされたリストを導入することで、これらの問題を改善した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 07:12:44 GMT)
Fast Graph Neural Network for Image Classification [0.0] 本研究では,グラフ畳み込みネットワーク(GCN)とボロノイ図を統合して画像分類を強化する手法を提案する。
提案モデルは,各種ベンチマークデータセットの事前処理効率と分類精度の両方において,大幅な改善を実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 17:57:59 GMT)
Fast Classical Simulation of Quantum Circuits via Parametric Rewriting in the ZX-Calculus [0.0] ZX-計算(ZX-calculus)は、数個の簡単な書き換え規則によって量子計算を単純化する代数形式である。
高速なGPU並列性を利用して古典シミュレーションの最終段階を迅速に行うことが可能であることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:44:53 GMT)
Exploring the Interplay Between Quantum Entanglement and Decoherence [0.0] 本研究は, 熱・電磁・衝突脱コヒーレンスなどの環境要因が絡み合った状態の整合性にどのように影響するかに焦点を当てる。
この発見は量子コンピューティングや量子通信を含む量子技術の発展に重大な影響を及ぼす。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:39:54 GMT)
Experimental tests of a model of the quantum measurement process [0.0] 提案する量子計測プロセスのモデルをテストする新しいタイプの実験を提案・記述する。
提案された実験には、モデルのファルシフィケーションや確認を可能にする新しいタイプの「中断測定」が含まれている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:34:34 GMT)
Evaluation and Optimization of Leave-one-out Cross-validation for the Lasso [0.0] 私は,ラッソの残余のクロスバリデーションを計算できる分数式を生成するアルゴリズムを開発した。
このアルゴリズムは、グローバルまたはローカルのいずれにおいても、アウト・ワン・アウトのクロスバリデーションを最適化する正確なハイパーパラメータを見つけるために使用できる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 02:53:54 GMT)
Ethics of Artificial Intelligence [0.0] 人工知能(AI)は、近い将来人類の発展にとって重要なデジタル技術である。
本稿では、AIシステムを対象とする倫理的問題について、主に論じる(2)を紹介する。
そして、AIシステムを主題として、すなわち、倫理がAIシステム自体の機械倫理である場合を考察する。
最後に、今後の発展とAIの概念について考察する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:22:19 GMT)
Equi-mRNA: Protein Translation Equivariant Encoding for mRNA Language Models [0.0] 2次元特殊直交行列(SO(2))の巡回部分群として同義コドン対称性を明示的に符号化する最初のコドンレベル同変mRNAモデルであるEqui-mRNAを導入する。
発現、安定性、リボスイッチングを含む下流特性予測タスクでは、Equi-mRNAは精度を最大10%向上させる。
Equi-mRNAはmRNAモデリングのための新しい生物学的原理のパラダイムを確立し、次世代治療の設計に重要な意味を持つ。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:42:10 GMT)
Entanglement-enhanced imaging through scattering media [0.0] 本稿では,散乱過程を反転させることなく複雑な媒体を介して画像を送信する量子絡み合いに基づくアプローチを提案する。
この方法は、複数の測定基地間での光子相関の保存という、量子絡み合いの基本的な性質を利用する。
我々の研究は、単純な光学的相関を超えた量子絡み合いのユニークな性質を活用することによって、複雑な媒体を通したイメージングに根本的に新しいアプローチを導入している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:04:25 GMT)
Entanglement Preservation and Clauser-Horne Nonlocality in Electromagnetically Induced Transparency Quantum Memories [0.0] 電磁誘導透過(EIT)量子メモリは、絡み合った光子を記憶することができる。
この研究は長年の理論的ギャップを橋渡しし、スケーラブルな量子ネットワークと量子情報処理にEITメモリを応用するための基盤となる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:40:35 GMT)
Enhanced Predictive Modeling for Hazardous Near-Earth Object Detection: A Comparative Analysis of Advanced Resampling Strategies and Machine Learning Algorithms in Planetary Risk Assessment [0.0] 本研究では,二元分類フレームワークによる有害地球近傍天体(NEO)の予測のための機械学習モデルの性能評価を行った。
RFC と GBC はともに 0.987 と 0.896 の印象的な F2 スコアで最高の性能を発揮した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:50:00 GMT)
Don't Push the Button! Exploring Data Leakage Risks in Machine Learning and Transfer Learning [0.0] 本稿では、意図しない情報がトレーニングデータを汚染し、モデルの性能評価に影響を与える機械学習(ML)における重要な問題に対処する。
新たなデータに対する評価と実際のパフォーマンスの相違は大きな懸念事項である。
データ漏洩と対処中の特定のタスクとの関係を調査し、Transfer Learningにおけるその発生を調査し、標準的なインダクティブMLとトランスダクティブMLフレームワークを比較します。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:39:43 GMT)
Dissipation and noise in strongly driven Josephson junctions [0.0] 超伝導体ギャップパラメータの2倍以下の周波数でも強い駆動は、光子アシストによるクーパー対の破れによる接合の消散を活性化できることを示す。
また、超伝導量子回路における非マルコフ物理学の理論的および実験的研究にアピールする、駆動されたジョセフソン接合における顕著なメモリ効果も予測する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:04:03 GMT)
Dirac, Schroedinger, and Maxwell equations in scalar and vector field quantum mechanics [0.0] 相対論的粒子の量子論は光子様の分散関係に基づいて再考される。
波動-粒子双対性は、電磁波-粒子双対性として再定義することができる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 10:04:21 GMT)
Diagnosing Psychiatric Patients: Can Large Language and Machine Learning Models Perform Effectively in Emergency Cases? [0.0] 我々は,従来の機械学習と大規模言語モデル(LLM)が精神科患者をどのように評価できるかについて研究してきた。
救急医療の患者からのデータは、ドイツの救難所から収集された。
Llama 3.1を含む様々な機械学習モデルは、このモデルの予測能力が不健康な精神疾患の患者を識別するための効率的なツールとして役立つかどうかを評価するために使用された。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:42:19 GMT)
Deutsch-Jozsa and Bernstein-Vazirani algorithm using single-particle discrete-time quantum walk [0.0] 本稿では、単一粒子離散時間量子ウォークを用いたDeutsch-JozsaとBernstein-Vaziraniアルゴリズムの効率的な実装を提案する。
これらの実装を実現するために、特定の光学部品を備えた詳細な光学フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:18:49 GMT)
Design of high-efficiency UHV loading of nanodiamonds into a Paul trap: Towards Matter-Wave Interferometry with Massive Objects [0.0] 質量粒子を持つ物質波干渉計は、多くの基本的なアイデアをテストすることができる。
我々はナノダイアモンドを粒子として利用することに集中し、NDにStern-Gerlach力とともに埋め込まれたスピンを時空の閉ループを達成する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:01:50 GMT)
DeepEmoNet: Building Machine Learning Models for Automatic Emotion Recognition in Human Speeches [0.0] 人間のスピーチで感情を分類するために、いくつかの機械学習モデルを構築します。
比較的小さなデータセットで適切なパフォーマンスを達成するために、モデルを効率的にトレーニングしました。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:34:28 GMT)
Data-Driven Probabilistic Evaluation of Logic Properties with PAC-Confidence on Mealy Machines [0.0] 本稿では,メアリーマシンという形で抽象的なCPSを考える。
我々は,n段階の有限地平線上でのシステムの安全性確率を決定するためのデータ駆動型手法を提案する。
自動車線維持システムにおけるケーススタディによるアプローチの検証を行った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:38:52 GMT)
Contributions to the Theory of Clifford-Cyclotomic Circuits [0.0] 我々はクリフォード-シクロトミック回路の理論に2つの貢献をする。
既存の合成アルゴリズムは、$n=2k$と$kgeq 4$のとき、$k-3$のアンシラだけが$U$の回路を合成するために必要であることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 12:44:39 GMT)
Continuous sentiment scores for literary and multilingual contexts [0.0] 本稿では,多言語文芸データに基づいて学習した概念ベクトル投影に基づく新しい連続感情スコアリング手法を提案する。
我々のアプローチは、英語とデンマーク語のテキスト上で既存のツールよりも優れており、人間の評価と密に一致した感情スコアを生み出している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 11:18:13 GMT)
Contextuality from the vacuum [0.0] 本研究では,Unruh-DeWitt検出器を用いて,量子場の真空からのコンテキスト性の抽出について検討する。
フィールドとの相互作用は、ハイゼンベルク・ワイル測度に関して、最初は文脈性のない非コンテキスト検出器を成立させることができることを示す。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 18:41:20 GMT)
Context Steering: A New Paradigm for Compression-based Embeddings by Synthesizing Relevant Information Features [0.0] コンテキストステアリング(context steering)は、機能形成プロセスを積極的にガイドする方法論である。
正規化圧縮距離(NCD)と相対圧縮距離(NRC)を用いて,この戦略の有効性を検証する。
テキストから実世界の音声への異種データセット間の実験結果-コンテキストステアリングの堅牢性と汎用性を検証した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:26:52 GMT)
Cohomotopy, Framed Links, and Abelian Anyons [0.0] 平面上の点の群完備構成空間の基本群とフレームリンクのコボルディズムクラスを同定する。
セガルの定理の下では、これらのクラスは3次元球面の 2-コホモトピーにおいてホップ生成子によって生成される整数である。
我々は、コホモトピーで定量化されたエキゾチックなフラックスとして、2次元電子ガス中の正準ソリトンを同定することの意義に関する展望を近づいた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 20:46:55 GMT)
Can AI Have a Personality? Prompt Engineering for AI Personality Simulation: A Chatbot Case Study in Gender-Affirming Voice Therapy Training [0.0] この論文は,大規模言語モデル (LLM) が,一貫したパーソナリティをシミュレートするために,迅速なエンジニアリングによって導出できるかどうかを考察する。
この研究は、SLP(Speech-Language Pathology)の学生教育のために設計されたチャットボットの文脈の中で、この概念を探求する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 00:43:06 GMT)
CaTE Data Curation for Trustworthy AI [0.0] このレポートは、AI対応システムを設計または開発するチームにガイダンスを提供する。
開発チームが信頼できるAI対応システムを構築するための一連のステップについて説明する。
これらのステップの説明には、強み、弱点、前提条件、結果、関連するオープンソースソフトウェアツールの実装が含まれる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:40:21 GMT)
Breaking conservation law enables steady-state entanglement out of equilibrium [0.0] 熱環境に結合したシステムにおいて, 純散逸動力学により, 絡み合った定常状態が生成可能であることを示す。
このスキームをスピンポンプ磁石に弱結合した2つの色中心のモデルで説明し、チューニング可能なマグノン励起により有限距離上の定常な絡み合いを可能にする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:03:55 GMT)
BoostTrack++: using tracklet information to detect more objects in multiple object tracking [0.0] 類似度尺度と過去の信頼度スコアに基づいて,新たな信頼度スコアを算出するソフト検出信頼度向上手法を提案する。
提案手法は,MOT17データセット上でのアート結果の近況と,MOT20データセット上でのアートHOTAとIDF1スコアの新たな状態を実現する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:40:59 GMT)
Beyond ReLU: Chebyshev-DQN for Enhanced Deep Q-Networks [0.0] 本稿では,Chebyshev-DQN(Ch-DQN)という新しいアーキテクチャを紹介し,ChebyshevベースをDQNフレームワークに統合し,より効率的な特徴表現を実現する。
提案したモデルをCart-Polev1ベンチマークで評価し,標準DQNと同等数のパラメータと比較した。
その結果,Ch-DQNは高い性能を示し,ベースラインを約39%上回った。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 08:41:15 GMT)
Beyond Copenhagen: Following the Trail of Decoherence in Feynman's Light Microscope [0.0] ファインマンの光顕微鏡は、私たちが量子現実について知っていることを再考してくれる。
粒子とその環境を絡み合ったシステムとして扱うと、未修正の量子力学は顕著な成功を収めた。
この記事は、量子力学の学部課程を持つ人なら誰でもアクセスできると書かれています。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 22:07:40 GMT)
Assessing the Quality and Security of AI-Generated Code: A Quantitative Analysis [0.0] 本研究では,Claude Sonnet 4, Claude 3.7 Sonnet, GPT-4o, Llama 3.2 90B, OpenCoder 8Bの5大言語モデル(LLM)のコード品質とセキュリティを定量的に評価する。
LLMは機能的なコードを生成することができるが、バグやセキュリティ上の脆弱性、コードの臭いなど、さまざまなソフトウェア欠陥も導入している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:16:21 GMT)
Application of resource theory based on free Clifford+kT computation to early fault-tolerant quantum computing [0.0] 我々は,一般量子状態のシミュレーションコストについて,$k$$T$ゲートしか使用できないという制約の下で検討した。
我々はその一般化を導入し、Clifford+$kT$ロバストネスと呼び、Clifford+$kT$状態を自由資源として扱う。
その結果,Clifford+$kT$状態を用いることで,サンプリングコストの低減を図ることができた。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:00:00 GMT)
Analysis of discrete modern Hopfield networks in open quantum system [0.0] 現代のホップフィールドネットワークは、クロトフとホップフィールドによって提案され、ホップフィールドネットワークの数学的一般化である。
本研究では、オープン量子ホップフィールドネットワークを一般化する離散的現代ホップフィールドネットワークのためのオープン量子モデルを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 15:50:27 GMT)
An Investigation Into Secondary School Students' Debugging Behaviour in Python [0.0] 本稿では,K-12の学生がテキストベースのプログラミング言語を学習する際のデバッグ行動について検討する。
学生によって様々な行動が示され、効果がないよう歪められた。
デバッグに苦労している学生は、脆弱な知識と、その結果を見るためのレンズを持っている、と我々は主張する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:34:23 GMT)
All incompatible sets of measurements can generate Buscemi nonlocality [0.0] 空間分離系の測定から生じる相関関係におけるベル非局所性の存在は、使用する測定の集合が必ずしも相容れないことを保証している。
しかし、すべての非互換測度がベル非局所性をもたらすわけではない、なぜなら、局所相関しか生成できない非互換測度が存在するからである。
しかし、古典的な測度入力ではなく量子が考慮されるような拡張ベルシナリオでは、すべての非互換な測度が非局所性を生成することができることを証明している。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:38:08 GMT)
Adaptive Interpolating Quantum Transform: A Quantum-Native Framework for Efficient Transform Learning [0.0] 本稿では,適応補間量子変換(AIQT)について紹介する。
この結果から,AIQTはパラメータカウントを最小化して高い性能を実現し,深部変動回路に代わるスケーラブルで解釈可能な代替手段を提供することがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 04:26:52 GMT)
A practical route to donor binding energies: The DFT-1/2 method for shallow defects [0.0] DFT-1/2法を用いて帯域ギャップの過小評価と非局在化誤差に対処する。
超セルサイズを無限にする補間スキームを用いることで,計算オーバーヘッドを最小限に抑えた正確な結合エネルギーが得られる。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:37:19 GMT)
A Theory of Information, Variation, and Artificial Intelligence [0.0] 実証研究の活発化は、生成AIの普及が情報、創造性、文化生産に顕著な均質化効果をもたらすことを示唆している。
本稿では、特殊領域内の知識を平らにする非常に均質化が、その知識をそれら全体で再結合可能な一貫したモジュールに同時にレンダリングする、と論じる。
この論文は、この緊張を解決するのに必要な認知的および制度的な足場を概説し、生成的AIがイノベーションの道具になるか、均質化されるかを決定する決定的な変数であると主張した。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:21:13 GMT)
A Scalable Trie Building Algorithm for High-Throughput Phyloanalysis of Wafer-Scale Digital Evolution Experiments [0.0] デジタル実験から得られた系譜の高解像度スナップショットは、進化可能性とオープンエンド進化の研究の鍵となる。
850,000プロセッサのCerebras Wafer-Scale Engine(WSE)など、AI/MLハードウェアアクセラレータデバイスの進歩は、進化的問題の範囲を広げようとしている。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 21:18:51 GMT)
A Lightweight Privacy-Preserving Smart Metering Billing Protocol with Dynamic Tariff Policy Adjustment [0.0] スマートメータとユーティリティプロバイダ間の双方向通信を容易にすることにより,高度な計測インフラストラクチャ(AMI)がスマートグリッドにおいて重要な役割を果たす。
詳細な消費データの収集は、消費者の日常活動を不注意に開示し、プライバシーの懸念を高め、プライバシー侵害につながる可能性がある。
本稿では,動的ポリシー調整によるリアルタイム関税請求サービスを支援するために設計された,軽量なプライバシ保護型スマート計測プロトコルを提案する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:06:19 GMT)
A Lightweight Incentive-Based Privacy-Preserving Smart Metering Protocol for Value-Added Services [0.0] 本稿では,インセンティブに基づく付加価値サービスのための軽量なプライバシ保護型スマート計測プロトコルを提案する。
このスキームは、ローカルな差分プライバシー、ハッシュチェーン、盲目のデジタル署名、偽名、時間的集約、匿名のオーバーレイネットワークを利用している。
その結果,1024ビットRSAキー,7日間,1日4回のレポートで約0.51秒で動作し,約4.5MBのメモリを消費することがわかった。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 13:28:39 GMT)
A Laplace diffusion-based transformer model for heart rate forecasting within daily activity context [0.0] 本稿では,患者の身体活動によって引き起こされる心拍変動をモデル化するために,TransformerモデルとLaplace拡散法を組み合わせることを提案する。
このモデルは、コンテキスト化された埋め込みと専用エンコーダを組み込むことで、長期パターンと活動特異的心拍数ダイナミクスの両方をキャプチャする。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 06:42:38 GMT)
A Collusion-Resistance Privacy-Preserving Smart Metering Protocol for Operational Utility [0.0] 本稿では,運用サービスにおけるスマート計測のためのコレージョン耐性・プライバシ保護アグリゲーションプロトコルを提案する。
提案手法は,Paillier暗号系の加法準同型特性を用いて摂動読解を集約する。
性能とプライバシの両方の観点からプロトコルを評価する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 14:40:33 GMT)
$TIME[t] \subseteq SPACE[O(\sqrt{t})]$ via Tree Height Compression [0.0] 決定論的マルチテープチューリングマシンの平方根空間シミュレーションを実証する。
鍵となるステップは、標準的な左深の簡潔な木を再認識するハイト圧縮理論である。
アルゴリズム的には、一定の大きさのフィールド上の一定度のマップを持つ代数的リプレイエンジンは、レベル単位の一定サイズのトークンを保証する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 16:27:53 GMT)
$2$-Rényi CCNR Negativity of Compact Boson for multiple disjoint intervals [0.0] 単一区間と残りの不連続区間の和との絡み合いを考察する。
R'enyi CCNRネガティビティを2dマスレスコンパクトボソンで計算する。
論文参考訳(メタデータ) (Wed, 20 Aug 2025 09:45:08 GMT)