Fugu-MT: arxivの論文翻訳(概要)

Advances in Feed-Forward 3D Reconstruction and View Synthesis: A Survey [154.5]
3D再構成とビュー合成は、拡張現実(AR)、仮想現実(VR)、デジタルツインといった没入型技術における基礎的な問題である。深層学習によるフィードフォワードアプローチの最近の進歩は、高速で一般化可能な3次元再構成とビュー合成を可能にして、この分野に革命をもたらした。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:13:25 GMT)
Rethinking Data Protection in the (Generative) Artificial Intelligence Era [115.7]
現代の(生産的な)AIモデルやシステムに生じる多様な保護ニーズを捉える4段階の分類法を提案する。当社のフレームワークは、データユーティリティとコントロールのトレードオフに関する構造化された理解を提供し、AIパイプライン全体にわたっています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:58:02 GMT)
DRS: Deep Question Reformulation With Structured Output [114.1]
大規模言語モデル(LLM)は、解決不可能な質問を検知できるが、これらの質問の修正をユーザーが支援するのに苦労する。 DRS:Deep Question Reformulation with Structured Output, a novel zero-shot method for enhance to LLMs ability to help users in reformulation Question。 DRS は GPT-3.5 の改定精度を 23.03% から 70.42% に改善するとともに,Gemma2-9B などのオープンソースモデルの性能を 26.35% から 56.75% に向上させた。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:39:52 GMT)
Generative Distribution Distillation [109.8]
単純なtextitGenDDベースラインは、高次元最適化の呪いとラベルからのセマンティックインスペクションの欠如という、2つの大きな課題に直面する。テキストスプリットトークン化戦略を導入し、安定かつ効果的な教師なしKDを実現する。また,リコンストラクション目的にラベル管理を統合するためのtextitDistribution Contraction 技術を開発した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:27:42 GMT)
Vulnerability of LLMs to Vertically Aligned Text Manipulations [108.7]
垂直テキスト入力は、数学計算や単語ベースのスドクパズルなど、様々な現実世界のアプリケーションでよく見られる。近年の研究では、エンコーダベースのモデルで単語を垂直に整列させるような入力形式の変更は、テキスト分類タスクにおいて大幅に精度を低下させることが示されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:44:30 GMT)
Reevaluating Policy Gradient Methods for Imperfect-Information Games [94.5]
我々は,不完全情報ゲームにおけるDRLアルゴリズムの最大利用可能性比較を行う。 FP-、DO-、CFR-ベースのアプローチは、一般的なポリシー勾配法を上回りません。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:56:04 GMT)
Docopilot: Improving Multimodal Models for Document-Level Understanding [87.6]
マルチモーダル文書の詳細な理解を支援するために,高品質な文書レベルデータセットDoc-750Kを提案する。このデータセットには、さまざまなドキュメント構造、広範なクロスページ依存関係、および元のドキュメントから派生した実際の質問と回答のペアが含まれている。データセットに基づいて、RAGに頼ることなく、文書レベルの依存関係を正確に処理できるネイティブなマルチモーダルモデルであるDocopilotを開発する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:03:34 GMT)
APIGen-MT: Agentic Pipeline for Multi-Turn Data Generation via Simulated Agent-Human Interplay [86.0]
APIGen-MTは検証可能で多様なマルチターンエージェントデータを生成するフレームワークである。 xLAM-2-fc-r 級数で 1B から 70B のパラメータを持つモデル群を訓練する。我々のモデルは、$tau$-benchとBFCLベンチマークでGPT-4oやClaude 3.5のようなフロンティアモデルより優れている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:39:17 GMT)
Composed Multi-modal Retrieval: A Survey of Approaches and Applications [81.5]
複合マルチモーダル検索(CMR)は次世代技術として誕生する。 CMRは、参照視覚入力とテキスト修正を統合することで、画像やビデオをクエリすることを可能にする。本稿では,CMRの基礎的課題,技術的進歩,応用について概説する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:16:52 GMT)
What if Othello-Playing Language Models Could See? [81.1]
VISOTHELLOは移動履歴と基板画像に基づいて訓練されたマルチモーダルモデルである。マルチモーダルトレーニングは、内部表現の性能と堅牢性の両方を改善する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:47:55 GMT)
When Autonomy Goes Rogue: Preparing for Risks of Multi-Agent Collusion in Social Systems [78.0]
悪意のあるマルチエージェントシステム(MAS)のリスクをシミュレートするための概念実証手法を提案する。この枠組みを、誤情報拡散とeコマース詐欺という2つのリスクの高い分野に適用する。その結果,分散システムの方が,集中型システムよりも悪意ある行動を実行するのに効果的であることが示唆された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:17:30 GMT)
Advancing Textual Prompt Learning with Anchored Attributes [77.5]
本稿では,ATPrompt という名前の視覚言語モデルに対する属性型テキスト・プロンプト学習手法を提案する。テキストプロンプトをカテゴリ中心の形式から属性-カテゴリハイブリッド形式に変換する。簡単に使えるプラグイン技術として、ATPromptは既存の基本的なプロンプトフォーマットをシームレスに置き換えることができる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:14:11 GMT)
Agentic Satellite-Augmented Low-Altitude Economy and Terrestrial Networks: A Survey on Generative Approaches [76.1]
本調査は,衛星搭載低高度経済と地上ネットワーク(SLAETN)におけるエージェント人工知能(AI)の実現に焦点をあてる。 SLAETNのアーキテクチャと特徴を紹介するとともに,衛星,空中,地上コンポーネントの統合において生じる課題を分析する。これらのモデルが,コミュニケーション強化,セキュリティとプライバシ保護,インテリジェントな衛星タスクという,3つの領域にわたるエージェント機能をどのように強化するかを検討する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:07:05 GMT)
MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization [74.0]
MiroMind-M1 は Qwen-2.5 ベースのベンチマーク上に構築された完全なオープンソース RLM のセットである。我々のモデルは2つの段階で訓練されている: SFT on a carefully curated corpus of 719K math-reasoning problem with confirmed CoT trajectories, then RLVR on 62K challenge and verible problem。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:21:23 GMT)
MagicGUI: A Foundational Mobile GUI Agent with Scalable Data Pipeline and Reinforcement Fine-tuning [73.9]
MagicGUIは、現実のモバイルGUI環境における認識、接地、推論における重要な課題に対処するために設計された、基本的なモバイルGUIエージェントである。フレームワークには、包括的で正確なデータセット、知覚と接地能力の強化、包括的で統一されたアクション空間、計画指向の推論メカニズムを含む6つの重要なコンポーネントが含まれている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:33:43 GMT)
SpatialTrackerV2: 3D Point Tracking Made Easy [73.0]
SpaceTrackerV2はモノクロビデオのフィードフォワード3Dポイントトラッキング手法である。これは、世界空間の3Dモーションをシーン幾何学、カメラエゴモーション、ピクセルワイドオブジェクトモーションに分解する。このような異種データから幾何学と運動を共同で学習することで、SpatialTrackerV2は既存の3Dトラッキング方法よりも30%優れています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:07:12 GMT)
Skill Learning via Policy Diversity Yields Identifiable Representations for Reinforcement Learning [67.9]
自己指導型特徴学習(RL)は、相互情報スキル学習(MISL)と呼ばれる情報理論の原則に依存することが多い。本研究は,MISLを識別可能な表現学習のレンズを用いて検討する。コントラスト継承機能(Contrastive Successor Features, CSF)は, 線形変換まで環境の地下構造を確実に復元できることを実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:48:46 GMT)
AutoPartGen: Autogressive 3D Part Generation and Discovery [66.1]
本稿では,3次元部品からなるオブジェクトを自己回帰的に生成するモデルであるAutoPartGenを紹介する。このモデルは、オブジェクトの画像、オブジェクトの2Dマスク、または既存の3Dオブジェクトを入力として、対応する合成3D再構成を生成することができる。我々はAutoPartGenの全体的な3D生成能力と部分レベル生成品質を評価し、3Dパーツ生成における最先端性能を実現することを実証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 22:47:47 GMT)
ReDiSC: A Reparameterized Masked Diffusion Model for Scalable Node Classification with Structured Predictions [64.2]
本稿では,構造化ノード分類のための構造拡散モデルであるReDiSCを提案する。本稿では,ReDiSCが最先端のGNN,ラベル伝搬,拡散ベースラインと比較して,優れた,あるいは高い競争力を発揮することを示す。特にReDiSCは、従来の構造化拡散法が計算制約によって失敗する大規模データセットに効果的にスケールする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:46:53 GMT)
Iceberg: Enhancing HLS Modeling with Synthetic Data [61.5]
Icebergは、LLM(Big Language Model)生成プログラムと、目に見えない設計構成の弱いラベルの両方を拡張する合成データ拡張アプローチである。我々の弱いラベル生成方法はコンテキスト内モデルアーキテクチャと統合され、実際のラベルや近親ラベルからのメタラーニングを可能にする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:32:24 GMT)
EgoM2P: Egocentric Multimodal Multitask Pretraining [55.3]
大規模なエゴセントリックなマルチモーダルモデルとマルチタスクモデルの構築は、ユニークな課題を示している。 EgoM2Pは、時間的に認識されたマルチモーダルトークンから学習し、エゴセントリックな4D理解のための大規模な汎用モデルをトレーニングするマスク付きモデリングフレームワークである。私たちはEgoM2Pを完全にオープンソース化し、コミュニティを支援し、エゴセントリックなビジョン研究を前進させます。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:33:13 GMT)
Multispectral State-Space Feature Fusion: Bridging Shared and Cross-Parametric Interactions for Object Detection [52.9]
MS2Fusionと呼ばれる新しいマルチスペクトル状態空間特徴融合フレームワークが提案されている。 MS2フュージョンはデュアルパスパラメトリック相互作用機構を通じて効率的かつ効果的な融合を実現する。我々のMS2Fusionは、主要なベンチマーク実験において、他の最先端のマルチスペクトルオブジェクト検出方法よりも大幅に優れています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:38:03 GMT)
Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaptation [52.8]
本稿では,制御生成画像圧縮フレームワークである制御-GICを提案する。制御-GICは、高忠実度と一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。実験により,制御-GICは高い柔軟かつ制御可能な適応を可能にし,その結果が最近の最先端手法よりも優れた性能を示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:25:30 GMT)
OSCAR: One-Step Diffusion Codec Across Multiple Bit-rates [52.7]
事前訓練された潜伏拡散モデルでは、画像圧縮が失われる可能性が強い。既存の手法のほとんどは、ランダムノイズから反復的にデノイングすることで、イメージを再構成する。我々はOSCARと呼ばれる複数のビットレートにまたがる1ステップ拡散を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:07:00 GMT)
BriLLM: Brain-inspired Large Language Model [51.8]
BriLLMは非トランスフォーマー、非GPT、非伝統的な機械学習入出力制御型生成言語モデルである。 4000トークン,32次元ノード幅,16token長列予測機能,GPT-1に匹敵する言語モデル予測性能を備えた,中国語の最初の BriLLM バージョンをリリースする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:11:05 GMT)
Inverse Scaling in Test-Time Compute [51.2]
LRM(Large Reasoning Models)の推論長の延長は性能を低下させる。モデルが長い理由付けをする場合には、5つの異なる障害モードを特定します。これらの結果は、テストタイムの計算スケーリングはモデル機能の改善に引き続き期待できるが、問題のある推論パターンを必然的に補強する可能性があることを示唆している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:06:13 GMT)
Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.1]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:22:36 GMT)
Scalable modular architecture for universal quantum computation [49.2]
一つの絡み合う2量子ゲートで制御可能な進化演算子である2つの量子ビットアレイを接続することは十分であることを示す。我々の証明は、より小さなビルディングブロックからローカル制御と結合数を減らしたモジュラQPUを構築するためのテンプレートを提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:45:47 GMT)
Texture or Semantics? Vision-Language Models Get Lost in Font Recognition [48.9]
FRB(Font Recognition Benchmark)は15のフォントからなるコンパクトで構造化されたデータセットである。 FRBには2つのバージョンがある: (i) 簡単なバージョン、10つの文を異なるフォントで描画するバージョン、 (ii) ハードバージョン。フォント認識タスクにおける様々なVLMの広範な評価を通じて,以下の重要な知見を得た。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:51:42 GMT)
VisualToolAgent (VisTA): A Reinforcement Learning Framework for Visual Tool Selection [47.3]
VisTAは新しい強化学習フレームワークで、視覚エージェントが経験的パフォーマンスに基づいた多様なライブラリのツールを動的に探索し、選択し、組み合わせることを可能にする。トレーニング不要のベースラインよりも,VisTAが大幅なパフォーマンス向上を実現していることを示す。これらの結果は、VisTAが一般化を強化し、多様なツールを適応的に活用し、柔軟な経験駆動型視覚推論システムを実現する能力を強調している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:24:59 GMT)
A Vision for Auto Research with LLM Agents [47.0]
本稿では,科学研究の全ライフサイクルの自動化,コーディネート,最適化を目的とした構造化マルチエージェントフレームワークであるエージェントベースオートリサーチを紹介する。このシステムは、文献レビュー、アイデア、方法論、実験、論文執筆、査読応答、普及など、すべての主要な研究段階にまたがる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:30:25 GMT)
X-Intelligence 3.0: Training and Evaluating Reasoning LLM for Semiconductor Display [46.4]
我々は半導体ディスプレイ産業向けに開発された最初の高性能推論モデルであるX-Intelligence 3.0を提案する。このモデルは、業界の複雑な課題に対する専門家レベルの理解と推論を提供するように設計されています。比較的コンパクトな32億のパラメータにもかかわらず、X-Intelligence 3.0は複数の評価でSOTA DeepSeek-R1-671Bを上回っている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:20:39 GMT)
Statistical and Algorithmic Foundations of Reinforcement Learning [45.7]
近年,シーケンシャルラーニング (RL) が注目されている。我々は、RLにおけるいくつかの重要な発展を紹介することを目指しており、新しいアイデアと古典的なトピックの関連を強調している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:42:41 GMT)
AlphaDPO: Adaptive Reward Margin for Direct Preference Optimization [45.5]
$alpha$-DPOは、大規模言語モデルの適応的優先最適化アルゴリズムである。ポリシーモデルと参照モデルのバランスを取り、パーソナライズされた報酬マージンを達成する。さまざまなモデル設定でDPOとSimPOを一貫して上回ります。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:40:37 GMT)
CANDoSA: A Hardware Performance Counter-Based Intrusion Detection System for DoS Attacks on Automotive CAN bus [45.2]
本稿では,制御領域ネットワーク(CAN)環境向けに設計された新しい侵入検知システム(IDS)を提案する。 RISC-VベースのCAN受信機はgem5シミュレータを用いてシミュレートされ、AES-128暗号化によるCANフレームペイロードをFreeRTOSタスクとして処理する。結果は、このアプローチがCANセキュリティを大幅に改善し、自動車サイバーセキュリティにおける新たな課題に対処する可能性があることを示唆している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:09:52 GMT)
Collusion-Resilient Hierarchical Secure Aggregation with Heterogeneous Security Constraints [42.8]
FL(Federated Learning)によって動機づけられたセキュアアグリゲーションは、多くのユーザに対して分散された入力の集合の合計を、可能な限り効率的に安全に計算することを目的としている。 We study weakly-secure HSA (WS-HSA) with collusion resistance。サーバとリレーの両方のセキュリティを確保するのに必要な独立鍵記号の総数を特徴付ける。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 23:09:57 GMT)
Language Models for Controllable DNA Sequence Design [41.7]
制御可能生成のための自動変圧器発電機ATGC-Genを紹介する。 ATGC-Genはデコーダのみとエンコーダのみのトランスフォーマーアーキテクチャでインスタンス化されている。我々の実験はATGC-Genが、流動的で多様性があり、生物学的に関係のある配列を生成できることを実証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:23:17 GMT)
Unitary designs in nearly optimal depth [40.3]
回路深さ$O(log k log log n k / varepsilon)$。深さは既知のすべての結果に対して指数関数的に改善され、すべてのパラメータは$n$, $k$, $varepsilon$である。また,多数のクエリをランダムなユニタリーに格納する量子実験において,エラーをバウンディングするための新しい分析フレームワークを開発した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:11:58 GMT)
Suggest, Complement, Inspire: Story of Two Tower Recommendations at Allegro.com [39.6]
本稿では,欧州発祥の最大のeコマースプラットフォームであるAllegro.comに展開する,コンテンツベースの統一レコメンデーションシステムを提案する。同じモデルアーキテクチャが3つの異なるレコメンデーションタスクにどのように適応できるかを示す。この結果から,フレキシブルでスケーラブルなアーキテクチャは,メンテナンスのオーバーヘッドを最小限に抑えつつ,多様なユーザ意図に役立てることができることがわかった。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:03:38 GMT)
LEAD: Exploring Logit Space Evolution for Model Selection [39.3]
本稿では,ロジットのネットワーク出力に基づく微調整型アプローチであるLEADを提案する。 10のダウンストリームデータセットにわたる24の教師付きおよび自己教師付き事前トレーニングモデルに関する包括的な実験は、素晴らしいパフォーマンスを示している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:45:17 GMT)
Growing a Twig to Accelerate Large Vision-Language Models [37.0]
大規模視覚言語モデル(VLM)は、オープンワールドのマルチモーダル理解において顕著な能力を示した。本稿では,基本VLMの初期層上に軽量な小枝を成長させることにより,シンプルで汎用的なアーキテクチャであるTwigVLMを紹介する。 TwigVLMは、88.9%の視覚トークンをプルーニングした後、元のパフォーマンスの96%を保ち、ロングレスポンスの生成において154%の高速化を実現している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:38:51 GMT)
KVLink: Accelerating Large Language Models via Efficient KV Cache Reuse [36.0]
KVLinkは、大規模言語モデル(LLM)における効率的なキー値(KV)キャッシュ再利用のためのアプローチである。 KVLinkは、連結後のグローバルな位置と一致するように、推論時にKVキャッシュの位置埋め込みを調整することと、自己注意を回復するためにトレーニング可能な特別なトークンを使用することである。 7つのデータセットにわたる実験によると、KVLinkは最先端の手法よりも平均4%の精度で質問応答を改善する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:41:03 GMT)
Towards the Next Frontier in Speech Representation Learning Using Disentanglement [34.2]
本稿では,フレームレベルと発話レベルのエンコーダモジュールから構成される音声の拡散自己監督学習(Learning2Diss)のためのフレームワークを提案する。提案したLearn2Dissは,フレームレベルのエンコーダ表現が意味的タスクを改善する一方で,発話レベルの表現が非意味的なタスクを改善することにより,様々なタスクにおける最先端の結果が得られることを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:26:06 GMT)
ArtiMuse: Fine-Grained Image Aesthetics Assessment with Joint Scoring and Expert-Level Understanding [32.6]
ArtiMuseはMLLMベースの革新的なIAAモデルで、Joint ScoringとExpert-Level Understanding機能を備えている。 ArtiMuse-10Kは、5つの主要なカテゴリと15のサブカテゴリにまたがる10,000のイメージからなる、最初の専門家による画像美的データセットである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:27:21 GMT)
AlgoTune: Can Language Models Speed Up General-Purpose Numerical Programs? [32.0]
オープンなベンチマークでアルゴリズムを設計・実装するテストモデルを提案する。 AlgoTuneベンチマークは155のコーディングタスクで構成されている。 AlgoTunerは参照ソルバに対して平均1.72倍のスピードアップを達成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:23:25 GMT)
Score-based Causal Representation Learning: Linear and General Transformations [31.8]
本稿は、識別可能性と達成可能性の両方に対処する。スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。結果は、構造化された合成データと画像データに関する実験によって検証される。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 22:38:11 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [31.8]
CD-NGPは、メモリオーバーヘッドを減らし、スケーラビリティを向上させる継続的学習フレームワークである。トレーニングメモリ使用量は14GBに大幅に削減され、DyNeRFのストリーミング帯域幅はわずか0.4MBである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:24:53 GMT)
CASPER: Contrastive Approach for Smart Ponzi Scheme Detecter with More Negative Samples [28.6]
我々は、ブロックチェーントランザクションにおけるスマートPonziスキーム検出を強化するために、対照的な学習フレームワークであるCASPERを提案する。我々は、XBlockデータセット上でCASPERを評価し、100%ラベル付きデータでトレーニングすると、ベースラインをF1スコアで2.3%上回ります。その結果、CASPERによるスマートポンジスキームの効率的かつ費用効率の高い検出の可能性を強調した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:26:02 GMT)
WSI-Agents: A Collaborative Multi-Agent System for Multi-Modal Whole Slide Image Analysis [28.5]
全スライド画像(WSI)は、デジタル病理学において不可欠であり、様々な病理学課題におけるギガピクセルの組織解析を可能にする。マルチモーダルWSI分析のための新しい協調型マルチエージェントシステムであるWSI-Agentsを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:11:03 GMT)
Adaptive 3D Gaussian Splatting Video Streaming [28.3]
本稿では,3DGSボリュームビデオストリーミングのための革新的なフレームワークを提案する。ハイブリット・サリエンシ・タイリングと差別化品質・モデリングを用いて、効率的なデータ圧縮と帯域幅変動への適応を実現する。提案手法は,映像品質,圧縮効率,伝送速度など,様々な面で既存手法よりも優れていた。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:45:24 GMT)
Descrip3D: Enhancing Large Language Model-based 3D Scene Understanding with Object-Level Text Descriptions [28.2]
Descrip3Dは自然言語を使ってオブジェクト間の関係を明示的にエンコードする新しいフレームワークである。グラウンド、キャプション、質問応答など、さまざまなタスクを統一した推論を可能にする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:19:16 GMT)
Learning Granularity-Aware Affordances from Human-Object Interaction for Tool-Based Functional Dexterous Grasping [27.1]
オブジェクトの付加的な特徴は、エージェントとオブジェクト間の機能的な相互作用のブリッジとして機能する。機能的空き地を特定するための粒度対応型空き地特徴抽出法を提案する。握り動作の予測には手動物体間相互作用領域で高活性な粗粒度機能を用いる。 GAAF-Dexは、人間と物体の相互作用からグラニュラリティ・アウェア・アフォーダンスを学習する完全なフレームワークである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:17:38 GMT)
Sortformer: A Novel Approach for Permutation-Resolved Speaker Supervision in Speech-to-Text Systems [27.1]
Sortformer はエンコーダに基づく話者ダイアリゼーションモデルであり、音声-テキストモデルにおける話者タグ付けを監督する。本稿では,Soltformer を利用したマルチ話者音声合成アーキテクチャを提案する。コードとトレーニングされたモデルはNVIDIA NeMo Frameworkを通じて公開されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:18:34 GMT)
TIME: A Multi-level Benchmark for Temporal Reasoning of LLMs in Real-World Scenarios [26.7]
実世界のシナリオにおける時間的推論のためのベンチマークTIMEを提案する。 TIMEは38,522のQAペアで構成され、11のきめ細かいサブタスクを持つ3レベルをカバーする。推論モデルと非推論モデルについて広範な実験を行う。 TIME-Liteは人手による注釈付きサブセットで、将来の研究を奨励し、時間的推論における標準化された評価を行う。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:52:39 GMT)
Explainable Graph Neural Networks via Structural Externalities [26.6]
GraphEXTはグラフニューラルネットワーク(GNN)のための説明可能性フレームワークグラフノードを連立に分割し、元のグラフを独立したサブグラフに分解する。ノード間の相互作用とGNN予測に対する構造変化の影響に重点を置いている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:36:47 GMT)
Label-semantics Aware Generative Approach for Domain-Agnostic Multilabel Classification [25.4]
マルチラベルテキスト分類のための堅牢で効率的なドメインに依存しない生成モデルフレームワークを提案する。提案手法は,事前に定義されたラベル記述を利用し,入力テキストに基づいてこれらの記述を生成するように訓練する。提案モデルの有効性を,評価されたすべてのデータセットにまたがって,新たな最先端性能を実現することによって実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:38:19 GMT)
Estimating Quantum Execution Requirements for Feature Selection in Recommender Systems Using Extreme Value Theory [24.8]
量子解のユーザビリティを定量的に評価するために,エクストリーム値理論に基づく解を提案する。提案手法は,広く使用されている2つのベンチマークデータセットにおいて,要求される実行回数を効果的に推定する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:02:06 GMT)
Towards AI Urban Planner in the Age of GenAI, LLMs, and Agentic AI [24.8]
都市計画とは別に、生成AI、大規模言語モデル、エージェントAIが出現している。本稿では、空間的、社会的、人間中心の制約の下で、AIが土地利用構成を合成する生成的AIタスクとして都市計画を概念化する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:40:42 GMT)
EvoRL: A GPU-accelerated Framework for Evolutionary Reinforcement Learning [24.4]
我々はGPUアクセラレーションに最適化された最初のエンドツーエンドEvoRLフレームワークである$texttt$textbfEvoRL$$を紹介した。このフレームワークは、環境シミュレーションやECプロセスを含む、アクセラレーター上のトレーニングパイプライン全体を実行する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:35:01 GMT)
Strategyproofness and Monotone Allocation of Auction in Social Networks [24.2]
ネットワークオークションにおける戦略的安全性は、バリュエーションを真実に報告するだけでなく、近所の人をソーシャルネットワークから招待するために最善を尽くす入札者を必要とする。このような原則が欠如しているため、単ユニット需要を持つマルチユニットネットワークオークションへの拡張でさえ、予期せぬ困難を呈している。 Invitation-Depressed Monotonicity (ID-MON) と Invitation-Promoted Monotonicity (IP-MON) の2つの分類を同定する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:05:35 GMT)
VisGuard: Securing Visualization Dissemination through Tamper-Resistant Data Retrieval [23.0]
VisGuardは、メタデータリンクを可視化画像に確実に埋め込む、タンパー耐性のVIDRフレームワークである。 VisGuardのデータ検索精度、埋め込み能力、改ざんやステガナリシスに対するセキュリティにおける優れた性能に関する総合的な実験を行う。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:09:30 GMT)
LPS-GNN : Deploying Graph Neural Networks on Graphs with 100-Billion Edges [22.7]
本稿では,LPS-GNNと呼ばれる拡張性,低コスト,フレキシブル,効率的なGNNフレームワークを提案する。 10時間で1つのGPUで1000億グラフの表現学習を実行し、ユーザ獲得シナリオを13.8%改善した。 LPS-GNNは、パブリックおよび現実世界のデータセットでテストされており、オンラインアプリケーションにおけるSOTAモデルよりも8.24%から13.89%のパフォーマンス向上を達成した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 10:44:26 GMT)
"Before, I Asked My Mom, Now I Ask ChatGPT": Visual Privacy Management with Generative AI for Blind and Low-Vision People [22.4]
本研究は,視力・視力の低い個人に対する現在の実践と今後の設計の嗜好について,インタビュースタディを通じて検討する。我々の発見は、プライバシ、効率、感情的なエージェンシーのバランスをとるGenAIの現在の実践の幅を明らかにします。我々は、GenAIを通じてユーザ中心の視覚的プライバシをサポートするための実用的なデザインレコメンデーションで締めくくります。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:31:05 GMT)
Revisiting Graph Contrastive Learning on Anomaly Detection: A Structural Imbalance Perspective [22.3]
本稿では,AD-GCLという新しいGCLベースのフレームワークを提案する。隣接するプルーニング戦略を考案し、ヘッドノードのノイズの多いエッジをフィルタリングし、真のテールノードの検出を容易にする。複数のデータセット上の全ノード,頭ノード,尾ノードのパフォーマンス評価は,提案したAD-GCLの総合的な優位性を検証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:05:27 GMT)
A first look at License Variants in the PyPI Ecosystem [22.0]
我々は,PyPIエコシステムにおけるライセンス変種に関する実証的研究を行った。差分に基づく手法と大規模言語モデルを活用した,効率的なライセンス変種解析のための新しいアプローチであるLV-を導入する。 LV-は計算コストを30%削減しながら0.936の精度を達成し、LV-Compatは0.98の既存の方法よりも5.2倍互換性のないパッケージを識別する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:41:33 GMT)
Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts [21.4]
Affordanceは、エージェントが認識し、その環境から利用する機能的特性を指す。既存のマルチモーダル・アベイランス手法は有用な情報抽出の限界に直面している。本稿では,BiT-Align画像深度テキストアプライアンスマッピングフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:21:11 GMT)
XplainAct: Visualization for Personalized Intervention Insights [21.2]
我々は、サブポピュレーション内の個々のレベルでの介入のシミュレーション、説明、推論をサポートする視覚分析フレームワークであるXplainActを紹介する。我々はXplainActの有効性を2つのケーススタディで示す: 疫学におけるオピオイド関連死の調査と大統領選挙における投票傾向の分析である。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 22:57:09 GMT)
SWI: Speaking with Intent in Large Language Models [21.0]
本稿では,大規模言語モデル(LLM)におけるSWI(Singing with Intent)の概念を紹介する。人間の心における意図的・目的的な思考をエミュレートすることにより、SWIはLLMの推論能力と生成品質を高めることを仮定する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:53:06 GMT)
Rejection or Inclusion in the Emotion-Identity Dynamics of TikTok Refugees on RedNote [20.9]
本研究では、中国人利用者と自己識別された「ティクトック難民」との異文化交流について検討する。 1,862の投稿と403,054のコメントのデータセットに基づいて、大きな言語モデルベースの感情分類とBERTベースのトピックモデリングを使用する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:38:33 GMT)
TruthLens: Explainable DeepFake Detection for Face Manipulated and Fully Synthetic Data [20.6]
本稿では,DeepFake検出のための新しいフレームワークであるTruthLensを提案する。 TruthLensは、顔操作のDeepFakesと完全なAI生成コンテンツの両方を扱う。予測のための詳細なテキスト推論を提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:46:35 GMT)
Brain Foundation Models: A Survey on Advancements in Neural Signal Processing and Brain Discovery [20.6]
脳基礎モデル(BFM)は、計算神経科学における変革的パラダイムとして登場した。 BFMは大規模な事前学習技術を活用し、複数のシナリオ、タスク、モダリティを効果的に一般化することができる。本稿では,BFMを初めて定義し,これらのモデルを様々なアプリケーションで構築・活用するための明確かつ簡潔なフレームワークを提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:40:27 GMT)
InterAct-Video: Reasoning-Rich Video QA for Urban Traffic [20.5]
ディープラーニングは、質問応答(VideoQA)モデルを通じて、高度なビデオベースのトラフィック監視を実現する。既存のVideoQAモデルは、現実世界の交通シーンの複雑さに悩まされている。 InterAct VideoQAは、トラフィック監視タスクのためのVideoQAモデルをベンチマークし、拡張するために設計された、キュレートされたデータセットである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:30:43 GMT)
A Structure-Guided Gauss-Newton Method for Shallow ReLU Neural Network [18.1]
浅いReLUニューラルネットワークを用いて最小二乗問題を解くための構造誘導型ガウスニュートン法(SgGN)を提案する。目的関数の最小二乗構造とニューラルネットワーク構造の両方を効果的に活用する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:33:40 GMT)
EgoEvGesture: Gesture Recognition Based on Egocentric Event Camera [17.6]
本稿では,イベントデータ処理に特化して設計された新しいネットワークアーキテクチャを提案する。イベントカメラを用いたエゴセントリックなジェスチャー認識のための,最初の大規模データセットを構築した。本手法は,7Mパラメータのみの未確認被験者に対して62.7%の精度を達成し,最先端手法よりも3.1%高い精度を示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:02:46 GMT)
A Transformer-Based Conditional GAN with Multiple Instance Learning for UAV Signal Detection and Classification [17.6]
本稿では,トランスフォーマーをベースとしたGAN(Generative Adversarial Network)とMILET(Multiple Examplely Explainable Learning)を統合した新しいフレームワークを提案する。実験の結果,DroneDetectデータセットでは96.5%,DroneRFデータセットでは98.6%の精度が得られた。このフレームワークはまた、様々なUAVプラットフォームと飛行状態にまたがる強力な計算効率と堅牢な一般化を示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:35:45 GMT)
Conan: A Chunkwise Online Network for Zero-Shot Adaptive Voice Conversion [17.0]
Conanは、オンラインのゼロショット音声変換モデルだ。音声の音色と参照音声のスタイルを一致させながら、ソースの内容を保存する。コナンは主観的および客観的な指標でベースラインモデルより優れている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:32:07 GMT)
$k$-PCA for (non-squared) Euclidean Distances: Polynomial Time Approximation [16.9]
整数 $kgeq1$ と集合 $P$ of $n$ points in $REALd$ が与えられたとき、古典近似 $k$-PCA は Affinemph$fty distance を近似する。実世界のデータセットに関するオープンコードと実験結果も提供されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:00:50 GMT)
Error-resilient Reversal of Quantum Chaotic Dynamics Enabled by Scramblons [16.7]
量子多体系における時間の矢印は、量子情報をスクランブルし絡みを増大させるハミルトン進化に由来する。量子情報スクランブルとカオス力学の構造について検討する。我々の結果は、複雑な量子系の動的反転の基本的な限界を押し上げます。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:30:08 GMT)
Self-supervised Learning of Hybrid Part-aware 3D Representations of 2D Gaussians and Superquadrics [16.4]
PartGSは、オブジェクトやシーンを解釈可能な分解に解析するために、2Dガウスとスーパークワッドリックを統合する、自己管理された部分認識再構築フレームワークである。提案手法は,DTU,ShapeNet,および実世界のデータセットに関する広範な実験において,最先端の手法と比較して優れた性能を示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:32:02 GMT)
Which Experiences Are Influential for RL Agents? Efficiently Estimating The Influence of Experiences [15.8]
経験的なリプレイを伴う強化学習(RL)では、リプレイバッファに格納された経験がRLエージェントのパフォーマンスに影響を与える。経験の影響を推定する1つの方法は、LOO法である。ターンオーバー・ドロップアウト(PIToD)によるポリシー・イテレーションを行い,経験の影響を効率的に推定する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:31:00 GMT)
CVPT: Cross Visual Prompt Tuning [15.6]
Cross Visual Prompt Tuning (CVPT) は、プロンプトと画像トークン間のインタラクションをモデル化するクロスアテンションモジュールである。 CVPTは平均精度を4%以上向上し、性能と効率の両面で主要なアダプタベースの手法に匹敵する。我々の研究は、視覚的な微調整において、プロンプトベースの手法が例外的な結果が得られることを確認している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:15:13 GMT)
GHZ-W Genuinely Entangled Subspace Verification with Adaptive Local Measurements [15.6]
我々は3ビットGHZ-W GESのための2つの適応型検証戦略、XZ戦略と回転戦略を開発する。 2次元の2量子部分空間を3つの異なる型に分類する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:51:34 GMT)
VMask: Tunable Label Privacy Protection for Vertical Federated Learning via Layer Masking [14.8]
モデル完了(MC)攻撃は、現在最も強力な攻撃である。新たなラベルプライバシ保護フレームワークであるVMaskを提案する。 VMaskは最高のプライバシユーティリティトレードオフを実現し、MC攻撃を回避した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:51:09 GMT)
Better Training Data Attribution via Better Inverse Hessian-Vector Products [14.7]
トレーニングデータ属性(TDA)は、学習したモデルの振る舞いにどのトレーニングデータが責任を持つのかに関する洞察を提供する。ニューマン級数反復のEKFACプレコンディショナーを用いて,TDAの正確なiHVP近似に到達するアルゴリズムを提案する。 ASTRAはチューニングが容易で、ノイマン級数よりもイテレーションを少なくし、EKFACベースの近似よりも正確である。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:18:51 GMT)
Vulnerability-Aware Spatio-Temporal Learning for Generalizable Deepfake Video Detection [14.6]
本稿では,FakeSTormerと呼ばれる微細なディープフェイク映像検出手法を提案する。具体的には、2つの補助分岐を組み込んだマルチタスク学習フレームワークを導入する。また、微妙な時間的アーティファクトを持つ擬似フェイクビデオを生成するビデオレベルの合成戦略を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:15:28 GMT)
Distributed Quantum Inner Product Estimation with Low-Depth Circuits [14.5]
本研究は、低深度量子回路を用いたDIPEを探索する。まず、任意のユニタリな2ドルの設計アンサンブルを持つDIPEは、平均的なサンプルの複雑さを$Theta(sqrt2n)$とする。次に、平均的なサンプル複雑度が$O(sqrt2.18n)$および$O(sqrt2.5n)$であることを示す、ユニタリな2ドルの設計の下のアンサンブルを分析する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:36:23 GMT)
Harnessing LLMs for Document-Guided Fuzzing of OpenCV Library [14.3]
VISTAFUZZは、OpenCVライブラリのドキュメント誘導ファジングに大規模な言語モデルを利用する新しい技術である。 VISTAFUZは個々の入力パラメータとそれらの間の依存関係の制約を抽出する。 VISTAFUZZがOpenCVライブラリで330のAPIを試験する際の有効性を評価し、その結果、VISTAFUZは17の新たなバグを検出し、10のバグが確認され、そのうち5つのバグが修正された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:44:01 GMT)
Diffusion Models for Time Series Forecasting: A Survey [14.3]
拡散モデルは、当初は画像合成のために開発されたが、顕著な生成能力を示している。近年, 時系列予測 (TSF) に応用が拡大され, 有望な結果が得られた。本調査はTSFにおける拡散モデルの最近の進展と今後の展望を詳述し、この分野の研究者の参考となる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:04:04 GMT)
From Semantics, Scene to Instance-awareness: Distilling Foundation Model for Open-vocabulary Situation Recognition [14.2]
マルチモーダル大言語モデル(MLLM)は、強いゼロショット能力を示すが、複雑な接地状況認識(GSR)と競合する。我々は,教師MLLMから小さなGSRモデルへの知識の伝達を利用して,その一般化とゼロショット能力を向上させる。基礎モデルから豊富なマルチモーダル知識を蒸留する新しいフレームワークであるMIPD(Multimodal Interactive Prompt Distillation)を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:29:02 GMT)
3DGAA: Realistic and Robust 3D Gaussian-based Adversarial Attack for Autonomous Driving [14.1]
本稿では,新しい対向オブジェクト生成フレームワークである3D Gaussian-based Adrial Attack (3DGAA)を提案する。パッチやテクスチャ最適化に依存する以前の作品とは異なり、3DGAAは幾何学的属性と外見的属性の両方を共同で摂動する。 3DGAAは検出mAPを87.21%から7.38%に減らし、既存の3D物理攻撃を著しく上回っている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:48:13 GMT)
Task-Agnostic Continual Prompt Tuning with Gradient-Based Selection and Decoding [13.8]
本稿では,タスク非依存推論の2つの重要な制約に対処する統合フレームワークGRIDを紹介する。 GRIDは、後方転送を改善するタスク認識復号機構を統合している。また、より少ない情報的プロンプトを1つの集約表現に圧縮する勾配に基づくプロンプト選択戦略を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:15:03 GMT)
DCHM: Depth-Consistent Human Modeling for Multiview Detection [13.8]
多視点歩行者検出は通常、人間のモデリングと歩行者のローカライゼーションという2つの段階を含む。本稿では,一貫した深度推定と多視点融合を目的としたフレームワークDCHMを提案する。提案する超画素ワイドガウススプラッティングパイプラインは,スパースビュー,大規模,混み合ったシナリオにおいて,多視点奥行きの整合性を実現する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:37:14 GMT)
MEMERAG: A Multilingual End-to-End Meta-Evaluation Benchmark for Retrieval Augmented Generation [13.4]
マルチリンガル・エンド・エンド・エンド・メタ評価RAGベンチマーク(MEMERAG)を開発した。我々のベンチマークは,MIRACLデータセット上に構築されており,母国語質問を用いて多種多様な大言語モデル(LLM)による応答を生成する。提案するベンチマークでは,高度なプロンプト技術とLCMによる改善を確実に識別できることが示されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:01:23 GMT)
Fine-Tuning Diffusion Generative Models via Rich Preference Optimization [13.4]
我々は、リッチなフィードバック信号を活用する新しいパイプラインであるRich Preference Optimization (RPO)を導入し、微調整されたテキスト-画像拡散モデルに対する好みペアのキュレーションを改善する。我々は,我々のパイプラインと結果のデータセットの有効性を,微調整された最先端拡散モデルで実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 23:30:44 GMT)
Towards Cross-modal Retrieval in Chinese Cultural Heritage Documents: Dataset and Solution [13.3]
クロスモーダル検索は中国文化遺産の理解と解釈において重要な役割を担っている。中国文化遺産に関する特別なデータセットが不足している。そこで我々は,中国語-CLIPを微調整した学習自由な局所アライメント戦略であるLACLIPを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:40:24 GMT)
BusterX++: Towards Unified Cross-Modal AI-Generated Content Detection and Explanation with MLLM [12.3]
合成メディアのクロスモーダル検出と説明のための新しいフレームワークである textbfBusterX++ を紹介する。本手法は,冷間開始を排除した高度強化学習(RL)ポストトレーニング戦略を取り入れたものである。 textbfGenBuster++は、最先端の画像とビデオ生成技術を利用したクロスモーダルなベンチマークである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:05:33 GMT)
Generalized Linear Bandits with Limited Adaptivity [12.1]
限定適応性の制約内における一般化線形文脈帯域問題について検討する。我々は2つのアルゴリズム, $textttB-GLinCB$ と $textttRS-GLinCB$ を提示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:42:01 GMT)
QLPro: Automated Code Vulnerability Discovery via LLM and Static Code Analysis Integration [12.0]
LLMと静的解析ツールを体系的に統合する脆弱性検出フレームワークであるQLProを紹介する。 62の脆弱性が確認されたGitHubから10のオープンソースプロジェクトからなる,新たなデータセットであるJavaTestを構築しました。最先端の静的分析ツールであるCodeQLは、これらの脆弱性を24つしか検出していないが、QLProは41。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:22:39 GMT)
VTarbel: Targeted Label Attack with Minimal Knowledge on Detector-enhanced Vertical Federated Learning [11.9]
VTarbelは、検出器強化VFL推論を回避するために設計された2段階の最小知識攻撃フレームワークである。 VTarbelを実装し、4つのモデルアーキテクチャ、7つのマルチモーダルデータセット、2つの異常検出器に対して評価を行う。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:43:50 GMT)
Towards Efficient Privacy-Preserving Machine Learning: A Systematic Review from Protocol, Model, and System Perspectives [11.9]
暗号化プロトコルに基づくプライバシ保護機械学習(PPML)は、クラウドベースの機械学習サービスにおいて、ユーザのデータプライバシを保護するための有望なパラダイムとして登場した。 PPMLは、大きなオーバヘッドのオーバヘッドのために、しばしば大幅な効率とスケーラビリティのコストを発生させる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:45:39 GMT)
Mangosteen: An Open Thai Corpus for Language Model Pretraining [11.7]
既存の大規模コーパスは英語や言語に依存しないパイプラインに依存している。 Mangosteen: タイのDolmaパイプラインを通じて構築された47億のタイ語対応コーパスを紹介します。パイプライントリムを202万から2500万のドキュメントにまとめた上で,SEA-HELM NLGを3から11に引き上げた。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:28:58 GMT)
Alleviating Textual Reliance in Medical Language-guided Segmentation via Prototype-driven Semantic Approximation [11.5]
ProLearnは、言語誘導セグメンテーションのためのプロトタイプ駆動学習フレームワークである。テキスト入力からのセマンティックガイダンスの近似を可能にする新しいプロトタイプ駆動セマンティック近似(PSA)モジュールを提案する。 ProLearnは、制限されたテキストが利用できる場合、最先端の言語誘導メソッドより優れている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:01:24 GMT)
GRACE: Generative Recommendation via Journey-Aware Sparse Attention on Chain-of-Thought Tokenization [11.4]
GRACE (Generative Recommendation via journey-aware sparse Attention on Chain-of-thinkt tokEnization) は、シーケンシャルレコメンデーションのための新しい生成フレームワークである。セマンティックトークン化に関する製品ナレッジグラフからの明示的な属性とユーザとイテムのインタラクションをエンコードする。 2つの実世界のデータセットの実験により、GRACEは最先端のベースラインを大幅に上回っていることが示された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:23:23 GMT)
Understanding Matching Mechanisms in Cross-Encoders [11.2]
クロスエンコーダは、内部メカニズムがほとんど不明な非常に効果的なモデルである。ほとんどの作業は、ハイレベルなプロセスに重点を置いている。より簡単な方法が、すでに価値ある洞察を提供できることを実証します。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:05:27 GMT)
On the Effect of Token Merging on Pre-trained Models for Code [11.0]
本研究では,同じ意味単位に属するサブトークンの隠蔽表現をマージする効果について検討する。 1つは表現を平均化することに基づく戦略であり、もう1つは学習に基づくアプローチを活用する戦略である。これらの戦略は浮動小数点演算数を1%$から19%$に削減できることを示している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:48:20 GMT)
Routine: A Structural Planning Framework for LLM Agent System in Enterprise [11.0]
エンタープライズ環境におけるエージェントシステムの展開は、しばしばいくつかの課題によって妨げられる。一般的なモデルは、ドメイン固有のプロセス知識が欠如し、非組織的な計画、主要なツールの欠如、実行の安定性が低下します。本稿では、明確な構造、明示的な命令、シームレスなパラメータパッシングを備えたマルチステップエージェント計画フレームワークであるRuleineを紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:46:19 GMT)
Self-Supervised Distillation of Legacy Rule-Based Methods for Enhanced EEG-Based Decision-Making [10.9]
頭蓋内脳波(iEEG)における高周波発振(HFO)はてんかん治療におけるてんかん原性領域の局在に重要なバイオマーカーである。 HFOの従来の規則に基づく検出器は、満足のいく精度に悩まされ、手作業によるレビューを必要とする偽陽性を発生させる。本稿では,レガシ検出器が生成する候補イベントの大規模なセットを,病的HFOの正確なセットに洗練するための自己監督型ラベル発見(SS2LD)フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:01:13 GMT)
CSSL: Contrastive Self-Supervised Learning for Dependency Parsing on Relatively Free Word Ordered and Morphologically Rich Low Resource Languages [10.4]
本稿では,単語順の変動に頑健なモデルを実現するための,対照的な自己教師型学習手法を提案する。提案手法は、7つの比較的自由な単語順序言語における3.03/2.95点の平均的な増加を示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:43:51 GMT)
Efficient Whole Slide Pathology VQA via Token Compression [10.1]
病理学における全スライディング画像(WSI)は1万×1万ピクセルまで到達でき、大言語モデル(MLLM)にとって大きな課題となる。トークン圧縮によりWSI VQAを実行する最初のMLLMアーキテクチャであるToken Compression Pathology LLaVA(TCP-LLaVA)を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:04:25 GMT)
Federated Reinforcement Learning in Heterogeneous Environments [9.9]
本研究では, 局所環境が統計的不均一性を示す, 環境不均一性を伴う連邦強化学習(FRL-EH)フレームワークについて検討する。このフレームワーク内では、エージェントは、ローカルな軌跡のプライバシーを維持しながら、集合的な経験を集約することで、グローバルなポリシーを共同で学習する。異質な局所環境とその可塑性摂動におけるロバストな性能を保証する,新たなグローバルな目的関数を提案する。我々は、期待損失を利用してFedRQを連続的な状態空間を持つ環境に拡張し、状態空間の連続部分集合上の値関数を最小化するという重要な課題に対処する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:06:38 GMT)
QUTCC: Quantile Uncertainty Training and Conformal Calibration for Imaging Inverse Problems [9.9]
ディープラーニングモデルは、しばしば幻覚を与え、サンプルに存在しない現実的なアーティファクトを生成します。これは、MRIや顕微鏡検査のような科学的および医学的な逆問題に恐ろしい結果をもたらす可能性がある。量子不確実性トレーニングと校正技術であるQUTCCを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:44:14 GMT)
Finding A Voice: Exploring the Potential of African American Dialect and Voice Generation for Chatbots [9.9]
本研究は、アフリカ系アメリカ人コミュニティに役立てるために、アフリカ系アメリカ人英語(AAE)を仮想エージェントに統合することに焦点を当てる。我々は,大規模言語モデルと音声合成技術を用いて,テキストベースおよび音声チャットボットを開発した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:57:52 GMT)
On the original Ulam's problem and its quantization [9.8]
一般共鳴の下では、古典的部分線型フェルミ・ウラム加速器はその量子化とは大きく異なる挙動を示す。量子加速器では、エネルギー成長と準エネルギースペクトルの形状との間の直接的および明示的な関係を明らかにする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:00:50 GMT)
Adaptive 3D Gaussian Splatting Video Streaming: Visual Saliency-Aware Tiling and Meta-Learning-Based Bitrate Adaptation [9.8]
3D Splatting Video(3DGS)ストリーミングは、アカデミックと業界の両方で研究ホットスポットとして浮上している。本研究では,空間的特徴と時間的特徴を統合した適応型3DGSタイリング手法を提案する。また、ストリーミング中の3DGS表現における空間領域の劣化と結果の2Dレンダリング画像の品質を共同で評価する3DGSビデオの品質評価フレームワークについても紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:00:36 GMT)
ASMA: An Adaptive Safety Margin Algorithm for Vision-Language Drone Navigation via Scene-Aware Control Barrier Functions [9.6]
VLNを運用するドローンプラットフォームについて検討し、新しいシーン認識CBFを定式化することによって安全性を向上させる。 CBFのないベースラインシステムは、コマンドを順序づけられたランドマークのシーケンスに変換するために、モーダルな注意を持つビジョンランゲージを使用する。 ASMAは移動物体を追跡し、シーン認識CBF評価をオンザフライで実行し、追加の制約として機能する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:48:48 GMT)
On the robustness of modeling grounded word learning through a child's egocentric input [9.6]
本研究では,各子から自動的に書き起こされたデータに基づいて学習したマルチモーダルニューラルネットワークが,複数のネットワークアーキテクチャにまたがる単語参照マッピングを取得し,一般化可能であることを示す。単語学習のためのマルチモーダルニューラルネットワークのロバスト性を検証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:55:37 GMT)
A Language Model-Driven Semi-Supervised Ensemble Framework for Illicit Market Detection Across Deep/Dark Web and Social Platforms [9.5]
本稿では,微調整言語モデルと半教師付きアンサンブル学習戦略を組み合わせた階層型分類フレームワークを提案する。深層WebページやTelegramチャネル,Subreddits,Pastebinペーストから,ドメイン固有のデータを微調整したModernBERTを用いて意味表現を抽出する。文書構造、Bitcoinアドレス、Eメール、IP、メタデータなどの組み込みパターンなど、手動で設計した機能を導入しています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:54:52 GMT)
GPI-Net: Gestalt-Guided Parallel Interaction Network via Orthogonal Geometric Consistency for Robust Point Cloud Registration [9.5]
高品質な対応の識別は、特徴ベースのポイントクラウド登録において必須のタスクである。特徴冗長性と複雑な空間的関係のため,局所的特徴とグローバル的特徴の融合を扱うことは極めて困難である。本稿では,地域情報とグローバル情報との補間通信を容易にする新しいGPI-Netを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:56:29 GMT)
Quantum Circuit Optimization Based on Dynamic Grouping and ZX-Calculus for Reducing 2-Qubit Gate Count [9.4]
量子回路における2キュービットゲートは、単一キュービットゲートよりもノイズの影響を受けやすい。本稿では,動的グルーピングとZX計算に基づく量子回路最適化手法を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:05:32 GMT)
Emerging Trends in Software Architecture from the Practitioners Perspective: A Five Year Review [9.4]
ソフトウェアアーキテクチャは、ソフトウェアシステムの設計、開発、保守において中心的な役割を果たす。この研究は、業界の主要な8つのカンファレンスにおけるソフトウェアアーキテクチャのトレンドを5年間にわたって分析する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:16:04 GMT)
Architectural Degradation: Definition, Motivations, Measurement and Remediation Approaches [9.4]
本研究の目的は, その定義, 原因, メトリクス, ツール, 修復戦略を同定することによって, アーキテクチャ劣化の理解を統一することである。定義,原因,指標,測定方法,ツール,修復戦略を抽出した108件の文献を複数回調査した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:09:38 GMT)
Approximate Revenue Maximization for Diffusion Auctions [9.2]
本研究は, 最適オークション理論のターゲット層を, 経済ネットワークのすべてのエンティティに拡張することを目的とした拡散オークション設計に従う。我々は,最も代表的なネットワークオークションに合わせて,予約価格関数の単純かつ明示的な形式を提供する。この予備価格関数は、ネットワークオークションのインセンティブ互換性を保ち、マーソン最適オークションによって達成された以上の収入を売り手が引き出すことを可能にする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:04:09 GMT)
Rec-AD: An Efficient Computation Framework for FDIA Detection Based on Tensor Train Decomposition and Deep Learning Recommendation Model [9.2]
深層学習モデルは、スマートグリッドにおけるFalse Data Injection Attack(FDIA)検出に広く採用されている。本稿では、列車分解と深層学習勧告モデル(DLRM)を統合する計算効率の良いフレームワークRec-ADを提案する。 PyTorchと完全に互換性があるため、Rec-ADはコード修正なしで既存のFDIA検出システムに統合できる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:38:56 GMT)
DFQ-ViT: Data-Free Quantization for Vision Transformers without Fine-tuning [9.2]
データフリー量子化(DFQ)は、データへのアクセスを必要とせずにビジョントランスフォーマー(ViT)の量子化を可能にし、限られたリソースを持つデバイスにViTをデプロイすることを可能にする。既存の手法では、サンプル内のグローバルな特徴とローカルな特徴を完全にキャプチャしてバランスをとることができず、結果として合成データの品質が制限される。視覚変換用データフリー量子化パイプライン(DFQ-ViT)を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:32:04 GMT)
Measuring CEX-DEX Extracted Value and Searcher Profitability: The Darkest of the MEV Dark Forest [9.2]
我々は、CEX-DEXを同定した7,203,560人の主要なCEX-DEXサーチによって抽出された合計233.8万USDを推定した。 3人の探索者が2つのボリュームと抽出値の4分の3を捕獲し、中央集権化の傾向が明らかになった。これらの洞察は、MEVランドスケープの最も暗い角を照らし、分散化のためのCEX-DEX仲裁の重大な意味を強調している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:27:04 GMT)
Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering Human Perceptual Variability on Facial Expressions [9.2]
本研究は、個人が同じ刺激を視る場合でも、感情分類に有意な差異を示す高知覚的変動現象について検討した。 ANNと人間の知覚の類似性に触発されて、ANN分類器に不明瞭な表情サンプルは、人間の観察者の間で異なる知覚的判断をも引き起こすという仮説を立てた。本研究は,ANN決定境界と人間の知覚的多様性の体系的関連性を確立し,感情的解釈のパーソナライズされたモデリングに関する新たな知見を提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:12:13 GMT)
Balancing Expressivity and Robustness: Constrained Rational Activations for Reinforcement Learning [9.1]
強化学習と継続学習の両方において、訓練可能な合理的なアクティベーションについて検討する。我々の主な成果は、合理的なアクティベーションにおける表現性と可塑性のトレードオフを示すことである。本研究は, 動的非定常環境におけるロバストかつトレーニング可能なアクティベーションに対して, 実用的な設計原理を提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:53:08 GMT)
PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity [9.1]
拡散モデルでは、高品質な条件付きサンプルの生成に顕著な結果が示されている。しかし、既存の方法は、しばしば追加のトレーニングや神経機能評価(NFE)を必要とする。本稿では,スパースアテンションを生かして事前学習モデルを強化する,PLADISと呼ばれる新しい,効率的な手法を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:43:22 GMT)
GTPBD: A Fine-Grained Global Terraced Parcel and Boundary Dataset [9.1]
GTPBDは、ピクセルレベルのバウンダリラベル、マスクラベル、パーセルラベルを含む3レベルラベルを持つ47,537の高解像度画像で構成されている。中国と大陸横断性気候圏の7つの主要地域をカバーしている。 GTPBDは、リモートセンシング研究において重要なギャップを埋め、きめ細かい農業地形解析のための基盤となる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:15:46 GMT)
Spectator Leakage Elimination in CZ Gates via Tunable Coupler Interference on a Superconducting Quantum Processor [8.9]
本稿では,ハミルトニアンシステムの動的再構成に基づく漏洩緩和戦略を提案する。実験により, この動的制御方式は, 広範囲な共振デチューニング範囲で10～4ドル程度の漏出率を抑制することを実証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:20:44 GMT)
Motion Segmentation and Egomotion Estimation from Event-Based Normal Flow [8.9]
本稿では,イベントベース正規流を用いた動きのセグメンテーションとエゴモーション推定のための頑健なフレームワークを提案する。提案手法は, 希薄かつ高時間分解能なイベントデータを利用して, 通常の流れ, シーン構造, 慣性測定の幾何学的制約を取り入れたものである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:11:09 GMT)
Designing Conversational AI to Support Think-Aloud Practice in Technical Interview Preparation for CS Students [8.4]
LLMを用いた技術面接実践ツールを用いて17名の被験者を対象に調査を行った。主なデザインレコメンデーションは、技術インタビューシミュレーションのための会話型AIにおける社会的プレゼンスを促進することである。交差点の課題やそれに対応するための潜在的戦略など,幅広い考察を考察した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:15:05 GMT)
Knockout: A simple way to handle missing inputs [8.1]
マルチモーダルディープラーニングモデルでは、推論時にいくつかの入力が欠落している可能性があるため、デプロイが困難になる可能性がある。現在の一般的なソリューションには、マーシャリゼーション、インプット、複数のモデルのトレーニングなどがある。完全入力と限界分布を用いて条件分布を効率よく学習する手法を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:42:40 GMT)
Linear Relational Decoding of Morphology in Language Models [7.8]
二つのアフィン近似は、ある種の対象物関係に対する変圧器の計算によい近似であることがわかった。 s が対象トークンの中間層表現であり、W がモデル微分から導出される線形変換 Ws は、多くの関係において最終対象状態の正確な再現も可能であることを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:35:15 GMT)
Deep RL Dual Sourcing Inventory Management with Supply and Capacity Risk Awareness [7.5]
介入モデルを利用して大規模最適化問題に強化学習(RL)を効率的に適用する方法を検討する。我々は,サプライチェーン最適化におけるマルチソース多周期在庫管理問題である,現実世界の挑戦的アプリケーションに対するアプローチを実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:44:45 GMT)
Configurable multi-agent framework for scalable and realistic testing of llm-based agents [7.5]
大言語モデル(LLM)エージェントは複雑で文脈に敏感な振る舞いを示す。我々は,LLMベースのシステムの現実的マルチターン評価を自動化するフレームワークであるNeoを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:51:25 GMT)
Draft-based Approximate Inference for LLMs [7.3]
本稿では,大規模言語モデル推論のための新しいフレームワークを提案する。提案手法の2つのインスタンス化について述べる: (i) SpecKV, ドラフトアウトプットを利用してKVペアの重要性を正確に評価し, より効率的なKVキャッシュダウンを実現する方法, (ii) SpecPC, ドラフトモデルのアテンションアクティベーションを使用して重要でないプロンプトトークンを識別・破棄する手法。我々の手法は、メモリ使用量、レイテンシ、スループットが同じ改善を保ちながら、既存のベースラインよりも常に高い精度を達成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:40:40 GMT)
ShiftKD: Benchmarking Knowledge Distillation under Distribution Shift [7.3]
知識蒸留(KD)は、大きなモデルから小さなモデルに知識を伝達し、近年顕著な成功を収めている。しかし、実世界のアプリケーションにおける既存のKD手法の信頼性は、特に分布シフト下では、未解明のままである。 KDを2つの分散シフトに対してベンチマークするために,統一的かつ体系的なフレームワークtextscShiftKDを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:30:46 GMT)
Amico: An Event-Driven Modular Framework for Persistent and Embedded Autonomy [7.1]
私たちは、組み込みシステムに最適化された自律エージェントを構築するためのモジュラーでイベント駆動のフレームワークであるAmicoを紹介します。 Amicoは、WebAssemblyを介して組み込みプラットフォームとブラウザ環境間で効率的に動作する、リアクティブで永続的なエージェントをサポートする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:21:09 GMT)
A Hybrid Framework for Subject Analysis: Integrating Embedding-Based Regression Models with Large Language Models [6.8]
大規模言語モデル(LLM)は分類や要約作業に広く用いられているが、対象分析を行う能力は乏しい。埋め込み型MLモデルをLLMと統合するハイブリッドフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:32:46 GMT)
State-observation augmented diffusion model for nonlinear assimilation with unknown dynamics [6.7]
データ駆動同化のための新しい生成モデルであるState-Observation Augmented Diffusion(SOAD)モデルを提案する。実験の結果、SOADは既存のデータ駆動方式と比較してパフォーマンスが向上する可能性が示唆されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:04:25 GMT)
Uncertainty-aware Probabilistic 3D Human Motion Forecasting via Invertible Networks [6.7]
人間の3D動作予測は、自律的なアプリケーションの実現を目的としている。本稿では,不整合空間におけるポーズをパラメータ化するための非可逆ネットワークを導入したProbHMIを提案する。予測モジュールは将来の潜伏分布を明示的に予測し、効果的な不確実性定量化を可能にする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:02:07 GMT)
WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation [6.5]
WMNavは視覚言語モデル(VLM)を利用した新しい世界モデルベースのナビゲーションフレームワークである。決定の結果を予測し、ポリシーモジュールへのフィードバックを提供するためにメモリを構築する。人間のような思考プロセスに従って分解することにより、WMNavはモデル幻覚の影響を効果的に緩和する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:44:28 GMT)
GEMINUS: Dual-aware Global and Scene-Adaptive Mixture-of-Experts for End-to-End Autonomous Driving [6.3]
GEMINUSは、Global Expert、Scene-Adaptive Experts Group、Dual-Aware Routerを特徴とするエンドツーエンドの自動運転フレームワークである。 Global Expertはデータセット全体に基づいてトレーニングされており、堅牢なパフォーマンスを備えている。 Scene-Adaptive Expertsは、対応するシーンサブセットに基づいてトレーニングされ、適応的なパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:04:28 GMT)
Investigating the Role of LLMs Hyperparameter Tuning and Prompt Engineering to Support Domain Modeling [6.3]
大規模言語モデル(LLM)は、ソフトウェアエンジニアリングタスクの自動化を強化した。本稿では,超パラメータチューニングとプロンプトエンジニアリングがLlama 3.1モデルの精度を向上させる方法について検討する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:49:58 GMT)
CRAFT: A Neuro-Symbolic Framework for Visual Functional Affordance Grounding [6.3]
CRAFT(CRAFT)は、可買性グラウンドの解釈のための神経象徴的枠組みである。与えられたアクション(例えば「カット」)を可能にするシーン内のオブジェクトを識別する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:06:29 GMT)
Fraud is Not Just Rarity: A Causal Prototype Attention Approach to Realistic Synthetic Oversampling [6.2]
Causal Prototype Attention (CPAC)は、クラス認識クラスタリングを促進し、潜在空間構造を改善した解釈可能なアーキテクチャである。 CPACは優れた性能を示し、93.14%のF1スコア、90.18%のリコールを達成した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:51:54 GMT)
IRGPT: Understanding Real-world Infrared Image with Bi-cross-modal Curriculum on Large-scale Benchmark [6.2]
実世界の赤外線画像のためのマルチモーダル大規模言語モデルIRGPTを提案する。提案したIR-TDデータセットは、精密に手作りされたテキストとペアリングされた実際の赤外線画像を含む。 IRGPTは大規模モデルと比較して最先端の性能を実現している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:53:01 GMT)
Mitigating state transition errors during readout with a synchronized flux pulse [6.0]
量子ビット測定中の状態遷移は、繰り返し測定に依存する量子タスクに非常に有害である。我々は,2レベルシステム(TLS)がキュービットの読み出しに与える影響を,異なるキュービットのフラックスバイアスにおける遷移誤差を測定することによって実験的に検証した。我々の研究は超伝導測定における状態遷移の理解を前進させ、高速な高忠実な読み出しを実現するためにフラキソニウム量子ビットのポテンシャルを実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:13:32 GMT)
Toward Inclusive AI-Driven Development: Exploring Gender Differences in Code Generation Tool Interactions [5.9]
コード生成ツール(CGTs)への依存度が高まっているため、公正性と傾きに関する批判的な疑問が持ち上がっている。 CGTは潜在的な生産性向上を提供するが、多様なユーザグループ間での有効性は調査されていない。 CGTとのインタラクションは,ジェンダーやタスク結果,認知的負荷などによって異なる,という仮説を立てる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 23:53:27 GMT)
When few labeled target data suffice: a theory of semi-supervised domain adaptation via fine-tuning from multiple adaptive starts [5.8]
半教師付きドメイン適応(SSDA)は、限られたラベル付きターゲットデータを用いて、ターゲット領域で高い予測性能を達成することを目的としている。本研究では,構造因果モデル(SCM)に基づく理論的枠組みを構築し,ラベル付き対象データに制限がある場合のSSDA手法の性能解析と定量化を可能にする。本稿では,複数の出発点からUDAモデルを微調整し,最適性能を選択するマルチ・アダプティブ・スタート・ファイン・チューニング(MASFT)アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:18:28 GMT)
EHPE: A Segmented Architecture for Enhanced Hand Pose Estimation [5.7]
本稿では,手ポーズ推定(EHPE)のための新しいセグメンテーションアーキテクチャを提案する。我々は,TIPと手首の局所抽出を行い,TIP予測に対する誤差蓄積の影響を軽減する。広く使われている2つのベンチマークの実験は、EHPEが最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:21:24 GMT)
Gene-DML: Dual-Pathway Multi-Level Discrimination for Gene Expression Prediction from Histopathology Images [5.6]
病理組織像からの正確な遺伝子発現予測は、分子プロファイリングに対するスケーラブルで非侵襲的なアプローチを提供する。既存の方法では、病理組織像と遺伝子発現プロファイルの相互表現アライメントを未利用にすることがしばしばある。我々はDual-pathway Multi-Levelの識別を通じて潜在空間を構造化する統合フレームワークであるGene-DMLを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:45:12 GMT)
Quantum State Preparation Based on LimTDD [5.3]
本稿では,局所可逆写像図(LimTDD)に基づく量子状態の準備手法を提案する。 LimTDDはテンソルネットワークと決定図の利点を組み合わせて、量子状態の効率的な表現を可能にしている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:00:27 GMT)
A Risk Assessment Framework for Digital Identification Systems [5.3]
本稿では,デジタル識別システムにおけるリスクアセスメントフレームワークを提案する。この作業は、製品レビューと開発、製品ポリシー、および標準の取り組みに通知することを目的としています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:04:34 GMT)
Continual Learning with Neuromorphic Computing: Foundations, Methods, and Emerging Applications [5.2]
スパイキングニューラルネットワーク(SNN)の原理を活用したニューロモルフィック連続学習(NCL)が出現する。本調査では,教師付き学習パラダイムと教師なし学習パラダイムを組み合わせたハイブリッドアプローチについて紹介する。また、SNN操作の削減、重量量子化、知識蒸留といった最適化手法についても触れている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:19:37 GMT)
LLM-Based Detection of Tangled Code Changes for Higher-Quality Method-Level Bug Datasets [5.2]
本稿では,コミットメッセージとメソッドレベルのコード差分の両方を活用することで,絡み合ったコード変化を検出するための大規模言語モデルの有用性について検討する。その結果,コミットメッセージとコード差分を組み合わせることで,モデルの性能が著しく向上することがわかった。 49のオープンソースプロジェクトにアプローチを適用することで、バグギーと非バグギーメソッド間のコードのメトリクスの分散分離性が向上します。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:36:19 GMT)
Cleanse: Uncertainty Estimation Approach Using Clustering-based Semantic Consistency in LLMs [5.2]
本研究では,textbfClusttextbfering に基づくsemtextbfantic contextbfsisttextbfency (textbfCleanse) を用いた効果的な不確実性推定手法を提案する。 LLaMA-7B, LLaMA-13B, LLaMA2-7B, Mistral-7Bの4つの市販モデルを用いて, 幻覚検出におけるクリーンスの有効性を検証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:48:24 GMT)
Exploring Human-AI Complementarity in CPS Diagnosis Using Unimodal and Multimodal BERT Models [5.1]
本稿では、AudiBERTモデルがデータセットに疎結合なクラスの分類を改善したことを強調して、過去の研究を拡張した。 BERTモデルに対する同様の有意なクラスワイド改善は、感情次元の分類では見られなかった。相関分析の結果,AudiBERTモデルとBERTモデルの両方において,より大きなトレーニングデータが高いリコール性能に大きく関連していることがわかった。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:47:08 GMT)
Explainable Collaborative Problem Solving Diagnosis with BERT using SHAP and its Implications for Teacher Adoption [5.1]
本研究では、転写データ中の異なるトークン化単語が、BERTモデルのCPSプロセスの分類にどのように寄与するかを検討する。その結果, 良好な分類は, 分類決定の合理的な説明と一致しなかったことが示唆された。分析では、分類に肯定的に寄与する刺激的な単語も同定したが、クラスには意味論的には意味がなかった。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:57:24 GMT)
XL-DURel: Finetuning Sentence Transformers for Ordinal Word-in-Context Classification [5.0]
XL-DUREL (XL-DURel) は、言語内単語分類に最適化された微調整された多言語文変換モデルである。本稿では,2進 WiC を順序性 WiC の特別な場合として扱うことができ,一般順序性タスクのモデル最適化により,より特定の二進性タスクの性能が向上することを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:40:37 GMT)
MoViAD: A Modular Library for Visual Anomaly Detection [4.8]
MoViADは、VADモデル、トレーナー、データセット、VADユーティリティへの高速で簡単にアクセスできるように設計されたライブラリである。連続性、半教師付き、少数ショット、ノイズなど、幅広いシナリオをサポートする。 MoViADは、バックボーンの選択、堅牢な評価VADメトリクス(ピクセルレベルと画像レベル)、および効率分析に有用なプロファイリングツールを統合する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:17:35 GMT)
Enhancing POI Recommendation through Global Graph Disentanglement with POI Weighted Module [4.7]
次の関心点(POI)推奨は主に、ユーザの過去のチェックインデータと現在の状況に基づいて、将来の活動を予測する。本稿では,新しいPOIレコメンデーションフレームワークであるGraph Disentangler with POI Weighted Module (GDPW)を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:16:44 GMT)
Reconciling Translational Invariance and Hierarchy [4.6]
テンソルネットワークは量子多体系の基底状態を記述するために用いられる。正解可能なモデルがこれまでのところ、ギャップのない基底状態には欠落している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:06:14 GMT)
Multi-parameter Control for the $(1+(λ,λ))$-GA on OneMax via Deep Reinforcement Learning [4.5]
我々は、最先端の深層強化学習技術がいかに優れた制御ポリシーを近似できるかを示す。我々は、既定理論推奨設定を一貫して上回る単純な制御ポリシーを導出する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:56:29 GMT)
Supervised Graph Contrastive Learning for Gene Regulatory Network [4.5]
SupGCL(Supervised Graph Contrastive Learning)は、遺伝子制御ネットワーク(GRN)のための新しいGCL手法である。本研究の目的は,患者の危険度予測や疾患サブタイプ分類など,下流の生物学的タスクの性能を向上させることである。すべての実験において、SupGCLは最先端のベースラインよりも優れたパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:19:01 GMT)
Learning Stochastic Hamiltonian Systems via Stochastic Generating Function Neural Network [4.4]
生成関数ネットワーク(SGFNN)と呼ばれる観測データからハミルトン系(SHS)を学習するための新しいニューラルネットワークモデルを提案する。 SGFNNはハミルトン系のシンプレクティック構造を保持し、シンプレクティック予測を生成する。ベンチマークニューラルフローマップ学習(SFML)ニューラルネットワークと比較して、SGFNNモデルは様々な予測指標で高い精度を示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:59:04 GMT)
Learning to Communicate in Multi-Agent Reinforcement Learning for Autonomous Cyber Defence [4.3]
本稿では,サイバーオペレーション研究ジムでトレーニングゲームを行うことにより,防衛エージェントが差し迫ったサイバー脅威に対してコミュニケーションし,防御することを学ぶゲーム設計を提案する。これらの自律エージェントが学んだ戦術的方針は、サイバー脅威を避けるためのインシデント対応において、人間の専門家に似ています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:16:24 GMT)
Efficient Story Point Estimation With Comparative Learning [4.2]
ストーリーポイントの推定はアジャイルソフトウェア開発の重要な部分です。伝統的に、開発者はプランニングポーカーや他の手動技術を使ってストーリーポイントを共同で見積もる。機械学習は、この負担を軽減できますが、プロジェクトチームによる歴史的決定から十分なコンテキストでしかありません。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:36:19 GMT)
Optimizing Legal Document Retrieval in Vietnamese with Semi-Hard Negative Mining [4.2]
本稿では,法的文書検索の効率と精度を高めるために,検索と再ランクからなる2段階の枠組みを提案する。鍵となるイノベーションは、検索の有効性を評価するExist@mメトリックの導入と、トレーニングバイアスを軽減するためのセミハードネガティブの使用である。このフレームワークは、最適化されたデータ処理、調整された損失関数、バランスの取れた負のサンプリングが、法的な文脈で堅牢な検索強化システムを構築する上で重要であることを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:30:14 GMT)
ChartQA-X: Generating Explanations for Visual Chart Reasoning [4.2]
本稿では,4種類のチャートを対象とする30,299のチャートサンプルからなる総合データセットであるChartQA-Xを提案する。モデル生成によるChartQA-Xの説明は、正確さと論理学の人間による説明を超越している。本手法により,エージェントは複雑な視覚情報をより効果的に伝達することができる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 22:19:51 GMT)
Beyond the Single-Best Model: Rashomon Partial Dependence Profile for Trustworthy Explanations in AutoML [4.1]
モデル多重度を説明生成に組み込んだフレームワークを提案する。結果として生じたラショモンPDPは解釈的変動を捉え、不一致の領域を強調している。以上より,Rashomon PDPはモデル解釈の信頼性と信頼性を向上させることが示唆された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:30:52 GMT)
Large Language Models as Medical Codes Selectors: a benchmark using the International Classification of Primary Care [4.0]
本研究では,ドメイン固有検索エンジンを用いてICPC-2符号を割り当てる大規模言語モデルの可能性を評価する。 ICPC-2コードでアノテートされたブラジルポルトガルの437の臨床的表現のデータセットが使用された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:11:10 GMT)
Benchmarking GANs, Diffusion Models, and Flow Matching for T1w-to-T2w MRI Translation [4.0]
I2Iアプローチは、診断品質を維持しながらMRIコントラストを合成することを目的としている。本稿では,生成的獲得モデル,拡散モデル,フローベースマッチング技術に関する包括的なフレームワークを提案する。結果は、フローベースのモデルはデータセットや単純なタスクに過度に適合する傾向があり、既存のメソッドにマッチしたり、超えたりするためにより多くのデータを必要とする可能性があることを示唆している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 10:58:02 GMT)
Point'n Move: Interactive Scene Object Manipulation on Gaussian Splatting Radiance Fields [3.9]
Point'n Moveは、露光領域のインペイントによるインタラクティブなシーンオブジェクト操作を実現する方法である。我々はシーン表現としてガウス・スプレイティング・ラディアンス・フィールドを採用し、その明示的な性質と速度の優位性を完全に活用する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:49:09 GMT)
Positive-Unlabeled Learning for Control Group Construction in Observational Causal Inference [3.8]
治療単位と管理単位の両方へのアクセスは、治療が興味ある結果に与える影響を推定するために不可欠である。一般的な課題は、コントロールとして明確にラベル付けされたユニットの欠如である。我々は,信頼度が高く,未ラベルのプールから制御ユニットを識別するためのフレームワークとして,肯定的未ラベル学習(PU)を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:06:08 GMT)
Contour Flow Constraint: Preserving Global Shape Similarity for Deep Learning based Image Segmentation [3.6]
本稿では,2つの形状が等価な輪郭を示すという前提に基づいて,大域的な形状類似性の概念を提案する。本稿では,この制約をディープニューラルネットワークと統合するための2つの実装を提案する。 CFSSnetは、セグメント化ノイズ汚染画像におけるロバストさと、グローバルな形状の類似性を維持する固有の能力を示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:23:18 GMT)
Learning in Strategic Queuing Systems with Small Buffers [3.4]
ラウンド間の移動効果を持つゲームにおける学習結果を検討する。ネットワークにおいて重要な例としてルータがあり、単純な学習アルゴリズムを使って、パケットを所望の目的地に届ける最良の方法を見つける。モデルをよりリアルにし、より高いトラフィック率を可能にする、2つの重要な変更を持つシステムについて検討する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:59:48 GMT)
SemiOccam: A Robust Semi-Supervised Image Recognition Network Using Sparse Labels [3.4]
SemiOccamは、半教師付き学習を高い効率で活用する画像認識ネットワークである。特徴表現と対象クラス間の相互情報を最適化し,階層的な混合密度分類機構を構築する。提案手法は, 一般的に使用されている3つのデータセットに対して, 最先端の性能を実現する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:11:04 GMT)
Benefit from Reference: Retrieval-Augmented Cross-modal Point Cloud Completion [3.3]
本稿では,新たな検索強化ポイントクラウド補完フレームワークを提案する。中心となる考え方は、クロスモーダル検索を完了タスクに組み込んで、構造的事前情報を学ぶことである。本手法は細粒度点雲の生成に有効であることを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:57:41 GMT)
Forecasting Faculty Placement from Patterns in Co-authorship Networks [3.1]
我々は,教員配置を個人レベルの予測課題とみなしている。我々は,博士課程の権威や文献学的な特徴など,従来の属性を持つ時間的共著者ネットワークを用いている。本研究の結果は,従来の学力向上と機関的威信の尺度を超えて,ソーシャルネットワーク,職業的支持,暗黙の擁護が教員の雇用において果たす役割を裏付けるものである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:09:23 GMT)
Caching Techniques for Reducing the Communication Cost of Federated Learning in IoT Environments [2.9]
フェデレートラーニング(FL)は、複数のデバイスがデータを集中せずに共有モデルを共同でトレーニングすることを可能にする。本稿では、不必要なモデル更新送信を減らすために、キャッシュ戦略(FIFO、LRU、プライオリティベース)を紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:02:15 GMT)
Maximum Causal Entropy IRL in Mean-Field Games and GNEP Framework for Forward RL [2.9]
本稿では、離散時間強化フィールドゲーム(MFFG)における因果エントロピー強化学習(IRL)の利用について検討する。 MFFGは一般ナッシュ問題(GNEP)として非作用状態勾配のデータを生成する
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:43:59 GMT)
Kernel Based Maximum Entropy Inverse Reinforcement Learning for Mean-Field Games [2.9]
静止平均フィールドゲームにおける最大因果エントロピー逆強化学習問題を考察する。これにより、エキスパートのデモンストレーションから直接リッチで潜在的に非線形な報酬構造を推測することができる。提案手法の有効性を,専門家の行動を正確に再現する平均フィールドトラフィックルーティングゲームに示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:06:52 GMT)
Spatial-Temporal Transformer with Curriculum Learning for EEG-Based Emotion Recognition [2.8]
SST-CLは、空間時間変換器とカリキュラム学習を統合した新しいフレームワークである。力に敏感なカリキュラム学習戦略は、高強度から低強度の感情状態へのトレーニングを指導する。 3つのベンチマークデータセットの実験では、様々な感情的強度レベルにわたる最先端のパフォーマンスが示されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:23:38 GMT)
OMNISEC: LLM-Driven Provenance-based Intrusion Detection via Retrieval-Augmented Behavior Prompting [2.8]
Provenance-based Intrusion Detection Systems (PIDS) はエンドポイントの脅威分析に広く利用されている。攻撃手法の進化により、ルールは攻撃者の全ての特性を動的にモデル化することはできない。異常検出システムは、通常の行動の変化と実際の攻撃行動とを区別できないため、重大な偽陽性問題に直面している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:16:13 GMT)
Sampling from Gaussian Processes: A Tutorial and Applications in Global Sensitivity Analysis and Optimization [2.7]
ガウス過程(GP)から後続サンプルを生成するための2つの顕著なサンプリング法を提案する。生成したサンプルをGSA、単目的最適化、多目的最適化に適用する方法を詳述する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:36:38 GMT)
Escaping Saddle Points for Nonsmooth Weakly Convex Functions via Perturbed Proximal Algorithms [2.5]
主な結果は、非滑らか関数に対する$epsilon$-approximate Local minimumの新たな特徴に基づいている。標準的な仮定では、摂動近位点、摂動近位勾配、摂動近位線形アルゴリズムは非滑らかな凸関数に対して$epsilon$-approximate局所最小値を求める。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:35:56 GMT)
CABLD: Contrast-Agnostic Brain Landmark Detection with Consistency-Based Regularization [2.4]
CABLDは、ラベルなしスキャンにおける3次元脳ランドマーク検出のための、新しい自己教師型ディープラーニングフレームワークである。提案手法はMRIによる脳のランドマーク検出を複雑に行うことで実証する。我々のフレームワークは、解剖学的ランドマーク検出のための堅牢で正確なソリューションを提供し、広範囲の注釈付きデータセットの必要性を減らす。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:14:22 GMT)
Glitches in Decision Tree Ensemble Models [2.3]
グリッチは入力空間内の小さな近傍で、入力の小さな変化に対してモデルの出力が突然振動する。文献からよく知られたモデルとデータセットを用いて、グリッチが広く存在することを示す。グリッチ検出の問題は,すでに深さ4の樹木に対して,樹木のアンサンブルに対してNP完全であることが証明されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:33:57 GMT)
OptiCorNet: Optimizing Sequence-Based Context Correlation for Visual Place Recognition [2.3]
本稿では,新しいシーケンスモデリングフレームワークOptiCorNetを提案する。空間的特徴抽出と時間的差分を微分可能でエンドツーエンドのトレーニング可能なモジュールに統一する。本手法は,季節的・視点的な変化に挑戦し,最先端のベースラインよりも優れる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:29:43 GMT)
Real-Time Scene Reconstruction using Light Field Probes [2.3]
画像からフォトリアリスティックな大規模なシーンを再構築することは、コンピュータグラフィックスにおける長年の問題である。本研究では,シーンジオメトリを明示的に使用せずに,複雑なシーンを効率的に再構築する新しいビュー合成手法について検討する。我々のアプローチは、仮想現実(VR)および拡張現実(AR)アプリケーションに適用できる可能性がある。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:43:30 GMT)
RATE: An LLM-Powered Retrieval Augmented Generation Technology-Extraction Pipeline [2.2]
本稿では,RATE(Retrieval Augmented Technology extract)を科学文献から自動抽出するパイプラインとして紹介する。我々は脳-コンピュータインタフェース(BCI)と拡張現実性(XR)に焦点を当てた678の論文でその使用を実証した。評価のため,70個のランダムな項目のゴールド標準技術データセットを専門家がキュレートした。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:00:27 GMT)
GCC-Spam: Spam Detection via GAN, Contrastive Learning, and Character Similarity Networks [2.2]
本稿では,3つのイノベーションを統合した新しいスパムテキスト検出フレームワークであるGCC-Spamを提案する。文字類似性ネットワークは、文字難読攻撃に対する正書法と音声の特徴をキャプチャする。対照的な学習は、スパムと通常のテキスト間の潜在空間距離を最適化することで差別性を高める。 Generative Adversarial Network (GAN)は、データ不足を軽減するために、現実的な擬似スパムサンプルを生成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:09:48 GMT)
Neural Brownian Motion [2.2]
本稿では,ニューラル・ブラウン運動(NBM)について紹介する。ボラティリティ関数 $nu_theta$ は事前に仮定されるのではなく、制約 $g_theta(t, M_t, nu_theta(t, M_t)) = 0 で暗黙的に定義される。悲観的か楽観的であるかは、学習した$thetaによって不均一に決定され、不確実性に対する態度が発見可能な特徴であるモデルに対して厳密な基礎を提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:09:52 GMT)
Beyond Atomic Geometry Representations in Materials Science: A Human-in-the-Loop Multimodal Framework [2.2]
MultiCrystalSpectrumSet(MCS-Set)は、原子構造と2Dプロジェクションと構造化テキストアノテーションを統合することで、材料データセットを拡張するキュレートされたフレームワークである。 MCS-Setは,(1)マルチモーダル特性と要約予測,(2)部分クラスタ管理による制約結晶生成の2つの重要なタスクを実現する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:25:44 GMT)
Characterizing State Space Model (SSM) and SSM-Transformer Hybrid Language Model Performance with Long Context Length [2.0]
ローカルデバイス上で連続した長文入力を処理できるマシンインテリジェンスへの需要は急速に伸びている。従来のTransformerアーキテクチャは効率が悪く、これらのタスクには使用できないことが多い。これにより、ステートスペースモデル(SSM)やハイブリッドといった、ほぼ直線的なスケーリングを約束する新しいアーキテクチャへのパラダイムシフトが加速した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:24:57 GMT)
It's Not That Simple. An Analysis of Simple Test-Time Scaling [2.0]
以前の研究では、o1のようなモデルから抽出したモデルでこのスケーリング動作を複製するシンプルなテストタイムスケーリングが提案されていた。本稿では, 簡単なテスト時間スケーリングの解析を行い, スケーリングの挙動は最大長を強制することによるスケールダウンに起因することが確認された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:28:10 GMT)
Kolmogorov Arnold Network Autoencoder in Medicine [2.0]
最近の研究はKAN(Kolmogorov Arnold Networks)と呼ばれる新しいアーキテクチャを導入し、ニューラルネットワークのエッジに学習可能なアクティベーション関数を配置することで、複数のシナリオのパフォーマンスが向上したことを報告している。本研究の目的は,複数バージョンのバニラAE(線形・畳み込み・変分法など)を,同じあるいは少ないパラメータを持つコルモゴロフ・アルノルドの値と比較することである。心電図をモデル入力として, 再建, 生成, 復調, 着色, 異常検出の5種類の古典的AEタスクについて検討した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:50:50 GMT)
First-Principles Framework for the Prediction of Intersystem Crossing Rates in Spin Defects: The Role of Electron Correlation [1.9]
本稿では,光スピン偏光サイクルにおいて重要なステップとなる,システム間交差過程を研究するための第1原理フレームワークを提案する。ダイヤモンド中の窒素空孔中心をケーススタディとして、我々の枠組みが電子相関効果を効果的に捉えることを実証した。我々は、蛍光寿命の測定を行い、理論と実験の間に優れた一致を見出すことにより、予測を検証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:35:06 GMT)
Artificial Intelligence in the Food Industry: Food Waste Estimation based on Computer Vision, a Brief Case Study in a University Dining Hall [1.9]
本研究は,プレートレベルの食品廃棄物を推定する費用対効果のコンピュータビジョンフレームワークを提案する。 4つの完全に教師されたモデルが、キャップ付き動的逆周波数損失とAdamWメトリクスを使用して訓練された。全てのモデルが満足な性能を達成し、食品の種類ごとに、少なくとも1つのモデルがDPAに近づいたか、90%を超えた。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:21:29 GMT)
Foundational Competencies and Responsibilities of a Research Software Engineer: Current State and Suggestions for Future Directions [1.8]
Research Software Engineerという用語は10年ほど前に、研究コミュニティで働く個人を表現し、ソフトウェア開発にフォーカスする手段として登場した。スペクトルの一端では、RSEの役割は伝統的な研究の役割と似ているかもしれない。反対に、彼らは業界のソフトウェアエンジニアに似ています。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:38:03 GMT)
Mind the Gap: A Review of Arabic Post-Training Datasets and Their Limitations [1.7]
本稿では,Hugging Face Hub上でのアラビア語学習後のデータセットについて概説する。各データセットは、人気、実践的採用、信頼性とメンテナンス、ドキュメンテーションとアノテーションの品質、ライセンスの透明性、科学的貢献に基づいて厳格に評価されている。私たちのレビューでは、タスクの多様性の制限、ドキュメントやアノテーションの欠如、コミュニティ全体の採用率の低下など、アラビアのポストトレーニングデータセットの開発において重要なギャップが明らかになった。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:30:45 GMT)
CXR-TFT: Multi-Modal Temporal Fusion Transformer for Predicting Chest X-ray Trajectories [1.7]
集中治療室(ICU)では、複雑な臨床疾患を持つ患者は警戒監視と迅速な介入が必要である。既存のCXR解釈ツールは断面解析によって制約されており、時間的ダイナミクスを捉えていない。 CXR-TFTは,CXR画像と放射線診断を高頻度臨床データと統合した新しいマルチモーダルフレームワークである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 22:42:26 GMT)
Fast Bilateral Teleoperation and Imitation Learning Using Sensorless Force Control via Accurate Dynamics Model [1.6]
この研究は、力覚フィードバックによる高速遠隔操作が、力覚のない低コストマニピュレータでも実現可能であることを示した。本手法は,正確に同定されたマニピュレータ力学に基づいて非線形項補償,速度,外力推定を統合する。 4チャンネルの双方向制御によって収集されたデータを用いて、学習ポリシーの入力と出力の両方に力情報を統合することで、模倣学習のパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:20:11 GMT)
VlogQA: Task, Dataset, and Baseline Models for Vietnamese Spoken-Based Machine Reading Comprehension [1.4]
本稿では,機械読解作業のためのベトナム語音声コーパスの開発過程について述べる。ベトナムの既存のMRCコーポラは主にウィキペディアの記事、オンライン新聞、教科書などの公式文書に焦点を当てている。対照的に、VlogQAはYouTubeからソースされた1,230の文書に基づいて10,076の質問応答ペアで構成されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:38:45 GMT)
PerspectiveNet: Multi-View Perception for Dynamic Scene Understanding [1.3]
PerspectiveNetは、複数のカメラビューにわたる長い記述を生成するための軽量モデルである。提案手法では,視覚エンコーダ,コンパクトコネクタモジュール,および大規模言語モデルを用いる。結果として得られるモデルは軽量で、効率的なトレーニングと推論を確実にします。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:59:12 GMT)
The Origin of Self-Attention: From Pairwise Affinity Matrices to Transformers [1.2]
自己認識メカニズムは現在、Transformersのようなディープラーニングアーキテクチャの中心となっている。本稿では,複数の領域にまたがる自己意識の概念的起源を追究する。我々は、ペア関係を前提とした基盤構造は、両方のアプローチにまたがって維持されていると論じる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:51:03 GMT)
High-fidelity quantum state control of a polar molecular ion in a cryogenic environment [1.2]
低温環境下でのCaH+イオンの量子状態を制御するために量子論理分光プロトコルを用いる。このプロトコルは分子固有のレーザーを一切必要とせず、検出方式は非破壊である。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:52:34 GMT)
Fourier Domain Adaptation for Traffic Light Detection in Adverse Weather [1.1]
悪天候下での交通光検出は、ADASシステムでは未発見のままである。本稿では、アーキテクチャの変更なしにデータ修正をトレーニングすることのみを必要とするフーリエドメイン適応(FDA)を提案する。 FDAは、ソースとターゲットドメイン間のドメインギャップを最小化し、悪天候下で信頼性の高いパフォーマンスのためのデータセットを作成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:51:22 GMT)
Influence of High-Performance Image-to-Image Translation Networks on Clinical Visual Assessment and Outcome Prediction: Utilizing Ultrasound to MRI Translation in Prostate Cancer [1.1]
本研究では,イメージ・ツー・イメージ・トランスフォーメーション(I2I)ネットワークのコア特性について検討し,その有効性と適応性に着目した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 23:22:17 GMT)
Large Language Models Assisting Ontology Evaluation [1.1]
機能的要求によるオントロジー評価は、コスト、労働集約、エラーを起こしやすい。自動および半自動検証によるオントロジー評価を支援する新しいフレームワークであるOE-Assistを紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:13:51 GMT)
Impact of Fixing Spins in a Quantum Annealer with Energy Rescaling [1.1]
本研究では,固定スピン,有望なサイズ縮小法,およびエネルギー再スケーリングの影響について検討した。量子アニール器を用いた数値シミュレーションと実験により、固定スピン法が量子アニール性能を向上させることを示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:25:12 GMT)
Accelerating Hamiltonian Monte Carlo for Bayesian Inference in Neural Networks and Neural Operators [1.1]
ハミルトニアン・モンテカルロ (HMC) はベイジアンネットワークの後方分布をサンプリングするための強力で正確な手法である。本稿では,安価なVI法と正確なHMC法を組み合わせて,ニューラルネットワークの不確かさを高精度に予測するハイブリッド手法を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:57:54 GMT)
Clutter Detection and Removal by Multi-Objective Analysis for Photographic Guidance [1.1]
写真のクレーターは、写真家が意図した感情やストーリーを観客に伝えるのを妨げている。我々は、クラッタ識別と除去のための解決策とガイダンスを提供するカメラ誘導システムを開発した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:15:17 GMT)
Depthwise-Dilated Convolutional Adapters for Medical Object Tracking and Segmentation Using the Segment Anything Model 2 [1.1]
本稿では SAM2 の効率的な適応フレームワーク DD-SAM2 を提案する。 DD-SAM2にはDepthwise-Dilated Adapter (DD-Adapter)が組み込まれている。 DD-SAM2はSAM2のストリーミングメモリを完全に活用し、医療ビデオオブジェクトの追跡とセグメンテーションを行う。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:19:55 GMT)
Grokking at the Edge of Linear Separability [1.0]
グルーキングは非単調なテスト損失行動を伴う一般化が遅れている。問題のパラメータが臨界点に近くても、グラッキングは自然に発生する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:23:58 GMT)
LeanTree: Accelerating White-Box Proof Search with Factorized States in Lean 4 [1.0]
LeanTreeは、複雑な証明状態をシンプルで独立したブランチに分解する、Lean 4言語で構築されたツールです。予備的な結果は、ホワイトボックスが一部の設定でブラックボックスの代替よりも優れていることを示唆している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:50:07 GMT)
Exploring the Dynamic Scheduling Space of Real-Time Generative AI Applications on Emerging Heterogeneous Systems [0.9]
リアルタイム生成AI(RTGen)ワークロードは、生成モデルの計算強度と動的実行パターンと、リアルタイム推論の制約とを結合する。現代のエッジプラットフォームでは、不均一なSystem-on-chip(SoC)アーキテクチャが採用されている。スケジューリング決定がワークロードのパフォーマンスに大きく影響することを示します。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:24:11 GMT)
BioGraphFusion: Graph Knowledge Embedding for Biological Completion and Reasoning [0.9]
そこで我々は,BioGraphFusionを紹介した。 3つの重要なバイオメディカルタスクにわたる実験により、バイオグラフフュージョンは最先端のKE、GNN、アンサンブルモデルよりも優れた性能を示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:03:42 GMT)
Discipline and Resistance: The Construction of a Digital Home for TikTok Refugees on Xiaohongshu [0.7]
この研究は、TikTokが米国で禁止されそうになった後、TikTok難民がXiaohongshuにどのように移動したかを調べる。フーコーのヘテロトピアの概念を利用して、Xiaohongshuが異文化間の議論の危機的場所になったことを実証している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:47:55 GMT)
The unknotting number, hard unknot diagrams, and reinforcement learning [0.7]
強化学習エージェントは、最大200回の交差を持つノットダイアグラムの交差変化の最小シーケンスを見つけます。我々はこれを57kノットの無作為数を決定するために使用した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:05:27 GMT)
Deep Learning-Based Survival Analysis with Copula-Based Activation Functions for Multivariate Response Prediction [0.7]
この研究は、ディープラーニング、コプラ関数、生存分析を統合している。このようなデータに固有の非線形依存をモデル化するために、コプラに基づくアクティベーション関数を導入する。提案するCNN-LSTMは, 右官能データに明示的に対応し, 複雑なパターンを捉えることにより, 予測精度を向上させる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:35:51 GMT)
Quantum Sensing Enhancement through a Nuclear Spin Register in Nitrogen-Vacancy Centers in Diamond [0.6]
固体スピン系、特にダイヤモンド中の窒素空孔(NV)中心は、高感度で室温で作動する能力に魅力がある。周囲のスピン浴からのノイズによる電子スピンのコヒーレンスと、この環境効果は、NV中心の感度を制限する。核スピン支援プロトコルは、自然発生の電子と核スピン対による電子スピンコヒーレンスの向上を示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:58:59 GMT)
Retrieval-Augmented Clinical Benchmarking for Contextual Model Testing in Kenyan Primary Care: A Methodology Paper [0.6]
大規模言語モデル(LLM)は、低リソース環境での医療アクセスを改善するという約束を持っているが、アフリカのプライマリケアにおけるそれらの効果は、まだ探索されていない。ケニアのレベル2と3の臨床ケアに焦点を当てたベンチマークデータセットと評価フレームワークを作成するための方法論を提案する。本手法は,ケニアの全国ガイドラインに臨床質問を根拠として,地域標準との整合性を確保するためにRAG (Regegration augmented generation) を用いている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:25:26 GMT)
Exp-Graph: How Connections Learn Facial Attributes in Graph-based Expression Recognition [0.6]
顔の特徴間の構造的関係を表現する新しいフレームワークであるExp-Graphを提案する。顔属性グラフ表現では、顔のランドマークがグラフの頂点として使用される。エッジは、顔のランドマークの近接と、視覚変換器を用いて符号化された顔属性の局所的な外観の類似性に基づいて決定される。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 13:10:21 GMT)
Adversarial bandit optimization for approximately linear functions [0.6]
非滑らかかつ非滑らかな関数に対する帯域最適化問題を考える。それぞれのトライアルでは、損失関数は線形関数の和であり、プレイヤーの選択を観察した後に選択された小さいが任意の摂動である。その結果、最適化のために高確率の後悔を省くことが示唆された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:53:31 GMT)
DiSCO-3D : Discovering and segmenting Sub-Concepts from Open-vocabulary queries in NeRF [0.5]
DiSCO-3Dは、シーンとユーザクエリの両方に対応する3Dセマンティックセマンティックセマンティクスを提供することを目指している。我々は、教師なしセグメンテーションと弱いオープン語彙誘導を組み合わせた、ニューラルネットワーク表現に基づくDiSCO-3Dを構築した。オープン語彙サブ概念発見においてDiSCO-3Dが有効な性能を発揮することを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:46:20 GMT)
RACR-MIL: Rank-aware contextual reasoning for weakly supervised grading of squamous cell carcinoma using whole slide images [0.5]
扁平上皮癌は最も一般的な癌亜型であり、発生頻度が増加し、がん関連死亡率に大きな影響を及ぼす。複数の解剖学にまたがる堅牢な一般化を実現するために, RACR-MILを提案する。本モデルでは,複数のSCCデータセットにまたがる最先端性能を達成し,3～9%のグレーディング精度,クラス不均衡に対するレジリエンス,最大16%の腫瘍局所化を実現した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:50:45 GMT)
Magnetic field orientation dependence of continuous-wave optically detected magnetic resonance with nitrogen-vacancy ensembles [0.5]
ダイヤモンド中の窒素空孔(NV)スピンによる連続波光検出磁気共鳴(CW-ODMR)測定は、近傍のターゲットから直流磁場を検出するために用いられる。この技術は、異なるNV配向クラスによる共鳴が互いに重なり合うとき、磁場成分の抽出の曖昧さに悩まされる。ここでは、低バイアス磁場を呈するNVアンサンブルに対するそのような効果に関する詳細な実験および理論的研究を行う。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 10:52:07 GMT)
Toward Responsible And Beneficial Ai: Comparing Regulatory And Guidance-Based Approaches [0.4]
この論文は、欧州連合、米国、中国、IEEEの技術標準における人工知能ガバナンスフレームワークの包括的な比較分析を提示している。本研究は,システマティックコンテンツ分析に基づく定性的な研究設計を用いて,規制哲学,実施機構,グローバルエンゲージメント戦略の特異なパターンを識別する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:44:28 GMT)
Enhancing the Clique Local Decoder to Correct Length-2 Space Errors in the Surface Code [0.3]
そこで我々はClique_L2を提案する。これはCliqueベースのアプローチを拡張し、いくつかの制約を緩和し、さらに低コストな論理を組み込む。 Clique_L2は、元のClique(またはClique_L1)デコーダ上で最大8.95倍の復号化を実現する。 Clique_L2はクラスタエラーや長いエラー連鎖が発生しやすい場合、Clique_L1上で最大18.3倍のデコード帯域幅の削減を達成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:06:31 GMT)
Large Language Models are Autonomous Cyber Defenders [0.2]
自律サイバーディフェンス(ACD)は、人工知能(AI)エージェントによるインシデント対応を自動化することを目的としている。ほとんどのACDアプローチは単一エージェントシナリオにフォーカスし、強化学習(RL)を活用する。大きな言語モデル(LLM)は、一般的なセキュリティコンテキストで説明可能なアクションを提供することによって、これらの問題に対処することができる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:35:05 GMT)
Analyzing Internal Activity and Robustness of SNNs Across Neuron Parameter Space [0.1]
Spiking Neural Networks (SNN)は、従来の人工ニューラルネットワークに代わるエネルギー効率の良い代替手段を提供する。ネットワークが有意義な活動と機能的行動を示す運用空間を特徴付ける。本結果は,堅牢で効率的なSNNをデプロイするための実践的ガイドラインを提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:13:53 GMT)
Spiral renormalization group flow and universal entanglement spectrum of the non-Hermitian 5-state Potts model [0.1]
テンソルネットワークアルゴリズムは、まだ非エルミート理論をシミュレートできることを示す。我々は、基底状態に符号化されたハミルトニアンの絡み目を通して、完全な境界CCFTスペクトルを再構成する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:46:16 GMT)
Domain-Adaptive Small Language Models for Structured Tax Code Prediction [0.1]
本稿では,製品およびサービス税体系の高次予測のためのエンコーダデコーダアーキテクチャを備えたドメイン適応型小言語モデル(SLM)を提案する。我々は,エンコーダ-デコーダアーキテクチャに基づくSLMを用いて,逐次税制コードの生成を可能にする。本研究では, エンコーダ・デコーダのSLMを, 構造化税コードの逐次予測に適用できることを実証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:12:12 GMT)
Sports Re-ID: Improving Re-Identification Of Players In Broadcast Videos Of Team Sports [0.0]
本研究は、チームスポーツの放送ビデオにおけるプレイヤーの再識別に焦点を当てている。具体的には、試合の特定の瞬間に異なるカメラ視点から撮影された画像において、同じプレイヤーを特定することに焦点を当てる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:10:26 GMT)
What do Large Language Models know about materials? [0.0]
大規模言語モデル(LLM)は、機械工学や材料科学の分野でますます応用されている。材料指紋の特異性に対する語彙とトークン化の役割を強調した。これにより、情報選択のための物質知識ベンチマークが作成され、PSPPチェーンのLCMのステップが適用できる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:02:08 GMT)
Violation of the Thermodynamic Uncertainty Relation in Quantum Collisional Models [0.0]
量子衝突モデルにおける熱力学的不確実性関係について検討する。マルコフ力学では、非平衡定常状態状態における古典的および量子的TUR境界について検討する。 2つの非マルコフ的アプローチに対して、非マルコフ的性の次数と型は、TUR違反に決定的に影響を及ぼす。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:15:05 GMT)
Two-photon coupling via Josephson element I: Breaking the symmetry with magnetic fields [0.0]
対称超伝導量子干渉デバイス(SQUID)に基づく結合素子について考察する。 2光子相互作用を媒介することを示す。 SQUIDによる他の誘導相互作用は、その場でオフにすることができる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:01:15 GMT)
Towards scalable quantum computations of atomic nuclei [0.0]
我々は、位置空間の格子上のピオンレス有効場理論の量子シミュレーションにより、核の2体と3体の境界状態を解く。我々は、ユニタリ結合クラスタ理論から成長した適応アンサッツを用いて、重陽子と3$Heの基底状態のパラメータ化を行う。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:40:46 GMT)
Towards a Proactive Autoscaling Framework for Data Stream Processing at the Edge using GRU and Transfer Learning [0.0]
実世界のDSPデータセットと合成DSPデータセットを用いて,GRUニューラルネットワークが上流の負荷を予測する方法を示す。転送学習フレームワークは、予測モデルをオンラインストリーム処理システムに統合する。負荷予測のための軽量GRUモデルは、実世界のデータセット上で最大1.3%のSMAPE値を記録した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:47:50 GMT)
Towards Quantum Accelerated Large-scale Topology Optimization [0.0]
本稿では,TO問題を効率的に解き,量子コンピューティングを利用して潜在的な量子優位性を利用するための実践的な方法を提案する。本研究は,3次元連続体構造における大規模・多材料TO課題を対象としている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:30:14 GMT)
The Perception of Phase Intercept Distortion and its Application in Data Augmentation [0.0]
位相歪みとは、知覚可能な信号の周波数間の位相関係の変化を指す。本稿では、周波数非依存の位相シフトによって生じる位相インセプション歪みと呼ばれる位相歪みの特別な場合について論じる。本稿では,位相知覚歪みの認識不能が機械学習,特にデータ拡張にどのように役立つかを論じる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:53:48 GMT)
Text2VR: Automated instruction Generation in Virtual Reality using Large language Models for Assembly Task [0.0]
本稿では,Large Language Models (LLM) を利用してテキスト入力から仮想命令を生成する手法を提案する。このシステムは、テキストからタスク関連情報を抽出するLLMモジュールと、この情報をVR環境内のアニメーションデモやビジュアルキューに変換するインテリジェントモジュールの2つのコアコンポーネントから構成される。このアプローチは、トレーニングの有効性を高め、開発オーバーヘッドを低減し、VRベースのトレーニングをよりスケーラブルで、産業的なニーズに適応できるようにします。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:37:48 GMT)
Subradiance generation in a chain of two-level atoms with a single excitation [0.0]
単一の励起系における鎖N2レベル原子のサブ放射に関する研究は、主に有効ハミルトニアンの複素スペクトルに焦点を当てている。疑問は、まずはレーザーによって励起されたり駆動されたりした原子からのサブ放射がどのように現れるかである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:21:45 GMT)
Specification and Evaluation of Multi-Agent LLM Systems -- Prototype and Cybersecurity Applications [0.0]
LLMは、推論技術、コード生成、ソフトウェア実行を複数の潜在的に特殊なLLMで組み合わせることで、複雑なタスクを解決するのに使うことができる。本稿では,マルチエージェントシステムアーキテクチャとプロトタイプを用いて,エージェントスキーマ言語と仕様の実行と評価を紹介する。サイバーセキュリティタスクを含むテストケースは、アーキテクチャと評価アプローチの可能性を示している。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:15:06 GMT)
Semi-automated Fact-checking in Portuguese: Corpora Enrichment using Retrieval with Claim extraction [0.0]
この論文はポルトガルのニュースコーパスを外部の証拠で強化するための方法論を開発し、適用し、分析する。このアプローチはユーザの検証プロセスをシミュレートし、Large Language Models (LLM) を使用してテキストから主クレームを抽出する。ベースコーパスの品質を高めるために、ほぼ重複検出を含むデータ検証および前処理フレームワークを導入する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 23:46:40 GMT)
SDSC:A Structure-Aware Metric for Semantic Signal Representation Learning [0.0]
本稿では,時系列自己教師型表現学習のための構造対応計量関数であるSignal Dice similarity Coefficient (SDSC)を提案する。 SDSCは署名された振幅の交叉に基づいて時間信号間の構造的一致を定量化することでこの問題に対処する。 SDSCとMSEを組み合わせたハイブリッド損失定式化も提案されている。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:32:00 GMT)
RingFormer: A Neural Vocoder with Ring Attention and Convolution-Augmented Transformer [0.0]
RingFormerは、リングアテンション機構を軽量変圧器、畳み込み強化変圧器(コンフォーマー)に組み込むニューラルボコーダである。 RingFormerは2つの差別者による敵の訓練で訓練されている。実験の結果、RingFormerは既存のモデルに匹敵する、あるいは優れたパフォーマンスを実現していることがわかった。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 06:41:48 GMT)
Rigorous lower bound on dynamical exponents in gapless frustration-free systems [0.0]
この研究は、フラストレーションのない量子多体系における動的指数に対する普遍的下界$zge2$を厳格に確立する。注目すべきことに、我々の結果は古典的プロセスの力学に対する新しい境界を証明するために応用できる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 22:41:11 GMT)
Rethinking Suicidal Ideation Detection: A Trustworthy Annotation Framework and Cross-Lingual Model Evaluation [0.0]
適切な思考検出は、リアルタイムの自殺予防には不可欠だが、その進歩は2つの未解決課題に直面している。ほとんどのデータセットは英語で書かれているが、その中でも高品質で人間による注釈付きデータはほとんど残っていない。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:54:36 GMT)
Real Time Captioning of Sign Language Gestures in Video Meetings [0.0]
コンピュータビジョンを用いた手話認識は、聴覚障害者と一般人のコミュニケーション障壁を取り除くことを目的としている。本稿では,ビデオ通話中のすべての人の字幕に手話を自動的に翻訳するブラウザエクステンションを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:01:59 GMT)
Quantum determinism and completeness restored by indistinguishability and long-time particle detection [0.0]
量子物理学における測定データは、統計的、マクロなプロセスの結果としてのみ厳密に解釈できると論じる。シュル・オーディンガー・キャットとベルの実験により、ボルン・ルールが1つの粒子のレベルで放棄されると、リアリズム、局所性、因果関係が復元されることを示した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:48:54 GMT)
Pruning Increases Orderedness in Recurrent Computation [0.0]
人工ニューラルネットワークにおいて、指向性が帰納バイアスに有効である程度について検討する。ニューロン間のトポロジ的に順序付けられた情報フローとして方向性をとることで、全接続のパーセプトロン層を定式化する。我々は,適切な刈り取り技術を適用することで,方向付けをハードワイヤではなく誘導できることを実証した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:44:17 GMT)
Performance comparison of medical image classification systems using TensorFlow Keras, PyTorch, and JAX [0.0]
本稿では、Keras、PyTorch、JAXの3つの人気のあるディープラーニングフレームワークのパフォーマンスを比較し、公開されているBloodMNISTデータセットから血液細胞像を分類する。その結果、画像の解像度やフレームワーク固有の最適化といった要因の影響を受け、フレームワーク間でのパフォーマンスのばらつきが明らかになった。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:05:14 GMT)
Patents as Knowledge Artifacts: An Information Science Perspective on Global Innovation [0.0]
この章では、知識アーティファクトとしての特許に焦点を当てることで、情報科学の文脈で特許を再構築することを提案する。この研究は、AIの発明、バイオテクノロジーの特許、および特許との国際競争という3つの分野に焦点を当て、新しいテクノロジーが発明、アクセス、道徳的説明責任という伝統的な概念にどのように挑戦しているかを考察する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:33:39 GMT)
PAT++: a cautionary tale about generative visual augmentation for Object Re-identification [0.0]
オブジェクト再識別のためのアイデンティティ保存画像生成の有効性を評価する。その結果、ドメインシフトやアイデンティティ定義機能の維持に失敗するなど、一貫したパフォーマンス劣化が見られた。これらの知見は、生成モデルの微粒化認識タスクへの転送可能性に関する仮定に挑戦する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:01:05 GMT)
Numerical Artifacts in Learning Dynamical Systems [0.0]
多くの応用において、その解から有限の時間点でサンプリングされた力学系を学ぶ必要がある。本稿では,選択した数値スキームが学習結果に与える影響について述べる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 05:23:39 GMT)
Nonlinearity-assisted advantage for open Dicke-quantum batteries [0.0]
エネルギー貯蔵およびエネルギー抽出の観点から量子電池の性能を解析する。システム内の非線形性は, 電池とキャビティの結合における非線形性である。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:30:49 GMT)
Multiply quantized vortex spectroscopy in a quantum fluid of light [0.0]
我々は、光の偏光流体の駆動散逸特性を利用して、定常で多重の電荷を持つ渦を生成する。我々は、量子流体や天体物理学的なコンパクト物体のような他の回転するジオメトリーにおいて、量子化された渦の共通の特徴を観察する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 08:52:52 GMT)
Multipartite entanglement from ditstrings for 1+1D systems [0.0]
1+1Dシステムの臨界点を同定する効率的な方法として,マルチパーティ・アンタングルメントが有効であることを示す。量子イジングモデル、格子の$lambda phi4$を量子四重項で近似し、レイドバーグ原子の配列でこれを実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:44:28 GMT)
Multimodal AI for Gastrointestinal Diagnostics: Tackling VQA in MEDVQA-GI 2025 [0.0]
本稿では,ImageCLEFmed MEDVQA 2025 ChallengeのSubtask 1へのアプローチについて述べる。 VQAパイプラインのバックボーンとして,大規模なマルチモーダル基盤モデルであるFlorenceモデルを採用しています。 KASVIRデータセットの実験では、微調整されたFlorenceが公式の課題メトリクスに対して正確なレスポンスを得ることが示された。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:04:13 GMT)
MultiRetNet: A Multimodal Vision Model and Deferral System for Staging Diabetic Retinopathy [0.0]
糖尿病網膜症(DR)は予防可能な失明の主要な原因であり、世界中で1億人以上に影響している。低所得層の個人は、診断前に進行するリスクが高く、主にスクリーニングへのアクセスが限られているためである。 DRステージング精度を向上させるために,網膜イメージング,社会経済的要因,および協調性プロファイルを組み合わせた新しいパイプラインであるMultiRetNetを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:00:31 GMT)
Microcausality and Tunneling Times in Relativistic Quantum Field Theory [0.0]
微視的因果性は超微視的トンネル力学を阻害することを示す。これらの結果はディラックフェルミオンとクライン=ゴードンボソンの数値計算で説明する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:58:48 GMT)
Likelihood-Free Gaussian Process for Regression [0.0]
確率モデルについてはほとんど知識がない場合もある。可能性自由ガウス過程(LFGP)と呼ばれる新しい枠組みを提案する。提案するフレームワークは、可能性のないモデリングに多大な貢献を期待する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:05:12 GMT)
Large Angular Momentum [0.0]
スピン $tfrac12$ ( a qubit) の量子状態は、ブロッホ球面の空間 $mathbf CP1 sim S2$ によってパラメータ化される。一般的な$j$に対するスピン$j$は、より大きな空間の点である$mathbf CP2j$で表される。本稿では,Stern-Gerlach過程,角-モーメント組成則,回転行列を解析することにより,これらの問題について議論する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:33:42 GMT)
KinForm: Kinetics Informed Feature Optimised Representation Models for Enzyme $k_{cat}$ and $K_{M}$ Prediction [0.0]
KinFormは、予測精度と運動パラメータの一般化を改善するために設計された機械学習フレームワークである。我々は,結合部位の確率プーリング,中間層選択,PCA,低密度タンパク質のオーバーサンプリングの改善を観察した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 14:34:57 GMT)
Hybrid Classical-Quantum Rainbow Table Attack on Human Passwords [0.0]
辞書ベースのパスワード生成と変換ルールを用いて虹色のテーブルを構築し,実際のユーザの振る舞いをモデル化する。我々はGroverのアルゴリズムの正確な分散版を使い、回路深度を低くし、決定論的成功をもたらす。全体として,構造化虹彩テーブルと効率的な量子探索を組み合わせたハイブリッドフレームワークを提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:51:38 GMT)
HistoryFinder: Advancing Method-Level Source Code History Generation with Accurate Oracles and Enhanced Algorithm [0.0]
HistoryFinderは、メソッド変更履歴の正確性と完全性を改善するために設計された新しいメソッド履歴生成ツールである。 CodeShovel、CodeTracker、IntelliJ、Gitベースのベースラインを精度、リコール、F1スコアで一貫して上回る。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:37:42 GMT)
High-fidelity, quasi-deterministic entanglement generation using phase-matched spectral islands in a zero-added-loss multiplexing architecture [0.0]
本稿では, スペクトル多重化手法を提案する。提案手法における大きな革新は, 密集率をN_I2$ではなくN_I2$とすることで, ベル状態の忠実度の高い光子対を現実的損失下で受信するために必要な弱スケズリング機構を実現することである。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 01:07:42 GMT)
Gauging non-invertible symmetries on the lattice [0.0]
1+1d格子ハミルトニアン系における有限非可逆対称性のゲージ化の処方則を提供する。ゲージ法では、各リンクに2つの量子ビットを導入し、非可逆対称性に対して「ゲージ場」のコサインを再生する。通常の$bbZ$をガウグするクラマース・ワニエ変換と同様に、ガウグはガウグマップで要約できる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:50:25 GMT)
Fluctuation-induced Hall-like lateral forces in a chiral-gain environment [0.0]
真空揺らぎは, キラルゲインを持つ一様非エルミート基板の近傍に位置する小粒子に横方向の力を与えることができることを示した。このタイプの非エルミート応答は、静電場で低対称性の導体をバイアスすることによって設計することができる。我々の理論は、場の相関関係におけるホールのような非対称性を明らかにし、量子幾何学とゆらぎによって引き起こされる現象の新たなリンクを確立する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 21:04:15 GMT)
Faster Low-Rank Approximation and Kernel Ridge Regression via the Block-Nyström Method [0.0]
Block-Nystr"omはブロック対角構造をNystr"omメソッドに注入するアルゴリズムである。第二次最適化のための改良されたプレコンディショナー構築にBlock-Nystr"omが利用できることを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:04:49 GMT)
FORTA: Byzantine-Resilient FL Aggregation via DFT-Guided Krum [0.0]
FORTAは、実ドメインで完全に動作する、ビザンチン耐性の安全なアグリゲーションフレームワークである。 DFTデコーダからのフィードバックを使ってKrumを洗練し、信頼できるアップデートの選択を改善します。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:17:24 GMT)
Exact steady state of perturbed open quantum systems [0.0]
摂動下での開量子系の正確な定常状態を決定するための一般的な非摂動的手法を提案する。この手法を3つの非自明な開量子系に適用する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:45:13 GMT)
ElectriQ: A Benchmark for Assessing the Response Capability of Large Language Models in Power Marketing [0.0]
電力マーケティングのカスタマーサービスは、問い合わせ、苦情、サービス要求に対処する上で重要な役割を果たす。 GPT-4oやClaude 3のような大きな言語モデル(LLM)は強力な汎用能力を示しているが、この分野で必要とされる専門知識や共感は欠如している。電力マーケティングシナリオにおけるLCMの評価と拡張を目的とした最初のベンチマークであるElectriQを紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:28:51 GMT)
Dynamic Context Tuning for Retrieval-Augmented Generation: Enhancing Multi-Turn Planning and Tool Adaptation [0.0]
マルチターン対話とツール環境の進化をサポートするためにRAGを拡張する軽量フレームワークであるDynamic Context Tuning (DCT)を提案する。 DCTは計画の精度を14%改善し、幻覚を37%削減し、GPT-4の性能と大幅に低いコストで一致させる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 17:46:19 GMT)
Disparities in Peer Review Tone and the Role of Reviewer Anonymity [0.0]
本研究は2つの主要な雑誌において8万件以上のレビューを調査する。レビューのトーン、感情、支持的な言語が、著者の人口層によってどのように異なるかを明らかにする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 20:19:21 GMT)
Discrete approach to machine learning [0.0]
本稿では,スパースビットベクトルと固定長線形ベクトルを用いた符号化および構造情報処理手法について検討する。コード空間の構造と性質を3つのモダリティを用いて検討した。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 11:39:54 GMT)
DiCE-Extended: A Robust Approach to Counterfactual Explanations in Machine Learning [0.0]
既存の生成方法は、近接性、多様性、堅牢性のバランスをとるのに苦労し、現実の応用性を制限する。広く採用されているフレームワークであるDiverse Counterfactual Explanations (DiCE)は多様性を強調しているが、堅牢性に欠けており、CFの説明は摂動やドメインの制約に敏感である。我々は、多目的最適化技術を統合し、解釈可能性を維持しながら堅牢性を向上させる拡張CF説明フレームワークであるDiCE-Extendedを紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 02:51:21 GMT)
Decomposed Quadratization: Efficient QUBO Formulation for Learning Bayesian Network [0.0]
二次的非制約二元最適化(QUBO)問題は近年大きな進歩を遂げている。目的関数におけるバイナリ変数の数を最小限にすることが不可欠である。そこで本研究では,従来の二次化手法よりもビット容量に有利なQUBOの定式化を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 00:56:59 GMT)
Coordinate Heart System: A Geometric Framework for Emotion Representation [0.0]
コーディネートハート(Coordinate Heart、CHS)は、人工知能アプリケーションにおける感情表現のための幾何学的なフレームワークである。我々は8つのコア感情を単位円上の座標として位置づけ、複雑な感情状態の数学的計算を可能にした。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:38:30 GMT)
Combining Cost-Constrained Runtime Monitors for AI Safety [0.0]
ランタイムモニタを単一の監視プロトコルに組み合わせる方法について検討する。我々のフレームワークは、望ましくない振る舞いを検出するために既存のモニターを組み合わせるための原則化された方法論を提供する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 04:28:40 GMT)
Bridging the Digital Divide: Small Language Models as a Pathway for Physics and Photonics Education in Underdeveloped Regions [0.0]
この記事では、低消費電力デバイス上でオフラインで実行できる、Small Language Models(SLM)互換のAIツールが、スケーラブルなソリューションを提供する方法について説明する。仮想チューターとして機能し、ネイティブ言語の教育を可能にし、インタラクティブな学習をサポートすることで、SLMは訓練された教育者の不足と実験室へのアクセスに対処するのに役立つ。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:03:53 GMT)
Backtranslation and paraphrasing in the LLM era? Comparing data augmentation methods for emotion classification [0.0]
本稿では,特にGPTのような大規模言語モデルを用いて,NLPのデータ拡張手法を体系的に検討する。バックトランスレーションとパラフレーズ化は、ゼロと数ショットの例に匹敵する、あるいはさらに良い結果をもたらす。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 12:23:20 GMT)
Automated Safety Evaluations Across 20 Large Language Models: The Aymara LLM Risk and Responsibility Matrix [0.0]
Aymara AIは、カスタマイズされたポリシーに基づく安全評価の生成と管理のためのプログラムプラットフォームである。自然言語の安全ポリシーを敵のプロンプトに変換し、人間の判断に対して検証されたAIベースのレーダを使用してモデル応答をスコアする。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 18:49:16 GMT)
Attention-Based Reconstruction of Full-Field Tsunami Waves from Sparse Tsunameter Networks [0.0]
本研究では,津波計ネットワークから予測を生成する津波データ同化手法に着目した。本モデルは,高分解能津波波動場を極めてスパースな観測から再構成するために用いられる。本研究では,Huygens-Fresnel Principle を用いた線形補間により,高密度観測ネットワークの生成において,線形補間を著しく上回っていることを示す。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 19:33:22 GMT)
Are Events Absolute? [0.0]
ウィグナーの友人思考実験は、量子力学において最も知的に挑発的で挑戦的な概念パズルの1つである。この記事では、ユージン・ウィグナー(Eugene Wigner)の独創的な思考実験の提案から始まる、一般的なプレゼンテーションを紹介する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:56:40 GMT)
Applications and Manipulations of Physics-Informed Neural Networks in Solving Differential Equations [0.0]
物理インフォームドニューラルネットワーク(PINN)は,前方および逆問題の両方を解くことができる。 PINNは、トレーニングセット境界外のモデル性能を改善するために、コスト関数にデータに関する事前解析情報を注入する。まず線形モデルと二次モデルから始まり、熱方程式や他の複素微分方程式のモデルに適合するように拡張する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 03:39:49 GMT)
Anisotropic Anderson localization in higher-dimensional nonreciprocal lattices [0.0]
高次元非相互格子におけるアンダーソン局在について検討する。我々は一方の方向に沿って皮膚の局在を示す異方性ハイブリッドモードを発見し、他方の方向に沿ってアンダーソンの局在を示す。解析は任意の次元にまで拡張し、無限次元の非相反ベテ格子上のスキン・アンダーソン転移の存在を実証する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 07:58:34 GMT)
Analysis of a 3D Integrated Superconducting Quantum Chip Structure [0.0]
本研究は3次元集積量子チップアーキテクチャの解析とシミュレーションを併用した研究である。分離した高抵抗シリコン基板上に作製された2つの超伝導量子ビットを積み重ねることで、フリップチップにインスパイアされた構造をモデル化する。固有周波数,Q因子,デコヒーレンス時間,非調和性,クロスカー,参加比,クビット結合エネルギーなどの重要な量子量を評価する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 09:20:42 GMT)
An Efficient Algorithm for Generating Minimal Unique-Cause MC/DC Test cases for Singular Boolean Expressions [0.0]
MC/DC(Modified Condition/Decision Coverage)は、重要なシステムの信頼性と安全性を確保するための構造的カバレッジ基準である。 Unique-Cause MC/DCは高い保証を提供するが、その効率的なテスト生成に関する研究は不足している。本稿は,N条件のSBEに対して,100%ユニクカスMC/DCを保証するため,N + 1ケースの最小限のテストセットを直接構築する決定論的アルゴリズムである'Robin's Rule'を提案する。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 16:30:39 GMT)
AI-Powered Precision in Sport Taekwondo: Enhancing Fairness, Speed, and Trust in Competition (FST.ai) [0.0]
FST.aiはSport Taekwondoの能力向上を目的としたAIベースのフレームワークである。キーアクションの識別と分類を自動化し、意思決定時間を数分から秒に短縮する。この枠組みは、柔道、空手、フェンシング、さらにはサッカーやバスケットボールのようなチームスポーツのようなアクション検出を必要とする幅広いスポーツに適応することができる。
論文参考訳（メタデータ） (Sat, 19 Jul 2025 15:14:45 GMT)