Fugu-MT: arxivの論文翻訳(概要)

Automated Black-box Prompt Engineering for Personalized Text-to-Image Generation [150.0]
PRISMは人間の解釈可能なプロンプトを自動生成するアルゴリズムである。大規模言語モデル(LLM)のジェイルブレイクにインスパイアされたPRISMは、LLMのコンテキスト内学習能力を活用して、候補のプロンプト分布を反復的に洗練する。本実験は,複数のT2Iモデルのオブジェクト,スタイル,画像の正確なプロンプトを生成する上で,PRISMの有効性と有効性を示すものである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:22:02 GMT)
Full-Duplex-Bench: A Benchmark to Evaluate Full-duplex Spoken Dialogue Models on Turn-taking Capabilities [93.1]
FullDuplexBenchは、重要なインタラクティブな振る舞いを体系的に評価するベンチマークである。ベンチマークコードを公開することによって、音声対話モデリングの進歩と、より自然で魅力的なSDMの開発を目指しています。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:46:19 GMT)
From Trial-and-Error to Improvement: A Systematic Analysis of LLM Exploration Mechanisms in RLVR [92.5]
検証可能な報酬付き強化学習(RLVR)は、大規模言語モデル(LLM)の推論能力を高めるための強力なパラダイムとして登場した。本技術報告では,RLVRにおける探査能力の体系的調査について述べる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:01:44 GMT)
VimoRAG: Video-based Retrieval-augmented 3D Motion Generation for Motion Language Models [91.4]
VimoRAGは、動画に基づく動き大言語モデル(LLM)のための動き生成フレームワークである。人間のポーズやアクションを識別する効果的な動き中心ビデオ検索モデルを開発した。 VimoRAG はテキストのみの入力に制約された動作 LLM の性能を大幅に向上させることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:31:14 GMT)
FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction [84.4]
FutureXは、将来の予測のための最大かつ最も多様なライブベンチマークである。リアルタイムの日次更新をサポートし、質問収集と回答収集のための自動パイプラインを通じてデータの汚染を取り除く。推論,検索機能,外部ツールの統合などを含む25のLLM/エージェントモデルを評価した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:54:08 GMT)
A Fluid Antenna Enabled Physical Layer Key Generation for Next-G Wireless Networks [83.9]
物理層鍵生成(PLKG)は、セキュリティインフラなしで無線チャネルから秘密鍵を入手することができる。厳しい伝播環境では、キー生成率(KGR)が著しく低下する。本稿では,この課題に対処するために,新しい流体アンテナ (FA) を用いたPLKGシステムを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:39:19 GMT)
Adaptively Clustering Neighbor Elements for Image-Text Generation [78.8]
我々はtextbfACF と呼ばれるトランスフォーマーに基づく新しい画像テキスト生成モデルを提案する。 ACFは、視覚パッチをオブジェクト領域と言語単語に適応的にクラスタリングし、暗黙的にオブジェクト・フレーズのアライメントを学習する。実験の結果,ほとんどのSOTAキャプションやVQAモデルよりも優れたACFの有効性が示された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:22:36 GMT)
Mind the Generation Process: Fine-Grained Confidence Estimation During LLM Generation [63.5]
大規模言語モデル(LLM)は自信過剰を示し、信頼度の高いスコアを誤った予測に割り当てる。本研究では,テキスト生成中に高精度できめ細かな信頼スコアを提供する信頼度推定手法であるFineCEを紹介する。論文で使用されたコードとすべてのベースラインはGitHubで公開されている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:29:35 GMT)
Categorical Schrödinger Bridge Matching [58.8]
Schr"odinger Bridge (SB)は、未ペアドメイン翻訳のような生成モデリングタスクを解決するための強力なフレームワークである。我々は、最近導入されたイテレーティブマルコフフィッティング(IMF)法を用いて、離散空間におけるSBを解くための理論的かつアルゴリズム的な基礎を提供する。これにより、我々はCSBM(Categorical Schr"odinger Bridge Matching)と呼ばれるSBの実用的な計算アルゴリズムを開発することができる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:29:31 GMT)
UniUGG: Unified 3D Understanding and Generation via Geometric-Semantic Encoding [57.9]
3Dモダリティのための最初の統一的理解・生成フレームワークUniUGGを紹介する。本フレームワークでは,LLMを用いて文や3次元表現の理解とデコードを行う。遅延拡散モデルを利用して高品質な3次元表現を生成する空間デコーダを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:27:31 GMT)
Subjective and Objective Quality Assessment of Banding Artifacts on Compressed Videos [55.1]
注目に値するバンドングアーティファクトは、ハイエンドのHDTVや高解像度のスクリーンで見るビデオの知覚的品質に深刻な影響を与える可能性がある。我々は、LIVE-YT-Bandingと呼ばれる、4つの異なる圧縮パラメータで生成された160のビデオからなる、第一種オープンビデオデータセットを作成しました。計7,200人の主観的意見が45人の被験者のコホートから集められている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:16:50 GMT)
LLM4CMO: Large Language Model-aided Algorithm Design for Constrained Multiobjective Optimization [54.8]
大規模言語モデル(LLM)は、アルゴリズム設計を支援する新しい機会を提供する。 LLM4CMOは,2つの人口構成をもつ2段階のフレームワークをベースとした新しいCMOEAである。 LLMは複雑な進化最適化アルゴリズムの開発において効率的な共同設計者として機能する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:00:57 GMT)
Research Challenges and Progress in the End-to-End V2X Cooperative Autonomous Driving Competition [54.3]
車両間通信(V2X)は、知覚範囲を拡大し運転安全性を高めるための重要な手段となっている。我々は,協調的時間知覚と協調的エンドツーエンド計画という2つのトラックを特徴とする,V2X協力によるエンドツーエンド自律運転を組織した。本稿では,バンド幅認識融合,堅牢なマルチエージェント計画,異種センサ統合といった重要な研究課題を取り上げ,課題の設計と成果について述べる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:20:38 GMT)
Towards Generalized Source Tracing for Codec-Based Deepfake Speech [52.7]
本稿では,意味的特徴符号化にWhisperを,音響的特徴符号化にAudioMAEにWav2vec2を併用したSemantic-Acoustic Source Tracing Network(SASTNet)を紹介する。提案したSASTNetは,CodecFake+データセットのCoSGテストセット上での最先端性能を実現し,信頼性の高いソーストレースの有効性を実証する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 22:33:43 GMT)
Performance and Storage Analysis of CRYSTALS Kyber as a Post Quantum Replacement for RSA and ECC [49.2]
CRYSTALS-Kyberは、2022年にNISTによって標準化されたポスト量子暗号ソリューションである。本研究は,様々な実装方式における性能試験を通じて,Kyberの実用可能性を評価する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:52:21 GMT)
Convex Physics Informed Neural Networks for the Monge-Ampère Optimal Transport Problem [49.2]
補給業者から顧客への原料の最適輸送は、物流における問題である。ここでは、対応する一般化モンジュ・アンペア方程式の解を求める物理情報ニューラルネットワーク法が提唱されている。特に、損失関数における輸送境界条件の実施に焦点が当てられている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:59:51 GMT)
SafeCtrl: Region-Based Safety Control for Text-to-Image Diffusion via Detect-Then-Suppress [48.2]
SafeCtrlは軽量で非侵襲的なプラグインで、まず安全でないコンテンツを正確にローカライズします。強硬なA-to-B置換を行う代わりに、SafeCtrlは有害なセマンティクスを抑える。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:28:52 GMT)
LLM-as-a-Judge for Privacy Evaluation? Exploring the Alignment of Human and LLM Perceptions of Privacy in Textual Data [47.8]
プライバシ-自然言語処理(NLP)分野の進歩にもかかわらず、プライバシの正確な評価は依然として課題である。テキストデータにおけるプライバシ評価モデルであるsox2013$にインスパイアされたグローバルアプローチを提案する。以上の結果から,プライバシ評価者としての評価者の可能性を探究する道が開けた。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:49:41 GMT)
RealTalk: Realistic Emotion-Aware Lifelike Talking-Head Synthesis [47.7]
本稿では,感情の正確さ,感情の制御性の向上,頑健なアイデンティティ保存を両立させた感傷的頭脳のためのフレームワークであるRealTalkを紹介する。 RealTalkは、感情ラベルの埋め込みを合成するオーディオを駆動する3D顔のランドマークを生成するために、変分オートエンコーダを使用している。実験により、RealTalkは感情の正確性、制御可能性、アイデンティティ保存において、既存の手法よりも優れていることが示された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:28:22 GMT)
Segmenting Objectiveness and Task-awareness Unknown Region for Autonomous Driving [46.7]
本稿では,自律走行シーンのためのセグメンティング・オブジェクトネスとタスク・アウェアネス(SOTA)という新しいフレームワークを提案する。 SOTAは、セマンティック・フュージョン・ブロック(SFB)を通じて目的のセグメンテーションを強化し、道路ナビゲーションタスクに関係のない異常をフィルタリングする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:30:54 GMT)
Connectivity structure and dynamics of nonlinear recurrent neural networks [46.6]
非線形リカレントニューラルネットワークにおいて,構造が高次元集合活動をどのように形成するかを解析する理論を開発する。単一ニューロンの活動では接続構造は見えず,集団活動は劇的に形成されている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:25:48 GMT)
Communicate Less, Synthesize the Rest: Latency-aware Intent-based Generative Semantic Multicasting with Diffusion Models [45.7]
我々は,事前学習した拡散モデルを用いた意図認識型セマンティック・マルチキャスト・フレームワークを開発した。提案するフレームワークでは,送信機は複数のユーザ意図に基づいて,ソース信号を複数のセマンティッククラスに分解する。シミュレーションの結果,非生成型および意図不明なマルチキャストベンチマークと比較すると,ユーザ毎のレイテンシが有意に低減された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:58:53 GMT)
VARAN: Variational Inference for Self-Supervised Speech Models Fine-Tuning on Downstream Tasks [43.7]
本稿では,レイヤアグリゲーションを個々の入力に動的に調整するVARANを提案する。 VARANは入力に基づいて層の特徴を適応的に優先順位付けする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:26:59 GMT)
Generic Event Boundary Detection via Denoising Diffusion [42.9]
ジェネリックイベント境界検出は、ビデオ内の自然な境界を識別することを目的としており、それを明瞭で意味のあるチャンクに分割する。従来は、決定論的予測に焦点が当てられ、可算解の多様性を見下ろしていた。 DiffGEBDと呼ばれる新しい拡散型境界検出モデルを導入し,ジェネレーティブの観点からGABDの問題に取り組む。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:44:34 GMT)
EventHallusion: Diagnosing Event Hallucinations in Video LLMs [42.7]
MLLM(Multimodal Large Language Models)はビデオ理解の分野で大きな進歩を遂げている。本稿では,イベントに対するビデオLLMの幻覚を評価する新しいベンチマークであるEventHallusionを提案する。また,ビデオLLMの幻覚化問題に対処するため,TCD(Temporal Contrastive Decoding)と呼ばれるシンプルで効果的な手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:45:26 GMT)
OneForecast: A Universal Framework for Global and Regional Weather Forecasting [42.5]
本稿では,グラフニューラルネットワークに基づくグローバルなネスト型気象予報フレームワーク(OneForecast)を提案する。動的システムパースペクティブとマルチグリッド理論を組み合わせることで,マルチスケールグラフ構造を構築し,対象領域を密度化する。動的ゲーティングユニットを用いた適応型メッセージング機構を導入し,ノードとエッジ機能を深く統合し,より正確なイベント予測を行う。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:08:09 GMT)
AdaRing: Towards Ultra-Light Vision-Language Adaptation via Cross-Layer Tensor Ring Decomposition [41.7]
本稿では,多層テンソルリング分解(TRD)に基づく視覚言語微調整フレームワークAdaRingを提案する。実験の結果,提案したAdaRingは,平均トレーニングパラメータを90%削減しつつ,最先端の性能を実現していることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:56:27 GMT)
SLAC: Simulation-Pretrained Latent Action Space for Whole-Body Real-World RL [41.3]
有能な家庭用・産業用ロボットの構築には、移動マニピュレータのような多目的で自由度の高いシステム(DoF)の制御を習得する必要がある。強化学習は、自律的なロボット制御ポリシーの獲得を約束するが、それをハイDoFに拡張することは依然として難しい。本稿では,現実のRLを複雑な具体化のためにレンダリングするSLACを紹介する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:41:09 GMT)
Scalable Gaussian Processes with Latent Kronecker Structure [40.2]
クロネッカー積のような行列構造は演算を著しく加速させることができるが、それらの応用は一般に近似や非現実的な仮定を必要とする。我々は、潜在クロネッカー積の射影として観測値のカーネル行列を表現し、潜在クロネッカー構造を活用することを提案する。提案手法は,最大500万例の実世界のデータセットにおいて,最先端のスパースと変分GPより優れていることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:19:14 GMT)
Simple o3: Towards Interleaved Vision-Language Reasoning [38.5]
我々は、動的ツールインタラクションをインターリーブされた視覚言語推論に統合する、エンドツーエンドのフレームワークであるSimple o3を提案する。提案手法は,高品質な視覚言語推論チェーンを生成するスケーラブルなデータ合成パイプラインを特徴とする。実験の結果、Simple o3は様々なベンチマークで優れたパフォーマンスを示し、既存のアプローチよりも優れています。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 17:15:39 GMT)
Impact of Clinical Image Quality on Efficient Foundation Model Finetuning [37.7]
医用画像の基礎モデルではラベル効率が有望であることが示され、注釈付きデータのごく一部で下流のパフォーマンスが向上した。本稿では、大規模な前立腺MRIデータセットに基づいて事前訓練されたドメイン固有視覚基盤モデルProFoundを用いて、前立腺MRIにおいてこれを評価する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:33:36 GMT)
FacLens: Transferable Probe for Foreseeing Non-Factuality in Fact-Seeking Question Answering of Large Language Models [35.0]
本研究は、非実効性予測(NFP)について研究し、LLMが応答生成に先立って非実効性応答を生成するかどうかを予測する。ファクチュアリティレンズ (FacLens) と呼ばれる軽量なモデルを提案し, 事実探索質問の隠れ表現を効果的に探索する。大規模な実験は、FacLensの効率性と効率性の両方における優位性を強調している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:05:42 GMT)
Multi-Modal Drift Forecasting of Leeway Objects via Navier-Stokes-Guided CNN and Sequence-to-Sequence Attention-Based Models [33.7]
海上環境におけるリーウェイ物体の漂流(変位)を正確に予測することは、依然として重要な課題である。本稿では,Sentence Transformerの埋め込みと注目に基づくシーケンス・ツー・シーケンスアーキテクチャを統合したマルチモーダル機械学習フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:01:29 GMT)
MUC: Machine Unlearning for Contrastive Learning with Black-box Evaluation [33.4]
本稿では,Machine Unlearning for Contrastive Learning(MUC)フレームワークを導入し,既存の手法を適用した。いくつかの手法が未学習者として不十分に動作し、既存の評価ツールが対照的な学習における未学習効果を検証していることに注意して、現在のアプローチにおける制限を識別する。我々は、ACが最先端のパフォーマンスを達成し、正確な未学習(リトレーニング)を近似し、データ所有者がブラックボックス評価によって未学習効果を明確に可視化できることを実証した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:17:44 GMT)
DynamixSFT: Dynamic Mixture Optimization of Instruction Tuning Collections [33.0]
DynamixSFTは、命令調整データセットの混合最適化のための動的かつ自動化された方法である。 Tulu-v2-mixtureコレクションに適用すると、DynamixSFTは10ベンチマークで最大2.2%のパフォーマンス向上を達成した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:01:39 GMT)
TBGRecall: A Generative Retrieval Model for E-commerce Recommendation Scenarios [31.1]
本稿では,eコマースアプリケーションのための生成検索モデルを強化するフレームワークTBGRecallを提案する。トレーニングの方法論では、パイプラインは制限された履歴データの事前トレーニングと部分的なインクリメンタルトレーニングを統合します。 TaoBaoの大規模産業データセットとともに公開ベンチマークを行い,TBGRecallが最先端のレコメンデーション手法より優れていることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:31:11 GMT)
Shape from Semantics: 3D Shape Generation from Multi-View Semantics [31.0]
既存の3D再構成手法では, 3次元画像, 3次元点雲, 形状輪郭, 単一意味論などのガイダンスを用いて3次元表面を復元する。図形や外観が、異なる視点から見ると、与えられたテキストの意味と一致した3Dモデルを作成することを目的として、新しい3Dモデリングタスク「Shape from Semantics'」を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:30:43 GMT)
Mitigating Jailbreaks with Intent-Aware LLMs [29.7]
大規模言語モデル(LLM)は、反対に作られた命令によってジェイルブレイク攻撃に対して脆弱である。 Intent-FTはシンプルで軽量な微調整手法で、LLMに応答する前に命令の基本的な意図を推測するように明示的に訓練する。実証的には、Intent-FTは評価されたすべての攻撃カテゴリを一貫して緩和し、単一の攻撃が50%の成功率を超えない。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:03:33 GMT)
Mobile-R1: Towards Interactive Reinforcement Learning for VLM-Based Mobile Agent via Task-Level Rewards [29.5]
対話型マルチターン強化学習とタスクレベルの報酬をモバイルエージェントに提供するMobile-R1を紹介する。トレーニングフレームワークは,初期形式微調整,アクションレベル報酬によるワンステップオンライントレーニング,マルチターン軌道に基づくタスクレベル報酬によるオンライントレーニングの3段階で構成されている。この戦略はMobile-R1の探索と誤り訂正機能を強化するために設計されており、大幅な性能向上につながっている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:23:21 GMT)
Scaling Generative Recommendations with Context Parallelism on Hierarchical Sequential Transducers [29.1]
本稿では,HSTUアテンションに対するジャグテンソルサポートによるコンテキスト並列化を導入し,シーケンス次元のスケールアップのための基礎的機能を確立する。提案手法により,分散データ並列処理(DDP)と組み合わせることで,ユーザインタラクションのシーケンス長が5.3倍向上し,スケーリング係数が1.55倍になる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:20:02 GMT)
FastCuRL: Curriculum Reinforcement Learning with Stage-wise Context Scaling for Efficient Training R1-like Reasoning Models [28.4]
我々は,LLM学習と推論を効率的に行うために,段階的コンテキストスケーリングを備えたカリキュラムRLフレームワークであるFastCuRLを提案する。 FastCuRL-1.5B-V3は5つの競合レベルのベンチマークで最先端の推論モデルよりも優れ、AIME 2024では49.6%の精度を達成した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:59:11 GMT)
OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation [27.9]
Retrieval-augmented Generation (RAG)は、幻覚を抑えるために外部知識を統合することで、言語モデル(LLM)を強化する。 RAGの本質的な部分として、光学文字認識(OCR)を用いて構造化されていないPDF文書から構造化されたデータを抽出して外部知識ベースを構築することが一般的である。本稿では,RAGシステムにおけるOCRのカスケード効果を理解するための最初のベンチマークであるOHRBenchを紹介する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:42:27 GMT)
LLMs Struggle with NLI for Perfect Aspect: A Cross-Linguistic Study in Chinese and Japanese [27.0]
異なる形態の英語とは異なり、中国語と日本語は、完全な側面の中で時制の別個の文法形式を欠いている。言語を動機づけたテンプレートベースの自然言語推論データセット(言語毎に1,350対)を構築した。実験により、先進的なLLMでさえ時間的推測に苦しむことが明らかとなり、特に微妙な時制や基準時間シフトを検出する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:16:56 GMT)
MedFormer: a data-driven model for forecasting the Mediterranean Sea [26.2]
我々は地中海における中距離海洋予測のための完全データ駆動深層学習モデルであるMedFormerを紹介する。このモデルは、20年間の毎日の海洋再分析データに基づいて訓練され、高解像度の運用分析で微調整される。我々は,ヨーロッパ・地中海気候変動センターで開発された,最先端の地中海予報システム(MedFS)に対するMedFormerのベンチマークを行った。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:05:03 GMT)
MAPF-World: Action World Model for Multi-Agent Path Finding [26.2]
マルチエージェントパス探索(MAPF)は、指定された開始地点から複数のエージェントのゴール位置までの競合のない経路を計画する問題である。近年の分散学習可能解法は大規模MAPFに大いに期待されている。本研究では,MAPFの自己回帰行動世界モデルであるMAPF-Worldを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:50:26 GMT)
Optimizing Token Choice for Code Watermarking: A RL Approach [24.3]
我々は,新しい強化学習訓練パラダイムを基盤とした適応型コード透かしフレームワークであるCodeTracerを紹介する。 CodeTracerの中核となるのは、パラメータ化モデルを使用してトークン選択をインテリジェントにバイアスするポリシ駆動のアプローチだ。政策学習を容易にするために,実行フィードバックを透かし埋め込み信号とシームレスに統合する包括的報酬システムを開発した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:11:29 GMT)
Demystifying Foreground-Background Memorization in Diffusion Models [23.9]
拡散モデル(DM)はトレーニング画像を記憶し、生成中にほぼ重複を再現することができる。現在の検出法は動詞の暗記を識別するが、2つの重要な側面を捉えることができない。生成した画像内の記憶領域を分類・定量化するセグメンテーションに基づく新しい指標であるフォアグラウンド背景記憶法(FB-Mem)を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:15:16 GMT)
Affordance-R1: Reinforcement Learning for Generalizable Affordance Reasoning in Multimodal Large Language Model [23.6]
Affordance Groundingは、ロボットが実行するアクションに関連するオブジェクトの特定の領域を予測することに焦点を当てている。既存のモデルは、しばしば異なるオブジェクト間で共有される余裕を無視する。 Affordance-R1は,認知的CoT誘導グループ相対的政策最適化を統合した,最初の統合型アプライアンス基盤フレームワークである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:00:05 GMT)
FormCoach: Lift Smarter, Not Harder [23.2]
FormCoachは、常にオンで対話的なAIトレーニングパートナで、微妙なフォームエラーを見つけ出し、リアルタイムで調整された修正を提供する。我々は、Webインターフェースと最先端のビジョン言語モデル(VLM)を用いて、1,700人のエキスパートによる注釈付きユーザ参照ビデオペアのデータセット上で、この機能を実証する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:20:34 GMT)
Dropping Just a Handful of Preferences Can Change Top Large Language Model Rankings [23.2]
そこで我々はBradley-Terryランキングシステムのロバスト性を評価する手法を提案する。トップパフォーマンスモデルのBradley-Terryランキングは,少数の評価の除去に非常に敏感であることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:01:33 GMT)
Crossing the Human-Robot Embodiment Gap with Sim-to-Real RL using One Human Demonstration [21.9]
本稿では,タスクを実演する人間の1つのRGB-Dビデオのみを用いて,創発的な操作ポリシーを訓練する,新しいリアルタイム・シミュレート・トゥ・リアルフレームワークを提案する。 Human2Sim2Robotは、オブジェクト認識のリプレイを55%以上上回り、模倣学習を68%以上上回っている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:32:53 GMT)
Rethinking Model Redundancy for Low-light Image Enhancement [21.9]
低照度画像強調(LLIE)は、照明の改善、ノイズ低減、低照度画像の画質向上を目的とした、計算写真の基本的な課題である。最近の進歩は、主に複雑なニューラルネットワークモデルのカスタマイズに焦点が当てられているが、これらのモデルには大きな冗長性があり、さらなる性能改善が制限されている。この再考に触発されて,LLIE性能を改善しながらモデル冗長性を緩和する2つの革新的な手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:48:06 GMT)
TRIALSCOPE: A Unifying Causal Framework for Scaling Real-World Evidence Generation with Biomedical Language Models [21.4]
本稿では,大規模観測データから堅牢な実世界の証拠を生成するためのフレームワークであるTRIALSCOPEを提案する。このフレームワークは、高品質な構造化された患者データを自動的にキュレートし、データセットを拡張し、非構造化形式でのみ利用可能な主要な患者属性を組み込む。また,TriALSCOPEは,抽出した実世界のデータから,肺癌および膵癌の臨床試験の結果を再現できることを示した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:33:01 GMT)
Transferable Class Statistics and Multi-scale Feature Approximation for 3D Object Detection [20.4]
本稿では,知識蒸留に基づく単一地区からの点ベースマルチスケール特徴を近似する。本稿では, 一つの地区における構成多様性の喪失を補うため, 伝達可能な特徴埋め込み機構を設計する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:27:01 GMT)
OVG-HQ: Online Video Grounding with Hybrid-modal Queries [19.9]
ビデオグラウンドタスクは、クエリに基づいて、通常テキスト形式で、ビデオ内の特定のモーメントを見つけることに焦点を当てる。従来のVGは、ビデオのストリーミングや、ビジュアルなキューを使ったクエリなど、いくつかのシナリオで苦労している。テキスト,画像,ビデオセグメント,およびそれらの組み合わせを用いたオンラインセグメントのローカライズを可能にする,OVG-HQ(Online Video Grounding with Hybrid-modal Queries)というタスクを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:21:45 GMT)
MOON: Generative MLLM-based Multimodal Representation Learning for E-commerce Product Understanding [19.9]
生成型多モーダル大規模言語モデルは,製品表現学習の改善に重要な可能性を秘めている。製品表現学習のための第1世代MLLMモデルMOONを提案する。本手法では,マルチモーダルおよびアスペクト特化商品のターゲットモデリングに,Mixture-of-Experts (MoE) モジュールを用いた。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:59:25 GMT)
SCORE: Story Coherence and Retrieval Enhancement for AI Narratives [19.8]
SCOREはストーリーコヒーレンスと検索の強化のためのフレームワークである。主要なアイテムのステータスを追跡し、エピソードの要約を生成する。 TF-IDFとコサイン類似性を取り入れ、関連するエピソードを特定し、全体のストーリー構造を強化する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:27:56 GMT)
Token-level Accept or Reject: A Micro Alignment Approach for Large Language Models [19.3]
マイクロトークンレベルのアクセプション・アライニング(MARA)は、言語モデルとは独立して動作するように設計されている。 MARAは、文レベルの選好学習をトークンレベルのバイナリ分類に分解することで、アライメントプロセスを単純化する。実験により,MARAは計算コストを削減しつつアライメント性能を大幅に向上することが示された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:40:47 GMT)
Sub-Sequential Physics-Informed Learning with State Space Model [18.6]
PINNMambaは、サブシーケンスモデリングをSSMで導入する新しいフレームワークである。 PINNMambaは最先端アーキテクチャと比較してエラーを最大86.3%削減できることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:07:17 GMT)
MHPP: Exploring the Capabilities and Limitations of Language Models Beyond Basic Code Generation [18.2]
大規模言語モデル(LLM)は、特に関数レベルでコード生成を大幅に改善した。そこで本研究では,HumanEvalとMBPPの2つの共通ベンチマークを解析し,LLMのコード生成能力を十分に評価できないことを示した。これを解決するために、210の独特な人為的問題からなるMostly Hard Python Problemsデータセットを紹介した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:00:25 GMT)
Overcoming Long-Context Limitations of State-Space Models via Context-Dependent Sparse Attention [17.5]
状態空間モデル(SSM)の長期コンテキストモデリング機能の解析と改善に焦点をあてる。本稿では,広く使用されている合成課題である連想的リコールが,実世界の長文モデリングの複雑さを十分に表していることを示す。理論的解析と実世界の応用のギャップを埋めるために, 疎鍵選択による局所性に敏感なハッシュ注意を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:36:51 GMT)
Deciphering the Interplay between Attack and Protection Complexity in Privacy-Preserving Federated Learning [17.0]
フェデレートラーニング(FL)は、データのプライバシを維持しながら協調的なモデルトレーニングのための有望なパラダイムを提供する。 Attack Complexity"は、敵がプライベートデータを再構築するのに必要となる最小限の計算およびデータリソースである。「保護複雑性」は、プライバシーメカニズムによってもたらされるであろう歪みである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:39:16 GMT)
NeFT: Negative Feedback Training to Improve Robustness of Compute-In-Memory DNN Accelerators [16.9]
ネットワーク全体のマルチスケールノイズ情報をより効果的に捉えるために,Negative Feedback Training (NeFT)を提案する。 NeFTは既存の最先端の手法よりも45.08%向上している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:40:11 GMT)
WiseLVAM: A Novel Framework For Left Ventricle Automatic Measurements [16.8]
臨床ガイドラインでは,Bモード心エコー画像の左室リニア計測を基礎レベルで行うことを推奨している。ほとんどの自動化された手法は、測定タスクのBモード画像から直接ランドマークを推定する。 textitWiseLVAM - SLを自動的に配置し、AMMモードでLV線形測定を自動的に実行する、新しく、完全に自動化され、手動で適応可能なフレームワーク。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:58:01 GMT)
Few-shot Class-incremental Fault Diagnosis by Preserving Class-Agnostic Knowledge with Dual-Granularity Representations [16.2]
FSC-FD(Few-Shot Class-Incremental Fault Diagnosis)は,実世界の産業システムにおいて重要である。本稿では,Dual-Granularity Guidance Network(DGGN)と呼ばれる,Dual-Granularity Representationsに基づく新しいフレームワークを提案する。提案したDGGNは最先端のFSC-FD手法と比較して診断性能と安定性に優れる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:14:07 GMT)
SAMDWICH: Moment-aware Video-text Alignment for Referring Video Object Segmentation [16.1]
Referring Video Object (RVOS)は、自然言語表現に基づくビデオ内のオブジェクトのセグメンテーションと追跡を目的としている。現行の手法は、訓練中、フレームサンプリングとすべての可視物体の監視が区別できないため、意味的ミスアライメントに悩まされることが多い。我々は、SAMDWICHというモーメントを意識したRVOSフレームワークと、新しい注釈付きデータセットMeViS-Mを、挑戦的なMeViSベンチマークに基づいて導入する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:34:43 GMT)
CAMF: Collaborative Adversarial Multi-agent Framework for Machine Generated Text Detection [16.1]
既存のゼロショット検出パラダイムは、しばしば重大な欠陥を示す。マルチLLMエージェントを用いた新しいアーキテクチャである textbfCAMF を紹介する。この構造化された協調的・敵対的プロセスは、非人間の起源を示す微妙でクロス次元のテキストの不一致の深い分析を可能にする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:25:27 GMT)
Emoji Attack: Enhancing Jailbreak Attacks Against Judge LLM Detection [15.8]
脱獄テクニックは、LLM(Large Language Models)を騙して制限された出力を生成し、潜在的な脅威を生じさせる。 1つの防衛線は、生成されたテキストの有害性を評価するために、別の裁判官 LLM を裁判官として使用することである。トークンセグメンテーションバイアスを利用して既存のジェイルブレイクプロンプトを増幅する新しい戦略である絵文字アタックを導入する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:07:24 GMT)
InstDrive: Instance-Aware 3D Gaussian Splatting for Driving Scenes [15.4]
本稿では,動的駆動シーンのインタラクティブな再構成に適したインスタンス認識型3Dガウス平滑化フレームワークInstDriveを提案する。本研究では,SAM が生成したマスクを擬似基底構造として用いて,対照的な損失と擬似教師対象を通して2次元特徴学習を誘導する。 3Dレベルでは、インスタンスのアイデンティティを暗黙的にエンコードし、ボクセルベースの損失を通じて一貫性を強制する正規化を導入する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:17:31 GMT)
In-Context Examples Matter: Improving Emotion Recognition in Conversation with Instruction Tuning [15.2]
会話における感情認識 (ERC) は、会話における各発話の感情を特定することを目的としている。 InitERCは,ERCのためのワンステージ・イン・コンテクスト・イン・コンテクスト・チューニング・フレームワークである。 InitERCはLLMに適応し、コンテキストの例からコンテキスト内命令チューニングを通じて話者・コンテキスト・感情アライメントを学習する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:23:48 GMT)
Universal Learning of Nonlinear Dynamics [15.0]
本研究では,不規則な非線形力学系を極端に安定に学習する基礎的問題について検討する。本稿では,スペクトルフィルタリング技術に基づくこの問題に対するアルゴリズムについて述べる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:14:47 GMT)
WebGeoInfer: A Structure-Free and Multi-Stage Framework for Geolocation Inference of Devices Exposing Information [14.1]
本研究では,多段階情報拡張を利用した構造自由な位置推定フレームワークであるWebGeoInferを紹介する。 WebGeoInferは94の国と2,056の都市で5,435台のデバイスを推定し、それぞれ96.96%、88.05%、79.70%の精度を達成した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:14:54 GMT)
QuarkMed Medical Foundation Model Technical Report [14.1]
医療タスクは、専門知識、専門的正確性、カスタマイズ能力を必要とすることが多い。 QuarkMedは、キュレートされた医療データ処理、医療コンテンツ検索強化生成(RAG)、大規模で検証可能な強化学習パイプラインを活用することで、これらのニーズに対処する。このモデルは中国医学ライセンス試験で70%の精度を達成し、様々な医学ベンチマークで強力な一般化を実証した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:47:52 GMT)
PEdger++: Practical Edge Detection via Assembling Cross Information [14.0]
エッジ検出は、オブジェクト検出、セマンティックセグメンテーション、画像編集など、多数のコンピュータビジョンアプリケーションにとって重要な基盤となっている。ディープラーニングは明らかに精度を向上しているが、しばしば高い計算コストに悩まされ、リソース制約のあるデバイスに適用性を制限する。エッジ検出精度を向上しつつ,計算コストとモデルサイズを削減することを目的とした協調学習フレームワークであるPEdger++を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:48:36 GMT)
Quantifying Coherence and Genuine Multipartite Entanglement : A Framework Based on Witness Operators and Frobenius Norm Distance [13.8]
量子系の絡み合いとコヒーレンスを定量化することは、理論的および実践的な重要な関心事である。本稿では,複数の広く使用されているコヒーレンス対策と真の多部絡み合い対策の下位境界を評価する手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:38:15 GMT)
An Improved Algorithm for Adversarial Linear Contextual Bandits via Reduction [13.8]
逆損失とアクションセットを持つ線形文脈帯域に対する効率的なアルゴリズムを提案する。我々のアルゴリズムは、まず最初に$text(d)sqrtT$後悔を達成するが、事前のアルゴリズムが我々の知識に間に合うように$o(T)$後悔することはない。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:25:18 GMT)
PVChat: Personalized Video Chat with One-Shot Learning [13.7]
PVChatは単発の学習フレームワークで、被験者ごとに単一のビデオから回答できる。提案手法は、合成強化ビデオQAデータセット上で、Mixture-of-Heads(MoH)拡張ViLLMを最適化する。医療シナリオ,テレビシリーズ,アニメ,実世界の映像を対象とした多様なデータセットを用いてPVChatを評価した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:06:10 GMT)
Planner-Refiner: Dynamic Space-Time Refinement for Vision-Language Alignment in Videos [13.6]
Planner-Refinerは言語と視覚の間のセマンティックギャップを橋渡しするフレームワークである。 Plannerモジュールは複雑な言語的プロンプトを分解することで言語指導をスケジュールする。 Refinerは各短い文、名詞句と動詞句のペアを処理し、空間を横断する視覚トークンの自己注意を指示する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:55:14 GMT)
STRIDE: Structure and Embedding Distillation with Attention for Graph Neural Networks [13.5]
知識蒸留(KD)はグラフニューラルネットワーク(GNN)の最も有望な圧縮技術の一つである GNNのKDアプローチは、最後のレイヤの出力のみを考慮し、GNNの中間レイヤの出力を考慮しない。我々は、構造と埋め込み蒸留(STRIDE)と呼ばれるGNN圧縮のための新しいKD手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:52:31 GMT)
Interpretable and Robust AI in EEG Systems: A Survey [13.3]
本稿では, 逆伝播, 摂動, 本質的に解釈可能な方法の3つのタイプに分類し, 解釈可能性の分類法を提案する。我々は、頑健性メカニズムをノイズとアーティファクト、人間の多様性、データ取得不安定性、敵攻撃の4つのクラスに分類する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:25:51 GMT)
Set-Valued Transformer Network for High-Emission Mobile Source Identification [13.3]
実測データでは、高エミッション状態データの比率は通常の排出状態に比べて著しく低い。高エミッションサンプルから識別特徴の包括的学習を実現するために,Set-Valued Transformer Network (SVTN)を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:30:01 GMT)
Clean Code, Better Models: Enhancing LLM Performance with Smell-Cleaned Dataset [13.2]
この研究は、コード臭いの観点からデータセットの品質を評価し改善する最初の体系的な研究である。コード臭を自動的に除去する,LCMベースのコード臭除去ツールSmellCCを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:40:58 GMT)
Scalable RF Simulation in Generative 4D Worlds [13.0]
WaveVerseはプロンプトベースでスケーラブルなフレームワークで、生成された屋内シーンのリアルなRF信号を人間の動きでシミュレートする。条件付き人体運動生成におけるアプローチの有効性を実証し,ビームフォーミングと呼吸監視に位相コヒーレンスがどのように適用されているかを明らかにする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:02:14 GMT)
No More Blind Spots: Learning Vision-Based Omnidirectional Bipedal Locomotion for Challenging Terrain [12.5]
視覚に基づく全方向二足歩行のための学習フレームワークを提案する。重要な課題は、シミュレーションにおいて一方向の深度画像をレンダリングする計算コストが高いことである。本手法は、視覚に基づく生徒政策を監督する教師ポリシーと、頑健なブラインドコントローラを組み合わせる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:20:46 GMT)
No More Marching: Learning Humanoid Locomotion for Short-Range SE(2) Targets [12.5]
短距離ヒューマノイド移動はSE(2)目標へのタスクの実行にエネルギー効率が良い必要がある。本研究では,SE(2)目標に対するヒューマノイド移動を直接最適化する強化学習手法を開発した。新しい星座型報酬関数は自然かつ効率的な目標指向運動を促進する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:48:52 GMT)
Differentiable Room Acoustic Rendering with Multi-View Vision Priors [12.3]
本研究では,多視点画像から抽出した視覚的手がかりとアコースティックビームトレーシングを利用した物理ベースの室内音響レンダリングシステムであるAV-DARについて紹介する。 2つのデータセットから6つの実世界の環境にまたがる実験は、我々のマルチモーダルな物理ベースのアプローチが効率的で解釈可能で正確であることを示した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:26:06 GMT)
Generative Medical Event Models Improve with Scale [12.3]
医療イベントデータにおける最大のスケーリング法則について述べる。最大10億のパラメータを持つ計算最適モデルを事前学習した。診断予測や疾患予後,医療活動など,78の現実的課題について検討した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 17:00:51 GMT)
CORE: Measuring Multi-Agent LLM Interaction Quality under Game-Theoretic Pressures [12.3]
対話型ロバストネス評価スコア:COREは,マルチエージェントシステムにおける言語使用の有効性を定量化する指標である。競合性,協調性,中立性にまたがるペアワイズな大言語モデルダイアログにCOREを適用します。以上の結果から, 協力的設定ではIPF分布の急激な増加とヒープ指数の上昇が見られ, 語彙展開の増大とともに反復性が向上することが示唆された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:26:36 GMT)
iFairy: the First 2-bit Complex LLM with All Parameters in $\{\pm1, \pm i\}$ [12.2]
QAT(Quantization-Aware Training)は、量子化をトレーニングループに統合し、LLMが堅牢な低ビット表現を学習できるようにする。複素数値 LLM のための最初の2ビット量子化フレームワークである Fairy$pm i$ を提案する。我々は重みを単位の$pm1, pm i$の4番目の根にマッピングし、完全に対称で情報理論的に最適な2ビット表現を形成する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:36:32 GMT)
AugLift: Boosting Generalization in Lifting-based 3D Human Pose Estimation [12.1]
検出された2Dキーポイントから3Dポーズを予測する方法は、しばしば新しいデータセットや実世界の設定に悪影響を及ぼす。我々は,データ収集やセンサの追加を必要とせずに,一般化性能を大幅に向上する標準リフトパイプラインの再構成であるemphAugLiftを提案する。 AugLiftはモジュラーアドオンとして機能し、既存のリフトアーキテクチャに簡単に統合できる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:07:52 GMT)
VELVET-Med: Vision and Efficient Language Pre-training for Volumetric Imaging Tasks in Medicine [12.0]
我々は,3次元CTや関連する放射線学報告など,限られたボリュームデータを対象とした視覚言語事前学習フレームワーク「textbfVELVET-Med」を提案する。本研究は,ボリューム医療画像とそれに対応する臨床物語に埋め込まれた,豊かな空間的・意味的関係を明らかにすることを目的としている。結果として得られるエンコーダは強い転送可能性を示し、幅広い下流タスクで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 17:08:43 GMT)
Too Easily Fooled? Prompt Injection Breaks LLMs on Frustratingly Simple Multiple-Choice Questions [12.0]
大規模言語モデル(LLM)は、最近、複雑な推論とゼロショットの一般化において、強力な創発的能力を示している。プロンプトインジェクション攻撃による堅牢性では、悪意のある命令がコンテンツに埋め込まれて出力を操作できるが、依然として大きな懸念点である。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:30:08 GMT)
ToxiEval-ZKP: A Structure-Private Verification Framework for Molecular Toxicity Repair Tasks [11.8]
本稿では,分子毒性修復の課題に焦点をあてる。構造プライベートな検証フレームワークであるToxiEval-ZKPを提案する。このタスクの評価プロセスにゼロ知識証明機構を導入する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:19:47 GMT)
User-Assistant Bias in LLMs [11.8]
大規模言語モデル(LLM)は、チャット履歴における自身の情報やユーザの情報への依存に偏りがあり、マルチターン会話において過度に頑固あるいは同意的な振る舞いをもたらす。我々は,フロンティアLLMにおけるユーザ・アシスタントバイアスをベンチマークし,理解し,操作するために,8kのマルチターン会話データセットであるtextbfUserAssist$を導入している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:33:09 GMT)
Exploring Efficiency Frontiers of Thinking Budget in Medical Reasoning: Scaling Laws between Computational Resources and Reasoning Quality [11.7]
本研究は,医学的推論タスクにおける思考予算機構の包括的評価である。 Qwen3とDeepSeek-R1の2つの主要なモデルファミリーを、様々な専門性や難易度にまたがる15の医療データセットで評価した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:25:06 GMT)
Deep Learning For Point Cloud Denoising: A Survey [11.7]
実世界の環境由来の点雲は、様々なモダリティや強度にわたって必ずノイズを示す。ダウンストリームタスクパフォーマンスを改善するための前処理ステップとして,ポイントクラウドデノイング(PCD)が不可欠である。深層学習(DL)ベースのPCDモデルは、その強力な表現能力と柔軟なアーキテクチャで知られており、性能を損なう従来の手法を超越している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:25:19 GMT)
ComplicitSplat: Downstream Models are Vulnerable to Blackbox Attacks by 3D Gaussian Splat Camouflages [11.7]
ComplicitSplatは、標準的な3DGSシェーディング手法を利用して、敵のコンテンツをシーンオブジェクトに埋め込む最初の攻撃である。実験の結果,ComplicitSplatは様々な検出器の攻撃に成功していることがわかった。これは3DGSを使った下流オブジェクト検出器に対する最初のブラックボックス攻撃であり、自律ナビゲーションやその他のミッションクリティカルなロボットシステムのようなアプリケーションにとって、新たな安全リスクが露呈している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:38:34 GMT)
Can LLMs Handle WebShell Detection? Overcoming Detection Challenges with Behavioral Function-Aware Framework [11.6]
WebShellの攻撃は、重大なサイバーセキュリティの脅威となる。従来のMLとDLメソッドは、広範囲なトレーニングデータの必要性などの課題によって、しばしば妨げられる。コード関連タスクの強力な代替手段として、大規模言語モデルが登場しました。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:19:47 GMT)
Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment [11.6]
実践的な授業では、従来のテキストベースの授業であるシラビで提供される情報を徹底的に読み書きし、完全に理解する学生はほとんどいなかった。本稿では,AIが生成する歌声と仮想アバターを利用して,より視覚的に魅力的で魅力的で記憶に残る形式でシラビを提示する手法を提案する。学生のフィードバックから,AIで歌ったシラビは重要なコース情報の認識とリコールを著しく改善した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:12:39 GMT)
LARC: Towards Human-level Constrained Retrosynthesis Planning through an Agentic Framework [11.4]
LARC(LLM-based Agentic framework for Retro synthesis planning for Constraints)について述べる。 LARCは、Agent-as-a-Judgeを通じて、再合成計画プロセスに直接エージェント制約評価を組み込む。 LARCを3種類の制約型にまたがる48個の制約付き再合成計画課題に対して厳格に評価した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:05:26 GMT)
Reasoning and Learning a Perceptual Metric for Self-Training of Reflective Objects in Bin-Picking with a Low-cost Camera [11.0]
低コストのRGB-Dカメラを用いた金属オブジェクトのビンピッキングは、しばしばスパース深度情報と反射面テクスチャに悩まされる。本稿では,メートル法学習段階と自己学習段階からなる2段階の枠組みを提案する。提案手法は,ROBIデータセットと新たに導入したSelf-ROBIデータセットの両方において,最先端の手法よりも優れている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:12:35 GMT)
A Novel Unified Extended Matrix for Graph Signal Processing: Theory and Application [10.9]
本稿では、パラメトリック設計により拡張隣接行列と統一グラフ表現行列を統合する統合拡張行列(UEM)フレームワークを提案する。合成および実世界のデータセットに対する実験結果から,UEM-GFTは異常検出タスクにおいて既存のGSOベースの手法よりも優れていることが示された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:30:41 GMT)
Adversarial Robustness in Distributed Quantum Machine Learning [10.7]
量子機械学習(QML)モデルの敵対的堅牢性の研究は、古典的モデルに対するその潜在的な利点を理解し、信頼できるシステムを構築するために不可欠である。分散QMLモデルにより、複数の量子プロセッサを活用して、個々のデバイスの制限を克服し、スケーラブルなシステムを構築することができる。本研究は,これらの分散手法の違いを概観し,各パラダイムを用いた分散におけるQMLモデルの対角的ロバスト性に関する既存のアプローチを要約し,その領域におけるオープンな疑問について論じる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:01:51 GMT)
Scale-Disentangled spatiotemporal Modeling for Long-term Traffic Emission Forecasting [10.6]
本稿では,長期交通排出予測のためのSDSTM(Scale-Disd S-temporal Modeling)フレームワークを提案する。提案手法は最先端の性能を実現する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:06:47 GMT)
M3OOD: Automatic Selection of Multimodal OOD Detectors [10.3]
マルチモーダル環境でのOOD検出のためのメタラーニングベースのフレームワークであるM3OODを紹介する。 M3OODは、計算オーバーヘッドを最小限に抑え、12のテストシナリオで10の競争ベースラインを一貫して上回ることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:39:57 GMT)
CHBench: A Cognitive Hierarchy Benchmark for Evaluating Strategic Reasoning Capability of LLMs [10.3]
ゲームプレイ能力は、大規模言語モデルの戦略的推論能力を評価する指標となる。行動経済学の認知階層モデルに着想を得た新しい評価フレームワークであるCHBenchを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:10:26 GMT)
Learning Marked Temporal Point Process Explanations based on Counterfactual and Factual Reasoning [10.0]
MTPPの説明は、最小かつ合理的な説明、すなわち歴史上の出来事の最小サブセットを特定することを目的としている。本研究は,MTPP (CFF) のための対実的・実的説明器を提案し,一連の故意に設計した手法を用いて MTPP の説明を解く。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:01:56 GMT)
UniCast: A Unified Multimodal Prompting Framework for Time Series Forecasting [9.8]
時系列予測は、ファイナンス、ヘルスケア、環境モニタリングといった分野における基本的なタスクである。既存のモデルは、視覚やテキストなどのリッチなマルチモーダルコンテキストを無視し、実世界のシナリオで時系列データを伴って運用される。本稿では、TSFMを拡張して時系列、視覚、テキストのモダリティを併用して予測性能を向上する、パラメータ効率の高い新しいマルチモーダルフレームワークUniCastを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:33:27 GMT)
OrthoRank: Token Selection via Sink Token Orthogonality for Efficient LLM inference [9.7]
近年の研究では、セマンティックな役割が限られているにもかかわらず、不当に高い注目を集めているシンクトークンが明らかにされている。私たちはまず、シンクトークンと他のトークンとの関係を拡大し、その類似性を隠れた状態で探究する。そこで本稿では,OrthoRankと呼ばれる動的トークン選択手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:42:58 GMT)
RT-Cache: Training-Free Retrieval for Real-Time Manipulation [9.3]
RT-Cacheは、ロボットのためのトレーニング不要の検索・アズ・コントロールパイプラインである。現行のフレームを埋め込んでマルチステップスニペットを検索して再生し、ステップ単位のモデルコールを置き換える。階層的な検索は、100万スケールのルックアップをサブ秒以下に維持し、コストを計算からストレージにシフトさせる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:49:41 GMT)
Error Propagation Mechanisms and Compensation Strategies for Quantized Diffusion [9.3]
拡散モデルは、前例のない品質と創造性のベンチマークを確立することによって、画像合成を変革した。大規模なデプロイメントは、計算集約的な反復的デノゲーションプロセスによる課題に直面している。拡散モデルにおける誤差伝播を数学的に定式化する理論的枠組みを開発する。時間ステップを考慮した累積誤差補償方式を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:31:00 GMT)
TimeSenCLIP: A Vision-Language Model for Remote Sensing Using Single-Pixel Time Series [9.3]
TimeSenCLIPは、単一のピクセルの有効性を評価することにより、空間コンテキストの役割を再評価する軽量フレームワークである。センチネル2画像からのスペクトル情報と時間情報を活用することで、キャプションベースのトレーニングの必要性を最小限に抑える。我々のアプローチはLUCASとSen4Mapのデータセットに基づいており、LULC、作物タイプ、生態系タイプなどの分類タスクに基づいて評価されている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:44:33 GMT)
Content Accuracy and Quality Aware Resource Allocation Based on LP-Guided DRL for ISAC-Driven AIGC Networks [9.2]
ISAC(Integrated Sensistance and Communication)は、AIGC(AIGC)ネットワークを効率化する。 ISACベースのAIGCサービスの質を評価するため、コンテンツ精度と品質意識サービス評価指標(CAQA)を提案する。低複雑性のCAQA-AIGC問題を解くために,アクションフィルタ(LPDRL-F)を用いた線形プログラミング(LP)誘導深部強化学習(DRL)アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:29:59 GMT)
Time-Scale Coupling Between States and Parameters in Recurrent Neural Networks [9.1]
本稿では,リカレントニューラルネットワーク(RNN)におけるゲーティング機構が適応学習速度の振る舞いを暗黙的に誘発する方法について検討する。この効果は状態空間の時間スケールとパラメータ空間のダイナミクスの結合から生じる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:19:34 GMT)
Reduced-order modeling of Hamiltonian dynamics based on symplectic neural networks [9.1]
我々は高次元ハミルトニアンシステムのための新しいデータ駆動シンプレクティック・インダクタンス・モデリング(ROM)フレームワークを提案する。 Romは、単一のエンドツーエンドのニューラルネットワークアーキテクチャ内で、潜時空間の発見と動的学習を統合する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:09:28 GMT)
Variational Optimization for Quantum Problems using Deep Generative Networks [9.0]
本稿では,単純なランダムな入力を高品質な解にマッピングする方法を学習する変分生成最適化ネットワークを提案する。この手法はモデル非依存であり、並列化可能であり、現在の古典的ハードウェアで動作するため、将来の変分最適化問題を加速することができる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:35:12 GMT)
On Balancing Sparsity with Reliable Connectivity in Distributed Network Design with Random K-out Graphs [9.0]
ポーシャリティは通信オーバーヘッドを低く保ち、信頼性の高い接続は、分散化されたデータ貯水池と計算リソースの信頼性の高い通信と推論に結びついている。ランダムKアウトグラフと呼ばれるネットワークモデルのクラスは、特に信頼度が制限された設定において、接続性と疎性のバランスをとるために広く現れる。本稿では,ノードが有限あるいは信頼できないレシエーションにおいて,信頼性の高い接続性を保証するネットワークパラメータの選択を通知する定理を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:29:16 GMT)
Magnon cat states in a cavity-magnon-qubit system via two-magnon driving and dissipation [8.9]
本研究では,キャビティ-マグノン-クビットハイブリッドシステムにおけるマグノニック・キャット状態の散逸生成を効率的に行う方法を提案する。短時間の進化の間にマグノンの収縮状態が出現する可能性がある。マグノニック・キャットとスクリュッド・ステートは、マクロ的な量子状態であり、マクロ的な量子研究や量子センシングに応用されている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:10:10 GMT)
Continuous topological phase transition between $\mathbb{Z}_2$ topologically ordered phases [8.7]
トリック符号 (TC) とダブルセミオン (DS) 相の遷移について検討し、これは (2 + 1)D において2つの異なる $mathbbZ$ 位相順序を持つ。本研究は, 凝縮以外の位相遷移の理論的枠組みの構築に向けた道を開くものである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:45:59 GMT)
AgentCDM: Enhancing Multi-Agent Collaborative Decision-Making via ACH-Inspired Structured Reasoning [8.6]
AgentCDMはマルチエージェントシステムにおける協調的意思決定を強化するための構造化フレームワークである。認知バイアスを内部化し、意思決定を受動的回答の選択からアクティブな仮説評価と構築へとシフトさせる。複数のベンチマークデータセットの実験は、AgentCDMが最先端のパフォーマンスを達成することを示した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:46:04 GMT)
EVTP-IVS: Effective Visual Token Pruning For Unifying Instruction Visual Segmentation In Multi-Modal Large Language Models [8.4]
命令されたビジュアルタスクは、自然言語命令に基づいた画像やビデオ内のオブジェクトのセグメンテーションを必要とする。最近のマルチモーダル大言語モデル(MLLM)は、ISV上では高いパフォーマンスを達成しているが、その推論コストは依然として大きなボトルネックとなっている。我々は,空間情報を統合することで,k中心上に構築されたEVTP-IVと呼ばれる新しい視覚的トークンのプルーニング手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:16:33 GMT)
CAT: Concept-level backdoor ATtacks for Concept Bottleneck Models [8.2]
概念ボトルネックモデル(CBM)は、高レベルな意味情報を活用することで、解釈可能性を改善するための重要なアプローチとして登場した。 CBMはセキュリティ上の脅威、特にモデル動作を隠蔽的に操作できるバックドア攻撃の影響を受けやすい。 CAT(Concept-level Backdoor ATtacks)は,CBM内の概念表現を利用して,トレーニング中にトリガを埋め込む手法である。強化された攻撃パターンであるCAT+は、最も効果的でステルス的な概念トリガーを体系的に選択する相関関数を組み込んでいる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:38:44 GMT)
Differentially Private Covariate Balancing Causal Inference [8.1]
差分プライバシーは、プライバシー保護のための主要な数学的枠組みである。我々のアルゴリズムは、所定のプライバシー予算の下で、整合性やレート最適性などの統計的保証のある点推定と区間推定の両方を生成する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:30:38 GMT)
DualFit: A Two-Stage Virtual Try-On via Warping and Synthesis [8.1]
ロゴや印刷されたテキスト要素などのきめ細かい衣服の詳細を保存するためのDualFitを提案する。最初の段階では、DualFitはターゲットの衣服をワープし、学習した流れ場を使って人物の画像と整列する。第2段階において、忠実度試行モジュールは、歪んだ衣服と保存されたヒト領域を混合することにより最終出力を合成する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:50:31 GMT)
LoRA-Edit: Controllable First-Frame-Guided Video Editing via Mask-Aware LoRA Fine-Tuning [8.1]
第一フレーム制御は第一フレームの制御を提供するが、その後のフレームの柔軟性には欠ける。フレキシブルなビデオ編集のための2Vモデルに適応するマスクベースのLoRA(Low-Rank Adaptation)手法を提案する。実験結果から,本手法はベースライン法よりも優れた映像編集性能が得られることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:16:47 GMT)
Towards an Explainable Comparison and Alignment of Feature Embeddings [8.1]
本研究では,組込みの比較を行うSPECフレームワークを提案し,参照データセットのクラスタリングにおける差を識別する。本稿では、このカーネルベースのアプローチをスケーラブルに実装し、サンプルサイズとともに線形に成長する計算複雑性について述べる。画像ネットやMS-COCOのような大規模データセット上での埋め込みの比較と整列を行うSPECの適用例を示す数値的な結果を提供する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:27:12 GMT)
Discovering Expert-Level Nash Equilibrium Algorithms with Large Language Models [8.0]
LegoNEは、アルゴリズム設計の創造的なプロセスと形式解析の厳密なプロセスとを融合させるフレームワークである。最先端の大規模言語モデルであるLegoNEを使用することで、数時間以内に2人のプレイヤーによるゲームの最先端のアルゴリズムが再発見された。この研究は、理論科学のための新しい人間と機械の協調パラダイムを実証する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:18:43 GMT)
Unsupervised Invariant Risk Minimization [7.9]
Emphinvariant Risk Minimization (IRM) のための新しい教師なしフレームワークを提案する。従来のIRM法は、環境間の分散シフトに対して堅牢な表現を学ぶためにラベル付きデータに依存していた。本フレームワークでは, ガウス的仮定の下で不変方向を抽出する線形手法である主不変成分分析(PICA)と, 環境不変要因と環境依存要因を混同する深部生成モデルである変動不変自己エンコーダ(VIAE)の2つの手法を紹介する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:00:50 GMT)
SCOPE: A Generative Approach for LLM Prompt Compression [7.8]
本稿では,新しい生成的即時圧縮法を提案する。既存のトークン除去方法とは異なり,本手法はチャンキング・アンド・サマー化機構に重点を置いている。提案手法は, 圧縮品質が向上し, 最新技術よりも安定性が向上する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:41:53 GMT)
Asymptotic Optimism of Random-Design Linear and Kernel Regression Models [7.4]
ランダムな設計の下で線形回帰モデルの閉形式最適化を導出した。本研究では,線形回帰モデル,タンジェントカーネル(NTK)回帰モデル,三層完全連結ニューラルネットワークの基本的挙動について検討した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:23:36 GMT)
Promoting Efficient Reasoning with Verifiable Stepwise Reward [7.4]
大規模推論モデル(LRM)は近年、強化学習によって支援された複雑な推論タスクにおいて大きな進歩を遂げている。 LRMは、単純な問題に対する過度な計算を過度に行い、効率を低下させることにしばしば悩まされる。本稿では,中間状態の推論軌道における性能に基づいて報酬を割り当てる,ルールベースで検証可能なステップワイド報酬機構(VSRM)を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:14:36 GMT)
Symmetry-Aware GFlowNets [7.2]
Generative Flow Networks(GFlowNets)は、グラフをその報酬に比例してサンプリングするための強力なフレームワークを提供する。既存のアプローチは状態遷移確率計算の不正確さによる体系的なバイアスに悩まされている。本稿では,対称性補正を学習プロセスに組み込んだ報酬スケーリング手法であるSymmetry-Aware GFlowNets (SA-GFN)を紹介する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:26:34 GMT)
Object Fidelity Diffusion for Remote Sensing Image Generation [7.2]
本稿では,リモートセンシングにおけるオブジェクトの精度と忠実度を高めるために,オブジェクトの忠実度拡散(OF-Diff)を提案する。我々は、リモートセンシングにおける拡散モデルのためのレイアウトに基づいて、オブジェクトの以前の形状を初めて抽出する。また、DDPOを導入して拡散過程を微調整し、生成したリモートセンシング画像をより多様でセマンティックに一貫性を持たせる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:13:50 GMT)
DE-VAE: Revealing Uncertainty in Parametric and Inverse Projections with Variational Autoencoders using Differential Entropy [7.0]
学習されたパラメトリックおよび可逆射影を改善するための不確実性を考慮した変分AEであるDE-VAEを提案する。固定投影が与えられた場合、2次元空間への写像と元の空間への逆写像を学ぶためにDE-VAEを訓練する。以上の結果から, DE-VAE は他の AE 法と同等の精度でパラメトリックおよび逆射影を生成できることが示唆された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:41:57 GMT)
LocalGPT: Benchmarking and Advancing Large Language Models for Local Life Services in Meituan [7.0]
大規模言語モデル(LLM)は目覚ましい能力を示し、様々な領域で大きなブレークスルーを遂げている。本研究は,地域生活サービスに関わる幅広い課題にまたがる多様なLCMの性能を体系的に評価する。その結果,比較的コンパクトな7Bモデルであっても,72Bモデルに匹敵する性能が得られることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:09:17 GMT)
Research on Conversational Recommender System Considering Consumer Types [6.9]
本稿では,消費者型モデリングを対話レコメンデーションに統合するフレームワークを提案する。消費者型理論に基づいて、2つの次元から派生した4つのユーザカテゴリ(依存型、効率的型、慎重型、エキスパート型)を定義する。 LastFM、Amazon-Book、Yelpの実験によると、CTCRSはレコメンデーション成功率を改善し、インタラクションのターンを減らす。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:15:52 GMT)
Modeling GRNs with a Probabilistic Categorical Framework [6.9]
この研究は確率的カテゴリGRN(PC-GRN)フレームワークを導入している。これは3つのコア方法論の相乗的統合に基づく新しい理論的アプローチである。このフレームワークは、GRNの数学的に厳密で生物学的に解釈可能で不確実性を認識した表現を提供する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:06:53 GMT)
Benchmarking LLM-based Agents for Single-cell Omics Analysis [6.9]
AIエージェントは、適応的な計画、実行可能なコード生成、トレース可能な決定、リアルタイム知識融合を可能にする、パラダイムシフトを提供する。本稿では,シングルセルオミクス解析におけるエージェント能力の厳格な評価を行うためのベンチマーク評価システムを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:26:18 GMT)
Robust Data Fusion via Subsampling [6.7]
外部データが大きすぎるが外部データが汚染されている間、ターゲットデータのサイズが制限されている現実的なシナリオを考察する。本研究では,外部データのサブサンプルを用いた様々な移動学習手法について検討し,基礎となる真のモデルから逸脱した外れ値を考慮した。本研究では, サンプルサイズ, 信号強度, サンプリングレート, オフレーヤの大きさ, モデル誤差分布のテール挙動などについて, 非漸近誤差境界について検討する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:49:26 GMT)
FedUHD: Unsupervised Federated Learning using Hyperdimensional Computing [6.7]
我々は超次元計算(HDC)に基づく最初のUFLフレームワークであるFedUHDを提案する。 FedUHDは最大173.6xと612.7倍のスピードアップとエネルギー効率を実現し、訓練では最大271倍の通信コスト、様々な設定で平均15.50%の精度を実現している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:41:29 GMT)
Attack Graph Generation on HPC Clusters [6.6]
アタックグラフ(AG)は、コンピュータネットワークのセキュリティを分析するグラフィカルツールである。 AGは、時間とメモリ消費の両方を生成します。本稿では,AGジェネレータの実装に高性能コンピューティングクラスタの利用を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:57:36 GMT)
Learning Wisdom from Errors: Promoting LLM's Continual Relation Learning through Exploiting Error Cases [6.6]
CREにおけるLarge Language Models (LLM) に対する命令ベース連続コントラストチューニング手法を提案する。我々は,TACREDとFewRelのモデルについて実験的に評価した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:49:11 GMT)
Implicit Hypergraph Neural Network [6.5]
我々は,ハイパーグラフニューラルネットワークが長距離依存を捉えるためにより多くの情報を集めると,予測能力を失うことを示す。 Inlicit Hypergraph Neural Network (IHNN)を提案する。これはノードとハイパーエッジの両方の固定点表現を共同で学習する新しいフレームワークである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:58:59 GMT)
EvoCut: Strengthening Integer Programs via Evolution-Guided Language Models [6.4]
整数プログラムを実際に解くための効果的なアプローチは、アクセラレーションカットの手動設計である。提案するフレームワークであるEvoCutは,大規模言語モデルと進化的検索を組み合わせることで,アクセラレーションカットの生成を自動化する。 EvoCutは、目に見えないインスタンスに一般化するカットを確実に生成し、改善し、実証的に検証する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:13:49 GMT)
QuickMerge++: Fast Token Merging with Autoregressive Prior [6.2]
高速な次世代予測のための軽量フレームワークであるQuickMergeを提案する。セマンティックサリエンス推定、フレキシブルトークン予算、ARアライメントを組み合わせることで、QuickMergeはより少ないトークンで正確な生成を可能にする。マルチモダリティドメイン間でQuickMergeを評価し、計算精度のトレードオフを一貫した改善を実証する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:07:33 GMT)
CAOTE: KV Cache Selection for LLMs via Attention Output Error-Based Token Eviction [6.1]
Token Evictionは、キャッシュからあまり重要でないトークンを排除してボトルネックを軽減するために設計された、広く採用されているポストトレーニング手法である。本稿では,キャッシュされたトークンのアテンション出力への寄与に基づく簡単な消去基準を提案する。本稿では,CAOTEと最先端の注目スコアベースの手法を組み合わせることで,下流タスクの精度が常に向上することを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:41:48 GMT)
Large Kernel Modulation Network for Efficient Image Super-Resolution [5.9]
Large Kernel Modulation Network (LKMN) は純粋なCNNベースのモデルである。 LKMNには2つのコアコンポーネントがある: Enhanced partial Large Kernel Block (EPLKB) と Cross-Gate Feed-Forward Network (CGFN) である。 LKMN-L は Manga109 データセットの DAT-light よりも 0.23 dB PSNR の改善を 4 ドルアップスケールで達成し、ほぼ 4.8 倍高速である。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:43:14 GMT)
Data Mixing Optimization for Supervised Fine-Tuning of Large Language Models [5.6]
最適化問題としてデータミキシングを枠組み化し,検証損失を最小限に抑える新しい手法を提案する。提案手法は, 効率的なデータ転送をモデル化し, スケール法則を微調整に活用することにより, 損失をパラメタライズする。提案アルゴリズムは,全領域にわたる総合的,個人的パフォーマンスに優れることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:28:39 GMT)
Infusing fine-grained visual knowledge to Vision-Language Models [5.5]
大規模コントラスト学習による視覚・言語モデル(VLM)の作成本稿では,VLMの広義マルチモーダル知識の細粒度ドメイン適応と保持の最適バランスを実現するための微調整手法を提案する。特に微調整時にテキストデータや元のテキストエンコーダを使わずに、視覚的テキストアライメントを維持する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:12:09 GMT)
LieRE: Lie Rotational Positional Encodings [5.3]
トランスフォーマーアーキテクチャは入力データの構造をモデル化するために位置符号化に依存している。変換器における位置符号化の表現能力を高めるために、リー相対代数(LieRE)を導入する。 2次元および3次元視覚タスクにおけるLieREの有効性を示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:26:50 GMT)
How Much Can a Behavior-Preserving Changeset Be Decomposed into Refactoring Operations? [5.2]
開発者は時々、機能追加のような振舞いを保存する修正と、機能追加のような振舞いを変える修正を混ぜる。これら2つの部分に分割することで、このような修正を理解するためのいくつかのアプローチが提案されている。機能的に等価なメソッドペアのデータセットを使用して,動作を保存する修正のどれ程を操作に分解できるかを定量化する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:29:51 GMT)
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models [5.2]
LauraTSEは、ターゲット音声の離散表現の初期層を生成する、小規模の自動回帰デコーダのみの言語モデルを採用している。一段階エンコーダのみの言語モデルは、混合と参照音声の両方からの情報を統合することにより、完全な表現を再構築する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:00:02 GMT)
A note on simulation methods for the Dirichlet-Laplace prior [5.1]
元のアルゴリズムは条件分布から間違った順序でサンプリングし、すなわち全ての潜伏変数の共役後続分布から正しくサンプリングしない。このコリゲンダムは、バッタチャリヤらの理論的な結果には影響しない。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:44:27 GMT)
Extending Straight-Through Estimation for Robust Neural Networks on Analog CIM Hardware [5.1]
本稿では,アナログ・コンピュート・イン・メモリ(CIM)システムのためのノイズアウェア・トレーニング手法を提案する。我々は、後方勾配計算から前方雑音シミュレーションを分離し、より正確だが計算上は難解なノイズモデリングによる雑音認識訓練を可能にする。本フレームワークは,画像分類の精度を最大5.3%向上し,テキスト生成における0.72パープレキシティ低減を実現し,トレーニング時間の2.2$times$ Speedupを実現し,ピークメモリ使用率を37.9%削減した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:53:44 GMT)
Automated Model Evaluation for Object Detection via Prediction Consistency and Reliablity [5.0]
PCR (Predict Consistency and Reliability) は, 地味ラベルを使わずに検出性能を推定する。我々は、様々な重度の画像汚職を適用して、メタデータセットを構築する。その結果,PCRは既存のAutoEval法よりも精度の高い性能推定値が得られることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:39:56 GMT)
Memory-Augmented Transformers: A Systematic Review from Neuroscience Principles to Enhanced Model Architectures [4.9]
記憶は知性の基本であり、生物学的および人工システム間の学習、推論、適応性を可能にする。トランスフォーマーはシーケンスモデリングにおいて優れているが、長距離コンテキスト保持、連続学習、知識統合において制限に直面している。このレビューでは、動的多時間記憶、選択的注意、統合など、神経科学の原則をブリッジする統一的な枠組みを提示する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:17:35 GMT)
HPD: Hybrid Projection Decomposition for Robust State Space Models on Analog CIM Hardware [4.7]
ステートスペースモデル(SSM)は、伝統的なシーケンスモデルに代わる効率的な代替品である。その行列乗法への依存は、計算メモリアーキテクチャ(CIM)に理想的である。我々は,最後の出力射影層に対するハイブリッド射影分解戦略であるHPDを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:34:14 GMT)
Advancing Data Equity: Practitioner Responsibility and Accountability in NLP Data Practices [4.7]
この研究は、実践者の視点を中心として、自身の経験をマルチスカラーなAIガバナンスフレームワークにリンクする最初のもののひとつです。我々は,米国を基盤とするNLPデータ実践者が公正性を概念化し,組織的・体系的な制約と競合し,新たなガバナンス活動に従事する方法を検討する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:49:02 GMT)
Ethereum Crypto Wallets under Address Poisoning: How Usable and Secure Are They? [4.6]
アドレス中毒はフィッシング攻撃だ被害者の取引履歴に "類似した" 転送記録を最近の研究によると、数百万のユーザーが標的にされ、1億ドル以上を失った。暗号ウォレットはアドレス中毒を緩和する対策の展開において中心的な役割を果たす
論文参考訳（メタデータ） (Sat, 16 Aug 2025 17:06:56 GMT)
J6: Jacobian-Driven Role Attribution for Multi-Objective Prompt Optimization in LLMs [4.4]
J6は、勾配相互作用行列を6つの解釈可能な成分に分解する構造的ヤコビアン法である。本研究は,コンフリクト・アウェア・プロンプト最適化の原理と機構を導入し,構造化ヤコビアン推論を多目的神経チューニングに組み込むための新たな道を開く。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:47:47 GMT)
Invitation Is All You Need! Promptware Attacks Against LLM-Powered Assistants in Production Are Practical and Dangerous [4.2]
本稿では,エンドユーザーに対するプロンプトウェアリスクを評価するための新しい脅威分析・リスクアセスメントフレームワークを提案する。 5つの脅威クラスにまたがって、ジェミニ駆動のアシスタントに対して14の攻撃シナリオを適用した。我々のTARAは、分析された脅威の73%がエンドユーザーに高い批判的リスクをもたらすことを明らかにした。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 22:56:51 GMT)
DynamicPose: Real-time and Robust 6D Object Pose Tracking for Fast-Moving Cameras and Objects [4.2]
トレーニング不要な6DポーズトラッキングフレームワークであるDynamicPoseを紹介する。素早く動くカメラやオブジェクトのシナリオにおけるロバストさのトラッキングを改善する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:25:08 GMT)
Structural Equation-VAE: Disentangled Latent Representations for Tabular Data [4.1]
可変オートエンコーダの設計に直接測定構造を組み込む新しいアーキテクチャであるSE-VAE(Structural Equation-Variational Autoencoder)を導入する。構造方程式モデリングにインスパイアされたSE-VAEは、潜在部分空間を既知の指標群と整列させ、構造特異的な共役変異を分離するために大域的ニュアンスラデントを導入する。 SE-VAEは、係数回復、解釈可能性、およびニュアンス変動に対する堅牢性において、オルタナティブよりも一貫して優れている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:27:15 GMT)
Chart-CoCa: Self-Improving Chart Understanding of Vision LMs via Code-Driven Synthesis and Candidate-Conditioned Answering [4.0]
視覚言語モデル(VLM)は、チャート理解タスク、特に正確なチャート記述や複雑な推論においてしばしば苦労する。本稿では,コード生成と実行を通じてチャート検索三重項を協調的に生成するチャート合成パイプラインを提案する。実験では、初期のVLMよりも15.50ポイントの精度が向上した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:26:55 GMT)
A Comprehensive Review of AI Agents: Transforming Possibilities in Technology and Beyond [4.0]
Reviewは、次世代のAIエージェントシステムを、より堅牢で適応性があり、信頼できる自律的知性へと導くことを目指している。認知科学に触発されたモデル、階層的強化学習フレームワーク、および大規模言語モデルに基づく推論から洞察を合成する。我々は、これらのエージェントを現実世界のシナリオに展開する際の倫理的、安全性、解釈可能性に関する懸念について論じる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:38:45 GMT)
TriQDef: Disrupting Semantic and Gradient Alignment to Prevent Adversarial Patch Transferability in Quantized Neural Networks [4.0]
量子ニューラルネットワーク(QNN)は、エッジとリソース制約のある環境にますますデプロイされている。 TriQDefは、QNN間のパッチベースの敵攻撃の転送可能性を破壊するために設計された、三段階の量子化対応防衛フレームワークである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:51:48 GMT)
Sliding Puzzles Gym: A Scalable Benchmark for State Representation in Visual Reinforcement Learning [3.8]
Sliding Puzzles Gym (SPGym) は、従来の8タイルパズルを任意に大きなデータセットから描画された画像で視覚的強化学習タスクに変換する新しいベンチマークである。 SPGymの重要な革新は、調整可能なグリッドサイズとイメージプールによって表現学習の複雑さを正確に制御できることである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:54:37 GMT)
Large Language Models Enable Personalized Nudges to Promote Carbon Offsetting Among Air Travellers [3.8]
ナッジ戦略は持続可能な行動を促進する効果的なツールであるが、その影響は個人の好みに依存する。人間の意思決定をエミュレートすることで、大規模言語モデル(LLM)は、広範囲な行動データセットを使わずに、ヌードを調整するためのコスト効率の良いルートを提供する。 LLMを使って、航空旅行者が自発的に飛行機からCO$の排出を相殺することを奨励するパーソナライズされたデコイベースのナッジ戦略を設計します。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:40:44 GMT)
Integrating Symbolic RL Planning into a BDI-based Autonomous UAV Framework: System Integration and SIL Validation [3.6]
本稿では,自律ミッションエージェント・フォー・ドローン(AMAD)認知マルチエージェントアーキテクチャの拡張版を提案する。我々は、ハードウェア・イン・ザ・ループ・シミュレーション(HILS)プラットフォームと同じ構成のSoftware-in-the-Loop(SIL)環境で、我々のフレームワークを検証した。実験の結果、モジュールの安定な統合と相互運用、BDI駆動と象徴的なRL駆動の計画フェーズ間の遷移の成功、一貫したミッション性能が示された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:27:26 GMT)
STEM: Efficient Relative Capability Evaluation of LLMs through Structured Transition Samples [3.4]
大規模言語モデル(LLM)の評価は、モデル機能が急速に進歩するにつれて、ますます困難になっている。軽量かつ解釈可能な評価フレームワークとして textbfStructured textbfTransition textbfEvaluation textbfMethod (STEM) を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:36:43 GMT)
Rigorous Feature Importance Scores based on Shapley Value and Banzhaf Index [3.4]
本稿では,Shapley値とBanzhaf指数に基づく2つの特徴重要度スコアを提案する。我々は,特徴量の計算において非WAXp集合を考慮し,各特徴がAExを除いた場合の有効性を定量的に評価する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:41:25 GMT)
D-CODA: Diffusion for Coordinated Dual-Arm Data Augmentation [3.2]
Coordinated Dual-arm Data Augmentation (D-CODA) は、両眼の模倣学習に適したオフラインデータ拡張法である。 D-CODAは拡散モデルを訓練し、両腕に新しい視点一貫性のある手首カメラ画像を合成する。グリップ・トゥ・オブジェクト・コンタクトを含む拡張状態が、双方向調整に適した制約に従うことを保証するために、制約付き最適化を採用している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:23:44 GMT)
Combinations of Fast Activation and Trigonometric Functions in Kolmogorov-Arnold Networks [2.9]
我々は、コルモゴロフ・アルノルドネットワーク(KAN)の基底成分として、ReLUや三角関数などの高速計算関数を提案する。これらの関数の組み合わせをネットワーク構造に統合することにより、計算効率を向上させることを目指している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:22:14 GMT)
Coherent control of solid-state defect spins via patterned boron-doped diamond circuit [2.8]
本研究は, ダイヤモンドにモノリシックに集積した電子回路を用いて窒素空孔(NV)スピンのコヒーレント制御を実証した。このアプローチは、様々な環境におけるセンシングと情報処理に適した、コンパクトで堅牢で汎用的な量子プラットフォームを新たに構築する道を開く。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:48:56 GMT)
Transforming Blood Cell Detection and Classification with Advanced Deep Learning Models: A Comparative Study [2.4]
本研究は,Roboflowデータに基づいて訓練されたYOLOv10モデルを用いて,様々なエポックに640×640ピクセルの画像を再現した。その結果,トレーニングエポックの増大は,特にリアルタイムな血液細胞検出・分類において,精度,精度,リコールを著しく向上させることが明らかとなった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 03:47:35 GMT)
Reputation-based PoS for the Restriction of Illicit Activities on Blockchain: Algorand Usecase [2.3]
近年では、ブロックチェーントランザクションデータに基づいて、さまざまな機械学習ベースのテクニックが、このような犯罪要素を検出することができる。本稿では,上記の不正行為を検知したユーザに対する評価に基づく応答手法を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:40:57 GMT)
Conditional mutual information: A generalization of causal inference in quantum systems [2.2]
我々は、量子システムに固有の因果関係を把握するのに適した量子因果索引を開発する。我々は、フォン・ノイマンエントロピーを取り入れた非対称量子条件相互情報(QCMI)に焦点を当てた。遠隔地においてQCMIが重要となる速度である効果的な因果伝播速度について検討した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:50:53 GMT)
Unified Conformalized Multiple Testing with Full Data Efficiency [2.2]
我々はデータ利用を中心に置く統一的なフレームワークを提案する。利用可能なすべてのデータ-ヌル、代替品、ラベルなしコンストラクションスコアを使用し、完全な置換戦略を通じてp値のキャリブレーションを行う。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:45:29 GMT)
Modeling Relational Logic Circuits for And-Inverter Graph Convolutional Network [2.0]
And-Inverter Graphs (AIG) はディジタル回路の機能特性を効率的に表現し、最適化し、検証する。 AIGerは、1)ノードロジック機能埋め込みコンポーネントと2)AIGの機能学習ネットワークコンポーネントの2つのコンポーネントで構成されている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:23:52 GMT)
Hierarchical Refinement: Optimal Transport to Infinity and Beyond [1.9]
階層化リファインメントはログ線形時間と線形空間で動作し、低ランクOTの利点を保ちながら、その限定解像度を克服していることを示す。我々は、100万以上のポイントを含むデータセットを含む複数のデータセットで階層的リファインメントの利点を示し、Sinkhornの範囲を超える問題にフルランクOTをスケールする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:14:40 GMT)
Unified quantification of entanglement and magic in information scrambling and their trade-off relationship [1.7]
情報スクランブル(英: information scrambling)は、幅広い量子系で観測される現象である。資源理論の原則を基礎とした2種類のスクランブルの尺度を導入する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:09:45 GMT)
VisualSpeech: Enhancing Prosody Modeling in TTS Using Video [1.6]
TTSにおける韻律生成を改善するために,視覚情報とテキスト情報を組み込んだ新しいモデルVisualSpeechを提案する。その結果,視覚的特徴を取り入れることで韻律的モデリングが向上し,合成音声の表現性が向上することが示唆された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:44:41 GMT)
SimInterview: Transforming Business Education through Large Language Model-Based Simulated Multilingual Interview Training System [1.6]
本稿では,大規模言語モデル(LLM)に基づくシミュレートされた多言語インタビュー訓練システムであるSimInterviewを紹介する。本システムは,その評価を雇用要件と一貫して整合させ,コンテンツを忠実に保存し,高い満足度を得られることを示す。我々はまた、新たな規制の期待に応えるために、AI設計の概要を説明した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:18:36 GMT)
Improving MSA Estimation through Adaptive Weight Vectors in MOEA/D [1.5]
そこで我々はMOEA/D-ADF(MOEA/D-ADF)を提案する。これはMOEA/Dの新しい変種で、フィットネスの変動に基づいてサブプロブレム重みベクトルを適応的に調整し、探索・探索のトレードオフを改善する。我々はMOEA/D-ADFをPMAO(PASTAと多くのアプリケーション認識最適化基準)と組み合わせてPMAO++を作り、MOEA/D-ADFをシードする。 PMAO++は、ベンチマークケースの大部分でオリジナルのPMAOよりも優れており、17 BAliBASE由来のデータセットのうち12で、より優れた偽陰性(FN)レートを実現している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:51:51 GMT)
Fairness Regularization in Federated Learning [1.5]
フェデレートラーニング(FL)は、現代の機械学習において重要なパラダイムとして登場した。この研究は、クライアント間のパフォーマンスの違いを最小限に抑えることを目的とした、パフォーマンスの公平性に焦点を当てている。 FairGrad (approximate) と FairGrad* (exact) が不均一なデータ設定における公平性と全体的なモデルパフォーマンスを改善することを実証的に示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:32:41 GMT)
KP-INR: A Dual-Branch Implicit Neural Representation Model for Cardiac Cine MRI Reconstruction [1.4]
Inlicit Neural Representation (INR)法は、アンダーサンプルデータから座標-値マッピングを学習することにより、教師なし再構成において有望であることを示す。心血管MRI再建のためのK空間で動作する2分岐INR法であるKP-INRを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:02:14 GMT)
Belief-Conditioned One-Step Diffusion: Real-Time Trajectory Planning with Just-Enough Sensing [1.4]
我々は、10ミリ秒の前方通過で短水平軌道を返す最初のプランナーであるBelief-Conditioned One-Step Diffusion (B-COD)を提示する。この1つのプロキシは、ソフト・アクター・クリティカルがオンラインでセンサーを選択するのに十分であり、ポーズ・コ・グロースを束縛しながらエネルギーを最適化することを示している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:34:16 GMT)
Enhancing Citizen-Government Communication with AI: Evaluating the Impact of AI-Assisted Interactions on Communication Quality and Satisfaction [1.1]
本研究では,AIによるインタラクションが市民と公務員間のコミュニケーションの質に及ぼす影響について検討した。統計分析によると、AIの修正によって市民と公務員の両方のコミュニケーションの次元が大幅に向上した。この結果は、AIが市民と政府の相互作用を改善し、より効果的で満足できるコミュニケーションを育む大きな可能性を持っていることを示唆している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:07:59 GMT)
Efficient Modular Learning through Naive LoRA Summation: Leveraging Orthogonality in High-Dimensional Models [1.1]
Low-Rank Adaptation (LoRA)はパラメータデルタを2つの小さな行列の積として保存する。 Naive summationは追加のトレーニングを必要とせず、数秒で適用でき、マージされたデータでトレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:49:02 GMT)
LoRA-based methods on Unet for transfer learning in Subarachnoid Hematoma Segmentation [1.1]
動脈瘤性くも膜下出血(Aneurysmal subarachnoid hemorrhage、SAH)は、致死率30%を超える致命的な神経疾患である。関連する血腫型からの移行学習は、潜在的に価値はあるが未発見のアプローチである。 LoRA法は、大動脈瘤SAHセグメンテーションにおける標準Unet微調整よりも一貫して優れていた。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:08:45 GMT)
AI Models for Depressive Disorder Detection and Diagnosis: A Review [0.9]
うつ病性障害は世界中で障害の原因の1つとなっているが、診断は主観的臨床評価に大きく依存している。本稿では,55の鍵研究の体系的レビューに基づいて,最先端のAI手法の発見と診断に関する包括的調査を行う。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:46:48 GMT)
Domain Translation of a Soft Robotic Arm using Conditional Cycle Generative Adversarial Network [0.9]
条件付きサイクル生成逆ネットワーク(CCGAN)に基づくドメイン翻訳フレームワークを提案する。本モデルでは,両領域の対応する端点位置と向きを条件とした入力圧力信号から学習する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:47:35 GMT)
Leveraging Geometric Insights in Hyperbolic Triplet Loss for Improved Recommendations [0.7]
本稿では,幾何学的洞察を用いて表現学習を改善する新しい双曲的推薦モデルを提案する。我々のアプローチは、既存のユークリッドモデルや双曲モデルを上回るだけでなく、人気バイアスを減らし、より多様性とパーソナライズされたレコメンデーションにつながります。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 08:34:17 GMT)
From One Single Sketch to 3D Detailed Face Reconstruction [0.6]
単一スケッチからの3D顔の再構成は、重要な実用的応用のための重要な課題であるが、未調査の課題である。 Sketch-1-to-3は、1つのスケッチから現実的な3次元顔再構成のための新しいフレームワークである。 Sketch-1-to-3はスケッチベースの3次元顔再構成において最先端の性能を実現する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:48:38 GMT)
Improving quantum channel discrimination with resourceful states [0.5]
凸でない状態の任意の資源理論において、最大平均成功確率が向上する程度は、ロバストネス測度によって正確に定量化できることを示す。また, 補助システムを用いたチャネル識別問題の改善を, 頑健性測定によって定量化できることを実証した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:04:44 GMT)
The Passwordless Authentication with Passkey Technology from an Implementation Perspective [0.5]
新しい認証技術は、従来のパスワードベースのログインからパスワードレスセキュリティに移行した。本稿では,Passkey技術を用いた認証システムの実装における鍵となる技術について述べる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:17:59 GMT)
Parallel Data Processing in Quantum Machine Learning [0.5]
本稿では、量子並列性を利用してトレーニングデータセット全体を単一の量子演算で処理するフレームワークを提案する。標準パラメータ化量子回路を統合アーキテクチャに組み込み、全てのトレーニングサンプルを量子重ね合わせに符号化し、並列に分類する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:32:34 GMT)
LIDDIA: Language-based Intelligent Drug Discovery Agent [0.5]
LIDDIAは、サイリコの薬物発見過程をインテリジェントにナビゲートできる自律エージェントである。大きな言語モデルの推論能力を活用することで、LIDDIAは、自律的な薬物発見のための低コストで高度に適応可能なツールとして機能する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:51:32 GMT)
Transfer-Based Strategies for Multi-Target Quantum Optimization [0.4]
マルチターゲット量子最適化の課題に対処する。目的は、同じ量子探索空間上で定義された複数のコスト関数を同時に最適化することである。本稿では,関連するタスク間の知識伝達を可能にする戦略について検討する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:24:16 GMT)
Data Shift of Object Detection in Autonomous Driving [0.4]
自律走行物体検出タスクにおけるデータシフト問題について検討する。我々は、データセットの分類とバランスをとるためにシフト検出分析技術を採用している。このアプローチを検証するために,CycleGANベースのデータ拡張技術とYOLOv5フレームワークを統合することにより,モデルを最適化する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:52:31 GMT)
AICRN: Attention-Integrated Convolutional Residual Network for Interpretable Electrocardiogram Analysis [0.4]
本研究は,注意統合畳み込み残差ネットワーク(AICRN)と呼ばれる新しいディープラーニングアーキテクチャを提案する。本アーキテクチャは,レグレッションのためのECG特徴のタイプと空間的位置に対処する空間的およびチャネル的注意関連機構を特化して設計されている。このシステムは、人間のエラーによる焦点の喪失などの従来の分析課題に対処し、心臓イベントの迅速かつ容易な検出を容易にする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:10:45 GMT)
Assessment of Using Synthetic Data in Brain Tumor Segmentation [0.3]
本研究では,プリトレーニングGANモデルを用いて生成した合成MRIデータをU-Netセグメンテーションネットワークに組み込むことが,概念実証として,U-Netセグメンテーションネットワークのトレーニングに与える影響について検討する。 BraTS 2020データセットの実際のデータ、メディガンライブラリで生成された合成データ、および実際のサンプルと合成サンプルを様々な割合で組み合わせたハイブリッドデータセットを用いて実験を行った。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:56:38 GMT)
Interplay of Zeeman Splitting and Tunnel Coupling in Coherent Spin Qubit Shuttling [0.3]
シリコンMOSデバイスにおける高忠実スピンシャットリングを, ポーリスピンブロック(PSB)リードアウトを用いて実証した。 SI99.8%の平均閉鎖忠実度を達成する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:27:30 GMT)
Explainable AI for Curie Temperature Prediction in Magnetic Materials [0.2]
NEMADデータベースを用いて,磁性材料のキュリー温度を予測する機械学習手法について検討する。 Extra Trees Regressorは、バランスの取れたデータセットに対して、最大0.85$pm$0.01のR2スコアに達する最高のパフォーマンスを提供します。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:33:28 GMT)
Overcoming Knowledge Discrepancies: Structuring Reasoning Threads through Knowledge Balancing in Interactive Scenarios [0.1]
対話的な問題解決シナリオにおける推論は、ユーザーの理解を反映し、構造化されたドメイン知識と整合する推論スレッドを構築するモデルを必要とする。本稿では,構造化知識の再利用を重視した人間的な推論戦略からインスピレーションを得た,プロトタイプインスパイアされた2段階のReasoning-Threads-Evaluation(ReT-Eval)フレームワークを提案する。実験と専門家による評価により、ReT-Evalはユーザの理解を高め、最先端の推論モデルより優れていることが示された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:41:42 GMT)
Trust@Health: A Trust-Based Multilayered Network for Scalable Healthcare Service Management [0.1]
医療システムにおける複雑な関係を,医師,部署,病院間の相互作用に着目して検討した。提案したモデルでは、医療サービスの理解と最適化のために、層内信頼関係と層間信頼関係の両方を強調している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:01:51 GMT)
YOLO11-CR: a Lightweight Convolution-and-Attention Framework for Accurate Fatigue Driving Detection [0.0]
本稿では,リアルタイム疲労モニタリングに適した軽量で効率的な物体検出モデルYOLO11-CRを提案する。 YOLO11-CR は Convolution-and-Attention Fusion Module (CAFM) と Rectangular Module (RCM) の2つの重要なモジュールを導入した。 DSMデータセットの実験では、YOLO11-CRは87.17%の精度、83.86%のリコール、88.09%のmAP@50、55.93%のmAP@50-95を達成した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:19:04 GMT)
Why Cannot Large Language Models Ever Make True Correct Reasoning? [0.0]
著者らは、LSMのいわゆる「推論能力」は、曖昧な概念を持つ人々の錯覚にすぎないと考えている。本論文は, 動作原理の本質的な限界から, LLMには真の正しい推論能力がないことを説明しようとするものである。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:38:49 GMT)
Visual Content Detection in Educational Videos with Transfer Learning and Dataset Enrichment [0.0]
本稿では,講義映像フレーム内の視覚的要素を検出するための伝達学習手法について報告する。 YOLOは講義ビデオオブジェクト検出に最適化されており、複数のベンチマークデータセットをトレーニングし、半教師付きオートラベリング戦略を展開している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:58:23 GMT)
Utilizing the RAIN method and Graph SAGE Model to Identify Effective Drug Combinations for Gastric Neoplasm Treatment [0.0]
RAIN法はグラフSAGEを統合し、薬物の組み合わせを提案する。提案された薬物を検証し、その後にPythonで実装された有効性を評価するためのネットワークメタ分析を行った。フルオロラシル単独のp値は0.0229であり、トラストゥズマブで0.0099、三重結合で0.0069と改善され、優れた効果を示した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:19:19 GMT)
Urban AI Governance Must Embed Legal Reasonableness for Democratic and Sustainable Cities [0.0]
本稿では,自治体のAIシステムにおける監督の監督に法的「合理的な人」標準を適用する概念的枠組みであるUrban Reasonableness Layer(URL)を紹介する。我々は、自治体のAIシステムに法的「合理的な人」標準を組み込むことは、民主的で持続可能な都市ガバナンスにとって不可欠であると主張している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 22:39:04 GMT)
Trotter simulation of vibrational Hamiltonians on a quantum computer [0.0]
振動力学のための量子アルゴリズムは、古典的なアプローチに代わる有望な選択肢として浮上している。時間進化をシミュレーションするために, トロッター積公式を有効活用するために, 効率的なフラグメンテーション手法を開発した。本稿では, それぞれの形状を用いた振動スペクトルの計算を行い, アルゴリズムの忠実さを実証する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:43:43 GMT)
Translation in the Wild [0.0]
大きな言語モデル(LLM)は翻訳に優れています。しかし、専用ニューラルネットワーク翻訳モデルとは異なり、LLMは翻訳関連の目的についてトレーニングされていない。私の作業仮説では、LLMの翻訳能力は2種類の事前学習データに起因している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:29:58 GMT)
SupraTok: Cross-Boundary Tokenization for Enhanced Language Model Performance [0.0]
トークン化は、自然言語処理の根本的かつ未発見のボトルネックである。サブワードセグメンテーションを再現する新しいトークン化アーキテクチャであるSupraTokを提案する。提案手法は,英語のトークン化効率を31%向上させる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 00:54:20 GMT)
Substituting Proof of Work in Blockchain with Training-Verified Collaborative Model Computation [0.0]
BitcoinのProof of Work(PoW)メカニズムは、過度のエネルギー使用とハードウェアの非効率で長年批判されてきた。本稿では,Bitcoinの従来のPoWを,集中型クラウドベースの協調トレーニングフレームワークに置き換えたハイブリッドアーキテクチャを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:12:34 GMT)
Stability of quasicrystalline ultracold fermions to dipolar interactions [0.0]
準周期光学格子における反動性超低温双極子フェルミオンについて検討し、相互作用する準結晶の挙動を特徴づける。我々の研究は、準周期ポテンシャルにおける双極子相互作用が、局所化および拡張量子状態の複雑でチューナブルな共存をもたらすことを示した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:51:15 GMT)
Several Issues Regarding Data Governance in AGI [0.0]
本稿では,人工知能(AGI)に特有のデータガバナンスの課題について検討する。 AGIガバナンスと現在のアプローチを区別する7つの重要な課題を特定します。我々は、効果的なAGIデータガバナンスには、ビルトイン制約、継続的監視機構、動的ガバナンス構造、国際協調、マルチステークホルダーの関与が必要であると結論付けている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:52:22 GMT)
Segmenting Action-Value Functions Over Time-Scales in SARSA via TD($Δ$) [0.0]
本研究は、現在SARSA($Delta$)と指定されているSARSAアルゴリズムに適用することにより、時間差分分解法であるTD($Delta$)を強化する。アクション値関数を特定の割引要因に関連付けられたコンポーネントに分割することで、SARSA($Delta$)は、さまざまな時間スケールでの学習を容易にする。本研究の結果から,提案手法は,SARSAの更新におけるバイアスの低減と,決定論的およびアタリ的設定における収束の高速化に有効であることが示唆された。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:53:39 GMT)
SHoM: A Mental-Synthesis Trust Management Model for Mitigating Botnet-Driven DDoS Attacks in the Internet of Things [0.0]
DDoS攻撃はIoTのセキュリティに深刻なリスクをもたらす。信頼管理を通じてモノのインターネットにおけるボットネットに対するDDOS攻撃を扱うためのモデルを提供する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:58:08 GMT)
Regime-Aware Time Weighting for Physics-Informed Neural Networks [0.0]
本稿では,時間依存微分方程式の解法としてPINNを用いた場合の時間次元を扱う新しい手法を提案する。我々のアプローチは、時間とともに摂動に対する解の感度を定量化するリアプノフから導かれる理論的な洞察に基づいている。カオスロレンツ系やバーガースの方程式を含む挑戦的ベンチマークに関する数値実験により,提案手法の有効性とロバスト性を実証した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:51:28 GMT)
Rashomon perspective for measuring uncertainty in the survival predictive maintenance models [0.0]
航空機エンジンの残留実用寿命の予測は、航空宇宙や防衛といった高信頼性分野において重要な領域である。従来の回帰モデルは検閲されたデータに苦しむため、バイアスのある予測につながる可能性がある。一方、サバイバルモデルは、検閲されたデータを効果的に処理し、メンテナンスプロセスの予測精度を向上させる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:47:38 GMT)
Raising the Bar: An Asymptotic Comparison of Classical and Quantum Shortest Path Algorithms [0.0]
Dijkstraのアルゴリズムは、長い間、シングルソースショート・パス問題の古典的なベースラインであった。ランドスケープは、O(m cdot (log n)2/3)$の複雑さを持つ新しい古典的アルゴリズムの導入によって、最近再形成された。より高度な量子アルゴリズムは、より好ましいスケーリングを示すが、短い解経路によって特徴づけられるレギュレーションに限られることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 15:16:02 GMT)
RLNVR: Reinforcement Learning from Non-Verified Real-World Rewards [0.0]
RLNVRは、人間の明示的な検証を必要とせず、ノイズの多い現実世界のフィードバック信号を使って言語モデルをトレーニングするためのフレームワークである。本稿では,RLNVRとGSPOを組み合わせた実践的フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 21:34:04 GMT)
Quantum geometric phase with initial state index dependent on space-time curvature [0.0]
結果のシュル・オーディンガー方程式は、アディバティック近似におけるアインシュタイン重力場方程式のトレース形式と同一であることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 19:46:39 GMT)
Quantum Entanglement Generation in the Heterometallic Ni$^\text{2+}_4$Gd$_4^\text{3+}$ Complexes [0.0]
外部磁場下でNi2+_4$Gd$3+_4$と表されるNi2+_4$Gd$_4$錯体の様々な種類の量子絡みについて検討する。量子エンタングルメントの尺度として負性度を用いて、Ni$2+_4$Gd$_4$2族における四方晶,二部晶,1$-$3 tangle,2 tangle tanglementに対する単一イオン異方性と磁場の影響を調べた。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:02:11 GMT)
Quantized nonlinear kink movement through topological boundary state instabilities [0.0]
本研究では, ポンピングパラメータの周期変調の下で, キンクの量子化輸送を示す非線形二量体鎖モデルについて検討する。これらの境界モードの不安定性は、観測されたクリンク運動の背後にある駆動機構であることを示す。その結果,線形トポロジと非線形力学の概念を統一し,非線形媒体における量子化輸送の枠組みを確立した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:46:19 GMT)
Q-FSRU: Quantum-Augmented Frequency-Spectral Fusion for Medical Visual Question Answering [0.0]
本稿では、周波数スペクトル表現と融合(FSRU)と量子検索拡張生成(Quantum Retrieval-Augmented Generation:量子RAG)を組み合わせた医用視覚質問応答(VQA)の新しいモデルであるQ-FSRUを提案する。 Q-FSRUは医療画像や関連テキストから特徴を抽出し、Fast Fourier Transform (FFT) を用いて周波数領域にシフトする。精度を向上し、実際の知識に基づいて回答を確実にするために、量子に着想を得た検索システムを追加します。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:21:49 GMT)
Preparation of the single-spinon wave function in a quantum computer [0.0]
量子コンピュータにおける1次元のS=1/2$スピンモデルに関連する単一スピノン波動関数の合成について検討する。量子コンピュータの単一スピンエネルギーを計算し、量子ビット数、ゲート数、回路数の観点からそのコストを分析するための3つの異なる戦略を検討する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:49:03 GMT)
Predicting ChatGPT Use in Assignments: Implications for AI-Aware Assessment Design [0.0]
この研究は、ChatGPTを新しい概念の学習に頻繁に使うことは、潜在的過度に相関していることを示している。我々は、イノベーションと学術的厳密さのバランスをとるために、規律に特有なガイドラインと再考された評価戦略を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 11:09:38 GMT)
PP-STAT: An Efficient Privacy-Preserving Statistical Analysis Framework using Homomorphic Encryption [0.0]
PP-STATは、プライバシー保護統計分析のための同型暗号化ベースのフレームワークである。 PP-STATはZスコア正規化、歪度、曲率、変動係数、ピアソン相関係数などの高度な統計測度をサポートし、すべて暗号化データ上で安全に計算される。実世界のデータセットを評価した結果,PP-STATは平均相対誤差(MRE)が2.4x10-4以下であることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:24:35 GMT)
PCA- and SVM-Grad-CAM for Convolutional Neural Networks: Closed-form Jacobian Expression [0.0]
畳み込みニューラルネットワーク(CNN)は、分類タスクに有効なアプローチである。 CNNは、Grad-CAMのような可視化技術を通じて、ホワイトボックスの手法として使用できる。ホワイトボックス手法の開発を容易にするため,CNNにおいてPCA層やSVM層に対する注意領域を生成することが重要である。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 02:52:12 GMT)
Optimizing Neural Architectures for Hindi Speech Separation and Enhancement in Noisy Environments [0.0]
本稿では,高度なニューラルネットワークアーキテクチャを用いたヒンディー語分離と強化の課題に対処する。従来の手法の限界を克服するために,DEMUCSモデルを利用した洗練されたアプローチを提案する。モデルはU-Net層とLSTM層で微調整され、40,000Hindi音声クリップのデータセットでトレーニングされる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 10:43:29 GMT)
MOVER: Multimodal Optimal Transport with Volume-based Embedding Regularization [0.0]
MOVERは、最適なトランスポートベースのソフトアライメントとボリュームベースの幾何正規化を組み合わせて意味的に整合した表現を構築する新しいフレームワークである。テキスト・ビデオ・オーディオ検索タスクの実験では、MOVERはゼロショットと微調整の両方で最先端の手法を大幅に上回っている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 20:17:06 GMT)
Generalized invariants meet constitutive neural networks: A novel framework for hyperelastic materials [0.0]
我々は、等方的非圧縮材料に対する適切な不変量やモデルを同時に発見する新しいデータ駆動フレームワークを提案する。本手法は一般化不変量のクラスで最も適切な不変量と対応するひずみエネルギー関数の両方を同定する。可能な不変量の連続的なファミリを見ることで、モデルは異なる物質的挙動に柔軟に適応することができる。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:32:45 GMT)
Fluorescence driven by nonclassical light [0.0]
押された光は理想的な状況下で両方の体制を強化できる我々は、分子系の最近報告された値と比較して、それらが極端に中和的であることを強調する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 13:26:42 GMT)
Exploring the Efficacy of Convolutional Neural Networks in Sleep Apnea Detection from Single Channel EEG [0.0]
本稿では,単一チャネル脳波データに基づいて学習した畳み込みニューラルネットワーク(CNN)を用いた睡眠時無呼吸症候群の検出手法を提案する。提案されたCNNの精度は85.1%、マシューズ相関係数(MCC)は0.22で、家庭ベースのアプリケーションにとって大きな可能性を示した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:58:00 GMT)
Exploring Spatial-Temporal Dynamics in Event-based Facial Micro-Expression Analysis [0.0]
我々は,RGBとイベントカメラを同期して記録した,新しい,予備的なマルチレゾリューションおよびマルチモーダルマイクロ圧縮データセットを提案する。イベントベースのデータは,マイクロ圧縮認識やフレーム再構成に利用できることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:03:20 GMT)
Enhancing 3D point accuracy of laser scanner through multi-stage convolutional neural network for applications in construction [0.0]
本稿では,多段階畳み込みニューラルネットワーク(MSCNN)を用いた室内粗い部屋におけるレーザースキャナ(LS)の3次元点精度の不確かさを低減する手法を提案する。提案手法では,同一環境における高精度スキャナ(HAS)と対応する低精度スキャナ(LAS)とを組み合わせ,特定のエラーパターンの定量化を行う。その結果,約6デシベルで平均2乗誤差(MSE)が70%以上,ピーク信号-雑音比(PSNR)が約6デシベルで改善した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 16:02:56 GMT)
ENA: Efficient N-dimensional Attention [0.0]
本稿では,線形リカレントモデルを高次データ(1DからND)に拡張する2つの重要な側面について検討する。線形再帰と高次SWAのハイブリッドアーキテクチャを高能率N次元注意(ENA)として表現する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 05:55:51 GMT)
Dynamical Phase Transitions in Open Quantum Walks [0.0]
オープン量子系において、デコヒーレンスによる古典化によって非エルミートスペクトル現象へのアクセスが可能となる新しい臨界挙動のクラスを示す。この結果は、量子シミュレーション、エラー軽減、制御可能な非平衡量子状態の工学など、量子技術に有望な意味を与える。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:17:36 GMT)
Diagnostic performance of deep learning for predicting glioma isocitrate dehydrogenase and 1p/19q co-deletion in MRI: a systematic review and meta-analysis [0.0]
MRIを用いたグリオーマ患者におけるisocitrate dehydrogenase (IDH)変異と1p/19q同時欠失の予測のための深層学習モデルの評価を行った。私たちは2025年3月まで、主要なデータベース( Scopus、Embase、Web of Science、Google Scholar)を検索しました。 The Radiomics Quality Score and the QUADAS-2 tool。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:22:55 GMT)
Design and Implementation of a Controlled Ransomware Framework for Educational Purposes Using Flutter Cryptographic APIs on Desktop PCs and Android Devices [0.0]
本研究では,Pythonのネイティブ暗号APIを活用したフレームワークの作成と実装に焦点を当てる。フレームワークのAndroidバージョンはFlutterとDartを使って実装されている。本稿では,悪名高いランサムウェアからインスピレーションを得て,Androidデバイス上での動作をシミュレートすることを目的とする。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:49:03 GMT)
Deep Learning for Operational High-Resolution Nowcasting in Switzerland Using Graph Neural Networks [0.0]
本稿では,スイスにおける高分解能放送のためのグラフニューラルネットワーク(GNN)に基づく手法を提案する。提案モデルでは,地表観測と選択した過去と将来の数値天気予報(NWP)状態を組み合わせる。 GNNモデルは、リードタイムで最大12時間、従来のアプローチよりも一貫して優れています。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:00:29 GMT)
Continual Learning with Columnar Spiking Neural Networks [0.0]
本研究では,コラム構造型スパイクニューラルネットワーク(SNN)と局所学習規則を併用した連続学習と破滅的忘れ込みを提案する。 CoLaNET(Columnar Layered Network)を用いて、従来の学習と共有構造が欠如している場合に、マイクロカラムが新しいタスクに最も効率的に適応できることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:15:57 GMT)
Constructive approximate transport maps with normalizing flows [0.0]
連続性方程式の近似制御可能性問題とその正規化フローを用いた輸送マップ構築への応用について検討する。ベクトル場 $xmapsto w(atop x + b)_+$ において、時間依存制御 $theta=(w, a, b)$ を構築し、既知の基底密度をおよそ輸送する。我々の主な結果は、$rho_*$ と $rho_mathrmB$ の相対テール崩壊の仮定に依存し、相対エントロピーにおける連続方程式の到達可能な空間を特徴づけるヒントを提供する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 14:50:38 GMT)
Conditional Generative Adversarial Networks Based Inertial Signal Translation [0.0]
本稿では,手首に装着したセンサを用いて計測した慣性信号を,靴に装着したセンサを用いて記録する手法を提案する。コンディショナル・ジェネバティブ・アドリアネットワーク(GAN)は、信号の変換に使用される。実験の結果,提案手法は正確な翻訳が可能であり,手首センサの慣性信号を用いて毎日の歩行分析を行うことができることがわかった。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 09:06:58 GMT)
Coherence and decoherence in generalized and noisy Shor's algorithm [0.0]
我々はShorのアルゴリズムにおいて、レジスタ$A$が任意の純粋状態であるコヒーレンスとデコヒーレンスを研究する。レジスタ$AB$が任意の擬似純粋状態にある場合に$r$を計算する確率と、レジスタ$A$が任意の純粋状態にあるときの関係を確立する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 07:53:12 GMT)
Capabilities of GPT-5 across critical domains: Is it the next breakthrough? [0.0]
OpenAIによるGPT-4は、推論、マルチモーダリティ、タスクの一般化の進歩をもたらした。 GPT-5は2025年8月にリリースされ、タスク固有の最適化のために設計されたシステム・オブ・モデルアーキテクチャが組み込まれている。本研究は,GPT-4とGPT-5を言語学および臨床分野からヒトラッカーを用いて比較した最初の体系的比較例である。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:26:11 GMT)
CAN Networks Security in Smart Grids Communication Technologies [0.0]
コントローラエリアネットワーク(Controller Area Network, CAN)は、スマートグリッドにおける信頼性の高いデータ伝送を提供するプロトコルの一つである。スマートシティがより相互接続されるようになると、サイバー攻撃の危険性も高まる。我々はネットワークに接続された任意のCANノードにほとんどオーバーヘッドを必要としないソリューションを実装した。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 23:36:24 GMT)
Bongard-RWR+: Real-World Representations of Fine-Grained Concepts in Bongard Problems [0.0]
ボンガード問題(BP)は抽象的視覚推論(AVR)のための挑戦的なテストベッドを提供する Bongard-RWR+は5,400ドルのインスタンスからなるデータセットで、実世界の画像を用いてBPの抽象概念を表現している。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:26:44 GMT)
Beyond Fixed Morphologies: Learning Graph Policies with Trust Region Compensation in Variable Action Spaces [0.0]
本稿では、信頼地域政策最適化(TRPO)とその広く使われている一階近似、PPOに焦点を当てる。目的は、KL分割や政策クリッピングの罰則によって課せられる制約の下で、様々な行動空間の次元が最適化の景観にどのように影響するかを実証することである。 The empirical evaluation under morphological variation was performed using the Gymnasium Swimmer environment。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 17:29:13 GMT)
BConformeR: A Conformer Based on Mutual Sampling for Unified Prediction of Continuous and Discontinuous Antibody Binding Sites [0.0]
本研究では,1,080の抗原-抗体複合体から得られた抗原配列に基づいて,コンフォメーションに基づくモデルを提案する。 CNNは線形の予測を強化し、Transformerモジュールはコンフォメーションの予測を改善する。実験の結果,PCC,ROC-AUC,PR-AUC,F1のスコアにおいて,既存のベースラインよりも優れていた。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:31:39 GMT)
Advancements in Entangled Photon Pairs in 2D Van der Waals Materials for On-chip Quantum Applications [0.0]
絡み合った光子対源は、量子ベースの応用において重要な役割を果たす。本稿では, 絡み合った光子対の生成における最近の進展と進展について述べる。量子技術の適用性と、オンチップの量子集積フォトニックデバイス技術に重点を置いている。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 18:22:37 GMT)
Active inference for action-unaware agents [0.0]
能動推論(英: Active Inference)は、適応的エージェントが近似ベイズ推論の過程に関与するとみなすことができるという概念に基づいて認知を研究するための公式なアプローチである。本稿では,アクション認識エージェントが動作認識エージェントに匹敵する性能を達成できることを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 12:27:51 GMT)
AI-Augmented CI/CD Pipelines: From Code Commit to Production with Autonomous Decisions [0.0]
我々は、大規模言語モデルと自律エージェントがポリシーに縛られたコパイロットとして機能するAI強化CI/CDパイプラインを提案する。我々は、倫理、検証、監査可能性、妥当性への脅威について議論し、本番配送システムにおける検証可能な自律性に関するロードマップを示す。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 01:51:59 GMT)
AI sustains higher strategic tension than humans in chess [0.0]
戦略的意思決定は、即時機会と長期的な目標の間の緊張を管理することを伴う。チェスにおけるこのトレードオフについて,人間対AIゲームとAIゲームのダイナミクスを特徴付け,比較することにより検討する。本稿では,現在進行中の戦略的緊張を定量化するためのネットワークベースの指標を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 22:53:34 GMT)
A Sobel-Gradient MLP Baseline for Handwritten Character Recognition [0.0]
我々は古典的なソベル演算子を再考し、簡単な問いを述べる:手書き文字認識(HCR)のための全密度多層パーセプトロン(MLP)を駆動するのに十分な一階エッジマップは十分か? 水平および垂直のソベル微分のみを入力として、MNISTおよびEMNIST文字上でニューラルネットワークをトレーニングする。極端な単純さにもかかわらず、結果として得られたネットワークは、MNIST桁で98%、EMNIST文字で92%の精度に達し、CNNに近づきながら、メモリフットプリントと透過的な機能を提供する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:17:39 GMT)
A Deep Learning Approach to Teeth Segmentation and Orientation from Panoramic X-rays [0.0]
本研究では, 深層学習技術を活用したパノラマX線画像からの歯のセグメンテーションと配向に対する包括的アプローチを提案する。グリッド対応アテンションゲートで強化されたエンコーダ・デコーダアーキテクチャを用いたエンドツーエンドのインスタンスセグメンテーションネットワークを構築した。主成分分析 (PCA) を用いて, 歯の配向を正確に推定するための指向性バウンディングボックス (OBB) の生成を提案する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 04:24:11 GMT)
A Confidence-Diversity Framework for Calibrating AI Judgement in Accessible Qualitative Coding Tasks [0.0]
信頼性の多様性の校正は、アクセス可能なコーディングタスクの品質評価フレームワークである。 8つの最先端のLCMから5,680のコーディング決定を分析すると、自信はモデル間の合意を密接に追跡する。
論文参考訳（メタデータ） (Sat, 16 Aug 2025 06:51:11 GMT)