Fugu-MT: arxivの論文翻訳(概要)

RMTBench: Benchmarking LLMs Through Multi-Turn User-Centric Role-Playing [111.1]
RMTBenchは、80の多様な文字と8000以上の対話ラウンドを特徴とする、総合的なテキストバプサー中心のバイリンガルロールプレイングベンチマークである。本ベンチマークでは,文字記述よりも明示的なユーザモチベーションに基づく対話を構築し,実用的なユーザアプリケーションとの整合性を確保する。 RMTBenchは、キャラクタバックグラウンドからユーザ意図のフルフィルメントにフォーカスを移すことで、学術的な評価と実践的なデプロイメント要件のギャップを埋める。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:49:47 GMT)
DSwinIR: Rethinking Window-based Attention for Image Restoration [109.4]
画像復元のための基盤となるバックボーンアーキテクチャとしてデフォルマブルスライディングウィンドウ変換器(DSwinIR)を提案する。 DSwinIRの中心には、Deformable Sliding Window (DSwin) Attentionという小説がある。大規模な実験により、DSwinIRは幅広い画像復元タスクに新しい最先端の技術を設定できることがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:45:59 GMT)
3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models [94.5]
3D世代は急速に進歩しているが、3D評価の開発はペースを保っていない。 3DGen-Arenaは、公開ユーザと専門家アノテータの両方から人間の好みを収集する統合プラットフォームである。このデータセットを用いて、CLIPベースのスコアモデルである3DGen-ScoreとMLLMベースの自動評価器である3DGen-Evalをさらに訓練する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:53:26 GMT)
Reframe Your Life Story: Interactive Narrative Therapist and Innovative Moment Assessment with Large Language Models [92.9]
物語療法は、個人が問題のある人生の物語を代替品の力に変えるのに役立つ。現在のアプローチでは、特殊精神療法ではリアリズムが欠如しており、時間とともに治療の進行を捉えることができない。 Int(Interactive Narrative Therapist)は、治療段階を計画し、反射レベルを誘導し、文脈的に適切な専門家のような反応を生成することによって、専門家の物語セラピストをシミュレートする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:52:09 GMT)
Doodle Your Keypoints: Sketch-Based Few-Shot Keypoint Detection [80.9]
キーポイント検出は、特にクエリと同じディストリビューションからのソースデータが利用できない場合、数ショットの学習において課題に直面します。このギャップは、一般的な人間の表現形式であるスケッチを活用することで解決され、ソースフリーの代替手段を提供する。提案するフレームワークは,これらのハードルを,グリッドベースのロケータとプロトタイプドメイン適応を組み合わせたプロトタイプ設定で克服する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:58:28 GMT)
HLFormer: Enhancing Partially Relevant Video Retrieval with Hyperbolic Learning [77.4]
部分関連ビデオ検索(PRVR)は、部分コンテンツのみを記述するテキストクエリと、未トリミングされたビデオとをマッチングするという課題に対処する。本稿は,高次空間学習を利用してユークリッド空間の最適階層的モデリング能力を補う,PRVRのための最初のハイパーボリックモデリングフレームワークであるHLFormerを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:26:55 GMT)
What is Wrong with Perplexity for Long-context Language Modeling? [71.3]
長いコンテキスト入力は、会話の拡張、文書の要約、多数のショットインコンテキスト学習といったタスクにおいて、大きな言語モデル(LLM)にとって不可欠である。パープレキシティ(PPL)は、長期コンテキスト能力の評価には信頼性が低いことが証明されている。長短コンテキストコントラスト法を用いて鍵トークンを識別する手法であるbfLongPPLを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:45:02 GMT)
PyG 2.0: Scalable Learning on Real World Graphs [70.8]
Pyg 2.0は、拡張性と現実世界のアプリケーション機能を大幅に改善した包括的アップデートです。ヘテロジニアスグラフやテンポラルグラフのサポート,スケーラブルな機能/グラフストア,さまざまな最適化など,フレームワークの強化されたアーキテクチャについて詳述する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:32:07 GMT)
ProsodyLM: Uncovering the Emerging Prosody Processing Capabilities in Speech Language Models [70.6]
本稿では,韻律学習に適した単純なトークン化方式であるProsodyLMを提案する。 ProsodyLMは事前学習だけで驚くほど多様なプロソディ処理能力を学習できることがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:59:01 GMT)
Heterogeneous User Modeling for LLM-based Recommendation [70.5]
オープンドメインレコメンデーションを進める上で重要な課題は、ユーザの不均一な振る舞いからユーザの好みを効果的にモデル化することだ。 IDベースやセマンティックベースモデリングなど、既存のアプローチでは、一般化の貧弱さに悩まされている。圧縮エンハンサーとロバストネスエンハンサーを組み込んだヘテロジニアス・ユーザ・モデリング(HUM)手法を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:25:23 GMT)
Towards Universal Modal Tracking with Online Dense Temporal Token Learning [66.8]
オンライン高密度時間トークン学習を用いたユニバーサルビデオレベルのモダリティ認識追跡モデルを提案する。モデルの入力をビデオシーケンスレベルに拡張し、よりリッチなビデオコンテキストを言語に近い視点から見ることを目的としている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:47:42 GMT)
Player-Centric Multimodal Prompt Generation for Large Language Model Based Identity-Aware Basketball Video Captioning [66.6]
既存のスポーツビデオキャプション手法は、プレイヤーのアイデンティティを見落としているアクションに焦点を合わせ、適用性を制限していることが多い。本稿では,個人対応スポーツビデオキャプション(LLM-IAVC)のためのプレイヤー中心型マルチモーダルプロンプト生成ネットワークを提案する。 NBA-Identityという,9つの主要なイベントを対象とする9,726本のビデオを備えた,大きなアイデンティティを意識したバスケットボールビデオキャプションデータセットを構築した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:30:56 GMT)
Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [65.9]
本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化(UAO)フレームワークを提案する。このフレームワークは、事前訓練されたモデルの事前情報を保持し、関節の不確実性を用いて過度に適合する問題を緩和する。我々のアプローチは、Human3.6Mの5.5%という大きなマージンで、これまでの最高の結果を上回っています。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:20:21 GMT)
SessionIntentBench: A Multi-task Inter-session Intention-shift Modeling Benchmark for E-commerce Customer Behavior Understanding [64.5]
本稿では,意図木の概念を導入し,データセットキュレーションパイプラインを提案する。我々は,L(V)LMsのセッション間意図シフト理解能力を評価するマルチモーダルベンチマークSessionIntentBenchを構築した。 1,952,177の意図的エントリ,1,132,145のセッション意図軌跡,および10,905のセッションを使用してマイニングされた13,003,664のタスクにより,既存のセッションデータを活用可能なスケーラブルな方法を提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:04:17 GMT)
MATE: Motion-Augmented Temporal Consistency for Event-based Point Tracking [58.7]
本稿では,任意の点を追跡するイベントベースのフレームワークを提案する。事象の間隔に起因する曖昧さを解決するため、運動誘導モジュールは運動ベクトルを局所的なマッチングプロセスに組み込む。このメソッドは、任意のポイントベースラインのイベントのみのトラッキングに対して、$Survival_50$メトリックを17.9%改善する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:15:09 GMT)
CopyJudge: Automated Copyright Infringement Identification and Mitigation in Text-to-Image Diffusion Models [58.6]
我々は,新しい自動侵害識別フレームワークであるCopyJudgeを提案する。我々は, 抽象フィルタ比較テストフレームワークを用いて, 侵害の可能性を評価する。インフレクションを自動最適化する汎用LVLM方式の緩和戦略を導入する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:32:31 GMT)
FAST: Similarity-based Knowledge Transfer for Efficient Policy Learning [57.5]
Transfer Learningは、タスク間で知識を伝達することで学習を加速する能力を提供する。これは、負の転送、ドメイン適応、ソリッドソースポリシーの選択における非効率といった重要な課題に直面します。本研究では,知識伝達の改善,タスク間のパフォーマンスの促進,計算コストの削減など,TLの課題に挑戦する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:21:53 GMT)
A General Framework for Estimating Preferences Using Response Time Data [56.7]
本研究は, 時間的選択実験への実証的応用を開発し, 応答時間の利用によって予測精度が得られ, 経済的に関係のあるパラメータを推定する上での課題が示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:13:02 GMT)
Seed LiveInterpret 2.0: End-to-end Simultaneous Speech-to-speech Translation with Your Voice [52.7]
同時解釈 (SI) は、翻訳業界における最強のフロンティアの1つである。 Seed-LiveInterpret 2.0は、音声のクローン機能を備えた高忠実で低レイテンシな音声音声合成を実現するエンドツーエンドのSIモデルである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:17:25 GMT)
Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.4]
Retrieval-Augmented Generationは、大規模な言語モデル幻覚を緩和するための強力なアプローチとして登場した。既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:10:15 GMT)
Humanoid Occupancy: Enabling A Generalized Multimodal Occupancy Perception System on Humanoid Robots [50.1]
ヒューマノイドロボット技術は急速に進歩しており、メーカーは特定のシナリオに合わせて様々な視覚認識モジュールを導入している。総合的な環境理解に不可欠なリッチなセマンティック情報と3D幾何学情報の両方を提供するため、占有率に基づく表現はヒューマノイドロボットに特に適していると広く認識されている。本稿では,ハードウェアとソフトウェアコンポーネントを統合した汎用マルチモーダル占有認識システムであるHumanoid Occupancy,データ取得装置,専用のアノテーションパイプラインを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:47:00 GMT)
Parameter-Efficient Fine-Tuning in Spectral Domain for Point Cloud Learning [49.9]
我々は,ポイントクラウドのための新しい固有textbfPointGST (textbfGraph textbfSpectral textbfTuning) 法を提案する。ポイントGSTは事前訓練されたモデルを凍結し、スペクトル領域の微調整パラメータのための軽量で訓練可能なポイントクラウドスペクトルアダプタ(PCSA)を導入する。さまざまなタスクにわたる挑戦的なポイントクラウドデータセットの実験では、ポイントGSTが完全に微調整されたデータセットを上回るだけでなく、トレーニング可能なパラメータも大幅に削減されていることが示されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:22:45 GMT)
Cognitive Chain-of-Thought: Structured Multimodal Reasoning about Social Situations [49.2]
CoT(Chain-of-Thought)は、モデルを段階的に考えるのに役立つ。しかし、彼らが見、理解し、一度に判断しなければならないと、どうなるのか? 認知的連鎖(CoCoT)は,認知にインスパイアされた3つの段階(知覚,状況,規範)を通じて,VLM推論を足場とする促進戦略である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:40:30 GMT)
RESCUE: Crowd Evacuation Simulation via Controlling SDM-United Characters [48.4]
現在の避難モデルは、避難中に起こる複雑な人間の行動を見渡す。本研究では,3次元適応型SFM(Social Force Model)決定機構とパーソナライズされた歩行制御モータを統合したリアルタイム3次元集団避難シミュレーションフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:50:18 GMT)
A Unified Image-Dense Annotation Generation Model for Underwater Scenes [48.3]
本稿では,水中のシーンに対して,テキスト・ツー・イメージ・デンスアノテーションを統一的に生成する手法を提案する。テキストのみを入力とし、リアルな水中画像と高度に一貫性のある複数のアノテーションを同時に生成する。 TIDEを用いて大規模な水中データセットを合成し,水中密集予測における手法の有効性を検証した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:53:41 GMT)
FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.9]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。 FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:39:01 GMT)
Algebras of actions in an agent's representations of the world [46.7]
我々は、対称性に基づく非交叉表現学習形式から対称性に基づく表現を再現するために、我々のフレームワークを使用する。次に、簡単な強化学習シナリオで発生する特徴を持つ世界の変換の代数について研究する。私たちが開発した計算手法を用いて、これらの世界の変換の代数を抽出し、それらの性質に応じてそれらを分類する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:54:59 GMT)
Is Crunching Public Data the Right Approach to Detect BGP Hijacks? [46.6]
ボーダーゲートウェイプロトコル(BGP)は、インターネットルーティングの脆弱な柱であり続けている。 DFOHやBEAMといった最近のアプローチでは、グローバルに分散したBGPモニターからのデータ分析に機械学習(ML)を採用している。本稿では、DFOHやBEAMのような最先端のハイジャック検出システムは、データ中毒に対して脆弱であることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:35:21 GMT)
Iterative Pretraining Framework for Interatomic Potentials [46.5]
MLIPモデルの予測性能を向上させるために, 原子間ポテンシャルの反復事前学習(IPIP)を提案する。 IPIPは、反復訓練が最適な局所最小値に収束するのを防ぐための、忘れるメカニズムを組み込んでいる。汎用力場と比較すると,Mo-S-Oシステムでは予測誤差が80%以上減少し,最大4倍の高速化を実現している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:59:41 GMT)
DoubleDipper: Improving Long-Context LLMs via Context Recycling [44.2]
In-Context-Learning法であるDoubleDipperを提案する。提案手法を大規模言語モデルに適用し,大幅な改良を行った。驚いたことに、シングルホップICLの例しか導入していないにもかかわらず、LLMはマルチホップ長文QAに一般化することに成功している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:47:16 GMT)
PUMPS: Skeleton-Agnostic Point-based Universal Motion Pre-Training for Synthesis in Human Motion Tasks [44.2]
モーションスケルトンは、骨階層を変換することで3Dキャラクターアニメーションを駆動するが、比例や構造の違いにより、骨格間での移動が困難になる。 TPC(Temporal Point Clouds)は、構造化されていない、相互互換のモーション表現を提供する。 TPCデータのためのプリミティブオートエンコーダアーキテクチャであるPUMPSを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:20:49 GMT)
AnimalClue: Recognizing Animals by their Traces [43.1]
AnimalClueは、間接的な証拠の画像から種を特定するための最初の大規模なデータセットである。 968種、200家族、65の注文がある。既存のデータセットとは異なり、AnimalClueは分類、検出、インスタンスセグメンテーションタスクに固有の課題を提示している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:48:03 GMT)
ModalFormer: Multimodal Transformer for Low-Light Image Enhancement [42.6]
低照度画像強調(LLIE)は、低照度条件下で撮影される画像のノイズ、詳細さの喪失、コントラストの低さのため、基本的な課題である。近年の手法はRGB画像のピクセルレベルの変換にのみ依存しており、複数の視覚的モダリティから利用可能なリッチなコンテキスト情報を無視することが多い。 LLIEのための最初の大規模マルチモーダルフレームワークであるModalFormerについて述べる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:07:22 GMT)
GT-Mean Loss: A Simple Yet Effective Solution for Brightness Mismatch in Low-Light Image Enhancement [40.5]
低照度画像強調(LLIE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。監督されたLLIE研究では、拡張された画像の全体的な明るさと、その根底にある真実との矛盾が、しばしば見過ごされがちである。本稿では,GT平均損失(GT平均損失)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:54:28 GMT)
LUDVIG: Learning-Free Uplifting of 2D Visual Features to Gaussian Splatting Scenes [39.7]
本稿では,3次元シーンのガウススプラッティング表現に2次元画像特徴を引き上げる新しい手法を提案する。本手法は,グラフ拡散機構により拡張された,よりシンプルで効率的な特徴集約手法を用いる。提案手法は,複数のダウンストリームタスクにおける技術状況に匹敵する性能を達成しつつ,大幅な高速化を実現している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:59:31 GMT)
SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration [39.4]
SciToolAgentは生物学、化学、材料科学にまたがる何百もの科学ツールを自動化する。エージェントはまた、責任と倫理的ツールの使用を保証するために、包括的な安全チェックモジュールも組み込んでいる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:55:35 GMT)
Motion Keyframe Interpolation for Any Human Skeleton via Temporally Consistent Point Cloud Sampling and Reconstruction [37.8]
Point Cloud-based Motion Representation (PC-MRL)は、運動学習のための骨格間の相互互換性を実現するための教師なしのアプローチである。 PC-MRLは、時間点雲サンプリングを用いた骨格難読化戦略と、点雲からの教師なし骨格復元法からなる。我々は、制御されていないクラウド・ツー・骨格運動プロセスに必要な制限を克服するために、第1フレームオフセット準位(FOQ)とRPA(Rest Pose Augmentation)戦略を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:47:19 GMT)
TurboSpec: Closed-loop Speculation Control System for Optimizing LLM Serving Goodput [37.6]
大規模言語モデル (LLM) システムは、効率的なサービスを実現するために、同時ユーザー要求をバッチ化する。本稿では,実行環境を自動的にプロファイリングする投機制御システムTurboSpecを提案する。さまざまなワークロードとハードウェア構成にまたがって、その効果を実証します。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:20:41 GMT)
Neural Shell Texture Splatting: More Details and Fewer Primitives [37.3]
表面のテクスチャ情報をエンコードするグローバル表現であるニューラルシェルテクスチャを導入する。本評価により, 高いパラメータ効率, きめ細かなテクスチャディテール再構築, 容易なテクスチャメッシュ抽出が可能であることが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:39:10 GMT)
Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.9]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:04:06 GMT)
Protein-SE(3): Benchmarking SE(3)-based Generative Models for Protein Structure Design [35.9]
SE(3)に基づく生成モデルは、タンパク質の幾何学的モデリングと効率的な構造設計において非常に有望である。統合トレーニングフレームワークに基づく新しいベンチマークであるProtein-SE(3)は、タンパク質の足場タスク、統合生成モデル、高レベルの数学的抽象化、多様な評価指標で構成されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:53:05 GMT)
MaPPO: Maximum a Posteriori Preference Optimization with Prior Knowledge [35.7]
本稿では,好みから学習するフレームワークであるPosteriori Preference Optimization (MaPPO)を提案する。 MaPPOは、事前の報酬推定値を、原則的最大値MaP(Posteriori)目標に統合する。 MaPPOはDPOの亜種を一貫して改善したプラグインとして使用できる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:26:50 GMT)
Data-Efficient Prediction-Powered Calibration via Cross-Validation [35.0]
本稿では,限られたキャリブレーションデータを効率的に利用して予測器を微調整し,合成ラベルのバイアスを推定する手法を提案する。提案手法は,AI生成決定に対する厳密なカバレッジ保証を備えた予測セットを生成する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:31:02 GMT)
When Does Metadata Conditioning (NOT) Work for Language Model Pre-Training? A Study with Context-Free Grammars [34.8]
潜在意味論は、言語モデルのパフォーマンスを決定する重要な特性の1つです。この機能を呼び出すための便利なアプローチの1つは、事前トレーニングデータのテキストの開始時にメタデータをプリペンドすることである。メタデータを用いたトレーニングは、与えられたコンテキストが遅延セマンティクスを推測するのに十分な時間である場合に、モデルの性能を向上させることができることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:42:28 GMT)
ViewSRD: 3D Visual Grounding via Structured Multi-View Decomposition [34.4]
3Dビジュアルグラウンドティングは、テキスト記述に基づいて、オブジェクトを3D空間で特定し、ローカライズすることを目的としている。構造化多視点分解プロセスとして3次元視覚グラウンドを定式化するフレームワークであるViewSRDを提案する。 3次元視覚的グラウンドデータセットの実験により、ViewSRDは最先端の手法を大幅に上回っていることが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:20:54 GMT)
Manipulating Multimodal Agents via Cross-Modal Prompt Injection [34.4]
マルチモーダルエージェントにおいて、これまで見過ごされていた重要なセキュリティ脆弱性を特定します。攻撃者が複数のモードにまたがって敵の摂動を埋め込む新たな攻撃フレームワークであるCrossInjectを提案する。本手法は,攻撃成功率を少なくとも30.1%向上させることで,最先端の攻撃よりも優れる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:12:52 GMT)
On the Role of Discrete Representation in Sparse Mixture of Experts [33.8]
VQMoE(Vector-Quantized Mixture of Experts)と呼ばれる新しいアーキテクチャを提案する。 VQMoEは計算コストを増大させることなく、モデルキャパシティをスケールアップするための効果的なソリューションである。 VQMoEは,他のSMoEルーティング方式と比較して,ルータの28%の改善を実現している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:26:08 GMT)
Motion-example-controlled Co-speech Gesture Generation Leveraging Large Language Models [33.6]
我々は,大規模言語モデル(LLM)を活用して,動きのサンプル制御による協調音声ジェスチャ生成のためのフレームワークMECoを提案する。本手法は,音声認識と動作例を同時に解釈するための微調整により,LLMの理解能力を活用する。我々のフレームワークは、個々の身体部分のきめ細かい制御を可能にし、モーションクリップ、静的ポーズ、ヒューマンビデオシーケンス、テキスト記述など、多様な入力モダリティに対応している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:59:29 GMT)
Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training [33.6]
アクションベースのコントラスト自己学習は、多ターン会話モデリングにおけるデータ効率のよい対話ポリシー学習を可能にする。動作ラベルがない場合でも、データ効率のよいチューニングシナリオにおいてACTの有効性を実証する。また,会話におけるあいまいさを暗黙的に認識し,説明できるかどうかを調べることで,LLMが会話エージェントとして機能する能力を評価することを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:59:06 GMT)
Synomaly Noise and Multi-Stage Diffusion: A Novel Approach for Unsupervised Anomaly Detection in Medical Images [33.0]
医用画像における異常検出は、様々な画像モダリティにおける病理領域の同定において重要な役割を担っている。本研究では,合成ノイズ関数と多段階拡散過程を組み込んだ拡散モデルに基づく新しい教師なし異常検出フレームワークを提案する。脳MRI,肝CT,頸動脈USデータセットに対する提案手法の検証を行った。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:59:42 GMT)
Emerging Properties in Unified Multimodal Pretraining [32.9]
マルチモーダル理解と生成をサポートするオープンソースの基盤モデルであるBAGELを紹介する。 BAGELは、大規模なインターリーブ付きテキスト、画像、ビデオ、Webデータからキュレートされた数兆のトークンに基づいて事前訓練された、統一されたデコーダのみのモデルである。オープンソースの統一モデルでは、マルチモーダル生成と標準ベンチマークでの理解の両方において、大幅に優れています。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:45:16 GMT)
Analytic Continual Test-Time Adaptation for Multi-Modality Corruption [31.7]
テスト時間適応(TTA)は、未ラベルのテストデータを使用して、トレーニング済みのモデルがソースとターゲットデータセット間のギャップを埋めることを可能にする。テスト時間適応(TTA)は、未ラベルのテストデータを使用して、トレーニング済みのモデルがソースとターゲットデータセット間のギャップを埋めることを可能にする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:36:23 GMT)
Retrieval and Distill: A Temporal Data Shift-Free Paradigm for Online Recommendation System [31.6]
現在のレコメンデーションシステムは、時間的データシフトの深刻な問題によって大きく影響を受ける。既存のモデルのほとんどは、データのシフトから学ぶことのできる、転送可能な一時的なデータシフトのない情報を見渡すことで、更新データの利用に重点を置いている。そこで本研究では,データシフトのない関連ネットワークを,シフトデータを用いてトレーニング可能な検索ベースレコメンデーションシステムフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:23:00 GMT)
Compressed Image Generation with Denoising Diffusion Codebook Models [31.6]
本稿では,高品質な画像サンプルと非圧縮ビットストリーム表現を生成する新しい生成手法を提案する。これは、逆拡散における標準ガウスノイズサンプリングを、固定イドガウスベクトルの予め定義されたコードブックから選択したノイズサンプルに置き換えることによって得られる。 DDCMを利用して、与えられた画像に最もよくマッチするコードブックからノイズを抽出し、生成モデルを高能率な損失画像に変換する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:57:40 GMT)
Knowledge Distillation with Refined Logits [31.2]
本稿では,現在のロジット蒸留法の限界に対処するため,Refined Logit Distillation (RLD)を導入する。我々のアプローチは、高性能な教師モデルでさえ誤った予測をすることができるという観察に動機づけられている。本手法は,教師からの誤解を招く情報を,重要なクラス相関を保ちながら効果的に排除することができる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:26:24 GMT)
Self-Regularization with Sparse Autoencoders for Controllable LLM-based Classification [29.7]
大規模言語モデル(LLM)潜在空間における意図しない特徴を特定し,規則化する新しいフレームワークを提案する。本稿では,有毒なチャット検出,報酬モデリング,疾患診断を含む3つの実世界の課題に関する枠組みについて検討する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:44:09 GMT)
Length Representations in Large Language Models [29.5]
本研究では,大言語モデルの内部表現に出力シーケンス長情報をエンコードする方法に関する実証的証拠を提供する。モデル内の特定の隠蔽単位をスケーリングすることにより、生成したテキストの情報量を失うことなく、出力シーケンス長を制御できる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:41:39 GMT)
CTR-Driven Ad Text Generation via Online Feedback Preference Optimization [28.7]
大規模言語モデル(LLM)は、手動の広告テキスト作成よりも効率性が高い。 LLMは人造テキストよりも高いCTR性能を保証していない。オンラインフィードバックからの好みの最適化によってCTRを最適化する新しい広告テキスト生成手法を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:13:03 GMT)
IQ Test for LLMs: An Evaluation Framework for Uncovering Core Skills in LLMs [27.3]
本稿では,因子分析を用いて,ベンチマーク間での潜在スキルの駆動性能を推定する新しい評価パラダイムを提案する。これらの洞察を、冗長なタスクを識別し、モデル選択を支援し、各潜伏するスキルに沿ってプロファイルモデルをプロファイルする実践的なツールに変換する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:11:16 GMT)
When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios [27.2]
MLLM(Multimodal large language model)は、より長く複雑なコンテキストを処理する。トークン圧縮は、トレーニングと推論の両方でトークンの数を効率的に削減する、目立たしく批判的なアプローチとして登場した。本稿では,マルチモーダル長コンテキストトークン圧縮の発芽領域に関する最初の体系的調査と合成について述べる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:33:56 GMT)
Controllable Feature Whitening for Hyperparameter-Free Bias Mitigation [26.9]
ディープニューラルネットワークは、データセットに存在する急激な相関を学習することができる。目的とバイアスの特徴の線形相関を共分散行列により定量化し, ホワイトニングモジュールを通して除去する。提案手法は,4つのベンチマークデータセットにおける既存手法よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:01:30 GMT)
Versatile Multimodal Controls for Expressive Talking Human Animation [26.6]
VersaAnimatorは、任意のポートレート画像から表現力のある人間の動画を合成する多目的フレームワークである。本稿では,3次元動作トークンを2次元ポーズシーケンスにスムーズにマッピングするトークン2poseトランスレータを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:08:12 GMT)
Benchmarking and Learning Multi-Dimensional Quality Evaluator for Text-to-3D Generation [26.1]
近年,テキスト・ツー・3D生成は目覚ましい進歩を遂げているが,これらの手法の評価はいまだに困難である。既存のベンチマークには、異なるプロンプトカテゴリと評価次元に関するきめ細かい評価が欠けている。まず,MATE-3Dという総合ベンチマークを提案する。ベンチマークには、単一のオブジェクト生成と複数のオブジェクト生成をカバーする、よく設計された8つのプロンプトカテゴリが含まれており、結果として1,280のテクスチャメッシュが生成される。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:18:49 GMT)
Beyond Walking: A Large-Scale Image-Text Benchmark for Text-based Person Anomaly Search [25.9]
そこで本研究では,日常的・異常な活動に従事する歩行者をテキストで検索するタスクを提案する。このタスクのトレーニングと評価を可能にするため,大規模画像テキストによる歩行者異常行動ベンチマークを構築した。提案したベンチマーク実験により, 合成学習データにより詳細な動作の検索が容易となり, 提案手法は84.93%のリコール@1精度で到達した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:25:05 GMT)
CodeNER: Code Prompting for Named Entity Recognition [25.4]
実験の結果,提案手法は,英語,アラビア語,フィンランド語,デンマーク語,ドイツ語の10つのベンチマークにおいて,従来のテキストベースのプロンプトよりも優れていた。また,提案したコードベースプロンプトとチェーン・オブ・シークレットを組み合わせることで,性能がさらに向上することを確認した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:49:36 GMT)
Video2BEV: Transforming Drone Videos to BEVs for Video-based Geo-localization [25.4]
我々は、新しいビデオベースドローンジオローカライズタスクを定式化し、Video2BEVパラダイムを提案する。このパラダイムは、ビデオをBird's Eye View (BEV)に変換し、その後のtextbfinter-platformマッチングプロセスを簡素化する。提案手法を検証するために,新しいビデオベースジオローカライゼーションデータセットUniVを導入する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:16:24 GMT)
MIGE: Mutually Enhanced Multimodal Instruction-Based Image Generation and Editing [25.1]
MIGEはマルチモーダル命令を使ってタスク表現を標準化する統合フレームワークである。まず、対象駆動生成を空白キャンバス上の生成として扱い、命令ベースの編集を既存の画像の修正として扱う。 MIGEは、命令ベースの主観的編集の新しいタスクにSOTAを設定しながら、主観的生成と命令に基づく編集の両面で優れている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:54:21 GMT)
CP-LLM: Context and Pixel Aware Large Language Model for Video Quality Assessment [25.1]
CP-LLM(Context and Pixel aware Large Language Model)を紹介する。 CP-LLMは、言語デコーダとともに、高レベル(ビデオコンテキスト)と低レベル(ピクセル歪み)の粒度の両方で知覚品質を独立に解析するために設計されたデュアルビジョンエンコーダを備えている。実験により, CP-LLMは, 確立されたVQAベンチマーク上での最先端のクロスデータセット性能と, 画素歪みに対する優れたロバスト性を実現することを示した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:40:21 GMT)
DDB: Diffusion Driven Balancing to Address Spurious Correlations [24.9]
経験的リスク最小化でトレーニングされたディープニューラルネットワークは、アウト・オブ・ディストリビューションのサンプルに一般化できないことが多い。テキストと画像の拡散モデルを用いたトレーニングサンプルを生成するための拡散駆動バランス(DDB)手法を提案する。実験の結果,本手法は既存の最先端手法よりもグループ精度がよいことがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:26:14 GMT)
When Prompts Go Wrong: Evaluating Code Model Robustness to Ambiguous, Contradictory, and Incomplete Task Descriptions [23.6]
LLM(Large Language Models)は、理想的な条件下でのコード生成タスクの性能を示す。実際には、タスク記述はしばしば曖昧さ、不完全性、内部矛盾を示す。このような不明瞭なタスク記述に直面した場合、最先端のコード生成モデルの堅牢性を検証した最初の実証的研究を示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 23:16:14 GMT)
ELMES: An Automated Framework for Evaluating Large Language Models in Educational Scenarios [23.5]
大規模言語モデル(LLM)は、多くの新しいアプリケーションシナリオを生成する、教育の変革的な機会を提供する。現在のベンチマークは、教育能力よりも一般知能を主に測定している。本研究では,オープンソースの自動評価フレームワークであるEMMESを紹介した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:20:19 GMT)
Improving Subgraph Matching by Combining Algorithms and Graph Neural Networks [23.0]
ホモモルフィズムは、その構造を保存するグラフの間のキーマッピング技術である。グラフ準同型のための最初のグラフニューラルネットワークフレームワークであるHFrameを提案する。 HFrameは正確なマッチングアルゴリズムよりも最大101.91倍高速で、平均精度は0.962である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:10:15 GMT)
Real-Time LaCAM for Real-Time MAPF [22.7]
証明可能な完全性保証を備えた初のリアルタイムMAPF手法であるReal-Time LaCAMを提案する。以上の結果から,1ミリ秒の遮断時間で混雑環境を反復的に計画する方法が示唆された。また,シングルステップ学習MAPFポリシーでどのように使用できるかを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:11:22 GMT)
Scaling Analysis of Interleaved Speech-Text Language Models [22.6]
既存の音声言語モデル(SLM)のスケーリング分析は、SLMがテキストよりもはるかに多くの計算とデータを必要とすることを予測している。現代のSLMは、知識伝達を可能にするために、音声テキストインターリーブを用いて事前訓練されたTextLMから初期化されることが多い。我々は,数ダースをトレーニングし,スケーリングの傾向を分析することで,インターリーブSLMのスケーリング分析を行う。以上の結果から,大規模化モデルでは先行モデルに匹敵するセマンティック音声性能が得られ,計算量やデータ量が少ないことが示唆された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:33:45 GMT)
Partial Domain Adaptation via Importance Sampling-based Shift Correction [22.1]
部分的ドメイン適応(PDA)は、現実世界の機械学習シナリオにおいて難しいタスクである。そこで我々は,新しいラベル付きデータをサンプリングドメインからサンプリングする,新しい重要サンプリングベースシフト補正法 (IS$2$C) を提案する。一般化誤差がIS$2$Cで十分に支配できることを証明することにより、IS$2$Cの理論的な保証を提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:19:07 GMT)
Generalized Trusted Multi-view Classification Framework with Hierarchical Opinion Aggregation [22.1]
階層的な意見集約を伴う信頼性のある多視点分類フレームワークを提案する。イントラアグリゲーションでは、各ビューは、他のビューと共有される共通情報と、その特定の情報で構成されていると仮定する。ビュー間のアグリゲーションにおいて、異なる視点からの意見アグリゲーションを促進するために、エビデンスレベルでアグリゲーションメカニズムを設計する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:29:17 GMT)
LRR-Bench: Left, Right or Rotate? Vision-Language models Still Struggle With Spatial Understanding Tasks [22.0]
VLM(Vision-Language Models)が空間的関係を認識し空間的動きを知覚する方法は、まだ解明されていない。本研究では,空間評価パイプラインを導入し,対応するベンチマークを構築する。我々は、複数の最先端VLMの実験を行い、改善の余地があることを観察する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:31:24 GMT)
Representing 3D Shapes With 64 Latent Vectors for 3D Diffusion Models [22.0]
COD-VAEは3D形状を1D潜伏ベクトルからなるCampact集合に符号化する。その結果,COD-VAEは品質を維持しつつ,ベースラインの16倍の圧縮を実現していることがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:17:19 GMT)
Bipedalism for Quadrupedal Robots: Versatile Loco-Manipulation through Risk-Adaptive Reinforcement Learning [21.9]
四足歩行ロボットに二足歩行を導入し,前肢を開放し,環境との多目的インタラクションを実現する。後肢を歩行する四足歩行ロボットを対象としたリスク適応型分散強化学習フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:51:34 GMT)
Wavelet-guided Misalignment-aware Network for Visible-Infrared Object Detection [21.6]
本稿では,ウェーブレット誘導型ミスアライメント・アウェアネットワーク(WMNet)を提案し,異なるモード間ミスアライメントパターンに適応的に対処する。低周波情報と高周波情報を併用することにより、WMNetはノイズ、照明のばらつき、空間的ミスアライメントの悪影響を軽減する。刺激的または誤解を招く情報を抑えつつ、健全な目標特徴の表現を高め、より正確でロバストな検出を促進する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:53:31 GMT)
Vidar: Embodied Video Diffusion Model for Generalist Bimanual Manipulation [21.4]
アクション推論のためのビデオ拡散(Vidar)について紹介する。実世界の3つのロボットプラットフォームから、750Kのマルチビュービデオ上で、ビデオ拡散モデルを事前訓練する。ロボットプラットフォーム上での人間によるデモはわずか20分で終わるが、Vidarは目に見えないタスクや背景を、強力なセマンティックな理解で一般化する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:48:18 GMT)
Come Together, But Not Right Now: A Progressive Strategy to Boost Low-Rank Adaptation [21.1]
低ランク適応(LoRA)は,大規模基盤モデルに適応するためのパラメータ効率の高い微調整手法として登場している。微調整の過程でアダプタのアクティベーション確率を徐々に高めるプログレッシブトレーニング戦略であるCoToプルーニングを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:06:57 GMT)
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance [21.1]
トレーニング後の量子化は、大規模言語モデルのメモリと推論遅延を低減するための重要なテクニックである。本稿では,エンドロスからの勾配情報を量子化対象に組み込む新しい量子化手法である GuidedQuant を提案する。 GuidedQuantは、ウェイトオンリーのスカラー、ウェイトオンリーのベクトル、ウェイト・アンド・アクティベーションの量子化にまたがる最先端の量子化手法の性能を一貫して向上させる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:06:56 GMT)
SDD: Self-Degraded Defense against Malicious Fine-tuning [20.6]
悪質な微調整は容易に安全アライメントを回避できる。自己劣化防衛(SDD)フレームワークを紹介する。この攻撃に対するSDDの有効性を実験的に検証した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:08:21 GMT)
HoneyImage: Verifiable, Harmless, and Stealthy Dataset Ownership Verification for Image Models [20.2]
HoneyImageは画像認識モデルにおけるデータセットのオーナシップ検証の新しい手法である。 HoneyImageは、少数のハードサンプルを選択的に修正して、認識不能で検証可能なトレースを埋め込む。実験によると、HoneyImageは下流のパフォーマンスに最小限の影響を伴って、強い検証精度を一貫して達成している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:44:47 GMT)
Integrating LLM-Derived Multi-Semantic Intent into Graph Model for Session-based Recommendation [20.1]
セッションベースのレコメンデーション(SBR)は主に匿名ユーザインタラクションシーケンスに基づいている。本稿では,セッションベースレコメンデーション(LLM-DMsRec)のためのグラフモデルへのLLM-Derived Multi-Semantic Intentと呼ばれる新しいSBRアプローチを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:54:00 GMT)
Point Cloud Self-supervised Learning via 3D to Multi-view Masked Learner [19.9]
本稿では,3次元と投影された2次元特徴から点雲と多視点画像を再構成する3次元から多視点自動エンコーダを提案する。 2次元と3次元の表現を整合させる新しい2段階の自己学習戦略が提案されている。提案手法は,3次元分類,部分分割,オブジェクト検出など,さまざまな下流タスクにおいて,最先端のタスクよりも優れる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:46:18 GMT)
A Free Probabilistic Framework for Analyzing the Transformer-based Language Models [19.8]
本稿では,自由確率理論を用いたトランスフォーマーに基づく言語モデル解析のための形式的演算子理論フレームワークを提案する。この研究は、理論上は大きな言語モデルにおける構造力学に関する原則的視点を提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:04:17 GMT)
Measuring and Explaining the Effects of Android App Transformations in Online Malware Detection [19.4]
マルウェア検出に対するアプリ変換の効果を測定するためのデータ駆動型手法を提案する。トレース可能な変更を伴う多数のAndroidアプリを生成するために、6つのアプリ変換テクニックが実装されている。最後に,シグネチャベース,静的解析ベース,動的解析ベース検出技術の観点から,抗ウイルスエンジンの包括的解析を行う。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:26:50 GMT)
GenM$^3$: Generative Pretrained Multi-path Motion Model for Text Conditional Human Motion Generation [19.3]
Generative Pretrained Multi-path Motion Model (GenM(3))は、統合された動き表現を学習するための包括的なフレームワークである。大規模なトレーニングを可能にするため、11の高品質なモーションデータセットを統合し、統合する。 GenM(3)はHumanML3Dベンチマークで0.035の最先端のFIDを達成し、最先端のメソッドを大きなマージンで上回る。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:52:01 GMT)
Interpretable Anomaly-Based DDoS Detection in AI-RAN with XAI and LLMs [19.3]
次世代無線アクセスネットワーク(RAN)は、インテリジェントコントローラを通じてプログラム可能性、インテリジェンス、およびほぼリアルタイム制御を導入する。本稿では,Large Language Models (LLMs) による将来のRAN環境に対する XAI 侵入検知(IDS) の機会,課題,研究ギャップを概説する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:16:09 GMT)
Intersectional Bias in Japanese Large Language Models from a Contextualized Perspective [19.2]
本研究では,大規模言語モデル(LLM)における交叉バイアスを評価するために,JBBQ間ベンチマークを構築した。 JBBQ による GPT-4o と Swallow の分析により,社会的属性の等しい組み合わせであっても,その文脈によってバイアス出力が変化することがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:14:26 GMT)
EvoSLD: Automated Neural Scaling Law Discovery With Large Language Models [18.7]
スケーリング法則は、ニューラルネットワークのパフォーマンスの進化を予測する基本的な数学的関係である。本稿では,Scaling Law Discoveryの自動化フレームワークであるEvoSLDを紹介する。 EvoSLDは、グループ化されたデータサブセットへの適合エラーを最小限に抑える、同義で普遍的な機能形式を探索する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:45:26 GMT)
MIPS: a Multimodal Infinite Polymer Sequence Pre-training Framework for Polymer Property Prediction [18.6]
既存のモデリングアプローチは、通常は構成モノマーによってポリマーを表すが、ポリマーの全ての性質を捉えるのに苦労している。本稿では, 高分子をモノマーの無限列として表現するMIPS事前学習フレームワークを提案する。トポロジカルな観点から、メッセージパッシング機構(MPM)とグラフアテンション機構(GAM)を無限のポリマー配列に一般化する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:34:51 GMT)
VLMPlanner: Integrating Visual Language Models with Motion Planning [18.6]
VLMPlannerは、学習ベースのリアルタイムプランナと生画像の推論が可能な視覚言語モデル(VLM)を組み合わせたハイブリッドフレームワークである。我々は,VLMが人間の運転動作を模倣できるコンテキスト適応推論ゲート機構を開発した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:15:21 GMT)
First-Order Sparse Convex Optimization: Better Rates with Sparse Updates [18.0]
Inは、疎最適解を用いた凸最適化問題に対して線形収束率を持つことが最近確立された。改良された混合ノルム条件数に依存する線形収束速度はスパース更新のみを用いて得られることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:25:17 GMT)
Cultivating Helpful, Personalized, and Creative AI Tutors: A Framework for Pedagogical Alignment using Reinforcement Learning [17.6]
EduAlignは、より大きな言語モデル(LLM)をより効果的で責任ある教育アシスタントへと導くために設計されたフレームワークである。最初の段階では、8kの教育相互作用のデータセットをキュレートし、それらを手動でアノテートし、自動で3つの重要な教育次元:ヘルプフルネス、パーソナライゼーション、クリエイティビティの3つに分類する。第2段階では、HPC-RMを報奨信号として利用し、2kの多様なプロンプトのセット上で、グループ相対ポリシー最適化(GRPO)を用いて事前学習したLLMを微調整する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:56:29 GMT)
Ask and Remember: A Questions-Only Replay Strategy for Continual Visual Question Answering [17.4]
VQACL(Continuous Learning in Visual Question Answering)は、学習前の知識(安定性)を保ちながら、新しい視覚言語スキル(塑性)を取得するモデルを必要とする。既存のメソッドは、主に単調な設定のために設計されており、この二重要求に対処するのに不足することが多い。 Intention Distillation (QUAD) を用いたQUestion-only replay(QUestion-only replay with Attention Distillation)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:10:01 GMT)
Do Not Mimic My Voice: Speaker Identity Unlearning for Zero-Shot Text-to-Speech [17.2]
ZS-TTSは、最小限のオーディオキューから高忠実な音声合成を可能にし、プライバシーと倫理上の懸念を生じさせた。音声のプライバシーに対する脅威にもかかわらず、望ましくない個々の声を複製する知識を選択的に除去する研究は行われていない。我々は、ZS-TTSのための最初の機械学習フレームワーク、特にTGU(Teacher-Guided Unlearning)を提案する。提案手法は,未知の話者が追跡不能であることを保証するため,話者の音声が一貫した複製されないようにランダム性を組み込む。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:13:58 GMT)
Context-Aware Deep Lagrangian Networks for Model Predictive Control [17.1]
本研究では,Deep Lagrangian Networks (DeLaN)を拡張し,コンテキスト認識を実現する。また、DeLaNと残留力学モデルを組み合わせることで、ロボットの名目モデルが一般的に利用可能であるという事実を活用する。本手法は, ベースラインで達成した21%の改善に比べ, エンドエフェクタ追跡誤差を39%削減する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:10:22 GMT)
SWIFT: A General Sensitive Weight Identification Framework for Fast Sensor-Transfer Pansharpening [16.6]
Pansharpeningは、高分解能パノクロマトグラフィ(PAN)画像と低分解能マルチスペクトル(LRMS)画像を融合して高分解能マルチスペクトル(HRMS)画像を生成することを目的としている。深層学習に基づく手法は有望な性能を達成したが、通常、目に見えないセンサーのデータに適用すると、厳しい性能劣化に悩まされる。クロスセンサ適応のための高速かつ汎用的なフレームワークSWIFTを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:06:05 GMT)
Critiques of World Models [15.9]
我々は、世界モデルの第一の目的は、目的的推論と行動のために、現実世界のあらゆる実行可能な可能性をシミュレートすることであると主張している。本稿では,階層的・多層的・混合的連続・離散的表現に基づく汎用世界モデルのための新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:36:54 GMT)
Advancing Dialectal Arabic to Modern Standard Arabic Machine Translation [15.8]
本稿では,レバンタ語,エジプト語,湾岸方言のDA-MSA翻訳の進展に寄与する2つの中核的貢献について述べる。ゼロショット,チェーン・オブ・シント,提案手法であるAra-TEaR法を改良した。共同で訓練されたマルチダイアレクトモデルは、シングルダイアレクトのモデルを10%以上のCHrF++で上回った。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:37:53 GMT)
Does equivariance matter at scale? [15.2]
我々は、等変ネットワークと非等変ネットワークが、計算およびトレーニングサンプルでどのようにスケールするかを研究する。まず、等分散によりデータ効率が向上するが、データ拡張による非同変モデルのトレーニングは、十分なエポックを考慮すれば、このギャップを埋めることができる。第二に、計算によるスケーリングは、テストされた各計算予算において、同変モデルが非同変モデルよりも優れたパワー則に従う。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:40:09 GMT)
Post-Completion Learning for Language Models [15.2]
現在の言語モデルトレーニングパラダイムは、エンド・オブ・シーケンス(eos>)トークンに到達して学習を終了する。モデル出力完了後のシーケンス空間を体系的に活用する新しい学習フレームワークであるポストコンプリート学習(PCL)を提案する。 PCLは、学習中の自己評価と報奨予測を継続し、完了点に停止することで効率的な推論を維持する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:47:26 GMT)
Cross-Process Defect Attribution using Potential Loss Analysis [15.1]
ウエハ欠陥のプロセス間根因解析は、半導体製造において最も重要かつ困難な課題の一つである。本稿では、潜在的損失分析(PLA)と呼ばれる、ウエハ欠陥根本原因分析のための新しい枠組みを提案する。 PLAフレームワークの属性は, 部分的処理軌跡から得られる最良の結果を比較することで, 上流プロセスに対する高いウエハ欠陥密度を観測した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:23:09 GMT)
StepFun-Prover Preview: Let's Think and Verify Step by Step [14.9]
本稿では,ツール統合推論による形式定理証明のための大規模言語モデルであるStepFun-Prover Previewを提案する。提案手法は,実時間環境フィードバックに基づく証明を反復的に精錬することにより,人間的な問題解決戦略をエミュレートすることを可能にする。 miniF2F-testベンチマークでは、StepFun-Proverがパス@1成功率70.0%$を達成した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:38:32 GMT)
Semi-Supervised Risk Control via Prediction-Powered Inference [14.9]
リスク制御予測セット(RCPS)は、任意の機械学習モデルの出力を変換し、厳密なエラー率制御で予測ルールを設計するツールである。ラベルのないデータを利用してハイパーパラメータを厳格に調整する半教師付きキャリブレーション手法を導入する。提案手法は予測駆動型推論フレームワーク上に構築され,リスク管理タスクに慎重に適合する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:11:11 GMT)
Goal Alignment in LLM-Based User Simulators for Conversational AI [14.8]
ユーザシミュレータは対話型AIにとって不可欠であり、シミュレートされたインタラクションを通じてスケーラブルなエージェント開発と評価を可能にする。 UGST(User Goal State Tracking)は,会話を通じてユーザ目標の進行を追跡する新しいフレームワークである。本稿では,目標の進捗を自律的に追跡し,目標に沿った応答を生成するユーザシミュレータを開発するための3段階の方法論を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:07:12 GMT)
MH-GIN: Multi-scale Heterogeneous Graph-based Imputation Network for AIS Data (Extended Version) [14.1]
異なる異種属性の値が多様なレートで更新されるため、不足値の発行は困難である。 MH-GINはマルチスケールなグラフベースインプットネットワークであり、マルチスケールの依存関係をキャプチャすることで、インプットの精度を向上させることを目的としている。その結果,MH-GINは,最先端手法と比較して平均57%の計算誤差を低減できることがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:31:47 GMT)
Fine-structure Preserved Real-world Image Super-resolution via Transfer VAE Training [14.1]
我々は、事前訓練されたUNetに適応しつつ、8$times$ダウンサンプルのVAEを4$times$1に転送するためのTransfer VAE Training(TVT)戦略を提案する。 TVT戦略は、新しいエンコーダとデコーダのペアを元のVAEラテント空間と整合させ、画像の細部を拡大する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:11:29 GMT)
MIRepNet: A Pipeline and Foundation Model for EEG-Based Motor Imagery Classification [12.6]
脳コンピュータインタフェース(BCI)は、脳と外部デバイス間の直接通信を可能にする。最近の脳波基礎モデルは、多様なBCIパラダイムにわたる一般化された表現を学習することを目的としている。本稿では,運動画像パラダイムに適した脳波基礎モデルMIRepNetを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:54:42 GMT)
Checklist Engineering Empowers Multilingual LLM Judges [12.6]
Checklist Engineering ベースの LLM-as-a-Judge (CE-Judge) は、オープンソースのモデルによる多言語評価にチェックリストの直観を使用する、トレーニング不要のフレームワークである。我々の手法は一般にベースラインを超え、GPT-4oモデルと同等に機能する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:42:57 GMT)
Second Competition on Presentation Attack Detection on ID Card [12.6]
20チームが登録され、74のモデルが提出された。トラック1では、Dragonsチームが平均ランキングとEERで40.48%、EERが11.44%で1位となった。トラック2のより困難なアプローチでは、"Incode"チームは14.76%と6.36%のAVランクで最高の結果に達し、それぞれ74.30%と21.87%のEERの第一版の結果を改善した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:18:52 GMT)
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning [12.5]
本稿では,Agensar-Fin-R1シリーズを紹介する。我々の最適化手法は、高品質で体系的な金融タスクラベルシステムを統合する。われわれのモデルは、主要な金融指標を総合的に評価している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:53:23 GMT)
Dual Frequency Branch Framework with Reconstructed Sliding Windows Attention for AI-Generated Image Detection [12.5]
GAN(Generative Adversarial Networks)と拡散モデルにより、高度にリアルな合成画像の作成が可能になった。 GAN(Generative Adversarial Networks)と拡散モデルにより、高度にリアルな合成画像の作成が可能になった。 AI生成画像の検出は、重要な課題として浮上している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:19:53 GMT)
Wafer Defect Root Cause Analysis with Partial Trajectory Regression [12.3]
本稿では, 部分軌道回帰 (Partial Trajectory Regression, PTR) と呼ばれる, ウエハ欠陥根因解析のための新しい枠組みを提案する。提案するフレームワークは,従来のベクトルベース回帰モデルの制約に対処するために慎重に設計されている。オールバニのNY CREATESファブの実際のウエハ履歴データを用いて,提案手法の有効性を示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:08:40 GMT)
Sequence-Aware Inline Measurement Attribution for Good-Bad Wafer Diagnosis [12.3]
本稿では,Shapley値の拡張であるTSA(Trajectory Shapley Attribution)という新しいフレームワークを提案する。 TSAは、製造プロセスのシーケンシャルな性質を無視するなど、SVの重要な制限を克服している。我々は,ニューヨーク・クリーテス・オールバニ・ナノテクノロジー・ファブ(英語版)において,実験用フロントエンドプロセスにおける良好なウェハ診断タスクにTSAを適用した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:40:11 GMT)
RL$^3$: Boosting Meta Reinforcement Learning via RL inside RL$^2$ [12.1]
本稿では,従来のRLによるタスクごとの学習をMeta-RLに入力するハイブリッドアプローチであるRL$3$を提案する。 RL$3$は、RL$2$よりも長期で累積的な報酬を得られる一方で、メタトレーニング時間を大幅に削減し、アウト・オブ・ディストリビューション・タスクをより一般化することを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:56:53 GMT)
Multi-output Deep-Supervised Classifier Chains for Plant Pathology [12.0]
そこで我々は,2つのラベルの出力層を連鎖させることにより,植物種と病気の予測を織り込む,Multi-Supervised Chains (Mo-DsCC) という新しいモデルを提案する。モデルの利点を評価するため、2つのベンチマークデータセットに対して集中的な実験を行う。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:23:17 GMT)
ADAgent: LLM Agent for Alzheimer's Disease Analysis with Collaborative Coordinator [11.9]
アルツハイマー病(英語: Alzheimer's disease、AD)は、進行性神経変性疾患である。既存の手法のほとんどは、医療専門家が使用する多面的アプローチとは対照的に、単一モダリティデータに依存している。本稿では,ユーザクエリに対処し,意思決定を支援するために,大規模言語モデル(LLM)上に構築されたAD分析のためのAIエージェントであるADAgentを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:17:10 GMT)
Real-time Factuality Assessment from Adversarial Feedback [11.7]
本研究では,従来の情報源からの情報の事実性を評価するための評価が,LCM検出器の時間経過とともに高い精度をもたらすことを示す。適切な事実性評価データセットは、関連する証拠を検索して読み取ることによって、現在の出来事を推論するモデルの能力をテストすべきである、と我々は主張する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:23:31 GMT)
PIVOTS: Aligning unseen Structures using Preoperative to Intraoperative Volume-To-Surface Registration for Liver Navigation [11.7]
PIVOTSは、変形予測の入力として点雲を取るニューラルネットワークである。生体力学シミュレーションパイプラインからシミュレーションした合成データに基づいてニューラルネットワークをトレーニングする。その結果,ベースライン法よりも優れた登録性能が得られた。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:01:26 GMT)
EcoTransformer: Attention without Multiplication [11.6]
本稿では,新しいトランスフォーマーアーキテクチャであるEcoTransformerを提案する。新しいアテンションスコア計算には行列乗算が不要である。 NLP、バイオインフォマティクス、ビジョンタスクにおいて、スケールしたドット製品に匹敵する、あるいは超えている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:32:54 GMT)
TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility [11.4]
軌道予測は自動運転車にとって不可欠であり、車両は周囲の道路利用者の動きを予測できる。現在のディープラーニングモデルは、予測が物理的に実現不可能で、人間には非論理的であるため、信頼性に欠けることが多い。本稿では,エージェントの行動差を捉えるために,すべてのエージェントクラスの相互作用とキネマティックな先行を取り入れることを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:14:24 GMT)
TADT-CSA: Temporal Advantage Decision Transformer with Contrastive State Abstraction for Generative Recommendation [11.3]
Decision Transformer (DT) はシーケンシャルなレコメンデーションタスクに適用される軽量な生成モデルである。コントラスト状態抽象化(TADT-CSA)モデルを用いたテンポラルアドバンテージ決定変換器を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:36:13 GMT)
Language Models Resist Alignment: Evidence From Data Compression [11.2]
大型言語モデル(LLM)は意図しないあるいは望ましくない振る舞いを示すことがある。微調整が事前学習に対するアライメントを著しく損なうことを示す。本研究は,LLMの弾性特性に対処し,アライメントに対する抵抗を緩和する必要性を浮き彫りにした。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:16:42 GMT)
MambaMap: Online Vectorized HD Map Construction using State Space Model [11.2]
MambaMapは、オンラインベクター化されたHDマップを構築するために、状態空間の長い時間的特徴を効率的に融合する新しいフレームワークである。具体的には、MambaMapにはメモリバンクが組み込まれており、過去のフレームから情報を保存して活用している。さらに,BEVとインスタンスレベルの特徴抽出を強化するために,革新的な多方向・時空間走査方式を設計する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:09:27 GMT)
Two Views, One Truth: Spectral and Self-Supervised Features Fusion for Robust Speech Deepfake Detection [11.1]
合成音声の最近の進歩は、音声のディープフェイクをますます現実的なものにし、重大なセキュリティリスクを生じさせている。生波形の埋め込みやスペクトルに基づく特徴など、単一モードに依存する既存の検出方法は、非スプーフ障害に対して脆弱である。自己教師付き学習(SSL)に基づく表現と手作りのスペクトル記述子を統合するハイブリッド融合フレームワークについて検討する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:22:27 GMT)
Aggregation-aware MLP: An Unsupervised Approach for Graph Message-passing [10.9]
AMLP"は、アグリゲーション関数を直接作成することから適応アグリゲーションへとパラダイムをシフトする、教師なしのフレームワークである。提案手法は2つの重要なステップから構成される: まず、高次グルーピング効果を促進するグラフ再構成を利用する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:52:55 GMT)
Awesome-OL: An Extensible Toolkit for Online Learning [10.8]
Awesome-OLは、オンライン学習研究に適したPythonツールキットである。再現可能な比較、ベンチマークデータセットのキュレーション、マルチモーダルビジュアライゼーションのための統一されたフレームワークを提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:34:37 GMT)
TIB-STC: A Large-Scale Structured Tibetan Benchmark for Low-Resource Language Modeling [10.8]
我々は,大規模言語モデル(LLM)の開発と評価を支援するために設計された,最初の大規模,専門家による,マルチドメインベンチマークであるTIB-STCを提案する。我々は、事前訓練、教師付き微調整、優先最適化を含む3段階のパイプラインを通して、TIB-STC上でSun-Shineという参照モデルを訓練する。 Ti-MMLUやTi-SafetyBenchを含むチベット固有のタスクに対するTLUEベンチマークの評価は、堅牢な指示追従と文化的に整合した生成を可能にするためのベンチマークの有効性を示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:18:25 GMT)
FMSD-TTS: Few-shot Multi-Speaker Multi-Dialect Text-to-Speech Synthesis for Ü-Tsang, Amdo and Kham Speech Dataset Generation [10.7]
FMSD-TTS(FMSD-TTS)は、音声合成フレームワーク。限られた参照音声と明示的な方言ラベルから並列方言音声を合成する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:13:27 GMT)
Wine Characterisation with Spectral Information and Predictive Artificial Intelligence [10.7]
本稿では,2段階のワイン製造において,機械学習(ML)技術と分光法を組み合わせることで,比較的簡単な手法を提案する。 Support Vector Machine (SVM) は属性および起点予測タスクにおいて最も効率的で堅牢である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:33:33 GMT)
Tunnelling photons pose no challenge to Bohmian machanics [10.6]
近年、シャログラゾバらは結合導波路におけるエネルギー-速度関係とボヘミア速度を測定する実験を行った。ここでは、この実験がボヘミア力学に挑戦するものではないことを実証する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:50:13 GMT)
NSegment : Label-specific Deformations for Remote Sensing Image Segmentation [10.6]
リモートセンシング(RS)画像セグメンテーションデータセットにおける誤りのラベル付けは暗黙的かつ微妙なままであることが多い。ラベル付けの高コストによる注釈付きRSデータの不足は、ノイズ・ロバストモデルの訓練を複雑にする。 NSegmentは、この問題を軽減するために、シンプルだが効果的なデータ拡張ソリューションである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:41:12 GMT)
Robotic Visual Instruction [10.1]
ロボット視覚指導(RoVI)を導入し,ロボット作業の指導を行う。 RoVIは時空間情報を人間の解釈可能な視覚命令にエンコードする。ロボットがRoVIをよりよく理解できるように、視覚インストラクション・エンボダイド(VIEW)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:58:24 GMT)
Understanding Learner-LLM Chatbot Interactions and the Impact of Prompting Guidelines [9.8]
本研究は,学習者とAIの相互作用を,参加者が効果的なプロンプトの構造化指導を受ける教育実験を通して調査する。ユーザの行動を評価し,有効性を促進するために,107人のユーザから642のインタラクションのデータセットを解析した。我々の研究は、ユーザーが大規模言語モデルとどのように関わり、AI支援コミュニケーションを強化するための構造化された指導の役割についてより深く理解している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:03:49 GMT)
T$^\text{3}$SVFND: Towards an Evolving Fake News Detector for Emergencies with Test-time Training on Short Video Platforms [9.7]
テストタイムトレーニング(TTT)を用いた新しいフェイクニュースビデオ検出フレームワーク(T$3$SVFND)を提案する。具体的には、テキスト中の単語の一定割合を隠蔽するマスク言語モデリング(MLM)に基づく自己教師型補助タスクを設計する。テストタイムトレーニングフェーズでは、モデルが補助的なタスクを通じてテストデータの分散に適応する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:04:00 GMT)
AnimeColor: Reference-based Animation Colorization with Diffusion Transformers [9.6]
アニメーションのカラー化はアニメーション制作において重要な役割を担っているが、既存の手法では色精度と時間的一貫性を達成するのに苦労している。 We propose textbfAnimeColor, a novel reference-based animation colorization framework using Diffusion Transformers (DiT)。提案手法はスケッチシーケンスをDiTに基づくビデオ拡散モデルに統合し,スケッチ制御によるアニメーション生成を可能にする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:25:08 GMT)
ResCap-DBP: A Lightweight Residual-Capsule Network for Accurate DNA-Binding Protein Prediction Using Global ProteinBERT Embeddings [9.6]
本稿では,残差学習に基づくエンコーダと1次元カプセルネットワークを組み合わせた新しいディープラーニングフレームワークResCap-DBPを提案する。 ProteinBERTの埋め込みは、大きなデータセット上の他の表現を大幅に上回る。我々のモデルは、常に現在の最先端の手法より優れています。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:54:32 GMT)
ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models [9.4]
本稿では,新しい任意のビット量子化アルゴリズムと推論フレームワークであるABQ-LLMを紹介する。様々な量子化設定において優れた性能を実現し、GPU上で効率的な任意の精度の量子化推論を可能にする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:44:00 GMT)
Minimax Optimal Reinforcement Learning with Quasi-Optimism [9.4]
EQO (Exploration via Quasi-Optimism) を新しいタイプの強化学習アルゴリズムとして導入する。経験的分散への依存を回避し、国家行動訪問数の逆数に比例する単純なボーナス項を用いる。性能と計算効率の両面で、既存のアルゴリズムを一貫して上回っている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:22:52 GMT)
Approximating Full Conformal Prediction for Neural Network Regression with Gauss-Newton Influence [9.0]
我々は、保留データなしで、保留後のニューラルネットワーク回帰器の予測間隔を構築する。ガウス・ニュートンの影響を利用して1回、局所摂動モデルパラメータを訓練する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:34:32 GMT)
Generative molecule evolution using 3D pharmacophore for efficient Structure-Based Drug Design [8.7]
我々は、数十億の小さな分子データセットと乏しいタンパク質-リガンド複合体データセットのギャップを埋めるMEVOという進化的フレームワークを提案する。 MEVOは, 潜伏空間における分子表現のための高忠実度VQ-VAE, 薬理泳動誘導分子生成のための拡散モデル, 分子最適化のためのポケットアウェア進化戦略の3つの重要な構成要素から構成される。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:58:11 GMT)
ChildGuard: A Specialized Dataset for Combatting Child-Targeted Hate Speech [8.5]
ChildGuardは、子供を対象としたヘイトスピーチに特化した、最初の大規模な英語データセットである。その中には、X(元Twitter)、Reddit、YouTubeの注釈付き例351,877件が含まれており、子供(11歳未満)、未成年(11歳〜12歳)、ティーン(13歳～17歳)の3つの年齢グループによってラベル付けされている。データセットは、談話レベルの特徴に焦点をあてた文脈的サブセット(157K)と、単語レベルの感情と語彙を強調する語彙的サブセット(194K)の2つのサブセットに分けられる。 ChildGuardにおけるアートヘイトスピーチモデルのベンチマークは、パフォーマンスの顕著な低下を明らかにし、課題を浮き彫りにする
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:40:56 GMT)
Online Learning with Probing for Sequential User-Centric Selection [8.5]
そこで,学習者がまず武器のサブセットを探索して資源や報酬の副次情報を取得し,その後に$K$プレイを$M$アームに割り当てる。既知の分布を持つオフライン設定に対しては、定数係数近似により $zeta = (e-1)/ (2e-1)$ が保証される。未知の分布を持つオンライン・セッティングについては、OLPA(Bandit algorithm)を紹介します。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:32:51 GMT)
From Gallery to Wrist: Realistic 3D Bracelet Insertion in Videos [8.4]
2次元拡散モデルは、フォトリアリスティックな編集を作成することを約束している。従来の3Dレンダリング手法は空間的・時間的整合性が優れているが、フォトリアリスティック照明を実現するには不十分である。これは、ビデオオブジェクト挿入のための3次元レンダリングと2次元拡散を相乗化するための最初のアプローチである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:49:07 GMT)
A Multi-Agent System for Information Extraction from the Chemical Literature [8.3]
化学情報の自動抽出のためのマルチモーダル大規模言語モデル(MLLM)に基づくマルチエージェントシステムを開発した。文献からの複雑な化学反応画像のベンチマークデータセットでは,F1スコアが80.8%に達した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:16:57 GMT)
Multi-Agent Retrieval-Augmented Framework for Evidence-Based Counterspeech Against Health Misinformation [8.2]
健康情報に対する反響を生成するための多エージェント検索フレームワークを提案する。提案手法は静的および動的エビデンスを統合し,生成した反音声が関連性,良好,最新であることを保証する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:11:34 GMT)
Can Foundation Models Predict Fitness for Duty? [8.2]
本研究は,業務適応度予測におけるディープラーニングと基礎モデルの適用性について検討する。それは、仕事の警戒度を決定することに関連する主観的条件として定義される。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:26:12 GMT)
Improving the trainability of VQE on NISQ computers for solving portfolio optimization using convex interpolation [8.2]
ポートフォリオ最適化のための凸性を利用して変動量子固有解器(VQE)の訓練性を向上させる。凸に基づいて、基底状態の位置はヒルベルト空間における基底状態の小さな部分集合の性質を学ぶことによって評価することができる。超伝導量子ビットを用いた40ドルの量子ビット実験を成功裏に実施し,提案手法の有効性を実証した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:41:57 GMT)
NeuroVoxel-LM: Language-Aligned 3D Perception via Dynamic Voxelization and Meta-Embedding [8.1]
我々は,NeuroVoxel-LMを提案する。NeuroVoxel-LMは,Neural Radiance Fields(NeRF)と動的解像度のボキセル化と軽量メタ埋め込みを統合した新しいフレームワークである。具体的には、幾何学的および構造的複雑さに基づいてボクセルを適応的に調整する動的分解能多スケールボクセル化(DR-MSV)技術を導入する。また,注目度に基づく重み付けと残差融合による意味表現を強化する軽量メタ埋め込み(TAP-LME)機構を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:11:08 GMT)
Communication-Efficient Distributed Training for Collaborative Flat Optima Recovery in Deep Learning [7.9]
作業員が協力して広義のミニマを求めることを奨励する軽量レギュレータを導入する。レギュラーライザは、労働者をまとめて引き寄せるコンセンサスステップに反するプッシュフォースを実行する。 DPPFは他の通信効率の高い手法よりも優れ、局所的な手法よりも優れた一般化性能を示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:49:49 GMT)
How to Save My Gas Fees: Understanding and Detecting Real-world Gas Issues in Solidity Programs [7.9]
スマートコントラクトの実行は、その計算とデータストレージに対するガス料金と呼ばれる手数料を発生させる。プログラマがスマートコントラクトを開発すると、不要により多くのガス料金を発生させるようなコードを書くことができます。本論文は,ユーザが2つの重要なステップでガス料金を削減できるようにするためのイニシアチブである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:06:10 GMT)
SoK: Root Cause of \$1 Billion Loss in Smart Contract Real-World Attacks via a Systematic Literature Review of Vulnerabilities [7.5]
我々は、スマートコントラクトの脆弱性と、現実世界のハイインパクトな財務損失の根本原因を理解することに重点を置いています。 2022年から2025年の間に、最も厳しい現実世界の悪用のうち50件について、詳細な実証分析を行いました。実世界で成功した攻撃は、プロトコルロジック設計、(2)ガバナンス、(3)外部依存関係、(4)従来の実装バグの4つのティアのうちの1つに遡る。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:33:56 GMT)
CONCAP: Seeing Beyond English with Concepts Retrieval-Augmented Captioning [7.4]
検索したキャプションと画像固有の概念を統合する多言語画像キャプションモデルであるConCAPを紹介する。 XM3600データセットの実験は、CONCAPが低級および中級の言語で強力なパフォーマンスを実現することを示唆している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:00:02 GMT)
Beyond Self-Repellent Kernels: History-Driven Target Towards Efficient Nonlinear MCMC on General Graphs [7.4]
我々はマルコフ・チェイン・モンテカルロ(MCMC)における履歴駆動型目標(HDT)フレームワークを提案し、離散状態空間におけるランダムウォークアルゴリズムを改善する。また,HDTは,現在の状態と提案状態の局所的な情報のみを必要とすることにより,軽量な実装を保っていることを示す。グラフサンプリング実験は、一貫したパフォーマンス向上を示し、メモリ効率の高いLRUキャッシュは、大規模な汎用グラフへのスケーラビリティを保証する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:40:47 GMT)
Contrast-CAT: Contrasting Activations for Enhanced Interpretability in Transformer-based Text Classifiers [7.4]
本稿では,新しいアクティベーションコントラストに基づく属性法であるContrast-CATを提案する。クラス非関連機能をフィルタリングすることでトークンレベルの属性を洗練します。実験の結果、Contrast-CATは最先端の手法よりも一貫して優れていたことが確認された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:53:01 GMT)
Diversity-Enhanced Reasoning for Subjective Questions [6.9]
主観的推論タスクの精度と多様性を改善するために,複数の役割視点を持つ多様性向上フレームワークであるMultiRole-R1を提案する。特別に設計された報酬関数により、視点の多様性と語彙の多様性を促進することに成功した。 6つのベンチマーク実験により,MultiRole-R1の有効性と主観的推論と客観的推論の両面での一般化性を示した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:07:42 GMT)
Concept Learning for Cooperative Multi-Agent Reinforcement Learning [6.8]
本稿では,概念ボトルネックモデルを用いた解釈可能な値分解フレームワークについて検討する。マルチエージェントQ-ラーニングのための概念学習という新しい価値ベース手法を提案する。 CMQは最先端技術と比較して優れたパフォーマンスを実現しています。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:22:24 GMT)
A Learning-based Domain Decomposition Method [6.5]
複素測地を含む複素PDEのための学習ベース領域分解法(L-DDM)を提案する。以上の結果から,本手法は,これらの課題に対して現状の手法よりも優れるだけでなく,学習中に見つからない微細構造パターンへの解像不変性や強い一般化をもたらすことが示唆された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:22:18 GMT)
Leveraging Analytic Gradients in Provably Safe Reinforcement Learning [6.5]
おそらく安全な強化学習は、安全ガードを用いてそのような保証を提供することを目的とした研究の活発な分野である。解析勾配に基づく強化学習のための最初の効果的な安全ガードを開発する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:02:11 GMT)
SGPO: Self-Generated Preference Optimization based on Self-Improver [6.5]
大規模言語モデル(LLM)は、実用的で信頼性の高いデプロイメントのために人間の好みに合わせている必要がある。 SGPO(Self-Generated Preference Optimization)を提案する。改善者は、ポリシーモデルの直接選好最適化(DPO)のための自己生成選好データに対するポリシーモデルからの応答を洗練する。 AlpacaEval 2.0 と Arena-Hard の実験結果から,提案した SGPO は DPO とベースライン自己改善法を大幅に向上することが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:55:40 GMT)
Local2Global query Alignment for Video Instance Segmentation [6.4]
ビデオセグメンテーション手法は、長いシーケンスの処理と段階的な変化のキャプチャに優れ、現実世界のアプリケーションに最適である。本稿では,オンラインセグメンテーションなどのオンラインフレームワークであるLocal2Globalを紹介する。ローカルクエリとグローバルクエリの早期アライメントを容易にするために,新しいトランスフォーマーデコーダであるL2G-alignerを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:04:01 GMT)
Color histogram equalization and fine-tuning to improve expression recognition of (partially occluded) faces on sign language datasets [6.4]
顔の上面と下面のみを用いて表情を認識することで実験を拡張した。 83.8%の平均感度と,クラス間での差 (.042) がほとんどなく, 表情を正しく認識する能力を示す。顔の上半身の分類精度は人間よりも高い。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:29:15 GMT)
Testing Autonomous Driving Systems -- What Really Matters and What Doesn't [6.2]
本稿では,既存のテスト手法を本質的な妥当性と妥当性の観点から比較する枠組みを提案する。多くの手法がこれらの要件を満たさないことを示している。ほとんどの重要なテスト手法は、オートパイロットの専門的な運用能力を考慮していないことが示されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:09:19 GMT)
Accelerating multiparametric quantitative MRI using self-supervised scan-specific implicit neural representation with model reinforcement [6.2]
本稿では,暗黙的ニューラル表現とモデル強化モジュールを組み合わせたREFINE-MOREを提案する。 REFINE-MOREはベースライン法と比較して最小の正規化ルート平均二乗誤差と最高構造類似度指数を達成する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:06:49 GMT)
Decomposing Densification in Gaussian Splatting for Faster 3D Scene Reconstruction [5.9]
3D Gaussian Splatting (GS)は、高品質なシーン再構築のための強力な表現として登場し、魅力的なレンダリング品質を提供している。本稿では, 細部保存と計算効率のバランスをとる上でのそれらの役割を明らかにするとともに, デンシフィケーションフェーズにおける分割・クローン操作の包括的解析について述べる。本稿では2次元画像のエネルギー密度に基づいて徐々に解像度を向上するエネルギー誘導型粗度多分解能トレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:47:20 GMT)
Trust the Model: Compact VLMs as In-Context Judges for Image-Text Data Quality [5.8]
視覚言語モデル(VLM)は、視覚データを統合することで従来の大規模言語モデルを拡張し、よりリッチなマルチモーダル推論を可能にする。高品質な画像キャプチャアノテートデータセットを微調整した,コンパクトなVLMを用いた合理化データフィルタリングフレームワークを提案する。このモデルは、キャプションと画像品質とアライメントに基づいて、潜在的トレーニングサンプルを効果的に評価し、フィルタリングする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:20:25 GMT)
Sem-DPO: Mitigating Semantic Inconsistency in Preference Optimization for Prompt Engineering [5.6]
Sem-DPOは意味的一貫性を維持しながら、その単純さと効率を維持するDPOの亜種である。本研究は,Sem-DPOが原文の有界近傍で学習のプロンプトを継続していることを示す。 3つの標準テキスト・ツー・イメージ・プロンプト・最適化ベンチマークでは、Sem-DPOはCLIPの類似度が8-12%高く、5-9%高く評価された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:20:13 GMT)
Learning from Expert Factors: Trajectory-level Reward Shaping for Formulaic Alpha Mining [5.6]
強化学習は、解釈可能で利益の出る投資戦略を作成するために、公式なアルファ因子を採掘する複雑なプロセスの自動化に成功した。既存の方法は、基礎となるマルコフ決定プロセスが与えられたスパース報酬によって妨げられる。そこで,新たな報酬形成手法であるトラジェクトリレベル・リワード(TLRS)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:14:48 GMT)
MASQUE: A Text-Guided Diffusion-Based Framework for Localized and Customized Adversarial Makeup [5.5]
我々は,ユーザ定義のテキストプロンプトで導かれる局所的な対角化粧を生成する新しい拡散ベースのフレームワークであるMASQUEを開発する。以上の結果から,MASQUEはすべてのベースラインに対するドッジ成功率を大幅に向上し,知覚的忠実度が向上し,テキストメイクプロンプトへの適応性が向上することが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:36:55 GMT)
Memorization: A Close Look at Books [5.4]
Llama 370Bのモデルを使って、最初の500個のトークンから1冊の本を自動で再構築しました。本書の抽出率は本の人気と相関し,学習データに重複する可能性が示唆された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:54:29 GMT)
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference [5.4]
Group Quantization and Sparse Acceleration (GQSA)は、LLMに適した新しい圧縮技術である。圧縮モデルの性能優位性を保証するための2段階スパース最適化手法を提案する。実験の結果、GQSA W4S50%圧縮設定の下では、モデルの精度は2:4プルーニングとW2量子化の両方を上回ることがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:52:56 GMT)
Density Ratio Estimation-based Bayesian Optimization with Semi-Supervised Learning [5.3]
この課題を解決するために,半教師付き学習を用いた密度比推定に基づくベイズ最適化を提案する。本手法の実証的な結果といくつかの基本手法を,未ラベルの点サンプリングと固定サイズのプールを持つ2つの異なるシナリオで示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:20:30 GMT)
NeuroCLIP: A Multimodal Contrastive Learning Method for rTMS-treated Methamphetamine Addiction Analysis [5.2]
メタンフェタミン依存症は、世界的な健康問題を引き起こす。脳波(EEG)や機能的近赤外分光法(fNIRS)のような客観的な神経画像モダリティは代替手段を提供する。本研究では,脳波とfNIRSデータを同時に統合した新しいディープラーニングフレームワークであるNeuroCLIPを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:16:39 GMT)
TIMEST: Temporal Information Motif Estimator Using Sampling Trees [5.1]
本稿では,時間的ネットワークにおける任意の大きさの時間的モチーフをカウントする汎用的,高速,高精度な推定アルゴリズムTIMESTを提案する。 TIMESTは,従来のアルゴリズムよりも高速かつ高精度であることを示す。例えば、TIMESTは4分間の時間的モチーフのインスタンス数を0.6%エラーでカウントでき、正確なメソッドは2日以上かかる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 23:31:55 GMT)
Multi-Agent Interactive Question Generation Framework for Long Document Understanding [5.1]
本稿では,コンテキストの長い質問を効率よく生成する,完全に自動化されたマルチエージェント対話型フレームワークを提案する。提案手法は,英語とアラビア語の広範な文書に対して,高品質な単ページ,複数ページの質問を効率よく生成する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:44:53 GMT)
Efficient Gaussian State Preparation in Quantum Circuits [4.9]
本稿では,1キュービット回転から始まって指数振幅プロファイルを形成する回路ベースアプローチを提案し,解析する。この手法がガウス状態と高い忠実性を達成することを実証する。提案手法は、ガウス状態がノイズの多い量子ハードウェア上でアクセスできるようにするための有望な方法であると結論付けている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:15:20 GMT)
Quantitative analysis of the effectiveness of mid-anneal measurement in quantum annealing [4.9]
本研究では,制約付き最適化問題に対する緩和手法として,中周期測定について検討する。その結果, 所望の溶液と基底状態のエネルギー差が小さい場合, 正中経時測定が最も有効であることがわかった。完全連結Isingモデルの解析により,中赤経測定の有効性はシステムサイズの増加とともに持続することが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:17:42 GMT)
Towards End-to-End Neuromorphic Event-based 3D Object Reconstruction Without Physical Priors [4.5]
ニューロモルフィックカメラを用いた高密度ボクセル3次元再構成のためのエンドツーエンド手法を提案する。本手法は, ベースライン法に比べて54.6%の再現精度向上を実現している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:20:13 GMT)
Modeling Professionalism in Expert Questioning through Linguistic Differentiation [4.5]
本稿では,専門家の質問において,言語的特徴がプロフェッショナル主義のモデル化と評価にどのように活用できるかを検討する。金融アナリストの質問において、構造的および実用的要素を定量化する新しいアノテーションフレームワークを導入する。この結果から,プロフェッショナリズムは言語的に基礎づけたモデリングによって獲得可能な,学習可能なドメイン・ジェネラル・コンストラクトであることが示唆された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:30:45 GMT)
Deformable Convolution Module with Globally Learned Relative Offsets for Fundus Vessel Segmentation [4.4]
変形可能な畳み込みは、複雑な形状の特徴を扱うオフセットを学習することで、畳み込みカーネルの形状を適応的に変更することができる。本稿では,注目とフィードフォワードネットワークを用いてオフセットを学習する新しいプラグ・プレイ・デフォルマブル・コンボリューション・モジュールを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:44:43 GMT)
SETOL: A Semi-Empirical Theory of (Deep) Learning [4.4]
本稿では,SETOL(SemiEmpirical Theory of Learning)を用いて,SETOL(State-Of-The-Art)ニューラルネット(NN)の性能について述べる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:57:45 GMT)
RadMamba: Efficient Human Activity Recognition through Radar-based Micro-Doppler-Oriented Mamba State-Space Model [4.2]
本稿では,レーダベースHARに特化して,パラメータ効率の高いマイクロドップラー指向のMamba SSMであるRadMambaを紹介する。 3つの多様なデータセットの中で、RadMambaは前モデルの99.8%の分類精度でトップパフォーマンスのモデルと一致している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:17:30 GMT)
A Comparative Study of OpenMP Scheduling Algorithm Selection Strategies [4.1]
我々は,OpenMPにおけるスケジューリングアルゴリズムの選択のための学習に基づくアプローチを提案し,評価する。その結果,RL法は高い性能のスケジューリング決定を学習できることがわかった。このアプローチはMPIベースのプログラムにも拡張可能で、並列性の複数のレベルにまたがるスケジューリング決定の最適化を可能にする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:10:30 GMT)
SAViL-Det: Semantic-Aware Vision-Language Model for Multi-Script Text Detection [4.0]
本稿では,多文テキスト検出機能を備えた意味認識型視覚言語モデルSAViL-Detを紹介する。提案フレームワークは,テキストプロンプトから視覚的特徴への微粒な意味情報を,モーダルな注意を通して適応的に伝達する。挑戦的なベンチマークの実験では、提案手法の有効性が示されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:16:39 GMT)
Multi-Stage Verification-Centric Framework for Mitigating Hallucination in Multi-Modal RAG [3.9]
本稿では, KDD Cup 2025 Meta Comprehensive RAG Benchmark for Multi-modal, Multi-turn (CRAG-MM) のチーム CRUISE による技術ソリューションを提案する。この課題は、視覚言語モデル(VLM)の重要な限界、すなわち幻覚への適合性に対処することを目的としている。本ソリューションでは,効率向上のための軽量なクエリルータ,クエリ対応検索と要約パイプライン,デュアルパス生成,ポストホック検証を統合した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:45:45 GMT)
Multi-Attention Stacked Ensemble for Lung Cancer Detection in CT Scans [3.8]
3つの事前訓練されたバックボーンは96 x 96ピクセルの入力に合わせたカスタム分類ヘッドで適合する。 2段階の注意機構は、ロジットからモデルワイドとクラスワイドの両方の重要点を学習する。 LIDC-IDRIデータセットの実験では、98.09の精度と0.9961 AUCを達成した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:03:07 GMT)
What Language(s) Does Aya-23 Think In? How Multilinguality Affects Internal Language Representations [3.7]
大規模言語モデル(LLM)は多言語タスクに優れるが、内部言語処理はあまり理解されていない。我々は、バランスの取れた多言語データに基づいて訓練されたデコーダのみのLLMであるAya-23-8Bが、コードミックス、クローゼ、翻訳タスクをどのように処理するかを分析する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:53:45 GMT)
Hybrid-Domain Synergistic Transformer for Hyperspectral Image Denoising [3.7]
本稿では,周波数領域拡張とマルチスケールモデリングに基づくHSIデノナイズフレームワークであるHybrid-Domain Synergistic Transformer Network (HDST)を提案する。実データと合成データの両方の実験により、HDSTはデノイング性能を著しく改善することが示された。本研究は,HSIやその他の高次元視覚データにおける複雑なノイズカップリング問題に対処するための新たな洞察と普遍的な枠組みを提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:45:29 GMT)
Foundation Models Knowledge Distillation For Battery Capacity Degradation Forecast [3.7]
本研究は,時系列基礎モデルの劣化を考慮した微調整戦略を提案する。リリースしたCycleLife-SJTUIEデータセットの検証は、微調整されたバッテリタイマーが強力なゼロショットの一般化能力を持っていることを示している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:04:30 GMT)
MoL-RL: Distilling Multi-Step Environmental Feedback into LLMs for Feedback-Independent Reasoning [3.5]
MoL-RLは、多段階EF信号を大規模言語モデルに統合する新しい訓練パラダイムである。我々は,MoL-RLがQwen3-8Bモデルを用いて最先端性能を実現することを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:52:15 GMT)
Detection of Medial Epicondyle Avulsion in Elbow Ultrasound Images via Bone Structure Reconstruction [3.5]
野球選手によく見られる中性てんかん発作は、骨剥離と変形を伴う。本研究は, 肘部超音波画像における内側上顎骨外転の検出のための再建的枠組みを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:16:28 GMT)
Clustering by Attention: Leveraging Prior Fitted Transformers for Data Partitioning [3.5]
メタラーニングに基づく新しいクラスタリング手法を提案する。我々は,クラスタリングを行うために事前学習したPFN(Predior-Data Fitted Transformer Network)を用いている。我々の手法は最先端のクラスタリング技術よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:53:19 GMT)
Quantum Imaging of Ferromagnetic van der Waals Magnetic Domain Structures at Ambient Conditions [3.4]
2Dファンデルワールス磁性材料は、基本的な視点と潜在的な用途の両方から大きな注目を集めている。ここでは、窒素空洞中心に基づく量子磁気顕微鏡を用いて、重要な問題に対処する。磁化のばらつきや相互相関などの空間的に解決された測定値を用い, 遷移温度は15nm以下では明らかな依存性がなく, 顕著な拡散が認められた。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:15:25 GMT)
Distributed Learning over Arbitrary Topology: Linear Speed-Up with Polynomial Transient Time [3.2]
本研究では, ピアツーピア通信によるローカルコスト関数の和を協調的に共有する分散学習問題について検討する。本稿では、一般的な通信グラフから抽出した2本の木を用いて、モデルパラメータと位相パラメータの両方を分散する新しいEmph Tree PushPull-(STPP)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:22:45 GMT)
From Infants to AI: Incorporating Infant-like Learning in Models Boosts Efficiency and Generalization in Learning Social Prediction Tasks [3.1]
新たな概念の学習における初期概念の利用は,学習の効率化と学習の効率化につながることを示す。その結果, 概念が人間的な方法で学習された場合, 出現する表現の方が有用であることが示唆された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:52:25 GMT)
Computational Advantages of Multi-Grade Deep Learning: Convergence Analysis and Performance Insights [3.0]
MGDL(Multi-grade Deep Learning)は、標準のSGDL(Single-grade Deep Learning)よりも優れていることが示されている。本研究の目的は,画像の回帰,デノイング,デブロアリングにおけるMGDLの性能に着目し,MGDLの計算上の優位性を検討することである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:43:29 GMT)
Learning to Align Human Code Preferences [3.0]
大規模言語モデル(LLM)は、ソフトウェア開発タスクの自動化において顕著な可能性を示している。最近の進歩は、スーパーバイザード・ファインチューニング(SFT)と直接選好最適化(DPO)を利用して、モデルを人間の好みに合わせることである。本稿では,SFTとDPOがLLMと異なるコード嗜好の整合において果たす役割を体系的に検討する。本稿では,適応型最適化(APO, Adaptive Preference Optimization)を提案する。この手法は,好ましくない応答を適応的に増幅し,好ましくない応答を抑制し,トレーニング中に潜在的に優れた解の探索を促す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:48:26 GMT)
Artificial Intelligence In Patent And Market Intelligence: A New Paradigm For Technology Scouting [3.0]
本稿では,産業R&Dにおける技術スカウトとソリューション発見を変革するAIを利用したソフトウェアプラットフォームの開発について述べる。提案プラットフォームは,意味理解,文脈推論,ドメイン間知識抽出など,最先端のLLM機能を利用する。このシステムは、請求書や技術的記述などの非構造化の特許文書を処理し、与えられた問題コンテキストに沿った潜在的なイノベーションを体系的に抽出する。このプラットフォームは、特許分析に加えて、検証済みの市場ソリューションと、同様の課題に対処するアクティブな組織を特定することで、商用インテリジェンスを統合している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:22:39 GMT)
Packet-Level DDoS Data Augmentation Using Dual-Stream Temporal-Field Diffusion [2.8]
DDoS(Distributed Denial of Service)攻撃に対して、最近の研究は機械学習(ML)ベースのソリューションにますます依存している。現在の合成トレース生成法は、現生のDDoS攻撃で現れる複雑な時間パターンと空間分布を捉えるのに苦労している。拡散モデルに基づく多視点マルチストリームネットワークトラフィック生成モデルであるDual-Stream Temporal-Field Diffusion (DSTF-Diffusion)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:40:56 GMT)
MagicAnime: A Hierarchically Annotated, Multimodal and Multitasking Dataset with Benchmarks for Cartoon Animation Generation [2.7]
マルチモーダルコントロールは、非人間的なキャラクターの複雑さ、スタイリスティックに多様な動き、きめ細かい感情のために困難である。複数のビデオ生成タスクをサポートするために設計された大規模で階層的な注釈付きマルチモーダルデータセットであるMagicAnimeデータセットを提案する。上記のタスクにおける様々なメソッドの比較をサポートするために,MagicAnime-Benchと呼ばれるマルチモーダルアニメーションのアニメーションベンチマークを構築した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:53:00 GMT)
Strategic Motivators for Ethical AI System Development: An Empirical and Holistic Model [2.5]
本研究の目的は,AIシステムの倫理的発展を促進するモチベータを特定し,優先することである。 20のキーモチベーターを同定し,8つのカテゴリに分類した。 Fuzzy TOPSISは、チームの多様性の促進、AIガバナンス団体の設立、監視上のリーダーの任命、データプライバシの確保など、モチベーションをランク付けした。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:49:05 GMT)
Dual-Stream Global-Local Feature Collaborative Representation Network for Scene Classification of Mining Area [2.5]
本研究では、マルチソースデータを融合して、マルチモーダルな土地被覆シーン分類データセットを構築する。本稿では,グローバルな特徴をキーセマンティックベクトルに分解するために協調表現を利用した二分岐融合モデルを提案する。このモデルの全体的な精度は83.63%であり、他の比較モデルよりも優れている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:45:58 GMT)
Detecting Visual Information Manipulation Attacks in Augmented Reality: A Multimodal Semantic Reasoning Approach [2.4]
拡張現実(AR)における視覚情報操作(VIM)攻撃に焦点を当てる本稿では,これらの攻撃を,文字,フレーズ,パターン操作という3つの形式に分類し,情報置換,情報難読化,余分な誤った情報という3つの目的に分類する。このような攻撃を検出するために,マルチモーダルなセマンティック推論フレームワークVIM-Senseを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:04:50 GMT)
CIgrate: Automating CI Service Migration with Large Language Models [2.3]
本稿では,Large Language Models (LLMs) を用いてCIマイグレーションを改善することができるかを検討する。 LLMはコード生成と変換タスクにおいて強力な機能を示している。自動CI構成移行のためのLLMベースのフレームワークであるCIgrateを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:51:37 GMT)
From Prompt to Pipeline: Large Language Models for Scientific Workflow Development in Bioinformatics [2.2]
本研究では,現代大規模言語モデル(LLM)が正確な,完全かつ有用なバイオインフォマティクスタスクの生成を支援することができるかどうかを考察する。各種SNP解析、RNA-seq、DNAメチル化、データ検索プラットフォームを用いてこれらのモデルを評価する。その結果,Gemini 2.5 Flash は Galaxy の生成に優れており,DeepSeek-V3 は Nextflow で強く機能していることがわかった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:08:11 GMT)
A Theory of $θ$-Expectations [2.2]
我々は、ドライバーがポイントワイズ幾何学である微分方程式のクラスのためのフレームワークを開発する。システムのトラクタビリティは、世界的なユニークかつグローバルな存在を前提としている。ドライバー関数に対するリプシッツ最大値写像。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:56:01 GMT)
Multi-Agent Reinforcement Learning for Dynamic Mobility Resource Allocation with Hierarchical Adaptive Grouping [2.2]
動的モビリティ資源割り当てのための階層適応型グループ共有(HAG-PS)と呼ばれる新しいマルチエージェント強化学習を提案する。 HAG-PSは、移動資源配分のためのマルチエージェント強化学習に関する2つの重要な研究課題に対処することを目的としている。実世界のニューヨークにおける自転車シェアリングデータに基づく広範な実験を行い,他のベースライン手法と比較してHAG-PSの優れた性能を実証した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:40:04 GMT)
Lessons from A Large Language Model-based Outdoor Trail Recommendation Chatbot with Retrieval Augmented Generation [2.2]
野外レクリエーション活動の人気が高まっており、屋外の道についてパーソナライズされた提案を提供するための会話型AIシステムの必要性が高まっている。本稿では,屋外トレイルレコメンデーションチャットボットJudyの開発から学んだ予備的,実践的な教訓について述べる。我々は、RAGに基づくレコメンデーションに関するWebベースのデータ収集、屋外トレイルデータ管理、LLMモデルパフォーマンス研究を行った。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:22:23 GMT)
Beyond Binary Moderation: Identifying Fine-Grained Sexist and Misogynistic Behavior on GitHub with Large Language Models [2.1]
この研究では、GitHub上のセクシストと偽造的なコメントの12の異なるカテゴリを識別する、きめ細かいマルチクラス分類フレームワークを紹介した。モデル性能は精度、リコール、F1スコア、マシューズ相関係数(MCC)を用いて厳密に比較した。明確な定義と構造化された出力を持つよく設計されたプロンプトは、性差別の検出の精度と解釈可能性を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:11:27 GMT)
ADA-DPM: A Neural Descriptors-based Adaptive Noise Filtering Strategy for SLAM [2.1]
本稿では ADA-DPM という SLAM のためのニューラルディスクリプタに基づく適応ノイズフィルタリング手法を提案する。動的物体干渉に対処するために,動的特徴点の予測とフィルタリングを行う動的ヘッドを設計する。第2に,ノイズと非構造的特徴点の影響を軽減するため,グローバル・コンパタンス・スコアリング・ヘッドを提案する。最後に、複数の公開データセットに対する実験的検証により、ADA-DPMの有効性が確認された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:29:18 GMT)
Bridging AI Innovation and Healthcare Needs: Lessons Learned from Incorporating Modern NLP at The BC Cancer Registry [2.0]
自然言語処理(NLP)ソリューションのデプロイは、現実的な課題を提示します。明確なビジネス目標に基づいて問題を定義することの重要性を強調します。実用的なモデル選択の必要性、データ品質への厳格な注意、堅牢なエラー軽減戦略を強調します。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:06:43 GMT)
A Multi-Stage Hybrid CNN-Transformer Network for Automated Pediatric Lung Sound Classification [2.0]
頭蓋骨画像を用いた小児呼吸器疾患の分類のためのハイブリッドCNN-Transformerフレームワークを提案する。本モデルでは,2進イベント分類では0.9039,多進イベント分類では0.8448であった。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:36:46 GMT)
The Blessing and Curse of Dimensionality in Safety Alignment [1.9]
高次元表現の呪いが大きな言語モデル(LLM)に一意に影響を及ぼすことを示す。モデル表現を低次元部分空間に投影することで、それらの線形構造を回避しつつアライメントのための十分な情報を保持することができることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:51:23 GMT)
Preparing graph states forbidding a vertex-minor [1.9]
測定に基づく量子コンピューティングは、準備された安定化状態に非クリフォード測定を加えることでプリフォームされる。すべての安定化状態はグラフ状態と局所クリフォード同値であるため、グラフ状態$leftvert G rightrangle$にフォーカスすることができる。グラフの特定の固有クラスに$G$が含まれているとき、かなり改善された境界を得る。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:32:24 GMT)
SAMwave: Wavelet-Driven Feature Enrichment for Effective Adaptation of Segment Anything Model [1.8]
我々は、ウェーブレット変換を利用して、入力データからよりリッチでマルチスケールな高周波特徴を抽出する新しい、解釈可能なアプローチであるtextbftextitSAMwaveを提案する。 4つの挑戦的低レベル視覚課題に対する経験的評価は、SAMwaveが既存の適応法を大幅に上回っていることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:05:23 GMT)
Cheap Learning: Maximising Performance of Language Models for Social Data Science Using Minimal Data [1.8]
近年発展してきた3つの安価な技術について概観する。後者では、大規模言語モデルのゼロショットプロンプトの特定の事例について概観する。我々は,すべての技術に対して優れた性能を示し,特に大規模言語モデルのプロンプトが,非常に低コストで高い精度を達成できることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:41:42 GMT)
VESPA: Towards un(Human)supervised Open-World Pointcloud Labeling for Autonomous Driving [1.6]
本稿では,LiDARの幾何学的精度をカメラ画像のセマンティック・リッチネスと融合させるマルチモーダル・オートラベリング・パイプラインであるVESPAを紹介する。 VESPAは、新しいカテゴリの発見をサポートし、地味なアノテーションやHDマップを必要とせず、高品質な3D擬似ラベルを生成する。 Nuscenesデータセットでは、VESPAはオブジェクト発見に52.95%、マルチクラスオブジェクト検出に46.54%のAPを達成している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:39:29 GMT)
Syno: Structured Synthesis for Neural Operators [1.6]
我々は,実用的なニューラル演算子合成を実現するために,エンドツーエンドのフレームワークであるSynoを開発した。 Synoは、さまざまなハードウェアとコンパイラの選択に対して、平均スピードアップが1.37時間$から2.06時間$のより良い演算子を見つけることを実証している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:28:54 GMT)
The existence of non-classical orthogonal quantum Latin squares [1.6]
我々は、等角量子ラテン四角形のような特別な性質を持つ新しい量子ラテン四角形を提唱した。非古典的 2-イデミティブ MOQLS$(v)$, 非古典的 2, 3-MOQLS$(v)$ および非古典的 SOQLS$(v)$ の存在を確立する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:18:00 GMT)
Meta Fusion: A Unified Framework For Multimodality Fusion with Mutual Learning [1.5]
既存の戦略を特別なケースとして統一する,フレキシブルで原則化されたフレームワークであるMeta Fusionを紹介します。深い相互学習とアンサンブル学習によって動機づけられたメタフュージョンは、モダリティにまたがる潜在表現の様々な組み合わせに基づくモデルのコホートを構築する。我々のアプローチは潜在表現の学習においてモデルに依存しないため、各モダリティの固有の特性に柔軟に適応することができる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:50:29 GMT)
An Automated Deep Segmentation and Spatial-Statistics Approach for Post-Blast Rock Fragmentation Assessment [1.2]
リアルタイムのインスタンスセグメンテーションを実現するために、細調整されたYOLO12l-segモデルを活用するエンドツーエンドパイプラインを導入する。キーフラグメンテーションパターンを示す代表的な例を4つ提示する。その結果, フレームワークの精度, 小型物体群集に対する堅牢性, および現場環境における高速自動爆風影響評価の可能性が確認された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 04:25:29 GMT)
High-Performance Parallel Optimization of the Fish School Behaviour on the Setonix Platform Using OpenMP [1.2]
本稿では,Setonix Supercomputing Platform上でのFish School Behaviour (FSB)アルゴリズムの並列最適化について詳細に検討する。 FSBアルゴリズムは自然の社会的行動パターンにインスパイアされ、反復的で計算集約的な性質のために並列化のための理想的なプラットフォームを提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:25:08 GMT)
Relating System Safety and Machine Learnt Model Performance [1.0]
本稿では,航空機の緊急制動システムにおいて,物体検出と警報を行う機械学習部品(MLC)について述べる。最初の方法は、最小限の安全関連パフォーマンス要件、関連するメトリクス、およびMDCとその基盤となるディープニューラルネットワークのターゲットを導出する。提案手法が有効であると考えられる理由について,提案手法の前提,適用可能性の制約,検証の意味を明らかにする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:39:54 GMT)
BioNeuralNet: A Graph Neural Network based Multi-Omics Network Data Analysis Tool [1.0]
BioNeuralNetは、エンドツーエンドのネットワークベースのマルチオミクスデータ分析用に設計されたPythonフレームワークである。複数のネットワーク構築技術、低次元表現の生成、幅広い下流分析タスクを含む、マルチオミクスネットワーク分析のすべての主要な段階をサポートする。 BioNeuralNetは、オープンソースの、ユーザフレンドリで、広範囲にドキュメント化されたフレームワークで、精密医療における柔軟で再現可能なマルチオミクスネットワーク分析をサポートするように設計されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 23:21:04 GMT)
Practical Multi-Task Learning for Rare Conversions in Ad Tech [0.8]
モデルは、すべての信号の共有表現を学習し、各タイプの個別のタスクタワーを通して専門化する。このアプローチはテストされ、本番環境に完全にデプロイされ、オフライン(0.69%のAUCリフト)とオンラインパフォーマンス指標(2%のアクション毎のコスト削減)の両方で一貫した改善が示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:28:27 GMT)
Survey of NLU Benchmarks Diagnosing Linguistic Phenomena: Why not Standardize Diagnostics Benchmarks? [0.7]
自然言語理解(NLU)は自然言語処理(NLP)の基本課題である NLU能力の評価は、ここ数年で研究者を惹きつける傾向にある研究トピックとなっている。いくつかのベンチマークには、調査ときめ細かいエラー解析のために設計された診断データセットが含まれている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:30:50 GMT)
From Observations to Causations: A GNN-based Probabilistic Prediction Framework for Causal Discovery [0.7]
因果グラフの全空間にわたる確率分布を学習する新しいグラフニューラルネットワーク(GNN)に基づく確率的フレームワークを提案する。我々のフレームワークは、ノード属性とエッジ属性の両方を統一グラフ表現に符号化するGNNを活用し、モデルがデータから直接複雑な因果構造を学習できるようにする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:36:45 GMT)
Floquet-engineered Emergent Massive Nambu-Goldstone Modes [0.7]
我々は多体駆動システムに巨大なナムブ・ゴールドストーン準粒子を実装した。我々は, 特定の観測対象の力学から, ナムブ・ゴールドストーン・モードの存在を証明した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:30:29 GMT)
WBHT: A Generative Attention Architecture for Detecting Black Hole Anomalies in Backbone Networks [0.5]
ブラックホール(BH)異常は、障害通知なしでパケットロスを引き起こし、接続を中断し、金銭的損失をもたらす。 WBHTは、生成モデリング、シーケンシャルラーニング、アテンションメカニズムを組み合わせて、BH異常検出を改善する。実世界のネットワークデータに基づいてテストした結果、WBHTは既存のモデルを上回っ、F1スコアを大幅に改善した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:22:28 GMT)
EMBRACE: Shaping Inclusive Opinion Representation by Aligning Implicit Conversations with Social Norms [0.5]
本研究の目的は、アライメント評価フレームワークを導入することで、NLPや計算モデルで意見がどのように表現されるかを評価することである。我々のアプローチは、反応のスタンスを基礎となる意見の代理としてモデル化し、多様な社会的視点を考慮し、反映した表現を可能にする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:21:07 GMT)
AutoLungDx: A Hybrid Deep Learning Approach for Early Lung Cancer Diagnosis Using 3D Res-U-Net, YOLOv5, and Vision Transformers [0.4]
本研究の目的は,肺結節の早期発見と分類のためのエンド・ツー・エンド深層学習フレームワークを提案することである。提案するフレームワークは,3次元U-Netを改良した3次元Res-U-Netを用いた肺分画,YOLO-v5を用いた結節検出,Vision Transformerベースのアーキテクチャを用いた分類の3段階からなる。提案したフレームワークは,低リソース環境下での肺癌検診の精度と効率を向上し,患者の予後を向上する可能性がある。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:46:12 GMT)
Software Fairness Testing in Practice [0.2]
本研究では、ソフトウェアプロフェッショナルがAIとMLプロジェクトに取り組む22人の実践者とのインタビューを通じて、公正のためにAIを活用したシステムをテストする方法について検討する。以上の結果から,理論的公正の概念と産業実践との間に大きなギャップがあることが示唆された。主な課題は、データ品質と多様性、時間制約、効果的なメトリクスの定義、モデルの相互運用性の確保である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:03:52 GMT)
Jeff = 1/2 Diamond Magnet CaCo2TeO6: A Pathway toward New Spin Physics and Quantum Functions [0.2]
CaCo2TeO6は、2つのOh-Co2+部位のダイヤモンド格子を特徴とする新しい材料である。この材料は強い量子ゆらぎ、競合する磁気交換相互作用の増大、磁場誘起磁気構造のチューニング性を示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:33:55 GMT)
Indian Sign Language Detection for Real-Time Translation using Machine Learning [0.2]
畳み込みニューラルネットワーク(CNN)を用いた頑健でリアルタイムなISL検出・翻訳システムを提案する。我々のモデルは総合的なISLデータセットに基づいて訓練され、99.95%の分類精度を達成し、例外的な性能を示す。リアルタイム実装のために、このフレームワークはMediaPipeを統合して手の動きを正確に追跡し、動的ジェスチャーをシームレスに翻訳する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:15:46 GMT)
Machine Learning Model Integration with Open World Temporal Logic for Process Automation [0.1]
本稿では,各種機械学習モデルの出力をPyReasonフレームワークに直接統合する新しい手法を提案する。一般化されたアノテート論理におけるPyReasonの基盤は、様々なMLモデルの実数値出力をシームレスに組み込むことを可能にする。この統合は、製造業、医療、ビジネスオペレーションなど、多くの領域にまたがる実用性を見出す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:55:29 GMT)
Non-stabilizerness in kinetically-constrained Rydberg atom arrays [0.1]
我々は、Rydberg原子配列が、単一量子ビットを超えて広がる非安定化器性の自然貯水池を提供することを示した。本稿では、波動関数の量子回路分解により、Rydberg非安定化器の起源を説明する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:02:17 GMT)
Multi-Community Spectral Clustering for Geometric Graphs [0.1]
このモデルにより生成されたグラフ上で,コミュニティ回復のためのスペクトルクラスタリングアルゴリズムを提案する。弱い整合性を証明し、単純な局所的な精細化ステップが強い整合性を保証することを示す。鍵となる要素は、非標準バージョンのデイビス=カハンの定理を、固有値が単純でないときに固有空間を制御するための応用である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:09:00 GMT)
MazeEval: A Benchmark for Testing Sequential Decision-Making in Language Models [0.1]
本稿では,大規模言語モデルにおける純粋空間推論の分離と評価を目的としたベンチマークであるMazeEvalを紹介する。我々は,英語とアイスランド語で同一の迷路にまたがる8つの最先端LLMを評価し,空間能力の言語間移動を評価する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:33:45 GMT)
DisQ: A Model of Distributed Quantum Processors [0.0]
分散量子プロセッサの最初の形式モデルとしてDisQを提案する。 DisQは分散量子プログラミング言語である。本研究では,古典的なシミュレーション基盤に基づくシミュレーション関係を構築し,量子アルゴリズムの等価性とその分散バージョンを確認する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:04:13 GMT)
Variational Quantum Algorithm for Solving the Liouvillian Gap [0.0]
開量子系において、リウヴィリアギャップは定常状態への緩和時間を特徴づける。本稿では,Louvillianギャップを効率的に推定するための変分量子アルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:45:42 GMT)
Towards Generalized Parameter Tuning in Coherent Ising Machines: A Portfolio-Based Approach [0.0]
Coherent Ising Machines (CIM) は、最近最適化問題を解決するための有望な計算モデルとして注目されている。モーメント付きカオス振幅制御(CACm)アルゴリズムを用いたCIMにおけるハイパーパラメータチューニングのためのアルゴリズムポートフォリオ手法を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 14:18:54 GMT)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [0.0]
本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。最小回路の識別にはエッジパッチやスパースオートエンコーダなどの解釈可能性技術を適用する。私たちの研究は、構造化され、段階的に複雑な設定における解釈可能性メソッドの探索と比較のための堅牢なフレームワークを提供します。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:28:05 GMT)
Time-bin qubit architecture using quantum Hall edge channels [0.0]
本稿では,量子ホールエッジチャネルに基づく時間ビン符号化量子ビットのモジュラーアーキテクチャの基本要素について述べる。量子状態は時間分離エッジプラズマ(EMP)パケットに符号化される。 EMPプラットフォームは、完全な量子ビット演算、読み出し、エンビット接触、および干渉計接触の静電制御をサポートする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:19:49 GMT)
The Policy Cliff: A Theoretical Analysis of Reward-Policy Maps in Large Language Models [0.0]
強化学習(RL)は,大規模言語と推論モデル(LLMs/LRMs)の行動形成において重要な役割を担っているしかし、しばしば不安定で不安定なポリシーを生み出し、急激な推論、偽りのアライメント、命令の不服従といった重大な失敗に繋がる。本稿では,報酬関数から最適ポリシーへの写像の安定性を解析するための厳密な数学的枠組みを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 06:56:10 GMT)
Testing Is Not Boring: Characterizing Challenge in Software Testing Tasks [0.0]
本研究は,ソフトウェアテストにおける課題タスクの性質と,それらがプロフェッショナルに与える影響について考察する。我々の研究結果は、創造性、継続的な学習、時間的プレッシャーを含むタスクが、モチベーションと報奨と見なされることが多いことを示している。挑戦や圧倒的な要求の欠如は、フラストレーションや不満を引き起こす可能性がある。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:29:17 GMT)
Technical Indicator Networks (TINs): An Interpretable Neural Architecture Modernizing Classic al Technical Analysis for Adaptive Algorithmic Trading [0.0]
TIN(Technical Indicator Networks)は、従来のインジケータを複製してアップグレードする一般的なニューラルネットワークとして導入されている。 TINは、技術分析とアルゴリズム取引の基礎ロジックを新しい時代へと近代化し、現代のAIシステムの可能性を秘めた実証済み指標の遺産をブリッジする。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:47:30 GMT)
Surrogate modeling of Cellular-Potts Agent-Based Models as a segmentation task using the U-Net neural network architecture [0.0]
我々は,周期的境界条件を考慮したU-Netアーキテクチャを用いた畳み込みニューラルネットワーク(CNN)サロゲートモデルを開発した。我々はこのモデルを用いて,生体内血管新生の研究に用いる機械的セルラーポッツモデルの評価を高速化する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:27:47 GMT)
Stochastic optimal transport in Banach Spaces for regularized estimation of multivariate quantiles [0.0]
絶対連続確率測度$mu$と$nu$の間のエントロピー最適輸送(EOT)を解く新しいアルゴリズムを提案する。無限次元バナッハ空間でその値を取るアルゴリズムのほぼ確実に収束について研究する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:31:09 GMT)
Spatial-Temporal Reinforcement Learning for Network Routing with Non-Markovian Traffic [0.0]
Reinforcement Learning (RL) は、通信ネットワークにおけるパケットルーティングを最適化するための確立されたアプローチとなっている。グラフニューラルネットワーク(GNN)とリカレントニューラルネットワーク(RNN)を統合した時空間RL手法を提案する。提案手法は従来のRL手法と比較して,ネットワークトポロジの変化に対して性能が優れ,頑健であることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:00:43 GMT)
Sparsity dependence of Krylov state complexity in the SYK model [0.0]
我々は,Sachdev-Ye-Kitaevモデル(SYK)のKrylov状態の複雑さを$N le 28$ Majorana fermions with $q$-body fermion interactionに対して検討した。大きな温度では、k$を超えると、複雑さのピーク値は変化しない。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:35:40 GMT)
Solving Scene Understanding for Autonomous Navigation in Unstructured Environments [0.0]
本稿では,インド運転データセットのセマンティックセグメンテーションを行う。データセットは、Cityscapesのような他のデータセットよりも難しい。 5つの異なるモデルがトレーニングされ、そのパフォーマンスは、Unionに対する平均インターセクションを使用して比較されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:11:21 GMT)
Single-photon sources created by nature millions of years ago [0.0]
単一光子源(SPS)は、量子通信デバイスに必要な重要なコンポーネントである。我々は、数百万年前に自然が生成した明るいダイヤモンドベースのSPSの発見を報告した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:22:13 GMT)
Set-based Implicit Likelihood Inference of Galaxy Cluster Mass [0.0]
本稿では,銀河団質量の後方分布を投影された銀河力学から推定する,集合型機械学習フレームワークを提案する。我々のモデルは、深部集合と条件付き正規化フローを組み合わせて、銀河の位置情報と速度情報の両方を組み込む。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:44:41 GMT)
Reinforcement learning fine-tuning of language model for instruction following and math reasoning [0.0]
コンパクト言語モデル(Qwen2.5-0.5Bベース)における強化学習手法の有効性について検討する。本研究では, 教師付き微調整(SFT), 嗜好ラベル付きデータを用いた直接選好最適化(DPO), 報酬モデルによるReinforce Leave-One-Out(RLOO)を比較した。実験により、DPOが強固で一貫した結果をもたらすのに対し、DeBERTaの報酬モデリングを用いたROOは最適なアライメントを実現することが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:45:00 GMT)
Reduction-induced Variation of Partial Von Neumann Entropy [0.0]
混合状態QEとその対策は、理論と実用の両方において重要な役割を担っている。本稿では, 部分フォン・ノイマンエントロピーの還元誘起変分法を提案し, 任意の二部体状態におけるQEを定量化する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:17:54 GMT)
Recursive KalmanNet: Analyse des capacités de généralisation d'un réseau de neurones récurrent guidé par un filtre de Kalman [0.0]
Recursive KalmanNetは、Kalmanフィルタによってガイドされるリカレントニューラルネットワークである。本稿では,アウト・オブ・ディストリビューションのシナリオにおけるその機能について考察する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 11:28:13 GMT)
Quantum Systems as Indivisible Stochastic Processes [0.0]
一般化量子対応(英語版)によれば、量子系は、確率法則と可分な法則の通常の概念に基づいて、昔ながらの設定空間に展開する過程として理解することができる。本稿では,一般化量子対応の概念的基礎と構造について,より深く研究する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:08:28 GMT)
Quantum Computational Unpredictability Entropy and Quantum Leakage Resilience [0.0]
計算エントロピーは、計算制約の下で不確実性とランダム性を定量化する枠組みを提供する。古典的予測不可能エントロピーを量子設定に自然に一般化した量子計算不予測可能性エントロピーを定義する。我々の結果は、量子計算環境におけるミニエントロピーに依存する暗号ツールの開発の基礎を築いた。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:13:11 GMT)
Product-Congruence Games: A Unified Impartial-Game Framework for RSA ($φ$-MuM) and AES (poly-MuM) [0.0]
RSA指数の減少とAES S-boxの反転は隠れた共通性を共有している。 Product-Congruence Gameのトラックは、ヒープ値のモジュラーまたは有限フィールド積を介してプレイする。このフレームワークを2つのコンパニオンゲームでインスタンス化する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:29:13 GMT)
Poliazed Houston State Framework for Nonequilibrium Driven Open Quanum Sysmtes [0.0]
我々は、駆動されたオープン量子系における非平衡力学をモデル化するための新しい理論フレームワーク、偏極ヒューストン基底を導入する。この結果は、光駆動のオープン量子材料における非平衡現象をシミュレートするための強力なツールとして、偏極化ヒューストン基底を強調した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:27:27 GMT)
Operator-Based Machine Intelligence: A Hilbert Space Framework for Spectral Learning and Symbolic Reasoning [0.0]
本稿では,無限次元ヒルベルト空間における学習タスクをサンプリングおよび計算として表現する別の定式化について検討する。我々はヒルベルト空間における学習の厳密な数学的定式化を提案し、散乱変換とクープマン作用素に基づく最近のモデルを強調した。このレポートは、ヒルベルト信号処理に基づくスケーラブルで解釈可能な機械学習の方向性を概説することで締めくくっている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 18:52:10 GMT)
Modeling Charge Noise in Superconducting Qubits Using Memory Multi-Fractional Brownian Motion [0.0]
メモリ多屈折ブラウン運動(mmfBm)に基づく超伝導電荷量子ビットにおける電荷雑音の新しいモデルを提案する。このフレームワークは、デコヒーレンスの重要な実験的な特徴を再現し、スーパーコンダクタリング量子デバイスとの環境相互作用に関する新たな洞察を提供する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:33:28 GMT)
MoCTEFuse: Illumination-Gated Mixture of Chiral Transformer Experts for Multi-Level Infrared and Visible Image Fusion [0.0]
我々は,MoCTEFuseと呼ばれる動的マルチレベル画像融合ネットワークを提案する。 MoCTEFuseはテクスチャの詳細とオブジェクトのコントラストをバランスよく適応的に保存する。 DroneVehicle、MSRS、TNO、RoadSceneのデータセットで実施された実験は、MoCTEFuseの優れた融合性能を示している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 08:54:16 GMT)
Measuring Information Distortion in Hierarchical Ultra long Novel Reconstruction:The Optimal Expansion Ratio [0.0]
我々は,異なる圧縮膨張比の下で意味歪みを定量化する情報理論解析を行う。超長編小説の実験では、最適圧縮膨張比が他の非最適圧縮膨張比と比較して意味歪みを著しく減少させることが示された。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 05:12:20 GMT)
Local Prompt Adaptation for Style-Consistent Multi-Object Generation in Diffusion Models [0.0]
そこで我々は、LPA(Local Prompt Adaptation)と呼ばれる、シンプルでトレーニング不要なアーキテクチャ手法を提案する。提案手法は,プロンプトをコンテンツとスタイルトークンに分解し,異なる段階でU-Netの注意層に選択的に注入する。提案手法は、5つのカテゴリにまたがる50のスタイルリッチなプロンプトのカスタムベンチマークで評価し、Composer、MultiDiffusion、Attend-and-Excite、LoRA、SDXLといった強力なベースラインと比較する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:32:13 GMT)
Lagrangian neural networks for nonholonomic mechanics [0.0]
ラグランジアンニューラルネットワーク(LNN)は物理システムに対処するための強力なツールである。 LNNはシステムのラグランジアンをパラメータ化して、ほぼ保存されたエネルギーで軌道を予測することができる。非ホロノミック制約を持つ機械システムにLNN技術を適用する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:39:28 GMT)
L-MCAT: Unpaired Multimodal Transformer with Contrastive Attention for Label-Efficient Satellite Image Classification [0.0]
本稿では,ラベル効率のよいリモートセンシング画像分類のためのトランスフォーマーベースのフレームワークを提案する。 L-MCATは,(1)高次元センサ入力を統一的な埋め込み空間に圧縮するモダリティ・スペクトル適応器(MSA),(2)画素レベルの対応やラベルを伴わずに不均一なモダリティを整列させるアンペアド・マルチモーダルアライメントアライメント(U-MAA)の2つのコアイノベーションを導入している。 L-MCATはSEN12MSデータセットの全体的な精度を95.4%向上し、クラスごとに20ラベルしか使用せず、47倍のパラメータと23倍のFLを使用して、最先端のベースラインを上回っている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:06:32 GMT)
Investigation of the Challenges of Underwater-Visual-Monocular-SLAM [0.0]
本研究では,水中ロボットにおける単眼視覚同時位置決め法とマッピング法(vSLAM)の課題について検討する。まず, 水中環境において, 水中環境における性能の低下を示すとともに, 水中環境における性能の低下を示す。本研究の最終目標は,これらの条件下でのSLAM法の精度とロバスト性を向上させる技術を明らかにすることである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:54:32 GMT)
Hypergraph Neural Networks Reveal Spatial Domains from Single-cell Transcriptomics Data [0.0]
空間的クラスタリングは、組織サンプルを細胞の様々なサブ集団に分類するために重要である。 ILISIスコアは,他の手法と比較して1.843と高い結果が得られた。我々のモデルは下流クラスタリングにおいて他の手法よりも優れており、最高ARI値は0.51、スコアは0.60である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:09:23 GMT)
High-Precision Quantum Dynamics of He$_2$ over the b~$^3Π_\mathrm{g}$-c~$^3Σ_\mathrm{g}^+$ Electronic Subspace by including Non-adiabatic, Relativistic and QED Corrections and Couplings [0.0]
相対論的量子力学は、ヘリウム二量体のb$3Pi_mathrmg$とc$3Sigma_mathrmg+$電子状態に対して計算される。量子核運動は、b$3Pi_mathrmg$-c$Sigma_mathrmg+$で計算される。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 09:05:57 GMT)
Graded Transformers: A Symbolic-Geometric Approach to Structured Learning [0.0]
ベクトル空間上の階調変換を通じて帰納バイアスを埋め込む新しいシーケンスモデルを導入する。 Graded Transformerは階層的学習とニューロシンボリック推論のための変換ポテンシャルを持つ。この研究は、幾何学的および代数的原理と注意機構を融合させることにより、構造化されたディープラーニングを促進する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:34:08 GMT)
Geometric Algebras and Fermion Quantum Field Theory [0.0]
幾何代数 $gscript (H)$ と $dimsqbracgscript (H)=2n$ を定義する。代数 $gscript (H)$ は、部分空間として$H$ を含むヒルベルト空間である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:25:01 GMT)
Generative Pre-training for Subjective Tasks: A Diffusion Transformer-Based Framework for Facial Beauty Prediction [0.0]
顔の美容予測(FBP)は、その主観的性質と、人間の知覚に影響を与える微妙で全体的な特徴のために難しいコンピュータビジョン課題である。本稿では、生成モデルのパワーを活用して、優れたドメイン特化特徴抽出器を作成する新しい2段階フレームワークを提案する。我々の手法はDiff-FBPと呼ばれ、FBP5500ベンチマークで新しい最先端技術を設定し、パーソン相関係数(PCC)0.932を達成し、汎用事前学習に基づく先行技術よりも大幅に優れていた。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:33:51 GMT)
From First Use to Final Commit: Studying the Evolution of Multi-CI Service Adoption [0.0]
私たちは2008年1月から2024年12月までにGitHubでホストされた18,924のJavaプロジェクトの歴史的CI採用を分析した。分析の結果、同じプロジェクト内で複数のCIサービスを使用することは、5つに1つ近いプロジェクトで繰り返し見られるパターンであることが分かりました。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:32:22 GMT)
Fermionic CFTs from topological boundaries in abelian Chern-Simons theories [0.0]
場の量子論は、その物理量が時空のスピン構造に依存しない場合、ボソニック(非スピン)、それに依存する場合、フェルミオン(スピン)と呼ばれる。我々は、ボソニックアーベル・チャーン・サイモンズ理論から生じるフェルミオン共形場理論(CFT)を探求し、位相境界条件を課すことで対称性位相場理論の役割を担っている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:40:54 GMT)
Feed-anywhere ANN (I) Steady Discrete $\to$ Diffusing on Graph Hidden States [0.0]
幾何学的解析と非線形力学を用いたデータから隠れグラフ構造を学習するための新しいフレームワークを提案する。我々のモデルは,データ多様体のトポロジに依存した,標準的なニューラルネットワークよりも強いバウンダリを実現する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 00:35:15 GMT)
EyeAI: AI-Assisted Ocular Disease Detection for Equitable Healthcare Access [0.0]
眼疾患は世界中の何十億もの個人に影響を与える。本稿では,人工知能を用いた眼疾患検出システムであるEyeAIを紹介する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:29:41 GMT)
Exploring Adaptive Structure Learning for Heterophilic Graphs [0.0]
グラフ畳み込みネットワーク (GCN) はグラフ表現学習の牽引となり, 異種グラフの性能向上に注目が集まっている。本稿では,下流の識別タスクの性能劣化を回避するため,浅いGCNのエッジを再構成する構造学習を提案する。提案手法は異種グラフをまたいで一般化することができず,グラフ構造に付随するノード分類タスクに不整合に作用する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:43:31 GMT)
Experimental study of the distributions of off-diagonal scattering-matrix elements of quantum graphs with symplectic symmetry [0.0]
本研究では, 共振対称性とカオス波動特性を有するオープンマイクロ波ネットワークの散乱行列の非対角成分の分布について検討した。分布で観測されたランダム行列理論の予測からの偏差は, 部分グラフが完全連結でないという事実に起因していると考えられる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:21:30 GMT)
Entanglement Halos [0.0]
量子多体系の基底状態において,強い絡み合う遠方点の集合である絡み合いハロスの概念を導入する。本研究は, 物理量の多い複雑な絡み合い構造を, 幾何や接続性によってどのように生み出すかを明らかにするものである。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:14:48 GMT)
Encoding molecular structures in quantum machine learning [0.0]
量子分子構造符号化(QMSE)は、ハイブリッドクーロン-アジャクエンシ行列として表される分子結合秩序と原子間カップリングをコードする。この戦略は, エンコードされた分子間の状態分離性を改善する上で, 効率的かつ解釈可能な方法であることを示す。我々は、このスケーラブルで解釈可能な符号化フレームワークが、分子データセットの実用的なQML応用の道を大きく拓くことを期待している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:48:46 GMT)
Emergent Semantics Beyond Token Embeddings: Transformer LMs with Frozen Visual Unicode Representations [0.0]
埋め込み層が完全に凍結されたTransformerモデルを構築します。我々の手法は、Unicode中心の新しいトークン化器を含む任意のトークン化器と互換性がある。トレーニング可能なセマンティックな埋め込みがないにもかかわらず、私たちのモデルは収束し、一貫性のあるテキストを生成します。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:53:29 GMT)
Embeddings to Diagnosis: Latent Fragility under Agentic Perturbations in Clinical LLMs [0.0]
本稿では, 臨床用LDMの潜在ロバスト性について, 構造的対向編集による検討を行うLAPD (Latent Agentic Perturbation Diagnostics) を提案する。本フレームワークでは,PCA-Reduced Latent Spaceにクロス決定境界を埋め込む際に,表現不安定性を捉えるモデルに依存しない診断信号であるLatent Diagnosis Flip Rate (LDFR)を導入する。その結果, 表面の堅牢性とセマンティック安定性の間には, 安全クリティカルな臨床AIにおける幾何学的監査の重要性を浮き彫りにした。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:48:53 GMT)
Dual-unitary shadow tomography [0.0]
二重単体ブロックウォール回路に基づく「二重単体シャドウトモグラフィー」を提案する。一次元量子ビット系における作用素拡散とパウリ重み力学について検討する。 (ほぼ) フルサポートを持つ作用素を予測するタスクでは、DUST がブロックウォール Clifford の影を等深度で上回ることを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 22:45:15 GMT)
Detection of twisted radiowaves with Rydberg atoms [0.0]
構造された電磁波の存在下でのアルカリ原子の外部電子について述べる。 Rydberg-atom-based detector of twisted radiowaves の2つの手法を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:04:45 GMT)
DYNARTmo: A Dynamic Articulatory Model for Visualization of Speech Movement Patterns [0.0]
DYNARTMOは,2次元中矢状平面における音声の調音過程を可視化する動的調音モデルである。このモデルは、UK-DYNAMOフレームワークに基づいて構築され、調音的不特定性、分節的およびジェスチャー的制御、協調の原理を統合している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 16:19:46 GMT)
Coupled Instantons In A Four-Well Potential With Application To The Tunneling Of A Composite Particle [0.0]
4つの等しいミニマを持つシステムを詳細に検討する。時間翻訳対称性から生じるゼロモード問題は、ファデエフ・ポポフ法によって処理される。ここでは1次元の複合粒子のトンネル化に応用する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:51:14 GMT)
Contrastive-KAN: A Semi-Supervised Intrusion Detection Framework for Cybersecurity with scarce Labeled Data [0.0]
Kolmogorov-Arnold Network (KAN) を用いた半教師付きコントラスト学習フレームワークに基づくリアルタイム侵入検知システムを提案する。本手法は, ラベルのないデータを利用して, 正常な動作と攻撃動作を効果的に識別する。 UNSW-NB15, BoT-IoT, Gas Pipelineの3つのベンチマークデータセットに対して,それぞれ2.20%,1.28%,8%のラベル付きサンプルを使用してアプローチを検証する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 12:55:37 GMT)
Continuous Classification Aggregation [0.0]
我々は、$mge 3$オブジェクトの連続体から2le ple m$型への最適で独立でゼロなファジィ分類アグリゲーション関数が重み付き算術平均でなければならないことを証明した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 13:54:48 GMT)
Co-NAML-LSTUR: A Combined Model with Attentive Multi-View Learning and Long- and Short-term User Representations for News Recommendation [0.0]
ニュースレコメンデーションシステムは、パーソナライズされたニュースコンテンツを配信することで、情報の過負荷を軽減する上で重要な役割を果たす。中心的な課題は、マルチビューニュース表現とユーザ興味の動的な性質の両方を効果的にモデル化することである。本稿では,マルチビューニュースモデリングにNAMLを統合したハイブリッドニュースレコメンデーションフレームワークCo-NAML-LSTURと,ユーザの好みを捉えるLSTURを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:18:22 GMT)
Circuit simulation of readout process toward large-scale superconducting quantum circuits [0.0]
本稿では,古典回路シミュレーションに基づく量子ビットの忠実度推定手法を提案する。このアプローチにより、標準的なラップトップコンピュータ上で10000量子ビットの超伝導量子回路の性能を評価することができる。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 01:46:50 GMT)
Biorthogonal quench dynamics of entanglement and quantum geometry in PT-symmetric non-Hermitian systems [0.0]
観測可能な量、量子幾何テンソル、および様々な絡み合い量のクエンチダイナミクスを解析する。以上の結果から,PT崩壊相への急激な急激なクエンチは,これらの量の指数的な増加につながることが示唆された。一般的な相互作用系とは対照的に、非相互作用性フェルミオン系に対するTTCエントロピーにおける驚くべき線形崩壊を観測する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:20:14 GMT)
Beyond Neural Networks: Symbolic Reasoning over Wavelet Logic Graph Signals [0.0]
グラフラプラシアンウェーブレット変換(GLWT)に基づく完全非ニューラルラーニングフレームワークを提案する。我々のモデルは、構造化されたマルチスケールフィルタリング、非線形収縮、ウェーブレット係数上のシンボリック論理を用いて、グラフスペクトル領域で純粋に動作する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:01:13 GMT)
Benchmarking Large Language Models for Geolocating Colonial Virginia Land Grants [0.0]
バージニアの17世紀から18世紀の土地特許は、主に物語のメッツ・アンド・バウンドの記述として残っている。本研究では、これらの散文を地理的に正確な緯度・経度座標に変換する際に、現在世代の大言語モデル(LLM)を体系的に評価する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 21:49:58 GMT)
BOOP: Write Right Code [0.0]
BOOP(Blueprint, Operations, OCaml, Proof)は,4つの必須フェーズを必要とする構造化フレームワークである。コードを動作させることから、なぜコードが正しいのかを理解することに焦点を移します。教師は伝統的なアプローチに比べて強い言葉のスキルを観察した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 17:35:16 GMT)
Atom-Field-Medium Interactions III: Quantum Field-mediated Entanglement between Two Atoms near a Conducting Surface [0.0]
このシリーズの第3の論文は、デコヒーレンスや絡み合いといった量子情報に関連する基本的な問題に焦点を当てている。我々は,2つの原子間の絡み合いと,その間と導電面との間の距離の違いを考察する。我々は、原子と磁場のカップリングから原子間のカップリングまで、どのように異なる要因が生じるかを示す。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:39:29 GMT)
Adaptive Real-Time Multi-Loss Function Optimization Using Dynamic Memory Fusion Framework: A Case Study on Breast Cancer Segmentation [0.0]
適応型マルチロス関数をリアルタイムにペナル化するための動的メモリ融合という新しいフレームワークを提案する。乳房超音波データセットを用いた実験により,様々な測定値のセグメンテーション性能が向上した。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 10:03:47 GMT)
Absence of nontrivial local conserved quantities in the Hubbard model on the two or higher dimensional hypercubic lattice [0.0]
我々は、$dge2$を持つ$d$次元超立方体格子上の標準的なHubbardモデルが、非自明な局所保存量を認めていないことを証明した。これは、保存量がないという白石の証明をフェルミオンモデルに拡張した最初の例である。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 02:26:58 GMT)
ASNN: Learning to Suggest Neural Architectures from Performance Distributions [0.0]
ニューラルネットワーク(NN)のアーキテクチャは、その性能を決定する上で重要な役割を果たす。ネットワーク構造と精度をマッピングする一般閉形式関数は存在しない。 NNアーキテクチャとテスト精度の関係を学習するためのモデルであるアーキテクチャ提案ネットワーク(ASNN)を提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 07:39:33 GMT)
AI-Driven Generation of Old English: A Framework for Low-Resource Languages [0.0]
古代の言語を保存することは、人類の文化的・言語的遺産を理解するのに不可欠である。古英語は、そのアクセシビリティを現代の自然言語処理(NLP)技術に制限している。本稿では,高度大言語モデル(LLM)を用いて,高品質な古英語テキストを生成するスケーラブルなフレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 03:29:19 GMT)
AI Should Be More Human, Not More Complex [0.0]
利用者は精巧な説明よりも簡潔でソース対応の回答を圧倒的に好んでいる。のAI開発トレンドは、システムが知識に富むように聞こえるが、真に批判的な思考が欠如している不気味な谷効果を生み出している。我々の発見は、より複雑なAI応答がより良いパフォーマンスを示すという一般的な仮定に挑戦し、代わりに、ユーザーエンゲージメントとシステムの信頼性にとって人間のような簡潔さと透明性が鍵であることを示唆している。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 15:55:52 GMT)
A small and interesting architecture for early fault-tolerant quantum computers [0.0]
最小の興味深いカラーコードに基づく早期フォールトトレラント量子コンピュータのアーキテクチャを提案する。 Xと基地での単一量子測定と準備、単一量子アダマール(H)ゲート、および3量子制御制御Z(CCZ)ゲートで構成されている。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 19:07:12 GMT)
A Lightweight Face Quality Assessment Framework to Improve Face Verification Performance in Real-Time Screening Applications [0.0]
顔画像の品質は、顔認証システムの精度と信頼性を決定する上で重要な役割を果たす。低画質の顔画像は、しばしば動きのぼやけ、照明条件の悪さ、極端なポーズの変化などの要因によって引き起こされ、顔認識モデルの性能を著しく低下させる。検証パイプラインに渡す前に,低品質の顔画像の事前フィルタリングを目的とした顔品質自動評価フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 27 Jul 2025 20:09:52 GMT)