LOTUS: A Leaderboard for Detailed Image Captioning from Quality to Societal Bias and User Preferences [91.1] LOTUSは詳細なキャプションを評価するためのリーダーボードである。
キャプションの品質など、様々な側面を包括的に評価する。
多様なユーザの嗜好に基準を合わせることで、嗜好指向の評価を可能にする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:12:42 GMT)
MagicDrive3D: Controllable 3D Generation for Any-View Rendering in Street Scenes [72.0] MagicDrive3Dは、コントロール可能な3Dストリートシーン生成のための新しいフレームワークである。
ロードマップ、3Dオブジェクト、テキスト記述を含むマルチコンディション制御をサポートする。
多様な高品質な3Dドライビングシーンを生成し、任意のビューレンダリングをサポートし、BEVセグメンテーションのような下流タスクを強化する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:48:16 GMT)
Level-Set Parameters: Novel Representation for 3D Shape Analysis [70.2] ニューラルフィールドの最近の発展は、3次元形状の新規で連続的で数値的な表現として符号付き距離関数のレベルセットパラメータをもたらす。
擬似正規分布として定式化し,各データセットに先行する分布を学習することにより,異なる形状の相関関係を確立する。
形状変換を用いたレベルセットパラメータのさらなる探索を目的として,これらのパラメータのサブセットを回転や変換で条件付けし,ハイパーネットワークで生成することを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:53:01 GMT)
MagicDrive-V2: High-Resolution Long Video Generation for Autonomous Driving with Adaptive Control [68.7] MagicDrive-V2は、MVDiTブロックと時空間条件エンコーディングを統合し、マルチビュービデオ生成と正確な幾何学的制御を可能にする新しいアプローチである。
これは、解像度が3.3倍、フレーム数が4.4倍のマルチビュー駆動ビデオ合成を可能にする(現在のSOTAと比較)。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:30:46 GMT)
Re:Form -- Reducing Human Priors in Scalable Formal Software Verification with RL in LLMs: A Preliminary Study on Dafny [68.0] 強化学習(RL)で訓練された大規模言語モデル(LLM)は、信頼性も拡張性もない、という大きな課題に直面している。
有望だが、ほとんど報われていない代替手段は、フォーマルな言語ベースの推論である。
生成モデルが形式言語空間(例えばダフニー)で機能する厳密な形式体系におけるLLMの接地は、それらの推論プロセスと結果の自動的かつ数学的に証明可能な検証を可能にする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:30:10 GMT)
Accelerating Multimodal Large Language Models via Dynamic Visual-Token Exit and the Empirical Findings [66.0] 既存のMultimoal Large Language Models (MLLM) における視覚トークンの過剰使用は、しばしば明らかな冗長性を示し、非常に高価な計算をもたらす。
DyVTE(Dynamic visual-token exit)と呼ばれるMLLMの効率を改善するための簡易かつ効果的な手法を提案する。
DyVTEは軽量なハイパーネットワークを使用して、テキストトークンの状態を認識し、特定のレイヤの後にすべてのビジュアルトークンを削除する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:41:09 GMT)
OVFact: Measuring and Improving Open-Vocabulary Factuality for Long Caption Models [65.8] 長字幕の字幕事実性を測定する新しい方法であるOV-Factを紹介する。
提案手法は,人間の判断との一致を改善し,同じ指標におけるキャプタネス(リコール)と事実精度の両方をキャプチャする。
従来のメトリクスとは異なり、参照不要なメソッド設計は、ファクトリティベースのデータフィルタリングに向けた新しいアプリケーションを可能にする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:38:06 GMT)
Towards Generalized Range-View LiDAR Segmentation in Adverse Weather [65.2] 我々は、厳しい天候下でのLiDARセグメンテーションの一般化に影響を及ぼす固有の課題を特定し、分析する。
既存のモデルのコアアーキテクチャを変更することなく、ロバスト性を高めるモジュール式で軽量なフレームワークを提案する。
提案手法は,推定オーバーヘッドを最小限に抑え,悪天候への一般化を著しく改善する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:19:55 GMT)
Long-Form Answers to Visual Questions from Blind and Low Vision People [54.0] VizWiz-LFは視覚障害者(BLV)による視覚的質問に対する長文回答のデータセットである。
LFVQAの文の機能的役割を開発し,長文回答が質問応答以上の情報を含んでいることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:55:30 GMT)
Seed-X: Building Strong Multilingual Translation LLM with 7B Parameters [53.6] 7Bパラメータサイズを持つオープンソースの言語モデル(LLM)のファミリーであるSeed-Xを紹介する。
ベースモデルは、28言語にわたるモノリンガルコンテンツとバイリンガルコンテンツの両方を含む、多種多様な高品質データセットで事前訓練されている。
その後、インストラクションモデルは、Chain-of-Thought(CoT)推論によって翻訳され、強化学習(RL)によりさらに強化され、多様な言語対をまたいだより良い一般化が達成される。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:46:56 GMT)
Towards Improving Long-Tail Entity Predictions in Temporal Knowledge Graphs through Global Similarity and Weighted Sampling [53.1] 時間知識グラフ(TKG)補完モデルは、伝統的にトレーニング中にグラフ全体へのアクセスを前提としている。
本稿では,TKGに特化して設計されたインクリメンタルトレーニングフレームワークを提案する。
提案手法は,モデルに依存しない拡張層と加重サンプリング戦略を組み合わせることで,既存のTKG補完手法を拡張および改善することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:02:48 GMT)
SimMLM: A Simple Framework for Multi-modal Learning with Missing Modality [52.9] モーダルを欠くマルチモーダル学習のためのシンプルで強力なフレームワークであるSimMLMを提案する。
SimMLMは、動的で学習可能なゲーティング機構を備えたDMoME(Dynamic Mixture of Modality Experts)アーキテクチャで構成されている。
SimMLMの主な革新はMoFe(MoFe)ランキングの損失の増加であり、より多くのモダリティが利用可能になるにつれてタスクの精度が向上または安定し続けることを保証する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:39:34 GMT)
A Survey of Multimodal Hallucination Evaluation and Detection [52.0] MLLM(Multi-modal Large Language Models)は、視覚情報とテキスト情報を統合するための強力なパラダイムとして登場した。
これらのモデルはしばしば幻覚に悩まされ、もっともらしいように見えるコンテンツを生成するが、入力内容や確立された世界的知識と矛盾する。
本調査では,イメージ・トゥ・テキスト(I2T)およびテキスト・トゥ・イメージ(T2I)生成タスクを対象とした幻覚評価ベンチマークと検出方法の詳細なレビューを行う。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:22:42 GMT)
On Arbitrary Predictions from Equally Valid Models [49.6] モデル多重性(英: Model multiplicity)とは、同じ患者に対して矛盾する予測を認める複数の機械学習モデルを指す。
たとえ小さなアンサンブルであっても、実際は予測的多重性を緩和・緩和できることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:15:59 GMT)
Persistent subradiant correlations in a random driven Dicke model [49.2] 理論的には、共振周波数における障害の存在下で、単光モードに結合した2レベルエミッタのアレイの駆動散逸ダイナミクスを理論的に検討する。
我々は、リウヴィリアンの固有状態と低崩壊速度に対応する力学における部分ラジアント相関の概念を導入し、時間内でも振動することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:53:56 GMT)
Optimal observables for (non-)equilibrium quantum metrology from the master equation [49.2] オープン量子系の主方程式から, 環境特性に対する最適感度の観測変数を明示的に構築する方法を示す。
これにより、対称対数微分(SLD)は、非平衡系と非平衡系の両方において、大きな利害関係を持つ系に利用可能となる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:32:21 GMT)
PDT: Point Distribution Transformation with Diffusion Models [48.5] 拡散モデルを用いた点分布変換のための新しいフレームワークである PDT を提案する。
PDTは入力点の雲を様々な形態の出力に変換することに成功した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:20:04 GMT)
High Performance Space Debris Tracking in Complex Skylight Backgrounds with a Large-Scale Dataset [48.3] 高精度なデブリ追跡を実現するために,深層学習に基づく空間デブリ追跡ネットワーク(SDT-Net)を提案する。
SDT-Netはデブリの特徴を効果的に表現し、エンドツーエンドのモデル学習の効率性と安定性を高める。
データセットとコードはまもなくリリースされます。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 01:56:35 GMT)
GT-Loc: Unifying When and Where in Images Through a Joint Embedding Space [48.1] GT-Locは、画像のキャプチャ時間(時間と月)と位置情報(GPS座標)を共同で予測する新しい検索ベースの手法である。
提案手法では,画像,時間,位置のエンコーダを分離し,その埋め込みを高次元特徴空間内に配置する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:08:55 GMT)
SLoW: Select Low-frequency Words! Automatic Dictionary Selection for Translation on Large Language Models [47.6] 本稿ではtextbfAutomatic textbfDictionary textbfSelection (textbfADS) と呼ばれる新しいタスクを提案する。
タスクの目標は、翻訳を強化するために使用する辞書を自動的に選択することである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:51:14 GMT)
Alignment and Safety in Large Language Models: Safety Mechanisms, Training Paradigms, and Emerging Challenges [47.1] 本調査では,大規模言語モデル(LLM)アライメントにおけるアライメント手法,トレーニングプロトコル,経験的発見について概観する。
我々は多種多様なパラダイムをまたいだアライメント手法の開発を分析し、コアアライメント目標間の基本的なトレードオフを特徴づける。
我々は、直接選好最適化(DPO)、構成AI、脳インスパイアされた方法、アライメント不確実性定量化(AUQ)など、最先端技術について議論する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:52:58 GMT)
Learning neuro-symbolic convergent term rewriting systems [47.1] 本稿では,書き換えアルゴリズム自体にインスパイアされたニューロシンボリックアーキテクチャを用いて,収束項書き換えシステムを学ぶための一般的なフレームワークを提案する。
本稿では,ニューラルリライトシステム (NRS) と高速ニューラルリライトシステム (FastNRS) の2つのモジュール実装について述べる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:24:56 GMT)
Closing the Modality Gap for Mixed Modality Search [47.0] 混合モダリティ探索タスクにおいて,CLIPなどの視覚言語モデルがどのように機能するかを検討する。
これらのモデルは埋め込み空間において顕著なモダリティギャップを示す。
本稿では,CLIPの埋め込み空間におけるモダリティギャップを取り除く軽量なポストホックキャリブレーション法GR-CLIPを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:15:28 GMT)
Object-centric Video Question Answering with Visual Grounding and Referring [44.0] 我々は、ビデオ推論タスクにおいて、入力参照と出力のグラウンド化の両方を実行することができるビデオLLMモデルを提案する。
また、ビデオ内の残りのフレームに対して、任意の時間スタンプで任意の視覚的プロンプト入力を伝搬する新しいアプローチであるSTOMを提案する。
我々は、ビデオ質問応答やオブジェクトセグメンテーションを参照しながら、VideoInferや他の既存のベンチマークに関する包括的な実験を行う。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:11:23 GMT)
GOAT-SLM: A Spoken Language Model with Paralinguistic and Speaker Characteristic Awareness [43.7] 本稿では,パラ言語的・話者的特徴認識を備えた新しい言語モデルGOAT-SLMを紹介する。
GOAT-SLMは、言語モデリングを音響的実現から切り離すデュアルモダリティヘッドアーキテクチャを採用している。
GOAT-SLMはセマンティックタスクと非セマンティックタスクの両方でバランスよく動作し、既存のオープンソースモデルよりも感情や方言の変化、年齢に敏感なインタラクションを処理できることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:25:27 GMT)
Secret Collusion among AI Agents: Multi-Agent Deception via Steganography [43.5] 近年の大規模言語モデル(LLM)では,コミュニケーション生成AIエージェントのグループによる共同作業の解決が試みられている。
これは、未承認の情報共有に関するプライバシーとセキュリティ上の問題を引き起こす。
現代のステガノグラフィー技術は、そのようなダイナミクスを検出しにくくする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:28:15 GMT)
EmbodiedOcc++: Boosting Embodied 3D Occupancy Prediction with Plane Regularization and Uncertainty Sampler [43.3] 本稿では,EmbodiedOcc++を紹介する。
Geometry-Guided Refinement Module (GRM) は、SUS(Semantic-Aware Uncertainty Sampler)とともに平面正規化によるガウス的更新を制約する
EmbodiedOcc-ScanNetベンチマークの実験は、EmbodiedOccがさまざまな設定で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:34:24 GMT)
Preserving Topological and Geometric Embeddings for Point Cloud Recovery [43.3] 我々は,サンプリングおよび復元フェーズを通じて重要な機能を維持する,textbfTopGeoFormer というエンドツーエンドアーキテクチャを提案する。
実験では,従来型および学習型サンプリング/アップサンプリングアルゴリズムを用いて,その状況を包括的に分析する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:58:41 GMT)
Negative Sampling in Recommendation: A Survey and Future Directions [43.1] Recommender System (RS) は、大量のユーザの行動からパーソナライズされた好みを捉えることを目的としている。
ネガティブサンプリングは、ユーザの行動に固有の真のネガティブな側面を明らかにすることに熟練している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:26:13 GMT)
RealisVSR: Detail-enhanced Diffusion for Real-World 4K Video Super-Resolution [43.0] RealisVSRは3つの中心となるイノベーションを持つ高頻度詳細拡張ビデオ拡散モデルである。
本手法では,既存の手法に比べてトレーニングデータ量の5~25%しか必要としない。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:18:33 GMT)
ProGMLP: A Progressive Framework for GNN-to-MLP Knowledge Distillation with Efficient Trade-offs [42.4] 我々は,GNN-to-MLP知識の推論コストと精度のトレードオフを柔軟かつオンデマンドで実現するために,プログレッシブフレームワークを導入する。
我々のアプローチは、8つの実世界のグラフデータセットに関する包括的な実験を通じて検証される。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:35:09 GMT)
Cross-Subject Mind Decoding from Inaccurate Representations [42.2] 正確なデコード表現予測のためのBi Autoencoder Intertwiningフレームワークを提案する。
本手法は,定性評価と定量的評価の両方において,ベンチマークデータセットの最先端手法よりも優れている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:45:02 GMT)
LLMs are Also Effective Embedding Models: An In-depth Overview [41.3] 大規模言語モデル(LLM)は、様々なタスクで最先端のパフォーマンスを達成することによって、自然言語処理に革命をもたらした。
近年、埋め込みモデルとしての有効性が注目され、ELMoやBERTのような従来のエンコーダのみのモデルから、GPT、LLaMA、Mistralのようなデコーダのみの大規模LLMへとパラダイムシフトした。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:22:04 GMT)
Technical Report of TeleChat2, TeleChat2.5 and T1 [40.9] 最新のTeleChatモデルについて紹介する: textbfTeleChat2, textbfTeleChat2.5, textbfT1。
モデルアーキテクチャの最小限の変更にもかかわらず、新しいシリーズは、強化されたトレーニング戦略によって、大幅なパフォーマンス向上を達成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:42:10 GMT)
Semantics versus Identity: A Divide-and-Conquer Approach towards Adjustable Medical Image De-Identification [40.8] 医用画像はコンピュータ支援診断を大幅に進歩させたが、その再識別(ReID)リスクは重要なプライバシー上の懸念を引き起こす。
本研究では,(1)アイデンティティ関連領域の多様性の割合をブロックし,異なるプライバシレベルを達成するためのアイデンティティ・ブロッキングと,(2)事前訓練された医療財団モデル(MFM)を活用して,ブロックされた領域を補うための医療意味的特徴を抽出するメディカル・セマンティクス・コンペンセーションという2つのステップからなるディバイス・アンド・コンカレンス・フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:59:05 GMT)
Improving Multislice Electron Ptychography with a Generative Prior [40.3] マルチスライス電子写真法(MEP)は、回折パターンから原子結晶構造の高分解能像を再構成する逆画像法である。
我々は,既存の反復解法を拡張するために,MEPの結晶構造の大規模データベース上で訓練された拡散モデルであるMEP拡散を開発する。
このハイブリッド手法は, 復元された3Dボリュームの品質を大幅に向上させ, 既存手法よりも90.50%のSSIM向上を実現している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:14:07 GMT)
Pulse-based optimization of quantum many-body states with Rydberg atoms in optical tweezer arrays [39.6] 光ツイーザアレイにおけるリドベルグ原子に対するパルスベースの変分量子固有解法を探索する。
一次元反強磁性ハイゼンベルク模型と混合場イジング模型の基底状態が正確に作成できることを数値的に示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:51:49 GMT)
T2ISafety: Benchmark for Assessing Fairness, Toxicity, and Privacy in Image Generation [39.5] T2ISafetyは、毒性、公正性、バイアスという3つの主要な領域にわたるT2Iモデルを評価する安全ベンチマークである。
我々は68Kの注釈付き画像を用いた大規模T2Iデータセットを構築し、臨界リスクを検出するための評価器を訓練する。
我々は、T2ISafety上での12の顕著な拡散モデルを評価し、人種的公正性に関する永続的な問題、有害なコンテンツを生成する傾向、モデル間でのプライバシー保護の顕著なばらつきなど、いくつかの懸念を明らかにした。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:18:26 GMT)
DINO-SLAM: DINO-informed RGB-D SLAM for Neural Implicit and Explicit Representations [39.1] 本稿では,DINO-SLAMについて述べる。DINO-SLAMはニューラル暗黙界(Neural Radiance Field -- NeRF)とSLAMシステムにおける明示的表現を強化するための設計戦略である。
我々のDINOインフォームドパイプラインは、最先端の手法と比較して、Replica、ScanNet、TUMで優れたパフォーマンスを実現しています。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:57:37 GMT)
Towards LLM-Enhanced Group Recommender Systems [39.1] グループレコメンデーションシステムは、グループレコメンデーションの生成と説明のために設計されている。
本稿では,大規模言語モデル(LLM)がこれらの側面をサポートする方法を分析する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:59:54 GMT)
Spike No More: Stabilizing the Pre-training of Large Language Models [38.3] ロススパイクは、大きな言語モデルの事前訓練中に発生することが多い。
サブ層に対するヤコビ行列のスペクトルノルムの解析を通して勾配ノルムを小さくする因子を探索する。
予備訓練プロセスの安定化には, 小さいサブレイヤと大きなショートカットの2つの条件が必要であることが示唆された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:09:17 GMT)
KGV: Integrating Large Language Models with Knowledge Graphs for Cyber Threat Intelligence Credibility Assessment [38.3] サイバー脅威インテリジェンス(サイバー脅威インテリジェンス、CTI)は、高度で組織化され、兵器化されたサイバー攻撃を防ぐ重要なツールである。
本稿では,大規模言語モデル (LLM) と単純な構造化知識グラフ (KG) を統合し,CTIの信頼性自動評価を行う最初のフレームワークである知識グラフベース検証(KGV)を提案する。
実験の結果,我々のKGVはCTI-200データセット上で最先端の事実推論手法より優れており,F1は5.7%向上していることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:41:37 GMT)
MaskControl: Spatio-Temporal Control for Masked Motion Synthesis [38.2] 生成マスク運動モデルに制御性を導入するための最初のアプローチであるMaskControlを提案する。
まず、textitLogits Regularizerは、トレーニング時に暗黙的にロジットを摂り、モーショントークンの分布を制御された関節位置と整列させる。
第2に、textitLogit最適化は、生成した動きを制御された関節位置と正確に一致させるトークン分布を明示的に再設定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:24:03 GMT)
Linearly Convergent Algorithms for Nonsmooth Problems with Unknown Smooth Pieces [38.0] 本研究では,ドメインを滑らかな部分へ分割する関数を高速に最適化するアルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:50:43 GMT)
Pilot Contamination-Aware Graph Attention Network for Power Control in CFmMIMO [32.8] CFmMIMOシステムにおけるダウンリンク電力制御のためのグラフアテンションネットワークを提案する。
パイロットの汚染を効果的に処理し、多数のユーザ機器に適応しながら、自己管理的な操作を行う。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:42:35 GMT)
Advancing biomolecular understanding and design following human instructions [32.4] InstructBioMolは、自然言語と生体分子を橋渡しするために設計された大きな言語モデルである。
マルチモーダルな生体分子を入力として統合し、研究者が自然言語で設計目標を明確にすることができる。
結合親和性は10%向上し、酵素-基質対予測スコア70.4に達する酵素を設計することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:16:00 GMT)
TiVy: Time Series Visual Summary for Scalable Visualization [32.3] 時系列パターンを用いて時系列を要約する新しいアルゴリズムTiVyを提案する。
また,大規模時系列をリアルタイムにレンダリングするインタラクティブな時系列可視化も提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:50:01 GMT)
TokenSmith: Streamlining Data Editing, Search, and Inspection for Large-Scale Language Model Training and Interpretability [31.8] TokenSmithは、データセットのインタラクティブな編集、検査、分析のためのオープンソースライブラリである。
GPT-NeoX、Megatron、NVIDIA NeMoといったMegatronスタイルの事前トレーニングフレームワークで使用されている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:37:58 GMT)
Quasi-$Φ_0$-periodic supercurrent at quantum Hall transitions [31.3] 近年の量子干渉研究により、QHエッジ状態は、高品質のグラフェン弱いリンクの超電流を効果的に媒介できることが示唆されている。
六方晶窒化ホウ素 (hBN) にカプセル化されNb鉛に接触した高移動率CVD結晶グラフェンからなる逆ゲートグラフェンジョセフソン接合を用いる。
超伝導ポケットは、最大2.4TまでのQHオンセットを超えて持続して検出され、Nb接触の上部臨界場に接近する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:54:12 GMT)
OS-MAP: How Far Can Computer-Using Agents Go in Breadth and Depth? [30.8] OS-MAPは、日々のコンピュータ利用自動化のためのベンチマークである。
15のアプリケーションにまたがる416の現実的なタスクを2つの重要な次元に沿って整理する。
必要なエージェントの自律性と一般化のレベルが異なる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:14:53 GMT)
A Validation Approach to Over-parameterized Matrix and Image Recovery [29.3] 複数のランダムな線形測定から低ランク行列を復元する問題を考察する。
提案手法は,より深いネットワークを持つ画像である画像に有効であることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:41:37 GMT)
Back to the Features: DINO as a Foundation for Video World Models [29.1] 我々は、DINOv2の潜在空間における将来のフレームを予測するために訓練された、強力なジェネラリストビデオワールドモデルであるDINO-worldを紹介する。
トレーニング済みの画像エンコーダを活用して、大規模未処理ビデオデータセット上で将来の予測器をトレーニングすることにより、DINO-worldは多様なシーンの時間的ダイナミクスを学習する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:54:10 GMT)
High-Fidelity Quantum Entanglement Distribution in Metropolitan Fiber Networks with Co-propagating Classical Traffic [29.0] ベルリンのDeutsche Telekomのメトロポリタンファイバーにデプロイされた実世界のスケーラブルな量子ネットワークテストベッドを実演する。
市販の量子デバイスと標準のアドドロップ多重化ハードウェアを用いて、動的に選択可能なファイバーパス上に偏光-絡み合った光子対を分散した。
連続マルチデイ操作において,85-99%のベル状態忠実度境界と2.36-2.74のクローザ・ホーネ・シモニー・ホルトパラメータ$S$-値を得た。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:45:05 GMT)
An Investigation of Prompt Variations for Zero-shot LLM-based Rankers [28.4] ゼロショット大言語モデル (LLMs) に基づくランク付けの有効性について, 特定のコンポーネントや単語がプロンプトに与える影響を体系的に理解する。
現在、性能の違いが根底にあるランキングアルゴリズムによるものなのか、あるいはプロンプトで使われる単語の選択がより良くなるなど、急激な要因によるものなのかは定かではない。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 01:51:32 GMT)
SALM-Duplex: Efficient and Direct Duplex Modeling for Speech-to-Speech Language Model [28.4] 本稿では,連続的なユーザ入力とチャネル融合を伴うエージェント出力を特徴とする,新しい2重音声合成(S2S)アーキテクチャを提案する。
ユーザ入力に事前トレーニングされたストリーミングを使用することで、音声事前トレーニングを必要とせずに、第1の二重S2Sモデルを実現できる。
実験結果から,提案モデルが従来の2次モデルよりも,推論,ターンテイク,バージイン能力に優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:07:10 GMT)
Quantum simulation of multiscale linear transport equations via Schrödingerization and exponential integrators [26.9] マルチスケール線形輸送方程式に対する2つのハミルトニアンシミュレーションアルゴリズムを提案する。
両方のアルゴリズムのクエリ複雑性である$mathcalO(N_vN_x2log N_x)$は、この方程式を解くために既存の量子および古典的アルゴリズムより優れている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:44:28 GMT)
BridgeNet: A Unified Multimodal Framework for Bridging 2D and 3D Industrial Anomaly Detection [26.9] 本稿では,新しい統合型マルチモーダル異常検出フレームワークを提案する。
コントリビューションは3つの重要な側面で構成されています。
実験の結果,MVTec-3D ADおよびEyecandiesデータセット上でのSOTA(State-of-the-art)よりも優れていた。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:27:25 GMT)
GSCache: Real-Time Radiance Caching for Volume Path Tracing using 3D Gaussian Splatting [26.7] 科学的可視化において、ボリュームレンダリングは、研究者が複雑な3Dデータを解析し解釈するのを助ける重要な役割を担っている。
最も顕著な問題の1つは、モンテカルロ統合によるレンダリング性能の遅さと高いピクセル分散である。
本稿では,パストレースボリュームレンダリングのための新しいラジアンスキャッシング手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 23:55:54 GMT)
All in One: Visual-Description-Guided Unified Point Cloud Segmentation [26.5] VDG-Uni3DSegは、事前訓練された視覚言語モデルと大規模言語モデルを統合する新しいフレームワークである。
提案手法はリッチなマルチモーダルキューを取り入れ,微細なクラスとインスタンス分離を容易にする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:03:22 GMT)
Injecting External Knowledge into the Reasoning Process Enhances Retrieval-Augmented Generation [26.2] Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を知識集約タスクの外部知識で拡張するために広く採用されている。
RAGの有効性は、しばしばノイズ(低品質)の回復経路の存在によって損なわれる。
本稿では,RAGの雑音に対する認識・抵抗能力を高めるため,パッセージインジェクションを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:43:31 GMT)
MedIQA: A Scalable Foundation Model for Prompt-Driven Medical Image Quality Assessment [26.2] しかし、既存のIQA法は、様々なモダリティや臨床シナリオにまたがる一般化に苦慮している。
MedIQAは,画像次元,モダリティ,解剖学的領域,タイプにおける可変性を扱うために設計された,医用IQAの最初の包括的基盤モデルである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:02:47 GMT)
Weak-to-Strong Generalization with Failure Trajectories: A Tree-based Approach to Elicit Optimal Policy in Strong Models [25.8] 我々は、弱いモデルによって生成された中間作用の軌跡を持つ強いモデルを微調整する。
人間の学習プロセスに動機づけられた我々は、成功知識だけでなく失敗経験も一般化することを提案する。
我々の経験的評価は、多種多様なタスク領域にわたる推論と意思決定能力を大幅に改善したことを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:17:09 GMT)
Decision by Supervised Learning with Deep Ensembles: A Practical Framework for Robust Portfolio Optimization [24.2] DecisionFocused by Supervised Learningは、ロバストなポートフォリオ最適化のためのフレームワークである。
DSLはDeep Ensembleメソッドを使用し、ポートフォリオ割り当てのばらつきを大幅に低減します。
アンサンブルサイズが大きくなると、中央値のリターンが向上し、リスク調整性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:25:59 GMT)
Masked Autoencoders that Feel the Heart: Unveiling Simplicity Bias for ECG Analyses [24.0] 単純性バイアス(Simplicity Bias, SB)として知られる細粒度だが臨床的に重要な手がかりを見越して, 支配的かつ反復的なパターンに適合する傾向を示した。
本稿では,1)ECG信号の動的特性を反映した時間周波数特性を捉えるための時間周波数対応フィルタと,2)2つの領域をまたいだ粗い表現学習のための多言語プロトタイプ再構成と,さらにSBを緩和する手法を提案する。
6つのECGデータセットにまたがる3つの下流タスクの実験により,本手法がSBを効果的に低減し,最先端の性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:25:33 GMT)
PARROT: An Open Multilingual Radiology Reports Dataset [23.9] PARROTは、複数の言語にまたがる架空の放射線学レポートの大きな、多中心的でオープンアクセスデータセットである。
このデータセットは、21か国と13の言語にわたる76人の著者による2,658の放射線学レポートで構成されている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:54:24 GMT)
Kill two birds with one stone: generalized and robust AI-generated text detection via dynamic perturbations [23.6] 本稿では,高精巧な報酬と行動を伴う強化学習によって導入された動的摂動による新しいAIGT検出法(DP-Net)を提案する。
実験により,提案したDP-NetによるAIGT検出手法は,一般化能力に優れることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:21:08 GMT)
Secure Best Arm Identification in the Presence of a Copycat [23.1] 本稿では,エンコードアームを用いたセキュアなアルゴリズムを提案する。
このアルゴリズムは鍵や暗号のプリミティブを一切必要としないが、最高の腕に関する情報をほとんど示さずに$Omegaleft(fracTlog2(d)right)$ exponentを達成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:00:44 GMT)
Multi-Task Dense Prediction Fine-Tuning with Mixture of Fine-Grained Experts [22.9] 密集予測のためのマルチタスク学習(MTL)は有望な結果を示しているが、タスク固有の特殊化と共有表現のバランスをとる上ではまだ課題に直面している。
3つの重要なイノベーションとファインチューニングを組み合わせることで、MoEベースのMTLモデルを探索する、ファイングラインド・ミックス・オブ・エキスパートアーキテクチャを導入する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:59:30 GMT)
HITSZ's End-To-End Speech Translation Systems Combining Sequence-to-Sequence Auto Speech Recognition Model and Indic Large Language Model for IWSLT 2025 in Indic Track [22.9] Indic-specialized large language model(LLM)であるKrutrimと事前訓練されたWhisper自動音声認識(ASR)モデルを組み合わせたエンドツーエンドシステムを提案する。
実験により,我々のエンドツーエンドシステムは,英語と英語の進路で平均28.88ドル,英語と英語の進路で平均27.86ドルを達成できた。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:32:14 GMT)
Component-Based Machine Learning for Indoor Flow and Temperature Fields Prediction Latent Feature Aggregation and Flow Interaction [22.9] 本研究では,従来のCFDシミュレーションを代替するコンポーネントベース機械学習(CBML)サロゲートモデリング手法を提案する。
CBMLは3つのニューラルネットワークで構成されている: 残留接続を持つ畳み込み自己エンコーダ(CAER)、多層パーセプトロン(MLP)、畳み込みニューラルネットワーク(CNN)。
その結果、CBMLモデルはトレーニングとテストの両方のデータセットで2次元の集約速度場を正確に高速に予測できることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:57:30 GMT)
WACA-UNet: Weakness-Aware Channel Attention for Static IR Drop Prediction in Integrated Circuit Design [22.7] 従来のシミュレーションベースの解法は計算コストが高く、スケールが難しい。
我々は、不均一な多チャンネル物理地図上での画素単位の回帰タスクとしてIRドロップ推定を再構成することで、この問題に対処する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:07:16 GMT)
Large Language Model Powered Automated Modeling and Optimization of Active Distribution Network Dispatch Problems [22.5] 本稿では,大規模言語モデル(LLM)を用いた自動モデリングと最適化手法を提案する。
提案手法は,ADN演算子による単純な自然言語クエリによるディスパッチ戦略の導出を可能にするユーザ中心インタフェースを特徴とする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:46:25 GMT)
Smooth Reading: Bridging the Gap of Recurrent LLM to Self-Attention LLM on Long-Context Tasks [22.4] 人間の読み方から着想を得たチャンクワイド推論手法であるSmooth Readingを提案する。
実験結果から,長文タスクにおけるリカレントLLMとセルフアテンションLLMのパフォーマンスギャップが大幅に狭まることがわかった。
提案手法は, 自己注意型LPMに比べて3倍高速に学習し, 64kコンテキストで2倍高速に推定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:02:45 GMT)
Should Top-Down Clustering Affect Boundaries in Unsupervised Word Discovery? [22.0] ラベルのない音声を単語のような単位に分割し、それらをクラスタ化して語彙を生成するという問題について検討する。
トップダウン手法は、クラスタ化された単語からの情報を組み込んで境界選択を知らせる。
ES-KMeansによるトップダウンの影響は有益であることを示すが、多くの場合、単純なボトムアップ手法も同様に機能する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:19:16 GMT)
MindFlow+: A Self-Evolving Agent for E-Commerce Customer Service [22.0] 自己進化型対話エージェントMindFlow+は、大規模な言語モデルと模倣学習とオフライン強化学習を組み合わせることで、ドメイン固有の振る舞いを学習する。
MindFlow+は、ツール拡張されたデモ構築と報酬条件付きデータモデリングという、学習をガイドする2つのデータ中心のメカニズムを導入している。
実世界のeコマースの会話の実験では、MindFlow+はコンテキストの関連性、柔軟性、タスクの正確性において、強いベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:01:55 GMT)
CodeEvo: Interaction-Driven Synthesis of Code-centric Data through Hybrid and Iterative Feedback [21.6] 大規模言語モデルの訓練には高品質な命令コードペアの獲得が不可欠である。
2つのLLMエージェント間の反復的な相互作用を通じてコードデータを合成するフレームワークであるCodeEvoを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:12:51 GMT)
Querying Autonomous Vehicle Point Clouds: Enhanced by 3D Object Counting with CounterNet [21.6] 我々は,RETRIEVAL, COUNT, AGGREGATIONの3つのコアクエリタイプを定義することで,ポイントクラウドクエリを形式化する。
CounterNetは、大規模クラウドデータの正確なオブジェクトカウントのために設計された、ヒートマップベースのネットワークである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:29:21 GMT)
FBSDiff: Plug-and-Play Frequency Band Substitution of Diffusion Features for Highly Controllable Text-Driven Image Translation [19.7] 本稿では,大規模テキスト・ツー・イメージ(T2I)拡散モデルとイメージ・ツー・イメージ(I2I)パラダイムをプラグ・アンド・プレイ方式で適用する,新しい,簡潔かつ効率的なアプローチを提案する。
本手法は,周波数帯域のタイプや帯域幅を調整するだけで,参照画像の導出係数と導出強度の両方を柔軟に制御できる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:37:53 GMT)
Objectifying the Subjective: Cognitive Biases in Topic Interpretations [19.6] トピック品質の構成を提案し,トピックの文脈でユーザに対して評価を依頼する。
我々は、意味論からトピック解釈のテーマを特定するために、反射的テーマ分析を用いる。
そこで本稿では,係留調整に基づくトピック解釈の理論を提案し,ユーザが適切な単語をアンカーし,解釈に到達するためのセマンティックな調整を行う。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:51:42 GMT)
Faster Lifting for Ordered Domains with Predecessor Relations [19.0] 我々は、先行関係のある順序付き藩の利上げ推論を調査する。
従来の研究は、重み付けされた一階モデルの数え上げを通じてこの問題を調査してきた。
我々はこれらの関係を本質的に支援する新しいアルゴリズムを考案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:43:34 GMT)
Efficient Attention Mechanisms for Large Language Models: A Survey [18.9] トランスフォーマーベースのアーキテクチャは、大規模言語モデルの一般的な計算バックボーンとなっている。
最近の研究は、効率的な注意機構の2つの主要なカテゴリを紹介している。
対照的に、スパースアテンションテクニックは、固定パターン、ブロックワイドルーティング、クラスタリング戦略に基づいて、選択されたトークンのサブセットに注意を限定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:08:10 GMT)
A Protocol to Address Ecological Redirection for Digital Practices in Organizations [18.5] 本稿では,デジタルプラクティスの生態的リダイレクトを支援するプロトコルを提案する。
本研究は,(1)参加者がプロトコルを実行する流動性,(2)リダイレクト目的の観点からのプロトコルの有効性,(3)リダイレクトプロセスに対する社会技術的障壁を測定するための実証的研究である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:03:56 GMT)
Gemini 2.5 Pro Capable of Winning Gold at IMO 2025 [18.3] 大規模言語モデル(LLM)は、AIMEのような数学的なベンチマークでうまく機能するが、オリンピアードレベルのタスクと競合する。
新たにリリースされたIMO 2025問題では、GoogleのGemini 2.5 Proを使って、データの汚染を避けています。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:53:11 GMT)
Ensemble Debiasing Across Class and Sample Levels for Fairer Prompting Accuracy [17.6] 言語モデルは、強力な数発の学習者であり、テキスト分類タスクにおいて、全体的な精度が良好である。
我々は、全体的な精度の追求は、強い階級を豊かにするだけでなく、弱い階級を育てることによってもたらされると信じている。
本論文では,文脈内学習クラス確率のフレキシブルな修正を可能にするHeaviside Step関数に基づくアンサンブルデバイアス法を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:39:26 GMT)
Identifying Fine-grained Forms of Populism in Political Discourse: A Case Study on Donald Trump's Presidential Campaigns [17.2] 本稿では,大言語モデルがポピュリズムの微細な形態を識別し,分類できるかどうかを検討する。
オープンウェイトとプロプライエタリの両方で、複数のプロンプトパラダイムで事前訓練された(大規模な)言語モデルを評価する。
微調整のRoBERTa分類器は、微調整のない限り、新しい命令のLLMをはるかに上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:18:54 GMT)
DyWA: Dynamics-adaptive World Action Model for Generalizable Non-prehensile Manipulation [16.9] 本研究では,未来の状態を共同で予測し,歴史的軌跡に基づく動的変動に適応して行動学習を促進する新しい枠組みを提案する。
DyWAは実世界の実験で平均68%の成功率を達成した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:49:01 GMT)
XAI4LLM. Let Machine Learning Models and LLMs Collaborate for Enhanced In-Context Learning in Healthcare [16.8] 本稿では,大規模言語モデルによる構造化された臨床データ処理を実現するための知識誘導型インコンテキスト学習フレームワークを提案する。
このアプローチでは、ドメイン固有の機能グループ化、慎重にバランスのとれた数ショットの例、タスク固有のプロンプト戦略を統合する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:24:58 GMT)
Assessment of Personality Dimensions Across Situations Using Conversational Speech [16.7] 本研究では,2つの作業状況に携わる参加者に対する会話音声と認知的性格の関係について検討した。
主な発見は,1) 個人性は相互作用によって大きく異なる,2) 声高, 音高, スペクトルフラックスの特徴は外転, 一致性, 良性, 中性相互作用における開放性を示すが, 神経症はこれらの特徴とストレスの多い文脈で相関する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:18:28 GMT)
Advancing Event Forecasting through Massive Training of Large Language Models: Challenges, Solutions, and Broader Impacts [16.6] 我々は,スーパーフォラキャスタレベルのイベント予測LPMの大規模トレーニングについて検討する時期が来たと論じる。
トレーニングでは,ノイズ・スパーシティ,知識遮断,単純な報酬構造問題という,LLMに基づくイベント予測トレーニングの難しさを3つ紹介する。
我々は,大規模なトレーニングと評価を可能にするために,市場,パブリック,クローリングデータセットの積極的な利用を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:59:13 GMT)
Trustworthy Reasoning: Evaluating and Enhancing Factual Accuracy in LLM Intermediate Thought Processes [16.5] 本稿では,Large Language Models(LLMs)における重大な脆弱性に対処する新しいフレームワークを提案する。
この現象は、医療、法的な分析、科学研究など、高度な領域に重大なリスクをもたらす。
我々は、RELIANCEは、挑戦的なベンチマークのパフォーマンスを維持したり改善したりしながら、事実の堅牢性(最大49.90%の改善)を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:34:51 GMT)
Empowering IoT Firmware Secure Update with Customization Rights [15.5] 私たちは、23ベンダにわたる200のLinuxベースのIoTデバイスのアップデートに関するパイロット研究を行います。
2020年から2024年にかけて行われたアップデート関連のCVEのより広範な分析によると、半数以上がカスタマイズによる問題に起因する。
信頼性の高いクロスモジュール整合性チェーンの構築と,大量カスタマイズによる更新パフォーマンスのスケールアップという,2つの主要な課題に対処する最初のフレームワークであるIMUPを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:17:29 GMT)
Integrating IP Broadcasting with Audio Tags: Workflow and Challenges [15.5] 放送業界はIP技術を採用し、生放送と録画されたコンテンツ制作の両方に革命をもたらした。
考えられる1つのツールは、ライブオーディオタグの使用であり、コンテンツの生産に多くの用途がある。
我々は、オーディオタグモデルをマイクロサービスにコンテナ化するプロセスについて説明する。これは、多数の異なるネットワーク設定に統合可能な、小さな分離されたコードモジュールである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:18:16 GMT)
Doubling Your Data in Minutes: Ultra-fast Tabular Data Generation via LLM-Induced Dependency Graphs [15.5] タブラルデータはさまざまなドメインで重要であるが、プライバシの懸念と収集コストのため、高品質なデータセットは依然として不足している。
本稿では,SPADA for SPArse Dependency-driven Augmentationを提案する。
4つのデータセットの実験により、SPADAは拡散ベースの手法と比較して制約違反を4%削減し、LCMベースのベースラインよりも約9500倍高速に生成することが示された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:43:50 GMT)
DoctorAgent-RL: A Multi-Agent Collaborative Reinforcement Learning System for Multi-Turn Clinical Dialogue [15.0] 大規模言語モデル (LLMs) は, バイオメディカルな質問応答の分野で優れた能力を発揮してきたが, 実際の臨床研究への応用はいまだに課題に直面している。
我々は,医療相談を不確実性下での動的意思決定プロセスとしてモデル化する,強化学習(RL)に基づくマルチエージェント協調フレームワークであるOursを提案する。
本手法は,医療資源の配分を最適化し,労働力不足を緩和する戦略の草分けとして,時間的プレッシャーによる誤診リスクの低減,複雑な症例に対する臨床医の解放,医療資源配分の最適化,労働力不足の緩和など,極めて実践的な価値を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:04:53 GMT)
Benchmarking Linguistic Diversity of Large Language Models [14.8] 本稿では,言語モデルによる人間の言語的豊かさの保全を検討することの重要性を強調する。
言語多様性の観点からLLMを評価するための包括的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:23:51 GMT)
Modality Agnostic Efficient Long Range Encoder [14.7] 汎用実装を用いた単一デバイス上での長文処理の課題に対処する。
これらの制約を克服するために、統一的で効率的なトランスアーキテクチャであるMAELREを提案する。
我々は、MAELREが既存の長文モデルと比較して計算コストを低減しつつ、優れた精度を達成できることを実証した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:19:47 GMT)
Bias Analysis for Synthetic Face Detection: A Case Study of the Impact of Facial Attribute [14.6] いくつかの顔特性に対する合成顔検出器の偏りの分析に寄与する評価フレームワークを提案する。
提案手法は,25個の顔属性を持つ合成データセットにおける5つの最先端検出器のバイアスレベルを広範囲に研究するためのものである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:49:06 GMT)
Face2VoiceSync: Lightweight Face-Voice Consistency for Text-Driven Talking Face Generation [14.0] 顔画像とテキストが与えられた場合、音声による顔のアニメーションとその対応する音声を生成する。
我々は、新しいフレームワークFace2VoiceSyncを提案し、いくつかの新しいコントリビューションを行った。
実験では、Face2VoiceSyncは単一の40GBのGPU上で、視覚的およびオーディオ的両方のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:49:06 GMT)
ScenePainter: Semantically Consistent Perpetual 3D Scene Generation with Concept Relation Alignment [14.0] ScenePainterは意味的に一貫した3Dシーン生成のための新しいフレームワークである。
我々のフレームワークはセマンティックドリフト問題を克服し、より一貫性のある没入型3Dビューシーケンスを生成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:21:12 GMT)
"X of Information'' Continuum: A Survey on AI-Driven Multi-dimensional Metrics for Next-Generation Networked Systems [13.9] 時間的・品質・実用性・信頼性・ロバスト性・ネットワーク・コミュニケーションの次元に沿って情報メトリクスを構造化する体系的な4次元分類体系を導入する。
分析の結果、深層強化学習、マルチエージェントシステム、ニューラル最適化モデルといった人工知能技術が、競合する情報品質の目的を適応的かつコンテキスト対応で最適化できることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:03:38 GMT)
Event-Driven Storytelling with Multiple Lifelike Humans in a 3D Scene [13.7] 我々は,複数の人間の文脈運動を生かした,生き生きとした仮想的な動的シーンを生成するフレームワークを提案する。
我々は,大言語モデル(LLM)のパワーを適応させ,テキスト入力における文脈的複雑さを解消する。
スケーラブルで包括的なコンテキストを提供するために、ハイレベルなモジュールを採用しています。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:57:05 GMT)
Debating Truth: Debate-driven Claim Verification with Multiple Large Language Model Agents [13.6] 複数のLLMエージェントを用いた議論駆動手法を採用した最初のクレーム検証フレームワークであるDebateCVを提案する。
本フレームワークでは,2つのデバタがクレームに対して反対の立場をとり,複数ラウンドの議論を行う一方,モデレーターは議論を評価し,正当化とともに評決を行う。
実験の結果,提案手法は,証拠品質の異なる既存のクレーム検証方法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:19:25 GMT)
Do Large Language Models Have an English Accent? Evaluating and Improving the Naturalness of Multilingual LLMs [13.6] 大規模言語モデル (LLM) は主に英語を基本言語として設計されている。
多言語である少数の人々でさえ、強い英語中心の偏見を示す傾向がある。
本稿では,多言語出力の語彙的および構文的自然性を評価するための新しい自動コーパスレベル指標を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:08:21 GMT)
A New One-Shot Federated Learning Framework for Medical Imaging Classification with Feature-Guided Rectified Flow and Knowledge Distillation [13.4] ワンショットフェデレートラーニング(OSFL)は、通信オーバーヘッドが低く、1ラウンドの送信しか必要とせず、注目を集めている。
既存の生成モデルベースのOSFLメソッドは、トレーニング効率の低下と、医療領域における潜在的なプライバシー漏洩に悩まされている。
本稿では,新しいFG-RF(Feature-Guided Rectified Flow Model)とDLKD(Dual-Layer Knowledge Distillation)アグリゲーション手法を開発したOSFLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:05:47 GMT)
MLLM-based Speech Recognition: When and How is Multimodality Beneficial? [12.7] マルチモーダル大言語モデル(MLLM)は、音声、テキスト、画像、その他のモダリティの統一モデリングのための新たな可能性を開いた。
本稿では,複数の入力モードが雑音環境下で自動音声認識(ASR)の精度を向上させる条件とモデルアーキテクチャについて検討する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:46:40 GMT)
The Eloquence team submission for task 1 of MLC-SLM challenge [12.4] MLC-SLM(Multiversual Conversational Speech Language Model)の課題1に向けて実施した研究と実験について述べる。
この課題は、言語モデルアーキテクチャの開発を通じて、多言語会話音声認識の進歩に焦点を当てる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:23:49 GMT)
Is Exchangeability better than I.I.D to handle Data Distribution Shifts while Pooling Data for Data-scarce Medical image segmentation? [12.3] データ不足は、特にディープラーニングモデルにおいて、医療画像における大きな課題である。
深層ネットワークのすべての層にまたがる前景特徴差を制御できる手法を提案する。
本手法は,5つのデータセットにまたがる病理組織像と超音波画像における最先端のセグメンテーション性能を実現する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:55:06 GMT)
MOCHA: Are Code Language Models Robust Against Multi-Turn Malicious Coding Prompts? [12.2] コード分解攻撃では、悪意のあるコーディングタスクが、安全フィルタを避けるために、一見良質なサブタスクに分解される。
システム評価を容易にするために,単一ターンおよび複数ターンの悪意のあるプロンプトに対して,LLMの堅牢性を評価するために設計された大規模ベンチマークであるベンチマークネームを導入する。
MOCHAの微調整は、符号化能力を維持しながら拒絶率を改善し、重要なことは、外部の敵データセットの堅牢性を、追加の監督なしに最大32.4%の拒絶率で向上させる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:11:10 GMT)
Diverse and Adaptive Behavior Curriculum for Autonomous Driving: A Student-Teacher Framework with Multi-Agent RL [11.2] 本研究は、自動カリキュラム学習のための新しい学生-教員の枠組みを導入する。
グラフベースのマルチエージェントRLコンポーネントである教師は、さまざまな困難レベルにわたるトラフィックの振る舞いを適応的に生成する。
結果は,多様な交通行動を生成する教師の能力を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:35:30 GMT)
ReCatcher: Towards LLMs Regression Testing for Code Generation [11.2] ReCatcherはPythonコード生成のための回帰テストフレームワークである。
ReCatcherを適用して、3つの更新シナリオ、微調整、マージ、モデルリリースのレグレッションを評価します。
Llama2のような汎用モデルとマージすると、精度が最大18%向上する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:45:55 GMT)
Mining Contextualized Visual Associations from Images for Creativity Understanding [11.1] ラベルのないデータセットにスケール可能な画像中の有意な視覚要素の文脈的関連を抽出する手法を提案する。
我々は,MSCOCOの画像に対して,新しい視覚関連データセットと1.7mのクリエイティビティキャプションを作成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:15:16 GMT)
SLICEMATE: Accurate and Scalable Static Program Slicing via LLM-Powered Agents [11.1] SliceMateはLarge Language Model (LLM)エージェントを利用した新しい静的プログラムスライシングソリューションである。
明示的な依存グラフ構築の必要性を回避し、より優れたスライシング精度を実現する。
厳密な評価のために,2200のJavaプログラムとPythonプログラムを手動でアノテートした新しい高品質ベンチマークであるSliceBenchを構築した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:51:47 GMT)
SE-VLN: A Self-Evolving Vision-Language Navigation Framework Based on Multimodal Large Language Models [11.0] SE-VLNは視覚言語ナビゲーションのための自己進化型フレームワークである
3つのコアモジュール、すなわち階層型メモリモジュール、検索強化思考ベースの推論モジュール、リフレクションモジュールで構成されている。
R2RとREVERSEのデータセットの現在の手法よりも23.9%と15.0%の絶対的なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:28:55 GMT)
Tell Me What to Track: Infusing Robust Language Guidance for Enhanced Referring Multi-Object Tracking [10.6] 参照マルチオブジェクト追跡(RMOT)は、任意の数のターゲットをローカライズすることを目的とした、新たなクロスモーダルタスクである。
我々は、不均衡の影響を軽減するために協調的マッチング戦略を実行し、新生児の標的を検出する能力を高める。
エンコーダでは,従来の作業のボトルネックを克服し,クロスモーダル・マルチスケール融合を統合し,強化する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:50:30 GMT)
Motion Synthesis with Sparse and Flexible Keyjoint Control [10.6] スパースおよびフレキシブルなキージョイント信号を尊重する制御可能なモーション合成フレームワークを提案する。
多様なデータセットやシナリオに関する総合的な実験を通じて,スパースかつフレキシブルなキージョイント制御の有効性を実証する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:45:05 GMT)
Oranits: Mission Assignment and Task Offloading in Open RAN-based ITS using Metaheuristic and Deep Reinforcement Learning [10.6] オープンLAN(Open RAN)ベースのインテリジェントトランスポートシステム(ITS)におけるミッション割り当てとタスクオフロードについて検討する。
既存の研究はしばしば、ミッション間の複雑な相互依存と、エッジサーバへのタスクのオフロードに伴うコストを見落としている。
我々は、オーラニッツ(Oranits)という、ミッション依存とオフロードコストを明示的に考慮し、車両の協調によって性能を最適化する新しいシステムモデルを紹介した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 23:13:09 GMT)
Learnable cut flow for high energy physics [9.5] Learnable Cut Flow(LCF)は、従来のカット選択をデータ駆動プロセスに変換するニューラルネットワークである。
LCFは2つのカット戦略パラレルを実装しており、観測可能な分布は独立に扱われる。
LCFは6つのさまざまなモックデータセットと、現実的なダイボソン対QCDデータセットでテストされている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:49:47 GMT)
A Self-training Framework for Semi-supervised Pulmonary Vessel Segmentation and Its Application in COPD [9.5] 本研究の目的は,半監督法を用いて肺血管を分画することであった。
提案手法であるSemi2は, 船体セグメンテーションの精度を2.3%向上し, 90.3%の精度を実現している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:50:31 GMT)
Gaussian Set Surface Reconstruction through Per-Gaussian Optimization [9.5] 3D Gaussian Splatting (3DGS)は、フレキシブルな表現を通して、斬新なビューを効果的に合成するが、シーン幾何学を正確に再構築することができない。
本稿では,ガウス集合表面再構成法(GSSR)を提案する。これは,ガウス集合表面を静止面に沿って均等に分配し,支配的な正規値と表面正規値とを整列させる手法である。
GSSRは画素レベルとガウスレベルの単視正規整合と多視光度整合を組み合わせることで、微細な幾何学的アライメントを強制する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:31:47 GMT)
Emerging Trends in Software Architecture from the Practitioners Perspective: A Five Year Review [9.4] ソフトウェアアーキテクチャは、ソフトウェアシステムの設計、開発、保守において中心的な役割を果たす。
この研究は、業界の主要な8つのカンファレンスにおけるソフトウェアアーキテクチャのトレンドを5年間にわたって分析する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:45:20 GMT)
Review of Deep Learning Applications to Structural Proteomics Enabled by Cryogenic Electron Microscopy and Tomography [9.3] 低温電子顕微鏡(cryoEM)とトモグラフィ(cryoET)の進歩により「cryoEM革命」は高分解能構造データにおいて指数関数的に成長した
構造的解決への深層学習の統合は、低信号対雑音比、優先方向アーティファクト、欠落問題など、長年にわたる課題に対処する。
本稿では,畳み込みニューラルネットワークを用いた自動粒子抽出から,好みの配向バイアスに対する計算解まで,CreoEMパイプライン全体にわたるAI応用について検討する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:15:09 GMT)
Perspective from a Higher Dimension: Can 3D Geometric Priors Help Visual Floorplan Localization? [8.8] 建物のフロアプランの自己ローカライズは研究者の興味を引き付けている。
フロアプランは建物の構造を最小限に表現するので、視覚的知覚とフロアプランの様相や幾何学的差異がこの課題に挑戦する。
既存の手法では、2次元幾何学的特徴とポーズフィルタを巧みに利用して有望な性能を実現する。
本稿では,2次元フロアプランの局所化問題を視覚的FLOCアルゴリズムに3次元幾何学的先行点を注入することにより高次元から考察する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 01:34:26 GMT)
How Much Do Large Language Model Cheat on Evaluation? Benchmarking Overestimation under the One-Time-Pad-Based Framework [8.8] 大規模言語モデル(LLM)を評価する際の過大評価が懸念されている。
本稿では,暗号におけるワンタイムパッド暗号化にインスパイアされた動的評価フレームワークArxivRollを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:39:03 GMT)
Can You Share Your Story? Modeling Clients' Metacognition and Openness for LLM Therapist Evaluation [8.7] 既存の評価方法は、内部状態をセラピストに明確に開示するクライアントシミュレータに依存している。
我々は,制御可能で現実的なクライアントシミュレータを備えた新しい評価フレームワークであるMindVoyagerを紹介する。
さらに,LLMセラピストの探究能力を評価するための評価指標を,クライアントの信念や思考を徹底的に理解することで導入する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:32:05 GMT)
Quantum Internet Architecture: unlocking Quantum-Native Routing via Quantum Addressing [8.4] 量子インターネットは、量子絡み合いの分散と操作が主な目的であるため、ネットワーク設計の根本的な変化を導入している。
本稿では,エンタングルメント定義コントローラの概念を中心にした,新しい階層型量子インターネットアーキテクチャを提案する。
また、スケーラブルでコンパクトなルーティングテーブルを示す量子ネイティブルーティングプロトコルを設計する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:01:46 GMT)
VisHall3D: Monocular Semantic Scene Completion from Reconstructing the Visible Regions to Hallucinating the Invisible Regions [8.4] VisHall3Dは、シーン完了タスクを、可視領域(ビジョン)の再構築と見えない領域(幻覚)の推測の2段階に分解する
VisHall3Dは最先端のパフォーマンスを達成し、従来の手法よりも大幅に向上した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:57:18 GMT)
AI PsyRoom: Artificial Intelligence Platform for Segmented Yearning and Reactive Outcome Optimization Method [8.3] 心理学的カウンセリングは、メンタルヘルスサービスの需要の増加と専門職の不足により、大きな課題に直面している。
大規模言語モデル(LLM)は、心理学的カウンセリング、特に共感と感情的支援を支援する可能性がある。
本稿では,共感的,感情的ニュアンスのある会話を生成することで,心理カウンセリングを強化するためのマルチエージェント・シミュレーション・フレームワークであるAI PsyRoomを紹介する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:08:54 GMT)
Data Caricatures: On the Representation of African American Language in Pretraining Corpora [8.2] 我々は、主に英語、オープンソースの事前学習コーパスにおけるアフリカ系アメリカ人表現の量と質を評価する。
AALは、アメリカの人口統計学と比較して、すべての評価済み事前学習コーパスにおいて不足しており、0.007%と0.18%の文書で構成されている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:28:49 GMT)
LISA: A Layer-wise Integration and Suppression Approach for Hallucination Mitigation in Multimodal Large Language Models [8.1] MLLM(Multimodal Large Language Models)は、視覚言語タスクにおいて優れているが、オブジェクト幻覚の傾向が強い。
階層的変調と多層融合による生成一貫性を向上させるtextbfLISA を提案する。
実験によると、LISAは$mathrmCHAIR_I$で最大53.6%の幻覚を減少させ、POPE F1を4.5%改善する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:48:23 GMT)
Jailbreaking Large Language Diffusion Models: Revealing Hidden Safety Flaws in Diffusion-Based Text Generation [7.9] 拡散型言語モデルのための PArallel Decoding jailbreak (PAD) を提案する。
PADはジェイルブレイク攻撃の成功率を97%向上させ、重大な安全性上の脆弱性を明らかにしている。
自己回帰型大規模言語モデル (LLM) と比較して, LLDMは有害な生成速度を2倍に向上させる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:53:03 GMT)
GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution [7.8] Infrared Image Super-Resolution is challenge by the low contrast and sparse textures of infrared data。
GPSMambaは、アーキテクチャガイダンスと非因果的な監視を併用するフレームワークである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:56:16 GMT)
Bounded KRnet and its applications to density estimation and approximation [7.8] 本稿では,有界領域上に,B-KRnetと呼ばれる可逆写像を開発する。
データに対する密度推定/近似や、フォッカー・プランク方程式やケラー・セゲル方程式のようなPDEの解に応用する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:22:26 GMT)
A self-supervised neural-analytic method to predict the evolution of COVID-19 in Romania [7.8] 我々は、感染症の古典的な確立されたモデルであるSEIRの改良版を使用している。
本稿では,修正SEIRモデルパラメータの正しいセットを推定するために,深層畳み込みネットワークを訓練するための自己教師型アプローチを提案する。
ルーマニアの死亡率が約0.3%である場合、楽観的な結果が得られ、我々のモデルが今後最大3週間の日々の死亡数を正確に予測できることを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:32:46 GMT)
Understanding Human Limits in Pattern Recognition: A Computational Model of Sequential Reasoning in Rock, Paper, Scissors [7.8] 仮説的マインドス(英: hypothetical Minds)は、対立する戦略に関する仮説を生成し、検証する、大きな言語モデルに基づくエージェントである。
同じ実験条件に適用した場合、HMは人間のパフォーマンスパターンを忠実に反映し、成功し、同様の方法で失敗することを示す。
教育的な介入を通じてモデル仮説を体系的に操作することにより、モデルが相手の行動に対する因果的理解を著しく更新することを発見した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:56:25 GMT)
SP-Mamba: Spatial-Perception State Space Model for Unsupervised Medical Anomaly Detection [7.8] 本研究では, 空間知覚型マンバフレームワークであるSP-Mambaを紹介した。
ウィンドウスライディングのプロトタイプ学習とCircular-HilbertスキャニングベースのMambaを導入し、一貫性のある解剖学的パターンをうまく活用する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:57:38 GMT)
From Cloud-Native to Trust-Native: A Protocol for Verifiable Multi-Agent Systems [7.0] エージェントインフラストラクチャに直接構造保証を組み込むプロトコルであるTrustTrackを導入する。
TrustTrackは、知的エージェントが組織や司法機関をまたいでどのように機能するかを再設定する。
Cloud -> AI -> Agent -> Trust transitionは、自律システムのための次のアーキテクチャレイヤである、と私たちは主張する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:38:38 GMT)
SAM2-Aug: Prior knowledge-based Augmentation for Target Volume Auto-Segmentation in Adaptive Radiation Therapy Using Segment Anything Model 2 [6.8] Segment Anything Model 2 (SAM2)は、プロンプトベースのセグメンテーションを約束するが、腫瘍の精度に苦慮している。
我々は、適応放射線治療(ART)のためのSAM2を強化するための知識に基づく事前増強戦略を提案する。
SAM2-Augは1-Seq-Liverデータセット(31例の肝癌患者の115個のMRI)で微調整された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:59:10 GMT)
Estimation of conditional average treatment effects on distributed confidential data [6.8] 複数のパーティに分散したデータが集中している場合、条件平均処理効果(CATE)を高精度に推定することができる。
機密性やプライバシー上の懸念から、このようなデータを集約することは困難である。
本稿では、分散ソースから構築されたプライバシー保護融合データを用いて、CATEモデルを推定するデータコラボレーションダブル機械学習を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:50:45 GMT)
Solar Photovoltaic Assessment with Large Language Model [6.7] 太陽パネル検出の課題を克服するために,大規模言語モデル (LLM) をどのように活用できるかを検討する。
LLMは、多段階の論理過程の困難を含む、ソーラーパネルの検出においていくつかの課題に直面している。
より効率的な出力標準化のためのタスク分解を組み込んだLLMフレームワークを用いたPVアセスメントを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:26:29 GMT)
Natural Language Processing for Tigrinya: Current State and Future Directions [6.7] ティグリニャは、自然言語処理 (NLP) 研究において、非常に過小評価されている。
この研究は、2011年から2025年までの10年以上にわたる40以上の研究を分析し、ティグリニャにおけるNLP研究の包括的調査を提示する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:58:42 GMT)
Integrating Physics and Topology in Neural Networks for Learning Rigid Body Dynamics [6.7] 剛体力学と学習衝突相互作用をモデル化するための新しい枠組みを提案する。
そこで本研究では,物理法則を直接モデルに組み込む物理インフォームドメッセージパッシングニューラルアーキテクチャを提案する。
この研究は、様々な科学的・工学的な領域にまたがる応用において、マルチエンタリティ・ダイナミックな相互作用の課題に対処する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:54:47 GMT)
MindSpeed RL: Distributed Dataflow for Scalable and Efficient RL Training on Ascend NPU Cluster [6.6] 強化学習(Reinforcement Learning, RL)は、大規模言語モデルの整合化にますます用いられるパラダイムである。
本稿では,大規模RL学習のための効果的かつ効率的なシステムであるMindSpeed RLを紹介する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:11:49 GMT)
ASR-Guided Speaker-Role Diarization and Diarization-Guided ASR Decoding [6.1] 話者ロールダイアリゼーション(RD)は従来の話者ダイアリゼーション(SD)よりも有用であることが多い
単語の予測と役割予測は、異なる量の予測者のコンテキストを必要とすることが示され、タスク固有の予測者が分離される。
本稿では,RD後部活動を利用してASR復号に影響を及ぼし,小語削除誤りを低減する手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:02:11 GMT)
Graph Structure Learning with Privacy Guarantees for Open Graph Data [6.0] 本稿では,Gaussian DP (GDP) を利用したオープングラフグラフに対する構造的ノイズ注入機構を用いた新しいプライバシ保護推定フレームワークを提案する。
推定精度を理論的に保証し、離散可変プライバシートレーニングに拡張する。
グラフ学習の実験結果は、堅牢なパフォーマンスを示し、プライバシー保護グラフ分析のための実行可能なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:51:12 GMT)
A Markov Categorical Framework for Language Modeling [6.0] 自己回帰型言語モデルは、シーケンス確率を分解し、負の対数類似度(NLL)の目標を最小化することによって訓練される。
本稿では、Markov Categories(MC)を使用して、AR生成プロセスとNLLの目的を分解する統一分析フレームワークを紹介する。
モデルの予測ヘッドの情報幾何学を解析することにより、NLLは学習した表現空間を類似性予測演算子の固有スペクトルに合わせるように暗黙的に強制することを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:14:03 GMT)
Framework of a multiscale data-driven DT of the musculoskeletal system [6.0] 筋骨格障害(英: Musculoskeletal disorders、MSD)は、世界中の障害の主要な原因である。
本稿では,マルチスケールバイオメカニカルデータと計算モデルを統合する新しいフレームワークであるMusculoskeletal Digital Twin (MS-DT)を紹介する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:34:11 GMT)
Diverse LLMs or Diverse Question Interpretations? That is the Ensembling Question [5.8] 大型言語モデル(LLM)を用いた二分問題に対する2つの多様性アプローチの比較を行った。
いずれの場合も、最終的な回答を決定するために、多数決をアンサンブルの合意として適用する。
Boolq、Strategyqa、pubmedqaの実験は、質問解釈の多様性が一貫してより良いアンサンブル精度をもたらすことを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:26:18 GMT)
SmartPNT-MSF: A Multi-Sensor Fusion Dataset for Positioning and Navigation Research [5.8] このデータセットは、グローバルナビゲーション衛星システム(GNSS)、慣性計測ユニット(IMU)、光学カメラ、LiDARなど、複数のセンサーからのデータを統合する。
データ収集と処理のための標準化されたフレームワークは、一貫性とスケーラビリティを確保し、大規模な分析を可能にする。
都市部、キャンパス、トンネル、郊外環境など、様々な現実のシナリオをカバーしている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:06:11 GMT)
Resolving Build Conflicts via Example-Based and Rule-Based Program Transformations [5.7] 開発者が異なるソフトウェアブランチから変更を統合すると、マージの衝突が発生することが多い。
新たなコンフリクトリゾルバであるBUCOR(Build Conflict Resolver)を紹介する。
BUCORは、例ベースの変換(BUCOR-E)とルールベースの変換(BUCOR-R)の2つの補完戦略を採用している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:02:18 GMT)
DASH: 4D Hash Encoding with Self-Supervised Decomposition for Real-Time Dynamic Scene Rendering [5.3] 4Dハッシュエンコーディングと自己教師型分解を利用したリアルタイム動的シーンレンダリングフレームワークであるDASHを提案する。
DASHは最先端のダイナミックレンダリング性能を実現し、1台の4090 GPU上で264 FPSのリアルタイム速度で視覚的品質を向上させる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:26:01 GMT)
Trustworthy AI: UK Air Traffic Control Revisited [5.3] 信頼に値するAIの要件に関する研究は、一般的に、人々が日々の作業プラクティスの一部として使用するツールに対する信頼の問題に対処する方法を見落としている。
本稿では,エアトラヒック制御作業における現在のツールの使用方法に関する人類学的研究から,いくつかの知見を提示する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:40:01 GMT)
Revisiting DETR for Small Object Detection via Noise-Resilient Query Optimization [5.2] 耐雑音特性ピラミッドネットワーク(NT-FPN)とPairwise-Similarity Region Proposal Network(PS-RPN)
NT-FPNは、空間情報と意味情報の整合性を維持することにより、FPNにおける特徴融合時のノイズを軽減する。
PS-RPNは、位置と形状の類似性を通じて、アンカーグラウンドの真理マッチングを強化することで、十分な数の高品質な正のクエリを生成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:22:39 GMT)
Reshaping MOFs text mining with a dynamic multi-agents framework of large language model [5.2] 合成知識の抽出,構造化,適用を目的とした大規模言語モデル(LLM)に基づくマルチエージェントシステムMOFh6を提案する。
MoFh6は合成データの解析において99%の精度を達成し、複雑な共参照の94.1%を解決している。
単一のフルテキスト文書を9.6秒で処理し、構造化された合成記述を36秒以内にローカライズする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:08:19 GMT)
Retrieval augmented generation based dynamic prompting for few-shot biomedical named entity recognition using large language models [4.8] 生物医学的名前付きエンティティ認識(NER)における大規模言語モデル(LLM)の性能課題について検討する。
提案手法では,入力テキストと類似性に基づいてアノテーション付きテキスト内学習例を選択し,推論中に各インスタンスに対してプロンプトを動的に更新する。
静的および動的プロンプトエンジニアリング技術を実装・最適化し、5つのバイオメディカルNERデータセットで評価した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:57:16 GMT)
JCAPT: A Joint Modeling Approach for CAPT [4.1] 本研究は、音韻的属性、SSMに基づくモデリング、CAPTにおけるプロンプトを組み合わせた最初のものである。
speechocean762ベンチマークで行った一連の実験は、我々のモデルが従来手法より一貫して優れていることを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:26:59 GMT)
Enhancing Speech Emotion Recognition Leveraging Aligning Timestamps of ASR Transcripts and Speaker Diarization [4.1] 本稿では,自動音声認識(ASR)と話者ダイアリゼーション(SD)出力のタイムスタンプに基づくアライメントが音声感情認識(SER)精度に与える影響について検討する。
本研究では,事前学習されたASRと話者ダイアリゼーションモデルを利用したアライメントパイプラインを導入し,タイムスタンプを体系的に同期させ,正確なラベル付き話者セグメントを生成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:05:20 GMT)
On the Limitations of Ray-Tracing for Learning-Based RF Tasks in Urban Environments [4.1] ローマ中央部の屋外細胞リンクにおけるSionna v ray-tracingの現実性について検討した。
我々は、経路深さ、拡散/特異/屈折フラグ、キャリア周波数、アンテナの特性など、主なシミュレーションパラメータを変化させる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:58:44 GMT)
Perfect Clustering in Very Sparse Diverse Multiplex Networks [4.1] 逆多重多重符号一般化ランダムドット製品グラフ(DIMPLE-SGRDPG)ネットワークモデル(Pensky (2024))について検討する。
すべての層は、同じグループの層が同じ周囲部分空間に埋め込まれるようにグループに分割することができる。
このモデルの主要なタスクは、ユニークな部分空間構造を持つレイヤのグループを復元することである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:43:42 GMT)
TreeReader: A Hierarchical Academic Paper Reader Powered by Language Models [4.1] TreeReaderは、新しい言語モデル拡張ペーパーリーダーである。
論文を、各セクションが簡潔な要約によって表現される対話的ツリー構造に分解する。
TreeReaderは、複雑な学術文献をナビゲートし、理解するための、より集中的で効率的な方法を提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:31:09 GMT)
Securing the Internet of Medical Things (IoMT): Real-World Attack Taxonomy and Practical Security Measures [4.0] IoMT(Internet of Medical Things)は、リアルタイム監視、リモート診断、AIによる意思決定を可能にすることで、医療を根本的に改善する可能性がある。
しかし、接続性、組み込みインテリジェンス、さまざまな新しいセンサーが組み込まれているため、医療機器は深刻なサイバーセキュリティの脅威にさらされる。
我々は、IoMTアーキテクチャの全層にわたる攻撃面、脆弱性、緩和戦略を提示し、IoMTをターゲットにした潜在的攻撃の分類を提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:24:45 GMT)
A Toolbox, Not a Hammer -- Multi-TAG: Scaling Math Reasoning with Multi-Tool Aggregation [4.0] 大規模言語モデルを外部ツールで拡張することは、高性能な数学的推論システムを開発する上で有望な方法である。
マルチツールアグリゲーションベースのフレームワークであるMulti-TAGを提案する。
我々は,MATH500,AIME,AMC,OlympiadBenchの4つのベンチマークでマルチTAGを評価した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:57:47 GMT)
Automated Code Review Using Large Language Models at Ericsson: An Experience Report [3.8] Ericssonのコードレビュープロセスを自動化するために、Large Language Modelsを使った経験について説明する。
次に、コードレビューツールと奨励的な結果を評価するための、経験豊富な開発者との予備実験について説明する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:50:48 GMT)
Fast Learning of Non-Cooperative Spacecraft 3D Models through Primitive Initialization [3.7] この研究は、モノクロ画像を用いた3DGSのための畳み込みニューラルネットワーク(CNN)ベースのプリミティブイニシャライザに寄与する。
CNNは、入力として単一の画像を取り込み、カメラに対してターゲットのポーズとともにプリミティブのアセンブリとして表される粗い3Dモデルを出力する。
この研究はこれらの変種の比較を行い、ノイズまたは暗黙のポーズ推定の下で下流3DGSトレーニングの有効性を評価する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:43:29 GMT)
When Noisy Labels Meet Class Imbalance on Graphs: A Graph Augmentation Method with LLM and Pseudo Label [3.7] 本稿では,雑音ラベル付きクラス不均衡グラフのロバストノード分類を体系的に検討する。
本稿では,Large Language Model(LLM)とPseudo-labeling(Pseudo-labeling)に基づくグラフ拡張フレームワークであるGraphALPを提案する。
実験結果から,GraphALPは,ノイズラベル付きクラス不均衡グラフの最先端手法よりも優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:04:58 GMT)
Lower Bounds on the Size of Markov Equivalence Classes [3.6] マルコフ同値クラスの期待値に対して指数関数的に大きな下界を3つの設定で証明する。
これらの仮定が緩和された場合、もはやそうではないことを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:48:30 GMT)
AGORA: Incentivizing Group Emergence Capability in LLMs via Group Distillation [3.5] 複雑な推論のための新しいスケーリング軸として構造化相互作用を提案する。
我々の自己進化フレームワークであるAGORAは、最先端のモノリシックシステムを超える推論性能を実現するための協調的なアンサンブルを可能にします。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:05:01 GMT)
Hypergames: Modeling Misaligned Perceptions and Nested Beliefs for Multi-agent Systems [3.5] 本稿では,ハイパーゲーム理論のエージェント互換応用を体系的に検討する。
サイバーセキュリティ、ロボティクス、社会シミュレーション、コミュニケーション、一般ゲーム理論モデリングから選ばれた44の研究を分析した。
本分析では, 階層型モデルやグラフベースのモデルが, 知覚的推論において有意な傾向を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:06:41 GMT)
Acoustically Precise Hesitation Tagging Is Essential for End-to-End Verbatim Transcription Systems [3.5] 低ランク適応(LoRA)を用いたSpeak & Improve 2025コーパス上のWhisperモデルを微調整する
チャレンジ後の実験では、微調整のWhisper Large V3 Turboと"Extra"のスキームが5.5% WERとなった。
このことは、明示的でリアルなフルポーズラベリングが、動詞L2音声の書き起こしにおけるASRの精度を大幅に向上させることを示している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:29:43 GMT)
A chart review process aided by natural language processing and multi-wave adaptive sampling to expedite validation of code-based algorithms for large database studies [3.5] 本稿では,人間レビュアーによる各チャートのレビューに要する時間を短縮するプロセスについて述べる。
本プロセスは,意図的自己修復のためのクレームに基づく結果アルゴリズムの性能を検証したケーススタディである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:11:22 GMT)
On exploration of an interior mirror descent flow for stochastic nonconvex constrained problem [3.4] ヘッセン障壁法とミラー降下法は連続流の離散近似として解釈できることを示す。
厳密な相補性条件が成立すれば、これらの急激な定常点を回避できるような2つの十分な条件を提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:02:24 GMT)
Pareto-NRPA: A Novel Monte-Carlo Search Algorithm for Multi-Objective Optimization [3.4] 離散探索空間上での多目的最適化問題に対するモンテカルロアルゴリズムを提案する。
このアルゴリズムは一連のポリシーを使って、ソリューション空間の異なる領域を同時に探索する。
我々の知る限り、この研究は多目的設定へのNRPAの最初の適応を構成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:46:25 GMT)
Early Mortality Prediction in ICU Patients with Hypertensive Kidney Disease Using Interpretable Machine Learning [3.4] 集中治療室(ICUs)の高血圧性腎疾患(HKD)患者は短期的死亡率が高い。
我々は,HKDのICU患者に対して,30日間の院内死亡を予測できる機械学習フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:48:23 GMT)
Deep Learning for Double Auction [3.4] 不完全な情報、インセンティブ整合性(IC)、個人合理性(IR)の制約により、最適なオークション機構を見つけることは極めて難しい。
本研究では,需要側と供給側の両方に不完全な情報が存在する二重オークションのための深層学習手法を開発する。
我々は、トランスフォーマーベースのアーキテクチャを利用して、市場参加者を様々な市場規模のシーケンスとしてモデル化することで、一般化性を実現する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:21:48 GMT)
Deep Unsupervised Domain Adaptation for Time Series Classification: a Benchmark [3.4] Unsupervised Domain Adaptation (UDA)は、ラベル付きソースデータを利用してラベルなしターゲットデータのモデルをトレーニングすることを目的としている。
本稿では,時系列分類のためのUDA手法の評価ベンチマークを提案する。
さまざまなドメインシフトと時間的ダイナミクスをカバーする7つの新しいベンチマークデータセットを提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:24:22 GMT)
Mixed-state phases from local reversibility [3.4] 本稿では,局部可逆チャネル回路に基づく混合状態位相等価性の定義法を提案する。
これらの回路は、強対称性と弱対称性の両方を含むすべての作用素の位相縮退と局所性を保っていることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:39:08 GMT)
A Comprehensive Evaluation of Semantic Relation Knowledge of Pretrained Language Models and Humans [3.3] ハイパーネミーを超えた5つの関係を包括的に評価する枠組みを導入する。
我々は最近セマンティック・リレーション・ナレッジの未処理の側面に5つのメトリクスを使用します。
その結果、人間と全ての意味関係のモデルの間に大きな知識ギャップがあることが判明した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:18:21 GMT)
KASPER: Kolmogorov Arnold Networks for Stock Prediction and Explainable Regimes [3.3] 我々はストック予測と説明可能なレジーム(KASPER)のためのコルモゴロフ・アルノルドネットワークを紹介する。
このフレームワークは、Gumbel-Softmaxベースのメカニズムを使用して隠れた市場状況を特定し、システマティックな予測を可能にする。
R2$スコア0.89、シャープ比12.02、平均2乗誤差0.0001で、既存の手法より優れている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:21:24 GMT)
Navigating the Risks of Using Large Language Models for Text Annotation in Social Science Research [3.3] 大規模言語モデル(LLM)は、計算社会科学に革命をもたらす可能性がある。
テキスト分類タスクにLLMを使用する際の約束とリスクを体系的に評価する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:30:52 GMT)
Uncovering Cross-Linguistic Disparities in LLMs using Sparse Autoencoders [3.3] Gemma-2-2Bの活性化パターンを26の残層と10の言語で解析した。
中級から低級のリソース言語は、初期層のアクティベーションが26.27パーセント減少し、深い層では19.89パーセントのギャップがある。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:22:50 GMT)
Enhancing Generalization of Spiking Neural Networks Through Temporal Regularization [3.2] スパイキングニューラルネットワーク(SNN)は、イベント駆動と低電力特性のために広く注目を集めている。
近年の研究では、ニューロモルフィックデータセットの規模が限られているため、直接訓練されたSNNが深刻なオーバーフィッティングの問題に悩まされていることが示されている。
時間依存正規化機構を導入することで、時間依存正規化訓練(TRT)手法を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:18:36 GMT)
CoCoEvo: Co-Evolution of Programs and Test Cases to Enhance Code Generation [3.1] CoCoEvoは、プログラムとテストケースを同時に進化させる新しいフレームワークである。
我々は、CoCoEvoが既存のメソッドを超越し、コードの自動生成とテストにおける最先端のパフォーマンスを実現していることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:26:07 GMT)
SynPAIN: A Synthetic Dataset of Pain and Non-Pain Facial Expressions [3.1] 既存の痛み検出データセットは、民族的/人種的多様性の制限、プライバシーの制約、高齢者の過小評価に悩まされている。
我々は,10,710個の表情画像を含む大規模合成データセットSynPAINを提案する。
商業的な生成AIツールを用いて、臨床的に有意な痛み表現を伴う人口動態バランスの取れた合成IDを作成しました。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:54:04 GMT)
BEV-LLM: Leveraging Multimodal BEV Maps for Scene Captioning in Autonomous Driving [3.1] 本稿では,自律走行シーンの3次元キャプションのための軽量モデルであるBEV-LLMを紹介する。
BEV-LLMは、小さな1Bパラメータベースモデルを使用しても、nuCaptionデータセット上での競合的なパフォーマンスを達成する。
さまざまな運転シナリオのシーンキャプションをよりよく評価する2つの新しいデータセットをリリースする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:22:56 GMT)
Enhanced photon-pair generation from a van der Waals metasurface [3.1] ファンデルワールス層状物質は量子光源における非線形材料候補として期待されている。
本稿では,VdW材料3R-MoS2からなる準曲面から自然パラメトリックダウンコンバージョン(SPDC)を初めて示す。
この研究は、量子光子対の生成においてファンデルワールス準曲面を利用するための新しいアプローチを確立し、先進的な量子応用への道を開く。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:45:33 GMT)
MLRU++: Multiscale Lightweight Residual UNETR++ with Attention for Efficient 3D Medical Image Segmentation [3.0] セグメント化精度と計算効率のバランスをとるために設計されたマルチスケール軽量Residual UNETR++アーキテクチャ。
4つの公開ベンチマークデータセットの実験は、MLRU++が最先端のパフォーマンスを達成することを示した。
MLRU++は, 3次元画像分割タスクに対して, 実用的で高性能なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:58:41 GMT)
Counterfactual Explanations in Medical Imaging: Exploring SPN-Guided Latent Space Manipulation [3.0] 医用画像解析において、深層学習モデルは顕著な性能を示した。
可変オートエンコーダ(VAE)のような深い生成モデルは、大きな生成能力を示す。
和積ネットワーク(SPN)のような確率モデルは、複雑な結合確率分布を効率的に表す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:19:32 GMT)
Adaptive XAI in High Stakes Environments: Modeling Swift Trust with Multimodal Feedback in Human AI Teams [3.0] 本稿では,ユーザのリアルタイム認知・感情状態に反応して非侵襲的に機能する適応型XAIの概念的枠組みを提案する。
中心となるのは、ワークロード、ストレス、感情を動的信頼推定にマッピングする、多目的でパーソナライズされた信頼推定モデルである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 01:39:55 GMT)
Enhancing Diabetic Retinopathy Classification Accuracy through Dual Attention Mechanism in Deep Learning [2.9] 本研究では,グローバルアテンションブロック(GAB)とカテゴリーアテンションブロック(CAB)をディープラーニングモデルに組み込む。
提案手法は,3つの事前学習ネットワークを用いた注意機構に基づくディープラーニングモデルに基づく。
提案手法はDR分類に関する最近報告された研究と同等の競争性能を実現する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:09:27 GMT)
Spinon Singlet: Microscopic Mechanism of $d$-Wave Pairing in a Partially-Filled Stripe [2.8] 反対のキラル性を持つ2つのスピノンが自然に一重項状態にペアリングする傾向を示し、これは自然に$d$-waveペアリングパターンを生じさせる。
我々の研究は、$d$-wave超伝導を媒介する秩序の役割に関する新たな洞察を提供し、フェルミ・ハバードモデルにおけるマルチストリップによるペアリング機構のさらなる探索の道を開く。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:24:37 GMT)
Detection of Adverse Drug Events in Dutch clinical free text documents using Transformer Models: benchmark study [2.7] オランダのフリーテキスト文書に有害薬物事象(ADE)検出のためのベンチマークを設定した。
我々は、Bi-LSTMモデルと4つのトランスフォーマーベースオランダ語および/または多言語エンコーダモデルを訓練した。
ADE RCモデルを内部でゴールドスタンダード(2ステップタスク)と予測エンティティを用いて評価した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:02:02 GMT)
Comparison of pipeline, sequence-to-sequence, and GPT models for end-to-end relation extraction: experiments with the rare disease use-case [2.6] エンド・ツー・エンド関係抽出(E2ERE)は、バイオメディシンにおける自然言語処理(NLP)の重要かつ現実的な応用である。
稀な疾患に焦点を絞った複雑なデータセットを用いて,E2EREの一般的なパラダイムを3つ比較した。
パイプラインモデルが依然として最善であるのに対して、シーケンス・ツー・シーケンスモデルはそれほど遅れていないことが分かっています。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:37:28 GMT)
Can Small-Scale Data Poisoning Exacerbate Dialect-Linked Biases in Large Language Models? [2.5] 本研究は、方言の変化、特にアフリカ系アメリカ人英語(AAVE)と標準アメリカ英語(SAE)について検討する。
毒性データへの最小限の曝露でもAAVE入力の毒性は著しく上昇するが、SAEには影響を受けない。
これらの相違を更に評価するため,我々はGPT-4oをフェアネス監査機として使用し,有害なステレオタイプパターンをAAVE入力と不一致に同定した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:05:47 GMT)
Accelerometry-based Energy Expenditure Estimation During Activities of Daily Living: A Comparison Among Different Accelerometer Compositions [2.5] 呼吸呼吸データから身体活動エネルギー支出(PAEE)を測定することができる。
または、PAEEは体の動きから予測でき、加速度計で測定して推定することができる。
COMベースの設定と手首ベースの設定の性能を評価し,比較した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:23:24 GMT)
Seeing Beyond Frames: Zero-Shot Pedestrian Intention Prediction with Raw Temporal Video and Multimodal Cues [2.5] 本稿では,Gemini 2.5 ProをベースとしたゼロショットアプローチであるBF-PIP(Beyond Pedestrian Intention Prediction)を紹介する。
構造化されたJAADメタデータに富んだ連続的なビデオクリップから直接、横断意図を推測する。
追加のトレーニングがなければ、BF-PIPは73%の予測精度を達成し、GPT-4Vベースラインを18%上回った。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:23:11 GMT)
Trade-off between diagonal and off-diagonal elements in the eigenstate thermalization hypothesis [2.5] 本稿では,再スケールされた局所演算子の分散に基づく可観測的独立性尺度を提案する。
対角線外項数の指数的な増加は、間接的に対角線偏差を制限し、その抑制を強制することを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:06:08 GMT)
Feature learning is decoupled from generalization in high capacity neural networks [2.3] 私たちは、このパフォーマンス改善を測定するために、機能品質と呼ぶ概念を紹介します。
特徴学習の現在の理論は、ニューラルネットワークの一般化の理論の発展に十分な基礎を与えていない。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:19:37 GMT)
Neural Tangent Kernels and Fisher Information Matrices for Simple ReLU Networks with Random Hidden Weights [2.3] ランダムな隠蔽重みを持つ2層ReLUネットワークのための釣り情報行列とニューラルネットワークカーネル(NTK)について論じる。
NTKのスペクトル分解は, 固有値を持つ固有関数の具体的な形式で可能であることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:19:13 GMT)
NAICS-Aware Graph Neural Networks for Large-Scale POI Co-visitation Prediction: A Multi-Modal Dataset and Methodology [2.3] 我々は,人口規模のコビジュアライゼーションパターンを予測する新しいグラフニューラルネットワークである,NAICS対応グラフSAGEを紹介した。
私たちの重要な洞察は、ビジネスセマンティクスは、詳細な業界コードを通して捉えられ、純粋な空間モデルでは説明できない重要なシグナルを提供するということです。
このアプローチは、効率的な状態分解を通じて大規模なデータセット(42億の潜在的な場所ペア)にスケールする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:31:45 GMT)
Quantum chaos in PT symmetric quantum systems [2.3] 非エルミート力学系における$mathcalPT$-symmetricと量子カオスの相互作用について検討する。
複素レベル間隔比は3つの位相の全てを区別できることがわかった。
$mathcalPT$-対称性の相では、OTOCはエルミート系で観測されるものに似た振る舞いを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:05:41 GMT)
MedSymmFlow: Bridging Generative Modeling and Classification in Medical Imaging through Symmetrical Flow Matching [2.2] この研究は、Symmetrical Flow Matching上に構築された生成-識別ハイブリッドモデルであるMedSymmFlowを提示する。
MedSymmFlowは4つのMedMNISTデータセットで評価され、さまざまなモダリティと病理をカバーしている。
その結果, MedSymmFlowは, 分類精度およびAUCにおいて, 確立されたベースラインの性能に適合するか, 上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:30:40 GMT)
Video Self-Distillation for Single-Image Encoders: A Step Toward Physically Plausible Perception [2.2] 現在のフレームから次のフレーム表現を予測するために訓練されたビデオ蒸留シングルイメージエンコーダを導入する。
本研究は,映像の自己蒸留を幾何学的認識への軽量な経路として強調した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:52:31 GMT)
Color code with a logical control-$S$ gate using transversal $T$ rotations [2.2] カラーコードの3次元的な例は、その構造、特に論理作用素の支持の交叉が、非クリフォード$T$と$CCZ$を生じさせることを示す。
ここでは、論理制御付きカラーコードを示す-$S$ゲートは、物理量子ビット上で$Tdagger$回転によって達成される。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:38:22 GMT)
Survey on Hand Gesture Recognition from Visual Input [2.2] ハンドジェスチャ認識は人間とコンピュータの相互作用の需要が増大する中で重要な研究領域となっている。
最近の研究、利用可能なソリューション、ベンチマークデータセットを包括的にカバーする調査はほとんどない。
本研究は,様々なカメラ入力データから手の動きと3次元手ポーズ認識の最新の進歩を調べることで,このギャップに対処する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:26:11 GMT)
AI Guided Accelerator For Search Experience [2.1] 本稿では,ユーザの最終購入意図に向けての旅の間に生じる中間的変更を,トランジショナルなクエリを明示的にモデル化する新しいフレームワークを提案する。
このアプローチは,探索行動や意図の洗練を反映した中途半端なトランジションをユーザのショッピングファンネルをモデル化する。
我々の貢献には、(i)トランザクショナルクエリの形式的識別とモデリング、(ii)インテントフロー理解のための構造化クエリシーケンスマイニングパイプラインの導入、(iii)スケーラブルでインテント対応のクエリ拡張のためのLLMの適用が含まれる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 23:26:00 GMT)
Reinforcement Learning via Conservative Agent for Environments with Random Delays [2.1] 本稿では,ランダム遅延下での意思決定のための単純かつ堅牢なエージェントを保守的エージェントと呼び,ランダム遅延環境を定遅延等価に再構成する。
これにより、アルゴリズム構造を変更したり性能を犠牲にすることなく、最先端の定数遅延法を直接ランダム遅延環境に拡張することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:41:06 GMT)
REPRO-Bench: Can Agentic AI Systems Assess the Reproducibility of Social Science Research? [2.1] 研究論文を再現するための既存のベンチマークは、提供されたコードとデータを使用した結果の再現のみに焦点を当てている。
本稿では112のタスクインスタンスからなるREPRO-Benchについて紹介する。
我々はREPRO-Bench上での3つの代表的AIエージェントの評価を行い、最も優れたエージェントは21.4%の精度である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:48:30 GMT)
Code-Switching and Syntax: A Large-Scale Experiment [2.1] 構文だけでは、最小ペアのコードスイッチング人間の文を区別する自動システムには十分であることを示す。
学習した構文パターンは、目に見えない言語ペアによく一般化する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:36:19 GMT)
GVCCS: A Dataset for Contrail Identification and Tracking on Visible Whole Sky Camera Sequences [2.1] 地上カメラで記録したコントラルのオープンデータセットを可視域内に提示する。
各コントラルは個別にラベル付けされ、時間とともに追跡され、そのライフサイクルを詳細に分析することができる。
また,汎視的セグメンテーションモデルを用いた反則解析のための統合ディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:32:47 GMT)
Efficient Learning for Product Attributes with Compact Multimodal Models [2.1] 電子商取引における画像ベースの製品予測は多くのアプリケーションにおいて重要な課題である。
本稿では,ラベル付き製品リストを利用するラベル効率の高い半教師付き微調整戦略について検討する。
実験により、DPOトレーニングによる精度はラベルのないデータにより向上し、ラベルのないサンプルの大きなプールを効果的に活用してパフォーマンスを向上させることが示されている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:12:11 GMT)
Towards Sustainability Model Cards [2.0] 本稿では,MLモデルの持続可能性の側面を定義するために,新しいドメイン特化言語を提案する。
この情報は、よく知られたModel Cardsイニシアチブの拡張版としてエクスポートすることができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:26:53 GMT)
Efficient and Scalable Agentic AI with Heterogeneous Systems [1.9] AIエージェントは、幅広いアプリケーションにおいて支配的なワークロードとして現れており、企業や消費者にAIの約束されたメリットを提供するための手段として期待されている。
AIエージェントの使用をスケールするには、効率的でスケーラブルなデプロイメントとエージェントサービスインフラストラクチャが必要です。
異種計算インフラストラクチャ上でAIエージェントのワークロードを動的にオーケストレーションするシステム設計を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:02:42 GMT)
Reconstruction of Sparse Urban Wireless Signals via Group Equivariant Non-Expansive Operators [1.9] 本研究は,群同変非拡張演算子(GENEOs)を用いたスパース計測による空間信号の再構成について検討する。
GENEOsは、データに作用する関数演算子としてモデル化されたエージェントを表現するために機械学習で使用される数学的ツールである。
超スパースサンプリングを用いた都市無線通信網における SINR マップ再構成のための新しい GENEO ベースのアプローチを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:59:44 GMT)
MixA-Q: Revisiting Activation Sparsity for Vision Transformers from a Mixed-Precision Quantization Perspective [1.8] MixA-Qは、混合精度アクティベーション量子化フレームワークである。
本稿では,2分岐スウィンブロックを導入し,高いビット精度と低ビット精度のアクティベーションを別々に処理する。
PTQ構成の精度を損なうことなく、MixA-Qがトレーニング不要な1.35倍の高速化を実現することを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:13:14 GMT)
Exploring molecular assembly as a biosignature using mass spectrometry and machine learning [1.8] 理想的なバイオシグナチャは解釈可能で実験的に測定可能でなければならない。
分子組立は、進化によって生み出された物体を測定するために最近開発された手法であり、両方の基準を満たすことを示す。
我々は,分子組立を高精度に予測し,ベースラインモデルと比較して誤差を3倍に削減する機械学習モデルを開発した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:19:15 GMT)
Archiverse: an Approach for Immersive Cultural Heritage [1.8] デジタル技術とツールは、文化遺産の研究方法を変えました。
混合現実感のソリューションは、研究者が新しい視点から、より正確に文化的対象やアーティファクトを調べることを可能にする。
バーチャルリアリティ(VR)とeXtended Reality(XR)は、歴史的遺産の遺構を再現し視覚化するためのツールとして機能する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:26:18 GMT)
On the Discretization Error of the Discrete Generalized Quantum Master Equation [1.8] 転写テンソル法(TTM)は中島-ズワンジグ量子マスター方程式(NZ-QME)の離散時間定式化とみなすことができる
最近の論文は、TTMの離散化の整合性に関する懸念を提起している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:34:53 GMT)
Phoneme-Level Visual Speech Recognition via Point-Visual Fusion and Language Model Reconstruction [1.8] 視覚自動音声認識(V-ASR)は、唇の動きや表情などの視覚情報のみから音声言語を解釈する課題である。
既存の手法は、しばしば視覚的手がかりから直接単語を予測することを目的としているが、視覚的曖昧さによる高いエラー率に悩まされることが多い。
本稿では,視覚的特徴とランドマーク的特徴を融合した新しい音素ベースの2段階フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:38:39 GMT)
RoD-TAL: A Benchmark for Answering Questions in Romanian Driving License Exams [1.8] 我々は,ルーマニアの運転法則の理解と推論において,Large Language Models (LLMs) とVision-Language Models (VLMs) の能力を評価することを目的とする。
これを容易にするために,ルーマニアの運転試験質問,テキストベース,画像ベースからなる新しいマルチモーダルデータセットであるRoD-TALを紹介した。
我々は、情報検索(IR)、質問回答(QA)、ビジュアルIR、ビジュアルQAを含むタスクにまたがって、検索拡張生成(RAG)パイプライン、高密度検索、推論最適化モデルを実装し、評価する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:40:39 GMT)
Geometric Origins of Bias in Deep Neural Networks: A Human Visual System Perspective [1.7] ディープニューラルネットワーク(DNN)におけるバイアス形成は、依然として批判的だが理解されていない課題である。
人間の視覚システムに触発されて,クラス固有の知覚マニフォールドの幾何学的複雑さをモデルバイアスに結びつける幾何学的分析フレームワークを提案する。
この解析を支援するために,知覚多様体の幾何学的性質を計算するために設計された知覚多様体幾何学ライブラリを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:47:04 GMT)
The Yang-Baxter integrability of the critical Ising chain [1.7] 一次元臨界逆場イジングモデルがヤン・バクスター積分可能であることを示す。
また、周期的横フィールドイジングモデルに対するクラマース・ワニエ双対性や他の非可逆対称性も見出す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:02:17 GMT)
Pre- and Post-Treatment Glioma Segmentation with the Medical Imaging Segmentation Toolkit [1.6] 本稿では,MIST(Messical Imaging Toolkit)の現状について述べる。
MISTの後処理モジュールは幅広い変換をサポートするために大幅に拡張されている。
単純な小オブジェクト除去からより複雑でクラス固有のパイプラインまで,3つの戦略を評価し,BraTSランキングプロトコルを用いてそのパフォーマンスをランク付けする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:54:24 GMT)
GENIAL: Generative Design Space Exploration via Network Inversion for Low Power Algorithmic Logic Units [1.6] 本稿では,算術単位の自動生成と最適化のための機械学習ベースのフレームワークであるGENIALを紹介する。
我々は、ジェネリックは他の方法よりも一貫してサンプリング効率が高く、最適化された設計に向けてより高速に収束することを示した。
また、有限状態マシンの大幅な改善によって、我々のアプローチの汎用性を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:34:59 GMT)
SigBERT: Combining Narrative Medical Reports and Rough Path Signature Theory for Survival Risk Estimation in Oncology [1.5] SigBERTは、患者1人当たりの多数の臨床報告を処理するために設計された、革新的な時間的生存分析フレームワークである。
文章埋め込みに単語埋め込みを抽出し平均化することにより、タイムスタンプ化された医療報告を処理する。
これは、L'eon B'erard Center corpusの実際の腫瘍学データセットで訓練され、独立したテストコホート上でのC-インデックススコア0.75(sd 0.014)で評価された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:33:25 GMT)
How Important is Domain Specificity in Language Models and Instruction Finetuning for Biomedical Relation Extraction? [1.5] 一般ドメインモデルは典型的にはバイオメディカルドメインモデルよりも優れていた。
バイオメディカル・インストラクション・ファインタニングは、パフォーマンスを一般的なインストラクション・ファインタニングと同等に改善した。
本研究は,一般のLMの大規模バイオメディカル・インスツルメンテーションに焦点を合わせることで,より有益である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:32:04 GMT)
Almost fault--tolerant quantum machine learning with drastic overhead reduction [1.5] 本研究では、量子機械学習(QML)モデルに対する部分量子誤差補正(QEC)の概念を提案する。
誤差補正された2量子CNOT(クリフォード演算)を仮定することにより、単一量子ゲートが非偏極ノイズを受ける場合でも、QMLモデルはトレーニング可能であることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:43:37 GMT)
Quantum cellular automata for quantum error correction and density classification [1.5] 量子セルオートマトンは量子チューリングマシンや量子回路に代わる量子計算パラダイムである。
本稿では,密度分類機能を持つ古典的セル・オートマタ規則に基づく2つの(準)1次元量子セルオートマトンを提案する。
これらの量子セルオートマトンを量子メモリコンポーネントとして動作させる場合、論理ビットフリップによって引き起こされる論理情報に必要な更新ステップ数をシミュレートすることにより、その性能について検討する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:58:20 GMT)
Neural Ordinary Differential Equations for Learning and Extrapolating System Dynamics Across Bifurcations [1.4] システムダイナミクスを学習するための継続的データ駆動型フレームワークを開発した。
ニューラルネットワークの時間的差分方程式は,時系列データから直接,基礎となる分岐構造を復元できることを示す。
また,制約付きノイズの多いデータ条件下での手法の性能評価を行った。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:44:34 GMT)
On the Security of a Code-Based PIR Scheme [1.4] CB-cPIRは、符号化理論の難しい問題にPIRスキームを基づかせる先駆的な試みである。
我々の研究はCB-cPIRの重大な脆弱性を明らかにし、セキュリティレベルを著しく低下させます。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:12:00 GMT)
A diffusion-based generative model for financial time series via geometric Brownian motion [1.4] 本稿では,金融時系列の拡散に基づく新たな生成フレームワークを提案する。
本手法は,金融時系列のヘテロスケダスティティーを反映して,各段階の資産価格に比例してノイズを注入する。
ドリフトと拡散の項を正確にバランスさせることにより、結果として得られる対数-価格過程が分散拡散微分方程式に還元されることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:02:09 GMT)
PLEIADES: Building Temporal Kernels with Orthogonal Polynomials [1.2] 本稿では,基本関数から発生する時間的カーネルを含むPLEIA(Lynomial Expansion In Adaptive Distributed Event Systems)というニューラルネットワークのクラスを紹介する。
低レイテンシでオンライン分類と検出を行うために、これらのネットワークをイベントベースのデータで相互接続することに重点を置いている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:20:03 GMT)
Dual Path Learning -- learning from noise and context for medical image denoising [1.1] 本研究では,医用イメージを効果的に認知するデュアルパスウェイ学習(DPL)モデルアーキテクチャを提案する。
DPLは複数の画像モダリティと様々な種類のノイズにまたがって評価され、その堅牢性と一般化性を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:43:50 GMT)
Towards Domain Specification of Embedding Models in Medicine [1.1] MTEB(Massive Text Embedding Benchmark)に基づく分類,クラスタリング,ペア分類,検索を対象とする51タスクの総合ベンチマークスイートを提案する。
以上の結果から,本手法はロバストな評価枠組みを確立し,各タスクにおける工芸品の代替品の状態を常に上回り,組込み性能が向上することを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:15:00 GMT)
A Lightweight Deep Learning-based Model for Ranking Influential Nodes in Complex Networks [1.0] 1D-CGSは、1次元畳み込みニューラルネットワーク(1D-CNN)の速度とGraphSAGEのトポロジ的表現能力を統合し、効率的なノードランク付けを実現する軽量で効果的なハイブリッドモデルである。
1D-CGSは、非常に高速な実行環境で動作しながら、従来の集中度尺度や近年のディープラーニングモデルよりも格付け精度が優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:45:56 GMT)
PrompTrend: Continuous Community-Driven Vulnerability Discovery and Assessment for Large Language Models [1.0] プラットフォーム間で脆弱性データを収集し,多次元スコアリングを用いて評価するシステムであるPrompTrendを提案する。
本研究は,現在の言語モデルにおいて,機能向上によってセキュリティが向上し,コミュニティ主導の心理的操作が主要な脅威となるという仮定に挑戦する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:52:46 GMT)
PBiLoss: Popularity-Aware Regularization to Improve Fairness in Graph-Based Recommender Systems [1.0] PBiLossは、グラフベースのレコメンデータモデルにおいて、人気バイアスを明示的に防止するために設計された正規化に基づく損失関数である。
PBiLoss は,PRU (Popularity-Rank correlation for Users) とPRI (Popularity-Rank correlation for Items) の削減によって,公正性を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:29:32 GMT)
SESR-Eval: Dataset for Evaluating LLMs in the Title-Abstract Screening of Systematic Reviews [0.9] 我々は,大言語モデル (LLM) の性能を評価するためのベンチマークデータセットを,体系的レビュー (SR) のタイトル別スクリーニングプロセスで作成する。
ソフトウェア工学(SE)ジャーナルに掲載された24の二次研究から,34,528のラベル付き一次研究を含むSESR-Evalデータセットを提案する。
我々のベンチマークは、ソフトウェア工学におけるSRのスクリーニングタスクにおけるAIパフォーマンスのモニタリングを可能にする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:27:03 GMT)
Generating Adversarial Point Clouds Using Diffusion Model [0.9] 3Dポイントクラウド分類のための逆攻撃手法は、ポイントクラウド認識モデルの脆弱性を明らかにする。
現実のシナリオではより意味のあるブラックボックス攻撃は、しばしば悪い結果をもたらす。
本稿では,新しいブラックボックス対逆例生成法を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:20:41 GMT)
Let It Go? Not Quite: Addressing Item Cold Start in Sequential Recommendations with Content-Based Initialization [0.8] 凍結埋め込みに小さな訓練可能なデルタを導入し、モデルが元のセマンティック構造から遠ざかることなく、アイテム表現を適応できるようにする。
このアプローチは、複数のデータセットとモダリティにわたって一貫した改善を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:57:31 GMT)
Quantum Advantage in Storage and Retrieval of Isometry Channels [0.8] 我々は、等尺チャネルの保存と検索のための古典的および量子的戦略の性能を分析する。
本稿では、ポートベースのテレポーテーションに基づくより効率的な量子戦略を提案し、アイソメトリチャネルをプログラム状態に格納する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:11:17 GMT)
Relaxed Total Generalized Variation Regularized Piecewise Smooth Mumford-Shah Model for Triangulated Surface Segmentation [0.8] 緩和された全一般化変分正規化(rTGV)を利用して,一括スムーズなMSメッシュセグメンテーションモデルを提案する。
新しいモデルは、メッシュの特徴関数は、断片的定数関数とアスモス関数の和で近似できると仮定する。
新たに導入された手法は、不規則な構造を持つメッシュを分割し、最短境界よりも優れた境界を得るのに有効である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:00:32 GMT)
Integrating LLM in Agent-Based Social Simulation: Opportunities and Challenges [0.8] 本稿では,人間の認知の重要な側面を再現する大規模言語モデルの能力に関する最近の知見をレビューする。
第2部はマルチエージェント・シミュレーション・フレームワークにおけるLLMの新しい応用について調査している。
この論文は、従来のエージェントベースモデリングプラットフォームにLLMを統合するハイブリッドアプローチを提唱することで締めくくっている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:15:35 GMT)
Patch Pruning Strategy Based on Robust Statistical Measures of Attention Weight Diversity in Vision Transformers [0.8] 本稿では,複数の注目頭間での注目重みのばらつきに基づいて,各パッチの重要性を評価するパッチプルーニング戦略を提案する。
このアプローチは、特徴表現の異なる部分空間にまたがる多様な注意パターンを捉えることを目的としたマルチヘッド自己注意の設計に着想を得たものである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:31:17 GMT)
Handcrafted vs. Deep Radiomics vs. Fusion vs. Deep Learning: A Comprehensive Review of Machine Learning -Based Cancer Outcome Prediction in PET and SPECT Imaging [0.8] この体系的なレビューは、2020年から2025年にかけて発行された226の研究を分析し、結果予測のためにPETまたはSPECTイメージングに機械学習を適用した。
PETベースの研究は、一般的にSPECTを用いた場合よりも優れており、おそらくは空間分解能と感度が高いためである。
一般的な制限としては、階級不均衡の不十分な扱い、データ不足、人口の多様性の低さがあった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:51:42 GMT)
Hidden shift problem for complex functions [0.7] 有限アーベル群上の複素スカラーおよびベクトル値関数の隠れシフト問題に対する量子アルゴリズムについて検討する。
一定数のクエリを用いてアルゴリズムの成功確率を解析する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:16:31 GMT)
DeepJIVE: Learning Joint and Individual Variation Explained from Multimodal Data Using Deep Learning [0.7] 私たちはDeepJIVEを紹介します。DeepJIVEは、JIVE(Joint and individual Variance Explained)を実践するためのディープラーニングアプローチです。
合成および実世界の1D, 2D, 3Dデータセットを用いて, 数学的導出と実験的検証を行う。
DeepJIVEをアルツハイマー病神経イメージングイニシアチブ(ADNI)に応用し,アミロイドポジトロン断層法(PET)とMR画像との生物学的に妥当な共変パターンを同定した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:23:31 GMT)
Verifying International Agreements on AI: Six Layers of Verification for Rules on Large-Scale AI Development and Deployment [0.7] このレポートは、政策の専門家と技術研究者の両方を対象とした、AI検証の詳細な概要を提供する。
本稿では、新しい概念フレームワーク、詳細な実装オプション、そして重要なR&D課題について述べる。
州は最終的に6つのほぼ独立した検証手法を用いてコンプライアンスを検証できることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:45:17 GMT)
Photon catalysis for general multimode multi-photon quantum state preparation [0.7] 多モード多光子状態は多くのフォトニック量子技術の中心にある。
我々は、マルチポート干渉計のみを用いて、正確にかつ制御された数ステップで、そのような状態を発生させる手順を導出する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:03:35 GMT)
3LM: Bridging Arabic, STEM, and Code through Benchmarking [0.7] 3LMはアラビア語用に特別に設計された3つのベンチマークのスイートである。
1つ目は、アラビア語の教科書と教育用ワークシートから自然に派生した、STEM関連の質問応答ペアのセットである。
2つ目は、同じソースを用いて合成されたSTEM質問である。
第3のベンチマークは、2つの広く使用されているコードベンチマークを注意深く翻訳することで構築されたコード生成に焦点を当てている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:36:12 GMT)
ViCTr: Vital Consistency Transfer for Pathology Aware Image Synthesis [0.7] 既存の方法は、病理学的特徴を正確にモデル化しながら、解剖学的忠実さを維持するのに苦労する。
ViCTrは、修正フロー軌跡とTweedie補正拡散プロセスを組み合わせて、高忠実で病理学的な画像合成を実現する新しい2段階のフレームワークである。
我々の知る限り、ViCTrは、厳密度制御による細粒度で病理に配慮したMRI合成を提供するための最初の方法である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:27:25 GMT)
A resource- and computationally-efficient protocol for multipartite entanglement distribution in Bell-pair networks [0.7] Greenberger--Horne-Zeilinger (GHZ) や他のグラフ状態は、マルチパーティ量子ネットワークプロトコルや測定ベースの量子コンピューティングにおいて重要なリソースである。
両端交絡(ベル)対のネットワークからそのような状態を生成する問題を考える。
本稿では, 任意のベルペアネットワーク上でGHZ状態を生成するプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:50:04 GMT)
Forest-Guided Clustering -- Shedding Light into the Random Forest Black Box [0.7] 本研究では、ランダムフォレストにおける局所構造とグローバル構造の両方を、共有決定経路に従ってグループ化するモデル固有の説明可能性手法であるフォレストガイドクラスタリング(FGC)を提案する。
FGCは、モデルの内部ロジックに整合した人間解釈可能なクラスタを生成し、クラスタ固有の、グローバルな特徴重要度スコアを計算して、RF予測に基づく決定ルールを導出する。
AML転写データセットに適用されたFGCは、生物学的にコヒーレントなサブポピュレーションを発見し、共同設立者による疾患関連シグナルを切断し、既知の新しい遺伝子発現パターンを復元した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:41:39 GMT)
Negative news posts are less prevalent and generate lower user engagement than non-negative news posts across six countries [0.7] 2020年1月1日から2024年4月1日までの6,081,134件のFacebook投稿を、6カ国97のメディア組織が使用している。
政治ニュース記事は、政治的でないニュース記事ほど否定的でもない。
負のニュース投稿は、非負のニュース投稿よりも15%、コメントが13%少ない。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:14:19 GMT)
A Graph-based Approach for Multi-Modal Question Answering from Flowcharts in Telecom Documents [0.6] 技術的文書からの質問回答は、フローチャートやフロー図のような数字に答えが存在する質問を含むことが多い。
我々は,VLM(Visual Large Language Models)から得られたフローチャートのグラフ表現を活用し,それをテキストベースRAGシステムに組み込んで,通信領域におけるQAの画像検索を可能にすることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:36:13 GMT)
MultiSocial: Multilingual Benchmark of Machine-Generated Text Detection of Social-Media Texts [0.6] MultiSocial データセットには 472,097 のテキストが含まれており、そのうち約58k が人文で書かれている。
このベンチマークを用いて、ゼロショットの既存の検出手法と微調整形式を比較した。
以上の結果から,微調整された検出器はソーシャルメディア上でのトレーニングに問題はないことが示唆された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:08:21 GMT)
MOCK: an Algorithm for Learning Nonparametric Differential Equations via Multivariate Occupation Kernel Functions [0.6] d$次元状態空間の軌跡から得られる通常の微分方程式の非パラメトリック系は、$d$変数の$d$関数を学ぶ必要がある。
明示的な定式化はしばしば、スパーシティや対称性といったシステム特性に関する追加の知識が得られない限り、$d$で2次的にスケールする。
本稿では,ベクトル値を持つカーネルヒルベルト空間から得られる暗黙の定式化を用いて,線形アプローチ,多変量占有カーネル法(MOCK)を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:16:06 GMT)
Salsa as a Nonverbal Embodied Language -- The CoMPAS3D Dataset and Benchmarks [0.6] 即興サルサダンスにおける最大かつ最も多様なモーションキャプチャーデータセットであるCoMPAS3Dを提案する。
データセットには、初心者、中間、プロのスキルレベルにまたがる18人のダンサーによる3時間のリーダーフォロワーサルサダンスが含まれている。
我々は,音声言語と対話処理における重要な問題を並列処理する合成人間の2つのベンチマークタスクについて,CoMPAS3Dを評価する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:33:48 GMT)
RADLADS: Rapid Attention Distillation to Linear Attention Decoders at Scale [0.6] RADLADSは、ソフトマックスアテンション変換器を線形アテンションデコーダモデルに迅速に変換するためのプロトコルである。
我々の変換プロセスでは350~700万のトークンしか必要とせず、オリジナルの教師モデルを訓練するのに使われるトークンの0.005%以下である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:46:09 GMT)
Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity [0.6] 広く採用されているにもかかわらず、ソフトウェア開発におけるAIツールの影響はいまだ検討されていない。
2025年2月から6月までのフロンティアにおけるAIツールが、経験豊富なオープンソース開発者の生産性にどのように影響するかを理解するために、ランダム化制御トライアル(RCT)を実施しています。
適度なAI経験を持つ16人の開発者が、平均5年間の経験を持つ成熟したプロジェクトで246のタスクを完了した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:43:07 GMT)
Modeling Uncertainty: Constraint-Based Belief States in Imperfect-Information Games [0.6] 不完全な情報ゲームでは、エージェントはゲームの状態の部分的知識に基づいて決定をしなければならない。
Belief Gameモデルは、状態推定をゲームモデル自体に委譲することで、この問題に対処する。
本稿では,隠れたピースアイデンティティを持つゲームにおける信念を表現するための2つのアプローチについて検討する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:38:44 GMT)
Benchmarking of Deep Learning Methods for Generic MRI Multi-Organ Abdominal Segmentation [0.5] 本稿では3つの最先端およびオープンソースMRI腹部分割ツールのベンチマークを行う。
これらのツールは、MSSegmentator、MRISegmentator-Abdomen、TotalSegmentator MRIである。
また、SynthSegベースのモデルであるABD Synthを、広く利用可能なCTセグメンテーションに基づいて純粋に訓練した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:03:46 GMT)
Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation [0.5] 大規模言語モデル(LLM)は、事前に定義された物語に従って偽ニュース記事を生成するために効果的に誤用することができる。
本研究は,近年のオープンかつクローズドなLCMの脆弱性と,パーソナライズされた偽情報ニュースを英語で生成する意思を評価することで,このギャップを埋めるものである。
以上の結果から,LLMの大部分が適切に機能していないため,より強力な安全性フィルタやディファイラの必要性が示唆された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:20:38 GMT)
$S^2M^2$: Scalable Stereo Matching Model for Reliable Depth Estimation [0.5] 一般化可能なステレオマッチングモデルは、データセット固有の微調整なしで、様々な解像度と異なる範囲で実行できる。
反復的局所探索法は制約付きベンチマークで高いスコアを得るが、そのコアメカニズムは真の一般化に必要な大域的な一貫性を制限する。
我々は,コスト・ボリューム・フィルタリングやディープ・リファインメント・スタックに頼ることなく,最先端の精度と高効率を実現するグローバル・マッチング・アーキテクチャを開発した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:42:59 GMT)
Universal cooling of quantum systems via randomized measurements [0.5] システムメータ間相互作用がランダムに選択された場合,量子系はシステムの詳細を知らずに冷却可能であることを示す。
我々は、汎用的、構造に依存しないプロトコルを通じて、複雑な量子システムの堅牢でスケーラブルな冷却の基本的なメカニズムとして同定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:36:21 GMT)
Higher-order exceptional points in composite non-Hermitian systems [0.5] 複数の系のテンソル積によって記述された複合量子系は、それぞれ1つの先行する例外点を示す。
このような高次の例外点の形成は、サブシステム間のカップリングを必要としない。
本研究では, 複合系の高次例外点の存在により, 時間進化の過程で一般初期状態が乱れてしまうことを実証する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:03:32 GMT)
Can LLMs Predict Citation Intent? An Experimental Analysis of In-context Learning and Fine-tuning on Open LLMs [0.5] 本研究では,Large Language Models (LLMs) を用いて,文脈内学習と微調整による引用意図の予測を行う。
0, 1-, few-, many-shot プロンプトを用いて, 5つの著名なオープン LLM ファミリーの12種類のモデル変動を評価した。
次に、このモデルを微調整し、SciCiteデータセットで8%、ACL-ARCデータセットで4.3%の相対的なF1スコア改善を実現し、タスク固有適応の意義を実証する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:46:55 GMT)
Addressing the Minor-Embedding Problem in Quantum Annealing and Evaluating State-of-the-Art Algorithm Performance [0.4] D-Wave Systems 量子アニールの性能に及ぼす埋め込み品質の影響を解析する。
実験により、埋め込みの平均鎖長とサンプリングされた溶液の相対誤差との明確な相関が明らかとなった。
我々は,Minorminerの埋め込み能力,埋め込みの品質と堅牢性,実行時の性能を評価する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:11:03 GMT)
A Comprehensive Review of AI-based Intelligent Tutoring Systems: Applications and Challenges [0.4] 我々は、体系的な文献レビュー手法を用いて、2010年から2025年にかけて発行された数多くの資格ある研究を分析した。
その結果、ITSの有効性に関する複雑な状況が明らかとなり、進歩と永続的な課題の両方が浮き彫りにされた。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 01:43:07 GMT)
Is the Full Power of Gaussian Boson Sampling Required for Simulating Vibronic Spectra Using Photonics? [0.4] 物理化学における理論近似とフォトニック化学との関連性を探る。
これらの近似をフォトニクスにマッピングすると、特定の分子に対してGBSアプローチは不要であることが示される。
その結果,従来手法とフォトニックアプローチとの深いつながりの形成の重要性が浮き彫りになった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:17:15 GMT)
An Enumerative Embedding of the Python Type System in ACL2s [0.4] 本稿では, ACL2 に Python 型システムのサブセットを埋め込む手法を開発した。
私たちがサポートしているPythonタイプのサブセットには、サポート対象の型で構成されるユーザ定義型だけでなく、最も一般的に使用される型アノテーションの多くが含まれています。
ACL2の埋め込みを使うことで、Pythonプログラムをファズするインプットとして使用できる型のインスタンスを生成することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:08:43 GMT)
An Empirical Investigation of Gender Stereotype Representation in Large Language Models: The Italian Case [0.4] 本研究では,大規模言語モデルが無意味なプロンプトに対してどのように反応し,偏りのあるアウトプットに寄与するかを検討する。
その結果、LCMが生成したコンテンツがステレオタイプを永続化する方法が明らかになった。
AI生成テキストにおけるバイアスの存在は、職場や仕事の選択など、多くの分野に重大な影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:57:29 GMT)
Exploring the Use of LLMs for Requirements Specification in an IT Consulting Company [0.4] 本稿では,大規模言語モデル(LLM)を用いた要件仕様プロセスの自動化について報告する。
LLMは要件仕様の自動化と標準化に役立ち、時間と人的労力の削減に役立ちます。
しかし、LLM生成FDSの品質は入力に大きく依存しており、しばしば人間の修正を必要とする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:49:37 GMT)
CNN-based Surface Temperature Forecasts with Ensemble Numerical Weather Prediction over Medium-range Forecast Periods [0.4] 本研究では,畳み込みニューラルネットワーク(CNN)とアンサンブル数値気象予測(NWP)モデルを統合する手法を提案する。
提案手法はまず,各アンサンブル部材のCNNによる後処理により,系統的な誤りを低減させる。
第二に、CNN修正メンバーのアンサンブル平均化によるランダムエラーを低減する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:19:05 GMT)
Bridging Quantum and Classical Computing in Drug Design: Architecture Principles for Improved Molecule Generation [0.4] 分子発見のための生成逆数ネットワーク(GAN)の量子古典的ブリッジアーキテクチャを体系的に最適化する。
我々の最適化モデル(BO-QGAN)は、従来の量子ハイブリッドベンチマークよりも2.27倍高い薬物候補スコア(DCS)を達成することで、性能を著しく向上させる。
この研究は、ハイブリッドモデルに対する実証的な基礎的なアーキテクチャガイドラインを初めて提供し、現在の量子コンピュータを製薬研究パイプラインにより効果的な統合を可能にした。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:17:57 GMT)
Demystifying AI in Criminal Justice [0.4] この実践的レビューは、統計学やコンピュータ科学の背景がほとんど、あるいは全くない読者向けに書かれています。
さらなる技術革新を意図したものではない。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:22:02 GMT)
T-MPEDNet: Unveiling the Synergy of Transformer-aware Multiscale Progressive Encoder-Decoder Network with Feature Recalibration for Tumor and Liver Segmentation [0.3] 腫瘍と肝臓の自動分割のためのトランスフォーマー対応マルチスケールプログレッシブデコーダネットワーク(T-MPEDNet)を提案する。
Transformerにインスパイアされたダイナミックアテンション機構は、空間領域内の長距離コンテキスト関係をキャプチャする。
T-MPEDNetは、それぞれ97.6%のDice similarity Coefficients(DSC)と89.1%の肝臓と腫瘍のセグメンテーションを達成している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:03:29 GMT)
Quantum algorithms for cooling: a simple case study [0.3] 低エネルギーの量子多体状態の合成は、量子情報処理や凝縮物質物理学に幅広い応用がある。
量子冷却アルゴリズムは、変分原理や断熱原理、散逸状態の準備に基づく他の方法に代わる有望な代替手段を提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:00:49 GMT)
Implementing Credit Risk Analysis with Quantum Singular Value Transformation [0.3] 量子振幅推定(QAE)は、古典的手法よりも2次的なスピードアップのポテンシャルを提供する。
本稿では,状態準備演算子の実装コストを大幅に削減するためにQSVT(Quantum Singular Value Transformation)を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:25:42 GMT)
TESSERA: Temporal Embeddings of Surface Spectra for Earth Representation and Analysis [0.2] オープンでグローバルな土地指向リモートセンシング基盤モデルであるTESSERAを提案する。
10~60mの空間分解能で10個のSentinel-2スペクトルバンドの光学データと、10mの分解能で2個のSentinel-1合成開口レーダバック係数を組み合わせて、多層パーセプトロンで融合した埋め込みを作成し、年次世界埋め込みマップを作成する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:22:48 GMT)
YOLO for Knowledge Extraction from Vehicle Images: A Baseline Study [0.2] 本研究は, YOLO-v11, YOLO-World, YOLO-classの3つの最先端ディープラーニング手法の有効性を評価する。
このデータセットは、NSW Police Highway Patrol Vehiclesによって、困難かつ制約のない条件下で収集された。
このような複雑な実世界のデータセットで使用可能なモデルを得るためには、MVIを使う必要があると結論付けられた。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:31:21 GMT)
Large language models provide unsafe answers to patient-posed medical questions [0.1] AnthropicによるClaude、GoogleによるGemini、OpenAIによるGPT-4o、MetaによるLlama3-70B、新しいデータセットであるHealthAdviceの4つの公開チャットボットの安全性を比較した。
問題は21.6%(クラド)から43.2%(ラマ)に変化し、安全でない反応は5%(クラド)から13%(GPT-4o, Llama)に変化している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:55:36 GMT)
Towards Multimodal Social Conversations with Robots: Using Vision-Language Models [0.0] 視覚言語モデルは、自律型社会ロボットにとって十分に一般的な方法で、この広い範囲の視覚情報を処理できると主張している。
技術的課題が残るこの状況にそれらをどう適応させるかを説明し、評価プラクティスを簡潔に議論する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:06:53 GMT)
Wave packets, "negative times" and the elephant in the room [0.0] 我々はバリアを調整可能なマッハ・ツェンダー干渉計(MZI)で置き換える。
トンネリングの場合、伝送波パケットは自由状態の複数コピー間の破壊的干渉によって生じるが、自由伝播は遅延する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:40:16 GMT)
Virtual local area network over HTTP for launching an insider attack [0.0] 本稿では、未使用のセカンダリIPアドレスを利用して、外部マシンがLANにアクセスする方法を示す。
ファイアウォールやIDSのような堅牢な外部保護が存在するにもかかわらず、インサイダー攻撃は内部の脅威に対処する方法において重大な脆弱性を明らかにする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:16:19 GMT)
Urban Green Governance: IoT-Driven Management and Enhancement of Urban Green Spaces in Campobasso [0.0] カンポバッソ市のスマートグリーンシティのユースケースは、グリーン都市部の持続可能な管理のための革新的なモデルである。
このプロジェクトはIoTシステムとデータ駆動型ガバナンスプラットフォームを統合し、木や緑地の健康状態のリアルタイム監視を可能にする。
クラウドベースのプラットフォームは、グリーンアーバンマネージャ、技術専門家、運用スタッフのための総合的なリアルタイム意思決定をサポートする。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:54:11 GMT)
Underwater Waste Detection Using Deep Learning A Performance Comparison of YOLOv7 to 10 and Faster RCNN [0.0] YOLOv7, YOLOv8, YOLOv9, および高速領域畳み込みニューラルネットワーク(R-CNN)を含む5つの最先端物体認識アルゴリズムの性能について検討した。
YOLOv8は、平均平均精度(mAP)が80.9%で他より優れており、大きなパフォーマンスを示している。
これらの結果から, YOLOv8モデルが大気汚染対策に有効である可能性が示唆された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:36:37 GMT)
Ultracoarse Equilibria and Ordinal-Folding Dynamics in Operator-Algebraic Models of Infinite Multi-Agent Games [0.0] エージェントの連続体を持つ無限ゲームのための演算子代数的フレームワークを開発する。
非可換連続性方程式によって支配される後悔に基づく学習力学が、一意の量子応答平衡に収束することを証明する。
本稿では,力学の自己参照深度を測定する計算可能な順序値指標である順序折り畳み指数を導入する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:20:42 GMT)
Two fundamental solutions to the rigid Kochen-Specker set problem and the solution to the minimal Kochen-Specker set problem under one assumption [0.0] 量子論の2つの基本構造が2つの剛KS集合を定義することを示す。
2つ目の構成は最小のKS問題を解く手がかりを提供する。
我々は、31が最小のKS集合問題の解であると予想する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:44:26 GMT)
Transient Dynamics of the Quantum Stuart-Landau Oscillator [0.0] 制限サイクルと同期を示す量子系の過渡ダイナミクスについて検討する。
システムはコヒーレントな状態から進化するので、古典的な振る舞いを特徴付ける。
いくつかのフォック、熱、コヒーレント状態の定常状態に到達するのに要する時間を定量化する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:20:00 GMT)
Transfinite Fixed Points in Alpay Algebra as Ordinal Game Equilibria in Dependent Type Theory [0.0] 本稿では, 自己参照プロセスの安定な結果が, システムと環境との非有界リビジョン対話のユニークな平衡と同一であることを示すことによって, アルペイ・アルゲブラに寄与する。
固定点論、ゲームセマンティクス、順序解析、型理論から概念を統一することにより、この研究は無限の自己参照システムについての推論において、広くアクセス可能で形式的に厳密な基礎を確立する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:12:55 GMT)
Towards Bug-Free Distributed Go Programs [0.0] 本稿では,分散プログラムにおける通信競合の欠如を証明できる検証フレームワークについて述べる。
我々は、分散プログラムがどのように実行されるのかを静的に推論し、フェール・バイ・オーダを使用してバッファリングおよび未バッファリングのチャネルに拡張する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:48:00 GMT)
Time-of-Flow Distributions in Discrete Quantum Systems: From Operational Protocols to Quantum Speed Limits [0.0] 本稿では,離散量子系における遷移タイミングを時間流(TF)分布を用いて定量化する枠組みを提案する。
本フレームワークは,時間依存ハミルトニアンの最適化,ショートカット・ツー・アディバティティティプロトコルの解析,およびクローズドおよびオープンな量子システムに対する遷移ベースの量子速度制限(TF-QSL)を導出する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:43:39 GMT)
The wall confronting large language models [0.0] 大規模言語モデルの性能を決定するスケーリング法則は,予測の不確実性を改善する能力を大幅に制限していることを示す。
LLMの学習能力の多くを駆動するメカニズムは、誤りの積み重ねを発生させる確率の根本にあるのかもしれない、と我々は主張する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:48:37 GMT)
The moments of the spectral form factor in SYK [0.0] カオス量子系において、スペクトル形成因子は、重畳された不規則振動を伴う普遍線型ランプとプラトー構造を示す。
本研究では,SYKモデルにおいて,ランプ領域の時間を記述するサドル点を同定する。
我々は、スペクトル形状因子が高雑音の指数的傾斜を示す$q=2$SYKモデルについて検討した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:53:33 GMT)
Testing time order and Leggett-Garg inequalities with noninvasive measurements on public quantum computers [0.0] 量子ビット上の2つの非互換オブザーバブルを非侵襲的に測定するために、1と2の2量子ビットゲートを持つ2つのプロトコルを提案する。
IBM Quantumで利用可能な5つのデバイスとIonQで利用可能な1つのデバイスから10量子ビットのデータを詳細に分析すると、ほとんどすべてのケースにおいて5つの標準偏差を超える違反が明らかになる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:12:12 GMT)
Supersinglets can be self-tested with perfect quantum strategies [0.0] スーパーシングレットは$d ge 3$粒子のスピンゼロ状態の$d$レベルである。
スーパーシングレットは、ユニークな$d$-partite、$d$-dimensional非局所シグネチャを生成することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:45:26 GMT)
Studying number theory with deep learning: a case study with the Möbius and squarefree indicator functions [0.0] 我々は、M"obius function $mu(n)$ と squarefree indicator function $mu2(n)$ を計算するために小さな変換器モデルを訓練する。
モデルは非自明な予測力を得る。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:48:48 GMT)
Spatial correlations in four-wave mixing with structured light [0.0] 本稿では,4波混合(FWM)の量子化パラ軸フレームワークにおける詳細な理論的処理について述べる。
位置表現と運動量表現の両方で双光子状態を分析することにより、これらの記述が等価となる条件を特定する。
我々の研究は、FWMにおける空間相関に関する既知の新しい結果を集約し、構造化光による非線形および量子光学における将来の研究を支援する理論的枠組みを提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:58:24 GMT)
Small Towns, Big Questions: Methodological Insights into Use Case Selection for Digital Twins in Small Towns [0.0] 本稿では,小都市におけるデジタルソリューションの利用事例を特定し,評価するための学際的手法を提案する。
提案手法はローワー・オーストリアで開発・実装された。
我々は、非都市・農村における将来のスマートシティイニシアチブにデジタルツインツールを実装することを目的とした、研究者や実践者のためのレプリカ可能なフレームワークを提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:52:51 GMT)
Short-Form Video Recommendations with Multimodal Embeddings: Addressing Cold-Start and Bias Challenges [0.0] 近年、ソーシャルメディアユーザーはショートフォームビデオプラットフォームにかなりの時間を費やしている。
eコマースなど他のドメインの確立されたプラットフォームは、ユーザをエンゲージするショートフォームビデオコンテンツを導入し始めた。
これにより、特に新しいビデオ体験を始める際に、レコメンデーションシステムに新たな課題が生まれる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:57:04 GMT)
Shallow-depth GHZ state generation on NISQ devices [0.0] 我々は、IBMとGoogleのチップアーキテクチャにインスパイアされた様々な接続グラフにわたるGHZ状態の準備について検討する。
提案手法は,NISQデバイス上でのGHZ状態の生成にキュービット接続制約を利用するための計測ベースのプロトコルである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:33:30 GMT)
SILS: Strategic Influence on Liquidity Stability and Whale Detection in Concentrated-Liquidity DEXs [0.0] SILSはCLMM(Concentrated Liquidity Market Makers)におけるインパクトフル流動性プロバイダ(LP)を識別する
これは、静的なボリュームベースの分析から、動的でインパクトを重視した理解へのパラダイムシフトを表している。
このフレームワークは、基盤となる流動性構造と関連するリスクに対して前例のない透明性を提供します。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:21:18 GMT)
SDVDiag: A Modular Platform for the Diagnosis of Connected Vehicle Functions [0.0] 本稿では,コネクテッドカー機能診断のための自動プラットフォームであるSDVDiagについて述べる。
このプラットフォームは、初期データ収集から潜在的な根本原因のトレースまで、すべてのステップをカバーするパイプラインの作成を可能にする。
接続された車両機能のための5Gテストフリート環境内に展開される。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:09:27 GMT)
Running in CIRCLE? A Simple Benchmark for LLM Code Interpreter Security [0.0] 大規模言語モデル(LLM)は、ネイティブコードインタプリタを統合し、リアルタイム実行機能を実現する。
これらの統合は、システムレベルのサイバーセキュリティの脅威をもたらす可能性がある。
本稿では、CPU、メモリ、ディスクリソースの枯渇をターゲットとした1,260プロンプトからなる単純なベンチマークであるCIRCLE(Code-Interpreter Resilience Check for LLM Exploits)を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:06:16 GMT)
Resonant-Tunnelling Diode Reservoir Computing System for Image Recognition [0.0] 我々は、物理貯水池コンピューティング(RC)に理想的な非線形特性を示す共鳴トンネルダイオード(RTD)に基づくニューロモルフィックコンピューティングアーキテクチャを提示し、検証する。
この回路レベルのアーキテクチャは,次世代RCの原理に固執しながら,有望な性能を提供することを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:08:12 GMT)
Reply to "Counterfactual communication not achieved yet -- A Comment on Salih et al. (2022)" [0.0] ポープスクは、論文の主張は無効であると主張している。
我々は彼の主張に反論し、それは我々が証明しようとしたことの具体性を無視することに基づいていることを示している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:16:13 GMT)
Real-Time Observation of Aharonov-Bohm Interference in a $\mathbb{Z}_2$ Lattice Gauge Theory on a Hybrid Qubit-Oscillator Quantum Computer [0.0] 我々は、ハイブリッド量子ビットオシレータトラップイオン量子デバイスを用いて、$mathbbZ$ LGTのリソース効率を実証する。
ガウスの法則を$mathbbZ$リンクで探索し、これをループ幾何学に拡張し、高次元LGTへの最初のステップを示す。
この結果はボソニックゲージ理論のスケーラブルな量子シミュレーションに有望な経路を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:02:33 GMT)
Quantum Algorithm for Protein Side-Chain Optimisation: Comparing Quantum to Classical Methods [0.0] 本研究では,タンパク質構造の基底状態エネルギーを計算するための資源効率最適化アルゴリズムを開発した。
量子近似最適化アルゴリズムを用いて、コンフォーメーション空間を探索し、低エネルギー構成を同定する量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:37:04 GMT)
Quadratic Volatility from the Pöschl-Teller Potential and Hyperbolic Geometry [0.0] 研究は、二次正規ボラティリティ(QNV)仕様の下で一般化されたブラック・スコルズ方程式と双曲型P"oschl-Teller電位に対する定常シュル・オーディンガー方程式との形式的同値性を確立する。
正準変換の列は、金融価格演算子を量子ハミルトニアンに写像し、ボラティリティの笑顔を双曲多様体上の拡散の直接的な表現として表す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:05:14 GMT)
Pulse-Level Simulation of Crosstalk Attacks on Superconducting Quantum Hardware [0.0] 超伝導量子コンピュータにおけるハードウェアのクロストークは、深刻なセキュリティ上の脅威となる。
パルスレベルにおけるアクティブクロストーク攻撃のシミュレーションに基づく研究について述べる。
最大論理誤差の原因となるパルスと結合構成を同定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:49:58 GMT)
Probing the spatial distribution of k-vectors in situ with Bose-Einstein condensates [0.0] 本稿では, ボース・アインシュタイン凝縮体(BEC)を移動プローブとして, 光子運動量の空間分布をレーザビームにマッピングする方法を提案する。
BECを分解することにより、レーザービームの異なる位置で原子干渉計により光子反動を測定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:58:58 GMT)
Polaritonic Coupled Cluster Theory for Unpolarized Cavities Exploiting Point Group Symmetry [0.0] 本稿では,量子電気力学結合クラスタ(QED-CC)波動関数アンザッツの一般化を紹介する。
非偏光光ファブリ・ペロトキャビティにおける強結合光マター系について述べる。
本実装を用いて, 芳香族種ベンゼン, フルオロベンゼン, アズレンについて検討した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 11:42:54 GMT)
Polar Coding and Linear Decoding [0.0] 2009年7月7日 IEEE Transactions on Information Theory, Vol. 55, No. 7 でアリカンが記述した極性符号化は通信のマイルストーンとなった。
極性符号は、情報を高容量チャネルと低容量チャネルに分散し、完全チャネル容量を達成する可能性を示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:23:14 GMT)
Optimising Perfect Quantum State Transfer for Timing Insensitivity [0.0] 完全状態移動がいかにそのタイミングに敏感であるかを研究する。
我々は、その感度を低下させるエンジニアリングされたスピン鎖を設計する。
同じ構成が、分数復元(英語版)としても知られる重ね合わせ(英語版)を作成するタスクにも適用される。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 01:07:35 GMT)
Opacity as Authority: Arbitrariness and the Preclusion of Contestation [0.0] 論文は、規範的欠陥や支配の症状としてではなく、人間のシステムや相互作用を構造化する機能的なメカニズムとして、仲裁性を再定義する。
Ferdinand de Saussure の l'arbitraire du signe という概念に基づいて構築されたこの分析は、ドメイン間の適用性を示すために、言語を超えてこの原理を拡張している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:10:35 GMT)
Oligonucleotide selective detection by levitated optomechanics [0.0] 光学実験におけるオリゴヌクレオチド特異的信号の検出について検討した。
SiNPs were functionalized usingCl$Cl$ and 25-mers of single-stranded deoxyadenosine and deoxydine monophosphate。
データは粒子の種類によって比較され、ピークの周波数、幅、振幅の差が明らかになった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:34:43 GMT)
Nonparametric Linear Discriminant Analysis for High Dimensional Matrix-Valued Data [0.0] 本稿では,行列値観測に適したフィッシャーの線形判別分析(LDA)の新たな拡張を提案する。
我々は、NPMLE(Non Maximum Likelihood Estimation)に基づく非パラメトリック経験的ベイズフレームワークを採用する。
本手法は,行列設定に効果的に一般化され,分類性能が向上する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:30:24 GMT)
Non-volatile photorefractive tuning and green light generation in a diamond cavity [0.0] 単結晶ダイヤモンドナノキャビティは、量子および非線形光学技術において、非常に大きな可能性を持っている。
ダイヤモンドナノキャビティの定性および非揮発性共鳴チューニングについて述べる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:00:03 GMT)
Non-Commutative Phase-Space Effects in Fermionic String Theory [0.0] 自由開フェルミオン弦理論を非可換対象位相空間内で研究する。
我々は、ラモンドとネヴェウ=シュワルツの両セクターに対して、修正された超ビラソロ代数を導出する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:01:42 GMT)
Neural network ensemble for computing cross sections for rotational transitions in H$_{2}$O + H$_{2}$O collisions [0.0] ニューラルネットワーク(NN)のアンサンブルを用いて断面予測を行う機械学習ツールを提案する。
提案手法は、混合量子古典理論(MQCT)を用いて計算されたデータを利用する。
トレーニングには計算データの約10%しか使用せず、NNはH$_2$O + H$_2$O衝突の状態-状態間の回転遷移の断面積を予測する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:59:32 GMT)
Multimodal Recurrent Ensembles for Predicting Brain Responses to Naturalistic Movies (Algonauts 2025) [0.0] 本稿では,事前訓練されたビデオ,音声,言語埋め込みをfMRI時系列にマッピングする階層的マルチモーダル・リカレントアンサンブルを提案する。
トレーニングは複合的なMSE相関損失と、初期の知覚的堅牢性から後期関連領域に徐々に重点を移すカリキュラムに依存している。
このアプローチは、将来のマルチモーダル脳エンコーディングベンチマークのための単純で自然なベースラインを確立する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:38:12 GMT)
Mixed-Reality Digital Twins: Leveraging the Physical and Virtual Worlds for Hybrid Sim2Real Transition of Multi-Agent Reinforcement Learning Policies [0.0] 本研究は、並列化シミュレーションワークロードをオンデマンドで選択的にスケーリングすることで、トレーニング速度を向上できる混合現実(MR)デジタルツイン(DT)フレームワークを提案する。
i) エージェントと環境並列化が訓練時間に及ぼす影響, (ii) ドメインランダム化がゼロショットsim2real転送に与える影響について検討した。
その結果、提案した並列化スキームとsim2realのギャップを2.9%に抑えることで、最大76.3%のトレーニング時間を短縮できることがわかった。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:15:33 GMT)
MedicalBERT: enhancing biomedical natural language processing using pretrained BERT-based model [0.0] MedicalBERTは、大規模なバイオメディカルデータセットに基づいてトレーニングされた、事前訓練されたBERTモデルである。
生物医学用語の理解を深めるドメイン固有の語彙を備えている。
MedicalBERTは、評価されたすべてのタスクで、汎用BERTモデルを平均5.67%上回る。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:44:25 GMT)
Measurement-based Simulation of Geometric Gates in Topological Qubits on NISQ Devices [0.0] マヨラナゼロモード(MZM)の断熱交換は、幾何学的に保護されたゲートの非普遍的な集合を可能にする。
マルチキュービットパウリパリティ測定によるMZMY接合の測定に基づくブレイディング
小型回路は、新しい測度に基づく幾何ゲートと、量子ハミルトニアンシミュレーションの計測に基づく実証を提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 19:40:01 GMT)
Mean flow data assimilation using physics-constrained Graph Neural Networks [0.0] 本研究では,グラフニューラルネットワーク(GNN)と最適化手法を統合し,平均流路復元の精度を高める新しいデータ同化手法を提案する。
GNNフレームワークは非構造化データを扱うのに適しており、計算流体力学(CFD)で遭遇する複雑な測地に共通している。
その結果,データ駆動モデルに類似するモデルと比較して,訓練データに制限がある場合でも,平均フロー再構成の精度は著しく向上した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:18:14 GMT)
Light and divergences: History and outlook [0.0] 実験的な証拠はすべて、真空は空白ではなく、真に量子的な何かで満たされていることを示している。
これはゼロ点ゆらぎや、仮想粒子対と反粒子対のディラックの海などによって反映される。
最後に、真空はマクスウェルの変位電流の原因となる媒体である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:00:00 GMT)
Large Language Models as Attribution Regularizers for Efficient Model Training [0.0] 大規模言語モデル(LLM)は、様々な領域で顕著なパフォーマンスを示している。
我々は,LLM生成したグローバルタスク特徴属性を,より小さなネットワークのトレーニングプロセスに組み込む方法を提案する。
我々のアプローチは、数ショットの学習シナリオにおいて優れたパフォーマンスをもたらす。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 09:56:38 GMT)
Landau levels for the $(2+1)$ Dunkl-Klein-Gordon oscillator [0.0] 我々はエネルギースペクトルと固有関数を解析的に発見し、どちらの解も一貫したものであることを示す。
磁場が消えるとき、あるいはダンクル微分のパラメータが0となるとき、その結果は文献に報告されている値に適切に還元されることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:13:10 GMT)
Knowledge Grafting: A Mechanism for Optimizing AI Model Deployment in Resource-Constrained Environments [0.0] 資源制約のある環境でAIモデルを最適化するために知識グラフトを導入する。
このアプローチはモデルサイズを88.54%削減する。
さまざまなエッジコンピューティングシナリオにまたがって拡張することができる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:37:45 GMT)
Kibble-Zurek mechanism for dissipative discrete time crystals [0.0] 不安定な位相から離散時間結晶 (DTC) へ遷移する開系に対して, キブル・ズールク機構が成り立つことを示す。
具体的には,空間欠陥数の待ち時間と臨界点を越える時間から測定される遷移遅延を特徴とする,DTCに切り替わるシステムにおいて,KZMの主なシグネチャを観察する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 04:38:04 GMT)
KD-GAT: Combining Knowledge Distillation and Graph Attention Transformer for a Controller Area Network Intrusion Detection System [0.0] コントローラエリアネットワーク(CAN)プロトコルは車内通信に広く採用されているが、固有のセキュリティ機構がない。
本稿では,グラフ注意ネットワーク(GAT)と知識蒸留を組み合わせた侵入検知フレームワークであるKD-GATを紹介する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:45:58 GMT)
Information Extraction from Unstructured data using Augmented-AI and Computer Vision [0.0] 本稿では,A2I(Augmented Intelligence)とコンピュータビジョン,自然言語処理技術を組み合わせた情報抽出フレームワークを提案する。
本稿では,物体検出にディープラーニングアーキテクチャを活用することによって,従来の手法の限界に対処する。
提案手法は,多種多様な文書形式から構造化情報を抽出する際の精度と効率の向上を実証する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:32:49 GMT)
Improving Count-Mean Sketch as the Leading Locally Differentially Private Frequency Estimator for Large Dictionaries [0.0] パラメータの異なるプライベートなCount-Mean Sketch(CMS)アルゴリズムを再検討する。
摂動法としてランダム化応答(RR)を用いてCMSを最適化する。
RRで最適化されたCMSは、最悪の平均二乗誤差を減らすために、他の既知の摂動とCMSの変種より優れていることを示す。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:40:10 GMT)
Human-AI Synergy in Adaptive Active Learning for Continuous Lithium Carbonate Crystallization Optimization [0.0] 本研究では,炭酸リチウムの連続結晶化を最適化するために,Human-in-the-Loop(HITL)を用いたアクティブラーニングフレームワークを提案する。
その結果、フレームワークが新しいデータに迅速に適応できることが示され、重要な不純物に対するプロセスの耐性が大幅に向上した。
このブレークスルーにより、低品位で不純物に富んだリチウム資源の活用が実現可能となり、広範なプレリファインメントプロセスの必要性が軽減される可能性がある。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:30:37 GMT)
Higher-dimensional entanglement detection and quantum channel characterization using moments of generalized positive maps [0.0] 我々は高次元の絡みを検知するための基準を提案する。
量子状態のシュミット数を決定することに集中し、正の部分転位と負の部分転位の絡み合った状態の有意なクラスを特定する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:44:18 GMT)
Hierarchical Deep Reinforcement Learning Framework for Multi-Year Asset Management Under Budget Constraints [0.0] 本稿では,多年計画に適した階層型深層強化学習手法を提案する。
提案手法では, 課題を, 高水準の予算プランナーと低水準の保守プランナーの2つの階層レベルに分割する。
マクロ予算決定を資産レベルの優先順位付けから構造的に分離し、階層的なソフトアクター・クリティカル・フレームワークに線形プログラミング・プロジェクションを統合することにより、アクション空間の指数的成長を効率的に処理し、厳密な予算順守を確保する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:42:34 GMT)
Harnessing intuitive local evolution rules for physical learning [0.0] 境界パラメータのみを外部制御する物理系のためのトレーニング手法を提案する。
このスキームを用いることで、これらの境界許容適応状態チューニングシステムは、局所的なフィズ・カルルールを利用して学習する。
BEASTAL(BEAST-Adaline)は,Adalineアルゴリズムに最も近い類似手法である。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:51:42 GMT)
HQ-SMem: Video Segmentation and Tracking Using Memory Efficient Object Embedding With Selective Update and Self-Supervised Distillation Feedback [0.0] 本稿では,高画質ビデオセグメンテーションとスマートメモリを用いたトラッキングのためのHQ-SMemを紹介する。
提案手法には, SAMと高品質マスク(SAM-HQ)を併用して, 粗いセグメンテーションマスクを改良し, オブジェクト境界を改良する, (ii) 冗長なキーフレームを廃棄しながら, 関連キーフレームを選択的に格納する動的スマートメモリ機構を実装し, (iii) 複雑なトポロジ的オブジェクトの変動を効果的に処理し, ビデオ全体のドリフトを低減するための外観モデルを動的に更新する,という3つの重要なイノベーションが含まれている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 03:28:05 GMT)
HIVMedQA: Benchmarking large language models for HIV medical decision support [0.0] HIV管理は、その複雑さのために魅力的なユースケースである。
大規模言語モデル(LLM)を臨床実践に統合すると、正確性、潜在的な害、臨床受理に関する懸念が高まる。
本研究は、HIV治療におけるLSMの現在の能力を評価し、その強度と限界を強調した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:40:44 GMT)
Gradient-based grand canonical optimization enabled by graph neural networks with fractional atomic existence [0.0] State-of-the-artモデルは一般的に、原子埋め込みを反復的に更新するためにメッセージパッシングを使用するグラフニューラルネットワークである。
我々は、分数原子の存在を考慮に入れた連続変数を含むことによって、メッセージパッシング形式を拡張した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:13:41 GMT)
Geometric Representation of Generalized Coherent States and their Symplectic Capacities: A Synthetic Approach [0.0] 我々は、一般化されたコヒーレント段階をフェルミ楕円体、量子ブロブ、マイクロ局所対の概念にリンクする結果をレビューし、完成し、合成する。
さらに,これらの物体に付随する様々なシンプレクティック・キャパシティについて検討した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:22:16 GMT)
Generative Logic: A New Computer Architecture for Deterministic Reasoning and Knowledge Generation [0.0] Generative Logic (GL) は、ユーザが提供する公理的定義から始まる決定論的アーキテクチャである。
GLは、候補含意を列挙し、正規化と型フィルタを適用し、マシンチェック可能な証明を自動的に再構築する。
Peanoの実験を再現するPythonとMPLのコードと完全なHTML証明グラフは、プロジェクトのGitHubリポジトリから入手できる。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:29:19 GMT)
Generating Clinically Realistic EHR Data via a Hierarchy- and Semantics-Guided Transformer [0.0] 生成過程の新たなフレームワークとして階層型・意味型変換器(HiSGT)を提案する。
HiSGTは、親子関係と臨床コード間の兄弟関係をエンコードする階層グラフを構築し、階層認識の埋め込みを導出するためにグラフニューラルネットワークを使用する。
MIMIC-IIIおよびMIMIC-IVデータセットの実験により、HiSGTは実際の患者記録と合成データの統計的アライメントを大幅に改善することが示された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:26:39 GMT)
Game-Theoretic Gradient Control for Robust Neural Network Training [0.0] フィードフォワードニューラルネットワーク(FFNN)は入力ノイズに弱いため、予測性能が低下する。
本研究の目的は,バックプロパゲーションを改良し,マルチエージェントゲームとして解釈し,制御対象変数の雑音化を探索することにより,FFNN雑音の頑健性を高めることである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 10:26:25 GMT)
FlashGuard: Novel Method in Evaluating Differential Characteristics of Visual Stimuli for Deterring Seizure Triggers in Photosensitive Epilepsy [0.0] 感光性てんかん(PSE)を持つ患者は、デバイスを使用する際の課題に遭遇する。
メディアにおけるてんかん性フラッシュを防ぐための現在の規範は、ビデオ中にフラッシュが発生したときに非同期に検知し、ユーザーに通知することである。
新たなアプローチであるFlashGuardは、ユーザの画面上のフレームの色の変化率を評価し、刺激を適切に緩和するために開発された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:18:25 GMT)
Federated Calculation of the Free-Support Transportation Barycenter by Single-Loop Dual Decomposition [0.0] 本稿では,複数の分布のワッサーシュタインバリセンタを計算するための効率的なフェデレーション二重分解アルゴリズムを提案する。
アルゴリズムはローカルデータにアクセスせず、高度に集約された情報のみを使用する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 18:54:25 GMT)
Extracting Insights from Large-Scale Telematics Data for ITS Applications: Lessons and Recommendations [0.0] 交通プランナーは以前、様々な形態でテレマティクスデータを利用してきたが、現在の規模は大きな新しい機会を提供している。
本稿は,4つの主要な目的を通じて,これらのニーズに対処するための一歩を踏み出す。
まず、2021年8月から2022年8月までにバージニア州で収集された14億マイル (120万回) のテレマティクスデータを効率的に分析するために、データ処理パイプラインが構築された。
第二に、トリップと道路のセグメントレベルの要約のオープンなデータリポジトリが作成されました。
第3に、道路の走行行動と速度プロファイルに関するこれらのデータから洞察を抽出するインタラクティブな可視化ツールが設計された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 12:59:23 GMT)
Extending Group Relative Policy Optimization to Continuous Control: A Theoretical Framework for Robotic Reinforcement Learning [0.0] グループ相対政策最適化(GRPO)は、グループベースの優位性推定を通じて値関数依存を排除し、離散的な行動空間において有望であることを示す。
本稿では,GRPOを連続制御環境に拡張し,高次元行動空間における課題,スパース報酬,時間的ダイナミクスに対処する理論的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 05:25:40 GMT)
Exponentially robust non-Clifford gate in a driven-dissipative circuit [0.0] 物理量子ビットレベルで保護された非クリフォード$sqrtT$ゲートのプロトコルを提案する。
このようなゲートはトポロジカルに頑健であり、制御やデバイス不完全性から指数的に不完全であることを示す。
回路パラメータのノイズ、不完全制御、不完全ターゲティングに対するプロトコルのレジリエンスを解析する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 23:26:48 GMT)
Exact solutions of the Schrödinger Equation with Dunkl Derivative for the Free-Particle Spherical Waves, the Pseudo-Harmonic Oscillator and the Mie-type Potential [0.0] 半径部と角部の方程式は球面座標と変数の分離を用いて得られる。
本結果は, Dunkl 微分パラメータを除去した場合に, 従来報告した値に適切に還元されることが示されている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:00:44 GMT)
Equilibration of Non-interacting Photons and Quantum Signatures of Chaos [0.0] 単一粒子カオスが非相互作用光子の平衡に繋がることを示す。
平衡の基本的なメカニズムは、演算子拡散と量子干渉であることを示す。
本稿では,多粒子キックロータのリアルなフォトニック実装を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 07:13:20 GMT)
Enhancing Frequency for Single Image Super-Resolution with Learnable Separable Kernels [0.0] Learnable Separable Kernels (LSK) は、画像周波数成分を直接強化するために設計されたランク1の行列である。
LSKを組み込んだベースライン法は、パラメータ数と計算要求の両方で60%以上の大幅な削減を示している。
実験により、LSKを組み込むことでパラメータや計算負荷を削減できるだけでなく、全体のモデル性能も向上することが示された。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:57:19 GMT)
Enhanced Quantum Energy Teleportation using a 3-Qubit System [0.0] 量子エネルギーテレポーテーション(QET)のエネルギー効率を高めるための3量子システムを用いた新しいアプローチを提案する。
実験の結果,エネルギー回収の面では有意な改善が見られた。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 13:29:38 GMT)
Directional Codes: a new family of quantum LDPC codes on hexagonal- and square-grid connectivity hardware [0.0] 我々は、方向コードと呼ばれる量子低密度パリティチェック(qLDPC)符号の新しいファミリーを構築する。
超伝導に着想を得た回路レベルのパウリ雑音モデルを用いて, 4ビット, 6ビット, 12ビットの論理量子ビットを符号化し, 方向性符号の性能を数値的に評価する。
我々の発見はQEC符号設計におけるブレークスルーであり、低オーバーヘッドのフォールトトレラント量子計算には複雑な長距離高接続性ハードウェアは必要ないかもしれないことを示唆している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:57:21 GMT)
Differentiating hype from practical applications of large language models in medicine - a primer for healthcare professionals [0.0] 大規模言語モデル(LLM)を含む機械学習と人工知能技術は、医療革新を実現することを約束されている。
LLMは、現実に基づく客観的真実を理解していない。
また、臨床医や研究者が使用する保護情報開示の本当のリスクも表している。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 16:40:17 GMT)
Differentiated Thyroid Cancer Recurrence Classification Using Machine Learning Models and Bayesian Neural Networks with Varying Priors: A SHAP-Based Interpretation of the Best Performing Model [0.0] 甲状腺癌のDTC再発は主要な公衆衛生上の問題である。
本研究は, 383名の患者を対象としたデータセットを用いて, DTC再分類のための包括的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:31:31 GMT)
Characterizing the Many Body Localization Crossover as a Metal-Insulator Transition: Localization length from Polarization and Quantum Metric [0.0] 多くのボディローカライゼーション(MBL)はユニークな物理現象であり、熱化を探索するための試験場を提供する。
ここでは、多体量子メートル法(MBQM)により幾何学的にMBL体制を特徴づける。
我々は, 波動関数の空間拡散を特徴付けるMBL系において, 自然な局所化長を抽出できることを見出した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 08:14:54 GMT)
Characterization of Polariton Dynamics in a Multimode Cavity (II): Coherent-Incoherent Transition Driven by Photon Loss [0.0] 減衰可変多モードキャビティモデルにおける非エルミート偏光子ダイナミクスについて検討する。
モデルハミルトニアンの複素固有スペクトルは、光子損失によって誘導される不整合コヒーレント遷移を予測できる。
その結果, 分散関係, 群速度, 緩和速度は顕著な特徴を示した。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:52:25 GMT)
Black Box Deployed -- Functional Criteria for Artificial Moral Agents in the LLM Era [0.0] 従来の倫理的基準は、このミスマッチのため、大きな言語モデル(LLM)では実践的に時代遅れである、と論文は主張する。
本稿では,LLMに基づく人工モラルエージェントを評価するための10種類の機能基準を改訂した。
これらのガイドポストは、私たちが「SMA-LLS」と呼ぶものに適用し、よりアライメントを高め、社会的統合を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 21:09:11 GMT)
AquiLLM: a RAG Tool for Capturing Tacit Knowledge in Research Groups [0.0] 研究グループは、チームメンバに分散した知識の取得、保存、検索において、永続的な課題に直面します。
AquiLLMは研究グループのニーズを満たすために設計された軽量でモジュラーなRAGシステムである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 20:47:01 GMT)
An OpenSource CI/CD Pipeline for Variant-Rich Software-Defined Vehicles [0.0] ソフトウェア定義車両(SDV)は、運転行動の強化や車両管理など幅広い機能を提供している。
これらの機能はOTA(Over-the-air)メカニズムを通じて継続的に更新される。
本稿では,SDVに適したオープンソースCI/CDパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 17:26:36 GMT)
Algebraic approach for the one-dimensional Dirac-Dunkl oscillator [0.0] ディラック・ダンクル発振器がパリティ不変であるためには、スピノル成分の一方は偶数でなければならず、もう一方のスピノル成分は奇数でなければならない。
スピノル成分ごとに微分方程式を分離し、これらの関数の一方が偶数で他方の関数が奇数である場合に、適切な$su (1,1)$代数的実現を導入する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:16:14 GMT)
Agent0: Leveraging LLM Agents to Discover Multi-value Features from Text for Enhanced Recommendations [0.0] 大規模言語モデル(LLM)とその関連するエージェントベースのフレームワークは、かなり高度な自動情報抽出を持っている。
本稿では,未構造化テキストから情報抽出と特徴構築を自動化するエージェントベースシステムであるAgent0を提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 06:45:10 GMT)
A Survey on State-of-the-art Deep Learning Applications and Challenges [0.0] ディープラーニングモデルの構築は、アルゴリズムの複雑さと現実世界の問題の動的な性質のため、難しい。
本研究の目的は,コンピュータビジョン,自然言語処理,時系列解析,広範コンピューティングにおける最先端のディープラーニングモデルを網羅的にレビューすることである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 02:03:21 GMT)
A Multimodal Seq2Seq Transformer for Predicting Brain Responses to Naturalistic Stimuli [0.0] Algonauts 2025 Challengeは、自然主義的なマルチモーダル映画に対する全脳のfMRI反応を予測するエンコーディングモデルを開発するようコミュニティに呼びかけた。
本稿では,視覚,聴覚,言語入力からfMRI活動を自動的に予測するシーケンス・ツー・シーケンス・トランスフォーマを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 00:49:55 GMT)
A Data-Driven Approach to Estimate LEO Orbit Capacity Models [0.0] アクティブ、デリケット、デブリの2つに分けられた居住空間オブジェクトの人口は、将来の衛星やデブリの伝播を予測するために正確にモデル化することができる。
提案手法では,計算コストの高い高忠実度モデルMOCAT-MCを用いて,短時間で正確な予測を行う軽量低忠実度モデルを提案する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 15:16:54 GMT)
A Clockwork Quantum: Symmetry, Noise, and the Emergence of Quantum Order [0.0] オープン量子系におけるノイズ誘起同期とコヒーレンス保護について検討した。
ノイズ相関の対称性が制御パラメータとして機能し、対称モードや反対称モードを保護していることを示す。
これらの洞察は、古典的および量子的状態における同期の統一的な見方を提供する。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 14:59:03 GMT)
A Black Hole Airy Tail [0.0] Jackiw-Teitelboim(JT)重力における焼成エントロピーを計算する。
半焼成エントロピーと呼ばれる中間量を定義し、焼成エントロピーの正の性質を持つ。
また, 類似の1固有値インスタントンサドルが, レプリカ限界における1固有値インスタントンに対するサドル点近似の分解により, 焼成エントロピーを計算できない理由も明らかにした。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 23:14:33 GMT)
$SU(1,1)\times SU(2)$ approach and the Mandel parameter to the Hamiltonian of two oscillators with weak coupling [0.0] 我々は、この問題のハミルトニアンを、$SU(1,1)$および$SU(2)$群のボソン生成子の観点から記述する。
これにより、両群類似性変換に基づく2つの傾き変換を適用して、そのエネルギースペクトルと固有関数を得ることができる。
留意すべき点は、我々の手順では、弱いカップリングの場合を考えることである。
論文参考訳(メタデータ) (Fri, 25 Jul 2025 22:30:59 GMT)