3DGen-Bench: Comprehensive Benchmark Suite for 3D Generative Models [94.5] 3D世代は急速に進歩しているが、3D評価の開発はペースを保っていない。
3DGen-Arenaは、公開ユーザと専門家アノテータの両方から人間の好みを収集する統合プラットフォームである。
このデータセットを用いて、CLIPベースのスコアモデルである3DGen-ScoreとMLLMベースの自動評価器である3DGen-Evalをさらに訓練する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:53:26 GMT)
Reframe Your Life Story: Interactive Narrative Therapist and Innovative Moment Assessment with Large Language Models [92.9] 物語療法は、個人が問題のある人生の物語を代替品の力に変えるのに役立つ。
現在のアプローチでは、特殊精神療法ではリアリズムが欠如しており、時間とともに治療の進行を捉えることができない。
Int(Interactive Narrative Therapist)は、治療段階を計画し、反射レベルを誘導し、文脈的に適切な専門家のような反応を生成することによって、専門家の物語セラピストをシミュレートする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:52:09 GMT)
HLFormer: Enhancing Partially Relevant Video Retrieval with Hyperbolic Learning [77.4] 部分関連ビデオ検索(PRVR)は、部分コンテンツのみを記述するテキストクエリと、未トリミングされたビデオとをマッチングするという課題に対処する。
本稿は,高次空間学習を利用してユークリッド空間の最適階層的モデリング能力を補う,PRVRのための最初のハイパーボリックモデリングフレームワークであるHLFormerを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:26:55 GMT)
What is Wrong with Perplexity for Long-context Language Modeling? [71.3] 長いコンテキスト入力は、会話の拡張、文書の要約、多数のショットインコンテキスト学習といったタスクにおいて、大きな言語モデル(LLM)にとって不可欠である。
パープレキシティ(PPL)は、長期コンテキスト能力の評価には信頼性が低いことが証明されている。
長短コンテキストコントラスト法を用いて鍵トークンを識別する手法であるbfLongPPLを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 14:45:02 GMT)
PyG 2.0: Scalable Learning on Real World Graphs [70.8] Pyg 2.0は、拡張性と現実世界のアプリケーション機能を大幅に改善した包括的アップデートです。
ヘテロジニアスグラフやテンポラルグラフのサポート,スケーラブルな機能/グラフストア,さまざまな最適化など,フレームワークの強化されたアーキテクチャについて詳述する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 18:32:07 GMT)
ProsodyLM: Uncovering the Emerging Prosody Processing Capabilities in Speech Language Models [70.6] 本稿では,韻律学習に適した単純なトークン化方式であるProsodyLMを提案する。
ProsodyLMは事前学習だけで驚くほど多様なプロソディ処理能力を学習できることがわかった。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 00:59:01 GMT)
Heterogeneous User Modeling for LLM-based Recommendation [70.5] オープンドメインレコメンデーションを進める上で重要な課題は、ユーザの不均一な振る舞いからユーザの好みを効果的にモデル化することだ。
IDベースやセマンティックベースモデリングなど、既存のアプローチでは、一般化の貧弱さに悩まされている。
圧縮エンハンサーとロバストネスエンハンサーを組み込んだヘテロジニアス・ユーザ・モデリング(HUM)手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:25:23 GMT)
Towards Universal Modal Tracking with Online Dense Temporal Token Learning [66.8] オンライン高密度時間トークン学習を用いたユニバーサルビデオレベルのモダリティ認識追跡モデルを提案する。
モデルの入力をビデオシーケンスレベルに拡張し、よりリッチなビデオコンテキストを言語に近い視点から見ることを目的としている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:47:42 GMT)
Player-Centric Multimodal Prompt Generation for Large Language Model Based Identity-Aware Basketball Video Captioning [66.6] 既存のスポーツビデオキャプション手法は、プレイヤーのアイデンティティを見落としているアクションに焦点を合わせ、適用性を制限していることが多い。
本稿では,個人対応スポーツビデオキャプション(LLM-IAVC)のためのプレイヤー中心型マルチモーダルプロンプト生成ネットワークを提案する。
NBA-Identityという,9つの主要なイベントを対象とする9,726本のビデオを備えた,大きなアイデンティティを意識したバスケットボールビデオキャプションデータセットを構築した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:30:56 GMT)
Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [65.9] 本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化(UAO)フレームワークを提案する。
このフレームワークは、事前訓練されたモデルの事前情報を保持し、関節の不確実性を用いて過度に適合する問題を緩和する。
我々のアプローチは、Human3.6Mの5.5%という大きなマージンで、これまでの最高の結果を上回っています。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:20:21 GMT)
FAST: Similarity-based Knowledge Transfer for Efficient Policy Learning [57.5] Transfer Learningは、タスク間で知識を伝達することで学習を加速する能力を提供する。
これは、負の転送、ドメイン適応、ソリッドソースポリシーの選択における非効率といった重要な課題に直面します。
本研究では,知識伝達の改善,タスク間のパフォーマンスの促進,計算コストの削減など,TLの課題に挑戦する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:21:53 GMT)
A General Framework for Estimating Preferences Using Response Time Data [56.7] 本研究は, 時間的選択実験への実証的応用を開発し, 応答時間の利用によって予測精度が得られ, 経済的に関係のあるパラメータを推定する上での課題が示された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:13:02 GMT)
Fast or Better? Balancing Accuracy and Cost in Retrieval-Augmented Generation with Flexible User Control [52.4] Retrieval-Augmented Generationは、大規模な言語モデル幻覚を緩和するための強力なアプローチとして登場した。
既存のRAGフレームワークは、しばしば無差別に検索を適用し、非効率な再検索につながる。
本稿では,精度・コストのトレードオフを動的に調整できる新しいユーザ制御可能なRAGフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 00:10:15 GMT)
Humanoid Occupancy: Enabling A Generalized Multimodal Occupancy Perception System on Humanoid Robots [50.1] ヒューマノイドロボット技術は急速に進歩しており、メーカーは特定のシナリオに合わせて様々な視覚認識モジュールを導入している。
総合的な環境理解に不可欠なリッチなセマンティック情報と3D幾何学情報の両方を提供するため、占有率に基づく表現はヒューマノイドロボットに特に適していると広く認識されている。
本稿では,ハードウェアとソフトウェアコンポーネントを統合した汎用マルチモーダル占有認識システムであるHumanoid Occupancy,データ取得装置,専用のアノテーションパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:47:00 GMT)
Parameter-Efficient Fine-Tuning in Spectral Domain for Point Cloud Learning [49.9] 我々は,ポイントクラウドのための新しい固有textbfPointGST (textbfGraph textbfSpectral textbfTuning) 法を提案する。
ポイントGSTは事前訓練されたモデルを凍結し、スペクトル領域の微調整パラメータのための軽量で訓練可能なポイントクラウドスペクトルアダプタ(PCSA)を導入する。
さまざまなタスクにわたる挑戦的なポイントクラウドデータセットの実験では、ポイントGSTが完全に微調整されたデータセットを上回るだけでなく、トレーニング可能なパラメータも大幅に削減されていることが示されている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:22:45 GMT)
Cognitive Chain-of-Thought: Structured Multimodal Reasoning about Social Situations [49.2] CoT(Chain-of-Thought)は、モデルを段階的に考えるのに役立つ。しかし、彼らが見、理解し、一度に判断しなければならないと、どうなるのか?
認知的連鎖(CoCoT)は,認知にインスパイアされた3つの段階(知覚,状況,規範)を通じて,VLM推論を足場とする促進戦略である。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:40:30 GMT)
RESCUE: Crowd Evacuation Simulation via Controlling SDM-United Characters [48.4] 現在の避難モデルは、避難中に起こる複雑な人間の行動を見渡す。
本研究では,3次元適応型SFM(Social Force Model)決定機構とパーソナライズされた歩行制御モータを統合したリアルタイム3次元集団避難シミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:50:18 GMT)
A Unified Image-Dense Annotation Generation Model for Underwater Scenes [48.3] 本稿では,水中のシーンに対して,テキスト・ツー・イメージ・デンスアノテーションを統一的に生成する手法を提案する。
テキストのみを入力とし、リアルな水中画像と高度に一貫性のある複数のアノテーションを同時に生成する。
TIDEを用いて大規模な水中データセットを合成し,水中密集予測における手法の有効性を検証した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:53:41 GMT)
Algebras of actions in an agent's representations of the world [46.7] 我々は、対称性に基づく非交叉表現学習形式から対称性に基づく表現を再現するために、我々のフレームワークを使用する。
次に、簡単な強化学習シナリオで発生する特徴を持つ世界の変換の代数について研究する。
私たちが開発した計算手法を用いて、これらの世界の変換の代数を抽出し、それらの性質に応じてそれらを分類する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:54:59 GMT)
Is Crunching Public Data the Right Approach to Detect BGP Hijacks? [46.6] ボーダーゲートウェイプロトコル(BGP)は、インターネットルーティングの脆弱な柱であり続けている。
DFOHやBEAMといった最近のアプローチでは、グローバルに分散したBGPモニターからのデータ分析に機械学習(ML)を採用している。
本稿では、DFOHやBEAMのような最先端のハイジャック検出システムは、データ中毒に対して脆弱であることを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:35:21 GMT)
GT-Mean Loss: A Simple Yet Effective Solution for Brightness Mismatch in Low-Light Image Enhancement [40.5] 低照度画像強調(LLIE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。
監督されたLLIE研究では、拡張された画像の全体的な明るさと、その根底にある真実との矛盾が、しばしば見過ごされがちである。
本稿では,GT平均損失(GT平均損失)を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:54:28 GMT)
LUDVIG: Learning-Free Uplifting of 2D Visual Features to Gaussian Splatting Scenes [39.7] 本稿では,3次元シーンのガウススプラッティング表現に2次元画像特徴を引き上げる新しい手法を提案する。
本手法は,グラフ拡散機構により拡張された,よりシンプルで効率的な特徴集約手法を用いる。
提案手法は,複数のダウンストリームタスクにおける技術状況に匹敵する性能を達成しつつ,大幅な高速化を実現している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:59:31 GMT)
SciToolAgent: A Knowledge Graph-Driven Scientific Agent for Multi-Tool Integration [39.4] SciToolAgentは生物学、化学、材料科学にまたがる何百もの科学ツールを自動化する。
エージェントはまた、責任と倫理的ツールの使用を保証するために、包括的な安全チェックモジュールも組み込んでいる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:55:35 GMT)
Motion Keyframe Interpolation for Any Human Skeleton via Temporally Consistent Point Cloud Sampling and Reconstruction [37.8] Point Cloud-based Motion Representation (PC-MRL)は、運動学習のための骨格間の相互互換性を実現するための教師なしのアプローチである。
PC-MRLは、時間点雲サンプリングを用いた骨格難読化戦略と、点雲からの教師なし骨格復元法からなる。
我々は、制御されていないクラウド・ツー・骨格運動プロセスに必要な制限を克服するために、第1フレームオフセット準位(FOQ)とRPA(Rest Pose Augmentation)戦略を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:47:19 GMT)
TurboSpec: Closed-loop Speculation Control System for Optimizing LLM Serving Goodput [37.6] 大規模言語モデル (LLM) システムは、効率的なサービスを実現するために、同時ユーザー要求をバッチ化する。
本稿では,実行環境を自動的にプロファイリングする投機制御システムTurboSpecを提案する。
さまざまなワークロードとハードウェア構成にまたがって、その効果を実証します。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:20:41 GMT)
When Does Metadata Conditioning (NOT) Work for Language Model Pre-Training? A Study with Context-Free Grammars [34.8] 潜在意味論は、言語モデルのパフォーマンスを決定する重要な特性の1つです。
この機能を呼び出すための便利なアプローチの1つは、事前トレーニングデータのテキストの開始時にメタデータをプリペンドすることである。
メタデータを用いたトレーニングは、与えられたコンテキストが遅延セマンティクスを推測するのに十分な時間である場合に、モデルの性能を向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 05:42:28 GMT)
ViewSRD: 3D Visual Grounding via Structured Multi-View Decomposition [34.4] 3Dビジュアルグラウンドティングは、テキスト記述に基づいて、オブジェクトを3D空間で特定し、ローカライズすることを目的としている。
構造化多視点分解プロセスとして3次元視覚グラウンドを定式化するフレームワークであるViewSRDを提案する。
3次元視覚的グラウンドデータセットの実験により、ViewSRDは最先端の手法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:20:54 GMT)
On the Role of Discrete Representation in Sparse Mixture of Experts [33.8] VQMoE(Vector-Quantized Mixture of Experts)と呼ばれる新しいアーキテクチャを提案する。
VQMoEは計算コストを増大させることなく、モデルキャパシティをスケールアップするための効果的なソリューションである。
VQMoEは,他のSMoEルーティング方式と比較して,ルータの28%の改善を実現している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:26:08 GMT)
Motion-example-controlled Co-speech Gesture Generation Leveraging Large Language Models [33.6] 我々は,大規模言語モデル(LLM)を活用して,動きのサンプル制御による協調音声ジェスチャ生成のためのフレームワークMECoを提案する。
本手法は,音声認識と動作例を同時に解釈するための微調整により,LLMの理解能力を活用する。
我々のフレームワークは、個々の身体部分のきめ細かい制御を可能にし、モーションクリップ、静的ポーズ、ヒューマンビデオシーケンス、テキスト記述など、多様な入力モダリティに対応している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:59:29 GMT)
Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training [33.6] アクションベースのコントラスト自己学習は、多ターン会話モデリングにおけるデータ効率のよい対話ポリシー学習を可能にする。
動作ラベルがない場合でも、データ効率のよいチューニングシナリオにおいてACTの有効性を実証する。
また,会話におけるあいまいさを暗黙的に認識し,説明できるかどうかを調べることで,LLMが会話エージェントとして機能する能力を評価することを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:59:06 GMT)
Synomaly Noise and Multi-Stage Diffusion: A Novel Approach for Unsupervised Anomaly Detection in Medical Images [33.0] 医用画像における異常検出は、様々な画像モダリティにおける病理領域の同定において重要な役割を担っている。
本研究では,合成ノイズ関数と多段階拡散過程を組み込んだ拡散モデルに基づく新しい教師なし異常検出フレームワークを提案する。
脳MRI,肝CT,頸動脈USデータセットに対する提案手法の検証を行った。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:59:42 GMT)
Retrieval and Distill: A Temporal Data Shift-Free Paradigm for Online Recommendation System [31.6] 現在のレコメンデーションシステムは、時間的データシフトの深刻な問題によって大きく影響を受ける。
既存のモデルのほとんどは、データのシフトから学ぶことのできる、転送可能な一時的なデータシフトのない情報を見渡すことで、更新データの利用に重点を置いている。
そこで本研究では,データシフトのない関連ネットワークを,シフトデータを用いてトレーニング可能な検索ベースレコメンデーションシステムフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:23:00 GMT)
Self-Regularization with Sparse Autoencoders for Controllable LLM-based Classification [29.7] 大規模言語モデル(LLM)潜在空間における意図しない特徴を特定し,規則化する新しいフレームワークを提案する。
本稿では,有毒なチャット検出,報酬モデリング,疾患診断を含む3つの実世界の課題に関する枠組みについて検討する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:44:09 GMT)
Length Representations in Large Language Models [29.5] 本研究では,大言語モデルの内部表現に出力シーケンス長情報をエンコードする方法に関する実証的証拠を提供する。
モデル内の特定の隠蔽単位をスケーリングすることにより、生成したテキストの情報量を失うことなく、出力シーケンス長を制御できる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:41:39 GMT)
CTR-Driven Ad Text Generation via Online Feedback Preference Optimization [28.7] 大規模言語モデル(LLM)は、手動の広告テキスト作成よりも効率性が高い。
LLMは人造テキストよりも高いCTR性能を保証していない。
オンラインフィードバックからの好みの最適化によってCTRを最適化する新しい広告テキスト生成手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:13:03 GMT)
IQ Test for LLMs: An Evaluation Framework for Uncovering Core Skills in LLMs [27.3] 本稿では,因子分析を用いて,ベンチマーク間での潜在スキルの駆動性能を推定する新しい評価パラダイムを提案する。
これらの洞察を、冗長なタスクを識別し、モデル選択を支援し、各潜伏するスキルに沿ってプロファイルモデルをプロファイルする実践的なツールに変換する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:11:16 GMT)
When Tokens Talk Too Much: A Survey of Multimodal Long-Context Token Compression across Images, Videos, and Audios [27.2] MLLM(Multimodal large language model)は、より長く複雑なコンテキストを処理する。
トークン圧縮は、トレーニングと推論の両方でトークンの数を効率的に削減する、目立たしく批判的なアプローチとして登場した。
本稿では,マルチモーダル長コンテキストトークン圧縮の発芽領域に関する最初の体系的調査と合成について述べる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:33:56 GMT)
CP-LLM: Context and Pixel Aware Large Language Model for Video Quality Assessment [25.1] CP-LLM(Context and Pixel aware Large Language Model)を紹介する。
CP-LLMは、言語デコーダとともに、高レベル(ビデオコンテキスト)と低レベル(ピクセル歪み)の粒度の両方で知覚品質を独立に解析するために設計されたデュアルビジョンエンコーダを備えている。
実験により, CP-LLMは, 確立されたVQAベンチマーク上での最先端のクロスデータセット性能と, 画素歪みに対する優れたロバスト性を実現することを示した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:40:21 GMT)
When Prompts Go Wrong: Evaluating Code Model Robustness to Ambiguous, Contradictory, and Incomplete Task Descriptions [23.6] LLM(Large Language Models)は、理想的な条件下でのコード生成タスクの性能を示す。
実際には、タスク記述はしばしば曖昧さ、不完全性、内部矛盾を示す。
このような不明瞭なタスク記述に直面した場合、最先端のコード生成モデルの堅牢性を検証した最初の実証的研究を示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 23:16:14 GMT)
ELMES: An Automated Framework for Evaluating Large Language Models in Educational Scenarios [23.5] 大規模言語モデル(LLM)は、多くの新しいアプリケーションシナリオを生成する、教育の変革的な機会を提供する。
現在のベンチマークは、教育能力よりも一般知能を主に測定している。
本研究では,オープンソースの自動評価フレームワークであるEMMESを紹介した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:20:19 GMT)
Vidar: Embodied Video Diffusion Model for Generalist Bimanual Manipulation [21.4] アクション推論のためのビデオ拡散(Vidar)について紹介する。
実世界の3つのロボットプラットフォームから、750Kのマルチビュービデオ上で、ビデオ拡散モデルを事前訓練する。
ロボットプラットフォーム上での人間によるデモはわずか20分で終わるが、Vidarは目に見えないタスクや背景を、強力なセマンティックな理解で一般化する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:48:18 GMT)
Come Together, But Not Right Now: A Progressive Strategy to Boost Low-Rank Adaptation [21.1] 低ランク適応(LoRA)は,大規模基盤モデルに適応するためのパラメータ効率の高い微調整手法として登場している。
微調整の過程でアダプタのアクティベーション確率を徐々に高めるプログレッシブトレーニング戦略であるCoToプルーニングを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:06:57 GMT)
GuidedQuant: Large Language Model Quantization via Exploiting End Loss Guidance [21.1] トレーニング後の量子化は、大規模言語モデルのメモリと推論遅延を低減するための重要なテクニックである。
本稿では,エンドロスからの勾配情報を量子化対象に組み込む新しい量子化手法である GuidedQuant を提案する。
GuidedQuantは、ウェイトオンリーのスカラー、ウェイトオンリーのベクトル、ウェイト・アンド・アクティベーションの量子化にまたがる最先端の量子化手法の性能を一貫して向上させる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:06:56 GMT)
Integrating LLM-Derived Multi-Semantic Intent into Graph Model for Session-based Recommendation [20.1] セッションベースのレコメンデーション(SBR)は主に匿名ユーザインタラクションシーケンスに基づいている。
本稿では,セッションベースレコメンデーション(LLM-DMsRec)のためのグラフモデルへのLLM-Derived Multi-Semantic Intentと呼ばれる新しいSBRアプローチを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:54:00 GMT)
Point Cloud Self-supervised Learning via 3D to Multi-view Masked Learner [19.9] 本稿では,3次元と投影された2次元特徴から点雲と多視点画像を再構成する3次元から多視点自動エンコーダを提案する。
2次元と3次元の表現を整合させる新しい2段階の自己学習戦略が提案されている。
提案手法は,3次元分類,部分分割,オブジェクト検出など,さまざまな下流タスクにおいて,最先端のタスクよりも優れる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:46:18 GMT)
A Free Probabilistic Framework for Analyzing the Transformer-based Language Models [19.8] 本稿では,自由確率理論を用いたトランスフォーマーに基づく言語モデル解析のための形式的演算子理論フレームワークを提案する。
この研究は、理論上は大きな言語モデルにおける構造力学に関する原則的視点を提供する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:04:17 GMT)
Measuring and Explaining the Effects of Android App Transformations in Online Malware Detection [19.4] マルウェア検出に対するアプリ変換の効果を測定するためのデータ駆動型手法を提案する。
トレース可能な変更を伴う多数のAndroidアプリを生成するために、6つのアプリ変換テクニックが実装されている。
最後に,シグネチャベース,静的解析ベース,動的解析ベース検出技術の観点から,抗ウイルスエンジンの包括的解析を行う。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:26:50 GMT)
GenM$^3$: Generative Pretrained Multi-path Motion Model for Text Conditional Human Motion Generation [19.3] Generative Pretrained Multi-path Motion Model (GenM(3))は、統合された動き表現を学習するための包括的なフレームワークである。
大規模なトレーニングを可能にするため、11の高品質なモーションデータセットを統合し、統合する。
GenM(3)はHumanML3Dベンチマークで0.035の最先端のFIDを達成し、最先端のメソッドを大きなマージンで上回る。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:52:01 GMT)
Interpretable Anomaly-Based DDoS Detection in AI-RAN with XAI and LLMs [19.3] 次世代無線アクセスネットワーク(RAN)は、インテリジェントコントローラを通じてプログラム可能性、インテリジェンス、およびほぼリアルタイム制御を導入する。
本稿では,Large Language Models (LLMs) による将来のRAN環境に対する XAI 侵入検知(IDS) の機会,課題,研究ギャップを概説する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:16:09 GMT)
Intersectional Bias in Japanese Large Language Models from a Contextualized Perspective [19.2] 本研究では,大規模言語モデル(LLM)における交叉バイアスを評価するために,JBBQ間ベンチマークを構築した。
JBBQ による GPT-4o と Swallow の分析により,社会的属性の等しい組み合わせであっても,その文脈によってバイアス出力が変化することがわかった。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:14:26 GMT)
EvoSLD: Automated Neural Scaling Law Discovery With Large Language Models [18.7] スケーリング法則は、ニューラルネットワークのパフォーマンスの進化を予測する基本的な数学的関係である。
本稿では,Scaling Law Discoveryの自動化フレームワークであるEvoSLDを紹介する。
EvoSLDは、グループ化されたデータサブセットへの適合エラーを最小限に抑える、同義で普遍的な機能形式を探索する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 05:45:26 GMT)
Semi-Supervised Risk Control via Prediction-Powered Inference [14.9] リスク制御予測セット(RCPS)は、任意の機械学習モデルの出力を変換し、厳密なエラー率制御で予測ルールを設計するツールである。
ラベルのないデータを利用してハイパーパラメータを厳格に調整する半教師付きキャリブレーション手法を導入する。
提案手法は予測駆動型推論フレームワーク上に構築され,リスク管理タスクに慎重に適合する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:11:11 GMT)
Goal Alignment in LLM-Based User Simulators for Conversational AI [14.8] ユーザシミュレータは対話型AIにとって不可欠であり、シミュレートされたインタラクションを通じてスケーラブルなエージェント開発と評価を可能にする。
UGST(User Goal State Tracking)は,会話を通じてユーザ目標の進行を追跡する新しいフレームワークである。
本稿では,目標の進捗を自律的に追跡し,目標に沿った応答を生成するユーザシミュレータを開発するための3段階の方法論を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:07:12 GMT)
Fine-structure Preserved Real-world Image Super-resolution via Transfer VAE Training [14.1] 我々は、事前訓練されたUNetに適応しつつ、8$times$ダウンサンプルのVAEを4$times$1に転送するためのTransfer VAE Training(TVT)戦略を提案する。
TVT戦略は、新しいエンコーダとデコーダのペアを元のVAEラテント空間と整合させ、画像の細部を拡大する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 14:11:29 GMT)
MIRepNet: A Pipeline and Foundation Model for EEG-Based Motor Imagery Classification [12.6] 脳コンピュータインタフェース(BCI)は、脳と外部デバイス間の直接通信を可能にする。
最近の脳波基礎モデルは、多様なBCIパラダイムにわたる一般化された表現を学習することを目的としている。
本稿では,運動画像パラダイムに適した脳波基礎モデルMIRepNetを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:54:42 GMT)
Second Competition on Presentation Attack Detection on ID Card [12.6] 20チームが登録され、74のモデルが提出された。
トラック1では、Dragonsチームが平均ランキングとEERで40.48%、EERが11.44%で1位となった。
トラック2のより困難なアプローチでは、"Incode"チームは14.76%と6.36%のAVランクで最高の結果に達し、それぞれ74.30%と21.87%のEERの第一版の結果を改善した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:18:52 GMT)
Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning [12.5] 本稿では,Agensar-Fin-R1シリーズを紹介する。
我々の最適化手法は、高品質で体系的な金融タスクラベルシステムを統合する。
われわれのモデルは、主要な金融指標を総合的に評価している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:53:23 GMT)
Dual Frequency Branch Framework with Reconstructed Sliding Windows Attention for AI-Generated Image Detection [12.5] GAN(Generative Adversarial Networks)と拡散モデルにより、高度にリアルな合成画像の作成が可能になった。
GAN(Generative Adversarial Networks)と拡散モデルにより、高度にリアルな合成画像の作成が可能になった。
AI生成画像の検出は、重要な課題として浮上している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:19:53 GMT)
TADT-CSA: Temporal Advantage Decision Transformer with Contrastive State Abstraction for Generative Recommendation [11.3] Decision Transformer (DT) はシーケンシャルなレコメンデーションタスクに適用される軽量な生成モデルである。
コントラスト状態抽象化(TADT-CSA)モデルを用いたテンポラルアドバンテージ決定変換器を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:36:13 GMT)
Language Models Resist Alignment: Evidence From Data Compression [11.2] 大型言語モデル(LLM)は意図しないあるいは望ましくない振る舞いを示すことがある。
微調整が事前学習に対するアライメントを著しく損なうことを示す。
本研究は,LLMの弾性特性に対処し,アライメントに対する抵抗を緩和する必要性を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 04:16:42 GMT)
MambaMap: Online Vectorized HD Map Construction using State Space Model [11.2] MambaMapは、オンラインベクター化されたHDマップを構築するために、状態空間の長い時間的特徴を効率的に融合する新しいフレームワークである。
具体的には、MambaMapにはメモリバンクが組み込まれており、過去のフレームから情報を保存して活用している。
さらに,BEVとインスタンスレベルの特徴抽出を強化するために,革新的な多方向・時空間走査方式を設計する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:09:27 GMT)
Two Views, One Truth: Spectral and Self-Supervised Features Fusion for Robust Speech Deepfake Detection [11.1] 合成音声の最近の進歩は、音声のディープフェイクをますます現実的なものにし、重大なセキュリティリスクを生じさせている。
生波形の埋め込みやスペクトルに基づく特徴など、単一モードに依存する既存の検出方法は、非スプーフ障害に対して脆弱である。
自己教師付き学習(SSL)に基づく表現と手作りのスペクトル記述子を統合するハイブリッド融合フレームワークについて検討する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:22:27 GMT)
Aggregation-aware MLP: An Unsupervised Approach for Graph Message-passing [10.9] AMLP"は、アグリゲーション関数を直接作成することから適応アグリゲーションへとパラダイムをシフトする、教師なしのフレームワークである。
提案手法は2つの重要なステップから構成される: まず、高次グルーピング効果を促進するグラフ再構成を利用する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 04:52:55 GMT)
Awesome-OL: An Extensible Toolkit for Online Learning [10.8] Awesome-OLは、オンライン学習研究に適したPythonツールキットである。
再現可能な比較、ベンチマークデータセットのキュレーション、マルチモーダルビジュアライゼーションのための統一されたフレームワークを提供する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:34:37 GMT)
TIB-STC: A Large-Scale Structured Tibetan Benchmark for Low-Resource Language Modeling [10.8] 我々は,大規模言語モデル(LLM)の開発と評価を支援するために設計された,最初の大規模,専門家による,マルチドメインベンチマークであるTIB-STCを提案する。
我々は、事前訓練、教師付き微調整、優先最適化を含む3段階のパイプラインを通して、TIB-STC上でSun-Shineという参照モデルを訓練する。
Ti-MMLUやTi-SafetyBenchを含むチベット固有のタスクに対するTLUEベンチマークの評価は、堅牢な指示追従と文化的に整合した生成を可能にするためのベンチマークの有効性を示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 05:18:25 GMT)
Understanding Learner-LLM Chatbot Interactions and the Impact of Prompting Guidelines [9.8] 本研究は,学習者とAIの相互作用を,参加者が効果的なプロンプトの構造化指導を受ける教育実験を通して調査する。
ユーザの行動を評価し,有効性を促進するために,107人のユーザから642のインタラクションのデータセットを解析した。
我々の研究は、ユーザーが大規模言語モデルとどのように関わり、AI支援コミュニケーションを強化するための構造化された指導の役割についてより深く理解している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:03:49 GMT)
T$^\text{3}$SVFND: Towards an Evolving Fake News Detector for Emergencies with Test-time Training on Short Video Platforms [9.7] テストタイムトレーニング(TTT)を用いた新しいフェイクニュースビデオ検出フレームワーク(T$3$SVFND)を提案する。
具体的には、テキスト中の単語の一定割合を隠蔽するマスク言語モデリング(MLM)に基づく自己教師型補助タスクを設計する。
テストタイムトレーニングフェーズでは、モデルが補助的なタスクを通じてテストデータの分散に適応する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 14:04:00 GMT)
AnimeColor: Reference-based Animation Colorization with Diffusion Transformers [9.6] アニメーションのカラー化はアニメーション制作において重要な役割を担っているが、既存の手法では色精度と時間的一貫性を達成するのに苦労している。
We propose textbfAnimeColor, a novel reference-based animation colorization framework using Diffusion Transformers (DiT)。
提案手法はスケッチシーケンスをDiTに基づくビデオ拡散モデルに統合し,スケッチ制御によるアニメーション生成を可能にする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:25:08 GMT)
ResCap-DBP: A Lightweight Residual-Capsule Network for Accurate DNA-Binding Protein Prediction Using Global ProteinBERT Embeddings [9.6] 本稿では,残差学習に基づくエンコーダと1次元カプセルネットワークを組み合わせた新しいディープラーニングフレームワークResCap-DBPを提案する。
ProteinBERTの埋め込みは、大きなデータセット上の他の表現を大幅に上回る。
我々のモデルは、常に現在の最先端の手法より優れています。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:54:32 GMT)
ABQ-LLM: Arbitrary-Bit Quantized Inference Acceleration for Large Language Models [9.4] 本稿では,新しい任意のビット量子化アルゴリズムと推論フレームワークであるABQ-LLMを紹介する。
様々な量子化設定において優れた性能を実現し、GPU上で効率的な任意の精度の量子化推論を可能にする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:44:00 GMT)
From Gallery to Wrist: Realistic 3D Bracelet Insertion in Videos [8.4] 2次元拡散モデルは、フォトリアリスティックな編集を作成することを約束している。
従来の3Dレンダリング手法は空間的・時間的整合性が優れているが、フォトリアリスティック照明を実現するには不十分である。
これは、ビデオオブジェクト挿入のための3次元レンダリングと2次元拡散を相乗化するための最初のアプローチである。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:49:07 GMT)
A Multi-Agent System for Information Extraction from the Chemical Literature [8.3] 化学情報の自動抽出のためのマルチモーダル大規模言語モデル(MLLM)に基づくマルチエージェントシステムを開発した。
文献からの複雑な化学反応画像のベンチマークデータセットでは,F1スコアが80.8%に達した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:16:57 GMT)
Multi-Agent Retrieval-Augmented Framework for Evidence-Based Counterspeech Against Health Misinformation [8.2] 健康情報に対する反響を生成するための多エージェント検索フレームワークを提案する。
提案手法は静的および動的エビデンスを統合し,生成した反音声が関連性,良好,最新であることを保証する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 18:11:34 GMT)
Can Foundation Models Predict Fitness for Duty? [8.2] 本研究は,業務適応度予測におけるディープラーニングと基礎モデルの適用性について検討する。
それは、仕事の警戒度を決定することに関連する主観的条件として定義される。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:26:12 GMT)
Improving the trainability of VQE on NISQ computers for solving portfolio optimization using convex interpolation [8.2] ポートフォリオ最適化のための凸性を利用して変動量子固有解器(VQE)の訓練性を向上させる。
凸に基づいて、基底状態の位置はヒルベルト空間における基底状態の小さな部分集合の性質を学ぶことによって評価することができる。
超伝導量子ビットを用いた40ドルの量子ビット実験を成功裏に実施し,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:41:57 GMT)
NeuroVoxel-LM: Language-Aligned 3D Perception via Dynamic Voxelization and Meta-Embedding [8.1] 我々は,NeuroVoxel-LMを提案する。NeuroVoxel-LMは,Neural Radiance Fields(NeRF)と動的解像度のボキセル化と軽量メタ埋め込みを統合した新しいフレームワークである。
具体的には、幾何学的および構造的複雑さに基づいてボクセルを適応的に調整する動的分解能多スケールボクセル化(DR-MSV)技術を導入する。
また,注目度に基づく重み付けと残差融合による意味表現を強化する軽量メタ埋め込み(TAP-LME)機構を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:11:08 GMT)
Communication-Efficient Distributed Training for Collaborative Flat Optima Recovery in Deep Learning [7.9] 作業員が協力して広義のミニマを求めることを奨励する軽量レギュレータを導入する。
レギュラーライザは、労働者をまとめて引き寄せるコンセンサスステップに反するプッシュフォースを実行する。
DPPFは他の通信効率の高い手法よりも優れ、局所的な手法よりも優れた一般化性能を示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:49:49 GMT)
How to Save My Gas Fees: Understanding and Detecting Real-world Gas Issues in Solidity Programs [7.9] スマートコントラクトの実行は、その計算とデータストレージに対するガス料金と呼ばれる手数料を発生させる。
プログラマがスマートコントラクトを開発すると、不要により多くのガス料金を発生させるようなコードを書くことができます。
本論文は,ユーザが2つの重要なステップでガス料金を削減できるようにするためのイニシアチブである。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:06:10 GMT)
SoK: Root Cause of \$1 Billion Loss in Smart Contract Real-World Attacks via a Systematic Literature Review of Vulnerabilities [7.5] 我々は、スマートコントラクトの脆弱性と、現実世界のハイインパクトな財務損失の根本原因を理解することに重点を置いています。
2022年から2025年の間に、最も厳しい現実世界の悪用のうち50件について、詳細な実証分析を行いました。
実世界で成功した攻撃は、プロトコルロジック設計、(2)ガバナンス、(3)外部依存関係、(4)従来の実装バグの4つのティアのうちの1つに遡る。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:33:56 GMT)
CONCAP: Seeing Beyond English with Concepts Retrieval-Augmented Captioning [7.4] 検索したキャプションと画像固有の概念を統合する多言語画像キャプションモデルであるConCAPを紹介する。
XM3600データセットの実験は、CONCAPが低級および中級の言語で強力なパフォーマンスを実現することを示唆している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:00:02 GMT)
Beyond Self-Repellent Kernels: History-Driven Target Towards Efficient Nonlinear MCMC on General Graphs [7.4] 我々はマルコフ・チェイン・モンテカルロ(MCMC)における履歴駆動型目標(HDT)フレームワークを提案し、離散状態空間におけるランダムウォークアルゴリズムを改善する。
また,HDTは,現在の状態と提案状態の局所的な情報のみを必要とすることにより,軽量な実装を保っていることを示す。
グラフサンプリング実験は、一貫したパフォーマンス向上を示し、メモリ効率の高いLRUキャッシュは、大規模な汎用グラフへのスケーラビリティを保証する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 00:40:47 GMT)
Contrast-CAT: Contrasting Activations for Enhanced Interpretability in Transformer-based Text Classifiers [7.4] 本稿では,新しいアクティベーションコントラストに基づく属性法であるContrast-CATを提案する。
クラス非関連機能をフィルタリングすることでトークンレベルの属性を洗練します。
実験の結果、Contrast-CATは最先端の手法よりも一貫して優れていたことが確認された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:53:01 GMT)
MASQUE: A Text-Guided Diffusion-Based Framework for Localized and Customized Adversarial Makeup [5.5] 我々は,ユーザ定義のテキストプロンプトで導かれる局所的な対角化粧を生成する新しい拡散ベースのフレームワークであるMASQUEを開発する。
以上の結果から,MASQUEはすべてのベースラインに対するドッジ成功率を大幅に向上し,知覚的忠実度が向上し,テキストメイクプロンプトへの適応性が向上することが示された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 14:36:55 GMT)
Memorization: A Close Look at Books [5.4] Llama 370Bのモデルを使って、最初の500個のトークンから1冊の本を自動で再構築しました。
本書の抽出率は本の人気と相関し,学習データに重複する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:54:29 GMT)
GQSA: Group Quantization and Sparsity for Accelerating Large Language Model Inference [5.4] Group Quantization and Sparse Acceleration (GQSA)は、LLMに適した新しい圧縮技術である。
圧縮モデルの性能優位性を保証するための2段階スパース最適化手法を提案する。
実験の結果、GQSA W4S50%圧縮設定の下では、モデルの精度は2:4プルーニングとW2量子化の両方を上回ることがわかった。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:52:56 GMT)
Density Ratio Estimation-based Bayesian Optimization with Semi-Supervised Learning [5.3] この課題を解決するために,半教師付き学習を用いた密度比推定に基づくベイズ最適化を提案する。
本手法の実証的な結果といくつかの基本手法を,未ラベルの点サンプリングと固定サイズのプールを持つ2つの異なるシナリオで示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:20:30 GMT)
SETOL: A Semi-Empirical Theory of (Deep) Learning [4.4] 本稿では,SETOL(SemiEmpirical Theory of Learning)を用いて,SETOL(State-Of-The-Art)ニューラルネット(NN)の性能について述べる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:57:45 GMT)
RadMamba: Efficient Human Activity Recognition through Radar-based Micro-Doppler-Oriented Mamba State-Space Model [4.2] 本稿では,レーダベースHARに特化して,パラメータ効率の高いマイクロドップラー指向のMamba SSMであるRadMambaを紹介する。
3つの多様なデータセットの中で、RadMambaは前モデルの99.8%の分類精度でトップパフォーマンスのモデルと一致している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:17:30 GMT)
A Comparative Study of OpenMP Scheduling Algorithm Selection Strategies [4.1] 我々は,OpenMPにおけるスケジューリングアルゴリズムの選択のための学習に基づくアプローチを提案し,評価する。
その結果,RL法は高い性能のスケジューリング決定を学習できることがわかった。
このアプローチはMPIベースのプログラムにも拡張可能で、並列性の複数のレベルにまたがるスケジューリング決定の最適化を可能にする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:10:30 GMT)
SAViL-Det: Semantic-Aware Vision-Language Model for Multi-Script Text Detection [4.0] 本稿では,多文テキスト検出機能を備えた意味認識型視覚言語モデルSAViL-Detを紹介する。
提案フレームワークは,テキストプロンプトから視覚的特徴への微粒な意味情報を,モーダルな注意を通して適応的に伝達する。
挑戦的なベンチマークの実験では、提案手法の有効性が示されている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:16:39 GMT)
Multi-Stage Verification-Centric Framework for Mitigating Hallucination in Multi-Modal RAG [3.9] 本稿では, KDD Cup 2025 Meta Comprehensive RAG Benchmark for Multi-modal, Multi-turn (CRAG-MM) のチーム CRUISE による技術ソリューションを提案する。
この課題は、視覚言語モデル(VLM)の重要な限界、すなわち幻覚への適合性に対処することを目的としている。
本ソリューションでは,効率向上のための軽量なクエリルータ,クエリ対応検索と要約パイプライン,デュアルパス生成,ポストホック検証を統合した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 05:45:45 GMT)
Multi-Attention Stacked Ensemble for Lung Cancer Detection in CT Scans [3.8] 3つの事前訓練されたバックボーンは96 x 96ピクセルの入力に合わせたカスタム分類ヘッドで適合する。
2段階の注意機構は、ロジットからモデルワイドとクラスワイドの両方の重要点を学習する。
LIDC-IDRIデータセットの実験では、98.09の精度と0.9961 AUCを達成した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:03:07 GMT)
What Language(s) Does Aya-23 Think In? How Multilinguality Affects Internal Language Representations [3.7] 大規模言語モデル(LLM)は多言語タスクに優れるが、内部言語処理はあまり理解されていない。
我々は、バランスの取れた多言語データに基づいて訓練されたデコーダのみのLLMであるAya-23-8Bが、コードミックス、クローゼ、翻訳タスクをどのように処理するかを分析する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:53:45 GMT)
Foundation Models Knowledge Distillation For Battery Capacity Degradation Forecast [3.7] 本研究は,時系列基礎モデルの劣化を考慮した微調整戦略を提案する。
リリースしたCycleLife-SJTUIEデータセットの検証は、微調整されたバッテリタイマーが強力なゼロショットの一般化能力を持っていることを示している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:04:30 GMT)
MoL-RL: Distilling Multi-Step Environmental Feedback into LLMs for Feedback-Independent Reasoning [3.5] MoL-RLは、多段階EF信号を大規模言語モデルに統合する新しい訓練パラダイムである。
我々は,MoL-RLがQwen3-8Bモデルを用いて最先端性能を実現することを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:52:15 GMT)
Detection of Medial Epicondyle Avulsion in Elbow Ultrasound Images via Bone Structure Reconstruction [3.5] 野球選手によく見られる中性てんかん発作は、骨剥離と変形を伴う。
本研究は, 肘部超音波画像における内側上顎骨外転の検出のための再建的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 02:16:28 GMT)
Clustering by Attention: Leveraging Prior Fitted Transformers for Data Partitioning [3.5] メタラーニングに基づく新しいクラスタリング手法を提案する。
我々は,クラスタリングを行うために事前学習したPFN(Predior-Data Fitted Transformer Network)を用いている。
我々の手法は最先端のクラスタリング技術よりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:53:19 GMT)
Quantum Imaging of Ferromagnetic van der Waals Magnetic Domain Structures at Ambient Conditions [3.4] 2Dファンデルワールス磁性材料は、基本的な視点と潜在的な用途の両方から大きな注目を集めている。
ここでは、窒素空洞中心に基づく量子磁気顕微鏡を用いて、重要な問題に対処する。
磁化のばらつきや相互相関などの空間的に解決された測定値を用い, 遷移温度は15nm以下では明らかな依存性がなく, 顕著な拡散が認められた。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:15:25 GMT)
Distributed Learning over Arbitrary Topology: Linear Speed-Up with Polynomial Transient Time [3.2] 本研究では, ピアツーピア通信によるローカルコスト関数の和を協調的に共有する分散学習問題について検討する。
本稿では、一般的な通信グラフから抽出した2本の木を用いて、モデルパラメータと位相パラメータの両方を分散する新しいEmph Tree PushPull-(STPP)を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:22:45 GMT)
From Infants to AI: Incorporating Infant-like Learning in Models Boosts Efficiency and Generalization in Learning Social Prediction Tasks [3.1] 新たな概念の学習における初期概念の利用は,学習の効率化と学習の効率化につながることを示す。
その結果, 概念が人間的な方法で学習された場合, 出現する表現の方が有用であることが示唆された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:52:25 GMT)
Computational Advantages of Multi-Grade Deep Learning: Convergence Analysis and Performance Insights [3.0] MGDL(Multi-grade Deep Learning)は、標準のSGDL(Single-grade Deep Learning)よりも優れていることが示されている。
本研究の目的は,画像の回帰,デノイング,デブロアリングにおけるMGDLの性能に着目し,MGDLの計算上の優位性を検討することである。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:43:29 GMT)
Artificial Intelligence In Patent And Market Intelligence: A New Paradigm For Technology Scouting [3.0] 本稿では,産業R&Dにおける技術スカウトとソリューション発見を変革するAIを利用したソフトウェアプラットフォームの開発について述べる。
提案プラットフォームは,意味理解,文脈推論,ドメイン間知識抽出など,最先端のLLM機能を利用する。
このシステムは、請求書や技術的記述などの非構造化の特許文書を処理し、与えられた問題コンテキストに沿った潜在的なイノベーションを体系的に抽出する。
このプラットフォームは、特許分析に加えて、検証済みの市場ソリューションと、同様の課題に対処するアクティブな組織を特定することで、商用インテリジェンスを統合している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:22:39 GMT)
Packet-Level DDoS Data Augmentation Using Dual-Stream Temporal-Field Diffusion [2.8] DDoS(Distributed Denial of Service)攻撃に対して、最近の研究は機械学習(ML)ベースのソリューションにますます依存している。
現在の合成トレース生成法は、現生のDDoS攻撃で現れる複雑な時間パターンと空間分布を捉えるのに苦労している。
拡散モデルに基づく多視点マルチストリームネットワークトラフィック生成モデルであるDual-Stream Temporal-Field Diffusion (DSTF-Diffusion)を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:40:56 GMT)
MagicAnime: A Hierarchically Annotated, Multimodal and Multitasking Dataset with Benchmarks for Cartoon Animation Generation [2.7] マルチモーダルコントロールは、非人間的なキャラクターの複雑さ、スタイリスティックに多様な動き、きめ細かい感情のために困難である。
複数のビデオ生成タスクをサポートするために設計された大規模で階層的な注釈付きマルチモーダルデータセットであるMagicAnimeデータセットを提案する。
上記のタスクにおける様々なメソッドの比較をサポートするために,MagicAnime-Benchと呼ばれるマルチモーダルアニメーションのアニメーションベンチマークを構築した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:53:00 GMT)
Strategic Motivators for Ethical AI System Development: An Empirical and Holistic Model [2.5] 本研究の目的は,AIシステムの倫理的発展を促進するモチベータを特定し,優先することである。
20のキーモチベーターを同定し,8つのカテゴリに分類した。
Fuzzy TOPSISは、チームの多様性の促進、AIガバナンス団体の設立、監視上のリーダーの任命、データプライバシの確保など、モチベーションをランク付けした。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:49:05 GMT)
Dual-Stream Global-Local Feature Collaborative Representation Network for Scene Classification of Mining Area [2.5] 本研究では、マルチソースデータを融合して、マルチモーダルな土地被覆シーン分類データセットを構築する。
本稿では,グローバルな特徴をキーセマンティックベクトルに分解するために協調表現を利用した二分岐融合モデルを提案する。
このモデルの全体的な精度は83.63%であり、他の比較モデルよりも優れている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:45:58 GMT)
Detecting Visual Information Manipulation Attacks in Augmented Reality: A Multimodal Semantic Reasoning Approach [2.4] 拡張現実(AR)における視覚情報操作(VIM)攻撃に焦点を当てる
本稿では,これらの攻撃を,文字,フレーズ,パターン操作という3つの形式に分類し,情報置換,情報難読化,余分な誤った情報という3つの目的に分類する。
このような攻撃を検出するために,マルチモーダルなセマンティック推論フレームワークVIM-Senseを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:04:50 GMT)
CIgrate: Automating CI Service Migration with Large Language Models [2.3] 本稿では,Large Language Models (LLMs) を用いてCIマイグレーションを改善することができるかを検討する。
LLMはコード生成と変換タスクにおいて強力な機能を示している。
自動CI構成移行のためのLLMベースのフレームワークであるCIgrateを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:51:37 GMT)
From Prompt to Pipeline: Large Language Models for Scientific Workflow Development in Bioinformatics [2.2] 本研究では,現代大規模言語モデル(LLM)が正確な,完全かつ有用なバイオインフォマティクスタスクの生成を支援することができるかどうかを考察する。
各種SNP解析、RNA-seq、DNAメチル化、データ検索プラットフォームを用いてこれらのモデルを評価する。
その結果,Gemini 2.5 Flash は Galaxy の生成に優れており,DeepSeek-V3 は Nextflow で強く機能していることがわかった。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 04:08:11 GMT)
A Theory of $θ$-Expectations [2.2] 我々は、ドライバーがポイントワイズ幾何学である微分方程式のクラスのためのフレームワークを開発する。
システムのトラクタビリティは、世界的なユニークかつグローバルな存在を前提としている。
ドライバー関数に対するリプシッツ最大値写像。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:56:01 GMT)
Lessons from A Large Language Model-based Outdoor Trail Recommendation Chatbot with Retrieval Augmented Generation [2.2] 野外レクリエーション活動の人気が高まっており、屋外の道についてパーソナライズされた提案を提供するための会話型AIシステムの必要性が高まっている。
本稿では,屋外トレイルレコメンデーションチャットボットJudyの開発から学んだ予備的,実践的な教訓について述べる。
我々は、RAGに基づくレコメンデーションに関するWebベースのデータ収集、屋外トレイルデータ管理、LLMモデルパフォーマンス研究を行った。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:22:23 GMT)
Beyond Binary Moderation: Identifying Fine-Grained Sexist and Misogynistic Behavior on GitHub with Large Language Models [2.1] この研究では、GitHub上のセクシストと偽造的なコメントの12の異なるカテゴリを識別する、きめ細かいマルチクラス分類フレームワークを紹介した。
モデル性能は精度、リコール、F1スコア、マシューズ相関係数(MCC)を用いて厳密に比較した。
明確な定義と構造化された出力を持つよく設計されたプロンプトは、性差別の検出の精度と解釈可能性を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:11:27 GMT)
ADA-DPM: A Neural Descriptors-based Adaptive Noise Filtering Strategy for SLAM [2.1] 本稿では ADA-DPM という SLAM のためのニューラルディスクリプタに基づく適応ノイズフィルタリング手法を提案する。
動的物体干渉に対処するために,動的特徴点の予測とフィルタリングを行う動的ヘッドを設計する。
第2に,ノイズと非構造的特徴点の影響を軽減するため,グローバル・コンパタンス・スコアリング・ヘッドを提案する。
最後に、複数の公開データセットに対する実験的検証により、ADA-DPMの有効性が確認された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:29:18 GMT)
Bridging AI Innovation and Healthcare Needs: Lessons Learned from Incorporating Modern NLP at The BC Cancer Registry [2.0] 自然言語処理(NLP)ソリューションのデプロイは、現実的な課題を提示します。
明確なビジネス目標に基づいて問題を定義することの重要性を強調します。
実用的なモデル選択の必要性、データ品質への厳格な注意、堅牢なエラー軽減戦略を強調します。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:06:43 GMT)
The Blessing and Curse of Dimensionality in Safety Alignment [1.9] 高次元表現の呪いが大きな言語モデル(LLM)に一意に影響を及ぼすことを示す。
モデル表現を低次元部分空間に投影することで、それらの線形構造を回避しつつアライメントのための十分な情報を保持することができることを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:51:23 GMT)
Preparing graph states forbidding a vertex-minor [1.9] 測定に基づく量子コンピューティングは、準備された安定化状態に非クリフォード測定を加えることでプリフォームされる。
すべての安定化状態はグラフ状態と局所クリフォード同値であるため、グラフ状態$leftvert G rightrangle$にフォーカスすることができる。
グラフの特定の固有クラスに$G$が含まれているとき、かなり改善された境界を得る。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:32:24 GMT)
SAMwave: Wavelet-Driven Feature Enrichment for Effective Adaptation of Segment Anything Model [1.8] 我々は、ウェーブレット変換を利用して、入力データからよりリッチでマルチスケールな高周波特徴を抽出する新しい、解釈可能なアプローチであるtextbftextitSAMwaveを提案する。
4つの挑戦的低レベル視覚課題に対する経験的評価は、SAMwaveが既存の適応法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:05:23 GMT)
Cheap Learning: Maximising Performance of Language Models for Social Data Science Using Minimal Data [1.8] 近年発展してきた3つの安価な技術について概観する。
後者では、大規模言語モデルのゼロショットプロンプトの特定の事例について概観する。
我々は,すべての技術に対して優れた性能を示し,特に大規模言語モデルのプロンプトが,非常に低コストで高い精度を達成できることを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:41:42 GMT)
VESPA: Towards un(Human)supervised Open-World Pointcloud Labeling for Autonomous Driving [1.6] 本稿では,LiDARの幾何学的精度をカメラ画像のセマンティック・リッチネスと融合させるマルチモーダル・オートラベリング・パイプラインであるVESPAを紹介する。
VESPAは、新しいカテゴリの発見をサポートし、地味なアノテーションやHDマップを必要とせず、高品質な3D擬似ラベルを生成する。
Nuscenesデータセットでは、VESPAはオブジェクト発見に52.95%、マルチクラスオブジェクト検出に46.54%のAPを達成している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:39:29 GMT)
The existence of non-classical orthogonal quantum Latin squares [1.6] 我々は、等角量子ラテン四角形のような特別な性質を持つ新しい量子ラテン四角形を提唱した。
非古典的 2-イデミティブ MOQLS$(v)$, 非古典的 2, 3-MOQLS$(v)$ および非古典的 SOQLS$(v)$ の存在を確立する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:18:00 GMT)
Meta Fusion: A Unified Framework For Multimodality Fusion with Mutual Learning [1.5] 既存の戦略を特別なケースとして統一する,フレキシブルで原則化されたフレームワークであるMeta Fusionを紹介します。
深い相互学習とアンサンブル学習によって動機づけられたメタフュージョンは、モダリティにまたがる潜在表現の様々な組み合わせに基づくモデルのコホートを構築する。
我々のアプローチは潜在表現の学習においてモデルに依存しないため、各モダリティの固有の特性に柔軟に適応することができる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 00:50:29 GMT)
An Automated Deep Segmentation and Spatial-Statistics Approach for Post-Blast Rock Fragmentation Assessment [1.2] リアルタイムのインスタンスセグメンテーションを実現するために、細調整されたYOLO12l-segモデルを活用するエンドツーエンドパイプラインを導入する。
キーフラグメンテーションパターンを示す代表的な例を4つ提示する。
その結果, フレームワークの精度, 小型物体群集に対する堅牢性, および現場環境における高速自動爆風影響評価の可能性が確認された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 04:25:29 GMT)
High-Performance Parallel Optimization of the Fish School Behaviour on the Setonix Platform Using OpenMP [1.2] 本稿では,Setonix Supercomputing Platform上でのFish School Behaviour (FSB)アルゴリズムの並列最適化について詳細に検討する。
FSBアルゴリズムは自然の社会的行動パターンにインスパイアされ、反復的で計算集約的な性質のために並列化のための理想的なプラットフォームを提供する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:25:08 GMT)
Relating System Safety and Machine Learnt Model Performance [1.0] 本稿では,航空機の緊急制動システムにおいて,物体検出と警報を行う機械学習部品(MLC)について述べる。
最初の方法は、最小限の安全関連パフォーマンス要件、関連するメトリクス、およびMDCとその基盤となるディープニューラルネットワークのターゲットを導出する。
提案手法が有効であると考えられる理由について,提案手法の前提,適用可能性の制約,検証の意味を明らかにする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 05:39:54 GMT)
BioNeuralNet: A Graph Neural Network based Multi-Omics Network Data Analysis Tool [1.0] BioNeuralNetは、エンドツーエンドのネットワークベースのマルチオミクスデータ分析用に設計されたPythonフレームワークである。
複数のネットワーク構築技術、低次元表現の生成、幅広い下流分析タスクを含む、マルチオミクスネットワーク分析のすべての主要な段階をサポートする。
BioNeuralNetは、オープンソースの、ユーザフレンドリで、広範囲にドキュメント化されたフレームワークで、精密医療における柔軟で再現可能なマルチオミクスネットワーク分析をサポートするように設計されている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 23:21:04 GMT)
Practical Multi-Task Learning for Rare Conversions in Ad Tech [0.8] モデルは、すべての信号の共有表現を学習し、各タイプの個別のタスクタワーを通して専門化する。
このアプローチはテストされ、本番環境に完全にデプロイされ、オフライン(0.69%のAUCリフト)とオンラインパフォーマンス指標(2%のアクション毎のコスト削減)の両方で一貫した改善が示された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:28:27 GMT)
Survey of NLU Benchmarks Diagnosing Linguistic Phenomena: Why not Standardize Diagnostics Benchmarks? [0.7] 自然言語理解(NLU)は自然言語処理(NLP)の基本課題である
NLU能力の評価は、ここ数年で研究者を惹きつける傾向にある研究トピックとなっている。
いくつかのベンチマークには、調査ときめ細かいエラー解析のために設計された診断データセットが含まれている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:30:50 GMT)
From Observations to Causations: A GNN-based Probabilistic Prediction Framework for Causal Discovery [0.7] 因果グラフの全空間にわたる確率分布を学習する新しいグラフニューラルネットワーク(GNN)に基づく確率的フレームワークを提案する。
我々のフレームワークは、ノード属性とエッジ属性の両方を統一グラフ表現に符号化するGNNを活用し、モデルがデータから直接複雑な因果構造を学習できるようにする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:36:45 GMT)
WBHT: A Generative Attention Architecture for Detecting Black Hole Anomalies in Backbone Networks [0.5] ブラックホール(BH)異常は、障害通知なしでパケットロスを引き起こし、接続を中断し、金銭的損失をもたらす。
WBHTは、生成モデリング、シーケンシャルラーニング、アテンションメカニズムを組み合わせて、BH異常検出を改善する。
実世界のネットワークデータに基づいてテストした結果、WBHTは既存のモデルを上回っ、F1スコアを大幅に改善した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 18:22:28 GMT)
EMBRACE: Shaping Inclusive Opinion Representation by Aligning Implicit Conversations with Social Norms [0.5] 本研究の目的は、アライメント評価フレームワークを導入することで、NLPや計算モデルで意見がどのように表現されるかを評価することである。
我々のアプローチは、反応のスタンスを基礎となる意見の代理としてモデル化し、多様な社会的視点を考慮し、反映した表現を可能にする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:21:07 GMT)
AutoLungDx: A Hybrid Deep Learning Approach for Early Lung Cancer Diagnosis Using 3D Res-U-Net, YOLOv5, and Vision Transformers [0.4] 本研究の目的は,肺結節の早期発見と分類のためのエンド・ツー・エンド深層学習フレームワークを提案することである。
提案するフレームワークは,3次元U-Netを改良した3次元Res-U-Netを用いた肺分画,YOLO-v5を用いた結節検出,Vision Transformerベースのアーキテクチャを用いた分類の3段階からなる。
提案したフレームワークは,低リソース環境下での肺癌検診の精度と効率を向上し,患者の予後を向上する可能性がある。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:46:12 GMT)
Software Fairness Testing in Practice [0.2] 本研究では、ソフトウェアプロフェッショナルがAIとMLプロジェクトに取り組む22人の実践者とのインタビューを通じて、公正のためにAIを活用したシステムをテストする方法について検討する。
以上の結果から,理論的公正の概念と産業実践との間に大きなギャップがあることが示唆された。
主な課題は、データ品質と多様性、時間制約、効果的なメトリクスの定義、モデルの相互運用性の確保である。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:03:52 GMT)
Jeff = 1/2 Diamond Magnet CaCo2TeO6: A Pathway toward New Spin Physics and Quantum Functions [0.2] CaCo2TeO6は、2つのOh-Co2+部位のダイヤモンド格子を特徴とする新しい材料である。
この材料は強い量子ゆらぎ、競合する磁気交換相互作用の増大、磁場誘起磁気構造のチューニング性を示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 02:33:55 GMT)
Indian Sign Language Detection for Real-Time Translation using Machine Learning [0.2] 畳み込みニューラルネットワーク(CNN)を用いた頑健でリアルタイムなISL検出・翻訳システムを提案する。
我々のモデルは総合的なISLデータセットに基づいて訓練され、99.95%の分類精度を達成し、例外的な性能を示す。
リアルタイム実装のために、このフレームワークはMediaPipeを統合して手の動きを正確に追跡し、動的ジェスチャーをシームレスに翻訳する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:15:46 GMT)
Machine Learning Model Integration with Open World Temporal Logic for Process Automation [0.1] 本稿では,各種機械学習モデルの出力をPyReasonフレームワークに直接統合する新しい手法を提案する。
一般化されたアノテート論理におけるPyReasonの基盤は、様々なMLモデルの実数値出力をシームレスに組み込むことを可能にする。
この統合は、製造業、医療、ビジネスオペレーションなど、多くの領域にまたがる実用性を見出す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 13:55:29 GMT)
Non-stabilizerness in kinetically-constrained Rydberg atom arrays [0.1] 我々は、Rydberg原子配列が、単一量子ビットを超えて広がる非安定化器性の自然貯水池を提供することを示した。
本稿では、波動関数の量子回路分解により、Rydberg非安定化器の起源を説明する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 08:02:17 GMT)
MazeEval: A Benchmark for Testing Sequential Decision-Making in Language Models [0.1] 本稿では,大規模言語モデルにおける純粋空間推論の分離と評価を目的としたベンチマークであるMazeEvalを紹介する。
我々は,英語とアイスランド語で同一の迷路にまたがる8つの最先端LLMを評価し,空間能力の言語間移動を評価する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:33:45 GMT)
DisQ: A Model of Distributed Quantum Processors [0.0] 分散量子プロセッサの最初の形式モデルとしてDisQを提案する。
DisQは分散量子プログラミング言語である。
本研究では,古典的なシミュレーション基盤に基づくシミュレーション関係を構築し,量子アルゴリズムの等価性とその分散バージョンを確認する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:04:13 GMT)
Variational Quantum Algorithm for Solving the Liouvillian Gap [0.0] 開量子系において、リウヴィリアギャップは定常状態への緩和時間を特徴づける。
本稿では,Louvillianギャップを効率的に推定するための変分量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:45:42 GMT)
Towards Generalized Parameter Tuning in Coherent Ising Machines: A Portfolio-Based Approach [0.0] Coherent Ising Machines (CIM) は、最近最適化問題を解決するための有望な計算モデルとして注目されている。
モーメント付きカオス振幅制御(CACm)アルゴリズムを用いたCIMにおけるハイパーパラメータチューニングのためのアルゴリズムポートフォリオ手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 14:18:54 GMT)
TinySQL: A Progressive Text-to-SQL Dataset for Mechanistic Interpretability Research [0.0] 本研究では,おもちゃのタスクの形式的構造と実世界の複雑さを組み合わせることで,テキスト・ツー・ジェネレーションを学習の理想的なタスクとして提案する。
最小回路の識別にはエッジパッチやスパースオートエンコーダなどの解釈可能性技術を適用する。
私たちの研究は、構造化され、段階的に複雑な設定における解釈可能性メソッドの探索と比較のための堅牢なフレームワークを提供します。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:28:05 GMT)
Time-bin qubit architecture using quantum Hall edge channels [0.0] 本稿では,量子ホールエッジチャネルに基づく時間ビン符号化量子ビットのモジュラーアーキテクチャの基本要素について述べる。
量子状態は時間分離エッジプラズマ(EMP)パケットに符号化される。
EMPプラットフォームは、完全な量子ビット演算、読み出し、エンビット接触、および干渉計接触の静電制御をサポートする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:19:49 GMT)
The Policy Cliff: A Theoretical Analysis of Reward-Policy Maps in Large Language Models [0.0] 強化学習(RL)は,大規模言語と推論モデル(LLMs/LRMs)の行動形成において重要な役割を担っている
しかし、しばしば不安定で不安定なポリシーを生み出し、急激な推論、偽りのアライメント、命令の不服従といった重大な失敗に繋がる。
本稿では,報酬関数から最適ポリシーへの写像の安定性を解析するための厳密な数学的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 06:56:10 GMT)
Testing Is Not Boring: Characterizing Challenge in Software Testing Tasks [0.0] 本研究は,ソフトウェアテストにおける課題タスクの性質と,それらがプロフェッショナルに与える影響について考察する。
我々の研究結果は、創造性、継続的な学習、時間的プレッシャーを含むタスクが、モチベーションと報奨と見なされることが多いことを示している。
挑戦や圧倒的な要求の欠如は、フラストレーションや不満を引き起こす可能性がある。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:29:17 GMT)
Technical Indicator Networks (TINs): An Interpretable Neural Architecture Modernizing Classic al Technical Analysis for Adaptive Algorithmic Trading [0.0] TIN(Technical Indicator Networks)は、従来のインジケータを複製してアップグレードする一般的なニューラルネットワークとして導入されている。
TINは、技術分析とアルゴリズム取引の基礎ロジックを新しい時代へと近代化し、現代のAIシステムの可能性を秘めた実証済み指標の遺産をブリッジする。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:47:30 GMT)
Surrogate modeling of Cellular-Potts Agent-Based Models as a segmentation task using the U-Net neural network architecture [0.0] 我々は,周期的境界条件を考慮したU-Netアーキテクチャを用いた畳み込みニューラルネットワーク(CNN)サロゲートモデルを開発した。
我々はこのモデルを用いて,生体内血管新生の研究に用いる機械的セルラーポッツモデルの評価を高速化する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:27:47 GMT)
Stochastic optimal transport in Banach Spaces for regularized estimation of multivariate quantiles [0.0] 絶対連続確率測度$mu$と$nu$の間のエントロピー最適輸送(EOT)を解く新しいアルゴリズムを提案する。
無限次元バナッハ空間でその値を取るアルゴリズムのほぼ確実に収束について研究する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:31:09 GMT)
Sparsity dependence of Krylov state complexity in the SYK model [0.0] 我々は,Sachdev-Ye-Kitaevモデル(SYK)のKrylov状態の複雑さを$N le 28$ Majorana fermions with $q$-body fermion interactionに対して検討した。
大きな温度では、k$を超えると、複雑さのピーク値は変化しない。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:35:40 GMT)
Solving Scene Understanding for Autonomous Navigation in Unstructured Environments [0.0] 本稿では,インド運転データセットのセマンティックセグメンテーションを行う。
データセットは、Cityscapesのような他のデータセットよりも難しい。
5つの異なるモデルがトレーニングされ、そのパフォーマンスは、Unionに対する平均インターセクションを使用して比較されている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:11:21 GMT)
Single-photon sources created by nature millions of years ago [0.0] 単一光子源(SPS)は、量子通信デバイスに必要な重要なコンポーネントである。
我々は、数百万年前に自然が生成した明るいダイヤモンドベースのSPSの発見を報告した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:22:13 GMT)
Set-based Implicit Likelihood Inference of Galaxy Cluster Mass [0.0] 本稿では,銀河団質量の後方分布を投影された銀河力学から推定する,集合型機械学習フレームワークを提案する。
我々のモデルは、深部集合と条件付き正規化フローを組み合わせて、銀河の位置情報と速度情報の両方を組み込む。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 18:44:41 GMT)
Reinforcement learning fine-tuning of language model for instruction following and math reasoning [0.0] コンパクト言語モデル(Qwen2.5-0.5Bベース)における強化学習手法の有効性について検討する。
本研究では, 教師付き微調整(SFT), 嗜好ラベル付きデータを用いた直接選好最適化(DPO), 報酬モデルによるReinforce Leave-One-Out(RLOO)を比較した。
実験により、DPOが強固で一貫した結果をもたらすのに対し、DeBERTaの報酬モデリングを用いたROOは最適なアライメントを実現することが示された。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 00:45:00 GMT)
Reduction-induced Variation of Partial Von Neumann Entropy [0.0] 混合状態QEとその対策は、理論と実用の両方において重要な役割を担っている。
本稿では, 部分フォン・ノイマンエントロピーの還元誘起変分法を提案し, 任意の二部体状態におけるQEを定量化する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:17:54 GMT)
Recursive KalmanNet: Analyse des capacités de généralisation d'un réseau de neurones récurrent guidé par un filtre de Kalman [0.0] Recursive KalmanNetは、Kalmanフィルタによってガイドされるリカレントニューラルネットワークである。
本稿では,アウト・オブ・ディストリビューションのシナリオにおけるその機能について考察する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 11:28:13 GMT)
Quantum Systems as Indivisible Stochastic Processes [0.0] 一般化量子対応(英語版)によれば、量子系は、確率法則と可分な法則の通常の概念に基づいて、昔ながらの設定空間に展開する過程として理解することができる。
本稿では,一般化量子対応の概念的基礎と構造について,より深く研究する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 22:08:28 GMT)
High-Precision Quantum Dynamics of He$_2$ over the b~$^3Π_\mathrm{g}$-c~$^3Σ_\mathrm{g}^+$ Electronic Subspace by including Non-adiabatic, Relativistic and QED Corrections and Couplings [0.0] 相対論的量子力学は、ヘリウム二量体のb$3Pi_mathrmg$とc$3Sigma_mathrmg+$電子状態に対して計算される。
量子核運動は、b$3Pi_mathrmg$-c$Sigma_mathrmg+$で計算される。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 09:05:57 GMT)
Graded Transformers: A Symbolic-Geometric Approach to Structured Learning [0.0] ベクトル空間上の階調変換を通じて帰納バイアスを埋め込む新しいシーケンスモデルを導入する。
Graded Transformerは階層的学習とニューロシンボリック推論のための変換ポテンシャルを持つ。
この研究は、幾何学的および代数的原理と注意機構を融合させることにより、構造化されたディープラーニングを促進する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 02:34:08 GMT)
Geometric Algebras and Fermion Quantum Field Theory [0.0] 幾何代数 $gscript (H)$ と $dimsqbracgscript (H)=2n$ を定義する。
代数 $gscript (H)$ は、部分空間として$H$ を含むヒルベルト空間である。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:25:01 GMT)
Generative Pre-training for Subjective Tasks: A Diffusion Transformer-Based Framework for Facial Beauty Prediction [0.0] 顔の美容予測(FBP)は、その主観的性質と、人間の知覚に影響を与える微妙で全体的な特徴のために難しいコンピュータビジョン課題である。
本稿では、生成モデルのパワーを活用して、優れたドメイン特化特徴抽出器を作成する新しい2段階フレームワークを提案する。
我々の手法はDiff-FBPと呼ばれ、FBP5500ベンチマークで新しい最先端技術を設定し、パーソン相関係数(PCC)0.932を達成し、汎用事前学習に基づく先行技術よりも大幅に優れていた。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 17:33:51 GMT)
From First Use to Final Commit: Studying the Evolution of Multi-CI Service Adoption [0.0] 私たちは2008年1月から2024年12月までにGitHubでホストされた18,924のJavaプロジェクトの歴史的CI採用を分析した。
分析の結果、同じプロジェクト内で複数のCIサービスを使用することは、5つに1つ近いプロジェクトで繰り返し見られるパターンであることが分かりました。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 01:32:22 GMT)
Fermionic CFTs from topological boundaries in abelian Chern-Simons theories [0.0] 場の量子論は、その物理量が時空のスピン構造に依存しない場合、ボソニック(非スピン)、それに依存する場合、フェルミオン(スピン)と呼ばれる。
我々は、ボソニックアーベル・チャーン・サイモンズ理論から生じるフェルミオン共形場理論(CFT)を探求し、位相境界条件を課すことで対称性位相場理論の役割を担っている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:40:54 GMT)
Feed-anywhere ANN (I) Steady Discrete $\to$ Diffusing on Graph Hidden States [0.0] 幾何学的解析と非線形力学を用いたデータから隠れグラフ構造を学習するための新しいフレームワークを提案する。
我々のモデルは,データ多様体のトポロジに依存した,標準的なニューラルネットワークよりも強いバウンダリを実現する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 00:35:15 GMT)
Experimental study of the distributions of off-diagonal scattering-matrix elements of quantum graphs with symplectic symmetry [0.0] 本研究では, 共振対称性とカオス波動特性を有するオープンマイクロ波ネットワークの散乱行列の非対角成分の分布について検討した。
分布で観測されたランダム行列理論の予測からの偏差は, 部分グラフが完全連結でないという事実に起因していると考えられる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:21:30 GMT)
Detection of twisted radiowaves with Rydberg atoms [0.0] 構造された電磁波の存在下でのアルカリ原子の外部電子について述べる。
Rydberg-atom-based detector of twisted radiowaves の2つの手法を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:04:45 GMT)
DYNARTmo: A Dynamic Articulatory Model for Visualization of Speech Movement Patterns [0.0] DYNARTMOは,2次元中矢状平面における音声の調音過程を可視化する動的調音モデルである。
このモデルは、UK-DYNAMOフレームワークに基づいて構築され、調音的不特定性、分節的およびジェスチャー的制御、協調の原理を統合している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 16:19:46 GMT)
Coupled Instantons In A Four-Well Potential With Application To The Tunneling Of A Composite Particle [0.0] 4つの等しいミニマを持つシステムを詳細に検討する。
時間翻訳対称性から生じるゼロモード問題は、ファデエフ・ポポフ法によって処理される。
ここでは1次元の複合粒子のトンネル化に応用する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 02:51:14 GMT)
Contrastive-KAN: A Semi-Supervised Intrusion Detection Framework for Cybersecurity with scarce Labeled Data [0.0] Kolmogorov-Arnold Network (KAN) を用いた半教師付きコントラスト学習フレームワークに基づくリアルタイム侵入検知システムを提案する。
本手法は, ラベルのないデータを利用して, 正常な動作と攻撃動作を効果的に識別する。
UNSW-NB15, BoT-IoT, Gas Pipelineの3つのベンチマークデータセットに対して,それぞれ2.20%,1.28%,8%のラベル付きサンプルを使用してアプローチを検証する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 12:55:37 GMT)
Co-NAML-LSTUR: A Combined Model with Attentive Multi-View Learning and Long- and Short-term User Representations for News Recommendation [0.0] ニュースレコメンデーションシステムは、パーソナライズされたニュースコンテンツを配信することで、情報の過負荷を軽減する上で重要な役割を果たす。
中心的な課題は、マルチビューニュース表現とユーザ興味の動的な性質の両方を効果的にモデル化することである。
本稿では,マルチビューニュースモデリングにNAMLを統合したハイブリッドニュースレコメンデーションフレームワークCo-NAML-LSTURと,ユーザの好みを捉えるLSTURを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:18:22 GMT)
Circuit simulation of readout process toward large-scale superconducting quantum circuits [0.0] 本稿では,古典回路シミュレーションに基づく量子ビットの忠実度推定手法を提案する。
このアプローチにより、標準的なラップトップコンピュータ上で10000量子ビットの超伝導量子回路の性能を評価することができる。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 01:46:50 GMT)
Biorthogonal quench dynamics of entanglement and quantum geometry in PT-symmetric non-Hermitian systems [0.0] 観測可能な量、量子幾何テンソル、および様々な絡み合い量のクエンチダイナミクスを解析する。
以上の結果から,PT崩壊相への急激な急激なクエンチは,これらの量の指数的な増加につながることが示唆された。
一般的な相互作用系とは対照的に、非相互作用性フェルミオン系に対するTTCエントロピーにおける驚くべき線形崩壊を観測する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:20:14 GMT)
Benchmarking Large Language Models for Geolocating Colonial Virginia Land Grants [0.0] バージニアの17世紀から18世紀の土地特許は、主に物語のメッツ・アンド・バウンドの記述として残っている。
本研究では、これらの散文を地理的に正確な緯度・経度座標に変換する際に、現在世代の大言語モデル(LLM)を体系的に評価する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 21:49:58 GMT)
Atom-Field-Medium Interactions III: Quantum Field-mediated Entanglement between Two Atoms near a Conducting Surface [0.0] このシリーズの第3の論文は、デコヒーレンスや絡み合いといった量子情報に関連する基本的な問題に焦点を当てている。
我々は,2つの原子間の絡み合いと,その間と導電面との間の距離の違いを考察する。
我々は、原子と磁場のカップリングから原子間のカップリングまで、どのように異なる要因が生じるかを示す。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:39:29 GMT)
Adaptive Real-Time Multi-Loss Function Optimization Using Dynamic Memory Fusion Framework: A Case Study on Breast Cancer Segmentation [0.0] 適応型マルチロス関数をリアルタイムにペナル化するための動的メモリ融合という新しいフレームワークを提案する。
乳房超音波データセットを用いた実験により,様々な測定値のセグメンテーション性能が向上した。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 10:03:47 GMT)
Absence of nontrivial local conserved quantities in the Hubbard model on the two or higher dimensional hypercubic lattice [0.0] 我々は、$dge2$を持つ$d$次元超立方体格子上の標準的なHubbardモデルが、非自明な局所保存量を認めていないことを証明した。
これは、保存量がないという白石の証明をフェルミオンモデルに拡張した最初の例である。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 02:26:58 GMT)
ASNN: Learning to Suggest Neural Architectures from Performance Distributions [0.0] ニューラルネットワーク(NN)のアーキテクチャは、その性能を決定する上で重要な役割を果たす。
ネットワーク構造と精度をマッピングする一般閉形式関数は存在しない。
NNアーキテクチャとテスト精度の関係を学習するためのモデルであるアーキテクチャ提案ネットワーク(ASNN)を提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 07:39:33 GMT)
AI-Driven Generation of Old English: A Framework for Low-Resource Languages [0.0] 古代の言語を保存することは、人類の文化的・言語的遺産を理解するのに不可欠である。
古英語は、そのアクセシビリティを現代の自然言語処理(NLP)技術に制限している。
本稿では,高度大言語モデル(LLM)を用いて,高品質な古英語テキストを生成するスケーラブルなフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 03:29:19 GMT)
AI Should Be More Human, Not More Complex [0.0] 利用者は精巧な説明よりも簡潔でソース対応の回答を圧倒的に好んでいる。
のAI開発トレンドは、システムが知識に富むように聞こえるが、真に批判的な思考が欠如している不気味な谷効果を生み出している。
我々の発見は、より複雑なAI応答がより良いパフォーマンスを示すという一般的な仮定に挑戦し、代わりに、ユーザーエンゲージメントとシステムの信頼性にとって人間のような簡潔さと透明性が鍵であることを示唆している。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 15:55:52 GMT)
A small and interesting architecture for early fault-tolerant quantum computers [0.0] 最小の興味深いカラーコードに基づく早期フォールトトレラント量子コンピュータのアーキテクチャを提案する。
Xと基地での単一量子測定と準備、単一量子アダマール(H)ゲート、および3量子制御制御Z(CCZ)ゲートで構成されている。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 19:07:12 GMT)
A Lightweight Face Quality Assessment Framework to Improve Face Verification Performance in Real-Time Screening Applications [0.0] 顔画像の品質は、顔認証システムの精度と信頼性を決定する上で重要な役割を果たす。
低画質の顔画像は、しばしば動きのぼやけ、照明条件の悪さ、極端なポーズの変化などの要因によって引き起こされ、顔認識モデルの性能を著しく低下させる。
検証パイプラインに渡す前に,低品質の顔画像の事前フィルタリングを目的とした顔品質自動評価フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 27 Jul 2025 20:09:52 GMT)