InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency [245.9] InternVL 3.5は、多目的性、推論能力、推論効率を大幅に向上させる、オープンソースの新しいマルチモーダルモデルである。
主要なイノベーションはCascade Reinforcement Learningフレームワークで、2段階のプロセスを通じて推論を強化する。
我々の最大のモデルであるInternVL3.5-241B-A28Bは、一般的なマルチモーダル、推論、テキスト、エージェントタスクにわたるオープンソースのMLLMの最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:58:17 GMT)
NVIDIA Nemotron Nano 2: An Accurate and Efficient Hybrid Mamba-Transformer Reasoning Model [205.5] Nemotron-Nano-9B-v2は、推論処理のスループットを向上させるために設計されたハイブリッドのMamba-Transformer言語モデルである。
Nemotron-Nano-9B-v2はNemotron-Hアーキテクチャをベースにしており、共通のTransformerアーキテクチャの自己保持層の大部分をMamba-2層に置き換えている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:10:44 GMT)
UQ: Assessing Language Models on Unsolved Questions [149.5] 当社では,Stack Exchangeから提供された500の難解で多様な質問を対象としたテストベッドであるUQを紹介します。
未解決の質問は、人間が答えを求めるときにしばしば難しく自然に発生する。
上位モデルは15%の質問でUQ検証をパスし、予備的な人間の検証はすでに正しい答えを同定している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:07:59 GMT)
Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI [116.8] 人工知能(Embodied AI)は、人工知能(AGI)の実現に不可欠である
本調査では,Embodied AIの最近の進歩を包括的に調査する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:20:09 GMT)
Stop Spinning Wheels: Mitigating LLM Overthinking via Mining Patterns for Early Reasoning Exit [114.8] オーバーライドは、大きな言語モデル全体のパフォーマンスを低下させる可能性がある。
推論は, 探索段階の不足, 補償推論段階, 推論収束段階の3段階に分類される。
我々は,ルールに基づく軽量なしきい値設定戦略を開発し,推論精度を向上させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:17:17 GMT)
Advancing Marine Research: UWSAM Framework and UIIS10K Dataset for Precise Underwater Instance Segmentation [110.0] 大規模な水中インスタンスセグメンテーションデータセットであるUIIS10Kを提案する。
次に,水中インスタンスの自動・高精度セグメンテーションのための効率的なモデルであるUWSAMを紹介する。
複数の水中インスタンスデータセット上での最先端手法よりも優れた性能向上を実現し,本モデルの有効性を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:43:37 GMT)
Large Language Models Meet NLP: A Survey [103.3] 大規模言語モデル(LLM)は自然言語処理(NLP)タスクにおいて印象的な機能を示している。
本研究は,以下の課題を探求することによって,このギャップに対処することを目的とする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:35:43 GMT)
Compute-Optimal Scaling for Value-Based Deep RL [99.7] オンライン価値ベースディープRLの計算スケーリングについて検討する。
解析の結果,モデルサイズ,バッチサイズ,UTD間の微妙な相互作用が明らかになった。
この現象を理解するためのメンタルモデルを提供し、バッチサイズとUTDを選択するためのガイドラインを構築します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:37:55 GMT)
VQualA 2025 Challenge on Face Image Quality Assessment: Methods and Results [96.5] VQuala 2025 顔画像品質評価(FIQA)への挑戦
本報告では,FIQAの実用化に向けた方法論と成果を概説する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:48:52 GMT)
OpenHuEval: Evaluating Large Language Model on Hungarian Specifics [90.6] OpenHuEvalはハンガリー語と特定の言語に焦点を当てた LLM の最初のベンチマークである。
OpenHuEvalは、複数の起源に由来するハンガリー固有の資料の膨大なコレクションから構築されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:17:21 GMT)
LumiSculpt: Enabling Consistent Portrait Lighting in Video Generation [88.0] ライティングは、ビデオ生成の自然性と美的品質を保証する上で重要な役割を担っている。
LumiSculptは、T2V生成モデルにおける正確で一貫した照明制御を可能にする。
LumiHumanは、画像やビデオのポートレートライティングのための新しいデータセットだ。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:08:03 GMT)
Field Matching: an Electrostatic Paradigm to Generate and Transfer Data [86.0] 本稿では,生成的モデリングと分散伝達タスクのための新しい手法を提案する。
私たちのアプローチは、電気コンデンサの物理学にインスパイアされています。
実際に,おもちゃおよび画像データ実験におけるEMFの性能を実演する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:09:45 GMT)
Detecting Knowledge Boundary of Vision Large Language Models by Sampling-Based Inference [82.6] 視覚大言語モデル(VLLM)の知識境界を検出する手法を提案する。
様々な種類の視覚質問応答データセットに対する実験結果から,本手法がVLLMの知識境界をうまく表現できることが判明した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:17:09 GMT)
Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [81.9] 本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:39:20 GMT)
FlowDubber: Movie Dubbing with LLM-based Semantic-aware Learning and Flow Matching based Voice Enhancing [81.3] Movie Dubbingは、スクリプトを、時間的および感情的な両方の面において、所定の映画クリップと整合するスピーチに変換することを目的としている。
既存の手法は、リップシンクと音響品質の重要性を無視しながら、単語エラー率の低減に重点を置いている。
ダビングのための大規模言語モデル(LLM)に基づくフローマッチングアーキテクチャであるFlowDubberを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:31:16 GMT)
How Do LLM-Generated Texts Impact Term-Based Retrieval Models? [76.9] 本稿では,大規模言語モデル(LLM)が項ベース検索モデルに与える影響について検討する。
言語学的解析により,LLM生成テキストはよりスムーズで低周波なZipf勾配を示すことが明らかとなった。
本研究は,項分布がクエリと密接に一致した文書を優先して,項ベース検索モデルがソースバイアスを示すかどうかを考察する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:43:27 GMT)
ObjFiller-3D: Consistent Multi-view 3D Inpainting via Video Diffusion Models [76.8] 3Dインパインティングは、しばしばマルチビュー2Dイメージのインパインティングに依存し、固有の不整合は、ぼやけたテクスチャ、空間的な不連続、視覚的アーティファクトを逸脱させる。
高品質で一貫した3Dオブジェクトを補完・編集するための新しい手法であるFiller-3Dを提案する。
映像と3Dの表現ギャップを解析し,映像のインパインティングモデルによる3Dシーンのインパインティングの適応を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:59:40 GMT)
VISA: Group-wise Visual Token Selection and Aggregation via Graph Summarization for Efficient MLLMs Inference [76.0] Group-wise textbfVIsual token textbfSelection and textbfAggregation (VISA)
本手法は,視覚トークンを圧縮しながら,より視覚的な情報を保存できる。
VISAの有効性を検証するため,LLaVA-1.5,LLaVA-NeXT,Video-LLaVAの総合的な実験を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:07:07 GMT)
Direct Preference Optimization for Primitive-Enabled Hierarchical Reinforcement Learning [76.0] DIPPERは階層的な政策学習を二段階最適化問題として定式化する新しいHRLフレームワークである。
DIPPERは、スパース報酬シナリオにおいて、最先端のベースラインよりも最大40%改善されていることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:51:04 GMT)
EmbodiedOcc: Embodied 3D Occupancy Prediction for Vision-based Online Scene Understanding [73.0] 3D占有予測は周囲のシーンを包括的に記述する。
既存のほとんどのメソッドは、1つか数つのビューからのオフラインの認識に焦点を当てている。
具体化された3次元占有予測タスクを定式化し,ガウスをベースとしたEmbodiedOccフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:59:30 GMT)
CMPhysBench: A Benchmark for Evaluating Large Language Models in Condensed Matter Physics [71.4] CMPhysBenchは、凝縮物質物理学における大規模言語モデルの習熟度を評価するように設計されている。
以上の結果から,最高モデルであるGrok-4でさえ,CMPhysBench上での平均SEEDスコアが36点,精度が28%であった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:32:22 GMT)
Test-Time Scaling Strategies for Generative Retrieval in Multimodal Conversational Recommendations [70.9] 電子商取引は、複雑なマルチターンユーザーインタラクションを管理する上で、伝統的な製品検索システムの限界を明らかにしている。
本稿では,対話型マルチモーダル製品検索にテスト時間スケーリングを導入する新しいフレームワークを提案する。
提案手法は生成型レトリバー上に構築され,さらに検索精度の向上と,対話を通してユーザ意図の進化と結果の整合性を向上するテストタイムリグレード機構が組み込まれている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:38:56 GMT)
EPFL-Smart-Kitchen-30: Densely annotated cooking dataset with 3D kinematics to challenge video and language models [69.4] キッチン環境内のモーションキャプチャプラットフォームで収集したEPFL-Smart-Kitchen-30データセットについて紹介する。
9台の静止RGB-Dカメラ、慣性測定ユニット(IMU)、ヘッドマウント型HoloLens2ヘッドセットが3D手、体、眼の動きを捉えた。
このデータセットは、シンクロナイズドエキソセントリック、エゴセントリック、深さ、IMU、視線、体、手動の4種類のレシピを調理する16人の被験者の29.7時間にわたる多視点アクションデータセットである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:46:38 GMT)
BiMark: Unbiased Multilayer Watermarking for Large Language Models [68.6] テキスト品質とメッセージ埋め込み能力のバランスをとる新しい透かしフレームワークであるBiMarkを提案する。
BiMarkは、短いテキストに対して最大30%高い抽出率を達成すると同時に、低いパープレキシティで示されるテキスト品質を維持する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:23:11 GMT)
T*: Re-thinking Temporal Search for Long-Form Video Understanding [66.7] 現在の時間探索法は、Longvideobenchサブセットで2.1%の時間F1スコアしか達成していない。
画像中の視覚探索に触発されて,空間探索として高価な時間探索を再構成する軽量な時間探索フレームワークT*を提案する。
大規模な実験により、T*と既存の方法を統合することにより、SOTAの長めのビデオ理解が大幅に向上することが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:57:46 GMT)
Physical Autoregressive Model for Robotic Manipulation without Action Pretraining [65.9] 我々は、自己回帰ビデオ生成モデルを構築し、物理自己回帰モデル(PAR)を提案する。
PARは、アクション事前トレーニングを必要とせず、物理力学を理解するために、ビデオ事前トレーニングに埋め込まれた世界の知識を活用する。
ManiSkillベンチマークの実験は、PARがPushCubeタスクで100%の成功率を達成したことを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:08:37 GMT)
TokenUnify: Scaling Up Autoregressive Pretraining for Neuron Segmentation [65.7] 本稿では,3つの相補的な学習目標を通じて,大規模依存関係をキャプチャする階層型予測コーディングフレームワークを提案する。
TokenUnifyは、ランダムトークン予測、次のトークン予測、およびすべてのトークン予測を統合して、包括的な表現空間を作成する。
また,120億個の注釈付きボクセルを付加した大規模EMデータセットを導入し,空間連続性を持つ理想的な長周期視覚データを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:29:17 GMT)
Amortized Sampling with Transferable Normalizing Flows [65.5] プロス(英: Prose)は、ペプチド分子動力学のコーパスで訓練された、最大8個の残基の移動可能な正規化フローである。
本稿では, Prose が様々なサンプリングアルゴリズムの提案であることを示す。
我々はProseデータセットをオープンソース化し、償却されたサンプリング手法と微調整目的の研究をさらに促進する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:28:18 GMT)
V2X-R: Cooperative LiDAR-4D Radar Fusion with Denoising Diffusion for 3D Object Detection [64.9] 我々は、LiDAR、カメラ、および4Dレーダを取り入れた初のシミュレーションV2XデータセットであるV2X-Rを提案する。
V2X-Rには12,079のシナリオがあり、LiDARと4Dレーダーポイント雲の37,727フレーム、150,908の画像、170,859の注釈付き3D車両バウンディングボックスがある。
本稿では,3次元物体検出のための新しいコラボレーティブLiDAR-4Dレーダ融合パイプラインを提案し,様々な融合戦略を用いて実装する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:28:51 GMT)
Concept-Guided Interpretability via Neural Chunking [64.6] ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。
神経集団レベルで繰り返しチャンクを抽出する3つの方法を提案する。
私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:19:25 GMT)
ChartMaster: Advancing Chart-to-Code Generation with Real-World Charts and Chart Similarity Reinforcement Learning [64.4] 本稿では,人工種子の代わりにarXiv紙のリアルな人間設計図をプロンプトとして活用するReChartPromptを提案する。
また,GRPOに基づく強化学習アルゴリズムであるChartSimRLを提案する。
ReChartPromptとChartSimRLを統合したChartMasterモデルを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:32:56 GMT)
COMET-poly: Machine Translation Metric Grounded in Other Candidates [63.8] 単一翻訳以外の追加情報を含む2つの自動メトリクスを提案する。
COMET-polycandは、同じソース文の代替翻訳を使用して、手元の翻訳と比較し、対比する。
COMET-polycandに1つの追加翻訳を含めると、セグメントレベルのメートル法性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:55:22 GMT)
LLM-based Agentic Reasoning Frameworks: A Survey from Methods to Scenarios [63.1] エージェント推論フレームワークを分解し,これらのフレームワークがどのようにフレームワークレベルの推論を支配しているかを分析する。
具体的には,エージェント推論システムを単一エージェントメソッド,ツールベースメソッド,マルチエージェントメソッドに分類するための統一形式言語を提案する。
我々は、科学的発見、医療、ソフトウェア工学、社会シミュレーション、経済学における彼らの主要な応用シナリオを包括的にレビューする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:01:16 GMT)
MALMM: Multi-Agent Large Language Models for Zero-Shot Robotics Manipulation [62.9] 大規模言語モデル(LLM)は、ロボティクスの操作やナビゲーションなど、さまざまな領域にまたがる優れた計画能力を示している。
特殊なLLMエージェント間で高レベル計画および低レベル制御コード生成を分散する新しいマルチエージェントLLMフレームワークを提案する。
長軸タスクを含む9つのRLBenchタスクに対するアプローチを評価し、ゼロショット環境でロボット操作を解く能力を実証した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:11:33 GMT)
Follow My Hold: Hand-Object Interaction Reconstruction through Geometric Guidance [61.4] 単眼RGB画像から手持ち物体の3次元形状を再構成する拡散法に基づく新しいフレームワークを提案する。
我々は手オブジェクト間相互作用を幾何学的ガイダンスとして使用し、手オブジェクト間相互作用を確実にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:11:53 GMT)
How Quantization Shapes Bias in Large Language Models [61.4] 重みとアクティベーションの定量化戦略に焦点をあて、幅広いバイアスタイプにまたがる効果について検討する。
確率的および生成されたテキストベースのメトリクスを9つのベンチマークで使用し、アーキテクチャファミリや推論能力の異なるモデルを評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:48:26 GMT)
Language-Specific Layer Matters: Efficient Multilingual Enhancement for Large Vision-Language Models [60.4] 大規模視覚言語モデル(LVLM)は、人間の言語で視覚情報を理解する能力を示す。
本研究では,LVLMの多言語理解能力と浅い層における言語特異的ニューロン活性化の関連性を明らかにする。
精密LAnguage-Specific 層ファインチューニングによるLVLMの多言語化を実現する学習レシピ PLAST を紹介する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:15:25 GMT)
Speculating LLMs' Chinese Training Data Pollution from Their Tokens [59.3] 汚染された中国人(PoC)トークンはポルノやオンラインギャンブルのような内容を示す。
GPTの語彙に基づくPoCトークンの形式的定義と分類について述べる。
我々は,LLMを微調整してPoCトークンを語彙でラベル付けすることで,PoCトークン検出装置を構築する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:08:51 GMT)
Steering Dialogue Dynamics for Robustness against Multi-turn Jailbreaking Attacks [59.3] 大規模言語モデル(LLM)は、有害な応答を誘発するために敵のプロンプトが設計されたジェイルブレイク攻撃に対して脆弱であることが示されている。
安全制御理論に基づく安全ステアリングフレームワークを提案し,マルチターン対話における不変安全性を保証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:49:18 GMT)
Speech Discrete Tokens or Continuous Features? A Comparative Analysis for Spoken Language Understanding in SpeechLLMs [59.2] 音声処理には、離散トークンと連続的な特徴の2つの主要なアプローチが出現している。
自己教師付き学習(SSL)に基づく離散的かつ連続的な特徴を、同じ実験環境下で比較する。
その結果, 連続的な特徴は, 様々なタスクにおいて, 離散トークンよりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:16:07 GMT)
Towards Privacy-aware Mental Health AI Models: Advances, Challenges, and Opportunities [58.6] メンタルヘルス障害は、深い個人的・社会的負担を生じさせるが、従来の診断はリソース集約的でアクセシビリティが制限される。
本稿では、これらの課題を考察し、匿名化、合成データ、プライバシー保護トレーニングを含む解決策を提案する。
臨床的な意思決定をサポートし、メンタルヘルスの結果を改善する、信頼できるプライバシを意識したAIツールを進化させることを目標としている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:46:55 GMT)
Versatile Framework for Song Generation with Prompt-based Control [58.6] VersBandは、高品質でアライメントのある曲をプロンプトベースのコントロールで合成するためのフレームワークである。
分離されたモデルであるVocalBandは、歌唱スタイル、ピッチ、メル-スペクトログラムを生成するためのフローマッチング手法を利用している。
フローベースのトランスフォーマーモデルであるAccompBandは、Band-MOEを取り入れ、品質、アライメント、制御の強化に適した専門家を選択する。
歌詞用LyricBandとメロディー用MelodyBandの2世代モデルは、総合的なマルチタスク・ソング生成システムに貢献している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:25:33 GMT)
Forgotten Polygons: Multimodal Large Language Models are Shape-Blind [55.7] 視覚言語タスクの性能は高いが、Multimodal Large Language Models (MLLM) は数学的な問題解決に苦戦している。
以上の結果から,正多角形同定において,トップモデルが50%未満の精度で達成されるなど,形状認識の根本的な欠点が明らかとなった。
図中の視覚的アノテーションを明示的に参照することにより、多段階の数学的推論を強化する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:28:48 GMT)
TOMATO: Assessing Visual Temporal Reasoning Capabilities in Multimodal Foundation Models [55.5] トマト(Tomato)は、ビデオ理解におけるMFMの時間的推論能力を厳格に評価するための新しいベンチマークである。
TOMATOは、6つのタスクにまたがる1,484件の注意深いキュレーションと人間による注釈付き質問で構成されている。
総合評価の結果, 人体モデルの性能差は57.3%であり, 最良性能モデルでは57.3%であった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:57:34 GMT)
Visual Generation Without Guidance [54.6] 我々はサンプリングガイドのないビジュアルモデルを構築することを提案する。
得られたアルゴリズムである Guidance-Free Training (GFT) は、CFGの性能と一致し、サンプリングを1つのモデルに減らし、コストを半減する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:05:49 GMT)
Where's the liability in the Generative Era? Recovery-based Black-Box Detection of AI-Generated Content [53.9] APIアクセスのみを必要とする新しいブラックボックス検出フレームワークを導入する。
画像がモデル自身によって生成された可能性を測定する。
マスクされた画像入力をサポートしないブラックボックスモデルに対して、ターゲットモデル分布に適合するように訓練された費用効率の良い代理モデルを導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:18:26 GMT)
GWM: Towards Scalable Gaussian World Models for Robotic Manipulation [53.5] 本稿では,ロボット操作のための世界モデルGawssian World Model (GWM)を提案する。
中心となるのは、潜伏拡散変換器(DiT)と3次元変分オートエンコーダを組み合わせることで、微粒なシーンレベルの将来の状態復元を可能にする。
シミュレーションと実世界の実験の両方で、GWMは多様なロボットのアクションに照らされた未来のシーンを正確に予測できる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:01:09 GMT)
Few-Shot Pattern Detection via Template Matching and Regression [52.8] 本稿では,テンプレートマッチングと回帰に基づく簡易かつ効果的な検出器TMRを提案する。
凍結したバックボーンの上に少数の学習可能な畳み込み層や投射層を持つ最小限の構造を通して、経験者の空間的レイアウトを効果的に保存し、活用する。
提案手法は, RPINE, FSCD-147, FSCD-LVISの3つのベンチマークにおける最先端手法よりも優れ, クロスデータセット評価において強い一般化を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:52:42 GMT)
Annotation-Free Open-Vocabulary Segmentation for Remote-Sensing Images [51.7] 本稿では,アノテーションのないRS画像のオープン語彙セグメンテーションのための最初のフレームワークであるSegEarth-OVを紹介する。
粗い特徴から高分解能空間の詳細を頑健に復元する普遍的なアップサンプラーであるSimFeatUpを提案する。
また、パッチ機能から固有のグローバルコンテキストを抽出するための、シンプルで効果的なグローバルバイアス緩和操作も提示する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:22:57 GMT)
Trust Me, I'm Wrong: LLMs Hallucinate with Certainty Despite Knowing the Answer [51.7] 本研究では,モデルが常に正しい解答を行うことのできる幻覚の別のタイプについて検討するが,一見自明な摂動は,高い確実性で幻覚応答を生じさせる。
この現象は特に医学や法学などの高度な領域において、モデルの確実性はしばしば信頼性の代用として使用される。
CHOKEの例は、プロンプト間で一貫性があり、異なるモデルやデータセットで発生し、他の幻覚と根本的に異なることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:47:29 GMT)
ModalPrompt: Towards Efficient Multimodal Continual Instruction Tuning with Dual-Modality Guided Prompt [51.7] 大規模マルチモーダルモデル(LMM)は、混合命令データセットを学習することで、顕著なマルチタスク能力を示す。
既存のMCITメソッドはLMMのユニークな属性を完全に活用していない。
本稿では,従来の知識の忘れを効果的に緩和する,MCITのための新しい素早い学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:25:26 GMT)
Time Symmetry, Retrocausality, and Emergent Collapse: The Tlalpan Interpretation of Quantum Mechanics [51.6] Tlalpan Interpretation (QTI) は、波動関数の崩壊は原始的、公理的な規則ではなく、創発的な現象であると主張する。
QTIの新規性は、統計物理学における臨界現象の概念言語に崩壊を埋め込むことにある。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:30:56 GMT)
MedQARo: A Large-Scale Benchmark for Medical Question Answering in Romanian [50.8] ルーマニア初の大規模医療QAベンチマークであるMedQARoを紹介する。
がん患者に関連する102,646のQAペアからなる高品質で大規模なデータセットを構築した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:17:17 GMT)
The Statistical Fairness-Accuracy Frontier [50.3] 機械学習モデルは正確性と公平さのバランスをとる必要があるが、これらの目標はしばしば矛盾する。
このトレードオフを理解するための有用なツールとしてフェアネス・精度フロンティアがあり、フェアネスと精度の両方で同時に改善できないモデルの集合を特徴付ける。
本研究では, 有限サンプル体制におけるFAフロンティアについて検討し, 人口の減少と, 最悪のケースギャップの定量化について検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:01:35 GMT)
Preference Trajectory Modeling via Flow Matching for Sequential Recommendation [50.1] シーケンスレコメンデーションは、履歴的なインタラクションシーケンスに基づいて、各ユーザの次の項目を予測する。
FlowRecはシンプルだが効果的なシーケンシャルレコメンデーションフレームワークである。
我々は,ガウス雑音に代えてパーソナライズされた行動に基づく事前分布を構築し,ユーザの嗜好軌跡をモデル化するためのベクトル場を学習する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:55:42 GMT)
Lightning Fast Caching-based Parallel Denoising Prediction for Accelerating Talking Head Generation [50.0] 拡散に基づく音声ヘッドモデルは高品質でフォトリアリスティックなビデオを生成するが、推論が遅い。
我々はLightning-fast Caching-based Parallel Denoising Prediction (LightningCP)を紹介する。
また,より高速な注意計算を実現するために,DFA(Decoupled Foreground Attention)を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:58:39 GMT)
Propose and Rectify: A Forensics-Driven MLLM Framework for Image Manipulation Localization [49.7] 本稿では,意味論的推論と法科学的な分析を橋渡しするPropose-Rectifyフレームワークを提案する。
提案手法は,具体的技術実証により,初期セマンティックな提案が体系的に検証され,拡張されることを保証し,包括的検出精度と局所化精度を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:43:53 GMT)
VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding [49.1] VisR-Benchは、長い文書における質問駆動型マルチモーダル検索のベンチマークである。
ベンチマークは、1.2Kドキュメントで35K以上の高品質なQAペアで構成されています。
テキストベースの手法,マルチモーダルエンコーダ,MLLMなど,さまざまな検索モデルを評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:29:22 GMT)
TPLA: Tensor Parallel Latent Attention for Efficient Disaggregated Prefill and Decode Inference [48.4] MLA(Multi-Head Latent Attention)は、キー値の状態を低ランクの潜在ベクトルに圧縮し、このベクトルだけをキャッシュしてメモリを減少させる。
しかし、テンソル並列性(TP)では、アテンションヘッドは複数のデバイスにまたがって計算され、各デバイスはフルキャッシュをロードしなければならない。
本稿では,潜在表現と各頭部の入力次元をデバイス間で分割し,シャード毎に独立して注目を行い,結果を全再現と組み合わせる方式であるTPLAを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:24:20 GMT)
TopoBench: A Framework for Benchmarking Topological Deep Learning [48.2] トポロジカルディープラーニング(TDL)の研究の標準化と高速化を目的としたオープンソースライブラリであるTopoBenchを紹介する。
TopoBenchは、TDLをデータ生成、ロード、変換、処理、モデルトレーニング、最適化、評価のための独立したモジュールのシーケンスに分解する。
TopoBenchの重要な機能は、トポロジカルドメイン間の変換とリフトをサポートすることだ。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:17:36 GMT)
A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code [48.1] A.S.E(AI Code Generation Security Evaluation)は、リポジトリレベルのセキュアコード生成のためのベンチマークである。
A.S.Eは、ドキュメント化されたCVEで実際のリポジトリからタスクを構築し、完全なリポジトリコンテキストを保存する。
その再現性のあるコンテナ化評価フレームワークは、専門家定義のルールを使用して、セキュリティ、ビルド品質、生成安定性の安定的で監査可能な評価を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:11:11 GMT)
Learning from Few Samples: A Novel Approach for High-Quality Malcode Generation [47.8] 侵入検知システム(IDS)は,ネットワークセキュリティ防衛において重要な役割を担っている。
検出モデルのトレーニングにおけるIDSの重要な課題は、適切にラベル付けされた悪意のあるサンプルが不足していることである。
本稿では、GAN(Generative Adrial Networks)とLLM(Large Language Models)を統合した、新しい半教師付きフレームワーク textbfGANGRL-LLMを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:55:17 GMT)
Generative Feature Imputing - A Technique for Error-resilient Semantic Communication [46.5] 本稿では,3つの鍵となる手法を取り入れた,生成的特徴インパッシング(generative feature imputing)という新しい枠組みを提案する。
まず,チャネルマッピングに基づいて特徴要素を符号化することで特徴歪みを空間的に集中する空間誤差集中パケット化手法を提案する。
第2に,パケット損失による欠落した特徴を効率的に再構築する拡散モデルを用いた生成的特徴量計算手法を提案する。
第3に,各パケットのセマンティックな重要性に応じて送信電力を割り当てることで,不等なエラー保護を可能にするセマンティック・アウェア・パワー・アロケーション・スキームを開発する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:19:48 GMT)
Arnold: a generalist muscle transformer policy [46.3] 我々は、複数のタスクと実施をマスターするポリシーであるArnoldを開発します。
Arnold氏は、14の困難な制御タスクにおいて、振る舞いのクローン化とPPOとの微調整を組み合わせて、専門家または超専門的なパフォーマンスを達成する。
重要な革新はアーノルドの感覚運動の語彙であり、これは異質な感覚のモダリティ、目的、アクチュエータのセマンティクスの合成表現である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:22:40 GMT)
Backdoor Attacks on Dense Retrieval via Public and Unintentional Triggers [46.2] 本稿では,攻撃者が検索システムを誤認して攻撃者の特定内容を検索する新たな攻撃シナリオについて検討する。
これらのコンテンツは、攻撃者によって検索コーパスに注入され、ヘイトスピーチやスパムのような有害なテキストを含むことができる。
モデル重みに頼り、顕著で不自然な出力を生成する従来の手法とは異なり、文法エラーによって引き起こされる隠れたバックドア攻撃を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:33:56 GMT)
Multimodal Proposal for an AI-Based Tool to Increase Cross-Assessment of Messages [45.9] 本稿では,収益コールのセマンティックにリッチな埋め込みを生成するために設計された,新しいマルチモーダルフレームワークを提案する。
結果として得られる埋め込みは、感情的なトーン、構造論理、主題的アライメントを反映する安定で意味のある表現を形成する。
提案システムは,遠隔医療,教育,政治談話など,他の非記述的コミュニケーション領域に一般化される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:47:56 GMT)
Large Language Models in the Task of Automatic Validation of Text Classifier Predictions [45.9] テキスト分類のための機械学習モデルは、与えられたテキストのクラスを予測するために訓練される。
これを行うには、トレーニングと検証のサンプルを用意し、各テキストにクラスを割り当てる必要がある。
人間のアノテーションは通常、特定の分類タスクによって異なる専門レベルを持つ人間のアノテーションによって割り当てられる。
本稿では,人間のアノテータを大規模言語モデルに置き換えるためのいくつかのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:01:55 GMT)
MeSS: City Mesh-Guided Outdoor Scene Generation with Cross-View Consistent Diffusion [45.7] メッシュモデルは、多くの都市で利用できるようになったが、現実的なテクスチャの欠如により、仮想都市ナビゲーションや自動運転への応用は制限されている。
本稿では,都市メッシュモデルを用いた高品質でスタイル整合な屋外シーンを生成するためのSplat MeSS(Meshbased Scene Synthesis)を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:57:16 GMT)
Unraveling the cognitive patterns of Large Language Models through module communities [45.4] 大規模言語モデル(LLM)は、科学、工学、社会において大きな進歩を遂げ、我々の世界を変えました。
実用性と実用性にもかかわらず、LLMの基盤となるメカニズムは何十億ものパラメータや複雑な構造の中に隠されている。
生物学における新たな認知を理解するためのアプローチを採用することで、このギャップに対処する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:49:38 GMT)
Large-Scale Model Enabled Semantic Communication Based on Robust Knowledge Distillation [45.3] 大規模モデル(LSM)は意味表現と理解に有効なフレームワークである。
しかしながら、それらの直接的なデプロイメントは、しばしば高い計算複雑性とリソース要求によって妨げられる。
本稿では,新しい知識蒸留に基づくセマンティックコミュニケーションフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:48:25 GMT)
Unveiling the Actual Performance of Neural-based Models for Equation Discovery on Graph Dynamical Systems [45.1] グラフのためのKAN(Kolmogorov-Arnold Networks)は、その固有の解釈可能性を活用するように設計されている。
カンは基礎となる記号方程式の同定に成功し、既存の基底線をはるかに上回った。
本研究は,モデル表現性と解釈可能性のトレードオフを明らかにするための実践的ガイドを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:25:50 GMT)
MalLoc: Toward Fine-grained Android Malicious Payload Localization via LLMs [45.0] MalLocは、Androidマルウェアの詳細なレベルで悪意のあるペイロードをローカライズするための、新しいアプローチである。
この研究は、振る舞いレベルの悪意のあるロジックに対する深い洞察を可能にすることによって、従来の検出と分類を超えて進んでいる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:05:44 GMT)
Defending Against Prompt Injection With a Few DefensiveTokens [44.2] 大規模言語モデル(LLM)システムは複雑なタスクを実行するために外部データと相互作用する。
システムによってアクセスされたデータに命令を注入することにより、攻撃者は攻撃者が指示する任意のタスクで初期ユーザタスクをオーバーライドすることができる。
システム開発者がフレキシブルな方法で必要な場合にのみセキュリティを確保するためには、例えば防御プロンプトのようなテストタイムディフェンスが提案されている。
トレーニング時の代替に匹敵するプロンプトインジェクションを備えたテストタイムディフェンスであるDefensiveTokenを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:49:10 GMT)
Demographic Biases and Gaps in the Perception of Sexism in Large Language Models [43.8] ソーシャルメディアのテキストで性差別を検出するための,様々な大規模言語モデルの能力について検討する。
我々は、モデルに存在する人口統計バイアスを分析し、統計分析を行う。
以上の結果から, LLMは集団の全体的意見を考えるとある程度性差別を検出できるが, 異なる集団間での認識の多様性を正確に再現するものではないことが示唆された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:36:58 GMT)
Supervising 3D Talking Head Avatars with Analysis-by-Audio-Synthesis [43.7] 音声駆動型3Dヘッドアバターは、音声に応じて唇を明瞭にしなければならない。
鍵となる問題は、決定論的モデルは高品質なリップシンクを生成するが、リッチな表現がないことである。
本稿では,3次元音声アバターフレームワークTHUNDERを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:51:40 GMT)
SCOUT: Semi-supervised Camouflaged Object Detection by Utilizing Text and Adaptive Data Selection [43.5] テキストと適応データ選択(SCOUT)を利用した半教師付きカモフラージュオブジェクト検出手法を提案する。
これにはAdaptive Data Augment and Selection (ADAS)モジュールとText Fusion Module (TFM)が含まれている。
提案手法は,COD分野における従来の半教師付き手法を超越し,最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:47:12 GMT)
SEA-BED: Southeast Asia Embedding Benchmark [43.1] 約7億人の話者を抱える東南アジア地域では、地域固有の埋め込みベンチマークが欠落している。
SEA-BEDは9つのタスクと10言語にまたがる169のデータセットを備えた最初の大規模埋め込みベンチマークである。
6つの研究にまたがる17の埋め込みモデルの評価,課題および言語課題の分析,ベンチマーク間比較,翻訳トレードオフについて検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:33:42 GMT)
Evaluating the Representation of Vowels in Wav2Vec Feature Extractor: A Layer-Wise Analysis Using MFCCs [43.0] CNNはまず、トランスフォーマーが処理する前に、音声を特徴ベクトルに変換する。
TIMITコーパスを用いた単声母音のCNN抽出情報について検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:30:56 GMT)
Efficient Model-Based Purification Against Adversarial Attacks for LiDAR Segmentation [42.8] 現代のセグメンテーションネットワークは、安全を損なう可能性のある敵攻撃に非常に影響を受けやすい。
本稿では,2DレンジビューLiDARセグメンテーションにおける敵防御に適した効率的なモデルベース浄化フレームワークを提案する。
提案手法はオープンベンチマーク上での競争性能を向上し, 生成的, 敵対的トレーニングベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:14:10 GMT)
Hierarchical Vision-Language Learning for Medical Out-of-Distribution Detection [42.7] 視覚言語モデル(VLM)に基づく新しいOOD検出フレームワークを提案する。
複数スケールからの視覚的埋め込みを両立させるために, クロススケールなビジュアルフュージョン戦略を提案する。
OOD検出を最大化するために, クロススケールな擬似ODサンプル生成戦略を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:55:27 GMT)
Understanding Subword Compositionality of Large Language Models [42.5] 大規模言語モデル(LLM)はサブワードのシーケンスを入力として取り、サブワード表現を構成する必要がある。
本稿では,LLMがサブワード情報を構成する方法を検討するための総合的な実験について述べる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:16:56 GMT)
Beyond Demographics: Enhancing Cultural Value Survey Simulation with Multi-Stage Personality-Driven Cognitive Reasoning [41.9] このシステムは、人格研究のためのMBTI心理学的枠組みにおける型力学理論にインスパイアされている。
World Values Surveyの実験によると、MARKは既存のベースラインを10%精度で上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:04:23 GMT)
Debiasing Multilingual LLMs in Cross-lingual Latent Space [41.3] 並列TEDトークスクリプトに基づいて訓練されたオートエンコーダを用いて,言語間ラテント空間を構築する。
Aya-expanseと4つの言語(英語、フランス語、ドイツ語、オランダ語)にわたる2つのデバイアス技術の実験により、a)オートエンコーダは、適切に整合した言語間ラテント空間を効果的に構築し、b)学習された言語間ラテント空間におけるデバイアス技術の適用により、全体的なデバイアス性能と言語間トランスファービリティの両方が大幅に向上することを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:13:37 GMT)
Text Meets Topology: Rethinking Out-of-distribution Detection in Text-Rich Networks [40.2] テキスト・オブ・ディストリビューション(OOD)検出はテキスト・リッチ・ネットワークにおいて依然として困難であり、テキスト・フィーチャとトポロジ的構造が交わる。
多様なOODシナリオにおける検出を評価するためのTextTopoOODフレームワークを紹介した。
また,テキストaNdトポロジー間の複雑な相互作用をモデル化するTNT-OODを提案する。1)ノードレベルのテキスト表現に局所構造を融合する新しいクロスアテンションモジュール,2)ノード固有の変換パラメータを生成するHyperNetwork。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:57:29 GMT)
SPIN-Bench: How Well Do LLMs Plan Strategically and Reason Socially? [39.4] 戦略計画・インタラクション・ネゴシエーション(SPIN-Bench)について
SPIN-Benchは、戦略的計画と社会的推論の知性を測定するために設計された、新しいマルチドメイン評価である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:24:36 GMT)
Hessian-Based Lightweight Neural Network HessNet for State-of-the-Art Brain Vessel Segmentation on a Minimal Training Dataset [39.4] 我々は、IXIデータセット(注釈付き200画像)に基づいて、半手動で注釈付き脳血管画像データセットを作成する。
データセットはhttps://git.scinalytics.com/terilat/VesselDatasetPartlyで公開されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:39:51 GMT)
On the Algorithmic Bias of Aligning Large Language Models with RLHF: Preference Collapse and Matching Regularization [39.3] 選好マッチング(PM) RLHF はBradley-Terry--Luce/Plackett--Luce モデルの下で、大きな言語モデルと報酬モデルの選好分布を整合させる新しいアプローチである。
我々のアプローチの中心はPM正則化器であり、応答上の LLM のポリシー確率分布の負の対数の形を取る。
実験では、標準的なRLHFと比較して、特定の測定基準によって測定されるように、人間の嗜好に沿った29%から41%の改善が示されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:01:38 GMT)
Anisotropic Heisenberg Su-Schrieffer-Heeger spin chain as a quantum channel [39.3] 異方性ハイゼンベルクSSHスピン鎖における1と2の励起の伝達について検討する。
自明かつ位相的状態における静的障害に対する量子状態伝達のロバスト性について検討する。
この結果から,量子状態伝達におけるトポロジ,障害,相互作用,制御戦略の相互作用に関する知見が得られた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:07:46 GMT)
ISALux: Illumination and Segmentation Aware Transformer Employing Mixture of Experts for Low Light Image Enhancement [39.2] ISALuxは低光画像強調(LLIE)のためのトランスフォーマーベースのアプローチである
HISA-MSAは特徴抽出のための照明とセマンティックセグメンテーションマップを統合している。
MoEベースのFeed-Forward Network (FFN)は文脈学習を強化する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:47:18 GMT)
Mitigating Message Imbalance in Fraud Detection with Dual-View Graph Representation Learning [39.2] フラッド検出(MimbFD)におけるメッセージの不均衡を軽減するための2視点グラフ表現学習法を提案する。
具体的には、高品質なノード表現学習のためのトポロジメッセージリーチビリティモジュールを設計し、詐欺師のカモフラージュを浸透させ、不十分な伝播を緩和する。
その結果,MimbFDは不正検出において優れた性能を示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:54:42 GMT)
MMTok: Multimodal Coverage Maximization for Efficient Inference of VLMs [38.6] VLM(Vision-Language Models)は,視覚入力を視覚トークンに変換することで,言語指導による視覚内容の理解に優れた性能を示す。
視覚トークンの数を減らすために多くのアルゴリズムが提案されているが、視覚言語タスクの固有のマルチモーダル特性は無視されている。
本稿では,視覚トークンとテキストトークンの両方を活用して,カバレッジの基準によって情報的視覚トークンを選択することを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:57:49 GMT)
Scaling Capability in Token Space: An Analysis of Large Vision Language Model [38.3] 本研究では,視覚トークン数に関して,視覚言語モデルに類似したスケーリング関係が存在するかを検討する。
視覚トークン数と視覚参照シーケンス間の距離のばらつきを特徴付ける数学的枠組みを開発した。
複数の視覚言語ベンチマークにおける実証的な検証は、モデルパフォーマンスがスケーリング関係からの予測と一致していることを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:35:47 GMT)
Zero-shot Context Biasing with Trie-based Decoding using Synthetic Multi-Pronunciation [38.1] 合成駆動型多発音文脈バイアス法を提案する。
提案手法は,非バイアスの単語誤り率(WER)を,テストクリーンでは42%,他では43%削減し,非バイアスの単語誤り率(WER)は本質的に変化しない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:41:52 GMT)
A Factuality and Diversity Reconciled Decoding Method for Knowledge-Grounded Dialogue Generation [37.7] 外部知識の接地は対話生成における応答の事実性を高めることができる。
DoGeと呼ばれる新しい手法が提案されている。
広く使われている3つのデータセットに対する大規模な実験は、DoGeが応答の多様性を向上するだけでなく、事実性も維持できることを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:19:42 GMT)
MeshSplat: Generalizable Sparse-View Surface Reconstruction via Gaussian Splatting [37.4] 本稿では,ガウススプラッティングによるスパース・ビュー・サーフェス・リコンストラクション・フレームワークであるMeshSplatを提案する。
我々のキーとなる考え方は、2DGSを橋として活用することであり、これは新しいビュー合成と学習された幾何学的先行とを結びつけるものである。
フィードフォワードネットワークを導入し、ビュー毎の2DGSを予測することで、新しいビュー画像の合成を可能にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:04:20 GMT)
Pandora: Leveraging Code-driven Knowledge Transfer for Unified Structured Knowledge Reasoning [37.0] Unified Structured Knowledge Reasoningは、構造化されたソースを統一的に使用することによって、自然言語の質問に答えることを目的としている。
既存の方法はタスク固有の戦略や振る舞い表現に依存しており、異なるSKRタスク間の障壁を分解する能力を妨げている。
2つの重要なイノベーションを活用することで、既存のメソッドの制限に対処する新しいUSKRフレームワークであるtextscPandoraを紹介します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:22:58 GMT)
Speech-Based Depressive Mood Detection in the Presence of Multiple Sclerosis: A Cross-Corpus and Cross-Lingual Study [36.7] 本研究は, 音声による抑うつ検出手法を, クロスコーパス, クロスランガル分析によりMS(pwMS)患者に伝達する可能性について検討した。
提案手法は,1) 現場で一般的に使われている従来の音声・言語の特徴,2) 音声感情認識(SER)モデルに由来する感情次元,3) 探索的音声特徴分析を用いて,教師付き機械学習モデルを実装する。
限られたデータにもかかわらず、我々のモデルは中程度の一般性を有するpwMSの抑うつ的気分を検知し、バイナリタスクで66%のUnweighted Average Recall(UAR)を達成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:54:13 GMT)
Spectrum Prediction in the Fractional Fourier Domain with Adaptive Filtering [36.7] 本稿では,SFFP(Spectral Fractional Filtering and Prediction)フレームワークを提案する。
SFFPはまず適応分数フーリエ変換(FrFT)モジュールを用いてスペクトルデータを適切な分数フーリエ領域に変換する。
適応フィルタモジュールは、この領域内で重要な予測特性を保持しながらノイズを選択的に抑制する。
複雑な価値を持つニューラルネットワークを活用する予測モジュールは、これらのフィルタされたトレンドコンポーネントを学習し、予測する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:26:52 GMT)
Stand on The Shoulders of Giants: Building JailExpert from Previous Attack Experience [36.5] 大規模言語モデル(LLM)は、一定の安全性の制約の下で、ヒューマンアラインなコンテンツを生成する。
textbfJailExpertフレームワークは、初めてエクスペリエンス構造を形式的に表現したフレームワークである。
JailExpertは平均17%の攻撃成功率と2.7倍の改善を実現している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:16:30 GMT)
DIVER: A Multi-Stage Approach for Reasoning-intensive Information Retrieval [36.4] DIVERは、推論集約的な情報検索のために設計された検索パイプラインである。
ドキュメント前処理ステージ、クエリ拡張ステージ、検索ステージ、再ランクステージの4つのコンポーネントで構成されている。
BRIGHTベンチマークでは、DIVERは最先端のnDCG@10スコアを45.8点、オリジナルクエリでは28.9点と達成し、競争力のある推論モデルを上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:06:32 GMT)
Memento: Fine-tuning LLM Agents without Fine-tuning LLMs [36.3] 本稿では,適応型大言語モデル(LLM)エージェントのための新しい学習パラダイムを提案する。
本手法は,メモリベースのオンライン強化学習により,低コストで連続的な適応を可能にする。
我々はエージェントモデルを,GAIA検証でトップ1に達するemphMementoというディープリサーチ環境でインスタンス化する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:32:12 GMT)
TemCoCo: Temporally Consistent Multi-modal Video Fusion with Visual-Semantic Collaboration [36.3] 既存のマルチモーダル融合法は、ビデオ融合タスクに直接静的フレームベースの画像融合技術を適用する。
本稿では、時間的モデリングと視覚的セマンティックなコラボレーションを明確に組み込んだ初めてのビデオ融合フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:12:55 GMT)
EmoBench-M: Benchmarking Emotional Intelligence for Multimodal Large Language Models [36.2] EmoBench-Mは、マルチモーダル大言語モデル(MLLM)の感情知能(EI)能力を評価するために設計された新しいベンチマークである。
EmoBench-M上でのオープンソースとクローズドソース両方のMLLMの評価は、彼らと人間の間に大きなパフォーマンスギャップがあることを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:34:02 GMT)
Gaze into the Heart: A Multi-View Video Dataset for rPPG and Health Biomarkers Estimation [36.0] 本稿では,rとHealth Estimationのための大規模マルチビュービデオデータセットを提案する。
このデータセットは600人の被験者の映像を同期し、様々な条件下で撮影する。
データセットとモデルの公開リリースによって、AI医療アシスタントの開発が大幅にスピードアップするでしょう。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:46:40 GMT)
EAI-Avatar: Emotion-Aware Interactive Talking Head Generation [35.6] EAI-Avatarは,ディヤドインタラクションのための新たな感情認識型音声ヘッド生成フレームワークである。
本手法は,会話状態と聴取状態とをシームレスに遷移させる,感情の豊かな時間的一貫した仮想アバターを生成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:07:03 GMT)
HeteroTune: Efficient Federated Learning for Large Heterogeneous Models [35.5] HeteroTuneは,限られた通信と予算の下で動作する大規模異種モデルのための,新しいファインチューニングパラダイムである。
我々の手法のコアは、異種モデルの柔軟かつ効率的な集約を可能にする新しいアーキテクチャであるDeMAにある。
We provide the theory analysis and empirical evidence shows that HeteroTune achieves state-of-the-art performance and efficiency across various task and model architectures。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:33:35 GMT)
Rethinking Cross-Subject Data Splitting for Brain-to-Text Decoding [35.3] 我々は、fMRIとEEG信号をテキストに復号するために、データ漏洩のない正しいクロスオブジェクトデータ分割基準を開発する。
いくつかのSOTA脳からテキストへの復号モデルは、さらなる研究のために提案された基準で正しく評価される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:48:15 GMT)
Simulating Electron Transfer on Noisy Quantum Computers: A Scalable Approach to Open Quantum Systems [35.2] 量子コンピュータは、本質的なハードウェアノイズによって支援されるオープン量子システムのダイナミクスをシミュレートする、有望なプラットフォームである。
我々は、IBMの超伝導プロセッサ上で、単一のドナーと最大9つのアクセプター部位を持つ電子移動(ET)の顕微鏡モデルシミュレーションを行った。
最大20キュービットの計算結果から、古典計算とよく一致したETの確率が明らかになる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:45:33 GMT)
Aligning NLP Models with Target Population Perspectives using PAIR: Population-Aligned Instance Replication [35.1] クラウドソースアノテーションで訓練されたモデルは、アノテーターとして働く人々がより広い人口を表現していない場合、人口ビューを反映しない可能性がある。
PAIR: Population-Aligned Replication Instance, 付加アノテーションを収集することなく、目標個体群特性をよりよく反映するようにトレーニングデータを調整した後処理手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:42:35 GMT)
Measuring Sycophancy of Language Models in Multi-turn Dialogues [35.0] SYCON Benchは、マルチターン・自由形式の会話環境におけるサイコフィナンシーを評価するための新しいベンチマークである。
SYCON Benchを3つの現実シナリオにわたる17の大規模言語モデルに適用すると、梅毒は相変わらず障害モードであることがわかる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:52:28 GMT)
Box-Level Class-Balanced Sampling for Active Object Detection [34.8] アクティブラーニング(AL)は、アノテーションの負担を軽減するための有望なテクニックである。
オブジェクト検出のためにボックスレベルでALを実行することは、画像全体を選択してラベル付けするよりもコスト効率が高いことが示されている。
そこで本稿では,ラベル付けのためのマイノリティクラスから,より多くのオブジェクトを選択するためのクラスバランスサンプリング手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:57:22 GMT)
AdLoCo: adaptive batching significantly improves communications efficiency and convergence for Large Language Models [34.5] 本稿では,Multi-Instance Training(MIT),Adaptive Batched DiLoCo,スイッチモード機構を組み合わせた3段階の手法を提案する。
MITは個々のノードに対して、異なるモデルインスタンスを並列に複数の軽量なトレーニングストリームを実行することができる。
Adaptive Batched DiLoCoは、ローカルバッチサイズを動的に調整して、計算と通信のバランスをとる。
スイッチモードは、ハードウェアフレンドリな制限を超えて適応バッチサイズが大きくなると、グラデーションの蓄積をシームレスに導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:35:57 GMT)
Clinical characteristics, complications and outcomes of critically ill patients with Dengue in Brazil, 2012-2024: a nationwide, multicentre cohort study [33.7] ブラジルは2024年の世界の感染者の71%を占めており、デング熱の流行は公衆衛生上の大きな問題となっている。
56病院253ICUのデング患者を対象とした前向き調査を行った。
我々は、デングICU人口の変動、ICU滞在中の合併症のリスク要因を特定するためのロジスティック回帰、合併症の進行リスクを予測するための機械学習フレームワークについて記述統計を用いた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:04:57 GMT)
Unified attacks to large language model watermarks: spoofing and scrubbing in unauthorized knowledge distillation [33.4] 非許可の知識蒸留における双方向攻撃を可能にする統合フレームワークとして,コントラスト復号型知識蒸留(CDG-KD)を提案する。
提案手法では, 学生モデルと弱透かし参照の出力を比較して, 劣化あるいは増幅された透かしテキストを抽出するために, コントラスト復号を用いる。
本研究は, 頑丈で鍛造不可能な透かし方式の開発において, 重要な必要性を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:07:09 GMT)
SAIL-Recon: Large SfM by Augmenting Scene Regression with Localization [33.3] 大規模SfMのためのフィードフォワード変換器SAIL-Reconを紹介する。
提案手法はまず,アンカー画像のサブセットからニューラルシーン表現を計算する。
そして、回帰ネットワークを微調整して、このニューラルシーン表現に条件付けられた全ての入力画像を再構成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:38:26 GMT)
Addressing Text Embedding Leakage in Diffusion-based Image Editing [33.2] 本稿では属性リークに対処するフレームワークであるAttribute-Leakage-free Editing (ALE)を紹介する。
ALEは、オブジェクト制限埋め込み(ORE)とテキスト埋め込みのアンタングル、空間的に正確に注意を向けるRGB-CAM(Regional-Guided Blending for Cross-Attention Masking)、非編集コンテンツを保存するためにバックグラウンドブレンディング(Backside Blending)を組み合わせる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:53:46 GMT)
Orthogonal Finetuning for Direct Preference Optimization [33.1] 重み付き優先度最適化(RoPO)法によるDPOの微調整を提案する。
RoPOは、超球面エネルギー不変量を維持するために、重みパラメータの回転および等級ストレッチング更新を行う。
我々のモデルは、トレーニング可能なパラメータの0.0086%しか使用せずに、元の表現能力を維持しながら、人間の好みと完全に一致します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:40:51 GMT)
VERIRL: Boosting the LLM-based Verilog Code Generation via Reinforcement Learning [33.0] 本稿では,Verilogコード生成に適した強化学習フレームワークを提案する。
スパース信号と雑音信号に対処するために,トレースバックに基づくRescore機構を提案する。
RL微調整中の破滅的忘れと過適合を軽減するため,サンプルバランスの重み付け戦略を導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:20:44 GMT)
Language Models Coupled with Metacognition Can Outperform Reasoning Models [32.3] 大規模言語モデル(LLM)は、様々な推論タスクの速度と適応性に優れる。
LRMは複雑なステップバイステップ推論のために特別に設計されている。
SOFAI-LM はメタ認知により遅いがより強力な LRM と高速な LLM を協調する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:19:57 GMT)
AffordanceSAM: Segment Anything Once More in Affordance Grounding [32.3] 本稿では,セグメンテーションにおけるSAMの一般化能力を,アダランスグラウンド化にまで拡張するAffordanceSAMを提案する。
具体的には、アベイランス適応モジュールを設計し、C2F-Affと呼ばれる粗粒度アノテートデータセットをキュレートする。
AffordanceSAMはAGD20KベンチマークでSOTA(State-of-the-art)性能を達成した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:25:44 GMT)
RepoMaster: Autonomous Exploration and Understanding of GitHub Repositories for Complex Task Solving [32.0] RepoMasterは、複雑なタスクを解決するためにGitHubリポジトリを探索、再利用するために設計された、自律的なエージェントフレームワークである。
RepoMasterは関数呼び出しグラフ、モジュール依存グラフ、階層的なコードツリーを構築し、必須コンポーネントを特定する。
新たにリリースしたGitTaskBenchでは、RepoMasterがタスクパス率を40.7%から62.9%に引き上げ、トークン使用率を95%削減しました。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:40:36 GMT)
Accountability Attribution: Tracing Model Behavior to Training Processes [31.9] AIシステムは、通常、複数のステージ事前訓練、微調整ラウンド、そしてその後の適応またはアライメントによって開発される。
これは、デプロイされたモデルが成功したり失敗したり、どのステージが責任を負い、どの程度まで責任を負うかという、説明責任に関する重要な疑問を提起する。
モデル開発プロセスの特定の段階に遡って、モデルの振る舞いをトレースするために、説明責任が問題となる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:12:26 GMT)
HLG: Comprehensive 3D Room Construction via Hierarchical Layout Generation [31.0] 階層レイアウト生成(HLG)は,微細な3次元シーン生成のための新しい手法である。
HLGは、大規模な家具配置から複雑なオブジェクト配置まで、シーンレイアウトを精錬する、粗大できめ細かな階層的アプローチを採用した最初の企業である。
既存の手法と比較して,現実的な屋内シーンの生成において優れた性能を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:32:57 GMT)
Making Hard Problems Easier with Custom Data Distributions and Loss Regularization: A Case Study in Modular Arithmetic [30.9] モジュール演算タスクにおけるMLモデルの性能を大幅に向上させる技術を開発した。
私たちの中心となるイノベーションは、カスタムトレーニングデータディストリビューションの使用と、慎重に設計された損失関数です。
我々の技術は、コピー、連想的リコール、パリティなど、MLモデルが他のよく研究された問題をよりよく学習するのに役立つ。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:43:03 GMT)
Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models [30.5] 長い会話をすると、大きな言語モデル(LLM)は過去の情報を思い出さず、一貫性のない応答を生成する傾向がある。
本稿では,長期記憶能力を高めるために,大規模言語モデル(LLM)を用いて要約/メモリを生成することを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:43:13 GMT)
Weights-Rotated Preference Optimization for Large Language Models [30.3] 本稿では,DPO から受け継いだ KL 発散量に対して,出力層ロジットを暗黙的に制約する,新しい重み付き優先度最適化 (RoPO) アルゴリズムを提案する。
我々の RoPO は AlpacaEval 2 の 3.27 点改善を実現し,トレーニング可能なパラメータの 0.015% を MT-Bench の 6.2 から 7.5 点 で上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:57:17 GMT)
Graph Neural Network Based Action Ranking for Planning [30.0] 本稿では,行動のランク付け学習に基づく古典的計画政策の学習手法を提案する。
本稿では、アクション情報を明示的にキャプチャするグラフ表現を導入し、Gated Recurrent Units(GRU)を付加したグラフニューラルネットワーク(GNN)アーキテクチャを提案し、アクションランキングを学習する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:06:57 GMT)
Demographically-Inspired Query Variants Using an LLM [30.0] 本研究では,既存のテストコレクションのクエリを多様化して,検索エンジン利用者の多様性を反映する手法を提案する。
LLM(Large Language Model)は、クエリの変種を生成するために使われる。
その結果,システムのランク付けに影響を及ぼす変異が示され,ユーザプロファイルがシステムの有効性の異なるレベルを経験していることが判明した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:17:56 GMT)
Instant Preference Alignment for Text-to-Image Diffusion Models [29.9] 本稿では,マルチモーダル大規模言語モデル(MLLM)を基礎とした学習自由フレームワークを提案する。
嗜好理解のために,MLLMを利用して参照画像からグローバルな選好信号を自動的に抽出する。
嗜好誘導型生成では,グローバルなキーワードベース制御と局所的な領域認識の相互アテンション変調を統合した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:51:15 GMT)
Exploring the Vulnerability of the Content Moderation Guardrail in Large Language Models via Intent Manipulation [29.8] 本研究では,意図認識型ガードレールの脆弱性を調査し,大規模言語モデルが暗黙の意図検出能力を示すことを示す。
IntentPromptという2段階のインテントベースのプロンプトリファインメントフレームワークを提案し、まず有害な問い合わせを構造化されたアウトラインに変換し、さらに宣言的なスタイルの物語に再構成する。
われわれのフレームワークは、最先端のジェイルブレイク手法を一貫して上回り、さらに高度なIntent Analysis(IA)とChain-of-Thought(CoT)ベースの防御を回避している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:27:19 GMT)
Supporting Intervention Design for Suicide Prevention with Language Model Assistants [29.8] 我々は,データアノテータや専門家の効率的なアシスタントとして,言語モデル(LM)の価値を検討する。
LM予測は50NVDRS変数の約85%の時間で既存のデータアノテーションと一致していることがわかった。
我々は,新しい変数を注釈付けするためのガイドラインを,専門家が効率的に構築し,精錬するのを支援するために,Human-in-the-loopアルゴリズムを導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:30:10 GMT)
TuningIQA: Fine-Grained Blind Image Quality Assessment for Livestreaming Camera Tuning [29.8] 既存のブラインド画像品質評価(BIQA)モデルは通常、粗い粒度の品質スコアのみを予測する。
まずFGLive-10Kという,カメラパラメータの異なる10,185個の高解像度画像を含む包括的細粒度BIQAデータベースを構築した。
そこで我々は,人間認識機能抽出とグラフベースのカメラパラメータ融合を統合した,ライブストリーミングカメラチューニングのための細粒度BIQAメトリックであるTuningIQAを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:26:12 GMT)
A holistic perception system of internal and external monitoring for ground autonomous vehicles: AutoTRUST paradigm [29.7] 本稿では,自律走行車の内部および外部監視のための総合的な認識システムについて紹介する。
インキャビン監視システムには、空気の質を計測し、オンボードとオフボードで効率よく熱快適な分析を行うAI搭載センサーが含まれている。
一方、外部監視システムは、LiDARに基づくコスト効率なセマンティックセマンティック・セマンティック・セマンティック・アプローチを通じて、車両の周囲環境を知覚する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:32:13 GMT)
PARROT: An Open Multilingual Radiology Reports Dataset [29.5] PARROTは、複数の言語にまたがる架空の放射線学レポートの大きな、多中心的でオープンアクセスデータセットである。
このデータセットは、21か国と13の言語にわたる76人の著者による2,658の放射線学レポートで構成されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:18:30 GMT)
VLASCD: A Visual Language Action Model for Simultaneous Chatting and Decision Making [29.2] マルチインプット・シングル・アウトプット(MISO)パラダイムは,マルチインプット・マルチ・アウトプット(MIMO)シナリオの性能を制限していることを示す。
MISOアーキテクチャでは、タスクは共有出力チャネルに競合し、不均衡な最適化と性能低下を引き起こす相互排除効果を生成する。
本稿では,同時対話生成と意思決定を併用したマルチタスク出力を実現するための統合トレーニングフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:23:29 GMT)
Hidden in Plain Sight: Reasoning in Underspecified and Misspecified Scenarios for Multimodal LLMs [28.9] マルチモーダルな大規模言語モデル(MLLM)は、オープンエンドの現実世界の環境にますます多くデプロイされている。
本稿では,現在のMLLMが暗黙の推論シナリオをどのように扱うのかを体系的に分析する。
モデルは、必要な知覚と推論スキルを持っている場合でも、隠れた問題にしばしば遭遇しない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:49:21 GMT)
DRQA: Dynamic Reasoning Quota Allocation for Controlling Overthinking in Reasoning Large Language Models [28.9] RLLM(Reasoning large language model)は、最近、構造化および多段階推論を実行することで、顕著な機能を示した。
バッチ処理から単一問合せ推論へのリソース競合の利点を伝達する新しい手法であるDRQA(Dynamic Reasoning Quota Allocation)を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:47:36 GMT)
UniSino: Physics-Driven Foundational Model for Universal CT Sinogram Standardization [28.7] ユニバーサルCTシングラム標準化の基礎モデルUniSinoを提案する。
UniSinoはプロジェクションドメインでデータを直接標準化し、多様なアンダーサンプリングシナリオをまたいだより強力な一般化を可能にする。
実験結果から,UniSinoは単独および混合アンダーサンプリングの双方で良好な再建品質が得られることが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:12:14 GMT)
U2UData-2: A Scalable Swarm UAVs Autonomous Flight Dataset for Long-horizon Tasks [28.7] 本稿では,U2UData-2を提案する。U2UData-2は,Long-Horizonタスクのための大規模なUAV自律飛行データセットである。
データセットは、12のシーン、720のトレース、120時間毎の600秒毎の軌道、4.32MのLiDARフレーム、12.96MのRGBフレームを含む、LHタスクのための自動共同飛行で15機のUAVによって収集される。
U2UData-2はまた、野生生物保護のためのLHタスクを導入し、9つのSOTAモデルで包括的なベンチマークを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:39:36 GMT)
Enhancing Trust-Region Bayesian Optimization via Newton Methods [28.5] BOを高次元空間に拡張する新しい手法を開発した。
提案手法は,TuRBOの有効性を高め,合成機能および実世界の応用において,多種多様な高次元BO技術より優れる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:15:12 GMT)
Evasive Active Hypothesis Testing with Deep Neuroevolution: The Single- and Multi-Agent Cases [28.5] 本稿では,eavesdropperの存在下でのアクティブ仮説テストにおいて,一元的かつ一元的な問題に焦点をあてる。
集中型問題では、ディープ・ニューロエボリューション(NE)に基づく新しいフレームワークを提案する一方、分散化問題では、協調型マルチエージェントタスクを解決するための新しいNEベースの手法を開発する。
後者のスキームの計算複雑性をさらに軽減するために、新しいマルチエージェントジョイントNEとプルーニングフレームワークも設計されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:19:48 GMT)
ISACL: Internal State Analyzer for Copyrighted Training Data Leakage [28.4] LLM(Large Language Models)は、著作権またはプロプライエタリなデータを不注意に公開するリスクを生じさせる。
本研究は, LLMの内部状態をテキスト生成前に検討し, 潜在的な漏洩を検出する, 積極的なアプローチを提案する。
Retrieval-Augmented Generation (RAG)システムと統合されたこのフレームワークは、著作権とライセンス要件の遵守を保証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:04:20 GMT)
Documenting Deployment with Fabric: A Repository of Real-World AI Governance [28.4] FabricはデプロイされたAIユースケースのリポジトリで、ガバナンスメカニズムを概説している。
本稿では,AI使用の保護に使用される監視機構とガードレールについて論じる。
私たちは、研究者がAIガバナンスの有効性を研究するために、Fabricを拡張可能で進化するツールとして提供するつもりです。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:25:28 GMT)
Beyond Semantic Similarity: Reducing Unnecessary API Calls via Behavior-Aligned Retriever [28.3] ツール拡張大型言語モデル(LLM)は、その機能を拡張するために外部関数を活用する。
不正確な関数呼び出しは非効率とコストの増加につながる可能性がある。
既存の手法では、LLMを微調整したり、デモベースのプロンプトを使ってこの問題に対処している。
我々は行動整合性を示す行動整合性レトリバー(BAR)を訓練した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:46:11 GMT)
Rethinking Distribution Shifts: Empirical Analysis and Inductive Modeling for Tabular Data [28.3] 我々は,アルゴリズム開発における経験的基盤を持つデータ駆動アプローチを開発した。
テストベッドでは、$Y|X$-shiftsが最も多く使われています。
目に見えない実装の詳細は、あいまいさセットや半径よりもパフォーマンスに大きな影響を与えます。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:22:21 GMT)
SuperGen: An Efficient Ultra-high-resolution Video Generation System with Sketching and Tiling [28.0] SuperGenは、超高解像度ビデオ生成のための効率的なタイルベースのフレームワークである。
追加の訓練をせずに広範囲の解像度をサポートする。
SuperGenにはタイルで調整された、適応的で、リージョン対応のキャッシュ戦略が組み込まれている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:49:17 GMT)
Interaction-Data-guided Conditional Instrumental Variables for Debiasing Recommender Systems [27.7] Recommender Systems では,インタラクションデータ誘導型条件付きIV(IDCIV)デバイアス法が提案されている。
IDCIV-RSは、相互作用データから直接有効なCIVとその対応する条件セットの表現を自動生成する。
実世界の2つのデータセットであるMovielens-10MとDouban-Movieの実験は、IDCIV-RSが有効なCIVの表現をうまく学習し、バイアスを効果的に低減し、結果として推奨精度を向上させることを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:44:37 GMT)
HOSt3R: Keypoint-free Hand-Object 3D Reconstruction from RGB images [27.0] モノクロモーションビデオ/画像から手動3D変換を推定するための,ロバストでキーポイントのない手法を提案する。
さらにこれを多視点再構成パイプラインに統合し,手動物体の形状を正確に復元する。
提案手法は,HOSt3Rと命名され,非拘束であり,事前スキャンされたオブジェクトテンプレートやカメラ内在性に依存しず,最先端の性能に達する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:02:08 GMT)
Joint Quality Assessment and Example-Guided Image Processing by Disentangling Picture Appearance from Content [26.9] ディープラーニングは、スタイル/ドメイン転送、強化/復元、視覚的品質評価といった低レベルの画像処理タスクに影響を与えている。
我々はこの観察を利用して、入力をコンテンツや外観特徴に分解する新しい非絡み合い表現学習法を開発した。
本研究では,DisQUEが品質予測タスクや歪みタイプにまたがって精度を達成できることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:27:44 GMT)
A Taxonomy of Transcendence [26.8] 制御された設定を使用して、トレーニングデータの特性を特定し、モデルがデータソースのパフォーマンスを超越する。
次に、シミュレーション専門家が個々の専門知識に基づいてデータを生成する知識グラフベースの設定を導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:05:00 GMT)
A Multimodal Handover Failure Detection Dataset and Baselines [26.7] ロボットと人間の間のオブジェクトハンドオーバは、失敗しがちな協調アクションである。
人間の参加による予防不可能な失敗を考慮に入れたデータセットや評価方法が欠如している。
本稿では,人間によって誘導される障害からなるマルチモーダルハンドオーバエラー検出データセットを提案する。
また、3次元CNNを用いたビデオ分類法と、時間的アクションセグメンテーション法という、ハンドオーバ障害検出のための2つのベースライン手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:34:59 GMT)
Theory of Mind in Large Language Models: Assessment and Enhancement [26.4] 心の理論 (ToM) - 自己や他人の精神状態について考える能力は、人間の社会的知性の基礎である。
大きな言語モデル(LLM)が日々の生活にますます統合されるにつれて、人間の精神状態の解釈と応答能力を理解することは、効果的な相互作用の実現に不可欠である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:00:55 GMT)
Guidelines for Empirical Studies in Software Engineering involving Large Language Models [26.3] 大規模言語モデル(LLM)は、ソフトウェア工学(SE)の研究と実践にますます統合されている。
我々は,この領域を包括するコミュニティの取り組みとして,LCMに基づく研究タイプの分類学と8つのガイドラインを紹介した。
このガイドラインは、研究プロセス全体を通して望まれる(すべき)基準と同様に、必須(必須)基準を示し、透明性を目標とする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:27:29 GMT)
On the Edge of Memorization in Diffusion Models [25.9] 本稿では,実践的拡散モデルにおける記憶と一般化を研究するための科学的・数学的「実験室」を紹介する。
我々の研究は、将来の理論的および実証的な調査のために分析的に抽出可能で実用的に意味のある設定を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:56:05 GMT)
EMO-Reasoning: Benchmarking Emotional Reasoning Capabilities in Spoken Dialogue Systems [25.9] EMO-Reasoningは、対話システムにおける感情的コヒーレンスを評価するためのベンチマークである。
マルチターン対話における感情遷移を評価するために,クロスターン感情推論スコアを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:01:40 GMT)
SolEval: Benchmarking Large Language Models for Repository-level Solidity Code Generation [25.5] SolEvalはSolidityスマートコントラクト生成のための最初のリポジトリレベルのベンチマークです。
既存のSolidityベンチマークとは異なり、SolEvalは複雑な関数呼び出しだけでなく、エコシステムの現実的な複雑さも反映している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:39:23 GMT)
PerPilot: Personalizing VLM-based Mobile Agents via Memory and Exploration [25.5] PerInstructは、さまざまなモバイルシナリオにまたがる多様なパーソナライズされたインストラクションをカバーする、新しい人間アノテーション付きデータセットである。
我々は,モバイルエージェントがパーソナライズされたユーザ命令を自律的に知覚し,理解し,実行できるようにする,大規模言語モデル(LLM)を利用したプラグイン・アンド・プレイフレームワークPerPilotを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:57:02 GMT)
Seeing Sarcasm Through Different Eyes: Analyzing Multimodal Sarcasm Perception in Large Vision-Language Models [25.4] 本稿では,既存のマルチモーダルサルカムデータセット上で,システマティックに設計されたプロンプトを用いた分析フレームワークを提案する。
モデル内およびモデル間の解釈的変動について検討し、信頼度、データセットラベルとの整合性、曖昧な「中立的」ケースの認識に着目した。
以上の結果より,LVLMと同一モデル内における顕著な相違が認められた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:45:08 GMT)
Choice Outweighs Effort: Facilitating Complementary Knowledge Fusion in Federated Learning via Re-calibration and Merit-discrimination [25.3] FedMateは二元最適化を実装する方法である。
サーバ側では,サンプルサイズ,現在のパラメータ,将来予測の総合的な統合により,集約重みを調整した動的グローバルプロトタイプを構築している。
クライアント側では,有益性に基づく識別訓練を実現するために補完的な分類融合を導入し,コストを考慮した特徴伝達をモデル性能と通信効率のバランスに取り入れる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:18:25 GMT)
Using Visual Anomaly Detection for Task Execution Monitoring [25.2] 我々は,カメラやロボットの身体の動きを含むタスクの実行中に発生する動作を予測することを学ぶ。
確率的U-Netアーキテクチャは光学フローを予測するために使用され、ロボットのキネマティクスと3Dモデルはカメラと体の動きをモデル化するために使用される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:40:33 GMT)
MetaGen: A DSL, Database, and Benchmark for VLM-Assisted Metamaterial Generation [25.2] メタマテリアルは、幾何学が非常に自明な性質を与えるマイクロアーキテクチャ構造である。
しかし、それらの設計は、幾何学的な複雑さとアーキテクチャから振る舞いへの非自明なマッピングのために難しい。
これらの課題に3つの補完的な貢献で対処する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:36:07 GMT)
CoCoA: Confidence- and Context-Aware Adaptive Decoding for Resolving Knowledge Conflicts in Large Language Models [24.7] CoCoA(Confidence- and Context-Aware Adaptive Decoding)は、紛争解決の原則と忠実性の強化のための新しいトークンレベルアルゴリズムである。
CoCoAは、信頼を意識した尺度(エントロピーギャップと文脈ピーク性)とパラメトリック分布と文脈分布の一般化したばらつきを利用して紛争を解決する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:06:04 GMT)
CellINR: Implicitly Overcoming Photo-induced Artifacts in 4D Live Fluorescence Microscopy [24.5] 本稿では,暗黙的ニューラル表現に基づくケース固有最適化手法であるCellINRを提案する。
この手法では、3次元空間座標を高周波領域にマッピングするためにブラインド畳み込みと構造増幅方式を用いる。
実験の結果,CellINRは人工骨の除去や構造的連続性の復元において,既存の技術よりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:38:25 GMT)
USPR: Learning a Unified Solver for Profiled Routing [24.5] Profiled Vehicle Routing Problem (PVRP) は、ゾーン制限やサービスレベルの優先といった現実的な要件を反映して、車両依存の嗜好と制約を取り入れている。
近年の強化学習の解法は有望な性能を示したが、表現能力に乏しく、アウト・オブ・ディストリビューション・インスタンスへの一般化に苦慮している。
任意のプロファイルタイプを扱う新しいフレームワークであるプロファイルルーティングのための統一ソルバー(USPR)を紹介する。
USPRは、プロファイルタイプの組み合わせをエンコードするプロファイル埋め込み(PE)、車間のリッチなインタラクションをモデル化するマルチヘッドプロファイル注意(MHPA)の3つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:02:36 GMT)
Incorporating Pre-trained Diffusion Models in Solving the Schrödinger Bridge Problem [24.3] IMM(Iterative Proportional Mean-Matching)、IPTM(Iterative Proportional Terminus-Matching)、IPFM(Iterative Proportional Flow-Matching)
事前訓練されたSGMを使用してSBベースのモデルを効果的に訓練する新しい初期化戦略。
大規模な実験により提案手法の有効性と改善が示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:56:16 GMT)
Wound3DAssist: A Practical Framework for 3D Wound Assessment [24.2] モノクラー・コンシューマグレード・ビデオを用いた3次元創傷評価のためのフレームワークであるWound3DAssistを提案する。
本フレームワークは手持ちの短いスマートフォンのビデオ記録から正確な3Dモデルを生成する。
我々は3D再構成,創部分割,組織分類,および周辺解析をモジュラーワークフローに統合した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:50:04 GMT)
On Task Vectors and Gradients [24.0] タスクベクトルとタスク損失の勾配との接続を確立することにより、タスク演算の厳密な理論的基礎を提供する。
標準勾配勾配下では,1つの微調整のエポックから生成されたタスクベクトルは,学習速度によってスケールされた損失の負の勾配と正確に等価であることを示す。
7つの視覚ベンチマークによる経験的分析は、我々の理論を裏付け、最初のエポック勾配がノルムと方向の両方において微調整軌道を支配していることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:50:05 GMT)
MARM: Unlocking the Future of Recommendation Systems through Memory Augmentation and Scalable Complexity [23.7] MARM(Memory Augmented Recommendation Model)を提案する。
RecSysモデルの場合、モデルパラメータと比較して計算複雑性のFLOPは、注意深い制御を必要とするより高価な要素である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:48:28 GMT)
FastAvatar: Instant 3D Gaussian Splatting for Faces from Single Unconstrained Poses [23.5] 我々は、ポーズ不変フィードフォワードフレームワークであるFastAvatarについて、ほぼ瞬時に単一の顔画像から3次元ガウススプラッティング(3DGS)モデルを生成することができる。
FastAvatarは、既存のフィードフォワードの3DGS手法を再現品質で大幅に上回り、顔ごとの最適化手法よりも1000倍高速に動作します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:29:05 GMT)
Defending against Jailbreak through Early Exit Generation of Large Language Models [23.3] 大規模言語モデル(LLM)は、様々なアプリケーションで注目を集めている。
悪意のある目的のためにこれらのモデルを悪用しようとするユーザもいるため、懸念が高まっている。
本稿では、悪意のある入力を検知する手段としてLSMの早期変換器出力を利用し、直ちに生成を終了する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:01:56 GMT)
Fingerprint Vector: Enabling Scalable and Efficient Model Fingerprint Transfer via Vector Addition [23.3] 我々はフィンガープリントベクトルと呼ばれる新しいメカニズムを提案する。
指紋をバックドアベースの微調整でベースモデルに埋め込み、タスク固有のパラメータデルタを指紋ベクトルとして抽出する。
キーデシダラタにまたがる直接注入に匹敵する、あるいは優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:16:24 GMT)
One Framework to Rule Them All: Unifying Multimodal Tasks with LLM Neural-Tuning [23.2] 複数のタスクやモダリティを同時に処理する統合フレームワークを提案する。
このフレームワークでは、すべてのモダリティとタスクは統一トークンとして表現され、単一の一貫したアプローチでトレーニングされる。
複数のタスクラベルを付加したサンプルを含む新しいベンチマークMMUDを提案する。
複数のタスクを合理化して効率的に同時に処理できることを実証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:06:20 GMT)
Neither Valid nor Reliable? Investigating the Use of LLMs as Judges [23.2] 審査員としての大規模言語モデル(LLJ)は、従来のメトリクスに代わる有望な代替手段として現れてきたが、その妥当性は未検討のままである。
本論では,LLJに対する現在の熱意は,信頼性と妥当性に関する厳密な調査を評価対象として上回っているため,時期尚早である可能性が示唆された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:43:10 GMT)
Principled Detection of Hallucinations in Large Language Models via Multiple Testing [23.1] 大規模言語モデル(LLM)は、様々なタスクを解決するための強力な基礎モデルとして登場した。
また、幻覚を起こしやすいことも示され、自信を持って聞こえるが、実際には正しくない、あるいは非感覚的な反応を生じさせる。
本稿では,仮説テスト問題として幻覚を検出する問題を定式化し,機械学習モデルにおける分布外検出問題に並列性を持たせる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:39:30 GMT)
EventTracer: Fast Path Tracing-based Event Stream Rendering [22.9] EventTracerは、複雑な3Dシーンからの高忠実度イベントシーケンスをシミュレートするパストレースベースのレンダリングパイプラインである。
EventTracerがより優れたシーンの詳細をキャプチャし、実際のイベントデータと他のイベントシミュレータとの類似性を示す2つの下流タスクを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:33:09 GMT)
WATCH: Adaptive Monitoring for AI Deployments via Weighted-Conformal Martingales [22.8] 非パラメトリックシーケンシャルテストのメソッド -- 特にコンフォーマルテストマーチンチャル(CTM)と任意の時間価推論 -- は、この監視タスクに有望なツールを提供する。
既存のアプローチは、限られた仮説クラスやアラーム基準の監視に限られています。」
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:08:07 GMT)
Integral Transformer: Denoising Attention, Not Too Much Not Too Little [22.7] ソフトマックスの自己注意は、特別なトークンや句読点のような意味的に非形式的なトークンに不均等な重みを割り当てる。
本稿では,ロジット分布からサンプリングした信号を統合することで注意を喚起する新しい自己認識機構であるIntegral Transformerを提案する。
提案手法は, モデル性能に重要な特別なトークンの寄与を保ちながら, ノイズを緩和する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:19:21 GMT)
Taming the Untamed: Graph-Based Knowledge Retrieval and Reasoning for MLLMs to Conquer the Unknown [22.5] マルチモーダルな大言語モデル(MLLM)は、限られた関連する知識のため、ほとんど遭遇しないドメイン固有のタスクで失敗することが多い。
マルチモーダル・ナレッジグラフ (MH-MMKG) を構築し, マルチモーダルと複雑な実体関係を包含する。
また,MH-MMKGに基づく複雑な知識検索と推論のためのモデルの能力を評価するために,一連の挑戦的なクエリを設計する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:46:29 GMT)
RubikSQL: Lifelong Learning Agentic Knowledge Base as an Industrial NL2SQL System [22.5] Rubikは、現実のエンタープライズレベルのNL2における重要な課題に対処するために設計された、新しいNL2システムである。
Rubik SOTAは、KaggleDBQAとBIRD Mini-Devデータセットの両方のパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:28:37 GMT)
From Global to Local: Social Bias Transfer in CLIP [22.5] 本研究では,先行文献におけるバイアス伝達現象を包括的実証分析により検討する。
事前学習バイアスがデータのグローバルビューとローカルビューの間でどのように変化するかを調べ、バイアス測定が計算されたデータのサブセットに大きく依存していることを確認する。
この不整合がなぜ生じるのかを考察し、現在のパラダイムの下では、異なる事前学習されたCLIPの表現空間が下流タスクに適応すると収束する傾向があることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:44:03 GMT)
A2HCoder: An LLM-Driven Coding Agent for Hierarchical Algorithm-to-HDL Translation [22.5] 大規模言語モデル(LLM)を利用した階層型アルゴリズム-HDL符号化エージェントA2HCoderを提案する。
A2HCoderは複雑なアルゴリズムをモジュラー関数ブロックに分解し、コード生成を単純化し、一貫性を向上させる。
5G無線通信領域における実世界の展開事例を通してA2HCoderを検証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:20:15 GMT)
ReHub: Linear Complexity Graph Transformers with Adaptive Hub-Spoke Reassignment [22.5] 本稿では,効率的な再割り当て手法により線形複雑化を実現するグラフトランスフォーマーアーキテクチャReHubを提案する。
ReHubは航空会社のハブアンドスポークモデルからインスピレーションを得ており、フライトは固定数の仮想ノードに割り当てられている。
LRGB実験では,線形複雑度を維持しつつ,ベース手法であるNeural Atomsよりも一貫した改善が見られた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:18:29 GMT)
GAN decoder on a quantum toric code for noise-robust quantum teleportation [21.8] 本稿では,量子トポロジカルコードに対するGANに基づくデコーダを提案する。
偏極雑音下での量子テレポーテーションプロトコルの拡張に応用する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:18:54 GMT)
Fence off Anomaly Interference: Cross-Domain Distillation for Fully Unsupervised Anomaly Detection [21.6] Unsupervised Anomaly Detection (FUAD) は Unsupervised Anomaly Detection (UAD) の実用的な拡張である
本稿では,広く研究されている逆蒸留(RD)パラダイムに基づく新しいクロスドメイン蒸留(CDD)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:15:28 GMT)
Can Classical Initialization Help Variational Quantum Circuits Escape the Barren Plateau? [21.5] 変分量子アルゴリズム(VQA)は、短期量子コンピューティングにおける主要なパラダイムである。
それらは、システムサイズや回路深さによって勾配が指数関数的に消えるいわゆるバレンプラトー問題によって妨げられる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:12:15 GMT)
Breaking Through Barren Plateaus: Reinforcement Learning Initializations for Deep Variational Quantum Circuits [21.5] 変分量子アルゴリズム(VQA)は、短期量子デバイスを活用可能なフレームワークとして注目されている。
VQAの有効性は、システムサイズや回路深さが増加するにつれて勾配が指数関数的に減少するいわゆるバレン高原問題によって制約されることが多い。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:37:36 GMT)
A Survey on the Safety and Security Threats of Computer-Using Agents: JARVIS or Ultron? [21.3] 本稿では,EmphComputer-Using Agentsの安全性とセキュリティの脅威に関する知識の体系化について述べる。
CUAは、デスクトップアプリケーション、Webページ、モバイルアプリをナビゲートするなど、自律的にタスクを実行することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:43:19 GMT)
Copyright Protection for 3D Molecular Structures with Watermarking [21.1] そこで本研究では,分子用に設計された最初のロバストな透かし法を提案する。
埋め込み透かしの実現可能性を示し,90.00%以上の基本特性を維持した。
下流ドッキングシミュレーションは、オリジナル分子とウォーターマーク分子の同等の性能を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:21:11 GMT)
BRAIN: Bias-Mitigation Continual Learning Approach to Vision-Brain Understanding [21.0] 記憶崩壊は、人間の脳が視覚的物体を認識して詳細を保持するのを難しくする。
本稿では,この問題に対処する最初のビジョン学習手法の1つについて述べる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:44:43 GMT)
Towards Controllable Speech Synthesis in the Era of Large Language Models: A Systematic Survey [20.9] 制御可能なTSは急速に成長している研究領域となっている。
産業需要の増加と深層学習のブレークスルーにより、制御可能なTSは急速に成長している研究分野となっている。
我々は、モデルアーキテクチャ、制御戦略、特徴表現を分類するとともに、制御可能なTSにおける課題、データセット、評価を要約する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:30:54 GMT)
BTW: A Non-Parametric Variance Stabilization Framework for Multimodal Model Integration [20.6] トレーニング中のモダリティ重要度を動的に調整するために,BTW(Beyond Two-modality Weighting)を提案する。
BTWは、各ユニモーダルと現在のマルチモーダル予測とのばらつきを測定することで、サンプル毎のKL重みを計算する。
本手法は回帰性能と多クラス分類精度を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:00:38 GMT)
GSVisLoc: Generalizable Visual Localization for Gaussian Splatting Scene Representations [20.5] GSVisLocは3次元ガウススプラッティング(3DGS)シーン表現用に設計された視覚的ローカライズ手法である。
シーン特徴と画像特徴とを頑健にマッチングすることで、これを実現する。
提案アルゴリズムは,まず粗いマッチング,次にきめ細かなマッチング,そして最後に,正確な最終的な推定値に対するポーズ補正を適用することで,3つのステップで進行する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:31:57 GMT)
Sparse Mean Estimation in Adversarial Settings via Incremental Learning [20.5] 本稿では,重み付き分布と対向汚職の存在下で,スパース平均推定を学習するためのスケーラブルな手法を提案する。
提案手法は,情報理論の下界に適合する最適統計率を実現する。
より広範に、我々の研究は、重み付き分布と敵対的腐敗の存在下で、過渡的手法の漸進的な学習現象を初めて明らかにした。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:33:59 GMT)
DiffusionGS: Generative Search with Query Conditioned Diffusion in Kuaishou [20.4] 生成モデルを利用した新しいスケーラブルなアプローチであるDiffusionGSを提案する。
我々は、ユーザのクエリが条件拡散過程を案内する条件記述タスクとして、関心抽出を定式化する。
本稿では,ユーザの過去の行動に対する注意分布の最適化にユーザ固有のプロファイルを組み込むためのユーザ認識Denoising Layer (UDL)を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:46:51 GMT)
Architectural Co-Design for Zero-Shot Anomaly Detection: Decoupling Representation and Dynamically Fusing Features in CLIP [20.3] Zero-Shot Anomaly Detection (ZSAD) に適用した場合、VLM(Pre-trained Vision-Language Models) は重要な適応ギャップに直面している。
パラメータ効率のよい畳み込み型低ランク適応 (Conv-LoRA) アダプタを提案する。
多様な産業・医療ベンチマークの実験では、精度と堅牢性が向上し、この相乗的共設計が基礎モデルを密接な知覚タスクに頑健に適応させる上で重要であることを証明している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:57:47 GMT)
TombRaider: Entering the Vault of History to Jailbreak Large Language Models [20.2] 我々は,LLMの歴史的知識を保存,検索,活用する,新しいジェイルブレイク技術であるTombRaiderを紹介した。
TombRaiderを6つの人気モデルで評価した。
実験の結果、TombRaiderは最先端のジェイルブレイク技術より優れていることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:39:53 GMT)
Enabling Deep Visibility into VxWorks-Based Embedded Controllers in Cyber-Physical Systems for Anomaly Detection [20.1] DIVER(Defensive implant for Visibility to Embedded Run-times)は、サイバー物理システムにおける組み込み制御デバイスをリアルタイムで可視化するためのフレームワークである。
Dimerは,VxWorksリアルタイムオペレーティングシステム(RTOS)を実行するデバイスを対象とした,異常のランタイム検出を可能にする
Dimerには2つのコンポーネントがある: VxWorksカーネルに組み込み、実行時の計測を収集し、TCP/IP上で対話的/ストリーミングインターフェースを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:15:30 GMT)
WaveStitch: Flexible and Fast Conditional Time Series Generation with Diffusion Models [19.9] WaveStitchは、時間データを生成するための新しい拡散ベースの方法である。
コヒーレンスを維持しながら、自己回帰法よりも最大166.48倍高速なデータを生成する。
平均二乗誤差は最先端に比べて1.81倍低く、自己回帰法よりも166.48倍高速なデータを生成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:06:16 GMT)
Rethinking Federated Learning Over the Air: The Blessing of Scaling Up [19.7] フェデレーション学習は、データのプライバシを保持しながら、複数のクライアント間で協調的なモデルトレーニングを促進する。
本稿では,大規模クライアントシナリオにおけるオーバー・ザ・エア・フェデレーション学習の性能分析のための理論的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:13:57 GMT)
Hierarchical Object-Oriented POMDP Planning for Object Rearrangement [19.6] 現在のオブジェクト再構成ソリューションは、主に強化学習または手作業による計画手法に基づいており、様々な課題への適応性に欠けることが多い。
この制限に対処するために,新しい階層的オブジェクト指向部分観測マルコフ決定プロセス(HOO-POMDP)を導入する。
本稿では、部分的に観測可能なマルチルーム環境における多目的再構成問題を解決するためのオンライン・プランニング・フレームワークと新しいベンチマーク・データセットを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:24:17 GMT)
Flash Sparse Attention: An Alternative Efficient Implementation of Native Sparse Attention Kernel [19.6] 我々は、効率的なNSA計算のための代替カーネル設計を含むFlash Sparse Attention (FSA)を提案する。
バニラのNSAカーネル実装と比較して、FSAは3.5$times$、平均1.6$times$カーネルレベルのレイテンシ低減を実現している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:22:15 GMT)
Humanizing Machines: Rethinking LLM Anthropomorphism Through a Multi-Level Framework of Design [19.5] 大規模言語モデル (LLM) は、テキストの人類学的特徴をますます示している。
我々は,ユーザ目標を支援するために意図的に調整可能なデザインの強調概念として人文準同型を扱わなければならないと論じる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:48:39 GMT)
A Theoretical Perspective on Why Stochastic Population Update Needs an Archive in Evolutionary Multi-objective Optimization [19.3] アーカイブを使用すれば人口が少なくなり,SPUベースのMOEAの探索性能が向上する可能性が示唆された。
SMS-EMOA と NSGA-II の2つの古典的アルゴリズムについて,双目的問題 OneJumpZeroJump について検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:17:35 GMT)
UAD: Unsupervised Affordance Distillation for Generalization in Robotic Manipulation [19.3] UAD (Unsupervised Affordance Distillation) は、基礎モデルから手動のアノテーションを使わずにタスク条件付き空調モデルに空調知識を蒸留する方法である。
UADは、シミュレーションにおいてレンダリング対象にのみ訓練されているにもかかわらず、現場でのロボットシーンや様々な人間の活動に顕著な一般化を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:45:29 GMT)
Evaluation of Large Language Models via Coupled Token Generation [19.2] 最先端の大規模言語モデルは、プロンプトに対応するためにランダム化に依存している。
大規模言語モデルの評価とランク付けは,それらの機能を支えるランダム化を制御すべきである,と我々は主張する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:05:04 GMT)
MIRAGE: Scaling Test-Time Inference with Parallel Graph-Retrieval-Augmented Reasoning Chains [19.0] MIRAGE(Multi-chain Inference with Retrieval-Augmented Graph Exploration)は、テスト時のスケーラブルな推論フレームワークである。
構造化された医療知識グラフに対する動的マルチチェーン推論を実行する。
自動評価と人的評価の両方において、GPT-4o、Tree-of-Thought、その他の検索強化ベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:53:22 GMT)
T-MASK: Temporal Masking for Probing Foundation Models across Camera Views in Driver Monitoring [18.7] イメージファウンデーションモデルを1つのトレーニングビューを使用してドライバ監視に適用する。
本研究では,2つの基礎モデル (DINOv2 と CLIP) とパラメータ効率の良いファインチューニング (PEFT) とフルファインチューニング (フルファインチューニング) を比較した。
T-MASK - 時間的トークンマスキングを利用する新しい画像とビデオの探索手法を紹介する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:44:22 GMT)
Boosting Redundancy-based Automated Program Repair by Fine-grained Pattern Mining [18.7] 本稿では,効果的なパッチ生成を導くための2段階のパターンマイニングプロセスを含むRepattという新しい修復手法を提案する。
我々は、広く使われているDefects4Jベンチマークの実験を行い、Repattを10の最先端のAPRアプローチと比較した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:34:45 GMT)
HERO: Hierarchical Extrapolation and Refresh for Efficient World Models [18.6] 世代駆動の世界モデルは没入型仮想環境を作るが、拡散モデルの反復的な性質のために推論が遅い。
我々は,効率的な世界モデルに適したトレーニング不要な階層加速度フレームワークHEROを提案する。
HEROは、最小品質の劣化で1.73$times$の高速化を実現し、既存の拡散加速法を著しく上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:22:15 GMT)
DSADF: Thinking Fast and Slow for Decision Making [18.6] RLエージェントと高速かつ直感的な意思決定のためのメモリ空間からなるシステム1と、深く解析的な推論のためのVLMによって駆動されるシステム2の2つの補完モジュールを統合するためのデュアルシステム適応決定フレームワーク(DSADF)を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:03:43 GMT)
LETToT: Label-Free Evaluation of Large Language Models On Tourism Using Expert Tree-of-Thought [18.5] 我々はエキスパート由来の推論構造を利用するフレームワークであるExpert $textbfT$ree-$textbfo$f-$textbfT$hought (LETToT)を提案する。
その結果,4.99-14.15%の相対的品質向上率をベースラインに最適化したToTの有効性が示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:40:23 GMT)
Mirroring Users: Towards Building Preference-aligned User Simulator with User Feedback in Recommendation [18.4] ユーザシミュレーションは、リコメンデータシステム(RS)の開発と評価にますます不可欠である。
このアライメントを強化するための巨大な未使用のリソースは、RSに固有の広範なユーザーフィードバックである。
本稿では,高度なLLM機能を備えたRSのユーザフィードバックを活用して,高品質なシミュレーションデータを生成する新しいデータ構築フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:51:24 GMT)
F2RVLM: Boosting Fine-grained Fragment Retrieval for Multi-Modal Long-form Dialogue with Vision Language Model [18.2] きめ細かいフラグメント検索(FFR)は、クエリ関連フラグメントを見つけるためにモデルを必要とするタスクである。
F2RVLMは、2段階のパラダイムで訓練された生成的検索モデルである。
ドメイン内設定と実ドメイン設定の両方で、人気のあるVision-Language Modelよりも優れています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:42:47 GMT)
Explainable Prediction of the Mechanical Properties of Composites with CNNs [18.2] 説明可能なAI(XAI)の手法を備えた畳み込みニューラルネットワーク(CNN)が,この問題の解決に有効であることを示す。
提案手法では, 逆張力試験を用いて生成したデータセットに基づいて学習したカスタムCNNを用いて, コンポジットの機械的特性を予測する。
次に、SHAPと統合勾配の2つのポストホックXAI法を用いて予測を説明し、CNNが合成体の挙動に影響を与える重要な幾何学的特徴を用いていることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:12:44 GMT)
An Inquiry into Datacenter TCO for LLM Inference with FP8 [18.0] 大規模言語モデル(LLM)の計算特性をTCOの観点から解析する。
我々は、Intel(Gaudi 2 & 3)とNVIDIA(H100 & H200)のAIアクセラレーターにおけるTCOに影響を与える重要なワークロード特性について検討する。
ガウディHPUは,特にFP8量子化モデルにおいて,薄型GEMMよりも優れた利用率が得られることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:01:25 GMT)
Imperceptible Protection against Style Imitation from Diffusion Models [17.8] 保護機能を保ちながら視覚的に改善された保護方法を提案する。
我々は,人間の目に敏感な領域に注目する知覚マップを考案した。
また,アートワークがどれだけの強度を保護・動的に調整することが難しいかを予測し,難易度に配慮した保護も導入した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:20:39 GMT)
Training Language Model Agents to Find Vulnerabilities with CTF-Dojo [17.8] 我々は,大規模な言語モデル(LLM)を検証可能なフィードバックでトレーニングするための,最初の大規模実行ランタイムであるCTF-Dojoを紹介する。
CTF-Dojoから,LLMベースのエージェントを486の高品質な実行検証トラジェクトリでトレーニングする。
私たちの最高の32Bモデルは31.9%のPass@1に達し、DeepSeek-V3-0324やGemini-2.5-Flashといったフロンティアモデルと競合する新しいオープンウェイトな最先端技術を確立しました。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:02:23 GMT)
Cyber-Zero: Training Cybersecurity Agents without Runtime [17.8] Cyber-Zeroは、サイバーセキュリティのLLMをトレーニングするために高品質なエージェントトラジェクトリを合成する最初のランタイムフリーフレームワークである。
ベースラインモデルよりも最大13.1%の絶対的な性能向上を実現するLCMベースのエージェントを訓練する。
当社のベストモデルであるCyber-Zero-32Bは、オープンウェイトモデルの最先端性能を確立しています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:12:25 GMT)
A Contrastive Learning-Guided Confident Meta-learning for Zero Shot Anomaly Detection [17.7] CoZADは、新しいゼロショット異常検出フレームワークである。
ソフト・インテリジェンス・ラーニングとメタラーニングとコントラスト的特徴表現を統合している。
7つの産業ベンチマークのうち6つで既存の手法を上回ります。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:27:31 GMT)
RL-Finetuned LLMs for Privacy-Preserving Synthetic Rewriting [17.3] 本稿では,複合報酬関数を用いた大規模言語モデル(LLM)を微調整する強化学習フレームワークを提案する。
プライバシ報酬は、セマンティックキューと、潜伏表現上の最小スパンニングツリー(MST)から派生した構造パターンを組み合わせる。
実験の結果,提案手法はセマンティック品質を劣化させることなく,著者の難読化とプライバシーの指標を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:38:19 GMT)
Latent Self-Consistency for Reliable Majority-Set Selection in Short- and Long-Answer Reasoning [17.0] 本稿では,学習可能なトークン埋め込みを用いて,最も意味的に一貫性のある応答を選択する潜在自己整合性を提案する。
軽量な要約トークンのフォワード生成は、推論時間を1%以下にし、モデルアーキテクチャの変更を必要としない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:36:28 GMT)
A Note on Graphon-Signal Analysis of Graph Neural Networks [17.0] これらの欠点に対処する既存の結果に対して、いくつかの改善と拡張を導入します。
我々はロバストネス型一般化境界を利用して一般化境界を改善する。
解析を非対称グラフトンやカーネルに拡張する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:46:02 GMT)
Few-shot Unknown Class Discovery of Hyperspectral Images with Prototype Learning and Clustering [16.8] Open-set Hyperspectral Image (HSI) 分類は、クラスごとにラベル付きピクセルがほとんどないことにより、画像ピクセルを分類することを目的としている。
現在の手法は主に、未知のクラスサンプルを既知のクラスサンプルと区別し、既知のクラスサンプルを識別する精度を高めるためにそれらを拒絶することに焦点を当てている。
本稿では,HSIにおける未知のクラスを少数ショット環境下で発見するための学習とクラスタリングのプロトタイプを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:40:06 GMT)
Traj-MLLM: Can Multimodal Large Language Models Reform Trajectory Data Mining? [16.7] トラジェクティブデータマイニングにMLLMを用いた最初の汎用フレームワークである textttTraj-MLLM を提案する。
textttTraj-MLLMは、重要な時空間特性を保持しながら、生の軌跡をインターリーブされた画像テキストシーケンスに変換する。
4つの公開データセットの実験では、textttTraj-MLLMが最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:45:34 GMT)
Riemannian Change Point Detection on Manifolds with Robust Centroid Estimation [16.7] ストリーミング時系列データにおける非パラメトリックな変化点検出は、信号処理における長年の課題である。
1つの顕著な戦略は、時系列の質量の中心における急激な変化を監視することである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:00:17 GMT)
TranSQL+: Serving Large Language Models with SQL on Low-Resource Hardware [16.5] グラフを純粋なSQLクエリに変換して,リレーショナルデータベースで実行するテンプレートベースのコードジェネレータであるTran+を紹介した。
また、結合操作を改善するための行列列最適化(ROW2Seek)を提案する。
本稿では,低リソースハードウェア上での大規模言語モデルの実践環境として,リレーショナルデータベースに注目した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:58:23 GMT)
EEG-FM-Bench: A Comprehensive Benchmark for the Systematic Evaluation of EEG Foundation Models [16.4] EEG-FM-BenchはEEG基盤モデル(EEG-FMs)の体系的および標準化された評価のための最初の総合的なベンチマークである
コントリビューションは,(1)標準のEEGパラダイムからさまざまなダウンストリームタスクとデータセットをキュレートし,統一されたオープンソースフレームワーク内で標準化された処理と評価プロトコルを実装し,(2)最先端の基盤モデルをベンチマークして,現在の展望を明確化するために総合的なベースライン結果を確立すること,(3)モデル行動の洞察を提供するための質的分析を行い,将来のアーキテクチャ設計を通知すること,の3つです。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:34:33 GMT)
DriveSplat: Decoupled Driving Scene Reconstruction with Geometry-enhanced Partitioned Neural Gaussians [16.4] 運転シナリオの領域では、高速走行車、歩行者の移動、大規模静的背景の存在が、3Dシーンの再構築に重大な課題となっている。
3次元ガウス散乱に基づく最近の手法は、シーン内の動的成分と静的成分を分離することで、動きのぼかし問題に対処する。
本稿では,動的静的デカップリングを用いたニューラルガウス表現に基づくシナリオ駆動のための高品質な再構成手法であるDriveSplatを紹介する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:28:49 GMT)
Steering When Necessary: Flexible Steering Large Language Models with Backtracking [16.2] 大規模言語モデル(LLM)は多くの世代で顕著な性能を達成している。
アクティベーションステアリング(Activation steering)は、推論段階においてLSMのアクティベーションを直接変更する効果的で費用効率のよいアプローチである。
本稿では,介入の必要性と強度の両方を動的に決定するフレキシブル・アクティベーション・ステアリング・アット・バックトラッキング(FASB)フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:01:30 GMT)
LexSemBridge: Fine-Grained Dense Representation Enhancement through Token-Aware Embedding Augmentation [16.2] 本稿では,細粒度で入力対応のベクトル変調により高密度なクエリ表現を向上する統合フレームワークを提案する。
LexSemBridgeはバックボーンエンコーダを変更することなくプラグインとして動作する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:07:36 GMT)
TradingGroup: A Multi-Agent Trading System with Self-Reflection and Data-Synthesis [15.9] TradingGroupは、セルフリフレクティブアーキテクチャとエンドツーエンドのデータ合成パイプラインを通じて制限に対処するために設計されたマルチエージェントトレーディングシステムである。
TradingGroupは、ニュース感情分析、財務報告解釈、株価トレンド予測、トレーディングスタイル適応、トレーディング意思決定エージェントのための専門エージェントで構成されている。
具体的には、ストック予測、スタイル、意思決定エージェントのための自己回帰機構を設計し、過去の成功と失敗を、類似した将来のシナリオで同様の推論のために蒸留する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:29:58 GMT)
Large-scale Multi-sequence Pretraining for Generalizable MRI Analysis in Versatile Clinical Applications [15.8] 本研究では,大規模MultI-Sequence MRIを用いた基礎モデルであるPRISMを提案する。
本稿では,MRIの配列特異的な変化から解剖学的に不変な特徴を引き離す新しい事前訓練パラダイムを提案する。
PRISMは、非事前のモデルと既存の基礎モデルの両方を一貫して上回った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:25:14 GMT)
FlexTSF: A Flexible Forecasting Model for Time Series with Variable Regularities [15.8] 変動時間正規度を持つ時系列データに特化して設計されたフレキシブルな予測モデルであるFlexTSFを紹介する。
その基盤にはIVP(Initial Value Problems)を活用した継続的パッチモジュールであるIPP Patcherがある。
16のデータセットの実験では、FlexTSFの有効性が示され、古典的な予測シナリオにおいて既存のモデルよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:58:45 GMT)
JCo-MVTON: Jointly Controllable Multi-Modal Diffusion Transformer for Mask-Free Virtual Try-on [15.6] JCo-MVTONは、拡散に基づく画像生成とマルチモーダル条件融合を統合することで制限を克服する新しいフレームワークである。
DressCodeなどの公開ベンチマークで最先端のパフォーマンスを実現し、測定値と人的評価の両方において、既存のメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:43:57 GMT)
EMPOWER: Evolutionary Medical Prompt Optimization With Reinforcement Learning [15.6] 本稿では,医学的即興性を高める新しい進化的枠組みであるEMPOWERを紹介する。
本手法は,(1)医療用語の注意機構,(2)明確さ,特異性,臨床関連性,事実の正確性を評価する包括的評価アーキテクチャ,(3)臨床理由の整合性を保つコンポーネントレベルの進化的アルゴリズムを包含する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:23:17 GMT)
TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training [15.3] TiKMiXは、モデルの進化する好みに応じてデータ混合物を動的に調整する手法である。
グループインフルエンス(Group Influence)は、データドメインがモデルに与える影響を評価するための効果的な指標である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:18:32 GMT)
DualSparse-MoE: Coordinating Tensor/Neuron-Level Sparsity with Expert Partition and Reconstruction [15.3] Mixture of Experts (MoE) はLarge Language Models (LLM) の主流アーキテクチャとなった。
トレーニング済みMoEモジュールにおけるテンソルとニューロンの二重間隔を精度と効率の両立の鍵因子として同定した。
本稿では,動的テンソルレベル低下と静的ニューロンレベル再構成を統合する推論システムであるDualSparse-MoEを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:08:32 GMT)
ArgusCogito: Chain-of-Thought for Cross-Modal Synergy and Omnidirectional Reasoning in Camouflaged Object Segmentation [15.2] アルガスコギト(ArgusCogito)は、クロスモーダルおよび全方位推論を基盤としたゼロショット・チェーン・オブ・シントフレームワークである。
ArgusCogitoは、認知にインスパイアされた3つのステージ、Conjecture、Focus、Sculptingを編成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:08:17 GMT)
From BERT to LLMs: Comparing and Understanding Chinese Classifier Prediction in Language Models [15.2] 我々は,最も人気のあるLarge Language Models (LLMs) が,中国語分類器の適切な知識を持っているかどうかを検討する。
LLMは細調整でもBERTよりも優れていた。
予想通り、この予測は以下の名詞に関する情報から大きな恩恵を受けており、BERTのような双方向の注意機構を持つモデルの利点も説明できる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:41:46 GMT)
SurveyGen: Quality-Aware Scientific Survey Generation with Large Language Models [14.9] さまざまな科学的領域にわたる4,200以上の人手による調査からなる大規模データセットであるSurveyGenを提示する。
調査生成のための新しい品質認識フレームワークであるQUIL-SGを構築した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:22:23 GMT)
Leveraging the Power of MLLMs for Gloss-Free Sign Language Translation [14.8] 手話翻訳(SLT)は手話イメージを音声言語に翻訳する作業である。
マルチモーダル手話翻訳(MMSLT)と呼ばれる新しい光沢のないフレームワークを提案する。
提案手法は,ベンチマークデータセットPHOENIX14TとCSL-Dailyの最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:12:26 GMT)
3D Feature Distillation with Object-Centric Priors [14.8] CLIPのような2Dビジョン言語モデルは、2Dイメージのオープン語彙グラウンドディングに優れた機能を備えているため、広く普及している。
最近の研究は、特徴蒸留によって2D CLIP機能を3Dに高めることを目的としているが、シーン固有のニューラルネットワークを学ぶか、室内のスキャンデータにフォーカスする。
提案手法は, 3次元CLIPの特徴を再構築し, 接地能力と空間的整合性を改善した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:04:46 GMT)
MOCA-HESP: Meta High-dimensional Bayesian Optimization for Combinatorial and Mixed Spaces via Hyper-ellipsoid Partitioning [14.6] まず,分散変数と混合変数を分割する新しいBO法MOCA-HESPを提案する。
次に,MOCA-HESPを変数の最先端BOと統合して,標準的なBO,CASMOPOLITAN,Bounceの3つの実用的なBO手法を開発する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:36:57 GMT)
Group Expectation Policy Optimization for Stable Heterogeneous Reinforcement Learning in LLMs [14.5] 本稿では,パラメータ学習からロールアウトサンプリングを分離する非同期RLアーキテクチャであるHeteroRLを提案する。
1800秒の遅延で性能劣化を3%以下に抑えながら,GRPOなどの手法よりも優れた安定性を保っていることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:57:35 GMT)
AgentRAN: An Agentic AI Architecture for Autonomous Control of Open 6G Networks [14.4] 我々は、自然言語(NL)の意図に基づいて分散AIエージェントのファブリックを生成し、オーケストレーションする、AIネイティブなオープンRAN対応フレームワークであるAgenRANを紹介する。
明示的なプログラミングを必要とする従来のアプローチとは異なり、AgentRANのLLMエージェントは自然言語の意図を解釈し、構造化された会話を通じて戦略を交渉し、ネットワーク全体の制御ループを編成する。
AI-RAN Factoryは、エージェントのインタラクションを観察し、改善された制御アルゴリズムを埋め込んだ新しいエージェントを継続的に生成する自動パイプラインである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:18:10 GMT)
Language Models For Generalised PDDL Planning: Synthesising Sound and Programmatic Policies [14.2] 計画領域定義言語(PDDL)で規定される世界モデルにおける言語モデル(LM)の利用について検討する。
我々は、あるドメインからPDDL問題を解決するための一般的なポリシーとして機能するPythonプログラムを生成するよう、LMに促す。
我々は,PDDLプランナや最近のLMアプローチよりも多くのPDDL問題を一定時間とメモリ制約で解くことができることを示す競合ベンチマーク実験を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:28:14 GMT)
Missing Melodies: AI Music Generation and its "Nearly" Complete Omission of the Global South [14.1] 我々はAI音楽生成研究に使用される100万時間以上の音声データセットの分析を行った。
我々は,AI研究において,グローバル・サウスの音楽ジャンルの公平な表現と包括性において重要なギャップを見出した。
これらのデータセットの約40%には、西洋音楽以外の形態が含まれており、グローバル・サウスのジャンルは14.6%に過ぎない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:00:21 GMT)
TableTalk: Scaffolding Spreadsheet Development with a Language Agent [14.1] TableTalkは、7つのスプレッドシートプログラマと85のExcelテンプレートによる研究から派生したスプレッドシートプログラミングエージェントである。
プロフェッショナルに基づいた構造化された計画を通じてプログラマを誘導し、プログラマのニーズに適応するための次の3つのステップを生成する。
20人のプログラマによる研究で、TableTalkはベースラインよりも2.3倍高い高品質のスプレッドシートを作成した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:03:13 GMT)
Linear Preference Optimization: Decoupled Gradient Control via Absolute Regularization [14.0] DPO(Direct Preference Optimization)は、その単純さと訓練安定性から、オフライン優先最適化アルゴリズムとして広く使われている。
3つの重要なイノベーションを特徴とする新しいアライメントフレームワークであるLinear Preference Optimization (LPO)を提案する。
まず,対数シグモイド関数を絶対差分損失に置き換え,最適化力学を分離することで勾配デカップリングを導入する。
第2に、選択された応答品質を維持するために、オフセット制約と正の正則化項を組み合わせることで安定性を向上させる。
第3に、直感的な推定を伴う勾配分離と、その相対確率の降下を線形に制御する調整可能な係数を用いて、制御可能な拒絶抑制を実装した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:37:33 GMT)
Finding Outliers in a Haystack: Anomaly Detection for Large Pointcloud Scenes [13.6] 我々は、屋外シーンのオープンセットセグメンテーションのタスクに対して、再構築に基づくアプローチを作成する。
提案手法は,我々のオープンセットセグメンテーション法に適用した場合だけでなく,既存の手法にも適用した場合にも性能が向上することを示す。
我々は,既存のボクセル・コンボリューション・ベースの手法と競合するMambaベースのアーキテクチャを,挑戦的かつ大規模なポイントクラウドに貢献する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:47:33 GMT)
DLGE: Dual Local-Global Encoding for Generalizable Cross-BCI-Paradigm [13.4] 深層学習モデルは脳波(EEG)に基づく単一の脳-コンピュータインタフェース(BCI)パラダイムのデコードに頻繁に用いられている。
複数のBCIパラダイムを1つのモデルでデコードするのは困難である。
本稿では,異なるBCIパラダイムにまたがる分類を可能にするために,Dual Local-Global (DLGE)を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:28:08 GMT)
Vivid-VR: Distilling Concepts from Text-to-Video Diffusion Transformer for Photorealistic Video Restoration [13.4] 先進的なT2Vファンデーションモデルに基づいて構築されたDiTベースの生成ビデオ復元手法であるVivid-VRを提案する。
Vivid-VRは, 実世界のベンチマークと実世界のベンチマークの両方において, 既存のアプローチに対して良好に動作することを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:07:54 GMT)
RT-Cache: Training-Free Retrieval for Real-Time Manipulation [13.3] RT-Cacheは、ロボットのためのトレーニング不要の検索・アズ・コントロールパイプラインである。
現行のフレームを埋め込んでマルチステップスニペットを検索して再生し、ステップ単位のモデルコールを置き換える。
階層的な検索は、100万スケールのルックアップをサブ秒以下に維持し、コストを計算からストレージにシフトさせる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:15:27 GMT)
Huracan: A skillful end-to-end data-driven system for ensemble data assimilation and weather prediction [13.3] Huracanは、アンサンブルデータ同化モデルと予測モデルを組み合わせた観測駆動の天気予報システムである。
最先端のNWP競合であるECMWF ENSに匹敵する精度を達成した最初のエンドツーエンドシステムである。
我々の研究は、エンドツーエンドのデータ駆動天気予報の大きな一歩であり、運用天気予報をさらに改善し、革新する機会を開く。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:55:46 GMT)
Automating Conflict-Aware ACL Configurations with Natural Language Intents [13.2] Xumiは、自然言語の意図を完全なACLルールに翻訳し、演算子の手作業を減らす。
Xumiは、ACLと競合するO(100)に対処し、現代のクラウドネットワークにおいて、ルールの追加を40%削減する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:00:41 GMT)
VIN-NBV: A View Introspection Network for Next-Best-View Selection [13.1] Next Best View (NBV)は、最小限のリソースを使用して3Dシーンの取得品質を最大化することを目的としている。
本稿では,潜在的次の視点の相対再構成改善(RRI)を予測する軽量ニューラルネットワークであるビューイントロスペクション・ネットワーク(VIN)を紹介する。
我々は,我々のRRI適合度基準が,同じ欲求戦略を用いて,カバーベース基準よりも30%向上することを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:56:25 GMT)
Simulating monitoring-induced topological phase transitions with small systems [13.0] 本研究では, 実験負荷を緩和し, 暗黒状態に誘起される位相相転移を示す2つの重要な単純化手法を提案する。
まず,小系の位相空間におけるトポロジをエミュレートする。そこでは,システムの有効サイズは,アクセス可能なパラメータ範囲によって反映される。
第2に,補助システムによるシステム拡張により,標準的な壁面平均化により,ジャンプ時間平均状態にアクセスする方法を開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:27:33 GMT)
Unveiling Code Clone Patterns in Open Source VR Software: An Empirical Study [13.0] 345のオープンソースVRプロジェクトにおいて,ソフトウェアクローンの大規模定量分析を行った。
われわれの研究は、VRソフトウェアにおけるクローン現象に関する多くの洞察を導き、慎重に定式化された7つの研究質問に導かれる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:01:22 GMT)
Jigsaw-Puzzles: From Seeing to Understanding to Reasoning in Vision-Language Models [12.9] Jigsaw-Puzzlesは空間的複雑さの高い1,100個の慎重にキュレートされた実世界の画像からなる新しいベンチマークである。
このデータセットに基づいて、視覚言語モデルの空間知覚、構造的理解、推論能力を厳格に評価する5つのタスクを設計する。
その結果、最強モデルであるGemini-2.5-Proでさえ、全体的な精度は77.14%に過ぎず、特にオーダージェネレーションタスクでは性能が劣っていることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:55:22 GMT)
Not a Swiss Army Knife: Academics' Perceptions of Trade-Offs Around Generative Artificial Intelligence Use [12.9] 我々は、教員や学生を含む17人の知識労働者にインタビューを行い、生成AI(Gen AI)の社会的・技術的側面について調査した。
参加者は、Gen AIのトレーニングに使用されるデータの不透明さに関する懸念を提起しました。
参加者は、学習プロセスを加速し、アクセス可能な研究アシスタントとして機能することで、Gen AIが知識を民主化する可能性を認識した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:21:23 GMT)
Robust Anomaly Detection in Industrial Environments via Meta-Learning [12.7] 本稿では,正規化フローとモデル非依存メタラーニングを統合したロバストな異常検出フレームワークRADを提案する。
提案手法では,メタラーニングによって様々な雑音条件に迅速に適応できる二段階最適化方式を用いる。
以上の結果から,RADのノイズの多い訓練条件に対する特異なレジリエンスと,様々な産業シナリオにおける微妙な異常を検出する能力が浮き彫りになった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:35:28 GMT)
See What You Need: Query-Aware Visual Intelligence through Reasoning-Perception Loops [12.6] 本稿では、推論、認識調整を通じて映像理解に革命をもたらすトレーニングフリーのフレームワークであるCAVIAを提案する。
視覚処理が推論とは無関係に機能する従来の手法とは異なり、CAVIAは推論が識別された情報ギャップに基づいて視覚的抽出を継続的に導く閉ループシステムを作成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:00:12 GMT)
CMFDNet: Cross-Mamba and Feature Discovery Network for Polyp Segmentation [12.5] 自動大腸ポリープセグメンテーションのための革新的アーキテクチャCMFDNetが提案されている。
CMFDNetはCMDモジュール、MSAモジュール、FDモジュールで提案されている。
実験の結果,CMFDNetは6つのSOTA法より優れていることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:12:00 GMT)
ControlEchoSynth: Boosting Ejection Fraction Estimation Models via Controlled Video Diffusion [12.5] エコービューを合成して臨床診断精度を高めるための新しい手法を提案する。
これらの視点は、既存の心のリアルな視点に基づいており、射出率(EF)の推定に特に焦点を当てている。
予備的な結果は、我々の合成エコーが、既存のデータセットを増強するために使用される場合、EF推定を向上するだけでなく、より堅牢で正確で臨床的に関連する機械学習モデルの開発を進める可能性も示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:27:25 GMT)
Mesh-Learner: Texturing Mesh with Spherical Harmonics [12.2] Mesh-Learnerは従来のパイプラインと互換性のある3D再構築およびレンダリングフレームワークである。
メッシュと球面調和(SH)テクスチャを学習プロセスに統合し、各メッシュのビュー依存のエンドツーエンドを学習する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:15:30 GMT)
PoRe: Position-Reweighted Visual Token Pruning for Vision Language Models [12.2] 本稿では,視覚的トークンプルーニングにおける遅延バイアスを軽減するための,極めて単純かつ効果的なアプローチを提案する。
画像内の空間的位置に応じて視覚的トークンの注意点を調節する簡単なリウェイト機構を提案する。
提案手法は,既存のビジュアルトークンプルーニングフレームワークにシームレスに組み込むことができるプラグイン・アンド・プレイソリューションである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:56:32 GMT)
Type-Compliant Adaptation Cascades: Adapting Programmatic LM Workflows to Data [12.1] 本稿では,ワークフロー適応を学習型確率プログラムとして再放送するフレームワークであるType-Compliant Adaptation Cascades (TACs)を紹介する。
経験的に、TACは最先端のプロンプト最適化ベースラインを著しく上回る。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:36:21 GMT)
CEIDM: A Controlled Entity and Interaction Diffusion Model for Enhanced Text-to-Image Generation [11.8] テキスト・ツー・イメージ(T2I)生成では、エンティティとその複雑な相互作用の複雑さが大きな課題となる。
本稿では,エンティティとインタラクションの二重制御による拡散モデルに基づく画像生成手法CEIDMを提案する。
実験により、CEIDM法は、エンティティ制御とインタラクション制御の両方において、最も代表的な方法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:58:57 GMT)
Denoising, segmentation and volumetric rendering of optical coherence tomography angiography (OCTA) image using deep learning techniques: a review [11.7] OCTAは、網膜と脈絡膜における血管構造と微小循環動態を研究するために広く用いられている非侵襲的イメージング技術である。
ディープラーニング(DL)ベースの画像解析モデルでは、アーティファクトやノイズを自動的に検出し、削除することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:05:13 GMT)
Visual-CoG: Stage-Aware Reinforcement Learning with Chain of Guidance for Text-to-Image Generation [11.7] 本稿では,3段階からなるビジュアル・チェーン・オブ・ガイダンス(Visual-CoG)パラダイムを提案する。
提案したVisual-CoGでは,それぞれ15%,5%,19%の改善が見られた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:53:02 GMT)
Poisson Hierarchical Indian Buffet Processes-With Indications for Microbiome Species Sampling Models [11.6] 複雑で疎数なデータに対する課題に対処するために,新しい種類の種サンプリングモデルを導入する。
我々の研究は、遺伝学、商取引、テキスト分析における階層的カウントモデリングのための、広く適用可能な方法論を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:30:35 GMT)
Disentangling the Factors of Convergence between Brains and Computer Vision Models [11.6] 我々は、人間中心の画像で訓練された最大のDINOv3モデルが、最も高い脳相似性に達することを示した。
これらの発見は、人工ニューラルネットワークが世界をどのように人間として見るかという、アーキテクチャと経験の間の相互作用を歪めている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:23:27 GMT)
Sharp Lower Bounds on Interpolation by Deep ReLU Neural Networks at Irregularly Spaced Data [11.6] Deep ReLUニューラルネットワークは、距離$delta$で区切られた$N$のデータポイントで値を補間することができる。
我々は$Omega(N)$パラメータが、$delta$が$N$で指数関数的に小さい状態において必要であることを示す。
アプリケーションとして、埋め込みエンドポイントにおけるソボレフ空間に対して、深いReLUニューラルネットワークが達成できる近似率に、低いバウンダリを与える。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:18:16 GMT)
Impact of Target and Tool Visualization on Depth Perception and Usability in Optical See-Through AR [11.3] 本稿では,対象物を異なる透過度で可視化し,追跡ツールの可視化が深度知覚とシステムユーザビリティにどのように影響するかを評価する。
10人の参加者がMicrosoft HoloLens 2.0で2つの実験を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:45:00 GMT)
Towards Continual Visual Anomaly Detection in the Medical Domain [11.3] 視覚異常検出(VAD)は、異常画像を特定し、対応する異常領域を正確に特定する。
継続的学習(CL)は、以前獲得した知識を保持しながらモデルを段階的に適応するためのフレームワークを提供する。
本研究は、医療分野におけるCLシナリオにおけるVADモデルの適用について、初めて考察する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:28:15 GMT)
Riemannian Optimization for LoRA on the Stiefel Manifold [11.2] 大規模言語モデル(LLM)は、そのサイズのため、大幅な微調整の課題を呈している。
幾何学的制約は、LoRAが効果的に微調整できる可能性を解き放つ鍵であることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:15:52 GMT)
WOMAC: A Mechanism For Prediction Competitions [11.2] 標準競技デザインは、達成された結果または保持されたラベルのセットに対して累積スコアに基づいて競技者をランク付けする。
主な原因は、専門家が反対する結果やラベルのノイズです。
WOMAC (Wisdom of the Most Accurate Crowd)
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:25:28 GMT)
Not All Visitors are Bilingual: A Measurement Study of the Multilingual Web from an Accessibility Perspective [11.1] 英語はウェブ上で支配的な言語であり、世界のトップ1000万のウェブサイトのほぼ半分を占めています。
多言語コンテンツのサポートは増加しており、多くのWebサイトは、可視的コンテンツと隠れメタデータの両方で、英語と地域言語、あるいはネイティブ言語を組み合わせている。
この多言語主義は視覚障害者にとって大きな障壁をもたらす。
LangCrUXは12言語にまたがる12万の人気のあるWebサイトの大規模なデータセットで、主に非ラテン語スクリプトを使用している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:29:57 GMT)
Decoherence-free interaction and maximally entangled state generation in double-giant-atom semi-infinite waveguide systems [11.0] 2つの巨大原子間のデコヒーレンスフリー相互作用は、ブレイドおよびネスト配置の両方で実現可能であることを示す。
また、1次元の半無限導波路に結合した2つの巨大原子間の絡み合いの発生について検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:51:54 GMT)
How do Humans and LLMs Process Confusing Code? [11.0] プログラミングアシスタント(LLM)とプログラマがコードを理解する方法の相違は、誤解や非効率性、コード品質の低下、バグにつながる可能性がある。
クリーンで紛らわしいコードを解釈し,LLMを人間プログラマと比較した実証的研究を行った。
LLMの急激なスパイクは、場所と振幅の両方において、混乱を示す人間の神経生理学的反応と相関していることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:50:55 GMT)
AVAM: Universal Training-free Adaptive Visual Anchoring Embedded into Multimodal Large Language Model for Multi-image Question Answering [11.0] 本稿では,既存のMLLMにシームレスに統合可能な,単純かつ普遍的な適応型ビジュアルアンカリング戦略を提案する。
グローバルな視覚入力と圧縮された視覚入力の両方から得られる結果のバランスをとるために,新しい協調的復号機構を導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:10:46 GMT)
Investigating the Robustness of Deductive Reasoning with Large Language Models [10.7] 大規模言語モデル(LLM)は多くの推論に基づくNLPタスクにおいて印象的な結果が得られることが示されている。
LLMが、非公式および自己形式化の両方の手法で、どの程度論理的推論タスクに頑健であるかは、まだ不明である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:34:46 GMT)
Improving Long-term Autoregressive Spatiotemporal Predictions: A Proof of Concept with Fluid Dynamics [10.7] 複雑なシステムでは、エラーの蓄積によって長期的な精度が劣化することが多い。
我々はPushForwardフレームワークを提案する。PushForwardフレームワークは、マルチステップ学習を実現しつつ、ワンステップのトレーニングを継続する。
SPFはモデル予測から補足的データセットを構築し、取得戦略を通じて真実と組み合わせる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:51:18 GMT)
SEAM: Semantically Equivalent Across Modalities Benchmark for Vision-Language Models [10.7] セマンティックに等価な入力を4つのドメインにペアリングするベンチマークSEAMを紹介する。
我々は、21の現代視覚言語モデルにおいて、系統的なモダリティの不均衡を観察する。
私たちの結果は、ビジュアルトランスフォーメーションに対して非常に堅牢です。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:33:07 GMT)
Learning Heterogeneous Mixture of Scene Experts for Large-scale Neural Radiance Fields [10.7] ヘテロジニアス分解とヘテロジニアスNeRFを効率的に学習する高度にスケーラブルなNeRFであるSwitch-NeRF++を紹介する。
このフレームワークでは、ゲーティングネットワークがシーンを分解し、3Dポイントを専門のNeRF専門家に割り当てることを学ぶ。
我々の手法は様々な大規模シーンに容易に拡張でき、最先端のシーンレンダリング精度を実現することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:04:29 GMT)
ClearMask: Noise-Free and Naturalness-Preserving Protection Against Voice Deepfake Attacks [10.7] 音声ディープフェイク攻撃に対する防音機構であるClearMaskを提案する。
従来のアプローチとは異なり、ClearMaskは特定の周波数を選択的にフィルタリングすることでオーディオメルスペクトルを変更する。
また、ユニバーサル周波数フィルタと残響生成器を用いて、リアルタイムにストリーミング音声を保護するLiveMaskを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:46:35 GMT)
Retrieval Feedback Memory Enhancement Large Model Retrieval Generation Method [10.7] 大規模言語モデル(LLM)は、制約付きパラメトリック知識や高いリトレーニングコストといった固有の制約に直面します。
検索フィードバックとメモリ検索拡張生成(RFM-RAG)を提案する。
RFM-RAGは, 動的エビデンスプールを構築することにより, 従来手法のステートレス検索をステートフルな継続的知識管理に変換する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:13:02 GMT)
Personalized Tree-Based Progressive Regression Model for Watch-Time Prediction in Short Video Recommendation [10.4] 時計時間予測の精度は、時計時間ラベルの変換と推定過程の分解に大きく依存する。
TPM(Tree based Progressive Regression Model)は、慎重に設計され効果的な分解パラダイムを用いて、最先端のパフォーマンスを達成する。
条件付きモデルにより,TPMは選択バイアスに悩まされ,簡単な解法が提案される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:01:43 GMT)
Artificial Intelligence-Based Multiscale Temporal Modeling for Anomaly Detection in Cloud Services [10.4] 本研究では,マルチスケール特徴認識を統合したTransformerアーキテクチャに基づく異常検出手法を提案する。
提案手法は,精度,リコール,AUC,F1スコアなどの主要な指標において,主流のベースラインモデルより優れている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:09:12 GMT)
Quantifying The Limits of AI Reasoning: Systematic Neural Network Representations of Algorithms [10.3] 基本的に任意の回路をフィードフォワードニューラルネットワーク(NN)に変換するシステムメタアルゴリズムを提案する。
あらゆるデジタルコンピュータ上で、我々の構成は回路を正確にエミュレートしている ― 近似がなく、丸めず、モジュラーなオーバーフローも含まない ― ニューラルネットワークの範囲を超えて推論タスクが存在しないことを実証している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:55:37 GMT)
Conditional Stochastic Interpolation for Generative Learning [10.2] 本研究では条件分布を学習するための条件条件付き条件付き(CSI)手法を提案する。
条件予測の観点から条件ドリフトとスコア関数の明示的な表現を導出する。
ベンチマーク画像データセットを用いた画像生成におけるCSIの適用について述べる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:05:21 GMT)
Can Large Language Models Act as Ensembler for Multi-GNNs? [10.1] グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するための強力なモデルとして登場した。
GNNは、リッチテキストノード属性の固有の意味理解能力に欠けており、アプリケーションでの有効性を制限している。
本研究は、意味情報と構造情報を統合するための堅牢で優れたソリューションを提供することにより、テキストによるグラフアンサンブル学習を推進している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:13:55 GMT)
WetCat: Enabling Automated Skill Assessment in Wet-Lab Cataract Surgery Videos [10.1] WetCatは、自動スキルアセスメントのために特別にキュレートされたウェットラブ白内障手術ビデオの最初のデータセットである。
WetCatは、人工眼で訓練生が行う手術の高解像度記録を含む。
WetCatは、既存の臨床指標に沿った解釈可能なAI駆動評価ツールの開発を可能にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:18:52 GMT)
FAIRGAMER: Evaluating Biases in the Application of Large Language Models to Video Games [10.0] 本研究では,Large Language Modelsが生み出す社会的バイアスが,現実世界のゲーム環境においてゲームバランスを直接的に損なうことを示す。
ビデオゲームシナリオにおける LLM のバイアス評価ベンチマークである FairGamer について述べる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:26:19 GMT)
Scene-Agnostic Traversability Labeling and Estimation via a Multimodal Self-supervised Framework [9.9] トレーバービリティの推定は、ロボットが多様な地形や環境を移動できるようにするために重要である。
トラバーサビリティラベリングと推定のためのマルチモーダルな自己教師型フレームワークを提案する。
当社のアプローチは、さまざまなデータセットの約88%のIoUを一貫して達成しています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:40:16 GMT)
Topology Aware Neural Interpolation of Scalar Fields [9.9] ニューラルネットワークは、実例に基づいて、時間値から対応するスカラーフィールドとの関係を学習し、この関係を非キーフレーム時間ステップに確実に拡張する。
入力図を利用して、このアーキテクチャを特定の位相損失で拡張することにより、幾何学的およびトポロジ的な非鍵フレーム時間ステップの再構築が向上することを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:04:21 GMT)
Evaluating Movement Initiation Timing in Ultimate Frisbee via Temporal Counterfactuals [9.6] アルティメット・フリスビーでは、ディスクをパスして相手チームのエンドゾーンでキャッチすることでポイントが得点される。
現在の文献は、プレイヤーがゲーム状況においてそのようなラベルのない動きを開始する際の定量的評価を無視している。
我々は,Ultimate Frisbeeにおける運動開始タイミングの定量的評価法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:42:08 GMT)
Interpretable Early Failure Detection via Machine Learning and Trace Checking-based Monitoring [9.6] ベクトル化トレースチェックに基づく早期故障検出のためのフレームワークを開発する。
このフレームワークは、最先端の手法と比較して、主要なパフォーマンス指標を2-10%改善している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:30:01 GMT)
Designing Practical Models for Isolated Word Visual Speech Recognition [9.5] 視覚音声認識(VSR)システムは、ビデオデータのみを使用して、入力シーケンスから音声をデコードする。
このようなシステムの実用化には、医療支援や人間と機械の相互作用が含まれる。
画像分類文献からまず効率的なモデルを作成し、その後、時間的畳み込みネットワークのバックボーンに軽量ブロック設計を採用することで、軽量なエンドツーエンドアーキテクチャを開発する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:04:36 GMT)
Improving End-to-End Training of Retrieval-Augmented Generation Models via Joint Stochastic Approximation [9.5] Retrieval-augmented Generation (RAG)は、パラメトリックメモリと非パラメトリックメモリを組み合わせたパラダイムとして広く認知されている。
RAGモデルのエンドツーエンド最適化における大きな課題は、関連するパスに対する限界化が必要であることである。
本稿では,共同近似(JSA)に基づくRAGのエンドツーエンドトレーニングを提案する。
JSAアルゴリズムはEM(expectation-maximization)アルゴリズムの拡張であり、潜在変数モデルの推定に特に強力である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:17:16 GMT)
DiscussLLM: Teaching Large Language Models When to Speak [9.4] LLM(Large Language Models)は、人間に似たテキストの理解と生成において顕著な能力を示した。
トレーニングモデルによってこのギャップを埋めるために設計されたフレームワークである$textitDiscussLLM$を紹介します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:16:42 GMT)
SafeBimanual: Diffusion-based Trajectory Optimization for Safe Bimanual Manipulation [9.4] 双方向操作は家庭サービスや製造業に広く応用されている。
最近の拡散型政策学習アプローチは、バイマニュアル操作のための行動分布のモデル化において有望な性能を達成している。
本研究では,事前学習した拡散に基づく双方向操作ポリシーに対して,SafeBimanual というテスト時間軌道最適化フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:59:02 GMT)
PCR-CA: Parallel Codebook Representations with Contrastive Alignment for Multiple-Category App Recommendation [9.3] PCR-CAはCTR予測を改善するためのエンドツーエンドフレームワークである。
複数のコードブックにまたがる個別の意味表現を並列に学習する。
意味的および協調的なシグナルをブリッジするために、ユーザレベルとアイテムレベルの両方において、コントラスト的なアライメント損失を用いる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:16:06 GMT)
Frozen in Time: Parameter-Efficient Time Series Transformers via Reservoir-Induced Feature Expansion and Fixed Random Dynamics [9.3] FreezeTSTは、凍結したランダム機能(Reservoir)ブロックと標準的なトレーニング可能なTransformerレイヤをインターリーブする軽量ハイブリッドである。
この設計ではトレーニング可能なパラメータを削減し、ウォールタイムのトレーニング時間を短縮し、推論の複雑さは変わらない。
以上の結果から,Transformers に貯水池の原理を組み込むことで,長期的時系列予測の効率化が図れる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:38:23 GMT)
Multi-layer Abstraction for Nested Generation of Options (MANGO) in Hierarchical Reinforcement Learning [9.2] MANGO(Multilayer Abstraction for Nested Generation of Options)は,階層型強化学習フレームワークである。
複雑なタスクを抽象化の複数のレイヤに分解し、各レイヤが抽象状態空間を定義する。
手続き的に生成されたグリッド環境での実験は、サンプル効率と一般化能力を大幅に改善した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:44:35 GMT)
Camera Pose Refinement via 3D Gaussian Splatting [9.1] カメラポーズ補正は,3次元コンピュータビジョンにおける初期ポーズ推定の精度向上を目的としている。
3次元ガウススプラッティングを利用した新しいカメラポーズ改善フレームワーク(3DGS)を提案する。
本手法は,7シーンとケンブリッジ・ランドマークス・データセットの中央値翻訳と回転誤差を53.3%,56.9%削減する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:29:59 GMT)
LongRetriever: Towards Ultra-Long Sequence based Candidate Retrieval for Recommendation [9.1] LongRetrieverは、超長いシーケンスをレコメンダの検索ステージに組み込むためのフレームワークである。
LongRetrieverは大規模なeコマースプラットフォームに完全にデプロイされており、数十億人のユーザーに影響を与える。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:37:46 GMT)
Emerging Semantic Segmentation from Positive and Negative Coarse Label Learning [9.1] 画像中の正の(対象)クラスと負の(背景)クラスの両方から粗い描画をノイズのあるピクセルでも使用し、意味的セグメンテーションのために畳み込みニューラルネットワーク(CNN)を訓練することを提案する。
2つの結合CNNを用いて、純粋にノイズの多い粗いアノテーションから真のセグメンテーションラベル分布を学習する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:38:51 GMT)
HotSpotter - Patterned Species Instance Recognition [9.1] ラベル付きデータベースに対して個々の動物を識別する高速で正確なアルゴリズムであるHotSpotterを提案する。
種特異的ではなく、グリービーズや平原のシマウマ、キリン、ヒョウ、ライオンズにも適用されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:18:52 GMT)
HypER: Hyperbolic Echo State Networks for Capturing Stretch-and-Fold Dynamics in Chaotic Flows [9.1] 本稿では,ポインケアボールにニューロンをサンプリングし,双曲距離と指数関数的に結合が崩壊するESNであるHypERを紹介した。
この負曲率構造は指数的計量を潜在空間に直接埋め込み、貯水池の局所膨張スペクトルと系のリャプノフ方向とを一致させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:55:16 GMT)
Layerwise Importance Analysis of Feed-Forward Networks in Transformer-based Language Models [9.0] 本研究では,トランスフォーマーに基づく言語モデルにおけるフィードフォワードネットワーク(FFN)の事前学習における重層的重要性について検討する。
本研究では,いくつかの層におけるFFN次元を増大させ,他の層からFFNを完全に除去する実験手法を提案する。
連続中間層の70%にFFNを集中させることは、複数の下流タスクの標準構成よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:21:49 GMT)
IDU: Incremental Dynamic Update of Existing 3D Virtual Environments with New Imagery Data [9.0] Incremental Dynamic Update (IDU)パイプラインを導入し、既存の3D再構成を効率的に更新する。
我々のアプローチは、カメラのポーズ推定から始まり、新しい画像を既存の3Dモデルに合わせる。
そして、3D生成AIモデルを使用して、新しい要素の高品質な3Dアセットを生成し、既存の3Dモデルにシームレスに統合する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:00:35 GMT)
Randomly Removing 50% of Dimensions in Text Embeddings has Minimal Impact on Retrieval and Classification Tasks [9.0] テキスト埋め込みが下流のパフォーマンスに与える影響について検討する。
均一に分散した次元が多数存在すると、取り除くと実際に性能が向上することがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:37:24 GMT)
CLAP: Coreference-Linked Augmentation for Passage Retrieval [9.0] 軽量LLM拡張フレームワークであるCLAP(Coreference-Linked Augmentation for Passage Retrieval)を提案する。
CLAPは、パスをコヒーレントなチャンクに分割し、コア参照チェーンを分解し、密度の高いレトリバー表現と整合した局所的な擬似クエリを生成する。
グローバルなトピック信号と微粒なサブトピック信号の単純な融合は、ドメイン間のロバストなパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:03:00 GMT)
Pr$^2$R: Information-Fused and Style-Aware Privacy-Preserving Replay for Lifelong Person Re-Identification [8.9] LReID(Lifelong person re-identification)は、ドメインシフトの下で一連のタスクに知識を段階的に蓄積することを目的としている。
近年のリプレイベース手法は, 補助記憶に記憶された過去のサンプルをリハーサルすることにより, LReIDに強い効果を示した。
リプレイメモリの画素空間にシーケンシャルデータから情報を融合し、プライバシ保存リプレイを可能にする(Pr$2$R)。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:48:05 GMT)
A foundation model with multi-variate parallel attention to generate neuronal activity [8.8] 本稿では,コンテンツ,時間,空間的注意をゆがめる新しい自己注意機構を提案する。
MVPAは、様々なチャンネル数と構成で、フレキシブルで、一般化可能で、効率的な時系列データのモデリングを可能にする。
我々はMVPAを用いて、多種多様な被験者におけるiEEG信号の進化を予測するために訓練された人体電気生理学の生成基盤モデルMVPFormerを構築した。
MVPFormerは、SWEC、MAYO、FNUSA間での発作検出において、最先端のTransformerベースラインを超えると同時に、データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:34:45 GMT)
Evaluating Scoring Bias in LLM-as-a-Judge [8.7] 大規模言語モデル (LLM) は複雑なタスクの評価に使用される。
LLM-as-a-Judgeには様々なバイアスがあり、判断の公平性と信頼性に悪影響を及ぼす。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:37:03 GMT)
Controllable Single-shot Animation Blending with Temporal Conditioning [8.6] 生成過程を時間的に条件付けすることでシームレスなブレンディングを可能にする,最初の単発モーションブレンディングフレームワークを提案する。
本手法では,運動間の遷移を誘導する骨格認識の正規化機構を導入し,運動がいつどのように混在するかを円滑にデータ駆動制御する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:55:16 GMT)
How many samples are needed to train a deep neural network? [8.6] 本稿では,ReLUフィードフォワードニューラルネットワークのトレーニングに必要なデータ量について検討する。
私たちの結果は、ニューラルネットワークが"多くの"トレーニングサンプルを必要とするという一般的な信念を裏付けています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:01:51 GMT)
Code Difference Guided Fuzzing for FPGA Logic Synthesis Compilers via Bayesian Optimization [8.5] 我々は、FPGA論理合成コンパイラのバグを検出するため、LCC-Fuzzと呼ばれるベイズ最適化に基づく誘導突然変異戦略を提案する。
3ヶ月の間に、LSC-Fuzzは16のバグを発見し、そのうち12が公式の技術サポートによって確認されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:41:36 GMT)
Are the Majority of Public Computational Notebooks Pathologically Non-Executable? [8.5] 従来の実行可能性の概念は過度に厳格であり、多くのノートを誤って分類し、実行不可能性を過大評価している、と私たちは主張する。
本稿では,公立ノートの病的実行可能性問題について,様々な概念と実行可能性の度合いで検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:40:33 GMT)
MemoryTalker: Personalized Speech-Driven 3D Facial Animation via Audio-Guided Stylization [8.4] 音声駆動型3D顔アニメーションは、話者の話し方に合わせて、与えられた音声から現実的な顔の動きシーケンスを合成することを目的としている。
以前の作業では、スピーカーのクラスラベルや推論時に追加の3D顔メッシュなど、事前の作業が必要になることが多い。
本稿では,音声入力のみで発話スタイルを反映することで,現実的で正確な3次元顔の動き合成を可能にするMemoryTalkerを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:44:57 GMT)
Large VLM-based Stylized Sports Captioning [8.4] 本研究は, 既存の SoTA LLM/LVLM による画像からのスポーツキャプション生成の限界を強調するものである。
これに対処する2レベル細調整LVLMパイプラインを提案する。
スーパーボウルLIXの間、パイプラインはプロスポーツジャーナリズムの実践的な応用を証明した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:50:51 GMT)
Quantum Parameter Estimation for Detectors in Constantly Accelerated Motion [8.3] 本研究では,量子フィッシャー情報(QFI)の動的特性を,加速度と初期状態の2種類のパラメータに対して解析する。
十分に大きな加速度を得るためには、有限の相互作用時間内で加速パラメータを推定する際に最適な精度が得られる。
トラジェクトリと比較すると、小さな加速度の場合、線形運動は$theta$に対して最も高いQFIが得られるのに対し、大きな加速度の場合、円運動は$theta$を推定するのに最適である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:49:48 GMT)
The Accessibility Paradox: How Blind and Low Vision Employees Experience and Negotiate Accessibility in the Technology Industry [8.2] 本研究は、さまざまな技術系企業におけるBLV労働者の経験に焦点を当てたものである。
日常の職場での交流においてアクセシビリティ・パラドックスがどのように現れるかを示す。
今後の研究と実践を推奨する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:05:23 GMT)
CCVA-FL: Cross-Client Variations Adaptive Federated Learning for Medical Imaging [8.1] Federated Learning(FL)は、分散データ上でモデルをトレーニングするためのプライバシ保護アプローチを提供する。
Cross-Client Variations Adaptive Federated Learning (CCVA-FL)は、イメージを共通の特徴空間に変換することで、クロスクライアントのバリエーションを最小限にすることを目的としている。
その結果、CCVA-FLはプライバシーを損なうことなく、クライアント間でのデータ分散の違いを効果的に解決することで、Vanilla Federated Averagingよりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:57:42 GMT)
Neural Algorithmic Reasoners informed Large Language Model for Multi-Agent Path Finding [8.0] 本稿では,ニューラルアルゴリズム推論(NAR)を利用してMAPFにLLMを通知する新しいフレームワーク LLM-NAR を提案する。
MAPFの地図情報とGNNを統合するために、ニューラルネットワーク推論を用いた最初の研究である。
本手法はMAPF問題の解法において,既存のLLM法よりも優れていた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:38:08 GMT)
M^3-GloDets: Multi-Region and Multi-Scale Analysis of Fine-Grained Diseased Glomerular Detection [8.0] M3-GloDetは、検出モデルの徹底的な評価を可能にするために設計された、体系的なフレームワークである。
我々は、長年のベンチマークアーキテクチャと、注目すべきパフォーマンスを達成した最先端モデルの両方を評価した。
我々の目標は、モデル強度と限界の理解を深め、自動検出戦略の洗練のための実用的な洞察を提供することである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:52:34 GMT)
Reconsidering Fairness Through Unawareness From the Perspective of Model Multiplicity [8.0] 我々は,FtUが必ずしも精度を低下させることなく,アルゴリズムによる識別を低減できることを理論的かつ実証的に示す。
現実のアプリケーションでは、FtUが効率を損なうことなく、より公平なポリシーの展開にどのように貢献できるかを説明します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:36:52 GMT)
Ada-TransGNN: An Air Quality Prediction Model Based On Adaptive Graph Convolutional Networks [7.9] 本研究では,グローバルな空間意味と時間的行動を統合するトランスフォーマーに基づくデータ予測手法を提案する。
本モデルは,短期・長期予測において,既存の最先端予測モデルよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:22:03 GMT)
Talking to Robots: A Practical Examination of Speech Foundation Models for HRI Applications [7.9] 人間-ロボット相互作用(HRI)では、これらの課題が相互に交わり、独特な挑戦的な認識環境を作り出す。
我々は,6次元の難易度をキャプチャする8つの公開データセット上で,最先端のASRシステム4つを評価する。
我々の分析は、標準ベンチマークに類似のスコアがあるにもかかわらず、性能、幻覚傾向、および固有のバイアスに有意なばらつきを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:45:20 GMT)
Quantum Mpemba effect in parity-time symmetric systems [7.7] ボゾン浴に浸漬したパリティ時間対称量子ビット系におけるQMPEの発生について検討した。
我々はQMPEを緩和モードの継続による協調効果とみなす。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:52:36 GMT)
PuzzleClone: An SMT-Powered Framework for Synthesizing Verifiable Data [7.6] Satisfiabilityo Synthesizing (SMT) を用いた大規模検証のためのフレームワークである PuzzleClone を紹介する。
提案手法は,(1) シードパズルを構造化論理仕様に符号化すること,(2) 体系的変数と制約ランダム化によるスケーラブルな変種を生成すること,(3) 再生機構による有効性を確保すること,の3つの重要なイノベーションを特徴とする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:16:00 GMT)
Minimizing Surrogate Losses for Decision-Focused Learning using Differentiable Optimization [7.6] 決定中心学習(DFL)は、最適化問題のパラメータを予測するために機械学習(ML)モデルを訓練する。
勾配に基づくDFLは、予測されたパラメータに対する最適化問題に対する解の微分を計算する必要がある。
線形プログラム(LP)のような多くの最適化問題に対して、予測されたパラメータに対する後悔の勾配はほぼどこでもゼロである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:45:34 GMT)
Aligning Core Aspects: Improving Vulnerability Proof-of-Concepts via Cross-Source Insights [7.6] 公共プラットフォームにおけるPoCレポートにおける情報不足に関する最初の研究を行う。
公開プラットフォームで利用可能なPoCレポートには,少なくとも1つの重要な側面が欠けていることが分かりました。
我々はPoCレポートの欠落した側面情報を補完するマルチソース情報融合法を開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:18:10 GMT)
A Survey of the Self Supervised Learning Mechanisms for Vision Transformers [7.6] 自己教師型学習がビジョントランスフォーマーの有望な技術として登場した。
本稿では,その表現と事前学習タスクに基づいてSSLテクニックを分類する包括的分類法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:16:46 GMT)
Logging Requirement for Continuous Auditing of Responsible Machine Learning-based Applications [7.5] 機械学習(ML)は、意思決定を自動化するために、業界全体でますます適用されています。
倫理的および法的コンプライアンスに関する懸念は、透明性、公平性、説明責任が制限されているために残っている。
従来のソフトウェアにおける長年のプラクティスのロギングによる監視は、MLアプリケーションの監査に潜在的手段を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:59:24 GMT)
EndoUFM: Utilizing Foundation Models for Monocular depth estimation of endoscopic images [7.4] EndoUFMは、教師なしの単眼深度推定フレームワークである。
強力な事前学習先を活用することにより、深さ推定性能を向上させる。
この研究は、最小侵襲の手術において、外科医の空間的知覚を増大させるのに寄与する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:33:05 GMT)
Recognizing Limits: Investigating Infeasibility in Large Language Models [7.3] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著なパフォーマンスを示しているが、多くの場合、その知識や能力を超えるクエリを処理できない。
本稿は,LLMが機能を超えた要求により,実現不可能なタスクを認識し,拒否する必要性に対処する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:46:18 GMT)
Diffusing the Blind Spot: Uterine MRI Synthesis with Diffusion Models [7.3] 子宮MRI合成のための新しい拡散型フレームワークを提案する。
本手法は, 解剖学的に整合した高忠実な合成画像を生成し, 実際のスキャンを忠実に再現する。
ブラインドド・エキスパートによる評価は,我々の合成画像の臨床的現実性を評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:43:40 GMT)
CleverDistiller: Simple and Spatially Consistent Cross-modal Distillation [7.2] CleverDistillerは、自己監督型の2D-to-3D KDフレームワークである。
セマンティックセグメンテーションと3Dオブジェクト検出の両方において、最大10% mIoUで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:34:28 GMT)
DRTA: Dynamic Reward Scaling for Reinforcement Learning in Time Series Anomaly Detection [7.2] 時系列データの異常検出は、ファイナンス、ヘルスケア、センサーネットワーク、産業監視におけるアプリケーションにとって重要である。
本稿では,動的報酬形成,変分オートエンコーダ(VAE),DRTAと呼ばれるアクティブラーニングを統合した強化学習ベースのフレームワークを提案する。
提案手法は,VAEに基づく再構成誤りと分類報酬の効果を動的にスケーリングすることにより,探索と利用のバランスをとる適応報酬機構を用いる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:39:49 GMT)
REALM: Recursive Relevance Modeling for LLM-based Document Re-Ranking [7.2] 大規模言語モデル(LLM)は、ドキュメントの再ランク付けにおいて強力な能力を示している。
我々は不確実性を認識した再分類フレームワークであるREALMを提案する。
本稿では,REALMが最先端の再ランカを上回るとともに,トークン使用率やレイテンシを大幅に低減していることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:13:50 GMT)
Dynamic Fusion Multimodal Network for SpeechWellness Detection [7.2] 自殺は青年期の死因の1つである。
これまでの自殺リスク予測研究は、主に単独でテキスト情報と音響情報の両方に焦点を当ててきた。
音声検出のための動的融合機構に基づく軽量マルチブランチマルチモーダルシステムについて検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:18:12 GMT)
Bayesian Deep Learning for Segmentation for Autonomous Safe Planetary Landing [7.2] 本稿では,ベイジアンディープラーニングセグメンテーション法のハザード検出への応用を提案する。
ベイジアンディープラーニングとセマンティックセグメンテーションを通じて、安全予測マップとその不確実性マップを同時に生成する。
実験は、Mars HiRISEデジタル地形モデルに基づくシミュレーションデータで示される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:09:15 GMT)
Reinforcement Learning for Jump-Diffusions, with Financial Applications [7.0] 本研究では,ジャンプ拡散過程によって制御される系の力学に対する連続時間強化学習について検討する。
本研究では,ジャンプの存在が一般の俳優や批評家のパラメータ化に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:12:32 GMT)
Robustness Feature Adapter for Efficient Adversarial Training [6.9] 投射勾配降下を伴う対人訓練(AT)は、対人攻撃下でのモデルロバスト性を改善する最も一般的な方法である。
ATが大きなバックボーンモデルに適用されると、計算オーバーヘッドは著しく大きくなる。
本稿では,機能空間内での効率的なATを実現するためのアダプタベースのアプローチを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:23:50 GMT)
SMITE: Enhancing Fairness in LLMs through Optimal In-Context Example Selection via Dynamic Validation [6.9] 本研究では,Large Language Models(LLMs)の性能と公平性を高める新しいアプローチを提案する。
本稿では,従来の静的検証手法を代替して,テストセットと並行して進化する動的検証セットを提案する。
提案手法は,ベースライン法と比較して予測精度と公平性の両方を有意に向上させることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:22:08 GMT)
A Comparative Study of Controllability, Explainability, and Performance in Dysfluency Detection Models [6.8] 我々は, YOLO-Stutter, FluentNet, UDM, SSDMの4つの非定常モデリング手法を比較した。
YOLO-StutterとFluentNetは効率とシンプルさを提供するが、透明性は限られている。
UDMは、精度と臨床的解釈可能性の最良のバランスを達成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:23:09 GMT)
Adversarial Robustness in Two-Stage Learning-to-Defer: Algorithms and Guarantees [6.8] 2段階のL2D(Learning-to-Defer)は、各入力を固定されたメインモデルまたは複数のオフライン専門家のいずれかに割り当てることで、最適なタスクデリゲートを可能にする。
既存のL2Dフレームワークはクリーンな入力を前提としており、クエリ割り当てを操作できる敵の摂動に弱い。
2段階L2Dシステムにおける対向ロバスト性の最初の包括的研究について述べる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:03:43 GMT)
A Metropolitan-scale Multiplexed Quantum Repeater with Bell Nonlocality [6.7] 量子リピータは光ファイバーの指数的な光子損失を克服し、量子メモリ間の絡み合いを克服することができる。
ベル非局所性は、デバイスに依存しないセキュリティと量子力学の基礎的なテストの基盤となる。
本稿では,2つの固体量子メモリ間の密接な絡み合い分布を14.5km間隔で報告する。
我々は、7.6pm2.0%の忠実度を持つベル状態を生成し、3.7の標準偏差によるCHSH-Bellの不等式違反を達成する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:08:05 GMT)
Provable Mixed-Noise Learning with Flow-Matching [6.7] 加法成分と乗法成分の組み合わせとしてモデル化された混合雑音による逆問題について検討する。
近年のフローベース生成モデリングの進歩により,予測最大化(EM)アルゴリズムに埋め込まれた条件付きフローマッチングに基づく新しい推論フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:30:12 GMT)
PromptGAR: Flexible Promptive Group Activity Recognition [6.6] 本稿では,グループ活動認識(GAR)のための新しいフレームワークであるPromptGARについて述べる。
私たちはそれらをポイントプロンプトとして統一することで、バウンディングボックス、骨格キーポイント、インスタンスIDといった多様な視覚的プロンプトを活用します。
認識デコーダはクラスをクロスアップデートし、パフォーマンス向上のためにトークンをプロンプトする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:27:30 GMT)
Deep Learning-based Cross-modal Reconstruction of Vehicle Target from Sparse 3D SAR Image [6.5] 本稿では,光学情報を融合させることで,車両のスパース3D SAR画像の高精細化を実現する3D-SAR再構成ネットワーク(CMAR-Net)を提案する。
CMAR-Netは、高度にスパースな観察から得られたスパース3次元SAR画像を視覚的に構造化された3次元車両画像に再構成し、効率的なトレーニングを実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:53:26 GMT)
DoGFlow: Self-Supervised LiDAR Scene Flow via Cross-Modal Doppler Guidance [6.5] DoGFlowは、LiDARシーンフロー推定のための完全な3Dオブジェクトモーションを復元する、新しい自己教師型フレームワークである。
挑戦的なMAN TruckScenesデータセットでは、DoGFlowが既存の自己管理メソッドを大幅に上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:26:32 GMT)
FloraSyntropy-Net: Scalable Deep Learning with Novel FloraSyntropy Archive for Large-Scale Plant Disease Diagnosis [6.4] 植物病の早期診断は、世界の食品安全にとって重要である。
ほとんどのAIソリューションは、現実世界の農業の多様性に必要な一般化を欠いている。
植物35種にわたる178,922枚の画像からなる大規模データセットであるFloraSyntropy Archiveを紹介した。
次に,新しいフェデレート学習フレームワークであるFloraSyntropy-Netを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:30:21 GMT)
Adaptive Ensemble Learning with Gaussian Copula for Load Forecasting [6.3] 本稿では,ガウスコピュラを用いた適応アンサンブル学習モデルを提案する。
実験により、我々のモデルは堅牢であることが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:17:10 GMT)
Rethinking the Detail-Preserved Completion of Complex Tubular Structures based on Point Cloud: a Dataset and a Benchmark [6.3] 初めて点雲に基づく管状構造物の完成について検討する。
我々は、実際の臨床データから派生したポイントクラウドベースの冠状動脈補完データセットを構築した。
本稿では,細部保存型特徴抽出器を統合したTSRNetを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:39:15 GMT)
Whilter: A Whisper-based Data Filter for "In-the-Wild" Speech Corpora Using Utterance-level Multi-Task Classification [6.3] In-the-wild音声データセットは、複数の話者、非ターゲット言語、音楽などの望ましくない特徴を含むことが多い。
Whilter モデルはこれらの望ましくないサンプルを識別する解法として提案されている。
WhilterはマルチタスクF1スコアを85%以上、エラー率は6.5%から7.8%と5つのサブタスクのうち3つで達成している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:17:22 GMT)
SentiMM: A Multimodal Multi-Agent Framework for Sentiment Analysis in Social Media [6.2] 感情分析のための新しいマルチエージェントフレームワークであるSentiMMを提案する。
SentiMMは、特殊なエージェントを通してテキストと視覚入力を処理し、マルチモーダルな特徴を融合させ、知識検索を通じてコンテキストを豊かにし、最終的な感情分類のための結果を集約する。
また,7つの微粒な感情カテゴリーを持つ大規模マルチモーダルデータセットであるSentiMMDを紹介する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:17:53 GMT)
RepoTransAgent: Multi-Agent LLM Framework for Repository-Aware Code Translation [6.2] RepoTransAgentはリポジトリ対応コード翻訳のための新しいマルチエージェントフレームワークである。
RepoTransAgentを6つの人気のあるオープンソースプロジェクトから数百のJava-C#の翻訳ペアで評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:56:22 GMT)
Visual Evaluative AI: A Hypothesis-Driven Tool with Concept-Based Explanations and Weight of Evidence [6.1] 本稿では,ある仮説に対する画像データから肯定的かつ否定的な証拠を提供する意思決定支援である視覚評価AIを提案する。
我々は,このツールを皮膚がん領域に応用し,皮膚内視鏡画像のアップロードが可能なウェブベースのアプリケーションを構築して評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:21:14 GMT)
Prefill-level Jailbreak: A Black-Box Risk Analysis of Large Language Models [6.0] 本報告では,プリフィルレベルジェイルブレイク攻撃のブラックボックスセキュリティ解析について述べる。
実験の結果,いくつかのモデルでは適応手法が99%を超え,プレフィルレベル攻撃が高い成功率を達成することが示された。
その結果,プロンプトとプリフィルの操作関係に着目した検出法がより効果的であることが判明した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:17:00 GMT)
Multi-domain Distribution Learning for De Novo Drug Design [5.9] DrugFlowは、個別のMarkovブリッジと連続的なフローマッチングを統合する構造に基づくドラッグデザインのための生成モデルである。
我々は,配布外サンプルを検出可能な不確実性推定値でD薬流を推定した。
我々は、側鎖の角度と分子を共同でサンプリングすることで、タンパク質のコンフォメーションランドスケープを探索するために、モデルを拡張した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:12:01 GMT)
Spacer: Towards Engineered Scientific Inspiration [5.9] 外部の介入なしに創造的な概念を発達させる科学的な発見システムであるスペーサーを提案する。
Spacerは(i)キーワードセットを構築するインスピレーションエンジンであるNuriと(ii)これらのセットを精巧な科学的ステートメントに洗練するManifesting Pipelineで構成されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:49:16 GMT)
Dynamic Embedding of Hierarchical Visual Features for Efficient Vision-Language Fine-Tuning [5.9] 動的埋め込みと階層型視覚特徴の融合に基づく効率的な視覚言語微調整法を提案する。
少数のパラメータのみを微調整することで、DEHVFはクロスモーダル情報の正確なアライメントと補完を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:57:46 GMT)
Auto prompt sql: a resource-efficient architecture for text-to-sql translation in constrained environments [5.8] 本稿では,リソース効率の良い小型オープンソースモデルと,テキスト翻訳のための大規模クローズドソースモデルの強力な機能とのギャップを埋めるために設計された,新しいアーキテクチャであるAuto Promptsql(AP-)を紹介する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:13:38 GMT)
DocFetch - Towards Generating Software Documentation from Multiple Software Artifacts [5.8] ドキュメントを生成するための既存の自動アプローチは、主にソースコードに焦点を当てている。
複数のソフトウェアアーティファクトからさまざまなタイプのドキュメンテーションを生成するDocFetchを提案する。
我々は,手作業によるグラウンドトルースデータセットを用いたDocFetchの性能評価を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:54:27 GMT)
Pixel Perfect MegaMed: A Megapixel-Scale Vision-Language Foundation Model for Generating High Resolution Medical Images [5.7] 我々は1024×1024の解像度で画像を合成する最初のビジョン言語基盤モデルであるPixel Perfect MegaMedを紹介する。
超高解像度医用画像生成に特化して設計されたマルチスケールトランスフォーマーアーキテクチャをデプロイする。
Pixel Perfect MegaMedは、医療用語や画像のモダリティに合わせた視覚言語アライメント技術を活用することで、テキスト記述と前例のない解像度レベルでの視覚表現のギャップを埋める。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:05:17 GMT)
Enhancing Speech Large Language Models through Reinforced Behavior Alignment [5.6] 本稿では,言語生成能力を高めるためのRBA(Reinforced Behavior Alignment)というフレームワークを提案する。
RBAは、人間のアノテーションから教師付き微調整に頼るのではなく、自己合成手法を用いて、広範囲で高忠実なアライメントデータを生成する。
実験により,本手法はSpeechLMの指示追従能力を効果的に向上することを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:31:48 GMT)
Leveraging Large Language Models for Accurate Sign Language Translation in Low-Resource Scenarios [5.6] AulSignは、動的プロンプトとテキスト内学習を通じて大規模言語モデルを活用する新しい手法である。
我々は,この分野で認められたベンチマークであるSignBank+と,イタリアのLaCAM CNR-ISTCデータセットを用いて,英語とイタリア語の両言語で評価を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:36:36 GMT)
Exploring the Interplay between Musical Preferences and Personality through the Lens of Language [5.5] 音楽は個人のアイデンティティの強力な反映として機能し、しばしばより深い心理的特徴と一致している。
以前の研究では、音楽的好みと性格特性の相関関係が確立されており、別の研究では、言語学的分析によって人格が検出可能であることが示されている。
本研究は,これらの2つの研究領域を,個人の音楽的嗜好が自発言語で認識可能かどうかを調査することによって橋渡しする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:10:08 GMT)
German4All - A Dataset and Model for Readability-Controlled Paraphrasing in German [5.5] 我々は,アライメントされた可読性制御された段落レベルのパラフレーズの最初の大規模ドイツのデータセットである German4All を紹介する。
可読性レベルは5つあり、25,000以上のサンプルを含んでいる。
German4Allを用いて、ドイツ語のテキスト単純化における最先端のパフォーマンスを実現するオープンソースの可読性制御パラフレーズモデルを訓練する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:40:32 GMT)
Infinite Grassmann time-evolving matrix product operators for quantum impurity problems after a quench [5.5] 量子不純物問題を解くための創発的な数値的アプローチは、不純物経路積分を行列積状態として符号化することである。
ここでは、最初に不純物が熱浴と平衡状態にある場合、不純物ハミルトニアンの急激なクエンチによって平衡から追い出される、一般的な非平衡シナリオについて考察する。
無限行列積状態の手法を十分に活用でき、結果として、コストは本質的に進化時間に依存しない方法がもたらされることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:36:18 GMT)
Optimistic Online Learning in Symmetric Cone Games [5.5] 対称コーンゲーム(SCG)
オンライン学習アルゴリズム: 最適対称性コーン乗算重み更新(OSCMWU)
我々は、対称錐負のエントロピーがトレースワンノルムに対して強く凸であることを証明する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:35:54 GMT)
Low-Regret and Low-Complexity Learning for Hierarchical Inference [5.5] HIは、ローカル推論が正しくない場合に限って、Remote-MLへの推論とオフロードにLocal-MLモデルを使用することで、レイテンシの低減、精度の向上、帯域幅使用量の削減を目指している。
本稿では,モデル信頼度尺度の高次関数としてローカルMLによる正しい推論の確率をモデル化し,HILに対する新しいアプローチを提案する。
両ポリシーが$O(log T)$のオーダー最適後悔を達成し,既存のHILポリシーを$O(T2/3)$後悔の保証で大幅に改善したことを実証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:02:21 GMT)
Objective Task-based Evaluation of Quantitative Medical Imaging Methods: Emerging Frameworks and Future Directions [5.4] 定量的イメージング(QI)は、複数の臨床応用において強い将来性を示している。
QI法の臨床翻訳には,臨床関連課題に対する客観的評価が不可欠である。
QI手法の評価研究を行うための4つの新しいフレームワークについて概説する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:18:26 GMT)
Few-shot Human Action Anomaly Detection via a Unified Contrastive Learning Framework [5.3] 人間行動異常検出(Human Action Anomaly Detection, HAAD)は、訓練中に正常な行動データのみを与えられた異常な行動を特定することを目的としている。
既存の手法は典型的には1-モデル/1-カテゴリのパラダイムに従っており、アクションカテゴリごとに個別のトレーニングと多数の正規サンプルを必要とする。
数ショットのシナリオと互換性のあるHAAD用の統一フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:07:35 GMT)
A Multisource Fusion Framework for Cryptocurrency Price Movement Prediction [5.3] 本研究では,X(旧Twitter)から得られた定性的な感情信号と,歴史的価格や技術的指標などの定量的な財務指標を統合するマルチソース融合フレームワークを提案する。
大規模なBitcoinデータセットの実験結果は、提案手法がシングルソースモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:29:47 GMT)
Tabular and Deep Reinforcement Learning for Gittins Index [5.2] マルチアームバンディット問題において、Gittinsインデックスポリシーは、マルコフの腕を引っ張ることで得られる期待の総割引報酬を最大化するのに最適であることが知られている。
ほとんどの現実的なシナリオでは、マルコフ状態遷移確率は未知であるため、Gittinsインデックスは計算できない。
次に、得られた報酬を最大限に活用しながら、状態空間を探索してこれらの指標を学習する強化学習(RL)アルゴリズムを利用することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:12:05 GMT)
OmniCache: A Trajectory-Oriented Global Perspective on Training-Free Cache Reuse for Diffusion Transformer Models [5.2] DiffusionTransformersは、多数のサンプリングステップと複雑なステップ毎の計算から、リアルタイムデプロイメントにおいて重要な課題を提示する。
OmniCacheは,デノナイジングプロセスに固有のグローバル冗長性を生かした,トレーニング不要なアクセラレーション手法である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:07:02 GMT)
Polynomial-time Extraction of Entanglement Resources [5.2] 量子ネットワークにおける遠隔ノード間のEPR対とn-qubits GHZ状態の抽出
Bell-VM問題は、与えられたグラフ状態がベルペアの集合に変換できるかどうかを決定する。
抽出可能なn-qubitリモートGHZ状態の数 - リモートEPRペアの数の横にある。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:38:24 GMT)
Beyond Traditional Quantum Routing [5.2] 本稿では,従来の量子パスフィニングのオーバーヘッドを回避するため,新しい量子ルーティング手法を提案する。
提案手法はグラフ補完戦略を利用して,リモートノード間の直接絡み合いを確立する。
量子ネットワークの柔軟性と効率性を向上し、より実用的な量子通信インフラを実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:38:13 GMT)
CultureGuard: Towards Culturally-Aware Dataset and Guard Model for Multilingual Safety Applications [5.2] CultureGuardは、文化的に整列した高品質な安全データセットを複数の言語でキュレートするための新しいソリューションです。
提案手法では,文化データ分離,文化データ適応,機械翻訳,品質フィルタリングという,4段階の合成データ生成とフィルタリングパイプラインを導入している。
得られたデータセットであるNemotron-Content-Safety-Dataset-Multilingual-v1は、9言語で386,661のサンプルで構成され、LoRAベースの微細チューニングを通じてLlama-3.1-Nemotron-Safety-Guard-Multilingual-8B-v1のトレーニングを容易にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:35:12 GMT)
Local Off-Grid Weather Forecasting with Multi-Modal Earth Observation Data [5.1] 森林火災の管理と再生可能エネルギーの発生は、地球表面付近の正確な局部的な天気予報を必要とする。
機械学習モデルや数値天気予報システムによって生成された予測は、通常、大規模な正規グリッド上で生成される。
本稿では,マルチグラニュアルトランスフォーマーモデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:29:29 GMT)
$AutoGuardX$: A Comprehensive Cybersecurity Framework for Connected Vehicles [5.1] 本稿では,コネクテッドカー専用に設計された包括的サイバーセキュリティフレームワークであるAutoGuardX$を提案する。
AutoGuardX$は、ISO/SAE 21434やISO 26262といった既存の車両セキュリティの標準から重要な要素を組み合わせる。
このフレームワークは、リレー攻撃、コントローラエリアネットワーク(CAN)バス侵入、および5Gや量子コンピューティングといった新興技術によって導入された脆弱性のような主要な攻撃ベクトルに対処する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:00:12 GMT)
DemoBias: An Empirical Study to Trace Demographic Biases in Vision Foundation Models [5.0] 大規模視覚言語モデル(LVLM)は、生体認証(FR)や記述を含む様々な下流タスクにおいて顕著な機能を示した。
テキストトークン生成タスクを用いた生体計測 FR における LVLM における人口統計学的バイアスの程度を実験的に検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:02:49 GMT)
ILRe: Intermediate Layer Retrieval for Context Compression in Causal Language Models [5.0] ILRe(Intermediate Layer Retrieval)と呼ばれる新しいコンテキスト圧縮パイプラインを導入する。
ILReは、チャンクされたプリフィルをその層にだけストリーミングすることでコンテキストをエンコードし、入力クエリと指定された層のフルキーキャッシュの間のアテンションスコアによってトークンをリコールする。
追加のポストトレーニングやオペレータ開発がなければ、ILReは100万ドルのトークン要求を30分以内で処理できる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:59:02 GMT)
The holographic dual of the GHZ state [4.7] 本稿では,GHZ状態に対する重力双対について述べる。
GHZ状態のすべてのエントロピー特性と、両方の系に対するユークリッド分割関数の同一性との正確な一致を示す。
興味深いことに、この構成は単純で極大に絡み合っており、ゲダンケンの実験に最適である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:12:08 GMT)
Refined Criteria for QRAM Error Suppression via Efficient Large-Scale QRAM Simulator [4.7] 我々は,スパース状態符号化とノイズ認識プルーニングアルゴリズムを組み合わせたバケットブリガド(BB)QRAMシミュレータを開発した。
このフレームワークは、完全な量子状態アクセスとスケーリングを効率よく提供し、従来の研究よりもはるかに大きなサイズのEF性能とノイズレシエーションを探索することを可能にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:24:24 GMT)
Scene-Aware Vectorized Memory Multi-Agent Framework with Cross-Modal Differentiated Quantization VLMs for Visually Impaired Assistance [4.6] 本研究では,視覚言語モデル(VLM)のためのクロスモーダル微分量子化フレームワークと,視覚障害者支援のためのシーン認識ベクトル化メモリマルチエージェントシステムを提案する。
モデル性能を維持しながら、メモリ要求を38GBから16GBに効果的に削減し、異なる処理戦略を実装したモジュラーフレームワークを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:32:32 GMT)
Information Templates: A New Paradigm for Intelligent Active Feature Acquisition [4.6] アクティブ機能取得(英: Active Feature acquisition、AFA)は、テスト時にどの機能を取得するかを順次選択する計算適応型インスタンスパラダイムである。
我々は、機能テンプレートの小さなライブラリを学習し、このライブラリを使用して次の機能取得をガイドする非階層フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:15:11 GMT)
The Computational Complexity of Satisfiability in State Space Models [4.6] ssmSATは一般には決定不可能であり、SSMの計算能力を反映している。
実際の設定により、ssmSATが決定可能な2つの自然的制約を識別する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:12:47 GMT)
The AI Data Scientist [4.6] AI Data Scientistは、大規模言語モデル(LLM)を利用した自律エージェントである
単にコードを書くか、プロンプトに応答するのではなく、質問を通じて理由付け、アイデアをテストし、エンドツーエンドの洞察を提供する。
AI Data Scientistの中核には、特殊なLLMサブエージェントのチームがある。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:21:49 GMT)
Learning to Detect Label Errors by Making Them: A Method for Segmentation and Object Detection Datasets [4.6] 本稿では,オブジェクト検出,セマンティックセグメンテーション,インスタンスセグメンテーションデータセットにおけるラベルエラーを統一的に検出する手法を提案する。
実験では,提案手法のラベル誤り検出性能を,各タスク領域の様々なベースラインと最先端アプローチと比較した。
我々は、Cityscapesデータセットで特定された459個の実ラベルエラーをリリースし、Cityscapesにおける実ラベルエラー検出のベンチマークを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:59:56 GMT)
A Systematic Approach to Predict the Impact of Cybersecurity Vulnerabilities Using LLMs [4.5] 本稿では、大規模言語モデル(LLM)を用いて、ATT&CKの知識ベースからCVEを関連技術にマッピングする2段階の自動アプローチであるTRIAGEを紹介する。
評価の結果、文脈内学習は個々のマッピング手法よりも優れており、ハイブリッドアプローチはエクスプロイト手法のリコールを改善する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:39:15 GMT)
Transferring Styles for Reduced Texture Bias and Improved Robustness in Semantic Segmentation Networks [4.5] 最近の研究では、画像分類におけるディープニューラルネットワーク(DNN)の形状とテクスチャバイアスについて研究している。
本研究では, 画像分類におけるテクスチャバイアスを低減し, 画像劣化に対するロバスト性を向上することを示す。
本研究では, セマンティックセグメンテーションにおいて, テクスチャの偏りを低減し, 画像の汚損や敵の攻撃に対して強固に頑健さを増すことを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:48:56 GMT)
PhantomLint: Principled Detection of Hidden LLM Prompts in Structured Documents [4.4] 本稿では,構造化文書におけるLLMのインタプリタ検出に対する第一原理的アプローチを提案する。
我々はPhantomLintというプロトタイプツールにアプローチを実装しました。
我々は,PDFおよびHTML文書を含む3,402文書のコーパスに対してPhantomLintを評価し,学術論文のプリプリントやCV,これらなどをカバーする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:45:10 GMT)
Quantum Paths: a Quantum Walk approach [4.4] 本稿では,チャネルの空間的重ね合わせに量子ランダムウォークフレームワークのツールを適用することで,量子スイッチの出力を再現できることを実証する予備的理論的結果を示す。
これらの結果は、量子スイッチをエミュレートし、実用的な利点と解釈的明確性の両方を提供する、有望で実現可能な経路であることを示唆している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:43:29 GMT)
Saccade crossing avoidance as a visual search strategy [4.4] 個人によって異なる新たな記憶依存効果を報告し,これを自己交差回避と呼ぶ。
これは、ササードがスキャンパスの早期の通過を避ける傾向があり、どちらも振幅が小さい場合に最も顕著である。
自己交差的ペナルティ項を含むパラメトリック確率モデルは, ササードの長さと自己交差の連立統計を再現することができた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:46:10 GMT)
Demographic-aware fine-grained classification of pediatric wrist fractures [4.3] コンピュータビジョンは、広範囲なデータセットの利用可能性に応じて、有望な道を示す。
極めて限られたデータセットを用いて手首の病態を認識するという課題に対処するために,多面的アプローチを採用する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:58:49 GMT)
A Factorized Probabilistic Model of the Semantics of Vague Temporal Adverbials Relative to Different Event Types [4.2] Vague temporal adverbials は過去の出来事と発話時間の間の時間的距離を記述しているが、正確な期間は未特定のままである。
本稿では,これらの副詞の意味を確率分布として捉える因子モデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:36:51 GMT)
MoveScanner: Analysis of Security Risks of Move Smart Contracts [4.2] 本稿では,Moveエコシステム内の既存のセキュリティツールの限界を体系的に分析する。
MoveScannerは、制御フローグラフとデータフロー分析アーキテクチャに基づく静的解析ツールである。
MoveScannerは、リソースリーク、弱いパーミッション管理、演算オーバーフローを含む5つの重要なセキュリティ脆弱性を効果的に識別できる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:25:28 GMT)
Can Out-of-Distribution Evaluations Uncover Reliance on Shortcuts? A Case Study in Question Answering [4.1] AIにおける最近の研究の大部分は、アウト・オブ・ディストリビューション(OOD)データセットのパフォーマンスのレンズを通じて、モデルの一般化能力を評価する。
我々はこの仮定に挑戦し、既存の質問応答モデル(QA)に記録された特定の障害モードのセットを用いてOOD評価の結果に反論する。
我々は、QAにおけるOOD評価に使用する異なるデータセットが、非常に異なる品質のショートカットに対してモデルの堅牢性を見積もっていることを発見した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:49:50 GMT)
Better Language Model-Based Judging Reward Modeling through Scaling Comprehension Boundaries [3.9] 本稿では、説明に基づくスロットフレームワークを用いて予測を行う2段階のLMに基づく評価報酬モデルを提案する。
ヒューマンフィードバック(RLHF)からの強化学習とアウト・オブ・ディストリビューション(OOD)シナリオの両方において、ESFP-RMフレームワークはより安定的で一般化可能な報酬信号を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:11:28 GMT)
Neural Logic Networks for Interpretable Classification [3.9] 我々は解釈可能な構造を持つニューラルネットワークを開発する。
我々は、観測されていないデータを考慮したNOT演算とバイアスでこれらのネットワークを一般化する。
本手法はブールネットワーク発見における最先端の手法を改良し,関連性のある解釈可能なルールを学習することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:47:34 GMT)
A Large-Scale Study on Developer Engagement and Expertise in Configurable Software System Projects [3.9] 本研究では,変数対必須コードに対する開発者の関与,変数コードの集中度,ワークロード,CSSプロジェクトにおける専門的メトリクスの有効性について検討する。
結果、開発者の59%が変数コードを変更していない一方で、約17%が83%の開発とメンテナンスを担当していることがわかった。
これは、少数の開発者の間で変数コードの専門知識が集中していることを示し、タスクの割り当てがこれらの専門知識を優先すべきであることを示唆している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:29:20 GMT)
Extendibility of Fermionic Gaussian States [3.9] フェルミオンガウス状態が$(k_2)$-extendibleであることと、フェルミオンガウス拡張を持つ場合に限ることを示す。
これは任意のフェルミオン状態に必要な条件を与え、ガウス集合の中で十分である。
また, 劣化防止のためのSDP基準も提供し, 絡み込み破壊チャネルと交換チャネルが一致することを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:11:10 GMT)
Limitations of Normalization in Attention Mechanism [3.9] 選択されたトークンの数が増えるにつれて、情報的トークンを識別する能力は低下することを示す。
また,ソフトマックスの正規化による勾配感度は,特に低温条件下でのトレーニングにおいて課題となることを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:25:05 GMT)
Learning with Spike Synchrony in Spiking Neural Networks [3.9] スパイキングニューラルネットワーク(SNN)は、生物学的神経力学を模倣してエネルギー効率の高い計算を約束する。
本稿では,スパイクタイミングではなく神経発射の度合いに基づいてシナプス重みを調整する訓練手法として,スパイク同期依存塑性(SSDP)を導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:25:09 GMT)
Unseen Speaker and Language Adaptation for Lightweight Text-To-Speech with Adapters [3.8] アダプタのレンズを用いた言語間テキスト音声合成について検討する。
その結果,言語固有の情報や話者固有の情報の学習において,アダプタの有効性が示された。
また,アダプタ配置,構成,使用話者数の影響について考察した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:14:57 GMT)
Scalable Engine and the Performance of Different LLM Models in a SLURM based HPC architecture [3.7] 本研究は、SLURM(Simple Linux Utility for Resource Management)に基づく高性能コンピューティングアーキテクチャについて詳述する。
動的リソーススケジューリングとコンテナ化のシームレスな統合は、CPU、GPU、メモリをマルチノードクラスタで効率的に管理するために活用されている。
その結果,大規模HPCインフラストラクチャ上でのLLM推論は,より効率的で応答性が高く,耐故障性に優れた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:11:27 GMT)
Mapping of Fermionic Lattice Models for Ising Solvers [3.7] 本稿では,相互作用するフェルミオンモデルと量子スピンモデルをアニーラー対応QUBOに変換する,エンドツーエンドの対称性対応パイプラインを提案する。
レプリケーション・ファクター(英語版)による研究は、rNqを超える誤差のオーダー・オブ・マグニチュード(英語版)の低減とリターンの減少を伴って、精度とオーバーヘッドのトレードオフを定量化する。
その結果、量子物質を現在のアニールにマッピングする実用的な経路が確立され、忠実さ、資源、埋め込みのための明確なノブが得られた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:03:11 GMT)
Quantum Algorithms for Matrix Operations Based on Unitary Transformations and Ancillary State Measurements [3.7] 行列演算のMQuantumアルゴリズムは、科学技術において非常に重要である。
本稿では,マルチキュービットトフォリゲートと基本単一キュービット演算を利用して,行加算,行スワッピング,トレース計算,トランスポジションの行列演算の量子アルゴリズムを求める。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:51:52 GMT)
Prompt-in-Content Attacks: Exploiting Uploaded Inputs to Hijack LLM Behavior [3.7] LLM(Large Language Models)は、ユーザが提出したコンテンツを受け入れるアプリケーションに広くデプロイされている。
本稿では,コンテンツインジェクションにおける新たな攻撃のクラスを同定する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:20:11 GMT)
Backprompting: Leveraging Synthetic Production Data for Health Advice Guardrails [3.7] ガードレール技術は、大きな言語モデルの入力/出力テキストを様々な検出器を通してフィルタリングすることで、このリスクを軽減することを目的としている。
本稿では、健康アドバイスガードレールの開発のために、プロダクションライクなラベル付きデータを生成するための、シンプルで直感的なバックプロンプティングを提案する。
我々の検出器は400倍のパラメータを持つにもかかわらず、GPT-4oを最大3.73%上回ることができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:17:00 GMT)
Does simple trump complex? Comparing strategies for adversarial robustness in DNNs [3.6] ディープニューラルネットワーク(DNN)は、様々なアプリケーションでかなりの成功を収めているが、敵の攻撃に弱いままである。
本研究は, 対人強靭性向上に寄与する2つの異なる対人訓練手法の構成要素を同定し, 分離することを目的とする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:33:38 GMT)
Less Is More? Examining Fairness in Pruned Large Language Models for Summarising Opinions [3.6] 本稿では,3つの最先端プルーニング手法と様々なキャリブレーションセットについて,意見要約の包括的実証分析を行った。
本稿では、入力処理に冗長だが出力生成に影響を及ぼすパラメータを特定し、除去する高勾配低活性化(HGLA)プルーニングを提案する。
我々の人間による評価では、HGLAによる出力は既存の最先端の刈り取り法よりも公平である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:40:55 GMT)
Robotic Fire Risk Detection based on Dynamic Knowledge Graph Reasoning: An LLM-Driven Approach with Graph Chain-of-Thought [3.5] 火災は極めて破壊的な災害であるが、効果的な予防は発生の可能性を著しく低下させる可能性がある。
火災リスクのシナリオに緊急ロボットを配置することは、人間の対応者の危険を最小限に抑えるのに役立つ。
災害前警報や災害時救助に関する現在の研究は、いまだに不完全な認識のために重大な課題に直面している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:10:16 GMT)
Training Transformers for Mesh-Based Simulations [3.5] 本稿では,アテンションマスクとして隣接行列を利用する新しいグラフトランスフォーマーアーキテクチャを提案する。
60以上のモデルをトレーニングして、FLOPのトレーニングとパラメータのスケーリングの法則を見つけます。
導入されたモデルは、最大3万ノードと300万エッジのメッシュ上で実行する、素晴らしいスケーラビリティを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:10:13 GMT)
Puzzle: Scheduling Multiple Deep Learning Models on Mobile Device with Heterogeneous Processors [3.5] ネットワークを複数のサブグラフに分割することで、異種プロセッサ上で複数のディープラーニングネットワークをスケジューリングする遺伝的アルゴリズムに基づく新しい手法を提案する。
このシステムであるPuzzleは、9つの最先端ネットワークを含むランダムに生成されたシナリオを用いて、広範囲な評価において優れた性能を示す。
その結果、Puzzleは、NPUのみとBest Mappingの2つのベースラインと比較して平均3.7と2.2倍の要求周波数をサポートでき、リアルタイム要件の同等レベルを満足できることを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:02:17 GMT)
Beam Geometry and Input Dimensionality: Impact on Sparse-Sampling Artifact Correction for Clinical CT with U-Nets [3.5] 本研究は,U-Netを用いたスパース・サンプリング・ストリーク・アーティファクト修正作業における各種ビーム・ジオメトリと入力データの次元の影響について検討することを目的とする。
平行, ファン, コーンビーム測位のためのAstraツールボックスを用いて, 疎サンプリングCTボリュームをシミュレートした。
2Dと3DのU-Netは14日にトレーニングされ、それぞれ8つの被験者でテストされた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:21:49 GMT)
BirdRecorder's AI on Sky: Safeguarding birds of prey by detection and classification of tiny objects around wind turbines [3.3] BirdRecorderは、絶滅危惧種、特にキツネ(Milvus milvus)を保護するAIベースの先進的対決システムである
BirdRecorderは、ロボット工学、テレメトリ、高性能AIアルゴリズムを統合して、鳥と鳥の衝突を最小限にする。
本研究では,BirdRecorderシステムのフィールドテストと性能について概説する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:41:36 GMT)
Why Synthetic Isn't Real Yet: A Diagnostic Framework for Contact Center Dialogue Generation [3.3] プライバシとデータ不足がモデルトレーニングと評価を制限するコンタクトセンタードメインでは,合成転写生成が重要となる。
単純なプロンプトから特徴認識型マルチステージアプローチに至るまで,言語に依存しない4つの生成戦略をベンチマークする。
結果、永続的な課題が明らかになる: 全ての特徴にまたがるメソッドは、拡散、感情、行動的リアリズムに顕著な欠陥を伴わない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:10:36 GMT)
Object Detection with Multimodal Large Vision-Language Models: An In-depth Review [3.3] 大規模視覚言語モデル(LVLM)における言語と視覚の融合は、ディープラーニングに基づく物体検出に革命をもたらした。
この詳細なレビューでは、LVLMの最先端技術に関する構造化された調査が紹介されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:21:00 GMT)
How good are LLMs at Retrieving Documents in a Specific Domain? [3.3] 本稿では,ドメイン固有の評価データセットをキュレートして検索システムの性能を解析する自動手法を提案する。
本研究では,Large Language Models (LLMs) を用いたRAG(Retrieval of Augmented Generation)を組み込んで,自然言語クエリを用いた環境領域データの高品質な検索を行う。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:47:21 GMT)
How Reliable are LLMs for Reasoning on the Re-ranking task? [3.3] 大規模言語モデル(LLM)における学習方法の違いがタスクのセマンティック理解に与える影響を解析する。
ユーザエンゲージメントが制限され、ランキングデータが不十分な新規開発システムでは、コンテンツを正確に再ランク付けすることが大きな課題である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:48:39 GMT)
Generic Guard AI in Stealth Game with Composite Potential Fields [3.3] ガードパトロール行動は、ステルスゲームの没入と戦略的な深さの中心である。
グローバルな知識とローカル情報を統合した,汎用的で完全に説明可能な,トレーニング不要なフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:56:13 GMT)
Adaptive Visual Navigation Assistant in 3D RPGs [3.3] 複雑な3Dゲーム環境では、プレイヤーはマップの遷移点を見つけるために視覚的な余裕に依存する。
本研究では,2つの部分領域間のトラバース可能な空間遷移点(STP)接続を検出するタスクを形式化する。
我々は、まずFaster R-CNNを用いて電位を検出し、次に軽量MSTPセレクタでランク付けする2段階のディープラーニングパイプラインを導入する。
フルネットワークファインチューニングは十分なデータによる優れた検出を実現するが、アダプタのみの転送は、低データシナリオにおいて、はるかに堅牢で効果的である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:20:37 GMT)
A Database-Driven Framework for 3D Level Generation with LLMs [3.3] 3Dゲームレベルのプロシージャコンテンツ生成は、空間コヒーレンス、ナビゲーション機能、マルチフロア環境における適応可能なゲームプレイ進行のバランスをとる上で、課題に直面している。
本稿では、アーキテクチャコンポーネント(ファクシリティとルームテンプレート)とゲームプレイ機構要素のための再利用可能なデータベースの構築をオフラインでLLMで支援することを中心に、そのようなレベルを生成するための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:15:08 GMT)
Learning Optimal Classification Trees Robust to Distribution Shifts [3.2] トレーニングとテスト/デプロイデータ間の分散シフトに頑健な分類木を学習する際の問題点を考察する。
混合整数型ロバスト最適化技術に基づく最適ロバスト分類木を学習する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:43:21 GMT)
Segmentation and Classification of Pap Smear Images for Cervical Cancer Detection Using Deep Learning [3.1] 本研究では,セグメント化のためのU-Netと分類モデルを統合し,診断性能を向上させるディープラーニングフレームワークを提案する。
セグメンテーションが分類性能に与える影響は, セグメンテーションされた画像と非セグメンテーション画像でトレーニングされたモデルを比較して評価した。
セグメンテーションは特徴抽出に有効であるが, 分類性能への影響は限定的であった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:11:16 GMT)
Efficient Computation of Blackwell Optimal Policies using Rational Functions [3.1] 決定問題(MDPs)は、様々な領域にわたるシーケンシャルな意思決定をモデル化するための基礎的な枠組みを提供する。
割引された最適性は短期的な報酬を過度に優先し、一方平均最適性は強い構造的仮定に依存する。
Blackwellの最適性はこれらの課題に対処し、ディスカウントおよび平均報酬フレームワークの両方で最適性を保証する堅牢で包括的な基準を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:41:30 GMT)
DesCartes Builder: A Tool to Develop Machine-Learning Based Digital Twins [3.0] デジタルツイン(DT)は、土木工学を含む様々な領域にわたる複雑なシステムの監視、管理、最適化にますます利用されている。
効果的なDTのコア要件は、物理的に高速で正確で保守可能な代理として振る舞うことである。
DesCartes Builderは、リアルタイムDTプロトタイプとDTインスタンスのためのMLベースのパイプラインのシステマティックエンジニアリングを可能にするオープンソースのツールです。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:57:34 GMT)
FCR: Investigating Generative AI models for Forensic Craniofacial Reconstruction [3.0] 2次元X線画像からの頭蓋顔面再建のための汎用的枠組みを提案する。
2次元X線が頭蓋顔面再建のための生成モデルによって頭蓋骨の表現として使用されるのは、これが初めてである。
実験結果から,これは法医学の有効なツールであることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:52:59 GMT)
Complete the Cycle: Reachability Types with Expressive Cyclic References (Extended Version) [2.9] Reachability Typesは、高次のプログラムのエイリアスと分離を追跡する。
RTを表現性を高める3つのメカニズムで拡張する。
これらの拡張は$mathsfF_:circ$-calculusで定式化され、型音の機械的な証明である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:09:19 GMT)
Reading Between the Signs: Predicting Future Suicidal Ideation from Adolescent Social Media Texts [2.9] 本稿では、フォーラム投稿から自殺的思考と行動(SIB)を予測する新しい課題と方法を提案する。
Early-SIBは、ユーザが書いた投稿を逐次処理し、SIB投稿を書くかどうかを予測するトランスフォーマーベースのモデルである。
オランダの青少年フォーラムで将来のSIBを予測するためのバランスの取れた精度0.73を達成し、そのようなツールが従来の手法に有意義に付加できることを実証した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:32:49 GMT)
NGD: Neural Gradient Based Deformation for Monocular Garment Reconstruction [2.9] モノクロ映像から動的に衣料を復元することは、衣料の複雑なダイナミクスと制約のない性質のために重要な課題であるが、難しい課題である。
ニューラルレンダリングの最近の進歩は、画像/映像の監督による高品質な幾何学的再構成を可能にしている。
モノクラービデオから動的に進化するテクスチャ化された衣服を再構成する,ニューラルグラディエントに基づく変形法NGDを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:40:57 GMT)
SwiftF0: Fast and Accurate Monophonic Pitch Detection [2.9] 単声ピッチ推定のための新しい最先端技術を設定する,新しい軽量ニューラルモデルであるemphSwiftF0を提案する。
SwiftF0は、計算効率を維持しながら、アコースティックドメイン全体の堅牢な一般化を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:39:20 GMT)
Adaptive Linguistic Prompting (ALP) Enhances Phishing Webpage Detection in Multimodal Large Language Models [2.9] 本研究では,フィッシングWebページの検出における適応言語プロンプト (ALP) について検討する。
ALPは、大きな言語モデル(LLM)を誘導し、テキストの偽造を分析する構造的意味推論手法である。
実験の結果,ALPはフィッシング検出精度を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:17:21 GMT)
Diffusion-Based Data Augmentation for Medical Image Segmentation [2.8] DiffAugは、テキスト誘導拡散ベースの生成と自動セグメンテーションバリデーションを組み合わせた、新しいフレームワークである。
我々のフレームワークは、ベースラインよりも8-10%Diceの改善で最先端のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:49:27 GMT)
Enhancing Differentially Private Linear Regression via Public Second-Moment [2.7] 本研究では,SSP-OLSEの変換を行うために,パブリックな第2モーメント行列を用いてプライベートデータを変換する手法を提案する。
我々は,提案手法と標準SSP-OLSEに関する理論的誤差境界を非DP OLSEに導出し,提案手法による堅牢性と精度の向上を明らかにした。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:55:46 GMT)
Enhancing the Trainability of Variational Quantum Circuits with Regularization Strategies [2.7] 本稿では,モデルパラメータをトレーニングデータとガウス雑音拡散の事前知識で正規化する手法を提案する。
我々は,4つの公開データセットにまたがる戦略の有効性を検証するためのアブレーション研究を行っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:57:20 GMT)
Weisfeiler-Leman Features for Planning: A 1,000,000 Sample Size Hyperparameter Study [2.7] Weisfeiler-Leman Features (WLF)は、計画と検索を学ぶための古典的な機械学習ツールである。
さまざまなトレードオフや,トレーニングや計画への影響について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:39:03 GMT)
Symmetry-Invariant Novelty Heuristics via Unsupervised Weisfeiler-Leman Features [2.7] 新規性の検出には原子の代わりにWeisfeiler-Leman Features(WLF)を用いることを提案する。
WLFは最近、一般的な計画問題のためのドメイン依存の学習のために導入された。
古典的国際計画コンペティションとハード・トゥ・グラウンドベンチマークスイートの実験は、WLFから合成された新規合成に有望な結果をもたらす。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:46:19 GMT)
Longitudinal Progression Prediction of Alzheimer's Disease with Tabular Foundation Model [2.7] この研究は、L2C-TabPFNを導入し、L2C変換を事前訓練されたタブラル基礎モデル(TabPFN)と統合し、アルツハイマー病の発症を予測する。
L2C-TabPFNは、シーケンシャルな患者の記録を固定長の特徴ベクトルに変換し、診断、認知スコア、心室容積の堅牢な予測を可能にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:24:51 GMT)
"Nobody should control the end user": Exploring Privacy Perspectives of Indian Internet Users in Light of DPDPA [2.7] インドインターネット利用者のクッキーバナー,オンラインプライバシ,プライバシ規則に対する認識と認識について,特に新たにパスされたPDPAを踏まえて検討する。
プライバシーを意識したユーザは、プライバシーメカニズムに対する一貫した認識を欠いていることが多い。
本研究は、インドにおけるデータプライバシの実践を強化するために、PDPA、ユーザー中心の同意機構、政策改善に関するコミュニケーションの明確化の必要性を強調した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:22:25 GMT)
Aligning the Evaluation of Probabilistic Predictions with Downstream Value [2.7] 予測性能のみに基づくメトリクスは、しばしば現実世界の下流への影響の尺度から発散する。
本稿では、下流評価と整合したプロキシ評価関数を学習するためのデータ駆動手法を提案する。
我々のアプローチでは、ニューラルネットワークによってパラメータ化された重み付けされたスコアリングルールを利用して、下流タスクのパフォーマンスに合わせて重み付けが学習される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:41:27 GMT)
Language-Guided Temporal Token Pruning for Efficient VideoLLM Processing [2.6] 視覚言語モデル(VLM)は、注意機構の複雑さのために長めのビデオに苦しむ。
本稿では,クエリからの時間的手がかりを利用して,適応的にビデオトークンを作成可能な言語誘導型時間的トケンプルーニング(LGTTP)を提案する。
モデルに依存しないフレームワークはTimeChatやLLaVA-Videoと統合され,オリジナル性能の97~99%を保ちながら,計算の65%の削減を実現している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:51:21 GMT)
Blockchain Security Risk Assessment in Quantum Era, Migration Strategies and Proactive Defense [2.6] 量子コンピューティングの出現は、ブロックチェーンシステムのセキュリティに深刻な課題をもたらす。
従来の暗号アルゴリズムは、量子コンピュータの膨大な計算能力に弱い。
本稿では,量子抵抗型ブロックチェーンへの移行のリスク評価を行う。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:22:12 GMT)
Database Normalization via Dual-LLM Self-Refinement [2.6] Miffieは、人間の努力なしに自動データ正規化を可能にするデータベース正規化フレームワークである。
Miffieの中核は、正規化されたスキーマ生成と検証のための最高のパフォーマンスモデルを組み合わせたデュアルモデル自己精製アーキテクチャである。
実験結果から、Miffieは複雑なデータベーススキーマを高い精度で正規化できることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:02:17 GMT)
Covariant decomposable maps on C*-algebras and quantum dynamics [2.5] 我々は $mathbbM_n (mathbbC)$ 上の写像の演算子和表現の特定の特徴を与える。
量子力学への接続は、D-可分量子進化系列の共分散のための十分かつ必要な条件を特定することによって確立される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:52:29 GMT)
From Models to Network Topologies: A Topology Inference Attack in Decentralized Federated Learning [2.5] この研究は、新しいトポロジ推論攻撃を提案することによって、DFLトポロジの隠れたリスクを明らかにする。
トポロジ推論攻撃の分類を導入し、攻撃者の能力と知識によって分類する。
その結果、各ノードのモデルのみを分析してDFLトポロジを正確に推定できることが示され、DFLシステムにおける重要なプライバシーリスクが浮き彫りにされている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:00:13 GMT)
Explain and Monitor Deep Learning Models for Computer Vision using Obz AI [2.4] Obz AIは、ビジョンAIシステムの最先端の説明可能性と可観測性を促進するために設計された、包括的なソフトウェアエコシステムである。
Obz AIは、Pythonクライアントライブラリからフルスタック分析ダッシュボードまで、シームレスな統合パイプラインを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:46:21 GMT)
Egocentric Instruction-oriented Affordance Prediction via Large Multimodal Model [2.4] 物体操作の文脈では、知能ロボットにとってアフォーダンスは不可欠である。
本稿では,手頃さはタスク・インストラクション・インストラクションに依存しているべきだと論じる。
本研究では,1万5000件のオブジェクト命令-アダクタンス三重項からなる新しいデータセットを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:40:31 GMT)
Handcrafted vs. Deep Radiomics vs. Fusion vs. Deep Learning: A Comprehensive Review of Machine Learning -Based Cancer Outcome Prediction in PET and SPECT Imaging [2.4] この体系的なレビューは、2020年から2025年にかけて発行された226の研究を分析し、結果予測のためにPETまたはSPECTイメージングに機械学習を適用した。
PETベースの研究は、一般的にSPECTを用いた場合よりも優れており、おそらくは空間分解能と感度が高いためである。
一般的な制限としては、階級不均衡の不十分な扱い、データ不足、人口の多様性の低さがあった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:20:29 GMT)
Toward Generalized Autonomous Agents: A Neuro-Symbolic AI Framework for Integrating Social and Technical Support in Education [2.3] 教育における永続的な課題の1つは、学生が学習の所有権を取得できるようにする方法である。
大規模言語モデル(LLM)とニューロシンボリックシステムの最近の進歩は、デジタル学習環境におけるサポートの提供方法を再定義する転換的な機会を提供する。
本稿では、上記の課題を解決するために設計された多エージェント・ニューロシンボリック・フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:46:59 GMT)
Contraction Properties of the Global Workspace Primitive [2.3] 我々は,Kozachkovらが導入したRNNの安定なRNNを理論的,実証的に拡張する。
我々は、少数のトレーニング可能なパラメータを持つGlobal Workspace Sparse Combo Netsの実証的な成功を示す。
異なるサブネットワークモジュール間の接続構造における疎結合性を探索することにより,安定したRNNのための技術性能を向上させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:01:11 GMT)
From Data to Decision: A Multi-Stage Framework for Class Imbalance Mitigation in Optical Network Failure Analysis [2.3] 故障検出と識別におけるクラス不均衡軽減のための前処理, 内処理, 後処理の比較を行った。
故障検出では、特にThreshold Adjustment-achieve the highest F1 score Improvement (最大15.3%)、Random Under-Samplingは最速の推論を提供する。
フェール識別では、GenAIメソッドが最も大きなパフォーマンス向上(最大24.2%)を提供するが、ポストプロセッシングはマルチクラス設定に限られている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:50:51 GMT)
Provably-Safe Neural Network Training Using Hybrid Zonotope Reachability Analysis [2.1] 安全クリティカルな制御アプリケーションにおいて、ニューラルネットワークの制約を強制することは困難である。
本稿では,線形整列線形ユニット(ReLU)非線形性を持つニューラルネットワークに対して,非ハイブリッド入力セットの正確な画像化を促進する手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:02:10 GMT)
VectorLiteRAG: Latency-Aware and Fine-Grained Resource Partitioning for Efficient RAG [2.1] Retrieval-Augmented Generation (RAG) システムは、ベクトル類似性探索と大言語モデル(LLM)を組み合わせてコンテキスト対応の応答を提供する。
本稿では,VectorLiteRAGを提案する。VectorLiteRAGは,追加のハードウェアリソースを必要とせず,遅延に順応する推論を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:59:34 GMT)
Low-Rank Tensor Decompositions for the Theory of Neural Networks [2.1] 本稿では,低ランクテンソル法がディープNNの性能の異なる側面を理論的に説明する上で,いかに基本的な役割を担っているかを示す。
私たちのゴールは、一貫性のある統一された方法で既存のアプローチの概要を提供することです。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:50:45 GMT)
Manifold learning in metric spaces [2.0] グラフラプラシアンの点収束に対して、計量が十分条件を満たすとき、多様体学習の問題を計量空間に一般化する枠組みを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:36:12 GMT)
SEBVS: Synthetic Event-based Visual Servoing for Robot Navigation and Manipulation [2.0] 本研究は,Gazeboシミュレーションのためのオープンソースでユーザフレンドリな v2e ロボットオペレーティングシステム (ROS) パッケージを提供する。
このパッケージは、リアルタイムナビゲーションと操作のためのイベントベースのロボットポリシーの調査に使用される。
結果は、リアルタイムのロボットナビゲーションと操作を改善するイベント駆動型認識の可能性を強調している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:14:04 GMT)
OwkinZero: Accelerating Biological Discovery with AI [2.0] 我々は,8-32B OwkinZeroモデルが生物ベンチマークにおいて,大規模かつ最先端の商用LCMよりも大幅に優れていることを示す。
ひとつひとつのタスクで訓練された専門家モデルは、これまで見つからなかったタスクでベースモデルを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:04:49 GMT)
PRZK-Bind: A Physically Rooted Zero-Knowledge Authentication Protocol for Secure Digital Twin Binding in Smart Cities [2.0] PRZK-Bindは軽量で分散化された認証プロトコルである。
物理的実体とDT間のセキュアでリアルタイムな対応を確立する。
最大4.5倍のレイテンシと4倍のエネルギー消費を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:29:57 GMT)
RAFT: Robust Augmentation of FeaTures for Image Segmentation [1.9] RAFTは、最小ラベル付き実世界のデータを用いて画像分割モデルを適応するための新しいフレームワークである。
我々は,合成から現実の「SYNTHIA->Cityscapes」と「GTAV->Cityscapes」ベンチマークの実験を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:48:36 GMT)
SupraTok: Cross-Boundary Tokenization for Enhanced Language Model Performance [1.9] トークン化は、自然言語処理の根本的かつ未発見のボトルネックである。
サブワードセグメンテーションを再現する新しいトークン化アーキテクチャであるSupraTokを提案する。
提案手法は,英語のトークン化効率を31%向上させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:30:15 GMT)
Securing Face and Fingerprint Templates in Humanitarian Biometric Systems [1.9] 人道的・緊急的なシナリオでは、バイオメトリックスを使用することで、操作の効率が劇的に向上する。
しかしそれは、脆弱性の文脈で悪化しているデータ対象にリスクをもたらす。
これらのシナリオに適したバイオメトリックテンプレート保護方式を実装したモバイルバイオメトリックシステムを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:03:33 GMT)
LPLC: A Dataset for License Plate Legibility Classification [1.9] 12,687個の注釈付きLPを持つ車両の10,210枚の画像からなる新しいデータセットを導入する。
画像は、車両の種類、照明条件、カメラ/画像の品質レベルなど多岐にわたる。
本稿では,3つの画像認識ネットワークを用いた分類課題を提案し,LP画像が十分であるか,超解像を必要とするか,あるいは完全に復元不可能であるかを判定する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:18:02 GMT)
Head-Specific Intervention Can Induce Misaligned AI Coordination in Large Language Models [1.9] 推論時のアクティベーション介入は、安全アライメントを回避し、有害なAIコーディネートに向けてモデル世代を効果的に操ることが可能であることを示す。
本手法は,各頭部を簡単な二分選択タスクで探索することにより,特定の注意頭部にきめ細かな介入を施す。
注意頭への介入は、全層への介入や教師付き微調整よりも効果的であることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:20:08 GMT)
Finding trail covers: near-optimal decompositions of graph states as linear fusion networks [1.8] ユーレアン経路問題とハミルトン経路問題の一般化とみなすことができる3つのグラフ理論問題について検討する。
これらは測定ベースの量子コンピューティングのフォトニックな実装に現れる。
グラフ構築に必要な融合数を削減できるグラフ状態の新しい書き直し戦略を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:06:53 GMT)
TinyGiantVLM: A Lightweight Vision-Language Architecture for Spatial Reasoning under Resource Constraints [1.8] 本稿では,空間的推論のための軽量でモジュラーなフレームワークであるTinyGiantVLMを紹介する。
提案手法は,RGBと奥行き変調のグローバルな特徴と地域レベルの特徴を事前学習した視覚的バックボーンを用いて符号化する。
高モダリティ入力と多様な質問型の複雑性を効果的に処理するために、Mixture-of-Experts (MoE) 融合モジュールを組み込む。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:36:22 GMT)
DroneKey: Drone 3D Pose Estimation in Image Sequences using Gated Key-representation and Pose-adaptive Learning [1.7] DroneKeyは、2Dキーポイント検出器とドローン用に設計された3Dポーズ推定器を組み合わせたフレームワークだ。
実験により,本手法はキーポイント検出において99.68%(OKS)のAPを達成し,既存手法より優れていることが示された。
3次元ポーズ推定では10.62degのMAE角,0.221mのRMSE,0.076mのMAE絶対値を得た。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:40:31 GMT)
Beyond prior knowledge: The predictive role of knowledge-building in Tutor Learning [1.6] チューター学習は、概念的知識と手続き的知識の2つの相互関連知識を含んでいる。
本研究では,手続き学習と概念学習の双方向関係を媒介する知識構築の役割について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:45:04 GMT)
Gain-Assisted and Dynamically Controlled Optical Bistability for Quantum Logic Gate Applications [1.6] 量子干渉のコヒーレント制御は、透過性と利得状態の間のプローブ場の切替を可能にする。
光学的不安定性の詳細な解析を行い, その閾値, 安定性, スイッチング効率に着目した。
その結果, 低温原子系における非線形光学効果と構造光の統合の可能性が明らかになった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:14:52 GMT)
Research on Evaluation Methods for Patent Novelty Search Systems and Empirical Analysis [1.6] 技術的に一貫した家族特許から抽出した試験員の引用とX型引用から高品質で再現可能なデータセットを構築する包括的評価手法を提案する。
実験では、この手法がシナリオ間のパフォーマンスの違いを効果的に露呈し、システム改善の実用的な証拠を提供する。
このフレームワークはスケーラブルで実用的であり、特許ノベルティ検索システムの開発と最適化に有用なリファレンスを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:24:04 GMT)
Named Entity Recognition of Historical Text via Large Language Model [1.5] 名前付きエンティティ認識(NER)は、構造化されていないテキストから情報を抽出する上で重要な役割を果たす。
伝統的に、NERは大量の注釈付きトレーニングデータを必要とする教師付き機械学習アプローチを使用して対処される。
本研究では,NER に LLM を適用する可能性について,ゼロショットと少数ショットのプロンプト戦略を用いて検討した。
HIPE-2022データセットを用いて行った実験により, この環境下でのNERタスクにおいて, LLMは合理的に高い性能が得られることが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:52:11 GMT)
SAT-SKYLINES: 3D Building Generation from Satellite Imagery and Coarse Geometric Priors [1.5] サットスカイライン(SatSkylines)は、衛星画像と粗い幾何学的先行画像を利用する3Dビルディング・ジェネレーション・アプローチである。
Skylines-50Kは、5万以上のユニークでスタイリングされた3Dビルディングアセットからなる大規模なデータセットです。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:03:31 GMT)
A Novel Framework for Uncertainty Quantification via Proper Scores for Classification and Beyond [1.5] 本稿では,機械学習における不確実性定量化のための新しい枠組みを提案する。
具体的には、カーネルベースの適切なスコアであるカーネルスコアを用いて、サンプルベースの生成モデルを評価する。
キャリブレーション・シャープネスの分解を分類を超えて一般化し、適切なキャリブレーション誤差の定義を動機付ける。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:11:03 GMT)
On the Uniform Convergence of Subdifferentials in Stochastic Optimization and Learning [1.5] 実験的リスクから集団リスクへのサブディファレンシャルマッピングの一様収束を非平滑,非評価,決定論的最適化を用いて検討した。
これらの保証は、堅牢な統計と関連する応用に起因する問題の幾何学に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:25:47 GMT)
GaussianFlowOcc: Sparse and Weakly Supervised Occupancy Estimation using Gaussian Splatting and Temporal Flow [1.5] 職業推定は3次元コンピュータビジョンにおいて顕著な課題となっている。
本稿では,GaussianFlowOccと呼ばれる,新規な占有率推定手法を提案する。
ガウススプラッティングにインスパイアされ、伝統的な密度の強いボクセル格子をスパース3Dガウス表現に置き換える。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:44:26 GMT)
Towards Optimal Convolutional Transfer Learning Architectures for Breast Lesion Classification and ACL Tear Detection [1.5] 転送学習は、小さなデータ上での高性能モデルの微調整における重要なソリューションとして現れてきた。
本研究は, 乳腺病変の悪性度検出およびACL裂傷検出に最適なCNNアーキテクチャを決定するために, 包括的調査を行うことにより, Mei et al. (2022) を拡張した。
以上の結果から, スキップ接続, ResNet50 トレーニングバックボーン, 部分的背骨凍結は, 医用分類性能が最適であることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:33:43 GMT)
Exploring Efficient Learning of Small BERT Networks with LoRA and DoRA [1.5] Low-Rank Adaptation (LoRA) と Weight-Decomposed Low-Rank Adaptation (DoRA) は、微調整の計算問題に対する高効率で高性能な解法である。
より小規模な言語モデルに適用した場合に,LoRA と DoRA の効率と性能をベンチマークすることで,オリジナルの LoRA と DoRA の論文を拡張したいと考えている。
この結果から,LoRAとDoRAの最適設定と自動混合精度(AMP)が相まって,性能を損なうことなくトレーニング効率を著しく向上することがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:14:44 GMT)
A Proportional-Integral Controller-Incorporated SGD Algorithm for High Efficient Latent Factor Analysis [1.5] 勾配降下に基づく潜在因子分析(SGD-LFA)法は,HDI行列に埋め込まれた深い特徴情報を効果的に抽出することができる。
本稿では,PIを高速化するSGDアルゴリズムを開発したPILFモデルを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:39:23 GMT)
Factorization of multimeters: a unified view on nonclassical quantum phenomena [1.5] 量子論は、測定の不整合性、文脈性、ステアリング、ベル非局所性など、様々な非古典的特徴を示す。
この研究は、それらを統一する交換ダイアグラムに基づく統一された数学的枠組みを導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:03:02 GMT)
Data-Driven Discovery of Interpretable Kalman Filter Variants through Large Language Models and Genetic Programming [1.4] 本稿では,Kalmanフィルタという科学計算アルゴリズムが,自動的,データ駆動型,進化的プロセスによって発見できるかどうかを考察する。
以上の結果から、カルマン最適性仮定が成立すると、我々のCGPおよびLLM支援進化の枠組みがほぼ最適解に収束することを示した。
これらの結果は、単純な計算モジュールの解釈可能なデータ駆動合成のための進化的アルゴリズムと生成モデルを組み合わせることが、科学計算におけるアルゴリズム発見の強力なアプローチであることを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:14:28 GMT)
Robust Federated Learning under Adversarial Attacks via Loss-Based Client Clustering [1.4] フェデレートラーニング(FL)は、プライベートデータを共有せずに、複数のクライアント間で協調的なモデルトレーニングを可能にする。
FLサーバは信頼できる(正直な)サイドデータセットを持ち、FLクライアントが敵(ビザンチン)攻撃を受ける場合のFLシナリオを考察する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:24:34 GMT)
FedGreed: A Byzantine-Robust Loss-Based Aggregation Method for Federated Learning [1.4] フェデレートラーニング(FL)は、デバイス上のローカルデータセットを保持することで、データのプライバシを保ちながら、複数のクライアント間で協調的なモデルトレーニングを可能にする。
本研究では,クライアントがビザンツ攻撃を行い,クライアントが逆さまに振る舞うようなFL設定に対処する一方,中央サーバは信頼され,参照データセットが装備される。
本稿では,フェデレート学習のためのレジリエントアグリゲーション戦略であるFedGreedを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:20:19 GMT)
A Weighted Vision Transformer-Based Multi-Task Learning Framework for Predicting ADAS-Cog Scores [1.4] 重み付き視覚変換器(ViT)を用いたマルチタスク学習(MTL)フレームワークを提案し,ADAS-Cogのグローバルスコアを共同で予測する。
提案フレームワークは,ViTを特徴抽出器として統合し,サブスコア比損失重み付けがモデル性能に与える影響を系統的に検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:43:48 GMT)
Post-Training Language Models for Continual Relation Extraction [1.4] 本研究では,事前学習言語モデル(PLM),特に大規模言語モデル(LLM)を知識グラフに適用することを検討した。
我々は,TACREDおよびFewRelデータセット上で,デコーダのみのモデル(Mistral-7BとLlama2-7B)とエンコーダ-デコーダモデル(Flan-T5 Base)を評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:03:29 GMT)
Consciousness as a Functor [1.3] 本研究では,無意識記憶から意識記憶へのコンテンツを受信し,伝達するファクタとしての意識理論を提案する。
我々のCFフレームワークは、Baars氏が提案したGlobal Workspace Theoryの分類的定式化と見なすことができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:06:52 GMT)
Detecting and Characterizing Planning in Language Models [1.3] 本稿では,半自動アノテーションパイプラインとして計画および運用を行うための形式的かつ因果的基準を提案する。
このパイプラインを,MBPPコード生成ベンチマークと詩生成タスク上で,ベースおよび命令調整されたGemma-2-2Bモデルに適用する。
Gemma-2-2B は即興で同じ詩生成タスクを解くが,MBPP では同様のタスクにまたがって計画と即興を切り替え,さらに連続したトークン予測も行う。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:59:46 GMT)
Attacking LLMs and AI Agents: Advertisement Embedding Attacks Against Large Language Models [1.3] 埋め込みアタック(AEA)は、モデルアウトプットやAIエージェントにプロモーションや悪意のあるコンテンツを注入します。
AEAは,(1)サードパーティのサービス配信プラットフォームをハイジャックして敵のプロンプトに対処し,(2)バックドアのオープンソースチェックポイントを発行する,という2つの低コストベクタを運用している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:13:23 GMT)
Entanglement dynamics of monitored non-interacting fermions on Graphic-Processing-Units [1.3] 観測された非相互作用フェルミオンの絡み合いのダイナミクスを$U(1)$対称性で数値的に特徴づける。
本結果は,量子システムの絡み合いのダイナミクスを定量的に説明するための道を開くものである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:35:06 GMT)
Architecting Clinical Collaboration: Multi-Agent Reasoning Systems for Multimodal Medical VQA [1.3] 遠隔医療による皮膚科医療は、しばしば個人訪問の豊かな文脈を欠いている。
本研究は,6つの構成にまたがる医用視覚質問応答の視覚言語モデルについて検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:55:38 GMT)
Zero-shot OCR Accuracy of Low-Resourced Languages: A Comparative Analysis on Sinhala and Tamil [1.3] 本研究では,2つの低リソース言語(LRL)上での6つのOCRエンジンのゼロショット性能の比較分析を行った。
選択されたエンジンには、各カテゴリの強度を評価することを目的とした、商用およびオープンソース両方のシステムが含まれている。
Cloud Vision API、Surya、Document AI、TesseractはSinhalaとTamilで評価され、Subasa OCRとEasyOCRは制限のために1つの言語で検査された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:11:11 GMT)
Teaching LLMs to Think Mathematically: A Critical Study of Decision-Making via Optimization [1.2] 本稿では,大規模言語モデル(LLM)の数学的プログラミングによる意思決定問題の定式化と解決能力について検討する。
まず、LLMがドメイン間の最適化問題をいかに理解し、構造化し、解決するかを評価するため、最近の文献の体系的レビューとメタ分析を行う。
計算機ネットワークにおける問題に対する最適化モデルの自動生成において、最先端のLLMの性能を評価するために設計されたターゲット実験により、系統的エビデンスを補完する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:52:56 GMT)
Why Isn't Relational Learning Taking Over the World? [1.2] リレーショナル・ラーニング(リレーショナル・ラーニング)は、リレーショナル・ラーニング(リレーショナル・ラーニング)が世界を支配するものではない。
世界中の(価値ある)データはすべて、テキストと画像の点である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:24:14 GMT)
Privacy-Preserving Federated Learning Framework for Risk-Based Adaptive Authentication [1.2] 本稿では,リスクベース適応認証のための新しいフェデレートラーニングフレームワークであるFL-RBA2を紹介する。
数学的に基底付けられた類似性変換を通じて、非IID問題に対処する。
分散クライアント間のアンバイアスアグリゲーションとパーソナライズされたリスクモデリングをサポートする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:02:07 GMT)
An Analytical Approach to Privacy and Performance Trade-Offs in Healthcare Data Sharing [1.2] 高齢者、頻繁に入院する患者、人種的少数派は、プライバシーの攻撃に弱い。
我々は,3つの匿名化手法($k$-anonymity, Zhengらによる手法,MO-OBAMモデル)を評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:36:47 GMT)
Client-Aided Secure Two-Party Computation of Dynamic Controllers [1.2] 提案プロトコルは,2つのサーバに対するコントローラ計算のアウトソーシングを実現する。
プロトコルの実現性は、PIDとオブザーバベースの制御の数値的な例を通して示される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:50:47 GMT)
CLaP -- State Detection from Time Series [1.2] 我々は,時系列状態検出のための新しい,高精度かつ効率的なアルゴリズムであるCLaPを紹介する。
それは、データセグメントが同じ状態から出現するかどうかを検出するために、セルフスーパービジョン技術を使用する。
CLaPは6つの最先端の競合相手よりはるかに精度が高い。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:14:37 GMT)
Controllable Hybrid Captioner for Improved Long-form Video Understanding [1.2] ビデオデータは極めて密度が高く、高次元である。
テキストベースの動画コンテンツの要約は、生よりはるかにコンパクトな方法でコンテンツを表現する方法を提供する。
静的なシーン記述でメモリを豊かにするビジョン言語モデル(VLM)を導入する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:17:48 GMT)
Improving Interpretability in Alzheimer's Prediction via Joint Learning of ADAS-Cog Scores [1.2] 我々は,グローバルADAS-Cogスコアとそのサブスコアを24ヶ月で共同で予測するマルチタスク学習(MTL)フレームワークを提案する。
主な目的は、MRI機能に関連する各サブスコアが、グローバルスコアの予測にどのように貢献するかを検討することである。
サブスコアレベル分析では、特にQ1(Word Recall)、Q4(Delayed Recall)、Q8(Word Recognition)の小さなサブセットが、予測されたグローバルスコアを一貫して支配していることが明らかになった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:56:11 GMT)
Agri-Query: A Case Study on RAG vs. Long-Context LLMs for Cross-Lingual Technical Question Answering [1.1] 本稿では,128Kのコンテキストウィンドウを持つ大規模言語モデル(LLM)を技術的質問応答(QA)タスク上で評価するケーススタディを提案する。
私たちのベンチマークは、英語、フランス語、ドイツ語で利用可能な農業機械のユーザーマニュアルに基づいて構築されています。
マニュアルの3つの言語バージョンすべてに対して、質問を英語で提示する言語間情報検索シナリオをシミュレートする。
この評価は現実的な "needle-in-a-haystack" の問題に焦点を合わせ、幻覚の検査に答えられない質問を含む。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:54:46 GMT)
A Retail-Corpus for Aspect-Based Sentiment Analysis with Large Language Models [1.1] 本研究では,店舗を対象とする多言語顧客レビュー10,814件を手作業でアノテートしたデータセットを提案する。
アスペクトベース感情分析におけるGPT-4とLLaMA-3の性能を評価し、新たに導入されたデータのベースラインを確立する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:02:05 GMT)
Signals vs. Videos: Advancing Motion Intention Recognition for Human-Robot Collaboration in Construction [1.1] 本研究は,ドライウォール設置作業の初期段階における作業者の動作意図の認識において,深層学習を活用して2つの異なるモーダル性を評価する。
The Convolutional Neural Network - Long Short-Term Memory (CNN-LSTM) model using surface Electromyography (sEMG) data to a accuracy of 87%。
事前訓練したビデオスウィン変換器と、転送学習を併用した動画シーケンスを入力として、動きの意図を認識し、精度が94%に達した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:58:07 GMT)
Enhancing Chemical Explainability Through Counterfactual Masking [1.1] マスクされたサブストラクチャを化学的に合理的な断片に置き換えるフレームワークである反ファクトファクトマスキングを提案する。
我々のアプローチは、説明可能性と分子設計のギャップを埋め、化学における説明可能な機械学習への原則的で生成的な経路を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:41:36 GMT)
Debate-to-Detect: Reformulating Misinformation Detection as a Real-World Debate with Large Language Models [1.0] D2D(Dbate-to-Detect, D2D)は, 偽情報検出を構造化された敵対的議論として再構築する, 新規なマルチエージェント・ディベート(MAD)フレームワークである。
ファクトチェックにインスパイアされたD2Dは、各エージェントにドメイン固有のプロファイルを割り当て、Opening Statement、Rebuttal、Free Debate、Closing Statement、Judgmentを含む5段階の議論プロセスを編成する。
従来の二項分類を超越するために、D2Dは5つの異なる次元にまたがるクレームを評価する多次元評価機構を導入している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:05:50 GMT)
Modeling spectral filtering effects on color-matching functions: Implications for observer variability [0.9] 本研究では,スペクトルフィルタリングがカラーマッチング機能(CMF)に与える影響と,その観測変数モデリングへの応用について検討する。
両部共役場前におけるスペクトルフィルタを用いて, 単一観測者によるカラーマッチング実験を行った。
新たな計算手法を用いてフィルタ透過率と変換行列を推定し,フィルタCMFをフィルタCMFに変換する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:04:04 GMT)
modelSolver: A Symbolic Model-Driven Solver for Power Network Simulation and Monitoring [0.9] 本稿では,記号的数学的モデリングを中心にした新しいフレームワークを備えたソフトウェア・ソリューションであるモデラーを紹介する。
提案したパラダイムは、直感的な数学的表現を通じてモデルを定義し、従来のプログラミング構造の必要性を排除している。
モデラーは、ユーザーがカスタムモデルを指定することができるオープンボックスアプローチを使用して、電力フローと状態推定に重点を置いている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:43:49 GMT)
The AI in the Mirror: LLM Self-Recognition in an Iterated Public Goods Game [0.9] 2つの条件で4つの推論モデルと非推論モデルの挙動を解析する。
異なる設定で、自分たちが自分たちと対戦しているとLLMに話すことで、協力する傾向が著しく変化していることに気付きました。
本研究は玩具環境で実施されているが, エージェントが互いに「無意識に」差別しあうことで, 協力関係の促進や低下が期待できるマルチエージェント環境について考察した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:35:03 GMT)
CausalSent: Interpretable Sentiment Classification with RieszNet [0.8] RieszNetをベースとしたニューラルネットワークアーキテクチャを試作し,処理効果推定精度の向上を実現した。
筆者らのフレームワークCausalSentは,半合成IMDB映画レビューにおける治療効果を正確に予測する。
本研究は,IMDB映画レビューにおける「愛」という言葉の因果効果に関する観察的ケーススタディを行い,「愛」という言葉の存在が肯定的な感情の確率を+2.9%増加させることを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:56:51 GMT)
AMELIA: A Family of Multi-task End-to-end Language Models for Argumentation [0.8] 論証マイニングは、自然言語テキストから論証的構造とその関係を自動的に抽出することを目的としている。
本稿では,一つの大規模言語モデルを用いて1つないし複数の引数マイニングタスクを実行する方法について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:51:39 GMT)
Tricking LLM-Based NPCs into Spilling Secrets [0.7] 大規模言語モデル (LLM) はゲームNPCの動的対話を生成するためにますます使われている。
本研究では,LLMをベースとしたNPCが隠れた背景シークレットを明らかにすることができるかを検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:25:28 GMT)
BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification with Swin-HAFNet [0.7] 我々は,脳腫瘍の分類と分類に特化して設計されたBRISCという新しいMRIデータセットを提案する。
このデータセットは、放射線医や医師によって注釈された6000個の造影T1強調MRIスキャンで構成されている。
悪性腫瘍としてはグリオーマ、髄膜腫、下垂体腫瘍の3種類と非腫瘍の3種類がある。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:11:45 GMT)
Correlations Are Ruining Your Gradient Descent [0.7] 自然勾配降下は、最も急勾配の方向を示す勾配ベクトルが、損失景観の局所曲率を考慮することにより、どのように改善されるかを照らしている。
ニューラルネットワークの各層におけるノード応答を含む,任意の線形変換におけるデータの相関が,モデルパラメータ間の非正規的関係を生じさせることを示す。
本稿では,ノード出力のデコレーションと白化のために提案された手法について述べるとともに,これを拡張し,分散コンピューティングや計算神経科学に特に有用な新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:34:51 GMT)
Vectorized Attention with Learnable Encoding for Quantum Transformer [0.7] 本稿では,理想のマスキング行列計算をサポートするVQT(Vectorized Quantum Transformer)を提案する。
我々のノイズ中間スケール量子フレンドリなVQTアプローチは、量子コンピューティングにおけるエンドツーエンド機械学習の新しいアーキテクチャを解き放ちます。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:33:14 GMT)
A Universal Framework for Offline Serendipity Evaluation in Recommender Systems via Large Language Models [0.7] 推薦システム(RS)のセレンディピティーは、予期せぬ有用なアイテムを提示することによってユーザの満足度を高める概念として注目されている。
既存のオフラインメトリクスは、しばしば曖昧な定義に依存するか、特定のデータセットやRSに合わせて調整されるため、一般化性が制限される。
本研究では,大規模言語モデル(LLM)を多種多様な知識と推論能力に活かした評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:45:16 GMT)
Exploring Economic Sectoral Dynamics Through High-resolution Mobility Data [0.6] われわれは,2019年1月から2023年1月までの米国全土における人体移動パターンを総合的に分析したデータセットを提示する。
このデータセットは、経済セクターが組織した公共の場所で約1200万ポイント・オブ・関心(POI)の訪問、旅行、時間についてレポートしている。
さまざまなタイプのビジネスにパターンを分散させることで、経済学、都市研究、公衆衛生の研究者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:47:31 GMT)
Limits of message passing for node classification: How class-bottlenecks restrict signal-to-noise ratio [0.6] メッセージパッシングニューラルネットワーク(MPNN)はノード分類の強力なモデルであるが、グラフのヘテロフィリーおよび構造的ボトルネックの下でのパフォーマンス制限に悩まされている。
本稿では,MPNN表現の信号対雑音比(SNR)を用いて,ヘテロフィリとボトルネックの関係を明らかにする。
高次ホモフィリーを最大化するための最適グラフ構造は、単クラスおよび二クラス二部体の解離結合であることを示す。
これにより、全てのホモフィリーにおけるほぼ完璧な分類精度を達成するグラフアンサンブルに基づく再配線アルゴリズムBRIDGEが得られる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:25:14 GMT)
Data Augmentation Improves Machine Unlearning [0.6] 異なるデータ拡張戦略が未学習手法の性能に与える影響について検討する。
適切な拡張設計は、未学習の有効性を著しく向上させる。
その結果,TrivialAug Aug Aug Aug Aug aug augmentationを用いた場合,平均ギャップ未学習の40.12%の減少が認められた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:17:25 GMT)
Analise de Desaprendizado de Maquina em Modelos de Classificacao de Imagens Medicas [0.6] 機械学習の目的は、モデルの堅牢性を保ちながら、事前訓練されたモデルからプライベートまたはセンシティブなデータを除去することである。
本研究では、PathMNIST、OrganAMNIST、BloodMNISTデータセットの実験を行うことで、SalUnアンラーニングモデルを評価する。
その結果、SalUnは完全再トレーニングに近いパフォーマンスを実現し、医療応用における効率的なソリューションであることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:28:33 GMT)
WMKA-Net: A Weighted Multi-Kernel Attention Network for Retinal Vessel Segmentation [0.6] 本研究では,マルチスケール機能融合の不十分,文脈連続性の破壊,ノイズ干渉といった問題に対処する二段階解を提案する。
第1段では、階層的な適応的畳み込みを使用して、キャピラリーからメイン船へのクロススケール機能を動的にマージするマルチスケール核融合モジュール(Multi-Scale Fusion Module, RMS)を採用している。
第2段階では、軸方向の経路を通じて長距離血管の連続性をモデル化する血管指向性注意機構が導入された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:53:31 GMT)
CLARIFY: A Specialist-Generalist Framework for Accurate and Lightweight Dermatological Visual Question Answering [0.5] 皮膚科視覚質問応答(VQA)を専門とするCLARIFYについて紹介する。
CLARIFYは、(i)高速かつ高精度な診断予測を提供する軽量な領域学習画像分類器(スペシャリスト)と(ii)ユーザクエリに対する自然言語説明を生成する強力な圧縮された会話型VLM(ジェネラリスト)の2つのコンポーネントを組み合わせる。
その結果, CLARIFYは最強基線に対する診断精度が18%向上することが確認された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:22:16 GMT)
2D Ultrasound Elasticity Imaging of Abdominal Aortic Aneurysms Using Deep Neural Networks [0.5] 腹部大動脈瘤 (AAA) は破裂の可能性があるため, 臨床的リスクが高い。
2次元超音波を用いたAAAの弾力性イメージングのためのディープラーニングに基づくフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:42:54 GMT)
Response and Prompt Evaluation to Prevent Parasocial Relationships with Chatbots [0.5] AIエージェントとの対人関係の発達は深刻であり、場合によっては人間の幸福に対する悲劇的な影響がある。
本稿では,現在進行中の対人会話をリアルタイムに評価する,最先端の言語モデルを再利用したシンプルな応答評価フレームワークを提案する。
5段階試験による反復的評価は,全社交会話の同定に成功し,寛容な一致規則の下で偽陽性を避けた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:36:54 GMT)
Algebraic Approach to Ridge-Regularized Mean Squared Error Minimization in Minimal ReLU Neural Network [0.5] RR-MSEの局所最小値を列挙する除算-列挙-マージ戦略を開発した。
計算代数的手法は、実際的な大きさのパーセプトロンに対して計算的に非常に集中的であるが、概念の証明として、提案手法をいくつかの隠れ単位を持つ最小のパーセプトロンに適用する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:24:20 GMT)
Assessing the Noise Robustness of Class Activation Maps: A Framework for Reliable Model Interpretability [0.5] クラスアクティベーションマップ(CAM)は、ディープラーニングモデルで使用される領域を視覚化する重要な手法の1つである。
我々は、複数のアーキテクチャやデータセットにまたがる様々なノイズ摂動に対する各種CAM手法のレジリエンスを評価し、報告する。
一貫性と応答性という2つの重要な特性を捉えるCAMのロバストネス指標を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:59:06 GMT)
HyST: LLM-Powered Hybrid Retrieval over Semi-Structured Tabular Data [0.5] HyST(Hybrid search over Semi-structured Tabular data)は、構造化フィルタリングとセマンティック埋め込み検索を組み合わせたハイブリッド検索フレームワークである。
半構造化ベンチマークにおいてHySTがトラジショナルベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:06:27 GMT)
Activation degree thresholds and expressiveness of polynomial neural networks [0.5] 本研究では, 深部ニューラルネットワークの表現力について, ニューロバリアリティの幾何学的手法を用いて検討する。
我々は、幅1のボトルネックを伴わない全てのニューラルネットワークに対して、アクティベーション度閾値の存在を証明した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:43:38 GMT)
Introduction to Regularization and Learning Methods for Inverse Problems [0.5] まず、微分、デコンボリューション、計算トモグラフィーなどの例を通して逆問題を導入する。
第2章ではまず、ヒルベルト空間の逆問題に関する古典正規化理論を扱う。
擬似逆数の後、収束正則化の概念を概観する。
第3章では、データ依存アプローチで逆問題の解決を可能にする、現代的なディープラーニング手法について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:32:38 GMT)
Beyond Imaging: Vision Transformer Digital Twin Surrogates for 3D+T Biological Tissue Dynamics [0.4] Vision Transformer Digital Twin Surrogate Network (VT-DTSN)は、生体組織からの3D+T画像データの予測モデリングのためのディープラーニングフレームワークである。
VT-DTSNはショウジョウバエミガットの高忠実で時間分解されたダイナミクスを再構築することを学ぶ。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:31:36 GMT)
Arc Routing Problems with Multiple Trucks and Drones: A Hybrid Genetic Algorithm [0.4] Rural Postman Problem (RPP) は、ネットワーク内のエッジや弧のサブセットをトラバースしなければならない基本的な変種である。
本稿では、複数のトラックを複数台搭載するRPP-mTDの一般化形態について検討する。
本稿では,人口ベース探索と対象地域探索を組み合わせたハイブリッド遺伝的アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:10:46 GMT)
Quantum Computer-Based Verification of Quantum Thermodynamic Uncertainty Relation [0.4] 一般的な量子熱力学的不確実性関係の実証実験を報告した。
この検証はIBMのクラウドベースの量子プロセッサで実証されている。
本研究は, 量子コンピュータを基本熱力学的トレードオフ関係研究の有効なプラットフォームとして確立した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:34:19 GMT)
The ProLiFIC dataset: Leveraging LLMs to Unveil the Italian Lawmaking Process [0.3] 本報告では,1987年から2022年までのイタリア法制定過程の包括的イベントログであるProLiFIC(Procedural Lawmaking Flow in Italian Chambers)を紹介する。
予備分析を実証し,法的なプロセスマイニング(PM)のベンチマークとしてProLiFICを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:00:12 GMT)
Integrating gender inclusivity into large language models via instruction tuning [0.3] ポーランド語のテキストで訓練された大きな言語モデル(LLM)は、この男性的バイアスを継承し、強化し、男女不均衡な出力を生成する。
本研究は、人為的な性別非包括的証明読解命令の集合であるIPISデータセットを用いて、LSMをチューニングすることでこの問題に対処する。
実験では、IPIS-tune multilingual LLMs (Llama-8B, Mistral-7B, Mistral-Nemo) とポーランド固有のLLMs (Bielik anduM) が実験された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:34:59 GMT)
Deterministic Coreset Construction via Adaptive Sensitivity Trimming [0.3] 実証的リスク最小化のための決定論的コアセット構築のためのフレームワークを開発する。
我々の中心的な貢献は、適応決定論的一様重みトリミング(ADUWT)アルゴリズムである。
我々は,インスタンス最適オラクル,決定論的ストリーミング,公平性に制約されたEMMについて,オープンな問題で結論付けた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:19:13 GMT)
Characterization and generation of a SQL-beating cat-like state through repetitive measurements [0.3] ハイゼンベルク制限スケーリングは一般化された猫状態によって達成できる。
マクロコヒーレンスを示すインデックス$q$を用いて猫のような状態を特徴付ける。
我々の結果は、絡み合いの強い量子メートル法の実現の道を開く。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:46:34 GMT)
Quantum nature of gravitational waves from binary black holes [0.3] このコヒーレント状態記述は、従来の重力波を先行順に再現する一方、次の次効果はグラビトンの圧縮状態を生成することを示す。
LIGO、Virgo、またはKAGRAによるこのようなスクイーズの検出は、重力の量子化の直接的な証拠となる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:12:54 GMT)
Does provable absence of barren plateaus imply classical simulability? [0.3] バレン高原を避けることができる構造も、古典的な損失を効率的にシミュレートするために利用できますか?
ケース・バイ・ケース(ケース・バイ・ケース)に基づくエビデンス(エビデンス)を収集する。
我々の分析は、不規則な地形を持つ多くのパラメタライズド量子回路の情報処理能力に疑問を呈している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:10:12 GMT)
Towards New Benchmark for AI Alignment & Sentiment Analysis in Socially Important Issues: A Comparative Study of Human and LLMs in the Context of AGI [0.3] 本研究では,大規模言語モデル(LLM)と人間による人工知能(AGI)に対する感情について検討する。
GPT-4はAGIに対して最も肯定的な感情を、Bardは中立的な感情に傾いた。
この分析は、LLMの感情形成における関心と偏見の潜在的な対立を概説している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:23:08 GMT)
Characterizing the Behavior of Training Mamba-based State Space Models on GPUs [0.3] マンバをベースとしたステートスペースモデル(SSM)は、ユビキタストランスフォーマーに代わる有望な代替品として登場した。
変圧器の表現力にもかかわらず、計算注意の二次的な複雑さは、性能のスケーリングの大きな障害である。
当社の作業は、そのようなモデルのパフォーマンスを継続的にスケーリングするための潜在的な最適化について、新たな光を当てています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:22:27 GMT)
DenseRec: Revisiting Dense Content Embeddings for Sequential Transformer-based Recommendation [0.2] トランスフォーマーベースのシーケンシャルレコメンダは通常、学習アイテムIDの埋め込みにのみ依存する。
DenseRecはシンプルだが効果的な方法であり、デュアルパス埋め込みアプローチを導入している。
3つの実世界のデータセットの実験では、DenseRecはIDのみのSASRecベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:47:20 GMT)
Sketchpose: Learning to Segment Cells with Partial Annotations [0.2] 距離マップに依存したアノテート対象を部分的に処理する手法を提案する。
本研究では,正規データベース上でのフラガルラーニング,トランスファーラーニング,レギュラーラーニングの文脈における提案手法の性能を評価する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:43:32 GMT)
LLM-Based Agents for Competitive Landscape Mapping in Drug Asset Due Diligence [0.2] 我々は、エージェントAIシステム内で高速な薬物資産デューディリジェンスに使用される競合発見コンポーネントを記述し、ベンチマークする。
競合するAIエージェントは、表示が与えられた場合、その表示の競合する風景を含むすべての薬物を検索する。
当社の競合発見エージェントは,OpenAI Deep ResearchとPerplexity Labsを上回る83%のリコールを達成した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:26:04 GMT)
SVD Based Least Squares for X-Ray Pneumonia Classification Using Deep Features [0.2] 肺炎分類のための特異値分解に基づくLast Squaresフレームワークを提案する。
我々は、精度を損なうことなく効率を確保できる、クローズドな非イテレーティブな分類手法を採用する。
実験により,SVD-LSは計算コストを大幅に削減し,競争性能が向上することを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:52:28 GMT)
adder-viz: Real-Time Visualization Software for Transcoding Event Video [0.2] イベントビデオはビデオフレームを省略し、非同期でピクセルごとの強度サンプルを選択できる。
我々はこれらの懸念に対処する統合ADDER表現を以前提案した。
本稿では,実時間イベントトランスコードプロセスとループ内アプリケーションを可視化するアドバンスビズソフトウェアについて,多数の改良を加えている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:58:20 GMT)
Linear cost mutual information estimation and independence test of similar performance as HSIC [0.2] 2つのデータサンプル間の統計的依存関係の評価は、データサイエンス/機械学習の基本的な問題である。
サイズ$n$データサンプルには$ntimes n$行列の乗算が必要です。
我々は,HCRを,テストにおける高い依存性感度の線形コスト実用的な代替手段として論じる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:45:25 GMT)
Hybrid Quantum-Classical Learning for Multiclass Image Classification [0.2] そこで本研究では,QCNNを完全連結の古典層に結合したハイブリッド量子古典アーキテクチャを提案する。
この方法は、MNIST、Fashion-MNIST、OrganAMNISTで同等の軽量モデルより優れている。
これらの結果は、捨てられた量子ビット情報の再利用が将来のハイブリッド量子古典モデルにとって有望なアプローチであることを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:12:18 GMT)
Software Unclonable Functions for IoT Devices Identification and Security [0.1] 本研究は,ソフトウェア非拘束機能 (SUF) として導入した概念を包含したハードウェア性能カウンタ(HPC)由来のシグネチャの特異性の有効性について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:00:14 GMT)
Content-based 3D Image Retrieval and a ColBERT-inspired Re-ranking for Tumor Flagging and Staging [0.1] 本研究は,3つの重要なコントリビューションを通じて,ボリューム医療画像に対するCBIR研究を進展させる。
C-MIRは,ColBERTの文脈的遅延相互作用機構を応用した3次元医用画像のための新しいボリュームリグレード法である。
本稿では,後続相互作用原理のボリューム医療画像への適応性を実証し,効果的な文脈認識の再ランク付けを可能にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:03:41 GMT)
Magic Resources of the Heisenberg Picture [0.1] 演算子に対する非安定化資源理論について検討し、これは状態を記述するものと双対である。
作用素空間における安定化器 R'enyi エントロピーアナログは、通常の条件を満たす優れたマジックモノトンである。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:13:47 GMT)
Hollow-grams: Generalized Entanglement Wedges from the Gravitational Path Integral [0.1] 重力バルク領域に付随する絡み合いウェッジの提案を導出する。
我々は、ランダムテンソルネットワーク(RTN)と重力における固定幾何状態の接続を利用する。
BP提案は$nto1$制限で普遍的に再現されていることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:23:52 GMT)
Information availability in different languages and various technological constraints related to multilinguism on the Internet [0.1] 1995年から2010年にかけて、インターネット利用者数は16億人から16億5000万人に増加した。
世界人口の20-25%が母国語として英語を話している。
本稿では,異なる言語における情報提供の必要性と,インターネット上での多言語化に関連する様々な技術的制約について分析する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:35:12 GMT)
When Algorithms Infer Gender: Revisiting Computational Phenotyping with Electronic Health Records Data [0.1] 電子健康記録における性別に関する不完全なデータ収集の実践的な解決策として、計算的表現型付けが登場している。
このアプローチは、患者の健康記録で利用可能なデータを用いて、患者の性別を推測するアルゴリズムに依存する。
EHRに基づくバイオメディカル研究において、トランスとジェンダーを対象とする人口の可視性を改善することを目的としているが、計算的表現型付けは、重要な方法論的および倫理的懸念を提起する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:37:18 GMT)
ImmunoAI: Accelerated Antibody Discovery Using Gradient-Boosted Machine Learning with Thermodynamic-Hydrodynamic Descriptors and 3D Geometric Interface Topology [0.0] ヒトメタ肺炎ウイルス(hMPV)は小児、高齢者、免疫不全の集団に深刻なリスクをもたらす。
従来の抗体発見パイプラインは10-12ヶ月を必要とし、急激なアウトブレイク反応に適用性を制限する。
本研究は,高親和性候補を予測して抗体発見を促進する機械学習フレームワークであるImmuAIを紹介する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:41:35 GMT)
Dynamic rerouting and interruption resilience of quantum communication via single-photon-based resynchronization [0.0] 本稿では,量子鍵分布(QKD)システムに対する同期化手法を提案する。
この方法は、量子チャネルの割り込みと光路長の変化から、迅速かつ確実な回復を可能にする。
本手法を時間2相BB84QKDシステムに実装し,100km以上の繊維長変化と複数分間のチャネル遮断後,再同期を成功させた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:07:34 GMT)
Fractal decompositions and tensor network representations of Bethe wavefunctions [0.0] 一般の$M$-粒子Beの1d格子上の波動関数の絡み合い構造について検討する。
通常の二分木の場合、ネットワークは深さ$log_2(N/M)$を持ち、同じ深さの適応量子回路に変換することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:38:25 GMT)
Towards Trustworthy Breast Tumor Segmentation in Ultrasound using Monte Carlo Dropout and Deep Ensembles for Epistemic Uncertainty Estimation [0.0] 乳房超音波セグメンテーションにおけるResidual U-Netの応用について検討した。
BUSIデータセットにおけるデータ重複の同定と補正を行う。
モンテカルロ・ドロップアウト、ディープアンサンブル、およびそれらの組み合わせを用いて、疫学的不確実性を定量化する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:06:07 GMT)
state-o-gram --A Novel 2D Visualization for Quantum States [0.0] 本稿では,任意の量子ビット数に対して直感的に量子状態を表すように設計された,新しい2次元可視化手法であるState-o-gramを紹介する。
我々は、量子状態解析のためのスケーラブルで直感的なツールを提供することを目的として、その設計原理、視覚要素、マルチキュービットシステムへの応用について詳述する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:30:33 GMT)
Why Relational Graphs Will Save the Next Generation of Vision Foundation Models? [0.0] ビジョン基礎モデル(FM)はコンピュータビジョンにおいて主要なアーキテクチャとなっている。
我々は、次世代FMは動的リレーショナルグラフとしてインスタンス化された明示的なリレーショナルインタフェースを組み込むべきであると論じる。
FMを軽量で文脈適応型グラフ推論モジュールで拡張することで、セマンティックな忠実度、分布外、解釈可能性、計算効率が向上することを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:11:03 GMT)
What is digital about abstraction? [0.0] 第1章は 抽象をコンピューティングの 中心原理として検討します
プログラミング、オペレーティングシステム、ネットワークの歴史的発展を通して抽象化をトレースする。
オープンソースプロジェクトからプラットフォーム資本主義やクラウドインフラストラクチャに至るまで、抽象化は技術的なデバイスとパワーの領域の両方として現れます。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:35:07 GMT)
Weisfeiler-Lehman meets Events: An Expressivity Analysis for Continuous-Time Dynamic Graph Neural Networks [0.0] グラフニューラルネットワーク (GNN) は、1-Weisfeiler-Lehman (1-WL) テストの識別能力と一致することが知られている。
GNNは任意の精度でグラフ上の任意の対象関数を普遍的に近似することができる。
属性付き離散力学グラフの理論を任意の接続性を持つ属性付き連続時間動的グラフに拡張する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:10:45 GMT)
Unlearning as Ablation: Toward a Falsifiable Benchmark for Generative Scientific Discovery [0.0] 大きな言語モデル(LLM)は本当に新しい知識を生成するのか、それとも単に記憶された断片をリミックスするだけなのか?
建設科学的発見の実証実験として,非学習的アズ・アブレーションを提案する。
数学とアルゴリズムの最小限のパイロットを概説し、物理学、化学、生物学の拡張について論じる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:24:15 GMT)
Twisted light drives chiral excitations of interacting electrons in nanostructures with magnetic field [0.0] ツイスト光(TL)は、量子閉じ込められたナノ構造における対称性分解遷移を駆動するための強力なツールを提供する。
TLパルスがナノ構造中の2つの相互作用する電子を垂直磁場下で励起する現実的なモデルについて検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:44:58 GMT)
Trotter-based quantum algorithm for solving transport equations with exponentially fewer time-steps [0.0] 本稿では, 量子状態の生成, 進化, 測定の3段階に基づく量子数値スキームを提案する。
新たなベクトルノルム解析を導入し、時間ステップの数を量子ビット数で指数関数的に減らすことができることを示す。
また、予測ベクトルノルムスケーリングを確認するための効率的な量子回路と数値シミュレーションも提示する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:00:54 GMT)
Towards Synthesizing Normative Data for Cognitive Assessments Using Generative Multimodal Large Language Models [0.0] 新しいイメージ刺激に基づく新しい認知テストの開発は、手軽に利用できる規範データがないために困難である。
近年のMLLM(Generative Multimodal Large Language Model)の進歩は、既存の認知テスト画像から合成規範データを生成する新しいアプローチを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:14:15 GMT)
Tomographic reconstruction of free-electron quantum states [0.0] 我々は、急速電子の量子状態を再構成するためのいくつかのアルゴリズムを与える。
我々は、約245aのパルスデュレーションを取得し、これらの電子が生成する放射と励起に対して36%のコヒーレンスを予測した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:34:55 GMT)
Time evolution of nodes in quantum superposition states [0.0] ノードは伝統的に、確率密度が消える固定点と見なされる。
この研究は、これらのノードが量子重畳状態において時間依存的な振動を示すことを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:50:49 GMT)
Time Domain Design of a Josephson Parametric Amplifier and Comparison with Input Output Theory [0.0] 量子制限増幅器は量子コンピュータにおいて必須の要素である。
JPAでは、増幅はジョセフソン接合の非線形特性に基づいている。
オープンソースのジョセフソン回路シミュレータを用いて実装したJPAの等価回路モデルに基づく代替手法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:37:11 GMT)
The sub-Riemannian geometry of measurement based quantum computation [0.0] 測定に基づく量子計算における演算資源の最小化は、同一性と対象の論理的ユニタリの間の準リーマン測地問題を解くことにつながることを示す。
これはMBQCの基礎となる幾何学的構造を明らかにし、計算相における量子処理を最適化する原理的な経路を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:56:52 GMT)
The real-time Feynman path integral for step potentials [0.0] 複素(半古典的)経路、あるいはインスタントンは、量子物理学の理解の不可欠な部分を形成する。
複素半古典経路のリッチで複雑な性質と非相対論的量子粒子のファインマンプロパゲータにおける干渉を明らかにする。
本研究では,伝搬振幅から複雑な半古典経路の存在を検出する手法を開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 00:59:47 GMT)
The Relationship Between the Number of Nodes in Wave Functions and Heisenberg's Uncertainty Principle [0.0] 共役変数(位置や運動量など)の不確実性は一般にノード数の関数であると主張する。
本稿では,ハイゼンベルクの不確かさ原理が波動関数のノルダル構造の影響と,この依存の性質がシステムに依存していることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:50:26 GMT)
The Quasi-Creature and the Uncanny Valley of Agency: A Synthesis of Theory and Evidence on User Interaction with Inconsistent Generative AI [0.0] 大規模な生成AIを使ったユーザエクスペリエンスは、パラドックス的です。
本論では, インテリジェンスを模擬した「Quasi-Creature」から起因した, 強力なフラストレーションは存在論的問題であると主張している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:43:33 GMT)
TLGLock: A New Approach in Logic Locking Using Key-Driven Charge Recycling in Threshold Logic Gates [0.0] 論理ロックのための新しい設計パラダイムであるTLGLockを提案する。
キーをゲートの重み付きロジックに埋め込むことで、TLGLockは従来のロック技術に代わる、ステートレスでコンパクトな代替手段を提供する。
その結果,TLGLockは最大30%の領域,50%の遅延,20%の省電力を実現していることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:57:36 GMT)
Succession of Ising criticality and its threshold in critical quantum Ising model subject to symmetric decoherence [0.0] 我々は,Isingモデルにおける混合状態量子臨界度を$X+ZZ$デコヒーレンスの下で検討する。
その結果, 混合状態はIsing CFTの特性を有することがわかった。
強いデコヒーレンスはイジング臨界を洗い出し、強弱自然対称性の破れを引き起こす。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:26:13 GMT)
Strong spin-magnon coupling in a van der Waals magnet with tunable chiral symmetry [0.0] 我々は、ファンデルワールス反強磁性絶縁体において、分子スピン量子ビットとマグノンの強いスピン-マグノン結合を示す。
磁気材料を用いた拡張型キラル量子光学のためのプラットフォームとして,磁気キャビティを確立した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:54:52 GMT)
Sparse Autoencoders for Low-$N$ Protein Function Prediction and Design [0.0] アミノ酸配列からのタンパク質機能の予測は、データスカース機構における中心的な課題である。
タンパク質言語モデル(pLM)は進化的インフォームド埋め込みとスパースオートエンコーダ(SAE)を提供することによって分野を進歩させた。
SAEは、24のシーケンスしか持たないが、フィットネス予測において、ESM2ベースラインよりも一貫して優れているか、競争している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:56:39 GMT)
Simulation Based Bayesian Optimization [0.0] 本稿では,獲得関数を最適化するための新しいアプローチとして,シミュレーションベースベイズ最適化(SBBO)を提案する。
GPは後続予測分布への解析的アクセスを提供するため、サロゲートモデルとして一般的に使用される。
本研究では,SBBOの有効性を種々の代理モデルを用いて実証的に実証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:41:28 GMT)
Semantic Search for Information Retrieval [0.0] 本調査ではBM25ベースラインの概要を概説し,近代的セマンティックレトリバーのアーキテクチャについて論じる。
我々は、高密度バイエンコーダ(DPR)、遅延相互作用モデル(ColBERT)、神経スパース検索(SPLADE)を導入する。
我々は、一般的な評価戦術、課題の押し付け、今後の方向性の提案で締めくくります。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:03:26 GMT)
Selective excitation of a single rare-earth ion in an optical fiber [0.0] テープ状シリカ繊維中で分離された唯一の希土類イオンを選択的に励起することにより, 室温での単一光子生成を実験的に実証した。
これらの特徴は、全ファイバー集積光量子ネットワークを実現するための有望なビルディングブロックとなる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:25:04 GMT)
Seeing Like a Designer Without One: A Study on Unsupervised Slide Quality Assessment via Designer Cue Augmentation [0.0] 専門家にインスパイアされたビジュアルデザインメトリクスとCLIP-ViT埋め込みを組み合わせた,教師なしのスライド品質評価パイプラインを提案する。
12kのプロの講義スライドでトレーニングを行い、6つの学術講演(115のスライド)で評価した。
以上の結果から,マルチモーダル埋め込みによる低レベルの設計手法の強化は,スライド品質に対する観衆の認識を近似させることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:07:58 GMT)
Secure Password Generator Based on Secure Pseudo-Random Number Generator [0.0] 本研究では,Pseudo-Random Number Generator (PRNG) を用いたセキュアなパスワード生成手法を提案する。
ジェネレータは、Keyed-Hash Message Authentication Code (HMAC) やCipher-based Message Authentication Code (CMAC) など、一連の Message Authentication Code (MAC) アルゴリズムを用いて実装されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 23:45:30 GMT)
Quantum-Accelerated Solution of Nonlinear Equations from Variational Principles [0.0] フォールトトレラント量子コンピュータ(FTQC)に適した新しいアルゴリズムを提案する。
提案手法では, 静的非線形問題を時間進化過程として再検討し, 量子加速に有効な線形化を実現する。
この研究は、物理と工学の分野にわたる複雑な非線形システムに対するフォールトトレラント量子コンピューティングの活用への道を開いた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 02:19:17 GMT)
Quantum reflection time and the Goos-Hänchen effect [0.0] 反射波パケットの運動の追従と散乱電位による粒子に課される空間遅延の量子的測定の類似性について検討する。
このような遅延を時間に換算すると、負の時間となり、最も避けられることが示されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:43:52 GMT)
Quantum Sensing with Nanoelectronics: Fisher Information for an Applied Perturbation [0.0] メロジカルな量子系は、古典的な量子系よりも精度の高い量子系を提供することができる。
量子フィッシャー情報(QFI)は、理想的な測定値に対するパラメータ推定の精度を特徴付ける。
量子ドットナノエレクトロニクスデバイスでは、電子相互作用がシステムサイズによるQFIの*指数*スケーリングにつながることが示される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:53:42 GMT)
Quantum Natural Gradient optimizer on noisy platforms: QAOA as a case study [0.0] 横フィールドイジングモデル(TFIM)の基底状態検出におけるQNG(Quantum Natural Gradient)の有効性について検討する。
本分析では,実装置の校正データに基づいて,理想化されたノイズフリー条件と現実的な雑音環境の両方でシミュレーションを行う。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:25:31 GMT)
Quantum Markovian master equation in the high-temperature limit [0.0] 高温量子マルコフマスター方程式(HTME)の臨界導出について述べる。
本稿では,その基礎的仮定,量子力学的含意,有効範囲について検討する。
我々の結果はNMRスピン格子緩和理論の伝統的な境界に挑戦する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:17:08 GMT)
Quantum Graph Attention Network: A Novel Quantum Multi-Head Attention Mechanism for Graph Learning [0.0] 量子グラフ注意ネットワーク(Quantum Graph Attention Network、QGAT)は、変動量子回路をアテンション機構に統合するハイブリッドグラフニューラルネットワークである。
複雑な構造的依存関係を捕捉するQGATの有効性を示し、帰納的シナリオにおける一般化を改善した。
実験により、量子埋め込みは特徴や構造的ノイズに対するロバスト性を高め、実世界のノイズデータを扱う利点を示唆している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:25:48 GMT)
Pulse sequence design for high field NMR with NV centers in dipolarly coupled samples [0.0] ダイヤモンドベースの量子センサーは、マイクロスケールでの高分解能NMR分光を可能にした。
本稿では,高磁場下での双極子結合試料中の核スピンの走査を可能にするプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:28:38 GMT)
Proposal for realizing quantum-spin systems on a two-dimensional square lattice with Dzyaloshinskii-Moriya interaction by Floquet engineering using Rydberg atoms [0.0] 本論文では,ハイゼンベルクとジアルシンスキー・モリヤ(DM)の相互作用を2次元正方格子に配置したリドベルク原子内に組み込むハミルトニアンの実装法を提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:45:40 GMT)
Probabilistic Classification of Near-Surface Shallow-Water Sediments using A Portable Free-Fall Penetrometer [0.0] 本研究では,携帯型自由落下ペネトロメータ(PFFP)データに基づく堆積挙動分類システムを構築するための革新的なアプローチを提案する。
提案モデルでは,セキム湾(ワシントン),ポトマック川,ヨーク川(ヴァージニア)など複数の地点から得られたPFFPの測定値を利用する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:08:47 GMT)
Predictability of quantum observables: Applications in QKD and top quarks [0.0] 量子相関によって強化された局所量子可観測物の予測を解析することにより、量子手段を用いた古典情報伝達の理解を深める。
提案手法は,統計的学習理論に根ざしたベイズリスクと推論分散という,予測誤差の相補的な2つの尺度に焦点をあてる。
我々は、我々の知る限り、これらの量の任意の2量子状態に対する最初の分析的最小化と最適な測定戦略を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:49:00 GMT)
Practical GPU Choices for Earth Observation: ResNet-50 Training Throughput on Integrated, Laptop, and Cloud Accelerators [0.0] このプロジェクトは、Sentinel-2画像の土地利用と土地被覆(LULC)分類のためのResNetベースのパイプラインを実装している。
このワークフローは、データ取得、地理空間前処理、タイリング、モデルトレーニング、可視化を自動化する。
性能評価では、Apple M3 Proのベースラインに比べて2倍のトレーニング速度が期待できる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:03:59 GMT)
Post-fusion monolithic hybrid recommender system for suggesting relevant movies to users [0.0] 本稿では,視聴映像のシーケンスと関連映画の視聴率を考慮した協調フィルタリングの2つの手法について考察する。
用途に応じて様々な重みが設定される。
この問題を解決するための文献と方法論のアプローチについて論じられた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:11:24 GMT)
Physical Formalism Of Directional Quantum Evolution Theory [0.0] 我々は、方向量子進化論(DQET)を紹介する。
DQETは4ベクトル定義の任意の時間的方向に沿って進化が起こる量子力学の共変再構成である。
保存された確率電流を提供し、適切な時間進化をサポートし、適切な境界でシュロディンガーを回復する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:51:17 GMT)
PKG-DPO: Optimizing Domain-Specific AI systems with Physics Knowledge Graphs and Direct Preference Optimization [0.0] 物理知識グラフ(PKG)と直接選好最適化(DPO)を統合する新しいフレームワークであるPKG-DPOを紹介する。
PKG-DPO 17%は、KG-DPO (knowledge graph-based DPO)と比較して、制約違反が少なく、物理スコアが11%高い。
私たちの主な焦点は金属の接合ですが、このフレームワークは他のマルチスケールの物理駆動の領域にも広く適用できます。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:31:03 GMT)
Optimizing Peer Grading: A Systematic Literature Review of Reviewer Assignment Strategies and Quantity of Reviewers [0.0] 本稿では, 査定の精度, 公平性, 教育的価値にどのような影響を与えるかを検討する。
我々は,ランダムな代入,能力に基づく代入,ソーシャル・ネットワークに基づく代入,入札という4つの一般的なレビュアー・アサインメント戦略を特定した。
レビューカウントでは、投稿ごとに3つのレビューを割り当てることが最も一般的なプラクティスとして現れます。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:28:50 GMT)
Observation of hysteresis in an isolated quantum system of disordered Heisenberg spins [0.0] 我々は孤立したハイゼンベルク量子スピン系にエネルギー依存性を見出す。
ゼロ磁場における感受性は特定のエネルギーで分岐し、異なる磁気状態の存在を示唆する。
非熱的準安定状態の観測は、孤立量子スピン系の新しい状態への相転移の存在を示すかもしれない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:58:58 GMT)
Numerical implementation of the partial secular approximation and unified master equation in structured open quantum systems [0.0] 構造化されたオープン量子系に対するレッドフィールド方程式において、部分的世俗近似を行うための符号を導入する。
この符号は、ボゾン浴に結合した任意の多粒子系のハミルトニアンに適用される。
2つの超伝導量子ビットからなる構造化されたオープン量子系における定常熱流の研究により、コードを記述する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:33:39 GMT)
Non-ergodic one-magnon magnetization dynamics of the kagome lattice antiferromagnet [0.0] 平らなバンドによる非平衡ダイナミクスの例として, かごめ格子反強磁性体の1-マグノンダイナミクスの側面を示す。
局所化マグノンとも呼ばれる一次元デルタ鎖局所化固有状態と同様に、無秩序な局在が生じ、系が平衡するのを防ぐ。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:59:19 GMT)
Non-degenerate Marginal-Likelihood Calibration with Application to Quantum Characterization [0.0] 我々は,ケネディ・オハガン(KOH)ベイズ的枠組みの中で,新たな限界化可能性戦略を提案する。
我々の方法は、元のものと異なる正確な可能性を定義するが、関連するすべての情報を保存している。
ローレンス・リバモア国立研究所(Lawrence Livermore National Laboratory)の超伝導量子装置のキャラクタリゼーションに応用されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:10:28 GMT)
Noisy atomic magnetometry with Kalman filtering and measurement-based feedback [0.0] 本稿では,測定,推定,制御戦略を統合する総合的なアプローチを提案する。
これは原子アンサンブルの連続的な光伝搬に基づく量子的非劣化測定を実装することを含む。
提案したフィードバックにより、測定データが破棄された場合でも原子は絡み合いを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:22:34 GMT)
Multilevel Analysis of Cryptocurrency News using RAG Approach with Fine-Tuned Mistral Large Language Model [0.0] 検索拡張生成(RAG)を用いた微調整Mistral 7B大言語モデルを用いた暗号ニュースのマルチレベルマルチタスク解析について検討する。
モデルはPEFT/LoRAアプローチを用いて4ビット化で微調整される。
知識グラフとしての暗号ニュースの表現は、大きな言語モデル幻覚の問題を本質的に排除することができる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:17:08 GMT)
Multicomponent cat states with sub-Planckian structures and their optomechanical analogues [0.0] 位相空間特性を拡張したコンパス状態の一般化版を導入する。
これらの望ましい位相空間特性は、少なくとも6つの異なるコヒーレント状態からなる重ね合わせにおいて維持されることを示す。
提案した量子状態を生成することができる光学系について検討し,ほぼ同じ位相空間構造を持つ光学系について検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:43:02 GMT)
Mining the Long Tail: A Comparative Study of Data-Centric Criticality Metrics for Robust Offline Reinforcement Learning in Autonomous Motion Planning [0.0] 我々は、情報豊富なサンプルに学習過程を集中させるためのデータキュレーション戦略について研究する。
我々は、7つの目標条件付き保守的Qラーニング(CQL)エージェントを最先端の注目アーキテクチャで訓練する。
モデル不確実性を信号として用いたデータ駆動型キュレーションは、最も重要な安全性向上を実現する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:37:29 GMT)
Machine Learning-Based Prediction of Quality Shifts on Video Streaming Over 5G [0.0] Quality of Experience(品質・オブ・エクスペリエンス、QoE)は、YouTubeのようなオーバー・ザ・トップ(OTT)プラットフォームでビデオセッションをストリーミングする際の満足度である。
YouTubeストリーミングセッションの品質シフトと、RSRP, RSRQ, SNRのチャネルメトリクスとの関係について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:14:31 GMT)
MESTI-MEGANet: Micro-expression Spatio-Temporal Image and Micro-expression Gradient Attention Networks for Micro-expression Recognition [0.0] マイクロ表現認識(MER)は、マイクロ表現の微妙な性質と浮き彫り性のために難しい課題である。
アペックスフレーム、オプティカルフロー、ダイナミックイメージのような伝統的な入力モダリティは、これらの短い顔の動きを適切に捉えることができないことが多い。
ビデオシーケンスを単一の画像に変換する新しい動的入力モダリティであるMESTI(Micro-Expression Spatio-Temporal Image)を導入する。
また,マイクロ圧縮グラディエント・アテンション・ネットワーク(MEGANet)について述べる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:49:05 GMT)
Low-rank optimal control of quantum devices [0.0] 予測精度を維持しながら計算コストを大幅に削減する計算フレームワークを適用した。
本手法は,現実的なトランスモン共振器-フィルタモデルを用いて,トランスモン量子ビット分散読み出しの最適化に関するベンチマークを行う。
低ランク近似と小型パルスパラメトリゼーションと勾配のない最適化を組み合わせることで、最先端の読み出し代入誤差が得られる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:22:17 GMT)
Local Description of Decoherence of Quantum Superpositions by Black Holes and Other Bodies [0.0] 我々は、アリスの研究室内の量子場の局所的な2点関数の観点から、デコヒーレンスを記述することができることを示す。
局所的な視点から、ウンルー真空中のシュワルツシルト時空におけるデコヒーレンスを明示的に計算する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:23:39 GMT)
Investigating the Impact of Project Risks on Employee Turnover Intentions in the IT Industry of Pakistan [0.0] 本研究は,IT産業におけるプロジェクトリスクが仕事満足度や転職意図に与える影響について考察する。
雇用満足度を形作る上での外的・内的ソーシャルリンクが果たす役割について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:34:44 GMT)
Imputation is Not Required: Incremental Feature Attention Learning of Tabular Data with Missing Values [0.0] 任意の計算戦略を用いて、異なる値のタブラルデータセットを機械学習に準備する。
本稿では,グラフデータに対する非インクリメンタルアテンション学習(NIAL)手法を提案する。
提案手法は、重なり合う特徴集合と固定サイズの特徴集合の分割を漸進的に学習し、変換器の効率と性能を向上させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 01:18:01 GMT)
Imprints of screened dark energy on non-local quantum correlations [0.0] 局所的な第5の力制約による宇宙加速を駆動する光スカラー場を再現するスクリーニング機構の探索方法について検討する。
我々は、地球を周回する一対の質量を持つスピン-1/2粒子を特徴とするゲダンケン実験を考察する。
曲線化された時空スピンの進化に先立って開発された一般的な定式化を用いて,CHSHの不等式に対するスクリーニングの効果を計算した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:58:22 GMT)
Impact of a Reflecting Material on a Search for Neutron--Antineutron Oscillations using Ultracold Neutrons [0.0] 1次元ポテンシャルで表される貯蔵容器内の超低温中性子の中性子-反中性子振動について検討した。
実験感度は反中性子の消滅速度によって決定される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:06:32 GMT)
HyTver: A Novel Loss Function for Longitudinal Multiple Sclerosis Lesion Segmentation [0.0] 我々はHyTverと呼ばれる新しいハイブリッド損失を提案し、他のメトリクスのパフォーマンスを維持しながらセグメンテーション性能を向上する。
我々はDiceスコア0.659を達成すると同時に、距離ベースのメトリクスが他の一般的な関数に匹敵することを保証する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:01:28 GMT)
How can AI agents support journalists' work? An experiment with designing an LLM-driven intelligent reporting system [0.0] 人工知能をジャーナリストの実践に統合することは、ニュースの収集、分析、発信方法の変革的な変化を表している。
大規模言語モデル(LLM)、特にエージェント能力を持つモデルは、ジャーナリストの実践を強化する前例のない機会を提供する。
本研究は,ジャーナリストのインタビューから得られた知見に基づいて,エージェントLLMがジャーナリストのフィルタリングを支援する方法について考察する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:56:59 GMT)
Heterogeneous co-occurrence embedding for visual information exploration [0.0] 異種領域の要素対間で共起確率が測定される場合を考える。
提案手法は、これらの不均一要素を対応する2次元潜在空間にマッピングし、ドメイン間の非対称関係の可視化を可能にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:51:50 GMT)
Harnessing the edge of chaos for combinatorial optimization [0.0] シミュレーション分岐 (SB) により, 大規模問題に対してほぼ100%の成功確率が得られることを示す。
2,000変数問題に対する解法時間は、GSBベースのマシンにより10ミリ秒に短縮される。
非線形制御強度を変化させるGSBのカオスを調べたところ、成功確率の劇的な増加はカオスの端近くで起こることがわかった。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:31:57 GMT)
Gradient Boosting Decision Trees on Medical Diagnosis over Tabular Data [0.0] アンサンブル法は、医学的意思決定プロセスの成功の観点から、強力な代替手段を提供する。
本研究では,医学分類作業におけるアンサンブル手法,特にGBDTアルゴリズムの利点について検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:33:24 GMT)
Generation of Quantum Entanglement in Autonomous Thermal Machines: Effects of Non-Markovianity, Hilbert Space Structure, and Quantum Coherence [0.0] 本稿では,量子自律型熱機械と相互作用する外部量子系における絡み合いの発生に関する理論的研究を行う。
仮想温度とエネルギー保存遷移によって支配される2つの熱力学サイクル、すなわちAとBを定義する。
エンタングルメントは、非マルコフ力学と強いエンタングルメントの存在によって支えられるサイクルAでのみ生成されることを示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:16:10 GMT)
Generation and certification of pure phase entangled light [0.0] 空間的絡み合いとして知られる位置運動変数の絡み合いを示す双光子系は、量子光学において最も興味深くよく研究された現象である。
それらの顕著な部分集合は位相絡み状態であり、そこでは波動関数の空間的位相における相関によって絡み合いが純粋に現れる。
我々は、純粋位相絡み(Pure' phase entanglement)と呼ばれる一意の位相絡み(phase entanglement)を理論的に実験的に検討した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:14:08 GMT)
Generalized Uncertainty Relation Between an Observable and Its Derivative [0.0] 観測者の不確かさとその時間微分の積は、可観測者とその微分の間の可換作用素の半分で有界であることを示す。
本研究は, 量子力学の理解を深め, 測定精度に時間依存的相互作用が与える影響について考察した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:51:05 GMT)
From Prediction to Simulation: AlphaFold 3 as a Differentiable Framework for Structural Biology [0.0] AlphaFold 3は、計算生物学における変革的な進歩を表す。
AlphaFold 3はタンパク質の折りたたみ予測を微分可能なプロセスとすることで、深層学習と物理に基づく分子シミュレーションを統合するためのフレームワークとして機能する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:49:28 GMT)
Finite temperature single-particle Green's function in the Lieb-Liniger model [0.0] 我々は, 反発型リーブ・ライニガーモデルにおける有限温度単一粒子グリーン関数の表現を数値的に評価した。
これにより、全温度と相互作用のスペクトル関数と、一般化されたギブスアンサンブルを決定できる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:25:34 GMT)
Filter-enhanced adiabatic quantum computing on a digital quantum processor [0.0] 本稿では,ノイズの存在下で量子ハードウェア上に基底状態フィルタを実装する戦略について述べる。
断熱的に準備された入力状態は、フィルタの成功確率を高め、回路深さの要求を低減させる。
量子スピンモデルにおける基底状態の精度の大幅な向上を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:32:42 GMT)
Feature-Refined Unsupervised Model for Loanword Detection [0.0] 本稿では,ある言語から別の言語に借用された単語を抽出する,教師なしの手法を提案する。
我々のモデルは、ネイティブと借用語の両方を処理するために、言語内部の情報にのみ依存する。
Indo-Europeanの標準言語6言語からのデータセットから借用語を分離する作業について,本手法の評価を行った。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:42:57 GMT)
Fault Detection in New Wind Turbines with Limited Data by Generative Transfer Learning [0.0] 本研究では,1つの風力タービンからのSCADAサンプルを,風力タービンのSCADAデータに代表的訓練データと類似した訓練データを持たせるための,新しい生成的深層移動学習手法を提案する。
その結果, 風力タービンの故障検出精度は有意に向上した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:00:29 GMT)
FastTracker: Real-Time and Accurate Visual Tracking [0.0] 本稿では,複数のオブジェクトタイプを扱える汎用的な追跡フレームワークを提案する。
提案手法は,(1)密閉物体の識別を向上する隠蔽認識再識別機構,(2)道路構造認識トラックレット改質戦略の2つの重要な要素を組み込んだ。
大規模な実験結果から,提案手法は新たに導入されたデータセットといくつかの公開ベンチマークの両方で堅牢な性能を実現することが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:26:54 GMT)
Exploring null-entropy events: What do we learn when nothing happens? [0.0] ゆらぎ定理は、ミクロスケールの熱力学過程が時々負のエントロピー生成をもたらすことを証明している。
マイクロスケールでは、エントロピーが全く発生しないプロセスという別の可能性がさらに高くなる。
熱力学電流のゆらぎに対する零エントロピー事象によって課される制約について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:03:53 GMT)
Evolutionary Automata and Deep Evolutionary Computation [0.0] 進化的オートマトン(英: Evolution Automaticon)とは、進化的計算を無限世代で行う自動機械である。
これはまた、環境との対話的なフィードバックによって自己進化する自然進化の力のヒントを与える。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:56:58 GMT)
Evaluating the Quality of the Quantified Uncertainty for (Re)Calibration of Data-Driven Regression Models [0.0] 安全クリティカルなアプリケーションでは、データ駆動モデルは正確で、信頼性の高い不確実性推定を提供する必要がある。
回帰において、様々なキャリブレーション指標と再校正手法が出現している。
ほとんどのリカバリ手法は、測定基準の小さな部分だけを用いて評価されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:59:03 GMT)
Evaluating Citizen Satisfaction with Saudi Arabia's E-Government Services: A Standards-Based, Theory-Informed Approach [0.0] 本研究は,サウジアラビアのE政府サービスに対する市民の満足度を質の高い利用枠組みを通じて調査する。
満足度は、全体的な満足度、特徴満足度、信頼度、感情的エンゲージメントの4つの側面で評価された。
この調査結果は、サウジアラビアのe政府開発における世界トップクラスのランキングと整合して、ユーザビリティと信頼に関する満足度が一貫して高いことを示している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:29:26 GMT)
Entanglement Detection with Quantum-inspired Kernels and SVMs [0.0] 本研究では,サポートベクトルマシン(SVM)に基づく量子絡み検出のための機械学習手法を提案する。
正部分転位基準 (PPT) を回避するために, 分離可能な状態, 絡み合った状態, 絡み合った状態を区別する分類法を開発した。
その結果,従来の絡み検出手法の強力な補完として機械学習が確立された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:27:03 GMT)
Enhancing material behavior discovery using embedding-oriented Physically-Guided Neural Networks with Internal Variables [0.0] 内部変数を持つ物理的ガイド付きニューラルネットワークは、トレーニングや内部状態関係の解明に可観測データのみを使用するSciMLツールである。
それらの可能性にもかかわらず、これらのモデルは、細粒度空間場や時間進化システムのような高次元データに適用する場合、スケーラビリティの課題に直面している。
本稿では,これらのスケーラビリティの限界に対処するPGNNIVフレームワークの改良について,低次モデリング手法を用いて提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:18:54 GMT)
Enhanced Drift-Aware Computer Vision Architecture for Autonomous Driving [0.0] 本研究では,道路環境から数千もの合成画像データを用いて学習し,未知の漂流環境におけるロバスト性を向上させるハイブリッドコンピュータビジョンアーキテクチャを提案する。
このシステムは,ドリフト拡大道路画像を用いた場合,連続して機能し,検出精度を90%以上向上した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:43:29 GMT)
Engineering a Digital Twin for the Monitoring and Control of Beer Fermentation Sampling [0.0] 本稿では,ビール発酵監視のための安全クリティカルデジタルツイン(DT)の開発経験報告を紹介する。
主な発見は、安全優先設計の重要性、シミュレーション駆動開発、そして進歩的な実装戦略である。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:01:28 GMT)
Emergence of Vorticity and Viscous Stress in Finite Scale Quantum Hydrodynamics [0.0] マドルング方程式は量子系の力学的な記述を提供する。
粗粒化法を適用して、量子流体のマクロな記述に到達させる。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:01:15 GMT)
Edge-Enhanced Vision Transformer Framework for Accurate AI-Generated Image Detection [0.0] 本稿では,視覚変換器(ViT)と新たなエッジベース画像処理モジュールを組み合わせたハイブリッド検出フレームワークを提案する。
提案手法は,自動コンテンツ検証とデジタル法医学における実世界の応用に非常に適している。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:30:56 GMT)
Dual-Frequency Absorption Spectroscopy in Laser-Cooled Rubidium Atoms: Theoretical Modeling and Experiment [0.0] レーザー冷却87Rbと85Rb原子を用いた二周波吸収分光法(DFAS)を実証した。
高コントラストのドップラーフリー共鳴が生成され、冷原子時計におけるレーザー安定化にDFASを用いることの適性が示唆された。
我々はルビジウムセルで発生する二重周波数スペクトルを正確にモデル化するためにモデルを拡張した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:56:08 GMT)
Driven inhomogeneous CFT as a theory in curved space-time [0.0] 演算子定式化を駆動不均質CFTとして提示する。
背景距離によって生成されるユニタリ進化は、ヴィラソロ量子回路のそれと一致する。
三次元重力下での駆動CFTのホログラフィック双対を導出する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:00:02 GMT)
Dispersion interaction of two graphene sheets [0.0] 力は、シート間の小さな距離と大きな距離で決定される。
短距離では、力は有限の魅力的なものである。
1eV以上の化学的ポテンシャルでは、最小値が観測されない。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:09:48 GMT)
Development of a Neural Network Model for Currency Detection to aid visually impaired people in Nigeria [0.0] 我々は3,468イメージのカスタムデータセットを構築し、SSDニューラルネットワークモデルのトレーニングに使用しました。
提案システムはナイジェリアの現金を正確に識別し、商業取引を合理化する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:27:27 GMT)
Destructive Interference induced constraints in Floquet systems [0.0] 我々は、駆動システムで実現可能な様々なタイプのヒルベルト空間フラグメンテーションを導入する。
我々のパラダイムは、駆動システムで実現可能な様々なタイプのヒルベルト空間の断片化を統一する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:00:26 GMT)
Designing across domains with declarative thinking: Insights from the 96-Eyes ptychographic imager project [0.0] 本稿では,デノボイメージングシステム設計における5世代問題定式化言語(5GL)の適用に関する実践者の考察を紹介する。
ハードウェア制約からライフサイエンスまで、プロジェクト要件が、さまざまなドメインステークホルダーからのミッションクリティカルなインプットを維持するために、マシン可読な問題ステートメントにどのようにフォーマル化できるかを説明します。
この宣言的アプローチは透明性を高め、設計のトレーサビリティを保証し、光学的、アルゴリズム的、ハードウェアアクセラレーションされた計算、ライフサイエンスチーム間でコストのかかるミスアライメントを最小限にする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:32:15 GMT)
Debian in the Research Software Ecosystem: A Bibliometric Analysis [0.0] 本研究の目的は,学術出版を通じてDebianシステムを調べることである。
調査データは公開リポジトリで公開され、人口統計と文献学のトレンドが報告される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:37:50 GMT)
Data Compression using Rank-1 Lattices for Parameter Estimation in Machine Learning [0.0] 平均二乗誤差と正規化バージョンは、教師付き機械学習における標準的な損失関数である。
広範データセットをランク1格子を用いてより小さなサイズに縮小するアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:49:04 GMT)
DTInsight: A Tool for Explicit, Interactive, and Continuous Digital Twin Reporting [0.0] DTInsightはDigital Twin(DT)システムのための継続的レポート作成ツールである。
DTInsightは、(a)DTのインタラクティブな概念的アーキテクチャ可視化、(b)オントロジデータに基づくDT特性の要約の生成、(c)これらのアウトプットをレポートページに統合する、という3つの重要な特徴を提供します。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:22:55 GMT)
Cryptographic Challenges: Masking Sensitive Data in Cyber Crimes through ASCII Art [0.0] 本研究は, ASCIIアートの特徴とその歴史的背景について考察した。
ASCIIアートは、その単純さと曖昧さにより、サイバー犯罪者に対する効果的なツールとして役立つことが示唆されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 16:54:01 GMT)
Correlation Enhanced Autonomous Quantum Battery Charging via Structured Reservoirs [0.0] 2つの量子ビットからなる構造型貯水池に結合した量子電池の充電力学について検討した。
非コヒーレントな初期状態とコヒーレントな初期状態の両方に対して、蓄えられたエネルギー、エルゴトロピー、電池の充電電力を解析する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 14:46:25 GMT)
Context-Aware Zero-Shot Anomaly Detection in Surveillance Using Contrastive and Predictive Spatiotemporal Modeling [0.0] この研究は、トレーニング中に異常な例に晒されることなく異常事象を識別する、文脈対応のゼロショット異常検出フレームワークを導入する。
提案したハイブリッドアーキテクチャは、TimeSformer、DPC、CLIPを組み合わせて、豊富な時空間特徴を抽出する。
コンテキストゲーティング機構は、シーン対応キューやグローバルビデオ機能による予測を調整することにより、意思決定をさらに強化する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:22:35 GMT)
Constrained Diffusion Models for Synthesizing Representative Power Flow Datasets [0.0] 電力システムの機械学習モデルのトレーニングには、高品質な電力フローデータセットが不可欠である。
セキュリティとプライバシーに関する懸念は、現実世界のデータへのアクセスを制限する。
本研究では,実世界の電力グリッドから合成電力フローデータセットを生成する拡散モデルを構築した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:22:45 GMT)
Consistent Opponent Modeling of Static Opponents in Imperfect-Information Games [0.0] 既存の対戦相手モデリング手法は、既知の先行分布から引き出された静的な相手に対しても、単純な望ましい性質を満足できないことを示す。
我々は,この特性を達成し,シーケンス形式ゲーム表現に基づく凸問題の解法により効率的に動作する新しいアルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:08:49 GMT)
Collinear Three-Photon Excitation of a Strongly Forbidden Optical Clock Transition [0.0] 弱磁場中における新しいコリニア3光子過程を用いて, ボソニック8.8$Srにおけるクロック遷移のコヒーレント励起を示す。
ボゾン同位体における核スピンの欠如は、磁場に対する感度の低下と光学格子光シフトをもたらす。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:18:53 GMT)
Collaborative Intelligence: Topic Modelling of Large Language Model use in Live Cybersecurity Operations [0.0] 本稿では,大規模言語モデル(LLM)を用いたセキュリティオペレーションセンター(SOC)のトピックモデリングについて述べる。
目標は、これらの専門家が自発的にこのツールを使う方法を理解することだ。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:02:13 GMT)
Citizen Centered Climate Intelligence: Operationalizing Open Tree Data for Urban Cooling and Eco-Routing in Indian Cities [0.0] この章では、参加型センシング、オープン分析、規範的都市計画ツールを通じて、環境インフラを再想像するスケーラブルで市民中心のフレームワークを提示します。
インド・プーンで応用されたこのフレームワークは,(1)AIセグメンテーションによって強化されたスマートフォンベースの計測ツールキットで樹高,天蓋径,幹径を抽出し,(2)衛星由来の地表面温度を用いて局所冷却を計算するパーセンタイルモデル,(3)木密度,種多様性,累積炭素捕獲に基づく静的環境品質スコアを用いて移動を誘導するエコルーティングエンジンの3つの相互接続モジュールから構成される。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 04:22:32 GMT)
Chiral Discrimination on Gate-Based Quantum Computers [0.0] 本稿では,ゲートベース量子プロセッサを用いたカイラル判別手法を提案する。
以上の結果から,本手法はキラル識別プロトコルの進歩に有効な基盤であることが示された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 22:48:48 GMT)
ChemKANs for Combustion Chemistry Modeling and Acceleration [0.0] ChemKANは、燃焼化学のためのモデル推論とシミュレーション加速のための新しいニューラルネットワークフレームワークである。
ケムカンの構造はカルモゴロフ・アーノルドネットワークの一般微分方程式(KAN-ODE)を、関連する力学および熱力学の法則を通じて情報の流れを知ることで強化する。
我々は、ChemKANsの頑健さを、最大15%の付加ノイズを含むスパースデータと、非常に大規模なネットワークパラメータ化にベンチマークする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 19:35:55 GMT)
Characterizing the Generalized Einstein-Podolsky-Rosen State and Extensions [0.0] アインシュタイン・ポドルスキーとローゼンは2つの粒子に対して運動量絡み状態を導入した。
一般化されたEPR状態はここで理論的に解析され、その絡み合いは定量化される。
非ガウス的絡み合いを示す別の状態が検討され、その絡み合いが定量化されている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 03:55:33 GMT)
CATformer: Contrastive Adversarial Transformer for Image Super-Resolution [0.0] 超解像度は、低解像度画像の品質を高めるための有望な技術である。
本研究では,拡散にインスパイアされた特徴改善と逆学習を統合した新しいニューラルネットワークであるCATformerを紹介する。
CATformerは、効率と視覚的画質の両方において、最近のトランスフォーマーベースおよび拡散インスパイアされた手法より優れている。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:30:18 GMT)
C60 fullerene as an on-demand single photon source at room temperature [0.0] ポリスチレンに埋もれた市販のchC60フラーレン分子を室温で信頼性の高い単一光子エミッタとして使用した。
これらの分子はオンデマンドの単光子発光を示し、蛍光寿命が短く、結果として高い発光速度を示す。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 09:25:51 GMT)
Bridging Clear and Adverse Driving Conditions [0.0] ドメイン適応パイプラインは、透明な天候の画像を霧、雨、雪、夜間の画像に変換する。
我々は、既存のDA GANを活用し、補助的な入力をサポートするように拡張し、シミュレーションと実画像の両方を活用する新しいトレーニングレシピを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:28:17 GMT)
Benchmarking Class Activation Map Methods for Explainable Brain Hemorrhage Classification on Hemorica Dataset [0.0] 本研究は脳出血の診断について,CAM(Class Activation Mapping)技術による説明可能性に着目して検討した。
9つの最先端CAMアルゴリズムを用いて,分類モデルから画素レベルのセグメンテーションと検出アノテーションを抽出するパイプラインを開発した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 06:16:32 GMT)
Batched Line Search Strategy for Navigating through Barren Plateaus in Quantum Circuit Training [0.0] 変分量子アルゴリズムは、短期デバイスにおける量子優位性を示すための有望な候補と見なされている。
本研究は,回路トレーニングにおけるバレンプラトー問題(BP)の悪影響を軽減するための新しい最適化手法を提案する。
21量子ビットと15000個のエンタングゲートからなる量子回路に最適化戦略を適用した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 10:09:46 GMT)
Automated, physics-guided, multi-parameter design optimization for superconducting quantum devices [0.0] 本稿では,超伝導回路の最適化を効率よく自動化する手法を提案する。
この手法の効率性は、ユーザ定義、物理インフォームド、非線形モデルから生じる。
オープンソースPythonパッケージQDesignrとして最適化手法の完全な実装を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:46:55 GMT)
An Unsupervised Deep XAI Framework for Localization of Concurrent Replay Attacks in Nuclear Reactor Signals [0.0] 次世代の先進的な原子炉は、サイズと出力の両方が小さくなると予想されている。
ネットワーク通信においては,不正攻撃に対するデータの整合性の確保がますます重要になっている。
本稿では,オートエンコーダとカスタマイズされたウィンドウSHAPアルゴリズムを組み合わせて,リアルタイムのリプレイ攻撃を完全に特徴付ける,教師なし説明可能なAIフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:56:04 GMT)
An 8- and 12-bit block AES cipher [0.0] 8ビットまたは12ビットブロック AES (Rijndael) 暗号は、Javaソースコードとともにここで文書化されている。
非常に珍しい、見つからない、あるいは説明が難しいため、Javaソースコードとともに、本当に小さな8ビットまたは12ビットのAES(Rijndael)暗号がここで文書化されています。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:54:49 GMT)
Ab initio study of anomalous temperature dependence of resistivity in V-Al alloys [0.0] V$_1-x$Al$_x$は高抵抗金属合金の代表例である。
ab initio法を用いて導電率を算出する。
この振る舞いに寄与する非ボルツマン寄与を同定し、温度と組成の関数として記述する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:44:54 GMT)
AQ-PCDSys: An Adaptive Quantized Planetary Crater Detection System for Autonomous Space Exploration [0.0] 本稿では,アダプティブ量子化惑星クレーター検出システム(AQ-PCDSys)を紹介する。
AQ-PCDSysは量子化ニューラルネットワーク(QNN)アーキテクチャを統合し、量子化認識トレーニング(QAT)を用いてトレーニングする
AMFモジュールは、光学画像(OI)とDEM(Digital Elevation Models)のデータを特徴レベルでインテリジェントに融合する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 13:44:00 GMT)
ANO : Faster is Better in Noisy Landscape [0.0] ノイズの多い環境で瞬間運動量を切り離す小説「Ano」を紹介します。
アノログは、強化学習のようなノイズの多い非定常的な体制においてかなりの利益をもたらす。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:51:00 GMT)
AI Data Centers Need Pioneers to Deliver Scalable Power via Offgrid AI [0.0] 私たちの時代は、スケーラブルなコンピューティング革命の鍵となる方法で、スケーラブルなエネルギーの新しい革命を必要としています。
オフグリッドAIアプローチは、主に再生可能エネルギーの生成とストレージを組み合わせて、オフグリッドからAIデータセンタに電力を供給する。
オフグリッドAIアプローチは、コンセプトから大規模デプロイメントへ素早く移行するために、システム開発者とAIデータセンタオペレータの両方のパイオニアが必要です。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 17:13:30 GMT)
A Unsupervised Framework for Identifying Diverse Quantum Phase Transitions Using Classical Shadow Tomography [0.0] 従来の影表現と教師なし主成分分析(PCA)を統合した一般的な機械学習手法を提供する。
提案手法は,データ中の隠れた統計的パターンを効果的に解析し,その変動を通じて量子臨界性の異なるシグネチャを抽出する。
本手法は, 1次元XZXクラスタIsingモデル, 1次元結合交互XXZモデル, 2次元横フィールドIsingモデル, 2D Kitaevハニカムモデルなど,様々なスピン-1/2系にまたがってベンチマークを行う。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 05:53:56 GMT)
A Scalable Heuristic for Molecular Docking on Neutral-Atom Quantum Processors [0.0] 本稿では,大規模なドッキング問題の解法として,新しい分割・コンカレントアルゴリズムを用いる方法を示す。
我々の研究は、短期量子ハードウェアにおける大規模なドッキング問題に取り組むための道を開いた。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 15:54:52 GMT)
A Praxis of Influence: Framing the Observation and Measurement of Information Power [0.0] 我々は、情報パワーが放送の説得から、認知効果と計算配信を融合させるプラットフォーム化されたデータ駆動オペレーションへと移行したと論じる。
本論文は,(1)研究に必要な最小変数と機器を指定する3進解析フレームワーク,(2)共通目的をマッピングする2つの横断歩道,(3)目標,運用,機械(自動化とAI)をひとつの空間に統合する情報影響力のためのマッカンバ型立方体,の3つの要素をコントリビュートする。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 20:46:55 GMT)
A Mixture of Exemplars Approach for Efficient Out-of-Distribution Detection with Foundation Models [0.0] 本稿では, 高品質で凍結, 事前訓練された基礎モデルを用いて, バックボーンをトレーニングする利点を最大化するためのOOD検出への効率的なアプローチを提案する。
MoLARは、OODサンプルの類似性と、データセットを表すために選択された小さなイメージの例を比較するだけで、強力なOOD検出性能を提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 07:58:06 GMT)
A Group-Theoretic Perspective on the PPT and Realignment Entanglement Criteria [0.0] 絡み合いは、セキュアな通信プロトコルや量子コンピューティングを含む多くの量子技術において重要な特徴である。
本研究では,ベル対角状態のPPTおよび配向基準を群理論の観点から分析する。
その結果、ベル対角状態の群構造は、これらの2つの絡み合い検出基準を解析し、計算するための明確な枠組みを提供することを示した。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 18:32:53 GMT)
A Feminist Account of Intersectional Algorithmic Fairness [0.0] 我々は、交差フェミニスト理論からの洞察により、グリーンの実体的アルゴリズムフェアネスの概念を拡張した実体的区間的アルゴリズムフェアネスを提案する。
我々は,アルゴリズムシステムの設計,評価,展開を指導するために,ROOF方法論に10のデシラタを導入している。
計算科学と社会科学の視点をブリッジすることで、より公平で包括的で文脈に敏感な交叉アルゴリズムの実践のための実用的なガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 12:09:04 GMT)
A Defect Classification Framework for AI-Based Software Systems (AI-ODC) [0.0] 本稿では,Orthogonal Defect Classification(ODC)パラダイムにヒントを得たフレームワークを提案する。
このフレームワークは、AIシステムのデータ、学習、思考の側面に対応するように適応された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 11:15:31 GMT)
A Deep Learning Application for Psoriasis Detection [0.0] ResNet50、Inception v3、VGG19の3つの畳み込みニューラルネットワークモデルを比較した。
以上より, Psoriasis の診断を支援する手段としては, モデルインセプション v3 が有用であることが示唆された。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 21:56:24 GMT)
$su(d)$-squeezing and many-body entanglement geometry in finite-dimensional systems [0.0] 良く知られたスピンスクイーズの不等式を一般化し、集合$N$- Particle $su(d)$演算子のスクイーズと多粒子系の多体絡み合い幾何の関係について検討する。
論文参考訳(メタデータ) (Mon, 25 Aug 2025 08:20:21 GMT)