International Scientific Report on the Safety of Advanced AI (Interim Report) [178.0] この報告書は、AIの安全性に関する第1回国際科学報告書の暫定的な発表である。
このレポートには、30カ国、EU、国連から指名された国際専門家諮問委員会を含む、75人のAI専門家の多種多様なグループが貢献した。
最後のレポートはarXiv:2501.17805で公開されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:34:12 GMT)
OLMoTrace: Tracing Language Model Outputs Back to Trillions of Training Tokens [119.6] OLMoTraceは、言語モデルのアウトプットを、完全にマルチトリルのトレーニングデータにリアルタイムでトレースする。
OLMoTraceは、トレーニングテキストコーパス内の言語モデル出力のセグメントとドキュメントの冗長な一致を見つけ、表示する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:59:35 GMT)
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography [98.3] 本稿では,写真監督の専門知識にインスパイアされた自己回帰モデルを導入し,芸術的かつ表現的なカメラトラジェクトリを生成する。
包括的で多様なデータベースのおかげで、高品質でコンテキスト対応のカメラムーブメント生成のための自動回帰デコーダのみのトランスフォーマーをトレーニングします。
実験により、既存の手法と比較して、GenDoPはより良い制御性、よりきめ細かい軌道調整、より高い運動安定性を提供することが示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:56:01 GMT)
Measuring the Discrepancy between 3D Geometric Models using Directional Distance Fields [98.2] 本稿では,DirDistを提案する。DirDistは3次元幾何データに対して,効率的で効果的で,頑健で,微分可能な距離測定法である。
一般的な距離計量として、DirDistは3次元幾何学モデリングの分野を前進させる可能性がある。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:29:49 GMT)
Benchmarking Multimodal CoT Reward Model Stepwise by Visual Program [96.8] ステップレベルの多次元Chain-of-Thought(CoT)報酬モデルを自動的に学習する新しい手法であるSVIPを提案する。
視覚的なタスクを解決するためのコードを生成し、コードブロックの分析をトレーニングサンプルとしてCoTステップの評価に変換する。
SVIP-Rewardは、トレーニングや推論時間スケーリングにおけるMLLMのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:09:40 GMT)
FamilyTool: A Multi-hop Personalized Tool Use Benchmark [94.1] ファミリーベースナレッジグラフ(KG)に基づく新しいベンチマークであるFamilyToolを紹介する。
FamilyToolは1から3つのリレーショナルホップにまたがるクエリを伴う大規模言語モデルに挑戦する。
実験により、最先端のLCMにおいて大きな性能差が示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:42:36 GMT)
LLM-A*: Large Language Model Enhanced Incremental Heuristic Search on Path Planning [92.0] 経路計画はロボット工学と自律航法における基本的な科学的問題である。
A*やその変種のような伝統的なアルゴリズムは、パスの妥当性を保証することができるが、状態空間が大きくなるにつれて、計算とメモリの非効率が著しく低下する。
本稿では, A* の正確なパスフィニング能力と LLM のグローバルな推論能力とを相乗的に組み合わせた LLM ベースの経路計画法を提案する。
このハイブリッドアプローチは、特に大規模シナリオにおいて、パス妥当性の完全性を維持しながら、時間と空間の複雑さの観点からパスフィニング効率を向上させることを目的としている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:34:52 GMT)
AuroraCap: Efficient, Performant Video Detailed Captioning and a New Benchmark [89.7] 大規模なマルチモーダルモデルに基づくビデオキャプタであるAuroraCapを提案する。
トークンマージ戦略を実装し、入力されたビジュアルトークンの数を減らす。
AuroraCapは、様々なビデオおよび画像キャプションベンチマークで優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:24:14 GMT)
DeciMamba: Exploring the Length Extrapolation Potential of Mamba [89.1] 本研究では,マンバに特化して設計された文脈拡張手法であるDeciMambaを紹介する。
実世界の長距離NLPタスクに対する実験では、DeciMambaはトレーニング中に見られるものよりも、コンテキスト長に格段に長く当てはまることが示されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:43:46 GMT)
Unsolvable Problem Detection: Robust Understanding Evaluation for Large Multimodal Models [84.8] Unsolvable Problem Detection (UPD) は,大規模マルチモーダルモデル(LMM)の頑健な理解能力を評価するための新しいタスクである。
UPDは、多票質問応答の解決不可能な問題に遭遇する際のLMMの回答を抑える能力を評価する。
実験の結果,既存のベンチマークで十分な性能を示すほとんどのLMMでも,MM-UPDとはかなり苦労していることがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:13:27 GMT)
RAGME: Retrieval Augmented Video Generation for Enhanced Motion Realism [73.4] 生成ビデオにおける動きのリアリズムを改善するための枠組みを提案する。
生成フェーズにおける検索機構の導入を提唱する。
私たちのパイプラインは、どんなテキスト間拡散モデルにも適用できるように設計されています。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:14:05 GMT)
SIGMAN:Scaling 3D Human Gaussian Generation with Millions of Assets [72.3] 本稿では,3次元デジタル化のための潜在空間生成パラダイムを提案する。
我々は,不適切な低次元から高次元のマッピング問題を学習可能な分布シフトに変換する。
我々は、HGS-1Mデータセットを構築するために、合成データと組み合わせた多視点最適化アプローチを採用する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:38:18 GMT)
Exploring the Impact of Personality Traits on Conversational Recommender Systems: A Simulation with Large Language Models [70.2] 本稿では,対話型レコメンダシステム(CRS)のためのパーソナリティを考慮したユーザシミュレーションを提案する。
ユーザエージェントはカスタマイズ可能な性格特性と嗜好を誘導し、システムエージェントはCRS内の現実的な相互作用をシミュレートする説得能力を有する。
実験により,現在最先端のLCMは,特定の性格特性に適合した多様なユーザ応答を効果的に生成できることが示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:21:17 GMT)
Bridging Queries and Tables through Entities in Table Retrieval [70.1] エンティティは、テキスト検索の文脈でよく研究されているが、テーブル検索におけるその応用についての研究は、顕著に欠如している。
本稿では、実体表現に基づく相互作用パラダイムを設計し、エンティティ強化トレーニングフレームワークを提案する。
提案するフレームワークはプラグアンドプレイでフレキシブルで,既存のテーブルレトリバーのトレーニングプロセスに統合しやすくする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:16:33 GMT)
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation [69.8] オープンエンドの質問を自動的にマルチ選択フォーマットに変換するエージェントフレームワークであるAutoを紹介します。
我々の実験は、オートが人間と同じような、あるいは低い精度で、複数選択の質問を訂正し、挑戦できることを実証した。
我々はVMCBench上で33の最先端ビジョン言語モデル(VLM)を包括的に評価し、スケーラブルで一貫した再現可能なVLM評価のための新しい標準を設定した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:25:07 GMT)
Dolphin: Moving Towards Closed-loop Auto-research through Thinking, Practice, and Feedback [69.6] ドルフィンは科学研究の自動化レベルを高めるための枠組みである。
ドルフィンは最初、以前の実験からのフィードバックに基づいて新しいアイデアを生み出した。
Dolphinは各アイデアの結果を自動的に分析し、その結果を次のアイデア生成ラウンドに戻す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:27:02 GMT)
The Essence of Contextual Understanding in Theory of Mind: A Study on Question Answering with Story Characters [67.6] 理論・オブ・ミンド(ToM)は、人間が他者の精神状態を理解し解釈することを可能にする。
本稿では,ToMにおける個人的背景に関する包括的文脈理解の重要性を検証する。
本稿では,古典小説の登場人物をベースとした1,035ToM質問からなるCharToMベンチマークを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:36:10 GMT)
Caption Anything in Video: Fine-grained Object-centric Captioning via Spatiotemporal Multimodal Prompting [60.6] CAT-V(Caption AnyThing in Video)は、オブジェクト中心のビデオキャプションを微粒化するためのトレーニング不要のフレームワークである。
Cat-Vは3つの重要なコンポーネントを統合している: SAMIに基づくフレーム間の正確なオブジェクトセグメンテーションのためのセグメンタ、TRACE-UniVLを動力とするテンポラルアナライザ、Intern-2.5を使用するキャピタ。
我々のフレームワークは、追加のトレーニングデータを必要とすることなく、オブジェクトの属性、アクション、ステータス、インタラクション、環境コンテキストの詳細な時間的記述を生成します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:30:44 GMT)
EffOWT: Transfer Visual Language Models to Open-World Tracking Efficiently and Effectively [60.5] Open-World Tracking (OWT) は,任意のカテゴリのすべてのオブジェクトを追跡することを目的としている。
EffOWTは未知のカテゴリの追跡基準OWTAで5.5%の絶対的なゲインを達成するが、完全な微調整に比べてパラメータの1.3%しか更新しない。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:00:05 GMT)
MemoRAG: Boosting Long Context Processing with Global Memory-Enhanced Retrieval Augmentation [60.0] Retrieval-Augmented Generation (RAG)は、この問題に対処するための有望な戦略と考えられている。
我々は,グローバルメモリ拡張検索による新しいRAGフレームワークであるMemoRAGを提案する。
MemoRAGは、様々な長期コンテキスト評価タスクにおいて優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:09:37 GMT)
Probability Density Geodesics in Image Diffusion Latent Space [58.0] 測地拡散は潜在空間で計算可能であることを示す。
我々は、事前訓練された画像拡散空間における測地線とビデオクリップの密接な関係を分析する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:28:53 GMT)
GWQ: Gradient-Aware Weight Quantization for Large Language Models [57.4] 大規模言語モデル(LLM)は、複雑な言語タスクの解決における優れたパフォーマンスを示している。
LLMを低ビットに圧縮することで、リソース制約のあるデバイスにデプロイできる。
低ビット重み量子化のための最初の量子化手法である勾配対応重み量子化(GWQ)を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:09:11 GMT)
IAAO: Interactive Affordance Learning for Articulated Objects in 3D Environments [56.9] IAAOは知的エージェントのための明示的な3Dモデルを構築するフレームワークで,対話を通して環境内の明瞭な物体の理解を得る。
マスク特徴とビュー一貫性ラベルを多視点画像から抽出し,まず3次元ガウススティング(3DGS)を用いて各オブジェクト状態の階層的特徴とラベルフィールドを構築する。
次に、3Dガウスプリミティブ上でオブジェクトと部分レベルのクエリを実行し、静的および明瞭な要素を識別し、大域的な変換と局所的な調音パラメータをアベイランスとともに推定する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:36:48 GMT)
Countering threats to national security posed by AI systems through an incident regime [55.2] 我々は、AIシステムからの潜在的な国家安全保障脅威に対抗することを目的とした、法的に義務付けられたポストデプロイAIインシデントシステムを提案する。
第1フェーズは,‘AIインシデント’として数えられるような,新たな運用方法を中心に展開されている。
第2フェーズと第3フェーズでは、AIプロバイダが政府機関にインシデントを通知し、政府機関がAIプロバイダのセキュリティおよび安全手順の修正に関与するべきだ、と説明されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:36:30 GMT)
A Meaningful Perturbation Metric for Evaluating Explainability Methods [55.1] 本稿では,画像生成モデルを用いて標的摂動を行う新しい手法を提案する。
具体的には,画像の忠実さを保ちながら,入力画像の高関連画素のみを塗布し,モデルの予測を変更することに焦点を当てる。
これは、しばしばアウト・オブ・ディストリビューションの修正を生み出し、信頼できない結果をもたらす既存のアプローチとは対照的である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:46:41 GMT)
Tensor Product Attention Is All You Need [54.4] プロダクトアテンション(TPA)は、テンソル分解を使用してクエリ、キー、値をコンパクトに表現する新しいアテンションメカニズムである。
TPAは、メモリ効率とともに改善されたモデル品質を実現する。
本稿では,シーケンスモデリングのための新しいモデルアーキテクチャであるProducT ATTion Transformer (T6)を紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 20:51:08 GMT)
Digital Gene: Learning about the Physical World through Analytic Concepts [54.2] AIシステムは、物理的な世界を理解し、相互作用することに関して、依然として苦戦している。
本研究は分析概念の考え方を紹介する。
マシンインテリジェンスは、物理的な世界を理解し、推論し、相互作用するためのポータルを提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:35:12 GMT)
A Survey on Personalized and Pluralistic Preference Alignment in Large Language Models [52.9] 本稿では,大規模言語モデルに対するパーソナライズされたアライメントとモデリングに関する研究について述べる。
本稿では,学習時間,推論時間,ユーザモデリングに基づく手法など,嗜好アライメント手法の分類を導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:39:58 GMT)
Methods with Local Steps and Random Reshuffling for Generally Smooth Non-Convex Federated Optimization [52.6] 非マシーン学習問題は通常、標準的な滑らかさの仮定に従わない。
本稿では,ローカルステップ,クライアントの部分的参加,ランダムランダムリシャッフルによる新しい手法の提案と解析を行う。
我々の理論は、標準的な滑らかな問題に対する既知の結果と一致している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:46:26 GMT)
Generalized Semantic Contrastive Learning via Embedding Side Information for Few-Shot Object Detection [52.5] マイクロショットオブジェクト検出(FSOD)の目的は、少数のトレーニングサンプルで新しいオブジェクトを検出することである。
本稿では,特徴空間とサンプル視点から得られる負の影響を緩和する側面情報を紹介する。
我々のモデルは従来の最先端手法よりも優れており、ほとんどのショット/スプリットにおけるFSODの能力は大幅に向上している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:24:05 GMT)
FedMerge: Federated Personalization via Model Merging [51.1] 1つのグローバルモデルでは、非IIDタスクや分散を多くのクライアントに提供するには不十分かもしれない。
我々は、複数のグローバルモデルをマージするだけで、クライアントごとにパーソナライズされたモデルを作成することができる新しいFedMergeのアプローチを提案する。
我々はFedMergeを、さまざまなタスクとデータタイプを持つ異なるドメインに適用した3つの異なる非IID設定で評価する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:44:14 GMT)
Optimizing LLM Queries in Relational Data Analytics Workloads [51.0] バッチデータ分析は、Large Language Models(LLMs)の急成長するアプリケーションである
LLMは、分類、エンティティ抽出、翻訳などの幅広い自然言語タスクを、大規模なデータセット上で実行可能にする。
本稿では,LLMコールによるリレーショナルデータ解析処理のコストを大幅に削減できる新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:23:39 GMT)
CAReDiO: Cultural Alignment of LLM via Representativeness and Distinctiveness Guided Data Optimization [50.9] 大規模言語モデル(LLM)は、より深く様々な地域における人間の生活に統合される。
既存のアプローチは、文化固有のコーパスを微調整することで、文化的に整合したLCMを開発する。
本稿では,新しい文化データ構築フレームワークであるCAReDiOを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:40:13 GMT)
PosterMaker: Towards High-Quality Product Poster Generation with Accurate Text Rendering [50.8] テーマ、シーン、テキストを統合したプロダクトポスターは、顧客を引き付けるための重要なプロモーションツールである。
主な課題はテキストを正確にレンダリングすることであり、特に1万文字以上を含む中国語のような複雑な書記システムではそうである。
テキストレンダリング精度が90%を超えるTextRenderNetを開発した。
TextRenderNetとSceneGenNetをベースに、エンドツーエンド生成フレームワークであるPosterMakerを紹介します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:13:08 GMT)
FlashDepth: Real-time Streaming Video Depth Estimation at 2K Resolution [50.6] ビデオ深度推定モデルは,(1)フレーム間の精度,(2)高解像度深度マップの作成,(3)リアルタイムストリーミングをサポートする。
提案するFlashDepthは,2044x1148ストリーミングビデオの深さ推定を24FPSで行うことで,3つの要件をすべて満たす手法である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:59:31 GMT)
SafeMLRM: Demystifying Safety in Multi-modal Large Reasoning Models [50.3] 推論能力の獲得は、引き継がれた安全アライメントを壊滅的に劣化させる。
特定のシナリオは、25倍の攻撃率を被る。
MLRMは、厳密な推論と問合せの安全結合にもかかわらず、初期段階の自己補正を示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:53:23 GMT)
Are Molecules Magical? Non-Stabilizerness in Molecular Bonding [50.2] 分離原子と平衡状態の分子は、量子計算複雑性の観点からは単純であると推定される。
化学結合の形成過程は電子基底状態の量子的複雑さの顕著な増大を伴うことを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:14:27 GMT)
Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes [50.2] メッシュサリエンシは、自然に視覚的注意を引き付ける領域を特定して強調することにより、3D視覚の適応性を高める。
状態空間モデル (SSM) に基づく統合唾液度予測モデルであるメッシュ・マンバを導入する。
Mesh Mambaは、トポロジカルフレームワークにテクスチャ機能をシームレスに組み込んだまま、メッシュの幾何学的構造を効果的に分析する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:35:39 GMT)
LogiDynamics: Unraveling the Dynamics of Logical Inference in Large Language Model Reasoning [49.6] 本稿では、類似推論のための制御された評価環境を導入することにより、探索的アプローチを採用する。
帰納的,帰納的,帰納的,帰納的な推論パイプラインの比較力学を解析する。
仮説選択や検証,洗練といった高度なパラダイムを考察し,論理的推論のスケールアップの可能性を明らかにする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:54:12 GMT)
Setup-Invariant Augmented Reality for Teaching by Demonstration with Surgical Robots [49.3] 本稿では,dV-STEARというオープンソースのシステムについて紹介する。
dV-STEARは腹腔鏡下手術の基本課題の初級成績を有意に改善した。
両課題とも,dV-STEARを用いた被験者では,手指使用のバランスが有意に改善し,フラストレーションの低下が報告された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:34:25 GMT)
Regret Bounds for Robust Online Decision Making [49.2] 構造化された観察による意思決定」を一般化する枠組みを提案する。
この枠組みでは、各モデルは各決定を結果に対する確率分布の凸集合と関連付ける。
次に、この枠組みに対する後悔の束縛の理論を導出します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:25:00 GMT)
Lugha-Llama: Adapting Large Language Models for African Languages [49.0] 大規模言語モデル(LLM)は、幅広い自然言語アプリケーションにおいて印象的な成果を上げている。
低リソースのアフリカ言語にLLMを適用する方法について検討する。
アフリカの言語から得られたキュレートされたデータと高品質な英語の教育用テキストを組み合わせることで、これらの言語上でのモデルの性能を大幅に向上させる訓練ミックスが得られることがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:25:53 GMT)
Domain-Specific Pruning of Large Mixture-of-Experts Models with Few-shot Demonstrations [48.9] 大規模MOEモデルにおける領域の特殊化と専門的冗長性について検討する。
本稿では,最も関係のある専門家のみを識別・保持するための簡易で効果的な刈取フレームワークであるEASY-EPを提案する。
提案手法は,DeepSeek-R1を完全かつ半分のエキスパートで,同じメモリ予算で同等の性能と2.99タイムのスループットを達成できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:34:06 GMT)
RAISE: Reinforenced Adaptive Instruction Selection For Large Language Models [48.6] 本稿では,タスクオブジェクト駆動型命令選択フレームワークRAISEを提案する。
RAISEは命令の微調整プロセス全体を最適化に組み込んでいる。
モデルの性能改善に対する命令の期待される影響に基づいて,各ステップで命令を選択する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:17:52 GMT)
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills [48.1] SkillWeaverは、再利用可能なスキルをAPIとして自律的に合成することで、Webエージェントの自己改善を可能にするスキル中心のフレームワークです。
新しいウェブサイトが与えられると、エージェントは自律的にスキルを発見し、実践のために実行し、実践経験を堅牢なAPIに蒸留する。
WebArenaと実世界のWebサイトでの実験は、SkillWeaverの有効性を示し、それぞれ31.8%と39.8%の相対的な成功率の向上を達成した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:51:50 GMT)
VideoPainter: Any-length Video Inpainting and Editing with Plug-and-Play Context Control [47.3] ビデオのインペイントは、腐敗したビデオコンテンツを復元することを目的としている。
マスク付きビデオを処理するための新しいデュアルストリームパラダイムVideoPainterを提案する。
また,任意の長さの映像を描ける新しいターゲット領域ID再サンプリング手法も導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:05:33 GMT)
Neuron-level Balance between Stability and Plasticity in Deep Reinforcement Learning [47.0] 安定度と塑性度(NBSP)のニューロンレベルバランスについて検討する。
N BSPは特定のニューロンがタスク関連スキルに強く関係しているという観察から着想を得ている。
N BSPは、安定性と可塑性のバランスをとる既存のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:43:30 GMT)
TASTE: Text-Aligned Speech Tokenization and Embedding for Spoken Language Modeling [46.6] テキスト対応音声トークン化と埋め込み(TASTE)について紹介する。
TASTEは、音声トークンと対応するテキストの書き起こしをトークン化段階で整列させることにより、モダリティギャップに直接対処する手法である。
我々は広範囲な実験を行い、TASTEはトークン列の長さを劇的に減らしながら重要なパラ言語情報を保持することができることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:14:33 GMT)
Analogical Learning for Cross-Scenario Generalization: Framework and Application to Intelligent Localization [45.6] 本稿では、アナログ学習(AL)という新しい普遍的深層学習フレームワークを提案する。
ALはシナリオに関連する参照フレーム情報を暗黙的に検索する非常に効率的な方法を提供する。
セルネットワークにおけるインテリジェントな無線ローカライゼーションの典型的なマルチシナリオ学習問題にALを適用した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:36:52 GMT)
Data Fusion of Deep Learned Molecular Embeddings for Property Prediction [45.0] 我々はデータ融合技術を用いて、様々な単一タスクモデルの学習された分子組込みを組み合わせ、この組込みについてマルチタスクモデルを訓練した。
融合マルチタスクモデルはスパースデータセットの標準マルチタスクモデルより優れており、単一タスクモデルと比較してデータ制限特性の予測が拡張可能であることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:40:15 GMT)
No Trick, No Treat: Pursuits and Challenges Towards Simulation-free Training of Neural Samplers [41.9] サンプリング問題は,正規化定数までしか知られていない分布からサンプルを抽出することを目的としている。
近年、高次元データ分布を近似する生成モデリングのブレークスルーが、この問題に対するニューラルネットワークベースの手法の開発に大きな関心を喚起している。
本稿では,時間依存正規化フローの助けを借りてシミュレーション不要なトレーニングを可能にする,従来の手法のエレガントな修正を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:05:18 GMT)
KG-LLM-Bench: A Scalable Benchmark for Evaluating LLM Reasoning on Textualized Knowledge Graphs [40.0] 我々は5つの知識グラフ理解タスクにまたがるベンチマークであるKG-LLM-Benchを紹介する。
異なる符号化戦略が様々なベースモデルのパフォーマンスにどのように影響するかを評価する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:58:47 GMT)
Creation of Negatively Charged GeV and SnV centers in Nanodiamonds via Ion Implantation [39.9] 固体量子エミッタ、特にダイヤモンド中のグループIV空孔中心は、量子技術の研究の最前線にある。
イオン注入によるゲルマニウム・スズ空洞センターの創製について述べる。
我々はSnV$-$中心の共鳴励起と強コヒーレント駆動により高純度単一光子放出を実現する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:05:34 GMT)
Towards Reasoning Era: A Survey of Long Chain-of-Thought for Reasoning Large Language Models [39.8] ロングチェーン・オブ・ソート(Long CoT)特性は推論能力を高め、複雑な問題の解決を可能にする。
まず、Long CoTとShort CoTを区別し、現在の推論パラダイムを分類する新しい分類法を導入する。
次に,Long CoTの出現やオーバー思考,テストタイムスケーリングなど,これらの特徴について考察する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:20:18 GMT)
Demystifying Language Model Forgetting with Low-rank Example Associations [38.9] 大規模言語モデル(LLM)は、微調整時に上流データを忘れることに悩まされる。
我々は、言語モデリングや微調整後の命令チューニングの上流の例で発生する忘れを実証的に分析する。
経験的関連性に対して行列補完を伴う未知のタスクを微調整した場合,上流の例を忘れないように予測する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:23:19 GMT)
CORTEX-AVD: A Framework for CORner Case Testing and EXploration in Autonomous Vehicle Development [38.1] CARLA Simulator と Scenic を統合し,Corner Cases を自動生成するオープンソースフレームワークである CORTEX-AVD を紹介する。
距離、時間、速度、衝突確率などの変数を考慮に入れた多要素適合関数が組み込まれている。
実験の結果, CORTEX-AVD フレームワークは, 使用済みシミュレーションの割合を減らしながら, CC の発生率を著しく向上させることがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 20:04:21 GMT)
Atlas Gaussians Diffusion for 3D Generation [37.7] 我々は、フィードフォワードネイティブな3D生成のための新しい表現であるAtlas Gaussiansを紹介する。
我々は、UVに基づくサンプリングを導入し、十分に大きく、理論上は無限の3Dガウス点の生成を可能にする。
実験により,本手法は,フィードフォワードネイティブな3D世代における先行技術よりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:27:31 GMT)
Low-latency control system for feedback experiments with optical tweezer arrays [36.6] 我々は,光ツイーザの配列中の原子や分子の配置に関するフィードバック制御実験を行う,モジュラーでオープンソースなシステムを提案し,特徴付けする。
このシステムは、マザーボードと周辺カードを備えたモジュール式で費用対効果の高いコンピュータアーキテクチャを備えている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:09:35 GMT)
Towards Collaborative Autonomous Driving: Simulation Platform and End-to-End System [35.4] 自動運転車(V2X-AD)は、より安全な運転ソリューションを提供する大きな可能性を秘めている。
本稿では,協調自動運転のための総合シミュレーションプラットフォームであるV2Xverseを紹介する。
私たちは、新しいエンドツーエンドのコラボレーティブドライブシステムであるCoDrivingを紹介します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:58:54 GMT)
nnLandmark: A Self-Configuring Method for 3D Medical Landmark Detection [35.4] この研究は3D医療ランドマーク検出のための自己構成型ディープラーニングフレームワークであるnnLandmarkを紹介している。
nnLandmarkは手動のパラメータチューニングの必要性を排除し、アウト・オブ・ボックスのユーザビリティを提供する。
下顎臼歯部CTデータセット(MML)に1.5mmの放射平均誤差(MRE)、脳MRIデータセット(AFIDs)に1.2mmの解剖学的画像を含む2つの公的データセットにまたがる最先端の精度を実現する。
nnLandmarkは、3Dランドマーク検出のための信頼性の高いベースラインを確立し、解剖学的局在の研究を支援している
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:53:39 GMT)
SVTest: general purpose software for testing weakly random sources with exemplary application to seismic data analysis enabling quantum amplification [34.8] 量子デバイスは、ランダム性の弱いソースのプライバシーを増幅することができる。
このような弱い源の理論モデルの一つが、いわゆるサンサ・ヴァジラニ(SV)源である。
我々は,ソースのランダム性を特徴付けるパラメータを推定するソフトウェアを開発する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:58:34 GMT)
Defending LLM Watermarking Against Spoofing Attacks with Contrastive Representation Learning [34.8] ピギーバック攻撃は、元々の透かしを保ったままのヘイトスピーチに変換する透かしテキストの意味を悪意的に変更することができる。
そこで本稿では,元来の意味を保ちつつ,与えられた目標テキストに透かしを埋め込む意味認識型透かしアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 04:38:17 GMT)
Deep Learning for Cardiovascular Risk Assessment: Proxy Features from Carotid Sonography as Predictors of Arterial Damage [34.7] The VideoMAE Deep Learning model was adapt by finetuning for the domain of Ultra imaging。
このモデルは、Gutenberg Health Studyから得られた31,000以上の頸動脈ソノグラフィービデオからなるデータセットを使用して、トレーニングされ、テストされた。
われわれの機械学習モデルは、個人の心血管の健康に関する貴重な洞察を提供する視覚的特徴を効果的に捉えていることを実証する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:38:17 GMT)
Law of Vision Representation in MLLMs [34.6] マルチモーダル大言語モデル(MLLM)における「視覚表現の法」について述べる。
クロスモーダルアライメント, 視覚表現の対応, MLLM性能の組合せは強い相関関係を示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:55:21 GMT)
Sort-free Gaussian Splatting via Weighted Sum Rendering [33.9] 重み付き和とアルファブレンディングを近似した重み付きSum Renderingを提案し,ソートの必要性を排除した。
これは実装を単純化し、優れたパフォーマンスを提供し、ソートによって引き起こされる"ポーピング"アーティファクトを排除します。
この方法はモバイルデバイスのGPUで実装されテストされ、平均1.23時間で高速なレンダリングを実現した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:12:58 GMT)
A Cross-Domain Few-Shot Learning Method Based on Domain Knowledge Mapping [33.7] タスクベースの少数ショット学習パラダイムでは、異なるタスクが独立して同一に分散していると一般的に仮定される。
実世界のシナリオでは、数発の学習で遭遇する分布は、既存のデータの分布と大きく異なる可能性がある。
本稿ではドメイン知識マッピングに基づく新しいドメイン間数ショット学習手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:11:55 GMT)
OmniCaptioner: One Captioner to Rule Them All [33.5] 細かなテキスト記述を生成するための多目的視覚キャプションフレームワークを提案する。
低レベルのピクセル情報を意味的にリッチなテキスト表現に変換することで、われわれのフレームワークは視覚とテキストのモダリティのギャップを埋める。
OmniCaptionerの汎用性と適応性は、言語と視覚的モダリティのギャップを埋めるための新たな視点を提供することができると信じています。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:58:58 GMT)
Saliency-driven Dynamic Token Pruning for Large Language Models [32.9] 塩分駆動型動的トケンプルーニング(SDTP)
軽量なサリエンシ駆動予測モジュールは、各トークンの重要度をその隠れ状態で推定するように設計されている。
ランキングに基づく最適化手法を提案し,評価スコアと予測重要スコアのランキングばらつきを最小化する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:36:19 GMT)
NeedleInATable: Exploring Long-Context Capability of Large Language Models towards Long-Structured Tables [32.9] NeedleInATable (NIAT) は、各テーブルセルを"ニードル"として扱い、異なるクエリでターゲットセルを抽出するモデルを必要とする新しいタスクである。
本稿では,モデルの長期理解能力を高めるためのデータ合成手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:46:56 GMT)
FANeRV: Frequency Separation and Augmentation based Neural Representation for Video [32.4] ビデオのための周波数分離と拡張に基づくニューラル表現(FANeRV)を提案する。
このブロックは、離散ウェーブレット変換を用いて入力フレームを高周波数成分と低周波数成分に明示的に分離する。
最後に、特別に設計されたゲートネットワークは、これらの周波数成分を効果的に融合して最適な再構成を行う。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:19:35 GMT)
R2E-Gym: Procedural Environments and Hybrid Verifiers for Scaling Open-Weights SWE Agents [32.1] AgentGymは、現実世界のSWEエージェントを訓練するための、手続き的に計算された最大のジム環境である。
Syngen、合成データキュレーションのレシピ、ハイブリッドテストタイムスケーリングの2つの主要なコントリビューションによって実現されている。
提案手法は,SWE-Bench Verifiedベンチマークで51%を達成し,オープンウェイトSWEエージェントの新たな最先端性を反映した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:55:19 GMT)
To Backtrack or Not to Backtrack: When Sequential Search Limits Model Reasoning [31.2] バックトラックは、長いチェーン・オブ・シント(CoT)生成による逐次線形化探索を可能にすることによって、テスト時間計算を自然にスケールする。
シーケンシャル検索の普及にもかかわらず、並列サンプリングよりも優位性はよく分かっていない。
バックトラック機能を持つモデルはRL微調整の恩恵を受けるが,バックトラック機能を持たないモデルは限定的かつ混合的なゲインを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:12:49 GMT)
ClarityEthic: Explainable Moral Judgment Utilizing Contrastive Ethical Insights from Large Language Models [30.3] 我々は、LLMの推論能力と対照的な学習を活用して関連する社会的規範を明らかにする、textitEthicと呼ばれる新しい道徳的判断手法を導入する。
本手法は,道徳的判断課題における最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:38:44 GMT)
Toward Holistic Evaluation of Recommender Systems Powered by Generative Models [29.8] 生成モデル(Gen-RecSys)はオープンなコンテンツを生成する。
従来の精度測定では、事実の正確性、コンテンツの安全性、ユーザ意図との整合性を計測できません。
本稿では,シナリオベースの評価とマルチメトリックチェックの関連性を含む総合評価手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:08:16 GMT)
LVC: A Lightweight Compression Framework for Enhancing VLMs in Long Video Understanding [29.7] VLM(Vision-Language Models)は、多フレーム入力によってフレームレベルの理解能力を得る。
ビデオ大言語モデル(Video Large Language Models, Video-LLMs)は、視覚機能内の時間的関係をキャプチャするが、高品質のビデオテキストデータセットの不足によって制限される。
本稿では,クエリ・アテンション・ビデオ圧縮機構を備えた新しい手法である軽量ビデオ圧縮(LVC)を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:51:10 GMT)
FIORD: A Fisheye Indoor-Outdoor Dataset with LIDAR Ground Truth for 3D Scene Reconstruction and Benchmarking [29.6] 本研究では,シーン再構築作業に適した魚眼画像データセットを提案する。
2つの200度の魚眼レンズを使って、私たちのデータセットは5つの屋内と5つの屋外のシーンの完全な360度カバレッジを提供します。
それぞれのシーンには、SfM点雲と正確なLIDAR由来の高密度な点雲があり、幾何学的な地平線として使用できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:59:22 GMT)
PointNorm-Net: Self-Supervised Normal Prediction of 3D Point Clouds via Multi-Modal Distribution Estimation [29.6] PointNorm-Netは、この課題に対処する最初の自己教師型ディープラーニングフレームワークである。
提案手法は,3つの実世界のデータセットにまたがって,最先端の従来型および深層学習手法より優れた一般化と性能を実現する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:21:48 GMT)
A Sober Look at Progress in Language Model Reasoning: Pitfalls and Paths to Reproducibility [29.4] Reasoningは、言語モデル(LM)の次の主要フロンティアとして登場した。
我々は総合的な実証的研究を行い、現在の数学的推論ベンチマークは微妙な実装選択に対して非常に敏感であることがわかった。
本稿では,ベストプラクティスと報告基準を明確に定義した標準化された評価フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:58:17 GMT)
MedSegFactory: Text-Guided Generation of Medical Image-Mask Pairs [29.4] MedSegFactoryは、モダリティとタスクをまたいだペア化された医療画像とセグメンテーションマスクを生成する汎用的なフレームワークである。
既存のセグメンテーションツールを強化するためにイメージマスクペアを提供する、無制限のデータリポジトリとして機能することを目指している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:56:05 GMT)
SEE: Continual Fine-tuning with Sequential Ensemble of Experts [26.0] 大規模言語モデル(LLM)の継続的な微調整は破滅的な忘れ込みに悩まされる。
SEE(Sequential Ensemble of Experts)フレームワークを紹介します。
SEEは、追加のルータの必要性を排除し、各専門家がクエリを処理するかどうかを独立して決定できるようにする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:56:56 GMT)
Unifying Search and Recommendation: A Generative Paradigm Inspired by Information Theory [25.7] GenSRは検索とレコメンデーションを統合するための新しい生成パラダイムである。
本研究は,従来の差別的手法と比較して新しい生成パラダイムを導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:15:37 GMT)
HypoEval: Hypothesis-Guided Evaluation for Natural Language Generation [25.2] hypoEvalは、大規模言語モデル(LLM)のための仮説誘導評価フレームワークである
人間の評価は30点に過ぎず,HypoEvalはヒトのランク(スピアマンの相関)とヒトのスコア(ピアソンの相関)の両方に対応して最先端のパフォーマンスを達成する。
我々は、HypoEvalの堅牢性を評価するための系統的研究を行い、信頼性と解釈可能な自動評価フレームワークとしての有効性を強調した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:00:01 GMT)
MonoPlace3D: Learning 3D-Aware Object Placement for 3D Monocular Detection [24.6] 現在のモノクラー3D検出器は、現実世界のデータセットの多様性とスケールに制限されている。
物体の位置や位置は、有効な3次元単分子検出器の訓練に必要不可欠であることを示す。
現実的な拡張を実現するために,3Dシーンコンテンツを考慮した新しいシステムであるMonoPlace3Dを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:47:48 GMT)
PiSSA: Principal Singular Values and Singular Vectors Adaptation of Large Language Models [23.9] 主特異値と特異ベクトル適応(PiSSA)を導入する。
PiSSAはLoRAと同じアーキテクチャを共有しているが、アダプタ行列を$A$と$B$で初期化し、元の行列の主成分を$W$とし、残りのコンポーネントをmathbbRm times n$の残留行列に配置する。
LoRAと比較すると、PiSSAは主コンポーネントを更新し、"残留"部分を凍結することで、より高速な収束と性能の向上を実現している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:54:20 GMT)
Socrates or Smartypants: Testing Logic Reasoning Capabilities of Large Language Models with Logic Programming-based Test Oracles [23.6] SmartyPatは、難解で自然に表現され、体系的にラベル付けされたベンチマークであり、微妙な論理的な誤りを含む現実世界の高品質なRedditの投稿に由来する。
手動データ収集とラベル付けの限界に対処するため,我々はSmartyPatを紹介した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:54:03 GMT)
Flexible Graph Similarity Computation With A Proactive Optimization Strategy [22.2] グラフ編集距離(GED)は、グラフ検索において重要な類似度尺度である。
最近の学習に基づくアプローチは、ベクトル空間における表現間の距離とGEDを近似する。
フレキシブルGED計算のための新しい学習ベースアプローチであるグラフ編集ネットワーク(GEN)を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:16:46 GMT)
From Text to Time? Rethinking the Effectiveness of the Large Language Model for Time Series Forecasting [22.1] 時系列予測のバックボーンとして事前訓練された大言語モデル(LLMs)を用いることは、近年、大きな研究関心を集めている。
小さなデータセット上でのLCMベースのモデルのトレーニングとテストは、しばしばDecoderとDecoderがデータセットに過度に適応するようになることを観察する。
大規模な実験により、LSMのバックボーンはある程度の可能性を証明しているが、予測性能は限られていることが明らかになった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:20:09 GMT)
Replacing Paths with Connection-Biased Attention for Knowledge Graph Completion [21.7] 知識グラフ(KG)の完成は、KGの既存の事実から推測できる追加の事実を特定することを目的としている。
この研究は、経路エンコーディングを明示的に使用することなく、帰納的設定でのKG補完に焦点を当てている。
接続バイアスによる注意とサブグラフエンコーディングモジュールへのエンティティロールの埋め込みを導入し、高価で時間を要するパスエンコーディングモジュールの必要性を解消する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:12:28 GMT)
Generative AI Voting: Fair Collective Choice is Resilient to LLM Biases and Inconsistencies [21.4] 複雑な選好投票形式は、より単純な大政党選挙と比較して大きな矛盾を示す。
しかし、実世界で初めて直接民主主義における有権者の比例表現を示すことによって、平等な株式のような公正な投票集約手法が勝利であることも証明できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:21:07 GMT)
A Deep Single Image Rectification Approach for Pan-Tilt-Zoom Cameras [21.4] 本稿では,広義の画像修正のための新しいフレームワークであるFDBWNet(Forward Distortion and Backward Warping Network)を提案する。
フォワード歪みモデルを用いてバレル歪み画像を合成し、画素の冗長性を低減し、ぼやけを防ぐ。
このネットワークは、幾何学的詳細を含む逆向きのワープフローを生成するアテンション機構を備えたピラミッドコンテキストを採用している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:19:38 GMT)
Robo-taxi Fleet Coordination at Scale via Reinforcement Learning [21.3] この研究は、数学的モデリングとデータ駆動技術を統合する新しい意思決定フレームワークを導入している。
本稿では、強化学習のレンズを通してAMoDコーディネート問題を示し、グラフネットワークに基づくフレームワークを提案する。
特に、強化学習のレンズを通してAMoDコーディネート問題を示し、グラフネットワークに基づくフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:54:20 GMT)
Adapting to Online Distribution Shifts in Deep Learning: A Black-Box Approach [20.7] 本研究では、バッチにデータが到着し、各バッチの分布が時間とともに任意に変化するという、オンライン配信シフトのモチベーションの高い問題について検討する。
シフトは、大きく、小さく、突然、あるいは徐々に変化する可能性があるため、そこから学ぶべき関連する歴史的データの長さは、時間とともに変化する可能性がある。
本稿では,任意のネットワークアーキテクチャとオンライン学習者(OL)アルゴリズムを入力とし,与えられたOLの性能を確実に向上させるメタアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 20:34:24 GMT)
KnobGen: Controlling the Sophistication of Artwork in Sketch-Based Diffusion Models [20.4] KnobGenは、スケッチベースの画像生成のためのデュアルパスウェイフレームワークである。
さまざまなレベルのスケッチの複雑さとユーザスキルにシームレスに対応します。
画像の自然な外観を維持しながら、最終的な出力を制御する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:27:10 GMT)
Context Switching for Secure Multi-programming of Near-Term Quantum Computers [19.4] 同時に2ビットのCNOTゲートからのクロストークはセキュリティ上のリスクを引き起こす。
ハードウェアエラープロファイルを知らずにクロストークを利用するゼロナレッジ・タンパリング・アタック(ZKTA)を設計する。
本稿では,複数のコンテキストにまたがるプログラムを実行することで,ZKTAを防御するコンテキストスイッチング手法であるQONTEXTSを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:05:16 GMT)
TSP-OCS: A Time-Series Prediction for Optimal Camera Selection in Multi-Viewpoint Surgical Video Analysis [19.4] 本稿では,複数の同時録画ビデオストリームから最適なショットシーケンスを選択するための,教師付き学習に基づく時系列予測手法を提案する。
提案手法は,より長い時間的地平線を予測した場合であっても,従来の教師付き手法と比較して競争精度が向上する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:07:49 GMT)
Sculpting Subspaces: Constrained Full Fine-Tuning in LLMs for Continual Learning [19.3] 大規模言語モデル(LLM)における継続的な学習は破滅的な忘れがちである。
適応特異値分解(SVD)を利用した連続的完全微調整手法を提案する。
我々は,Encoder-decoder (T5-Large) モデルとdecoder-only (LLaMA-2 7B) モデルの両方を用いて,標準連続学習ベンチマークを広範囲に評価した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:59:42 GMT)
Exploring Ordinal Bias in Action Recognition for Instructional Videos [18.3] アクション認識モデルは、真のビデオ理解よりも、支配的なデータセット固有のアクションシーケンスに依存することが多い。
本稿では,頻繁に発生するアクションのフレームをマスクするアクションマスキングと,アクションセグメントの順序をランダム化するシーケンスシャッフルという2つの効果的なビデオ操作手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:03:51 GMT)
A Scalable Approach to Clustering Embedding Projections [18.0] 本稿では, 点ではなく, 投影された2次元空間におけるカーネル密度推定を用いた効率的なクラスタリング手法について述べる。
このアルゴリズムは、数百ミリ秒で2次元密度マップから高品質なクラスタ領域を生成することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:24:17 GMT)
GBG++: A Fast and Stable Granular Ball Generation Method for Classification [17.7] グラニュラーボールコンピューティングは効率的で堅牢でスケーラブルな学習方法である。
既存のGBG法の安定性と効率をさらに改善する必要がある。
まず, 高速かつ安定なGBG (GBG++) 手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:25:03 GMT)
Better Decisions through the Right Causal World Model [17.6] 因果的対象中心モデル抽出ツール(COMET)は、正確に解釈可能な因果的世界モデル(CWM)を学習するために設計された新しいアルゴリズムである。
Pong や Freeway などの Atari 環境で検証した結果,COMET の精度とロバスト性を実証した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 20:29:13 GMT)
TESSERACT: Eliminating Experimental Bias in Malware Classification across Space and Time (Extended Version) [17.4] マルウェア検知器は、常に進化するオペレーティングシステムや攻撃方法によって、しばしば性能劣化を経験する。
本論文は, 検出作業における2つの実験バイアス源により, 一般的に報告される結果が膨らんでいることを論じる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:32:21 GMT)
FLASH: Flexible Learning of Adaptive Sampling from History in Temporal Graph Neural Networks [16.8] 時間グラフニューラルネットワーク(TGNN)は、一様サンプリングや最近の隣人選択のような、歴史的な隣人サンプリングに依存することが多い。
学習可能なグラフ適応型近傍選択機構であるFLASHを紹介する。
FLASHはTGNNにシームレスに統合され、セルフ教師付きランキング損失を使用してエンドツーエンドにトレーニングされる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:35:09 GMT)
Beware of "Explanations" of AI [16.3] ますます複雑なAIシステムによってなされる決定と行動を理解することは、依然として重要な課題である。
これにより、説明可能な人工知能(XAI)の研究分野が拡大した。
何が"よい"説明を構成するのかという問題は、目標、ステークホルダ、コンテキストに依存します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:31:08 GMT)
Bridging the Gap Between Preference Alignment and Machine Unlearning [16.2] 本稿では,大規模言語モデルにおける優先度アライメントと,人間のフィードバックによる強化学習との関係を考察する枠組みを提案する。
分析の結果,全ての否定例が未学習時のアライメント改善に等しく寄与するわけではないことが判明した。
本稿では,2段階最適化を利用して最適PA性能のサンプルを効率よく選択し,未学習の例を抽出するUnlearning to Alignというフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:49:08 GMT)
SynFlowNet: Design of Diverse and Novel Molecules with Synthesis Constraints [16.2] 反応空間が化学反応と精製可能な反応物質を用いて新しい分子を逐次生成するGFlowNetモデルであるSynFlowNetを紹介する。
生成機構の明示的な制約としてフォワード合成を取り入れることで、シリコン分子生成と実世界の合成能力のギャップを埋めることを目指す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:03:07 GMT)
GigaHands: A Massive Annotated Dataset of Bimanual Hand Activities [16.1] GigaHandsは56人の被験者と417のオブジェクトから34時間の両手の動きを捉えた巨大な注釈付きデータセットである。
マーカレスキャプチャのセットアップとデータ取得プロトコルにより,完全自動3Dハンドとオブジェクト推定が可能となる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:18:05 GMT)
Right Prediction, Wrong Reasoning: Uncovering LLM Misalignment in RA Disease Diagnosis [16.1] 大規模言語モデル(LLM)は、有望な事前スクリーニングツールを提供し、早期疾患の検出を改善し、未熟なコミュニティに対する医療アクセスを増強する。
様々な疾患の予測に顕著な精度で、LSMは臨床前スクリーニングや様々な医療状況の意思決定に革命をもたらす可能性がある。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:04:01 GMT)
Decoupling Contrastive Decoding: Robust Hallucination Mitigation in Multimodal Large Language Models [15.5] マルチモーダル大言語モデル(MLLM)は、明白な視覚的または事実的証拠と一致しない出力を生成する。
DCD(Decoupling Contrastive Decoding)という新しいフレームワークを提案する。
DCDは選好データセットにおける正と負のサンプルの学習を分離し、訓練はMLLM内で正と負のイメージ投影を分離する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:59:18 GMT)
STI-Bench: Are MLLMs Ready for Precise Spatial-Temporal World Understanding? [15.4] MLLM(Multimodal Large Language Models)は、Embodied AIとAutonomous Drivingのためのエンドツーエンドソリューションである。
MLLMの時空間的理解を評価するためのベンチマークであるSTI-Benchを紹介する。
私たちのベンチマークでは、デスクトップ、屋内、屋外のシナリオにまたがる幅広いロボットと車両の操作を網羅しています。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:07:39 GMT)
A Simple but Strong Baseline for Sounding Video Generation: Effective Adaptation of Audio and Video Diffusion Models for Joint Generation [15.3] オーディオとビデオのベース拡散モデルを考えると,これらを1つのモデルに追加モジュールに統合し,モデルが共同でオーディオとビデオを生成するように訓練する。
音声とビデオのペア間のアライメントを高めるために,本モデルでは2つの新しいメカニズムを導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:18:01 GMT)
Are Vision-Language Models Ready for Dietary Assessment? Exploring the Next Frontier in AI-Powered Food Image Recognition [14.6] VLM(Vision-Language Models)は、視覚的およびテキスト的推論を統合することで、新たな可能性を提供する。
本研究では,6種類の最先端VLMを評価し,その食品認識能力について異なるレベルで分析した。
実験フレームワークとして,9,263個の専門家ラベル付き画像を含むユニークな食品画像データベースであるFoodNExTDBを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:33:59 GMT)
Persona Dynamics: Unveiling the Impact of Personality Traits on Agents in Text-Based Games [14.4] PANDA: Personality Adapted Neural Decision Agentsは,人格特性をエージェントに投影する新しい手法である。
我々は、25のテキストベースのゲームに16の異なるパーソナリティタイプを配置し、それらのトラジェクトリを分析する。
より高いオープンネスのレベルを特徴とするような、特定の個性タイプは、パフォーマンスのアドバンテージを誇示する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:17:00 GMT)
More diverse more adaptive: Comprehensive Multi-task Learning for Improved LLM Domain Adaptation in E-commerce [13.8] 本稿では,多種多様なデータやタスクが大規模言語モデルに与える影響を検討するために,総合的なeコマースマルチタスクフレームワークを提案し,実証実験を設計する。
具体的には,新たな主要機能領域に関連するタスクを段階的に導入することにより,LLM性能の大幅な向上を観察する。
最後に,KDDカップ2024における経験的実験から得られたベストパフォーマンスモデルを検証し,タスク1のランク5を達成した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:30:57 GMT)
Dark Matter Search with a Resonantly-Coupled Hybrid Spin System [13.8] アルカリ-21$Neスピン系におけるブロードバンド手法を提案する。
我々は、中性子と陽子とのアクシオンダークマター相互作用に新しい制約を設け、DM性の影響を考慮に入れた。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:57:38 GMT)
Resource-efficient Inference with Foundation Model Programs [13.5] 本稿では,タスクをプログラムに変換し,リソース割り当てのポリシーを学習する手法を提案する。
提案手法は,入力列の質問に応答する2つの視覚的質問応答タスクに対して評価する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:36:47 GMT)
No Detail Left Behind: Revisiting Self-Retrieval for Fine-Grained Image Captioning [13.3] 画像キャプションシステムは、ノイズ(alt-text)またはジェネリック(ヒューマンアノテーション)のいずれかのデータに基づいて訓練されるため、きめ細かいキャプションを生成することができない
それまでの研究では、自己検索(SR)報酬で微調整されたキャプタによって、この制限に対処しようと試みてきた。
SRファインチューニングは, キャプションの忠実度を低下させ, 幻覚までも減少させる傾向にある。
本稿では,(1)人間のアノテーションに固定されたままの画像キャプションデータセットに細粒度を注入する新しいフレームワークであるビジュアルキャプションブースティング,(2)より最適に活用する慎重に設計されたトレーニングカリキュラムであるBagCurriについて述べる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 04:34:41 GMT)
NLP Security and Ethics, in the Wild [13.0] NLPSecの研究倫理は、サイバーセキュリティにまつわる長年の混乱の多くに直面していない。
文献にまたがるトレンドを特定し、害の最小化や責任のある開示といったトピックに関して、最終的に目覚ましいギャップを見つけます。
この研究の目的は、NLPセキュリティで働く人々のための倫理研究の意図的な文化を育むことにある。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:12:34 GMT)
Orchestrate Multimodal Data with Batch Post-Balancing to Accelerate Multimodal Large Language Model Training [12.9] モータリティ構成不整合によるMLLMトレーニングにおける非効率性を軽減するためのフレームワークであるOrchMLLMを紹介する。
Batch Post-Balancing DispatcherとMLLM Global Orchestratorは、シーケンシャルデータにおけるミニバッチの不均衡を取り除くために使用される。
OrchMLLMは、84B MLLMを2560ドルのH100 GPUで3つのモダリティでトレーニングする際に、MFU(Model FLOPs utilization)を41.6%で達成し、Megatron-LMを最大3.1倍のスループットで上回っている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:39:29 GMT)
Large Language Model Can Be a Foundation for Hidden Rationale-Based Retrieval [12.8] 本稿では,隠れ合理性検索という,より困難なタイプの検索タスクを提案し,検討する。
このような問題に対処するためには、命令調整付き大規模言語モデル(LLM)とクロスエンコーダアーキテクチャが妥当な選択である可能性がある。
我々は、RaHoReによってこの検索フレームワークを命名し、感情支援会話(ESC)におけるゼロショットおよび微調整性能上の優位性を検証した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:08:58 GMT)
Reasoning Towards Fairness: Mitigating Bias in Language Models through Reasoning-Guided Fine-Tuning [12.6] モデルの推論能力と公平性との関係について検討する。
より強力な推論能力を持つ大型モデルは、かなり低いステレオタイプバイアスを示す。
本稿では,先進的推論モデルから構造的推論トレースを抽出し,そのような能力を欠いたモデルに注入する手法であるReGiFTを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:05:13 GMT)
A Neuro-inspired Interpretation of Unlearning in Large Language Models through Sample-level Unlearning Difficulty [12.4] 既存の研究では、サンプル全体にわたって一様でない学習困難が想定されている。
本稿では,サンプルレベルの未学習難易度を定量化するためのメモリ除去困難度(mathrmMRD$)尺度を提案する。
また、既存の未学習アルゴリズムを最適化するために、$mathrmMRD$ベースの重み付きサンプリング手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:48:10 GMT)
CRYSIM: Prediction of Symmetric Structures of Large Crystals with GPU-based Ising Machines [12.4] 我々は、空間群を符号化するアルゴリズムであるCRYSIM、Wyckoff配置の組み合わせ、および独立した原子サイトを独立変数として座標するアルゴリズムを紹介する。
CRYSIMがGPUベースのIsingマシンであるFixstars Amplifyにインターフェースされたとき、予測性能はCALYPSOやベイジアン最適化と競合していた。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:33:48 GMT)
How do Copilot Suggestions Impact Developers' Frustration and Productivity? [12.3] 本稿では,自動提案がフラストレーションと生産性に与える影響について2つの理論を提案する。
専門家も初心者も、少なくとも32人の開発者を巻き込みます。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:55:22 GMT)
SIGMA: An Efficient Heterophilous Graph Neural Network with Fast Global Aggregation [12.3] グラフニューラルネットワーク(GNN)は、グラフ学習において大きな成功を収めているが、ヘテロフィリーに会うとパフォーマンス損失に悩まされる。
SIGMAは,SimRankの構造的類似度測定を統合した,効率的なグローバルヘテロ親和性GNNアグリゲーションである。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:19:32 GMT)
Understanding the Effect of Opinion Polarization in Short Video Browsing [12.2] 本稿では,オピニオン偏光(OP)が短いビデオブラウジングにおけるユーザの知覚と行動に与える影響について考察する。
従来のユーザフィードバック信号,例えば,閲覧時間などは,OPの検出や測定には適していない。
脳波信号は、OPに関連する知覚と認知の神経処理を評価する新しい非侵襲的アプローチとして用いられる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:14:02 GMT)
A Survey on Mixture of Experts in Large Language Models [11.8] モデルキャパシティを最小限のオーバーヘッドでスケールアップする有効な方法として、専門家(MoE)の混在が現れた。
普及しているにもかかわらず、MoEに関する文献の体系的かつ包括的なレビューは欠如している。
この調査は、このギャップを埋めることを目指しており、MoEの複雑さを探求する研究者にとって不可欠なリソースとなっている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:54:59 GMT)
Neural Motion Simulator: Pushing the Limit of World Models in Reinforcement Learning [11.8] モーションダイナミクスモデルは、効率的なスキル獲得と効果的なプランニングに不可欠である。
本稿では,脳神経運動シミュレータ (MoSim) を紹介する。
MoSimは物理状態予測において最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:59:32 GMT)
InteractRank: Personalized Web-Scale Search Pre-Ranking with Cross Interaction Features [11.7] Pinterestで使用されている堅牢なクロスインタラクション機能を備えた,新しい2つのタワープレグレードモデルであるInteractRankを紹介した。
Pinterestの実際のA/B実験では、InteractRankはBM25ベースラインで6.5%、バニラ2タワーベースラインで3.7%改善している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:13:58 GMT)
LeanGaussian: Breaking Pixel or Point Cloud Correspondence in Modeling 3D Gaussians [11.7] 変形可能なトランスフォーマーにおける各クエリを1つの3次元ガウス楕円体として扱う新しいアプローチであるLeanGaussianを紹介する。
変形可能なデコーダを用いて、画像特徴をキーと値として、ガウス層を反復的に洗練する。
提案手法は従来の手法よりも約6.1%優れ,PSNRは25.44,PSNRは22.36であった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:00:32 GMT)
GTS-LUM: Reshaping User Behavior Modeling with LLMs in Telecommunications Industry [11.6] GTS-LUMは、通信環境におけるモデリングパラダイムを再定義する、新しいユーザ行動モデルである。
GTS-LUMは(マルチモーダルな)エンコーダアダプタ-LLMデコーダアーキテクチャを採用しており、いくつかのテレコム固有の革新で拡張されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:12:07 GMT)
GRAIN: Multi-Granular and Implicit Information Aggregation Graph Neural Network for Heterophilous Graphs [11.5] Granular and Implicit Graph Network (GRAIN) は異種グラフに特化して設計された新しいGNNモデルである。
GRAINは、さまざまなレベルでマルチビュー情報を集約し、非隣接ノードからの暗黙のデータを組み込むことで、ノードの埋め込みを強化する。
また,多粒度と暗黙的データを効率よく組み合わせ,ノード表現の質を大幅に向上させる適応グラフ情報集約器を導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:36:44 GMT)
Policy Gradient Converges to the Globally Optimal Policy for Nearly Linear-Quadratic Regulators [11.4] 準線形2次制御系における最適速度について検討する。
本稿では、勾配アルゴリズムを用いて、グローバルな最適レートで保証されるポリシーを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:06:03 GMT)
Robust and Noise-resilient Long-Term Prediction of Spatiotemporal Data Using Variational Mode Graph Neural Networks with 3D Attention [11.4] 本稿では,時空間変動モードグラフネットワーク(VMGCN)を用いた長期予測の堅牢性向上に焦点をあてる。
このタスクのディープラーニングネットワークは過去のデータ入力に依存しているが、リアルタイムデータはセンサノイズによって破壊される可能性がある。
我々は、このノイズを独立かつ同一に分散したガウスノイズとしてモデル化し、LargeSTトラフィックボリュームデータセットに組み込む。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:49:45 GMT)
ODEStream: A Buffer-Free Online Learning Framework with ODE-based Adaptor for Streaming Time Series Forecasting [11.3] ODEStreamはバッファフリーの連続的な学習フレームワークで、データ内の時間的依存関係をキャプチャするための時間的分離レイヤを備えている。
連続したデータ表現を生成し、データストリーミングシナリオにおける動的変更へのシームレスな適応を可能にする。
我々のアプローチは、過去のデータの動的および分布が時間とともにどのように変化するかを学ぶことに集中し、ストリーミングシーケンスの直接処理を容易にする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:29:09 GMT)
Leveraging Machine Learning Techniques in Intrusion Detection Systems for Internet of Things [11.2] 従来の侵入検知システム(IDS)は、IoTネットワークの動的かつ大規模な性質を管理するのに不足することが多い。
本稿では,機械学習(ML)とディープラーニング(DL)技術がIoT環境におけるIDSのパフォーマンスを大幅に向上させる方法について検討する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:52:15 GMT)
Pruner: A Draft-then-Verify Exploration Mechanism to Accelerate Tensor Program Tuning [11.1] プログラムチューニングを高速化するために,Pruner と MoA-Pruner を提案する。
Prunerはスケジュール探索を高速化する"Draft-then-Verify"探索メカニズムである。
MoA-Prunerは、クロスプラットフォームのオンライン無意識に対処するためのMomentumオンライン適応戦略を導入した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:26:08 GMT)
Intent Representation Learning with Large Language Model for Recommendation [11.1] モデルに依存しないフレームワークIRLLRec(Intent Representation Learning with Large Language Model)を提案する。
具体的には、IRLLRecはマルチモーダルなインテント表現を学ぶためにデュアルトウワーアーキテクチャを採用している。
テキストと対話に基づく意図をよりよく一致させるため、融合した意図表現を教師が学習するためにモーメント蒸留を用いる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:21:18 GMT)
Outlier dimensions favor frequent tokens in language models [11.1] 我々は,多くの現代言語モデルにおいて,不規則な次元が出現することを示し,その関数を常に頻繁な単語の予測に遡ることを示す。
我々は,多くの異なるモデルによって有用なトークン予測を実装するための特別なメカニズムである,と結論付けている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:37:48 GMT)
The Importance of Being Discrete: Measuring the Impact of Discretization in End-to-End Differentially Private Synthetic Data [10.9] そこで本研究では,差分プライベート(DP)生成限界モデルの文脈における4つの離散化戦略の測定を行った。
離散化器とビン数の選択を最適化することで,DPの限界モデル6モデルに対して,有効性を平均30%向上できることがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:30:30 GMT)
Improving Examples in Web API Specifications using Iterated-Calls In-Context Learning [10.8] Web API仕様の例は、APIテスト、API理解、さらにはAPIのチャットボット構築に不可欠である。
本稿では、Web API仕様の例を作成するための新しいテクニックを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:43:47 GMT)
Societal Impacts Research Requires Benchmarks for Creative Composition Tasks [10.7] このポジションペーパーは、創造的な構成タスクに焦点を当てたベンチマークが、AI生成コンテンツの社会的害を理解するための必要なステップであると主張している。
我々は、創造的な構成タスクを、日常的な創造性を必要とする個人的タスクの助けを求める一般的な利用カテゴリとして特定する。
我々は、創造性のあるモデルの発展と影響を効果的に測定できる新しいベンチマークの開発を知らせるために、使用パターンの透明性を高めることを求めている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:12:16 GMT)
Free Random Projection for In-Context Reinforcement Learning [10.6] 自由確率論に基づく入力写像である自由ランダム射影を導入する。
フリーランダムプロジェクションは、既存のコンテキスト内強化学習フレームワークにシームレスに統合される。
マルチ環境ベンチマークの実証結果は、自由乱射影が標準乱射影よりも一貫して優れていることを示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:38:50 GMT)
RO-FIGS: Efficient and Expressive Tree-Based Ensembles for Tabular Data [10.6] ツリーベースモデルは非形式的特徴に対して堅牢であり、非滑らかで複雑な決定境界を正確に捉えることができる。
我々はRandom oblique Fast Interpretable Greedy-Tree Sums (RO-FIGS)を提案する。
RO-FIGSはFast Interpretable Greedy-Tree Sumsの上に構築され、斜めまたは多変量分割で木を学習することで拡張する。
RO-FIGSを22の実世界のデータセット上で評価し、他の木とニューラルネットワークに基づく手法よりも優れた性能とはるかに小さなモデルを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:35:24 GMT)
Who cares about testing?: Co-creations of Socio-technical Software Testing Experiences [10.3] 本研究は,テストに関する彼らの意見がどう変わるかを明らかにするために,ソフトウェア開発者の生きた経験を考察する。
ソフトウェア開発者との深い半構造化されたインタビュー19件のデータを体系的に分析して理論を構築する。
テストプラクティスの適用と適応の条件として機能する状況の11のカテゴリを開発します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:35:36 GMT)
RETROcode: Leveraging a Code Database for Improved Natural Language to Code Generation [10.2] 本稿では,シーケンス・ツー・シーケンス・モデルに対するRETROアーキテクチャの新たな適応であるRETROcodeを提案する。
以上の結果から,RETROcode はテストセット上での類似サイズの従来型アーキテクチャよりも優れるだけでなく,はるかに大きな Codex モデルの有効性にもアプローチすることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:55:15 GMT)
Data Augmentation for Fake Reviews Detection in Multiple Languages and Multiple Domains [10.1] 大規模な言語モデルを使用してデータセットを生成し、偽レビュー検出をトレーニングします。
我々のアプローチは、異なるドメイン(書籍レビュー、レストランレビュー、ホテルレビュー)と異なる言語(英語と中国語)で偽レビューを生成するために用いられました。
偽レビュー検出モデルの精度は、DeRev TESTで0.3ポイント、Amazon TESTで10.9ポイント、Yelp TESTで8.3%、DianPing TESTで7.2ポイント向上できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:23:54 GMT)
Untangling Lariats: Subgradient Following of Variationally Penalized Objectives [10.0] 本稿では,不規則なペナルティを伴う凸問題の最適解を段階的に追従する装置について述べる。
我々は,このアプローチの特殊な場合として,溶存ラッソや等調回帰といった既知のアルゴリズムを導出する。
そこで我々は,任意の畳み込みフィルタによって特徴づけられる変分罰則の段階的追従のための格子ベースの新しい手順を導出した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:30:27 GMT)
AI, Help Me Think$\unicode{x2014}$but for Myself: Assisting People in Complex Decision-Making by Providing Different Kinds of Cognitive Support [9.9] 我々は、AIがユーザの意思決定の合理性に基づいて構築する代替インタラクションモデルについて検討する。
このアプローチをExtendedAIと呼び、レコメンデーションベースのAIと比較する。
その結果、AIは異なる影響を持ち、ExtensionAIは意思決定プロセスと人々の思考にもっとうまく統合されていることがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:48:17 GMT)
The Writing is on the Wall: Analyzing the Boom of Inscriptions and its Impact on EVM-compatible Blockchains [8.7] ある日、ArbitrumとZKsyncの取引の90%近くを碑文が占めていた。
ZKロールアップであるZKsync Eraは、楽観的なロールアップよりも高い手数料削減を示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:43:04 GMT)
Uni-PrevPredMap: Extending PrevPredMap to a Unified Framework of Prior-Informed Modeling for Online Vectorized HD Map Construction [8.4] 時間知覚バッファと費用効率のよい地図は本質的にオンラインHDマップ構築のための補完的な事前情報源を形成する。
我々は、以前の予測を統合し、古いHDマップをシミュレートした、統合された事前インフォームドフレームワークUni-PrevPredMapを提案する。
Uni-PrevPredMapは、確立されたオンラインベクトル化HDマップ構築ベンチマークにおいて、マップフリーシナリオにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:36:17 GMT)
When Federated Learning Meets Quantum Computing: Survey and Research Opportunities [8.3] 量子フェデレーションラーニング(QFL)は、分散フェデレーションラーニング(FL)モデルのスケーラビリティと効率を改善するために、量子コンピューティング(QC)の進歩を活用する新興分野である。
本稿では,FLがQCに適合する際の課題と解決策について,体系的かつ包括的な調査を行う。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:29:33 GMT)
Automated Business Process Analysis: An LLM-Based Approach to Value Assessment [8.2] 本稿では,Large Language Models(LLM)を用いて付加価値分析を自動化する。
まず、高レベルのアクティビティを詳細なステップに分解して粒度分析を可能にし、次に、リーンの原則に従って各ステップを分類するために付加価値分析を実行します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:52:50 GMT)
DeduCE: Deductive Consistency as a Framework to Evaluate LLM Reasoning [8.2] 本稿では,言語モデル(LM)からのチェーン・オブ・シント・アウトプットを解析するための帰納的整合性尺度を提案する。
LMは入力前提数の増加に対してかなり堅牢であるが, 推理ホップ数の増加に伴い精度が著しく低下することがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:53:55 GMT)
Pretraining Language Models for Diachronic Linguistic Change Discovery [8.2] 本手法は,手作業による検査を容易にするため,コーパス上で有効なモデルを生成することができることを示す。
我々は,10万ワードスライス5件の時間分割データセットを得るために,新しい日付属性パイプラインを用いる。
事前訓練されたモデルは、微調整されたベースラインよりも訓練が早いこと、そして、私たちのコーパスの歴史的区分をより尊重していることが分かりました。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:09:06 GMT)
MoEDiff-SR: Mixture of Experts-Guided Diffusion Model for Region-Adaptive MRI Super-Resolution [8.2] Moediff-SRは、領域適応型MRI超解像(SR)のためのMixture of Experts(MoE)誘導拡散モデルである
画像全体にわたって均一な復調過程を適用する従来の拡散ベースSRモデルとは異なり、Moediff-SRは微粒なトークンレベルで特殊復調の専門家を動的に選択する。
実験の結果,Moediff-SRは画像品質の定量的指標,知覚的忠実度,計算効率において,既存の最先端手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:12:44 GMT)
Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation [7.8] 本研究では,リモートセンシング(RS)シナリオに特化して設計された最初のPEFT方式であるEarth-Adapterを紹介する。
DFTを利用することで、Earth-Adapterは特徴を異なる周波数成分に分解し、アーティファクトを元の特徴から正確に分離することができる。
ベースラインのReinと比較して、Earth-AdapterはDAで9.0% mIoU、DGベンチマークで3.1% mIoUを大幅に改善している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:36:31 GMT)
"Sorry for bugging you so much." Exploring Developers' Behavior Towards Privacy-Compliant Implementation [7.7] プライバシに敏感なプログラミングタスクについて,30人のプロソフトウェア開発者を対象に調査を行った。
3つのタスクのいずれも、30人全員がプライバシに準拠するものではない。
参加者は、目的の制限、ユーザーの同意、データ最小化といった共通のプライバシー要件に対処する深刻な問題を報告した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:59:17 GMT)
Learning global control of underactuated systems with Model-Based Reinforcement Learning [7.4] 本稿では,ICRA 2025で開催された「AI Olympics with RealAIGym」第3回大会の解決策について述べる。
我々は,モンテカルロ確率的学習制御(MC-PILCO)を,低次元ロボット作業における例外的なデータ効率に用いている。
MC-PILCOはこのコンペの最初の2回で優勝し、シミュレーションと実環境の両方で堅牢性を示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:20:37 GMT)
Wanting to be Understood [7.4] 本稿では,人間には理解の基本的な動機があるという仮説を,相互認識の本質的な動機として考察する。
知覚横断パラダイムのシミュレーションを通じて、強化学習エージェントにおける様々な内的報酬関数の効果について検討する。
その結果, 人工好奇心だけでは社会的相互作用を優先しないが, 相互理解を重視した報酬が, 相互作用の優先順位付けに成功していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:15:24 GMT)
Parallel repetition of local simultaneous state discrimination [7.1] 局所的同時状態判別は、量子情報処理において最近導入された問題である。
古典的手法に対する無署名戦略の利点について検討する。
3人のプレイヤーと2進値に対して、符号なしの戦略は古典的な手法では改善できないことを数値的に示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:55:26 GMT)
Identifying Information from Observations with Uncertainty and Novelty [7.1] 本稿では、異なる状態間の関係を表現するために使用される言語から生じる識別可能な情報の概念を定式化する。
計算可能なPAC-Bayes学習者のサンプル複雑性分布は、そのモーメントによって、固定有限仮説集合上の事前確率分布によって決定されることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:11:06 GMT)
Geometric Quantum Gates of Non-closed Paths Under Counterdiabatic Driving [7.0] 非断熱的および非閉鎖的進化経路は、量子ゲートの忠実性において重要な役割を果たす。
準位相数(nu_textqua$)に基づく高忠実度量子制御フレームワークを提案する。
我々は幾何学的量子制御をトポロジカルプロテクションでブリッジし、耐雑音量子コンピューティングへの普遍的なアプローチを提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:35:43 GMT)
LLM Safeguard is a Double-Edged Sword: Exploiting False Positives for Denial-of-Service Attacks [7.0] 本研究は,セーフガード手法のエンファルス陰性を利用した攻撃について検討する。
悪意のある攻撃者は、セキュリティ保護の偽陽性を悪用する可能性もあり、ユーザーに影響を与えるDoS(DoS)が否定された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:20:33 GMT)
Enhancing Metabolic Syndrome Prediction with Hybrid Data Balancing and Counterfactuals [6.9] メタボリックシンドローム(メタボリックシンドローム、MetS)は、心臓血管疾患と2型糖尿病のリスクを著しく増大させる、関連性リスク因子の集団である。
世界的な流行にもかかわらず、クラス不均衡、データの不足、既存の研究における方法論上の矛盾などの問題により、MetSの正確な予測は依然として困難である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:51:10 GMT)
Beyond Moore's Law: Harnessing the Redshift of Generative AI with Effective Hardware-Software Co-Design [6.8] ムーアの法則はコンピュータ・アーキテクチャとシステム・デザインの柱として機能している。
従来の切り離されたシステム設計哲学は、ますます時代遅れになっている。
ハードウェアとソフトウェアの共同設計は、最近のイノベーションではない。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:10:58 GMT)
SketchRef: a Multi-Task Evaluation Benchmark for Sketch Synthesis [6.8] SketchRefは、スケッチ合成のための最初の総合的なマルチタスク評価ベンチマークである。
タスクは、動物、共通物、人体、顔の4つの領域にまたがる5つのサブタスクに分けられる。
アート愛好家から7,920の回答を収集することで,我々のアプローチを検証する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:18:01 GMT)
Have we unified image generation and understanding yet? An empirical study of GPT-4o's image generation ability [6.6] OpenAIのマルチモーダルGPT-4oは、画像生成と編集において顕著な機能を示した。
しかし、世界知識による意味合成を実現する能力は証明されていない。
我々の研究は、より堅牢なベンチマークとトレーニング戦略の開発を要求する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:10:15 GMT)
Human-like compositional learning of visually-grounded concepts using synthetic environments [6.5] 本研究では,人間が試行錯誤によって概念クラスや接地的視覚的手がかりを構成することを学ぶ方法について検討する。
我々は,エージェントが自然言語の指示によって指定されたターゲットに移動するために,強化によって学習する3D合成環境を設計する。
強化学習エージェントは、決定者の概念を視覚的目標に根ざすことができるが、より複雑な前置詞概念に苦慮していることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:33:28 GMT)
A Dataset of Software Bill of Materials for Evaluating SBOM Consumption Tools [6.1] ソフトウェア・ビル・オブ・マテリアル(Software Bill of Materials, SBOM)は、ソフトウェアで使用されるコンポーネントの一覧である。
多くのツールは、SBOMを通じてソフトウェア依存の管理をサポートする。
この目的のために特別に設計されたデータセットは公開されていない。
実世界のJavaプロジェクトから生成されたSBOMのデータセットを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:35:02 GMT)
UKBOB: One Billion MRI Labeled Masks for Generalizable 3D Medical Image Segmentation [6.0] 医用画像の最大の課題は、プライバシーの懸念、ロジスティクス、高ラベリングコストによる大規模なラベル付きデータ収集である。
本報告では,UKBOB (British Biobank Organs and Bones) について述べる。
我々は,自動ラベル付け,臓器特異的フィルタを用いた自動ラベルクリーニングパイプラインの導入,腹部11クラスの300MRIのサブセットを手動でアノテートして,その品質を検証した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:10:51 GMT)
Show and Tell: Visually Explainable Deep Neural Nets via Spatially-Aware Concept Bottleneck Models [6.0] 本稿では,視覚ニューラルネットワークを空間的・概念的に解釈可能なモデルに変換する統一的な枠組みを提案する。
この手法をSALF-CBM(Spatially-Aware and Label-Free Concept Bottleneck Model)と呼ぶ。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:14:02 GMT)
Boost Your Human Image Generation Model via Direct Preference Optimization [6.0] 人間の画像生成は、幅広い応用のために画像合成に重要な焦点をあてるが、解剖学、ポーズ、詳細のわずかな不正確さでさえ、現実主義を損なう可能性がある。
提案手法は,好ましくない(損失)画像から分岐しながら,好ましくない(勝利)画像を生成するようにモデルを訓練するDPO(Direct Preference Optimization)を提案する。
本稿では,高品質な実画像を勝利画像として取り入れたDPO手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:55:52 GMT)
Comparative Performance Evaluation of Large Language Models for Extracting Molecular Interactions and Pathway Knowledge [5.9] 大型言語モデル(LLM)は、関心の経路に関連する遺伝子やタンパク質を同定することができる。
LLMは関心の経路に関連する遺伝子やタンパク質を同定し、その相互作用をある程度予測することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:41:35 GMT)
Meta-LoRA: Meta-Learning LoRA Components for Domain-Aware ID Personalization [5.9] メタロラ(Meta-LoRA)は、アイデンティティに依存しない知識とアイデンティティ固有の適応を分離するフレームワークである。
この結果から,Meta-LoRAは多種多様なアイデンティティ条件にまたがって優れたアイデンティティ保持,計算効率,適応性を達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:33:11 GMT)
Mixed-state geometric phases of coherent and squeezed spin states [5.7] スピンコヒーレント状態 (CSS) とスピン圧縮状態 (SSS) の2つの混合状態幾何位相 (Uhlmann phase) と干渉幾何学的位相 (IGP) を解析した。
j=1$2軸のSSSを考えると、GPとその非断熱一般化は有限温度で滑らかな挙動を示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:21:06 GMT)
Assessing the risk of recurrence in early-stage breast cancer through H&E stained whole slide images [5.5] 深層学習を用いて乳癌再発リスクを予測するため,125例のヘマトキシリンおよびエオシン含有全スライド画像(WSI)を解析した。
感度はそれぞれ, 0.857, 0.746, 0.529であり, それぞれ0.816, 0.803, 0.972, ピアソン相関は0.61であった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:51:52 GMT)
Objaverse++: Curated 3D Object Dataset with Quality Annotations [5.5] 本稿では,人間の専門家による詳細なアノテーションを付加した,逆のキュレートされたサブセットであるaverse++について述べる。
逆キュレーションは利用可能な3Dアセットコレクションとしては最大であるが、その実用性は低品質モデルの制限によって制限されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:29:08 GMT)
Exploring the Effectiveness and Interpretability of Texts in LLM-based Time Series Models [5.3] 大規模言語モデル(LLM)は、トレーニング済みの言語モデルをバックボーンとして活用し、時系列予測タスクに適用されている。
本研究は,このような文章の具体化の実際の有効性と解釈可能性について検討する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:48:35 GMT)
GraspClutter6D: A Large-scale Real-world Dataset for Robust Perception and Grasping in Cluttered Scenes [5.3] GraspClutter6Dは、1,000の散らばったシーンと密集したアレンジメントを特徴とする、大規模な現実世界の把握データセットである。
我々は,最先端のセグメンテーション,オブジェクトポーズ推定,把握検出手法のベンチマークを行い,乱雑な環境における課題に対する重要な洞察を提供する。
トレーニングリソースとしてのデータセットの有効性を検証し、GraspClutter6Dでトレーニングされたネットワークの把握が、シミュレーションと実世界の実験の両方において、既存のデータセットでトレーニングされたネットワークよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:15:46 GMT)
Trustworthy AI Must Account for Intersectionality [5.2] 信頼できるAIは、公正性、プライバシ、堅牢性、説明可能性、不確実性定量化など、AIシステムを人間の価値と整合させるという願望的な側面を含んでいる。
ある側面を強化するための努力は、しばしば意図しないトレードオフを導入し、他人に悪影響を及ぼし、すべての側面を同時に改善することは困難になります。
我々は、それぞれの軸に沿った信頼に対処するには不十分な立場にある。代わりに、信頼に値するAIの研究は、アスペクト間の交差性を考慮し、すべての関連する軸を同時に総合的な視点を採用する必要がある。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:00:00 GMT)
AI-based identification and support of at-risk students: A case study of the Moroccan education system [5.2] 学生の退学は、個人的、家族的、学術的要因に影響される世界的な問題である。
本稿では,退学リスクのある学生を識別するAIによる予測モデル手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:30:35 GMT)
Image registration of 2D optical thin sections in a 3D porous medium: Application to a Berea sandstone digital rock image [5.2] 本研究では,3次元ディジタルロックボリューム内に2次元の光学的薄断面像を配向させる方式を提案する。
この方法は合成多孔質媒体上で検証され、正確に登録され、ベレア砂岩に適用される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:01:43 GMT)
A Year of the DSA Transparency Database: What it (Does Not) Reveal About Platform Moderation During the 2024 European Parliament Election [5.2] 我々は8つの大手ソーシャルメディアプラットフォームが行った18億件の自己申告モデレーション行動を分析した。
以上の結果から,モデレーション戦略への適応の欠如が判明した。
これらの結果は、現在の自己規制的アプローチの限界を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:31:01 GMT)
Using ML filters to help automated vulnerability repairs: when it helps and when it doesn't [5.1] テストは通常、アプリケーションを構築するためのコストのかかるプロセスが必要ですが、MLモデルはパッチの迅速な分類に使用できます。
テストに基づいて従来のフィルタの前に置かれる候補パッチの予備フィルタとしてMLモデルを用いることを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:39:09 GMT)
Computable and Faithful Lower Bound on Entanglement Cost [5.1] 我々は量子演算における絡み合いコストの計算可能で忠実な下限を開発する。
私たちの境界は半定値プログラミングによって効率的に計算できる。
提案手法は、ポイント・ツー・ポイントとバイパート・量子チャネルの両方の絡み合いコストの低い境界を導出するように拡張する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:15:46 GMT)
Probabilistic QoS Metric Forecasting in Delay-Tolerant Networks Using Conditional Diffusion Models on Latent Dynamics [5.0] DTNの保守と運用に一般的に使用されるアクティブメトリック予測は、レイテンシ、スループット、エネルギー消費、信頼性に関するネットワーク性能を向上させることができる。
時系列予測における従来の平均回帰法は、データの複雑さを適切に把握できないため、ルーティングなどのDTNの運用タスクでは、性能が低下する。
本稿では、DTNにおけるメトリクスの予測を多変量時系列上の確率予測問題として定式化し、これらのサンプルの分布を特徴付けることによって予測の不確かさを定量化することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:40:02 GMT)
Masked Scene Modeling: Narrowing the Gap Between Supervised and Self-Supervised Learning in 3D Scene Understanding [5.0] 本稿では,3次元シーン理解のための自己監督機能の品質を評価するためのロバストな評価プロトコルを提案する。
本稿では, 線形探索装置において, 市販品のみを使用する場合に, 教師付きモデルと同様に機能する最初の自己教師型モデルを提案する。
我々の実験は、教師付きモデルに対する競合性能を実証するだけでなく、既存の自己教師型アプローチを大きなマージンで上回っている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:19:49 GMT)
Deviations from Random Matrix Theory in quantum chaotic systems: A Perspective from Observable Properties [5.0] 量子カオス系におけるランダム行列理論からの偏差を可観測性の観点から検討する。
本研究の目的は,実システムにおける包絡関数の非自明な構造の起源を理解することである。
この結果から,小天体のエンベロープ関数の構造は,システムのランダム性と密接に関係していることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:50:07 GMT)
Visually Similar Pair Alignment for Robust Cross-Domain Object Detection [5.0] トレーニングデータ(ソース)と実世界の環境(ターゲット)の間のドメインギャップは、しばしばオブジェクト検出モデルの性能を低下させます。
既存のほとんどのメソッドは、ソースドメインとターゲットドメインをまたいで機能をアライメントすることで、このギャップを埋めようとしているが、アライメントペアにおける色や方向などの視覚的な違いを説明できないことが多い。
本研究では、視覚的に類似したペアの整列がドメイン適応を大幅に改善するカスタム構築データセットを用いて、初めて実演する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:11:11 GMT)
Language Modeling for the Future of Finance: A Quantitative Survey into Metrics, Tasks, and Data Opportunities [5.0] 近年の言語モデリングの進歩により、金融問題への自然言語処理技術の適用への関心が高まっている。
この傾向を検討するため、2017年から2024年にかけて38のカンファレンスやワークショップで374件のNLP研究論文をレビューした。
我々はこれらの論文を11の質的、定量的な次元にわたって評価し、汎用言語モデルの利用の増加などの重要なトレンドを特定した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:02:12 GMT)
GSta: Efficient Training Scheme with Siestaed Gaussians for Monocular 3D Scene Reconstruction [4.9] Gaussian Splatting (GS)は3D再構成の一般的なアプローチである。
大規模なストレージとメモリの要求に悩まされる。
本稿では,訓練中によく収束したガウスを同定するGStaを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:17:56 GMT)
How Accurately Do Large Language Models Understand Code? [4.8] 大規模言語モデル(LLM)は、コードの修復やテストといった開発後のタスクでますます使われています。
コードの理解の定量化は、その抽象的な性質と標準化されたメトリクスの欠如のために難しい。
本稿では,LLMのコード理解能力に関する大規模な実証的研究を行った。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:27:43 GMT)
An Analysis of Temporal Dropout in Earth Observation Time Series for Regression Tasks [4.7] モンテカルロ・テンポラル・ドロップアウト (MC-TD) は, 推論中の時間ステップをランダムに減少させることにより, 入力レベルの不確実性を明示的に考慮する手法である。
我々は,モンテカルロコンクリートテンポラルドロップアウト(MC-ConcTD)を用いて,最適なドロップアウト分布を直接学習する手法を拡張した。
3つのEO時系列データセットの実験により、MC-ConcTDは既存のアプローチと比較して予測性能と不確実性校正を改善することが示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:23:04 GMT)
ARC-Flow : Articulated, Resolution-Agnostic, Correspondence-Free Matching and Interpolation of 3D Shapes Under Flow Fields [4.7] 本研究は、2つの3次元調音形状間の物理的可視性の教師なし予測のための統一的な枠組みを示す。
ニューラル正規微分方程式(ODE)が支配する滑らかな時間変化流れ場を用いた微分同相変換として補間をモデル化する
対応性は, パラメータ化の異なる高忠実度曲面に有効である, 効率的なバリアフォールド定式化を用いて回復する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:08:51 GMT)
ALFA-Chains: AI-Supported Discovery of Privilege Escalation and Remote Exploit Chains [4.7] 本稿では,プリビレージエスカレーション(PE)とネットワーク内のリモートエクスプロイトの連鎖を発見する新しい手法であるALFA-Chainsを提案する。
特定の浸透テストフレームワークに縛られることなく、浸透テストを支援することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:27:54 GMT)
Towards LLMs Robustness to Changes in Prompt Format Styles [4.5] 大規模言語モデル(LLM)は、プロンプトフォーマットの非意味的な変更に敏感である。
プロンプトフォーマットの小さな変更は、大幅なパフォーマンスの変動を引き起こす可能性がある。
本稿では,LLMにおける即時脆性に対処する手法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:26:00 GMT)
MoC-System: Efficient Fault Tolerance for Sparse Mixture-of-Experts Model Training [4.4] 本研究では,分散学習システムで発生する多数のチェックポイントシャードをオーケストレーションするMixture-of-Checkpoint System (MoC-System)を提案する。
MoC-Systemは、新しい部分エキスパートチェックポイント(PEC)機構を備えており、これはアルゴリズムシステムの共同設計であり、専門家の選ばれたサブセットを戦略的に保存する。
We build MoC-System on the Megatron-DeepSpeed framework, achieve a 98.9% down of overhead for each checkpointing process。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:51:25 GMT)
Zeus: Zero-shot LLM Instruction for Union Segmentation in Multimodal Medical Imaging [4.3] マルチモーダル学習の実行には、ソリューションとして示される視覚とテキストのモダリティが含まれるが、ペア化されたビジョン言語データセットの収集は高価で時間を要する。
大規模言語モデル(LLM)における多くのクロスモーダルタスクの優れた能力に触発されて、我々はこの問題に対処する新しいビジョン・LLM統合フレームワークを提案しました。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:33:35 GMT)
Domain Generalization through Attenuation of Domain-Specific Information [4.3] 我々は、ドメイン独立(DI)とドメイン特化情報(ADSI)の減衰という新しい評価基準を提案する。
DIはドメイン固有の情報の存在を測定する。
ADSIはバターワースフィルタを使用して、ドメイン固有の情報を含む画像の低周波成分を除去する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:10:29 GMT)
GIScience in the Era of Artificial Intelligence: A Research Agenda Towards Autonomous GIS [4.3] 本稿は、GISが従来から自律的な理由づけ、導出、革新、地球空間的ソリューションの推進を超えて、グローバルな課題を推し進める未来を構想する。
本稿では,GIScienceのパラダイムシフトの基盤を築き,GISが従来から自律的な理由づけ,導出,革新,地空間的ソリューションの先進化によって世界的課題を推し進める未来を構想する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:26:03 GMT)
ASRL:A robust loss function with potential for development [4.3] 本稿では, 従来のロバスト損失関数に基づく分割型ロバスト損失関数を提案する。
この損失関数の特徴は、高い堅牢性と幅広い適用性を達成することである。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:40:46 GMT)
Deep Learning in Early Alzheimer's disease's Detection: A Comprehensive Survey of Classification, Segmentation, and Feature Extraction Methods [4.1] 2015年の世界アルツハイマー病報告書によると、世界中で4680万人が認知症に苦しんでいる。
ディープラーニングは、高次元データの複雑な構造を特定することによって、従来の機械学習技術より優れている。
本研究では、オープンアクセスデータセットを用いて、早期アルツハイマー病検出のためのディープラーニングアルゴリズムの評価を行った。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:39:50 GMT)
Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer [4.0] マルチソースプロンプト転送のための適応フレームワークであるHGPromptを提案する。
まず,情報理論による特徴の伝達性の評価手法を提案する。
そこで我々は,プロンプト間の勾配衝突を軽減するために,新しい勾配アライメント正規化を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:40:21 GMT)
Longitudinal Assessment of Lung Lesion Burden in CT [4.0] アメリカでは、肺がんが死因の第2位である。
肺結節の分節と体積解析に対する多くのアプローチが提案されているが, 肺腫瘍の総負担の経時的変化を考察する例は少ない。
本研究は,肺病変を自動的に分節し,各患者の総病変負担を定量化するために,解剖学的先行と非解剖学的先行の2つの3Dモデル(nnUNet)を訓練した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:30:43 GMT)
NeuRadar: Neural Radiance Fields for Automotive Radar Point Clouds [4.0] 我々は、レーダー点雲、カメラ画像、ライダー点雲を共同で生成するNeuRadarについて紹介する。
レーダNeRFのさらなる開発を促進するため,NeuRadarのソースコードをリリースする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:30:13 GMT)
Studying and Understanding the Effectiveness and Failures of Conversational LLM-Based Repair [3.9] 自動プログラム修復(APR)は、バグ修正のプロセスを自動化するように設計されている。
会話言語モデル(LLM)を利用した高度なAPR技術は、目覚ましい修復能力を示した。
優位性にもかかわらず、会話型APR技術は依然として多くのバグを修復することができない。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:18:47 GMT)
CLaSP: Learning Concepts for Time-Series Signals from Natural Language Supervision [3.9] 本稿では,自然言語クエリを用いた時系列信号検索の新しいモデルであるCLaSPを提案する。
CLaSPは、時系列信号を自然言語記述にマッピングするために、対照的な学習を採用することで、課題に対処する。
自然言語クエリに基づく時系列パターンの検索において,CLaSPが高精度であることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:01:55 GMT)
The Power of the Pareto Front: Balancing Uncertain Rewards for Adaptive Experimentation in scanning probe microscopy [3.8] 我々はMOBOが走査型プローブ顕微鏡(SPM)イメージングパラメーターを最適化し、測定品質と効率を向上できることを示す。
MOBOはヒューマン・イン・ザ・ループによる意思決定のための自然なフレームワークを提供しており、研究者はドメインの専門知識に基づいて実験的なトレードオフを微調整できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:59:31 GMT)
Prototype-Based Continual Learning with Label-free Replay Buffer and Cluster Preservation Loss [3.8] 連続学習技術は、単純なリプレイサンプル選択プロセスを使用し、その後のタスクでそれらを使用する。
本稿では,ラベルのないプロトタイプを自動的に選択することで,これから離れる。
クラスインクリメンタルとドメインインクリメンタルのシナリオでは、"Push-away"と"pull-toward"のメカニズムも導入されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:26:26 GMT)
Understanding Users' Security and Privacy Concerns and Attitudes Towards Conversational AI Platforms [3.8] r/ChatGPT Redditコミュニティから250万以上のユーザ投稿を大規模に分析して、ユーザのセキュリティとプライバシに関する懸念を理解する。
データライフサイクルの各ステージ(すなわち、収集、使用、保持など)にユーザが関心を持っていることが分かりました。
透明性を高め、データコントロールを改善し、ユーザの信頼と採用を高めるために、ユーザ、プラットフォーム、企業、および政策立案者にレコメンデーションを提供します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:22:48 GMT)
Hybrid machine learning models based on physical patterns to accelerate CFD simulations: a short guide on autoregressive models [3.8] 本研究では,Long Short-Term Memory (LSTM) アーキテクチャと高次特異値分解を革新的に統合し,流体力学における低次モデリング(ROM)の複雑さに対処する。
この手法は、2次元および3次元のシリンダー流(2次元および3次元)を含む数値的および実験的なデータセットで試験される。
その結果、HOSVDは、異なるエラーメトリクスを用いて証明されたように、すべてのテストシナリオでSVDより優れていることが示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:56:03 GMT)
Sliced Wasserstein Discrepancy in Disentangling Representation and Adaptation Networks for Unsupervised Domain Adaptation [3.7] DRANet-SWDは、教師なし領域適応(UDA)のための画像のコンテンツとスタイル表現を分離するための完全なパイプラインである
この手法はDRANetの上に構築されており、スライスされたワッサーシュタインの差分(SWD)を従来のグラム行列損失の代わりにスタイル損失として組み込む。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:25:42 GMT)
Classifying the Unknown: In-Context Learning for Open-Vocabulary Text and Symbol Recognition [3.7] 文書中の新しいスクリプトパターンのシーケンスを分類するために,Multimodal In-Context Learning (MICL)を活用するマルチモーダルモデルであるRosettaを導入する。
提案手法の重要な強みは,オープン語彙分類を可能にするコンテキスト認識トークンライザ(CAT)を使用することである。
結果として、新しいアルファベットや言語の認識などのアプリケーションをアンロックする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:58:25 GMT)
Deep Sturm--Liouville: From Sample-Based to 1D Regularization with Learnable Orthogonal Basis Functions [3.6] 入力空間内のフィールド線に沿って連続した1次元正則化を可能にする新しい関数近似器を提案する。
Deepdimensional Sturm--Liouville (SLT) はディープラーニングフレームワークに統合されている。
我々は、ランク1パラボラ値問題の解法において、DSLの定式化が自然に発生することを実証する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:21:13 GMT)
ColonScopeX: Leveraging Explainable Expert Systems with Multimodal Data for Improved Early Diagnosis of Colorectal Cancer [3.5] 大腸癌(CRC)は、がん関連死亡の2番目に多い原因であり、世界でも3番目に多い悪性腫瘍である。
CRCの早期発見は、その非特異的でしばしば恥ずかしい症状のため、依然として問題である。
説明可能なAI(XAI)手法を利用した機械学習フレームワークであるColonScopeXを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 20:45:11 GMT)
Adaptive Computation Pruning for the Forgetting Transformer [3.5] 我々は、FoX(Fortting Transformer)のための適応計算処理(ACP)を提案する。
ACPは、インプット・アウトプットの依存関係を含む計算をリクットゲートによって強く減衰させる。
ACPは、異なるモデルサイズとコンテキストの長さで、ソフトマックスの注意におけるFLOPの数を約70%削減する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:57:55 GMT)
Zero-Shot Image-Based Large Language Model Approach to Road Pavement Monitoring [3.5] 本稿では,Large Language Models (LLMs) の画像認識と自然言語理解機能を活用し,道路条件を効果的に評価するゼロショット学習手法を提案する。
Googleストリートビューの道路画像を用いて,様々なレベルの専門家による評価に対して,最適化されたモデルをベンチマークした。
Googleストリートビューの画像に最適化されたモデルを適用することに成功し、将来の都市規模の展開の可能性を示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:19:17 GMT)
Beyond the Hype: A dispassionate look at vision-language models in medical scenario [3.4] LVLM(Large Vision-Language Models)は、様々なタスクにまたがる顕著な能力を示す。
医学などの専門分野における性能や信頼性は依然として十分に評価されていない。
本稿では,既存のLVLMを包括的に評価する新しいベンチマークであるRadVUQAを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:42:01 GMT)
Characterizing the Yang-Lee zeros of the classical Ising model through dynamic quantum phase transitions [3.4] 古典的イジングモデルの分割関数は、非エルミート力学におけるロシミット振幅と等価であることを示す。
我々の研究は、ヤン=リー零点と非エルミート力学の間の内部接続を明らかにし、前者の動的特徴付けを提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:48:49 GMT)
Clustering and novel class recognition: evaluating bioacoustic deep learning feature extractors [3.3] 生体音響学では、深層学習モデルは特徴抽出器と分類器から構成される。
分類スコアのベンチマークは、特定のパフォーマンス統計に関する洞察を提供する。
非常に異なる分類群で訓練されたモデルを比較することは不可能である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:13:18 GMT)
Robust Reinforcement Learning from Human Feedback for Large Language Models Fine-Tuning [3.3] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデルの出力と人間の嗜好を整合させる重要な手法として登場した。
既存のRLHFアルゴリズムの多くはBradley-Terryモデルを使用しており、これは人間の好みに関する仮定に依存しており、現実世界の判断の複雑さや変動性を反映していない。
そこで我々は,そのような報酬モデルの不特定条件下での既存手法の性能向上のための頑健なアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:41:09 GMT)
End2end-ALARA: Approaching the ALARA Law in CT Imaging with End-to-end Learning [3.2] CTイメージングを行うためのコンセンサスとしては、放射線線量(ALARA法則)を適度に低くすることが挙げられる。
本稿では,エンド・ツー・エンドの学習フレームワークであるEnd2end-ALARAを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:57:58 GMT)
WaveHiTS: Wavelet-Enhanced Hierarchical Time Series Modeling for Wind Direction Nowcasting in Eastern Inner Mongolia [3.2] 本稿では、ウェーブレット変換とニューラル階層型時系列補間を組み合わせた新しいモデルWaveHiTSを提案する。
提案手法は風向をU-V成分に分解し,ウェーブレット変換を用いてマルチスケールの周波数パターンを捕捉し,階層構造を用いて時間依存性をモデル化する。
中国内モンゴルからの実世界気象データを用いて行った実験では、WaveHiTSがディープラーニングモデルを大幅に上回っていることが示されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:15:48 GMT)
Holstein-Friesian Re-Identification using Multiple Cameras and Self-Supervision on a Working Farm [2.9] 複数のカメラで撮影されたMultiCamCows2024は、ホルシュタイン・フリース種牛の生体認証のための大規模画像データセットである。
データセットは、90頭の牛の101,329枚の画像と、基盤となるCCTVの映像で構成されている。
本研究では,データセットから画像の識別精度を96%以上上回る性能を報告し,学習中の複数のカメラからのデータを組み合わせることで,自己教師付き識別が促進されることを示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:01:38 GMT)
Audio-visual Event Localization on Portrait Mode Short Videos [2.9] AVE-PMは、ポートレートモードのショートビデオに特化して設計された最初のAVELデータセットである。
最先端のAVEL法は、クロスモード評価において平均18.66%のパフォーマンス低下を被っている。
ポートレートモードビデオにおけるAVELの最適前処理レシピと背景音楽の影響について検討する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:38:40 GMT)
Compound and Parallel Modes of Tropical Convolutional Neural Networks [2.9] 熱帯畳み込みニューラルネットワーク(TCNN)は乗算を減少させるが、通常のCNNと比較して性能は劣る。
化合物TCNN(cTCNN)と並列TCNN(pTCNN)の2つの新しい変種を提案する。
様々なデータセットの実験では、cTCNNとpTCNNは、他のCNNメソッドのパフォーマンスと一致しているか、あるいは上回っている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:36:11 GMT)
Adapting GT2-FLS for Uncertainty Quantification: A Blueprint Calibration Strategy [2.8] 不確実性定量化(UQ)は、信頼性の高いディープラーニング(DL)モデルを高スループットアプリケーションにデプロイするために不可欠である。
General Type-2 Fuzzy Logic Systems (GT2-FLSs) は、不確実性を捉えるために予測インターバル(PI)を提供するUQに有効であることが証明されている。
本研究では,GT2-FLSのブループリント校正戦略を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:32:43 GMT)
Bypassing Safety Guardrails in LLMs Using Humor [2.8] 我々は,大言語モデル(LLM)の安全ガードレールをユーモラスなプロンプトで回避可能であることを示す。
我々のメソッドは安全でないリクエストを編集せず、固定されたテンプレートに従う。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 04:58:14 GMT)
Off-the-grid learning of mixtures from a continuous dictionary [2.8] 我々は,信号が未知の,おそらく増大する可能性のある,真の非線形パラメータによってパラメータ化された連続辞書から発行される特徴量の有限混合である一般非線形モデルを考える。
そこで本研究では,パラメータ空間上の離散化スキームを一切用いないオフ・ザ・グリッド最適化手法を提案する。
線形パラメータと非線形パラメータの両方に対する推定の質を高い確率で定量化する収束率を確立する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:17:29 GMT)
Fully smooth one shot multipartite covering and decoupling of quantum states via telescoping [2.7] 量子状態に対する完全スムーズな多重分割と凸分割の結果を証明した。
また、量子多重アクセスチャネル上で量子情報を送信するための自然多面体内部境界を初めて証明することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:20:39 GMT)
LUDO: Low-Latency Understanding of Deformable Objects using Point Cloud Occupancy Functions [2.7] 本稿では,変形可能な物体の高精度な低レイテンシ理解手法LUDOを紹介する。
LUDOは、内部構造を含む変形した状態の物体を、30ms以下の単一視点の雲観測から再構成する。
変形可能な物体に注目する内部領域を自律的ターゲティングするLUDOの能力を実証する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:47:52 GMT)
Corrected with the Latest Version: Make Robust Asynchronous Federated Learning Possible [2.7] 本稿では,FedADTという知識蒸留に基づく非同期フェデレーション学習バージョン修正アルゴリズムを提案する。
FedADTは、勾配を集約する前に知識蒸留を適用し、最新のグローバルモデルを用いて古い情報を修正し、古い勾配がトレーニングプロセスに負の影響を効果的に低減する。
その結果,FedADTは他の非同期手法よりも大幅に改善され,コンバージェンス速度の点で全ての手法より優れることが示された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:42:03 GMT)
Efficient Deployment of Spiking Neural Networks on SpiNNaker2 for DVS Gesture Recognition Using Neuromorphic Intermediate Representation [2.6] スパイキングニューラルネットワーク(SNN)は、推論時に非常にエネルギー効率が高い。
ダイナミックビジョンセンサー(DVS)のデータなどのイベント駆動入力を処理する能力により、エッジコンピューティングタスクへの適用性はさらに向上する。
マルチコアニューロモルフィックチップSpiNNaker2に最適化されたSNNを用いたDVSジェスチャー認識タスクの最初のベンチマークを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:09:29 GMT)
Automating Customer Needs Analysis: A Comparative Study of Large Language Models in the Travel Industry [2.4] 大規模言語モデル(LLM)は、大量のテキストデータから貴重な洞察を抽出する強力なツールとして登場した。
本研究では,TripAdvisor と Reddit の投稿から旅行客のニーズを抽出するための LLM の比較分析を行った。
特にMistral 7Bは,大規模クローズドモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:21:07 GMT)
ChatEMG: Synthetic Data Generation to Control a Robotic Hand Orthosis for Stroke [2.4] ChatEMGは自己回帰生成モデルであり、プロンプトで条件付けられた合成EMG信号を生成することができる。
インテント分類器が脳卒中生存者によって整形機能の制御のためにデプロイされたのはこれが初めてである。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:49:04 GMT)
Multi-Object Tracking for Collision Avoidance Using Multiple Cameras in Open RAN Networks [2.4] 本稿では,オープン無線アクセスネットワーク(RAN)の範囲内でのマルチオブジェクト検出・追跡問題を扱う。
この目的のために、カメラとコロケーションされた分散インテリジェントエージェントのセットを検討する。
検出されたオブジェクトの融合は、Open RAN接続性を考慮してエッジサービスで実行される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:36:40 GMT)
Integrating Cognitive Processing Signals into Language Models: A Review of Advances, Applications and Future Directions [2.4] 本稿では,認知信号,特に眼球追跡(ET)信号を活用した言語モデル(LM)とマルチモーダル大言語モデル(MLLM)の最近の進歩について概説する。
ユーザ中心の認知シグナルを取り入れることで、これらのアプローチは、データの不足や大規模モデルをトレーニングする際の環境コストなど、重要な課題に対処する。
このレビューでは、視覚質問回答(VQA)やMLLMにおける幻覚の緩和といったタスクにおけるETデータの可能性を強調し、新たな課題や研究トレンドについて議論することで結論付けている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:01:48 GMT)
Unraveling Human-AI Teaming: A Review and Outlook [2.3] 人工知能(AI)は前例のないペースで進歩しており、意思決定と生産性を高める可能性がある。
しかし、人間とAIの協調的な意思決定プロセスはまだ未開発であり、しばしばその変革の可能性に欠ける。
本稿では,AIエージェントの受動的ツールから,複雑な環境下での学習,適応,自律的な運用能力を強調した,人間-AIチームの積極的な協力者への進化について考察する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:20:05 GMT)
Code Generation with Small Language Models: A Deep Evaluation on Codeforces [2.3] 小言語モデルは、より高速な推論、デプロイメントオーバーヘッドの低減、ドメイン固有のタスクへの適応性の向上を提供する。
800から2100までのEloレーティングにまたがる280のCodeforce問題の5つのオープンSLMをベンチマークします。
PHI-4 14BはSLMの中で最高の性能を発揮し、パス@3は63.6%だった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:57:44 GMT)
A Multi-Phase Analysis of Blood Culture Stewardship: Machine Learning Prediction, Expert Recommendation Assessment, and LLM Automation [2.3] 血の文化は、しばしば明確な正当化なしに過度に秩序づけられる。
135483 救急部門 (ED) の血液培養命令について検討し,細菌性貧血のリスクを予測する機械学習モデルを開発した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:12:29 GMT)
CoTAL: Human-in-the-Loop Prompt Engineering, Chain-of-Thought Reasoning, and Active Learning for Generalizable Formative Assessment Scoring [2.2] チェーン・オブ・ソート(CoT)のような手法は、教師が科学の形式的評価を格付けできるようにする。
これらの手法が複数の領域でキュリキュラにまたがる一般化の程度は、まだほとんど証明されていない。
書式評価評価のための LLM ベースのアプローチである Chain-of-Thought Prompting + Active Learning (CoTAL) を導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:50:32 GMT)
Artificial Intelligence for Pediatric Height Prediction Using Large-Scale Longitudinal Body Composition Data [2.1] このモデルには、人文計測測度、体組成、標準偏差スコア、成長速度パラメータが含まれていた。
その結果, 平均RMSE, MAE, MAPEは2.51cm, 1.74cm, 1.14%, 女性は2.28cm, 1.68cm, 1.13%であった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:32:15 GMT)
Deep Neural Koopman Operator-based Economic Model Predictive Control of Shipboard Carbon Capture System [2.1] クープマンフレームワークにおけるデータ駆動型動的モデリングと経済予測制御手法を提案する。
この統合モデリングと制御のアプローチは、船舶の燃焼後炭素捕獲プラントの安全でエネルギー効率の良いプロセス運用を実現するために用いられる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:22:42 GMT)
Disentangle and Regularize: Sign Language Production with Articulator-Based Disentanglement and Channel-Aware Regularization [1.8] 我々は,手話のポーズをコンパクトな潜在空間にエンコードするポーズオートエンコーダを,調音器によるアンタングルメント戦略を用いて訓練する。
非自己回帰変換器デコーダは、文レベルのテキスト埋め込みから潜在表現を予測するために訓練される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:14:19 GMT)
Learning to erase quantum states: thermodynamic implications of quantum learning theory [1.7] 学習アルゴリズムは最適エネルギーコストで未知の状態の多くのコピーを消去できることを示す。
これは、学習が完全に可逆的にでき、基本的なエネルギーコスト自体を持たないことを示すことで証明される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:51:01 GMT)
EzSQL: An SQL intermediate representation for improving SQL-to-text Generation [1.6] 我々は、自然言語のテキストシーケンスと整合するEzと呼ばれる新しいモデルを開発した。
Ezは演算子とキーワードを変更することで、クエリを自然言語テキストに近づける。
ウィキやスパイダーのデータセットのクエリからテキスト記述を生成する手法として,本モデルが有効であることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:40:29 GMT)
Noise-based Local Learning using Stochastic Magnetic Tunnel Junctions [1.6] 多層ニューラルネットワークを実装した物理システムに対して,新しい雑音に基づく学習手法を提案する。
スピントロニクスのハードウェア実装を用いて、物理磁気トンネル接合からなる小さなネットワークにおいて学習が達成できることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:01:35 GMT)
A Comparison of Deep Learning Methods for Cell Detection in Digital Cytology [1.6] Papanicolaou-stained cytological Whole Slide Images (WSIs) における細胞検出のためのDeep Learning (DL) 法の性能評価を行った。
市販のアルゴリズムとカスタム設計の検出器について検討し、2つのデータセットに適用する。
その結果、特に改良された完全畳み込み回帰ネットワーク(IFCRN)法は、検出精度と計算効率の両方の観点からセグメンテーションに基づく手法よりも優れていた。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:08:12 GMT)
Carbon-Efficient Software Design and Development: A Systematic Literature Review [1.6] 我々は,カーボン効率のソフトウェアを設計・開発するための最先端の提案について,体系的な文献レビューを行う。
我々は,炭素効率のソフトウェア設計と開発に関する5W1Hの疑問に答えることを目的とした分類法により,65の初等研究を同定し,分析する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:12:00 GMT)
Teaching pathology foundation models to accurately predict gene expression with parameter efficient knowledge transfer [1.5] PEKA(Efficient Knowledge Adaptation)は、クロスモーダルな知識伝達のための知識蒸留と構造アライメント損失を統合する新しいフレームワークである。
複数の空間転写学データセットを用いた遺伝子発現予測のためのPEKAの評価を行った。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:24:41 GMT)
PAYADOR: A Minimalist Approach to Grounding Language Models on Structured Data for Interactive Storytelling and Role-playing Games [1.5] PAYADORはアクション自体を表現するのではなく、アクションの結果を予測することに重点を置いている。
このコントリビューションをオープンソースにすることで、RPGの共創造力を解き放つ他の研究に適応し、使用することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:59:31 GMT)
RNN-Transducer-based Losses for Speech Recognition on Noisy Targets [1.5] RNN-Transducerモデルにおける転写誤りの影響を軽減するために,新しい損失関数を導入する。
我々のStar-Transducer損失は、損失格子に「スキップフレーム」遷移を組み込むことで、削除エラーに対処する。
Bypass-Transducer損失は「スキップトークン」遷移を使用して挿入エラーに対処し、品質の60%以上を回復する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:18:29 GMT)
Large-Scale (Semi-)Automated Security Assessment of Consumer IoT Devices -- A Roadmap [1.5] IoT(Internet of Things)は、さまざまな分野に急速に拡大し、コンシューマIoTデバイスが成長している。
共通して簡単に発見できる脆弱性により、IoTデバイスは悪意のあるアクターのターゲットとなる。
本稿では、現在のIoTセキュリティ課題とアセスメントの取り組みをレビューし、ギャップを特定し、スケーラブルで自動化されたセキュリティアセスメントのロードマップを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:15:04 GMT)
Experimental Implementation of a Qubit-Efficient Variational Quantum Eigensolver with Analog Error Mitigation on a Superconducting Quantum Processor [1.5] 超伝導量子プロセッサを用いた量子ビット効率変動量子固有解法(VQE)アルゴリズムの実験的検討を行った。
行列積状態を利用して量子状態表現を圧縮することにより、N + 1-スピン円イジングモデルを横場でシミュレートする。
検証として, 4スピンイジングモデルの基底状態エネルギーを決定するために, 誤差緩和量子ビット効率VQEを適用した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:23:26 GMT)
Let SSMs be ConvNets: State-space Modeling with Optimal Tensor Contractions [1.4] 本稿では、一般化状態空間モデル(SSM)ブロックで構成されるネットワークのクラスであるCentaurusを紹介する。
この異種ネットワーク設計は、生音声処理タスクにおいて、同種ネットワークよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:05:31 GMT)
Wheat3DGS: In-field 3D Reconstruction, Instance Segmentation and Phenotyping of Wheat Heads with Gaussian Splatting [1.4] We present Wheat3DGS, a novel approach that leverageing 3DGS and the Segment Anything Model (SAM) for accurate 3D instance segmentation and morphological Measurement of hundreds of wheat head automatically。
高分解能レーザースキャンデータによるコムギの育種頭部抽出の精度を検証し, 長さ, 幅, 体積に対して15.1%, 18.3%, 40.2%の絶対値誤差が得られた。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:31:42 GMT)
Monte Carlo Temperature: a robust sampling strategy for LLM's uncertainty quantification methods [1.4] 本研究では,温度校正の必要性を解消するロバストサンプリング戦略を提案する。
MCTは、幅広い温度でより堅牢な不確実性推定を提供する。
MCTはオラクル温度と統計的に同等であり、これはよく調整されているが計算に費用がかかるHPOプロセスの理想的な結果である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:40:21 GMT)
Optical pumping through the Liouvillian skin effect [1.4] 我々は、リウビリアの皮膚効果の観点から、典型的な光ポンピングプロセスが理解可能であることを示した。
以上の結果から, 光ポンピングは, 状態調製と冷却に重要な意味を持つと考えられる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:45:33 GMT)
HoTPP Benchmark: Are We Good at the Long Horizon Events Forecasting? [1.4] 長軸予測を厳格に評価するために設計された最初のベンチマークである HoTPP を紹介する。
我々は,広く使用されている評価指標の欠点を特定し,理論的に基礎付けられたT-mAP尺度を提案し,人気モデルの効率的な実装を提供する。
我々は,自己回帰と強度に基づく損失が予測品質に与える影響を分析し,今後の研究に向けた有望な方向性を概説する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:59:49 GMT)
Exploring the Potential of Quantum Approximate Optimization Algorithm in Tackling the Perfect Domination Problem [1.3] 完全支配問題(PDP)は、無線やソーシャルネットワークといった現実のシナリオにおいて重要な応用がある。
量子コンピューティングの最近の進歩により、NP完全問題に対処する量子アルゴリズムの開発が急増した。
この研究は、量子アルゴリズムをPDPに適用する先駆的な取り組みであり、それを解決するための有効性を示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:42:55 GMT)
Determining Fetal Orientations From Blind Sweep Ultrasound Video [1.3] この作品は、自動化された胎児の嘘予測を導入し、それを置き換えるのではなく、ソノグラフィーの専門知識を強化する補助パラダイムを提案することで、自分自身を区別している。
今後の研究は、取得効率の向上と、ワークフローを改善するためのリアルタイム臨床統合と、産科医のサポートに焦点をあてる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:51:15 GMT)
Linguistic Interpretability of Transformer-based Language Models: a systematic review [1.3] Transformerアーキテクチャに基づく言語モデルは、多くの言語関連タスクにおいて優れた結果をもたらす。
しかし、それらの内部計算がどのように結果を達成するかは分かっていない。
しかし、「解釈可能性」という一連の研究は、これらのモデル内でどのように情報がエンコードされているかを学ぶことを目的としている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:00:12 GMT)
Compressing Hamiltonians with \emph{ab initio} downfolding for simulating strongly-correlated materials on quantum computers [1.3] 我々は、量子アルゴリズムを用いて、下向きのハミルトンの物性を得ることができ、確実に高忠実性解が得られることを示した。
我々は最大54ドルビットの大型モデルをシミュレートし、相関部分空間に最大4つのバンドを包含する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:50:06 GMT)
Mechanistic Anomaly Detection for "Quirky" Language Models [1.3] 我々は、機械的異常検出を用いて、有能なモデルの監視を強化する。
我々は、トレーニング環境と大きく異なるテスト環境から点をフラグする検出器を訓練する。
検知器はいくつかのタスクで高い差別を達成することができるが、すべてのモデルやタスクで有効な検出器は存在しない。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:03:18 GMT)
FACT: Multinomial Misalignment Classification for Point Cloud Registration [1.3] 本稿では,登録ライダー点雲対のアライメント品質(登録誤差)を予測するためのFACTを提案する。
FACTは、登録されたペアからローカル特徴を抽出し、ポイントトランスフォーマーベースのネットワークで処理し、ミスアライメントクラスを予測する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:01:57 GMT)
Using Large Language Models to Develop Requirements Elicitation Skills [1.1] チャットベースのインタビューにおいて,クライアントの役割を果たすために,大規模言語モデルを条件付けすることを提案する。
どちらの手法も、参加者が技術的に健全なソリューションを構築するのに十分な情報を提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:37:25 GMT)
Levels of Binary Equivalence for the Comparison of Binaries from Alternative Builds [1.1] ビルドプラットフォームの可変性は、妥協されたビルド環境の検出を容易にするため、セキュリティを強化することができる。
同じソースから構築された複数のバイナリの可用性は、新たな課題と機会を生み出します。
そのような質問に答えるためには、バイナリ間の等価性の概念が必要である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:55:38 GMT)
Enhancing Downstream Analysis in Genome Sequencing: Species Classification While Basecalling [1.0] 本稿では,ヌクレオチド配列の決定と並行して,シークエンシング装置からの信号のプロファイリングを行う手法を提案する。
本稿では,共有層に対するモデル重みを組み合わせて,ベースコールと分類の損失を個別にバックプロモートする新たな損失戦略を提案する。
我々は最先端のベースコール精度を達成する一方、分類精度は最先端のバイナリ分類器の結果を超えている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:30:43 GMT)
Generative AI in Live Operations: Evidence of Productivity Gains in Cybersecurity and Endpoint Management [1.0] 我々は、生成AI(GAI)ツールの採用と、セキュリティ操作、情報保護、エンドポイント管理にまたがる4つのメトリクスとの関係を計測する。
GAIは、4つの指標の堅牢で統計的、事実上重要な改善と結びついている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:34:20 GMT)
Training the parametric interactions in an analog bosonic quantum neural network with Fock basis measurement [1.0] 量子ニューラルネットワークは、量子状態の自動認識のための量子デバイスとシームレスに統合される可能性がある。
本稿では, ボソニックモードの活用とFockベース測定の実施を提案し, モード数に対する指数関数的な特徴の抽出を可能にした。
トレーニング可能なパラメータの数はモード数に比例して線形にしかスケールしないのに対して、ニューロン数は指数関数的に増加するのに対して、ネットワークはトレーニング可能であることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:18:22 GMT)
Architecture independent generalization bounds for overparametrized deep ReLU networks [1.0] 過度パラメータ化ニューラルネットワークは、過度パラメータ化のレベルに依存しないテストエラーで一般化できることを示す。
入力空間次元で有界なトレーニングサンプルサイズを持つ過度にパラメータ化された深部ReLUネットワークに対して、勾配勾配を使わずにゼロ損失最小化器を明示的に構築する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:29:05 GMT)
The membership problem for constant-sized quantum correlations is undecidable [0.8] 測定結果の数と測定結果の数が固定された,一定サイズの相関関係の族が存在することを示す。
これは量子相関集合に対して与えられる記述の種類に強い制約を与える。
本証明は, 線形システム非局所ゲームにおいて, 量子自己検定法と第3著者の判定不能結果を組み合わせたものである。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:44:10 GMT)
Beyond the Hype: Embeddings vs. Prompting for Multiclass Classification Tasks [0.8] 組込み型ソフトマックスモデルを構築し,各問題記述に関連する専門的カテゴリを予測する。
我々は、最先端のLLMモデルに同じ問題を解決するよう求めるプロンプトと比較する。
埋め込みアプローチは、精度、キャリブレーション、レイテンシ、金銭的コストの観点から、最高のLCMプロンプトよりも優れていることが分かりました。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:15:47 GMT)
Accurate Gauge-Invariant Tensor Network Simulations for Abelian Lattice Gauge Theory in (2+1)D [0.8] 本研究では,(2+1)Dにおけるアベリア格子ゲージ理論(LGT)の高精度かつ効率的なシミュレーションを実現するための新しい手法を提案する。
第1の鍵はゲージ不変テンソルネットワーク状態のゲージ標準形式(GCF)を特定することである。
第2の鍵は、(2+1)D LGT基底状態とゲージ場と物質場との効率的な変分最適化を実現するために、モンテカルロ変分法を組み合わせた射影対ペア状態(PEPS)のGCFを用いることである。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:34:08 GMT)
Proof or Bluff? Evaluating LLMs on 2025 USA Math Olympiad [0.8] 我々は2025年のUSAMOの6つの問題に対して、最先端の推論モデルを評価する。
Gemini-2.5-Proのみが25%という非自明なスコアを達成している。
以上の結果から,現在のLLMは厳密な数学的推論作業には不十分であることが示唆された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:41:59 GMT)
Acceptance Test Generation with Large Language Models: An Industrial Case Study [0.8] 大規模言語モデル(LLM)を利用したアシスタントは、プログラムコードや単体テストの生成にますます利用されている。
本稿では,2段階のプロセスでWebアプリケーションの実行可能受け入れテストを生成するLLMについて検討する。
この2段階のアプローチは、受け入れテスト駆動開発をサポートし、テスターコントロールを強化し、テスト品質を向上させる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:33:38 GMT)
Short two-qubit pulse sequences for exchange-only spin qubits in 2D layouts [0.7] 量子ドット内の交換専用(EO)スピンキュービットは、スケーラブルなデバイスレイアウトを設計するための広大なデザインランドスケープを提供する。
我々は,CX,CZ,iSWAP,リーク制御CX,リーク制御CZ2量子ゲートの完全なパルス列を生成する。
私たちの研究は、スケーラブルな量子ドットアーキテクチャの将来の実装のためのハードウェアとソフトウェア設計の選択をガイドします。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:01:49 GMT)
Glocalizing Generative AI in Education for the Global South: The Design Case of 21st Century Teacher Educator AI for Ghana [0.7] 21世紀のガーナGPT教育者(21th Teacher Educator for Ghana GPT)は、OpenAIのRetrieval-Augmented Generation(RAG)とInteractive Semi-Automated Prompting Strategy(ISA)を使ったカスタマイズされた生成AI(GenAI)ツールである。
このツールは、局所的な言語、文化、カリキュラムのコンテンツを、倫理的および責任あるAI使用のグローバルな原則に組み込むことで、ガーナのサービス前教師を支援する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:28:35 GMT)
Data-driven Fuzzy Control for Time-Optimal Aggressive Trajectory Following [0.7] 本研究は,マルチコプター追跡問題に対する時間最適軌道で導かれるデータ駆動型ファジィコントローラフレームワークを提案する。
高木-菅野ファジィフレームワークを用いて、ホバリング条件近傍の安定化コントローラと、時間最適の攻撃軌道を模倣するように訓練された自己回帰移動平均(ARMA)コントローラからなるファジィコントローラを構築する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:06:15 GMT)
AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection [0.7] AMADはUMTStextbfADシナリオに対するtextbfAutotextbfMasked Attentionを統合している。
AMADはUMTSADの課題に対して堅牢で適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:32:59 GMT)
Human and LLM Biases in Hate Speech Annotations: A Socio-Demographic Analysis of Annotators and Targets [0.7] 我々は、アノテータとターゲットの両方の社会デマトグラフィー情報を豊富なデータセットで活用する。
分析の結果,その強度と有病率に基づいて定量的に記述し,特徴付ける広範囲なバイアスの存在が明らかになった。
私たちの研究は、ヘイトスピーチアノテーションにおける人間のバイアスに関する新しい、そして、AI駆動のヘイトスピーチ検出システムの設計に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:05:27 GMT)
Bregman-Hausdorff divergence: strengthening the connections between computational geometry and machine learning [0.7] 我々は、人気のあるKulback--Leiblerの発散を含むBregmanの発散の家族に焦点を当てる。
概念の証明として、結果のブレグマン-ハウスドルフ発散を用いて確率的予測の2つの集合を比較する。
提案するアルゴリズムは、数百の次元を持つ大きな入力に対しても驚くほど効率的である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:42:29 GMT)
Atomic Regional Superfluids in two-dimensional Moiré Time Crystals [0.6] モアレ物理学は空間次元を超越し、合成領域に拡張し、量子現象を可能にする。
非格子トラップに印加される周期的摂動により誘導される超低温原子によって形成される2流体(2D)モワールテン時間結晶の理論モデルを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:31:31 GMT)
Compressing Search with Language Models [0.6] 本稿では,探索データの次元性を低減するための新しい手法を提案する。
私たちは、ユーザー定義のルールなしで、個々の用語で多くの情報を保持します。
実世界の事象を検索データのみを用いて推定するための制約付き検索モデルであるCoSMoを提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:34:22 GMT)
A Survey of Source Code Representations for Machine Learning-Based Cybersecurity Tasks [0.6] この記事では、異なるサイバーセキュリティタスクやプログラミング言語にどのような表現が使われたかを示す。
グラフベースの表現が表現の最も一般的なカテゴリであり、トークン化子と抽象構文木(AST)が全体として最も人気のある表現であることがわかった。
最も一般的なサイバーセキュリティタスクは脆弱性検出であり、最もテクニックによってカバーされる言語はCです。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:06:35 GMT)
Floralens: a Deep Learning Model for the Portuguese Native Flora [0.6] 本稿では,ポルトガル原生植物群を対象とした,公開可能な研究グレードデータセットに基づくデータセットの構築について述べる。
既成の深層畳み込みニューラルネットワークを用いて高精度モデルを導出する。
最も優れたモデルであるFloralensは、Project Biolensの公開ウェブサイトに統合されました。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:12:38 GMT)
COGNAC: Circuit Optimization via Gradients and Noise-Aware Compilation [0.3] 我々は、量子回路をコンパイルするための新しい戦略であるCOGNACを提案する。
回転角をゼロにすることで、COGNACは回路からゲートを取り除き、より小さな量子回路を生成する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:39:13 GMT)
Quantized symbolic time series approximation [0.3] 本稿では,新しい量子化に基づくABBA記号近似手法,QABBAを提案する。
QABBAは、元の速度とシンボル再構成の精度を維持しながら、ストレージ効率を向上させる。
時系列回帰のための大規模言語モデル(LLM)を用いたQABBAの応用についても述べる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:46:27 GMT)
Oil Spill Segmentation using Deep Encoder-Decoder models [0.3] 最高のパフォーマンスモデルはResNet-50エンコーダとDeepLabV3+デコーダである。
64.868%のIoU、改良されたIoUは61.549%の石油流出率を達成している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:06:22 GMT)
EDIT: Enhancing Vision Transformers by Mitigating Attention Sink through an Encoder-Decoder Architecture [0.3] EDIT(Encoder-Decoder Image Transformer)は、Vision Transformerモデルで観測される注目シンク現象を軽減するために設計された新しいアーキテクチャである。
EDITはシーケンシャル・アテンション・マップを通じて自然に解釈可能であり、キー画像の特徴に焦点を絞った洗練されたレイヤー・バイ・レイヤを描いている。
ImageNet-1kとImageNet-21kの実験は、転送学習タスクとともに、EDITがDeiT3モデルよりも一貫したパフォーマンス改善を実現していることを示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:51:41 GMT)
Generating graph states with a single quantum emitter and the minimum number of fusions [0.2] グラフ状態は、光子を用いた計測および融合に基づく量子コンピューティングの鍵となる資源である。
単一量子エミッタと線形光学的ベル状態測定を用いたハイブリッドグラフ状態生成方式を最適化する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:25:39 GMT)
LostPaw: Finding Lost Pets using a Contrastive Learning-based Transformer with Visual Input [0.2] 本研究では,ペットのイメージを正確に識別できるコントラストニューラルネットワークモデルを提案する。
このモデルは、犬画像の大規模なデータセットに基づいて訓練され、3倍のクロスバリデーションによって評価された。
我々の研究結果は、失われたペットを見つけるためのツールとして、コントラストニューラルネットワークモデルが約束されていることを示唆している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:17:26 GMT)
Youth as Advisors in Participatory Design: Situating Teens' Expertise in Everyday Algorithm Auditing with Teachers and Researchers [0.0] 我々は、高校生のコンピュータサイエンスの教師と研究者-設計者による学習活動のアドバイザーとして、青春を定めている。
具体的には,若年者や成人が生成型AIアルゴリズムシステムに批判的評価を行うためのエントリーポイントとして,アルゴリズム監査について検討する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:27:17 GMT)
Wigner Function of Observed Quantum Systems [0.0] ウィグナー関数は、古典的な統計力学から受け継いだ道具で量子力学場を記述する試みとして導入された。
本稿では、任意の量子状態のウィグナー関数に対して閉形式表現を提供するために、フォック状態の基礎を用いる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:11:27 GMT)
Visualisation of a multidimensional point cloud as a 3D swarm of avatars [0.0] この記事では、Chernoffの顔にインスパイアされたアイコンを用いて、多次元データの可視化に対する革新的なアプローチを示す。
このアプローチは、特徴を模倣するために、古典的な射影技法と特定のデータ次元の割り当てをマージする。
この技術は、dpVisionオープンソースイメージハンドリングプラットフォームのプラグインとして実装されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:14:33 GMT)
VQE calculations on a NISQ era trapped ion quantum computer using a multireference unitary coupled cluster ansatz: application to the BeH$_2$ insertion problem [0.0] 我々は、強い相関効果が重要である幾何学において、BeH$Forte$分子の基底状態エネルギーを報告する。
ノイズの多い中間スケール量子時代トラップイオンハードウェア上での12量子ビット計算を実現するため,資源削減手法を多数実施する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:52:37 GMT)
Translation symmetry restoration under random unitary dynamics [0.0] 初期状態によって破壊される力学の特定の対称性が、与えられたサブシステムの縮小状態のレベルでどのように復元されるかを検討する。
ここでは、時空対称性の復元に同じ論理を適用することができ、従って完全な汎用システムの緩和を特徴付けることができることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:46:31 GMT)
Towards scalable active steering protocols for genuinely entangled state manifolds [0.0] マルチパーティの絡み合った状態をターゲットにしたアクティブステアリングプロトコルを導入・解析する。
最大22量子ビットのシステムに対する数値シミュレーションでは、このプロトコルはスケーラブルであり、システム間の高マルチパーティントの絡み合いを可能にすることが示唆されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:24:49 GMT)
The curious case of operators with spectral density increasing as $Ω(E)\sim e^{\,\mathrm{Const.}\, E^2}$ [0.0] 実際そのような作用素は存在するが、かなり特異な型を持ち、波動関数はわずかに局所化されているだけである。
このような非局在状態とブラックホールの間の緊張関係をコンパクト物体として指摘する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:44:28 GMT)
The Method for Storing Patterns in Neural Networks-Memorization and Recall of QR code Patterns- [0.0] 本稿では,ニューラルネットワーク内に複雑なパターンを格納し,それをリコールする機構を提案する。
ニューラルネットワークにパターンを格納する利点は、不完全なバージョンが提示された場合でも、元のパターンをリコールする能力にある。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:09:40 GMT)
The Gendered Algorithm: Navigating Financial Inclusion & Equity in AI-facilitated Access to Credit [0.0] さまざまな企業が、携帯電話のデータを収集し、機械学習(ML)を使用して、従来の銀行から離れたグループに信用スコアを提供するアプリを開発している。
本稿は、低所得国と中所得国でMLベースの代替融資アプリを開発する企業における、リーダー、投資家、データサイエンティストとのインタビューデータに基づく。
発見は、MLが客観的でデータが真実を反映しているという信念に基づいて、開発者が'ジェンダーブラインド'アプローチに従うことを示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:28:21 GMT)
The Dirac Equation, Mass and Arithmetic by Permutations of Automaton States [0.0] 我々は1 + 1次元のディラック方程式を表現するために、トーラスのような位相を持つ新しいネックレス・オブ・ネックレスのオートマトンを構築した。
先に述べたように、離散スピンやビットのそのような決定論的モデルは、わずかに変形しただけで量子力学的になる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:37:12 GMT)
The Artificial Intelligence Disclosure (AID) Framework: An Introduction [0.0] 本稿では、教育・研究のためのGenAI開示の開発と作成を知らせる標準的で包括的で詳細なフレームワークである人工知能開示(AID)フレームワークを紹介する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:03:37 GMT)
Swinging small quantum systems out of available values of control parameters [0.0] 相互作用強度を制御パラメータとして扱う小型量子システムに対して,このような最適化手法を適用する方法を示す。
提案手法は様々な複雑な量子システムに創造的に拡張できると考えている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:37:49 GMT)
Spectroscopy of collective modes in a Bose-Einstein condensate: From single to double excitation periods [0.0] 集合モードはボース=アインシュタイン凝縮体(BEC)におけるコヒーレント励起である
それらは、トラップ幾何学、原子間相互作用、欠陥の存在など、BECの特性を探索するために用いられる。
本稿では,2つの振動場を時間的に分離したRabiライクなプロトコルよりも優れた分解能を実現する方法を提案する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:48:46 GMT)
SemEval-2025 Task 5: LLMs4Subjects -- LLM-based Automated Subject Tagging for a National Technical Library's Open-Access Catalog [0.0] 本稿では,SemEval-2025 Task 5: LLMs4Subjectsについて紹介する。
参加者は、トップk被験者を推薦するシステムを開発し、定量的指標(精度、リコール、F1スコア)と、被験者の専門家による質的評価を通じて評価した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:26:46 GMT)
Self-testing in the compiled setting via tilted-CHSH inequalities [0.0] コンパイルされた2プロベルシナリオに対する自己テストの概念を定式化する。
我々は,コンパイルされた不等式の設定における最大違反が,コンパイルされた設定における自己テストの概念を満たすことを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:42:11 GMT)
Scalable quantum neural networks by few quantum resources [0.0] 本稿では,数量子ビット上で複数のスワップテストを実行するための一般パラメトリックモデルの構築に着目する。
このモデルは、小さな量子モジュールを組み合わせた2層フィードフォワードニューラルネットワークと等価であることが判明した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:57:46 GMT)
S-EO: A Large-Scale Dataset for Geometry-Aware Shadow Detection in Remote Sensing Applications [0.0] S-EOデータセットは、ジオメトリ対応のシャドウ検出を前進させるために設計された、大規模で高解像度のデータセットである。
データセットは米国全体で702個の測地タイルで構成され、それぞれ500×500mをカバーしている。
各画像に対して、幾何と太陽の位置から派生した影マスク、NDVI指数に基づく植生マスク、バンドル調整RPCモデルを提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:25:35 GMT)
RuOpinionNE-2024: Extraction of Opinion Tuples from Russian News Texts [0.0] その任務は、ある文に対する意見を抽出することである。
意見は、感情保持者、その目標、表現と目標に対する感情から成り立っている。
テストセット上での最良の結果は、大きな言語モデルの微調整によって得られた。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:54:00 GMT)
Review of Case-Based Reasoning for LLM Agents: Theoretical Foundations, Architectural Components, and Cognitive Integration [0.0] ケースベース推論(CBR)は、過去の経験を参照することによって、新しい問題を解決する戦略である。
本稿では、過去の経験を参照して新しい問題を解決する戦略であるケースベース推論(CBR)を大規模言語モデルに組み込む方法について考察する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:51:02 GMT)
Quantum vs classical Markov chains; Exactly solvable examples [0.0] グラフ上の一般可逆マルコフ連鎖のコインレス量子化手順を示す。
量子ハミルトン H は、基本遷移確率行列 K の類似性変換によって得られる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:34:20 GMT)
Quantum and Classical Dynamics with Random Permutation Circuits [0.0] 量子多体系における熱化が古典多体系と根本的に異なるかどうかを考察する。
そこで我々は,局所的な透過基底状態を持つランダムな置換回路(RPC)のクラスを導入し,汎用的な顕微鏡的古典力学をモデル化する。
RUCと同様に、RPCsは、OOC(out-of-time order correlator)や絡み合いエントロピーなど、いくつかの重要な量の解析的計算を可能にする。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:23:21 GMT)
Prompting or Fine-tuning? Exploring Large Language Models for Causal Graph Validation [0.0] 本研究では,因果グラフの因果性を評価するための大規模言語モデルの有用性について検討する。
本研究では,(1)ゼロショットと少数ショットの因果推論のためのプロンプトベース手法,(2)因果関係予測タスクのための微調整言語モデルの比較を行った。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 04:44:48 GMT)
Probing dipolar interactions between Rydberg atoms and ultracold polar molecules [0.0] 超低温の40$K$87$Rb分子とライドバーグの87$Rb原子との共振双極子相互作用を光学的に閉じ込められたアンサンブルで探索する。
我々は、リドベルク原子から分子への2.227GHzの共鳴エネルギー移動を、調整可能な外部電場下で観測する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:31:02 GMT)
PriM: Principle-Inspired Material Discovery through Multi-Agent Collaboration [0.0] 言語推論型マルチエージェントシステム(MAS)を利用した原理誘導型材料発見システムを提案する。
本フレームワークは,MASのラウンドテーブルシステムにおいて,自動仮説生成と実験検証を統合する。
この枠組みに基づいて,ナノヘリックスのケーススタディにより,より高い材料探索率と特性値を示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:05:10 GMT)
Poly-Vector Retrieval: Reference and Content Embeddings for Legal Documents [0.0] 法的文脈では、ユーザーは自分のコンテンツではなく、ラベルやあだ名によってしばしばノルムを参照する。
本稿では,各法則に複数の異なる埋め込みを割り当てるポリレトリヴァルについて述べる。
ラベル中心のクエリの検索精度を大幅に向上し、内部および外部の参照を解決できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:54:11 GMT)
PingPong: A Benchmark for Role-Playing Language Models with User Emulation and Multi-Model Evaluation [0.0] 言語モデルのロールプレイング能力を評価するためのベンチマークを導入する。
異なる言語モデルを利用して、動的でマルチターンな会話でユーザをシミュレートし、その結果の対話を評価する。
英語とロシア語の両方で40以上のモデルを評価し,各モデルは8文字と8つの状況で64の会話に参加した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:02:23 GMT)
Photon self-interaction through gravitons and axions [0.0] 環キャビティ内の軸イオンを介して光子に対する相互作用ハミルトニアンを導出する。
軸索を介する相互作用が重力によって引き起こされる自己相互作用を支配していることがわかった。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:37:27 GMT)
Periodic Motzkin chain: Ground states and symmetries [0.0] モツキン鎖(Motzkin chain)は、開境界条件を持つ量子$s=1$スピンと隣り合う相互作用のモデルである。
独特な基底状態を持ち、モツキン経路の和と見なすことができる。
基底状態は縮退し独立状態であり、全スピン作用素の第3成分の固有値によって区別される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:57:11 GMT)
Packaged Quantum States and Symmetry: A Group-Theoretic Approach to Gauge-Invariant Packaged Entanglements [0.0] パッケージ化された量子状態は、内部量子数の分離不能ブロックを含む量子状態を指す。
多粒子量子系において、有限群あるいはコンパクト群の任意の非自明な表現がパッケージ化絡みを誘導することを示す。
この結果は、エキゾチックハドロン分光法、量子場理論の拡張対称性、量子技術への応用に有用かもしれない。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:48:22 GMT)
PLM-eXplain: Divide and Conquer the Protein Embedding Space [0.0] PLM-eXplain (PLM-X)について説明する。
PLM-Xは、PLM埋め込みを2つの構成要素に分解することでギャップを埋める: 確立された生化学的特徴に基づく解釈可能な部分空間と、モデルの予測力を保存する残留部分空間である。
3つのタンパク質レベルの分類課題にまたがるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 10:46:24 GMT)
Optimizing Multi-Hop Quantum Communication using Bidirectional Quantum Teleportation Protocol [0.0] 修正Dijkstraアルゴリズムと量子ウォーク(BQT-MDQW)を用いた双方向量子テレポーテーションという双方向量子テレポーテーションの新しい手法を提案する。
この方法は、量子無線ネットワークにおける量子通信を改善するために、GHZ-Bell状態、W-Bell状態、Cluster-Bell状態などの異なる種類の絡み合った状態を使用する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:38:53 GMT)
OPAL: Encoding Causal Understanding of Physical Systems for Robot Learning [0.0] 本稿では,ロボット制御のためのフローマッチングにトポロジ的制約を導入する,視覚-言語-アクションアーキテクチャであるOPALを提案する。
10の複雑な操作タスクにまたがる実験結果から、OPALは従来のアプローチよりも優れた性能を示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:29:36 GMT)
Notions of Fermionic Entropies of a Causal Fermion System [0.0] フェルミオンフォンノイマンエントロピー、フェルミオンエンタングルメントエントロピー、フェルミオン相対エントロピーは、因果フェルミオン系に対して定義される。
我々の定義は、2次元および4次元ミンコフスキー空間のディラックスピノル、シュワルツシルトブラックホール幾何学、フェルミオン格子の様々な例で示される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:33:51 GMT)
Not someone, but something: Rethinking trust in the age of medical AI [0.0] 人工知能が医療に埋め込まれるにつれて、医療の意思決定に対する信頼は急速に変化している。
この意見書は、AIへの信頼は人間から機械への単純な移行ではない、と論じている。
哲学、生命倫理、システムデザインなどから、人間の信頼と機械の信頼性の主な違いを探求する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:46:53 GMT)
Non-Hermitian Numerical Renormalization Group: Solution of the non-Hermitian Kondo model [0.0] 非エルミート的(NH)ハミルトニアン(英語版)は開量子系、非平衡力学、散逸過程を記述している。
強相関物理学の重要なパラダイムである近藤効果は、最近、NH設定で検討されている。
ここでは,数値再正規化群 (NRG) の NH 一般化を開発し,それを NH Kondo モデルの解法として利用する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:34:49 GMT)
Multilingual MFA: Forced Alignment on Low-Resource Related Languages [0.0] 類似の音韻学的在庫を持つオーストラリア語および無関係言語に対する多言語・多言語訓練の結果を比較した。
モントリオール強制アリグナーを用いて、スクラッチから音響モデルを訓練し、大きな英語モデルを適用する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:32:57 GMT)
More-efficient Quantum Multivariate Mean Value Estimator from Generalized Grover Gate [0.0] 精度$fracsqrttexttr Sigman$ in $lVert rVert_infty$ norm を達成するために$Oleft(n log fracddeltaright)$を使用するアルゴリズムを見つける。
また、より小さなメモリを使用する別のアルゴリズムも提示しますが、さらにdfrac14$の複雑さがあります。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:48:23 GMT)
Modeling Response Consistency in Multi-Agent LLM Systems: A Comparative Analysis of Shared and Separate Context Approaches [0.0] 本稿では,文脈制約,ノイズ,エージェント間の依存性がシステム性能に与える影響を評価する指標として,応答一貫性指数(RCI)を導入する。
提案手法は,メモリ制約とノイズ管理の相互作用に着目した既存研究と異なる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:54:21 GMT)
MedPix 2.0: A Comprehensive Multimodal Biomedical Data set for Advanced AI Applications with Retrieval Augmented Generation and Knowledge Graphs [0.0] 本稿では,MedPix 2.0データセット構築のワークフロー全体について述べる。
結果として得られるアーキテクチャは、医療意思決定支援システムとしてエンドツーエンドでクエリすることができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:57:40 GMT)
Mass Balance Approximation of Unfolding Improves Potential-Like Methods for Protein Stability Predictions [0.0] ディープラーニング戦略は分野を前進させてきたが、標準的な手法での利用はリソースの要求により制限されている。
本研究は、展開状態を考慮した質量バランス補正(MBC)を導入することにより、これらの手法を著しく強化することを示す。
多くの機械学習モデルは、このバランスを部分的にモデル化しているが、我々の分析は、展開状態の洗練された表現が予測性能を向上させることを示唆している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:53:02 GMT)
Machine learning-guided construction of an analytic kinetic energy functional for orbital free density functional theory [0.0] 数百の材料の結晶セル平均運動エネルギー密度(タウ)の機械学習によって導かれる運動エネルギー密度表現(タウ)の解析式を構築した。
特徴量に対するタウの機能的依存のタイプを理解するために,ハイブリッドガウスプロセス回帰-ニューラルネットワーク(GPR-NN)法が用いられた。
コーンシャム DFT エネルギー体積曲線を十分な精度で再現できる解析モデルを構築した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:29:27 GMT)
Machine Learning Approach towards Quantum Error Mitigation for Accurate Molecular Energetics [0.0] 我々は,誤り軽減技術の実現に向けて,グラフニューラルネットワークと回帰ベース機械学習(ML)アーキテクチャを考案した。
いくつかの強い相関を持つ分子に対する予測エネルギーの桁違いの改善を示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:49:09 GMT)
MESA: Text-Driven Terrain Generation Using Latent Diffusion and Global Copernicus Data [0.0] 我々は、手続き的な地形モデリングに代わる新しいデータ中心のMESAを提案する。
MESAはグローバルリモートセンシングデータを用いてテキスト記述から高品質な地形サンプルを生成する。
このモデルの能力は広範な実験を通じて実証され、現実的で多様な地形を生成する能力を強調している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 18:37:24 GMT)
Lossy-and-Constrained Extended Non-Local Games with Applications to Quantum Cryptography [0.0] 制約や損失を考慮してそのようなゲームを拡張すると、SDPの最適値への収束が保たれることを示す。
この結果を応用し、相対論的ビットコミットメント、量子鍵分布、量子位置検証のためのプロトコルのより厳密なセキュリティを示すSDPを計算する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:23:52 GMT)
Leveraging deep learning for plant disease identification: a bibliometric analysis in SCOPUS from 2018 to 2024 [0.0] 本研究の目的は,植物病の同定のための深層学習研究の文献的分析である。
SCOPUSをソースとした253文書の文献データの徹底的な分析を行った。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:57:30 GMT)
Learning Latent Hardening (LLH): Enhancing Deep Learning with Domain Knowledge for Material Inverse Problems [0.0] 本研究では, 材料ミクロ組織の機械的挙動に関するドメイン固有知識の導入について検討した。
データ制限を克服するため、2段階のフレームワークであるLearning Latent Hardening (LLH)が提案されている。
ドメイン固有の情報を持つモデルの結果は、事前知識のないモデルと比較してR2$の値が常に高い値を得た。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 03:04:57 GMT)
Fermi surface as a quantum critical manifold: gaplessness, order parameter, and scaling in $d$-dimensions [0.0] それらのギャップレス(次元)位相の性質に着目した$d$次元フェルミオンのモデルをいくつか検討する。
これは、分割関数の零点が実際のパラメータの範囲に達するとき、連続遷移として$T = 0$で発生する。
これらの零点は$(d-1)$-manifold of quantum criticality (Fermi surface) を定義する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:31:07 GMT)
Fast Mølmer-Sørensen gates in trapped-ion quantum processors with compensated carrier transition [0.0] イオン鎖におけるモルマー-ソレンセンゲートのレーザーパルス形状を設計するためのアプローチを提案する。
高速発振キャリア項は、イオンに作用するスピン依存力を効果的に修飾し、レーザーパルスの単純な非線形変換によって補償できることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:29:11 GMT)
Exploring utilization of generative AI for research and education in data-driven materials science [0.0] 2024年7月、私たちは、生成AIが研究と教育を促進する方法について調査するハッカソン、AIMHack2024を組織しました。
材料科学、情報科学、バイオインフォマティクス、凝縮物質物理学の研究者たちが協力して、生成AIが研究と教育をどのように促進するかを探求した。
本稿では、AIによるソフトウェア試験、ソフトウェアのためのAIチューターの構築、ソフトウェアのためのGUIアプリケーションの開発に関するトピックについて述べる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:15:21 GMT)
Exact Current Fluctuations in a Tight-Binding Chain with Dephasing Noise [0.0] 我々は、平均密度のステップ初期条件における積分電流の分散を計算し、負軸上の$rho_a$、正軸上の$rho_b$を計算した。
我々の正確な解は、たとえどんなに小さくても、デフォーカスの存在は、長期の限界において、現在の変動の性質を弾道的から拡散的へと変化させることを示している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:56:31 GMT)
Evolutionary Generation of Random Surreal Numbers for Benchmarking [0.0] 本稿では,ランダムな超現実数のアンサンブルをベンチマークアルゴリズムに生成する手法を提案する。
このアプローチでは、進化的アルゴリズムを使用して、ベンチマークデータセットを生成する。
これは他のタイプのネットワークデータに役立ちそうです。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:28:42 GMT)
Estimating Item Difficulty Using Large Language Models and Tree-Based Machine Learning Algorithms [0.0] フィールドテストによるアイテムの難易度の推定は、しばしばリソース集約的で時間を要する。
本研究は,大言語モデル(LLM)を用いて,K-5数学および読解評価項目の項目難易度を予測することの実現可能性について検討する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:04:07 GMT)
Dissipation and noise in strongly driven Josephson junctions [0.0] ジョセフソン接合における準粒子関連損失は、状態の超伝導密度のギャップによって抑制される。
二重超伝導ギャップよりも低い周波数でも強い駆動は、光子アシストによるクーパー対の破断による接合の消散を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:31:18 GMT)
Dissimilar Batch Decompositions of Random Datasets [0.0] データポイントは与えられた空間から独立して引き出され、2つのデータポイント間の類似性の概念が定義されると仮定する。
次に、各バッチ内の類似度を制限する分解を検討し、最小サイズに対して高い確率境界を求める。
類似性制約の緩和と全体サイズとの本質的にのトレードオフを示すとともに、マーチンゲール法を用いて、与えられた類似性を持つデータサブセットの最大サイズに対する境界を求める。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 15:58:06 GMT)
Detecting quantum resources in a semi-device independent framework [0.0] 線形独立な自由状態や自由操作が$d2$未満の任意のリソース理論に対して、量子リソースの存在を検出する相関が存在することが分かる。
次に、様々な量子資源の存在を観察するために証人を明示的に構築する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:49:44 GMT)
Dependency Update Adoption Patterns in the Maven Software Ecosystem [0.0] 依存関係の更新は、依存するソフトウェアコンポーネントをバグやセキュリティ上の脆弱性、コード品質の低下から保護する。
Mavenエコシステムにおける採用遅延は、ログ正規分布に従っているのに対して、採用範囲は指数関数的な崩壊分布を示しています。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:24:31 GMT)
Degrees of Entanglement in Systems of Three Indistinguishable Bosons: Revisiting the Greenberger-Horne-Zeilinge State [0.0] 本研究では, 識別不能なボソン系における真の三部構造絡みの検出問題について検討する。
特に、標準的なGHZ状態と類似性を持つ区別不能なボソンの状態を導入する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:20:53 GMT)
Defects in Silicon Carbide as Quantum Qubits: Recent Advances in Defect Engineering [0.0] 本稿では,炭化ケイ素(SiC)の欠陥と量子量子ビットとしての可能性について概説する。
次に焦点はSiCの最も有望な欠陥、特にシリコン空孔(VSi)と空孔(VC-VSi)にシフトする。
照射, イオン注入, フェムト秒レーザー加工, 集束イオンビーム法など, 様々な製造技術が研究されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:13:58 GMT)
Decoupling spin relaxation and chemical kinetics in radical pair magnetism: A master equation study [0.0] 低強度磁場の生物学的効果に関する主要な理論は、スピン化学のラジカルペア機構である。
本研究では, 単純ラジカル対モデルに対するこの方程式の解を見つけ, 以下の条件を満たせば, 有意な磁気効果が生じることを示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 06:52:41 GMT)
Decoherence effects in entangled fermion pairs at colliders [0.0] 最大絡み合ったフェルミオン対に対する様々な種類の放射線からの脱コヒーレンスの影響を計算した。
開量子系の進化をアルタレッリ-パリ分割関数で記述したクラス作用素を同定する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:44:25 GMT)
Data Augmentation and Hyperparameter Tuning for Low-Resource MFA [0.0] 我々はコーパスサイズを増やすためにデータ拡張手法を用いる。
テキストの増補とは異なり、音声の増補は性能を大幅に向上させるものではない。
少量から中程度のトレーニングデータを持つ言語では、これは高レベルの言語からモデルを適用するための有効な代替手段である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 16:38:45 GMT)
DLTPose: 6DoF Pose Estimation From Accurate Dense Surface Point Estimates [0.0] DoseはRGB-D画像から6DoFオブジェクトのポーズ推定を行う新しい手法である。
スパースキーポイント法の精度と高密度画素ワイド予測の堅牢性を組み合わせる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 23:30:22 GMT)
Crystal fields, exchange, and dipolar interactions and noncollinear magnons of erbium oxide [0.0] 有効イオンハミルトニアンからの非コリン反強磁性体である酸化エルビウム中のマグノンの性質をシミュレートする。
その結果, マグノンの偏差の平均値と正規化値の差は, 隣り合う40分の1に双極子相互作用が組み込まれている場合の平均値よりも10~6ドル以下であることが判明した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:20:13 GMT)
Cryptographic Strengthening of MST3 via Automorphism Group of Suzuki Function Fields [0.0] 本稿では,鈴木関数のフィールドの自己同型群に基づくMST3暗号系の実装について述べる。
暗号解析の複雑さと暗号化用メッセージのサイズは、鈴木グループのMST3暗号システムよりも大きい。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:37:08 GMT)
Continuous-Variable Quantum Encoding Techniques: A Comparative Study of Embedding Techniques and Their Impact on Machine Learning Performance [0.0] 連続変数量子コンピューティング(CVQC)と古典機械学習の交点について検討する。
CVQCに基づく符号化法は特徴表現性を著しく向上し,分類精度とF1スコアが向上した。
量子表現可能性と古典的学習可能性のトレードオフを考察し、これらの量子符号化を現実のアプリケーションに組み込むことの現実的な実現可能性に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 00:00:45 GMT)
Consensus-based qubit configuration optimization for variational algorithms on neutral atom quantum systems [0.0] 本稿では,個々の変分量子アルゴリズム問題に対して,量子ビット相互作用を調整可能なアルゴリズムについて報告する。
本研究では、これらの最適化された構成が、一般に、基底状態の最小化問題を解決するシステムの能力に大きな改善をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 09:07:49 GMT)
Confidence Regularized Masked Language Modeling using Text Length [0.0] マスケード言語モデリングは言語表現を学習するのに広く用いられる手法であり、各入力においてランダムにマスキングされた単語を予測する。
この問題は、入力テキストが短いとき、可能な単語分布はエントロピーが高い傾向にあり、その予測においてモデルが過信される可能性があるため、より顕著になる。
本稿では,入力長に基づいて正則化強度を適応的に調整する新しい信頼度正則化器を提案する。GLUEおよびSQuADベンチマークによる実験により,本手法が精度と期待校正誤差の両方を改善することを示す。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 02:32:58 GMT)
Computing Canonical Averages with Quantum and Classical Optimizers: Thermodynamic Reweighting for QUBO Models of Physical Systems [0.0] 物理エネルギーなどの順序パラメータの特定の間隔に制約されたQUBOに基づくサンプリングに適用可能なヒストグラム再重み付け方式を提案する。
提案手法は,共役アンサンブルにおける期待値の算出を可能にする状態密度を精度良く復元できることを実証する。
そこで本手法は,QUBOに基づく表現と,それ以外は実空間サンプリング法で抽出可能な物理システムの,最先端のキャラクタリゼーションを推し進めるために利用することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:59:32 GMT)
Coherence-decoherence interplay in quantum systems due to projective stochastic pulses: The case of Rabi oscillations [0.0] コヒーレンスとデコヒーレンスの相互作用は、3レベル量子システムで実行される。
この研究は、ポアソン駆動のパルスシーケンスによってシステムの一貫性のある一元的進化がランダムに中断されるシナリオに基づいている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 05:02:08 GMT)
Bose-Einstein Condensation and the Lambda Transition for Interacting Lennard-Jones Helium-4 [0.0] 最適凝縮率は、制約された自由エネルギーを最小化することによって得られる。
縮合抑制により純位置置換ループの成長とそれに伴う熱容量のばらつきが実現される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 01:18:01 GMT)
Beyond Tools: Generative AI as Epistemic Infrastructure in Education [0.0] 生成AIは、世界中の教育インフラに急速に統合される。
本稿では,AIシステムが教育におけるてんかんの基盤として機能するかを考察する。
教師が3次元にまたがる実践に与える影響を分析する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:35:30 GMT)
Artificial Intelligence and the Dual Paradoxes: Examining the Interplay of Efficiency, Resource Consumption, and Labor Dynamics [0.0] 我々は,AIがエネルギー消費,人的労働の役割,ハイブリッドの役割に与える影響について検討する。
発見は、AIがエネルギー消費を増大させ、人間の労働者の役割に最小限の影響を与えたことを示唆している。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:10:02 GMT)
Applications of Hybrid Machine Learning Methods to Large Datasets: A Case Study [0.0] 時系列データのマルチクラス分類のためのMLパイプラインにおいて,古典ニューラルネットワークを意識的に設計された変分量子回路(VQC)に置き換えることで,同じ分類性能が得られることを示す。
この結果から,回路の調整済みデータ前処理の重要性を強調し,QuditベースのVQCの可能性を示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:53:27 GMT)
An improved quantum algorithm for linear autonomous differential equations via Padé approximation [0.0] 離散化解は行列指数の積で表すことができる。
提案アルゴリズムは対角線パド近似により行列指数を近似する。
提案アルゴリズムの複雑さを解析する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:54:27 GMT)
An Activity-Based Model of Transport Demand for Greater Melbourne [0.0] メルボルン大都市圏における活動モデルを提案する。
階層的クラスタリング、確率的、重力に基づくアプローチを組み合わせています。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 22:34:16 GMT)
AI-Assisted Conversational Interviewing: Effects on Data Quality and User Experience [0.0] 本研究は,AI支援インタビューの枠組みを導入することで,標準化された調査と会話インタビューのギャップを埋めるものである。
我々は1,800人の参加者がランダムにテキストベースの会話AIエージェント、すなわち「テキストボット」に割り当てられたウェブサーベイ実験を行った。
この結果から,Webサーベイにおけるオープンエンドデータ収集をAI手法で向上する可能性が示唆された。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:58:07 GMT)
A thermodynamic road to gravity and quantum phenomena: non-relativistic self-gravitating weakly nonlocal fluids [0.0] 弱非局所非相対論的流体の熱力学解析を行った。
内部変数と呼ばれる追加のスカラーフィールドもダイナミクスに寄与する。
完全(非散逸性)流体の古典ホログラフィは一般に証明されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:39:34 GMT)
A new training approach for text classification in Mental Health: LatentGLoss [0.0] 本研究では,機械学習アルゴリズム,ディープラーニングアーキテクチャ,トランスフォーマーモデルを活用することにより,メンタルヘルス分類の多段階的アプローチを提案する。
本研究の中核的な貢献は、教師と学生ネットワークで構成される二重モデルアーキテクチャを含む、新しいトレーニング戦略にある。
実験の結果、各モデルステージの有効性を強調し、提案した損失関数と教師と学生の相互作用が、メンタルヘルス予測タスクにおけるモデルの学習能力を大幅に向上させることを示した。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 19:34:31 GMT)
A few remarks concerning application of the Lifshitz theory to calculation of the Casimir-Polder interaction [0.0] リフシッツ理論はカシミール・ポルダー原子-プレート相互作用の半古典的な記述を提供する。
これにより、許容される原子プレート分離距離に関する特定の制限が適用される。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:51:13 GMT)
A Serendipitous Recommendation System Considering User Curiosity [0.0] 本稿では,各ユーザが好奇心に基づいて求める有用性や予期せぬ性の割合を推定する手法を提案する。
提案手法は,最先端手法と同等の性能を達成しつつ,セレンディピティーなレコメンデーションをうまく提供できる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 07:15:06 GMT)
A Python toolkit for dealing with Petri nets over ontological graphs [0.0] 本稿では、ペトリネットのオントロジグラフ上の理論的基礎と、そのようなネットを扱うPythonツールキットについて述べる。
いくつかの貴重な知識(特に意味的関係の観点から)は、ペトリネットによってモデルに追加することができる。
実装されたツールにより、ユーザはオントロジグラフ上にペトリネットの構造とダイナミクスを定義することができる。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 21:52:17 GMT)
A Practical Cross-Platform, Multi-Algorithm Study of Quantum Optimisation for Configurational Analysis of Materials [0.0] 材料構成解析のよく研究された問題,具体的には欠陥グラフェン構造の最低エネルギー構成を見つけることを考える。
この問題は、擬似非制約二項最適化問題に適用可能な様々なアルゴリズムを研究できるテストケースとして機能する。
完全接続QUBOを最大7,200ドル(約7,800円)で解くために量子的手法を用いており、これ以上のアルゴリズム性能はデバイス接続性、ノイズ、古典的な時間オーバーヘッドによって制限されている。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 13:38:44 GMT)
A Measurement Device Independent Quantum Key Distribution protocol in the service of three users [0.0] 量子鍵分布(QKD)は、2つのユーザ間で鍵分布をセキュアにするための理論的に証明された唯一の方法である。
本稿では,鍵を3つのユーザ間でペア方式で配布するためのMDIプロトコルを提案し,解析する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 14:01:49 GMT)
A Lightweight and Extensible Cell Segmentation and Classification Model for Whole Slide Images [0.0] 本稿では,軽量なセルセグメンテーションと分類モデルを作成することにより,データ品質,モデル性能,ユーザビリティを向上させるソリューションを提案する。
そこで,PanNukeとMoNuSACのアノテーションを改良し,異なる7つのセルタイプで統一されたデータセットを生成する。
第3に、基礎モデルの計算要求に対処するため、比較性能を維持しながら、モデルのサイズと複雑さを減らすために知識を蒸留する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 11:06:08 GMT)
A Graph Diffusion Algorithm for Lexical Similarity Evaluation [0.0] 本稿では,ある言語と複数の参照言語クラスタ間の語彙的類似性を評価するアルゴリズムを提案する。
それぞれの概念に対して、アルゴリズムはそれぞれの翻訳間の距離を計算する。
このアルゴリズムは、多言語領域で話される言語間の関係を多くの相互影響で分析するのに有用である。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 12:17:08 GMT)
A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection [0.0] 大規模言語モデル(LLM)は、ユーザがこれらのモデルに対して、意図した範囲を超えてタスクを実行するように促すという、オフトピー的な誤用を招きやすい。
現行のガードレールは、高い偽陽性率、限られた適応性、およびプレプロダクションでは利用できない実世界のデータを必要とする非現実性に悩まされている。
これらの課題に対処するフレキシブルでデータフリーなガードレール開発手法を導入します。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 08:59:26 GMT)
A Concise Mathematical Description of Active Inference in Discrete Time [0.0] 本稿では,アクション選択機構の詳細な例を含むトピックの基本的紹介として機能する。
この付録はより微妙な数学的詳細を論じており、既に活発な推論文学を研究している読者をターゲットにしている。
本稿では,アクション選択と学習機構を実装し,pymdp環境と互換性のあるPythonコードを提供する。
論文参考訳(メタデータ) (Wed, 09 Apr 2025 17:54:25 GMT)