Cosmos-Reason1: From Physical Common Sense To Embodied Reasoning [76.9] 物理的なAIシステムは、物理的な世界で複雑な行動を知覚し、理解し、実行する必要がある。
物理世界を理解するためのモデルを提案する。
私たちは、空間、時間、物理学に関する基本的な知識を捉える階層的オントロジーを使用します。
具体的推論では、異なる物理的実施形態をまたいで一般化する2次元オントロジーに依存している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:11:13 GMT)
All Patches Matter, More Patches Better: Enhance AI-Generated Image Detection via Panoptic Patch Learning [76.8] 我々は、系統解析によるAIGI検出の2つの重要な原則を確立する。
textbf(1) All Patches Matter: 識別的特徴が対象中心領域に集中する従来の画像分類とは異なり、AIGIのそれぞれのパッチは、一様生成プロセスによる合成アーティファクトを本質的に含んでいる。
textbf (2) パッチの改善: より多くのパッチで分散アーティファクトを活用することで、補完的な法医学的証拠をキャプチャすることで検出が改善される。
textbfPanoptic textbfPatch textbfLearning (PPL)フレームワーク。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:32:09 GMT)
Loong: Generating Minute-level Long Videos with Autoregressive Language Models [76.6] そこで我々は,Longという自動回帰型大言語モデル (LLM) ベースのビデオジェネレータを提案する。
具体的には,テキストトークンとビデオトークンを自己回帰LDMの統一シーケンスとしてモデル化し,スクラッチからモデルをトレーニングする。
提案したLoongは10秒のビデオでトレーニングでき、テキストプロンプトで調整されたミニレベル長ビデオを生成するよう拡張できる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:57:32 GMT)
InvFussion: Bridging Supervised and Zero-shot Diffusion for Inverse Problems [76.4] この研究は、教師付きアプローチの強いパフォーマンスとゼロショットメソッドの柔軟性を組み合わせたフレームワークを導入している。
新規なアーキテクチャ設計では、分解演算子を直接デノイザにシームレスに統合する。
FFHQとImageNetデータセットの実験結果は、最先端の後方サンプリング性能を示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:40:57 GMT)
Large Language Model Can Transcribe Speech in Multi-Talker Scenarios with Versatile Instructions [69.0] 我々は,多話者環境における音声の書き起こしにおける大規模言語モデル(LLM)の能力について,先駆的な研究を行う。
We use WavLM and Whisper encoder to extract multi-faceted speech representations that sensitive to speaker characteristics and semantic context。
提案システムであるMT-LLMのカクテルパーティーシナリオにおける有望な性能について実験を行った。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:16:33 GMT)
A Comprehensive Survey of Contamination Detection Methods in Large Language Models [68.1] 近年のLarge Language Models(LLM)の台頭に伴い、多くの新しい機会が生まれつつありますが、新たな課題もあります。
LLMの性能は、データへの以前の露出のために、少なくとも部分的には高性能である可能性があるため、もはや信頼性が低い可能性がある。
この制限は、NLPの分野での実際の能力向上を阻害するが、汚染を効率的に検出する方法が不足している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:19:33 GMT)
A Survey of Scaling in Large Language Model Reasoning [62.9] 大規模言語モデル(LLM)推論におけるスケーリングの総合的な検討について述べる。
我々は、多段階推論と論理的整合性を改善する推論ステップにおけるスケーリングを分析する。
我々は、反復モデルの改善による最適化に焦点を当て、トレーニング可能な推論のスケーリングについて論じる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:51:27 GMT)
VidCRAFT3: Camera, Object, and Lighting Control for Image-to-Video Generation [62.6] VidCRAFT3は、画像とビデオの正確な生成のための新しいフレームワークである。
カメラの動き、物体の動き、照明方向を同時に制御できる。
高品質なビデオコンテンツを生成し、粒度と視覚的コヒーレンスを制御する最先端の手法より優れている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:56:07 GMT)
Learning from Streaming Video with Orthogonal Gradients [62.5] 本稿では,映像の連続的ストリームからの表現学習を自己指導的に行うという課題に対処する。
これは、トレーニング中にビデオが切り刻まれ、シャッフルされ、非冗長なバッチを生成する、ビデオ学習の標準的なアプローチとは異なる。
3つのタスクでシャッフルからシーケンシャルな学習に移行する際のパフォーマンスの低下を実演する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:59:57 GMT)
Domain Guidance: A Simple Transfer Approach for a Pre-trained Diffusion Model [62.1] ドメインガイダンス(Domain Guidance)は、トレーニング済みの知識を活用して、サンプリングプロセスを対象のドメインに誘導する移行アプローチである。
FIDは19.6%改善し、FD$_textDINOv2$は23.4%改善した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:07:55 GMT)
Investigating and Scaling up Code-Switching for Multilingual Language Model Pre-Training [58.7] コンテクスト内の異なる言語間を交互に交換するコードスイッチの存在が、多言語機能の鍵であることに気付きました。
事前学習における言語アライメントのためのコードスイッチングのパワーをよりよく探求するために,合成コードスイッチングの戦略について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:09:58 GMT)
UAVTwin: Neural Digital Twins for UAVs using Gaussian Splatting [57.6] UAVTwinは,無人航空機(UAV)に埋め込まれた下流モデルの訓練を行うための,実環境からデジタル双生児を作成する方法である。
これは、背景を再構築するための3Dガウススティング(3DGS)と、多様な外観と動作を複数のポーズで表示する制御可能な合成人間モデルを統合することで実現される。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:17:30 GMT)
InfiniteICL: Breaking the Limit of Context Window Size via Long Short-term Memory Transformation [57.3] In-context Learning (ICL) は、大規模言語モデル(LLM)において重要であるが、その有効性は有限コンテキストウィンドウによって制約される。
本稿では,LLMにおけるコンテキストとパラメータを,短期記憶と長期記憶に並列化するフレームワークであるInfiniteICLを紹介する。
提案手法は,コンテキスト長を90%削減し,フルコンテキストプロンプトの平均性能を103%向上することを示した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:15:44 GMT)
Do We Truly Need So Many Samples? Multi-LLM Repeated Sampling Efficiently Scales Test-Time Compute [55.3] 本稿では,テスト時間計算のスケールアップによるLCM性能向上のための,シンプルで効果的で費用効率のよい手法を提案する。
当社の戦略は,複数のモデルを組み込んで,補完的な強みを活用するという,新たなツイストによって,繰り返しサンプリングされる投票フレームワークを基盤としています。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:55:04 GMT)
COST: Contrastive One-Stage Transformer for Vision-Language Small Object Tracking [52.6] 本稿では,視覚言語(VL)追跡のための一段変圧器融合フレームワークを提案する。
ビデオとそれに対応する言語記述間の相互情報を最大化するコントラストアライメント戦略を導入する。
視覚言語変換器を活用することにより,効率的なマルチモーダル融合・推論機構を確立する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:12:38 GMT)
Efficient Model Selection for Time Series Forecasting via LLMs [52.3] 本稿では,Large Language Models (LLM) をモデル選択の軽量な代替手段として活用することを提案する。
提案手法は, LLMの固有知識と推論能力を活用することで, 明示的な性能行列の必要性を解消する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:33:27 GMT)
FreSca: Unveiling the Scaling Space in Diffusion Models [52.2] 拡散モデルは、主にタスク固有の情報をエンコードするノイズ予測と、調整可能なスケーリングを可能にするガイダンスを通じて、画像タスクに対して印象的な制御性を提供する。
条件/条件付き雑音予測の違いがキーセマンティック情報を伝達するインバージョンベースの編集から始めることで、この空間を考察する。
我々のコアコントリビューションは、ノイズ予測のフーリエ解析に起因し、その低周波成分と高周波成分が拡散を通して異なる進化を遂げていることを明らかにする。
この知見に基づいてFreScaを導入し、FreScaはフーリエ領域の異なる周波数帯域に独立してガイダンススケーリングを適用する簡単な方法である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:03:11 GMT)
End-to-End Driving with Online Trajectory Evaluation via BEV World Model [52.1] 本稿では,BEV Worldモデルを活用し,将来のBEV状態を予測するためのエンドツーエンド駆動フレームワークWoTEを提案する。
我々は,NAVSIMベンチマークとCARLAシミュレータに基づく閉ループBench2Driveベンチマークを用いて,最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:47:23 GMT)
Mesh Mamba: A Unified State Space Model for Saliency Prediction in Non-Textured and Textured Meshes [50.2] メッシュサリエンシは、自然に視覚的注意を引き付ける領域を特定して強調することにより、3D視覚の適応性を高める。
状態空間モデル (SSM) に基づく統合唾液度予測モデルであるメッシュ・マンバを導入する。
Mesh Mambaは、トポロジカルフレームワークにテクスチャ機能をシームレスに組み込んだまま、メッシュの幾何学的構造を効果的に分析する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:22:25 GMT)
Token Dynamics: Towards Efficient and Dynamic Video Token Representation for Video Large Language Models [50.2] 極端に短いトークンの削減という新しいタスクを導入し、最小限のトークン数で広範囲なビデオシーケンスを表現することを目的としている。
空間的時間的コヒーレンスを保ちながらトークン数を動的に削減する新しいビデオ表現フレームワークであるToken Dynamicsを提案する。
実験では、トークンの数を0.07%に減らし、小さなパフォーマンス低下は1.13%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:54:38 GMT)
LVSM: A Large View Synthesis Model with Minimal 3D Inductive Bias [50.1] スパースビュー入力からのスケーラブルで一般化可能な新規ビュー合成のためのトランスフォーマーに基づくアプローチを提案する。
本稿では,(1)入力画像トークンを1次元遅延トークンにエンコードするエンコーダデコーダLVSM,(2)入力画像を直接新規ビュー出力にマッピングするデコーダのみLVSMの2つのアーキテクチャを紹介する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:12:32 GMT)
An Illusion of Progress? Assessing the Current State of Web Agents [49.8] 我々は,Webエージェントの現状を包括的かつ厳密に評価する。
結果は、現在のエージェントの能力の非常に異なる描写を描いており、以前報告された結果に過度に最適化されていることを示唆している。
オンライン評価ベンチマークであるOnline-Mind2Webを紹介した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:51:29 GMT)
Benchmarking the Spatial Robustness of DNNs via Natural and Adversarial Localized Corruptions [49.5] 本稿では,局所汚濁下でのセグメンテーションモデルのロバスト性を評価するための特別な指標を紹介する。
本研究では,特定の領域に適用される対向的摂動に対して,モデルロバスト性をより深く理解する手法である,地域対応型マルチアタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック・アタック分析を提案する。
その結果、モデルがこれらの2種類の脅威に異なる反応を示すことが明らかとなった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:37:39 GMT)
Exceptional Points and Stability in Nonlinear Models of Population Dynamics having $\mathcal{PT}$ symmetry [49.2] 我々は、進化ゲーム理論の複製子方程式と、人口動態のロトカ・ボルテラ系によって支配されるモデルを分析する。
a) 支配対称性特性がモデルの大域的性質と結びついている場合、および(b) それらの対称性が定常状態の周囲に局所的に現れる場合の2つのケースにおける例外点の出現について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:18:47 GMT)
Streamlined optical training of large-scale modern deep learning architectures with direct feedback alignment [48.9] 我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、30ワット以下の1500テラオプスで大規模なランダム行列乗算を行う。
トレーニング時間のスケーリングについて検討し、超深度・広帯域ニューラルネットワークに対するハイブリッド光電子アプローチの潜在的な利点を実証する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:37:06 GMT)
NVS-Solver: Video Diffusion Model as Zero-Shot Novel View Synthesizer [48.6] そこで本研究では,テキストを不要に操作する新しいビュー合成(NVS)パラダイムを提案する。
NVS-rは、所定のビューで拡散サンプリングプロセスを適応的に変調し、目覚しい視覚体験の作成を可能にする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:16:43 GMT)
Grounding Multimodal LLMs to Embodied Agents that Ask for Help with Reinforcement Learning [48.1] 現実の環境で活動する身体的エージェントは、曖昧で特定されていない人間の指示を解釈しなければならない。
本研究では,Ask-to-Actタスクを導入し,具体的エージェントがホーム環境においてあいまいな指示を受けると,特定のオブジェクトインスタンスをフェッチしなければならない。
LLM生成報酬を用いたオンライン強化学習(RL)を用いた視覚言語行動(VLA)ポリシーとして,マルチモーダル大規模言語モデル(MLLM)を微調整する新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 01:49:21 GMT)
Test-Time Alignment for Tracking User Interest Shifts in Sequential Recommendation [47.8] シークエンシャルレコメンデーションは、ユーザが対話する可能性のある次の項目を予測することを目的として、現代のレコメンデーションシステムにおいて不可欠である。
現実のシナリオは、しばしば動的で、ユーザの関心事の変化を被る。
最近のテストタイムトレーニングは有望なパラダイムとして現れ、事前トレーニングされたモデルがテストデータに動的に適応できるようにする。
逐次レコメンデーションに適した2つのTest-Time Alignmentモジュールを導入することで,TTTのステートスペースモデルを活用した新しいモデルであるT$2$ARecを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:42:30 GMT)
Are Users More Willing to Use Formally Verified Password Managers? [47.2] 正式な検証がユーザに与える影響を理解するために,2つの実験を設計,実装する。
パスワードマネージャに対する信頼の欠如が採用率を低下させる可能性があることが文書化されているので、パスワードマネージャのアプリケーションドメインに焦点を当てる。
我々は,形式的検証がユーザにとって望ましいものとみなし,形式的検証コミュニケーションを改善するための3つの行動的勧告を同定する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:57:49 GMT)
A Systematic Review of Security Communication Strategies: Guidelines and Open Challenges [47.2] 情報過負荷や技術的理解,セキュリティ意識と快適さのバランスなど,ユーザの難しさを識別する。
利用者は信頼性に関する技術的詳細が必要であるが、ジャーゴンに苦慮し、不安を経験することなくリスクを認識する必要がある。
この作業は,サイバーセキュリティの脅威を認識し,適切な対応を可能にする,より効果的なセキュリティコミュニケーションプラクティスに寄与する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:18:38 GMT)
AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World [45.7] AutoEvalは、人間の介入を最小限に抑えて、時計周りのロボットポリシーを自律的に評価するシステムだ。
評価プロセスにおいて,AutoEvalは人間の関与をほぼ完全に排除できることを示す。
We provide public access to multiple AutoEval scene in the popular BridgeData robot set with WidowX robot arms。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:24:22 GMT)
Adapting Video Diffusion Models for Time-Lapse Microscopy [45.2] 本稿では,HeLa細胞の細胞分裂の時間分解顕微鏡ビデオを生成するために,ビデオ拡散モデルのドメイン適応を提案する。
3つの条件付け手法を探索し、顕微鏡特異的なシーケンス上で予め訓練されたビデオ拡散モデルを微調整する。
以上の結果から, 生物可塑性合成顕微鏡データを生成するための生成ビデオモデルのドメイン特異的微調整の可能性が示された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:21:43 GMT)
SpreadsheetLLM: Encoding Spreadsheets for Large Language Models [44.1] 本研究では,スプレッドシート上での大規模言語モデル(LLM)の効率的な符号化手法であるSpreadsheetLLMを紹介する。
LLMのスプレッドシートを効果的に圧縮する革新的な符号化フレームワークである SheetCompressor を開発した。
シート圧縮機を用いた微調整LDMは平均圧縮比25倍であり、最先端の78.9%のF1スコアを達成し、既存の最高のモデルよりも12.3%上回っている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:33:38 GMT)
Slot-Level Robotic Placement via Visual Imitation from Single Human Video [43.7] 人間のデモビデオを用いてロボットに新しいタスクを教えるという課題に対処する。
本稿では,複数の高度な視覚基盤モデルとスロットレベル配置検出器Slot-Netを活用するモジュールシステムであるSLeRPを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:59:45 GMT)
Why Autonomous Vehicles Are Not Ready Yet: A Multi-Disciplinary Review of Problems, Attempted Solutions, and Future Directions [43.4] 本稿では, 自動化分野が直面する大きな課題を考察するために, 統合的・多分野的なアプローチを採用する。
レビューでは、現在の技術と研究者が考案した最も有望な解決策に関連する限界とリスクについて検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:11:56 GMT)
Satellite Edge Artificial Intelligence with Large Models: Architectures and Technologies [43.2] 極度の気象予報、災害監視、戦場監視はリアルタイムのデータ処理を必要とする。
衛星エッジ大型AIモデル(LAM)は、トレーニング(微調整)と推論フェーズの両方を含む。
時間変化トポロジを持つ資源制約付き宇宙ネットワークにおけるLAM展開
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:25:57 GMT)
DALIP: Distribution Alignment-based Language-Image Pre-Training for Domain-Specific Data [42.9] 対照的に、CLIP(Contrastive Language- Image Pre-training)はドメイン固有のデータで有望なパフォーマンスを示している。
本稿では,生体データを対象とした分散アライメントに基づく言語画像事前学習法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:56:57 GMT)
Slow-Fast Architecture for Video Multi-Modal Large Language Models [42.4] 既存の方法では、事前に定義されたルールを使用してビデオ表現を圧縮し、マルチモーダルな大言語モデルに入力する。
本稿では、このトレードオフを自然に回避し、空間的詳細を保存しながらより多くの入力フレームを使用できる、新しい低速アーキテクチャを提案する。
提案モデルでは,入力容量を16フレームから128フレームに拡張し,計算能力は3%向上した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:24:58 GMT)
Rethinking Synthetic Data definitions: A privacy driven approach [42.1] 合成データは、AI開発におけるデータ要求の増加に対するコスト効率のよいソリューションである。
従来の合成データ型の分類は、新しい世代技術に合わない。
我々は、規制政策立案を支援するために、プライバシー評価をより良く支援する合成データタイプをグループ化する新しい方法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:19:31 GMT)
Building Knowledge from Interactions: An LLM-Based Architecture for Adaptive Tutoring and Social Reasoning [42.1] 大規模言語モデルは、人間のようなコミュニケーションにおいて有望であるが、そのスタンドアロンの使用は、メモリ制約とコンテキストの不整合によって妨げられている。
この研究は、LLMに基づく社会的・タスク指向のヒューマンロボットインタラクションにおける自律的意思決定を強化する、マルチモーダルで認知にインスパイアされたフレームワークを提示する。
自律性とパーソナライゼーションをさらに強化するために,体験の選択,保存,検索を行うメモリシステムを導入する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:45:41 GMT)
Enhanced Diffusion Sampling via Extrapolation with Multiple ODE Solutions [42.0] 拡散確率モデル(DPM)は、しばしば反復サンプリングプロセスのために高い計算コストを被る。
本稿では,リチャードソン外挿にインスパイアされたDPMのODEに基づくサンプリング手法を提案し,数値誤差を低減し,収束率を向上させる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:06:23 GMT)
Direction-Aware Hybrid Representation Learning for 3D Hand Pose and Shape Estimation [42.0] 暗黙的な画像特徴と明示的な2次元共同座標特徴を融合する学習方向対応ハイブリッド特徴(DaHyF)を提案する。
提案手法は,DAHyF表現による3次元手振りを直接予測し,コントラスト学習に基づく予測信頼度を用いて,モーションキャプチャ時のジッタリングを低減する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:06:23 GMT)
TiC-LM: A Web-Scale Benchmark for Time-Continual LLM Pretraining [41.6] 歴史的Webデータに基づいてトレーニングされた大規模言語モデル(LLM)は、必然的に時代遅れになる。
114ダンプのCommon Crawl(CC)から得られたLCMの時間-連続事前学習のためのWebスケールデータセットを提案する。
また、一般CCデータと特定ドメインの両方にわたって時間階層評価を設計する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:11:54 GMT)
Are Autonomous Web Agents Good Testers? [41.6] 大規模言語モデル(LLMs)は、自律Webエージェント(AWAs)を活用することで、潜在的な代替手段を提供する。
AWAは自律テストエージェント(ATA)として機能する。
本稿では,自然言語テストケース実行におけるAWAの適用可能性について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:48:01 GMT)
Urban Computing in the Era of Large Language Models [41.5] 本稿では,大規模言語モデル(LLM)と都市コンピューティングの交わりについて検討する。
我々は,LLMの進化とコア技術について,簡潔に概説する。
我々は、交通、公共安全、環境モニタリングなど、主要都市領域にまたがる応用を調査する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:12:13 GMT)
Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation [41.0] 本稿では,視覚に基づくロボット操作課題を解決するためにシミュレーションデータを利用する手法を提案する。
ロボットアームとヒューマノイドの2つの領域を用いて,シミュレーションデータにより実世界のタスク性能を平均38%向上させることができることを示した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:40:11 GMT)
Processes Matter: How ML/GAI Approaches Could Support Open Qualitative Coding of Online Discourse Datasets [40.0] 最近公開された5つのML/GAIアプローチと4つのヒューマンコーダによるオープンコーディング結果の比較を行った。
ラインバイラインAIアプローチは、人間が会話のダイナミクスを解釈するのに対して、コンテンツベースのコードを効果的に識別する。
オープンコーディングで人間を置き換える代わりに、研究者はAIを分析プロセスと統合する必要がある。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:43:54 GMT)
Strategize Globally, Adapt Locally: A Multi-Turn Red Teaming Agent with Dual-Level Learning [39.9] AlgNameは、補完的な学習次元を通じて高度な人間の攻撃者をエミュレートする、新しい赤チームエージェントである。
AlgNameは、エージェントが新しいジェイルブレイク戦術を特定し、ゴールベースの戦術選択フレームワークを開発し、選択した戦術の迅速な定式化を洗練できるようにする。
JailbreakBenchに関する実証的な評価は、我々のフレームワークの優れた性能を示し、GPT-3.5-Turbo と Llama-3.1-70B に対する攻撃成功率の90%以上を、5つの会話ターンで達成した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 01:06:19 GMT)
A Diffusion-Based Framework for Occluded Object Movement [39.6] DiffOOM という名前の Occluded Object Movement 用に設計された拡散型フレームワークを提案する。
除染分岐は、背景色充満戦略と、継続的に更新されたオブジェクトマスクを利用して、対象オブジェクトの曖昧な部分を完成させることに集中する。
同時に、動作ブランチは、完了したオブジェクトを目標位置に置くために遅延最適化を採用し、ローカルテキスト条件のガイダンスを採用して、オブジェクトを新しい環境に適切に統合する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:29:30 GMT)
Accurate and Honest Approximation of Correlated Qubit Noise [39.6] 提案手法は, 量子ビット相関度の高い雑音成分を組み込むことにより, 精度を向上することのできる, 近似雑音チャネルの効率的な構成法である。
固定周波数超伝導量子ビットに典型的な現実的な雑音強度では、2量子ビット相関を超える相関ノイズがコードシミュレーションの精度に大きく影響することを発見した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:51:19 GMT)
A topology-preserving three-stage framework for fully-connected coronary artery extraction [39.5] 冠動脈摘出術は,冠動脈疾患のコンピュータ診断に必須である。
完全連結冠状動脈抽出のためのトポロジー保存型3段階フレームワークを提案する。
このフレームワークには、血管のセグメンテーション、中心線再接続、血管再建の欠如が含まれる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:04:44 GMT)
Can A Society of Generative Agents Simulate Human Behavior and Inform Public Health Policy? A Case Study on Vaccine Hesitancy [38.6] 大規模言語モデル(LLM)を利用した100個の生成エージェントを備えたVacSimフレームワークについて紹介する。
VacSim ワクチンは,1) 人口統計データに基づくエージェントの集団のインスタンス化,2) ソーシャル・ネットワークを介してエージェントを接続し,社会的ダイナミクスと疾患関連情報の関数としてワクチンの態度をモデル化すること,3) ワクチンの根絶を緩和するための様々な公衆衛生介入の設計と評価を行う。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:30:46 GMT)
STEREO: A Two-Stage Framework for Adversarially Robust Concept Erasing from Text-to-Image Diffusion Models [38.6] 大規模テキスト・画像拡散モデル(T2ID)は有害なコンテンツの生成における誤用の可能性について深刻な懸念を提起している。
本稿では,強靭な概念消去のための唯一のステップではなく,敵対的トレーニングを第1ステップとして活用する新しいフレームワークであるSTEREOを提案する。
我々は,7つの最先端概念消去手法に対してSTEREOをベンチマークし,ホワイトボックス攻撃とブラックボックス攻撃の両方に対して優れた堅牢性を示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:59:36 GMT)
ContrastScore: Towards Higher Quality, Less Biased, More Efficient Evaluation Metrics with Contrastive Evaluation [38.5] コントラストスコア(ContrastScore)は、高品質でバイアスの少ない、より効率的なテキスト評価を実現するために設計された、コントラストスコア(ContrastScore)である。
実験結果から,ContrastScoreは単一モデルとアンサンブルに基づくベースラインの両方よりも,人間の判断と強い相関性が得られることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:11:45 GMT)
Detecting Localized Density Anomalies in Multivariate Data via Coin-Flip Statistics [38.2] 本稿では,2つのデータセットを比較する異常検出手法であるEagleEyeを紹介する。
異常は、各点について、隣人の登録ラベルの順序付けられたシーケンスをモデル化することによって検出される。
人工と実世界の両方のデータセットの実験を通して、その効果を実証する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:07:05 GMT)
High-fidelity 3D Object Generation from Single Image with RGBN-Volume Gaussian Reconstruction Model [38.1] 本稿では,3次元のボクセル表現が明示的な3次元幾何情報を含む,新しいハイブリッドなVoxel-Gaussian表現を提案する。
我々の3Dボクセル表現は、2D画像から推定できるRGB特徴と表面正規特徴を整列する融合モジュールによって得られる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:58:34 GMT)
Is Your LLM Outdated? A Deep Look at Temporal Generalization [37.6] 本稿では,Large Language Models(LLMs)における時間的一般化の概念を紹介する。
LLMの時間適応性を評価するために、新しいテキストとイベント予測を利用する新しい評価フレームワークであるFreshBenchを紹介する。
以上の結果から,将来的にはより優れたモデルが急速に減少する傾向にあることが明らかとなった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:20:24 GMT)
Segmentation variability and radiomics stability for predicting Triple-Negative Breast Cancer subtype using Magnetic Resonance Imaging [36.4] 本研究では, 放射能を用いた3重複性乳癌サブタイプのMRIによる予測において, セグメンテーションの変動が特徴安定性および予測性能に及ぼす影響について検討した。
経時的情報の導入は特徴の安定性を低下させる可能性があるが、特徴予測能力は低下しない。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:48:01 GMT)
A finite-resources description of a measurement process and its implications for the "Wigner's Friend" scenario [36.1] 有限資源にのみアクセスする影響を一貫して含む量子計測プロセスのモデルを導入する。
測定崩壊を閉力学の効果的な記述とみなすことができることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:29:16 GMT)
EmoHead: Emotional Talking Head via Manipulating Semantic Expression Parameters [36.0] 提案するEmoHeadは,音声ヘッドビデオのセマンティックな表現パラメータを用いて合成する。
本研究は,様々な感情に対する音声入力からの相関性を高めることを目的としている。
我々は、訓練済みの超平面を利用して、垂直方向に沿って探索することで顔の動きを洗練する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:01:32 GMT)
SAV-SE: Scene-aware Audio-Visual Speech Enhancement with Selective State Space Model [35.6] SAV-SEは、同期ビデオからのリッチな文脈情報を、ノイズの種類を示す補助的手がかりとして使うための最初の提案である。
我々の知る限り、これは、音声強調性能を向上させるために、同期ビデオからリッチな文脈情報を補助的手がかりとして使用する最初の提案である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:39:14 GMT)
Discriminative Subspace Emersion from learning feature relevances across different populations [35.4] そこで本研究では,DSE(Driminative Subspace Emersion)法を提案する。
DSEでは,クラス間の重複度が高い場合にも,分類課題を2つの集団で区別する上で,最も関連性の高い特徴を特定することができる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:00:53 GMT)
Image Difference Grounding with Natural Language [34.6] ユーザの指示に基づいて視覚的差分を正確に局所化するタスクである画像差分グラウンド(IDG)を提案する。
我々は,IDGの大規模かつ高品質なデータセットであるDiffGroundを紹介した。
DiffTrackerというIDGのベースラインモデルを提案し、特徴差分拡張と共通抑制を効果的に統合し、差分を正確に特定する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:56:42 GMT)
MolX: Enhancing Large Language Models for Molecular Learning with A Multi-Modal Extension [34.6] タスクハンドリング能力の強い大規模言語モデル(LLM)は、様々な分野において顕著な進歩を見せている。
本研究は、分子をマルチモーダルな外部モジュール、すなわちMollXに装備することで、分子の理解能力を高めることを目的とする。
特に,分子の表現にSMILES文字列を直接使用する代わりに,特定のエンコーダを用いて,SMILES文字列と2次元分子グラフ表現の両方から微細な特徴を抽出する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:20:34 GMT)
Like Oil and Water: Group Robustness Methods and Poisoning Defenses May Be at Odds [34.5] グループロバストネスは機械学習(ML)において大きな関心事となっている
私たちの研究で、まずこれらの方法の重大な欠点を明らかにしました。
毒サンプルを増幅することにより、集団堅牢性法は必然的に敵の成功率を増加させる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:37:07 GMT)
Q-MambaIR: Accurate Quantized Mamba for Efficient Image Restoration [34.4] 状態空間モデル(SSM)は、画像復元(IR)において大きな注目を集めている。
Q-MambaIRは、IRタスクのための正確で効率的で柔軟な量子マンバである。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:56:09 GMT)
Lost in Sequence: Do Large Language Models Understand Sequential Recommendation? [33.9] 大きな言語モデル(LLM)は、高度なテキスト理解能力とコンテキスト認識のおかげで、推奨のための有望なツールとして登場した。
本稿では,事前学習したSRecモデルから抽出したユーザ表現をLLMに蒸留することにより,LLMへのシーケンシャル情報の統合を向上する手法を提案する。
実験の結果, LLM-SRecは, ユーザの項目間相互作用の系列を理解する能力を高め, 最終的にレコメンデーション性能の向上につながることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:42:03 GMT)
An Optimizable Suffix Is Worth A Thousand Templates: Efficient Black-box Jailbreaking without Affirmative Phrases via LLM as Optimizer [33.7] 最適化可能な接尾辞を用いた新規かつ効率的なブラックボックスジェイルブレイク法であるELIPSEを提案する。
我々は,Jailbreakの目標を自然言語命令に変換するタスクプロンプトを用いて,悪意のあるクエリに対する逆接接尾辞を生成する。
ECLIPSE は3つのオープンソース LLM と GPT-3.5-Turbo に対して平均攻撃成功率 0.92 を達成し、GCG を2.4倍に上回っている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:03:11 GMT)
Direct Preference Optimization for LLM-Enhanced Recommendation Systems [33.5] 大規模言語モデル(LLM)は、幅広い領域で顕著なパフォーマンスを示している。
我々は,DPOをLLM強化レコメンデーションシステムに統合するフレームワークであるDPO4Recを提案する。
大規模な実験により、DPO4Recは強いベースラインよりも性能が大幅に向上した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:22:49 GMT)
STAR-1: Safer Alignment of Reasoning LLMs with 1K Data [33.5] STAR-1は、大きな推論モデル(LRM)用に特別に設計された高品質でジャスト1kスケールの安全データセットである。
STAR-1は、多様性、熟考的推論、厳密なフィルタリングという3つの原則に基づいて構築されている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:04:04 GMT)
Lux Post Facto: Learning Portrait Performance Relighting with Conditional Video Diffusion and a Hybrid Dataset [33.4] 我々はLux Post Factoを紹介した。これは光リアリスティックと時間的に一貫した照明効果を両立させる新しいポートレートビデオライティング手法である。
提案手法では,静的表現OLATデータと画像内パフォーマンスビデオを組み合わせたハイブリッドデータセットを用いて,ライティングと時間的モデリングを共同で学習する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:46:45 GMT)
Making Large Language Models Better Knowledge Miners for Online Marketing with Progressive Prompting Augmentation [33.1] マーケティング指向の知識グラフをLLMで抽出するためのプログレッシブプロンプトであるPAIRを提案する。
特に,LLMをベースとした適応的関係フィルタリングプロセスにおける純粋関係生成を知識駆動型プロンプト技術により削減する。
オンラインサービスに関しては,中小のPAIR(LightPAIR)を専門とし,強力な教師LLMによって提供される高品質のコーパスを微調整する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:20:49 GMT)
Bridging the Linguistic Divide: A Survey on Leveraging Large Language Models for Machine Translation [33.1] 大規模言語モデル(LLM)の出現は機械翻訳(MT)の景観を大きく変えた。
我々は、アンダーリソース設定への効果的な適応を可能にする、少数ショットプロンプト、クロスランガル転送、パラメータ効率の微調整などの手法を解析する。
幻覚, 評価の不整合, 遺伝バイアスなどの持続的課題について検討するとともに, 翻訳品質向上のためのLCM駆動メトリクスの評価を行った。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:26:40 GMT)
Variational preparation of entangled states in a system of transmon qubits [32.7] 極小校正された2ビットのi-Swap様ゲートを用いてベル状態とGHZ状態を2ビットと3ビットのトランペット量子ビット系で実験的に生成する。
提案手法は変分量子アルゴリズム(VQA)を用いて、不完全なマルチキュービット演算によりターゲット量子状態を生成する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:09:26 GMT)
Nitrogen-Vacancy Centers in Epitaxial Laterally Overgrown Diamond: Towards Up-scaling of Color Center-based Quantum Technologies [32.7] 広い領域を持つ高品質で単結晶ダイヤモンド(SCD)は、アップスケーリング量子技術応用に望ましい。
ヘテロエピタキシーは大きなSCDを成長させるための一般的なツールとなっているが、量子アプリケーションに必要な高結晶質を達成することは依然として課題である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:38:10 GMT)
Data Driven Decision Making with Time Series and Spatio-temporal Data [32.4] 時系列データは、時間とともに変化するプロパティをキャプチャする。
このチュートリアルは、データ分析-決定の全体的パラダイムを取り入れている」。
データ品質向上を目的としたデータガバナンス手法について論じる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:02:00 GMT)
Improving Multi-modal Recommender Systems by Denoising and Aligning Multi-modal Content and User Feedback [32.1] マルチモーダルレコメンダシステム(DA-MRS)を提案する。
DA-MRSは、マルチモーダルノイズを軽減するために、まず、モーダル間の一貫したコンテント類似性によって決定されるアイテム-テムグラフを構成する。
DA-MRSは、ユーザフィードバックを認知するために、観測されたフィードバックの確率とマルチモーダルコンテンツとを関連付け、識別されたBPR損失を考案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:51:31 GMT)
ArchCAD-400K: An Open Large-Scale Architectural CAD Dataset and New Baseline for Panoptic Symbol Spotting [31.4] ArchCAD-400Kは5538の高度に標準化された図面から413,062個のチャンクからなる大規模CADデータセットである。
我々は、Dual-Pathway Symbol Spotter (DPSS)と呼ばれる、汎視的シンボルスポッティングのための新しいベースラインモデルを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:24:01 GMT)
GarmageNet: A Dataset and Scalable Representation for Generic Garment Modeling [31.1] Garmageは、複雑な多層衣服のためのニューラルネットワークとCGフレンドリーな表現である。
GarmageNetは、ボディコンフォーミング初期ジオメトリーと複雑な縫製パターンを備えた詳細な衣服を製造している。
工業標準、大規模、高忠実な衣服データセットをリリースする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:37:32 GMT)
Dinomaly: The Less Is More Philosophy in Multi-Class Unsupervised Anomaly Detection [31.0] 本稿では,再構成に基づく異常検出フレームワーク,すなわちDianomalyを紹介する。
提案したDinomalyは,3つのデータセットでそれぞれ99.6%,98.7%,89.3%のイメージレベルAUを達成した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:01:42 GMT)
LLM-VPRF: Large Language Model Based Vector Pseudo Relevance Feedback [31.0] ベクトルPseudo Relevance Feedback (VPRF) はBERTに基づく高密度検索システムの改善に有望な結果を示した。
本稿では,大言語モデル(LLM)に基づく高密度検索器におけるVPRFの一般化可能性について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:02:01 GMT)
Fundamental computational limits of weak learnability in high-dimensional multi-index models [30.5] 本稿では, 1次反復アルゴリズムを用いて低次元構造を弱めに復元するために必要な最小サンプル複雑性に着目した。
i) 自明な部分空間が任意の$alpha!>!0$; (ii) 自明な部分空間が空であれば、簡単な部分空間の存在に必要な必要十分条件を提供する。
限定的だが興味深い厳密な方向の集合において、-パリティ問題に似て-$alpha_c$が見つかる
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:49:06 GMT)
Do LLM Agents Have Regret? A Case Study in Online Learning and Games [30.4] 大規模言語モデル(LLM)は(対話的な)意思決定にますます採用されている。
オンライン学習とゲーム理論のベンチマーク決定設定において,それらの相互作用について検討する。
本稿では,教師付きプレトレーニングの損失とは対照的に,教師付き行動のラベルを必要としない新しいインフントレーニングの損失を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:51:07 GMT)
Method-of-Moments Inference for GLMs and Doubly Robust Functionals under Proportional Asymptotics [30.3] 高次元一般化線形モデル(GLM)における回帰係数と信号対雑音比の推定について考察する。
我々は、推論対象の一貫性と漸近的正規性(CAN)推定を導出する。
理論的結果を数値実験と既存文献との比較で補完する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:46:26 GMT)
FIORD: A Fisheye Indoor-Outdoor Dataset with LIDAR Ground Truth for 3D Scene Reconstruction and Benchmarking [29.6] 本研究では,シーン再構築作業に適した魚眼画像データセットを提案する。
2つの200度の魚眼レンズを使って、私たちのデータセットは5つの屋内と5つの屋外のシーンの完全な360度カバレッジを提供します。
それぞれのシーンには、SfM点雲と正確なLIDAR由来の高密度な点雲があり、幾何学的な地平線として使用できる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:41:23 GMT)
Enhancing Embedding Representation Stability in Recommendation Systems with Semantic ID [29.6] 本稿では,従来のセマンティックIDの性能を大幅に向上させる新しいトークンパラメータ化手法であるセマンティックIDプレフィックスngramを紹介する。
セマンティックIDプレフィックスngramは, 組込み不安定性に対処するだけでなく, テールIDモデリングを著しく改善し, オーバーフィッティングを低減し, 表現シフトを緩和する。
また,Semantic IDをMeta Production Ads Rankingシステムに統合した経験を報告する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:28:38 GMT)
PolypSegTrack: Unified Foundation Model for Colonoscopy Video Analysis [28.8] PolypSegTrackは、大腸内視鏡ビデオにおけるPolyp検出、セグメンテーション、分類、教師なし追跡を共同で扱う新しい基礎モデルである。
我々のアプローチは、新しい条件付きマスク損失を活用し、ピクセルレベルのセグメンテーションマスクまたはバウンディングボックスアノテーションを持つデータセット間の柔軟なトレーニングを可能にする。
我々の教師なし追跡モジュールは、視覚に頼ることなく、オブジェクトクエリを使用して、フレーム全体のポリプインスタンスを確実に関連付けます。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:58:56 GMT)
Flow to the Mode: Mode-Seeking Diffusion Autoencoders for State-of-the-Art Image Tokenization [28.1] FlowMoは、複数の圧縮速度で画像トークン化のための新しい最先端技術を実現するトランスフォーマーベースの拡散オートエンコーダである。
重要な洞察は、FlowMoトレーニングは、トレーニング前段階とトレーニング後段階に分割されるべきであるということです。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:40:41 GMT)
Test-time Adaptation for Foundation Medical Segmentation Model without Parametric Updates [27.9] 基礎医療セグメンテーションモデルは、MedSAMが最も人気があり、臓器や病変をまたいで有望なパフォーマンスを実現している。
MedSAMは、複雑な構造と外観を持つ特定の病変に対する妥協されたパフォーマンスと、バウンディングボックスのプロンプトによる摂動に悩まされている。
本稿では,分布近似型潜在条件付きランダム場損失とエントロピー最小化損失を併用して,後続予測確率の因子化条件付き確率を最大化する手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:03:34 GMT)
Representation Bending for Large Language Model Safety [27.8] 大きな言語モデル(LLM)は強力なツールとして登場したが、その固有の安全性のリスクは重大な課題を引き起こしている。
本稿では,LLMにおける有害行動の表現を根本的に破壊する新しい手法であるRepBendを紹介する。
RepBendは最先端のパフォーマンスを達成し、Circuit Breaker、RMU、NPOといった従来の手法よりも優れ、攻撃成功率を最大95%削減する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:47:01 GMT)
Efficient Alignment of Unconditioned Action Prior for Language-conditioned Pick and Place in Clutter [26.4] 本研究では,ロボットが対象物を開き散らかし,特定の場所に移動させるという,言語条件のピック・アンド・プレイス作業について検討する。
いくつかのアプローチは、ビジョンファウンデーションモデルから機能を使ってエンドツーエンドのポリシーを学び、大きなデータセットを必要とする。
本研究では,無条件動作先行と3次元視覚言語先行とを1つの注意層から学習することで協調する行動先行アライメント手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:52:34 GMT)
A Status Quo Investigation of Large Language Models towards Cost-Effective CFD Automation with OpenFOAMGPT: ChatGPT vs. Qwen vs. Deepseek [26.3] 複数の大言語モデルを用いたOpenFOAMGPTの性能評価を行った。
いくつかのモデルでは、境界条件の調整などの異なるCFDタスクを効率的に管理する。
QwQ-32Bのようなより小さなモデルは、複雑なプロセスのために有効なソルバファイルを生成するのに苦労した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:04:52 GMT)
Representing Flow Fields with Divergence-Free Kernels for Reconstruction [26.1] 分散自由カーネル(DFK)に基づく新しい流れ場再構築フレームワークを提案する。
DFKs-Wen4は速度場に対する解析的分散のない近似の最適形である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:13:59 GMT)
Multi-party Collaborative Attention Control for Image Customization [25.4] MCA-Ctrlは、テキストと複雑な視覚条件の両方を用いて高品質な画像カスタマイズを可能にするチューニング不要な手法である。
MCA-Ctrlは、条件入力とのセマンティック一貫性を維持しながら、特定の被験者の内容と外観をキャプチャする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:45:49 GMT)
Interactive Sketchpad: A Multimodal Tutoring System for Collaborative, Visual Problem-Solving [25.2] 本稿では,対話型ビジュアライゼーションと対話型ビジュアライゼーションを組み合わせた学習システムであるInteractive Sketchpadを紹介する。
幾何学、計算、および対話型スケッチパッドなどの数学問題に関するユーザ研究は、タスク理解、問題解決精度、エンゲージメントレベルの改善につながることを示した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 01:03:51 GMT)
APPATCH: Automated Adaptive Prompting Large Language Models for Real-World Software Vulnerability Patching [25.0] 本稿では,事前学習言語モデル(LLM)のパワーとメリットを活用し,脆弱性の自動パッチングを実現する。
脆弱なコードの振る舞いを効果的に推論するために,LLMを応用するために,脆弱性セマンティックス推論と適応的プロンプトを導入する。
97のゼロデイ脆弱性と20の既存脆弱性に対するAPの評価は、既存の手法と最先端の非LLM技術の両方に優れた性能を示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:10:42 GMT)
SAM-REF: Introducing Image-Prompt Synergy during Interaction for Detail Enhancement in the Segment Anything Model [24.8] 軽量精細機を用いて画像とプロンプトを完全に統合する2段階精細化フレームワークを提案する。
我々のSAM-REFモデルは、効率を損なうことなくセグメンテーション品質に関するほとんどの指標において、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:07:20 GMT)
Leveraging Modality Tags for Enhanced Cross-Modal Video Retrieval [24.8] ビデオ検索のためのモダリティ補助概念(MAC-VR)を紹介する。
我々は、潜在空間におけるモダリティの整合と、補助潜在概念の学習と整合性を提案する。
5つの多様なデータセットについて広範な実験を行う。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:56:01 GMT)
TimeSearch: Hierarchical Video Search with Spotlight and Reflection for Human-like Long Video Understanding [24.5] 大規模ビデオ言語モデル(LVLM)は、様々なビデオ言語タスクで顕著なパフォーマンスを示している。
長いビデオを空間的にも時間的にもダウンサンプリングすることは視覚幻覚を引き起こす可能性があるため、長いビデオを正確に解釈することは困難である。
TimeSearchは2つの人間のようなプリミティブを統合された自己回帰型LVLMに統合する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:47:19 GMT)
Repurposing SAM for User-Defined Semantics Aware Segmentation [23.9] SAMに意味認識を付与する新しいフレームワークであるU-SAMを提案する。
U-SAMは、テストデータディストリビューションのラベル付き/ラベルなしサンプルを必要とせずに、画像にピクセルレベルのセマンティックアノテーションを提供する。
We evaluate U-SAM on PASCAL VOC 2012 and MSCOCO-80, achieve significant mIoU improve of +17.95% and +520%。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:00:56 GMT)
AgentForge: A Flexible Low-Code Platform for Reinforcement Learning Agent Design [23.5] 本稿では,強化学習システムにまたがるパラメータを最適化する,フレキシブルなローコードプラットフォームであるAgentForgeを提案する。
本稿では,視覚に基づくRL問題に対する性能評価について述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:59:05 GMT)
MLKV: Efficiently Scaling up Large Embedding Model Training with Disk-based Key-Value Storage [22.8] 本稿では,MLKVを提案する。MLKVは,組込みモデルトレーニングにおけるスケーラビリティの課題に対処するために設計された,効率的で再利用可能なデータストレージフレームワークである。
オープンソースのワークロードの実験では、MLKVは、産業的な強度を持つキーバリューストア上に構築されたオフロード戦略を1.6-12.6倍上回っている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:57:01 GMT)
Diffusion-Guided Gaussian Splatting for Large-Scale Unconstrained 3D Reconstruction and Novel View Synthesis [22.8] 本稿では,現行手法の限界に対処する多視点拡散モデルを用いて,新しい3DGSフレームワークであるGS-Diffを提案する。
マルチビュー入力に条件付き擬似観測を生成することにより、制約の少ない3次元再構成問題をよく表されたものに変換する。
4つのベンチマークの実験では、GS-Diffは最先端のベースラインをかなりのマージンで一貫して上回っている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:59:46 GMT)
RoboAct-CLIP: Video-Driven Pre-training of Atomic Action Understanding for Robotics [22.0] 本稿では,コントラスト言語-画像事前学習(CLIP)アーキテクチャに基づく時間分解微調整戦略を提案する。
シミュレーション環境での結果は,RoboAct-CLIP事前学習モデルがベースラインのビジュアル言語モデルよりも12%高い成功率を達成することを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:02:08 GMT)
CLIBD: Bridging Vision and Genomics for Biodiversity Monitoring at Scale [22.0] コントラスト学習を用いて画像、バーコードDNA、および統合埋め込み空間における分類ラベルのテキストベース表現を整列する。
本手法は、ゼロショット学習タスクにおいて、従来の単一モダリティアプローチを8%以上精度で上回る。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:13:52 GMT)
A Systematic Survey of Automatic Prompt Optimization Techniques [22.0] 本研究は,本分野における現状と今後の課題をまとめた総合的な調査である。
APOは5つの部分を統一するフレームワークであり、それに基づいて関連する作業をすべて厳格に分類する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:04:21 GMT)
Bench4Merge: A Comprehensive Benchmark for Merging in Realistic Dense Traffic with Micro-Interactive Vehicles [21.8] 本稿では,統合シナリオにおける動作計画能力を評価するためのベンチマークを提案する。
我々のアプローチには、微小な行動特性を持つ大規模データセットで訓練された他の車両が含まれる。
既存の手法の評価を行い,共通問題を同定した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:02:05 GMT)
Aligned Better, Listen Better for Audio-Visual Large Language Models [21.5] ビデオには本質的に音声が含まれており、視覚に情報を提供する。
ビデオ大言語モデル(ビデオ-LLM)は多くのオーディオ中心の設定に遭遇する。
既存のモデルは、音声情報を利用するのに欠陥があり、理解と幻覚が弱い。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:47:09 GMT)
Track and Trace: Automatically Uncovering Cross-chain Transactions in the Multi-blockchain Ecosystems [21.5] クロスチェーン技術は、分散金融(DeFi)エコシステム内のシームレスな資産移動とメッセージパッシングを可能にする。
本稿では,DeFiエコシステムに特化して設計された双方向トランザクショントレースツールABCTRACERを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:28:25 GMT)
Chain of Correction for Full-text Speech Recognition with Large Language Models [21.4] 大規模言語モデル(LLM)を用いた全文誤り訂正のための訂正の連鎖(CoC)
CoCは、通常のマルチターンチャットフォーマット内のガイダンスとして、事前に認識されたテキストを使用して、エラーセグメントをセグメントごとに修正する。
我々は、修正しきい値を設定し、過度な補正と過剰な言い換えのバランスをとる方法について分析する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:06:23 GMT)
Instance Migration Diffusion for Nuclear Instance Segmentation in Pathology [21.1] 核のインスタンスセグメンテーションは、デジタル病理学における疾患診断において重要な役割を担っている。
この課題に対処するために,新しいデータ拡張フレームワークIM-Diffusionを提案する。
多様な核配置と核間空間関係を構築することで、より多様な病理画像を生成する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:29:31 GMT)
UAC: Uncertainty-Aware Calibration of Neural Networks for Gesture Detection [21.0] IMUデータからジェスチャー確率とそれに関連する不確実性の両方を予測する不確実性認識型ジェスチャーネットワークアーキテクチャを提案する。
この不確実性は、各潜在的なジェスチャーの確率を調整するために使用される。
本手法は,ジェスチャ検出のために利用可能な3つのIMUデータセットを用いて評価し,ニューラルネットワークの3つの最先端キャリブレーション手法と比較した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:40:01 GMT)
Enabling Systematic Generalization in Abstract Spatial Reasoning through Meta-Learning for Compositionality [21.0] 構成性のためのメタラーニングのアプローチを抽象空間推論の領域に拡張する。
この結果から,メタラーニングにより学習したトランスフォーマーを用いたエンコーダ・デコーダモデルにより,既往の変換合成を体系的に一般化できることが示唆された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:56:39 GMT)
Investigating Map-Based Path Loss Models: A Study of Feature Representations in Convolutional Neural Networks [20.6] 畳み込みニューラルネットワークにおけるスカラー特徴の表現法について検討する。
画像チャネルとしてのスカラー特徴の表現が最強の一般化をもたらすことが判明した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:06:47 GMT)
From Prompts to Templates: A Systematic Prompt Template Analysis for Real-world LLMapps [20.5] 大規模言語モデル(LLM)は、自然言語のプロンプトを通じて直感的なタスク実行を可能にすることで、人間とAIのインタラクションに革命をもたらした。
構造や単語の小さなバリエーションは、出力に大きな違いをもたらす可能性がある。
本稿では,実用LLMappにおけるプロンプトテンプレートの包括的解析について述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:20:06 GMT)
Flavors of Margin: Implicit Bias of Steepest Descent in Homogeneous Neural Networks [19.2] 深層ニューラルネットワークにおける無限小学習率を持つ急勾配降下アルゴリズムの一般家系の暗黙バイアスについて検討した。
我々は、様々な急勾配アルゴリズムで最適化されたニューラルネットワークの軌道を実験的に拡大し、一般的な適応手法の暗黙のバイアスとのつながりを強調した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:56:57 GMT)
Client Selection in Federated Learning with Data Heterogeneity and Network Latencies [19.2] Federated Learning(FL)は、複数のクライアントがプライベートデータに基づいてローカルトレーニングを行う分散機械学習パラダイムである。
本稿では,両不均一性を扱う理論的に最適なクライアント選択方式を2つ提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:31:15 GMT)
DRAN: A Distribution and Relation Adaptive Network for Spatio-temporal Forecasting [19.1] 本稿では、時間とともに変化に適応し、分散することができるリレーショナル・アダプティブ・ネットワーク・ディストリビューション(DRAN)を提案する。
本研究では,SFLが時間的操作の空間的関係を効率的に保存していることを示す。
本手法は,天気予報や交通予報における技術手法の状況に優れる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:18:43 GMT)
SWE-Search: Enhancing Software Agents with Monte Carlo Tree Search and Iterative Refinement [18.8] 現在の大規模言語モデル(LLM)ベースのソフトウェアエージェントは、しばしば線形でシーケンシャルなプロセスに従う。
モンテカルロ木探索(MCTS)と自己改善機構を統合したマルチエージェントフレームワークであるSWE-Searchを提案する。
これは、複雑なソフトウェアエンジニアリング環境における自己評価駆動検索技術の可能性を強調している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:13:19 GMT)
Emerging Cyber Attack Risks of Medical AI Agents [18.6] 大規模言語モデル(LLM)を利用したAIエージェントは、医療と医療の課題に対処する上で、高いレベルの自律性を示す。
さまざまなツールにアクセスでき、オープンなアクション空間内で操作できる。
我々は、Webブラウジングツールを通じてインターネットにアクセスするエージェントとして、医療AIエージェントのサイバー攻撃の脆弱性を調査した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:04:53 GMT)
Anomaly Detection for Hybrid Butterfly Subspecies via Probability Filtering [18.5] 本研究は,BがAを生物学的に模倣した場合に,ハイブリッド種Aを認識するために訓練されたモデルがB種に一般化できる,特定のシナリオに焦点を当てる。
A種とB種は類似したパターンを共有しているため,BioCLIPを特徴抽出器として利用し,その分類に基づく特徴を捉える。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:18:44 GMT)
APPLS: Evaluating Evaluation Metrics for Plain Language Summarization [18.4] 本研究では,Plain Language Summarization (PLS) のメトリクス評価を目的とした,詳細なメタ評価テストベッド APPLS を提案する。
従来の作業から4つのPLS基準を特定し,これらの基準に対応する摂動のセットを定義した。
APPLSを用いて、自動スコア、語彙特徴、LLMプロンプトに基づく評価を含む14のメトリクスのパフォーマンスを評価する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:03:37 GMT)
Medical Spoken Named Entity Recognition [18.3] 医療領域における最初の音声NERデータセットであるVietMed-NERを紹介する。
我々の知る限り、ベトナムの現実世界のデータセットは、エンティティの型数に関する世界最大のNERデータセットである。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:12:03 GMT)
CARL: A Framework for Equivariant Image Registration [18.0] 画像登録は、一対の画像間の空間対応を推定する。
形式的には、推定子は所望の画像変換のクラスに同値であるべきである。
本稿では,多段階$[W,U]$等分散を座標アテンション機構と変位予測層を併用して実現する方法を示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:58:50 GMT)
Analysis of an Idealized Stochastic Polyak Method and its Application to Black-Box Model Distillation [17.9] SPS$*$ と呼ばれる理想化されたポリアクステップサイズの一般収束定理を提供する。
SPS$*$は、ソリューションで評価されたトレーニングバッチ毎に損失にアクセスする必要があるため、理想化されています。
これはまた、大域リプシッツ函数の最適下界を達成し、滑らかな設定で任意の時間収束する$O(1/sqrtt) を持つ最初のポリアクステップサイズであるという点でも理想的である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:57:39 GMT)
Can DeepSeek Reason Like a Surgeon? An Empirical Evaluation for Vision-Language Understanding in Robotic-Assisted Surgery [17.7] DeepSeekシリーズは、一般的なシーン理解、質問応答(QA)、テキスト生成タスクにおいて優れたパフォーマンスを示している。
本研究は, 単句QA, 視覚的QA, 詳細記述などのタスクに焦点をあてる。
DeepSeek-V3は、空間的位置分析において重要な限界を示し、外科的行動の正確な理解に苦慮している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:14:07 GMT)
UniFault: A Fault Diagnosis Foundation Model from Bearing Data [17.3] 既存の機械故障診断モデルは、多種多様なデータセットにまたがる限定的な一般化を伴う操作特化である。
障害診断のための基盤モデルUniFaultを導入し,これらの問題に体系的に対処する。
UniFaultは、さまざまなFDデータセットにまたがる90億以上のデータポイントで事前トレーニングされている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:34:27 GMT)
MDP: Multidimensional Vision Model Pruning with Latency Constraint [17.3] 多次元プルーニング(MDP)は,様々なプルーニング粒度を協調的に最適化する新しいパラダイムである。
大規模な実験により、MDPは特に高い刈り取り率で従来の方法よりも大幅に優れていたことが示されている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:00:10 GMT)
FLAMES: A Hybrid Spiking-State Space Model for Adaptive Memory Retention in Event-Based Learning [16.6] FLAMESは構造化状態空間力学とイベント駆動型計算を統合するハイブリッドフレームワークである。
ニューロモルフィックコンピューティングと構造化シーケンスモデリングをブリッジすることで、FLAMESはイベント駆動システムにおいてスケーラブルな長距離推論を可能にする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:08:19 GMT)
TeleAntiFraud-28k: An Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection [16.4] 本稿では,TeleAntiFraud-28kについて紹介する。
本データセットは,(1)自動音声認識(ASR)で書き起こされた通話記録(匿名化元音声)を用いたプライバシ保存テキストトラス・サンプル生成,(2)大規模言語モデル(LLM)に基づく自己指示サンプリングによるシナリオカバレッジの拡大,の3つの戦略により構築されている。
生成されたデータセットは、厳密に処理された28,511の音声テキストペアを含み、不正推論のための詳細なアノテーションを完備している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:32:22 GMT)
Prior Lessons of Incremental Dialogue and Robot Action Management for the Age of Language Models [16.3] 近年の自然言語処理の進歩により,ロボットの発話能力向上への取り組みが恩恵を受けている。
現在の言語モデルは本質的に単調であるため、完全にはインクリメンタルではない。
この単調性は人間-ロボット相互作用のための対話システムの開発に重要な意味を持つ。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:24:00 GMT)
ANNEXE: Unified Analyzing, Answering, and Pixel Grounding for Egocentric Interaction [16.3] 本稿では,Egocentric Interaction Reasoning and pixel Grounding (Ego-IRG) という新しいタスクを提案する。
Ego-IRGは、クエリを入力としてエゴセントリックなイメージを取り入れ、分析、回答、ピクセルグラウンドという3つの重要なステップを通じてインタラクションを解決することを目的とした最初のタスクである。
Ego-IRGBenchデータセットには、160万のクエリとそれに対応するインタラクションに関するマルチモーダルレスポンスを備えた、20万以上のエゴセントリックなイメージが含まれている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:24:35 GMT)
Private Synthetic Data Generation in Small Memory [16.3] $mathttPrivHP$は、テキスト差分プライバシーを保証する軽量な合成データジェネレータである。
階層の深さ、ノイズの追加、低周波のプルーニングのバランスを保ちながら、頻繁なノイズを保っている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:01:51 GMT)
Quo Vadis, HCOMP? A Review of 12 Years of Research at the Frontier of Human Computation and Crowdsourcing [16.2] 人間の計算とクラウドソーシングは歴史的に、タスクを人間にアウトソースする方法を研究してきた。
以前は人群衆に配布されていた多くのタスクは、現在、人間レベルの能力を持つ生成AIによって完了することができる。
言語モデルを使ってタスクを完了しようとするクラウドワーカーの懸念が浮かび上がっている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:51:57 GMT)
DLFR-VAE: Dynamic Latent Frame Rate VAE for Video Generation [16.2] 本研究では,動的遅延フレームレートVAE(DLFR-VAE)を提案する。
我々のシンプルだが効果的なDLFR-VAEはプラグイン・アンド・プレイモジュールとして機能し、既存のビデオ生成モデルとシームレスに統合できる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:25:35 GMT)
ScreenAudit: Detecting Screen Reader Accessibility Errors in Mobile Apps Using Large Language Models [16.1] ScreenAuditは、モバイルアプリの画面を横切り、メタデータと書き起こしを抽出し、スクリーンリーダーアクセシビリティエラーを特定するように設計されたシステムである。
以上の結果から,ScreenAuditの平均カバレッジは69.2%であり,広く使用されているアクセシビリティチェッカーでは31.3%に過ぎなかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:18:45 GMT)
Extension of the Dip-test Repertoire -- Efficient and Differentiable p-value Calculation for Clustering [16.1] 一様性のディップテスト(英: Dip-test of unimodality)は、1次元サンプルのモダリティを確実に評価するパラメータフリーな統計テストである。
多くのDipベースのクラスタリングアルゴリズムは、ある程度のサンプルサイズでDip-からDip-p-値に変換するブートストラップ付きルックアップテーブルを使用している。
本稿では、これらの最先端のルックアップテーブルの代用として、特別に設計されたシグモイド関数を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:15:38 GMT)
NeuRaLaTeX: A machine learning library written in pure LaTeX [16.0] 我々は,完全に韻律で書かれた最初のディープラーニングライブラリであるNeuRaLaを紹介する。
ドキュメントの一部として、ニューラルネットワークのアーキテクチャとその損失関数を指定することができる。
ドキュメントがコンパイルされると、コンパイラはトレーニングデータを生成し、ロードし、ネットワークをトレーニングし、実験を行い、図を生成する。
論文はコンパイルに48時間かかり、NeuRaLaのソースコード全体が論文のソースコードに含まれている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:46:42 GMT)
3D Gaussian Inverse Rendering with Approximated Global Illumination [15.9] スクリーン空間線トレーシングによる3次元ガウシアンスプラッティングの効率的な大域的照明を可能にする新しい手法を提案する。
私たちの重要な洞察は、相当量の間接的な光を現在の視界のフラストタルから見える表面まで遡ることができるということです。
実験では,画面空間の近似により間接照明が可能となり,リアルタイムのレンダリングと編集が可能であることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:02:25 GMT)
Memory-efficient Low-latency Remote Photoplethysmography through Temporal-Spatial State Space Duality [15.7] ME-rは時間空間空間双対性に基づくメモリ効率のアルゴリズムである。
最小の計算オーバーヘッドを維持しながら、顔フレーム間の微妙な周期的な変化を捉えます。
我々のソリューションは3.6MBのメモリ使用率と9.46msのレイテンシでリアルタイムの推論を可能にする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:34:04 GMT)
An Introductory Survey to Autoencoder-based Deep Clustering -- Sandboxes for Combining Clustering with Deep Learning [15.4] このサーベイは、基本的なオートエンコーダベースのディープクラスタリングアルゴリズムの紹介を提供する。
ディープラーニングとクラスタリングの組み合わせは、Deep Clusteringと呼ばれ、特定のクラスタリングタスクに適した表現を学ぶことができる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:46:22 GMT)
Augmentation of EEG and ECG Time Series for Deep Learning Applications: Integrating Changepoint Detection into the iAAFT Surrogates [15.4] 非定常時系列を増大させる新しい方法を提案する。
これは、オフライン切換点検出と反復振幅調整フーリエ変換(iAAFT)を組み合わせることで実現される。
CHB-MITとシエナのデータセットはそれぞれ精度が4.4%、精度が1.9%、精度が10%、精度が5.5%、リコールが3.6%、リコールが0.9%、F1が4.2%、F1が1.4%だった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:40:04 GMT)
Global Rice Multi-Class Segmentation Dataset (RiceSEG): A Comprehensive and Diverse High-Resolution RGB-Annotated Images for the Development and Benchmarking of Rice Segmentation Algorithms [15.3] 画像成分の区別は、器官の規模で植物の成長と発達を特徴づける重要な前提条件である。
RiceSEGは、最初の包括的多クラスイネセマンティックセマンティックセグメンテーションデータセットである。
5カ国から高解像度地上画像5万枚を収集した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:03:23 GMT)
On Data Synthesis and Post-training for Visual Abstract Reasoning [15.1] 我々は,LLaVANeXT 7Bモデルを用いて,特定の問題に対する認識と推論を行う。
これまでのほとんどのVLMは、代表ベンチマークでほとんどランダムなパフォーマンスを示しなかったため、これは素晴らしいブレークスルーです。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:18:24 GMT)
An Exponential Separation Between Quantum and Quantum-Inspired Classical Algorithms for Linear Systems [15.0] 本稿では、線形システムの解法の基本問題に対する量子と量子に着想を得た古典的アルゴリズムの最初の証明可能な指数的分離について述べる。
現在の状況からすると、どんな自然な機械学習タスクでも指数的な量子スピードアップを期待できるかどうかは不明だ。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:39:17 GMT)
From Easy to Hard: Building a Shortcut for Differentially Private Image Synthesis [14.9] 差分プライベート(DP)画像合成は、センシティブなデータセットから合成画像を生成することを目的としている。
本稿では,拡散モデルを用いて合成画像を容易に生成する2段階のDP画像合成フレームワークを提案する。
我々は,4つの画像データセットの平均値において,合成画像の忠実度と有用度が,最先端の手法よりも33.1%,2.1%向上していることを示す実験を行った。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:30:55 GMT)
LVMed-R2: Perception and Reflection-driven Complex Reasoning for Medical Report Generation [14.6] 我々は,LVMの複雑な推論とリフレクション機構を導入し,医療報告の生成を向上させるための新たな微調整戦略であるLVMed-R2を提案する。
提案する複雑推論は,LVMの診断精度を向上させるための医用知識注入と知覚強調モジュールを含む。
提案したリフレクション機構によって微調整されたLVMには,出力と複雑な推論を効果的に補正する能力があることを実証した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:18:54 GMT)
OmniCellTOSG: The First Cell Text-Omic Signaling Graphs Dataset for Joint LLM and GNN Modeling [14.5] OmniCellTOSGは、セルテキスト・オミリック・シグナリンググラフ(TOSG)の最初のデータセットである。
各TOSGは、個人またはメタセルのシグナルネットワークを表し、臓器、疾患、性別、年齢、細胞サブタイプなどの情報でラベル付けされる。
データセットは継続的に拡張され、定期的に更新される。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:47:58 GMT)
SOLAR: Scalable Optimization of Large-scale Architecture for Reasoning [14.4] 我々は,CoT(Chain-of-Thought),ToT(Tree-of-Thought),GoT(Graph-of-Thought)トポロジを動的に最適化し,精度と効率を向上させるフレームワークであるSOLARを提案する。
また,各課題にポストトレーニングと推論スケーリングを適応的に組み合わせたカリキュラムベースアプローチであるTopological-Scalingを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:51:45 GMT)
ToM-RL: Reinforcement Learning Unlocks Theory of Mind in Small LLMs [14.3] ルールに基づく強化学習は、小規模言語モデルにおいても、理論・オブ・マインド(ToM)推論能力を解き放つことができることを示す。
RLでトレーニングされた7Bモデルは、GPT-4oやDeepSeek-v3といったモデルを上回る、Hi-ToMベンチマークで84.50%の精度を実現しています。
これらの結果は、RLが社会的認知的推論を強化し、構造的問題解決とニュアンス的社会的推論のギャップを埋める可能性を強調している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:58:42 GMT)
Geometry in Style: 3D Stylization via Surface Normal Deformation [14.2] 我々は、アイデンティティ保存メッシュスタイリングの新しい手法であるGeometry in Styleを提案する。
既存の技術は、バンプマップのような過度に制限された変形を通じて、元の形状に固執する。
対照的に、三角形メッシュの変形を対象の正規ベクトルとして表現する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:56:38 GMT)
Is the Reversal Curse a Binding Problem? Uncovering Limitations of Transformers from a Basic Generalization Failure [14.1] LLMはReversal Curseとして知られる基本的な一般化の失敗を示す。
LLMにおける逆曲線は認知科学、神経科学、AIにおける長年の結合問題の顕在化である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:38:03 GMT)
A Truncated Newton Method for Optimal Transport [13.8] 本稿では, エントロピック規則化最適輸送(OT)解法のための特殊トランケートニュートンアルゴリズムを提案する。
提案アルゴリズムは実行時性能が極めて良好であり,既存の多くの選択肢よりも高精度な順序を達成できる。
アルゴリズムのスケーラビリティは、非常に大きなOT問題に対して、約106$の$n近似で示され、エントロピー正則化の弱さの下で解決される。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:00:24 GMT)
Deep LG-Track: An Enhanced Localization-Confidence-Guided Multi-Object Tracker [13.8] Deep LG-Trackは、トラッキング精度とロバスト性を改善するために3つの重要な拡張を組み込んだ、新しいマルチオブジェクトトラッカーである。
MOT17とMOT20データセットの総合的な評価は、提案されたDeep LG-Trackが常に最先端のトラッカーより優れていることを示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:10:18 GMT)
Preference-Driven Active 3D Scene Representation for Robotic Inspection in Nuclear Decommissioning [13.8] 本稿では,能動的3次元シーン表現パイプラインに専門家の好みを取り入れた新しいフレームワークを提案する。
具体的には,ロボット経路計画の指針として,人間フィードバックからの強化学習を用いる。
我々は, 原子炉タイル検査のためのUR3eロボットアームを用いて, 核廃炉シナリオの枠組みを検証した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:20:48 GMT)
ForestVO: Enhancing Visual Odometry in Forest Environments through ForestGlue [13.4] 我々は4つの構成でSuperPoint特徴検出器を強化したForestGlueを紹介する。
特徴マッチングには、合成森林データで再訓練したLightGlueまたはSuperGlueを用いる。
フレーム間のマッチング2次元画素座標を用いて相対カメラのポーズを推定するフォレストVOを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:20:05 GMT)
Efficient Federated Learning Tiny Language Models for Mobile Network Feature Prediction [13.3] 通信において、自律ネットワーク(AN)は、特定の要求(例えば、帯域幅、利用可能なリソース)に基づいて構成を自動的に調整する。
ここでは、フェデレートラーニング(FL)により、複数のANセル — それぞれニューラルネットワーク(NN)を備えた — が、データのプライバシを保持しながら、モデルを協調的にトレーニングすることが可能になる。
小型言語モデル(TLM)を統合する新しいFLフレームワークにおいて,ISO/IECニューラルネットワーク符号化(NNC)標準の実装であるNNCodecについて検討する。
ベルリンのV2Xデータセットを用いた実験の結果,NNCodecは透過的な圧縮を実現し,通信オーバーヘッドを1%以下に抑えることができた。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:54:06 GMT)
VideoScene: Distilling Video Diffusion Model to Generate 3D Scenes in One Step [13.2] VideoSceneは、ビデオ拡散モデルを蒸留して、ワンステップで3Dシーンを生成する。
VideoSceneは従来のビデオ拡散モデルよりも高速で優れた3Dシーン生成結果が得られる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:59:21 GMT)
Memory Kernel Coupling Theory: Obtain Time Correlation Function from Higher-order Moments [13.1] このレターは、時間相関関数(TCF)を評価する一般的な形式であるメモリカーネル結合理論(MKCT)を提示する。
補助核の急激な崩壊により、結合した運動方程式を高精度に切り離すことができる。
この定式化は一般的なものであるが、典型的な開量子系(スピンボソンモデル)の数値的な実演を行う。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:30:11 GMT)
Induction Heads as an Essential Mechanism for Pattern Matching in In-context Learning [12.9] 誘導ヘッドの最小アブレーションでもICL性能は抽象的パターン認識タスクで最大32%低下することを示す。
NLPタスクの場合、このアブレーションはモデルがサンプルから恩恵を受ける能力を大幅に低下させ、ゼロショットプロンプトに近い数ショットのICLパフォーマンスをもたらす。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:40:08 GMT)
MagicDec: Breaking the Latency-Throughput Tradeoff for Long Context Generation with Speculative Decoding [12.7] 我々は,中間列から長列への高スループット推論方式であっても,投機的復号化が高速化可能であることを示す。
最大高速化のための最適起草戦略を選択するための理論的モデルを提案する。
中程度から長いシーケンスでは、32から256までのバッチサイズでLlama3.1-8Bの2.51倍のスピードアップを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 01:58:38 GMT)
Exploring Data Scaling Trends and Effects in Reinforcement Learning from Human Feedback [12.7] 本稿では、推論タスク検証器(RTV)と生成報酬モデル(GenRM)を組み合わせたハイブリッド報酬システムを導入し、報酬ハッキングを緩和する。
また,応答の多様性を維持し,学習効率を高めるために,新しいプロンプト選択手法であるPre-PPOを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:26:34 GMT)
Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval [12.7] 本稿では,GRAM(Generative Retrieval and Alignment Model)という新しいeコマース検索パラダイムを紹介する。
GRAMは、クエリと製品の両方からのテキスト情報を共同でトレーニングして、共有テキストコードを生成する。
GRAMは従来のモデルと最新の生成的検索モデルを大きく上回っている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:40:09 GMT)
On the Role of Priors in Bayesian Causal Learning [12.3] 我々は、ラベルのないデータが、そのメカニズムを定義するパラメーターの推定を改善しないことを、実用的な方法で示す。
本研究は,原因パラメータとメカニズムパラメータの適切な優先順位を選択することの重要性を考察する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:19:49 GMT)
OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery [12.3] 一般科学のための専門的な大規模推論モデルであるOmniScienceを紹介する。
我々は、分子を潜在的電解質溶媒または添加剤として効率よくランク付けする電池剤を開発した。
我々は,ドメイン適応型事前学習と推論に基づく知識蒸留が性能レベルを達成するために重要であることをアブレーション実験で実証した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:01:30 GMT)
Code Red! On the Harmfulness of Applying Off-the-shelf Large Language Models to Programming Tasks [12.2] 我々は、潜在的に有害なソフトウェアエンジニアリングシナリオの分類法を開発する。
次に、この分類に基づいてプロンプトのデータセットを作成します。
本稿では,モデルサイズ,アーキテクチャファミリー,アライメント戦略が有害なコンテンツを生成する傾向に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:00:14 GMT)
A Unified Approach to Analysis and Design of Denoising Markov Models [12.0] 我々はマルコフモデルを決定するための厳密な数学的基盤を確立することを目指している。
本稿では,後方ジェネレータの明示的な構築を確実にするための仮定の最小セットを提案する。
我々のフレームワークは、連続および離散拡散モデルの既存の定式化を統一する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:46:43 GMT)
Kite: How to Delegate Voting Power Privately [12.0] 我々は、メンバの投票権の委譲を$textitprivate$で行えるプロトコルであるKiteを紹介した。
有権者は、誰に委任されたかを知ることなく、自由に委任し、証明し、権限を再委譲することができる。
公に記録されている唯一の情報は、投票者がその投票を誰かに委任または再委任したことである。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:26:01 GMT)
Fourier Feature Attribution: A New Efficiency Attribution Method [11.8] 本稿では,信号分解理論に基づく新しいフーリエ特徴帰属法を提案する。
実験により,Fourier特徴帰属は空間領域帰属法と比較して優れた特徴選択能力を示すことが示された。
その結果、フーリエの特徴はクラス内濃度とクラス間特異性が高く、より効率的な分類と説明可能なAIアルゴリズムの可能性を示していることが明らかとなった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:20:19 GMT)
When Reasoning Meets Compression: Benchmarking Compressed Large Reasoning Models on Complex Reasoning Tasks [11.7] 大規模言語モデルの圧縮(LLM)は、計算資源のコスト削減に有効なソリューションを提供する。
圧縮されたDeepSeek-R1モデルを4つの異なる推論データセットでベンチマークした。
パラメータカウントは記憶量よりも LRM の知識に大きく影響していることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:17:46 GMT)
Cyclic Contrastive Knowledge Transfer for Open-Vocabulary Object Detection [11.5] 我々は、余分な監督なしに訓練されたCCKT-Detを提案する。
提案フレームワークは,視覚言語モデル(VLM)から抽出した言語クエリと視覚領域の特徴から,循環的かつ動的に知識を伝達する。
CCKT-Detは、VLMの規模が大きくなるにつれて常に性能を向上させることができる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:12:56 GMT)
Is Temporal Prompting All We Need For Limited Labeled Action Recognition? [11.5] コアCLIPアーキテクチャを変更することなく、時間的視覚的プロンプトを利用して時間的適応を行うCLIPの適応であるTP-CLIPを提案する。
TP-CLIPはCLIPアーキテクチャに効率的に統合され、ビデオデータに事前トレーニングされた機能を活用する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:50:28 GMT)
LLM4SZZ: Enhancing SZZ Algorithm with Context-Enhanced Assessment on Large Language Models [10.5] SZZアルゴリズムは、バグ発生コミットを特定する主要な手法である。
バグ予測や静的コード解析など、多くのソフトウェア工学研究の基盤となっている。
近年,従来のSZZアルゴリズムを強化するために,ディープラーニングに基づくSZZアルゴリズムが導入された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:40:57 GMT)
Meat-Free Day Reduces Greenhouse Gas Emissions but Poses Challenges for Customer Retention and Adherence to Dietary Guidelines [10.5] 肉フリーデイ(英語: Meat-Free Day、MFD)は、動物由来の食事の除去を通じて植物由来の食事を促進する戦略である。
大学構内におけるMFDの環境, 行動, 栄養への影響を18カ月以上にわたって検討した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:50:57 GMT)
Time-optimal single-scalar control on a qubit of unitary dynamics [10.4] 最適プロトコルに関する一般的な制約は導出され、時間-最適解を厳格にパラメータ化するために使用される。
完全ゲート忠実度を維持しながらバンバン制御の急激な変化を円滑に行う方法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:48:50 GMT)
Cross-Lingual Consistency: A Novel Inference Framework for Advancing Reasoning in Large Language Models [10.2] 大型言語モデル(LLM)における推論能力を高める重要なメカニズムとして、Chain-of-Thought(CoT)が登場した。
LLMの推論能力を高めるために,多数決による多言語推論経路を統合した言語間整合性(CLC)フレームワークを提案する。
CMATHデータセットの実証評価により、従来の自己整合性法よりもCLCの方が優れていることが明らかになった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:09:39 GMT)
Optimizing Social Media Annotation of HPV Vaccine Skepticism and Misinformation Using Large Language Models: An Experimental Evaluation of In-Context Learning and Fine-Tuning Stance Detection Across Multiple Models [10.2] 我々は,HPVワクチン関連ツイートに対するスタンス検出のためのソーシャルメディアコンテンツアノテーションのスケールアップのための最適戦略を実験的に決定する。
一般に、インコンテキスト学習は、HPVワクチンのソーシャルメディアコンテンツに対するスタンス検出において微調整よりも優れる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:27:38 GMT)
Multimodal Point Cloud Semantic Segmentation With Virtual Point Enhancement [10.2] LiDARベースの3Dポイントクラウド認識は、様々なアプリケーションで有用であることが証明されている。
空間と密度の変化は、複雑な物体の詳細を捉える上で大きな課題となる。
仮想ポイントエンハンスメントに基づくマルチモーダルポイントクラウドセマンティックセマンティックセマンティックス法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:02:06 GMT)
Graphically Speaking: Unmasking Abuse in Social Media with Conversation Insights [10.2] ソーシャルメディアの会話における虐待的言語は、先行するコメントの内容とトポロジによって特徴づけられる会話の文脈に依存する。
従来の乱用言語検出モデルは、しばしばこのコンテキストを見落とし、信頼性の低いパフォーマンス指標につながる可能性がある。
会話コンテキストを統合する最近の自然言語処理(NLP)手法は、しばしば限定的かつ単純化された表現に依存し、一貫性のない結果を報告する。
本稿では,グラフニューラルネットワーク(GNN)を用いてソーシャルメディアの会話をグラフとしてモデル化し,ノードがコメントを表現し,エッジが応答構造をキャプチャする手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:03:37 GMT)
Generate the browsing process for short-video recommendation [10.1] 本稿では,ショートビデオレコメンデーションのためのブラウジングプロセスを生成する新しいモデルを提案する。
ビデオレコメンデーションにおける視聴時間予測のための,ユーザエンゲージメントフィードバック(SCAM)による新しいセグメンションコンテンツ認識モデルを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:54:52 GMT)
Decoding Covert Speech from EEG Using a Functional Areas Spatio-Temporal Transformer [9.9] 脳波(EEG)からの音声の復号は、脳波マッピングの理解が限られているため困難である。
本研究では,57人の右利き英語話者を対象に,大規模多言語音声脳波を作成した。
本研究は,前頭側頭葉領域と側頭葉領域のFAST生成活性化マップを可視化することにより,音声のニューラル特徴を明らかにした。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:38:08 GMT)
DreamActor-M1: Holistic, Expressive and Robust Human Image Animation with Hybrid Guidance [9.9] 本稿では,DreamActor-M1 を用いた拡散トランスフォーマ (DiT) ベースのフレームワークを提案する。
動作誘導のために、暗黙の表情、3次元頭部球体、および3次元体骨格を統合したハイブリッド制御信号は、表情と身体運動の堅牢な制御を実現する。
実験により,本手法は,肖像画,上半身,全体生成の表現的結果を提示し,最先端の成果よりも優れることが示された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:30:32 GMT)
A Conic Transformation Approach for Solving the Perspective-Three-Point Problem [9.8] 本稿では,P3P問題を解くための円錐変換法を提案する。
我々のアプローチは、2つのコニックを新しい座標系にマッピングする変換に基づく新しい定式化に基づいている。
本手法は,最先端の手法に匹敵する頑健さと安定性を維持しつつ,高速を実現する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:27:47 GMT)
Local Differential Privacy for Tensors in Distributed Computing Systems [9.5] 高次元テンソルデータは、自律運転やスマートヘルスケアといった分散ビッグデータアプリケーションではますます一般的になっています。
伝統的な局所微分プライバシー法は、要素間の本質的な関係を保たないため、テンソルストライクには不十分である。
構造的整合性を維持しつつテンソル成分を摂動するランダム化応答機構を用いた新しいLCPアルゴリズムTLDPを導入する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:25:43 GMT)
PolyG: Effective and Efficient GraphRAG with Adaptive Graph Traversal [9.5] GraphRAGは、大きな言語モデル(LLM)を拡張して、外部知識グラフから関連する事実を検索することで、ユーザの質問に対する質の高い回答を生成する。
そこで本研究では,全4クラス分類に基づいて質問を分類し,各質問に対して適切なグラフトラバース戦略を適応的に選択することを提案する。
我々のシステムPolyGは基本的にGraphRAGのクエリプランナであり、統一されたインターフェースと実行エンジンで多様な質問を処理できます。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:19:04 GMT)
Subasa -- Adapting Language Models for Low-resourced Offensive Language Detection in Sinhala [9.3] そこで我々は,Masked Rationale Prediction を用いた中間的事前ネットワークのステップを組み込んだ「Subasa-XLM-R」の4つのモデルを紹介した。
我々は,Sinhala攻撃言語検出のためのSOLDベンチマークデータセットを用いて,我々のモデルを評価する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:46:49 GMT)
Trapped by Expectations: Functional Fixedness in LLM-Enabled Chat Search [9.2] 大規模言語モデル(LLM)対応チャット検索における機能的固定性の影響について検討した。
事前の期待が言語の使用を形作り、行動を促すことを発見した。
適切なシステムサポートにより、LLM能力の広範な探索が促進される可能性がある。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:14:01 GMT)
ByteCheckpoint: A Unified Checkpointing System for Large Foundation Model Development [9.1] ByteCheckpoint は大規模 LFM トレーニングのための産業レベルのチェックポイントシステムである。
ByteCheckpoint はチェックポイントストールを著しく減少させ、平均54.20倍の減少を達成する。
ByteCheckpointは、保存時間とロード時間を最大9.96倍と8.80倍に改善した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:05:23 GMT)
A thorough benchmark of automatic text classification: From traditional approaches to large language models [9.1] 本研究は,近年のアプローチの有効性が,コストの増大を補うかどうかを考察する。
これには、従来の12のATCソリューションと最近のATCソリューションの費用対効果に関する科学的に健全な比較分析が含まれている。
コード、データ、ドキュメントのリリースにより、コミュニティは実験を複製し、フィールドを前進させることができる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:40:08 GMT)
From Code Generation to Software Testing: AI Copilot with Context-Based RAG [8.3] 本稿では,2つの相互接続問題として,バグ検出と少ないバグでコーディングを行うことにより,ソフトウェアテストの新たな視点を提案する。
我々は、バグ検出と更新を同期する自動テストシステムであるCopilot for Testingを紹介した。
評価の結果,バグ検出精度が31.2%向上し,テストカバレッジが12.6%向上し,ユーザ受け入れ率が10.5%向上した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:20:05 GMT)
From Smør-re-brød to Subwords: Training LLMs on Danish, One Morpheme at a Time [8.3] 我々は、デンマークの注釈付き形態素データセットを利用して、形態素分割のための半教師付きモデルを訓練する。
デンマーク語の単語をテクスチャ的にセグメント化することで,2つのカスタムな形態素トークン化器を含む4つの異なるトークン化器の評価を行った。
その結果、デンマークのBPEトークン化装置が達成した39.28と比べ、F1スコア58.84を達成し、我々のカスタム開発したトークン化装置はモルフォロジーのセグメンテーションを著しく向上させることが判明した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:26:02 GMT)
The LLM Wears Prada: Analysing Gender Bias and Stereotypes through Online Shopping Data [8.3] 本研究では,オンラインショッピング履歴のみに基づいて,大規模言語モデルが個人の性別を予測できるかどうかを検討する。
米国ユーザーのオンライン購入履歴のデータセットを用いて、性別を分類する6つのLCMの能力を評価する。
結果は、モデルが適度な精度で性別を推測できる一方で、その決定は製品カテゴリーと性別のステレオタイプ的関連に根ざしていることを示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:56:08 GMT)
Random Conditioning with Distillation for Data-Efficient Diffusion Model Compression [7.9] 拡散モデルは、プログレッシブデノケーションにより高品質な画像を生成するが、大きなモデルサイズと繰り返しサンプリングのために計算集約的である。
本研究では,ランダムに選択したテキスト条件と雑音のある画像とをペアリングして,効率的な無画像知識蒸留を可能にする手法であるランダム条件付けを提案する。
提案手法により,条件固有の画像を生成することなく条件空間を探索することが可能となり,生成品質と効率の両面で顕著な改善が得られた。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:41:19 GMT)
Divide and Merge: Motion and Semantic Learning in End-to-End Autonomous Driving [7.6] 本稿では,新しい並列検出,追跡,予測手法であるニューラルベイズ動作復号法を提案する。
対話型セマンティックデコーディングを用いて、セマンティックタスクにおける情報交換を強化し、肯定的な伝達を促進する。
UniADとSparseDriveによるnuScenesデータセットの実験により、分割とマージのアプローチの有効性が確認された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:10:39 GMT)
GAN decoder on a quantum toric code for noise-robust quantum teleportation [7.6] GAN(Generative Adversarial Network)は、画像処理やデータ拡張などのアプリケーションにおいて、その価値を示す強力なディープラーニングモデルである。
我々は、GANベースの量子トポロジカルトリック符号デコーダを提案し、それを量子テレポーテーションプロトコルの考案に応用する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:37:51 GMT)
On-Chain Analysis of Smart Contract Dependency Risks on Ethereum [7.6] 私たちは2024年12月までに4100万以上の契約と1100億のインタラクションを分析します。
私たちの結果は4つの重要な洞察をもたらします。
私たちの仕事は、スマートコントラクト依存関係のリスクを理解するための、初めての大規模な基盤を提供します。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:20:35 GMT)
Measurement-device-independent quantum-secret-sharing networks with linear Bell-state analysis [7.5] 量子秘密共有(QSS)は、多人数の量子通信において重要な役割を果たす。
しかし、QSSスキームのセキュリティは、測定装置の欠陥を悪用した攻撃によって損なわれる可能性がある。
本稿では,測定デバイスに依存しない(MDI)原理に基づいてQSSを実装するための再構成可能な手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:52:42 GMT)
Bridge the Gap between SNN and ANN for Image Restoration [7.5] 現在、SNN(Spiking Neural Network)フレームワークに基づくニューラルネットワークは、画像復元の分野において目印を付け始めている。
本研究では,教師がANNであり,学生がSNNである非対称フレームワーク(ANN-SNN)蒸留法を提案する。
具体的には、ANNが学習した中間機能(機能マップ)をヒントとして、SNNのトレーニングプロセスのガイドとして活用する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:12:06 GMT)
DiaTool-DPO: Multi-Turn Direct Preference Optimization for Tool-Augmented Large Language Models [7.4] そこで本研究では,TA-LLMの対話能力を向上させる手法であるDiaTool-DPOを提案する。
TA-LLMインタラクションを5つの異なる対話状態を持つマルコフ決定プロセスとしてモデル化し、状態遷移軌跡に基づいてユーザクエリを3つのタイプに分類する。
評価の結果,DiaTool-DPOはGPT-4oの性能(情報収集では94.8%,ツールコールでは91%)に近づき,ベースラインよりも大幅に改善した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:47:28 GMT)
The Factors Influencing Well-Being in Software Engineers: A Cross-Country Mixed-Method Study [7.4] ソフトウェア工学におけるメンタルヘルスの課題に対する認識が高まる一方で、幸福を維持または損なう要因に焦点を当てる研究はほとんどない。
この研究は、ソフトウェアエンジニアの幸福に影響を与える特定の要因を調査することによって、このギャップを埋める。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:51:58 GMT)
LR$^2$Bench: Evaluating Long-chain Reflective Reasoning Capabilities of Large Language Models via Constraint Satisfaction Problems [7.4] 我々はLong-chain Reflective Reasoning capabilities of Large Language Models (LLMs)を評価するために設計された新しいベンチマークLR$2$Benchを紹介する。
実験結果から,DeepSeek-R1やOpenAI o1-previewのような先進的な推論モデルでさえ,LR$2$Benchのタスクと競合することが明らかとなった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:12:15 GMT)
Low-resource Machine Translation: what for? who for? An observational study on a dedicated Tetun language translation service [7.3] 我々は,ティモール・レステのテトゥーン語に特化したMTサービスであるtetun$.$orgの実際の使用パターンについて,観察的研究を行った。
10万件の翻訳要求を解析した結果,既存のコーパスに基づいて仮定に挑戦するパターンが明らかになった。
この結果から,テトゥーンのような制度化されたマイノリティ言語のためのMTシステムは,教育的文脈に関連する領域の精度を優先すべきであることが示唆された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:56:42 GMT)
Insights from the Inverse: Reconstructing LLM Training Goals Through Inverse Reinforcement Learning [6.7] Reinforcement Learning from Human Feedbackで訓練された大規模言語モデル(LLM)は、目覚ましい能力を示しているが、その基盤となる報酬関数や意思決定プロセスは不透明である。
本稿では, 逆強化学習(IRL)を用いて暗黙の報酬関数を復元することにより, LLMを解釈する新しい手法を提案する。
我々は,ヒトの嗜好を予測するために,最大85%の精度で報酬モデルを抽出し,様々な大きさの毒性に整合したLSMの実験を行った。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:54:41 GMT)
Entanglement and Bell Nonlocality in $τ^+ τ^-$ at the LHC using Machine Learning for Neutrino Reconstruction [6.5] 標準モデルで予測される物理過程の精密測定は、高エネルギーで自然を深く理解し続けています。
我々は、量子トモグラフィーと量子エンタングルメントを測定するために、$pp to tau+tau-X$のプロセスの詳細なシミュレーションを行う。
ニュートリノ運動量再構成のための高度な機械学習技術を用いて、全スピン密度行列の正確な測定を実現する。
統計学的に有意なベル非局所性は, 5$sigma$を超え, $tau+ tau-$が確立された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:48:10 GMT)
Quantum sampling on a quantum annealer for large volumes in the strong coupling limit for gauge group U(3) [6.5] 我々はD-Wave量子アニールを用いてサブ格子のヒストグラムを生成し、Metropolis-Hastingsアルゴリズムを用いて熱力学的観測値を決定する。
従来のモンテカルロシミュレーションから得られたものと比較した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:18:17 GMT)
When to Truncate the Archive? On the Effect of the Truncation Frequency in Multi-Objective Optimisation [6.4] 興味深いことに、新しいソリューションが生成されるとアーカイブを停止させるのが最善である傾向があるのに対して、無制限のアーカイブを考えると、最悪の場合があります。
本結果は,効率的なサブセット選択手法の開発の重要性を強調した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:33:49 GMT)
Threshold for Fault-tolerant Quantum Advantage with the Quantum Approximate Optimization Algorithm [6.3] 現実的な仮定の下では、量子コンピュータが古典的な最適化問題に勝ることはありそうにない。
さらに, 物理誤差率と耐故障性オーバーヘッドの低減が期待できるため, 古典的解法エネルギー消費に対するこの制限は緩和可能であることを示す。
これらの結果は、大規模フォールトトレラント量子コンピュータが最適化に有用であるという仮説を支持している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:57:28 GMT)
Refining Interactions: Enhancing Anisotropy in Graph Neural Networks with Language Semantics [6.3] 異方性GNNの概念を自然言語レベルまで拡張するフレームワークであるLanSAGNN(Language Semantic Anisotropic Graph Neural Network)を紹介する。
本稿では,LLMの出力とグラフタスクとの整合性を改善するために,効率的な2層LLMの微調整アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:32:45 GMT)
NormTab: Improving Symbolic Reasoning in LLMs Through Tabular Data Normalization [6.3] 我々は,Webテーブルの正規化によるLarge Language Models(LLMs)のシンボリック推論性能の向上を目的としたフレームワークであるNormTabを紹介した。
表データのシンボリック推論を支援するために, LLMを用いてテーブル正規化を1回1回1回前処理ステップとして検討する。
WikiTableQuestion や TabFact などの Web テーブルデータセットを用いた実験により,NormTab の活用がシンボル推論性能を大幅に向上することを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:52:21 GMT)
KD$^{2}$M: An unifying framework for feature knowledge distillation [6.2] 知識蒸留(KD)は、教師の知識を学生の神経ネットに移そうとする。
本稿では,この戦略を定式化した,分散マッチングによる知識蒸留(KD$2$M)の統一フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:14:46 GMT)
FireGuard: A Generalized Microarchitecture for Fine-Grained Security Analysis on OoO Superscalar Cores [6.1] 微粒な命令解析のためのジェネリックプログラマブルサポートは、将来のプロセッサのセキュリティのためのビルディングブロックである。
実OoOスーパースカラープロセッサ上でのきめ細かい命令解析の最初の実装であるFireGuardを紹介する。
実験の結果、我々のソリューションは並列スケーラビリティで、システムのセキュリティとパフォーマンスの両方を同時に確保できることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:49:22 GMT)
AverageTime: Enhance Long-Term Time Series Forecasting with Simple Averaging [6.1] 長期の時系列予測は、将来のトレンドを予測するために歴史的なデータを活用することに焦点を当てている。
主な課題は、シーケンスとチャネルの両方で依存関係を効果的にモデリングすることである。
本研究は,シーケンスとチャネルの依存関係をキャプチャするための新しいアプローチを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:14:55 GMT)
Universality of High-Dimensional Logistic Regression and a Novel CGMT under Dependence with Applications to Data Augmentation [6.1] ガウスの普遍性はブロック依存下での高次元ロジスティック回帰に対して依然として成り立つことを証明している。
我々は、深層学習における広範な実践であるデータ強化がリスクに与える影響を確立する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:29:34 GMT)
A Two-Timescale Approach for Wireless Federated Learning with Parameter Freezing and Power Control [5.9] フェデレートラーニング(FL)は、分散デバイスが共有機械学習(ML)モデルを協調的にトレーニングすることを可能にする。
モバイルデバイスは、モデルパラメータの計算・通信コストの増大に悩まされる。
凍結安定化パラメータの協調最適化と送信電力制御による2時間スケールFLフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:05:45 GMT)
Exploring the Privacy and Security Challenges Faced by Migrant Domestic Workers in Chinese Smart Homes [5.8] 本稿では、中国における多目的スマートホームにおける移民家庭労働者(MDW)のプライバシとセキュリティの課題について考察する。
その結果, MDW, 雇用者, 機関間の関係は, 電力不均衡が顕著であることがわかった。
中国において、特に公共空間における監視技術の広範で正規化された利用は、これらの権力不均衡を悪化させる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:49:15 GMT)
Towards Compatibly Mitigating Technical Lag in Maven Projects [5.8] LagEaseは技術的遅延を軽減し、互換性の低いリスクや依存関係の肥大を回避するためのツールだ。
LagEaseはMaven Dependabotより優れています。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:48:28 GMT)
LSC-ADL: An Activity of Daily Living (ADL)-Annotated Lifelog Dataset Generated via Semi-Automatic Clustering [5.8] LSCデータセットから派生したADLアノテーション付きライフログデータセットであるLCC-ADLを紹介する。
正確なADLアノテーションを生成し、検索説明性を向上させる。
このデータセットは、ライフログ検索、アクティビティ認識、エゴセントリックビジョンの研究を前進させるものと信じている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:39:28 GMT)
Explaining 3D Computed Tomography Classifiers with Counterfactuals [5.8] 本研究では,Latent Shift反ファクト生成法を2次元アプリケーションから拡張し,CTスキャンを解説する。
スライスベースのオートエンコーダと勾配ブロッキングを実装した。
本手法は,高分解能3次元医用画像における解釈可能な偽物の生成に有効である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:04:29 GMT)
AnySat: One Earth Observation Model for Many Resolutions, Scales, and Modalities [5.8] 本稿では,JEPAとスケール適応型空間エンコーダに基づくマルチモーダルモデルであるAnySatを提案する。
この統一アプローチの利点を示すために、5ドルのマルチモーダルデータセットのコレクションであるGeoPlexをコンパイルする。
次に、これらの多様なデータセット上で、単一の強力なモデルを同時にトレーニングします。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:19:39 GMT)
FlowDistill: Scalable Traffic Flow Prediction via Distillation from LLMs [5.7] FlowDistillは、大規模言語モデル(LLM)からの知識蒸留に基づく軽量交通予測フレームワークである
その単純さにもかかわらず、FlowDistillは、トレーニングデータを大幅に少なくしながら、予測精度で最先端のモデルを一貫して上回る。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:54:54 GMT)
Epistemic Monte Carlo Tree Search [5.6] 深層探査における探索の不確かさを考慮し, 深層探査に利用するために, EMCTS(Epistemic MCTS)を導入する。
アセンブリ言語 sc subleq でコードを記述するという難易度の高いタスクにおいて,本手法と組み合わせた AZ は,ベースライン AZ よりもはるかに高いサンプリング効率を実現する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:36:00 GMT)
Dual-stream Transformer-GCN Model with Contextualized Representations Learning for Monocular 3D Human Pose Estimation [5.6] 一人称3次元人物のポーズ推定には,深度あいまいさ,限られた3次元ラベル付きトレーニングデータ,不均衡モデリング,限定モデル一般化が課題である。
本稿では,文脈適応型表現学習に基づくグラウンドブレーキング動作事前学習手法を提案する。
本モデルでは,Human3.6MのMPJPEが38.0mm,P-MPJPEが31.9mm,MPPI-INF-3DHPのMPJPEが15.9mmであった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:17:57 GMT)
Is Less Really More? Fake News Detection with Limited Information [5.5] 偽ニュース検出のためのSLIMシステム選択限定情報というフレームワークを提案する。
SLIMは、限られた情報を活用して、全文を用いて得られた最先端技術に匹敵する偽ニュース検出の性能を達成する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:32:37 GMT)
Factored Agents: Decoupling In-Context Learning and Memorization for Robust Tool Use [4.4] 本稿ではエージェントAIにおける従来の単一エージェントシステムの限界を克服する新しいファクターエージェントアーキテクチャを提案する。
提案手法はエージェントを,(1)高レベルプランナーおよびインコンテキスト学習者として機能する大規模言語モデル,(2)ツールフォーマットと出力の記憶器として機能する小型言語モデルに分解する。
経験的評価により,本アーキテクチャは,テキスト内学習と静的記憶のトレードオフを解明しつつ,計画精度と誤り回復性を著しく向上することが示された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:53:06 GMT)
CASCADE Your Datasets for Cross-Mode Knowledge Retrieval of Language Models [4.4] 言語モデルは、しばしばクロスモードの知識検索に苦しむ。
複数のデータソースでトレーニングされたモデルは、元のトレーニングモードとは異なるフォーマットで知識を取得する際に、大幅に精度を低下させることを示した。
そこで我々はCASCADEを提案する。CASCADEは、様々な列の長さのカスケードデータセットを用いて、異なるスケールの知識を抽出する新しい事前学習アルゴリズムである。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:02:07 GMT)
Efficient Calibration for RRAM-based In-Memory Computing using DoRA [4.4] Resistive In-Memory Computing (RIMC)はエッジAIのための超効率的な計算機能を提供する。
従来のリトレーニング手法は、RRAMの高エネルギー消費、書き込み遅延、耐久性の制約によって制限される。
最小限のキャリブレーションパラメータを格納した影響重みを補償することにより精度を回復するDoRAベースのキャリブレーションフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:58:08 GMT)
RealityAvatar: Towards Realistic Loose Clothing Modeling in Animatable 3D Gaussian Avatars [4.3] 本研究では,高忠実度デジタルヒューマンモデリングのための効率的なフレームワークであるRealAvatarを提案する。
動作トレンドモジュールと潜在骨エンコーダを組み込むことで,ポーズ依存的な変形と衣服行動の時間的変動をモデル化する。
特に非剛性領域における動的ヒト再建における構造的忠実度と知覚的品質を著しく向上させる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:59:12 GMT)
Distilling Multi-view Diffusion Models into 3D Generators [4.3] 本稿では,多視点拡散モデル(MV-DM)をガウススプラッティングを用いた3次元ジェネレータに拡散させる定式化であるDD3Gを紹介する。
DD3GはMV-DMから広範囲の視覚的および空間的知識を圧縮し統合する。
本稿では,パターン抽出とプログレッシブデコーディングのフェーズからなるジェネレータPEPDを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:29:23 GMT)
Style over Substance: Distilled Language Models Reason Via Stylistic Replication [4.3] 特殊推論言語モデル(RLM)は、詳細な推論トレースによるテスト時間計算のスケーリングが性能を大幅に向上させることを示した。
本研究では, 蒸留モデルが推理中に複製された文体パターンを内部にどの程度内在させるかを検討する。
合成トレーサを用いたモデルでは, 蒸留された推理能力は, 表面レベルのパターンに大きく依存していることが示唆された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:50:20 GMT)
BlenderGym: Benchmarking Foundational Model Systems for Graphics Editing [4.3] BlenderGymは3Dグラフィック編集のための視覚言語モデル(VLM)システムベンチマークである。
クローズドおよびオープンソース VLM システムを評価し,最先端の VLM システムでさえ,Blender ユーザにとって比較的簡単なタスクに悩まされていることを観察した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:51:45 GMT)
Interaction of Spinons with Magnetic Fields in a Fractionalized State [4.2] 14Tまでの磁場の適用は、熱容量の急激な上昇を最大5000%も引き起こす。
スピノンは熱キャリアとして働き、電荷絶縁QSLはHFSMよりもはるかに優れた熱伝導体となる。
ミリケルビン温度と強磁場における熱容量(したがってエントロピー)の驚くべき上昇は、非常に異常な状況を示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:22:27 GMT)
Increasing happiness through conversations with artificial intelligence [4.2] その結果,AI会話後の幸福度はジャーナリング後の幸福度よりも高かった。
ネガティブなトピックについて議論するとき、参加者は徐々にAIの肯定的な感情と一致した。
計算モデルを用いて、会話の途中でこれらの感情予測誤差の履歴が会話後の幸福度を高めることを予測している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:52:02 GMT)
Learning Koopman-based Stability Certificates for Unknown Nonlinear Systems [4.2] 未知非線形系のベクトル場とリアプノフ関数を同時に学習するアルゴリズムフレームワークを提案する。
学習したリアプノフ関数は、満足度モジュロ理論(SMT)の解法を用いて形式的に検証可能であることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:30:39 GMT)
AI-Newton: A Concept-Driven Physical Law Discovery System without Prior Physical Knowledge [4.2] 生データから物理法則を自律的に導き出すことができる概念駆動型発見システムであるAI-Newtonを提案する。
概念実証として、AI-Newtonをニュートン力学の幅広い問題に適用する。
この成果は、AIによる自律的な科学発見への大きな一歩となる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:25:34 GMT)
Real-time Ad retrieval via LLM-generative Commercial Intention for Sponsored Search Advertising [4.2] 本稿ではリアルタイム広告検索(RARE)フレームワークを提案する。
RAREは、クエリの広告を直接リアルタイムで検索するために、中間的なセマンティック表現として商用意図(CI)を使用する。
オンライン実装は、消費の5.04%増加、Gross Merchandise Volume(GMV)の6.37%増加、クリックスルーレート(CTR)の1.28%向上、浅い変換の5.29%増加といった大きな利益をもたらした。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:26:31 GMT)
Large Language Models in Healthcare [4.1] 大規模言語モデル(LLM)は医療の変革を約束する。
彼らの成功には、臨床ニーズに合わせて厳格な開発、適応、評価戦略が必要である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:56:12 GMT)
Tasks and Roles in Legal AI: Data Curation, Annotation, and Verification [4.1] AIツールの法分野への応用は、自然に感じられる。
しかし、法的文書は、ほとんどのAIシステムの基盤となるウェブベースのテキストとは異なる。
我々は、データキュレーション、データアノテーション、出力検証の3つの分野を実践者に対して特定する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:34:58 GMT)
Register Always Matters: Analysis of LLM Pretraining Data Through the Lens of Language Variation [4.0] 事前学習データの登録がモデルの性能に大きく影響を与えることを示す。
事前学習材料と結果モデルとの驚くべき関係を明らかにする。
我々は、レジスタがモデル変動の重要な説明者であり、より意図的な将来のデータ選択の実践を促進することができると結論付けている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:30:24 GMT)
Combining physics-based and data-driven models: advancing the frontiers of research with Scientific Machine Learning [3.9] SciMLは物理学に基づくモデルとデータ駆動モデルを組み合わせた研究分野である。
データ駆動モデルは、入力データと出力データの間の関係を抽出することを目的としている。
SciMLのヒト心機能シミュレーションへの応用について検討した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:37:59 GMT)
Linear Time Iterative Decoders for Hypergraph-Product and Lifted-Product Codes [3.9] 量子低密度パリティチェック(QLDPC)符号は、フォールトトレラントな量子計算を実現するための重要な候補である。
多くの研究が、QLDPC符号の能力をフル活用するために高速デコーダの必要性を主張している。
しかし、実証的な調査は、QLDPC符号を復号化しながら高いエラーフロアを持つような反復復号化が可能であることを示唆している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:37:29 GMT)
Recurrent Stochastic Configuration Networks for Temporal Data Analytics [3.9] 本稿では,問題解決のためのコンフィグレーションネットワーク(RSCN)のリカレントバージョンを開発する。
我々は、初期RCCNモデルを構築し、その後、オンラインで出力重みを更新する。
数値的な結果は,提案したRCCNが全データセットに対して良好に動作することを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:12:52 GMT)
From Text to Graph: Leveraging Graph Neural Networks for Enhanced Explainability in NLP [3.9] 本研究では,自然言語処理タスクにおける説明可能性を実現するための新しい手法を提案する。
自動的に文をグラフに変換し、ノードや関係を通じて意味を維持する。
実験は、与えられた分類のためのテキスト構造の中で最も重要なコンポーネントを決定するための有望な結果をもたらした。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:55:58 GMT)
Attention Mamba: Time Series Modeling with Adaptive Pooling Acceleration and Receptive Field Enhancements [3.9] 時系列モデリングは、天気予報や交通管理といった現実世界の応用の基礎となっている。
近年、Mambaは線形に近い計算複雑性と高い予測精度を組み合わせた有望なモデルとなっている。
本稿では,Adaptive Poolingブロックを特徴とする,革新的なフレームワークであるAttention Mambaを紹介する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:56:43 GMT)
AL-Bench: A Benchmark for Automatic Logging [3.8] 自動ロギングツールに特化して設計されたベンチマークであるAL-Benchを紹介する。
AL-Benchには、広く認識されている10のプロジェクトから収集された、大規模で高品質で多様なデータセットが含まれている。
ソースコードレベルでの従来の静的評価に加えて、ロギング品質のランタイム視点を提供する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:13:04 GMT)
CLaP -- State Detection from Time Series [3.6] 我々は,時系列状態検出のための新しい,高精度かつ効率的なアルゴリズムであるCLaPを紹介する。
教師なし環境でのTSSDの時系列分類の予測力を利用する。
CLaPは5つの最先端コンペティターよりはるかに精度が高い。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:46:42 GMT)
Barrier Certificates for Unknown Systems with Latent States and Polynomial Dynamics using Bayesian Inference [3.1] 本稿では,未知システムに対するバリア証明書の合成手法を提案する。
初期状態空間表現は、ターゲットとするメトロポリス・ハスティングスサンプリング器を介して入力出力データを用いて更新される。
候補が追加サンプルの試験セットの要求条件を満たすならば、真で未知のシステムに対して高い確率で有効であることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:12:34 GMT)
In Pursuit of Privacy: The Value-Centered Privacy Assistant [3.0] スマートフォン価値中心プライバシアシスタント(VcPA)のプロトタイプの開発
VcPAは個人の価値観に基づいたユーザのプライバシ決定を促進する。
VcPAがユーザに対して,より価値中心のアプリ選択を支援する,という概念実証を確立します。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:35:11 GMT)
Extending MovieLens-32M to Provide New Evaluation Objectives [3.0] 我々は、新しい評価目標を提供するMovieLens-32Mデータセットの拡張を提供する。
我々の主な目的は、ユーザーが視聴に興味を持つであろう映画、すなわち、ウォッチリストを予測することである。
人気映画をレコメンデーションアルゴリズムとして推奨することは、最悪のパフォーマンスの1つになる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:15:46 GMT)
Muographic Image Upsampling with Machine Learning for Built Infrastructure Applications [3.0] 非侵襲イメージング技術であるミューグラフィーは、宇宙線ミューオンの相互作用を検出することによって三次元密度マップを構築する。
宇宙線ミューオンは、その高いモーメントと天然資源のために、深く浸透し、固有の安全を提供する。
しかし、この技術はムーンフラックスに制約を課し、長期の取得に繋がる。
これらの制約に対処する2モデル深層学習手法を開発した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:33:01 GMT)
Enhancing Interpretability in Generative AI Through Search-Based Data Influence Analysis [2.7] 生成AIモデルは強力な能力を提供するが、透明性が欠如していることが多いため、アウトプットの解釈が困難である。
本研究は,学習データが出力に与える影響を分析することにより,これらのモデルの解釈可能性を向上させるための探索的アプローチを導入する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:29:37 GMT)
Proposal for an experiment to verify Wigner's rotation at non-relativistic speeds with massive spin-$1/2$ particles [2.6] スピンを持つ量子粒子のウィグナー回転は、特殊相対性理論と量子力学の間の相互作用の魅力的な結果の1つである。
我々は、ウィグナーの回転の直接的実験的検証が、原則として非相対論的速度の体制で可能であることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:48:08 GMT)
SeizureTransformer: Scaling U-Net with Transformer for Simultaneous Time-Step Level Seizure Detection from Long EEG Recordings [2.6] SeizureTransformer は (i) 1次元畳み込み (ii) 残余のCNNスタックと変換器エンコーダから構成され、前の出力を文脈情報付き高レベル表現に埋め込む単純なモデルである。
パブリックおよびプライベートな脳波発作検出データセットの実験は、我々のモデルが既存のアプローチを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:23:11 GMT)
Spatial-R1: Enhancing MLLMs in Video Spatial Reasoning [2.5] そこで本研究では,ScanNetから7つのタスクタイプにまたがるQAペアを自動的に生成するビデオ空間推論データセットを提案する。
Qwen2.5-VL-7B-インストラクトモデルをGRPOを用いて訓練することにより、Spatial-R1はベースラインの性能を大幅に向上させる。
本研究は,ビデオMLLMにおける複雑な空間推論を改善するための特殊データキュレーションと最適化手法の有効性を検証する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:12:17 GMT)
Leveraging Generalizability of Image-to-Image Translation for Enhanced Adversarial Defense [2.4] 敵対的攻撃は、機械学習モデルの重大な脆弱性を浮き彫りにする。
本研究では,残差ブロックを組み込んで一般化性を高める改良モデルを提案する。
実験の結果,分類精度は0付近から平均72%に復元できることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:38:28 GMT)
Confidence-weighted integration of human and machine judgments for superior decision-making [2.4] 近年の研究では、大きな言語モデル(LLM)が特定のタスクにおいて人間を上回ることが示されている。
我々は、LLMよりも悪いパフォーマンスをしているにもかかわらず、人間はチームで価値を付加できることを示した。
人間と機械のチームは、チームメンバーの自信が十分に調整されたときに、各チームメイトを追い越すことができます。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:02:16 GMT)
LogLSHD: Fast Log Parsing with Locality-Sensitive Hashing and Dynamic Time Warping [2.4] 大規模ソフトウェアシステムは、監視、診断、性能最適化に不可欠な大量のシステムログを生成する。
LogLSHDは解析時間において例外的な効率を示し、最先端の手法よりも優れています。
例えば、Drainと比較して、LogLSHDは平均パース時間を73%削減し、LogHub 2.0ベンチマークでは平均パース精度を15%向上した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:08:04 GMT)
Multilingual European Language Models: Benchmarking Approaches and Challenges [2.4] 生成型大規模言語モデル(LLM)は、チャットインタラクションによってさまざまなタスクを解決できる。
本稿では、多言語欧州ベンチマークに着目し、現在の評価データセットの利点と限界について分析する。
本稿では,翻訳品質と文化バイアスを高めるための潜在的な解決策について論じる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:57:12 GMT)
A Study of Undefined Behavior Across Foreign Function Boundaries in Rust Libraries [2.4] Rustは、他の言語との相互運用に頻繁に使用される。
Miriは、これらのモデルに対してアプリケーションを検証できる唯一の動的解析ツールである。
Miriは、外部機能のバグ発見をサポートしておらず、Rustエコシステムに重大な正当性ギャップがあることを示唆している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:04:21 GMT)
Watermarking for AI Content Detection: A Review on Text, Visual, and Audio Modalities [2.4] 生成人工知能(GenAI)は、テキスト、ビジュアル、オーディオドメイン間でコンテンツ作成に革命をもたらした。
本研究では,テキスト,ビジュアル,オーディオモダリティの透かし手法を分類する構造的分類法を開発した。
我々は、敵対的攻撃に対する抵抗、異なるコンテンツタイプ間の標準化の欠如、プライバシーとコンテンツの所有に関する倫理的考察など、主要な課題を特定します。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:18:10 GMT)
A Practical Synthesis of Detecting AI-Generated Textual, Visual, and Audio Content [2.4] AI生成コンテンツの進歩により、大きな言語モデル、拡散ベースのビジュアルジェネレータ、合成オーディオツールが広く採用されている。
これらの発展は、誤情報、著作権侵害、セキュリティの脅威、および公的な信頼の侵食に関する懸念を提起する。
本稿では,AI生成したテキストコンテンツ,視覚コンテンツ,音声コンテンツの検出と緩和を目的とした,幅広い手法について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:27:55 GMT)
Linear Representations of Political Perspective Emerge in Large Language Models [2.2] 大規模言語モデル(LLM)は、様々な主観的人間の視点を現実的に反映するテキストを生成する能力を示した。
本稿は、LLMがアメリカの政治における他の政治的視点の中で、よりリベラルで保守的な視点を反映できるように見えるかを研究する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:53:23 GMT)
Build Code Needs Maintenance Too: A Study on Refactoring and Technical Debt in Build Systems [2.2] 現代のソフトウェアエンジニアリングでは、ビルドシステムはソースコードをソフトウェアアーティファクトに変換する上で重要な役割を担います。
最近の研究では、ビルド失敗のハイレベルな原因を調査しているが、ビルドファイルの構造的特性を概ね見落としている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:07:38 GMT)
Image captioning in different languages [2.1] 本稿は、2024年5月現在)非英語画像キャプションデータセットのリストを提供する。
わずか23の異なる言語しか表現されないが、+/-500の制度言語は存在する。
本稿では、ビジョン&ランゲージの分野について、いくつかのオープンな質問で締めくくります。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:27:35 GMT)
Testing Low-Resource Language Support in LLMs Using Language Proficiency Exams: the Case of Luxembourgish [2.1] 本研究では,ルクセンブルク語に対する評価ツール等の言語習熟度試験の実施可能性について検討した。
また,ChatGPTやClaude,DeepSeek-R1といった大規模モデルは高いスコアを得るのが一般的である。
また,このような言語試験における性能は,他のNLP課題における性能を予測するためにも有効であることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:16:14 GMT)
An Explainable Reconfiguration-Based Optimization Algorithm for Industrial and Reliability-Redundancy Allocation Problems [2.0] AI-AEFA(AI-AEFA)は、大規模産業・信頼性・冗長性割り当て問題に対処するために設計されたメタヒューリスティックアルゴリズムである。
このアルゴリズムは、IEEE CEC 2017の28の制約付きベンチマーク問題、15の大規模産業最適化問題、7の信頼性-冗長割り当て問題に検証されている。
その結果、AI-AEFAは、堅牢でスケーラブルで解釈可能な最適化ツールであり、重要な現実世界のアプリケーションであることを確認した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:33:48 GMT)
On the metric property of quantum Wasserstein divergences [1.9] 量子ワッセルシュタイン(英: Quantum Wasserstein)は、チャネルによって定義される量子ワッセルシュタインの修正版である。
我々は、分離可能なヒルベルト空間によって記述される全ての量子系に対して、量子ワッサーシュタインの発散に対する三角形の不等式を証明する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:23:48 GMT)
HH-PIM: Dynamic Optimization of Power and Performance with Heterogeneous-Hybrid PIM for Edge AI Devices [1.9] 本研究では,高性能なMRAM-SRAM PIMモジュールと低消費電力なMRAM-SRAM PIMモジュールからなるHH-PIMアーキテクチャを提案する。
提案したHH-PIMは,アプリケーション要件を満たしつつ,従来のPIMよりも最大60.43ドルの省エネを達成できることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:22:32 GMT)
On the Geometry of Receiver Operating Characteristic and Precision-Recall Curves [1.7] 二項分類問題における受信者動作特性(ROC)と高精度リコール曲線(PR)の幾何学について検討する。
鍵となる発見は、最もよく使われるバイナリ分類のメトリクスの多くは、単に合成関数 $G := F_p circ F_n-1$ の関数であるということである。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:04:28 GMT)
Equivariant Spherical CNNs for Accurate Fiber Orientation Distribution Estimation in Neonatal Diffusion MRI with Reduced Acquisition Time [1.7] 新生児dMRIに適した回転同変球状畳み込みニューラルネットワーク(SCNN)フレームワークを提案する。
我々は、43の新生児dMRIデータセットから得られた実データを用いて、sCNNの性能を訓練し、評価する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:36:51 GMT)
Revisiting Funnel Transformers for Modern LLM Architectures with Comprehensive Ablations in Training and Inference Configurations [1.6] 現代のGemma2 Transformerアーキテクチャにおけるファンネリングの影響について検討する。
ファネリングは、特に大きなモデルにおいて、より深いネットワーク層を伝播する情報のボトルネックを生み出します。
この結果から,計算効率とモデル精度の主なトレードオフが明らかになった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:09:17 GMT)
FastFlow: Early Yet Robust Network Flow Classification using the Minimal Number of Time-Series Packets [1.6] 我々は,ネットワークフローを既知のタイプあるいは未知のタイプの1つとして正確に分類する時系列フロー分類法であるFastFlowを開発した。
本モデルでは,フロー毎の時系列データポイントの最小数を動的に決定し,信頼度を既知のフロータイプあるいは未知のフロータイプとして分類する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:17:14 GMT)
On Model Protection in Federated Learning against Eavesdropping Attacks [1.6] 我々のモデルでは、敵はクライアントからサーバに送信されたモデル更新をインターセプトすることができる。
本研究では,クライアント選択の確率,局所的目的関数の構造,盗聴者の能力といった様々な要因が,全体的な保護レベルに与える影響について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:20:13 GMT)
Quantum metrological capability as a probe for quantum phase transition [1.6] 量子フィッシャー情報によって定量化された気象能力は、量子臨界点付近でユニークなピークを示す。
干渉計発生器の量子ゆらぎを抽出することにより、この探索を実現できることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:40:32 GMT)
CLIP-SLA: Parameter-Efficient CLIP Adaptation for Continuous Sign Language Recognition [1.5] 連続手話認識(CSLR)は、ビデオ中の手話ジェスチャーのシーケンスを解釈し、翻訳することに焦点を当てている。
CLIPモデルから学習済みの強力なビジュアルエンコーダを利用して手話課題に対処する新しいCSLRフレームワークであるCLIP手話適応(CLIP-SLA)を提案する。
CLIPビジュアルエンコーダにPEFTモジュールを統合するSLA-AdapterとSLA-LoRAの2つのバリエーションを導入し、最小限のトレーニング可能なパラメータで微調整を可能にする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:15:33 GMT)
Developing a Dual-Stage Vision Transformer Model for Lung Disease Classification [1.5] 肺疾患は全米で流行し、3400万人以上の人に影響を与えている。
さまざまな種類の肺疾患の正確な診断とタイムリーな診断が重要であり、人工知能(AI)の手法はこれらのプロセスを高速化する可能性がある。
この研究を通じて、視覚変換器(ViT)とスイニング変換器(Swin Transformer)を統合して、X線スキャンで14種類の肺疾患を分類する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:17:36 GMT)
One Pic is All it Takes: Poisoning Visual Document Retrieval Augmented Generation with a Single Image [1.5] 大規模マルチモーダルモデルの幻覚を抑制する手法として,M-RAG(Multimodal search augmented generation)が最近登場した。
本稿では,視覚的文書検索を対象とするM-RAGに対する中毒攻撃について述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:08:33 GMT)
Dissipation-Assisted Steady-State Entanglement Engineering based on Electron Transfer Models [1.5] 本稿では,トラップイオン量子シミュレータ上で実装可能な,散逸支援型絡み合い生成プロトコルを提案する。
我々のアプローチは、最近実験で実現されたシングルサイト分子電子移動(ET)モデルに基づいている。
外部自由度に結合すると、ETモデルは散逸的な量子制御機構として利用できることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:05:52 GMT)
Quantum Key Distribution with Efficient Post-Quantum Cryptography-Secured Trusted Node on a Quantum Network [1.4] 量子鍵分配(QKD)により、2人の遠いユーザーが秘密鍵と情報理論のセキュリティを交換できる。
本稿では、量子後暗号技術を用いることにより、プライバシー要件の低い信頼ノードを有効活用する手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:06:16 GMT)
Beyond Text-to-Text: An Overview of Multimodal and Generative Artificial Intelligence for Education Using Topic Modeling [1.4] 本研究では、トピックモデリングを用いて、教育におけるマルチモーダル・ジェネレーティブAIの研究環境をマッピングする。
発見は、教育的文脈におけるテキスト・トゥ・テキスト・モデルに重点を置いており、他のモダリティは未探索であることを示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:19:10 GMT)
TransforMerger: Transformer-based Voice-Gesture Fusion for Robust Human-Robot Communication [1.4] 本稿では,トランスフォーマーモデルについて紹介する。トランスフォーマーは,解答音声とジェスチャー入力に基づくロボット操作のための構造化された動作指令を推論するトランスフォーマーモデルである。
我々のアプローチは、マルチモーダルデータを単一の統一文にマージし、言語モデルで処理する。
シミュレーションおよび実世界の実験において,TransforMergerの評価を行い,ノイズや不一致,情報不足に対するロバスト性を実証した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:15:59 GMT)
Multivariate Temporal Regression at Scale: A Three-Pillar Framework Combining ML, XAI, and NLP [1.3] 本稿では,高次元データの解析のハードルについて述べる。
データ分析における従来の手法は、しばしば入力変数間の直接接続に注目し、データ内のより複雑な関係を見逃す可能性がある。
我々は、合成データの役割と、情報を異なるセンサー間で冗長にする方法を考える。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:53:03 GMT)
Base Station Certificate and Multi-Factor Authentication for Cellular Radio Control Communication Security [1.3] 現在の携帯電話ネットワークは、悪意のある偽の基地局に対して脆弱なままである。
我々は基地局の認証(基地局の公開鍵と位置の認証)と多要素認証を設計し、基地局制御通信の信頼性とメッセージ整合性を確保する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:12:29 GMT)
Social Science Is Necessary for Operationalizing Socially Responsible Foundation Models [1.2] 社会科学は、変革的技術の社会的影響を研究する長い歴史を持っている。
本稿では,基礎モデルを社会技術システムとして研究する概念的枠組みを提案する。
我々は、AIと社会科学の学際的で協調的な研究パラダイムを提唱する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:56:19 GMT)
Proposition of Affordance-Driven Environment Recognition Framework Using Symbol Networks in Large Language Models [1.2] 本研究では,大規模言語モデル(LLM)を活用した自動割当獲得手法を提案する。
例として「リンゴ」を用いた実験は、高い説明性で文脈依存の余裕を抽出する手法の能力を実証した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:48:44 GMT)
Exploring the Capabilities of LLMs for IMU-based Fine-grained Human Activity Understanding [1.1] 慣性計測単位(IMU)を用いたHAR(Human Activity Recognition)は、ますます大きな言語モデル(LLM)を活用する
予備研究は, 空気文字認識などの細粒度HARタスクにおいて, 予め訓練したLLMが破滅的に失敗し, ほぼランダムな推測精度が得られたことを示唆している。
これを3Dに拡張するために、3Dデータを2次元の等価値にマッピングするエンコーダベースのパイプラインを設計した。
私たちのエンドツーエンドパイプラインは、中書きシナリオで最大5文字の単語認識において78%の精度を実現し、LCMを実行可能なツールとして確立しています。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:42:58 GMT)
A Robust Model-Based Approach for Continuous-Time Policy Evaluation with Unknown Lévy Process Dynamics [1.1] 本稿では,継続的政策評価のためのモデルベースフレームワークを開発する。
ブラウンとレヴィのノイズを組み込んで、稀な出来事や極端な出来事の影響を受けやすい力学をモデル化する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:37:14 GMT)
Extending quantum annealing to continuous domains: a hybrid method for quadratic programming [1.1] 本稿では,連続最適化問題に対処する量子拡張型アニーリング(QESA)を提案する。
QESAは離散化を必要とせず、量子資源を使用する。
QESAは、ソリューションの品質において、古典的なベースラインを一貫して上回ることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:09:59 GMT)
Foundations and Evaluations in NLP [1.1] この回顧録では,自然言語処理(NLP)の基本的側面として,言語資源の作成とNLPシステムの性能評価について考察する。
私の研究は、形態学から意味論まで言語特性をキャプチャする、韓国語のための形態素ベースのアノテーションスキームの開発に重点を置いてきた。
I have proposed a novel evaluation framework, the jp-algorithm, which is introduced a alignment-based method to address challenges in preprocessing task。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:14:03 GMT)
What is Left After Distillation? How Knowledge Transfer Impacts Fairness and Bias [1.0] クラスの41%は、クラス単位の精度を比較する際に、蒸留によって統計的に有意な影響を受けている。
本研究は, あるクラスにおける蒸留の不均一な影響と, フェアネスにおけるその潜在的重要な役割を明らかにする。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:08:06 GMT)
LLM-mediated Dynamic Plan Generation with a Multi-Agent Approach [1.0] 動的環境に適応可能なネットワークを生成する手法を提案する。
提案手法は, 条件や目標を表す「統計」を収集し, エージェントの生成に利用する。
これらのエージェントは特定の条件に基づいて相互接続され、結果として柔軟性と一般性を組み合わせたネットワークとなる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:42:49 GMT)
Large Language Models for Code Generation: A Comprehensive Survey of Challenges, Techniques, Evaluation, and Applications [0.9] 大規模言語モデル(LLM)は多くの分野においてその顕著な能力を示している。
この調査は、LLMがユーザに対して、技術的背景に関係なく、ヒューマン言語を使用して実行可能なコードを自動的に生成する方法に焦点を当てている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:29:11 GMT)
Epistemic Skills: Reasoning about Knowledge and Oblivion [0.8] 本稿では,グループ知識の概念を取り入れつつ,知識の獲得と隠蔽への道のりを捉えた。
モデルチェックと満足度の問題の計算複雑性について検討し、その理論的基礎と実践的意味についての洞察を提供する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:41:42 GMT)
Virtual Reality and Artificial Intelligence as Psychological Countermeasures in Space and Other Isolated and Confined Environments: A Scoping Review [0.8] バーチャルリアリティ(VR)と人工知能(AI)技術は心理的対策として機能する。
この研究では、スコーピング文献レビューアプローチを用いて、VRおよびAIベースの介入の使用と有効性について現在知られているものを特定する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:25:29 GMT)
Graph Analytics for Cyber-Physical System Resilience Quantification [0.8] 本研究はサイバー物理システム(CPS)のサイバーレジリエンスに焦点を当てている。
本稿では,複雑なシステムのレジリエンスポテンシャルを定量化するために,知識グラフモデリングとグラフ解析に基づく方法論を提案する。
我々は、最も弾力性のあるSWaT設計は、攻撃を跳ね返して吸収するために必要な可能性を持っていることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:43:40 GMT)
Advancing AI-Scientist Understanding: Making LLM Think Like a Physicist with Interpretable Reasoning [0.7] 大規模言語モデル(LLM)は、推論、記号操作、数値計算を強化することで、物理学研究において拡大する役割を担っている。
我々は、推論モジュール、解釈モジュール、AI-科学相互作用モジュールの3つのモジュール間の動的相互作用として、AIと人間の科学者の協力を概念化する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:13:16 GMT)
Face Mask Removal with Region-attentive Face Inpainting [0.7] 本研究では,顔のマスク部分の復元・再構成を行う生成顔インペイント法を提案する。
提案手法は,空間情報損失を軽減するため,M-CSAM (M-scale Channel-Spatial Attention Module) を含む。
我々は、CelebAデータセットから5種類のマスクを組み込むことで、独自のMasked-Facesデータセットを合成する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:13:11 GMT)
Sustainable broadcasting in Blockchain Networks with Reinforcement Learning [0.6] 推定では、Bitcoinの二酸化炭素排出量は年間平均6600万トンから2600万トンと見積もられている。
ブロックチェーンネットワークにおけるブロックブロードキャスト方式を改善する強化学習に基づく効率的な手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:17:42 GMT)
Early Classification of Time Series: Taxonomy and Benchmark [0.5] この文書は原則に基づく分類から始まり、非常に広範な実験の結果を報告する。
評価を整理するための次元を定義し、非常に広範な実験の結果を報告する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:59:14 GMT)
Evolving Security in LLMs: A Study of Jailbreak Attacks and Defenses [0.5] 大規模言語モデル(LLM)はますます人気を博し、幅広いアプリケーションに電力を供給している。
特に、有害なコンテンツを生み出すための安全対策を回避したジェイルブレイク攻撃によって、それらの普及が懸念を呼び起こした。
本稿では,大規模言語モデル(LLM)の包括的セキュリティ解析を行い,モデル安全性の進化と決定要因に関する重要な研究課題に対処する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:33:07 GMT)
Chunking Attacks on File Backup Services using Content-Defined Chunking [0.5] ファイルからコンテンツ定義チャンキングパラメータを抽出する攻撃を提案する。
プロトコルに依存しない攻撃と、パラメータが破られたときのセキュリティの喪失について論じる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:55:11 GMT)
Optimizing Package Delivery with Quantum Annealers: Addressing Time-Windows and Simultaneous Pickup and Delivery [0.4] 我々は、実世界のルーティング問題に対処するために、以前に公表した量子古典的手法を活用している。
我々は、さらに現実的な問題インスタンスの解決について詳述する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:01:34 GMT)
Niche Dynamics in Complex Online Community Ecosystems [0.4] 本稿では,5年間に1,919の高ユーザオーバラップを抱えるRedditコミュニティ8,806を大規模に調査した。
その結果、相互主義のエピソードは、競争のエピソードよりも長く、わずかに頻度が高いことが判明した。
競合する生態的相互作用はトピックやユーザの重複を減少させるが、このようなニッチな重複を減少させる変化は相互主義に繋がらない。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:56:46 GMT)
Corner-Grasp: Multi-Action Grasp Detection and Active Gripper Adaptation for Grasping in Cluttered Environments [0.4] 本研究では, 散在したビンピッキング環境において, 効果的に把握する手法を提案する。
我々は吸引と指の握りを併用した多機能グリップを用いた。
また,グリップハードウェアと周辺環境との衝突を最小限に抑えるために,アクティブグリップの適応戦略を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:12:28 GMT)
FineLIP: Extending CLIP's Reach via Fine-Grained Alignment with Longer Text Inputs [0.4] FineLIPは textbfFine の粒度のアライメントと textbfLonger のテキスト入力を組み込むことで、クロスモーダルなテキストイメージマッピングを強化する。
FineLIPはまず、より長いテキストを扱うために位置埋め込みを拡張し、続いてローカル画像とテキストトークンの動的集約を行う。
我々は、ゼロショット・クロスモーダル検索とテキスト・ツー・イメージ生成という2つのタスクにまたがって、長い詳細なキャプションを持つデータセット上でモデルを検証した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:19:59 GMT)
Rethinking industrial artificial intelligence: a unified foundation framework [0.3] 産業人工知能(AI)は産業を変革し、よりスマートな製造、予測保守、インテリジェントな意思決定を推進している。
既存のアプローチは、ドメイン知識、データ、モデルを体系的に統合することの重要性を見越して、アルゴリズムとモデルに重点を置いていることが多い。
本稿では,知識モジュール,データモジュール,モデルモジュールの3つのコアモジュールからなる産業用AI基盤フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:05:32 GMT)
Quantum Meets SAR: A Novel Range-Doppler Algorithm for Next-Gen Earth Observation [0.3] 本稿では,QRDA(Quantum Range Doppler Algorithm)の実装について検討する。
量子フーリエ変換(Quantum Fourier Transform, QFT)は、古典的なFFTの高速化ツールである。
また、RDAアルゴリズムの重要な補正ステップの一つであるフーリエ領域におけるレンジセルマイグレーション補正(RCMC)の量子バージョンを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:40:12 GMT)
Prompting Medical Vision-Language Models to Mitigate Diagnosis Bias by Generating Realistic Dermoscopic Images [0.3] 皮膚科拡散変換器(DermDiT)
本稿では,視覚言語モデルとマルチモーダルテキスト画像学習を用いて生成したテキストプロンプトを利用して,新たな皮膚画像を生成する,新しい生成AIベースのフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:44:12 GMT)
CoHiRF: A Scalable and Interpretable Clustering Framework for High-Dimensional Data [0.3] 課題を効果的に解決する新しいクラスタリング手法であるCoHiRF(Consensus Hierarchical Random Feature)を提案する。
CoHiRFは、ランダムな特徴選択を利用してノイズと次元効果を緩和し、縮小された特徴空間にK平均クラスタリングを繰り返し適用し、全一致のコンセンサス基準で結果を組み合わせる。
CoHiRFはK-Meansに匹敵する実行時間で計算効率が高く、大規模データセットにスケーラブルで、SC-SRGF、HDBSCAN、OPTICSといった最先端の手法に対して堅牢な性能を示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:10:01 GMT)
Market-Oriented Flow Allocation for Thermal Solar Plants: An Auction-Based Methodology with Artificial Intelligence [0.3] 本稿では,パラボリックトラフコレクタ(PTC)プラントの熱収支を最適化する新しい手法を提案する。
市場ベースのシステムを使用して、計算とデータ要求を減らすために、ループ間のフローを人工知能ニューラルネットワーク(ANN)と組み合わせて分散する。
熱損失、光学効率、照射条件の相違、部分的に曇り、曇りなどによる検証により、非配置システムと比較して熱出力とインターセプト係数が改善された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:01:41 GMT)
A Prefixed Patch Time Series Transformer for Two-Point Boundary Value Problems in Three-Body Problems [0.3] 円柱軌道の2点境界値問題は、円周方向の3つの体問題において重要な課題である。
本研究では,2点境界値問題の解を自動生成する,プレフィックス付きパッチ時系列変換器モデルを用いた新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:22:03 GMT)
BASIR: Budget-Assisted Sectoral Impact Ranking -- A Dataset for Sector Identification and Performance Prediction Using Language Models [0.2] 本研究は、インドの統一予算発表の恩恵を受ける可能性のあるセクターを体系的に識別し、ランク付けする枠組みを提案する。
BASIR(Budget-Assisted Sectoral Impact Ranking)は,予算記述からセクター影響への注釈付きデータセットマッピングである。
以上の結果から,セクター分類では0.605F1スコア,予算後の業績では0.997NDCGスコアが得られた。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:10:26 GMT)
Fault injection analysis of Real NVP normalising flow model for satellite anomaly detection [0.2] 衛星は、通信、地球観測、宇宙科学など、様々な用途に使用される。
人工知能(AI)の重要な応用の1つは、故障検出である。
ニューラルネットワークの利点にもかかわらず、これらのシステムは放射線エラーに弱いため、信頼性に大きな影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:32:59 GMT)
An evaluation of LLMs and Google Translate for translation of selected Indian languages via sentiment and semantic analyses [0.2] 大規模言語モデル(LLM)は低リソース言語を含む言語翻訳において顕著である。
本研究では,サンスクリット語,テルグ語,ヒンディー語を含むインドの言語における選択されたLLMの意味的・感情的分析を用いた。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:17:30 GMT)
Sparse Dictionary Learning for Image Recovery by Iterative Shrinkage [0.1] 画像回復のためのスパース辞書学習におけるスパース符号化問題について検討する。
縮小操作を用いて構築したいくつかの最先端スパース最適化手法について検討・比較する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:08:10 GMT)
Measuring the Data [0.1] データの測定は、ビッグデータの中で本質的な多様体を解析的に見つける。
クープマン次元性低減法は、データから固有多様体への非線形変換を導出する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:43:08 GMT)
Evaluation of Flight Parameters in UAV-based 3D Reconstruction for Rooftop Infrastructure Assessment [0.1] UAVを用いた3次元ホログラフィーによる屋根上3次元再構築は,インフラ評価に有望な解決策を提供する。
既存の手法では、自律飛行経路を使用する際のモデル精度を確保するために、画像の重複率が高く、飛行時間を延長する必要があることが多い。
本研究は,複合屋上インフラの3次元再構築を最適化するために,キーフライトパラメーター地上サンプリング距離(GSD)と画像重なり合いを体系的に評価する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:43:20 GMT)
xML-workFlow: an end-to-end explainable scikit-learn workflow for rapid biomedical experimentation [0.0] 機械学習モデルの構築とイテレーションは、しばしばリソース集約的なプロセスである。
xML-workFlowは、迅速で堅牢でトレース可能なエンドツーエンドワークフローを提供することで、この問題に対処する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:01:12 GMT)
Why many-partite entanglement is essential for holography [0.0] 多数の粒子の絡み合いはホログラフィやホログラム量子誤り訂正符号においてユビキタスであると主張する。
我々は、真のマルチエントロピー(マルチパーティエンタングルメントの新しい尺度)に基づく。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:31:37 GMT)
What is AI, what is it not, how we use it in physics and how it impacts... you [0.0] 人工知能(AI)と機械学習(ML)は、30年以上にわたって粒子物理学で普及してきた。
本稿では,その基盤,誤解,傾向,影響について批判的に考察する。
物理学以外にも、AIのより広範な社会的応用にも対処している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:35:43 GMT)
Vers une modélisation de la confiance dans le renseignement sur les menaces cyber [0.0] サイバー脅威インテリジェンス(CTI)は、効果的なシステム防御に不可欠である。
近年、不確実な情報に基づく意思決定のための信頼のモデリングの基礎となる理論が進歩している。
我々は,CTIとCTIの情報共有の問題と,論理ベースのソリューションを初期実装に用いた理由について述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:17:26 GMT)
TowerDebias: A Novel Unfairness Removal Method Based on the Tower Property [0.0] TowerDebias(tDB)は、ブラックボックスモデルによる予測における機密属性の影響を低減するために設計された、新しい後処理手法である。
本稿では tDB に対する形式的公正性改善定理を提案し,その妥当性を回帰処理と分類処理の両方で示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:30:44 GMT)
Towards practical non-Markovianity measures: Normalization and regularization techniques [0.0] 量子力学の非マルコビアン度を特徴づける尺度は、実デバイスに適用した場合にいくつかの欠点がある。
本研究は,超伝導トランスモンおよび捕捉イオン量子ビット上で実験により得られた知見を検証し,その有効性を高めるためのいくつかの手法を提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:46:49 GMT)
Topology of surface electromyogram signals: hand gesture decoding on Riemannian manifolds [0.0] 表面筋電図(EMG)信号を用いた手動作の復号化のためのデータと手法を提案する。
EMGをベースとした上肢インタフェースは、切断者リハビリ、人工上肢増強、コンピュータのジェスチャー制御、バーチャルおよび拡張現実の応用に有用である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:13:07 GMT)
Time-to-event prediction for grouped variables using Exclusive Lasso [0.0] 本稿では,標準のラッソ法典に代えて排他的ラッソ正則化(Exclusive Lasso regularization)を提案する。
本手法を実生がんデータセットに適用し,従来のCox回帰モデルと比較して生存予測性能が向上したことを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:07:05 GMT)
Time-dependent Hamiltonian Simulation via Magnus Expansion: Algorithm and Superconvergence [0.0] マグナス級数展開に基づく時間依存型ハミルトンシミュレーションアルゴリズムを提案する。
2階アルゴリズムのコンピュテータが驚くべき4階超収束をもたらすことを証明した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:14:12 GMT)
Time operator from parametrization invariance and implications for cosmology [0.0] 対応する量子作用素を定義し、その結果、消滅するハミルトニアンと正則に共役する。
宇宙論的な設定で導入された時間変数の一般的な式を導出する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:11:21 GMT)
Thermalization in a model of enhanced memory capacity [0.0] 情報保存能力が向上した量子系における熱化の研究を行う。
我々は,その情報搬送サブシステムが大規模システムサイズ限界の温度に近づいたことを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:58:20 GMT)
The dynamical $α$-Rényi entropies of local Hamiltonians grow at most linearly in time [0.0] 我々は、厳密な局所的な相互作用を持つ長さ $ L $ の一般的な 1 次元スピン系を考える。
我々は、初期積状態の動的 $ α $-R'enyi エントロピー、$ 0 α le 1 $ が、最も線形に時間的に増加することを証明した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:56:47 GMT)
Systematic Literature Review of Automation and Artificial Intelligence in Usability Issue Detection [0.0] ユーザビリティの自動問題検出技術の現状を概観する。
私たちは、トレンド、パラダイム、そしてそれらを適用する技術的コンテキストを分析します。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:07:32 GMT)
Sub-second spin and lifetime-limited optical coherences in $^{171}$Yb$^{3+}$:CaWO$_4$ [0.0] 171$Yb$3+$イオンをCaWO$_4$結晶にドープする。
我々は、185MHzの光遷移と放射寿命制限コヒーレンス時間(0.75ms)の細い不均一な拡張を見出した。
これらの結果は量子技術を構築するための低ノイズプラットフォームとしての171$Yb$3+$:CaWO$_4$の可能性を示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:57:01 GMT)
Study of scaling laws in language families [0.0] 本稿では,6万以上の言語からのデータを用いて,言語ファミリー内の法則のスケーリングについて検討する。
Zipfに似た分類グラフで観察される創発パターンを分析する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:28:59 GMT)
Stability of Floquet sidebands and quantum coherence in 1D strongly interacting spinless fermions [0.0] フロケ・ブロッホ側バンド(FBs)の寿命における駆動のコヒーレンスにおける電子-電子相互作用と摂動の影響について検討する。
高周波駆動では,完全多体励起連続体から分離した長寿命FBが得られた。
現像像は、実空間単一粒子プロパゲータの挙動によってさらに解明される。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:20:35 GMT)
Spontaneous symmetry breaking for nonautonomous Hermitian or non-Hermitian systems [0.0] 一般の反線型対称性が解けていない場合、ルイス・アンド・リースフェルト位相は時間の真の奇函数であることを示す。
自然に壊れた状態に対して、ルイス・アンド・リースフェルト相の虚成分は時間の関数として現れる。
非エルミート力学カシミール効果をモデル化する時間依存ハミルトニアンに対して、未破壊かつ破れた$mathcalPT$対称性の例を示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:13:48 GMT)
Simultaneous optical phase and loss estimation revisited: measurement and probe incompatibility [0.0] 単一光モードにおける位相シフトと損失の同時推定について検討する。
我々は、光子の数が増加するにつれて、単モードと2モードの両方でプローブ不整合が消失する光の量子状態が存在することを数値的に見出した。
このモデルの基本的不整合性の側面は、考慮されたすべてのシナリオに持続する測定不整合性であり、プローブ不整合性は大きな光子数制限でも克服できない。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:40:33 GMT)
Should AI Optimize Your Code? A Comparative Study of Classical Optimizing Compilers Versus Current Large Language Models [0.0] 大規模言語モデル(LLM)は、コード最適化に革命をもたらすAIアプローチの可能性に関する興味深い疑問を提起する。
この作業は、コンパイラコミュニティにとって重要な質問に答えることを目的としている。
本稿では3つの古典最適化コンパイラと2つの最近の大規模言語モデルの比較分析を行う。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:22:18 GMT)
Sampling the spatial coherence of light [0.0] 我々は従来,光信号のコヒーレンス特性を測定するために,波面センシングのために設計されたハートマンセンサの新たな応用を紹介した。
量子系のコヒーレンス行列と密度行列の類似を描画することにより、センサ動作を量子推定問題として再放送する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:00:01 GMT)
Robustness of electron charge shuttling: Architectures, pulses, charge defects and noise thresholds [0.0] 単純なSi/SiO2デバイスに対する様々な「コンベヤベルト」シャットリングシナリオを数値シミュレーションした。
本研究の結果から,コンベヤベルトシャットリングは半導体量子デバイスにおける接続性に優れた候補である,という結論が得られた。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:28:37 GMT)
Relativistic quantum Otto heat engine using a three-level Unruh-DeWitt detector [0.0] 我々は, 量子スカラー場と相互作用する作用物質として, クォートを持つ相対論的量子オットー熱エンジンを探索する。
一対のエネルギーレベルが知覚する有効温度の観点から、一般的な正の作業条件を導出する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:38:58 GMT)
Reinsuring AI: Energy, Agriculture, Finance & Medicine as Precedents for Scalable Governance of Frontier Artificial Intelligence [0.0] 本稿では,3階層の保険アーキテクチャを通じて,このようなハイテイクモデルを管理するための新しい枠組みを提案する。
連邦政府が、脆弱な規制や予測ライセンス制度に頼ることなく、民間のAI保険市場を安定させる方法を示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:02:19 GMT)
Redefining technology for indigenous languages [0.0] 我々は、先住民族の言語を概観し、その切り下げの原因を特定し、言語の権利に関する法律の必要性を明らかにする。
我々は、これらの言語を再活性化するために使用される技術についてレビューし、それらが外から来たとき、それらが求めるものと逆の効果を持つことが多いことを発見した。
我々は,大規模言語モデル(LLM)に内在的知識を組み込むことで,技術景観を豊かにするが,参加型環境で行う必要があることを示唆する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:08:53 GMT)
ReMi: A Random Recurrent Neural Network Approach to Music Production [0.0] 生成的人工知能は、エネルギー消費、著作権侵害、創造的萎縮に関する懸念を提起する。
音楽家を置き換えることを目的としたエンドツーエンドの音楽生成とは対照的に、我々のアプローチはデータの不要さと計算能力の低下を両立させながらクリエイティビティを高める。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:45:00 GMT)
Quantum entanglement in a pure state of strongly correlated quantum impurity systems [0.0] 我々は、サブシステムとしてシステムから任意に選択された1つまたは2つの量子不純物からなるシステムを構築した。
エンタングルメントエントロピー、相互情報、相対エントロピーなどの量子情報量について定式化する。
いくつかのサイトと単一の不純物アンダーソンモデルからなる量子不純物系に適用し、それらの状態と量子情報量の挙動の関係を研究する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:03:40 GMT)
Quantum Computing in Logistics and Supply Chain Management an Overview [0.0] この研究は、量子コンピューティングのロジスティクスとサプライチェーン管理への統合を探求している。
本稿では,ルーティング,ロジスティックネットワーク設計,艦隊維持,貨物積み込み,予測,スケジューリング問題に対する量子的アプローチの概要について述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:48:47 GMT)
Pseudo Random Number Generator using Internet-of-Things Techniques on Portable Field-Programmable-Gate-Array Platform [0.0] 本稿では、FPGAプラットフォーム上に実装されたロジスティックマップ、ダブル振り子、マルチLFSRを含む3つのIoTベースのPRNGモデルの比較研究を行う。
Multi-LFSR、ロジスティックマップ、ダブル振り子モデルと比較すると、完全な品質のランダム性が得られる。
Multi-LFSRは、低レイテンシ、消費電力、リソース効率設計のため、独自のものになっている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:07:55 GMT)
Proper scoring rules for estimation and forecast evaluation [0.0] 本稿では,適切なスコアリングルールの数学的基礎について概観する。
推定・予測評価における統計学と機械学習の役割について論じる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:46:14 GMT)
Proof of Humanity: A Multi-Layer Network Framework for Certifying Human-Originated Content in an AI-Dominated Internet [0.0] 本稿では,通信ネットワークが人間指向コンテンツのインフラストラクチャレベル認証として機能する,概念的,多層アーキテクチャフレームワークを提案する。
我々は、SIM/eSIMアイデンティティ、デジタルシグネチャ、ビヘイビアベースのML、エッジ検証APIといった技術的プリミティブを使用して、各OSIレイヤがこの信頼ファブリックにどのように貢献できるかを概説する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:02:51 GMT)
Preparation of conditionally-squeezed states in qubit-oscillator systems [0.0] 量子調和振動子における圧縮状態の重畳を生成するプロトコルを提案する。
我々はデコヒーレンスの存在下での状態準備スキームの頑健さを数値的に評価する。
潜在的な応用として、条件付き状態に基づく量子誤り訂正符号を導入し、その誤り軽減特性を解析する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:15:08 GMT)
Plane-Wave Decomposition and Randomised Training; a Novel Path to Generalised PINNs for SHM [0.0] 物理インフォームドニューラルネットワーク(PINN)の定式化について紹介する。
PINNは、フーリエ分解の形式を学習し、ランダムに選択された境界条件の拡散に基づく訓練手法である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:59:36 GMT)
Phase vs coin vs position disorder as a probe for the resilience and revival of single particle entanglement in cyclic quantum walks [0.0] 単一粒子エンタングルメント(SPE)を示す量子状態は、それらの多粒子アナログよりも堅牢に量子情報をエンコードし、処理することができる。
この手紙は、離散時間量子ウォークによる位相、コイン、位置障害を奇数および巡回グラフ上で調べ、それらのSPEへの影響を研究する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:57:33 GMT)
OpenThaiGPT 1.6 and R1: Thai-Centric Open Source and Reasoning Large Language Models [0.0] OTG-1.6はタスク・アリストメティクス・モデルを組み合わせて広範囲に一般化し、OTG-R1はマルチステージ・トレーニングとLess-Is-More Reasoning hypothesis (LIMO)を統合して高度な推論を行う。
ベンチマーク評価は、タイ語のタスク間で優れたパフォーマンスを示し、大規模なオープンソースであるタイのLLMに対して競争力を発揮する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:55:52 GMT)
On the dual structure of the Schrödinger dynamics [0.0] まず、古典力学を参照せずに、スクラッチから実数値シュリンガー方程式を導出する。
次に、Schr"odinger方程式と互換性のある方法で量子パス力学を研究する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 05:38:05 GMT)
Nonlinearity of the Fidelity in Open Qudit Systems: Gate and Noise Dependence in High-dimensional Quantum Computing [0.0] 本稿では,リンドブラッド形式におけるマルコフ雑音下での単一キューディット系の平均ゲート忠実度(AGF)について検討する。
環境結合係数の観点から平均ゲート不忠実度(AGI)の摂動膨張に関する一般表現を導出する。
本研究は,AGIがQudit次元,量子ゲート選択,ノイズ強度に依存していることに注目し,量子ゲート設計と誤り訂正プロトコルを最適化するための重要な洞察を提供する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:28:58 GMT)
Neural Style Transfer for Synthesising a Dataset of Ancient Egyptian Hieroglyphs [0.0] 本稿では,NSTをデジタル書体に適用することにより,古代エジプトのヒエログリフのデータセットを生成する新しい手法を提案する。
実験結果から,NST生成例と写真に基づいて訓練した画像分類モデルが,実際のヒエログリフ画像と同等の性能と転写性を示した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:30:45 GMT)
Network Intrusion Datasets: A Survey, Limitations, and Recommendations [0.0] データ駆動型サイバー脅威検出は、現代のサイバーセキュリティにおいて重要な防御技術となっている。
データの重要性にもかかわらず、その不足はNIDS研究の大きな障害として長年認識されてきた。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:40:47 GMT)
Multiplexed Control at Scale for Electrode Arrays in Trapped-Ion Quantum Processors [0.0] 1万個のトラップ電極を持つトラップイオン量子コンピュータは、13個のフィールドプログラマブルゲートアレイと104個の高速DACで制御できる。
これは従来の制御法で必要とされる1万の専用DACとは対照的である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:21:31 GMT)
Multipartite Entanglement Structure of Fibered Link States [0.0] 我々は、ゼーファート面上のファイバーとしてトポロジ的に記述できるリンク補集合に焦点をあてる。
このようなファイバーリンク補完状態の絡み合い構造は、位相不変量、すなわちフィブレーションのモノドロミーによって制御されることを示す。
特に、GHZのような絡み合いにつながる背景に任意のリンクが埋め込まれていることが示される。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:04:25 GMT)
Multicriticality in stochastic dynamics protected by self-duality [0.0] 本研究では, 1次元の運動的制約のあるモデルの大規模な動的偏差(LD)について検討する。
ドメインウォール(DW)Fredrickson-Andersen(FA)、DW East、ZZZ-FA、XOR-FAの4つのモデルを詳細に検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:10:57 GMT)
Multi-Path and Multi-Particle Tests of Complex vs. Hyper-Complex Quantum Theory [0.0] 本稿では, ペレス検定を固形数学的根拠に当てはめる一般行列形式論を提案する。
量子力学の数値系の任意の次元に対して直接プローブを提供する多経路および多粒子干渉試験を導入する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:09:46 GMT)
Mode Protection and Synchronization of Anyonic Oscillators [0.0] 我々は、任意の振動子における散逸動力学を支配するリンドブラッド・マスター方程式を導出する。
ハイゼンベルク図形の随伴方程式も定式化する。
xi$のチューニングは、通常のモードを消散から選択的に保護する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 23:16:18 GMT)
Migrating a Job Search Relevance Function [0.0] 本稿では,自家製C++検索エンジンのOpenSearchへの移行について述べる。
ジョブコーパスを凍結し、在庫の少ない場所でクエリを実行し、高品質と低品質の検索結果の代表的な混合をキャプチャします。
私たちはOpenSearchで新しい検索アルゴリズムを微調整し、元のエンジンのロジックのキーコンポーネントを複製し、必要に応じて新しい機能を導入しました。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 01:22:55 GMT)
Measuring entanglement without local addressing in quantum many-body simulators via spiral quantum state tomography [0.0] 量子状態トモグラフィーは、量子コンピュータとシミュレータで生成された量子状態を特定するための重要なツールである。
本稿では,より効率的にスケールできるトモグラフィー手法を提案する。
数値シミュレーションの結果,高いトモグラフィ効率と精度が示された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 04:49:02 GMT)
Many neighbors little entanglement: A curious scaling in the variable-range extended Ising model [0.0] 量子ビットの正解変数範囲拡張イジングモデルの基底状態における二点相関関数と二部交絡について検討する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:54:52 GMT)
MCP Safety Audit: LLMs with the Model Context Protocol Allow Major Security Exploits [0.0] Model Context Protocol (MCP) は、大規模言語モデル(LLM)、データソース、エージェントツールへのAPI呼び出しを標準化するオープンプロトコルである。
現在のMPP設計はエンドユーザーに幅広いセキュリティリスクをもたらすことを示す。
任意のMPPサーバのセキュリティを評価するために,安全監査ツールであるMPPSafetyScannerを導入する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:46:02 GMT)
Limits to Analog Reservoir Learning [0.0] アナログ貯水池コンピュータの学習能力に及ぼす雑音の影響について検討する。
情報処理能力(IPC)はノイズによる性能劣化の定量化に有用な指標であることを示す。
ノイズに晒された物理的アナログ貯水池コンピュータは、学習量の増加にのみ利用できると結論付けている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:22:09 GMT)
Language Models at the Syntax-Semantics Interface: A Case Study of the Long-Distance Binding of Chinese Reflexive ziji [0.0] 本稿では,中国語の反射ジジの複雑な結合パターンを,言語モデルで効果的に解決できるかどうかを考察する。
我々は,BCCコーパスからの320の自然文とともに,構文文献のテンプレートと例を用いて240の合成文のデータセットを構築した。
いずれのモデルも、人間のような判断を一貫して再現するものではない。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 20:25:27 GMT)
Joint estimation of position and momentum with arbitrarily high precision using non-Gaussian states [0.0] 非ガウス性を利用して任意の精度で同時推定できることを示す。
我々は、純粋な非ガウス状態が全てのガウス状態に対して、純粋でも混合でも有利であることを示した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:11:32 GMT)
Inverse RL Scene Dynamics Learning for Nonlinear Predictive Control in Autonomous Vehicles [0.0] 本稿では,自律ナビゲーションのための深層学習に基づくScene Dynamics(DL-NMPC-SD)手法を提案する。
DL-NMPC-SDは、時間範囲センシング情報から学習したシーンダイナミクスモデルと組み合わせて、アプリオリ名車モデルを使用する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 03:46:37 GMT)
Inference of hidden common driver dynamics by anisotropic self-organizing neural networks [0.0] 隠れた共通ドライバの基盤となるダイナミクスを推論する新しい手法を提案する。
推測は時間遅延埋め込み、観測システムの内在次元の推定に依存する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:17:23 GMT)
Horizon Scans can be accelerated using novel information retrieval and artificial intelligence tools [0.0] この研究は、水平線スキャンを改善するために設計されたオープンソースのPythonベースのツールであるSCANARとAIDOCを紹介している。
SCANARはニュース記事の検索と処理を自動化する。
AIDOCは、AIを活用して関連性に基づいてテキストデータを順序付けし、セマンティックな類似性のためにニューラルネットワークを使用し、その後、人間のレビューに関連性のあるエントリを優先順位付けすることで、フィルタリングを支援する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 11:33:08 GMT)
Groningen: Spatial Prediction of Rock Gas Saturation by Leveraging Selected and Augmented Well and Seismic Data with Classifier Ensembles [0.0] 本稿では,巨大グローニンゲンガス田の例における分類器アンサンブル法を用いて,岩盤飽和確率の空間的予測に関する概念を実証する。
提案手法の有効性を示し, トレーニングサンプルを9倍に増やした。
フィールド内および隣接領域におけるガス貯留層の厚さの予測を行う。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:40:38 GMT)
Geometric measure of quantum complexity in cosmological systems [0.0] 時間依存周波数を持つ調和振動子ハミルトニアンの量子複雑性の上限の明示的な公式が導出される。
宇宙学的なデ・シッター背景の質量を持たない試験スカラー場に適用すると、スケール係数の関数としての複雑性の上限は超ハッブルスケールにおける対数的増加を示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 00:01:35 GMT)
Geometric Reasoning in the Embedding Space [0.0] グラフニューラルネットとトランスフォーマーは、幾何学的制約について推論することを学ぶことができることを示す。
我々は、制約の集合から離散的な2次元格子内の点の空間的位置を予測するよう訓練する。
また、タスク用に設計したグラフニューラルネットワークは、Transformerよりも大幅に性能が良く、スケールも容易であることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:13:52 GMT)
General channel capacities from quantum channel-state duality [0.0] 量子チャネル状態双対性(quantum channel-state duality)は、チョイ状態と呼ばれる量子状態を通して量子過程を特徴づけることを可能にする。
この研究において、量子チャネルキャパシティに関する基本的な定理は、チョイ状態が情報源と見なされるときに証明される。
これは超加法現象の理解と新しい量子誤り訂正符号の発見に新たな機会をもたらす。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:58:25 GMT)
Exact Dynamics and Bloch Oscillations in a Non Hermitian Zigzag Glauber Fock Lattice [0.0] 一次元非エルミタン導波路アレイの離散力学を理論的に研究する。
不均衡ホッピング振幅と導波路設定との相互作用は非エルミタンブロッホ振動をもたらす。
閉形式解析解を導出し, 系の数値解と比較する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 19:41:53 GMT)
Evaluating the Application of SOLID Principles in Modern AI Framework Architectures [0.0] この研究は、現代のAIフレームワーク、特にスキキットラーンがSOLID設計原則にどの程度準拠しているかを評価する。
それぞれのフレームワークのドキュメンテーション、ソースコード、アーキテクチャコンポーネントを調べて、これらの原則への準拠性を評価しました。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:23:26 GMT)
Epistemic Closure and the Irreversibility of Misalignment: Modeling Systemic Barriers to Alignment Innovation [0.0] 人工知能の安全な開発を保証する努力は、しばしばコンセンサスに基づくアライメントアプローチに依存する。
本稿では, 認知, 制度, 社会的, インフラ的フィルタを併用してアライメント提案を不可能にする, てんかん閉鎖機能モデルを提案する。
本稿では,AIシステムによる拒絶・非エンゲージメントパターンのメタ分析を含む,理論的および経験的情報源の両方が支持する重み付きクロージャモデルを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:35:15 GMT)
Entanglement of a spin-1/2 Ising-Heisenberg diamond spin cluster in the thermal bosonic bath [0.0] 熱ボゾン浴の影響下でのイシン・ハイゼンベルク相互作用によるダイヤモンドスピンクラスターの時間進化について検討した。
環境がシステム内の絡み合いの存在にどのように影響するかを実証する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:38:07 GMT)
Entanglement in the symmetric subspace: mapping multipartite to bipartite states [0.0] 我々は、$N$-qubit対称状態を、より高い局所次元の2部対称状態にマッピングする。
このマッピングは分離性を保ち、元のマルチパーティイト状態の絡み合いを特徴付けることができることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:31:18 GMT)
Enhancing Traffic Sign Recognition On The Performance Based On Yolov8 [0.0] この論文では、高度なデータ拡張技術を統合する拡張YOLOv8ベースの検出システムを提案する。
GTSRB、TT100K、GTSDBなどのデータセットで実施された実験では、検出精度、悪条件下での堅牢性、エッジデバイス上でのリアルタイム推論が著しく改善された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:28:05 GMT)
Enhancing LLMs in Long Code Translation through Instrumentation and Program State Alignment [0.0] コード翻訳は、機能を保ちながらプログラミング言語間でコードを変換することを目的としている。
大規模言語モデル(LLM)の最近の進歩はコード翻訳を改善しているが、課題は残る。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:55:29 GMT)
Energy spectrum and quantum phase transition of the coupled single spin and an infinitely coordinated Ising chain [0.0] 我々は、1つのスピンからなるスピンモデルを考え、無限に座標付けられたイジング鎖に接続する。
我々はチェインハミルトニアンをリプキン-メシュコフ-グリックモデルのハミルトニアンに写像し、システム全体は一般化されたラビハミルトニアンによって記述される。
熱力学的極限において、系全体のスペクトルを取得し、基底状態量子相転移の性質を研究する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:37:14 GMT)
Embedding Method for Knowledge Graph with Densely Defined Ontology [0.0] そこで本研究では,プロパティ間の関係を組み込んだ知識グラフを用いたKGEモデルTransUを提案する。
本稿では,標準データセットと実用データセットを用いた実験結果について述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:43:47 GMT)
EEG-EyeTrack: A Benchmark for Time Series and Functional Data Analysis with Open Challenges and Baselines [0.0] まず、FDAアプリケーションに適したオープンな課題と評価指標が提案されている。
機能的ニューラルネットワークは、一次回帰タスクのベースライン結果を確立するために使用される。
コンシューマグレードのハードウェアに基づく新しいデータセットと、リサーチグレードのハードウェアに基づくEEGEyeNetデータセットのベースライン結果が報告されている。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:33:38 GMT)
Density estimation via mixture discrepancy and moments [0.0] 混合離散性に基づくシーケンシャルパーティション(DSP-mix)による密度推定とモーメントに基づくシーケンシャルパーティション(MSP)による密度推定を提案する。
結果: DSP-mix と MSP は DSP の約10倍の速度で動作し,同じ精度を維持した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:15:03 GMT)
Demonstrating Correlation Trends in the Electric Dipole Polarizabilities of Many Low-lying States in Cesium (Cs I) through First-principle Calculations [0.0] セシウム(Cs)における電子相関と高次相対論的効果の研究
原子軌道上の奇数のE1演算子による摂動を考慮し、線形応答法で計算を行う。
我々の最終的な$alpha_d$値は、推定された不確実性と共に、以前の計算と合理的に良い一致を示している。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 07:10:28 GMT)
Defending Large Language Models Against Attacks With Residual Stream Activation Analysis [0.0] 大規模言語モデル(LLM)は敵の脅威に対して脆弱である。
本稿では, LLM へのホワイトボックスアクセスを前提とした, 革新的な防御戦略を提案する。
そこで本研究では,アタックプロンプト分類のための残差ストリームの固有なアクティベーションパターンを解析するための新しい手法を適用した。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 22:12:47 GMT)
Deep Learning for VWAP Execution in Crypto Markets: Beyond the Volume Curve [0.0] Volume-Weighted Average Price (VWAP) は、おそらく取引実行の最も一般的なベンチマークである。
VWAPの達成は、ボリュームと価格の2つの動的要因に依存しているため、本質的に困難である。
本稿では,ボリューム曲線予測の中間段階をバイパスすることで,VWAP実行目標を直接最適化するディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 14:56:54 GMT)
De Novo Molecular Design Enabled by Direct Preference Optimization and Curriculum Learning [0.0] デノボ分子設計は、薬物発見と材料科学に広く応用されている。
巨大な化学空間は直接分子探索を計算的に禁止し、従来の実験スクリーニングは時間と労働の両方に集約している。
NLPの直接選好最適化(DPO)は、分子スコアに基づくサンプルペアを使用して、高品質分子と低品質分子の確率差を最大化する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:00:21 GMT)
Criticality-Enhanced Quantum Sensing with a Parametric Superconducting Resonator [0.0] 超伝導パラメトリック(すなわち2光子駆動)Kerr共振器を用いた臨界量子センサを実装した。
システムサイズに対する2次精度スケーリングは、Kerr非線形性の有限値で達成可能であることを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 13:22:04 GMT)
Conditions for Unitarity in Timeless Quantum Theory [0.0] この研究は、相対力学がユニタリであることに必要かつ十分な条件を導出する。
これらの条件の物理的解釈は、クロックの速度の観点から与えられる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 10:31:25 GMT)
Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B [0.0] Llama駆動のコード生成は、自然言語プロンプトを複数のプログラミング言語で実行可能なコードに変換することができる。
Llamaは、あらゆるスキルレベルの開発者にとって汎用的なツールとして機能し、ソフトウェア開発の生産性と効率を改善します。
教育、産業、そしてコーディングプラクティスの将来への潜在的影響についても論じる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:01:15 GMT)
Characterization of the chaotic phase in the tilted Bose-Hubbard model [0.0] 傾きボース・ハバードモデルのカオス相はエネルギー,傾き強度,粒子相互作用の関数として同定される。
解析の結果,素体のボース・ハッバード・ハミルトンのカオス位相は,適度な傾きの存在によって実際に向上できることが明らかとなった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:18:33 GMT)
Cause or Trigger? From Philosophy to Causal Modeling [0.0] 我々は、メタ物理的な意味での引き金や原因の説明と、それらと区別する特徴に焦点をあてる。
本稿では,プロセスが原因なのか効果の引き金なのかを判断できる数学的モデルと因果トリガーアルゴリズムを提案する。
地球温暖化を引き起こすプロセスの引き金を知ることは、政治家が効果的な行動に集中するのに役立ちます。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 06:37:48 GMT)
Catalytic Activation of Bell Nonlocality [0.0] ベル非局所性は触媒反応によって特定のベル局所状態に対して活性化できることを示す。
本稿では,ベル局所状態と触媒が組み合わさってベル非局所状態に変換され,触媒の初期状態が正確に返されるプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 18:02:44 GMT)
Business Process Modeling Using a Metamodeling Approach [0.0] 論文では、ビジネスプロセス管理システムの開発に関するトピックについて論じている。
ビジネス管理システムの複雑さに対処するためには、モデル駆動開発の適用が必要である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:46:54 GMT)
Buggin: Automatic intrinsic bugs classification model using NLP and ML [0.0] 本稿では、自然言語処理(NLP)技術を用いて、固有のバグを自動的に識別する。
本稿では,バグレポートのタイトルと記述文に適用した2つの埋め込み手法であるseBERTとTF-IDFを用いる。
結果として得られる埋め込みは、Support Vector Machine、Logistic Regression、Decision Tree、Random Forest、K-Nearest Neighborsといった、確立された機械学習アルゴリズムにフィードバックされる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:23:08 GMT)
Autonomous optical navigation for DESTINY+: Enhancing misalignment robustness in flyby observations with a rotating telescope [0.0] DESTINY+は、パエソンを含む複数の小惑星を飛ばすJAXA Epsilonの中級ミッションである。
小惑星フライバイ観測装置として、TAPと呼ばれる1軸回転が可能な望遠鏡が宇宙船に搭載され、フライバイ中にターゲット小惑星を追跡し観測する。
航法精度の低下を軽減するため、過去のミッションでは光航法を開始する前に航法カメラのアライメントを校正した。
本稿では,回転望遠鏡の誤配に頑健な自律型光ナビゲーションアルゴリズムについて述べる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:42:37 GMT)
Autonomous AI for Multi-Pathology Detection in Chest X-Rays: A Multi-Site Study in the Indian Healthcare System [0.0] この研究は、胸部X線(CXR)解釈のための自律型AIシステムの開発について概説している。
このシステムは、Vision Transformers、Faster R-CNN、および様々なUNetモデルを含む高度なアーキテクチャを統合している。
インドでは、診断センター、大病院、政府病院を含む17の医療システムに配備された。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:36:56 GMT)
Architect Your Landscape Approach (AYLA) for Optimizations in Deep Learning [0.0] グラディエントDescent(DSG)とその変種(ADAMなど)はディープラーニングの最適化の基礎となっている。
本稿では適応性と効率性を向上する新しい最適化手法であるAYLAを紹介する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 16:31:39 GMT)
Arbitrary gauge quantisation of light-matter theories with time-dependent constraints [0.0] 時間依存のホロノミック制約を持つ光マター理論の定量化のための一般的な枠組みを提供する。
時間依存的な光-物質相互作用を記述するために、クーロンゲージは一般に不回転ではないことを示す。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 12:27:00 GMT)
Applying software engineering solutions to law management, Nigeria as a case study [0.0] 本稿では,ナイジェリアの法律事務所における技術採用のレベルを調査し,作業プロセスを自動化するソフトウェアソリューションを開発する。
発見は、ソフトウェアソリューションを必要とする法的なプラクティスのさまざまな領域について、さらなる分析の必要性を示している。
音声からテキストへの書き起こし機能も実装され、長めのタイピングが不要になった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 17:21:25 GMT)
An Operational Quantum Field Theoretic Model for Gravitationally Induced Entanglement [0.0] 空間重畳における2つの大物体間の重力誘起絡み合いの量子場理論モデルを構築した。
静的極限における線形化量子重力を用いることで、質量が占める場モード間の絡み合いを誘導する効果的なハミルトニアンを導出する。
重力によって引き起こされた絡み合いは、以前の非相対論的結果と一致して視界の低下につながる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 09:27:39 GMT)
Accelerate Parallelizable Reasoning via Parallel Decoding within One Sequence [0.0] 推論プロセスを加速するために、特定のタスクの固有の並列化性を活用します。
実験結果から,提案手法は解答品質を維持しつつ,復号時間において100%以上の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 08:29:16 GMT)
A healthier stochastic semiclassical gravity: world without Schrödinger cats [0.0] 半古典重力は、平均場近似における量子化された物質に古典的な重力を結合する。
まず、物質分布の量子的ゆらぎを無視する。
第二に、量子力学の線型性に反する。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 21:24:10 GMT)
A Randomized Zeroth-Order Hierarchical Framework for Heterogeneous Federated Learning [0.0] フェデレートラーニング(FL)における不均一性は、モデルの性能と収束に大きな影響を及ぼす決定的かつ挑戦的な側面である。
階層的最適化問題として不均一FLを定式化した新しいフレームワークを提案する。
画像分類タスクに本手法を実装し,異なる異種条件下での他の手法との比較を行った。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:44:59 GMT)
A Precision Gyroscope from the Helicity of Light [0.0] 光の偏光に対する回転の影響に基づいて回転を測定するジャイロスコープについて述べる。
回転は、左右の円偏光の伝播における差動位相シフトを誘導する。
この位相シフトは、適切に設計された干渉計の設定で測定することができる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:13:25 GMT)
A Novel Framework To Assess Cybersecurity Capability Maturity [0.0] 本稿では,新しいサイバーセキュリティ能力成熟度フレームワークを提案する。
組織により関連性があり、影響力のある評価を提供することは、総合的で、柔軟で、測定可能である。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 02:29:35 GMT)
A Novel Approach To Implementing Knowledge Distillation In Tsetlin Machines [0.0] Tsetlin Machine (TM) は命題論理に基づくモデルであり、データからパターンを学ぶために接続節を使用する。
本稿では,教師の出力サンプルの確率分布を利用して,知識蒸留をTsetlin Machinesに導入する手法を提案する。
提案アルゴリズムは,画像認識とテキスト分類の試験領域における遅延に悪影響を及ぼすことなく,学生モデルの性能を著しく向上させることができる。
論文参考訳(メタデータ) (Wed, 02 Apr 2025 15:06:27 GMT)