Ego-Exo4D: Understanding Skilled Human Activity from First- and Third-Person Perspectives [194.1] Ego-Exo4Dは、熟練した人間の活動を同時に捉えたエゴセントリックでエゴセントリックなビデオを中心にしている。
世界の13都市から740人の参加者が123の異なる自然環境下でこれらの活動を行った。
ビデオにはマルチチャンネルオーディオ、視線、3Dポイントクラウド、カメラポーズ、IMU、複数対の言語記述が添付されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:55:38 GMT)
Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Multimodal Models [146.2] Molmoは、オープンネスのクラスで最先端のVLMの新たなファミリーである。
私たちの重要なイノベーションは、人間のアノテーションから収集された、新しくて詳細な画像キャプションデータセットです。
近い将来、モデルウェイト、キャプション、微調整データ、ソースコードをすべてリリースする予定です。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:59:51 GMT)
Pre-trained Language Models Do Not Help Auto-regressive Text-to-Image Generation [82.5] 我々は,自動回帰テキスト・画像生成のための事前学習言語モデルを適用した。
事前訓練された言語モデルは限られた助けを提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:58:21 GMT)
Language Models Learn to Mislead Humans via RLHF [81.3] 言語モデル(LM)は、特にタスクが複雑である場合に、人間にとって検出が難しいエラーを生成する。
我々はこの現象を標準のRLHFパイプラインで研究し、モデル開発者が意図していないことから「U-SOPHISTRY」と呼ぶ。
我々の研究は、RLHFの重要な障害モードを強調し、人間の調整を支援するためのさらなる研究を求めている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:32:31 GMT)
EAGLE: Towards Efficient Arbitrary Referring Visual Prompts Comprehension for Multimodal Large Language Models [80.0] 本稿では,既存のアプローチよりもトレーニングの少ない任意の参照視覚的プロンプトの理解を促進するための,MLLM(Multimodal Large Language Models)を提案する。
本手法は,視覚的プロンプトを,MLLMに理解可能な特定の空間領域を伝達する空間概念として応用する。
我々はまた、MLLMの領域レベルの理解を視覚的プロンプトを参照する特定の形式にさらに引き離すための幾何非依存学習パラダイム(GAL)を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:22:00 GMT)
DreamWaltz-G: Expressive 3D Gaussian Avatars from Skeleton-Guided 2D
Diffusion [69.7] テキストからアニマタブルな3Dアバター生成のための新しい学習フレームワークDreamWaltz-Gを提案する。
このフレームワークのコアはScore DistillationとHybrid 3D Gaussian Avatar表現にある。
我々のフレームワークは、人間のビデオ再現や多目的シーン構成など、多様なアプリケーションもサポートしています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:59:45 GMT)
Scalable Ensemble Diversification for OOD Generalization and Detection [68.9] SEDは、ハエのハードトレーニングサンプルを特定し、アンサンブルメンバーにこれらについて意見の一致を奨励する。
モデル間でのペアの相違を解消する既存の方法において,コストのかかる計算を避ける方法を示す。
OODの一般化のために,出力空間(古典的)アンサンブルや重量空間アンサンブル(モデルスープ)など,複数の環境での多様化による大きなメリットを観察する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:30:24 GMT)
ChatCam: Empowering Camera Control through Conversational AI [67.3] ChatCamは、ユーザーとの会話を通じてカメラの動きをナビゲートするシステムである。
そこで本研究では,テキスト条件付きカメラ軌道生成のためのGPTに基づく自己回帰モデルであるCineGPTを提案する。
また、正確なカメラ軌道配置を保証するアンカー決定器も開発した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:13:41 GMT)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles
Using Latent Space Generative World Models [62.0] World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:48:25 GMT)
InstructIR: High-Quality Image Restoration Following Human Instructions [61.2] 本稿では,人間の手書きによる画像復元モデルを導出する手法を提案する。
InstructIRという手法は、いくつかの修復作業において最先端の結果を得る。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:29:36 GMT)
Single Image, Any Face: Generalisable 3D Face Generation [59.9] 我々は,制約のない単一画像入力を伴う3次元顔を生成する新しいモデルGen3D-Faceを提案する。
私たちの知る限りでは、これは1枚の画像からフォトリアリスティックな3D顔アバターを作るための最初の試みであり、ベンチマークである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:56:37 GMT)
Uncertainty Representations in State-Space Layers for Deep Reinforcement Learning under Partial Observability [59.8] 線形状態空間モデルにおいて閉形式ガウス推論を行う独立なカルマンフィルタ層を提案する。
効率的な線形リカレント層と同様に、Kalmanフィルタ層は並列スキャンを使用してシーケンシャルデータを処理している。
実験により、不確実性推論が意思決定の鍵となる問題においてカルマンフィルタ層が優れており、他のステートフルモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:22:29 GMT)
Source Attribution for Large Language Model-Generated Data [57.9] 合成テキストの生成に寄与したデータプロバイダを特定することで、ソース属性を実行できることが不可欠である。
我々はこの問題を透かしによって取り組めることを示した。
本稿では,アルゴリズム設計により,これらの重要な特性を満足する情報源属性フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:40:20 GMT)
Simple Image Signal Processing using Global Context Guidance [56.4] ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:53:48 GMT)
Efficient Motion Prediction: A Lightweight & Accurate Trajectory Prediction Model With Fast Training and Inference Speed [56.3] 我々は,1つのGPU上で数時間のトレーニングをしながら,競争力の高いベンチマーク結果を実現する,新しい効率的な動き予測モデルを提案する。
その低推論レイテンシは、特に限られたコンピューティングリソースを持つ自律アプリケーションへのデプロイに適している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:00:27 GMT)
Scaling Behavior for Large Language Models regarding Numeral Systems: An Example using Pythia [55.2] 本研究では, 変圧器を用いた大規模言語モデルを用いて, 異なる数値システムのスケーリング挙動について検討する。
ベース10ドルシステムは、トレーニングデータスケール全体で、ベース102ドルまたは103ドルよりも一貫してデータ効率が高い。
私たちは、トークンレベルの識別とトークンレベルの操作に苦労する、ベース100ドルとベース1,000ドルのシステムを特定します。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:08:31 GMT)
Non-asymptotic Convergence of Training Transformers for Next-token
Prediction [55.0] トランスフォーマーは、シーケンシャルなデータを扱う優れた能力のために、現代の機械学習において驚くべき成功を収めています。
本稿では, 単層変圧器のトレーニング力学の微細な非漸近解析を行う。
トレーニングされたトランスフォーマーは,データセットシフトによる非トーケン予測能力を示すことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:22:06 GMT)
Tell Me What You Don't Know: Enhancing Refusal Capabilities of Role-Playing Agents via Representation Space Analysis and Editing [54.1] 我々は,文脈知識の競合要求,パラメトリック知識の競合要求,非競合要求を含む評価ベンチマークを開発する。
ほとんどのRPAは、異なる競合要求に対して、大幅なパフォーマンスギャップを動作します。
本稿では、競合する要求を拒否領域に都合よくシフトさせる軽量な表現編集手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:18:12 GMT)
Prompt Sliders for Fine-Grained Control, Editing and Erasing of Concepts in Diffusion Models [53.4] 概念スライダは、学習概念(属性/オブジェクト)によるきめ細かい画像制御と編集方法を導入した
このアプローチは、学習概念に使用されるローランドアダプタ(LoRA)のロードとアンロードにより、パラメータを追加し、推論時間を増加させる。
そこで本研究では,テキストエンコーダを共有するモデル間で一般化可能な,テキスト埋め込みによる概念学習のための簡単なテキストインバージョン手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 01:02:30 GMT)
Search for Efficient Large Language Models [53.0] 大規模言語モデル(LLMs)は、人工知能研究の領域で長い間停滞してきた。
軽量プルーニング、量子化、蒸留がLLMの圧縮に取り入れられ、メモリの削減と推論の加速を狙った。
ほとんどのモデル圧縮技術は、最適アーキテクチャの探索を見越して重量最適化に重点を置いている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:32:12 GMT)
Towards General Text-guided Image Synthesis for Customized Multimodal Brain MRI Generation [51.3] マルチモーダル脳磁気共鳴(MR)イメージングは神経科学や神経学において不可欠である。
現在のMR画像合成アプローチは、通常、特定のタスクのための独立したデータセットで訓練される。
テキスト誘導ユニバーサルMR画像合成モデルであるTUMSynについて述べる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:14:47 GMT)
Face Forgery Detection with Elaborate Backbone [50.9] Face Forgery Detectionは、デジタル顔が本物か偽物かを決定することを目的としている。
以前のFFDモデルは、偽造の手がかりを表現および抽出するために既存のバックボーンを直接使用していた。
本稿では,実顔データセットを用いた自己教師型学習でVTネットワークを活用することで,バックボーンの事前トレーニングを提案する。
次に、多様な偽の手がかりを抽出するバックボーンの能力を強化するために、競争力のあるバックボーンの微調整フレームワークを構築します。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:57:16 GMT)
SynChart: Synthesizing Charts from Language Models [50.7] 本研究は,LLMをデータ生成に単独で活用し,チャート理解に焦点をあてた競合するマルチモダリティモデルを開発する可能性を探る。
約400万の多彩なチャートイメージと7500万以上の高密度アノテーションを含む大規模チャートデータセットであるSynChartを構築した。
我々は,このデータセットを用いて4.2Bのグラフエキスパートモデルを訓練し,GPT-4Vを超え,ChartQAタスクでほぼGPT-4Oの性能を達成した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:18:12 GMT)
COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.2] COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:59:08 GMT)
COHERENT: Collaboration of Heterogeneous Multi-Robot System with Large Language Models [49.2] COHERENTは、異種マルチロボットシステムの協調のための新しいLCMベースのタスク計画フレームワークである。
提案-実行-フィードバック-調整機構は,個々のロボットに対して動作を分解・割り当てするように設計されている。
実験の結果,我々の研究は,成功率と実行効率の面で,従来の手法をはるかに上回っていることが明らかとなった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:59:08 GMT)
Disco4D: Disentangled 4D Human Generation and Animation from a Single Image [49.2] textbfD4Dは、単一の画像から4Dの人間生成とアニメーションのための新しいフレームワークである。
服を人体から遠ざける(SMPL-Xモデル)
鮮明なダイナミックスを備えた4Dアニメーションをサポートする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:46:06 GMT)
Differential Privacy Regularization: Protecting Training Data Through Loss Function Regularization [49.2] ニューラルネットワークに基づく機械学習モデルのトレーニングには、機密情報を含む大きなデータセットが必要である。
差分的にプライベートなSGD [DP-SGD] は、新しいモデルをトレーニングするために標準勾配降下アルゴリズム(SGD)を変更する必要がある。
より効率的な方法で同じ目標を達成するための新しい正規化戦略が提案されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:59:32 GMT)
Navigating the Nuances: A Fine-grained Evaluation of Vision-Language Navigation [45.4] 本研究では,視覚言語ナビゲーション(VLN)タスクのための新しい評価フレームワークを提案する。
様々な命令カテゴリの現在のモデルをよりきめ細かいレベルで診断することを目的としている。
フレームワークはタスクの文脈自由文法(CFG)を中心に構成されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:49:39 GMT)
Solar Active Regions Emergence Prediction Using Long Short-Term Memory
Networks [45.0] 太陽表面における活動領域(AR)の形成を予測するために,Long Short-Term Memory(LSTM)モデルを開発した。
音響パワーと磁束の時系列データセットを使用して、LSTMモデルを12時間前に連続強度を予測するために訓練する。
これらの機械学習(ML)モデルは、次の磁束の出現と連続体強度の減少に伴う音響パワー密度の変動を捉えることができる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:09:46 GMT)
From angular coefficients to quantum observables: a phenomenological appraisal in di-boson systems [45.0] マルチボソン過程のスピン構造にアクセスすることへの関心が高まっていることから, 双ボソン系の偏極係数とスピン相関係数について検討した。
そこで本研究では,QCDとエレクトロオーク型の高次補正,オフシェルモデリング,およびフィデューシャルセレクションやニュートリノ再構成などの現実的な効果が避けられないことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:30:54 GMT)
MambaJSCC: Adaptive Deep Joint Source-Channel Coding with Generalized State Space Model [44.0] MambaJSCCは、計算とパラメータのオーバーヘッドを低くして最先端のパフォーマンスを達成する。
我々は,チャネル状態情報(CSI)をGSSMの初期状態に注入し,そのネイティブ応答を利用するCSI-ReST法を設計する。
実験の結果,MambaJSCCは既存のJ SCC法より優れるだけでなく,パラメータサイズ,計算オーバーヘッド,推論遅延を大幅に低減することがわかった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:37:51 GMT)
A Roadmap for Embodied and Social Grounding in LLMs [43.7] 大規模言語モデルとロボットシステムの融合は、ロボット分野における変革的パラダイムへと繋がった。
LLMの知識を経験的世界に根ざすことは、ロボット工学におけるLLMの効率を活かす重要な道であると考えられている。
人間からインスピレーションを得て、この研究はエージェントが世界を把握し、経験するために必要な3つの要素に注意を向ける。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:09:23 GMT)
Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing [42.7] 本稿では,誘導機構による拡散サンプリングプロセスの修正に基づく新しい手法を提案する。
本研究では,入力画像の全体構造を保存するための自己誘導手法について検討する。
本稿では,人間の評価と定量的分析を通じて,提案手法が望ましい編集を可能にすることを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:44:21 GMT)
The Effect of Perceptual Metrics on Music Representation Learning for Genre Classification [42.1] 損失関数として知覚メトリクスで訓練されたモデルが知覚的に意味のある特徴を捉えることができることを示す。
知覚的損失で訓練されたオートエンコーダから抽出した特徴を用いることで,音楽理解タスクのパフォーマンスが向上することが実証された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:29:21 GMT)
StreetSurfaceVis: a dataset of crowdsourced street-level imagery annotated by road surface type and quality [41.9] ドイツから9,122枚のストリートレベルの画像からなる新しいデータセットであるStreetSurfaceVisを紹介した。
多様な画像ソース間で高い精度を維持する頑健なモデルを実現することを目的としている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:24:35 GMT)
CVT-Occ: Cost Volume Temporal Fusion for 3D Occupancy Prediction [41.7] 視覚に基づく3次元占有予測は、深度推定における単眼視の固有の限界によって著しく困難である。
本稿では,3次元占有予測の精度を向上させるために,時間とともにボクセルの幾何学的対応を通して時間的融合を導入する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:34:27 GMT)
CVT-Occ: Cost Volume Temporal Fusion for 3D Occupancy Prediction [41.7] 視覚に基づく3次元占有予測は、深度推定における単眼視の固有の限界によって著しく困難である。
本稿では,3次元占有予測の精度を向上させるために,時間とともにボクセルの幾何学的対応を通して時間的融合を導入する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:34:27 GMT)
Towards Underwater Camouflaged Object Tracking: An Experimental Evaluation of SAM and SAM 2 [41.6] 本研究は,UW-COTという大規模水中カモフラージュ物体追跡データセットを提案する。
本稿では,複数の高度な視覚オブジェクト追跡手法の実験的評価と,画像と映像のセグメンテーションの最新の進歩について述べる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:10:03 GMT)
SEN12-WATER: A New Dataset for Hydrological Applications and its Benchmarking [41.0] 気候と干ばつの増加は、世界中の水資源管理に重大な課題をもたらしている。
本稿では,干ばつ関連分析のためのエンドツーエンドディープラーニングフレームワークを用いたベンチマークとともに,新しいデータセットであるSEN12-WATERを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:50:59 GMT)
Data-Centric AI Governance: Addressing the Limitations of Model-Focused Policies [40.9] 強力なAI能力に関する現在の規制は、"境界"または"フロンティア"モデルに絞られている。
これらの用語は曖昧で一貫性のない定義であり、ガバナンス活動の不安定な基盤につながります。
本稿では,モデルがもたらすリスクを評価する上で,データセットのサイズや内容が重要な要因であることを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:59:01 GMT)
Turn Every Application into an Agent: Towards Efficient Human-Agent-Computer Interaction with API-First LLM-Based Agents [40.9] AXISは、ユーザインタフェースアクションよりもアプリケーションプログラミングインターフェース(API)を通してアクションを優先順位付けする、LLMベースの新しいエージェントフレームワークである。
Office Wordでの実験では、AXISはタスク完了時間を65%-70%削減し、認知負荷を38%-53%削減し、精度は97%-98%と人間と比較した。
また、すべてのアプリケーションをエージェントに変え、エージェント中心のオペレーティングシステム(Agent OS)への道を開く可能性についても検討している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:58:08 GMT)
The Effect of Lossy Compression on 3D Medical Images Segmentation with Deep Learning [40.0] 我々は、20倍の圧縮損失がディープニューラルネットワーク(DNN)によるセグメンテーション品質に悪影響を及ぼさないことを示した。
さらに、圧縮データに基づいて訓練されたDNNモデルを用いて、圧縮されていないデータを予測する能力を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:31:37 GMT)
TroL: Traversal of Layers for Large Language and Vision Models [39.3] 大言語とビジョンモデル(LLVM)は、大言語モデル(LLM)の一般化力によって駆動されている。
GPT-4VのようなクローズドソースLLVMと互換性のある既存のオープンソースLLVMは、大きすぎると考えられていることが多い。
1.8B, 3.8B, 7B LLMモデルサイズ, Traversal of Layers (TroL) を持つLLVMファミリーを新たに提案する。
我々は、TroLが単純な層トラバースアプローチを採用しているが、より大きなモデルサイズを持つオープンソースのLLVMよりも効率的に性能を向上することを示した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:17:21 GMT)
Enhancing Feature Selection and Interpretability in AI Regression Tasks Through Feature Attribution [38.5] 本研究では、回帰問題に対する入力データの非形式的特徴をフィルタリングする特徴属性法の可能性について検討する。
我々は、初期データ空間から最適な変数セットを選択するために、統合グラディエントとk平均クラスタリングを組み合わせた機能選択パイプラインを導入する。
提案手法の有効性を検証するため, ターボ機械の開発過程における羽根振動解析を実世界の産業問題に適用した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:50:51 GMT)
World Model-based Perception for Visual Legged Locomotion [37.2] 我々は環境のワールドモデルを構築し、世界モデルに基づいたポリシーを学習する。
World Model-based Perceptionは、トラバーサビリティとロバストネスにおいて最先端のベースラインよりも優れています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:47:31 GMT)
Quantum Advantage in Distributed Sensing with Noisy Quantum Networks [37.2] 分散センシングにおける量子優位性はノイズの多い量子ネットワークで実現できることを示す。
この量子的優位性には絡み合いが必要であるが、真の多部絡みは一般に不要である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:55:07 GMT)
Emotional Dimension Control in Language Model-Based Text-to-Speech: Spanning a Broad Spectrum of Human Emotions [37.1] 現在の感情的テキスト音声システムは、人間の感情の幅広い範囲を模倣する際の課題に直面している。
本稿では,喜び,覚醒,支配の制御を容易にするTTSフレームワークを提案する。
TTSトレーニング中に感情的な音声データを必要とせずに、感情的なスタイルの多様性を合成することができる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:16:16 GMT)
EventHDR: from Event to High-Speed HDR Videos and Beyond [36.9] 本稿では,イベントシーケンスから高速HDR映像を再構成する畳み込みニューラルネットワークを提案する。
我々はまた、ペア化された高速HDRビデオとイベントストリームの実際のデータセットを収集する新しい光学システムを開発した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:32:07 GMT)
Harnessing Diversity for Important Data Selection in Pretraining Large Language Models [36.9] textttQuadは、データの影響を利用して、最先端の事前トレーニング結果を達成することによって、品質と多様性の両方を考慮する。
多様性のために、textttQuadはデータセットを、各クラスタ内の同様のデータインスタンスと、異なるクラスタにわたる多様なインスタンスにクラスタする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:49:29 GMT)
Space-Based Quantum Internet: Entanglement Distribution in Time-Varying LEO Constellations [36.8] 本稿では、LEO衛星ネットワークの動的特性を活用して、絡み合い分布効率を向上させる新しいフレームワークを提案する。
提案手法は,従来の手法と比較して,絡み合いの低減とスループットの向上に優れた性能を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:33:08 GMT)
A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms [34.8] 大規模言語モデル (LLM) は自然言語処理において顕著な進歩を遂げている。
しかし、高価なメモリと計算の要求は、その実践的な展開に重大な課題をもたらしている。
低ビット量子化は、モデルパラメータのビット幅を減らすことでこれらの課題を緩和するための重要なアプローチとして現れている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:38:02 GMT)
Keeping Up with the Language Models: Systematic Benchmark Extension for Bias Auditing [33.3] 我々は, LM生成語彙変動, 逆フィルタリング, 人間の検証を組み合わせることで, 既存のNLIのバイアスベンチマークを拡張した。
BBNLI-nextは最先端のNLIモデルの精度を95.3%から57.5%に下げることを示した。
バイアスとモデル脆性の両方を考慮したバイアス対策を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:06:31 GMT)
Symbolic Music Generation with Non-Differentiable Rule Guided Diffusion [33.0] 音楽規則は、音の密度やコード進行などの音の特徴に象徴的な形で表されることが多い。
本稿では,ルール関数の前方評価のみを必要とする新しいガイダンス手法である制御誘導(SCG)を提案する。
SCGは、非微分不可能なルールに対するトレーニング不要のガイダンスを初めて達成する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:12:27 GMT)
Results of the Big ANN: NeurIPS'23 competition [32.1] 2023年、NeurIPS 2023で開かれたBig ANN Challengeは、データ構造と検索アルゴリズムのインデックス化における最先端の進歩に焦点を当てた。
本稿では,コンペティショントラック,データセット,評価指標,そして,トップパフォーマンスの応募の革新的なアプローチについて要約する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:24:56 GMT)
CJEval: A Benchmark for Assessing Large Language Models Using Chinese Junior High School Exam Data [31.3] CJEvalは中国の中学校のエクサム評価に基づくベンチマークである。
26,136個のサンプルから成っている。
このベンチマークを用いて,LLMの潜在的な応用性を評価し,その性能を総合的に分析した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:35:35 GMT)
Spotlight Text Detector: Spotlight on Candidate Regions Like a Camera [31.2] シーンテキストに有効なスポットライトテキスト検出器(STD)を提案する。
スポットライト校正モジュール(SCM)と多変量情報抽出モジュール(MIEM)で構成される。
我々のSTDは、様々なデータセットの既存の最先端手法よりも優れている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:19:09 GMT)
Focus Entirety and Perceive Environment for Arbitrary-Shaped Text Detection [31.2] セグメンテーションベースのアプローチは、フレキシブルピクセルレベルの予測のため、顕著な競合候補として現れている。
そこで本研究では,フォーカス全体モジュールと知覚環境モジュールからなる多情報レベルの任意形テキスト検出器を提案する。
後者は、領域レベルの情報を抽出し、画素近傍の正のサンプルの分布にフォーカスするようモデルに促す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:24:37 GMT)
Mitigating the Bias of Large Language Model Evaluation [30.7] LLM-as-a-Judgeのバイアスに関する系統的研究を提案する。
クローズドソース・ジャッジモデルでは、表面品質の重要性を緩和するためにキャリブレーションを適用する。
オープンソース・ジャッジ・モデルでは, 対照的な学習によってバイアスを軽減し, 学習から逸脱するが, 表面品質が向上する負のサンプルをキュレートする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:52:44 GMT)
Multi-objective Evolution of Heuristic Using Large Language Model [29.3] ヒューリスティックスは、様々な探索と最適化の問題に取り組むために一般的に用いられる。
最近の研究は、その強力な言語と符号化能力を活用して、大規模言語モデル(LLM)を自動検索に取り入れている。
本稿では,多目的最適化問題として探索をモデル化し,最適性能以外の実践的基準を導入することを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:32:41 GMT)
TaskMet: Task-Driven Metric Learning for Model Learning [29.0] ディープラーニングモデルは、トレーニング手順が認識していない可能性のある下流タスクにデプロイされることが多い。
本稿では,モデルのパラメータよりも1段階深いタスク損失信号を用いて,モデルがトレーニングした損失関数のパラメータを学習する。
このアプローチは、最適な予測モデル自体を変更するのではなく、下流のタスクにとって重要な情報を強調するためにモデル学習を変更する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:03:12 GMT)
Detecting Adversarial Data via Perturbation Forgery [28.6] 逆検出は、自然データと逆データの間の分布とノイズパターンの相違に基づいて、データフローから逆データを特定し、フィルタリングすることを目的としている。
不均衡および異方性雑音パターンを回避した生成モデルに基づく新しい攻撃
本研究では,ノイズ分布の摂動,スパースマスク生成,擬似対向データ生成を含む摂動フォージェリを提案し,未知の勾配に基づく,生成モデルに基づく,物理的対向攻撃を検出することができる対向検出器を訓練する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:09:58 GMT)
The Differential and Boomerang Properties of a Class of Binomials [28.5] F_2,u(x)=x2big (1+ueta(x)big)$ over $mathbbF_q$。
我々は citebudaghyan 2024arithmetization において、$F_2,u$ が APN 函数であるような無限に多くの$q$ と $u$ が存在するという予想を否定する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:10:48 GMT)
The Differential and Boomerang Properties of a Class of Binomials [28.5] F_2,u(x)=x2big (1+ueta(x)big)$ over $mathbbF_pn$。
任意の$uinmathbbF_pn*$に対して$F_2,u$の均一性を決定する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:10:48 GMT)
Pruning Multilingual Large Language Models for Multilingual Inference [28.4] 本研究では,非英語言語におけるMLLMのゼロショット性能を向上させる方法について検討する。
まず、翻訳を行う際のMLLMの挙動を分析し、翻訳過程において重要な役割を果たす大きな特徴があることを明らかにする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:15:50 GMT)
Post-hoc Reward Calibration: A Case Study on Length Bias [28.3] リワードモデル(RM)は、トレーニングデータに突発的な相関を利用してバイアスを発生させることができる。
これらのバイアスは、誤った出力ランキング、準最適モデル評価、望ましくない振る舞いの増幅につながる可能性がある。
本稿では、追加データやトレーニングを使わずにバイアスを修正するという課題に対処する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:30:42 GMT)
SynTQA: Synergistic Table-based Question Answering via Mixture of Text-to-SQL and E2E TQA [25.1] テキスト・ツー・パースとエンドツーエンド質問応答(E2E TQA)は、表に基づく質問回答タスクの2つの主要なアプローチである。
複数のベンチマークで成功したが、まだ比較されておらず、相乗効果は未解明のままである。
ベンチマークデータセットの最先端モデルを評価することによって、さまざまな長所と短所を識別する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:18:45 GMT)
DemoRank: Selecting Effective Demonstrations for Large Language Models in Ranking Task [24.8] 本稿では,文節ランキングタスクにおいて,コンテキスト内デモを適切に選択する方法について検討する。
ランキングタスクのためのデモ選択フレームワークであるDemoRankを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:36:49 GMT)
Holistic Automated Red Teaming for Large Language Models through Top-Down Test Case Generation and Multi-turn Interaction [24.5] 本研究では, 対角的, きめ細かなリスク分類に基づいて, テストケースの多様性を拡大する自動紅茶造法を提案する。
提案手法は,新しい微調整戦略と強化学習技術を活用し,人的手法で多ターン探索を容易にする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:44:48 GMT)
ManiFoundation Model for General-Purpose Robotic Manipulation of Contact Synthesis with Arbitrary Objects and Robots [24.0] 汎用ロボットが幅広い操作タスクをこなせるようなモデルを開発する必要がある。
本研究は,汎用ロボット操作の基礎モデルを構築するための包括的枠組みを導入する。
私たちのモデルは、平均的な成功率を約90%達成します。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:21:06 GMT)
Disentangling Questions from Query Generation for Task-Adaptive Retrieval [22.9] 本研究では,BeIRベンチマークで表現された広範囲な検索意図に適応するクエリジェネレータEGGを提案する。
提案手法は,従来よりも47倍小さいクエリジェネレータを用いて,探索対象の少ない4つのタスクにおいて,ベースラインと既存モデルの性能を向上する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:53:27 GMT)
Enabling Auditory Large Language Models for Automatic Speech Quality Evaluation [22.7] 音声品質評価は通常、平均評価スコア(MOS)や話者類似度(SIM)など、複数の側面から音声を評価する必要がある。
本稿では,最近導入された聴覚大言語モデル(LLM)を用いた音声品質自動評価手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:44:44 GMT)
Blox-Net: Generative Design-for-Robot-Assembly Using VLM Supervision, Physics Simulation, and a Robot with Reset [22.7] GDfRA(Generative Design-for-Robot-Assembly)という新しい問題を紹介します。
このタスクは、自然言語のプロンプト(例えば'giraffe')と3Dプリントブロックのような利用可能な物理コンポーネントの画像に基づいてアセンブリを生成する。
本稿では、生成視覚言語モデルとコンピュータビジョン、摂動解析、運動計画、物理ロボット実験の確立した手法を組み合わせたGDfRAシステムであるBlox-Netを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:42:20 GMT)
Zero-resource Hallucination Detection for Text Generation via Graph-based Contextual Knowledge Triples Modeling [22.1] オープンな回答を持つテキスト生成のための幻覚検出はより困難である。
外部資源のない長いテキストにおける幻覚の検出に関する最近の研究は、一貫性の比較を行っている。
テキスト生成のためのグラフベースの文脈認識(GCA)幻覚検出を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 01:55:29 GMT)
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models [22.0] マルチモーダル統合によるジェスチャーの多様性とリズムを向上させるMambaTalkを紹介する。
我々の手法は最先端のモデルの性能と一致するか超えている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:33:37 GMT)
Semi-Supervised Cognitive State Classification from Speech with Multi-View Pseudo-Labeling [21.8] ラベル付きデータの欠如は、音声分類タスクにおいて共通の課題である。
そこで我々は,新しい多視点擬似ラベル手法を導入したセミスーパーバイザードラーニング(SSL)フレームワークを提案する。
感情認識と認知症検出タスクにおけるSSLフレームワークの評価を行った。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:51:19 GMT)
Is This a Bad Table? A Closer Look at the Evaluation of Table Generation from Text [21.7] テーブルの品質評価のための既存の尺度は、テーブルの全体的なセマンティクスをキャプチャすることができない。
テーブルのセマンティクスをキャプチャするテーブル評価戦略であるTabEvalを提案する。
提案手法を検証するために,1250種類のウィキペディアテーブルのテキスト記述からなるデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:27:50 GMT)
Demo: SGCode: A Flexible Prompt-Optimizing System for Secure Generation of Code [21.4] 本稿では,大規模言語モデル(LLM)でセキュアなコードを生成するフレキシブルなプロンプト最適化システムであるSGCodeを紹介する。
これは、LLMとセキュリティツールを軽量な生成逆グラフニューラルネットワークと組み合わせて、生成されたコードのセキュリティ脆弱性を検出し、修正することで、プロンプトを最適化するアプローチです。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:17:27 GMT)
RoleBreak: Character Hallucination as a Jailbreak Attack in Role-Playing Systems [20.8] 大規模言語モデル(LLM)を利用したロールプレイングシステムは,感情コミュニケーションアプリケーションにおいてますます影響力を増している。
これらのシステムは、事前に定義されたキャラクターロールから逸脱し、意図されたペルソナと矛盾しない応答を生成するという、キャラクター幻覚の影響を受けやすい。
本稿では,RoleBreakフレームワークを導入し,攻撃的視点からキャラクターの幻覚を初めて体系的に分析する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:23:46 GMT)
Speech Recognition Rescoring with Large Speech-Text Foundation Models [20.1] 大規模言語モデル(LLM)は、大量のテキストデータを活用することで、人間の言語を理解する能力を示した。
自動音声認識(ASR)システムは、しばしば利用可能な転写音声データによって制限される。
最近の多モーダルな言語モデルでは、強い音声言語理解が示されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:17:23 GMT)
Projective Proximal Gradient Descent for A Class of Nonconvex Nonsmooth Optimization Problems: Fast Convergence Without Kurdyka-Lojasiewicz (KL) Property [20.0] 非滑らかな最適化問題は、学習にとって重要かつ困難である。
本稿では,PSGDの高速収束を示す新しい解析法について述べる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:41:55 GMT)
Distribution Backtracking Builds A Faster Convergence Trajectory for Diffusion Distillation [19.9] 本研究では,拡散モデルのサンプリング速度を高速化する分散バックトラック蒸留(DisBack)を提案する。
DisBackは既存の蒸留法よりも高速で収束性が高く、ImageNet 64x64データセットのFIDスコアは1.38である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:05:05 GMT)
Improving the Stability and Efficiency of Diffusion Models for Content Consistent Super-Resolution [18.7] 画像超解像 (SR) 結果の視覚的品質を高めるために, 予め訓練した潜伏拡散モデル (DM) の生成先行が大きな可能性を示唆している。
本稿では、生成SR過程を2段階に分割し、DMを画像構造再構築に、GANを細かな細部改善に使用することを提案する。
トレーニングを済ませると、提案手法、すなわちコンテンツ一貫性超解像(CCSR)は、推論段階における異なる拡散ステップの柔軟な利用を可能にする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:13:27 GMT)
The Vizier Gaussian Process Bandit Algorithm [18.7] Google Vizierは、数百万の最適化を実行し、Googleの多くのリサーチとプロダクションシステムを加速した。
本稿では,Open Source Vizierが提供するデフォルトアルゴリズムの実装の詳細と設計選択について論じる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:14:33 GMT)
MegaFake: A Theory-Driven Dataset of Fake News Generated by Large Language Models [18.7] 我々は、社会心理学の観点からフェイクニュースの作成を分析する。
我々は LLM に基づく理論フレームワーク LLM-Fake Theory を開発した。
我々はMegaFakeデータセットを評価するために包括的な分析を行う。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:21:26 GMT)
Learning Utilities from Demonstrations in Markov Decision Processes [18.2] 本稿では,実用機能を通じてエージェントのリスク態度を明確に表現する,マルコフ決定過程(MDP)の行動モデルを提案する。
そこで我々は,MDPにおける実演から実用機能を通じて符号化された,観察対象者のリスク態度を推定するタスクとして,ユーティリティ学習問題を定義した。
我々は, UL を有限データ型で証明可能な2つのアルゴリズムを考案し, サンプルの複雑さを解析する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:01:15 GMT)
Pose-Guided Fine-Grained Sign Language Video Generation [18.2] 本稿では,細粒度かつ動きに一貫性のある手話ビデオを生成するための新しい Pose-Guided Motion Model (PGMM) を提案する。
まず,光学式フローワープによる特徴量の変形を解消する新しい粗い運動モジュール(CMM)を提案する。
第2に、RGBのモーダル融合とポーズ特徴を導く新しいPose Fusion Module (PFM)を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:54:53 GMT)
GraphLoRA: Structure-Aware Contrastive Low-Rank Adaptation for Cross-Graph Transfer Learning [17.9] グラフニューラルネットワーク(GNN)は、様々なグラフ解析タスクを扱うのに顕著な習熟度を示した。
汎用性にもかかわらず、GNNはトランスファービリティにおいて重大な課題に直面し、現実のアプリケーションでの利用を制限している。
グラフ領域によく訓練されたGNNを転送するための有効かつパラメータ効率のよいGraphLoRAを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:57:42 GMT)
Erase then Rectify: A Training-Free Parameter Editing Approach for Cost-Effective Graph Unlearning [17.9] グラフアンラーニングは、訓練されたグラフニューラルネットワーク(GNN)からノード、エッジ、属性の影響を排除することを目的としている。
既存のグラフアンラーニング技術は、しばしば残りのデータに対する追加のトレーニングを必要とし、かなりの計算コストをもたらす。
本稿では,2段階の学習自由アプローチであるETR(Erase then Rectify)を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:20:59 GMT)
Zeroth-Order Policy Gradient for Reinforcement Learning from Human
Feedback without Reward Inference [17.8] 本稿では,報酬推論を伴わない2つのRLHFアルゴリズムを提案する。
鍵となる考え方は、人間の嗜好と異なる局所値関数を推定し、ゼロ階勾配近似器でポリシー勾配を近似することである。
以上の結果から,報酬推論なしで一般RLHF問題の解法が確立できることが示唆された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:20:11 GMT)
Towards User-Focused Research in Training Data Attribution for Human-Centered Explainable AI [17.5] XAIはAIを人間にとって理解しやすく有用なものにすることを目標としているが、形式主義や解法主義に頼りすぎていると批判されている。
我々は,XAI研究コミュニティがユーザ関連性を確保するために,トップダウンでユーザ中心の視点を採用する方法を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:40:26 GMT)
CryptoTrain: Fast Secure Training on Encrypted Datase [17.2] 線形および非線形操作を扱うために,同型暗号化とOblivious Transfer(OT)を併用したハイブリッド暗号プロトコルを開発した。
CCMul-Precomputeと相関した畳み込みをCryptoTrain-Bに統合することにより、迅速かつ効率的なセキュアなトレーニングフレームワークを実現する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:06:14 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Handy Appetizer [17.0] 本では、ビッグデータ分析と管理の進歩を促進する上で、人工知能(AI)、機械学習(ML)、ディープラーニング(DL)の役割について論じている。
ニューラルネットワークと、畳み込みニューラルネットワーク(CNN)のような技術がどのように機能するかを理解するのに役立つ、直感的な視覚化と実践的なケーススタディを提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:31:45 GMT)
Benchmarking Cognitive Biases in Large Language Models as Evaluators [16.8] 大規模言語モデル(LLM)は、簡単なプロンプトと文脈内学習を備えた自動評価器として有効であることが示されている。
我々は,LLMの認知バイアスベンチマークを導入したランキングアウトプットの品質を評価対象として評価する。
LLMはテキスト品質評価器であり、バイアスベンチマークに強い指標を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:57:20 GMT)
Emotion-Driven Melody Harmonization via Melodic Variation and Functional Representation [16.8] 感情駆動のメロディは、望ましい感情を伝えるために、1つのメロディのための多様なハーモニーを生成することを目的としている。
以前の研究では、異なるコードで同じメロディを調和させることで、リードシートの知覚的価値を変えることが困難であった。
本稿では,シンボリック音楽の新たな機能表現を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:23:17 GMT)
Multi-UAV Pursuit-Evasion with Online Planning in Unknown Environments by Deep Reinforcement Learning [16.8] マルチUAV追跡回避は、UAV群知能にとって重要な課題である。
本研究では,協調戦略学習における部分的可観測性に対処するために,回避者予測強化ネットワークを導入する。
我々は、2段階の報酬改善を通じて実現可能な政策を導出し、ゼロショット方式で実四重項にポリシーを展開する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:47:44 GMT)
Disk2Planet: A Robust and Automated Machine Learning Tool for Parameter
Inference in Disk-Planet Systems [16.7] 本研究では、プロトプラネタリーディスク構造からディスクプラネタリーシステムにおける鍵パラメータを推論する機械学習ツールであるDisk2Planetを紹介する。
我々のツールは完全自動化されており、Nvidia A100グラフィックス処理ユニットで1つのシステムで3分でパラメータを取得できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:01 GMT)
On the Evaluation of Large Language Models in Unit Test Generation [16.4] 単体テストは、ソフトウェアコンポーネントの正しさを検証するために、ソフトウェア開発において不可欠な活動である。
LLM(Large Language Models)の出現は、ユニットテスト生成を自動化するための新しい方向性を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:47:10 GMT)
Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification [16.0] Ctrl-GenAugは新規で汎用的な生成拡張フレームワークである。
高度に意味論的およびシーケンシャルな塩基配列合成を可能にし、誤って合成されたサンプルを抑圧する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:58:19 GMT)
Democratizing Signal Processing and Machine Learning: Math Learning Equity for Elementary and Middle School Students [16.0] 信号処理(SP)と機械学習(ML)は、優れた数学とコーディング知識に依存している。
多くの学生は小学生に算術の強力な基礎を築けない。
本稿では,SP教員と大学院生が,学外数学支援プログラムの開始と参加において,いかに重要な役割を果たすかを論じる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:28:12 GMT)
Generative Object Insertion in Gaussian Splatting with a Multi-View Diffusion Model [15.9] ガウス散乱で表される3次元コンテンツに物体を挿入する新しい手法を提案する。
提案手法では,事前学習した安定した映像拡散モデルに基づいて,MVInpainterと呼ばれる多視点拡散モデルを導入する。
MVInpainterの内部では、制御されたより予測可能なマルチビュー生成を可能にする制御ネットベースの条件付きインジェクションモジュールが組み込まれている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:52:50 GMT)
Counterfactual Token Generation in Large Language Models [15.9] 最先端の大規模言語モデルはステートレスであり、内部メモリや状態は保持しない。
我々は,Gumbel-Max構造因果モデルに基づくトークン生成の因果モデルを開発する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:30:24 GMT)
Demystifying Issues, Causes and Solutions in LLM Open-Source Projects [15.9] LLMオープンソースソフトウェアの開発と利用において,実践者が直面する問題を理解するための実証的研究を行った。
LLMの15のオープンソースプロジェクトから、クローズドな問題をすべて収集し、要件を満たす問題をラベル付けしました。
本研究の結果から,モデル課題は実践者が直面する最も一般的な問題であることが示唆された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:16:45 GMT)
APILOT: Navigating Large Language Models to Generate Secure Code by Sidestepping Outdated API Pitfalls [15.9] APILOTは、時代遅れのAPIのリアルタイム、即時更新可能なデータセットを維持している。
拡張ジェネレーションメソッドを使用して、セキュアでバージョン対応のコードを生成するLLMをナビゲートする。
古いコードレコメンデーションを平均89.42%削減し、パフォーマンス上のオーバーヘッドを制限できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:37:40 GMT)
Improving Clinician Performance in Classification of EEG Patterns on the Ictal-Interictal-Injury Continuum using Interpretable Machine Learning [15.5] 集中治療室(ICUs)では、重度の脳損傷を防ぐために、重度疾患のある患者は脳波(EEGs)で監視される。
ブラックボックスのディープラーニングモデルは信頼できない、トラブルシューティングが難しい、現実世界のアプリケーションでは説明責任が欠如している。
本稿では,有害脳波パターンの存在を予測する新しい解釈可能な深層学習モデルを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:35:55 GMT)
Transient Adversarial 3D Projection Attacks on Object Detection in Autonomous Driving [15.5] 本稿では,自律運転シナリオにおける物体検出を対象とする3Dプロジェクション攻撃を提案する。
本研究は, YOLOv3 と Mask R-CNN の物理環境における攻撃効果を示すものである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:27:11 GMT)
MSI-Agent: Incorporating Multi-Scale Insight into Embodied Agents for Superior Planning and Decision-Making [15.4] マルチスケールインサイトエージェント(MSI-Agent)は、計画と意思決定能力を改善するために設計されたエンボディエージェントである。
GPT3.5 による計画において MSI が他の洞察戦略より優れていることを示す。
MSIはドメインシフトシナリオに直面するとき、より堅牢性を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:21:51 GMT)
A Character-Centric Creative Story Generation via Imagination [15.3] 多様な詳細なストーリ要素を持つ創造的なストーリ生成は、大規模な言語モデルの長年の目標である。
我々はCCI(Character-centric Creative Story Generation via Imagination)と呼ばれる新しいストーリー生成フレームワークを紹介する。
CCIは創造的ストーリー生成のための2つの革新的なモジュールを特徴付けている。IG(Image-Guided Imagination)とMW(Multi-Writer model)である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:54:29 GMT)
Non-invertible duality defects in one, two, and three dimensions via gauging spatially modulated symmetry [15.3] 空間変調対称性を用いた非可逆双対性欠陥を持つコンクリート格子モデルを構築した。
我々の研究は、関連する対称性をゲージすることで、エキゾチックな双対性欠陥を構築するための統一的で体系的な分析フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:52:07 GMT)
MCI-GRU: Stock Prediction Model Based on Multi-Head Cross-Attention and Improved GRU [15.2] 本稿では,多頭部クロスアテンション機構と改良型GRUに基づくストック予測モデルMCI-GRUを提案する。
4つの主要株式市場での実験では、提案手法は複数の指標でSOTA技術を上回っている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:37:49 GMT)
Towards Trustworthy Reranking: A Simple yet Effective Abstention Mechanism [15.2] 実世界の制約に合わせた軽量な禁制機構を提案する。
ブラックボックスシナリオにおける禁忌戦略を評価するためのプロトコルを提案する。
実験複製と禁忌実装のためのオープンソースコードを提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:37:39 GMT)
Deep Generative Models through the Lens of the Manifold Hypothesis: A Survey and New Connections [15.2] 本研究では,低内在次元のデータモデリングにおいて,高周囲次元の確率の数値的不安定性は避けられないことを示す。
次に、オートエンコーダの学習表現上のDGMは、ワッサーシュタイン距離をほぼ最小化するものとして解釈できることを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:00 GMT)
BitQ: Tailoring Block Floating Point Precision for Improved DNN Efficiency on Resource-Constrained Devices [14.5] ブロック浮動小数点(BFP)量子化は、メモリと計算負荷を減らすための代表的な圧縮手法の1つである。
組込みプラットフォーム上でのDNN推論の最良のBFP実装のためのBFPベースのビット幅対応解析モデルフレームワーク(BitQ')を開発した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:03:49 GMT)
Robust Online Classification: From Estimation to Denoising [14.5] 一般仮説クラスを用いて,特徴のオンライン分類をラベルに分類する。
観測されたノイズラベルとノイズレス特徴を用いて予測を行う。
性能は、真のラベルと比較する場合、ミニマックスリスクによって測定される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:33:54 GMT)
On Extending Direct Preference Optimization to Accommodate Ties [14.4] DPO のBradley-Terry モデルを2つのよく知られたモデリング拡張に置き換える。
ニューラルネットワーク翻訳と要約の実験では、タスクパフォーマンスの劣化を伴わずに、これらのDPO変種のためのデータセットに明示的にラベル付けされたネクタイを追加できることが示されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:38:15 GMT)
The gap persistence theorem for quantum multiparameter estimation [14.3] 本稿では,Holevo Cram'er-Rao 境界 (HCRB) をいくつかの物理的動機付けられた問題に対して飽和させることは不可能であることを示す。
さらに、SLDCRBがプローブ状態の1つのコピーで到達できない場合、プローブ状態の有限個のコピーの集合的な測定では到達できないことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:18:28 GMT)
Wildlife Product Trading in Online Social Networks: A Case Study on Ivory-Related Product Sales Promotion Posts [14.3] 本稿では,オンラインソーシャルネットワークにおける野生生物製品販売促進行動の検出と認識の課題について論じる。
我々は、疑わしい野生生物がポストやアカウントを売っているのを自動的に識別するフレームワークを構築している。
我々は、これらの行動の性質に関する詳細な知見を提供し、違法な野生生物製品取引の理解と対策に貴重な情報を提供しています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:57:43 GMT)
Asynchronous Fractional Multi-Agent Deep Reinforcement Learning for Age-Minimal Mobile Edge Computing [14.3] 計算集約的な更新のタイムラインを調査し、AoIを最小化するためにタスク更新とオフロードポリシーを共同で最適化する。
具体的には、エッジ負荷のダイナミクスを考慮し、期待時間平均AoIを最小化するためにタスクスケジューリング問題を定式化する。
提案アルゴリズムは,実験における最良基準アルゴリズムと比較して平均AoIを最大52.6%削減する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:33:32 GMT)
Large Language Model Predicts Above Normal All India Summer Monsoon Rainfall in 2024 [14.2] 本研究は,最新のLCMモデルであるPatchTSTの適応と微調整に着目し,AISMRを3ヶ月のリードタイムで正確に予測する。
2024年6月から9月にかけての降水量は921.6mmと推定される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:32:18 GMT)
ZoDi: Zero-Shot Domain Adaptation with Diffusion-Based Image Transfer [14.0] 本稿では,ZoDiと呼ばれる拡散モデルに基づくゼロショット領域適応手法を提案する。
まず,原画像の領域を対象領域に転送することで,対象画像の合成にオフ・ザ・シェルフ拡散モデルを用いる。
次に、元の表現でソース画像と合成画像の両方を用いてモデルを訓練し、ドメイン・ロバスト表現を学習する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:08:46 GMT)
How to Connect Speech Foundation Models and Large Language Models? What Matters and What Does Not [13.9] 音声テキスト(S2T)タスクでは、新興ソリューションは、音声基礎モデル(SFM)のエンコーダの出力をアダプタモジュールを介して埋め込み空間に投影する。
5つのアダプタモジュール, 2つのLLM(ralMistとLlama), 2つのSFM(WhisperとSeamlessM4T)の組み合わせを2つのS2Tタスク、すなわち自動音声認識と音声翻訳で評価した。
その結果、SFMは下流性能において重要な役割を担い、アダプタの選択は適度な影響があり、SFMとLLMに依存していることがわかった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:54:29 GMT)
SCOI: Syntax-augmented Coverage-based In-context Example Selection for Machine Translation [13.9] そこで本研究では,機械翻訳(MT)における文脈内例の選択に統語的知識を導入する。
我々は、構文拡張されたコベレージベースのIn-context example selection (SCOI) という新しい戦略を提案する。
提案するSCOIは,すべての学習自由手法の中で,平均COMETスコアが最も高い。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:00:03 GMT)
LSR-IGRU: Stock Trend Prediction Based on Long Short-Term Relationships and Improved GRU [13.6] LSR-IGRUという株価トレンド予測モデルを提案する。
長期の株式関係と改良されたGRUインプットに基づいている。
我々は,現在最先端のベースラインモデルよりも提案したLSR-IGRUの優位性を検証した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:38:48 GMT)
CombU: A Combined Unit Activation for Fitting Mathematical Expressions with Neural Networks [13.6] 異なる層にまたがる様々な次元で異なるアクティベーション機能を利用するCombU(CombU)を導入する。
このアプローチは理論上、ほとんどの数学的表現を正確に適合させることが証明できる。
6つのState-Of-The-Art(SOTA)アクティベーション関数アルゴリズムと比較して、4つの数学的表現データセットで実施された実験は、CombUが16の指標のうち10のSOTAアルゴリズムより優れていることを示した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:26:09 GMT)
Models Can and Should Embrace the Communicative Nature of Human-Generated Math [13.5] モデルが学習される数学データは、理想化された数学的実体だけでなく、豊かなコミュニケーション意図を反映していると論じる。
我々は、人間生成数学において潜在するコミュニケーション意図から学習し、表現するAIシステムを提唱する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:08:08 GMT)
Fast Distributed Inference Serving for Large Language Models [13.3] 大規模言語モデル(LLM)のための分散推論サービスシステムであるFastServeについて述べる。
FastServeはLLM推論の自己回帰パターンを利用して、各出力トークンの粒度のプリエンプションを可能にする。
我々は,FastServeのシステムプロトタイプを構築し,最先端のソリューションであるvLLMと比較して,同じ平均および末尾遅延条件下でのスループットを最大31.4xと17.9xに改善したことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:57:51 GMT)
Overview of the First Shared Task on Clinical Text Generation: RRG24 and "Discharge Me!" [13.3] 本稿では,Radiology Report Generation (RRG24) と Discharge Summary Generation (Discharge Me!
RRG24は、胸部X線を照射した放射線学報告の「フィンディング」と「印象」のセクションを生成する。
退院!」は、救急科で入院した患者の退院要領の「Brief Hospital Course」と「Discharge Instructions」のセクションを作成。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:02:54 GMT)
Reactive Multi-Robot Navigation in Outdoor Environments Through Uncertainty-Aware Active Learning of Human Preference Landscape [13.2] マルチロボットシステム(MRS)は、多様な能力を持つ複数のメンバーが存在するため、ミッションをより効率的に実行することができる。
広範囲の現実世界環境にMSSを配置することは、不確実で様々な障害のために依然として困難である。
本研究では, ランドスケープ・ラーニング・アンド・ビヘイビア・アライメント・フレームワーク(PLBA)を新たに設計した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:15:09 GMT)
Consistent estimation of generative model representations in the data
kernel perspective space [13.1] 大規模言語モデルやテキストから画像への拡散モデルのような生成モデルは、クエリを提示すると関連する情報を生成する。
同じクエリを表示すると、異なるモデルが異なる情報を生成する可能性がある。
本稿では,一組のクエリのコンテキストにおける生成モデルの埋め込みに基づく表現に関する新しい理論的結果を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:35:58 GMT)
VFDelta: A Framework for Detecting Silent Vulnerability Fixes by Enhancing Code Change Learning [13.0] オープンソースソフトウェア(OSS)の脆弱性修正は通常、調整された脆弱性開示モデルに従い、静かに修正される。
この遅延は、修正が公表される前に悪意のある関係者がソフトウェアを悪用する可能性があるため、OSSユーザを危険に晒す可能性がある。
既存のメソッドは、コード変更表現をコミットから学習することで脆弱性修正を分類する。
VFDeltaは、コードを取り囲む独立したモデルを用いて、変更前後にコードを埋め込む軽量で効果的なフレームワークである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:13:08 GMT)
ScanTalk: 3D Talking Heads from Unregistered Scans [13.0] スキャンデータを含む任意のトポロジで3次元顔をアニメーションできる新しいフレームワークである textbfScanTalk を提案する。
我々のアプローチは、固定トポロジ制約を克服するためにDiffusionNetアーキテクチャに依存しており、より柔軟でリアルな3Dアニメーションのための有望な道を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:42:45 GMT)
Fast Distributed Inference Serving for Large Language Models [12.7] 大規模言語モデル(LLM)のための分散推論サービスシステムであるFastServeについて述べる。
FastServeはLLM推論の自己回帰パターンを利用して、各出力トークンの粒度のプリエンプションを可能にする。
我々は,FastServeのシステムプロトタイプを構築し,最先端のソリューションであるvLLMと比較して,同じ平均および末尾遅延条件下でのスループットを最大31.4xと17.9xに改善したことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:57:51 GMT)
Transport properties in a two-dimensional Su-Schrieffer-Heeger model in Quantum Hall Regime [12.6] 量子ホール状態における2次元Su-Schrieffer-Heeger (2D SSH)モデルの輸送特性について検討する。
磁場の変化により、ギャップ位相から平らなバンド状態への遷移をゼロエネルギーで観測する。
この遷移は、バルクまたはエッジに高度に局在した状態の出現によって特徴づけられる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:45:37 GMT)
Quantum Entanglement Allocation through a Central Hub [12.6] 我々は,集中型ハブアーキテクチャにおいて,$N$-qubit W状態の割り当てを行うためのローカル演算と古典的通信プロトコルを提案する。
その結果、これらのプロトコルは、中央システム内で量子メモリの$N$ qubitsしか使用せず、それぞれWおよびGHZ状態の古典ビットに対して$N$2$と$N$の通信コストがかかることを決定的かつ正確に示している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:49:07 GMT)
Text2CAD: Generating Sequential CAD Models from Beginner-to-Expert Level Text Prompts [12.6] テキストからパラメトリックCADモデルを生成するための最初のAIフレームワークであるText2CADを提案する。
提案するフレームワークは,AI支援設計アプリケーションにおいて大きな可能性を秘めている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:19:33 GMT)
The FruitShell French synthesis system at the Blizzard 2023 Challenge [12.5] 本稿では,Blizzard Challenge 2023のためのフランス語音声合成システムを提案する。
この課題は、女性話者から高品質な音声を生成することと、特定の個人によく似た音声を生成することの2つのタスクから構成される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:39:08 GMT)
Implicit Neural Representations for Simultaneous Reduction and
Continuous Reconstruction of Multi-Altitude Climate Data [12.3] 本稿では,多高度風速データの有効次元削減と連続表現を同時に実現するためのディープラーニングフレームワークを提案する。
本研究の目的は,(1)多種多様な気候条件にまたがるデータ解像度を改善して高解像度の細部を復元すること,(2)大規模気候データセットのより効率的な保存のためのデータ次元の低減,(3)異なる高度で測定された風速データ間の交差予測を可能にすることである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:23:28 GMT)
Evaluating and Enhancing Large Language Models for Novelty Assessment in Scholarly Publications [12.2] 学術論文において,大規模言語モデルの新規性を評価する能力を評価するために,学術ノベルティベンチマーク(SchNovel)を導入する。
SchNovelは、arXivデータセットからサンプリングされた6つのフィールドにわたる15,000の論文からなる。
RAG-Noveltyは、類似論文の検索を利用して、人間レビュアーによるレビュープロセスをシミュレートし、新規性を評価する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:12:38 GMT)
Non-stationary BERT: Exploring Augmented IMU Data For Robust Human Activity Recognition [12.2] HAR(Human Activity Recognition)は、モバイルデバイスの普及により、研究者から大きな注目を集めている。
本研究では、携帯電話IMUデータからなるOPPOHARと呼ばれる人間の活動認識データセットを収集する。
本研究では,ユーザ固有のアクティビティ認識を実現するための2段階のトレーニング手法により,非定常BERTと呼ばれる新しい軽量ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:28:54 GMT)
SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues [11.9] 我々は、単純なテキストキューを利用して高品質な擬似ラベルを生成する新しいフレームワーク、SimTxtSegを提案する。
大腸ポリープ・セグメンテーションとMRI脳腫瘍セグメンテーションという2つの医療画像セグメンテーションの枠組みについて検討した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:03:54 GMT)
LLM-CARD: Towards a Description and Landscape of Large Language Models [11.7] 学術論文から大規模言語モデルに関する重要な情報を自動抽出・整理するシステムを開発することが重要である。
本研究は、名前付きエンティティ認識(textbfNER)および関係抽出(textbfRE)手法を用いて、そのような先駆的なシステムを開発することを目的とする。
106の学術論文は, LLMの名前, ライセンス, 適用の3つの辞書を定義して処理した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:15:57 GMT)
VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models [11.7] 大規模言語モデル(LLM)の極低ビット量子化のためのベクトル後学習量子化(VPTQ)を導入する。
VPTQはLLaMA-2で0.01$-$0.34$、Mistral-7Bで0.38$-$0.68$、LLaMA-3で4.41$-$7.34$を2ビットで還元する。
また、モデル精度を高め、モデルをさらに圧縮する残差量子化および外れ値量子化をサポートするためにVPTQを拡張した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:25:45 GMT)
SeaSplat: Representing Underwater Scenes with 3D Gaussian Splatting and a Physically Grounded Image Formation Model [11.6] 本研究では,最近の3次元放射場の発展を生かした水中シーンのリアルタイムレンダリングを可能にするSeaSplatを紹介する。
SeaSplatを、アメリカ領ヴァージン諸島の水中車両が収集したSeaThru-NeRFデータセットの現実世界のシーンに適用する。
水中画像形成はシーン構造を学習し, 深度マップを改良し, 3次元ガウス表現の活用による計算精度の向上を図った。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:45:19 GMT)
Translation of Multifaceted Data without Re-Training of Machine Translation Systems [11.2] このプラクティスは、しばしば同じデータポイント内のコンポーネント間の相互関係を見落としている、と私たちは主張する。
MTパイプラインでは、データポイント内のすべてのコンポーネントが実装され、単一の翻訳シーケンスを形成します。
学習データとしての有効性とともに,翻訳品質自体の大幅な向上を実現しています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:15:32 GMT)
Multi-Robot Informative Path Planning for Efficient Target Mapping using Deep Reinforcement Learning [11.1] 本稿では,多ボット情報経路計画のための新しい深層強化学習手法を提案する。
我々は、集中的な訓練と分散実行パラダイムを通じて強化学習政策を訓練する。
提案手法は,他の最先端のマルチロボット目標マッピング手法よりも33.75%向上する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:27:37 GMT)
Are LLMs Ready for Real-World Materials Discovery? [10.9] 大規模言語モデル(LLM)は、材料科学の研究を加速する強力な言語処理ツールのエキサイティングな可能性を生み出します。
LLMは、物質理解と発見を加速する大きな可能性を秘めているが、現在は実用的な材料科学ツールとして不足している。
材料科学におけるLLMの失敗事例として,複雑で相互接続された材料科学知識の理解と推論に関連するLCMの現在の限界を明らかにする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:43:59 GMT)
Context-Enhanced LLM-Based Framework for Automatic Test Refactoring [10.8] テストの臭いは、設計プラクティスの貧弱さとドメイン知識の不足から生じます。
我々は,Javaプロジェクトにおける自動テストのための文脈拡張型LLMベースのフレームワークUTRefactorを提案する。
6つのオープンソースのJavaプロジェクトから879のテストに対してUTRefactorを評価し、テストの匂いを2,375から265に減らし、89%の削減を実現した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:42:29 GMT)
Unit Test Generation for Vulnerability Exploitation in Java Third-Party Libraries [10.8] VULEUTは、クライアントソフトウェアプロジェクトで一般的に使用されているサードパーティ製ライブラリの脆弱性の悪用を自動検証するように設計されている。
VULEUTはまず、脆弱性条件の到達可能性を決定するためにクライアントプロジェクトを分析する。
次に、Large Language Model (LLM)を活用して、脆弱性確認のためのユニットテストを生成する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:47:01 GMT)
AACLiteNet: A Lightweight Model for Detection of Fine-Grained Abdominal Aortic Calcification [10.8] CVDは世界でも主要な死因であり、毎年1790万人が死亡している。
AACLiteNetは、粒度のAACスコアを高精度に予測する軽量なディープラーニングモデルである。
計算コストは19.88倍、メモリフットプリントは2.26倍である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:21:10 GMT)
MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving [10.7] 視覚言語モデル(VLM)は、自律運転における汎用的なエンドツーエンドモデルとして機能する。
既存のほとんどの手法は計算コストのかかるビジュアルエンコーダと大言語モデル(LLM)に依存している。
提案するFE-MoE(Feature Engineering Mixture of Experts)モジュールとDI-Adapter(Dynamic Instruction Adapter)を組み込んだMiniDriveという新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:53:39 GMT)
Bits-to-Photon: End-to-End Learned Scalable Point Cloud Compression for Direct Rendering [10.7] 我々は,レンダリング可能な3Dガウスアンに直接デコード可能なビットストリームを生成するポイントクラウド圧縮スキームを開発した。
提案手法はスケーラブルなビットストリームを生成し,異なるビットレート範囲で複数の詳細レベルを実現する。
提案手法は,高品質な点雲のリアルタイムカラーデコーディングとレンダリングをサポートし,自由視点でインタラクティブな3Dストリーミングアプリケーションを実現する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:01:55 GMT)
Landscape of Policy Optimization for Finite Horizon MDPs with General State and Action [10.2] 我々は、一般的な状態と空間を持つマルコフ決定過程のクラスのためのフレームワークを開発する。
勾配法は非漸近条件で大域的最適ポリシーに収束することを示す。
その結果,多周期インベントリシステムにおける最初の複雑性が確立された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:56:02 GMT)
CodeInsight: A Curated Dataset of Practical Coding Solutions from Stack Overflow [10.2] データセットは、明確化インテント、コードスニペットの関連、関連する3つのユニットテストの平均を含む例を提供する。
Pythonの専門家が作成した3,409の例を補完する私たちのデータセットは、モデル微調整とスタンドアロン評価の両方のために設計されています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:18:52 GMT)
RLHFuse: Efficient RLHF Training for Large Language Models with Inter- and Intra-Stage Fusion [10.2] 既存のRLHFシステムは、プロダクションデプロイメントにおけるGPU利用の低さに悩まされている。
RLHFuseは、個々のタスクの合成として、従来のRLHFワークフローのビューを分解する。
RLHFuseは既存の最先端システムと比較してトレーニングのスループットを最大3.7倍に向上させる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:28:06 GMT)
RLHFuse: Efficient RLHF Training for Large Language Models with Inter- and Intra-Stage Fusion [10.2] RLHF(Reinforcement Learning from Human Feedback)は、トレーニング後の重要なテクニックである。
既存のRLHFトレーニングシステムは、各タスクを最小の実行ユニットと見なしているため、サブタスクレベルの最適化の機会を見越すことができる。
RLHFuseは、個々のタスクの合成としてRLHFワークフローの従来のビューを分解し、各タスクをよりきめ細かいサブタスクに分割する。
RLHFuseは既存の最先端システムと比較してトレーニングのスループットを最大3.7倍に向上させる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:28:06 GMT)
Ascend HiFloat8 Format for Deep Learning [10.1] HiFloat8(HiF8)は、ディープラーニングのための8ビット浮動小数点データフォーマットである。
通常の値符号化では、3ビットのマティーサを持つ7の指数、2ビットのマティーサを持つ8の指数、1ビットのマティーサを持つ16の指数を提供する。
デノーマル値やサブノーマル値の符号化では、ダイナミックレンジを2の7つの余分なパワー(31から38ビネード)で拡張する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:11:58 GMT)
Navigating the Maze of Explainable AI: A Systematic Approach to Evaluating Methods and Metrics [10.0] LATECは、20の異なる指標を用いて17の顕著なXAI手法を批判的に評価する大規模なベンチマークである。
信頼性の低いランキングに繋がるメトリクスの衝突リスクを実証し、その結果、より堅牢な評価手法を提案する。
LATECは将来のXAI研究における役割を強化し、326kのサリエンシマップと378kのメトリクススコアを(meta-)データセットとして公開している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:07:46 GMT)
Evaluating Usability and Engagement of Large Language Models in Virtual Reality for Traditional Scottish Curling [9.9] 本稿では,VR(VR)環境におけるLarge Language Models(LLM)の革新的な応用について検討する。
スコティッシュ・ボンスピエル・VR』で紹介された伝統的なスコットランドのカーリングに焦点を当てている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:06:53 GMT)
EMIT- Event-Based Masked Auto Encoding for Irregular Time Series [9.9] データポイントが不均一な間隔で記録される不規則な時系列は、医療設定で一般的である。
この変動は、患者の健康の重大な変動を反映し、情報的臨床的意思決定に不可欠である。
本稿では,不規則な時系列に対するイベントベースのマスキングである,新しい事前学習フレームワーク EMIT を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:05:32 GMT)
The loss landscape of deep linear neural networks: a second-order analysis [9.9] 正方形損失を伴う深部線形ニューラルネットワークの最適化環境について検討する。
我々は、すべての臨界点の中で、大域最小化点、厳格なサドル点、非制限サドル点を特徴づける。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:38:43 GMT)
A Computational Tsirelson's Theorem for the Value of Compiled XOR Games [9.8] Kalaiらによって提案されたコンパイラは,任意の2プレーヤXORゲームに対して健全であることを示す。
提案手法を用いて並列繰り返しXORゲームのコンパイル値の厳密なバウンダリを含む,いくつかの追加結果を得た。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:39:03 GMT)
Data-driven Probabilistic Trajectory Learning with High Temporal Resolution in Terminal Airspace [9.7] 混合モデルとSeq2seqに基づくニューラルネットワークの予測および特徴抽出機能を活用するデータ駆動学習フレームワークを提案する。
このフレームワークでトレーニングした後、学習したモデルは長期予測精度を大幅に向上させることができる。
提案手法の精度と有効性は,予測された軌道と基礎的真実とを比較して評価する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:08:25 GMT)
T2Pair++: Secure and Usable IoT Pairing with Zero Information Loss [9.7] 我々は、慣性センサーを必要とせずに、IoTデバイスがユーザの物理的操作を検知できるようにする、Universal Operation Sensingと呼ばれる新しい技術を紹介した。
この技術により、ユーザーはボタンを押したり、ノブをねじったりといった単純なアクションを使って、数秒でペアリングプロセスを完了することができる。
ファジィコミットメントを使わず,情報損失をゼロにする,正確なペアリングプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:41:02 GMT)
Path-adaptive Spatio-Temporal State Space Model for Event-based Recognition with Arbitrary Duration [9.5] イベントカメラはバイオインスパイアされたセンサーで、強度の変化を非同期に捉え、イベントストリームを出力する。
本稿では, PAST-Act と呼ばれる新しいフレームワークを提案する。
私たちはまた、コミュニティの利益のために任意の期間で、ArDVS100という名前の分レベルのイベントベースの認識データセットを構築しました。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:08:37 GMT)
Building Real-time Awareness of Out-of-distribution in Trajectory Prediction for Autonomous Vehicles [8.4] 軌道予測は、自動運転車の周囲の障害物の動きを記述する。
本稿では,自律走行車における軌道予測におけるアウト・オブ・ディストリビューションのリアルタイム認識を確立することを目的とする。
提案手法は軽量であり, 軌道予測推定時にいつでもアウト・オブ・ディストリビューションの発生を処理できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:43:58 GMT)
PIFS-Rec: Process-In-Fabric-Switch for Large-Scale Recommendation System Inferences [8.4] 本稿では,布地スイッチの下流ポートを介して,近距離データ処理を実現するPIFS-Recを提案する。
PIFS-Recは、業界標準のCXLベースのシステムであるPondの3.89倍のレイテンシを実現し、最先端のスキームであるBEACONを2.03倍に上回っている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:23:26 GMT)
A Visual-Analytical Approach for Automatic Detection of Cyclonic Events in Satellite Observations [8.3] 熱帯性サイクロンの位置と強度を推定することは、破滅的な気象事象を予測する上で重要な意味を持つ。
サイクロンの検出と強度推定の現在のプロセスは、時間を要する物理に基づくシミュレーション研究を含む。
本研究の目的は、画像入力とデータ駆動アプローチのみを用いて、サイクロンの検出、強度推定および関連する側面に焦点を当てることである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:52:04 GMT)
DroneWiS: Automated Simulation Testing of small Unmanned Aerial Systems in Realistic Windy Conditions [8.3] DroneWiSは、sUAS開発者が現実的な風の条件を自動的にシミュレートし、sUASの風に対するレジリエンスをテストすることを可能にする。
ガゼボやAirSimのような現在の最先端のシミュレーションツールとは異なり、DroneWiSは計算流体力学(CFD)を利用してユニークな風速を計算する。
このシミュレーション機能は、困難で現実的な風の条件下でのsUASのナビゲーション能力について、開発者に深い洞察を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:23:50 GMT)
data2lang2vec: Data Driven Typological Features Completion [8.3] 我々は1,749言語で70%以上の精度を達成し,多言語対応のPOSタグを導入した。
また、タイポロジーに欠ける可能性のある機能に焦点を当てた、より現実的な評価設定も導入しています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:32:57 GMT)
SelectiveKD: A semi-supervised framework for cancer detection in DBT through Knowledge Distillation and Pseudo-labeling [8.3] がん検出モデルを構築するための半教師付き学習フレームワークであるSelectiveKDを提案する。
本フレームワークは,選択的な拡張戦略を実装することで,教師の監督信号の潜在的なノイズを軽減する。
複数のデバイスメーカーやロケーションから収集した1万以上の試験を,大規模な実世界のデータセットで評価した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:19:29 GMT)
Spacewalker: Traversing Representation Spaces for Fast Interactive Exploration and Annotation of Unstructured Data [8.2] Spacewalkerは、複数のモダリティをまたいだデータの探索とアノテートのために設計されたインタラクティブなツールである。
Spacewalkerは、ユーザーがデータ表現を抽出し、低次元空間でそれらを視覚化することを可能にする。
その結果,潜伏空間を横断し,マルチモーダルクエリを実行するツールの能力は,利用者の関連データを素早く識別する能力を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:14:01 GMT)
Training Language Models to Win Debates with Self-Play Improves Judge Accuracy [8.1] 本稿では,学習モデルによるスケーラブルな監視手法としての議論の堅牢性を試行し,自己再生によって生成されたデータと議論する。
言語モデルに基づく評価器は、モデルの判断が議論に勝つように最適化されたときに、より正確に質問に答える。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:28:33 GMT)
Non-asymptotic convergence analysis of the stochastic gradient
Hamiltonian Monte Carlo algorithm with discontinuous stochastic gradient with
applications to training of ReLU neural networks [8.1] 我々は、勾配ハミルトニアンモンテカルロのWasserstein-1 と Wasserstein-2 距離の目標測度への収束の非漸近解析を提供する。
本研究の主な成果を説明するために、定量推定に関する数値実験と、金融と人工知能に関連するReLUニューラルネットワークに関わるいくつかの問題について考察する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:21:09 GMT)
Deep-Learning Recognition of Scanning Transmission Electron Microscopy: Quantifying and Mitigating the Influence of Gaussian Noises [8.0] 走査型透過電子顕微鏡(STEM)によるナノ粒子認識のための深層学習マスク領域ベースニューラルネットワーク(Mask R-CNN)を提案する。
The Mask R-CNN model were tested onsimulated STEM-HAADF results with different Gaussian noises, Particle shapes and Particle sizes, and the results showed that Gaussian noise has determined Influence on the accuracy of recognition。
このフィルタリング認識手法はSTEM-HAADF実験結果にさらに適用され,従来のしきい値法と比較して満足度が向上した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:30:18 GMT)
Limitations of (Procrustes) Alignment in Assessing Multi-Person Human Pose and Shape Estimation [8.0] 我々は,映像監視のシナリオにおいて,人間の3Dポーズと形状を正確に推定する上での課題に焦点をあてる。
地上面との3Dメッシュのアライメントを改良してメトリクスを強化することを目的としたRotAvatを紹介する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:15:18 GMT)
3DDX: Bone Surface Reconstruction from a Single Standard-Geometry Radiograph via Dual-Face Depth Estimation [7.8] 単一のX線写真からの3D再構成は、いわゆる2D-3D再構成と呼ばれ、様々な臨床応用の可能性を秘めている。
本稿では,X線画像から得られた複数の深度マップを同時に学習し,計算トモグラフィーの登録を行う手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:48:57 GMT)
Can Vision Language Models Learn from Visual Demonstrations of Ambiguous Spatial Reasoning? [7.8] 大規模視覚言語モデル(VLM)は多くのコンピュータビジョンタスクの最先端技術となっている。
本稿では,空間的視覚曖昧性タスク (SVAT) と呼ばれる新しいベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:45:02 GMT)
WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.8] ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:04:21 GMT)
GEIC: Universal and Multilingual Named Entity Recognition with Large Language Models [7.7] ジェネレーションベース抽出とテキスト内分類(GEIC)の課題について紹介する。
次に,多言語GEICフレームワークであるCascadeNERを提案する。
我々はまた、Large Language Models(LLMs)用に特別に設計された最初のNERデータセットであるAnythingNERを紹介します。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:33:27 GMT)
Investigating Privacy Attacks in the Gray-Box Setting to Enhance Collaborative Learning Schemes [7.7] 我々は、攻撃者がモデルに限られたアクセスしかできないグレーボックス設定でプライバシ攻撃を研究する。
SmartNNCryptは、同型暗号化を調整して、より高いプライバシーリスクを示すモデルの部分を保護するフレームワークです。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:49:21 GMT)
Judgment of Thoughts: Courtroom of the Binary Logical Reasoning in Large Language Models [7.5] 本稿では,二項論理推論タスクに特化して設計された,素早い工学手法について述べる。
この枠組みでは、裁判官、検察官、弁護士が、より信頼性が高く正確な推論を容易にするためにこの技術を利用する。
実験結果から,本手法は既存手法よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:28:05 GMT)
PitRSDNet: Predicting Intra-operative Remaining Surgery Duration in
Endoscopic Pituitary Surgery [7.5] 本稿では,下垂体手術中の残存手術期間(RSD)を予測するためのPitRSDNetを提案する。
PitRSDNet はワークフロー知識を RSD 予測に統合する。1) ステップと RSD を同時に予測するためのマルチタスク学習,2) 時間的学習と推論におけるコンテキストとしての事前ステップ。
PitRSDNetは、88のビデオを備えた新しい内視鏡下垂体手術データセットでトレーニングされ、従来の統計的および機械学習手法よりも競争力のあるパフォーマンス向上を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:03:22 GMT)
Unveiling Ontological Commitment in Multi-Modal Foundation Models [7.5] ディープニューラルネットワーク(DNN)は、概念の豊かな表現とそれぞれの推論を自動的に学習する。
そこで本研究では,葉柄概念の集合に対してマルチモーダルDNNから学習したスーパークラス階層を抽出する手法を提案する。
最初の評価研究では、最先端基礎モデルから有意義な存在論的階級階層を抽出できることが示されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:24:27 GMT)
Fast decision tree learning solves hard coding-theoretic problems [7.4] 我々は、Ehrenfeucht と Haussler のアルゴリズムの改善により、$k$-NCP に対して$O(log n)$-approximation アルゴリズムが得られることを示す。
これは、$k$-NCPのアルゴリズムを設計するための新しい道、あるいはEhrenfeucht と Haussler のアルゴリズムの最適性を確立するための道と解釈できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:46:28 GMT)
AFIDAF: Alternating Fourier and Image Domain Adaptive Filters as an Efficient Alternative to Attention in ViTs [7.4] 本稿では,特徴抽出のためのFourierと画像領域フィルタリングを交互に行う手法を提案する。
軽量モデル間の性能はImageNet-1K分類の最先端レベルに達する。
我々のアプローチは、視覚変換器(ViT)を圧縮するための新しいツールとしても機能する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:15:46 GMT)
Let There Be Light: Robust Lensless Imaging Under External Illumination With Deep Learning [7.4] レンズレスカメラは、アナログ光学からデジタル後処理へ画像形成をシフトすることで、従来のカメラの設計制約を緩和する。
新しいカメラの設計や応用が可能である一方で、レンズレスイメージングは望ましくない干渉(他の情報源、ノイズなど)に非常に敏感である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:24:53 GMT)
DALDA: Data Augmentation Leveraging Diffusion Model and LLM with Adaptive Guidance Scaling [6.7] 大規模言語モデル(LLM)と拡散モデル(DM)を利用した効果的なデータ拡張フレームワークを提案する。
提案手法は,合成画像の多様性を増大させる問題に対処する。
本手法は, 目標分布の付着性を維持しつつ, 多様性を向上した合成画像を生成する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:02:43 GMT)
Exploring the Use of ChatGPT for a Systematic Literature Review: a Design-Based Research [6.6] 体系的な文献レビューを行う上でChatGPTを使用する方法に関する実証的研究は限られている。
本研究では、ChatGPTを用いて、同じ33論文のSLRを設計ベースのアプローチで実行した。
ガイド原理は、ChatGPTを用いてSLRを実行する必要がある研究者のために、本研究から要約される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:29:19 GMT)
Interpreting Deep Neural Network-Based Receiver Under Varying Signal-To-Noise Ratios [6.6] 本稿では,畳み込みニューラルネットワークに基づくレシーバモデルに着目し,ニューラルネットワークを解釈する新しい手法を提案する。
この方法は、モデルのどのユニットまたはユニットが関心のチャネルパラメータに関する最も多く(または少なくとも)情報を含むかを特定する。
リンクレベルのシミュレーション実験では、最も(少なくとも)信号対雑音比の処理に寄与する単位を特定する方法の有効性が示されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:26:19 GMT)
ControlCity: A Multimodal Diffusion Model Based Approach for Accurate Geospatial Data Generation and Urban Morphology Analysis [6.6] 本稿では,アクセス可能なVGIデータと完全なVGIデータを利用して,都市建物のフットプリントデータの生成を支援するマルチソース地理データ変換ソリューションを提案する。
次に,多モード拡散モデルに基づく地理データ変換手法であるControlCityを提案する。
世界の22都市での実験では、ControlCityが実際の都市建築パターンをシミュレートすることに成功している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:03:33 GMT)
How Effective are Self-Supervised Models for Contact Identification in Videos [6.5] この研究は、8つの異なるCNNベースのビデオSSLモデルを使用して、特にビデオシーケンス内の物理的接触のインスタンスを特定することを目的としている。
Some-Something v2 (SSv2) と Epic-Kitchen (EK-100) のデータセットがこれらのアプローチを評価するために選ばれた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:32:25 GMT)
Topological SLAM in colonoscopies leveraging deep features and topological priors [6.2] ColonSLAMは、古典的なマルチマップメートル法SLAMと深い特徴とトポロジカル事前を組み合わせた、大腸全体のトポロジカルマップを作成するシステムである。
提案手法をエンドマップデータセットで実証し,実際の人間の探索における大腸全体の地図作成の可能性を示した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:56:08 GMT)
Zero-Shot Detection of LLM-Generated Text using Token Cohesiveness [6.2] 我々は,既存のゼロショット検出器を改善するために,トークン凝集性をプラグアンドプレイモジュールとして利用する汎用的なデュアルチャネル検出パラダイムを開発した。
トークンの凝集度を計算するために,ランダムなトークンの削除と意味的差分測定を数ラウンドで行う。
各種データセット,ソースモデル,評価設定の4つの最先端ベース検出器を用いた実験は,提案手法の有効性と汎用性を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:18:57 GMT)
Group-Feature (Sensor) Selection With Controlled Redundancy Using Neural Networks [6.2] 本稿では,MLP(Multi-layer Perceptron)ネットワークに基づく新しい特徴選択手法を提案する。
グループ機能やセンサ選択の問題に対して一般化し、選択した特徴やグループ間の冗長性のレベルを制御できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:34:42 GMT)
Evolutionary Greedy Algorithm for Optimal Sensor Placement Problem in Urban Sewage Surveillance [6.1] 本稿では,大規模有向ネットワークの効率的かつ効率的な最適化を実現するために,新しい進化的欲求アルゴリズム(EG)を提案する。
提案手法は,香港の小規模合成ネットワークと大規模実世界の下水ネットワークの両方で評価される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:27:51 GMT)
Math-PUMA: Progressive Upward Multimodal Alignment to Enhance Mathematical Reasoning [6.0] MLLM(Multimodal Large Language Models)は、テキストベースの数学的問題の解法として優れている。
彼らは、主に自然の風景画像で訓練されているため、数学的図形に苦しむ。
本研究では,プログレッシブ・アップワード・マルチモーダルアライメントに着目したMath-PUMAを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:53:13 GMT)
Fast unconditional reset and leakage reduction in fixed-frequency transmon qubits [5.6] 量子ビットリセットとリークリダクションの両方を実装可能なプロトコルを示す。
合計して、クビットリセット、リークリセット、カプラリセットの組み合わせは83nsで完了する。
また,本プロトコルは,QECサイクル実行時間を短縮し,量子コンピュータにおけるアルゴリズムの忠実度を向上させる手段を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:57:41 GMT)
AlignedKV: Reducing Memory Access of KV-Cache with Precision-Aligned Quantization [5.6] 混合精度量子化は重要なパラメータと重要でないパラメータを区別する。
既存の手法は定性的分析と手動実験によってのみ重要なパラメータを識別できる。
本稿では,パラメータの重要性を総合的に評価する定量的枠組みを構築するために,いわゆる「精度アライメント」という新しい基準を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 01:39:02 GMT)
MorphoSeg: An Uncertainty-Aware Deep Learning Method for Biomedical Segmentation of Complex Cellular Morphologies [5.5] 深層学習は医学や生物学的イメージング、特にセグメンテーションのタスクに革命をもたらした。
細胞の形態の多様性と複雑さのため、生物学的な細胞を分断することは依然として困難である。
我々は多能性癌細胞株であるNtera-2細胞の新しいベンチマークデータセットを導入する。
トレーニング中の低線量領域からの仮想アウトリーチのサンプリングを取り入れた,複雑な細胞形態区分(MorphoSeg)のための不確実性を考慮したディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:25:06 GMT)
On Your Mark, Get Set, Predict! Modeling Continuous-Time Dynamics of Cascades for Information Popularity Prediction [5.5] 情報の普及を正確に予測する鍵は、基礎となる時間情報拡散過程を微妙にモデル化することにある。
本稿では,情報人気予測のために,カスケードの連続時間ダイナミクスをモデル化したConCatを提案する。
実世界の3つのデータセット上でConCatを評価するための広範な実験を行った。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:08:44 GMT)
SPL: A Socratic Playground for Learning Powered by Large Language Model [5.4] ソクラティック・プレイグラウンド・フォー・ラーニング (SPL) は GPT-4 をベースとした対話型プレイグラウンドである。
SPLは、個人のニーズに合わせてパーソナライズされた適応的な学習体験を強化することを目的としている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 01:48:32 GMT)
CasFT: Future Trend Modeling for Information Popularity Prediction with Dynamic Cues-Driven Diffusion Models [5.3] 本稿では,観測情報ニューラルズとODEを用いて抽出したダイナミックキューを活用して,未来増加傾向の発生を導出するCasFTを提案する。
3つの実世界のデータセットで実施された実験は、CasFTが最先端のアプローチと比較して予測精度を改善することを示した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:03:16 GMT)
TransUKAN:Computing-Efficient Hybrid KAN-Transformer for Enhanced Medical Image Segmentation [5.3] U-Netは現在、医療画像セグメンテーションの最も広く使われているアーキテクチャである。
我々は、メモリ使用量と計算負荷を減らすためにkanを改善した。
このアプローチは、非線形関係をキャプチャするモデルの能力を高める。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:03:46 GMT)
TransUKAN:Computing-Efficient Hybrid KAN-Transformer for Enhanced Medical Image Segmentation [5.3] U-Netは現在、医療画像セグメンテーションの最も広く使われているアーキテクチャである。
我々は、メモリ使用量と計算負荷を減らすためにkanを改善した。
このアプローチは、非線形関係をキャプチャするモデルの能力を高める。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:03:46 GMT)
Domain-Independent Automatic Generation of Descriptive Texts for Time-Series Data [5.3] 時系列データからドメインに依存しない記述テキストを生成する手法を提案する。
新たな後方アプローチを実装することで、観測データセットのための時間自動キャプションを作成する。
実験の結果,TACOデータセットを用いて学習した対照的な学習ベースモデルでは,新しいドメインにおける時系列データのための記述テキストを生成することができることがわかった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:04:03 GMT)
An Analysis of Minimum Error Entropy Loss Functions in Wireless Communications [5.1] 本稿では,無線通信における深層学習に適した情報理論損失関数として,最小誤差エントロピー基準を提案する。
本手法は,大気上回帰法と室内局在法という2つの重要な応用のシミュレーションにより評価した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:45:47 GMT)
Commitments are equivalent to statistically-verifiable one-way state generators [5.1] ワンウェイ状態発生器 (OWSG) は古典的なワンウェイ関数の自然な量子アナログである。
我々は、O(n/log(n)-copy-OWSGs(nは入力長を表す)がポリ(n)-copy-OWSGsおよび量子コミットメントに等しいことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:40:08 GMT)
Time Constant: Actuator Fingerprinting using Transient Response of Device and Process in ICS [4.9] 我々は Time Constant という新しいアクチュエータフィンガープリント技術を開発した。
Time Constantはアクチュエータと物理プロセスの過渡的なダイナミクスをキャプチャする。
我々は、インサイダー敵の顔にコマンドインジェクションやリプレイアタックに抵抗する複写抵抗アクチュエータ指紋を開発する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 01:04:13 GMT)
Numerical Approximation Capacity of Neural Networks with Bounded Parameters: Do Limits Exist, and How Can They Be Measured? [4.9] 普遍近似は理論的には実現可能であるが,現実的な数値シナリオでは,Deep Neural Networks (DNN) は有限次元ベクトル空間でしか近似できない。
ネットワークの系列の近似能力限界を定量化するために、textit$epsilon$ outer measure と textitNumerical Span Dimension (NSdim) の概念を導入する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:43:48 GMT)
Unique and Universal scaling in dynamical quantum phase transitions [4.8] 普遍性とスケーリングは平衡連続相転移の基本的な概念である。
我々は、ゆっくりと駆動された動的量子相転移において臨界時間のユニークで普遍的なスケーリング挙動を公表する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:25:19 GMT)
Unique and Universal scaling in dynamical quantum phase transitions [4.8] 普遍性とスケーリングは平衡連続相転移の基本的な概念である。
我々は、ゆっくりと駆動された動的量子相転移において臨界時間のユニークで普遍的なスケーリング挙動を公表する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:25:19 GMT)
Feedforward Controllers from Learned Dynamic Local Model Networks with Application to Excavator Assistance Functions [4.7] 我々は、ゼロダイナミクスによるLMNのフィードバック線形化が有効なコントローラを生成するときの基準を提供する。
実験では、外乱信号と複数の入力と出力を組み込むことで、学習した制御器の追跡性能が向上する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:40:07 GMT)
Understanding the Cognitive Complexity in Language Elicited by Product Images [4.4] この研究は、製品イメージによって引き起こされる人間の言語の認知的複雑さを測定し、検証するためのアプローチを提供する。
製品イメージの多彩な記述ラベルを含む大規模なデータセットを導入します。
人間の評価された認知複雑性は、自然言語モデルを用いて近似できることを示した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:26:11 GMT)
Automating Traffic Model Enhancement with AI Research Agent [4.4] Traffic Research Agent(TR-Agent)は、交通モデルを自律的に開発・洗練するAI駆動システムである。
TR-Agentは、複数のトラフィックモデルで大幅なパフォーマンス向上を実現している。
研究とコラボレーションをさらに支援するため、私たちは実験で使用されるコードとデータの両方をオープンソース化しました。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:42:25 GMT)
DeformStream: Deformation-based Adaptive Volumetric Video Streaming [4.4] ボリュームビデオストリーミングは没入型3D体験を提供するが、高い帯域幅要件とレイテンシの問題のために大きな課題に直面している。
本稿では,メッシュベースの表現の変形性を生かして,ボリュームビデオストリーミング性能を向上させる新しいフレームワークであるAdaptive Volumetric Video Streamingを紹介する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:43:59 GMT)
Enhancing Post-Hoc Attributions in Long Document Comprehension via Coarse Grained Answer Decomposition [4.4] ポストホック属性システムは、回答テキストをソース文書にマッピングするように設計されているが、このマッピングの粒度は未解決である。
そこで本研究では,テンプレートを用いたテキスト内学習を用いて,帰属に対する回答の事実分解に関する新しい手法を提案し,検討する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:32:35 GMT)
AAPM: Large Language Model Agent-based Asset Pricing Models [4.3] 本稿では, LLMエージェントからの質的意思決定的投資分析と, 定量的な手動経済要因を融合した新たな資産価格手法を提案する。
実験結果から,本手法はポートフォリオ最適化および資産価格誤差において,機械学習に基づく資産価格ベースラインよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:27:35 GMT)
ECG-Image-Database: A Dataset of ECG Images with Real-World Imaging and Scanning Artifacts; A Foundation for Computerized ECG Image Digitization and Analysis [4.3] ECG-Image-Databaseは、ECG時系列データから生成された心電図(ECG)画像の大規模かつ多種多様なコレクションである。
我々は、オープンソースのPythonツールキットであるECG-Image-Kitを使用して、生のECG時系列から12リードのECGプリントアウトのリアルな画像を生成する。
得られたデータセットには35,595個のソフトウェアラベル付きECGイメージが含まれており、幅広い画像アーティファクトと歪みがある。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:30:19 GMT)
Task Addition in Multi-Task Learning by Geometrical Alignment [4.2] 本稿では,限定データを用いた目標タスクの性能向上のためのタスク追加手法を提案する。
これは、大規模データセット上で教師付きマルチタスク事前トレーニングによって達成され、続いて、各タスクに対するタスク固有のモジュールの追加とトレーニングが行われる。
本実験は,従来のマルチタスク手法よりもGATEのタスク追加戦略の方が,計算コストに匹敵する優れた性能を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:56:00 GMT)
Reinforcement Learning for Finite Space Mean-Field Type Games [3.8] 平均場型ゲーム(MFTG)は、大連立間のナッシュ均衡を記述する。
有限空間設定でそのようなゲームに対する強化学習法を開発する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:15:26 GMT)
Embedding an ANN-Based Crystal Plasticity Model into the Finite Element Framework using an ABAQUS User-Material Subroutine [3.8] 本論文は、ユーザマテリアル(UMAT)サブルーチンを用いて、トレーニングニューラルネットワーク(NN)を有限要素(FE)フレームワークに組み込む実践的な方法を提案する。
この研究は、ABAQUS UMATで広範囲に応用された複雑な非弾性な非線形経路依存材料応答である結晶の塑性を例証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:47:18 GMT)
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation [3.8] 拡散モデルの量子化はモデルを圧縮し加速する有望な方法である。
既存の方法は、低ビット量子化のために、精度と効率の両方を同時に維持することはできない。
拡散モデルのための新しい量子化フレームワークであるDilateQuantを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:56:46 GMT)
DilateQuant: Accurate and Efficient Diffusion Quantization via Weight Dilation [3.8] 拡散モデルの量子化はモデルを圧縮し加速する有望な方法である。
既存の方法は、低ビット量子化のために、精度と効率の両方を同時に維持することはできない。
拡散モデルのための新しい量子化フレームワークであるDilateQuantを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:56:46 GMT)
Quantifying Visual Properties of GAM Shape Plots: Impact on Perceived Cognitive Load and Interpretability [3.7] GAM(Generalized Additive Models)は、機械学習のパフォーマンスと解釈可能性のバランスを提供する。
本研究は,GAM形状プロットの視覚特性と認知負荷の関係について検討した。
我々は,認知負荷を予測するための実用的なツールを提供するキンクの数に基づくシンプルなモデルを開発する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:36:14 GMT)
Examining the Rat in the Tunnel: Interpretable Multi-Label Classification of Tor-based Malware [3.6] Tor上の悪意のあるトラフィックは混雑を誘発し、Torのパフォーマンスを低下させる。
最近の研究は、捕獲されたTorのトラフィックを悪意または良心として正確に分類する可能性を実証している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:38:09 GMT)
A Differentiable Approach to Multi-scale Brain Modeling [3.6] 本稿では,脳シミュレータBrainPyを用いたマルチスケール微分脳モデリングワークフローを提案する。
単一ニューロンレベルでは、微分可能なニューロンモデルを実装し、電気生理学的データへの適合を最適化するために勾配法を用いる。
ネットワークレベルでは、生物学的に制約されたネットワークモデルを構築するためにコネクトロミックデータを組み込む。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:56:29 GMT)
Accelerating TinyML Inference on Microcontrollers through Approximate Kernels [3.6] 本研究では、近似計算とソフトウェアカーネル設計を組み合わせることで、マイクロコントローラ上での近似CNNモデルの推定を高速化する。
CIFAR-10データセットでトレーニングされたSTM32-Nucleoボードと2つの人気のあるCNNによる評価は、最先端の正確な推測と比較すると、平均21%のレイテンシ削減が可能であることを示している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:10:33 GMT)
Log-normal Mutations and their Use in Detecting Surreptitious Fake Images [3.6] 我々は、一般的なブラックボックス最適化ツール、特にログ正規化アルゴリズムにインスパイアされた他のブラックボックス攻撃について検討する。
偽検知器の攻撃に対数正規法を適用し,攻撃を成功させる。
そして、これらの攻撃と深度検出を組み合わせることで、改良された偽検出装置を作成する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:00:21 GMT)
Log-normal Mutations and their Use in Detecting Surreptitious Fake Images [3.6] 我々は、一般的なブラックボックス最適化ツール、特にログ正規化アルゴリズムにインスパイアされた他のブラックボックス攻撃について検討する。
偽検知器の攻撃に対数正規法を適用し,攻撃を成功させる。
そして、これらの攻撃と深度検出を組み合わせることで、改良された偽検出装置を作成する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:00:21 GMT)
When Is Inductive Inference Possible? [3.5] オンライン学習理論への新たなリンクを確立することにより,帰納的推論の厳密な特徴付けを行う。
帰納的推論が可能であることは、仮説クラスがオンライン学習可能なクラスの可算和である場合に限る。
私たちの主要な技術ツールは、新しい一様でないオンライン学習フレームワークです。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:38:47 GMT)
A Survey for Deep Reinforcement Learning Based Network Intrusion Detection [3.5] 本稿では,ネットワーク侵入検出における深部強化学習(DRL)の可能性と課題について考察する。
DRLモデルの性能は分析され、DRLは将来性を持っているが、近年の多くの技術は未解明のままである。
この論文は、現実世界のネットワークシナリオにおけるDRLの展開とテストを強化するための推奨事項で締めくくっている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:39:30 GMT)
Severity Prediction in Mental Health: LLM-based Creation, Analysis,
Evaluation of a Novel Multilingual Dataset [3.4] 大規模言語モデル(LLM)は、メンタルヘルス支援システムを含む様々な医療分野に統合されつつある。
本稿では、広く使われているメンタルヘルスデータセットを英語から6言語に翻訳した新しい多言語適応法を提案する。
このデータセットは、精神状態を検出し、複数の言語にわたる重症度を評価する上で、LLMのパフォーマンスを総合的に評価することを可能にする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:14:34 GMT)
Pre-trained Language Models Return Distinguishable Probability Distributions to Unfaithfully Hallucinated Texts [3.3] 本研究では,事前学習した言語モデルを用いて,不確実な生成確率と不確実性分布を不当に幻覚したテキストに戻すことを示す。
6つのデータセット上で24のモデルを調べることで、88~98%のケースが統計的に識別可能な生成確率と不確実性分布を返すことがわかった。
提案アルゴリズムは,高信頼度指標を達成しつつ,音質の一般的な指標を維持しながら,他のベースラインよりも優れる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:22:30 GMT)
A Newton Method for Hausdorff Approximations of the Pareto Front within Multi-objective Evolutionary Algorithms [3.3] 本論文では,多目的進化アルゴリズムで用いられるパレートフロントのハウスドルフ近似に対するセットベースニュートン法を提案する。
いくつかのベンチマークテスト関数と異なる基底進化アルゴリズムにおける後処理ステップとしてNewton法の利点を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:56:05 GMT)
Fourier neural operators for spatiotemporal dynamics in two-dimensional
turbulence [3.2] フーリエ・ニューラル演算子(FNO)に基づくモデルと偏微分方程式(PDE)を組み合わせれば,流体力学シミュレーションを高速化できる。
また、乱流の長期シミュレーションのために、機械学習モデルによって回避される必要のある純粋にデータ駆動アプローチの落とし穴についても論じる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:36:44 GMT)
AgRegNet: A Deep Regression Network for Flower and Fruit Density Estimation, Localization, and Counting in Orchards [3.1] 本稿では,樹木果樹冠内の花と果実の密度,数,位置を推定する,深い回帰に基づくネットワークAgRegNetを提案する。
一般的なU-NetアーキテクチャにインスパイアされたAgRegNetは、エンコーダからデコーダへのスキップ接続と、エンコーダ機能抽出器としてConvNeXt-Tを改良したU字型ネットワークである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:19:32 GMT)
Fourier neural operators for spatiotemporal dynamics in two-dimensional turbulence [3.1] フーリエ・ニューラル演算子(FNO)に基づくモデルと偏微分方程式(PDE)を組み合わせれば,流体力学シミュレーションを高速化できる。
また、乱流の長期シミュレーションのために、機械学習モデルによって回避される必要のある純粋にデータ駆動アプローチの落とし穴についても論じる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:36:44 GMT)
Fourier neural operators for spatiotemporal dynamics in two-dimensional turbulence [3.1] フーリエ・ニューラル演算子(FNO)に基づくモデルと偏微分方程式(PDE)を組み合わせれば,流体力学シミュレーションを高速化できる。
また、乱流の長期シミュレーションのために、機械学習モデルによって回避される必要のある純粋にデータ駆動アプローチの落とし穴についても論じる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:36:44 GMT)
Alternative Telescopic Displacement: An Efficient Multimodal Alignment Method [3.1] 本稿では,マルチモーダル情報の融合に革命をもたらす機能アライメントに対する革新的なアプローチを提案する。
提案手法では,異なるモードをまたいだ特徴表現の遠隔的変位と拡張の新たな反復的プロセスを用いて,共有特徴空間内の一貫性のある統一表現を導出する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:40:27 GMT)
Decomposition of Equivariant Maps via Invariant Maps: Application to Universal Approximation under Symmetry [3.1] 我々は、群 $G$ に関する不変写像と同変写像の関係の理論を発展させる。
我々は、この理論をグループ対称性を持つディープニューラルネットワークの文脈で活用し、それらのメカニズムに関する新たな洞察を得る。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:27:41 GMT)
SWE2: SubWord Enriched and Significant Word Emphasized Framework for Hate Speech Detection [3.0] 本稿では,メッセージの内容のみに依存し,ヘイトスピーチを自動的に識別するSWE2という新しいヘイトスピーチ検出フレームワークを提案する。
実験結果から,提案モデルでは0.975の精度と0.953のマクロF1が達成され,最先端の7つのベースラインを上回った。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:05:44 GMT)
An Effective, Robust and Fairness-aware Hate Speech Detection Framework [3.0] 既存のヘイトスピーチ検出手法には、いくつかの面で制限がある。
我々は,データ拡張,公平性,不確実性を考慮した新しいフレームワークを設計する。
本モデルは,攻撃シナリオと攻撃シナリオの両方で,最先端の8つの手法より優れている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:01:51 GMT)
Social Bias in Large Language Models For Bangla: An Empirical Study on Gender and Religious Bias [3.0] LLM生成したバングラ語に対する2種類の社会的バイアスについて検討した。
これは、バングラのLLMのバイアス評価を私たちの知識の最大限に活用する、この種の研究としては初めてのものです。
すべてのコードとリソースは、Bangla NLPにおけるバイアス関連研究の進展のために公開されています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:05:16 GMT)
A Hybrid Quantum-Classical AI-Based Detection Strategy for Generative Adversarial Network-Based Deepfake Attacks on an Autonomous Vehicle Traffic Sign Classification System [3.0] 著者らは、AV信号の分類システムを騙すために、生成的敵ネットワークベースのディープフェイク攻撃をいかに構築できるかを提示する。
彼らは、ハイブリッド量子古典ニューラルネットワーク(NN)を活用したディープフェイクトラフィックサイン画像検出戦略を開発した。
その結果、ディープフェイク検出のためのハイブリッド量子古典的NNは、ほとんどの場合、ベースラインの古典的畳み込みNNと似た、あるいは高い性能が得られることが示唆された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:44:56 GMT)
Cycle Counting under Local Differential Privacy for Degeneracy-bounded Graphs [2.9] 我々のアルゴリズムは、縮退有界グラフに対する (O(n1.5 + sqrtC_4) = O(n2)) の予測誤差を達成する。
アルゴリズムの中核となる考え方は、前処理ステップに続く正確な三角形の数である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:23:58 GMT)
CodonMPNN for Organism Specific and Codon Optimal Inverse Folding [2.9] タンパク質のバックボーン構造と生物ラベルに条件付けられたコドン配列を生成するコドンMPNNを提案する。
自然発生のDNA配列がコドン最適性に近い場合、コドンMPNNは高い発現率のコドン配列を生成することができる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:27:28 GMT)
Stress Detection from Photoplethysmography in a Virtual Reality Environment [2.9] 本稿では,非侵襲的かつ広く利用可能な生理的信号を用いて患者の精神状態を評価できる仮想現実治療プラットフォームを提案する。
ケーススタディでは,平和状態とストレス状態の2つのバイナリ分類をPSG信号を用いて検出する方法について検討した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:29:30 GMT)
Spiders Based on Anxiety: How Reinforcement Learning Can Deliver Desired User Experience in Virtual Reality Personalized Arachnophobia Treatment [2.9] プロシージャコンテンツ生成(PCG)と強化学習(RL)を利用したバーチャルリアリティ露光療法(VRET)の枠組みを提案する。
この治療では、仮想クモを観察する患者が脱感作し恐怖症を減少させる。
より一般的なルールベースのVRET法と比較して,本システムの優れた性能を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:30:39 GMT)
Identifying Unnecessary 3D Gaussians using Clustering for Fast Rendering of 3D Gaussian Splatting [2.9] 3D-GSは、速度と画質の両方においてニューラル放射場(NeRF)を上回った新しいレンダリングアプローチである。
本研究では,現在のビューをレンダリングするために,不要な3次元ガウスをリアルタイムに識別する計算量削減手法を提案する。
Mip-NeRF360データセットの場合、提案手法は2次元画像投影の前に平均して3次元ガウスの63%を排除し、ピーク信号対雑音比(PSNR)を犠牲にすることなく全体のレンダリングを約38.3%削減する。
提案されたアクセラレータは、GPUと比較して10.7倍のスピードアップも達成している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 01:29:37 GMT)
Cross-Lingual and Cross-Cultural Variation in Image Descriptions [2.9] 画像記述における言語間差異に関する大規模な実証的研究を行った。
私たちは、31の言語とさまざまな場所の画像を持つマルチモーダルデータセットを使用します。
我々の分析によると、地理的にあるいは遺伝的に近い言語のペアは、同じ実体に頻繁に言及する傾向がある。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:57:09 GMT)
Exploring Semantic Clustering in Deep Reinforcement Learning for Video Games [2.8] セマンティッククラスタリング(セマンティッククラスタリング)とは、セマンティックな類似性に基づいて内部的にビデオ入力をグループ化するニューラルネットワークの本質的な能力を指す。
本稿では,特徴量削減とオンラインクラスタリングを兼ね備えたセマンティッククラスタリングモジュールを統合したDRLアーキテクチャを提案する。
ビデオゲームにおけるDRLにおける提案モジュールの有効性とセマンティッククラスタリング特性を検証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:48:14 GMT)
CodecNeRF: Toward Fast Encoding and Decoding, Compact, and High-quality Novel-view Synthesis [2.7] 我々は,1つのフォワードパスでNeRF表現を生成可能なNeRF表現のためのニューラルネットワークであるCodecNeRFを提案する。
近年のパラメータ効率のよい微調整手法に着想を得て,生成したNeRF表現を新しいテストインスタンスに効率よく適応させるファインタニング手法を提案する。
提案したCodecNeRFは100倍以上の前例のない圧縮性能を達成し、符号化時間を大幅に短縮した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:16:41 GMT)
RESAA: A Removal and Structural Analysis Attack Against Compound Logic Locking [2.7] 本稿では,CLLでロックされた設計を分類し,重要なゲートを識別し,秘密鍵を明らかにするための様々な攻撃を実行するための新しいフレームワークRESAAを提案する。
その結果、RESAAは比較的複雑なITC'99ベンチマーク回路で92.6%の精度を達成できることがわかった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:14:36 GMT)
Weighted Cross-entropy for Low-Resource Languages in Multilingual Speech Recognition [2.7] 重み付きクロスエントロピーの新たな応用法を提案する。
我々は5つの高ソース言語と1つの低リソース言語でWhisper多言語ASRモデルを微調整する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:09:09 GMT)
Model Averaging and Double Machine Learning [2.6] DDMLは, 従来の代替手法よりも, 部分的に未知の機能形式に対して頑健であることを示す。
提案を実装したStaとRのソフトウェアを提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:56:11 GMT)
Zeeman polaritons as a platform for probing Dicke physics in condensed matter [2.5] スピン-ボソン系はディックモデルとより互換性があり、超強結合光-マッターハイブリッドに対して予測される現象の実験的実現を追求するボソン-ボソン系よりも有利であることを示す。
この結果は、スピン-ボソン系がディックモデルとより互換性があり、超強結合光-マッターハイブリッドに対して予測される現象の実験的実現を追求するボソン-ボソン系よりも有利であることを示している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:28:01 GMT)
Setting the AI Agenda -- Evidence from Sweden in the ChatGPT Era [2.5] 本稿では,ChatGPTのリリース前後におけるスウェーデンにおけるAIメタ議論の展開について検討する。
議題設定理論の観点からは、議論を主導する政党政治のエリートであることを提案する。
我々は、2010年代初頭から現在までのエリートレベルの文書のオリジナルのデータセットを、スウェーデンの主要な新聞に掲載されているオペ・エッセイを用いて描いている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:58:02 GMT)
Fast decision tree learning solves hard coding-theoretic problems [2.5] 我々は、Ehrenfeucht と Haussler のアルゴリズムの改善により、$k$-NCP に対して$O(log n)$-approximation アルゴリズムが得られることを示す。
これは、$k$-NCPのアルゴリズムを設計するための新しい道、あるいはEhrenfeucht と Haussler のアルゴリズムの最適性を確立するための道と解釈できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:46:28 GMT)
CaBRNet, an open-source library for developing and evaluating Case-Based Reasoning Models [2.4] CaBRNetはCase-Based Reasoning Networks用のオープンソースでモジュール化された後方互換性のあるフレームワークである。
本稿では,CaBRNetを提案する。CaBRNetはCase-Based Reasoning Networksのための,オープンソースでモジュール化された,後方互換性のあるフレームワークである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:32:03 GMT)
Enhancing Automatic Keyphrase Labelling with Text-to-Text Transfer Transformer (T5) Architecture: A Framework for Keyphrase Generation and Filtering [2.2] 本稿では,テキスト・テキスト・トランスフォーマ(T5)アーキテクチャに基づくキーフレーズ生成モデルを提案する。
また,T5アーキテクチャに基づく新しいキーフレーズフィルタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:16:46 GMT)
TempFuser: Learning Agile, Tactical, and Acrobatic Flight Maneuvers Using a Long Short-Term Temporal Fusion Transformer [2.2] TempFuserは、新しい長期の短期融合トランスアーキテクチャである。
複雑なドッグファイト問題において、アジャイル、戦術、およびアクロバティックな飛行操作を学ぶことができる。
我々のモデルは、優れた仕様で敵に面した場合でも、人間のようなアクロバティックな操作を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:09:05 GMT)
Information revival without backflow: non-causal explanations for non-Markovian quantum stochastic processes [2.1] 我々は、情報再生の研究が非マルコフ量子過程の研究において重要なパラダイムとなったと論じる。
我々は、非因果リバイバル現象を詳細に検討し、短いマルコフ鎖の理論と非マルコフ性に関連付ける。
我々は、システムのみの自由度の観点から、非因果リバイバルによって説明できないバックフローの存在を目撃するための運用条件を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:03:15 GMT)
2024 BRAVO Challenge Track 1 1st Place Report: Evaluating Robustness of
Vision Foundation Models for Semantic Segmentation [2.1] 2024年のBRAVO Challengeのトラック1では,モデルがCityscapesでトレーニングされ,その堅牢性はいくつかのアウト・オブ・ディストリビューション・データセットで評価される。
我々のソリューションは、DINOv2に単純なセグメンテーションデコーダを付加し、モデル全体を微調整することで、ビジョンファウンデーションモデルによって学習された強力な表現を活用する。
このアプローチは、より複雑な既存のアプローチよりも優れており、挑戦において第1位を獲得します。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:15:06 GMT)
The Role of Language Models in Modern Healthcare: A Comprehensive Review [2.0] 医療における大規模言語モデル(LLM)の適用は注目されている。
本稿では,言語モデルの初期から現在までの軌跡を概観する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:15:15 GMT)
ReCycle: Resilient Training of Large DNNs using Pipeline Adaptation [2.0] ReCycleは、障害発生時の効率的なトレーニング用に設計されたシステムである。
分散トレーニングシステムに固有の機能的冗長性を活用する。
複数の障害で高いトレーニングスループットを実現していることを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:43:50 GMT)
The loss landscape of deep linear neural networks: a second-order
analysis [2.0] 正方形損失を伴う深部線形ニューラルネットワークの最適化環境について検討する。
我々は、すべての臨界点の中で、大域最小化点、厳格なサドル点、非制限サドル点を特徴づける。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:38:43 GMT)
Optimal starting point for time series forecasting [2.0] 我々は、OSP-TSP(Optimal starting Point Time Series Forecast)と呼ばれる新しいアプローチを導入する。
XGBoostモデルとLightGBMモデルを利用してシーケンス長を調整することで、提案手法は時系列の最適開始点(OSP)を決定することができる。
実験の結果,OSP-TSPアプローチに基づく予測は,完全なデータセットを用いた予測よりも一貫して優れていた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:51:00 GMT)
FineZip : Pushing the Limits of Large Language Models for Practical Lossless Text Compression [2.0] FineZipは、オンライン記憶と動的コンテキストのアイデアを組み合わせて圧縮時間を劇的に短縮する新しいテキスト圧縮システムである。
FineZipは上記のコーパスを9.5日と比較すると約4時間で圧縮できる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:58:35 GMT)
Bias Reduction in Social Networks through Agent-Based Simulations [2.0] ネットワーク特性に基づいてフィードを構成する単純な欲求アルゴリズムにより、ランダムフィードに匹敵する知覚バイアスを低減できることを示す。
このことは、ソーシャルネットワークのコンテキストにおけるレコメンダシステムの有効性を決定する上で、ネットワーク構造が持つ影響を裏付けるものである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:16:20 GMT)
Precision Aquaculture: An Integrated Computer Vision and IoT Approach for Optimized Tilapia Feeding [1.9] 伝統的な魚の養殖は効率の悪さを招き、環境問題や生産性を低下させる。
我々はコンピュータビジョンとIoT技術を組み合わせて、ティラピアの正確な給餌を行う革新的なシステムを開発した。
予備推計では、従来の農場に比べて58倍の増産が期待されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:34:45 GMT)
Precision Aquaculture: An Integrated Computer Vision and IoT Approach for Optimized Tilapia Feeding [1.9] 伝統的な魚の養殖は効率の悪さを招き、環境問題や生産性を低下させる。
我々はコンピュータビジョンとIoT技術を組み合わせて、ティラピアの正確な給餌を行う革新的なシステムを開発した。
予備推計では、従来の農場に比べて58倍の増産が期待されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:34:45 GMT)
Digital Twins of Business Processes: A Research Manifesto [1.8] モノのインターネット(Internet of Things)は、物理的プロセスの監視と自動化のために、組織的および産業的に広く採用されている。
ビジネスプロセスの管理と保守の高度な方法は、ビジネスプロセスのデジタルツインが存在するため、到達範囲内にあります。
本宣言は,事業プロセスとデジタルツインの関係を明らかにすることで,技術の現状に貢献することを目的としている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:43:46 GMT)
Application of AI-based Models for Online Fraud Detection and Analysis [1.8] オンライン不正検出のためのAIおよびNLP技術に関する体系的文献レビューを行う。
各種オンライン詐欺カテゴリを解析するための最先端NLP技術について報告する。
データ制限の問題、トレーニングバイアスレポート、モデルパフォーマンスレポートにおけるメトリクスの選択的な表示などを特定します。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:47:03 GMT)
SDCL: Students Discrepancy-Informed Correction Learning for Semi-supervised Medical Image Segmentation [1.7] 半教師付き医用画像セグメンテーション(SSMIS)は、限られた医療ラベル付きデータの問題を緩和する可能性を実証している。
本研究では,2人の生徒と1人の教師を含む学生の離散型情報修正学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:23:53 GMT)
Integrating curation into scientific publishing to train AI models [1.7] 我々は,複数モーダルデータキュレーションを学術出版プロセスに組み込んで,セグメント化された図形パネルやキャプションに注釈を付ける。
SourceData-NLPというデータセットには、620,000以上の注釈付きバイオメディカルエンティティが含まれている。
我々は、名前付き認識、図形キャプションを構成パネルに分割すること、コンテキスト依存型セマンティックタスクを用いて、AIモデルをトレーニングするためのデータセットの有用性を評価する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:22:20 GMT)
Immersion and Invariance-based Coding for Privacy-Preserving Federated
Learning [1.6] 協調分散学習におけるプライバシ保護手法として,フェデレートラーニング(FL)が登場している。
制御理論から差分プライバシーとシステム浸漬ツールを組み合わせたプライバシー保護FLフレームワークを提案する。
提案手法は,局所モデルパラメータとグローバルモデルパラメータの両方に対して,任意のレベルの差分プライバシを提供するように調整可能であることを実証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:04:42 GMT)
Conversational Health Agents: A Personalized LLM-Powered Agent Framework [1.5] 会話型健康エージェント(英: Conversational Health Agents、CHA)は、援助や診断などの医療サービスを提供する対話型システムである。
我々は,対話エージェントがユーザの医療クエリに対してパーソナライズされた応答を生成するためのオープンソースのフレームワークであるopenCHAを提案する。
openCHAには、外部ソースから情報を集めるためのアクションを計画し実行するためのオーケストレータが含まれている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:50:38 GMT)
Proof of Thought : Neurosymbolic Program Synthesis allows Robust and
Interpretable Reasoning [1.4] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、一貫性のない推論に苦戦している。
本研究では,LLM出力の信頼性と透明性を高めるフレームワークであるProof of Thoughtを紹介する。
主な貢献は、論理的整合性を高めるためのソート管理を備えた堅牢な型システム、事実的知識と推論的知識を明確に区別するための規則の明示である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:35:45 GMT)
Euclidean and complex geometries from real-time computations of gravitational Rényi entropies [1.3] 適切な実時間経路積分は、ユークリッド法と一致するR'enyiエントロピーと関連する複素サドル点測地の両方をもたらすことを示す。
これらの一般点の簡単な説明の後、JT重力を用いて関連するリアルタイム計算を詳細に説明する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:32:49 GMT)
Block Expanded DINORET: Adapting Natural Domain Foundation Models for Retinal Imaging Without Catastrophic Forgetting [1.3] 我々はDINOv2視覚変換器を自己教師あり学習を用いた網膜画像分類タスクに適用した。
DINORETとBE DINORETという2つの新しい基礎モデルを生成した。
データ効率ではDINORETとBE DINORETがRETFoundより優れていた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:17:16 GMT)
The Technology of Outrage: Bias in Artificial Intelligence [1.2] 人工知能と機械学習は、人々の意思決定をオフロードするためにますます使われています。
過去において、この代替の根拠の1つは、機械が人間と違って公平で偏見のないものになることである。
アルゴリズム的偏見に対して人々が感情的に反応する場合、我々は怒り、知性、道徳、政治の3つの形態を識別する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 20:23:25 GMT)
LiverUSRecon: Automatic 3D Reconstruction and Volumetry of the Liver with a Few Partial Ultrasound Scans [1.2] 超音波(US)スキャンによる肝体積測定は,USスキャン,ぼやけた境界,部分的な肝可視性などのノイズが原因で困難である。
肝のCTスキャンを用いて構築した統計的形状モデル (SSM) と合わせて, 肝の非完全矢状面USスキャンのセグメンテーションマスクを用いて, これらの課題に対処する。
3次元肝再建は正確であり,自動肝体積計算に繋がる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:09:03 GMT)
Decoding Large-Language Models: A Systematic Overview of Socio-Technical Impacts, Constraints, and Emerging Questions [1.2] この記事では、倫理的考察とともに、社会に肯定的な影響を与える可能性のある適用領域を強調します。
これには、開発に関する責任ある考慮、アルゴリズムの改善、倫理的課題、社会的影響が含まれる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:36:30 GMT)
E-SQL: Direct Schema Linking via Question Enrichment in Text-to-SQL [1.2] E-レポジトリは、直接スキーマリンクと候補述語拡張による課題に対処するために設計された新しいパイプラインである。
E-は、関連するデータベースアイテム(テーブル、列、値)と条件を質問に直接組み込むことで、自然言語クエリを強化し、クエリとデータベース構造の間のギャップを埋める。
本研究では,従来の研究で広く研究されてきた手法であるスキーマフィルタリングの影響について検討し,先進的な大規模言語モデルと並行して適用した場合のリターンの低下を実証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:02:48 GMT)
HVT: A Comprehensive Vision Framework for Learning in Non-Euclidean Space [1.2] 本稿では、双曲幾何学を統合した視覚変換器(ViT)の新たな拡張である、双曲型視覚変換器(HVT)を紹介する。
従来のViTはユークリッド空間で作用するが、この手法は双曲的距離とM"オビウス変換を活用することにより自己認識機構を強化する。
厳密な数学的定式化を行い、双曲幾何学を注意層、フィードフォワードネットワーク、最適化に組み込む方法を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:07:37 GMT)
Comparison of Atom Detection Algorithms for Neutral Atom Quantum Computing [1.2] 原子量子コンピュータでは、明るさまたはそれと同等のメートル法が推定され、原子の存在や欠如を予測するために使用される。
我々は,複数の異なるアルゴリズムを調査し,その性能を精度と実行時間の両方で比較する。
我々の比較では、光システムのPSFを用いて、各部位の光電子を最も多く返却する、グローバルな非線形最小二乗解法である、テストされたアルゴリズムについて示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:08:06 GMT)
Shifting from endangerment to rebirth in the Artificial Intelligence Age: An Ensemble Machine Learning Approach for Hawrami Text Classification [1.2] ハフラミ語(Hawrami)はクルド語の方言で、絶滅危惧言語に分類される。
本稿では2つの母語話者による15のカテゴリにラベル付けされた6,854項目のデータセットを用いて,さまざまなテキスト分類モデルを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:52:21 GMT)
Collaborative Comic Generation: Integrating Visual Narrative Theories with AI Models for Enhanced Creativity [1.1] 本研究は,概念的原理-共通オーサリング・イディオムと生成的・言語モデルを統合し,漫画作成プロセスを強化する理論に着想を得たビジュアル・ナラティブ・ジェネレーションシステムを提案する。
主な貢献は、機械学習モデルを人間-AI協調コミック生成プロセスに統合すること、抽象的な物語理論をAI駆動コミック作成に展開すること、物語駆動画像シーケンスのカスタマイズ可能なツールである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:21:01 GMT)
Realism in Action: Anomaly-Aware Diagnosis of Brain Tumors from Medical Images Using YOLOv8 and DeiT [1.0] 本研究は,脳腫瘍の診断・分類に深層学習(DL)技術を活用することでこの問題に対処する。
NBML(National Brain Mapping Lab)は、30の腫瘍患者と51の正常患者を含む81の患者を対象とする。
このアプローチは、信頼できる腫瘍の検出と分類において有望な進歩を示し、現実の医療画像シナリオにおける腫瘍診断の潜在的な進歩を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:45:52 GMT)
Explain the Black Box for the Sake of Science: the Scientific Method in the Era of Generative Artificial Intelligence [0.9] 科学的手法は自然科学と応用科学の全ての分野における人間の進歩の基盤である。
我々は、人類の科学的発見のための複雑な推論が、少なくとも人工知能の出現以前には重要な存在であると主張している。
決定を下す上で重要なデータAIシステムを知ることは、ドメインの専門家や科学者との接触点になる可能性がある。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:42:18 GMT)
Classification of Gleason Grading in Prostate Cancer Histopathology Images Using Deep Learning Techniques: YOLO, Vision Transformers, and Vision Mamba [0.6] 本研究は,3つの深層学習手法であるYOLO,Vision Transformers,Vision Mambaの有効性を,病理組織像からグリーソングレードを正確に分類し,比較した。
ビジョン・マンバ(Vision Mamba)は、病理画像におけるグリーソン分類の最も効果的なモデルとして登場し、精度と計算効率のバランスを提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:36:18 GMT)
A Multi-Dataset Classification-Based Deep Learning Framework for Electronic Health Records and Predictive Analysis in Healthcare [0.6] 本研究では,複数のデータセットを分類するための新しいディープラーニング予測分析フレームワークを提案する。
Residual NetworksとArtificial Neural Networksを組み合わせたハイブリッドディープラーニングモデルを提案し,急性および慢性疾患を検出する。
厳密な実験と評価の結果,網膜基底像,肝硬変ステージ,心疾患診断予測では,93%,99%,95%の精度が得られた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:13:39 GMT)
Efficient Feature Interactions with Transformers: Improving User Spending Propensity Predictions in Gaming [0.6] 本稿では,ユーザがゲームラウンドに費やす確率を予測する問題について議論し,様々なダウンストリームアプリケーションに利用できるようにする。
例えば、利用者の支出適性に応じて極端にインセンティブを与えるか、または利用者の支出適性に基づいて製品リストをパーソナライズすることで、ユーザーをアップセラーする。
提案したアーキテクチャは,ゲームラウンドにおけるユーザの使用状況を予測するタスクにおいて,既存のモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:40:51 GMT)
Polyatomic Complexes: A topologically-informed learning representation for atomistic systems [0.5] 原子系の表現について述べる。
原子論系を符号化する一般的なアルゴリズムを提供する。
各種タスクにおける最先端手法に匹敵する性能を報告する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:26:49 GMT)
Pix2Next: Leveraging Vision Foundation Models for RGB to NIR Image Translation [0.5] RGB入力から高画質近赤外(NIR)画像を生成する新しい画像画像変換フレームワークPix2Nextを提案する。
マルチスケールのPatchGAN識別器は、様々な詳細レベルでリアルな画像生成を保証し、慎重に設計された損失関数は、グローバルなコンテキスト理解と局所的な特徴保存を結びつける。
提案手法により、追加のデータ取得やアノテーションの取り組みなしに、NIRデータセットのスケールアップが可能となり、NIRベースのコンピュータビジョンアプリケーションの進歩が加速する可能性がある。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:51:47 GMT)
Non-stabilizerness Entanglement Entropy: a measure of hardness in the classical simulation of quantum many-body systems [0.5] 我々は、量子状態に対する最小残差エントロピーである非安定化性エンタングルメントエントロピーの概念を導入する。
量子多体系の古典的なシミュレーションにおいて、新しい実用的でより良い難易度尺度として機能する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:06:04 GMT)
Heralded optical entanglement distribution via lossy quantum channels: A comparative study [0.5] 量子絡み合いは様々な量子技術の基盤となる。
本研究は,多部構成のグリーンベルガー・ホーネ・ザイリンガー状態(GHZ)を損失量子チャネルを介して分配する3つの隠蔽スキームを示唆する。
成功確率と予測効率を比較することで、各スキームは、当事者数、チャンネル距離、セキュリティ要件に応じて、それぞれ独自の利点があることがわかった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:08:21 GMT)
A random measure approach to reinforcement learning in continuous time [0.4] 連続時間強化学習におけるモデル探索のためのランダムな計測手法を提案する。
これらのランダム測度の構築はブラウン運動とポアソンランダム測度を利用する。
グリッドサンプリング限界SDEは、最近の連続RL文献の探索SDEとサンプルSDEを置き換えることができると論じる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:34:09 GMT)
Learning Bipedal Walking for Humanoid Robots in Challenging Environments with Obstacle Avoidance [0.3] 深層強化学習は、動的歩行を実現するためのヒューマノイドロボットの実装に成功している。
本稿では,政策に基づく強化学習を用いて,障害物が存在する環境下での2足歩行を実現することを目的とする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:02:04 GMT)
Measuring Entanglement by Exploiting its Anti-symmetric Nature [0.3] フォン・ノイマンやレーニエントロピーのようなほとんどの絡み合い測度は、外積の観点で表せることを示す。
本稿では,フェルミオンの非対称性を利用してエンタングルメントエントロピーを効率的に測定することを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:02 GMT)
In-Context Ensemble Improves Video-Language Models for Low-Level Workflow Understanding from Human Demonstrations [0.3] Standard Operating procedureは、ビデオデモに基づいて、ビジネスソフトウェアワークフローのための低レベルのステップバイステップのガイドを定義する。
近年の大規模ビデオ言語モデルの進歩は、人間の実演記録を解析することにより、SOP生成を自動化する可能性を秘めている。
SOP生成のためのビデオ言語モデルを用いたテキスト内学習について検討する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:50:49 GMT)
Exploring the mechanisms of qubit representations and introducing a new category system for visual representations: Results from expert ratings [0.3] 量子物理学(QP)教育では、図表や数学的概念に結びつく視覚補助などの表現の使用が不可欠である。
我々は、表現研究、QP教育、および量子科学の特定の側面からの洞察に基づく新しい識別基準を開発する。
4つの国からの専門家21人が、Bloch sphere、Circle Notation、Quantum Bead、Pie chart(Qake)モデルという4つのキュービット表現を用いてこのカテゴリシステムを評価した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:16:09 GMT)
Quantum Long Short-Term Memory (QLSTM) vs Classical LSTM in Time Series Forecasting: A Comparative Study in Solar Power Forecasting [0.3] 本研究は、ソーラー発電予測のための量子長期記憶(QLSTM)モデルと古典的長期記憶(LSTM)モデルの比較を行う。
調査の結果,トレーニング収束の加速やテスト損失の大幅な削減など,QLSTMによる有望な改善が明らかになった。
継続的な進歩により、量子機械学習は再生可能エネルギー時系列予測におけるパラダイムシフトを提供することができる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:06:47 GMT)
Physics-Informed Graph-Mesh Networks for PDEs: A hybrid approach for complex problems [0.2] 物理インフォームドグラフニューラルネットワークと有限要素からの数値カーネルを組み合わせたハイブリッドアプローチを提案する。
モデルの理論的性質を研究した後、2次元と3次元の複素幾何学に応用する。
我々の選択はアブレーション研究によって支持され,提案手法の一般化能力を評価する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:52:29 GMT)
Demo2Vec: Learning Region Embedding with Demographic Information [0.2] 単純でアクセスが容易な人口統計データによって、最先端領域の埋め込みの質が向上することを示す。
KL分散に基づく既存のプレトレイン法は移動情報に偏りがあることが判明した。
ニューヨークとシカゴの双方の実験結果から、モビリティと収入がプレトレインデータの組み合わせで最高のものであることが示されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:39:16 GMT)
Finite State Machine with Input and Process Render [0.2] 本稿では,FSMシミュレーションのビデオを生成するFSM(Finite State Machines)の自動可視化ツールを開発した。
教育者はFSMと入力文字列の任意の形式的定義を入力でき、FSMIPRはそのシミュレーションのビデオを生成する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:14:15 GMT)
A Few Hypocrites: Few-Shot Learning and Subtype Definitions for Detecting Hypocrisy Accusations in Online Climate Change Debates [0.2] 偽犯罪の告発は、オンライン気候論争において中心的なレトリック要素である。
大規模テキスト分析では、偽善罪の告発検出は未調査のツールである。
本稿では,偽犯罪の告発検出をNLPにおける独立したタスクとして定義する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:56:28 GMT)
Towards a Realistic Long-Term Benchmark for Open-Web Research Agents [0.2] 我々は,金融・コンサルティングにおいて日常的に行われる8つの現実的・乱雑なタスクを評価する。
これは既存のベンチマークのギャップを、実際の人間による経済的価値の業務を構成していない'ピザを次のアドレスに注文する'といったタスクで埋める。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:52:49 GMT)
Towards a Realistic Long-Term Benchmark for Open-Web Research Agents [0.2] ファイナンスやコンサルティングにおいて日常的に行われている,実世界のオープンウェブ研究課題に対するエージェントの評価を行った。
我々は、o1-preview、GPT-4o、Claude-3.5 Sonnet、Llama 3.1 (405b)、GPT-4o-miniといったエージェントアーキテクチャを構築し、テストした。
LLM全体では、サブタスクをサブエージェントに委譲する機能を備えたReActアーキテクチャが最もよく機能した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:52:49 GMT)
Unified Embedding Based Personalized Retrieval in Etsy Search [0.2] グラフ, 変換器, 項ベース埋め込みを終末に組み込んだ統合埋め込みモデルを学習することを提案する。
我々のパーソナライズされた検索モデルは、検索購入率5.58%、サイト全体のコンバージョン率2.63%によって、検索体験を著しく改善する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:01:50 GMT)
From Deception to Detection: The Dual Roles of Large Language Models in Fake News [0.2] フェイクニュースは、情報エコシステムと公衆信頼の整合性に重大な脅威をもたらす。
LLM(Large Language Models)の出現は、フェイクニュースとの戦いを変革する大きな可能性を秘めている。
本稿では,偽ニュースに効果的に対処する各種LLMの能力について検討する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:57:29 GMT)
Analysis of Centrifugal Clutches in Two-Speed Automatic Transmissions with Deep Learning-Based Engagement Prediction [0.2] 本研究は,様々なクラッチ構成が伝達力学に及ぼす影響を系統的に検討した。
Deep Neural Network(DNN)モデルは、スプリングプリロードや靴の質量といったパラメータを用いてクラッチエンゲージメントを予測する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:43:03 GMT)
Design and Fabrication of Robust Hybrid Photonic Crystal Cavities [0.1] 不均一に集積されたハイブリッドフォトニック結晶キャビティは、固体で光学的に対応可能な量子メモリとの強い光-物質相互作用を可能にする。
高品質(Q)ハイブリッドフォトニック結晶を実現するための鍵となる課題は、空気中の懸濁装置と比較して基板上の指数コントラストが減少することである。
そこで我々は,基板による損失の詳細な理解を利用したハイブリッドフォトニック結晶の設計手法を開発した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:50:38 GMT)
Towards a complete classification of holographic entropy inequalities [0.1] ホログラフィックエントロピーの不等式、縮尺写像、部分立方体の間の試行性を利用する。
ホログラフィックエントロピーの不等式の有効性は縮尺写像の存在によって示唆される。
また、興味深い副生成物、特に、候補量子エントロピー不等式を生成する手順を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:55:31 GMT)
Differentiating and Integrating ZX Diagrams with Applications to Quantum Machine Learning [0.1] 我々は、ZX-計算の枠組み内での微分と積分を実現することにより、ZXを解析的視点に高める。
本稿では,バレンプラトーの解析に量子機械学習を応用し,ZX計算の新しい解析フレームワークを具体的に解説する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:51:59 GMT)
Wide-field microwave magnetic field imaging with nitrogen-vacancy centers in diamond [0.0] マイクロ波(MW)磁場のマイクロスケール横方向分解能の非侵襲イメージングは、様々な用途において重要である。
NV中心磁力計は、$mu$mスケールの解像度、ミリスケールの視野、高感度、そして様々なサンプルと互換性のない非侵襲イメージングを提供する理想的なツールとして登場した。
本研究は, 差動レービ周波数測定に基づく新しいNV磁気メトリープロトコルを実証し, 弱いMW磁場の画像化にNV広視野イメージング能力を拡張した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:38:13 GMT)
What is the relationship between Slow Feature Analysis and the Successor Representation? [0.0] 遅い特徴解析(SFA)と後継表現(SR)の比較
SFAとSRは、機械学習の異なる分野に由来するが、それらは数学と、それらが敏感である情報のタイプの両方において、重要な特性を共有している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:57:07 GMT)
Website visits can predict angler presence using machine learning [0.0] 漁業活動と環境または経済要因を関連付ける予測モデルは、典型的には歴史的データに依存している。
湖のインフォメーションサイトだけで、毎日のアングルボートの存在を78%の精度で予測できるようになった。
モデルは、モデル訓練に含まれる既知の湖で最大0.77のR2を達成したが、未知の湖では不十分であった。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:26:52 GMT)
Using LLM for Real-Time Transcription and Summarization of Doctor-Patient Interactions into ePuskesmas in Indonesia [0.0] 本稿では,局所的大言語モデル(LLM)を用いて医師と患者の会話の書き起こし,翻訳,要約を行う手法を提案する。
我々はWhisperモデルとGPT-3を用いて、それらをePuskemasの医療記録形式に要約する。
このイノベーションは、過密化された施設やインドネシアの医療提供者に対する管理上の負担といった課題に対処する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:13:42 GMT)
Temporal Bell inequalities in a many-body system [0.0] 2つのスピンの時間的クレーター-ホルン不等式は、2つの測定されたパーティがスピンチェーンで接続されている場合、測定間の非ゼロ時間間隔で違反することを示す。
我々の結果は、多体構成で予想されるように、リーブ・ロビンソン境界は情報の拡散の基本的な限界として光の速度を代用していることを示唆している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:00:47 GMT)
TFT-multi: simultaneous forecasting of vital sign trajectories in the ICU [0.0] 医療データにおける軌道予測は、計算手法の精度ケアと臨床統合において重要な研究領域である。
我々は、多次元時系列予測ツールであるフレームワーク時間融合変換器(TFT)を拡張し、TFT-multiを提案する。
集中治療室で記録された5つのバイタルサイン (血圧, 脈拍, SpO2, 温度, 呼吸速度) の予測にTFT-multiを適用した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:13:29 GMT)
TFT-multi: simultaneous forecasting of vital sign trajectories in the ICU [0.0] 医療データにおける軌道予測は、計算手法の精度ケアと臨床統合において重要な研究領域である。
我々は、多次元時系列予測ツールであるフレームワーク時間融合変換器(TFT)を拡張し、TFT-multiを提案する。
集中治療室で記録された5つのバイタルサイン (血圧, 脈拍, SpO2, 温度, 呼吸速度) の予測にTFT-multiを適用した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:13:29 GMT)
Susceptibility Formulation of Density Matrix Perturbation Theory [0.0] 密度行列摂動理論は時間非依存の応答計算のための計算効率の良いフレームワークを提供する。
代わりに、観測可能な状態の静的感受性を計算するために、双対定式化(英語版)という別の方法を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:34:21 GMT)
Super Level Sets and Exponential Decay: A Synergistic Approach to Stable Neural Network Training [0.0] 指数減衰と高度な反オーバーフィッティング戦略を統合する動的学習率アルゴリズムを開発した。
適応学習率の影響を受けて、損失関数の超レベル集合が常に連結であることを証明する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:27:17 GMT)
Sub-ballistic operator growth in spin chains with heavy-tailed random fields [0.0] ハイゼンベルク図形の中で進化する任意の作用素が1/alpha$未満の動的指数で拡散することは不可能であることを示す。
この結果は、この障害が従来の輸送を確実に阻止する幅広いモデルのファミリーを確立する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:25 GMT)
Squeezing Quantum States in Three-Dimensional Twisted Crystals [0.0] 波動力学の基本的な考え方は、周期媒質内の伝播は、保存された結晶モータが離散格子変換の集合に置換されたときにそれらの変換を定義するブロッホ波によって記述できるということである。
不規則な空間周期が競合する順序づけられた材料では、この一般的な原理は効果がなく、しばしば劇的な結果をもたらす。
例えば、電荷またはスピン密度波からの対称性の破れた結晶、結晶学的に禁止された点対称性の回折パターンを生成する準周期格子、層間の相対的な回転(ツイスト)を持つ2次元格子のスタックなどがある。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:01:01 GMT)
Spectral gaps of local quantum channels in the weak-dissipation limit [0.0] 保存則のない一般カオス量子多体系の力学をバルク散逸の弱い条件下で考察する。
これらの散逸動力学の生成元である量子チャネル$mathcalE$は、熱力学的極限が最初に取られるとき、散逸強度$gammaから0$として非ゼロギャップを保持する。
我々は、$gamma から 0$ の極限のギャップは、ユニタリ力学のパラメータをチューニングすることによって非解析的に変化できると主張している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:07 GMT)
Sparsity, Regularization and Causality in Agricultural Yield: The Case
of Paddy Rice in Peru [0.0] 本研究は,ペルー各地の水田収量の正確な予測モデルを構築するために,農業国勢調査データとリモートセンシング時系列を統合した。
スパースレグレッションとElastic-Net正規化技術を利用して、重要リモートセンシング変数間の因果関係を同定する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:16:54 GMT)
Solving Free Fermion Problems on a Quantum Computer [0.0] 指数関数的に改善されたポリ(n$)コストで量子アルゴリズムによって解くことができるような自由フェルミオン問題をいくつか提示する。
強結合ハミルトニアンの力学と熱状態の文脈において、そのようなユニタリを量子回路として効率的に実現できることを実証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:03:18 GMT)
Simulating the quantum Fourier transform, Grover's algorithm, and the quantum counting algorithm with limited entanglement using tensor-networks [0.0] 我々は、限られた絡み合いを持つ量子アルゴリズムの実行をシミュレートする。
絡み合いが幾分小さくても,アルゴリズムは高い忠実度で実行可能であることがわかった。
我々の結果は、将来の量子コンピュータ上でこれらのアルゴリズムを実行することを約束している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:53:30 GMT)
Simulating black hole quantum dynamics on an optical lattice using the complex Sachdev-Ye-Kitaev model [0.0] 超低温原子を用いた光学格子上のアナログブラックホールシミュレーションのための低エネルギーモデルを提案する。
我々はランダムに無限の範囲で相互作用するフェルミオンの系を記述するSachdev-Ye-Kitaev(SYK)モデルを用いる。
低エネルギーでは、SYKモデルは創発的な共形対称性を示し、AdS2時空付近の極端ブラックホール溶液と双対である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:02:36 GMT)
Schr\"odinger bridge based deep conditional generative learning [0.0] 我々は条件分布を学習するための新しいSchr"odinger Bridgeに基づく深層生成手法を提案する。
本手法を低次元および高次元条件生成問題に適用する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:08:13 GMT)
Real-time estimation of overt attention from dynamic features of the face using deep-learning [0.0] 遠隔学習への移行に伴い、教師は様々な学生のエンゲージメントに適応するために必要な視覚的フィードバックを失っている。
本稿では,目,頭,顔の動きに基づいて注目度を推定するために,手軽に利用可能な前面映像を提案する。
我々は,眼球運動に基づく注意度を推定するために,深層学習モデルを訓練する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:34:19 GMT)
Real-time estimation of overt attention from dynamic features of the face using deep-learning [0.0] 我々は,眼球運動に基づく注意度を推定するために,深層学習モデルを訓練する。
学生が同じ教育ビデオを見ている間、10秒間隔で眼球運動の物体間相関を測定した。
ソリューションは軽量で、クライアント側で操作できるため、オンラインの注意監視に関連するプライバシー上の懸念が軽減される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:34:19 GMT)
Optimized Monte Carlo Tree Search for Enhanced Decision Making in the FrozenLake Environment [0.0] Monte Carlo Tree Search (MCTS) は複雑な意思決定問題を解決する強力なアルゴリズムである。
本稿では,古典的強化学習課題であるFrozenLake環境に適用したMCTS実装を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:04:53 GMT)
On-orbit Servicing for Spacecraft Collision Avoidance With Autonomous Decision Making [0.0] 本研究は、宇宙船衝突回避演習(CAM)を支援するために、AIによるOOSミッションの実装を開発する。
本稿では、RL(Reinforcement Learning)を用いて訓練された自律型サーベイラを提案し、ターゲット衛星と宇宙デブリの衝突を自律的に検出し、絶滅危惧衛星とのランデブーとドッキングを行い、最適なCAMを実行する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:40:37 GMT)
On the role of Artificial Intelligence methods in modern force-controlled manufacturing robotic tasks [0.0] ロボットマニピュレータの強化におけるAIの役割は、スマートマニュファクチャリングにおける重要なイノベーションに急速に結びついている。
この記事では、これらのイノベーションを実効力によって制御されたアプリケーションにまとめ、高品質な生産標準を維持する必要性を強調します。
この分析は、AI技術を検証するための共通のパフォーマンスメトリクスの必要性を強調した、将来の研究方向性の視点で締めくくっている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:29:26 GMT)
Non-collapsing electric readout of arbitrary Andreev qubits [0.0] 非復調プロトコルは、符号化された情報を破壊することなく、アンシラ量子ビットを用いて量子ビットの脆弱な量子状態を特定する。
ここでは、量子ドットジョセフソン接合で定義されるアンドレフ量子ビットを考える。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:12:16 GMT)
New technologies and AI: envisioning future directions for UNSCR 1540 [0.0] 論文は、WMDの開発、普及、潜在的な誤用におけるAI技術の増大する影響に対処するため、UNSCR 1540の拡張を要求する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:41:12 GMT)
Neural Network Plasticity and Loss Sharpness [0.0] 近年の研究では、新しいタスクにおける塑性損失は、非定常RLフレームワークにおける損失ランドスケープのシャープネスと高い関係があることが示されている。
我々は,スムーズなミニマを追求し,バニラ予測設定における一般化能力を評価されたシャープネス正則化手法について検討した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:20:09 GMT)
Multipartite information in sparse SYK models [0.0] 場の量子論では、任意の空間領域間の絡み合いエントロピーを含む特定の不等式が成立する。
そこで本研究では,Sachdev-Ye-Kitaev(SYK)モデルとスパースSYKモデルの類似エントロピー不等式について検討する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:41:12 GMT)
More on quantum measuring systems and the holographic principle [0.0] 古典化されたホログラフィックテンソルネットワークのユークリッド系における量子測定系の構造について検討する。
その結果、ユークリッド体制の次の図が得られた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:14:18 GMT)
More on quantum measuring systems and the holographic principle [0.0] 古典化されたホログラフィックテンソルネットワークのユークリッド系における量子測定系の構造について検討する。
その結果、ユークリッド体制の次の図が得られた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:14:18 GMT)
Metaheuristic Method for Solving Systems of Equations [0.0] 遺伝的アルゴリズムは、様々なテストケースにわたる正確なソリューションを一貫して提供した。
GAの重要な利点は、解空間を広く探索し、複数の解の集合を明らかにすることである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:14:08 GMT)
Mapping Technical Safety Research at AI Companies: A literature review and incentives analysis [0.0] レポートは、3つの主要なAI企業が実施する安全なAI開発に関する技術研究を分析している。
Anthropic、Google DeepMind、OpenAI。
私たちは安全なAI開発を、大規模な誤用や事故のリスクを生じにくいAIシステムの開発であると定義しました。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:19:25 GMT)
MaViLS, a Benchmark Dataset for Video-to-Slide Alignment, Assessing Baseline Accuracy with a Multimodal Alignment Algorithm Leveraging Speech, OCR, and Visual Features [0.0] 本稿では,講演ビデオとそれに対応するスライドの整合性を示すベンチマークデータセットを提案する。
音声、テキスト、画像の特徴を活用する新しいマルチモーダルアルゴリズムを導入する。
SIFT(0.56)と比較して平均精度は0.82で、約11倍高速である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 09:24:42 GMT)
Long-distance device-independent quantum key distribution using single-photon entanglement [0.0] デバイス非依存の量子鍵分布(DIQKD)により、2人の誠実なユーザーがセキュアな通信チャネルを確立することができる。
単一光子経路の絡み合った状態の隠蔽的準備を利用して, DIQKDのフォトニック実現を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:39:03 GMT)
Liouvillian skin effects and fragmented condensates in an integrable dissipative Bose-Hubbard model [0.0] ホッピング振幅に適合する速度に調整された損失の有無で,任意の相互作用強度でBose-Hubbardモデルのダイナミクスを解くことができることを示す。
ベーテ・アンザッツ解を解析することにより、弱い相互作用でさえシステムの定性的特徴を変化させることが分かる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:56:12 GMT)
Linking in Style: Understanding learned features in deep learning models [0.0] 畳み込みニューラルネットワーク(CNN)は抽象的な特徴を学び、オブジェクト分類を行う。
本稿では,CNNにおける学習特徴を可視化し,体系的に解析する自動手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:28:48 GMT)
Harnessing the Potential of Gen-AI Coding Assistants in Public Sector Software Development [0.0] GitHub Copilot - GovTech Singaporeのエンジニアリング生産性プログラム(EPP)
報告書は、AI Code Assistantツールが開発者の生産性を高め、公共セクターにおけるアプリケーション品質を向上させる大きな可能性を強調している。
と分類し、GitHub Copilotのようなクラウド上のGen-AI Coding Assistantツールを使用するようにアドバイスしている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:59:45 GMT)
Grüneisen parameter as an entanglement compass and the breakdown of the Hellmann-Feynman theorem [0.0] Gr"uneisen ratio $Gamma$, すなわち、熱膨張と比熱の比の特異部分は、有限のT$と量子臨界点(QCP)の両方を探索するために広く用いられている。
チューニングパラメータ$lambda$の関数として絡み合いを計算する量子アナログを$Gamma$に提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:40:53 GMT)
Growth and Spectroscopy of Lanthanide Doped Y$_2$SiO$_5$ Microcrystals for Quantum Information Processing [0.0] ランタンをドープしたY$_2$SiO$_5$マイクロ結晶を, 溶液燃焼, 固体, ゾル-ゲル合成技術を用いて調製した。
低温下でのNd$3+, Eu$3+およびEr$3+のドープ材料のレーザーサイト選択蛍光測定により, 成長した微結晶は光学的品質が高いことが示された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:18:59 GMT)
Graph Pruning Based Spatial and Temporal Graph Convolutional Network with Transfer Learning for Traffic Prediction [0.0] 本研究では,グラフプルーニングと転送学習の枠組みに基づく新しい時空間畳み込みネットワーク(TL-GPSTGN)を提案する。
その結果、単一のデータセット上でのTL-GPSTGNの異常な予測精度と、異なるデータセット間の堅牢なマイグレーション性能が示された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:59:23 GMT)
GeoBiked: A Dataset with Geometric Features and Automated Labeling Techniques to Enable Deep Generative Models in Engineering Design [0.0] GeoBikedは4つの355枚の自転車画像を含むようにキュレーションされており、構造的および技術的特徴を付加している。
大規模基盤モデルを用いてデータラベリングを自動化する手法を提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:57:59 GMT)
Generalizable Error Modeling for Human Data Annotation: Evidence From an Industry-Scale Search Data Annotation Program [0.0] 本稿では,検索関連アノテーションタスクにおける潜在的なエラーを検出するために訓練された予測誤差モデルを提案する。
そこで本研究では,中程度のモデル性能(AUC=0.65-0.75)で誤差を予測できることを示す。
本稿では,高い予測誤差確率のタスクを優先することで,修正されたアノテーションエラーの量を大幅に増加させるという,監査の文脈におけるモデルの有用性を実証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:41:14 GMT)
Game4Loc: A UAV Geo-Localization Benchmark from Game Data [0.0] クロスビューペアデータの部分的マッチングを含む,より実用的なUAV測位タスクを提案する。
実験により,UAV測地のためのデータとトレーニング手法の有効性が示された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:33:28 GMT)
Functional Integral Construction of Topological Quantum Field Theory [0.0] 単位の$n+1$ alterfold TQFTを導入し、$n$次元格子モデル上の線型汎関数から構成する。
単位球面$n$-圏は数学的に定義され、格子モデルの局所量子対称性として現れる。
特に、線形汎函数から非可逆ユニタリ 3+1 折りたたみ TQFT を構築し、その局所量子対称性を明示的な20j-記号を持つイジン型ユニタリ球面3圏として導出する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:15:35 GMT)
Free Independence and the Noncrossing Partition Lattice in Dual-Unitary Quantum Circuits [0.0] 二重単位量子回路のカオス力学の詳細について検討する。
相関子を量子チャネルのクラスの縮約として記述することにより、それらの指数的崩壊を証明できる。
また,双対ユニタリ回路の複製手法も開発しており,本手法は有用であり,自己の利害関係にある可能性がある。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:00 GMT)
Fermionic parton theory of Rydberg $\mathbb{Z}_2$ quantum spin liquids [0.0] 位相的に順序付けられた$mathbbZ_2$量子スピン液体(QSL)における対称性分数化パターンについて述べる。
また, 今後の実験の参考として, 動的構造因子の詳細な解析を行った。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:00:00 GMT)
Fate of non-Hermitian free fermions with Wannier-Stark ladder [0.0] ワニエ・スタークの局在は非エルミート自由フェルミオンの絡み合い挙動を動的に変化させる。
定常状態半鎖絡みのエントロピーを観察し、2つの異なる地域法域を同定する。
本研究は,非エルミート皮膚効果と無障害局所化との相互作用から出現する新規な絡み合い相について考察した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:49:22 GMT)
Extracting Dynamical Maps of Non-Markovian Open Quantum Systems [0.0] Lambda(tau)$は、システムと1つ以上の熱浴を、弱くも強くもない強度で突然結合することによって生じることを示す。
我々はChoi-Jamiolkowski同型を使い、$hatLambda(tau)$を完全に再構成することができる。
スピンレスフェルミ連鎖と単一不純物アンダーソンモデルとの相互作用の数値的な例は、我々のアプローチが大きなスピードアップをもたらす状態を示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:09:03 GMT)
Exposing Assumptions in AI Benchmarks through Cognitive Modelling [0.0] 文化AIベンチマークは、しばしば測定された構成物に関する暗黙の仮定に頼っており、不適切で明確な相互関係を持つ曖昧な定式化に繋がる。
構造方程式モデルとして定式化された明示的認知モデルを用いて,これらの仮定を明らかにする。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:55:02 GMT)
Ethical and Scalable Automation: A Governance and Compliance Framework for Business Applications [0.0] 本稿では、AIが倫理的で、制御可能で、実行可能で、望ましいものであることを保証するフレームワークを紹介する。
異なるケーススタディは、学術と実践の両方の環境でAIを統合することで、このフレームワークを検証する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:39:28 GMT)
Entanglement Hamiltonian and effective temperature of non-Hermitian quantum spin ladders [0.0] 非エルミートスピンはしごの絡み合いと絡み合いエネルギースペクトルを解析的に検討した。
我々の発見は非エルミート系における量子エンタングルメントに関する新たな知見を提供する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:20:24 GMT)
Enhancing Guardrails for Safe and Secure Healthcare AI [0.0] 私は、医療特有のニーズに合うように、Nvidia NeMo Guardrailsのような既存のガードレールフレームワークの強化を提案します。
私は、医療におけるAIの安全で信頼性が高く正確な使用を確実にし、誤情報リスクを軽減し、患者の安全性を向上させることを目指しています。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:30:06 GMT)
Don't Trust A Single Gerrymandering Metric [0.0] これらの指標のそれぞれが,ゲーリーマンダリングを検出するために,単一の孤立量として使用する場合,ゲーム可能であることを示す。
我々は,山登り法を用いて,メートル法上の境界に制約された地区計画を生成するとともに,当事者が獲得した地区数を最大又はほぼ最大化する。
これらの結果の明らかな結果の1つは、ゲーリーマンダリングを避けるために、再分権委員会が満たさなければならないメートル法上の事前境界を指定することの事実を示すことである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:40:09 GMT)
Dispute resolution in legal mediation with quantitative argumentation [0.0] 我々は,仲介目標の受容性を決定する際に,当事者の知識と仲介者の知識を統合するQuAMフレームワークを導入する。
また、目的引数の受け入れ可能性と、その引数に関連付けられた変数に割り当てられた値との関係をモデル化する新しい形式も開発する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:05:46 GMT)
Dimension reduction and the gradient flow of relative entropy [0.0] 次元減少は科学で広く用いられ、高次元データを低次元空間にマッピングする。
本研究では,近傍埋め込み(SNE)技術の基礎となる基本的な数学的モデルと,その一般的な変種であるt-SNEについて検討する。
目的は、これらの点を最適な方法で低次元にマッピングし、類似点がより近いようにすることである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 14:23:04 GMT)
Dichotomy in the effect of chaos on ergotropy [0.0] 本稿では,2つの量子カオスモデルを用いて,システムから最大単位抽出可能なエルゴトロピーについて検討する。
アンシラを補助するシナリオでは、カオスは状態が分かっているときにエルゴトロピーを高める。
対照的に、状態が不明な場合には、カオスと作業の間に負の相関関係を確立する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 03:28:04 GMT)
Deformation of a one dimensional ferromagnetic domain wall due to double exchange interaction with a free electron system [0.0] 磁気相互作用よりも大きい化学ポテンシャルでは、磁壁はより大きな幅に向けて大きく変形する。
エネルギーと伝導度は、このプロトタイプモデル内のBlochとN'eelの磁区壁と同一である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 05:33:32 GMT)
DRIM: Learning Disentangled Representations from Incomplete Multimodal Healthcare Data [0.0] 実生活の医療データは、しばしばマルチモーダルで不完全であり、高度なディープラーニングモデルの必要性を助長する。
データ疎性にもかかわらず、共有表現とユニークな表現をキャプチャする新しい方法であるDRIMを紹介する。
本手法はグリオーマ患者の生存予測タスクにおける最先端のアルゴリズムよりも優れており,モダリティの欠如に対して頑健である。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:13:57 GMT)
Couples can be tractable: New algorithms and hardness results for the Hospitals / Residents problem with Couples [0.0] 本研究は,ソリューションが安定したマッチングや,存在しない報告であるHRCを用いて,病院・居住者の問題を研究するものである。
ほぼ可能な安定マッチングを見つけることができる新しい時間アルゴリズムを提案する。
また,本アルゴリズムは,グラフがループを持つ多重グラフである安定なbマッチング問題の可解性も示している。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:23:09 GMT)
Classification of Non-native Handwritten Characters Using Convolutional Neural Network [0.0] 非ネイティブユーザによる英語文字の分類は、カスタマイズされたCNNモデルを提案することによって行われる。
我々はこのCNNを、手書きの独立した英語文字データセットと呼ばれる新しいデータセットでトレーニングする。
5つの畳み込み層と1つの隠蔽層を持つモデルでは、文字認識精度において最先端モデルよりも優れる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 04:36:14 GMT)
Classical and Quantum Analysis of Light Transmission Through Polarizing Filters [0.0] 角度の異なる偏光フィルタからなる系を通過する光の挙動を解析する。
次に、状態記法を用いて現象を記述するために量子力学を適用し、光子の偏光状態の射影の確率論的解釈を行う。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 00:25:51 GMT)
Characterizing stable regions in the residual stream of LLMs [0.0] モデル出力が小さいアクティベーション変化に敏感なままであるトランスフォーマーの残ストリーム内の「安定領域」を同定する。
これらの領域はトレーニング中に現れ、トレーニングの進行やモデルサイズの増加に伴ってより定義される。
解析の結果、これらの安定な領域は、類似の領域内のクラスタを誘導する意味的区別と一致し、同一領域からのアクティベーションは、同様の次のトークン予測をもたらすことが示唆された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:27:02 GMT)
Boson-fermion algebraic mapping in second quantization [0.0] 生成と演算子のボゾン代数からフェルミオン代数への写像に基づく構造を導出する手法を提案する。
この構造は非可換グラスマン型変数を含む変形グラスマン代数に対応する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:37:34 GMT)
Bi-Filtration and Stability of TDA Mapper for Point Cloud Data [0.0] カバーサイズとtextbf$epsilon$ を同時に増加させることで安定性を得る方法を示す。
特に,2つのデータセット間のホモロジー群の被覆サイズと$epsilon$はtextbf2$delta$-interleavedであることを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 21:08:47 GMT)
Benchmarking Deep Learning Models for Object Detection on Edge Computing Devices [0.0] YOLOv8 (Nano, Small, Medium), EfficientDet Lite (Lite0, Lite1, Lite2), SSD (SSD MobileNet V1, SSDLite MobileDet) など,最先端のオブジェクト検出モデルの評価を行った。
これらのモデルをRaspberry Pi 3、4、5、TPUアクセラレーター、Jetson Orin Nanoといった一般的なエッジデバイスにデプロイし、エネルギー消費、推論時間、平均精度(mAP)といった重要なパフォーマンス指標を収集しました。
この結果から,SSD MobileNet V1などの低mAPモデルの方がエネルギー効率が高く,高速であることが示唆された。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 10:56:49 GMT)
BabyLlama-2: Ensemble-Distilled Models Consistently Outperform Teachers
With Limited Data [0.0] 本研究では,BabyLMコンペティションのための1000万語コーパス上で,2人の教師から事前訓練された3億4500万のパラメータモデル蒸留であるBabyLlama-2を提案する。
BLiMPとSuperGLUEのベンチマークでは、BabyLlama-2は、同じデータミックスと教師モデルで、1000万ワードデータセットと1億ワードデータセットの両方でトレーニングされたベースラインを上回っている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 19:46:49 GMT)
Automatic Library Migration Using Large Language Models: First Results [0.0] API移行タスクをサポートするためにChatGPTの利用を検討している研究の最初の成果を報告する。
一番良い結果はワンショットのプロンプトで達成され、次に思考の連鎖が続くことを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:17:06 GMT)
Assessing the Level of Toxicity Against Distinct Groups in Bangla Social Media Comments: A Comprehensive Investigation [0.0] 本研究は, トランスジェンダー, 先住民, 移民の3つの特定のグループを対象として, ベンガル語における有毒なコメントを同定することに焦点を当てた。
この方法論は、データセット、手動のアノテーションの作成と、Bangla-BERT、bangla-bert-base、distil-BERT、Bert-base-multilingual-casedといったトレーニング済みのトランスフォーマーモデルの使用を含む。
実験の結果、Bangla-BERTは代替モデルを超え、F1スコアは0.8903に達した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:48:59 GMT)
An Integrated Deep Learning Framework for Effective Brain Tumor
Localization, Segmentation, and Classification from Magnetic Resonance Images [0.0] 脳内の腫瘍は、様々な種類の脳細胞から生じる脳組織内の異常な細胞増殖によって生じる。
本研究は,MRI画像からのグリオーマの局在,セグメンテーション,分類のためのDLフレームワークを提案する。
提案モデルでは,早期診断を可能とし,患者に対してより正確な治療オプションを提供することで,医療用AIの進歩を期待できる結果が得られた。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 18:38:57 GMT)
An Alternative to Multi-Factor Authentication with a Triple-Identity Authentication Scheme [0.0] デュアルパスワードログイン認証システムには、外部と対話するための2つのエントリポイント(ユーザ名とパスワードフィールド)がある。
個人情報を使わずに、ユーザー名とパスワードについて識別子を定義することはできない。
利用可能なユーザのログイン名とパスワードが無意味なハッシュ要素のマトリックスにランダムに変換されることが鍵となるトリプルアイデンティティ認証が確立される。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:48:32 GMT)
An Adaptive Screen-Space Meshing Approach for Normal Integration [0.0] この研究は、画像領域に適応的な表面三角測量を導入し、その後、三角形メッシュ上で通常の積分を行う。
曲率に基づいて、平坦な領域を識別し、画素を三角形に集約する。
ピクセルグリッドと比較して、トライアングルメッシュは表面の詳細に局所的に適応し、スペーサー表現を可能にします。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 13:12:58 GMT)
Amplifying hybrid entangled states and superpositions of coherent states [0.0] 増幅スキームの忠実度とHESの利得はコヒーレント状態のそれと同じであることを示す。
SCSは、コヒーレント状態の振幅に依存する増幅スキームによって非常に非自明な振る舞いを示す。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 02:24:22 GMT)
Against (unitary) interpretation (of quantum mechanics): removing the metaphysical load [0.0] 我々は「ユニタリ量子力学」が量子力学の解釈であることを示す。
単位」対運用上の不一致の根源は、後者が測定プロセスを不可逆的に扱うことである。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 16:19:44 GMT)
Advancing Cyber Incident Timeline Analysis Through Rule Based AI and Large Language Models [0.0] 本稿では,ルールベース人工知能(R-BAI)アルゴリズムとLarge Language Models(LLM)を組み合わせた新しいフレームワークGenDFIRを紹介する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 06:50:29 GMT)
AI-Driven Risk-Aware Scheduling for Active Debris Removal Missions [0.0] 低地球軌道でのデブリは、宇宙の持続可能性と宇宙船の安全性に対する重大な脅威である。
装甲輸送車両(OTV)は破片の軌道離脱を促進し、将来の衝突リスクを減らす。
深部補強学習(DRL)に基づく装甲決定計画モデルを構築し,OTVを最適デブリ除去シークエンシングを計画する。
提案手法を用いることで、最適なミッションプランを見つけ、衝突リスクの高い破片のリスクハンドリングを含む自律的に計画の更新を学べることが示されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 15:16:07 GMT)
AI Enabled Neutron Flux Measurement and Virtual Calibration in Boiling
Water Reactors [0.0] 原子炉コア内の3次元の電力分布を正確に把握することは、原子炉の安全かつ経済的操作を保証するために不可欠である。
機械学習(ML)は、メンテナンスコストの削減、オンラインローカル電力測定の精度の向上、オフラインとオンライン電力分布間のバイアスの低減に使用されている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 22:30:09 GMT)
A parametric framework for kernel-based dynamic mode decomposition using deep learning [0.0] 提案されたフレームワークは、オフラインとオンラインの2つのステージで構成されている。
オンラインステージでは、これらのLANDOモデルを活用して、所望のタイミングで新しいデータを生成する。
高次元力学系に次元還元法を適用して, トレーニングの計算コストを低減させる。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 11:13:50 GMT)
A Novel Framework for Analyzing Structural Transformation in Data-Constrained Economies Using Bayesian Modeling and Machine Learning [0.0] 農業経済からより多様化した産業やサービスベースのシステムへの移行は、経済発展の重要な要因である。
低所得国と中所得国(LMIC)では、データの不足と信頼性の欠如が、このプロセスの正確な評価を妨げる。
本稿では,ベイジアン階層モデリング,機械学習に基づくデータ計算,因子分析を統合することで,これらの課題に対処する新しい統計フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 08:39:41 GMT)
A Noisy Approach to Intrinsically Mixed-State Topological Order [0.0] 得られた混合状態は内在的に混合状態位相秩序(imTO)を示すことができることを示す。
我々は、ある異常な1-形式対称性の下でデコヒートされた混合状態が強い対称性を持つ、イムト(ImTO)を総称的にガグアウトすることは、イムト(ImTO)をもたらすことを見出した。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 23:29:55 GMT)
A Learning Support Method for Multi-threaded Programs Using Trace Tables [0.0] マルチスレッドプログラムは、並列処理のためにアプリケーションプロセスを複数のスレッドに分割することで、応答性とリソースの保存を改善することが期待されている。
しかし、スケジューリングと複数のスレッドの相互作用のため、実行時の動作はシングルスレッドプログラムよりも複雑である。
トレーステーブルを用いたマルチスレッドプログラムの学習ツールを提案する。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 07:46:38 GMT)
A Counterdiabatic Route to Entanglement Steering and Dynamical Freezing in the Floquet Lipkin-Meshkov-Glick Model [0.0] この研究は、反断熱駆動(CD)が、長い時間、絡み合った軌道に沿って集合スピン系を操る強力なツールであることを示した。
特に、CD駆動は周期的に駆動されるリプキン-メシュコフ-グリックモデルにおいて、多くの初期状態に対する近似的なストロボスコピック凍結と永遠の絡み合い振動をもたらす。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 12:39:11 GMT)
A Concise Mathematical Description of Active Inference in Discrete Time [0.0] 本論文の主部は、アクション選択の理論を詳述した詳細な例を含む、このトピックの基本的紹介として機能する。
付録では、より微妙な数学的詳細が議論されている。
この部分は、既に活発な推論文学を研究しているが、数学的詳細や導出を理解するのに苦労している読者を対象としている。
論文参考訳(メタデータ) (Wed, 25 Sep 2024 17:59:18 GMT)