VimTS: A Unified Video and Image Text Spotter for Enhancing the Cross-domain Generalization [115.6] VimTSは、異なるタスク間のより良い相乗効果を達成することにより、モデルの一般化能力を高める。
本研究では,コンテンツ変形場(CoDeF)アルゴリズムを利用した合成ビデオテキストデータセット(VTD-368k)を提案する。
ICDAR2015ビデオとDSText v2では,ビデオレベルのクロスドメイン適応に対して,従来のエンドツーエンドビデオスポッティング手法を超越している。
論文参考訳(メタデータ) (Sun, 5 May 2024 01:26:55 GMT)
Multimodal Fusion on Low-quality Data: A Comprehensive Survey [110.2] 本稿では,野生におけるマルチモーダル核融合の共通課題と最近の進歩について考察する。
低品質データ上でのマルチモーダル融合で直面する4つの主な課題を同定する。
この新たな分類によって、研究者はフィールドの状態を理解し、いくつかの潜在的な方向を特定することができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:29:35 GMT)
Retroformer: Retrospective Large Language Agents with Policy Gradient Optimization [103.7] 本稿では,レトロスペクティブモデルを学習することで,大規模言語エージェントを強化するための原則的枠組みを提案する。
提案するエージェントアーキテクチャは,事前学習した言語モデルを微調整するために,複数の環境やタスクにまたがる報酬から学習する。
様々なタスクの実験結果から、言語エージェントは時間とともに改善することが示された。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:04:49 GMT)
Instantaneous Perception of Moving Objects in 3D [86.4] 周囲の交通参加者の3次元運動の認識は、運転安全に不可欠である。
本研究では,物体点雲の局所的な占有率の達成を利用して形状を密度化し,水泳人工物の影響を軽減することを提案する。
広汎な実験は、標準的な3次元運動推定手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 01:07:24 GMT)
ATG: Benchmarking Automated Theorem Generation for Generative Language Models [83.9] 人間はより広範に複雑な数学的結果を探求するために新しい定理を開発することができる。
現在の生成言語モデル(LM)は、定理の自動証明において著しく改善されている。
本稿では,エージェントが価値ある(あるいは新しい)定理を自動生成できるかどうかを評価する自動定理生成ベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:06:37 GMT)
Guaranteed Approximation Bounds for Mixed-Precision Neural Operators [83.6] 我々は、ニューラル演算子学習が本質的に近似誤差を誘導する直感の上に構築する。
提案手法では,GPUメモリ使用量を最大50%削減し,スループットを58%向上する。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:01:31 GMT)
QualEval: Qualitative Evaluation for Model Improvement [82.7] モデル改善のための手段として,自動定性評価による定量的スカラー指標を付加するQualEvalを提案する。
QualEvalは強力なLCM推論器と新しいフレキシブルリニアプログラミングソルバを使用して、人間の読みやすい洞察を生成する。
例えば、その洞察を活用することで、Llama 2モデルの絶対性能が最大15%向上することを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:53:50 GMT)
Mastering Text-to-Image Diffusion: Recaptioning, Planning, and Generating with Multimodal LLMs [77.9] トレーニング不要なテキスト・画像生成/編集フレームワークであるRecaption, Plan and Generate(RPG)を提案する。
RPGは、マルチモーダルLLMの強力な連鎖推論能力を活用し、テキストから画像への拡散モデルの合成性を高める。
本フレームワークはMLLMアーキテクチャとの広範な互換性を示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:50:54 GMT)
DoraemonGPT: Toward Understanding Dynamic Scenes with Large Language Models (Exemplified as A Video Agent) [73.1] 本稿では,LLMによる動的シーン理解のための包括的かつ概念的にエレガントなシステムであるドラモンGPTについて検討する。
質問/タスクのあるビデオが与えられた場合、DoraemonGPTは入力されたビデオをタスク関連の属性を格納するシンボリックメモリに変換することから始める。
我々は,DoraemonGPTの有効性を,3つのベンチマークといくつかのアプリ内シナリオで広範囲に評価した。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:12:19 GMT)
R-Tuning: Instructing Large Language Models to Say `I Don't Know' [66.1] 大きな言語モデル(LLM)は、優れたパフォーマンスで多くのドメインに革命をもたらしたが、それでもその課題に直面している。
事前の指導チューニング方法は、モデルが知識を知っているかどうかに関わらず、モデルに文章を完成させるよう強制する。
我々はRefusal-Aware Instruction Tuning (R-Tuning)と呼ばれる新しいアプローチを提案する。
実験の結果、R-Tuningは、既知の質問に答えたり、未知の質問に答えるのを控えるモデルの能力を効果的に改善することを示した。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:00:14 GMT)
MVIP-NeRF: Multi-view 3D Inpainting on NeRF Scenes via Diffusion Prior [65.1] 露光RGBと深度2Dの塗布監督を基盤としたNeRF塗布法は,その基礎となる2D塗布能力によって本質的に制限されている。
我々は,NeRF塗装における拡散先行の可能性を生かし,外観面と幾何学面の両方に対処するMVIP-NeRFを提案する。
実験の結果,従来のNeRF塗装法よりも外観や形状の回復性が良好であった。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:04:42 GMT)
Decision-Oriented Dialogue for Human-AI Collaboration [62.4] そこでは,大規模言語モデル(LM)のようなAIアシスタントが,自然言語を介して複数の人間と協調して複雑な意思決定を行うための,意思決定指向対話と呼ばれるタスクのクラスについて述べる。
日常的な意思決定に直面する3つの領域を定式化し,(1)レビュアーの会議論文への課題の選択,(2)都市における複数段階の旅程の計画,(3)友人集団の旅行計画の交渉を行う。
各タスクに対して、エージェントが到達した最終決定の質に基づいて報酬を受け取る対話環境を構築する。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:41:13 GMT)
Improve Temporal Awareness of LLMs for Sequential Recommendation [61.7] 大規模言語モデル(LLM)は、幅広い汎用タスクを解く際、印象的なゼロショット能力を示した。
LLMは時間的情報の認識と利用に不足しており、シーケンシャルなデータの理解を必要とするタスクではパフォーマンスが悪い。
LLMに基づくシーケンシャルレコメンデーションのために、歴史的相互作用の中で時間情報を利用する3つのプロンプト戦略を提案する。
論文参考訳(メタデータ) (Sun, 05 May 2024 00:21:26 GMT)
A Characterization of Semi-Supervised Adversarially-Robust PAC Learnability [57.5] 本研究では、半教師付きPACモデルにおいて、時間攻撃をテストするために、逆向きに頑健な予測器を学習する問題について検討する。
最悪の分布自由モデルにおいても,半教師付き頑健な学習には大きなメリットがあることが示されている。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:00:33 GMT)
A New Linear Scaling Rule for Private Adaptive Hyperparameter Optimization [57.5] 本稿では,HPOのプライバシコストを考慮した適応型HPO法を提案する。
我々は22のベンチマークタスク、コンピュータビジョンと自然言語処理、事前学習と微調整で最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:26:16 GMT)
Deep Regression Representation Learning with Topology [57.2] 回帰表現の有効性は,そのトポロジによってどのように影響されるかを検討する。
Information Bottleneck (IB) 原則は、有効性表現を学ぶための重要なフレームワークである。
本稿では,回帰に特有な正則化器PH-Regを導入し,特徴空間の内在次元と位相を対象空間と一致させる。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:57:20 GMT)
Evaluate What You Can't Evaluate: Unassessable Quality for Generated Response [56.3] 大規模な言語モデルに基づく参照不要評価器の使用には課題がある。
参照なし評価器は、異なるセマンティクス応答を持つオープンな例により適している。
対話応答の質を評価するため, LLM に基づく推論不要評価器の使用にはリスクがある。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:47:48 GMT)
Making Retrieval-Augmented Language Models Robust to Irrelevant Context [55.6] ALMの重要なデシプラタムは、検索された情報が関連する場合のパフォーマンスをモデル化するのに役立つことである。
近年の研究では、検索の増大がパフォーマンスに悪影響を及ぼすことが示されている。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:58:24 GMT)
Robust Collaborative Perception without External Localization and Clock Devices [54.6] 複数のエージェントをまたいだ一貫した空間的時間的調整は、協調的な知覚の基礎である。
従来の手法は、ローカライゼーションとクロック信号を提供するために外部デバイスに依存している。
本稿では,様々なエージェントの知覚データに内在する幾何学的パターンを認識して整列する手法を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:20:36 GMT)
Sim2Real Transfer for Audio-Visual Navigation with Frequency-Adaptive Acoustic Field Prediction [51.7] 本稿では,音場予測 (AFP) とウェイポイントナビゲーションに切り離して, 音声視覚ナビゲーションのためのsim2real の最初の治療法を提案する。
次に、特定の周波数サブバンドのみを入力とするAFPモデルをトレーニングすることにより、実世界のデータを収集し、シミュレーションと実世界のスペクトル差を測定する。
最後に、実際のロボットプラットフォームを構築し、転送されたポリシーが、音を鳴らすオブジェクトにうまくナビゲートできることを示します。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:01:31 GMT)
Paintings and Drawings Aesthetics Assessment with Rich Attributes for Various Artistic Categories [47.7] Aesthetics of Paintings and Drawingsデータセットは、合計4985枚の画像で構成され、注釈数は31100枚を超える。
APDDの建設は世界中の28人のプロアーティストから活発に参加し、芸術分野を専門とする数十人の学生が参加した。
最終的なAPDDデータセットは、合計4985のイメージで構成され、アノテーション数は31100を超える。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:05:56 GMT)
RegionPLC: Regional Point-Language Contrastive Learning for Open-World 3D Scene Understanding [46.3] 複数の2次元基礎モデルから派生した3次元視覚言語対を融合する3次元認識型SFusion戦略を導入する。
我々は、堅牢で効果的な3D学習を実現するために、地域対応のポイント識別型コントラスト学習目標を考案する。
我々のモデルは、セマンティックスとインスタンスセグメンテーションにおいて、平均17.2%と9.1%の3Dオープンワールドシーン理解アプローチよりも優れている。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:44:55 GMT)
MedAdapter: Efficient Test-Time Adaptation of Large Language Models towards Medical Reasoning [43.8] MedAdapterは,大規模言語モデル(LLM)の生体医学的応用に対するテスト時間適応のための統合されたポストホックアダプタである。
MedAdapterは、バイオメディカル推論において、ホワイトボックスとブラックボックスの両方に効果的に適応し、それぞれ25.48%と11.31%の平均的なパフォーマンス向上を達成した。
モデルパフォーマンス、計算リソース、データプライバシのバランスをとるという課題に直面したMedAdapterは、効率的でプライバシ保護、費用対効果、透明なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:06:31 GMT)
Residual-Conditioned Optimal Transport: Towards Structure-preserving Unpaired and Paired Image Restoration [42.0] 画像復元のためのResidual-Conditioned Optimal Transport (RCOT) アプローチを提案する。
二重性により、RCOT問題は最小限の最適化問題に変換され、ニューラルネットワークを敵対的に訓練することで解決される。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:19:04 GMT)
A Two-Stage Prediction-Aware Contrastive Learning Framework for Multi-Intent NLU [41.5] NLU(Multi-intent Natural Language Understanding)は、単一発話における複数の意図から生じるモデルの混乱によって、非常に難しい課題を提示する。
以前の作業では、異なる多目的ラベル間のマージンを増やすために、モデルを対照的に訓練した。
マルチインテリジェントNLUのための2段階予測対応コントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:09:55 GMT)
RICE: Breaking Through the Training Bottlenecks of Reinforcement Learning with Explanation [40.8] RICEは強化学習のための革新的な精製手法である。
トレーニングボトルネックを突破するための説明手法が組み込まれている。
様々なRL環境と実世界のアプリケーションでRICEを評価する。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:06:42 GMT)
Hardware Honeypot: Setting Sequential Reverse Engineering on a Wrong Track [40.8] この研究は、有限状態機械(FSM)のリバースエンジニアリング(RE)に対する新しいアプローチを示す。
ハードウェアのFSMミツバチはREツールを間違っていますが、ツールに関しては非常に魅力的なFSMです。
その結果、現在最先端のRE法はFSM候補として非常に魅力的なミツバチを好んでいるか、あるいは正しいFSMをもはや検出していないことが明らかとなった。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:34:39 GMT)
Spectral Convergence of Complexon Shift Operators [38.9] 本研究では,グラフトンの高次化によるトポロジカル信号処理の転送可能性について検討する。
グラフオンシフト演算子とメッセージパスニューラルネットワークにインスパイアされた我々は、限界複素数と複素数シフト演算子を構築する。
単純複素信号列が複素数信号に収束すると、対応するCSOの固有値、固有空間、フーリエ変換が極限複素数信号の信号に収束することを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 10:52:26 GMT)
Visual Attention Methods in Deep Learning: An In-Depth Survey [37.2] 人間の認知システムにインスパイアされた注意は、特定の情報に対する人間の認知意識を模倣するメカニズムである。
ディープラーニングは多くのアプリケーションのパフォーマンス向上に注意を払っています。
この文献は、深層モデルに注意を向ける研究者を導くための注意技術に関する包括的な調査を欠いている。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:44:14 GMT)
Region-specific Risk Quantification for Interpretable Prognosis of COVID-19 [36.7] 新型コロナウイルス(COVID-19)のパンデミックは、世界的な公衆衛生を悪化させ、正確な診断と疾病対策の介入を必要とし、死亡率を下げている。
胸部X線画像(CXR)を用いて、新型コロナウイルスの予後に対する理解と信頼の向上を目的とした、解釈可能な深層生存予測モデルを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:08:38 GMT)
NetLLM: Adapting Large Language Models for Networking [36.6] 我々は,ネットワーク問題を解決するために,大規模言語モデルを効率的に適応する最初のフレームワークであるNetLLMを提案する。
ネットワークへのLLM適応におけるNetLLMの有効性を実証し、適応されたLLMが最先端のアルゴリズムよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:21:17 GMT)
Harmonizing SO(3)-Equivariance with Neural Expressiveness: a Hybrid Deep Learning Framework Oriented to the Prediction of Electronic Structure Hamiltonian [36.1] HarmoSEは、ディープラーニングのための2段階のケースケード回帰フレームワークである。
第1段階は、豊富なSO(3)-同変の特徴を抽出したハミルトニアンを予測する。
第2段階はハミルトニアンの詳細な予測として第1段階の出力を洗練させる。
論文参考訳(メタデータ) (Sun, 5 May 2024 03:51:17 GMT)
PVTransformer: Point-to-Voxel Transformer for Scalable 3D Object Detection [36.0] 点雲のための3Dオブジェクト検出器は、しばしば、スパースポイントをグリッドのようなボクセルや柱にエンコードするために、プールベースのPointNetに依存する。
本稿では,3次元検出のための変圧器を用いたポイント・ツー・ボクセルアーキテクチャであるPVTransformerを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:44:41 GMT)
Stochastic RAG: End-to-End Retrieval-Augmented Generation through Expected Utility Maximization [35.7] RAGは、検索拡張生成(RAG)モデルのエンドツーエンド最適化のための新しいアプローチである。
我々はGumbel-top-k をストレートスルーで使い、置換せずにサンプリングに微分可能な近似を提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:42:33 GMT)
Spectral Heterogeneous Graph Convolutions via Positive Noncommutative Polynomials [34.7] 正のスペクトル不均一グラフ畳み込みネットワーク(PSHGCN)を提案する。
PSHGCNは、有効なヘテロジニアスグラフフィルタを学習するための、単純かつ効果的な方法を提供する。
PSHGCNは目覚ましいスケーラビリティを示し、数百万のノードとエッジからなる大規模な実世界のグラフを効率的に処理する。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:45:00 GMT)
Adapting to Distribution Shift by Visual Domain Prompt Generation [34.2] いくつかのラベルのないデータを使って、テスト時にモデルを適応し、分散シフトに対処する。
ソースドメインから移行可能な知識を学ぶための知識銀行を構築します。
提案手法は,WILDSやDomainNetを含む5つの大規模ベンチマークにおいて,従来よりも優れている。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:44:04 GMT)
Delocate: Detection and Localization for Deepfake Videos with Randomly-Located Tampered Traces [33.4] Delocateは、未知のドメインのDeepfakeビデオの認識とローカライズが可能な、新しいDeepfake検出モデルである。
広範に使用されている4つのベンチマークデータセットに対する実験により、乱れ領域のローカライズに限らず、ドメイン間検出性能も向上することが示された。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:05:53 GMT)
MR-Transformer: Vision Transformer for Total Knee Replacement Prediction Using Magnetic Resonance Imaging [31.5] MRIを用いた人工膝関節置換術(TKR)予測のための変圧器を用いた深層学習モデルMR-Transformerを開発した。
このモデルは、ImageNet事前学習を取り入れ、MR画像から3次元(3D)空間相関をキャプチャする。
論文参考訳(メタデータ) (Sun, 5 May 2024 01:59:11 GMT)
Graph as Point Set [31.4] 本稿では,相互接続ノードを独立点の集合に変換するグラフ・ツー・セット変換法を提案する。
これにより、セットエンコーダを使用してグラフから学習することが可能になり、グラフニューラルネットワークの設計空間が大幅に拡張される。
提案手法の有効性を示すために,グラフから変換された点集合を入力として受け入れる変換器アーキテクチャであるPoint Set Transformer (PST)を導入する。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:29:41 GMT)
LMFlow: An Extensible Toolkit for Finetuning and Inference of Large Foundation Models [31.1] ファンデーションモデルは、従来のアプローチをはるかに超越した、一般的な人間レベルのインテリジェンスを達成するための優れた能力を示してきた。
ほとんどの基礎モデルの重大な欠点は、特殊ドメインやタスク固有のアプリケーションのパフォーマンスにある。
本稿では,一般基礎モデルのドメイン・タスク・アウェア・ファインタニングを簡略化することを目的としたLMFlowを紹介する。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:13:02 GMT)
Fairness of ChatGPT [31.0] 本研究は,ChatGPTを研究事例として,LLMの有効性と妥当性を体系的に評価することを目的とする。
われわれは、ChatGPTの教育、犯罪学、金融、医療などハイテイク分野における業績を評価することに重点を置いている。
この研究は、LLMの公平性のパフォーマンスをより深く理解し、バイアス軽減を促進し、責任あるAIシステムの開発を促進する。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:15:30 GMT)
Responsible AI: Portraits with Intelligent Bibliometrics [30.5] この研究は、責任あるAIを定義し、そのコア原則を特定した。
この研究は、2015年からAIコミュニティが寄稿した17,799の論文を実証的に調査した。
複数の分野から380の記事からなるコアコホートの分析は、責任あるAIの最新の進歩を捉えている。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:40:22 GMT)
Exploring the Compositional Deficiency of Large Language Models in Mathematical Reasoning [30.4] 数学的推論における大規模言語モデル(LLM)の構成性について検討する。
論理的欠陥の問題は実世界では非常に稀であるため、これらは LLM に対する見当たらないケースを表している。
実験の結果, LLM には必要知識の双方の構成要素があるが, これらの新規事例を扱うために, テキストbfspontanely に組み合わせることはできないことがわかった。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:35:30 GMT)
A Self-explaining Neural Architecture for Generalizable Concept Learning [29.9] 現在,SOTA の概念学習アプローチは,概念の忠実さの欠如と,概念の相互運用の限界という2つの大きな問題に悩まされている。
ドメイン間の概念学習のための新しい自己説明型アーキテクチャを提案する。
提案手法は,現在広く使われている4つの実世界のデータセットに対するSOTA概念学習手法に対して有効であることを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:11:25 GMT)
MERIT: Multi-view Evidential learning for Reliable and Interpretable liver fibrosis sTaging [29.5] 本稿では,MERITと呼ばれる顕在的学習に基づく新しいマルチビュー手法を提案する。
MERITは、予測の不確実性を可能とし、信頼性を高め、論理ベースの組み合わせルールを用いて解釈性を向上させる。
その結果、提案したMERITの有効性を示し、信頼性を強調し、アドホックとポストホックの両方の解釈性を提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:52:28 GMT)
Open-ended VQA benchmarking of Vision-Language models by exploiting Classification datasets and their semantic hierarchy [27.5] 本稿では、よく知られた視覚分類データセットに基づく新しいVQAベンチマークを提案する。
また,ラベル空間のセマンティックな階層構造を用いて,基底構造カテゴリに関するフォローアップ質問を自動的に生成することを提案する。
私たちの貢献は、より正確で有意義な評価の基礎を築くことを目的としています。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:34:28 GMT)
Matten: Video Generation with Mamba-Attention [27.0] ビデオ生成のためのMamba-Attentionアーキテクチャを用いた最先端の潜伏拡散モデルであるMattenを紹介する。
最小の計算コストで、Mattenは局所的なビデオコンテンツモデリングとグローバルなビデオコンテンツモデリングのための双方向のMambaに空間的注意を払っている。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:36:45 GMT)
Parameter-Efficient Fine-Tuning with Discrete Fourier Transform [26.6] ローランク適応(LoRA)は近年、微調整基礎モデルに多くの関心を集めている。
デルタW$を空間領域の行列として扱い、そのスペクトル係数のごく一部しか学習しないフーリエFTを導入する。
提案手法は,様々なタスクにおいてLoRAよりも少ないパラメータで同等あるいは優れた性能を示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:15:24 GMT)
Towards Generalizable Neural Solvers for Vehicle Routing Problems via Ensemble with Transferrable Local Policy [24.9] 車両ルーティング問題(VRP)のための多くのニューラルネットワーク構築手法は、特定のノード分布と限られたスケールを持つ合成問題インスタンスに焦点を当てている。
我々は,局所移動可能な局所的特徴から学習する補助的政策を設計し,それを典型的な建設方針と統合し,アンサンブル政策を形成する。
共同トレーニングでは、集約されたポリシが協調的かつ補完的に実行され、一般化が促進される。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:55:07 GMT)
Deep Orthogonal Hypersphere Compression for Anomaly Detection [24.5] 多くのよく知られた効果的な異常検出法は、合理的な決定境界が超球形であることを仮定する。
本稿では,従来のハイパースフィア学習を改良した新しい深部異常検出モデルを提案する。
本稿では,超球面よりもコンパクトな決定領域が得られる超球面殻を得るための超球面圧縮法を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:45:57 GMT)
Adaptive Guidance Learning for Camouflaged Object Detection [23.8] 本稿では,適応型誘導学習ネットワーク「textitAGLNet」を提案する。
広く使用されている3つのCODベンチマークデータセットの実験により,提案手法が大幅な性能向上を実現することが示された。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:21:58 GMT)
Source-Free Domain Adaptation Guided by Vision and Vision-Language Pre-Training [23.6] ソースフリードメイン適応(SFDA)は、完全にラベル付けされたソースドメインでトレーニングされたソースモデルを、関連するがラベル付けされていないターゲットドメインに適応させることを目的としている。
従来のSFDAパイプラインでは、ソースモデルを初期化するために、大量のデータ(イメージネットなど)を事前訓練した特徴抽出器が使用される。
トレーニング済みネットワークを対象適応プロセスに組み込むための統合フレームワークを導入する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:48:13 GMT)
How do LLMs Support Deep Learning Testing? A Comprehensive Study Through the Lens of Image Mutation [23.2] ビジュアルディープラーニング(VDL)システムは、画像認識、オブジェクト検出、自律運転といった現実世界のアプリケーションで大きな成功を収めている。
VDLの信頼性を評価するために、ソフトウェアテストは画像意味論よりも多様で制御可能な突然変異を必要とする。
MLLM(Multi-modal large language model)の急速な開発により、命令駆動方式による画像突然変異の可能性も導入された。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:40:20 GMT)
MagicPose: Realistic Human Poses and Facial Expressions Retargeting with Identity-aware Diffusion [22.6] 人間の2次元ポーズと表情の拡散に基づくモデルであるMagicPoseを提案する。
画像拡散モデルの事前の知識を活用することで、MagicPoseは目に見えない人間のアイデンティティや複雑なポーズをうまく一般化する。
提案したモデルは使いやすく、安定拡散に対するプラグインモジュール/拡張と見なすことができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:07:34 GMT)
NegativePrompt: Leveraging Psychology for Large Language Models Enhancement via Negative Emotional Stimuli [21.8] 大規模言語モデル(LLM)は幅広い応用に不可欠なものとなっている。
LLMには感情的な知性があり、肯定的な感情刺激によってさらに発展することができる。
心理学的原理に基づく新しいアプローチであるNegativePromptを紹介する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:06:07 GMT)
Relay Decoding: Concatenating Large Language Models for Machine Translation [21.4] 我々はRD(Relay Decoding)と呼ばれる革新的なアプローチを提案し、ソースとターゲット言語を個別にサポートする2つの異なる大規模モデルを結合する。
これら2つのモデル間の接続を容易にするための単純なマッピング層を導入し、訓練に限られた並列データを活用することにより、機械翻訳タスクにおいて優れた結果が得られた。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:42:25 GMT)
Efficient Text-driven Motion Generation via Latent Consistency Training [21.3] 動作生成のための動作遅延整合性トレーニング(MLCT)を提案し,推論時の計算量と時間消費を緩和する。
低次元運動潜在空間に拡散パイプラインを適用し,各関数評価の計算負担を軽減する。
2つの人体運動生成ベンチマーク実験により、提案モデルが10%未満の時間コストで最先端の性能を達成することを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:11:57 GMT)
Multi-Task Reinforcement Learning with Mixture of Orthogonal Experts [20.9] MTRL(Multi-Task Reinforcement Learning)は、様々な問題にまたがる汎用スキルを持つエージェントの育成問題に取り組む。
この目的のために、表現の共有は、タスクのユニークな特徴と共通の特徴の両方をキャプチャする上で、基本的な役割を担っている。
本稿では,MTRLにおける表現学習の新たなアプローチを提案し,多様性を促進するために表現を用いたタスク間の共通構造をカプセル化する。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:04:52 GMT)
Finite-Time Convergence and Sample Complexity of Actor-Critic Multi-Objective Reinforcement Learning [20.5] 本稿では多目的強化学習(MORL)問題に取り組む。
MOACと呼ばれる革新的なアクター批判アルゴリズムを導入し、競合する報酬信号間のトレードオフを反復的に行うことでポリシーを見出す。
論文参考訳(メタデータ) (Sun, 5 May 2024 23:52:57 GMT)
Removal and Selection: Improving RGB-Infrared Object Detection via Coarse-to-Fine Fusion [20.1] 既存の融合戦略のほとんどは、RGBとIR画像をディープニューラルネットワークに直接入力し、検出性能が劣る。
2つのモダリティの特徴を清浄し、融合させるために、新しい粗大な視点を導入する。
粗大な核融合戦略の有効性を検証するため、除去・選択検出器(RSDet)と呼ばれる新しい物体検出器を構築した。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:41:59 GMT)
Adversarially Robust PAC Learnability of Real-Valued Functions [19.5] 脂肪散乱次元のクラスは $ell_p$ 摂動条件で学習可能であることを示す。
そこで本研究では,実関数に対する非依存的な新しいサンプルスキームを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:55:10 GMT)
Multi-Agent RL-Based Industrial AIGC Service Offloading over Wireless Edge Networks [19.5] 本稿では,モデル駆動型産業用AIGC協調エッジラーニングフレームワークを提案する。
このフレームワークは、現実的なサンプル合成とエッジベースの最適化機能を活用することにより、効率的な数ショット学習を容易にすることを目的としている。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:31:47 GMT)
Improved Crop and Weed Detection with Diverse Data Ensemble Learning in Agriculture [18.5] 現代の農業は、現場における作物や雑草の正確な検出、地域化、定量化を必要とする、サイト・スペクティブ・ファーム・マネジメントの実践に大きく依存している。
既存の手法は、制御されていない畑の条件を考慮に入れた農業データを増強し、合成する。
我々は,他の作物や雑草に特有のデータを活用することを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:19:06 GMT)
Convergence and Complexity Guarantee for Inexact First-order Riemannian Optimization Algorithms [18.4] tBMM は $O(epsilon-2)$ 内の $ilon$-定常点に収束することを示す。
軽度反復の下では、全最適性ギャップが有界である場合、各反復においてサブプロブレムが解かれるときの結果は依然として保たれる。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:53:14 GMT)
Get more for less: Principled Data Selection for Warming Up Fine-Tuning in LLMs [18.2] この研究は、膨大なラベルのないオープンデータから事前訓練された言語モデルへの活用と選択に焦点を当てている。
特定の条件下での微調整タスクに対するこのアプローチの最適性を示す。
提案手法は既存の手法よりもはるかに高速で,GPU時間内に数百万のサンプルにスケールアップする。
論文参考訳(メタデータ) (Sun, 5 May 2024 00:08:00 GMT)
Supervised Algorithmic Fairness in Distribution Shifts: A Survey [17.8] 現実世界のアプリケーションでは、機械学習モデルは特定のデータセットでトレーニングされることが多いが、データ分散がシフトする可能性のある環境にデプロイされる。
この変化は、人種や性別などのセンシティブな属性によって特徴づけられる特定のグループに不公平な予測をもたらす可能性がある。
論文参考訳(メタデータ) (Sun, 5 May 2024 01:01:03 GMT)
Scene-Adaptive Person Search via Bilateral Modulations [17.4] 本稿では、シーンノイズを同時に排除し、一貫した人物表現を維持するために、二元変調を導入することで、シーン適応型人物探索(SEAS)モデルを提案する。
SEASは2つのベンチマークデータセット(CUHK-SYSUは97.1% mAP、PRWは60.5% mAP)で最先端(SOTA)のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 07:21:17 GMT)
VectorPainter: A Novel Approach to Stylized Vector Graphics Synthesis with Vectorized Strokes [17.2] 本稿では,ベクトルグラフ合成のための新しい手法であるVectorPainterを提案する。
テキストプロンプトと参照スタイルのイメージが与えられた後、VectorPainterは、テキストプロンプトとコンテンツが一致し、スタイルが参照イメージに忠実なベクターグラフィックを生成する。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:01:29 GMT)
Fast One-Stage Unsupervised Domain Adaptive Person Search [17.2] 教師なしの人物探索は、アノテーションなしでシーンイメージのギャラリーセットから特定の対象人物をローカライズすることを目的としている。
本稿では,補完的なドメイン適応とラベル適応を統合したファストワンステージ非教師者探索(FOUS)を提案する。
Fousは、CUHK-SYSUとPRWという2つのベンチマークデータセット上で、最先端(SOTA)のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 07:15:47 GMT)
Defining and Preventing Asymmetric Mempool DoS in Ethereum with saferAd [17.1] 安全定義を2つの抽象的なDoSe、すなわち退行攻撃とロック攻撃で定式化する。
本稿では,メムプール保護のための安全な取引許可フレームワークであるSaferAdを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:45:04 GMT)
Multiple Code Hashing for Efficient Image Retrieval [16.8] 本稿では,ハッシュバケット探索の性能向上のため,マルチコードハッシュ(MCH)と呼ばれる新しいハッシュフレームワークを提案する。
MCHは各画像の複数のハッシュコードを学習し、各コードは画像の異なる領域を表す。
我々の知る限りでは、画像検索において各画像に対する複数のハッシュコードを学習することを提案する最初の研究である。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:37:05 GMT)
Multimodal Sense-Informed Prediction of 3D Human Motions [16.7] 本研究は,2つのモーダル情報に対して高忠実度を生成するマルチモーダル・インフォームド・モーション・予測手法を提案する。
視線情報は人間の意図と見なされ、動きとシーンの特徴が組み合わさって、世代を監督するために第3の意図に注意を向ける。
実世界の2つのベンチマークにおいて,提案手法は3次元人間のポーズと軌道予測の両方において最先端の性能を達成する。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:38:10 GMT)
A Single Online Agent Can Efficiently Learn Mean Field Games [16.0] 平均場ゲーム (MFGs) は大規模人口システムの振る舞いをモデル化するための有望なフレームワークである。
本稿では,オンラインサンプルを用いてMFNEを学習できるオンライン単エージェントモデルフリー学習方式を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:38:04 GMT)
Safe Reinforcement Learning with Learned Non-Markovian Safety Constraints [15.9] 我々は、安全に関する部分的状態行動軌跡の貢献を評価するために、信用割当を行う安全モデルの設計を行う。
学習された安全モデルを用いて安全なポリシーを最適化する有効なアルゴリズムを導出する。
安全報酬と安全コンプライアンスのトレードオフ係数を動的に適用する手法を考案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:27:22 GMT)
Modelling Opaque Bilateral Market Dynamics in Financial Trading: Insights from a Multi-Agent Simulation Study [15.4] 本稿では,オーストラリア国債取引における不透明な二国間市場を表現することを目的とする。
交渉された取引と限られた数のエージェントによって特徴づけられる二国間市場の特異性は、エージェントベースのモデリングと量的金融に価値ある洞察をもたらす。
市場構造における市場剛性の影響を考察し,市場設計における安定性の要素について考察する。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:42:20 GMT)
How far is Language Model from 100% Few-shot Named Entity Recognition in Medical Domain [14.6] 本研究の目的は、医療領域における100%Few-shot NERのLMのパフォーマンスを比較して、医療領域における100%Few-shot NERのLMのパフォーマンスについて答えることである。
以上の結果から, LLMは, 適切な例や適切な論理的枠組みの存在から, 数発のNERタスクにおいてSLMよりも優れていたことが示唆された。
本研究では, 検索者, 関連事例, 思考者として機能し, ステップ・バイ・ステップの推論プロセスを採用する,textscRT (Retrieving and Thinking) という, シンプルで効果的な手法を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:58:53 GMT)
CoverLib: Classifiers-equipped Experience Library by Iterative Problem Distribution Coverage Maximization for Domain-tuned Motion Planning [14.6] CoverLibは、ライブラリに経験分類器ペアを反復的に追加する。
未発見領域を効果的にカバーする機能に基づいて、次のエクスペリエンスを選択する。
それは、問題領域に対する高速な計画と高い成功率の両方を達成する。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:27:05 GMT)
Tree-based Ensemble Learning for Out-of-distribution Detection [14.5] TOOD検出は、単純なが効果的なツリーベースのアウト・オブ・ディストリビューション検出機構である。
私たちのアプローチは、ツリーベースの性質に対して解釈可能で堅牢です。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:49:51 GMT)
Blending Distributed NeRFs with Tri-stage Robust Pose Optimization [14.4] 3段ポーズ最適化を用いた分散NeRFシステムを提案する。
本稿では,三段ポーズ最適化を用いた分散NeRFシステムを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 10:27:03 GMT)
Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents [14.2] 治療過程全体をシミュレートした,エージェント病院という病院のシミュラムを紹介した。
すべての患者、看護師、医師は、大規模言語モデル(LLM)を利用した自律型エージェントである。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:53:51 GMT)
I$^3$Net: Inter-Intra-slice Interpolation Network for Medical Slice Synthesis [14.2] 医療画像は取得時間と走査装置によって制限される。CTおよびMRボリュームは、より厚いスライスで再構成され、高平面解像度と低平面解像度で異方性である。
我々は、データの性質から、軸方向からスライス的に行うと、他の視点から超解像を行うよりも大きな利益が得られるという興味深い現象を明らかにした。
Intra-Slice Interpolation Network (I$3$Net) を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:01:13 GMT)
Easy over Hard: A Simple Baseline for Test Failures Causes Prediction [13.8] NCCheckerは、失敗したテストログの障害原因を自動的に識別するツールである。
当社のアプローチには,ログの抽象化,ルックアップテーブルの構築,障害発生予測という,3つの主要なステージがあります。
我々は,10K以上のテストログを持つ実世界の産業データセット上で,プロトタイプを開発し,ツールの評価を行った。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:59:37 GMT)
Separate in the Speech Chain: Cross-Modal Conditional Audio-Visual Target Speech Extraction [13.6] 音声・視覚的対象音声抽出タスクでは、音声モダリティが支配的になりがちであり、視覚誘導の重要性を覆す可能性がある。
提案手法は,音声・視覚的対象音声抽出タスクを,音声知覚と音声生成の2段階に分割する。
生成した音声によって伝達される意味情報が、唇の動きによって伝達される意味情報と一致することを保証するために、対照的な意味マッチング損失を導入する。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:00:17 GMT)
Prompt Design and Engineering: Introduction and Advanced Methods [13.5] 本稿では、中核的な概念、Chain-of-ThoughtやReflectionのような高度な技術、およびLCMベースのエージェント構築の背景にある原則を紹介する。
論文参考訳(メタデータ) (Sun, 5 May 2024 00:54:26 GMT)
Temporal Inductive Logic Reasoning over Hypergraphs [13.5] 時間的インダクティブ論理推論(TILR)を提案する。
パス一貫性アルゴリズムと組み合わせることで、TILRは時間データと関係データの両方から論理規則を一般化することで学習する。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:14:07 GMT)
Machine learning of network inference enhancement from noisy measurements [13.1] 観測された時系列データからネットワークを推定すると、ノード間の相互接続が明らかになる。
実世界のオープンケースを扱うネットワーク推論モデルは、パフォーマンスの大幅な低下を経験します。
モデルベースおよびモデルフリーなネットワーク推論モデルの能力を増幅するための、エレガントで効率的なモデルに依存しないフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:42:07 GMT)
Is Flash Attention Stable? [12.8] 最先端のジェネレーティブAIモデルをトレーニングする多くの組織は、トレーニング中に不安定な独立したケースを報告している。
我々は,数値偏差の影響を理解するための原理的アプローチを開発し,文脈に観察を組み込むプロキシを構築した。
フォワードパスで測定すると,Flash AttentionはBF16のBaseline Attentionと比べて,約1桁の数値偏差があることがわかった。
論文参考訳(メタデータ) (Sun, 5 May 2024 03:25:25 GMT)
A Unified Review of Deep Learning for Automated Medical Coding [12.7] 本稿では,医療用符号化モデルの構成要素を汎用的に理解するための統一的な枠組みを提案する。
本フレームワークは, テキスト特徴抽出のためのエンコーダモジュール, 隠蔽表現を医療コードに変換するデコーダモジュール, 補助情報の利用の4つの主要コンポーネントに分解する。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:04:16 GMT)
Accelerating Legacy Numerical Solvers by Non-intrusive Gradient-based Meta-solving [12.7] 本研究では,機械学習とレガシー数値コードを組み合わせた新しい勾配推定手法を用いた非侵入的手法を提案する。
提案手法が他のベースラインよりも優れていることを示すとともに,PETScに実装された非自動微分可能な数値解法を高速化する手法を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:39:43 GMT)
Design, analysis, and manufacturing of a glass-plastic hybrid minimalist aspheric panoramic annular lens [12.5] 従来のパノラマ環状レンズ (PAL) のいくつかの限界を解決するために, ガラス塑性ハイブリッドパノラマ環状レンズ (ASPAL) を提案する。
ASPALの視野(FoV)は360degx(35deg110deg)であり、撮像品質は回折限界に近い。
高精度ガラス成形および射出成形による非球面レンズ製造技術により、我々は最終的に20個のASPALを小さなバッチで製造した。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:07:23 GMT)
SMCD: High Realism Motion Style Transfer via Mamba-based Diffusion [12.4] スタイル転送は映画、ゲーム、メタバースといったマルチメディアシナリオに広く適用されている。
この分野での現在の研究のほとんどはGANを採用しており、不安定性と収束の問題に繋がる可能性がある。
動作のスタイル特徴をより包括的に学習できるSMCD(Style Motion Conditioned Diffusion)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:28:07 GMT)
Swipe2Pair: Secure and Fast In-Band Wireless Device Pairing [12.3] ワイヤレスデバイスペアリングは、2つのデバイス間のセキュアな通信を、事前に共有された秘密なしでブートストラップする重要なセキュリティメカニズムである。
本稿では、ペアリング装置の近接と無線伝送電力のランダム化に基づく、使い易い相互認証装置ペアリング方式Swipe2Pairを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:12:37 GMT)
Data-Driven Permissible Safe Control with Barrier Certificates [12.0] 本稿では,未知のダイナミクスを持つシステムのデータから,安全戦略の最大セットを特定する手法を提案する。
ケーススタディでは、システム学習のためのデータセットのサイズが大きくなると、許容可能な戦略セットが大きくなることが示されている。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:41:47 GMT)
Stability of a Generalized Debiased Lasso with Applications to Resampling-Based Variable Selection [11.5] 本稿では,デバイアス付きラッソ係数を更新するための近似式を提案する。
応用として、近似式により、変数選択アルゴリズムの複雑さを低減できることを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:05:02 GMT)
Trojans in Large Language Models of Code: A Critical Review through a Trigger-Based Taxonomy [11.1] 大きな言語モデル(LLM)は、ソフトウェア開発に多くのエキサイティングな新機能を提供します。
これらのモデルの不透明な性質は、推論や検査を困難にしている。
本研究は,現在最先端のトロイの木馬によるコードの大規模言語モデルに対する攻撃について概説する。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:43:52 GMT)
FairRelay: Fair and Cost-Efficient Peer-to-Peer Content Delivery through Payment Channel Networks [10.6] Peer-to-Peer(P2P)コンテンツ配信は、従来の集中型コンテンツ配信ネットワーク(CDN)に代わり、分散化された代替手段を提供する。
P2Pコンテンツ配信において重要な課題は、リレーの帯域幅への貢献に対する公正な補償である。
既存のソリューションでは、決済決済にブロックチェーンを使用しているが、オンチェーンのコストが高く、ネットワークの前提が単純化されているため、実用的ではない。
FairRelayは、すべての参加者が複雑なコンテンツ配信ネットワーク設定で公正な報酬を得られるよう、公正で費用効率のよいプロトコルです。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:33:02 GMT)
Revisiting a Pain in the Neck: Semantic Phrase Processing Benchmark for Language Models [10.5] セマンティックフレーズ処理タスクにおける言語モデル(LM)のテストを可能にする総合評価スイートであるLexBenchを紹介する。
我々のベンチマークにより、モデルアーキテクチャにおける15のLMの性能と、分類、抽出、解釈タスクにおけるパラメータスケールを評価する。
我々のベンチマーク結果は,意味的フレーズ理解におけるLMの汎用的能力の向上を目的とした今後の研究に役立つだろう。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:20:38 GMT)
Convolutional Learning on Directed Acyclic Graphs [10.3] 我々は、有向非巡回グラフ(DAG)上で定義されたデータから学習するための新しい畳み込みアーキテクチャを開発する。
我々は,学習可能なDAGフィルタを統合した新しい畳み込みグラフニューラルネットワークを開発し,グラフトポロジによって誘導される部分順序を考慮に入れた。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:30:18 GMT)
Explainable Malware Detection with Tailored Logic Explained Networks [9.5] マルウェア検出は、新しい攻撃技術が急速に発達しているため、サイバーセキュリティにおいて恒常的な課題である。
従来のシグネチャベースのアプローチは、大量のマルウェアサンプルとペースを維持するのに苦労している。
マシンラーニングは有望なソリューションを提供するが、見つからないサンプルへの一般化と、マルウェアとして特定されたインスタンスの説明の欠如という問題に直面している。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:36:02 GMT)
A Collaborative Model-driven Network for MRI Reconstruction [9.4] 本稿では,様々な正規化器の相補性を生かした協調型モデル駆動ネットワークを提案する。
計算コストを伴わずに最終結果に大幅な改善が見られた。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:48:12 GMT)
Mozart's Touch: A Lightweight Multi-modal Music Generation Framework Based on Pre-Trained Large Models [9.3] MozartのTouchは、マルチモーダルキャプションモジュール、LLM (Large Language Model) Understanding & Bridging Module、Music Generation Moduleの3つの主要コンポーネントで構成されている。
従来のアプローチとは異なり、MozartのTouchはトレーニングや微調整を必要とせず、透明で解釈可能なプロンプトを通じて効率と透明性を提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 03:15:52 GMT)
Performance Evaluation of Real-Time Object Detection for Electric Scooters [9.2] 電動スクーター(電動スクーター)は都市部の交通手段として急速に普及しているが、重大な安全上の課題を生じさせている。
本稿では,e-スクータ用に設計された最先端物体検出器の有効性と効率について検討する。
mAP@0.5で測定された検出精度は27.4%(YOLOv7-E6E)から86.8%(YOLOv5s)である。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:00:22 GMT)
Impact of Different Infrastructures and Traffic Scenarios on Behavioral and Physiological Responses of E-scooter Users [9.2] 本稿では,e-scooterユーザに対して,自然なライディング実験を通じて,異なるインフラやシナリオ下での応答について検討することを目的とする。
その結果,異なる速度分布,インフラ要素,交通シナリオがライディング・ダイナミクスに大きく影響していることが示唆された。
この研究は、インフラ設計の重要さと、電子タバコの安全性への影響を浮き彫りにしている。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:55:46 GMT)
Enabling Patient-side Disease Prediction via the Integration of Patient Narratives [9.1] 患者側から疾患予測を行うために,PoMP(Personalized Medical Disease Prediction)を提案する。
PoMPは、テキスト記述や人口統計情報を含む患者の健康物語を用いて病気を予測する。
我々は,Hodfの現実世界データを用いて,PoMPの有効性を示す広範囲な実験を行った。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:54:02 GMT)
Neural Structure Learning with Stochastic Differential Equations [9.1] 本稿では,ニューラルディファレンシャル方程式と変分推論を組み合わせた新しい構造学習手法SCOTCHを提案する。
この連続的なアプローチは、任意の時点における観測からの学習と予測の両方を自然に処理することができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:38:08 GMT)
Data Depth and Core-based Trend Detection on Blockchain Transaction Networks [9.1] ブロックチェーンネットワーク内のマーケットマニピュレータを検出する手法として,InnerCoreを提案する。
これはデータ深度に基づくコア分解と中心的なモチーフ発見によって実現される。
人間の関与なしに、インナーコアが正確な解析値に一致できることが示される。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:17:18 GMT)
IceFormer: Accelerated Inference with Long-Sequence Transformers on CPUs [8.8] 既存のTransformerベースのモデルの1つの制限は、入力として非常に長いシーケンスを扱うことができないことである。
推論時に自己注意を加速する新しい手法を提案する。
我々は、元の事前訓練されたモデルの精度の98.6%から99.6%を維持しながら、2.73倍から7.63倍のスピードアップを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:18:42 GMT)
DVMSR: Distillated Vision Mamba for Efficient Super-Resolution [7.6] 本研究では,ビジョン・マンバと蒸留戦略を組み込んだ新しい軽量画像SRネットワークであるDVMSRを提案する。
提案したDVMSRは,モデルパラメータの観点から,最先端の効率的なSR手法より優れている。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:34:38 GMT)
Predicting postoperative risks using large language models [7.4] 各種チューニング手法を用いて, 臨床テキストによる術後リスク予測のための大規模言語モデル (LLM) について検討した。
その結果,30日間の死亡,肺塞栓症,肺炎が認められた。
事前訓練されたLLMは従来の単語の埋め込みよりも優れており、AUROCは38.3%、AUPRCは14%だった。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:07:44 GMT)
Energy-based Model for Accurate Shapley Value Estimation in Interpretable Deep Learning Predictive Modeling [7.4] EmSHAPはShapley値推定のためのエネルギーベースモデルである。
任意の特徴部分集合の下では、Shapleyコントリビューション関数の期待を推定する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:28:56 GMT)
Automated Deep Learning Optimization via DSL-Based Source Code Transformation [7.4] 本稿では,Adopterという,ディープラーニングによるOPTimizationの自動化手法を提案する。
DLモデルアーキテクチャを表現し、このDSLを利用してモデル変換ルールを指定する。
Adopterは、それぞれ3%と56%の精度とリコールを改善するのに役立ちます。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:23:14 GMT)
Active Preference Learning for Ordering Items In- and Out-of-sample [7.1] ノイズの多いペアワイズ比較に基づいてアイテムの順序付けを学習することは、アイテム固有のラベルを割り当てるのが難しい場合に有用である。
本研究は,文脈属性を持つ項目の順序付けに対して,一対の選好フィードバックを用いて能動的学習を学習する。
我々は,これらのアルゴリズムを,人間のアノテータによる比較を含む2つの現実的な画像順序付けタスクで評価する。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:44:03 GMT)
Analysis of the Identifying Regulation with Adversarial Surrogates Algorithm [7.0] 我々は、IRASアルゴリズムの厳密な分析を、特定の設定で行う。
この場合、IRASの反復は一般化商問題を解くための自己整合体(SCF)の反復と密接に関連していることが示される。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:47:24 GMT)
LIBRA: Enabling Workload-aware Multi-dimensional Network Topology Optimization for Distributed Training of Large AI Models [7.0] 我々は,機械学習システムにおける多次元ネットワークの設計を,ネットワーク全体の帯域幅を向上させるためのコスト効率のメカニズムとして動機付けている。
多次元ファブリックアーキテクチャの最適化に特化したフレームワークであるLIBRAを紹介する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:53:40 GMT)
Nip in the Bud: Forecasting and Interpreting Post-exploitation Attacks in Real-time through Cyber Threat Intelligence Reports [7.0] Advanced Persistent Threat (APT) 攻撃は世界中で大きな被害をもたらした。
企業によって潜在的な脅威に対抗するために様々な検知・応答システム(EDR)が展開されている。
アナリストは、対策を講じる前に、検出結果を調査し、フィルタリングする必要がある。
本稿では,リアルタイム攻撃予測・解釈システムである予測・解釈システム(EFI)を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:25:52 GMT)
Overconfidence is Key: Verbalized Uncertainty Evaluation in Large Language and Vision-Language Models [6.9] 言語と視覚言語モデル(LLMs/VLMs)は、人間のようなテキストを生成し、画像を理解する能力によってAIの分野に革命をもたらしたが、信頼性の確保は不可欠である。
本稿では,LLM (GPT4, GPT-3.5, LLaMA2, PaLM2) と VLM (GPT4V, Gemini Pro Vision) の言語的不確実性を評価することを目的とした。
本稿では,難解なクエリやオブジェクトカウントによるVLM機能テストを目的とした日本語不確実シーンデータセットと,誤校正の方向を測定するNet Errorデータセットを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:51:38 GMT)
ClothPPO: A Proximal Policy Optimization Enhancing Framework for Robotic Cloth Manipulation with Observation-Aligned Action Spaces [6.8] ClothPPOは、ポリシー勾配アルゴリズムを使用して、服の展開作業における観察と一致した巨大な106アクション空間を持つ事前訓練されたモデルを強化するフレームワークである。
政策のベースラインモデルをトレーニングするために、教師付き事前訓練ステージが使用される。
第2段階では、PPO(Proximal Policy Optimization)を用いて、観察整列された行動空間内の教師付きモデルを導出する。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:36:18 GMT)
Language Evolution for Evading Social Media Regulation via LLM-based Multi-agent Simulation [6.6] Twitter、Reddit、Sina Weiboといったソーシャルメディアプラットフォームは、グローバルコミュニケーションにおいて重要な役割を担っているが、地理的に敏感な地域では厳しい規制に直面していることが多い。
本稿では,Large Language Models (LLM) を用いたマルチエージェント・シミュレーション・フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:02:54 GMT)
Neural Network Enhanced Single-Photon Fock State Tomography [6.4] ターゲットパラメータの直接推定による単一光子量子状態トモグラフィーの実験的実装について報告する。
我々のニューラルネットワーク拡張量子状態トモグラフィーは、平衡ホモダイン検出器から可能な全ての光子数状態の光子数分布を特徴付ける。
このような高速で頑健で正確な量子状態トモグラフィーは、単一光子フォック状態やその他の非ガウス的量子状態を持つアプリケーションにとって重要な診断ツールボックスを提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:58:18 GMT)
Halfway Escape Optimization: A Quantum-Inspired Solution for Complex Optimization Problems [6.4] ハーフウェイエスケープ最適化(HEO)アルゴリズムは、厳密な景観と効率的な収束率で高次元性によって特徴づけられる複雑な最適化問題に対処するために設計された新しい量子インスパイアされたメタヒューリスティックである。
The study is presented a comprehensive comparative comparison of HEO's performance against established optimization algorithm, including Particle Swarm Optimization (PSO), Genetic Algorithm (GA), Artificial Fish Swarm Algorithm (A), Grey Wolf (GWO), Quantum behaviord Particle Swarm Optimization (QPSO)。
旅行セールスマン問題(TSP)におけるHEOの簡単なテストは、リアルタイムアプリケーションにおけるその実現可能性も推測する。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:43:07 GMT)
Self-Organized Construction by Minimal Surprise [6.2] シミュレーションロボットは、2Dトーラスグリッドの世界でブロックを押します。
いずれにせよ、ブロックを移動させて環境を構造化し、より予測しやすくするロボットの振る舞いを進化させる。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:59:22 GMT)
Exploiting Semantic Reconstruction to Mitigate Hallucinations in Vision-Language Models [6.0] 視覚言語モデルにおける幻覚は、特に長いキャプションの生成において、その信頼性に重大な課題をもたらす。
本研究では,幻覚の正確な局在化と罰則化による幻覚の発生抑制を目的とした,新しい教師なし学習フレームワークであるESREALを紹介する。
LLaVA, InstructBLIP, mPLUG-Owl2の幻覚を32.81%, 27.08%, 7.46%減少させる。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:46:45 GMT)
Enhancing High-Level Synthesis with Automated Pragma Insertion and Code Transformation Framework [5.7] 高レベルの合成、ソース・ソース・コンパイラ、およびプラグマ挿入のための様々な設計空間探索技術により、生成された設計結果の品質が大幅に向上した。
これらのツールは、開発時間を短縮し、パフォーマンスを向上するといった利点を提供する。
しかしながら、高品質な結果を達成するには、通常、個別または前処理ステップとして実行される、追加の手動コード変換とタイリング選択が必要になることが多い。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:41:43 GMT)
Seeded graph matching for the correlated Gaussian Wigner model via the projected power method [5.6] グラフマッチングアルゴリズムとして,Emphprojected Power Method (PPM) の性能解析を行った。
PPM は定数 $sigma$ の反復でも機能し、(Mao et al. 2023) のスパース相関エルドス・レニー(CER) モデルに対する解析を (dense) CGW モデルに拡張する。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:54:53 GMT)
You Only Need Half: Boosting Data Augmentation by Using Partial Content [5.6] YONA(You Only Need hAllf)と呼ばれる新しいデータ拡張手法を提案する。
ヨナは画像を2分し、半分をノイズで置き換え、残りの半分にデータ拡張技術を適用する。
この方法では、元の画像の冗長な情報を低減し、ニューラルネットワークが不完全なビューからオブジェクトを認識することを奨励し、ニューラルネットワークの堅牢性を大幅に向上する。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:57:40 GMT)
Physics-based reward driven image analysis in microscopy [5.6] 本稿では,画像解析を動的に最適化するReward Functionの概念に基づく方法論を提案する。
Reward関数は、実験目標とより広いコンテキストと密接に整合するように設計されている。
高次元クラスタリングの物理駆動型報酬関数とアクション空間を作成することにより,部分非秩序領域の同定に向けた報酬関数のアプローチを拡張した。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:51:05 GMT)
A Joint Code and Belief Propagation Decoder Design for Quantum LDPC Codes [5.2] 本稿では,QLDPC符号のための新しいジョイントコードとデコーダ設計を提案する。
合同符号はブロック長の平方根の最小距離を持つ。
その結果, 脱分極チャネル上でのデコード性能が顕著であった。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:17:37 GMT)
JOSENet: A Joint Stream Embedding Network for Violence Detection in Surveillance Videos [4.9] 本稿では、監視ビデオにおける暴力検出のための新しい自己監視フレームワークJOSENetを紹介する。
JOSENetは、RGBフレームと光フローという2つのテンポラリなビデオストリームを受け取り、ビデオのための新たな正規化された自己教師付き学習アプローチを含む。
これは、ビデオセグメント当たりのフレーム数の4分の1とフレームレートの削減を必要としながら、自己監督された最先端手法と比較して、パフォーマンスの向上を提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:01:00 GMT)
Verlet Flows: Exact-Likelihood Integrators for Flow-Based Generative Models [4.9] ハミルトン力学のシンプレクティックに着想を得た拡張状態空間上のCNFのクラスであるVerlet Flowを提案する。
バーレットフローは、最小の表現性制約を課しながら、非連続的な設定から結合フローアーキテクチャを一般化する、正確な類似した生成モデルを提供する。
おもちゃの密度に関する実験では、一般的なハッチンソントレース推定器のばらつきは重要サンプリングには適さないが、一方、Verletフローは完全オートグレートトレース計算に比較可能であり、かなり高速である。
論文参考訳(メタデータ) (Sun, 5 May 2024 03:47:56 GMT)
Preventive Audits for Data Applications Before Data Sharing in the Power IoT [4.9] データ所有者は、データ共有の前にデータアプリケーションの予防監査を行う必要がある。
IoTのパワーにおけるデータ共有は、背景と見なされる。
予防監査は、データ共有前後のデータ特徴パラメータの変更に基づいて実施されるべきである。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:07:56 GMT)
AC4: Algebraic Computation Checker for Circuit Constraints in ZKPs [4.8] 本稿では,ZKP回路の2種類のバグをピンポイントする手法を提案する。
本稿では,この手法の実装を表現するためのツールAC4を提案する。
可溶範囲内では、AC4のチェック時間も顕著に改善されている。
論文参考訳(メタデータ) (Sun, 5 May 2024 03:21:14 GMT)
Advancing African-Accented Speech Recognition: Epistemic Uncertainty-Driven Data Selection for Generalizable ASR Models [4.7] アノテーションプロセスの自動化と,情報的不確実性に基づくデータ選択によるアノテーション関連費用の削減を行う。
我々のアプローチは69.44%のWER改善をもたらし、既存のベースラインよりも平均45%少ないデータを必要とする。
提案手法はアフリカ中心のASRの即時問題に対処し,他の未表現および低リソース言語やアクセントに対するASRシステムの改善に広範な意味を持つことを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:51:31 GMT)
Multi-hop graph transformer network for 3D human pose estimation [4.7] 本稿では,2次元から3次元の人間のポーズ推定を目的としたマルチホップグラフトランスフォーマーネットワークを提案する。
提案するネットワークアーキテクチャは,多頭部自己注意層と学習可能な隣接行列を用いたグラフ畳み込みからなるグラフアテンションブロックで構成されている。
拡張畳み込み層の統合により、人体関節の正確な位置決めに必要な空間的一般化を扱う能力が向上する。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:29:20 GMT)
Position paper: Do not explain (vision models) without context [4.5] 我々は、説明へのアプローチの変化が「どこで」から「どのように」に変わる必要があると論じる。
空間的コンテキストが重要な役割を果たす実世界のユースケースの例を示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:38:42 GMT)
Sharing to learn and learning to share; Fitting together Meta-Learning, Multi-Task Learning, and Transfer Learning: A meta review [4.5] 本稿では、これらの学習アルゴリズムを2つ組み合わせた研究についてレビューする。
文献から蓄積した知識に基づいて、汎用的なタスクに依存しないモデルに依存しない学習ネットワークを仮定する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:52:26 GMT)
Minimizing Kinetic Inductance in Tantalum-Based Superconducting Coplanar Waveguide Resonators for Alleviating Frequency Fluctuation Issues [4.4] タンタルフィルムは アルミニウムやニオブよりも はるかに大きな動力学的インダクタンスを示す
共振器の周波数変動を100以上の係数で低減する。
大型超伝導チップにおけるタンタルの有効利用の新たな道が開けた。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:49:33 GMT)
Towards a Flexible and High-Fidelity Approach to Distributed DNN Training Emulation [4.2] 我々は、実ノードのサブセット上でトレーニングワークロードを実行し、ネットワーク化された実行環境と集合的な通信操作をエミュレートすることが可能であると主張している。
本研究では,NuronaBoxが実システムの動作を高精度に再現し,エミュレートした測定値と実システムの誤差マージンが1%未満であることを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:27:56 GMT)
Grokking as a First Order Phase Transition in Two Layer Networks [4.1] ディープニューラルネットワーク(DNN)の重要な特性は、トレーニング中に新機能を学ぶ能力である。
また、グローキングは、機能学習を含む遅延学習/ガウス過程の現象を越えていると考えられている。
我々は、Grokkingの後、DNNの状態が1次相転移後の混合相と類似していることを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:21:36 GMT)
High Order Reasoning for Time Critical Recommendation in Evidence-based Medicine [3.9] 本稿では,エビデンスベースの医療に推奨する高次推論のモデルを提案する。
実験では、Large Language Model (LLM) が "What-if" シナリオで最適な性能を示した。
LLMはICUからの退院後の患者の生活状態を70%の精度で予測することができた。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:36:22 GMT)
Polarization Purity and Dispersion Characteristics of Nested Antiresonant Nodeless Hollow-Core Optical Fiber at Near- and Mid-IR Wavelengths for Quantum Communications [3.9] ホローコアファイバは、連続波(CW)レーザー光を用いたテレコム波長範囲において、最小二屈折率で非平行偏光純度を有する。
以上の結果より,CW動作の1520nmから1620nmの範囲において,-30dBと-70dBの偏光消滅比が最大2mの波長で-60dBに達した。
本研究は,量子鍵分布(QKD)プロトコルなどの新興アプリケーションにおける光ファイバーの可能性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:32:28 GMT)
Exploring prompts to elicit memorization in masked language model-based named entity recognition [3.9] 言語モデルのトレーニングデータ記憶は、モデル能力(一般化)と安全性(プライバシリスク)に影響を与える
本稿では、6つのマスキング言語モデルに基づく名前付きエンティティ認識モデルの暗記検出に対するプロンプトの影響を分析することに焦点を当てた。
包括的な分析は、迅速なパフォーマンスが、プロンプト特性、トークンを含むこと、そしてプロンプトに対するモデルの自己注意重みによってどのように影響されるかを示している。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:19:35 GMT)
Ultrastrong coupling limit to quantum mean force Gibbs state for anharmonic environment [3.5] 量子系の平衡状態は、系の環境結合が弱くない場合、ギブス状態から逸脱することができる。
この平均力ギブス状態(MFGS)の解析式はカルデイラ・レゲットモデル(CL)の超強結合系で知られている。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:11:10 GMT)
Tetris: A Compilation Framework for VQA Applications in Quantum Computing [3.5] Tetrisは、短期量子デバイス上でのVQAアプリケーションのためのコンパイルフレームワークである。
テトリスは、2つのキュービットゲートの数を減らすために、VQAコンパイラの状態がしばしば見過ごされる回路合成段階のユニークな機会を利用する。
全体として、テトリスはCNOTゲート数で41.3%、回路深度で37.9%、回路長で42.6%の減少を示した。
論文参考訳(メタデータ) (Sun, 5 May 2024 23:53:12 GMT)
Exploring the Improvement of Evolutionary Computation via Large Language Models [3.5] 進化計算(EC)は様々な領域に適用されている。
問題の複雑さが増大するにつれて、ECの限界はより明確になっている。
大きな言語モデルの膨大な知識と適応能力を活用することで、潜在的な改善の先見的な概要を提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 10:13:55 GMT)
Any-Precision LLM: Low-Cost Deployment of Multiple, Different-Sized LLMs [3.5] 大規模言語モデル(LLM)の任意の精度量子化のための軽量な手法を提案する。
我々のソリューションは、複数の異なるサイズのLCMをデプロイする際のコストを大幅に削減します。
ビット幅の異なる全てのLLMは、最先端のモデル品質と推論スループットを示している。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:09:04 GMT)
LIFL: A Lightweight, Event-driven Serverless Platform for Federated Learning [3.3] フェデレートラーニング(FL)は通常、個々のユーザデバイス/サーバのトレーニングモデルをローカルに配置した大規模分散システムを伴い、信頼された中央サーバ上でモデル更新を集約する。
FLの既存のシステムは、しばしばモデルアグリゲーションに常時オンのサーバーを使用するが、資源利用の面では非効率である。
本稿では,大規模で効率的なFLアグリゲーションを実現するための,きめ細かいリソース管理機能を備えた軽量で柔軟なサーバレスクラウドプラットフォームLIFLを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 23:04:37 GMT)
Scalable and Adaptively Secure Any-Trust Distributed Key Generation and All-hands Checkpointing [3.2] DLogベースの暗号システムのための実用的なDKGを提案し、共通のコインの助けを借りて(準)線形化とノード単位の通信コストを実現する。
我々のプロトコルは適応的な敵に対して安全であり、全てのノードの半分以下を破損させる可能性がある。
参加者が異なる重みを持つ場合でも,従来の分散プロトコルであるDKGを効率的にデプロイできる汎用トランスフォーマーを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 06:22:29 GMT)
PLMM: Personal Large Language Models on Mobile Devices [3.2] 私たちは、大きな言語モデルを、個人レベル、専門家レベル、伝統的なレベルという3つのレベルに分類します。
提案した個人用大規模モデルは、言語や視覚タスクなど幅広い応用に適用できる。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:33:38 GMT)
On Probabilistic and Causal Reasoning with Summation Operators [3.1] 各因果言語における推論は、計算複雑性の観点からは、単に確率的あるいは「相関的」な推論と同じくらい困難であることを示す。
因果推論のための$do$-calculus of Pearl (2009)のようなアプリケーションに現れる一般的なデバイスをキャプチャするための和演算子を導入する。
意外なことに、ランダム変数値に対する自由変数の許容は、これらのランダム変数の範囲が制限されない限り、決定不可能なシステムをもたらす。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:32:01 GMT)
Environment Design for Inverse Reinforcement Learning [3.1] 一つの環境から学ぶことに集中する現在の逆強化学習法は、環境力学のわずかな変化に対処できない可能性がある。
本フレームワークでは,学習者がエキスパートと繰り返し対話し,前者の選択環境を使って報酬関数を識別する。
その結果,サンプル効率とロバスト性の両方の改善が得られた。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:35:00 GMT)
RepAugment: Input-Agnostic Representation-Level Augmentation for Respiratory Sound Classification [2.8] 本稿では,プレトレーニング音声モデルの呼吸音分類への応用について検討する。
音声と肺の音響サンプルの間には特徴的ギャップがあり,このギャップを埋めるためには,データ拡張が不可欠である。
入力に依存しない表現レベルの拡張手法であるRepAugmentを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:45:46 GMT)
Defense against Joint Poison and Evasion Attacks: A Case Study of DERMS [2.6] IDSの第1の枠組みは, ジョイント中毒や回避攻撃に対して堅牢である。
IEEE-13バスフィードモデルにおける本手法のロバスト性を検証する。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:24:30 GMT)
Linear Noise Approximation Assisted Bayesian Inference on Mechanistic Model of Partially Observed Stochastic Reaction Network [2.3] 本稿では、部分的に観察された酵素反応ネットワーク(SRN)に対する効率的なベイズ推論手法を開発する。
実証的研究は、提案手法が有望な性能を持つことを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 01:54:21 GMT)
Persian Typographical Error Type Detection Using Deep Neural Networks on Algorithmically-Generated Misspellings [2.3] タイポグラフィーによるペルシャのエラータイプ検出は比較的調査の少ない地域である。
本稿では,ペルシャ語文の誤字を検出するための説得力のあるアプローチを提案する。
最終手法の結果は競争力が高く、精度は97.62%、精度は98.83%、リコールは98.61%、速度は他を上回った。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:44:10 GMT)
AC-MAMBASEG: An adaptive convolution and Mamba-based architecture for enhanced skin lesion segmentation [2.2] 本稿では,新しい皮膚病変分割モデルであるAC-MambaSegを提案する。
AC-MambaSegはハイブリッドCNN-Mambaバックボーンを持ち、Attention GateやSelective Kernel Bottleneckといった高度なコンポーネントを統合している。
本モデルは,コンピュータ支援診断システムの改善と皮膚疾患の早期発見と治療の促進に有望な可能性を示唆する。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:37:50 GMT)
SkelCap: Automated Generation of Descriptive Text from Skeleton Keypoint Sequences [2.0] 我々はこのデータセットをトルコ手話データセットであるAUTSLを中心に構築した。
また,身体運動のテキスト記述を生成できるベースラインモデルであるSkelCapを開発した。
ROUGE-Lスコアは0.98、BLEU-4スコアは0.94である。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:50:02 GMT)
E-TSL: A Continuous Educational Turkish Sign Language Dataset with Baseline Methods [2.0] 本研究は,5年生,6年生,8年生を対象に,オンライントルコ語授業から収集した連続的トルコ手話データセットについて紹介する。
データセットは、合計24時間近くの1,410本のビデオで構成され、11人の署名者によるパフォーマンスを含んでいる。
特に64%がシングルトン語、85%がまれな単語で、5回未満の出現である。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:07:23 GMT)
Predicting Open-Hole Laminates Failure Using Support Vector Machines With Classical and Quantum Kernels [2.0] 本研究では, 面内載荷時の開放孔複合板の最終的な破壊包絡を学習するために, 代理モデルの訓練方法を示す。
カーネル-ターゲットアライメント最適化により、すべてのカーネルのフリーパラメータを最適化し、安全なロード状態と障害発生ロード状態の分離を最良とする。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:48:50 GMT)
QuantProb: Generalizing Probabilities along with Predictions for a Pre-trained Classifier [1.8] ディープ・ネットワークの信頼性の欠如の理由は、ニューラルネットワークが現在トレーニングされている方法では、確率は小さな歪みをまたいで一般化しない、という理由にある、と我々は主張する。
損失関数から量子化表現の構成を分離し、元のネットワークを乱さずに量子化に基づく確率を計算する革新的な手法を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:38:35 GMT)
Universal Spreading of Conditional Mutual Information in Noisy Random Circuits [1.6] 一般開放量子系における条件付き相互情報の進化について検討する。
誤差率$p$のノイズランダム回路は条件付き相互情報の超線形伝播を示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 00:57:54 GMT)
Kinematic analysis of structural mechanics based on convolutional neural network [1.5] フレームワークとKerasディープラーニングプラットフォームに基づく畳み込みニューラルネットワークモデルを構築した。
モデルは、トレーニングセット、検証セット、テストセットで100%精度を達成する。
可視化技術を用いて、畳み込みニューラルネットワークがどのように構造的特徴を学び、認識するかを明らかにする。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:00:03 GMT)
AnoGAN for Tabular Data: A Novel Approach to Anomaly Detection [1.5] 本研究は, 異常検出, 課題探索, 厳密な悪意ある活動に適応する複雑性に対処する。
コントリビューションには、AnoGANの原則を新しいドメインに適用することや、これまで検出できなかった異常を検出するための有望な進歩が含まれている。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:54:43 GMT)
TRAMBA: A Hybrid Transformer and Mamba Architecture for Practical Audio and Bone Conduction Speech Super Resolution and Enhancement on Mobile and Wearable Platforms [1.5] 音響・骨伝導音声強調のためのハイブリッドトランスであるTRAMBAとMambaアーキテクチャを提案する。
TRAMBAは、データサンプリングや送信を少なくすることで、ウェアラブルのバッテリ寿命を最大160%改善することを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:27:10 GMT)
Graphical user interface agents optimization for visual instruction grounding using multi-modal artificial intelligence systems [1.3] GUIにおけるオブジェクト識別のためのマルチモーダルソリューションである検索命令コーディネート(SIC)を提案する。
より正確には、自然言語命令とGUIのスクリーンショットが与えられたら、SICは命令が実行される画面上のコンポーネントの座標を見つける。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:10:19 GMT)
A self-supervised text-vision framework for automated brain abnormality detection [1.2] 脳MRI画像における臨床的に関連のある異常を検出するためのテキストビジョンフレームワークを提案する。
当フレームワークは,臨床診断支援ツールとしても機能する可能性がある。
論文参考訳(メタデータ) (Sun, 5 May 2024 01:51:58 GMT)
Practices, Challenges, and Opportunities When Inferring Requirements From Regulations in the FinTech Sector - An Industrial Study [1.1] 規制規範を理解して解釈し、それらからソフトウェア要件を推測することは、規制コンプライアンスへの重要なステップである。
本研究では,規制文脈における要求工学の複雑さを考察し,諸問題を指摘し,詳細に議論する。
ソフトウェア開発における規制要件を管理するための重要なプラクティスを特定し、いくつかの課題を特定しました。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:39:08 GMT)
Insights Gained after a Decade of Cellular Automata-based Cryptography [1.0] セルラーオートマタ (CA) は対称暗号プリミティブの実装に広く用いられている。
この分野の研究の大部分は、初期の作品を除いて、非暗号の会場で出版されているようである。
本稿では,CA暗号の歴史を概説することによって,この問題に対する洞察を提供する。
論文参考訳(メタデータ) (Sun, 5 May 2024 10:10:28 GMT)
A warm Rydberg atom-based quadrature amplitude-modulated receiver [1.0] ライドバーグ原子は電磁場に対して顕著な感度を示し、磁場センサーの候補となる。
2.4GHz帯のWi-Fi帯域近傍で信号受信を行うプロトコルを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:38:41 GMT)
On Enhancing Brain Tumor Segmentation Across Diverse Populations with Convolutional Neural Networks [0.9] 本研究は、BraTS-GoATチャレンジの一環として、脳腫瘍セグメンテーション法を提案する。
課題は、成人、小児科、サハラ以南のアフリカなどの様々な集団から脳MRIスキャンで腫瘍を抽出することである。
実験の結果, 平均DSCは85.54%, HD95は27.88。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:55:00 GMT)
A Comprehensive Survey on Evaluating Large Language Model Applications in the Medical Industry [0.9] GPTやBERTのような大規模言語モデル(LLM)は、言語理解と生成の高度な能力で様々な産業に影響を与えている。
この包括的調査は、医療におけるLSMの広範な適用と必要な評価を概説する。
本調査は,臨床環境,医療用テキストデータ処理,研究,教育,公衆衛生への意識といった分野におけるLCM応用の詳細な分析を行うために構成されている。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:44:58 GMT)
Imaging Signal Recovery Using Neural Network Priors Under Uncertain Forward Model Parameters [0.8] 逆イメージング問題(IIP)は様々な用途で発生し、圧縮された測定値から画像の再構成が主な目的である。
本稿では,ニューラルネットワークを前に使用することで,一般的なIPソリューションと互換性のある新しいモーメント・アグリゲーション(MA)フレームワークを提案する。
理論的には、既知のフォワードモデルパラメータの下での再構成に類似した複雑さを持つMAフレームワークの収束を実証する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:12:48 GMT)
An Exploratory Study of V-Model in Building ML-Enabled Software: A Systems Engineering Perspective [0.7] 機械学習(ML)コンポーネントは、ますます重要で影響力のあるソフトウェアシステムに追加されている。
本研究は,ML対応システム構築における学際的コラボレーション課題へのV-Modelの適用について検討する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:56:36 GMT)
Negative Probability [0.7] 負の確率は主に量子論と計算に現れる。
負の確率は、ベイズモデルにおける観測されていない潜在変数の混合分布として生じる。
負の混合手段を持つ二重密度の例が提供される。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:09:49 GMT)
The Topos of Transformer Networks [0.7] 本稿では, トポス理論のレンズを用いて, トランスフォーマーアーキテクチャの表現性に関する理論的解析を行う。
我々は、多くの一般的なニューラルネットワークアーキテクチャが、一括線形関数のプリトポに組み込むことができるが、トランスフォーマーはそのトポス完了に必然的に存在することを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:07:34 GMT)
BetterNet: An Efficient CNN Architecture with Residual Learning and Attention for Precision Polyp Segmentation [0.6] 本研究では,ポリプセグメンテーションの精度を高めるために,残差学習と注意法を組み合わせた畳み込みニューラルネットワークアーキテクチャであるBetterNetを提案する。
BetterNetは、ポリープの検出と癌の早期認識を強化するために、コンピュータ支援診断技術を統合することを約束している。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:08:49 GMT)
On Linear Separation Capacity of Self-Supervised Representation Learning [0.6] 自己教師型学習の最近の進歩は、ラベルのないデータからデータ表現を学習する際のデータ拡張の有効性を強調している。
本稿では,データ拡張により非線形データ構造を線形分離可能な表現に展開する機構について検討する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:17:04 GMT)
Adaptive deep density approximation for stochastic dynamical systems [0.5] 状態変数の確率密度関数(PDF)の反復を近似するために、新しい時間的KRnetを提案する。
tKRnetを効率的に訓練するために、対応する残留損失関数のコロケーションポイントを生成する適応手順を開発した。
時間分解技術は、長期統合を改善するためにも用いられる。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:29:22 GMT)
Systematic analysis of the effectiveness of adding human mobility data to covid-19 case prediction linear models [0.2] 予測モデルにモビリティデータを追加することで、テスト期間の開始時にモデルのパフォーマンスが2ヶ月程度向上する。
性能改善は、非運動量ベースラインに対する実際の相関改善に対する予測値として測定される。
論文参考訳(メタデータ) (Sun, 5 May 2024 03:59:09 GMT)
A View on Out-of-Distribution Identification from a Statistical Testing Theory Perspective [0.2] 本研究では,教師なしおよび教師なしの学習コンテキストにおいて,テスト時間におけるOODサンプルを効率的に検出する問題について検討する。
我々は,OOD問題を統計的検定のレンズで再定式化し,OOD問題を統計的に特定可能な条件について議論する。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:06:07 GMT)
Light Field Spatial Resolution Enhancement Framework [0.2] 解像度向上のための新しい光場フレームワークを提案する。
第1モジュールは高解像度のオールインフォーカス画像を生成する。
第2のモジュール、テクスチャ・トランスフォーマー・ネットワークは、各光界視点の分解能を独立して向上させる。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:07:10 GMT)
On the tractability of SHAP explanations under Markovian distributions [0.2] SHAPフレームワークはMLモデルの局所的な説明可能性のための最も広く利用されているフレームワークの1つである。
その人気にもかかわらず、その正確な計算は非常に困難であることが知られ、様々な構成においてNP-Hardであることが証明されている。
近年の研究では、特定のモデルファミリーに対するSHAPスコアの計算に関して、肯定的な複雑性の結果が明らかにされている。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:56:12 GMT)
On marginal feature attributions of tree-based models [0.1] 辺縁的なシャプリー、オーウェンまたはバンジャフの値など、辺縁的な期待に基づく局所的な特徴属性を用いることができる。
パス依存(path-dependent)のTreeSHAPが特徴のランク付けを行うのと全く同じ関数を計算する2つの(統計的に類似した)決定木を提示する。
我々は、CataBoostモデルの余剰Shapley(およびBanzhafとOwen)値についてのみ、複雑さを改善し、内部モデルパラメータの観点からのみ、明示的な式を導出するために対称性を利用する。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:39:16 GMT)
Confidential and Protected Disease Classifier using Fully Homomorphic Encryption [0.1] 多くのユーザーは、病気のために医療専門家に相談する前に、ChatGPTやBardのようなプラットフォームで潜在的な原因を探している。
このようなプラットフォームの利便性にもかかわらず、個人医療データをオンラインで共有することは、悪意のあるプラットフォームの存在を含むリスクを引き起こす。
安全かつプライベートな診断システムのためのFHEとDeep Learningを組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:10:00 GMT)
Visions of augmented reality in popular culture: Power and (un)readable identities when the world becomes a screen [0.0] 私は、視線とパワーが拡張現実の3つのポップカルチャー的なビジョンにどのようにコード化されているかを調べます。
スクリーンに境界がなくなったこれらの未来では、協力的および不愉快な身体の両方に、性別と人種のデジタルマーカーが刻まれている。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:36:05 GMT)
Unraveling the Dominance of Large Language Models Over Transformer Models for Bangla Natural Language Inference: A Comprehensive Study [0.0] 自然言語推論(NLI)は自然言語処理(NLP)の基盤である
本研究では,ベンガル語のような低リソース言語におけるLLM(Large Language Models)の評価について検討した。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:57:05 GMT)
Understanding the effects of data encoding on quantum-classical convolutional neural networks [0.0] 量子化法の主要な構成要素は、古典的なデータを量子状態に埋め込むために使用されるデータ符号化戦略である。
本研究では、2つの医用画像データセット上での量子古典的畳み込みニューラルネットワーク(QCCNN)の性能に与える影響について検討する。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:44:08 GMT)
Trade-off relations between Bell nonlocality and local Kochen-Specker contextuality in generalized Bell scenarios [0.0] これら2つのリソースのそれぞれに任意の量が存在するはずがないことを示す。
グローバルな文脈性の概念の観点から、どのように理解できるかについて議論する。
論文参考訳(メタデータ) (Sun, 5 May 2024 15:09:00 GMT)
Towards Incremental Learning in Large Language Models: A Critical Review [0.0] このレビューは、大規模言語モデルにおける漸進的学習の包括的分析を提供する。
それは、継続的な学習、メタラーニング、パラメータ効率の学習、およびエキスパートの混合学習を含む、最先端の漸進的な学習パラダイムを合成する。
重要な発見は、これらのアプローチの多くはコアモデルを更新せず、リアルタイムでインクリメンタルに更新するものではないことである。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:46:32 GMT)
The Quantum Rabi model: Towards Braak's conjecture [0.0] 我々は、量子モデルのスペクトルの微細構造に関するブランク予想の密度 1 バージョンを確立する。
また、近辺のスペクトル間隔も予想する。
この証明は Boutet de Monvelinski と Zielinski による大きな固有値に対する3項の展開と、一様分布論からの数論的な議論を用いる。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:39:34 GMT)
Spinor quantum states of the Dirac's core/shell at fm-space [0.0] 球状コア/シェル系におけるテンソル効果下でのディラック粒子の挙動モデルを提案する。
量子球の中心領域における約1.0 fmの空間に局在する粒子に対応するエネルギー準位の変化について検討した。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:50:38 GMT)
Spatial Transfer Learning with Simple MLP [0.0] 空間統計学の分野に適用された移動学習の可能性を調べるための第一歩。
空間統計学の分野に適用される伝達学習の可能性を検討することを目的とする。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:39:15 GMT)
Sentiment Analysis Across Languages: Evaluation Before and After Machine Translation to English [0.0] 本稿では,機械翻訳を行った多言語データセットおよびテキストを対象とした感性分析タスクにおけるトランスフォーマーモデルの性能について検討する。
異なる言語文脈におけるこれらのモデルの有効性を比較することで、それらの性能変化と様々な言語における感情分析の潜在的な影響について洞察を得ることができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 10:52:09 GMT)
Self-Reflection in LLM Agents: Effects on Problem-Solving Performance [0.0] 大規模言語モデル(LLM)における自己回帰が問題解決性能に及ぼす影響について検討した。
各質問に対して, 誤りを反映するように8種類の自己反射型LLMエージェントを指示した。
このガイダンスを用いて、各自己表現エージェントは、同じ質問を再回答しようと試みた。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:56:46 GMT)
Rigged Hilbert Space formulation for quasi-Hermitian composite systems [0.0] ディラックのブラケット形式は、非ハーマイト合成系のためのブラとケットベクトルを構築するために用いられる。
準エルミート作用素に関する対称関係は双対空間に拡張可能であることを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 08:41:57 GMT)
Random-matrix models of monitored quantum circuits [0.0] 量子ビットの非構造系に対するハールランダムユニタリ力学と測度との競合について検討する。
射影測定のために、クラス作用素の統計アンサンブルの様々な性質を導出する。
我々は、クラウス作用素の統計的性質が、観測された量子系の絡み合う位相のモデルとなることを期待する。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:46:11 GMT)
RKHS, Odzijewicz, Berezin and Fedosov-type quantizations on smooth compact manifolds [0.0] 我々はコンパクトな滑らかな多様体上で、Odzijewicz, Berezin, Fedosov型量子化を定義する。
プルバックコヒーレント状態は通常通り定義される。
論文参考訳(メタデータ) (Sun, 5 May 2024 07:39:15 GMT)
Predicting the usability of mobile applications using AI tools: the rise of large user interface models, opportunities, and challenges [0.0] 本稿では,モバイルアプリケーションにおけるユーザインタフェースの生成とユーザビリティの予測を可能にする,いわゆるLUIM(Big User Interface Model)を提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:24:48 GMT)
Powering the Future of IoT: Federated Learning for Optimized Power Consumption and Enhanced Privacy [0.0] フェデレートラーニングは、IoT環境における消費電力とデータプライバシの固有の課題に対処するための、有望なパラダイムとして登場します。
本稿では、電力消費を軽減し、プライバシとセキュリティ対策を強化することにより、IoTデバイスの長寿命化におけるFLの変革の可能性について検討する。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:18:22 GMT)
On the use of dynamical systems in cryptography [0.0] 本稿では,その間隔のカオスマップの繰り返しに基づいて,ストリーム暗号のセキュリティを攻撃し,テストするために使用できる新しいアルゴリズムを提案する。
2つ目は、カオスベースの暗号の研究者が暗号プロトコルの設計を始められるように、現代の暗号理論と複雑性理論言語に離散力学系の問題を配置することである。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:59:49 GMT)
On the performativity of SDG classifications in large bibliometric databases [0.0] 大規模な文献データベースは、それぞれの分類において国連の持続可能な開発目標を引き継いだ。
本研究では,大規模言語モデル (LLM) の特徴を用いて,多様なSDG分類から得られる「データバイアス」をバイオロメトリデータに応用することを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:28:54 GMT)
On Quantum Ambiguity and Potential Exponential Computational Speed-Ups to Solving Dynamic Asset Pricing Models [0.0] 我々は、量子コンピューティングのソリューションを、大規模な非線形資産価格モデルに定式化する。
モデル選択に対処するために、あいまいさとモデル/パラメータの不確実性の量子決定理論の基礎を導入する。
論文参考訳(メタデータ) (Sun, 5 May 2024 20:41:19 GMT)
Observing quantum many-body scars in random quantum circuits [0.0] 我々は量子シミュレーションを考案し、シュウィンガー模型の低次元形状の力学を解明する。
我々は、シュウィンガーモデルハミルトニアンの下で進化を効果的に生成する量子回路を記述するためにトロッタライズを適用する。
逐次およびランダム化回路力学の比較により、ヒルベルト空間の非熱セクターは、傷跡を含むよりランダム化に敏感であることが示されている。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:07:59 GMT)
Nonclassical effects of photon-phonon antibunching in a multifield driven optomechanical cavity [0.0] フォトン-フォノン対の非古典的なシグネチャは、コーシー=シュワルツとベルの不等式に違反することで、効果的に検証することができる。
単一オプティメカルキャビティにおける多光子-フォノン励起の抑制につながる量子相関について検討する。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:28:12 GMT)
Mixture of partially linear experts [0.0] 非線形関係を捉えるために不特定関数を組み込んだ部分線形構造を提案する。
軽度条件下では,提案モデルの同定可能性を確立し,実用的な推定アルゴリズムを導入する。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:10:37 GMT)
Longitudinal Momentum Spectra of pair created in a pulsed field at finite times: Are Oscillations "Real" [0.0] 本研究では, 真空中からの電子-陽電子対の生成について検討した。
一粒子時間依存ディラック方程式の正確な解を用いて運動量空間における対生成確率を計算する。
生成粒子の縦運動スペクトル(LMS)を有限時間で解析する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:28:05 GMT)
Logical Error Rates for a [[4,2,2]]-Encoded Variational Quantum Eigensolver Ansatz [0.0] 量子誤り検出符号は、符号化された変分量子固有解法の論理誤差率、精度、精度をいかに改善するかを定量化する。
選択後の最も積極的な戦略は, サンプルの損失が増大しても, 符号化された推定値の精度と精度を向上することを見出した。
論文参考訳(メタデータ) (Sun, 5 May 2024 19:02:58 GMT)
Leveraging Lecture Content for Improved Feedback: Explorations with GPT-4 and Retrieval Augmented Generation [0.0] 本稿では,大規模言語モデルによるプログラミングタスクのフィードバックを改善するために,検索拡張生成(Retrieval Augmented Generation)を提案する。
対応する講義記録は転写され、外部知識源としてLarge Language Model GPT-4で利用可能となった。
この目的は、幻覚を予防し、講義の技術的用語やフレーズの使用を強制することである。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:32:06 GMT)
Jointly Learning Spatial, Angular, and Temporal Information for Enhanced Lane Detection [0.0] 本稿では,光場画像と新しい深層学習モデルを用いて,空間情報,角情報,時間情報を統合することで,車線検出を向上するための新しい手法を提案する。
提案手法の有効性を改良したCNNアーキテクチャを用いて実証し,従来の手法よりも優れたフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:12:20 GMT)
HuixiangDou-CR: Coreference Resolution in Group Chats [0.0] 本研究では,58kのチャットデータを前処理し,手動で2.3k質問を行った。
0.5Bから32Bの範囲でQwenモデルの微調整を行った。
これは、下流自然言語処理(NLP)タスクのための微調整大型言語モデル(LLM)の実現可能性を確認する。
論文参考訳(メタデータ) (Sun, 5 May 2024 05:43:20 GMT)
General quantum-classical dynamics as measurement based feedback [0.0] このノートは、連続測定の理論と一般(非マルコフ的)フィードバックから、一般ハイブリッド量子古典力学の微分方程式と偏微分方程式を導出する。
論文参考訳(メタデータ) (Sun, 5 May 2024 09:32:19 GMT)
General protocols for the efficient distillation of indistinguishable photons [0.0] 識別不能な光子の蒸留のためのプロトコルを紹介する。
このプロトコルは、識別可能性エラー率を$n$で減らし、リソース要求は$n$で線形にスケールする。
抑圧法則を規定する同じ対称性特性は、これらのプロトコルの振る舞いを理解するのに有効である。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:14:11 GMT)
Fast TILs estimation in lung cancer WSIs based on semi-stochastic patch sampling [0.0] パイプラインは、予後に関係のない領域の約70%を効率よく排除し、予後の正確性を維持するために残りのパッチの5%しか必要としない。
このパイプラインは、NSCLCの予後と治療のパーソナライゼーションを高める可能性を示す。
今後の研究は、その幅広い臨床的有用性を検証すること、およびNSCLC予後を改善するために追加のバイオマーカーを調査することに焦点を当てるべきである。
論文参考訳(メタデータ) (Sun, 5 May 2024 12:41:55 GMT)
Exploring the ethical sensitivity of Ph.D. students in robotics [0.0] 倫理的感受性の概念は、医療、ビジネス、その他の領域で広く研究されている。
ロボットの設計と展開における選択は、社会に深い倫理的影響を及ぼす可能性があるにもかかわらず、ロボットコミュニティではほとんど、あるいは全く関心を示さなかったようだ。
我々は,災害ロボットの倫理的緊張を実証するケース・ヴィグネットを用いて,ロボット工学の博士課程生の倫理的感受性の質的調査を行った。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:11:51 GMT)
Exploring a Cognitive Architecture for Learning Arithmetic Equations [0.0] 本稿では,算術学習を支える認知メカニズムについて考察する。
本稿では,数ベクトル化埋め込みネットワークと連想メモリモデルを実装し,知能システムによる算術方程式の学習とリコールについて検討する。
知的システムにおける数学的認知の神経的相関に関する継続的な研究に貢献することを目的としている。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:42:00 GMT)
Erasure-tolerance scheme for the surface codes on Rydberg atomic quantum computers [0.0] 光ツイーザを備えたライドバーグ原子配列は、フォールトトレラント量子コンピュータの候補として有望である。
克服すべき大きな障壁は、非Pauliエラー、消去エラー、リークエラーである。
そこで我々は,この問題を許容する新たな手法,すなわちkシフト消去回復スキームを提案する。
論文参考訳(メタデータ) (Sun, 5 May 2024 14:32:50 GMT)
Elements Of Legislation For Artificial Intelligence Systems [0.0] 自律人工知能システムのための専用の運用コンテキストが作成される。
地方規制文書の文言は、人による使用と自律システムによる使用の2つのバージョンで表現できる。
個人と自律的な人工知能システムの共同作業の基盤を提供する地方規制は、関連する法律の基礎を形成することができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 11:01:31 GMT)
Efficient discrimination between real and complex quantum theories [0.0] ベル型パラメータ上の複素-実有界のより大きい比で実数に基づく量子論の不合理性を示す。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:47:31 GMT)
Efficient Remote Sensing with Harmonized Transfer Learning and Modality Alignment [0.0] ハーモナイズドトランスファーラーニングとモダリティアライメント(HarMA)は,タスク制約,モダリティアライメント,単一モダリティアライメントを同時に満足する手法である。
HarMAはリモートセンシング分野における2つの一般的なマルチモーダル検索タスクにおいて最先端の性能を達成する。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:10:03 GMT)
Dynamics of qudit gates and effects of spectator modes on optimal control pulses [0.0] 余剰モードの存在下で各モジュールのパルスを適用すれば、クロストークによる効果が低下する可能性がある。
単一量子SWAPゲートのパルスを分離して、それぞれがフォック状態にあるオブザーバモードの存在下で適用する。
論文参考訳(メタデータ) (Sun, 5 May 2024 13:53:16 GMT)
Digital quantum simulation of gravitational optomechanics with IBM quantum computers [0.0] 本稿では,量子機械振動子と光学場との相互作用を制御したハミルトニアンの作用のディジタル量子シミュレーションを紹介する。
これは、ボソン量子ビットマッピングプロトコルとデジタルゲート分解を利用して、IBM Quantumプラットフォームで利用可能な量子コンピュータでシミュレーションを実行することで実現される。
本稿では,2つの異なる量子コンピュータにおいて,誤差軽減とポストセレクション手法を適用した実験結果について述べる。
論文参考訳(メタデータ) (Sun, 5 May 2024 18:18:51 GMT)
Cavity QED systems for steady-state sources of Wigner-negative light [0.0] 光学キャビティQEDシステムは、定常なウィグナー負の光の電位源である。
キャビティからの連続出力場における時間モードについて考察する。
スピンサイズが変化するにつれて、ウィグナー分布負のリッチな構造が見つかる。
論文参考訳(メタデータ) (Sun, 5 May 2024 22:04:50 GMT)
Canonical data-reconstructions via kernels, Hilbert space-valued Gaussian processes, and quantum states [0.0] 演算子評価されたカーネルとその分解の研究において、新しい結果と新しい方向性を提供する。
私たちのアプローチは、より明示的な実現と新しい結果、そして新しいアプリケーションを提供します。
論文参考訳(メタデータ) (Sun, 5 May 2024 02:29:51 GMT)
Can Large Language Models Make the Grade? An Empirical Study Evaluating LLMs Ability to Mark Short Answer Questions in K-12 Education [0.0] 本稿では, 大規模言語モデルを用いて, 短時間の回答に対するオープンテキスト応答の精度を評価できるような, 新たなデータセットによる一連の実験について報告する。
GPT-4は, 基本的数発のプロンプト(Kappa, 0.70)が良好に動作し, 人体レベルのパフォーマンス(0.75)に非常に近いことが判明した。
この研究は、GPT-4が、専門家のラッカーと非常に近いパフォーマンスレベルで、短い回答読解質問を確実にスコアできるという以前の知見に基づいている。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:11:06 GMT)
Can LLMs Grade Short-Answer Reading Comprehension Questions : An Empirical Study with a Novel Dataset [0.0] 本稿では,Large Language Models (LLMs) の最新のバージョンが,形式的アセスメントのための短解問題に使用される可能性について検討する。
ガーナで150人以上の学生が実施した一連の読解評価から抽出した,短い回答読解質問の新しいデータセットを紹介した。
本論文は, 有能なヒトラッカーと比較して, 生成性LLMの児童短解反応の各種構成がいかに良好かを実証的に評価した。
論文参考訳(メタデータ) (Sun, 5 May 2024 16:01:40 GMT)
Arbitrary Amplification of Quantum Coherence in Asymptotic and Catalytic Transformation [0.0] 低コヒーレント状態から良好なコヒーレント状態を作ることができ、与えられたコヒーレント状態が他の状態に変換可能であるかどうかを示す。
局所部分系における所望の状態の準備を目的としたコヒーレンスの変種の場合、初期コヒーレンスの弱さにかかわらず変換の速度は非有界となる。
これを標準設定に適用すると、触媒はコヒーレンス率をゼロから無限に大きく向上させることができる。
論文参考訳(メタデータ) (Sun, 5 May 2024 04:44:59 GMT)
A drone detector with modified backbone and multiple pyramid featuremaps enhancement structure (MDDPE) [0.0] 本研究は,改良後骨と多重ピラミッド特徴地図強調構造(MDDPE)を有するドローン検出器を提案する。
新たな特徴マップでは,情報レベルの異なるモジュールを改良し,より堅牢で差別的な特徴を創出する。
論文参考訳(メタデータ) (Sun, 5 May 2024 10:28:26 GMT)
A Realist Interpretation of Unitarity in Quantum Gravity [0.0] ユニタリティは、状態の非正規化性と時間の問題のため、正準量子重力において実装するのが難しい概念である。
我々は、重力-フェルミオン系の大域的時間を定義するために、理論における定配置の仮定を用いる。
ミニ超空間におけるユニタリ状態は、ハミルトニアン制約の近似解を見つけることによって得られる。
論文参考訳(メタデータ) (Sun, 5 May 2024 17:10:10 GMT)
A Greedy Quantum Route-Generation Algorithm [0.0] 本稿では,量子コンピュータから得られた全てのサンプルからの情報を用いて,経路を生成するグリーディアルゴリズムを提案する。
有向非巡回グラフ (DAG) としての定式化における量子ビットの関係に気付き, 実現可能な解を適応的に構築するアルゴリズムを設計した。
論文参考訳(メタデータ) (Sun, 5 May 2024 21:20:46 GMT)