BAMBOO: A Comprehensive Benchmark for Evaluating Long Text Modeling Capacities of Large Language Models [141.2] 大規模言語モデル(LLM)は、通常の長さのNLPタスクよりも劇的な熟練を実現している。
マルチタスク長コンテキストベンチマークであるBAMBOOを提案する。
5つの異なる長いテキスト理解タスクから10のデータセットで構成されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:22:54 GMT)
Towards 3D Molecule-Text Interpretation in Language Models [125.6] 3D-MoLMは、LMに3D分子エンコーダを装着することで、3D分子の解釈と解析を可能にする。
この積分は、3D分子テキストプロジェクターによって達成され、3D分子エンコーダの表現空間とLMの入力空間をブリッジする。
我々は、3D分子中心の命令チューニングデータセット -- 3D-MoITを慎重にキュレートした。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:51:45 GMT)
4DGen: Grounded 4D Content Generation with Spatial-temporal Consistency [118.2] この4DGenは、4Dコンテンツ作成のための新しいフレームワークである。
静的な3Dアセットとモノクロビデオシーケンスを4Dコンテンツ構築のキーコンポーネントとして同定する。
我々のパイプラインは条件付き4D生成を容易にし、ユーザーは幾何学(3Dアセット)と運動(眼球ビデオ)を指定できる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:07:35 GMT)
PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation [110.1] PixArt-Sigmaは4K解像度で画像を直接生成できる拡散変換器モデルである。
PixArt-Sigmaは、非常に高い忠実度とテキストプロンプトとのアライメントを改善した画像を提供する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:59:25 GMT)
Lost in Translation? Translation Errors and Challenges for Fair Assessment of Text-to-Image Models on Multilingual Concepts [107.3] テキスト・トゥ・イメージ(T2I)モデルの多言語能力のベンチマークは、テスト言語で生成された画像と概念集合上の期待画像分布を比較した。
このようなベンチマークの一つである"Conceptual Coverage Across Languages" (CoCo-CroLa)は、7つの言語に翻訳された概念リストから画像を生成するように促すことで、T2Iモデルの具体的な名詞の在庫を評価する。
このベンチマークは、スペイン語、日本語、中国語の様々な重大度の翻訳誤りを含むことがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:05:11 GMT)
OpenSUN3D: 1st Workshop Challenge on Open-Vocabulary 3D Scene Understanding [96.7] 本報告では,ICCV 2023とともに開かれたOpenSUN3D Workshop on Open-Vocabulary 3D Scene Understandingにおける課題の概要を紹介する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:41:49 GMT)
Compressing LLMs: The Truth is Rarely Pure and Never Simple [90.1] Knowledge-Intensive Compressed LLM BenchmarKは、圧縮された大言語モデルの評価プロトコルを再定義することを目的としている。
LLM-KICKは、現在のSoTA圧縮方式の多くの有利な利点と不運な点を明らかにしている。
LLM-KICKは、言語理解、推論、生成、テキスト内検索、テキスト内要約などのための圧縮LLMの能力に一様にアクセスできるように設計されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:38:59 GMT)
Single-Model and Any-Modality for Video Object Tracking [85.8] 任意のモダリティに対して単一のパラメータセットの統一トラッカーUn-Trackを導入する。
任意のモダリティを扱うために,低ランク因子化および再構成手法を用いて,それらの共通潜時空間を学習する。
我々のUn-Trackは、+6.6M(93M以上)のパラメータを持つ+2.14(21.50以上)のGFLOPを導入することで、DepthTrackデータセット上で、+8.1絶対Fスコアゲインを達成する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:26:48 GMT)
FaceTalk: Audio-Driven Motion Diffusion for Neural Parametric Head Models [85.2] 音声信号から人間の頭部の高忠実度3次元動作系列を合成するための新しい生成手法であるFaceTalkを紹介する。
我々の知る限りでは、人間の頭部の現実的で高品質な運動合成のための生成的アプローチを提案するのはこれが初めてである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:45:01 GMT)
Scaling Data Diversity for Fine-Tuning Language Models in Human Alignment [84.3] 人間の好みの調整は、大きな言語モデルが誤解を招くか有害なコンテンツを生成するのを防ぐ。
本研究では, 微調整後のLLMの最終性能と線形相関を示唆し, 即時多様性の新たな定式化を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:08:55 GMT)
GeoGaussian: Geometry-aware Gaussian Splatting for Scene Rendering [83.2] ガウススプレイティング最適化の過程で、その構造が意図的に保存されていない場合、シーンの幾何学は徐々に悪化する。
我々はこの問題を緩和するためにGeoGaussianと呼ばれる新しいアプローチを提案する。
提案するパイプラインは、新しいビュー合成と幾何再構成において最先端の性能を達成する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:06:41 GMT)
Repositioning the Subject within Image [78.8] 本稿では,革新的動的操作タスク,主題再構成を導入する。
このタスクは、画像の忠実性を保ちながら、ユーザが指定した対象を所望の位置に移動させることである。
本研究は, 主観的再配置の基本的なサブタスクを, 統一的, 即効的な塗装作業として効果的に再構築できることを明らかにする。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:15:34 GMT)
The Update-Equivalence Framework for Decision-Time Planning [78.4] 本稿では,サブゲームの解決ではなく,更新等価性に基づく意思決定時計画のための代替フレームワークを提案する。
ミラー降下に基づく完全協調型ゲームに対する有効音声探索アルゴリズムと、磁気ミラー降下に基づく対戦型ゲームに対する探索アルゴリズムを導出する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:58:59 GMT)
MME: A Comprehensive Evaluation Benchmark for Multimodal Large Language Models [73.9] マルチモーダル言語モデル(MLLM)は、マルチモーダルタスクを実行するために強力なLLMに依存している。
本稿では,MLLM 評価ベンチマーク MME について述べる。
知覚能力と認知能力の両方を合計14のサブタスクで測定する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:55:52 GMT)
MiM-ISTD: Mamba-in-Mamba for Efficient Infrared Small Target Detection [73.1] 基本モデルの開発により、赤外線小目標検出(ISTD)は大きな進歩を遂げた。
効率的なISTDのためのMamba-in-Mamba (MiM-ISTD) 構造を調整する。
NUAA-SIRSTとIRSTD-1kを用いた実験により,本手法の精度と効率が向上した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:58:23 GMT)
GOMA: Proactive Embodied Cooperative Communication via Goal-Oriented Mental Alignment [73.0] 我々は、ゴール指向メンタルアライメント(GOMA)という新しい協調コミュニケーションフレームワークを提案する。
GOMAは、目標に関連のあるエージェントの精神状態のミスアライメントを最小限に抑える計画問題として、言語コミュニケーションを定式化している。
我々は,Overcooked(マルチプレイヤーゲーム)とVirtualHome(家庭用シミュレータ)の2つの挑戦環境において,強いベースラインに対するアプローチを評価する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:52:52 GMT)
Improving Dialogue Agents by Decomposing One Global Explicit Annotation with Local Implicit Multimodal Feedback [71.6] 本稿では,LLMに基づく対話エージェントをグローバルな(対話レベル)報酬に基づいて整列する手法について述べるとともに,自然に発生するマルチモーダル信号も考慮する。
我々は,GELI手法の性能を評価するために定量的,質的な人間の研究を行い,ベースライン手法と比較して,様々な対話的指標に一貫した改善が見られた。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:21:26 GMT)
CLEX: Continuous Length Extrapolation for Large Language Models [68.4] 大規模言語モデル(LLM)のためのCLEX(Continuous Longth Extrapolation)を提案する。
CLEXはコンテキストウィンドウを4倍または8倍のトレーニング長に拡張するが、性能は劣化しない。
我々のモデルは4k長でトレーニングされ、最先端のオープンソースモデルに対して最大32k長でトレーニングされた。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:53:28 GMT)
GRA: Detecting Oriented Objects through Group-wise Rotating and Attention [64.2] オブジェクト指向オブジェクト検出のための軽量で効果的な textbfGroup-wise textbfRotating and textbfAttention (GRA) モジュールを提案する。
GRAは、グループワイド回転(Group-wise Rotating)とグループワイド注意(Group-wise Attention)という2つの重要なコンポーネントを含む、さまざまな向きのオブジェクトのきめ細かい特徴を適応的にキャプチャすることができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:29:32 GMT)
The Expressive Leaky Memory Neuron: an Efficient and Expressive Phenomenological Neuron Model Can Solve Long-Horizon Tasks [64.1] 本稿では,脳皮質ニューロンの生物学的モデルであるExpressive Memory(ELM)ニューロンモデルを紹介する。
ELMニューロンは、上記の入力-出力関係を1万以下のトレーニング可能なパラメータと正確に一致させることができる。
本稿では,Long Range Arena(LRA)データセットなど,時間構造を必要とするタスクで評価する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:36:53 GMT)
Domain-Guided Masked Autoencoders for Unique Player Identification [62.9] マスク付きオートエンコーダ (MAE) は, 従来の特徴抽出器よりも優れた代替手段として出現している。
人間の視覚に触発され、我々はd-MAEと呼ばれるMAEのための新しいドメイン誘導マスキングポリシーを考案した。
3つの大規模スポーツデータセットの実験を行った。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:14:57 GMT)
Unveiling and Mitigating Memorization in Text-to-image Diffusion Models through Cross Attention [62.7] 研究は、テキストから画像への拡散モデルがトレーニングデータから画像を複製し、著作権侵害やプライバシーのリスクに対する大きな懸念を引き起こすことを示唆している。
暗記中、クロスアテンションは特定のトークンの埋め込みに不均等に集中する傾向にあることが明らかとなった。
拡散モデルにおける記憶の検出と緩和のための革新的なアプローチを導入する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 01:27:00 GMT)
Local-consistent Transformation Learning for Rotation-invariant Point Cloud Analysis [61.0] ポイント形状解析のための局所一貫性変換(LocoTrans)学習戦略を提案する。
まず、LRFにおける2つの軸の対称性を考慮し、LCRF(Local-Consistent Reference frame)を構築する。
整合性は局所的にのみ存在するため、相対的なポーズ情報はネットワークの中間層で失われる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:40:50 GMT)
Can LLMs Express Their Uncertainty? An Empirical Evaluation of Confidence Elicitation in LLMs [60.6] 従来の信頼性推論手法は、内部モデル情報やモデル微調整へのホワイトボックスアクセスに依存していた。
これにより、不確実性推定のためのブラックボックスアプローチの未解決領域を探索する必要性が高まっている。
言語的信頼を導き出すための戦略の推進、複数の応答を生成するためのサンプリング方法、一貫性を計算するための集約手法の3つの要素からなる体系的フレームワークを定義する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:38:48 GMT)
A Lie Group Approach to Riemannian Batch Normalization [59.5] 本稿では,リー群における正規化手法の統一的枠組みを確立する。
我々は3つの異なるリー群構造を持つ対称正定性(SPD)に焦点を当てる。
これらのリー群によって誘導される特定の正規化層は、SPDニューラルネットワークに対して提案される。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:24:07 GMT)
DP-OPT: Make Large Language Model Your Privacy-Preserving Prompt Engineer [57.0] 大きな言語モデル(LLM)は、様々なタスクのための支配的なツールとして現れています。
しかし、データプライバシに関する懸念は、調整されたプロンプトが機密情報に依存しているため、障害となる。
本稿では,DP-OPT(Dis Differentially-Private Offsite Prompt Tuning)を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:16:41 GMT)
Zippo: Zipping Color and Transparency Distributions into a Single Diffusion Model [56.8] 色と透明性の分布を単一の拡散モデルに分解する統合フレームワークZippoを提案する。
ZippoはアルファマットからRGBイメージを生成し、入力イメージから透過性を予測できる。
実験では,Zippoのテキスト条件の透過的な画像生成能力について紹介した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:02:39 GMT)
Logic Query of Thoughts: Guiding Large Language Models to Answer Complex Logic Queries with Knowledge Graphs [56.5] LGOT(Logic-Query-of-Thoughts)は知識グラフ推論と大規模言語モデルを組み合わせた最初の方法である。
実験の結果,ChatGPTよりも20%向上した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:01:45 GMT)
PyGOD: A Python Library for Graph Outlier Detection [56.3] PyGODは、グラフデータの外れ値を検出するオープンソースライブラリである。
外れ値検出のための主要なグラフベースのメソッドを幅広くサポートしています。
PyGODはBSD 2-Clauseライセンスの下でhttps://pygod.orgとPython Package Index (PyPI)でリリースされている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:37:05 GMT)
Unifying Global-Local Representations in Salient Object Detection with Transformer [55.2] 我々は、視覚変換器という新しいアテンションベースのエンコーダを有能な物体検出に導入する。
非常に浅い層でのグローバルビューでは、トランスフォーマーエンコーダはより局所的な表現を保持する。
提案手法は,5つのベンチマークにおいて,他のFCN法およびトランスフォーマー法よりも優れていた。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:46:31 GMT)
Implicit Event-RGBD Neural SLAM [54.7] 神経性SLAMは近年顕著な進歩を遂げている。
既存の手法は、非理想的なシナリオにおいて重大な課題に直面します。
本稿では,最初のイベントRGBD暗黙的ニューラルSLAMフレームワークであるEN-SLAMを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:54:59 GMT)
Training Large Language Models for Reasoning through Reverse Curriculum Reinforcement Learning [54.6] 逆カリキュラム強化学習(RL)によるR$3の学習推論を提案する。
RLは、大規模言語モデルのプロセス監視の利点を達成するために、結果監視のみを採用する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:02:02 GMT)
Modeling Continuous Motion for 3D Point Cloud Object Tracking [54.5] 本稿では,各トラックレットを連続ストリームとみなす新しいアプローチを提案する。
各タイムスタンプでは、現在のフレームだけがネットワークに送られ、メモリバンクに格納された複数フレームの履歴機能と相互作用する。
頑健な追跡のためのマルチフレーム機能の利用性を高めるために,コントラッシブシーケンス強化戦略を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:36:52 GMT)
Endora: Video Generation Models as Endoscopy Simulators [53.7] 本稿では,臨床内視鏡シーンをシミュレートする医用ビデオを作成するための革新的な手法であるモデルを紹介する。
また、ビデオ生成モデルを用いた内視鏡シミュレーションのための最初の公開ベンチマークを開拓した。
Endoraは、臨床内視鏡研究のための生成AIの展開において、注目すべきブレークスルーとなる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:51:59 GMT)
3D Human Reconstruction in the Wild with Synthetic Data Using Generative Models [53.0] 本稿では,人間の画像とそれに対応する3Dメッシュアノテーションをシームレスに生成できるHumanWildという,最近の拡散モデルに基づく効果的なアプローチを提案する。
生成モデルを排他的に活用することにより,大規模な人体画像と高品質なアノテーションを生成し,実世界のデータ収集の必要性を解消する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:31:16 GMT)
Predicting the long-term collective behaviour of fish pairs with deep learning [52.8] 本研究では,魚種Hemigrammus rhodostomusの社会的相互作用を評価するための深層学習モデルを提案する。
我々は、ディープラーニングのアプローチの結果と実験結果と、最先端の分析モデルの結果を比較した。
機械学習モデルにより、ソーシャルインタラクションは、微妙な実験的観測可能な解析的相互作用と直接競合できることを実証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:19:40 GMT)
Forging the Forger: An Attempt to Improve Authorship Verification via Data Augmentation [52.7] 著者検証(英語: Authorship Verification, AV)とは、ある特定の著者によって書かれたか、別の人物によって書かれたのかを推測するテキスト分類タスクである。
多くのAVシステムは敵の攻撃に弱いことが示されており、悪意のある著者は、その書体スタイルを隠蔽するか、あるいは他の著者の書体を模倣することによって、積極的に分類者を騙そうとしている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:36:26 GMT)
Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.5] 本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:02:55 GMT)
THOR: Text to Human-Object Interaction Diffusion via Relation Intervention [51.0] 我々は、リレーショナルインターベンション(THOR)を用いたテキスト誘導型ヒューマンオブジェクト相互作用拡散モデルを提案する。
各拡散段階において、テキスト誘導された人間と物体の動きを開始し、その後、人と物体の関係を利用して物体の動きに介入する。
テキスト記述をシームレスに統合するText2HOIデータセットであるText-BEHAVEを,現在最大規模で公開されている3D HOIデータセットに構築する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:17:25 GMT)
Online Multi-Task Learning with Recursive Least Squares and Recursive Kernel Methods [50.7] 本稿では,オンラインマルチタスク学習(MTL)回帰問題に対する2つの新しいアプローチを紹介する。
入力空間の次元の2次パースタンスコストで精度よく近似的な再帰を実現する。
我々は,実世界の風速予測ケーススタディにおいて,オンラインMTL法と他の競技者との比較を行った。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:22:39 GMT)
Data is all you need: Finetuning LLMs for Chip Design via an Automated design-data augmentation framework [50.0] 本稿では,Verilog と EDA スクリプトに適合する高ボリュームかつ高品質な自然言語を生成する自動設計データ拡張フレームワークを提案する。
Verilog生成の精度は現在の最先端のオープンソースVerilog生成モデルを超え、同じベンチマークで58.8%から70.6%に増加した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:01:03 GMT)
Proximity-Informed Calibration for Deep Neural Networks [49.3] ProCalは、近接性に基づいてサンプル信頼度を調整する理論的保証を持つプラグアンドプレイアルゴリズムである。
ProCalは、近接バイアスに対処し、バランスの取れた、長い、分布シフトの設定の校正を改善するのに有効であることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:43:38 GMT)
Analytic-Splatting: Anti-Aliased 3D Gaussian Splatting via Analytic Integration [49.0] 3DGSはエイリアスフリーではなく、解像度の異なるレンダリングは、ひどくぼやけたり、ジャギーになったりする可能性がある。
これは、3DGSが各ピクセルを領域ではなく孤立した単一点として扱い、ピクセルのフットプリントの変化に敏感であるからである。
本稿では、この近似を2次元のピクセルシェーディングに導入し、2D-ピクセルウィンドウ領域内のガウス積分を解析的に近似するアナリシス・スプレイティングを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 02:06:03 GMT)
Beyond Static Evaluation: A Dynamic Approach to Assessing AI Assistants' API Invocation Capabilities [48.9] 人間の関与なしにアシスタントのAPIコール能力を評価するために,自動動的評価(Automated Dynamic Evaluation, AutoDE)を提案する。
この枠組みでは,人間と機械の相互作用において,真の人間の会話パターンを忠実に反映するよう努めている。
提案手法は,従来の静的評価に比べて8%の精度向上を示す0.99の相関で人体評価を反映する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:34:12 GMT)
Self-Supervised Video Desmoking for Laparoscopic Surgery [48.8] 自己監督型手術ビデオデモーキング(SelfSVD)について紹介する。
高エネルギー装置の起動前に捕捉したフレームは一般に明確である(プレスモークフレーム、PSフレーム)。
さらに、PSフレームからモデルに貴重な情報を供給し、マスキング戦略と正規化項を提示し、自明な解決策を避ける。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:38:58 GMT)
TMT-VIS: Taxonomy-aware Multi-dataset Joint Training for Video Instance Segmentation [48.8] 大規模データセットのトレーニングは、ビデオインスタンスセグメンテーションのパフォーマンスを高めることができるが、VISのデータセットは労働コストが高いためスケールアップが難しい。
私たちが持っているものは、多数の独立した提出された特定のデータセットであり、データ量と多様性を高めるためにデータセットの集合をまたいだモデルを共同でトレーニングすることが魅力です。
我々は、YouTube-VIS 2019、YouTube-VIS 2021、OVIS、UVOの4つの人気で挑戦的なベンチマークで、広範囲に評価を行っている。
本モデルでは,ベースラインソリューションよりも大幅に改善され,すべてのベンチマークで新たな最先端レコードが設定される。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:15:45 GMT)
SQ-LLaVA: Self-Questioning for Large Vision-Language Assistant [48.2] 本稿では,SQ-LLaVA: Self-Questioning for Large Vision-Language Assistantを提案する。
SQ-LLaVAは、視覚的手がかりと先行言語知識を分析しながら、柔軟で有意義な画像関連質問を生成する能力を示す。
高品質な命令データに対する微調整SQ-LLaVAは、従来の視覚的インストラクションチューニング手法と比較して一貫した性能向上を示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:42:38 GMT)
MOFI: Learning Image Representations from Noisy Entity Annotated Images [47.7] ノイズのあるエンティティアノテート画像から画像表現を学習するための新しい視覚基盤モデルMOFIを提案する。
ノイズの多い画像とテキストのペアから画像にエンティティラベルを自動的に割り当てる手法を提案する。
提案手法では、アルトテキストからエンティティを抽出するために名前付きエンティティ認識モデルを使用し、CLIPモデルを用いて、ペア画像のラベルとして正しいエンティティを選択する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:49:19 GMT)
Multitask frame-level learning for few-shot sound event detection [46.3] 本稿では,限られたサンプルを用いて音声イベントを自動的に認識・分類することを目的とした音声イベント検出(SED)について述べる。
本稿では,データ拡張のためのリニアタイミングマスクであるTimeFilterAugと,マルチタスクフレームレベルのSEDフレームワークを提案する。
提案手法はFスコア63.8%を達成し, バイオ音響事象検出カテゴリーにおける第1位を確保した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:00:40 GMT)
SmartPlay: A Benchmark for LLMs as Intelligent Agents [45.8] SmartPlayはRock-Paper-Scissors, Tower of Hanoi, Minecraftなど,6つの異なるゲームで構成されている。
各ゲームは知的LLMエージェントの9つの重要な能力のサブセットに挑戦する。
テストには、オブジェクト依存による推論、事前計画、空間的推論、履歴からの学習、ランダムさの理解が含まれる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:23:31 GMT)
Pioneering SE(2)-Equivariant Trajectory Planning for Automated Driving [45.2] 制御されたエゴ車両の軌道を計画することは、自動走行において重要な課題である。
本稿では,全車両に対して多モード共同予測を生成する軽量同変計画モデルを提案する。
また,車載GPSナビゲーションシステムによって提供される高水準経路に沿って,エゴ車両を誘導する等変経路アトラクションを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:53:46 GMT)
When the Majority is Wrong: Modeling Annotator Disagreement for Subjective Tasks [45.1] ヘイトスピーチの検出における重要な問題は、ある声明が人口集団に対して攻撃的であるかどうかを決定することである。
我々は、潜在的に攻撃的なテキストに基づいて、個々のアノテータ評価を予測するモデルを構築した。
その結果、アノテータの評価は、その人口統計情報とオンラインコンテンツに関する意見を用いて予測できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:39:58 GMT)
Concept-Best-Matching: Evaluating Compositionality in Emergent Communication [45.0] 本稿では,出現語と自然言語概念のベストマッチを見出すことにより,創発的コミュニケーションの合成性を評価する手法を提案する。
我々の知る限りでは、創発語と人間の概念の直接的かつ解釈可能なマッピングが提供されるのは初めてである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:47:02 GMT)
Usefulness of adaptive strategies in asymptotic quantum channel discrimination [43.8] 本稿では,二分仮説テストの枠組みにおける適応手法の有用性について検討する。
チャネルの使用に関して、適応戦略と非適応戦略の間には根本的な区別がある。
古典的フィードバックによる適応的戦略は、適応的でない製品入力戦略を超えてチャネルの識別能力を高めないことを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:20:10 GMT)
Our Model Achieves Excellent Performance on MovieLens: What Does it Mean? [43.4] MovieLensのデータセットを精巧に分析する。
MovieLensプラットフォームと対話する場合、異なる段階でのユーザインタラクションには大きな違いがある。
MovieLensデータセット上で優れたレコメンデーション精度を達成するモデルは、実際には優れたパフォーマンスを示すものではないかもしれない。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:34:29 GMT)
WeatherDepth: Curriculum Contrastive Learning for Self-Supervised Depth Estimation under Adverse Weather Conditions [43.0] カリキュラムのコントラスト学習による自己教師付き頑健な深度推定モデルであるWeatherDepthを提案する。
提案手法は様々なアーキテクチャに容易に組み込めることが証明され、合成および実際の気象データセット上での最先端(SoTA)性能を示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:53:44 GMT)
Bilateral Propagation Network for Depth Completion [41.2] 深度補正は,色画像の同期による疎深度測定から高密度深度マップを導出することを目的としている。
現在の最先端技術(SOTA)法は主に伝播に基づく手法であり、初期推定密度深さの反復精製として機能する。
本稿では, スパースデータの直接結合を避けるために, 早期に深度を伝播するバイラテラル伝搬ネットワーク(BP-Net)を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:48:46 GMT)
Concatenate, Fine-tuning, Re-training: A SAM-enabled Framework for Semi-supervised 3D Medical Image Segmentation [40.8] 本稿では,3段階のフレームワーク,すなわちコンカニケート,ファインチューニング,リトレーニングを提案する。
我々のCFRフレームワークはプラグイン・アンド・プレイであり、様々な人気のある半教師付き手法と容易に互換性がある。
特に、CFRフレームワークでは、平均教師のDiceスコアを29.68%から74.40%に改善している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:30:56 GMT)
Boosting Semi-Supervised Temporal Action Localization by Learning from Non-Target Classes [40.7] 本稿では,非対象クラスから学習し,従来の対象クラスのみに焦点を移すことを提唱する。
まず,対象のクラスに対する信頼度とランクの両方をモデル化することにより,ラベル空間から高品質な正負のクラスを適応的に選択する革新的な戦略を考案する。
最後に、正負のプロセスと負のプロセスがハイブリッドな正負の学習フレームワークに統合され、ラベル付きビデオとラベルなしビデオの両方で非ターゲットクラスの利用が容易になる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:26:23 GMT)
Quantum control and Berry phase of electron spins in rotating levitated diamonds in high vacuum [40.3] 内部スピン量子ビットを持つ高真空中での浮遊ダイヤモンド粒子は量子力学の探索のために提案されている。
複数の安定化電極を持つ一体型表面イオントラップを作製した。
これによりオンチップ浮揚が容易になり、高真空で浮遊したナノダイアモンドの磁気共鳴測定が初めて光学的に検出された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:51:45 GMT)
FORCE: Dataset and Method for Intuitive Physics Guided Human-object Interaction [39.8] 本稿では,物理属性をモデル化し,多種多様でニュアンスのある人間と物体の相互作用をキネマティックに表現するForceモデルを提案する。
我々の重要な洞察は、人間の動きは人間の力と知覚される抵抗の相互関係によって決定されるということである。
人間の力を取り入れた実験は、多クラス動作の学習を容易にする。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:52:05 GMT)
Artifact Feature Purification for Cross-domain Detection of AI-generated Images [38.2] 既存の画像検出方法は、ドメイン外ジェネレータや画像シーンに直面すると、性能低下に悩まされる。
本稿では, 人工物抽出ネットワーク(APN)を提案し, 明示的で暗黙的な浄化プロセスを通じて生成した画像から人工物抽出を容易にする。
クロスジェネレータ検出では、APNの平均精度は、GenImageデータセットの以前の10メソッドよりも5.6% 16.4%高く、DiffusionForensicsデータセットの1.7% 50.1%である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:17:06 GMT)
Selective Hourglass Mapping for Universal Image Restoration Based on Diffusion Model [36.6] そこで我々は拡散モデルDiffUIRに基づく高度な時間ガラスマッピング戦略を提案する。
5つの画像復元タスク、22のベンチマーク、ゼロショットの一般化設定で最先端の性能を実現する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:41:20 GMT)
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions [36.3] 気象条件下でのマルチエージェント認識システムにおいて,LiDARに基づく3次元物体検出のための領域一般化手法 V2X-DGW を提案する。
クリーンな天候だけでなく、クリーンな天気データのみを学習することで、好適なマルチエージェントのパフォーマンスを確保することを目的としている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:29:41 GMT)
TempCompass: Do Video LLMs Really Understand Videos? [36.3] 既存のベンチマークでは、ビデオLLMの時間知覚能力に関する包括的なフィードバックが得られていない。
時間的側面とタスクフォーマットの多様性を導入した textbfTemp ベンチマークを提案する。
我々は,8つの最先端(SOTA)ビデオLLMと3つの画像LLMを評価し,これらのモデルが時間知覚能力に劣ることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:50:04 GMT)
Evaluation Ethics of LLMs in Legal Domain [35.7] 本稿では,大規模言語モデル (LLM) の基本的言語能力, 専門的法的知識, 法的堅牢性を評価するために, 真正の法的事例を利用する新規性評価手法を提案する。
包括的評価から得られた知見は,法律領域における大規模言語モデルの適合性と性能に関する学術的議論に大きく貢献する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:05:13 GMT)
Training A Small Emotional Vision Language Model for Visual Art Comprehension [35.3] 本稿では,視覚芸術を理解するために,小さな視覚言語モデルを開発する。
感情モデリングと入出力特徴アライメントによって、小さな感情視覚言語モデル(SEVLM)を構築する。
提案手法は,ベースラインSEVLMの視覚的理解性能を一貫して向上することを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:01:02 GMT)
Efficiently Detecting Reentrancy Vulnerabilities in Complex Smart Contracts [35.3] 既存の脆弱性検出ツールは、複雑なコントラクトにおける脆弱性の効率性や検出成功率の面では不十分である。
SliSEは、複雑なコントラクトに対するReentrancy脆弱性を検出する堅牢で効率的な方法を提供する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:08:30 GMT)
EX-Graph: A Pioneering Dataset Bridging Ethereum and X [35.0] EX-Graphは、Authentically Link and Xという新しいデータセットで、このタイプの最初の、そして最大のデータセットをマークしている。
EX-Graphの詳細な統計分析では、X-アドレスと非X-アドレスの構造的な違いが強調されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:15:13 GMT)
Granular Change Accuracy: A More Accurate Performance Metric for Dialogue State Tracking [34.4] グラニュラーチェンジ精度(GCA)について紹介する。
GCAは、対話履歴全体にわたる対話状態の変化の予測を評価することに重点を置いている。
その結果,GAAは分布の均一性や誤差の位置から生じるバイアスを効果的に低減できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:07:44 GMT)
A Simple Mixture Policy Parameterization for Improving Sample Efficiency of CVaR Optimization [33.8] 政策勾配(PG)を利用してリスク条件値(CVaR)を最適化する強化学習アルゴリズムは、サンプルの非効率性において重大な課題に直面している。
本稿では,リスクニュートラル政策と調整可能な政策を統合し,リスク・アバース政策を形成する簡易な混合政策パラメタライゼーションを提案する。
実験により、この混合パラメータ化は様々なベンチマーク領域で一意に有効であることが判明した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 02:24:09 GMT)
Brain-on-Switch: Towards Advanced Intelligent Network Data Plane via NN-Driven Traffic Analysis at Line-Speed [33.5] プログラム可能なネットワークは、ラインスピードで学習に基づくトラフィック分析を実現するIntelligent Network Data Plane (INDP) に大きな研究を巻き起こした。
INDPの以前の技術は、データプレーンにツリー/フォレストモデルをデプロイすることに焦点を当てていた。
本稿では,ニューラルネットワーク(NN)によるトラフィック解析を回線速度で実現することにより,INDPの境界を押し上げるBoSを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:59:30 GMT)
Decoding Continuous Character-based Language from Non-invasive Brain Recordings [33.1] 本研究では,単心的非侵襲的fMRI記録から連続言語を復号する手法を提案する。
文字ベースのデコーダは、固有の文字構造を特徴とする連続言語の意味的再構成のために設計されている。
被験者間での単一の試行から連続言語を復号化できることは、非侵襲的な言語脳-コンピュータインタフェースの有望な応用を実証している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:12:33 GMT)
Audio-Visual Segmentation via Unlabeled Frame Exploitation [32.8] オーディオ・ビジュアル・セグメンテーション(AVS)における未ラベルフレームの可能性について検討する。
本稿では,それらの特徴を考慮し,AVSの取組に効果的に活用する多目的フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:45:14 GMT)
Towards Robust Fidelity for Evaluating Explainability of Graph Neural Networks [32.3] グラフニューラルネットワーク(GNN)は、グラフノード間のメッセージパッシングを介してグラフィカルデータの依存性構造を利用するニューラルネットワークである。
GNN説明可能性の研究における主な課題は、これらの説明機能の性能を評価するための忠実度尺度を提供することである。
本稿では,この基礎的課題について考察し,その限界を浮き彫りにする。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:35:59 GMT)
ChartThinker: A Contextual Chain-of-Thought Approach to Optimized Chart Summarization [32.2] 本研究は,各チャートに包括的チャートキャプチャペアと微調整命令の大規模データセットを構築した。
本稿では,思考の連鎖に基づいて深い分析を合成する,革新的なチャート要約手法であるChartThinkerを提案する。
キュレートされたデータセットに基づいて、トレーニングされたモデルは、チャートの要約タスクにおいて、常に優れたパフォーマンスを示します。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:49:09 GMT)
AutoLoRA: Automatically Tuning Matrix Ranks in Low-Rank Adaptation Based on Meta Learning [32.0] 低ランク適応 (LoRA) 低ランクインクリメンタル更新行列は、凍結事前訓練された重量の上に置かれる。
本稿では,各LoRA層の最適ランクを自動的に識別するフレームワークであるAutoLoRAを紹介する。
自然言語理解,生成,シーケンスラベリングに関する実験により,AutoLoRAの有効性が示された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:55:47 GMT)
Neural Markov Random Field for Stereo Matching [31.8] データ駆動型ニューラルネットワークを用いてポテンシャル関数とメッセージパッシングの両方を設計するニューラルネットワークモデルを提案する。
また,差分提案ネットワーク(DPN)を提案し,不一致の探索空間を適応的に創出する。
提案されたアプローチは、KITTI 2012と2015のリーダーボードの両方で1位であり、100msより高速である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:40:46 GMT)
SVGDreamer: Text Guided SVG Generation with Diffusion Model [31.8] SVGDreamerと呼ばれる新しいテキスト誘導ベクトルグラフィックス合成法を提案する。
SIVEプロセスは、前景オブジェクトと背景への合成の分解を可能にする。
VPSDアプローチは、彩度の過飽和、ベクトルプリミティブの過度な平滑化、限られた結果の多様性といった課題に取り組む。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:12:58 GMT)
Recent Advances in 3D Gaussian Splatting [31.4] 3次元ガウススプラッティングは、新規なビュー合成のレンダリング速度を大幅に高速化した。
3D Gaussian Splattingの明示的な表現は、動的再構成、幾何学的編集、物理シミュレーションなどの編集作業を容易にする。
本稿では,3次元再構成,3次元編集,その他の下流アプリケーションに大まかに分類できる最近の3次元ガウス散乱法について,文献的考察を行う。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:57:08 GMT)
TRELM: Towards Robust and Efficient Pre-training for Knowledge-Enhanced Language Models [31.2] 本稿では,知識強化言語モデルのためのロバストかつ効率的な事前学習フレームワークであるTRELMを紹介する。
我々は、知識を3倍に注入するための堅牢なアプローチと、価値ある情報を取得するための知識強化されたメモリバンクを採用しています。
我々は,TRELMが事前学習時間を少なくとも50%削減し,知識探索タスクや複数の知識認識言語理解タスクにおいて,他のKEPLMよりも優れていることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:04:35 GMT)
m&m's: A Benchmark to Evaluate Tool-Use for multi-step multi-modal Tasks [31.0] 我々は、33のツールを含む4K以上のマルチステップマルチモーダルタスクを含むベンチマークであるm&m'sを紹介する。
これら各タスククエリに対して、この現実的なツールセットを使用して自動生成されたプランを提供する。
1,565のタスクプランの高品質なサブセットを提供する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:36:18 GMT)
A Versatile Framework for Multi-scene Person Re-identification [30.7] 人物再識別(ReID)は、重複しないカメラビュー間で同一人物の画像の関連を学習するために、10年間にわたって広く開発されてきた。
多くのReID変種の性能にもかかわらず、これらの変種は典型的には明確に機能し、他の問題にも適用できない。
この研究は、このような問題を解決するために多目的ReIDモデルを学習する最初の試みに寄与する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:04:09 GMT)
Tokenizer Choice For LLM Training: Negligible or Crucial? [30.3] 24個の単言語LLMと多言語LLMを学習し,トークン化選択が大規模言語モデル(LLM)の下流性能に与える影響について検討した。
トークン化ツールの選択は、ダウンストリームのパフォーマンスとトレーニングコストに大きな影響を与えます。
ヨーロッパの5言語で訓練された多言語トークン化器は,英語と比較して語彙サイズが3倍に大きくなることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:17:22 GMT)
Is Mamba Effective for Time Series Forecasting? [30.2] 状態空間モデル(SSM)は、シーケンス内の複雑な依存関係をキャプチャする能力によって、注目を集めている。
本稿では,時系列予測(TSF)のための2つの簡単なSSMモデルを紹介する。
S-MambaとD-MambaはGPUメモリとトレーニング時間を節約しながら優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:50:44 GMT)
Enhancing Event Causality Identification with Rationale and Structure-Aware Causal Question Answering [30.0] 事象因果同定(DECI)は、文書中の2つの事象間の因果関係を特定することを目的としている。
近年の研究では、事前訓練された言語モデルを用いて事象因果関係を生成する傾向にある。
本稿では,合理的かつ構造を考慮した因果的質問応答による事象因果同定を強化するためのマルチタスク学習フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:41:58 GMT)
Omni-Recon: Towards General-Purpose Neural Radiance Fields for Versatile 3D Applications [29.6] Omni-Reconと呼ばれるフレームワークは、(1)一般化可能な3D再構成とゼロショットマルチタスクシーン理解、(2)リアルタイムレンダリングやシーン編集といった様々な下流3Dアプリケーションへの適応性を実現する。
具体的には、Omni-Reconは2つの分離枝を持つ画像ベースレンダリングを用いた汎用NeRFモデルを備えている。
この設計は、ゼロショットマルチタスクシーン理解のために、様々なタスクで再利用可能なブレンディングウェイトを用いて、最先端(SOTA)の一般化可能な3次元表面再構成品質を実現する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:47:26 GMT)
ConvSDG: Session Data Generation for Conversational Search [29.2] 本稿では,セッションデータ生成のための大規模言語モデル(LLM)を用いて,対話型検索の実現可能性を検討する枠組みを提案する。
このフレームワーク内では、教師なしおよび半教師なし学習による対話/セッションレベルおよびクエリレベルのデータ生成を設計する。
生成されたデータは、会話の密集したレトリバーを微調整するために使用される。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:34:40 GMT)
LAN: Learning Adaptive Neighbors for Real-Time Insider Threat Detection [29.2] 我々は、リアルタイムITDを活動レベルで初めて研究し、きめ細かいフレームワークLANを提示する。
具体的には、LANはアクティビティシーケンス内の時間的依存関係を同時に学習する。
本稿では,正常な活動からの自己超越信号と異常な活動からの監視信号とを統合したハイブリッド予測損失を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:05:51 GMT)
Self-supervised co-salient object detection via feature correspondence at multiple scales [27.7] 本稿では,画像群における2段階の自己教師型手法を用いて,セグメンテーションアノテーションを必要とせず,共起性有色物体(CoSOD)を検出する手法を提案する。
我々は、画像間の局所パッチレベルの特徴対応を計算し、コサレント領域を検出する自己教師ネットワークを訓練する。
3つのCoSODベンチマークデータセットの実験では、我々のモデルは、対応する最先端モデルよりも大きなマージンで優れています。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:21:21 GMT)
CGI-DM: Digital Copyright Authentication for Diffusion Models via Contrasting Gradient Inversion [26.7] Contrasting Gradient Inversion for Diffusion Models (CGI-DM) はデジタル著作権認証のための鮮やかな視覚表現を特徴とする新しい手法である。
入力画像が同じである場合、2つのモデルの潜在変数間のKLばらつきを定式化する。
WikiArtとDreamboothデータセットの実験は、デジタル著作権認証におけるCGI-DMの精度を実証している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 10:06:38 GMT)
Compact 3D Gaussian Splatting For Dense Visual SLAM [26.5] 本稿では,ガウス楕円体の数とパラメータサイズを削減できるコンパクトな3次元ガウス格子SLAMシステムを提案する。
余剰楕円体を減らすために、スライドウィンドウベースのマスキング戦略が最初に提案されている。
本手法は,シーン表現の最先端(SOTA)品質を維持しつつ,高速なトレーニングとレンダリングの高速化を実現する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:41:35 GMT)
A Challenge Dataset and Effective Models for Conversational Stance Detection [26.2] マルチターン会話姿勢検出データセット(textbfMT-CSD)を導入する。
本稿では,会話データに固有の長距離および短距離の依存関係に対処するグローバルローカルアテンションネットワーク(textbfGLAN)を提案する。
私たちのデータセットは、ドメイン間スタンス検出の進歩を触媒する貴重なリソースとして役立ちます。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:51:01 GMT)
SpikeNeRF: Learning Neural Radiance Fields from Continuous Spike Stream [26.2] スパイクカメラは、標準的なカメラよりも明確な利点がある。
スパイクカメラに依存する既存のアプローチは、しばしば最適な照明を仮定する。
スパイクカメラデータからNeRFに基づくボリュームシーン表現を導出した最初の作品であるSpikeNeRFを紹介する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:51:25 GMT)
Anomaly Heterogeneity Learning for Open-set Supervised Anomaly Detection [26.1] オープンセット型教師付き異常検出(OSAD)は、トレーニング中に見られたいくつかの異常クラスのサンプルを利用して、見えない異常を検出することを目的としている。
異種不均一分布の多様集合をシミュレートする新しいアプローチ,すなわちAHL(Anomaly Heterogeneity Learning)を導入する。
AHL can 1) は, 目に見える異常や見えない異常の検出において, 最先端のOSADモデルを大幅に強化し, 2) 新たな領域の異常を効果的に一般化することを示した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:10:25 GMT)
ProgGen: Generating Named Entity Recognition Datasets Step-by-step with Self-Reflexive Large Language Models [25.7] 大規模言語モデルは、名前付きエンティティ認識のような構造化された知識抽出タスクにおいて不足する。
本稿では,より優れたNERデータセットを生成するため,LCMを質素なNER能力で活用するための革新的で費用効率のよい戦略について検討する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:12:43 GMT)
A Selective Review on Statistical Methods for Massive Data Computation: Distributed Computing, Subsampling, and Minibatch Techniques [25.0] 本研究では,(1)分散計算,(2)サブサンプリング法,(3)ミニバッチ勾配手法の3つのカテゴリに着目した。
最初のクラスの文献は分散コンピューティングに関するもので、データセットのサイズが大きすぎて1台のコンピュータで快適に処理できない。
第2級の文献は、データセットのサンプルサイズが1つのコンピュータに配置できるくらい小さいが、メモリ全体によって簡単に処理できないという、サブサンプリング方法と状況に対する懸念に関するものである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 10:09:54 GMT)
Uni-O4: Unifying Online and Offline Deep Reinforcement Learning with Multi-Step On-Policy Optimization [25.0] 従来のアプローチでは、オフラインとオンラインの学習を別々の手順として扱い、冗長な設計と限られたパフォーマンスをもたらす。
オフライン学習とオンライン学習の両方に、政治上の目的を利用するUni-o4を提案する。
本手法は,オフラインとオフラインのファインチューニング学習の両方において,最先端の性能を実現することを実証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:40:06 GMT)
Generalized Large-Scale Data Condensation via Various Backbone and Statistical Matching [24.5] Generalized Various Backbone and Statistical Matching (G-VBSM) は、小規模なデータセットと大規模データセットの両方で高い性能を得るアルゴリズムである。
G-VBSMは、CIFAR-100で38.7%、128インチのConvNetで47.6%、ResNet18でTiny-ImageNetで47.6%、ResNet18で224x224 ImageNet-1kで31.4%のパフォーマンスを達成した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:56:13 GMT)
Pencil: Private and Extensible Collaborative Learning without the Non-Colluding Assumption [24.3] Pencilは、データプライバシ、モデルのプライバシ、拡張性を複数のデータプロバイダに同時に提供する、共同学習のための最初のプライベートトレーニングフレームワークである。
この設計原則を実現し、厳密なセキュリティとプライバシ分析を行うために、新しい暗号プロトコルをいくつか導入する。
Pencilは10260倍のスループットと2桁の通信速度を実現している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 10:26:41 GMT)
Third-Party Developers and Tool Development For Community Management on Live Streaming Platform Twitch [24.3] この研究は、ライブストリーミングプラットフォームTwitchのサードパーティ開発者(TPD)に焦点を当てている。
詳細な定性分析と混合手法を用いて、PDは異なる利害関係者との複雑な関係を維持していることがわかった。
TPDSとプラットフォームとプロの開発者との緊密なコラボレーションを支援する設計を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:02:57 GMT)
PolySketchFormer: Fast Transformers via Sketching Polynomial Kernels [24.0] モデル品質を犠牲にすることなくソフトマックスを効果的に置き換えることができることを示す。
本稿では,因果マスキングを効率的に適用するためのブロックベースアルゴリズムを提案する。
PolySketchFormerAttentionは、長いコンテキストを扱える言語モデルを訓練することで実証的に検証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:35:24 GMT)
NetTrack: Tracking Highly Dynamic Objects with a Net [23.9] オープンワールドオブジェクトの複雑なダイナミック性は、マルチオブジェクトトラッキング(MOT)の非無視的課題を示す
この研究は、動的に堅牢なきめ細かい学習を導入するための、効率的で汎用的で安価な追跡フレームワークであるNetTrackを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:15:02 GMT)
STAIR: Semantic-Targeted Active Implicit Reconstruction [23.9] 特定の意味を持つオブジェクト、すなわち特定の意味を持つオブジェクトを活発に再構築することは、ロボットが下流のタスクを実行するのに重要である。
提案手法は,RGB-Dの測定値と2次元意味ラベルを入力として用いたセマンティックターゲット型アクティブリコンストラクションのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:42:05 GMT)
PhD: A Prompted Visual Hallucination Evaluation Dataset [23.5] 内因性視覚・言語幻覚(IVL-Hallu)問題について検討し,IVL-Halluの病因と反射について,多種多様なIVL-Halluを徹底的に分析した。
具体的には、新しいIVL-ハルル課題を提案し、(a)オブジェクト幻覚、(b)属性幻覚、(c)マルチモーダルコンフリクト幻覚、(d)対コモンセンス幻覚の4つのタイプに分類する。
そこで本研究では,IVL-Hallu の評価と探索を行うため,PhD というより難しいベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:53:44 GMT)
StateFlow: Enhancing LLM Task-Solving through State-Driven Workflows [23.2] StateFlowは、大規模言語モデルが支援する複雑なタスク解決プロセスをステートマシンとして概念化する。
状態の適切な構成と状態遷移の定義により、StateFlowはタスク解決の進捗を根拠にしている。
それぞれの状態内で、StateFlowは一連のアクションの実行を可能にし、特定のプロンプトによってガイドされるLLMのレスポンスの生成だけでなく、必要に応じて外部ツールの利用も含む。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:54:16 GMT)
Reconstruct before Query: Continual Missing Modality Learning with Decomposed Prompt Collaboration [23.0] 本研究では,連続的な微調整中に特定のモダリティのデータが欠落した場合にモデルがどのように一般化できるかを検討するために,CMML(Continuous Missing Modality Learning)という新しいタスクを導入する。
Reconstruct before Query(RebQ)と呼ばれるフレームワークを考案し、プロンプトをモダリティ固有のものに分解し、それらをプールに格納されたコンポーネントに分解する。
我々の枠組みは、欠落したモダリティ情報を効果的に再構築し、事前学習された知識を保持する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:44:20 GMT)
LatEval: An Interactive LLMs Evaluation Benchmark with Incomplete Information from Lateral Thinking Puzzles [22.1] インタラクティブなフレームワーク内でモデルの横方向の思考を評価する新しい評価ベンチマークであるLatEvalを提案する。
本ベンチマークでは,モデルが提示する質問の質と,問題解決のための情報の統合能力の2つの側面でLCMに挑戦する。
例えば、最も先進的なモデルであるGPT-4でさえある程度の優位性を示しているが、人間と比較しても顕著なギャップは維持されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:11:08 GMT)
Federated Transfer Learning with Differential Privacy [21.5] 我々は、信頼された中央サーバを仮定することなく、各データセットに対するプライバシー保証を提供する、テキストフェデレーションによる差分プライバシーの概念を定式化する。
フェデレートされた差分プライバシは、確立されたローカルと中央の差分プライバシモデルの間の中間プライバシモデルであることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:04:48 GMT)
Towards Effective Multiple-in-One Image Restoration: A Sequential and Prompt Learning Strategy [19.7] 7つのIRタスクからなるMultiple-in-one (MiO) IR問題について詳細に検討する。
これらの課題に対処するために、我々は2つの単純かつ効果的な戦略を提示した。
19個のテストセットで評価することにより、逐次的および迅速な学習戦略がMiO性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:37:37 GMT)
Prior-dependent analysis of posterior sampling reinforcement learning with function approximation [19.5] この研究は、線形混合MDPをモデルとした関数近似を用いた強化学習(RL)におけるランダム化探索を推し進める。
機能近似を用いたRLに対する最初の事前依存型ベイズ後悔法を確立し, 後方サンプリング強化学習(PSRL)のためのベイズ後悔解析を洗練させる。
上限は$mathcalO(dsqrtH3 T log T)$で、$d$は遷移カーネルの次元を表し、$H$は計画地平線、$T$は相互作用の総数を表す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:23:51 GMT)
Multimodal self-supervised learning for lesion localization [19.4] テキストレポートから全文を局所的意味的アライメントの基本単位として取り出す新しい手法が導入された。
このアプローチは胸部X線画像と対応するテキストレポートを組み合わせることで、グローバルレベルとローカルレベルの両方でコントラスト学習を行う。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:42:19 GMT)
Unified Generative Modeling of 3D Molecules via Bayesian Flow Networks [19.4] GeoBFNは、分布の微分可能なパラメータ空間における様々なモジュラリティをモデル化することによって、分子幾何学に自然に適合する。
我々はGeoBFNが生成品質の観点から,複数の3次元分子生成ベンチマークにおける最先端性能を実現することを実証した。
GeoBFNはまた、効率と品質の最適なトレードオフに到達するために、任意のステップでサンプリングを行うこともできる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:40:06 GMT)
Dual-Encoders for Extreme Multi-Label Classification [19.3] 本稿では,Dual-Encoder (DE) モデルが,極端なマルチラベル分類 (XMC) ベンチマークにおいて著しく不足していることを示す。
本稿では,既存のコントラスト損失の限界を克服するInfoNCE損失の簡易な修正を提案する。
提案した損失関数をトレーニングすると、標準のDEモデルだけで、Precision@1.1で最大2%のSOTAメソッドにマッチまたは性能が向上する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:22:08 GMT)
Multi-modal vision-language model for generalizable annotation-free pathological lesions localization [19.0] 視覚言語による事前学習モデルを提案する。
Free Pathological Localization (AFLOC)
AFLocのコアとなる強みは、多段階のセマンティック構造に基づくコントラスト学習にある。
AFLOCは6つの最先端の手法を超越し、5つの病因の特定においてヒトのベンチマークを上回ります。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:51:50 GMT)
Source Prompt Disentangled Inversion for Boosting Image Editability with Diffusion Models [18.8] テキスト駆動画像編集における重要なステップの1つは、元の画像をソースプロンプトに条件付き遅延ノイズコードに変換することである。
本稿では、ソースプロンプトの影響を低減することを目的とした、SPDInv(Source Prompt Disentangled Inversion)と呼ばれる新しい手法を提案する。
実験の結果,提案手法はターゲット編集プロンプトとソースプロンプトの衝突を効果的に軽減できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:19:30 GMT)
Learning Time Slot Preferences via Mobility Tree for Next POI Recommendation [18.4] Next Point-of-Interests(POI)レコメンデーションタスクは、ユーザの現在のチェックイントラジェクトリに基づいて、POIの動的ランキングを提供することを目的としている。
我々は,ユーザのチェックイン記録を階層的に記述するために,モビリティツリーと呼ばれる革新的なデータ構造を導入する。
そこで我々は,モビリティツリーに基づく好み学習のためのマルチタスクフレームワークであるモビリティツリーネットワーク(MTNet)を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:43:12 GMT)
Fast Personalized Text-to-Image Syntheses With Attention Injection [17.6] 生成した画像と参照画像のテキストイメージの一貫性とアイデンティティの整合性のバランスをとることができる有効かつ高速なアプローチを提案する。
本手法は,拡散モデル固有のテキスト・画像生成能力を保ちながら,微調整なしでパーソナライズされた画像を生成することができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:42:02 GMT)
JUMBO: Fully Asynchronous BFT Consensus Made Truly Scalable [17.5] FIN-NGは、最近の署名なし非同期共通サブセットプロトコルFIN(CCS' 23)を、同時放送および合意の最先端フレームワークに適合させる。
我々は,Dumbo-NGのスケーラブルなインスタンス化であるJUMBOを提案し,認証とメッセージの両方に対して$bigO(n2)$の複雑さしか持たない。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:53:38 GMT)
Curriculum Learning for ab initio Deep Learned Refractive Optics [17.5] DeepLensは、人間の介入なしにランダムに調整された表面から化合物ab initioの光学設計を学ぶことができる。
従来型撮像レンズと大視野拡大深度計算レンズの両方を自動で設計し,本手法の有効性を実証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:53:18 GMT)
Graph Neural Network based Double Machine Learning Estimator of Network Causal Effects [17.4] 本稿では,グラフニューラルネットワークとダブル機械学習を組み合わせた新しい手法を提案する。
提案手法では,グラフ同型ネットワークとダブル機械学習を併用して,ネットワーク共同創設者の調整を行う。
自己ヘルプグループ参加が金融リスク耐性に及ぼす影響を事例研究する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:23:42 GMT)
Forgedit: Text Guided Image Editing via Learning and Forgetting [17.3] 我々は Forgedit という新しいテキスト誘導画像編集手法を設計する。
まず,30秒で元の画像を再構成できる視覚言語共同最適化フレームワークを提案する。
次に,拡散モデルのテキスト埋め込み空間におけるベクトル投影機構を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:55:07 GMT)
Intention-driven Ego-to-Exo Video Generation [16.9] エゴ・ツー・エゴ・ビデオ生成とは、エゴ中心モデルに従って対応するエゴ・エゴ・ビデオを生成することを指す。
本稿では、アクション記述をビュー非依存表現として活用する意図駆動型エクソ生成フレームワーク(IDE)を提案する。
我々は,多様なエゴビデオペアを用いた関連データセットの実験を行い,主観的および客観的な評価において,最先端のモデルよりも優れることを示した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:28:32 GMT)
JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning [16.9] 本稿では,Llama-2モデルのPEFT互換微調整のための新しいフレームワークについて紹介する。
我々のフレームワークは、JAXのジャスト・イン・タイム(JIT)コンパイルと、効率的なリソース管理のためにテンソルシャーディングを独自に利用しています。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:02:04 GMT)
SemCity: Semantic Scene Generation with Triplane Diffusion [16.4] セムシティ」は現実世界の屋外環境におけるセマンティックシーン生成のための3次元拡散モデルである。
本研究では,三面体表現をシーン分布のプロキシ形式として利用し,拡散モデルを用いて学習する。
私たちは、シーン内のオブジェクトのシームレスな追加、削除、修正を容易にするトリプレーン操作を示します。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:18:14 GMT)
Self-Improving for Zero-Shot Named Entity Recognition with Large Language [16.2] この研究は、強力な大言語モデル(LLM)によるゼロショットNERのパフォーマンス境界を押し上げる。
LLMの自己学習能力を刺激するためにラベルのないコーパスを利用する、トレーニング不要な自己改善フレームワークを提案する。
4つのベンチマークの実験は、我々のフレームワークによって達成された大幅なパフォーマンス改善を示している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:58:01 GMT)
Accelerated Convergence of Stochastic Heavy Ball Method under Anisotropic Gradient Noise [16.1] 重球運動量法は加速収束を提供し、大きなバッチ設定でうまく機能するはずだと広く推測されている。
重球運動量は, SGDの偏差項の加速収束率を$tildemathcalO(sqrtkappa)$で達成し, ほぼ最適収束率を達成できることを示した。
つまり、重い球運動量を持つSGDは、分散機械学習やフェデレーション学習のような大規模なバッチ設定で有用である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:54:11 GMT)
Visual Object Tracking on Multi-modal RGB-D Videos: A Review [16.1] 本研究の目的は,RGB-D追跡研究の相対的知識を要約することである。
具体的には、関連するRGB-D追跡ベンチマークデータセットと、対応するパフォーマンス測定を一般化する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:10:23 GMT)
MaxQ: Multi-Axis Query for N:M Sparsity Network [16.0] MaxQは様々なコンピュータビジョンタスクにおいて、多様なCNNアーキテクチャで一貫した改善を実現している。
実験の結果、MaxQはImageNetで74.6%の精度を達成でき、最先端よりも2.8%以上改善できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:17:47 GMT)
Compact: Approximating Complex Activation Functions for Secure Computation [15.8] Compactは、最先端のMPC技術で効率的な使用を可能にするために、複雑なAFのピースワイズ近似を生成する。
隠れ層が多いDNNモデルに対して,2x-5倍の精度で非無視精度の損失を生じさせることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:23:10 GMT)
Unraveling the emergence of quantum state designs in systems with symmetry [15.7] 対称性を示すランダムなジェネレータ状態からの状態設計の出現について検討する。
初期時間におけるトレース距離の高速収束は, 乱数行列予測から逸脱した有限値に飽和する。
我々は, 閉かつオープンな量子多体系の熱化と平衡のさらなる探索の道を開くことを期待する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:22:16 GMT)
From Pixels to Predictions: Spectrogram and Vision Transformer for Better Time Series Forecasting [15.2] 時系列予測は、様々な領域における意思決定において重要な役割を担っている。
近年,これらの課題に対処するために,コンピュータビジョンモデルを用いた画像駆動アプローチが研究されている。
時系列データの視覚的表現として時間周波数スペクトログラムを用いる新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:14:29 GMT)
Ensembling and Test Augmentation for Covid-19 Detection and Covid-19 Domain Adaptation from 3D CT-Scans [14.9] 本稿では,第4回COV19Dコンペティションに貢献し,Covid-19 DetectionとCovid-19 Adaptation Challengesに着目した。
アプローチは肺セグメンテーションとCovid-19感染症セグメンテーションを中心にしている。
我々は3つの3D CNNバックボーン、Customized Hybrid-DeCoVNet、事前訓練された3D-Resnet-18および3D-Resnet-50モデルを用いてCovid-19の認識を訓練する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:44:38 GMT)
Learning-Based Pricing and Matching for Two-Sided Queues [14.9] 複数のタイプの顧客とサーバを持つ動的システムについて検討する。
各キューの到着率は、未知の需要または供給機能に応じて価格によって決定される。
このシステムは、乗客やドライバーとの乗り合い市場のような、両側の市場をモデル化するのに使用することができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:07:04 GMT)
RCdpia: A Renal Carcinoma Digital Pathology Image Annotation dataset based on pathologists [14.8] 腫瘍領域と隣接領域(RCdpia)を個別にラベル付けしたTCGAデジタル病理データセットを作成した。
このデータセットはhttp://39.171.241.18:8888/RCdpia/で公開されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:23:25 GMT)
Correcting misinformation on social media with a large language model [14.7] 専門家や平民は、不正確な情報を手動で特定し説明することによって誤情報を修正するのに効果的であることが示されている。
LLMは誤情報を生成しやすくするが、近年の情報不足や、偽のコンテンツや参照を生成する傾向、マルチモーダル情報に対処する際の制限などにより、難航する。
本稿では,最新の情報へのアクセスと信頼性を付加したLCMであるMUSEを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 10:59:09 GMT)
Strategic Bidding Wars in On-chain Auctions [14.6] 本稿では,MEV-Boostオークションのゲーム理論モデルを導入し,シミュレーションを用いて,実際に観察されたビルダーの入札戦略について検討する。
提案手法は,建設業者の戦略の有効性に対する遅延の重要性と,提案者の視点からの全体的なオークション結果を示すものである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:10:24 GMT)
Understanding the Robustness of Multi-modal Contrastive Learning to Distribution Shift [14.6] CLIPのようなマルチモーダルな対照的な学習アプローチは、分散シフトに対して堅牢な学習表現において、顕著な成功を収めている。
MMCLの強靭性の背後にある2つのメカニズムを同定する。
理論的には、リッチキャプションを用いたロバストネスの利点を実証し、キャプション内の様々な種類の詳細を注釈付けする効果を探求する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:47:33 GMT)
Few-Shot VQA with Frozen LLMs: A Tale of Two Approaches [14.6] 画像を大言語モデル(LLM)に入力する2つのアプローチを比較する。
LLM埋め込み空間に直接視覚埋め込みを接続しても,画像キャプションの使用による性能向上は保証されない。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:44:05 GMT)
Large Language Models and Foundation Models in Smart Agriculture: Basics, Opportunities, and Challenges [14.3] FMとしても知られる大規模な事前学習モデルは、言語、ビジョン、意思決定タスクにおいて顕著な成功を収めている。
その実証された効果と大きな潜在能力にもかかわらず、農業AIにFMを適用するという調査はほとんど行われていない。
本研究の目的は、スマート農業分野におけるFMの可能性を探ることである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:29:53 GMT)
Large Language Models Powered Context-aware Motion Prediction [13.9] 我々はLarge Language Models (LLMs) を用いて、動き予測タスクのグローバルトラフィックコンテキスト理解を強化する。
我々の研究は、LLMの交通シーンの理解と自動運転の動作予測性能を高めるための貴重な洞察を提供する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 02:06:49 GMT)
3DGS-ReLoc: 3D Gaussian Splatting for Map Representation and Visual ReLocalization [13.9] 本稿では,3次元ガウススプラッティングを用いた3次元マッピングと視覚的再局在のための新しいシステムを提案する。
提案手法は、LiDARとカメラデータを用いて、環境の正確な視覚的表現を生成する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:06:12 GMT)
DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks [13.4] 本稿では,困難条件下で頑健なマッチングを実現するために,グラフニューラルネットワークに基づくスパース特徴マッチングネットワークを提案する。
我々は、キーポイント表現を最先端の機能マッチングネットワークとして強化するために、グラフエッジ上での注目集約という同様の手法を用いる。
動作対象のキーポイントを排除したネットワークの性能は,最新の特徴マッチングネットワークと比較して,一連の実験により向上した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:23:40 GMT)
FlowMind: Automatic Workflow Generation with LLMs [12.8] 本稿では,Large Language Models(LLM)の機能を活用した新しいアプローチであるFlowMindを紹介する。
信頼性のあるアプリケーションプログラミングインタフェース(API)を用いたLLM推論を支援する講義のための汎用的なプロンプトレシピを提案する。
また、N-CENレポートからの質問応答タスクをベンチマークするための金融の新しいデータセットであるNCEN-QAについても紹介する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:36:37 GMT)
Multi-Relational Graph Neural Network for Out-of-Domain Link Prediction [12.5] 本稿では,領域外一般化問題に対処するため,GOODと呼ばれる新しいグラフニューラルネットワークモデルを提案する。
GOODは、既知の関係タイプから予測を効果的に一般化し、最先端の結果を得ることができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:08:22 GMT)
Co-orchestration of Multiple Instruments to Uncover Structure-Property Relationships in Combinatorial Libraries [12.0] 本稿では,スペクトルや画像などの複雑な可観測物を用いて測定を行うための協調手法を提案し,実装する。
この手法は,変分オートエンコーダによる次元性低減と,潜在空間構造制御のための表現学習の組み合わせに依存する。
提案したフレームワークは、測定された信号の複数の測定モードと任意の寸法に拡張することができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:41:27 GMT)
Dynamics and Resonance Fluorescence from a Superconducting Artificial Atom Doubly Driven by Quantized and Classical Fields [12.0] 2レベル超伝導人工原子の2つの駆動場下での共振蛍光の実験的研究
1次元伝送線路とコプラナー導波路共振器とに強く結合されたトランスモン量子ビットからなる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:48:30 GMT)
Instance-Level Trojan Attacks on Visual Question Answering via Adversarial Learning in Neuron Activation Space [11.9] トロイの木馬攻撃は入力データに埋め込まれ、ニューラルネットワークモデルに悪意のある振る舞いをもたらす。
本稿では,VQAに対するインスタンスレベルのマルチモーダルトロイの木馬攻撃を提案する。
提案した攻撃はトロイの木馬のサンプルを数枚注入することで、異なる微調整モデルに効率的に適応できることを実証した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:39:40 GMT)
Independent RL for Cooperative-Competitive Agents: A Mean-Field Perspective [11.6] この論文では、各チーム間には協力関係があるが、異なるチーム間での一般的な競争があるように、チームにグループ化されるエージェント間の強化学習(RL)に対処する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:11:55 GMT)
A Dual-Augmentor Framework for Domain Generalization in 3D Human Pose Estimation [11.5] 制御された実験室で収集された3D人間のポーズデータは、様々なシナリオにまたがって一般化されたポーズ推定装置の課題を示す。
3次元ポーズ推定のための領域一般化における現在の手法は、通常、逆行訓練を利用して、トレーニングのための合成ポーズを生成する。
本稿では,2つのポーズオーグメンタ,すなわち弱いポーズオーグメンタと強いオーグメンタを特徴とする新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:10:07 GMT)
RobustSentEmbed: Robust Sentence Embeddings Using Adversarial Self-Supervised Contrastive Learning [11.3] RobustSentEmbedは、テキスト表現タスクの堅牢性を改善するために設計された、自己教師型文埋め込みフレームワークである。
本フレームワークは,様々な敵攻撃の成功率を大幅に低下させ,BERTAttackの成功率をほぼ半分に削減する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:29:45 GMT)
Revisiting Recurrent Reinforcement Learning with Memory Monoids [11.3] 我々は、リカレントニューラルネットワーク(RNN)や部分観測可能な決定変換器(POMDP)などのメモリモデルについて検討する。
特にリニアリカレントモデルと呼ばれる新しいクラスのメモリモデルと比較すると、どちらのモデルも特に長いシーケンスにうまくスケールしない。
本稿では,RLにおける再帰損失関数の実装を簡略化し,サンプル効率を改善し,リターンを向上させる手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:16:28 GMT)
Towards Context-Stable and Visual-Consistent Image Inpainting [11.2] 未知領域(ASUKA)を先行したアライメント安定塗布
ASUKAは、SD(Stable Diffusion Inpainting Model)と相まって、コンテキスト安定性を著しく改善する。
ASUKAは彩色専用デコーダを採用しており、SDの色の不整合を著しく低減し、より視覚的に整合性を確保している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:44:17 GMT)
rFaceNet: An End-to-End Network for Enhanced Physiological Signal Extraction through Identity-Specific Facial Contours [11.1] リモート光胸腺撮影(r)技術は、ビデオフレームの微妙なピクセル変化から血液体積パルス(BVP)信号を抽出する。
本稿では,顔の輪郭に着目して顔BVP信号の抽出を促進するrFaceNet法を紹介する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:59:38 GMT)
Locally Optimal Fixed-Budget Best Arm Identification in Two-Armed Gaussian Bandits with Unknown Variances [10.5] 本稿では,適応実験における分散を推定し,推定標準偏差の比率でアームを描画する手法を提案する。
以上の結果から,小ギャップ体制を特徴とする最悪のシナリオでは,変動が未知であっても,推定分散を利用する戦略が最適であることが示唆された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:00:10 GMT)
Bridging Expert Knowledge with Deep Learning Techniques for Just-In-Time Defect Prediction [9.9] Just-In-Time(JIT)の欠陥予測は、コミットが欠陥であるかどうかを自動的に予測することを目的としている。
シンプルなモデルで使用される手作りの機能は、専門家の知識に基づいていますが、コミットの意味を完全に表現することはできません。
複雑なモデルで使用されるディープラーニングベースの機能は、コミットの意味を表現しているが、有用な専門家の知識を反映していないかもしれない。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:20:38 GMT)
CBR - Boosting Adaptive Classification By Retrieval of Encrypted Network Traffic with Out-of-distribution [9.7] 一般的なアプローチの1つは、一定の数のクラスで機械学習またはディープラーニングベースのソリューションを使用することである。
未知のクラスを扱うソリューションの1つは、モデルを再トレーニングすることである。
本稿では,暗号ネットワークトラフィック分類の新しいアプローチであるRetrieval CBRによる適応分類を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:14:09 GMT)
OSTAF: A One-Shot Tuning Method for Improved Attribute-Focused T2I Personalization [9.6] 個人化されたテキスト・ツー・イメージ(T2I)のパーソナライズのためのパラメータ効率の高いワンショット微調整手法を提案する。
様々な属性特徴の正確な学習を実現するために,ハイパネットワークによる属性中心の微調整機構が導入された。
提案手法は属性識別と適用において大きな優位性を示すとともに,効率と出力品質のバランスが良好であることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 01:42:48 GMT)
BrightDreamer: Generic 3D Gaussian Generative Framework for Fast Text-to-3D Synthesis [9.4] 本稿ではBrightDreamerについて述べる。BrightDreamerは、汎用的で高速(77ms)なテキスト・ツー・3D生成を実現するエンドツーエンドのシングルステージ・アプローチである。
まず、変形形状とその新しい位置を予測するために、テキスト誘導形状変形(TSD)ネットワークを提案する。
次に、3次元オブジェクトの3次元表現を生成するための新しいテキスト誘導三平面発電機を設計する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:04:45 GMT)
CantonMT: Cantonese to English NMT Platform with Fine-Tuned Models Using Synthetic Back-Translation Data [9.2] この研究は、標準データ拡張手法を、新しい言語翻訳の方向であるCantonese-to- Englishにバック翻訳することで展開する。
実データ量と合成データを用いて微調整したモデルを提案する。
我々は、このtextsc CantonMT研究プロジェクトに含まれるモデルのユーザフレンドリなインターフェースを作成し、カントン語から英語へのMT研究を促進するために利用できるようにする。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:16:17 GMT)
Driving Style Alignment for LLM-powered Driver Agent [9.1] 実演やフィードバックを通じてドライバーエージェントを人間運転スタイルに整合させる枠組みを提案する。
我々は,自然主義運転実験とポストドライブインタビューを通じて,人間の運転行動の自然言語データセットを構築した。
このフレームワークの有効性は、CARLA都市交通シミュレータのシミュレーション実験を通じて検証され、さらに人間による評価によって裏付けられる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:07:13 GMT)
AISFormer: Amodal Instance Segmentation with Transformer [9.0] Amodal Instance(AIS)は、オブジェクトインスタンスの可視部分と隠蔽部分の両方の領域をセグメントすることを目的としている。
本稿では、Transformerベースのマスクヘッドを備えたAISフレームワークであるAISFormerを紹介する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:58:03 GMT)
How Physics and Background Attributes Impact Video Transformers in Robotic Manipulation: A Case Study on Planar Pushing [8.4] 物理特性(色,摩擦係数,形状)と背景特性が映像変換器の性能に与える影響について検討した。
提案するCloudGripper-Push-1Kは,大規模なビジョンベースロボットのプッシュデータセットである。
また,ビデオ・オクルージョン・トランスフォーマ (VOT) を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 10:37:08 GMT)
Programming Frameworks for Differential Privacy [8.3] プログラミングフレームワークの基礎となる概念のいくつかを調査する。
実践者にとって、この調査は、プログラミングフレームワークを選択するときにどんな機能が価値のあるのかを理解するための出発点を提供することができる。
研究者にとってこれは、既存の作業を統一的に整理し、将来のフレームワークで新機能を理解するためのコンテキストを提供するのに役立つ。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:44:48 GMT)
Simple 2D Convolutional Neural Network-based Approach for COVID-19 Detection [8.2] 本研究では,肺CT画像解析におけるディープラーニング技術の利用について検討した。
我々は,CTスキャンに適した高度な空間スライス特徴学習(SSFL++)フレームワークを提案する。
本研究の目的は,CTスキャン全体のアウト・オブ・ディストリビューション(OOD)データをフィルタリングし,データ冗長性を70%削減して解析に不可欠な空間スライス特徴を選択することである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:34:51 GMT)
WSI-SAM: Multi-resolution Segment Anything Model (SAM) for histopathology whole-slide images [8.2] 病理画像の正確なオブジェクト分割機能を備えたWSI-SAM, Segment Anything Model (SAM) を提案する。
トレーニングオーバーヘッドを最小限にしながら、トレーニング済みの知識を完全に活用するために、SAMは凍結し、最小限のパラメータしか導入しません。
本モデルでは, 膵管癌 in situ (DCIS) セグメンテーションタスクと乳癌転移セグメンテーションタスクにおいて, SAMを4.1, 2.5パーセント上回った。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:14:28 GMT)
Regulating Chatbot Output via Inter-Informational Competition [8.2] 本稿では、AI関連コンテンツリスクとそれに対応する規制提案を再評価するためのヤードスティックを開発する。
情報市場における情報ソース間の十分な競争は、生成的AI技術によって引き起こされるコンテンツリスクを十分に軽減し、解決することができる、と同社は主張する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:11:15 GMT)
Java JIT Testing with Template Extraction [7.7] LeJitは、Javaのジャスト・イン・タイム(JIT)コンパイラをテストするためのテンプレートベースのフレームワークである。
私たちは、さまざまな人気のあるJava JITコンパイラをテストするためにLeJitを成功させました。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:39:27 GMT)
Solvent-Aware 2D NMR Prediction: Leveraging Multi-Tasking Training and Iterative Self-Training Strategies [7.5] 本稿では,原子2DNMRシフトを予測し,実験スペクトルにピークを割り当てる深層学習モデルを訓練するための反復自己学習(IST)手法を提案する。
我々のモデルは2次元NMRを正確に予測できるだけでなく、実験的な2次元NMRスペクトルのアノテートピークも予測できる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:52:51 GMT)
Hierarchical Generative Network for Face Morphing Attacks [7.3] 顔認識システム(FRS)は、複数のアイデンティティを含む形態画像を作成することで、顔認識システム(FRS)を回避している。
本研究では, 画像の品質向上と寄与するアイデンティティの保存を図るため, 新たなモーフィング攻撃法を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:09:27 GMT)
Mixture-of-Prompt-Experts for Multi-modal Semantic Understanding [7.3] ブロック認識型prompt Fusion (MoPE-BAF) を用いたMixture-of-prompt-Expertsを提案する。
MoPE-BAFは、統合視覚言語モデル(VLM)に基づく、新しいマルチモーダルソフトプロンプトフレームワークである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:12:26 GMT)
Adaptive Semantic-Enhanced Denoising Diffusion Probabilistic Model for Remote Sensing Image Super-Resolution [7.3] Denoising Diffusion Probabilistic Model (DDPM) は画像再構成において有望な性能を示した。
DDPMが生成する高周波の詳細は、モデルが長距離の意味的文脈を見落としているため、HR画像との不一致に悩まされることが多い。
DDPMの詳細な保存能力を高めるために,適応的意味強化DDPM(ASDDPM)を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:08:58 GMT)
AQM: A Refresh of the Abstract Qubit Model for Quantum Co-design [7.2] より高度なアルゴリズムとアプリケーションのための抽象量子ビットモデル(AQM)を提案する。
我々は、量子計算を可能にするために、低レベルの物理機器の基準を設定した。
AQMは量子アルゴリズムとデバイスの間の中間インターフェースとして機能する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:19:17 GMT)
Graph Expansion in Pruned Recurrent Neural Network Layers Preserve Performance [7.1] 我々は、RNNやLSTMのような再帰的なネットワークを創り出し、基礎となるグラフのスペクトルギャップを大きく維持する。
また、2部層の性質の観点から、時間展開された再帰的ネットワークグラフについても検討する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:08:08 GMT)
Tokensome: Towards a Genetic Vision-Language GPT for Explainable and Cognitive Karyotyping [7.1] Tokensomeは、染色体トークン化に基づく新しい視覚言語モデルである。
トケソームは、従来の視覚知覚層から認知的意思決定層へとメソッドを上昇させる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:38:50 GMT)
Cross-Shaped Windows Transformer with Self-supervised Pretraining for Clinically Significant Prostate Cancer Detection in Bi-parametric MRI [6.9] 前立腺癌 (bpMRI) における臨床的に重要な前立腺癌 (csPCa) を検出するために, CSwin 変圧器 UNet モデル (CSwin 変圧器 UNet モデル) を導入した。
1500人の患者を対象とした大規模前立腺bpMRIデータセットを用いて、まずマルチタスク自己教師型学習を用いてCSwin変換器を事前訓練し、データ効率とネットワークの一般化性を向上させる。
5倍のクロスバリデーションは、自己教師型CSwin UNetが0.888 AUCと0.545 Average Precision(AP)を達成し、4つの同等モデル(Swin U)を著しく上回っていることを示している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:23:22 GMT)
DuPL: Dual Student with Trustworthy Progressive Learning for Robust Weakly Supervised Semantic Segmentation [6.8] 信頼に足る進歩的学習(DuPL)を伴う2つの学生フレームワークを提案する。
実験結果は、PASCAL VOC 2012とMSデータセットにおける最近の最先端の代替よりも、提案されたDuPLの方が優れていることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:14:34 GMT)
Stylized Face Sketch Extraction via Generative Prior with Limited Data [6.7] StyleSketchは、顔画像から高解像度のスタイリングスケッチを抽出する方法である。
事前訓練されたStyleGANの深い特徴の豊富なセマンティクスを用いて、16対の顔とそれに対応するスケッチイメージでスケッチジェネレータを訓練することができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:25:25 GMT)
MaskDiffusion: Exploiting Pre-trained Diffusion Models for Semantic Segmentation [6.2] MaskDiffusionは、未学習の凍った安定拡散を利用してオープン語彙のセマンティックセマンティックセグメンテーションを実現する革新的なアプローチである。
また,maskDiffusion の細粒度および固有名詞分類を含む開語彙処理における優れた性能を示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:40:49 GMT)
CPA-Enhancer: Chain-of-Thought Prompted Adaptive Enhancer for Object Detection under Unknown Degradations [6.2] 本研究では, 未知の劣化下での物体検出のための適応エンハンサーCPA-Enhancerを提案する。
私たちの知る限りでは、オブジェクト検出タスクのためにCoTのプロンプトを利用する最初の作業です。
実験結果から,CPA-Enhancerはオブジェクト検出のための新しい手法の状態を設定できるだけでなく,未知の劣化下での他の下流視覚タスクの性能も向上することが示された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:43:10 GMT)
Research on Personal Credit Risk Assessment Methods Based on Causal Inference [6.2] 本稿では、1945年にサミュエル・アイレンバーグとサンダース・マクレーンによって提唱された圏論を用いた因果関係の新しい定義を紹介する。
カテゴリー理論関連技術ツールの開発に限界があるため、1995年にジュデア・パールが提唱した広く使われている確率因果グラフツールを採用する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:34:45 GMT)
Incorporating Higher-order Structural Information for Graph Clustering [6.0] グラフ畳み込みネットワーク(GCN)は、ディープクラスタリングの強力なツールとして登場した。
グラフ構造情報をフル活用するための新しいグラフクラスタリングネットワークを提案する。
提案手法は, 各種データセット上での最先端手法よりも優れる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:42:41 GMT)
PubDef: Defending Against Transfer Attacks From Public Models [6.0] 本稿では,公用サロゲートモデルによる転送攻撃を敵が頼りにする,新たな実用的脅威モデルを提案する。
本研究では,この環境での移動攻撃を評価し,ゲーム理論の観点から専門的な防御手法を提案する。
この脅威モデルの下では、我々の防衛であるPubDefは、最先端のホワイトボックス対敵訓練を、通常の精度でほとんど損なわない大きなマージンで上回っている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:40:48 GMT)
A New Random Forest Ensemble of Intuitionistic Fuzzy Decision Trees [5.8] 直観主義的ファジィ決定木(IFDT)のランダム森林アンサンブルを提案する。
提案手法は,ブートストラップサンプリングと特徴選択からランダム性のパワーを享受する。
本研究は,直観的ファジィ理論に基づくランダムな森林アンサンブルを提案する最初の試みである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:08:15 GMT)
Identification of Craving Maps among Marijuana Users via the Analysis of Functional Brain Networks with High-Order Attention Graph Neural Networks [5.5] 高用量のマリファナの摂取は、心理的、社会的に大きな影響を及ぼす可能性がある。
本稿では,マリファナ中毒分類のためのHOGANNと呼ばれる解釈可能なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:59:44 GMT)
Pattern-Based Peephole Optimizations with Java JIT Tests [5.4] JOGを使うことで、開発者は、望まれるコード変換を指定するパターンをJava自身で書くことができる。
JOGは各パターンをC/C++コードに変換し、JIT最適化パスとして統合することができる。
JOGは、最適化のペア間のシャドウ関係を自動的に検出する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:41:01 GMT)
What Makes Math Word Problems Challenging for LLMs? [5.2] 数学語問題(MWP)の重要な言語的・数学的特徴を詳細に分析する。
大型言語モデル(LLM)におけるMWPの全体的な難しさに対する各特徴の影響をよりよく理解するために、特徴ベースの分類器を訓練する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:18:40 GMT)
An Empirical Study on JIT Defect Prediction Based on BERT-style Model [5.1] 本研究では,細粒化プロセスの設定がJIT欠陥予測のためのBERT型事前学習モデルに及ぼす影響について検討する。
以上の結果から,BERTモデルにおける第1エンコーダ層の役割が明らかとなった。
これらの知見を組み合わせて,LoRAに基づくコスト効率の高い微調整手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:41:55 GMT)
Cooperative Multi-Agent Graph Bandits: UCB Algorithm and Regret Analysis [5.0] Zhang, Johansson, Li が導入したグラフバンディット問題のマルチエージェント拡張として,マルチエージェントグラフバンディット問題を定式化する。
上信頼境界(UCB)に基づく学習アルゴリズムであるMulti-G-UCBを提案し、T$のステップに対する期待された後悔が$O(gamma Nlog(T)[sqrtKT + DK])$で束縛されていることを証明した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:04:03 GMT)
Accelerating Laboratory Automation Through Robot Skill Learning For Sample Scraping [5.0] 自律的な実験にラボロボティクスを使うことは、科学者を退屈な作業から救い出す魅力的な道のりを提供する。
一部の実験では、既に自動化の恩恵を受けることができるが、サンプルの準備はまだ手作業で行われている。
完全自律型サンプリングスクレイピング手法を実現するため,スクレイピングポリシーを学習するためのモデルフリー強化学習法を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:10:16 GMT)
QCSHQD: Quantum computing as a service for Hybrid classical-quantum software development: A Vision [4.6] 本研究は,古典的開発者のためのQCリソースへのアクセスを民主化するために設計されたQCSHQDの青写真を示す。
QCSHQDのビジョンは、古典的コンピュータと量子コンピュータのハイブリッド化における重要な課題に対処することで、イノベーションを画期的なものにする道を開く。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:49:32 GMT)
Enhancing Bandwidth Efficiency for Video Motion Transfer Applications using Deep Learning Based Keypoint Prediction [4.6] 本稿では,モーショントランスファー対応ビデオアプリケーションにおける帯域幅削減のための,ディープラーニングに基づく新しい予測フレームワークを提案する。
リアルタイムアプリケーションでは,最大2倍の帯域幅削減を実現し,提案手法の有効性を示した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:36:43 GMT)
Principle of Information Increase: An Operational Perspective of Information Gain in the Foundations of Quantum Theory [4.4] 量子システム上で行われる測定は、その状態に関する情報を取得する行為である。
量子論の再構成における情報の概念は多重定義である。
シャノンエントロピーの連続拡張は、情報ゲインの2つの異なる尺度を自然に認めることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:40:47 GMT)
A lightweight deep learning pipeline with DRDA-Net and MobileNet for breast cancer classification [4.4] 本稿では,乳がん分類の改善のための新しい深層学習手法を提案する。
本手法はShuffleNetの効率的なアーキテクチャにインスパイアされたResidual Dual-Shuffle Attention Network (DRDA-Net)に基づく。
MobileNetは、パフォーマンスを犠牲にすることなく、限られたリソースを持つデバイスでも高速な実行を保証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:09:48 GMT)
An upper bound of the mutation probability in the genetic algorithm for general 0-1 knapsack problem [4.4] 我々は,0-1knapsack問題(0-1KP)と改良された突然変異演算子(IMO)に対する新しい還元法を提案する。
大規模インスタンスにおいて1回の反復で最適解を打つIMOは、従来の突然変異演算子よりも優れていることを証明した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:05:40 GMT)
IGANN Sparse: Bridging Sparsity and Interpretability with Non-linear Insight [4.0] IGANN Sparseは、一般化された加法モデルのファミリーから生まれた、新しい機械学習モデルである。
トレーニング中の非線形特徴選択プロセスを通じて、スパシティを促進する。
これにより、予測性能を犠牲にすることなく、モデル空間の改善による解釈可能性を保証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:44:36 GMT)
JustQ: Automated Deployment of Fair and Accurate Quantum Neural Networks [4.0] この研究はデザインスペースの探索を行い、QNNの不公平を公表した。
NISQ コンピュータ上に公平かつ正確な QNN をデプロイするためのフレームワーク JustQ を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:29:42 GMT)
RDA-INR: Riemannian Diffeomorphic Autoencoding via Implicit Neural Representations [4.0] 本研究では,ニューラルネットワークに基づくアトラス構築の限界と統計的潜在モデリング手法に焦点をあてる。
我々は、解像度非依存の暗黙的ニューラル表現に基づく新しいエンコーダを設計することで、この制限を克服する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:34:31 GMT)
Automating Psychological Hypothesis Generation with AI: Large Language Models Meet Causal Graph [3.9] 我々は,大言語モデル(LLM)を用いて43,312の心理学記事を分析し,因果関係のペアを抽出した。
リンク予測アルゴリズムを適用して、幸福に焦点をあてた130の心理学的仮説を作成した」
この結果から,因果知識グラフなどの機械学習技術を組み合わせることで,心理学における自動発見に革命をもたらす可能性が示唆された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:14:27 GMT)
Accelerating Asynchronous Federated Learning Convergence via Opportunistic Mobile Relaying [3.8] 本稿では,非同期フェデレート学習(FL)アルゴリズムの収束性能に及ぼすモビリティの影響について検討する。
モビリティを活用することで、クライアントはリレーとして機能する別のクライアントを介して、サーバと間接的に通信できることを示す。
我々はFedMobileと呼ばれる新しいFLアルゴリズムを提案し、機会論的リレーを取り入れ、いつ、どのようにリレーするかといった重要な問題に対処する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:38:47 GMT)
usfAD Based Effective Unknown Attack Detection Focused IDS Framework [3.6] Internet of Things(IoT)とIndustrial Internet of Things(IIoT)は、サイバー脅威の増加につながっている。
10年以上にわたり、研究者は侵入検知システム(IDS)を開発するための教師付き機械学習技術を模索してきた。
既知のデータセット上でトレーニングされ、テストされたIDSは、ゼロデイまたは未知の攻撃を検出するのに失敗する。
我々は,攻撃の訓練サンプルを必要としない,半教師付き学習に基づくIDSのための2つの戦略を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:49:57 GMT)
Hierarchical Classification for Intrusion Detection System: Effective Design and Empirical Analysis [3.6] 誤報を最小化しながら、異なる種類の攻撃を正確に検出できる侵入検知システム(IDS)を配備することが重要である。
機械学習のアプローチはIDSで広く使われており、通常トラフィックと異なるタイプの攻撃を区別するために、主にフラットなマルチクラス分類を使用している。
ネットワーク攻撃の分類には3レベルの階層的分類モデルを用いており、第1のレベルは良性または攻撃を分類し、第2のレベルは粗度の高い攻撃タイプを分類し、第3のレベルは粒度の高い攻撃タイプを分類する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:16:55 GMT)
A Dual-Tier Adaptive One-Class Classification IDS for Emerging Cyberthreats [3.6] 2層構造を有する一級分類駆動型IDSシステムを提案する。
第1層は通常の活動と攻撃/脅威を区別し、第2層は検出された攻撃が未知であるかを判定する。
このモデルは、目に見えない攻撃を識別するだけでなく、目に見えない攻撃をクラスタリングすることでそれらを再トレーニングするために使用する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:26:30 GMT)
MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data [3.5] この研究は、1時間分のfMRIトレーニングデータを使用して高品質な再構成を行う。
MindEye2は、MRI施設への単一の訪問から、いかに正確に知覚の再構築が可能かを実証する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:15:22 GMT)
Customizing Visual-Language Foundation Models for Multi-modal Anomaly Detection and Reasoning [3.2] 複数のシナリオに適用可能な一般的な異常検出モデルを開発する。
本手法では,タスク記述,クラスコンテキスト,正規性規則,参照画像など,マルチモーダルなプロンプト型について検討する。
予備研究は,視覚と言語の組み合わせが,モデルをカスタマイズする条件として,異常検出性能を高めることを実証した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 04:30:57 GMT)
Machine Learning and Vision Transformers for Thyroid Carcinoma Diagnosis: A review [3.2] 本稿では, 甲状腺癌診断におけるAIベースのアプローチ, 特にトランスフォーマーを用いたアプローチについて概説する。
人工知能(AI)アルゴリズム,フレームワークの目標,使用するコンピューティング環境に基づいて,これらの手法の新たな分類システムを導入する。
この論文は、教師なし、教師なし、または混在したアプローチを通じて、TCの診断と治療を支援するためのAI機器の重要性を強調している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:45:04 GMT)
A Tip for IOTA Privacy: IOTA Light Node Deanonymization via Tip Selection [3.0] IOTAは、Tangleと呼ばれるDirected Acyclic Graph構造を使用する分散台帳技術である。
本稿では,ユーザのプライバシを侵害するために,チップの選択を活用できることを実証する。
これらの攻撃は、現在のIOTA環境だけでなく、IOTA 2.0でも可能であり、プライバシーの改善も研究されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:12:46 GMT)
General Line Coordinates in 3D [2.9] 3Dビジュアライゼーションにおける解釈可能なインタラクティブな視覚パターン発見は、機械学習を前進させる有望な方法である。
GLC (3D General Line Coordinates) 可視化空間で行われ、3D内のすべてのn-D情報を保存している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:42:20 GMT)
Nonparametric Bayesian volatility learning under microstructure noise [2.8] 市場マイクロ構造騒音下でのボラティリティ学習の課題について検討する。
具体的には、微分方程式からノイズの多い離散時間観測を考察する。
方程式の拡散係数を学習するための新しい計算法を開発した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:04:25 GMT)
Synergy of Information in Multimodal IoT Systems -- Discovering the impact of daily behaviour routines on physical activity level [2.7] 本研究は,様々なIoTソースからの情報のシナジーを利用して,革新的なアプローチを提案する。
ガイドラインの遵守に基づいてルーチンをグループ化し,クラスタリング手法を用いて行動の類似点とキー特性を同定した。
高齢者のケアケーススタディに応用して,推奨された日常的ステップに基づいて,日々の分類によって身体的不活性化につながるパターンを明らかにする。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:06:38 GMT)
Experimental Design for Multi-Channel Imaging via Task-Driven Feature Selection [2.7] 本稿では,その設計(画像チャネルのセット)を同時に最適化し,ユーザが特定した画像解析タスクを実行するための機械学習モデルを訓練する実験設計のための新しいパラダイムを提案する。
その結果、従来の実験設計よりも大幅に改善され、新しいパラダイムにおけるアプリケーション固有の方法が2つ、教師付き特徴選択における最先端のアプローチが2つあった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:45:52 GMT)
Advanced Artificial Intelligence Algorithms in Cochlear Implants: Review of Healthcare Strategies, Challenges, and Perspectives [2.6] 本レビューは、CIベースのASRと音声強調の進歩を包括的にレビューすることを目的としている。
このレビューは潜在的な応用を掘り下げ、この領域の既存の研究ギャップを埋めるための今後の方向性を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:28:23 GMT)
Understanding Diffusion Models by Feynman's Path Integral [2.4] ファインマン積分経路を用いた拡散モデルの新しい定式化を導入する。
この定式化はスコアベース生成モデルの包括的記述を提供する。
また、後方微分方程式と損失関数の導出を示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:24:29 GMT)
A minimal coalition logic [2.4] 我々は、並列ゲームモデルであるCoalition Logicモデルには3つの強い仮定があると主張している。
本稿では,3つの仮定を持たない一般的な並列ゲームモデルに基づく連立論理を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:33:37 GMT)
Learning solution operators of PDEs defined on varying domains via MIONet [2.0] まず、距離空間を扱うために MIONet の近似理論を拡張する。
次に、いくつかの適当な領域からなる集合を構築し、この集合上の計量を提供して、それを計量空間とする。
すべてのパラメータが変化するPDEの解写像を学習することができる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 01:45:49 GMT)
Deep Neural Crossover [2.0] 我々は、Deep Neural Crossover'(DNC)と呼ばれる、遺伝的アルゴリズム(GA)における新しいマルチペアクロスオーバー演算子を提案する。
親遺伝子をランダムに選別する従来のGAクロスオーバー演算子とは異なり、DNCは深層強化学習(DRL)とエンコーダ・デコーダアーキテクチャ(encoder-decoder architecture)の能力を利用して遺伝子を選択する。
DNCはドメイン非依存であり、他の問題領域にも容易に適用できる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:50:20 GMT)
StainDiffuser: MultiTask Dual Diffusion Model for Virtual Staining [1.9] ヘマトキシリンとエオシン(H&E)染色は、疾患の診断や腫瘍再発追跡に最もよく用いられる。
ディープラーニングモデルは、画像から画像への変換(I2I)を重要な研究領域とし、高価な物理的染色プロセスの必要性を減らす。
StainDiffuserは、仮想染色のための新しい二重拡散アーキテクチャであり、限られたトレーニング予算の下で収束する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:47:52 GMT)
DCNFIS: Deep Convolutional Neuro-Fuzzy Inference System [1.9] 精度を犠牲にすることなく透明性を向上させる新しいディープネットワークの設計について報告する。
本研究では,ファジィ論理とディープラーニングモデルのハイブリッド化により,深層畳み込み型ニューロファジィ推論システム(DCNFIS)を設計する。
我々は,ネットワークに符号化されたファジィルールから,ファジィ論理の透明性を,サリエンシマップの形で導出することで活用する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:10:15 GMT)
D4C glove-train: solving the RPM and Bongard-logo problem by distributing and Circumscribing concepts [1.8] D2Cアプローチは、Ravenのプログレッシブ行列とボンガード・ローゴ問題において、概念境界を再定義する。
D3C法は画像表現の分布を推定し、シンクホーン距離を測定することにより推論精度を著しく向上させる。
D3C-cos変種は分布距離を制約することでRPM問題の効率的かつ正確な解を提供する。
Lico-NetはD3CとD3C-cosを組み合わせたネットワークであり、問題解決と解釈性の両方において最先端の性能を達成する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:47:00 GMT)
Order-One Rolling Shutter Cameras [1.6] ローリングシャッター(RS)カメラが消費者およびスマートフォン市場を支配している。
我々は,ローリングシャッターカメラの重要なクラスの統一理論を提供する。
我々は、この理論が、かつて絶対的なポーズに使われたRSモデルを説明するのにどのように使えるかを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:28:24 GMT)
Technological Utilization in Remote Healthcare: Factors Influencing Healthcare Professionals' Adoption and Use [1.5] 本研究は、遠隔医療モニタリングに関連する技術を用いて、医療専門家の能力を理解することを目的としている。
我々は,技術受容モデルにおいて,サステナビリティを重要な次元として紹介する。
その結果,遠隔医療における遠隔監視装置の利用に対する参加者の肯定的見解が示唆された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:13:52 GMT)
HarmPot: An Annotation Framework for Evaluating Offline Harm Potential of Social Media Text [1.3] 我々は「ハームポテンシャル」を、現実世界の物理的損害(暴力)を引き起こすオンラインの公共のポストの可能性として定義する。
本稿では、テキストの異なる側面でデータに注釈を付けるフレームワーク/アノテーションスキーマの開発について論じる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 06:23:25 GMT)
Causality from Bottom to Top: A Survey [1.3] 因果関係は、様々な研究分野における事象、現象、結果の関係を説明するための基本的なアプローチとなっている。
医療、医療、経済学、金融、不正検出、サイバーセキュリティ、教育、公共政策、推薦システム、異常検出、ロボット工学、制御、社会学、マーケティング、広告など様々な分野や応用に侵入してきた。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:39:43 GMT)
Geometric structure of shallow neural networks and constructive ${\mathcal L}^2$ cost minimization [1.2] 隠れた1つの層を持つ浅層ニューラルネットワーク、ReLUアクティベーション関数、$mathcal L2$ Schattenクラス(Hilbert-Schmidt)のコスト関数を考える。
我々は、$O(delta_P)$のコスト関数の最小値に対して、$delta_P$の信号とトレーニング入力のノイズ比を測る上限を証明した。
特別の場合、$M=Q$ において、コスト関数の正確な退化局所極小を明示的に決定し、そのシャープ値が a の$Qleq M$ に対して得られる上限値と異なることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:09:45 GMT)
Robustness of the data-driven approach in limited angle tomography [1.1] 本研究では,ディープニューラルネットワークに基づくデータ駆動型アプローチが,従来の手法に比べて安定した方法で,より多くの情報を再構築できることを数学的に説明する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:35:45 GMT)
Reasoning in Transformers - Mitigating Spurious Correlations and Reasoning Shortcuts [1.0] トランスフォーマー言語モデル(Transformer Language Model)は、自然言語に関する様々なタスクに使用されるニューラルネットワークである。
命題論理における推論を近似するために,変換器の学習範囲について検討する。
We found that SIP-BART is successfully to avoiding reasoning shortcuts, while WP-BART does not。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:32:12 GMT)
Deep Learning-based Sentiment Analysis in Persian Language [0.9] 本稿では,Digikala Online Retailer Webサイトからの顧客レビューデータを用いて,感情分析のためのハイブリッドディープラーニングモデルの導入と実装を行う。
肯定的,否定的,中立という3つの感情カテゴリーのF1スコアは78.3である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 03:15:29 GMT)
A Survey of IMU Based Cross-Modal Transfer Learning in Human Activity Recognition [0.9] 本研究では,HAR(Human Activity/Action Recognition)のためのモダリティ間の知識の伝達と活用について検討する。
我々は、IMUデータの重要性と可能性、およびモダリティ横断学習への適用性を動機づける。
クロスモーダルHARにおける今後の研究の方向性と応用について論じる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:31:14 GMT)
Introducing an ensemble method for the early detection of Alzheimer's disease through the analysis of PET scan images [0.8] 本研究は、アルツハイマー病を制御正常(CN)、進行性軽度認知障害(pMCI)、安定性軽度認知障害(sMCI)、アルツハイマー病(AD)の4つのグループに分類する難しい課題について考察する。
いくつかのディープラーニングモデルと伝統的な機械学習モデルがアルツハイマー病の検出に使われている。
その結果、深層学習モデルを用いてMCI患者間の差異を判断すると、全体の平均精度は93.13%、AUCは94.4%となることがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:12:50 GMT)
Quantifying the biomimicry gap in biohybrid robot-fish pairs [0.7] 我々は,ヒラメの4種の魚類(Hemigrammus rhodostomus)とニューラルネットワーク(NN)モデルを用いた生体模倣的社会相互作用の生成を行った。
我々の生物ハイブリッドシステムは,魚のペアを反映した社会的相互作用を生み出すことを示した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:17:41 GMT)
Negative refraction index manipulated by a displaced squeezed Fock state in the mesoscopic dissipative left-handed transmission line [0.6] LHTLの負屈折率(NRI)は、変位圧縮フォック状態(DSFS)によって制御される
量子効果のため、LHTLにはいくつかの特定の量子特性が示されており、マイクロ波周波数における小型化の応用において重要である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:29:08 GMT)
2-D isotropic negative refractive index in a N-type four-level atomic system [0.6] 2-D(2次元)等方性負屈折率(NRI)は直交信号と定常波場の結合により明確に実現される。
他の2次元NRIスキームと比較して、このスキームにおけるコヒーレントな原子蒸気媒体は理想の2次元等方性NRI候補である可能性がある。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:14:49 GMT)
Unveiling gravity's quantum fingerprint through gravitational waves [0.5] このモデルは、LOCC原理の古典的な通信制約を回避し、重力誘起絡み合い(GIE)現象を研究する。
モデルは「事象」だけでなくシステムの局所性も満足しているため、観測されたGIEは重力の量子的性質の強いシグネチャである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:06:44 GMT)
Analyzing the Variations in Emergency Department Boarding and Testing the Transferability of Forecasting Models across COVID-19 Pandemic Waves in Hong Kong: Hybrid CNN-LSTM approach to quantifying building-level socioecological risk [0.3] 救急部門(ED)の搭乗は、患者の予後不良と健康システムのパフォーマンスに関連付けられている。
しかし、新型コロナウイルス(COVID-19)に先立って効果的な予測モデルは稀であり、近日中には欠落している。
ここでは、香港の病院局、保健省、住宅局から得られたパブリックドメインデータに対して、ハイブリッド畳み込みニューラルネットワーク(CNN)-Long短期記憶(LSTM)モデルを適用した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:48:40 GMT)
Safeguarding Marketing Research: The Generation, Identification, and Mitigation of AI-Fabricated Disinformation [0.3] 生成AIは、人間のコントリビューションを忠実に模倣するコンテンツを生成する能力を確立している。
これらのモデルは、世論の操作や認識の歪曲に利用することができ、結果としてデジタルプラットフォームに対する信頼が低下する。
本研究は,マーケティング文献と実践に3つの方法で貢献する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:08:28 GMT)
Psittacines of Innovation? Assessing the True Novelty of AI Creations [0.3] 我々は、仮説的なクラウドファンディングキャンペーンのために、AIにプロジェクトタイトルの生成を任せる。
AI生成したプロジェクトタイトルで比較し、繰り返しと複雑さを測定します。
結果は、タスクの複雑さが増大しても、AIがユニークなコンテンツを生成することを示唆している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:08:11 GMT)
Scenarios for the Transition to AGI [0.2] 我々は、技術進歩の異なるシナリオの下で、生産と賃金がどのように振る舞うかを分析する。
人間の作業は、複雑さが異なる原子論的なタスクに分解できると仮定する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:22:28 GMT)
Global Convergence of SGD For Logistic Loss on Two Layer Neural Nets [0.2] 我々は,SGDのグローバル・ミニマへの第一種収束性を示す。
鍵となる考え方は、定数サイズのニューラルネット上のフロベニウスノルム正規化ロジスティック損失関数の存在を示すことである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:22:05 GMT)
Potential of Domain Adaptation in Machine Learning in Ecology and Hydrology to Improve Model Extrapolability [0.2] ドメイン適応技術は画像分類などの機械学習領域で広く使われている。
本稿では,地球規模での生態・水文学の現在の機械学習モデルの欠点について概説する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:23:06 GMT)
Photonic non-Markovianity identification by quantum process capabilities of non-CP processes [0.2] マルコフ量子過程は、任意に2つまたはそれ以上の正の完全正(CP)サブプロセスに分けることができる。
分裂過程の間に少なくとも1つの非CP過程が存在するとき、力学は非マルコフ過程と見なされる。
本稿では,非CPプロセスの定量化手法を提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 05:39:58 GMT)
Intelligent Railroad Grade Crossing: Leveraging Semantic Segmentation and Object Detection for Enhanced Safety [0.1] RHGCの事故と遅れは、アメリカ合衆国連邦鉄道管理局(FRA)に重大な安全上の懸念をもたらす。
本研究では、機械学習とコンピュータビジョン技術を活用してRHGCの安全性を高めるインテリジェントシステムを提案する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 02:15:15 GMT)
Circular Belief Propagation for Approximate Probabilistic Inference [0.1] Belief Propagation (BP) は、確率分布を表すグラフのノード間でメッセージを渡す単純な確率的推論アルゴリズムである。
本稿では,BPの拡張であるCircular Belief Propagation (CBP)を提案する。
CBP が BP をはるかに上回り,従来提案したアルゴリズムと比較して優れた性能を示すバイナリ確率グラフを含む数値実験を行った。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:59:39 GMT)
Effect of Spontaneously Generated Coherence and Detuning on 2D Atom Localization in Two Orthogonal Standing-Wave Fields [0.1] 自発コヒーレンス(SGC)による2次元(2次元)原子の局在とプローブおよび定在波駆動場に関連する変形について検討した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:50:21 GMT)
Left-handedness with three zero-absorption windows tuned by the incoherent pumping field and inter-dot tunnelings in a GaAs/AlGaAs triple quantum dots system [0.1] 3つのゼロ吸収窓を持つ左利きは、トリプル量子ドット(TQD)システムで達成される。
GaAs/AlGaAsヘテロ構造の典型的なパラメータにより、同時に負の相対電気誘電率と磁気透過性が得られる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 08:19:15 GMT)
Classical shadows based on locally-entangled measurements [0.0] 我々は、$n$-qubitの絡み合った基底のランダム化測定に基づいて古典的なシャドウプロトコルを研究する。
絡み合った測定によって,パウリ予想値の学習において,非自明で潜在的に有利なトレードオフが可能になることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:03:11 GMT)
YOLOv9 for Fracture Detection in Pediatric Wrist Trauma X-ray Images [0.0] 本稿では, YOLOv9アルゴリズムモデルをコンピュータ支援診断(CAD)として骨折検出タスクに適用した最初の例である。
実験の結果、現在の最先端(SOTA)モデルのmAP 50-95と比較して、YOLOv9モデルは42.16%から43.73%に上昇し、3.7%の改善が見られた。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:47:54 GMT)
Theory of Supervibronic Transitions via Casimir Polaritons [0.0] 赤外線光キャビティ内には、電子から振動の度合いまでの遠隔エネルギー伝達経路が同定される。
このメカニズムは、異方性分子の突然の電子遷移により、実際の赤外線光子が生成される、動的カシミール効果に依存している。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:04:32 GMT)
The Negative Energy Sea [0.0] ディラックの負のエネルギー海は反物質の概念を導入し、特に波動方程式の負のエネルギー解との関係でそれを説明した。
戦後、これは私が「標準形式主義」と呼ぶもの、特に通常の順序付けに依存するものに大きく取って代わられた。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:14:15 GMT)
Source-Free Domain Adaptation for Question Answering with Masked Self-training [0.0] 以前の教師なしドメイン適応(UDA)メソッドは、ターゲットドメインのモデルを微調整しながら、ソースドメインデータにアクセスする必要がある。
ドメイン適応のためのユニークなマスクモジュールを統合したQAモデルに対する新しい自己学習手法を提案する。
4つのベンチマークデータセットに対する実験結果から,本手法は対象領域における事前学習されたQAモデルの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 19:06:38 GMT)
Relativization is naturally functorial [0.0] 量子計測理論から生じる相対化構造について、いくつかの分類学的視点を提供する。
この構成は、任意の量子系に対して、系の代数から合成系の不変代数への量子チャネルを提供する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 10:58:19 GMT)
Quantum dynamics in the self-consistent quadratic approximation [0.0] 自己整合2次理論は、量子力学における非線形寄与を説明するために提示される。
力学はトレース保存であることが証明されており、ハミルトン状態は初期ガウス状態の運動定数として作用する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:13:41 GMT)
Partitioned Neural Network Training via Synthetic Intermediate Labels [0.0] GPUメモリの制約は、そのような巨大なモデルをトレーニングする上で、注目すべきボトルネックになっている。
この研究は、モデルをGPU間で分割し、個々のセグメントをトレーニングするために合成中間ラベルを生成することを提唱する。
このアプローチは、モデル精度を維持しながらデータ通信を最小限に抑える、より効率的なトレーニングプロセスをもたらす。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:06:29 GMT)
Observation of spin-electric transitions in a molecular exchange qubit [0.0] 分子スピン三角形上で低温磁気遠赤外分光を行う(Fe3)
多核錯体におけるスピン-電気遷移の初めての実験的証拠を提供する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 13:28:14 GMT)
Numerical Realization of Dynamical Fermionization and Bethe Rapidities in a cold quenched Bose gas [0.0] コールドリーブ・ライニガー(LL)ボース気体の非平衡力学を考察する。
我々の研究は、ボースガスの基底状態から無限の深さ L0 の深い箱内から最終長さ L への弾道膨張中の硬壁電位の存在に関するものである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:35:12 GMT)
NeoNeXt: Novel neural network operator and architecture based on the patch-wise matrix multiplications [0.0] 本稿では,行列パターンを学習し,入力データに対してパッチワイズ行列乗算を行う新しい基礎演算であるNeoCellを提案する。
提案手法の主な利点は,(1)im2colのような演算を必要としない単純な実装,(2)計算量が少ないこと(特に大規模行列),(3)アップ/ダウンサンプリングの単純で柔軟な実装である。
我々は、ImageNet-1K分類タスクに基づいて、NeoNeXtモデルのファミリーを検証し、競合品質を実現することを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 15:51:21 GMT)
Multi-Objective Evolutionary Neural Architecture Search for Recurrent Neural Networks [0.0] 本稿では,多目的進化アルゴリズムに基づくRNNアーキテクチャ探索手法を提案する。
提案手法は,進化過程におけるRNNアーキテクチャの複雑性最適化のための近似ネットワーク型に依存する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 11:19:45 GMT)
Maximizing information obtainable by quantum sensors through the Quantum Zeno Effect [0.0] 我々は量子センサで得られる情報を最大化するためのツールとして量子ゼノ効果(QZE)を利用する。
外部共振条件下でのLACシステムに対するQZEによる情報増幅の概念を導入する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:45:39 GMT)
Manipulative Properties of the Asymmetry Double Quantum Dots via Laser and Gate Voltage [0.0] 非対称二重量子ドット(QD)系の理論的記述のための密度行列法を提案する。
その結果, 二重QDシステムの利得, 吸収, 分散特性はレーザパルスまたはゲート電圧で制御できることがわかった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 12:40:48 GMT)
Hierarchy of the echo state property in quantum reservoir computing [0.0] 量子貯水池計算機(QRC)における非定常ESPの対応を数値的に示す。
また、リニア/非線形メモリ容量を計算し、貯水池の状態内の入力依存成分を定量化する。
本研究は,非定常システムとサブシステムを利用したQRCおよび非定常RCシステムの実用設計について,新たな知見を提示する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:26:05 GMT)
Generalizations of Powers--Størmer's inequality [0.0] Mathrmtr|A-B|leq 2, Mathrmtrbig(f(A)g(B)big) endalign* は任意の正値行列単調関数に対して$f$である。
この不等式を満たす関数の集合には追加の要素が含まれており、この主張を支持するための図示的な例が示されている。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 00:31:23 GMT)
Exploring Tokenization Strategies and Vocabulary Sizes for Enhanced Arabic Language Models [0.0] 本稿では,アラビア語モデルの性能に及ぼすトークン化戦略と語彙サイズの影響について検討する。
本研究は, 語彙サイズがモデルサイズを一定に保ちながら, モデル性能に及ぼす影響を限定的に明らかにした。
論文のレコメンデーションには、方言の課題に対処するためのトークン化戦略の洗練、多様な言語コンテキストにわたるモデルの堅牢性の向上、リッチな方言ベースのアラビア語を含むデータセットの拡大が含まれる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 07:44:44 GMT)
Enhancing Predictive Capabilities in Data-Driven Dynamical Modeling with Automatic Differentiation: Koopman and Neural ODE Approaches [0.0] クープマン作用素のデータ駆動近似は、複雑な力学によって特徴づけられるシステムの時間進化を予測することを約束している。
ここでは、観測可能な辞書とクープマン作用素の対応する近似の両方を同時に決定するEDMD-DLの修正について述べる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 20:38:27 GMT)
Creating Seamless 3D Maps Using Radiance Fields [0.0] ナビゲーション,仮想観光,都市計画などの応用のために,2次元入力画像から3次元オブジェクトモデルと3次元マップを作成することが望ましい。
従来の方法では反射面と特異反射が困難である。
Google Road Viewは実際の3Dオブジェクトモデルを作成するのではなく、ビューの集合である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 22:49:07 GMT)
Comprehensive Autonomous Vehicle Optimal Routing With Dynamic Heuristics [0.0] AVユーザエクスペリエンスを改善するために提案されたモデルは、複数の連結自動運転車のハイブリッドAVネットワークを使用する。
この問題の真の最適解決策は、AVネットワークにおける車両の自動誘導システムを開発することである。
結果は分析され、解の有効性を評価し、ギャップと将来の拡張を識別するために比較される。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:21:56 GMT)
Cheap Ways of Extracting Clinical Markers from Texts [0.0] 本稿では,CLPsychの2024 Shared TaskにおけるUniBuc考古学チームの作業について述べる。
これには、割り当てられた自殺リスクレベルを支持するテキスト内の証拠の発見が含まれていた。
証拠にはハイライトと要約の2種類が必要だった。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:21:42 GMT)
Benefits of non-adiabatic quantum control in quantum computation through spin qubit systems [0.0] 制御可能な量子システムは、量子計算のための信頼できるビルディングブロックである。
将来的には、本格的な動作可能な量子コンピュータが登場することを期待しています。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 17:48:51 GMT)
An SDP-based Branch-and-Cut Algorithm for Biclustering [0.0] 本稿では,二クラスタリング問題に対する分枝切断アルゴリズムを提案する。
提案アルゴリズムは汎用的な解法よりも20倍大きな解法を解くことができることを示す。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 21:43:19 GMT)
An Alternative Approach to SUSY Oscillators [0.0] 一般型の振動子の対の系に対するシュヴィンガー代数の一般化と物理的実現を提供する。
得られた結果のいくつかの応用についても論じる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:37:31 GMT)
All-thermal reversal of heat currents using qutrits [0.0] システムを構成する2つの貯水池の同時冷凍機とヒートポンプとして、2つのクエットのコヒーレントカップリングを提案する。
これは、平衡状態にあるが系の熱を注入しない他の2つの貯水池との結合によって起こる。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 09:54:06 GMT)
Advanced Knowledge Extraction of Physical Design Drawings, Translation and conversion to CAD formats using Deep Learning [0.0] 本研究では,ディープラーニング手法を利用した革新的な手法を提案する。
このアプローチでは、物理的な描画オブジェクトを検出するために、Yolov7やFaster R-CNNといったオブジェクト検出モデルを採用している。
光文字認識(OCR)ツールは、図面からテキスト要素を識別して抽出するために統合される。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:06:06 GMT)
A learning-based solution approach to the application placement problem in mobile edge computing under uncertainty [0.0] モバイルエッジコンピューティングサーバにアプリケーションを配置することは、多くのサーバ、ユーザ、そして彼らの要求にまつわる複雑な課題を示す。
これらのアプローチの1つは機械学習であり、エッジサーバにおけるアプリケーションの配置に最適なソリューションをエミュレートする。
本研究の目的は,モバイルエッジコンピューティングにおける高次元問題や,不確実性を伴うシナリオに対処するための,より効率的なアプローチを提供することである。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 16:23:00 GMT)
A Modified Word Saliency-Based Adversarial Attack on Text Classification Models [0.0] 本稿では,テキスト分類モデルを対象とした新たな逆攻撃手法を提案する。
The Modified Word Saliency-based Adversarial At-tack (MWSAA)は、セマンティックコヒーレンスを維持しながら分類モデルを誤解させる。
多様なテキスト分類データセットを用いて実証評価を行い,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:39:14 GMT)
A Logic for Veracity [0.0] 本稿は、形式論理の第一原理から特徴付けに至るまでの開発の初期段階を示し、その上で、広範囲に定義されたVeracityの考え方で問題を探求する。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 23:34:10 GMT)
A Brief Study of Computer Network Security Technologies [0.0] 本稿では,ネットワークセキュリティシステムの重要性を紹介し,関連する技術を紹介する。
ネットワークのセキュリティ問題は、どのネットワークユーザでも直面することができるので、ネットワークのセキュリティを大幅に優先順位付けする必要があります。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 18:48:46 GMT)
2D isotropic negative permeability in a Λ-type three-level atomic system [0.0] x-y平面では、負の磁気応答の2つの等質で可変なピーク最大値が観測された。
ピーク極大領域の周辺では、負の透過性は等方性である。
論文参考訳(メタデータ) (Sun, 17 Mar 2024 14:24:08 GMT)