Fugu-MT: arxivの論文翻訳(概要)

A Comprehensive Survey on 3D Content Generation [148.4]
3Dコンテンツ生成は学術的価値と実践的価値の両方を示している。新しい分類法が提案され,既存のアプローチを3Dネイティブ生成法,2D先行3D生成法,ハイブリッド3D生成法という3つのタイプに分類する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:22:42 GMT)
BAMBOO: A Comprehensive Benchmark for Evaluating Long Text Modeling Capacities of Large Language Models [141.2]
大規模言語モデル(LLM)は、通常の長さのNLPタスクよりも劇的な熟練を実現している。マルチタスク長コンテキストベンチマークであるBAMBOOを提案する。 5つの異なる長いテキスト理解タスクから10のデータセットで構成されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:00:32 GMT)
DePT: Decoupled Prompt Tuning [124.6]
この作業は、即時チューニングにおいてBase-New Tradeoff (BNT)ジレンマを突破する。チューニングされたモデルがベースタスクに一般化されるほど、それが新しいタスクに一般化される。提案するDecoupled Prompt Tuning (DePT) フレームワークは,プロンプトチューニング中に特徴チャネルから独立した特徴空間へベース固有の知識を分離する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:51:38 GMT)
Dysen-VDM: Empowering Dynamics-aware Text-to-Video Diffusion with LLMs [112.4]
テキスト・ツー・ビデオ(T2V)合成は,最近出現した拡散モデル (DM) が,過去のアプローチよりも有望な性能を示したコミュニティで注目を集めている。既存の最先端のDMは高精細なビデオ生成を実現する能力があるが、ビデオ合成の要点である時間力学モデリングに関して重要な制限(例えば、アクション発生障害、粗雑なビデオ運動)に悩まされる。本研究では,高品位T2V生成のためのDMの映像ダイナミックスに対する意識向上について検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:29:54 GMT)
GGRt: Towards Pose-free Generalizable 3D Gaussian Splatting in Real-time [112.3]
GGRtは、現実のカメラポーズの必要性を軽減する、一般化可能な新しいビュー合成のための新しいアプローチである。最初のポーズフリーの一般化可能な3D-GSフレームワークとして、GGRtは$ge$5 FPSで、リアルタイムレンダリングは$ge$100 FPSで実現している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:03:14 GMT)
Cross-Lingual Transfer for Natural Language Inference via Multilingual Prompt Translator [104.6]
素早い学習による言語間移動は有望な効果を示した。我々は,MPT(Multilingual Prompt Translator)という新しいフレームワークを提案する。 MPTは、ソース言語とはかなり異なる言語に移行する際、バニラプロンプトよりも顕著である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:35:18 GMT)
MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training [104.5]
MLLM(Performant Multimodal Large Language Models)を構築する。特に,さまざまなアーキテクチャコンポーネントとデータ選択の重要性について検討する。本稿では,画像キャプチャ,インターリーブ画像テキスト,テキストのみのデータを組み合わせた大規模マルチモーダル事前学習について述べる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:37:13 GMT)
Entity6K: A Large Open-Domain Evaluation Dataset for Real-World Entity Recognition [100.4]
実世界のエンティティ認識のための包括的なデータセットであるEntity6Kを紹介する。 26のカテゴリに5700のエンティティがあり、それぞれがアノテーション付きの5つの人間認証イメージによってサポートされている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:07:53 GMT)
mPLUG-DocOwl 1.5: Unified Structure Learning for OCR-free Document Understanding [100.2]
MLLMの性能向上を目的とした統一構造学習を提案する。我々のモデルDocOwl 1.5は、10のビジュアル文書理解ベンチマーク上で最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:48:40 GMT)
Optimal Flow Matching: Learning Straight Trajectories in Just One Step [94.3]
ストレートネスは学習した流れの経路を素早く統合するために重要である。既存のフローストレート化手法の多くは、非自明な反復的な手順に基づいている。本研究では, 直列OT変位を2次コストで回収する新しい最適流れマッチング手法を, 1つのフローマッチングステップで開発する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:44:54 GMT)
AV-SUPERB: A Multi-Task Evaluation Benchmark for Audio-Visual Representation Models [92.9]
AV-SUPERBベンチマークは,音声・視覚・バイモーダル融合表現の汎用的評価を可能にする。我々は,最近の5つの自己教師型モデルを評価し,これらのモデルがすべてのタスクに一般化されないことを示す。我々は,AudioSetを用いた中間タスクの微調整と音声イベント分類によって表現が改善されることを実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:51:51 GMT)
Mitigating Hallucination in Large Multi-Modal Models via Robust Instruction Tuning [92.9]
本稿では,Large-scale Robust Visual (LRV)-Instructionという,大規模かつ多様な視覚的インストラクションチューニングデータセットを紹介する。本データセットは, GPT4が生成した400kの視覚的命令からなり, 16の視覚・言語的タスクをオープンエンドの指示と回答でカバーする。 LMMが生み出す幻覚を効果的に測定するために,人間の専門家による視覚指導のチューニングを安定的に評価するためのGAVIE(GPT4-Assisted Visual Instruction Evaluation)を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:53:25 GMT)
Phenomenal Yet Puzzling: Testing Inductive Reasoning Capabilities of Language Models with Hypothesis Refinement [92.6]
言語モデル(LM)は、しばしば帰納的推論に不足する。我々は,反復的仮説修正を通じて,LMの帰納的推論能力を体系的に研究する。本研究は, LMの誘導的推論過程と人間とのいくつかの相違点を明らかにし, 誘導的推論タスクにおけるLMの使用の可能性と限界に光を当てる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:18:22 GMT)
DMAD: Dual Memory Bank for Real-World Anomaly Detection [91.0]
我々は、DMAD(Anomaly Detection)のための表現学習を強化したDual Memory Bankという新しいフレームワークを提案する。 DMADはデュアルメモリバンクを用いて特徴距離を計算し、正常パターンと異常パターンの間の特徴注意を計算している。 DMADをMVTec-ADおよびVisAデータセット上で評価した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:16:32 GMT)
TuneTables: Context Optimization for Scalable Prior-Data Fitted Networks [90.0]
我々は,事前データ対応ネットワーク(PFN)のコンテキスト最適化手法を開発した。 PFNは、事前学習とコンテキスト内学習を利用して、1つのフォワードパスで新しいタスクの強力なパフォーマンスを達成する。我々は,大規模データセットをより小さな学習コンテキストに圧縮する新しいプロンプトチューニング戦略であるTuneTablesを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:49:24 GMT)
GVGEN: Text-to-3D Generation with Volumetric Representation [89.6]
3Dガウススプラッティングは、高速で高品質なレンダリング機能で知られる3D再構成と生成のための強力な技術として登場した。本稿では,テキスト入力から3次元ガウス表現を効率的に生成する新しい拡散型フレームワークGVGENを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:57:52 GMT)
MatPlotAgent: Method and Evaluation for LLM-Based Agentic Scientific Data Visualization [86.6]
MatPlotAgentは、科学的データ可視化タスクを自動化するために設計された、モデルに依存しないフレームワークである。 MatPlotBenchは、100人の検証されたテストケースからなる高品質なベンチマークである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:44:22 GMT)
Simple Ingredients for Offline Reinforcement Learning [86.2]
オフライン強化学習アルゴリズムは、ターゲット下流タスクに高度に接続されたデータセットに有効であることが証明された。既存の手法が多様なデータと競合することを示す。その性能は、関連するデータ収集によって著しく悪化するが、オフラインバッファに異なるタスクを追加するだけでよい。アルゴリズム的な考慮以上のスケールが、パフォーマンスに影響を及ぼす重要な要因であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:57:53 GMT)
Pretraining Codomain Attention Neural Operators for Solving Multiphysics PDEs [85.4]
PDEを用いた多物理問題の解法として,コドメイン注意ニューラル演算子(CoDA-NO)を提案する。 CoDA-NOはコドメインやチャネル空間に沿った機能をトークン化し、複数のPDEシステムの自己教師付き学習や事前訓練を可能にする。我々は,CoDA-NOの可能性を,複数システム上で多物理PDEを学習するためのバックボーンとして評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:56:20 GMT)
FRESCO: Spatial-Temporal Correspondence for Zero-Shot Video Translation [85.3]
フレーム間対応とフレーム間対応のFRESCOを導入し,より堅牢な時空間制約を確立する。この拡張により、フレーム間で意味的に類似したコンテンツのより一貫性のある変換が可能になる。提案手法では,入力ビデオと高空間時間整合性を実現するために,特徴の明示的な更新を行う。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:18 GMT)
Yell At Your Robot: Improving On-the-Fly from Language Corrections [84.1]
高いレベルのポリシーは、人間のフィードバックによって言語修正の形で容易に管理できることを示す。このフレームワークは、ロボットがリアルタイムの言語フィードバックに迅速に適応するだけでなく、このフィードバックを反復的なトレーニングスキームに組み込むことを可能にする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:08:24 GMT)
DetToolChain: A New Prompting Paradigm to Unleash Detection Ability of MLLM [81.8]
DetToolChainはマルチモーダル大言語モデル(MLLM)のゼロショットオブジェクト検出能力を解き放つ新しいパラダイムである。提案手法は,高精度検出にヒントを得た検出プロンプトツールキットと,これらのプロンプトを実装するための新しいChain-of-Thoughtから構成される。 DetToolChainを用いたGPT-4Vは,オープン語彙検出のための新しいクラスセットにおいて,最先端のオブジェクト検出器を+21.5%AP50で改善することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:54:33 GMT)
Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models [81.7]
CoS(Chain-of-Spot)法は,注目領域に着目して特徴抽出を強化する手法である。この技術により、LVLMは元の画像解像度を変更することなく、より詳細な視覚情報にアクセスすることができる。実験の結果,LVLMの視覚的内容の理解と推論能力は著しく改善した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:52 GMT)
Safety-Tuned LLaMAs: Lessons From Improving the Safety of Large Language Models that Follow Instructions [79.2]
いくつかの一般的な命令調整モデルは非常に安全でないことを示す。私たちの安全チューニングは、標準ベンチマークによって測定されたモデルの性能や有用性を著しく低下させません。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:50:50 GMT)
Wav2Gloss: Generating Interlinear Glossed Text from Speech [78.6]
Interlinear Glossed Text (IGT) は言語アノテーションの一種で、これらの言語コミュニティのドキュメントやリソース作成をサポートする。本稿では,これらの4つのアノテーションを音声から自動的に抽出するWav2Glossを提案する。我々は、エンドツーエンドとカスケードされたWav2Gloss法を比較し、事前学習されたデコーダが翻訳とグロス処理を補助し、マルチタスクと多言語アプローチは性能が劣り、エンドツーエンドシステムはカスケードシステムよりも性能が良いことを示唆する分析を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:45:29 GMT)
ComboVerse: Compositional 3D Assets Creation Using Spatially-Aware Diffusion Guidance [76.8]
複雑な構成で高品質な3Dアセットを生成する3D生成フレームワークであるComboVerseについて,複数のモデルを組み合わせることを学習して紹介する。提案手法は,標準スコア蒸留法と比較して,物体の空間的アライメントを重視している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:39:43 GMT)
WaveFace: Authentic Face Restoration with Efficient Frequency Recovery [74.7]
拡散モデルは,1) 訓練の遅さと推論速度,2) アイデンティティの保存ときめ細かい顔の詳細の復元の失敗の2つの問題で批判されている。本稿では,ウェーブレット変換によって分解される低周波・高周波成分を個別に考慮した周波数領域の問題を解決するためにWaveFaceを提案する。本稿では、WaveFaceが、特にアイデンティティ保存の観点から、信頼性において最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:27:24 GMT)
Generative Enhancement for 3D Medical Images [74.2]
本稿では,3次元医用画像合成の新しい生成手法であるGEM-3Dを提案する。本手法は2次元スライスから始まり,3次元スライスマスクを用いて患者に提供するための情報スライスとして機能し,生成過程を伝搬する。 3D医療画像をマスクと患者の事前情報に分解することで、GEM-3Dは多目的な3D画像を生成する柔軟な、かつ効果的なソリューションを提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:57:04 GMT)
WIA-LD2ND: Wavelet-based Image Alignment for Self-supervised Low-Dose CT Denoising [74.1]
周波数視点による実験結果に基づいてLDCT復調タスクを解析する。そこで我々は, NDCTデータのみを用いて, WIA-LD2NDと呼ばれる新しい自己監督型CT画像復号法を提案する。提案したWAA-LD2NDは、ウェーブレットベース画像アライメント(WIA)と周波数対応マルチスケールロス(FAM)の2つのモジュールからなる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:07:11 GMT)
Radiology-GPT: A Large Language Model for Radiology [74.1]
本稿では,ラジオロジーのための大規模言語モデルであるRadiology-GPTを紹介する。 StableLM、Dolly、LLaMAといった一般的な言語モデルと比較して、優れたパフォーマンスを示している。放射線診断、研究、通信において大きな汎用性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:01:03 GMT)
Oracle-Efficient Smoothed Online Learning for Piecewise Continuous Decision Making [73.5]
この研究は、複雑性という新しい概念、一般化ブラケット数を導入し、空間の大きさに対する敵の制約を結婚させる。次に、オンライン予測や断片的連続関数の計画など、関心のあるいくつかの問題で境界をインスタンス化する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:22:18 GMT)
Light Schrödinger Bridge [72.9]
我々は,軽量でシミュレーション不要で理論的に正当化されたSchr"odinger Bridgesソルバを開発した。我々の光解法は密度推定に広く用いられているガウス混合モデルに類似している。この類似性に着想を得て、光解法がSBの普遍近似であることを示す重要な理論的結果も証明した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:14:39 GMT)
GSVA: Generalized Segmentation via Multimodal Large Language Models [72.6]
Generalized Referring Expression (GRES)は、従来のRESの範囲を拡張して、1つの式で複数のオブジェクトを参照したり、画像に存在しない空のターゲットを特定する。セグメンテーションMLLMは、ユーザが特定のプロンプトで複数の主題を参照するケースを正しく扱えないため、現在のGRESの解決策は満足できないままである。本稿では,このギャップに対処する汎用ビジョンアシスタント(GSVA)を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:13:19 GMT)
Ada-NAV: Adaptive Trajectory Length-Based Sample Efficient Policy Learning for Robotic Navigation [72.2]
軌道長は強化学習アルゴリズムの学習過程において重要な役割を果たす。本稿では,RLアルゴリズムのトレーニングサンプル効率を向上させるための適応軌道長スキームであるAda-NAVを紹介する。我々は,Ada-NAVが従来の手法より優れている実世界のロボット実験を実演する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:16:16 GMT)
Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.1]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:34:28 GMT)
Fully Authentic Visual Question Answering Dataset from Online Communities [72.1]
VQA(Visual Question Answering)は、画像に関する質問に答える機能である。 VQAデータセットは、すべてのコンテンツが真正のユースケースから生まれたものである。このデータセットと8つの主流VQAデータセットとの関係を特徴付ける。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:50:36 GMT)
SynCDR : Training Cross Domain Retrieval Models with Synthetic Data [69.3]
クロスドメイン検索では、同じ意味圏から2つの視覚領域にまたがるイメージを識別するためにモデルが必要である。我々は、これらの欠落したカテゴリの例を満たすために、ドメイン間で合成データを生成する方法を示す。最高のSynCDRモデルは、先行技術よりも最大15%パフォーマンスが向上します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:56:53 GMT)
Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.4]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:28:19 GMT)
DreamDA: Generative Data Augmentation with Diffusion Models [68.2]
本稿では,新しい分類指向フレームワークDreamDAを提案する。 DreamDAは、オリジナルのデータのトレーニングイメージを種として考慮して、オリジナルのデータ分布に準拠する多様なサンプルを生成する。また、生成したデータのラベルは、対応するシード画像のラベルと一致しない可能性があるため、擬似ラベルを生成するための自己学習パラダイムを導入する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:04:35 GMT)
RelationVLM: Making Large Vision-Language Models Understand Visual Relations [66.7]
本稿では,複数の画像にまたがっても動画内でも,様々なレベルの関係を解釈できる大規模視覚言語モデルであるRelationVLMを提案する。具体的には,多段階的な関係認識学習手法とそれに対応するデータ構成戦略を考案し,意味的関係を理解する能力を備えた関係VLMを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:01:19 GMT)
Tuning-Free Image Customization with Image and Text Guidance [66.0]
テキスト画像の同時カスタマイズのためのチューニング不要なフレームワークを提案する。提案手法は,テキスト記述に基づく詳細な属性の修正が可能でありながら,参照画像のセマンティックな特徴を保っている。提案手法は,人的・定量的評価において,従来の手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:48:35 GMT)
BA-SAM: Scalable Bias-Mode Attention Mask for Segment Anything Model [65.9]
我々は,Segment Anything Model (SAM)における画像分解能変動の課題に対処する。 SAMはゼロショットの汎用性で知られており、さまざまな画像サイズを持つデータセットに直面するとパフォーマンスが低下する。我々は、各トークンが隣り合う情報を優先順位付けできるバイアスモードのアテンションマスクを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:48:17 GMT)
VisualCritic: Making LMMs Perceive Visual Quality Like Humans [65.6]
広視野画像の主観的品質評価のための最初のLMMであるVisualCriticを提案する。 VisualCriticは、データセット固有の適応操作を必要とせずに、最初からさまざまなデータにまたがって使用することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:07:08 GMT)
FTIC: Frequency-Aware Transformer for Learned Image Compression [64.3]
学習画像圧縮(lic)のためのマルチスケール指向性アナリシスを初めて実現した周波数認識変換器(FAT)ブロックを提案する。 FATブロックは、自然画像のマルチスケールおよび指向性周波数成分をキャプチャするための周波数分解ウィンドウアテンション(FDWA)モジュールを含む。また、周波数変調フィードフォワードネットワーク(FMFFN)を導入し、異なる周波数成分を適応的に変調し、周波数歪み性能を向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:15:28 GMT)
GRA: Detecting Oriented Objects through Group-wise Rotating and Attention [64.2]
GRA(Group-wise Rotating and Attention)モジュールは、オブジェクト指向オブジェクト検出のためのバックボーンネットワークにおける畳み込み操作を置き換えるために提案されている。 GRAは、グループワイド回転(Group-wise Rotating)とグループワイド注意(Group-wise Attention)という2つの重要なコンポーネントを含む、さまざまな向きのオブジェクトのきめ細かい特徴を適応的にキャプチャすることができる。 GRAはDOTA-v2.0ベンチマークで新しい最先端(SOTA)を実現し、以前のSOTA法と比較してパラメータを50%近く削減した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:40:43 GMT)
How does promoting the minority fraction affect generalization? A theoretical study of the one-hidden-layer neural network on group imbalance [64.2]
グループ不均衡は経験的リスク最小化において既知の問題である。本稿では,個々の集団がサンプルの複雑さ,収束率,平均および群レベルの試験性能に与える影響を定量化する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:20:31 GMT)
Better Call SAL: Towards Learning to Segment Anything in Lidar [64.0]
本稿では,Lidar内の任意のオブジェクトをセグメント化,分類するためのテキストプロンプト可能なゼロショットモデルを提案する。擬似ラベルエンジンは、手動の監督なしにモデルの訓練を容易にする。クラスに依存しないセグメンテーションでは91%、ゼロショットLPSでは44%である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:58:54 GMT)
Genixer: Empowering Multimodal Large Language Models as a Powerful Data Generator [63.8]
我々は、高品質な命令チューニングデータを生成する革新的なデータ生成パイプライン、Genixerを開発した。具体的には、Genixerはデータ生成の難しさを軽減するための4つの重要なステップを備えた統一されたソリューションを提供する。 Genixerの優れた定性的な結果は、現在のMLLMが強力なデータジェネレータに進化する強力な可能性を持っていることを示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:13:22 GMT)
Layered 3D Human Generation via Semantic-Aware Diffusion Model [63.5]
本稿では,新しい意味認識拡散モデルに基づくテキスト駆動型3次元人文生成フレームワークを提案する。生成した衣服を対象のテキストと整合性を保つために,衣服のセマンティック・信頼戦略を提案する。そこで本研究では,SMPLによる暗黙的フィールド変形ネットワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:50:32 GMT)
RigorLLM: Resilient Guardrails for Large Language Models against Undesired Content [62.7]
現在の緩和戦略は効果はあるものの、敵の攻撃下では弾力性がない。本稿では,大規模言語モデルのための弾力性ガードレール(RigorLLM)について紹介する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:25:02 GMT)
Friendly Sharpness-Aware Minimization [62.6]
シャープネス・アウェアの最小化(SAM)は、トレーニング損失とロスシャープネスの両方を最小化することにより、ディープニューラルネットワークトレーニングの改善に役立っている。対向性摂動におけるバッチ特異的勾配雑音の主な役割,すなわち現在のミニバッチ勾配について検討する。逆勾配雑音成分を分解することにより、全勾配のみに依存すると一般化が低下し、除くと性能が向上することがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:39:33 GMT)
Measuring and Improving Chain-of-Thought Reasoning in Vision-Language Models [61.3]
視覚言語モデル(VLM)は近年,人間のような出力を生成できる視覚アシスタントとして,強力な有効性を示している。我々は、既存の最先端のVLMを評価し、最高の性能モデルでさえ、強力な視覚的推論能力と一貫性を示すことができないことを発見した。本稿では,VLMの推論性能と一貫性の向上を目的とした2段階トレーニングフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:48:59 GMT)
DRESS: Instructing Large Vision-Language Models to Align and Interact with Humans via Natural Language Feedback [61.3]
本稿では,大規模言語モデルから自然言語フィードバック(NLF)を革新的に活用する大規模視覚言語モデル(LVLM)であるDRESSを紹介する。我々は,NLFの新たな分類法を2つの重要なタイプに分類する。実験の結果、DRESSはより有用な(9.76%)、正直な(11.52%)、無害な(21.03%)を生成できることが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:51:45 GMT)
Instant Uncertainty Calibration of NeRFs Using a Meta-calibrator [60.5]
我々は,1つの前方パスを持つNeRFに対して不確実な校正を行うメタ校正器の概念を導入する。メタキャリブレータは、見えないシーンを一般化し、NeRFの良好な校正と最先端の不確実性を実現できることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:54:22 GMT)
LeTI: Learning to Generate from Textual Interactions [60.4]
本稿では,テキストインタラクション(LETI)から学習するLMの可能性を,バイナリラベルによる正当性をチェックするだけでなく,テキストフィードバックを通じて出力中のエラーをピンポイントし,説明する。私たちの焦点はコード生成タスクであり、そこではモデルが自然言語命令に基づいてコードを生成する。 LETIは、目的のLMを用いて、自然言語命令、LM生成プログラム、テキストフィードバックの結合に基づいて、モデルを反復的に微調整する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:53:15 GMT)
Eye-gaze Guided Multi-modal Alignment Framework for Radiology [60.1]
放射線医が診断評価中に同期的に収集したアイ・ゲイズデータは、胸部X線と診断用テキストを自然に結びつける。モデルは、ゼロショット分類および検索タスクにおいて、他の最先端手法よりも優れた、堅牢な性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:59:14 GMT)
FaceXFormer: A Unified Transformer for Facial Analysis [59.9]
FaceXformerは、さまざまな顔分析タスクのためのエンドツーエンドの統一トランスフォーマーモデルである。本モデルでは,8つのタスクにまたがる頑健さと一般化性を実証し,画像の「夢中」を効果的に処理する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:58:04 GMT)
Impossible Distillation: from Low-Quality Model to High-Quality Dataset & Model for Summarization and Paraphrasing [59.6]
本稿では,パラフレーズと文要約のための新しい枠組みであるImpossible Distillationを提案する。極端に大規模な教師モデルに依存した先行研究とは異なり、パラフラスティックな近在性と事前学習されたLMを仮説化し、検証する。これらの部分空間から世代を同定して蒸留することにより、インポッシブル蒸留は、GPT2スケールのLMでも高品質なデータセットとモデルを生成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:14:04 GMT)
Generalized Consistency Trajectory Models for Image Manipulation [59.6]
拡散に基づく生成モデルは、画像編集や復元といった応用タスクと同様に、無条件生成において優れている。本稿では、任意の分布をODEで変換する一般化軌道モデル(GCTM)を提案する。本稿では,GCTMの設計空間について論じ,画像から画像への変換,復元,編集など,様々な画像操作タスクにおいて有効性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:24:54 GMT)
Third-Party Language Model Performance Prediction from Instruction [59.6]
言語モデルに基づく命令フォローシステムは、最近、多くのベンチマークタスクのパフォーマンスが向上している。ユーザは、応答が正確かどうかを判断することなく、命令付きモデルを容易に促すことができる。本稿では,タスク上での指示追従システムの評価から得られたメトリックを予測するために,別のモデルを訓練した第三者のパフォーマンス予測フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:53:47 GMT)
AnySkill: Learning Open-Vocabulary Physical Skill for Interactive Agents [58.8]
オープンな語彙の指示に従って物理的に妥当な相互作用を学習する新しい階層的手法であるAnySkillを提案する。我々のアプローチは、模倣学習によって訓練された低レベルコントローラを介して、一連のアトミックアクションを開発することから始まります。提案手法の重要な特徴は,手動の報酬工学を使わずにオブジェクトとのインタラクションを学習する,高レベルなポリシーに対する画像ベースの報酬の利用である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:41:39 GMT)
Zero-Reference Low-Light Enhancement via Physical Quadruple Priors [58.8]
本稿では,標準光画像のみをトレーニング可能な,ゼロ参照低光強調フレームワークを提案する。このフレームワークは、画像にさかのぼる照明不変性を復元し、自動的に低照度化を実現します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:36:28 GMT)
AffineQuant: Affine Transformation Quantization for Large Language Models [58.5]
ポストトレーニング量子化(PTQ)は、その圧縮効率とトレーニングの文脈における費用対効果により、かなりの関心を集めている。既存の大規模言語モデル(LLM)のPTQ手法は、事前量子化重みと後量子化重みの間の変換のスケーリングに最適化範囲を制限している。本稿では,PTQ(AffineQuant)における等価アフィン変換を用いた直接最適化を提唱する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:40:21 GMT)
Self-learning Canonical Space for Multi-view 3D Human Pose Estimation [58.0]
マルチビュー3次元人間のポーズ推定は、自然に単一ビューのポーズ推定よりも優れている。これらの情報の正確な注釈を得るのは難しい。完全自己管理型多視点アグリゲーションネットワーク(CMANet)を提案する。 CMANetは、大規模で質的な分析において最先端の手法よりも優れている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:54:59 GMT)
Human Mesh Recovery from Arbitrary Multi-view Images [58.0]
任意の多視点画像からU-HMR(Unified Human Mesh Recovery)を分離・征服する枠組みを提案する。特にU-HMRは、分離された構造と、カメラとボディーデカップリング(CBD)、カメラポーズ推定(CPE)、任意のビューフュージョン(AVF)の2つの主要コンポーネントから構成されている。我々は、Human3.6M、MPI-INF-3DHP、TotalCaptureの3つの公開データセットについて広範な実験を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:47:56 GMT)
Zippo: Zipping Color and Transparency Distributions into a Single Diffusion Model [56.8]
色と透明性の分布を単一の拡散モデルに分解する統合フレームワークZippoを提案する。 ZippoはアルファマットからRGBイメージを生成し、入力イメージから透過性を予測できる。実験では,Zippoのテキスト条件の透過的な画像生成能力について紹介した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:21:02 GMT)
Provable Privacy with Non-Private Pre-Processing [56.8]
非プライベートなデータ依存前処理アルゴリズムによって生じる追加のプライバシーコストを評価するための一般的なフレームワークを提案する。当社のフレームワークは,2つの新しい技術的概念を活用することにより,全体的なプライバシー保証の上限を確立する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:54:49 GMT)
GVA: Reconstructing Vivid 3D Gaussian Avatars from Monocular Videos [56.4]
モノクロビデオ入力(GVA)から鮮明な3Dガウスアバターの作成を容易にする新しい手法を提案する。私たちのイノベーションは、高忠実な人体再構築を実現するという、複雑な課題に対処することにあります。通常の地図とシルエットを整列させて手足のポーズ精度を向上させるためにポーズ改善手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:58:17 GMT)
FoldToken: Learning Protein Language via Vector Quantization and Beyond [56.2]
タンパク質配列構造を離散シンボルとして表現するために textbfFoldTokenizer を導入する。学習したシンボルを textbfFoldToken と呼び、FoldToken の配列が新しいタンパク質言語として機能する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:29:23 GMT)
OV9D: Open-Vocabulary Category-Level 9D Object Pose and Size Estimation [56.0]
本稿では,新しい開集合問題,開語彙圏レベルのオブジェクトポーズとサイズ推定について検討する。まずOO3D-9Dという大規模フォトリアリスティックなデータセットを紹介した。次に、事前学習したDinoV2とテキストから画像への安定拡散モデルに基づくフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:09:24 GMT)
Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models [56.0]
オープンソースのLarge Language Models(LLM)は、さまざまなNLPタスクで大きな成功を収めていますが、エージェントとして振る舞う場合、それでもAPIベースのモデルよりもはるかに劣っています。本稿では,(1) エージェント学習コーパスを,(1) エージェント学習データの分布から大きくシフトするエージェント推論と,(2) エージェントタスクが必要とする能力に異なる学習速度を示すエージェント学習コーパスと,(3) 幻覚を導入することでエージェント能力を改善する際の副作用について述べる。本稿では,エージェントのためのFLANモデルを効果的に構築するためのエージェントFLANを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:26:10 GMT)
When Do We Not Need Larger Vision Models? [56.0]
視覚モデルのサイズを拡大することが、より強力な視覚表現を得るためのデファクトスタンダードとなっている。 S$2のScaling on Scales(スケーリング・オン・スケール)のパワーを実演します。 1行のコードで任意のビジョンモデルにS$2$を適用可能なPythonパッケージをリリースします。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:58:39 GMT)
Robust NAS under adversarial training: benchmark, theory, and beyond [55.5]
我々は、多数の敵に訓練されたネットワークに対して、クリーンな精度とロバストな精度の両方を含む包括的データセットをリリースする。また,多目的対人訓練において,クリーンな精度とロバストな精度で探索アーキテクチャを一般化する理論を確立した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:10:23 GMT)
Pointer Networks with Q-Learning for OP Combinatorial Optimization [55.2]
オリエンテーアリング問題(OP)は、組合せ最適化(CO)においてユニークな課題を提示するこの研究はPointer Q-Network (PQN)を発表した。この手法は、Ptr-NetsとQ-learningを組み合わせたもので、批判のみにより、組込みグラフ内で関係をキャプチャする能力に勝っている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:15:36 GMT)
Boosting Image Restoration via Priors from Pre-trained Models [54.8]
我々は、OSFによるターゲット復元ネットワークの復元結果を改善するために、Pre-Train-Guided Refinement Module (PTG-RM)と呼ばれる軽量モジュールを学習する。 PTG-RMは、低照度強化、デラリニング、デブロアリング、デノナイジングなど、様々なタスクにおける様々なモデルの復元性能を効果的に向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:46:42 GMT)
Cameras as Rays: Pose Estimation via Ray Diffusion [54.1]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:29:20 GMT)
Subjective-Aligned Dateset and Metric for Text-to-Video Quality Assessment [54.0]
現在までに最大規模のテキスト・ビデオ品質評価データベース(T2VQA-DB)を構築している。データセットは、9つの異なるT2Vモデルによって生成される1万のビデオで構成されている。主観的テキスト・ビデオ品質評価(T2VQA)のためのトランスフォーマーに基づく新しいモデルを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:03:22 GMT)
Improving Diffusion Models for Virtual Try-on [54.0]
本稿では,キュレートされた衣服を身に着けている人のイメージをレンダリングする,イメージベースの仮想試行について考察する。衣服の忠実度を改善し,仮想試行画像を生成する新しい拡散モデルを提案する。本稿では,一対の人着画像を用いたカスタマイズ手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:49:40 GMT)
HUGS: Holistic Urban 3D Scene Understanding via Gaussian Splatting [53.6]
RGB画像に基づく都市景観の全体的理解は、難しいが重要な問題である。我々の主な考え方は、静的な3Dガウスと動的なガウスの組合せを用いた幾何学、外観、意味論、運動の合同最適化である。提案手法は,2次元および3次元のセマンティック情報を高精度に生成し,新たな視点をリアルタイムに描画する機能を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:39:05 GMT)
Encode Once and Decode in Parallel: Efficient Transformer Decoding [53.6]
本稿では,エンコーダ・デコーダモデルのための新しい構成を導入し,構造化された出力と質問応答タスクの効率を改善する。提案手法は,インプットを一度エンコードして並列にデコードすることで,トレーニングと推論の効率を向上する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:27:23 GMT)
BooookScore: A systematic exploration of book-length summarization in the era of LLMs [53.4]
我々は,識別されたエラータイプを一切含まない要約文の割合を計測する自動測度BooookScoreを開発した。 GPT-4 や 2 のようなクローズドソース LLM は,オープンソースモデルよりも BooookScore の高いサマリーを生成することがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:13:59 GMT)
MoreStyle: Relax Low-frequency Constraint of Fourier-based Image Reconstruction in Generalizable Medical Image Segmentation [53.2]
MoreStyleと呼ばれるデータ拡張のためのPlug-and-Playモジュールを紹介します。 MoreStyleは、フーリエ空間の低周波制約を緩和することで、イメージスタイルを多様化する。敵対的学習の助けを借りて、MoreStyleは潜在機能の中で最も複雑なスタイルの組み合わせを指差している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:13:46 GMT)
MineDreamer: Learning to Follow Instructions via Chain-of-Imagination for Simulated-World Control [53.2]
我々はMinecraftシミュレータ上に構築されたオープンなエンボディエージェントであるMineDreamerを紹介する。命令実行のステップバイステップを想定するために,CoI(Chain-of-Imagination)機構を用いる。実験では、MineDreamerは単段階と多段階の命令を着実に従っている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:52:28 GMT)
Layer-wise Linear Mode Connectivity [52.7]
ニューラルネットワークパラメータの平均化は、2つの独立したモデルの知識の直感的な方法である。フェデレートラーニングにおいて最も顕著に用いられている。私たちは、単一グループやグループを平均化するモデルの性能を分析します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:50:38 GMT)
Task-Customized Mixture of Adapters for General Image Fusion [51.9]
一般画像融合は、マルチソース画像から重要な情報を統合することを目的としている。本稿では, 汎用画像融合用アダプタ(TC-MoA)を新たに提案し, 統一モデルにおける様々な融合タスクを適応的に促進する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:02:08 GMT)
EscherNet: A Generative Model for Scalable View Synthesis [51.3]
EscherNetはビュー合成のための多視点条件拡散モデルである。単一のコンシューマグレードGPU上で、100以上の一貫性のあるターゲットビューを同時に生成することができる。 EscherNetはシングルイメージとマルチイメージの3D再構成を統一し、これらの多様なタスクを単一の凝集性フレームワークに統合する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:41:04 GMT)
UFineBench: Towards Text-based Person Retrieval with Ultra-fine Granularity [50.9]
既存のテキストベースの人物検索データセットは、しばしば比較的粗い粒度のテキストアノテーションを持つ。これにより、実際のシナリオにおけるクエリテキストのきめ細かいセマンティクスを理解するモデルが妨げられます。我々は,超微細な人物検索のためにtextbfUFineBench という新しいベンチマークを作成した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:45:07 GMT)
DREAM: Diffusion Rectification and Estimation-Adaptive Models [50.7]
DREAM(Diffusion Rectification and Estimation Adaptive Models)を提案する。 DREAMには2つのコンポーネントがある。DREAMは、サンプリングプロセスの反映のためにトレーニングを調整する拡散補正と、歪みに対する知覚のバランスをとる推定適応である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:19:18 GMT)
Contextual AD Narration with Interleaved Multimodal Sequence [50.2]
このタスクは、視覚障害者が映画のような長めのビデオコンテンツにアクセスするのを助けるために、視覚障害者のための視覚要素の記述を作成することを目的としている。ビデオ機能、テキスト、文字バンク、コンテキスト情報を入力として、生成されたADは名前で文字に対応することができる。我々は、ADを生成するためのシンプルで統一されたフレームワークを通じて、事前訓練された基礎モデルを活用することを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:27:55 GMT)
Machine Learning of the Prime Distribution [49.8]
我々は、Y.-Hの実験的な観察を説明する理論的議論を行う。我々は、ErdHos-Kac法が現在の機械学習技術によって発見される可能性は極めて低いと仮定する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:47:54 GMT)
3D Scene Creation and Rendering via Rough Meshes: A Lighting Transfer Avenue [49.6]
本稿では,再構成された3Dモデルを3Dシーン作成やレンダリングなどの実用的な3Dモデリングパイプラインに柔軟に統合する方法について述べる。我々はNFRとPBRを橋渡しする照明伝達ネットワーク(LighTNet)を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:02:04 GMT)
Understanding the Factors Influencing Self-Managed Enterprises of Crowdworkers: A Comprehensive Review [49.6]
本稿では,クラウドソーシングの自己管理型クラウドワーカー企業(SMEC)への移行について検討する。 SMECの台頭を説明する重要な要因を特定することに焦点を当て、このシフトの基本的な側面を理解するために文献をレビューする。この研究は、今後の研究を指導し、政策とプラットフォーム開発を指導することを目的としており、この発展途上の風景における公正な労働実践の重要性を強調している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:33:16 GMT)
Urban Scene Diffusion through Semantic Occupancy Map [49.2]
UrbanDiffusionは、Bird's-Eye View (BEV)マップに条件付き3次元拡散モデルである。我々のモデルは,潜在空間内のシーンレベルの構造の分布を学習する。実世界の運転データセットをトレーニングした後、我々のモデルは多様な都市シーンを生成することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:37:01 GMT)
Hamiltonian for a Bose gas with Contact Interactions [49.2]
ボース気体のハミルトニアンを、ゼロレンジまたは接触相互作用を介して相互作用する3次元のN geq 3$スピンレス粒子で研究する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:00:12 GMT)
FouriScale: A Frequency Perspective on Training-Free High-Resolution Image Synthesis [49.0]
本稿では、周波数領域解析の観点から、FouriScaleの革新的な学習不要アプローチを紹介する。従来の拡散モデルの畳み込み層を,低域演算とともに拡張手法を組み込むことで置き換える。提案手法は, 生成画像の構造的整合性と忠実度をバランスさせ, 任意のサイズ, 高解像度, 高品質な生成の驚くべき能力を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:33 GMT)
Automated Contrastive Learning Strategy Search for Time Series [48.7]
コントラスト学習(CL)は,時系列の表現学習パラダイムとして主流となっている。我々はMicrosoftでAutomated Machine Learning(AutoML)の実践を紹介し、様々な時系列データセットの学習表現をコントラストに自動的に学習する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:24:14 GMT)
Learning Cross-view Visual Geo-localization without Ground Truth [48.5]
CVGL(Cross-View Geo-Localization)は、クエリ画像の地理的位置を対応するGPSタグ付き参照画像とマッチングすることで決定する。現在の最先端の手法は、ラベル付きペア画像によるトレーニングモデルに依存しており、かなりのアノテーションコストとトレーニングの負担が伴う。 CVGLにおける凍結モデルの適用について,真理ペアラベルを必要とせずに検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:01:57 GMT)
Towards Model Extraction Attacks in GAN-Based Image Translation via Domain Shift Mitigation [48.4]
モデル抽出攻撃(MEA)は、攻撃者がAPIサービスをリモートでクエリすることで、被害者のディープニューラルネットワーク(DNN)モデルの機能を複製することを可能にする。本稿では,画像間翻訳(I2IT)タスクにおけるMEAの脅威を新たな視点から明らかにする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:02:34 GMT)
AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:45:33 GMT)
Dated Data: Tracing Knowledge Cutoffs in Large Language Models [48.0]
LLMの資源レベルの時間的アライメントに有効なカットオフを推定するための簡単な手法を提案する。効果的なカットオフは、報告されたカットオフとしばしば異なります。提案手法は,(1)非自明なデータ量によるCommonCrawlデータの時間的偏りと,(2)意味的重複と語彙的近接重複を含むLLM重複の重複という2つの原因を明らかにした。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:57:58 GMT)
NTK-Guided Few-Shot Class Incremental Learning [47.9]
FSCILにおける最適NTK収束とNTK関連一般化誤差の確保に焦点をあてる。グローバルに最適なNTK収束を実現するために,数学的原理に基づくメタ学習機構を用いる。ネットワークは堅牢なNTK特性を取得し,その基礎的一般化を著しく向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:43:46 GMT)
A Graph is Worth $K$ Words: Euclideanizing Graph using Pure Transformer [47.3]
我々は、非ユークリッドグラフをユークリッド空間で学習可能なグラフ語に変換するGraph2Seqエンコーダを特徴とするGraphsGPTを紹介する。 GraphGPTデコーダは、元のグラフをグラフ語から再構成し、情報等価性を保証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:27:08 GMT)
Learning Neural Volumetric Pose Features for Camera Localization [47.1]
本稿では,PoseMapと呼ばれるニューラルボリュームポーズ機能を導入し,カメラのローカライゼーションを強化した。我々のフレームワークは、拡張されたNeRFモジュールとともにAPR(Absolute Pose Regression)アーキテクチャを活用している。室内および屋外のベンチマークシーンで平均14.28%, 20.51%の性能向上が得られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:01:18 GMT)
Understanding Training-free Diffusion Guidance: Mechanisms and Limitations [46.8]
クリーンな画像に事前訓練されたオフ・ザ・シェルフネットワークを用いて、トレーニング不要な拡散誘導を提案する研究がいくつかある。我々は、最適化の観点から、トレーニングフリーガイダンスをサポートする理論的分析を提供する。次に,その限界を克服するために,理論的理論的根拠と実証的証拠を伴って,一連の手法を導入する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:27:01 GMT)
LHMKE: A Large-scale Holistic Multi-subject Knowledge Evaluation Benchmark for Chinese Large Language Models [46.8]
Chinese Large Language Models (LLMs)は、最近、様々なNLPベンチマークと実世界のアプリケーションで印象的な能力を実証した。大規模・完全・多目的知識評価ベンチマークLHMKEを提案する。初等学校から専門的認定試験まで、30の科目をカバーする75の課題に10,465の質問がある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:11:14 GMT)
Real-IAD: A Real-World Multi-View Dataset for Benchmarking Versatile Industrial Anomaly Detection [46.5]
大規模・実世界・多視点産業異常検出データセットであるReal-IADを提案する。 30の異なるオブジェクトの150Kの高解像度画像が含まれており、これは既存のデータセットよりも桁違いに大きい。このデータセットを実際のアプリケーションシナリオに近づけるために,多視点撮影法とサンプルレベルの評価指標を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:44:41 GMT)
FutureDepth: Learning to Predict the Future Improves Video Depth Estimation [46.4]
FutureDepthは、マルチフレームとモーションキューを暗黙的に活用して深度推定を改善するビデオ深度推定手法である。本論文では,FutureDepthがベースラインモデルを大幅に改善し,既存のビデオ深度推定法より優れ,新しい最先端(SOTA)の精度が設定できることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:55:22 GMT)
A conditional latent autoregressive recurrent model for generation and forecasting of beam dynamics in particle accelerators [46.3]
本稿では,加速器内の荷電粒子のダイナミクスを学習するための2段階の非教師付きディープラーニングフレームワークであるLatent Autoregressive Recurrent Model (CLARM)を提案する。 CLARMは、潜在空間表現をキャプチャしてデコードすることで、様々な加速器サンプリングモジュールでプロジェクションを生成することができる。その結果,提案手法の予測能力と生成能力は,様々な評価指標と比較した場合に有望であることが示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:05:17 GMT)
Embodied LLM Agents Learn to Cooperate in Organized Teams [46.3]
大規模言語モデル(LLM)は、推論、計画、意思決定のための統合的なツールとして登場した。本稿では,これらの問題を緩和するために,LSMエージェントにプロンプトベースの組織構造を課す枠組みを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:39:47 GMT)
GCT: Graph Co-Training for Semi-Supervised Few-Shot Learning [46.1]
新たなラベル予測手法である孤立グラフ学習(IGL)を提案する。 IGLでは、生データをグラフ空間にエンコードするLaplacian演算子を導入している。第2に,マルチモーダル融合の観点から,この課題に対処するためのグラフコライニング(GCT)を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:03:09 GMT)
Discover and Mitigate Multiple Biased Subgroups in Image Classifiers [46.0]
機械学習モデルは、分散データではうまく機能するが、トレーニングデータに不足している偏りのあるサブグループでは失敗することが多い。この問題に対処するために,分解,解釈,緩和(DIM)を提案する。提案手法では,画像特徴を複数のサブグループを表す複数のコンポーネントに分解する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:44:54 GMT)
Discrimination and certification of unknown quantum measurements [45.8]
我々は,フォン・ノイマン測定の基準値や他の測定値が与えられた場合のシナリオにおける識別について検討した。基準測定が古典的な記述を伴わない場合と古典的な記述が知られている場合を考察する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:37:35 GMT)
OMG: Towards Open-vocabulary Motion Generation via Mixture of Controllers [45.8]
我々は、ゼロショットオープン語彙テキストプロンプトから魅力的な動き生成を可能にする新しいフレームワークOMGを提案する。事前学習の段階では、ドメイン外固有のリッチな動作特性を学習することで、生成能力を向上させる。微調整の段階では、テキストプロンプトを条件情報として組み込んだモーションコントロールネットを導入する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:50:17 GMT)
EasyEdit: An Easy-to-use Knowledge Editing Framework for Large Language Models [45.7]
本稿では,大規模言語モデルのための知識編集フレームワークであるEasyEditを提案する。様々な最先端の知識編集アプローチをサポートし、よく知られたLLMにも容易に適用できる。我々はLlaMA-2の知識編集結果をEasyEditで報告し、知識編集が従来の微調整よりも優れていることを示した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:27:33 GMT)
MSLM-S2ST: A Multitask Speech Language Model for Textless Speech-to-Speech Translation with Speaker Style Preservation [45.6]
マルチタスク音声言語モデル(Multitask Speech Language Model、MSLM)は、マルチタスク設定で訓練されたデコーダのみの音声言語モデルである。我々のモデルは、話者スタイルを保存した多言語S2STをサポートすることができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:35:20 GMT)
An Empirical Study of Speech Language Models for Prompt-Conditioned Speech Synthesis [45.6]
音声言語モデル(LM)は、文脈内学習を通じて高品質な音声合成を実現することを約束している。合成音声がどのようにプロンプトとコンテンツによって制御されるかを検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:22:28 GMT)
Learning Successor Features with Distributed Hebbian Temporal Memory [45.0]
本稿では,不確実性を考慮した意思決定におけるオンライン時間記憶学習の課題に対して,新しいアプローチを提案する。提案アルゴリズムは因子グラフ形式と多成分ニューロンモデルに基づく分散Hebbian Temporal Memory (DHTM) である。実験の結果,非定常データセットの場合,DHTMはLSTMと生物学的にインスパイアされたHMMライクなアルゴリズムCSCGより優れていた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:58:29 GMT)
Generic 3D Diffusion Adapter Using Controlled Multi-View Editing [45.0]
オープンドメインの3Dオブジェクト合成は、限られたデータと高い計算複雑性のために、画像合成に遅れを取っている。本稿では,SDEditの3次元版として機能するMVEditを提案する。 MVEditはトレーニング不要の3Dアダプタを通じて3D一貫性を実現し、最後の2Dビューをコヒーレントな3D表現に変換する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:45:22 GMT)
CLIP-VIS: Adapting CLIP for Open-Vocabulary Video Instance Segmentation [44.5]
我々はCLIP-VISと呼ばれる単純なエンコーダデコーダネットワークを提案し、CLIPをオープン語彙ビデオインスタンスセグメンテーションに適用する。私たちのCLIP-VISは凍結したCLIP画像エンコーダを採用し、クラス非依存マスク生成、時間的トップK強調マッチング、重み付きオープン語彙分類を含む3つのモジュールを導入している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:27:04 GMT)
Enhancing Quality of Compressed Images by Mitigating Enhancement Bias Towards Compression Domain [44.1]
既存の圧縮画像の品質向上手法は圧縮領域に対する広範化バイアスを示す。本稿では,このバイアスを緩和し,圧縮画像の品質を高めるための簡易かつ効果的な方法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:41:00 GMT)
Health-LLM: Personalized Retrieval-Augmented Disease Prediction System [43.9]
本稿では,大規模特徴抽出と医療知識トレードオフスコアリングを組み合わせた,革新的なフレームワークHeath-LLMを提案する。従来の健康管理アプリケーションと比較して,本システムには3つの利点がある。医療報告と医療知識を大きなモデルに統合し、疾患予測のための大きな言語モデルに関連性のある質問を行う。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:12:19 GMT)
Smoothed Online Learning for Prediction in Piecewise Affine Systems [43.6]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:18:23 GMT)
ReProbes: An Architecture for Reconfigurable and Adaptive Probes [43.6]
ReProbesは、データ収集戦略の迅速な変更を処理できるアダプティブな監視プローブのクラスである。得られたアーキテクチャは、最先端の監視ソリューションと比較して質的にプローブ適応性を効果的に向上させることができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:01:58 GMT)
HCPM: Hierarchical Candidates Pruning for Efficient Detector-Free Matching [43.5]
HCPMは、階層的プルーニングを用いてマッチングパイプラインを最適化する、効率的かつ検出不要な局所的特徴マッチング手法である。その結果,HCPMは精度を保ちながら,既存の手法をはるかに上回っていることが明らかとなった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:40:19 GMT)
LASPA: Latent Spatial Alignment for Fast Training-free Single Image Editing [43.2]
拡散モデルを用いた実画像のテキスト編集のためのトレーニング不要な手法を提案する。参照画像を用いて拡散過程が空間的誘導にどう影響するかを実証し,意味的コヒーレントな編集に繋がることを示す。提案手法は,ユーザスタディにおいて62-71%の選好を達成し,モデルベース編集強度と画像保存スコアを大幅に改善する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:47:08 GMT)
LLMLingua-2: Data Distillation for Efficient and Faithful Task-Agnostic Prompt Compression [43.0]
本稿では, タスク非依存のプロンプト圧縮に着目し, 一般化性と効率性の向上を図る。我々は,プロンプト圧縮をトークン分類問題として定式化し,圧縮されたプロンプトが元のプロンプトに忠実であることを保証する。提案手法は, XLM-RoBERTa-large や mBERT などの小型モデルを用いて圧縮目標を明示的に学習することにより,低レイテンシを実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:56 GMT)
Temporally-Consistent Koopman Autoencoders for Forecasting Dynamical Systems [42.7]
テンポラリ一貫性を有するクープマンオートエンコーダ(tcKAE)について紹介する。 tcKAEは、制約付き、ノイズの多いトレーニングデータであっても正確な長期予測を生成する。我々は,最先端のKAEモデルよりもtcKAEの方が,様々なテストケースで優れた性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:48:25 GMT)
Building Brain Tumor Segmentation Networks with User-Assisted Filter Estimation and Selection [42.6]
複数のFLIM実行から最も関連性の高いフィルタを推定・選択するためのユーザ支援手法であるMulti-Step (MS) FLIMを提案する。 MS-FLIMは第1の畳み込み層にのみ使用され、既にFLIMよりも改善されていることを示している。 We build a simple U-shaped encoder-decoder network, named sU-Net, for glioblastoma segmentation using T1Gd and FLAIR MRI scans。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:11:26 GMT)
ViTGaze: Gaze Following with Interaction Features in Vision Transformers [42.1]
本稿では,新しい単一モダリティ・ギャラクシー・フレームワークであるViTGazeを紹介する。従来の方法とは対照的に、ViTGazeは、主に強力なエンコーダをベースとした、まったく新しい視点のフレームワークを作成する。本手法は,すべての単一モダリティ手法において,最先端(SOTA)性能を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:45:17 GMT)
TexDreamer: Towards Zero-Shot High-Fidelity 3D Human Texture Generation [42.0]
TexDreamerは、最初のゼロショットマルチモーダル高忠実度3Dヒューマンテクスチャ生成モデルである。 ArTicuLated humAn textureSは,最大解像度(1024×1024)のヒトテクスチャデータセットである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:02:07 GMT)
Knowledge Graph Large Language Model (KG-LLM) for Link Prediction [41.5]
本稿では,知識グラフにおけるマルチホップリンク予測を強化するために,知識グラフ大言語モデルフレームワーク(KG-LLM)を提案する。知識グラフをチェーン・オブ・シークレットのプロンプトに変換することで、我々のフレームワークは、エンティティの潜在表現とその相互関係を識別し、学習するように設計されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:08:02 GMT)
Hypergraph-MLP: Learning on Hypergraphs without Message Passing [41.4]
多くのハイパーグラフニューラルネットワークは、ハイパーグラフ構造上のメッセージパッシングを利用してノード表現学習を強化する。我々は、ハイパーグラフ構造に関する情報を、明示的なメッセージパッシングを伴わずに、トレーニングの監督に組み込む方法を提案する。具体的には,ハイパーグラフ構造化データのための新しい学習フレームワークであるHypergraph-MLPを紹介する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:09:23 GMT)
CrossTune: Black-Box Few-Shot Classification with Label Enhancement [40.9]
ラベル強化型クロスアテンションネットワークであるCrossTuneを導入し,ブラックボックス言語モデルの適応性を即時検索なしで研究する。提案手法は,従来の勾配のないブラックボックスチューニング手法を平均5.7%向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:52:56 GMT)
ERASE: Benchmarking Feature Selection Methods for Deep Recommender Systems [40.8]
本稿では,Deep Recommender Systems(DRS)のためのフェースセレクションのための包括的bEnchmaRkであるERASEについて述べる。 ERASEは11種類の特徴選択手法を徹底的に評価し、従来のアプローチとディープラーニングアプローチの両方をカバーしている。私たちのコードは簡単に再現できる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:49:35 GMT)
FairSIN: Achieving Fairness in Graph Neural Networks through Sensitive Information Neutralization [40.8]
フィルタリングベースの戦略は、いくつかの非感度な特徴情報をフィルタリングする可能性もあり、予測性能と公平性の間の準最適トレードオフにつながると我々は主張する。メッセージパッシング前のノード機能や表現に、F3(Fairness-facilitating Features)を追加して組み込むという、革新的な中立化に基づくパラダイムを紹介します。提案手法をFairSINと命名し,データ中心とモデル中心の両方の観点から,実装のバリエーションを3つ提示する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:22:58 GMT)
KG-Rank: Enhancing Large Language Models for Medical QA with Knowledge Graphs and Ranking Techniques [40.7]
KG-Rankは、医療領域における自由テキスト質問応答(QA)を改善するためのフレームワークである。我々は医療用KGから三つ子を回収し、事実情報を収集する。我々はこれらの三重項の順序を洗練させるためにランク付け手法を適用し、より正確な回答を得ることを目的としている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:48:11 GMT)
Privacy-Preserving Face Recognition Using Trainable Feature Subtraction [40.5]
顔認識はプライバシーの懸念を増している。本稿では,視覚障害と回復障害に対する顔画像保護について検討する。我々は,この手法を新たなプライバシ保護顔認識手法であるMinusFaceに精錬する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:27:52 GMT)
Characteristic AI Agents via Large Language Models [40.1]
本研究は,特有なAIエージェント構築における大規模言語モデルの性能調査に焦点をあてる。 character100''と呼ばれるデータセットがこのベンチマークのために構築されており、ウィキペディアの言語モデルでロールプレイを行う最も訪問者の多い人々で構成されている。実験結果から,LLMの能力向上に向けた潜在的な方向性が明らかにされた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:25:29 GMT)
Accelerating Data Generation for Neural Operators via Krylov Subspace Recycling [40.0]
偏微分方程式(PDE)を解くためのニューラルネットワークの訓練には、かなりの量のラベル付きデータを生成する必要がある。本稿では,これらのシステムの効率を高めるために,SKR(Sorting Krylovcycle)を提案する。 SKRは神経オペレーターのデータ生成を著しく加速し、最大13.9倍のスピードアップを達成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:46:35 GMT)
Accurate and interpretable drug-drug interaction prediction enabled by knowledge subgraph learning [39.7]
本稿では,薬物と薬物の相互作用の潜在的な発見という課題に対処するグラフニューラルネットワークを用いたKnowDDIを提案する。 KnowDDIは、大きなバイオメディカル知識グラフからリッチな近隣情報を適応的に活用することで、薬物表現を強化する。元々のオープンソースツールであるKnowDDIは、さまざまな関連するインタラクション予測タスクにおいて、可能なインタラクションを検出するのに役立ちます。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:38:16 GMT)
Spectral Multiplexing of Rare-earth Emitters in a Co-doped Crystalline Membrane [39.6]
ここで、エルビウムエミッタは、ユーロピウムと共ドープした結晶性イットリウムオルソシリケート10ミクロンの膜を含むファブリペロ共振器で研究される。共ドーピングはエミッタ周波数の不均一分布を調整し、360キュービット以上の高忠実度スペクトル多重化を可能にする。将来の研究は、これを長寿命の核スピン記憶と組み合わせることで、研究された共ドープ膜を量子リピータと分散量子コンピュータのための有望なプラットフォームにするかもしれない。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:10:25 GMT)
Comparing Explanation Faithfulness between Multilingual and Monolingual Fine-tuned Language Models [39.5]
FA忠実度は多言語モデルと単言語モデルの間で異なることを示す。多言語モデルが大きいほど、FAが忠実でないほど、そのモノリンガルモデルと比較される。さらに分析したところ、忠実さの相違はモデルトークン化器の違いによって引き起こされる可能性が示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:07:22 GMT)
SAMAug: Point Prompt Augmentation for Segment Anything Model [39.3]
本稿では,Segment Anything Model(SAM)のための新しい視覚点拡張法であるSAMAugを紹介する。 SAMAugは、SAMに対するユーザの意図に関する情報を提供するために、拡張ポイントプロンプトを生成する。実験結果から,SAMAugはSAMのセグメンテーション結果を,特に最大距離と塩分濃度を用いて向上させることができることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:27:37 GMT)
Mitigating Gradient Bias in Multi-objective Learning: A Provably Convergent Stochastic Approach [38.8]
我々は多目的勾配最適化のための多目的補正法(MoCo)を開発した。本手法の特長は,非公正勾配を増大させることなく収束を保証できる点である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:47:43 GMT)
VOLTA: Improving Generative Diversity by Variational Mutual Information Maximizing Autoencoder [38.4]
VOLTAは,VAEでトランスフォーマーをブリッジすることで,遺伝子多様性を高めるフレームワークである。 6つのデータセット上で2種類のトランスフォーマーを用いた総合的な実験を行い、生成品質を維持しながら生成の多様性を著しく向上させることができることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:30:03 GMT)
RankPrompt: Step-by-Step Comparisons Make Language Models Better Reasoners [38.3]
大規模言語モデル(LLM)の新しいプロンプト手法である RankPrompt を導入する。 RankPromptはランキング問題を、さまざまなレスポンスの一連の比較に分解する。実験の結果, RankPrompt は ChatGPT と GPT-4 の推論性能を大幅に向上し,最大13% の改善が得られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:34:18 GMT)
LLMs-based Few-Shot Disease Predictions using EHR: A Novel Approach Combining Predictive Agent Reasoning and Critical Agent Instruction [38.1]
本研究では,構造化患者訪問データを自然言語物語に変換するための大規模言語モデルの適用可能性について検討する。様々なERH予測指向のプロンプト戦略を用いて,LLMのゼロショット性能と少数ショット性能を評価した。提案手法を用いることで,従来のERHによる疾患予測の教師付き学習法と比較して,LLMの精度は極めて低いことが示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:10:13 GMT)
Social-Aware Clustered Federated Learning with Customized Privacy Preservation [38.0]
本稿では,ソーシャル・アウェア・クラスタ・フェデレーション・ラーニングの新たな手法を提案する。モデル更新をソーシャルグループに混ぜ合わせることで、敵はソーシャル層を組み合わせた結果のみを盗むことができるが、個人のプライバシーを盗むことはできない。 FacebookネットワークとMNIST/CIFAR-10データセットの実験は、SCFLが学習ユーティリティを効果的に強化し、ユーザの支払いを改善し、カスタマイズ可能なプライバシ保護を強制できることを検証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:51:32 GMT)
Learning Multi-Pattern Normalities in the Frequency Domain for Efficient Time Series Anomaly Detection [38.0]
時系列異常検出のための周波数領域における多重正規パターン対応異常検出手法を提案する。 i) 統一モデルで多様な正規パターンを扱うのに優れたパターン抽出機構、(ii) 時間領域における短期異常を増幅し周波数領域における異常の再構築を妨げる双対的畳み込み機構、(iii) 周波数領域のスパーシリティと並列性を活用してモデル効率を向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:32:56 GMT)
WHAC: World-grounded Humans and Cameras [37.9]
我々は,表現的パラメトリック人間モデル(SMPL-X)と対応するカメラのポーズを共同で再現することを目指している。 WHACと呼ばれる新しいフレームワークを導入し、世界規模で表現された人間のポーズと形状の推定を容易にする。我々は、正確に注釈付けされた人間とカメラを含む新しい合成データセットWHAC-A-Moleを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:58:02 GMT)
Efficient Diffusion-Driven Corruption Editor for Test-Time Adaptation [37.7]
テスト時間適応(TTA)は、テスト時間中に発生する予期せぬ分散シフトに対処する。画像復元のための拡散ベースの最近のTTAアプローチには、画像レベルの更新が含まれる。遅延拡散モデル(LDM)に基づく画像編集モデルを利用した新しいTTA手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:26:55 GMT)
SmartRefine: A Scenario-Adaptive Refinement Framework for Efficient Motion Prediction [37.5]
我々は,最小限の計算量で予測を洗練するために,SmartRefineというシナリオ適応型改良戦略を導入する。 SmartRefineは汎用的で柔軟なアプローチとして設計されており、ほとんどの最先端のモーション予測モデルにシームレスに統合することができる。 QCNetにSmartRefineを追加することで、提出時にArgoverse 2のリーダーボード(シングルエージェントトラック)で、すべてのアンサンブルフリーの作品をパフォーマンスします。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:04:35 GMT)
Instructing Large Language Models to Identify and Ignore Irrelevant Conditions [37.5]
数学語問題(MWP)の解法は、しばしば無関係な条件を含む与えられた問題記述に基づいて推論経路を生成する必要がある。既存のチェーン・オブ・シント (CoT) はMWPを解くために大規模言語モデル (LLM) の多段階推論能力を引き出す手法である。我々は,LLMに無関係な条件を識別・無視するように指示する,I$3$Cという新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:07:28 GMT)
DDSB: An Unsupervised and Training-free Method for Phase Detection in Echocardiography [37.3]
本研究では,End-Diastolic (ED) フレームとEnd-Systolic (ES) フレームを識別するための教師なしおよびトレーニング不要な手法を提案する。アンカー点の同定と方向変形解析により,初期セグメンテーション画像の精度への依存性を効果的に低減する。本手法は,学習モデルと同等の精度を,関連する欠点を伴わずに達成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:51:01 GMT)
Sample Complexity of Offline Distributionally Robust Linear Markov Decision Processes [37.2]
オフライン強化学習(RL) 本稿では、オフラインデータを用いた全変動距離を特徴とする不確実性を伴う分布安定線形マルコフ決定過程(MDP)のサンプル複雑性について考察する。我々は悲観的なモデルベースアルゴリズムを開発し、そのサンプル複雑性を最小限のデータカバレッジ仮定の下で確立し、少なくとも$tildeO(d)$で先行技術より優れている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:48:42 GMT)
DTOR: Decision Tree Outlier Regressor to explain anomalies [37.0]
Decision Tree Outlier Regressor (DTOR) は、個々のデータポイントに対してルールベースの説明を生成する技術である。本結果は,多数の特徴を持つデータセットにおいても,DTORの堅牢性を示すものである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:58:00 GMT)
Vid2Robot: End-to-end Video-conditioned Policy Learning with Cross-Attention Transformers [36.5]
ロボットのための新しいエンドツーエンドビデオベース学習フレームワークであるVid2Robotを紹介した。 Vid2Robotは、操作タスクと現在の視覚的観察のデモビデオから、ロボットのアクションを直接生成する。これは、人間のビデオとロボットの軌道の大規模なデータセットに基づいて訓練された統一表現モデルによって達成される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:47:37 GMT)
V2X-DGW: Domain Generalization for Multi-agent Perception under Adverse Weather Conditions [36.3]
気象条件下でのマルチエージェント認識システムにおいて,LiDARに基づく3次元物体検出のための領域一般化手法 V2X-DGW を提案する。クリーンな天候だけでなく、クリーンな天気データのみを学習することで、好適なマルチエージェントのパフォーマンスを確保することを目的としている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:50:51 GMT)
Interpretable User Satisfaction Estimation for Conversational Systems with Large Language Models [36.0]
既成のMLモデルやテキスト埋め込みに基づくアプローチは、一般化可能なパターンの抽出に不足している。 LLMは、埋め込み型アプローチよりも、自然言語の発話から、ユーザの満足度を解釈可能なシグナルを抽出できることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:57:07 GMT)
Granger-Causal Hierarchical Skill Discovery [35.1]
強化学習(Reinforcement Learning, RL)は複雑なタスクの学習方針において有望な結果を示してきたが、しばしばサンプル効率の低下と限られた伝達性に悩まされる。このアルゴリズムは、ドメイン内の制御性に着目し、高い制御を許す少数のタスクに依存しないスキルを識別する。また、一般的なRLベンチマークであるBreakoutの変種を用いて、COInSが学習したスキルの伝達性を実証し、標準のRLベースラインと比較してサンプル効率と最終性能を2～3倍改善したことを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:05:21 GMT)
TiC-CLIP: Continual Training of CLIP Models [35.1]
視覚言語モデルをトレーニングするために,WebスケールのTime-Continual(TiC)ベンチマークを初めて導入する。当社最大のデータセットであるTiC-DataCompには、9年にわたる12.7億のタイムスタンプイメージテキストペアが含まれています。我々は、前回のチェックポイントからトレーニングを継続し、古いデータを再生するシンプルなリハーサルベースのアプローチが、スクラッチからリトレーニングする標準的なプラクティスと比較して、計算を2.5倍に削減することを示した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:17:54 GMT)
HYPO: Hyperspherical Out-of-Distribution Generalization [35.0]
超球面空間におけるドメイン不変表現を確実に学習する新しいフレームワークを提案する。特に,超球面学習アルゴリズムは,クラス内変動とクラス間分離原理によって導かれる。我々は,本手法が競争基準より優れ,優れた性能を発揮することを実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:17:10 GMT)
Non-negative Contrastive Learning [34.9]
深い表現は、ブラックボックス方式で下流タスクに転送する際の有望なパフォーマンスを示している。しかし、解釈可能性の欠如は依然として大きな課題である。解釈可能な特徴を導出するための非負のコントラスト学習を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:30:50 GMT)
Attacks, Defenses and Evaluations for LLM Conversation Safety: A Survey [34.7]
大規模言語モデル(LLM)が会話アプリケーションで一般的なものになった。有害な反応を引き起こすために悪用されるリスクは、深刻な社会的懸念を引き起こしている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:23:20 GMT)
Policy Bifurcation in Safe Reinforcement Learning [34.3]
いくつかのシナリオでは、実行可能なポリシーは不連続または多値であり、不連続な局所最適性の間の補間は必然的に制約違反につながる。我々は,このような現象の発生機構を最初に同定し,安全RLにおける分岐の存在を厳密に証明するためにトポロジカル解析を用いる。本稿では,ガウス混合分布をポリシ出力として利用するマルチモーダルポリシ最適化(MUPO)と呼ばれる安全なRLアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:54:38 GMT)
Contextual Moral Value Alignment Through Context-Based Aggregation [34.2]
文脈アグリゲーションに基づく文脈的道徳的価値アライメントを行うシステムを提案する。提案システムでは, 技術状況と比較して, 人的価値との整合性に優れた結果が得られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:06:53 GMT)
OCTDL: Optical Coherence Tomography Dataset for Image-Based Deep Learning Methods [34.1]
本研究は,2000枚以上の OCT 画像からなるオープンアクセス型 OCT データセット (OCTDL) を提案する。このデータセットは、加齢関連黄斑変性症(AMD)、糖尿病黄斑浮腫(DME)、網膜膜(ERM)、網膜動脈閉塞症(RAO)、網膜静脈閉塞症(RVO)、およびVID(Vitreomacular Interface Disease)患者のOCT記録からなる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:49:01 GMT)
BiLoRA: A Bi-level Optimization Framework for Overfitting-Resilient Low-Rank Adaptation of Large Pre-trained Models [34.1]
BiLoRA はバイレベル最適化 (BLO) に基づく過度に適合する微調整手法である自然言語理解と生成タスクをカバーする10のデータセットでテストしました。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:11:20 GMT)
Vox-Fusion++: Voxel-based Neural Implicit Dense Tracking and Mapping with Multi-maps [34.1]
本稿では,従来の容積融合法とニューラルな暗黙表現をシームレスに融合する,頑健な高密度追跡・マッピングシステムであるVox-Fusion++を紹介する。本システムでは,各ボクセル内のシーンの効率的なエンコーディングと最適化を実現するために,ボクセルをベースとしたニューラル暗黙表面表現を用いる。提案手法は, 様々なシナリオにおいて, 再現性や精度において, 従来の手法よりも優れていた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:21:54 GMT)
PoNQ: a Neural QEM-based Mesh Representation [33.8]
学習可能なメッシュ表現を,局所的な3次元サンプルポイントとその関連する正規値および擬似誤差メトリクス(QEM)を用いて導入する。グローバルメッシュは、局所的な二次誤差の知識を効率的に活用することにより、PoNQから直接導出される。 SDFグリッドからの学習に基づくメッシュ予測により,PoNQの有効性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:15:08 GMT)
P-MapNet: Far-seeing Map Generator Enhanced by both SDMap and HDMap Priors [33.7]
提案するP-MapNetでは、P文字は、モデル性能を改善するために、マッププリエントの導入に重点を置いているという事実を強調している。注意に基づくアーキテクチャは,SDMapスケルトンに適応的に対応し,性能を大幅に向上させる。 P-MapNetは、長い範囲でより大きな改善をもたらす、探究可能なソリューションです。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:54:14 GMT)
TAPTR: Tracking Any Point with Transformers as Detection [33.5]
TRansformer (TAPTR) を用いた任意の点追跡のためのシンプルで強力なフレームワークを提案する。点追跡は物体検出と追跡に非常によく似ているという観測に基づいて,TAPの課題に対処するためにDETRライクなアルゴリズムから設計を借りる。提案フレームワークは,高速な推論速度を持つ様々なTAPデータセットに対して,最先端の性能で高い性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:57:09 GMT)
Iterative Regularization with k-support Norm: An Important Complement to Sparse Recovery [33.3]
本稿では,$k$サポート標準正規化器に基づく新しい反復正規化アルゴリズムIRKSNを提案する。 IRKSNを用いてスパースリカバリ条件を提供し、従来のリカバリ条件と$ell_1$標準正規化器を比較した。また、IRKSNのモデル誤差を定数で早期に停止し、スパースリカバリの標準線形レートを達成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:04:28 GMT)
Decoding Continuous Character-based Language from Non-invasive Brain Recordings [33.1]
本研究では,単心的非侵襲的fMRI記録から連続言語を復号する手法を提案する。文字ベースのデコーダは、固有の文字構造を特徴とする連続言語の意味的再構成のために設計されている。被験者間での単一の試行から連続言語を復号化できることは、非侵襲的な言語脳-コンピュータインタフェースの有望な応用を実証している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:09:20 GMT)
Large, Small or Both: A Novel Data Augmentation Framework Based on Language Models for Debiasing Opinion Summarization [32.8]
現在の意見要約アプローチは、負のテキストの入力から負の要約を生成するのに消極的である。本稿では,大小の言語モデルと大小の言語モデルに基づく新しいデータ拡張フレームワークを提案する。我々のフレームワークは、大きなモデルだけでなく、より経済的にも、感情バイアスを効果的に軽減することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:20:05 GMT)
Magic Fixup: Streamlining Photo Editing by Watching Dynamic Videos [32.7]
本稿では,所定のレイアウトに従うフォトリアリスティックな出力を合成する生成モデルを提案する。本手法は,元の画像から細かな詳細を転送し,その部分の同一性を保持する。簡単なセグメンテーションと粗い2D操作により、ユーザの入力に忠実なフォトリアリスティックな編集を合成できることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:58 GMT)
Do Generated Data Always Help Contrastive Learning? [32.6]
コントラスト学習(CL)は、教師なし視覚表現学習において最も成功したパラダイムの1つである。生成モデル、特に拡散モデルの増加に伴い、実際のデータ分布に近い現実的な画像を生成する能力はよく認識されている。しかし、生成したデータ(DDPMのような優れた拡散モデルからでも)は、コントラスト学習に害を与えることもある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:17:47 GMT)
A Large Collection of Model-generated Contradictory Responses for Consistency-aware Dialogue Systems [32.3]
反応生成モデルの矛盾の大規模なデータセットを初めて構築する。モデル生成矛盾の特性に関する貴重な知見を得る。このデータセットは、データ駆動の矛盾抑制手法の性能を大幅に向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:07:13 GMT)
Functional Bayesian Tucker Decomposition for Continuous-indexed Tensor Data [32.2]
マルチアスペクトデータを扱うために,関数ベイズタッカー分解(FunBaT)を提案する。私たちは、Tuckerコアと潜在関数のグループ間の相互作用として、連続インデックスデータを使用します。高度メッセージパッシング技術に基づく後方拡張性近似のための効率的な推論アルゴリズムを開発した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:39:19 GMT)
Prompt-fused framework for Inductive Logical Query Answering [31.7]
本稿では,Pro-QEという問合せ対応のプロンプトフューズフレームワークを提案する。論理的クエリにおける未知のエンティティの問題に,我々のモデルがうまく対処できることが示される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:30:30 GMT)
Compositional 3D Scene Synthesis with Scene Graph Guided Layout-Shape Generation [31.5]
3Dシーンの合成は、ロボティクス、映画、ビデオゲームといった様々な産業に多様な応用がある。本稿では,シーングラフから現実的で合理的な3Dシーンを生成することを目的とする。統一グラフ畳み込みネットワーク(GCN)により,共同レイアウト・形状分布によって更新されたシーングラフからグラフ特徴を抽出する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:54:48 GMT)
OctreeOcc: Efficient and Multi-Granularity Occupancy Prediction Using Octree Queries [31.1]
OctreeOccは、Octree表現を利用して、3Dで貴重な情報を適応的にキャプチャする革新的な3D占有予測フレームワークである。評価の結果,OctreeOccは占有率予測の最先端手法に勝るだけでなく,計算オーバーヘッドを15%-24%削減できることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:03:18 GMT)
TAGS: Real-time Intrusion Detection with Tag-Propagation-based Provenance Graph Alignment on Streaming Events [31.1]
TAGSはタグプロパゲーションに基づくストリーミングプロファイランスグラフアライメントシステムである。様々なサイバー攻撃をリアルタイムで検出し、調査することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:37:13 GMT)
FedFisher: Leveraging Fisher Information for One-Shot Federated Learning [30.9]
One-Shot FLは、サーバが単一の通信ラウンドでグローバルモデルをトレーニングできるようにすることによって、この問題に対処することを目的とした、新しいパラダイムである。本稿ではFedFisherを提案する。FedFisherは、ローカルクライアントモデルで計算されたフィッシャー情報行列を利用するワンショットFLのための新しいアルゴリズムである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:03:40 GMT)
Towards Lossless ANN-SNN Conversion under Ultra-Low Latency with Dual-Phase Optimization [30.1]
非同期離散イベントで動作するスパイキングニューラルネットワーク(SNN)は、スパース計算によるエネルギー効率の向上を示す。ディープSNNを実装するための一般的なアプローチは、ANNの効率的なトレーニングとSNNの効率的な推論を組み合わせたANN-SNN変換である。本稿では,SNNにおける負または過フロー残留膜電位の誤表現に起因する性能劣化を最初に同定する。そこで我々は,変換誤差を量子化誤差,クリッピング誤差,残留膜電位表現誤差の3つの部分に分解した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:25:14 GMT)
Epistemology of Language Models: Do Language Models Have Holistic Knowledge? [30.0]
本稿では,言語モデルにおける本質的な知識をホリズムの観点から検討する。本研究の目的は,言語モデルの特徴がホリズムと一致しているかどうかを検討することである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:06:10 GMT)
InBox: Recommendation with Knowledge Graph using Interest Box Embedding [29.9]
InBoxと呼ばれる新しい埋め込みモデルを導入する。知識グラフのエンティティや関係はポイントやボックスとして埋め込まれ、ユーザの興味はボックスとしてモデル化される。 InBoxはレコメンデーションタスクにおいてHAKGやKGINのような最先端のメソッドを大幅に上回っている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:34:15 GMT)
Improving Human Sequential Decision-Making with Reinforcement Learning [29.3]
トレースデータから"ベストプラクティス"を抽出できる新しい機械学習アルゴリズムを設計する。我々のアルゴリズムは、労働者の行動と最適な政策によって取られた行動のギャップを最もうまく埋めるヒントを選択する。実験の結果,提案アルゴリズムが生成したチップは人体の性能を著しく向上させることができることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:12:28 GMT)
Bayesian Nonparametrics Meets Data-Driven Robust Optimization [29.2]
機械学習と統計モデルのトレーニングは、しばしばデータ駆動型リスク基準の最適化を伴う。ベイズ的非パラメトリック(ディリクレ過程)理論と、スムーズなあいまいさ-逆選好の最近の決定論的モデルとの知見を組み合わせることで、新しいロバストな基準を提案する。実用的な実装として、よく知られたディリクレプロセスの表現に基づいて、評価基準の抽出可能な近似を提案し、研究する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:46:42 GMT)
Securely Fine-tuning Pre-trained Encoders Against Adversarial Examples [28.9]
本稿では,下流モデルのロバスト性向上を目的とした2段階逆微調整手法を提案する。 Gen-AFは最先端のDAEに対して高い試験精度と堅牢な試験精度を達成できることを実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:45:48 GMT)
GaussianFlow: Splatting Gaussian Dynamics for 4D Content Creation [28.8]
連続するフレーム間の3次元ガウス流と画素速度のダイナミクスを結合する新しい概念であるガウス流を導入する。提案手法は,ガウススプラッティングを用いた4次元動的コンテンツ生成と4次元新規ビュー合成に有効である。提案手法は, 4次元生成と4次元新規ビュー合成の両課題に対して, 最先端の成果を得る。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:22:21 GMT)
Factorized Learning Assisted with Large Language Model for Gloss-free Sign Language Translation [28.6]
グロースフリー手話翻訳(SLT)のための大規模言語モデル(FLa-LLM)を用いた因子学習を提案する。視覚初期化段階では、視覚エンコーダの後に軽量翻訳モデルを用いて、視覚エンコーダを事前訓練する。 LLMの微調整段階では、視覚エンコーダの取得した知識を凍結し、学習済みのLLMと統合し、LLMの翻訳電位を刺激する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:00:23 GMT)
Towards image compression with perfect realism at ultra-low bitrates [28.5]
当社のモデルPerCoを"知覚圧縮"としてダブし、最先端コーデックを0.1から0.003ビット/ピクセルのレートで比較します。 FID と KID によって測定された現状の視覚的品質によって,本モデルが再構築に繋がることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:54:41 GMT)
O$^2$-Recon: Completing 3D Reconstruction of Occluded Objects in the Scene with a Pre-trained 2D Diffusion Model [28.4]
咬合は、RGB-Dビデオからの3D再構成において一般的な問題であり、しばしばオブジェクトの完全な再構成をブロックする。本研究では,物体の隠れた部分の完全な表面を再構築する2次元拡散に基づくインペインティングモデルを用いて,新しい枠組みを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:37:32 GMT)
Confusing Pair Correction Based on Category Prototype for Domain Adaptation under Noisy Environments [28.0]
ノイズの多い環境下での教師なしのドメイン適応は、従来のドメイン適応よりも困難で実践的です。従来のメソッドは、ノイズの多い環境下で同様の機能を持つクラスを効果的に分類するのに苦労した。混乱するクラスペアの検出と修正を行う新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:29:59 GMT)
Dr3: Ask Large Language Models Not to Give Off-Topic Answers in Open Domain Multi-Hop Question Answering [27.7]
Open Domain Multi-Hop Question Answering (ODMHQA)は自然言語処理(NLP)において重要な役割を果たす大規模言語モデル (LLM) は ODMHQA の解法において顕著な性能を示した。 LLMは、ODMHQAを解こうとするときに、オフトピー的な回答を生成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:00:03 GMT)
Distributed Learning based on 1-Bit Gradient Coding in the Presence of Stragglers [27.3]
ストラグラーの存在下での勾配学習の問題点を考察する。 1ビット勾配符号化(1ビットGCDL)に基づく新しいDL法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:48:40 GMT)
Prompt-Guided Adaptive Model Transformation for Whole Slide Image Classification [27.2]
スライド画像全体(WSI)を分類する一般的な方法として,Multiple Case Learning (MIL)が登場した。本稿では,事前学習したモデルを病理組織学データの特定の特性にシームレスに適応するPrompt-Guided Adaptive Model Transformationフレームワークを提案する。我々は,Camelyon16とTCGA-NSCLCの2つのデータセットに対するアプローチを厳格に評価し,様々なMILモデルに対して大幅な改善を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:23:12 GMT)
LifeTox: Unveiling Implicit Toxicity in Life Advice [27.1]
LifeToxは、幅広いアドバイス検索シナリオ内で暗黙の毒性を特定するために設計されたデータセットである。既存の安全データセットとは異なり、LifeToxはオープンエンドの質問を通じて個人体験から派生したさまざまなコンテキストで構成されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:20:50 GMT)
Diffusion-Driven Self-Supervised Learning for Shape Reconstruction and Pose Estimation [27.0]
本稿では,多目的形状再構成とカテゴリー的ポーズ推定のための拡散駆動型自己教師ネットワークを提案する。提案手法は,最先端の自己監督型カテゴリレベルのベースラインを著しく上回り,完全教師型インスタンスレベルのメソッドやカテゴリレベルのメソッドをはるかに上回っている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:43:27 GMT)
Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM [26.8]
状態空間モデル(SSM)の最近の進歩は、長いシーケンスモデリングにおいてかなりの可能性を秘めている。我々は,SSMを用いた先駆的な動き生成モデルを示す,シンプルで効率的な手法であるモーション・マンバを提案する。提案手法は,HumanML3DおよびKIT-MLデータセットの最大50%のFID改善と最大4倍の高速化を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:05:37 GMT)
MuSHRoom: Multi-Sensor Hybrid Room Dataset for Joint 3D Reconstruction and Novel View Synthesis [26.7]
実世界のマルチセンサーハイブリッドルームデータセット(MuSHRoom)を提案する。我々のデータセットは、エキサイティングな課題を示し、最先端の手法がコスト効率が高く、ノイズの多いデータやデバイスに対して堅牢であることを要求する。共同3Dメッシュ再構成と新しいビュー合成のためのデータセット上で、いくつかの有名なパイプラインをベンチマークする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:05:22 GMT)
The Use of Generative Search Engines for Knowledge Work and Complex Tasks [26.6]
Bing Copilotを使うタスクのタイプと複雑さをBing Searchと比較して分析する。発見は、従来の検索エンジンよりも認知の複雑さが高い知識作業タスクのために、人々が生成検索エンジンを使用していることを示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:17:46 GMT)
Understanding the training of infinitely deep and wide ResNets with Conditional Optimal Transport [26.5]
深部ニューラルネットワークの勾配流は遠距離で任意に収束することを示す。これは空間における有限幅の勾配距離の理論に依存する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:34:31 GMT)
PHAnToM: Personality Has An Effect on Theory-of-Mind Reasoning in Large Language Models [25.7]
本研究では,大規模言語モデルにおけるパーソナリティの誘導が,理論・オブ・ミンド(ToM)推論能力にどのように影響するかを検討する。 3種類のToMタスクにおいて,特定の個人性がLLMの推論能力に大きな影響を与えることが判明した。 ToMにおけるパーソナリティプロンプトのばらつきを示すLCMは、パーソナリティテストにおいてより制御しやすい傾向にある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:42:31 GMT)
Primal Methods for Variational Inequality Problems with Functional Constraints [25.3]
本稿では,関数的制約付き変分不等式問題に対処する手法として,制約付き勾配法(Constrained Gradient Method, CGM)を提案する。滑らかな制約下での単調作用素による変分不等式問題に対するアルゴリズムの非漸近収束解析を確立する。提案アルゴリズムは, 単調・強単調両方の演算子問合せにおいて, プロジェクションに基づく手法の複雑さに適合する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:03:03 GMT)
DecentNeRFs: Decentralized Neural Radiance Fields from Crowdsourced Images [24.9]
ニューラルレイディアンス場(NeRF)は、世界中で撮影された画像を没入型3D視覚体験に変換する可能性を示している。これらのキャプチャーされた視覚データのほとんどは、カメラロールにサイロ化されており、画像には個人情報が含まれている。私たちのアプローチであるDecentNeRFは、分散化されたクラウドソースのNeRFの最初の試みです。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:23:35 GMT)
Quantum Architecture Search with Unsupervised Representation Learning [24.7]
量子アーキテクチャ探索(QAS)のための教師なし表現学習のためのフレームワークを提案する。我々のフレームワークは、多数のラベル付き量子回路の必要性を排除し、予測不要である。その結果,本フレームワークは,検索回数の限られた範囲で,より効率的に高い性能の候補回路を得ることができた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:53:24 GMT)
Generalizability Under Sensor Failure: Tokenization + Transformers Enable More Robust Latent Spaces [24.5]
神経科学の主要な目標は、一般化する神経データ表現を発見することである。最近の研究は、セッションや主題間の一般化に対処し始めているが、センサ障害に対する堅牢性の研究はほとんどない。まず、多数のセッション、被験者、センサーで脳波データを収集し、2つの時系列モデル(EEGNetとTOTEM)を研究します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:54:05 GMT)
Generative Multimodal Entity Linking [24.3]
MEL(Multimodal Entity Linking)は、知識ベースからの参照エンティティへの参照をマルチモーダルコンテキストでマッピングするタスクである。既存のMEL法は主に複雑なマルチモーダル相互作用機構の設計に重点を置いており、すべてのモデルパラメータを微調整する必要がある。大規模言語モデル(LLM)に基づくジェネレーティブマルチモーダルエンティティリンクフレームワークであるGEMELを提案する。モデルパラメータの0.3%しか微調整されていないため、GEMELは2つの確立されたMELデータセットの最先端結果を達成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:30:53 GMT)
PopulAtion Parameter Averaging (PAPA) [24.3]
本稿では,アンサンブルの一般性と重量平均化の効率を結合する手法であるPopulAtion Averaging (PAPA)を提案する。 PAPAは平均化とアンサンブルのパフォーマンスギャップを減らし、モデルの個体数の平均精度を最大0.8%向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:56:07 GMT)
Precise-Physics Driven Text-to-3D Generation [24.2]
高精度な物理駆動型テキスト・ツー・3D生成法であるPhy3DGenを提案する。生成した3次元形状のソリッド・メカニクスを解析することにより,既存のテキスト・ツー・3次元生成手法が生み出す3次元形状が実世界の応用には実用的でないことを明らかにする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:51:38 GMT)
Diversity-Aware Agnostic Ensemble of Sharpness Minimizers [24.2]
深層アンサンブルにおける多様性と平坦性を促進する学習アルゴリズムであるDASHを提案する。我々は,本手法の理論的バックボーンと,アンサンブルの一般化性の向上を示す広範な実証的証拠を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:50:11 GMT)
Improving Generalizability of Extracting Social Determinants of Health Using Large Language Models through Prompt-tuning [24.1]
ファインチューニング戦略に基づく手法は、クロスドメインアプリケーションのための転送学習能力に制限がある。本研究では,LLMを所望の出力に導くための訓練可能なプロンプトを導入し,ソフトプロンプトに基づく学習アーキテクチャを用いた新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:34:33 GMT)
An Aligning and Training Framework for Multimodal Recommendations [24.0]
マルチモーダル・レコメンデーションはユーザーインタラクションを超えて豊かなコンテキストを活用できる既存の手法では、主に多モーダル情報を補助的なものとみなし、それを用いてIDの特徴を学習する。マルチモーダルコンテンツの特徴とIDの特徴の間にはセマンティックなギャップがあり、多モーダル情報を補助として使用すると、ユーザやアイテムの表現が不一致になる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:49:32 GMT)
GenCorres: Consistent Shape Matching via Coupled Implicit-Explicit Shape Generative Models [23.9]
GenCorresは、新しい教師なし関節形状マッチング(JSM)アプローチである。メッシュジェネレータを学習して、非組織的な変形可能な形状コレクションに適合させる。一貫性のある形状のマッチングとペアワイズマッチングを統一する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:42:28 GMT)
Generalizable and Stable Finetuning of Pretrained Language Models on Low-Resource Texts [23.9]
微調整PLMにおける注意誘導重み付けに基づく正規化手法を提案する。本手法は,各ネットワークの重みを,学習可能な注意パラメータによって制御されたタスク固有重みと事前学習重みの混合として表現する。トレーニングデータセットの2つの分割に2段階の最適化フレームワークを導入し、一般化を改善し、オーバーフィッティングに対処する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:21:29 GMT)
Has Approximate Machine Unlearning been evaluated properly? From Auditing to Side Effects [23.9]
機械学習プロバイダーは、機械学習が規制コンプライアンスの究極の保護になることを期待している。重要な重要性にもかかわらず、プライバシコミュニティがマシンアンラーニングの有効性を検証する強力な方法を開発し、実装しているペースは、信じられないほど遅かった。本稿では,ブラックボックス・アンラーニング・オーディショニングのタスクに対して,適切に定義された効果的なメトリクスを導入することで,この欠点に対処することを目的とする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:37:27 GMT)
Low-Trace Adaptation of Zero-shot Self-supervised Blind Image Denoising [23.8]
自己教師型学習と教師型学習のギャップを埋めるために,トレース制約損失関数と低トレース適応型ノイズ2ノイズ(LoTA-N2N)モデルを提案する。本手法は,ゼロショット自己監督型画像復調手法の領域内での最先端性能を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:47:33 GMT)
As Firm As Their Foundations: Can open-sourced foundation models be used to create adversarial examples for downstream tasks? [23.7]
我々は,Webスケールの視覚言語データに基づいて事前学習した基礎モデルが,下流システムを攻撃する基盤となることを示す。本稿では,パッチ表現ミスアライメント(Patch Representation Misalignment)と呼ばれる,単純な敵攻撃戦略を提案する。本研究は,下流システム開発における公共基盤モデルの利用がもたらす安全性のリスクを明らかにするものである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:51:39 GMT)
KorNAT: LLM Alignment Benchmark for Korean Social Values and Common Knowledge [23.2]
KorNATは韓国と国家の整合性を測定する最初のベンチマークである。社会価値データセットについて,6,174人の韓国人参加者を対象とした大規模調査から,基礎的真理ラベルを得た。共通知識データセットについて,韓国の教科書とGED参照資料に基づくサンプルを構築した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:00:56 GMT)
Sim2Real in Reconstructive Spectroscopy: Deep Learning with Augmented Device-Informed Data Simulation [23.2]
本研究は、再構成分光におけるスペクトル信号再構成のためのディープラーニングフレームワークであるSim2Realを提案する。これは、デバイスインフォームド・シミュレートされたデータのみをトレーニングに利用できる極端な設定の下で、現実世界のスペクトル信号を再構築するという課題に焦点を当てている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:58:14 GMT)
Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs [23.2]
ゼロショット認識のためのMPVR(Meta-Prompting for Visual Recognition)を提案する。 MPVRは様々なカテゴリ固有のプロンプトを自動生成し、強いゼロショット分類器を生成する。例えば、MPVRは、CLIPに対するゼロショット認識の改善を、最大19.8%と18.2%(平均20データセットで5.0%と4.5%)で取得する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:28:27 GMT)
FlowerFormer: Empowering Neural Architecture Encoding using a Flow-aware Graph Transformer [23.0]
本稿では,ニューラルネットワーク内に情報フローを組み込んだ強力なグラフトランスフォーマーであるFlowerFormerを紹介する。本研究では,既存のニューラルエンコーディング法よりもFlowerFormerの方が優れていることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:21:10 GMT)
DermSynth3D: Synthesis of in-the-wild Annotated Dermatology Images [22.5]
本稿では皮膚疾患パターンを3次元テクスチャメッシュにブレンドするDerm Synth3Dという新しいフレームワークを提案する。筆者らの手法は,ブレンディングとレンダリングを制約するトップダウンのルールに固執し,線内取得を模倣した皮膚条件の2次元画像を生成する。 Derm Synth3Dは、さまざまな皮膚科のタスクのためのカスタムデータセットを作成することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:42:14 GMT)
Neural Parameter Regression for Explicit Representations of PDE Solution Operators [22.4]
偏微分方程式(PDE)の解演算子を学習するための新しいフレームワークであるニューラル回帰(NPR)を導入する。 NPRは、ニューラルネットワーク(NN)パラメータを回帰するために、Physics-Informed Neural Network (PINN, Raissi et al., 2021) 技術を使用している。このフレームワークは、新しい初期条件と境界条件に顕著な適応性を示し、高速な微調整と推論を可能にした。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:30:56 GMT)
Inter- and intra-uncertainty based feature aggregation model for semi-supervised histopathology image segmentation [22.0]
学生モデルにおける階層的予測の不確実性(不確実性)と画像予測不確実性(不確実性)は,既存の手法では十分に活用されていない。本研究では,教師・学生アーキテクチャにおける不整合度と不整合度を計測・制約する新しい不整合正規化手法を提案する。また,セグメンテーションモデルとして擬似マスク誘導特徴集約(PG-FANet)を用いた2段階ネットワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:32:21 GMT)
Multispectral Image Restoration by Generalized Opponent Transformation Total Variation [22.0]
一般化対向変換領域における新しい多スペクトル全変分正規化を提案し,開発する。一般化対向変換総変分法(GOTTV)の正則化とそれに対応する多スペクトル画像復元の最適化式について検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:34:44 GMT)
XPose: eXplainable Human Pose Estimation [21.7]
XPoseは、説明可能なAI(XAI)の原則をポーズ推定に組み込んだフレームワークである。 Group Shapley Value(GSV)は、キーポイントを依存性に基づいてクラスタに編成する。 GSVは、キーポイントのShapley値を慎重に計算する一方、クラスタ間キーポイントについては、より包括的なグループレベルの評価を選択する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:29:34 GMT)
Safer Digital Intimacy For Sex Workers And Beyond: A Technical Research Agenda [21.7]
多くの人は、セックスワーカー、クライアント、親密なコンテンツをレクリエーションに作り、共有する人々といったデジタル親密さに従事しています。この近親相姦によって、スティグマによって悪化する、重大なセキュリティとプライバシーのリスクがもたらされる。本稿では、より安全なデジタル親密性のための商用デジタル親密性脅威モデルと10の研究方向について述べる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:47:57 GMT)
Selective Domain-Invariant Feature for Generalizable Deepfake Detection [21.7]
本稿では,コンテンツの特徴やスタイルを融合させることにより,顔の偽造に対する感受性を低下させる新しいフレームワークを提案する。既存のベンチマークと提案における質的および定量的な結果の両方が、我々のアプローチの有効性を示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:09:19 GMT)
The Training Process of Many Deep Networks Explores the Same Low-Dimensional Manifold [21.4]
我々は,訓練中の深層ネットワーク予測の軌跡を解析するための情報幾何学的手法を開発した。異なるアーキテクチャを持つネットワークは区別可能な軌跡に従うが、他の要因は最小限の影響を持つ。より大きなネットワークは、より小さなネットワークと同様の多様体に沿って訓練し、予測空間の非常に異なる部分のネットワークは、同様の多様体に沿って解に収束する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:51:12 GMT)
Evolutionary Optimization of Model Merging Recipes [21.4]
本稿では、強力な基礎モデルの作成を自動化するための進化的アルゴリズムの新たな応用について述べる。本稿では,様々なオープンソースモデルの効果的な組み合わせを自動的に発見することで,制限を克服する進化的アプローチを提案する。この研究は、新しい最先端のモデルをオープンソースコミュニティに提供し、また、自動化されたモデル構成のための新しいパラダイムも導入している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:56:53 GMT)
ECAMP: Entity-centered Context-aware Medical Vision Language Pre-training [21.3]
本稿では,エンティティ中心型医療ビジョン言語事前学習のための新しいフレームワークを提案する。医療報告からエンティティ中心のコンテキストを抽出し、テキストモダリティをより効果的に管理する。提案したマルチスケールコンテキスト融合設計は、粗い画像表現と細かな画像表現の両方のセマンティックな統合も改善する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:01:35 GMT)
MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation [21.2]
本研究では,マンバをベースとした医用画像再構成モデルであるMambaMIRと,そのジェネレーティブ・アドバーサリアル・ネットワーク・モデルであるMambaMIR-GANを紹介する。提案したMambaMIRは,線形複雑性,大域受容場,動的重み付けなどの利点を元のMambaモデルから継承する。高速MRIやSVCTなどの様々な医用画像再構成タスクで行った実験により,MambaMIRとMambaMIR-GANは,最先端の手法と比較して,同等あるいは優れた再建結果が得られることが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:09:37 GMT)
Confidence Self-Calibration for Multi-Label Class-Incremental Learning [21.1]
MLCIL(Multi-Label Class-Incremental Learning)におけるラベルの課題は、トレーニング中に新しいクラスのみをラベル付けする場合に発生する。この問題は、誤って高い信頼度を持つマルチラベル予測による偽陽性エラーの増大につながる。 MLCILのマルチラベル信頼度校正を改良するための信頼性自己校正(CSC)手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:14:52 GMT)
RadarCam-Depth: Radar-Camera Fusion for Depth Estimation with Learned Metric Scale [21.1]
本稿では, 単視点画像とスパース, ノイズの多いレーダー点雲の融合に基づく, 距離密度推定のための新しい手法を提案する。提案手法は,難解なnuScenesデータセットと自己コンパイルしたZJU-4DRadarCamデータセットにおいて,平均絶対誤差(MAE)を25.6%,40.2%削減することにより,最先端のRadar-Camera深度推定法を著しく上回っている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:45:47 GMT)
Improving Visual Quality and Transferability of Adversarial Attacks on Face Recognition Simultaneously with Adversarial Restoration [21.0]
敵回復(AdvRestore)と呼ばれる新たな敵攻撃手法を提案する。顔の復元を前もって活用することにより、対向顔の視覚的品質と転写性の両方を向上させる。提案手法の有効性を実験的に検証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:05:26 GMT)
Automatic Summarization of Doctor-Patient Encounter Dialogues Using Large Language Model through Prompt Tuning [21.0]
本研究では,ジェネレーティブ・大規模言語モデル(LLM)を用いた医師と患者との対話を要約するアプローチを提案する。我々は, 臨床テキストを要約するために, 生成LDMを指示するプロンプトチューニングアルゴリズムを開発した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:37:05 GMT)
TransformMix: Learning Transformation and Mixing Strategies from Data [20.8]
我々は、データからより良い変換と拡張戦略を混合するための自動アプローチであるTransformMixを提案する。本稿では,トランスフォーメーション学習,分類,オブジェクト検出,知識蒸留設定におけるTransformMixの有効性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:36:41 GMT)
PostoMETRO: Pose Token Enhanced Mesh Transformer for Robust 3D Human Mesh Recovery [20.8]
本稿では,2次元ポーズ表現をトークン的に変換器に統合するPostoMETROを提案する。閉塞のような極端なシナリオの下でも、より正確な3D座標を生成することができます。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:18:25 GMT)
Mask-Based Modeling for Neural Radiance Fields [20.7]
本研究では,マスクベースモデリングにより3次元暗黙表現学習を大幅に改善できることを明らかにする。 MRVM-NeRFは,各光線に沿った部分的マスキング特徴から,シーンの完全な表現を予測するための自己教師付き事前学習対象である。この事前学習目標により、MRVM-NeRFは、幾何学的先行として異なる点とビュー間の相関をよりよく利用することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:28:46 GMT)
Gate-Compatible Circuit Quantum Electrodynamics in a Three-Dimensional Cavity Architecture [20.6]
3次元マイクロ波キャビティを用いたゲート可変ハイブリッドデバイスの試作手法を提案する。 InAs-Alナノワイヤジョセフソン接合を用いたハイブリッドデバイスを用いて,この設計を検証する。ゲート可変キャビティシフトと2トーン量子ビット分光を実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:50:07 GMT)
Uncertainty-Aware Adapter: Adapting Segment Anything Model (SAM) for Ambiguous Medical Image Segmentation [20.6]
Segment Anything Model (SAM) は自然画像のセグメンテーションにおいて大きな成功を収めた。自然画像とは異なり、医療画像の多くの組織や病変はぼやけており、曖昧である可能性がある。本研究では,不確実性を認識した医療画像のセグメンテーションのためにSAMを効率よく微調整するUncertainty-aware Adapterという新しいモジュールを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:54:43 GMT)
Evaluating Large Language Models as Generative User Simulators for Conversational Recommendation [20.2]
本稿では,言語モデルが対話的推薦において人間の行動を正確にエミュレートできる程度を測定するための新しいプロトコルを提案する。これらのタスクは、人間の行動から言語モデルの逸脱を効果的に明らかにし、モデル選択と促進戦略による逸脱を減らす方法についての洞察を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:35:40 GMT)
Sebastian, Basti, Wastl?! Recognizing Named Entities in Bavarian Dialectal Data [19.9]
本稿では,バイエルン語ウィキペディアの記事(bar-wiki)とつぶやき(bar-tweet)に注釈付き161Kトークンを付加したドイツ語の方言NERデータセットであるBarNERを紹介する。バイエルン方言は、語彙分布、構文構成、実体情報において標準ドイツ語とは異なる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:12:54 GMT)
ChatASU: Evoking LLM's Reflexion to Truly Understand Aspect Sentiment in Dialogues [19.8]
本稿では、対話シナリオにおけるアスペクト感情を理解するLLMの能力を探求する、Chat-based Aspect Sentiment Understanding (ChatASU)タスクを提案する。具体的には,ChatASUのバックボーンとしてChatGLMを用いた信頼自己回帰アプローチ(TSA)を提案する。具体的には、このTSAは、ACRタスクを補助タスクとして扱い、主要なASUタスクの性能を高める。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:53:27 GMT)
Just Shift It: Test-Time Prototype Shifting for Zero-Shot Generalization with Vision-Language Models [19.7]
Test-Time Prototype Shifting (TPS)は、未ラベルのテスト入力を使用したデータセットのテストに視覚言語モデルを適用するために設計された先駆的なアプローチである。 TPSは、その後の予測のために最適化不要なプロトタイプの再利用を促進するだけでなく、プロンプトエンジニアリングにおける現在の進歩とシームレスに統合することを可能にする。我々のフレームワークの特筆すべき点は、従来のテキストプロンプトチューニング手法と比較して、メモリと計算要求が大幅に削減されていることである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:54:34 GMT)
PGA: Personalizing Grasping Agents with Single Human-Robot Interaction [19.6]
LCRG(Language-Conditioned Robotic Grasping)は、自然言語の指示に基づいてオブジェクトを理解・把握するロボットを開発することを目的としている。タスクシナリオのGraspMineと、個人オブジェクトのピンポインティングと把握を目的とした新しいデータセットを導入する。提案手法であるPersonalized Grasping Agent (PGA)は,ユーザの環境のラベルのない画像データを活用することでGraspMineに対処する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:09:12 GMT)
WoVoGen: World Volume-aware Diffusion for Controllable Multi-camera Driving Scene Generation [19.5]
ワールドボリューム対応マルチカメラ駆動シーンジェネレータ(WoVoGen)を提案する。 WoVoGenは、4Dワールドボリュームをビデオ生成の基礎要素として利用するように設計されている。本モデルでは,車載制御シーケンスに基づく将来の4次元時空間容積を想定するフェーズと,マルチカメラビデオを生成するフェーズの2つのフェーズで運用する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:33:17 GMT)
Jetfire: Efficient and Accurate Transformer Pretraining with INT8 Data Flow and Per-Block Quantization [19.4]
ジェットファイア(Jetfire)は、変圧器に特化した、効率的かつ正確なINT8訓練方法である。本手法では,FP16ベースラインと比較して,エンドツーエンドのトレーニング速度が1.42倍,メモリが1.49倍に向上する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:09:11 GMT)
One-Shot Strategic Classification Under Unknown Costs [19.4]
戦略的分類の目標は、戦略的入力に対して堅牢な決定ルールを学ぶことである。広範囲のコストに対して、ユーザコスト関数の小さな誤推定でさえ、最悪の場合、自明な精度を伴う可能性があることを示す。我々の理論応答は、戦略応答、特に双対ノルム正規化の値から生じる重要な構造を明らかにする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:41:35 GMT)
Interactive Continual Learning: Fast and Slow Thinking [19.3]
本稿では,対話型連続学習フレームワークを提案する。 System1におけるメモリ検索を改善するために,von Mises-Fisher(vMF)分布に基づくCL-vMF機構を導入する。提案したICLの包括的評価は,既存の手法と比較して,忘れられ,優れた性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:19:52 GMT)
Offline Imitation of Badminton Player Behavior via Experiential Contexts and Brownian Motion [19.2]
RallyNetは、バドミントンプレーヤーの振る舞いに対する階層的なオフライン模倣学習モデルである。我々はRallyNetを世界最大規模のバドミントンデータセットで広く検証する。その結果、オフラインの模倣学習法や最先端のターンベースアプローチよりもRallyNetの方が優れていることが明らかになった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:34:23 GMT)
TrojFSP: Trojan Insertion in Few-shot Prompt Tuning [19.2]
トロイの木馬攻撃のような、いくつかのデータサンプルの迅速なチューニングに関するセキュリティ問題は、十分に研究されていない。本手法は, 汚染試料数の等化を目的としたテクスタイトターゲットクラスシンク (TC-Shrink) 技術を開発した。また, トリガー刺激による毒トロイの木馬の注意力を高めるために, テキストトロイジャン・トロイガー注意機能を導入した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:56:14 GMT)
Addressing Source Scale Bias via Image Warping for Domain Adaptation [19.1]
視覚認識においては、実際のシーンデータセットに固有のオブジェクトと画像サイズ分布の不均衡のため、スケールバイアスが鍵となる課題である。本研究では、適応的な注意処理を用いて、トレーニング中の画像のゆがみによって、正常な対象領域をオーバーサンプリングする。このアプローチでは、トレーニング中に最小限のメモリを追加し、推論時に追加のレイテンシが不要になります。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:19:41 GMT)
MEDBind: Unifying Language and Multimodal Medical Data Embeddings [19.0]
我々は,CXR,ECG,医療用テキストにまたがる共同埋め込みを学習するMEDBind(Medical Electronic patient recorD)を提案する。テキストデータを中央アンカーとして使用すると、MEDBindはトリモダリティバインディングを備え、トップK検索、ゼロショット、少数ショットベンチマークで競合的なパフォーマンスを提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:46:29 GMT)
Selective, Interpretable, and Motion Consistent Privacy Attribute Obfuscation for Action Recognition [18.9]
既存のアプローチは、難読化(obfuscation)によって引き起こされる問題や、解釈可能性の欠如に悩まされることが多い。人間の選択したプライバシーテンプレートは,属性を選択的に隠蔽し,時間的一貫性を誘導する難読化方式である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:17:26 GMT)
DiffPortrait3D: Controllable Diffusion for Zero-Shot Portrait View Synthesis [18.6]
本稿では,DiffPortrait3Dについて述べる。DiffPortrait3Dは,3次元一貫性のあるフォトリアリスティック・ノベルビューを合成できる条件拡散モデルである。一つのRGB入力が与えられた場合、我々は、新しいカメラビューから表現された、可塑性だが一貫した顔の詳細を合成することを目指している。我々は、我々の挑戦的インザワイルドとマルチビューのベンチマークにおいて、質的にも定量的にも、最先端の結果を実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:01:59 GMT)
SEVEN: Pruning Transformer Model by Reserving Sentinels [18.5]
シンボリックDescent(SD)は、訓練および微調整トランスフォーマーモデル(TM)の一般的なアプローチである SEVENは私たちによって導入され、特に高感度の重み、すなわち小さな勾配雑音の重みが好まれる。以上の結果から,複数の刈り出しシナリオにおけるSEVENの顕著な改善が得られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:47:43 GMT)
LNPT: Label-free Network Pruning and Training [18.5]
トレーニング前のプルーニングは、ニューラルネットワークをスマートデバイスにデプロイすることを可能にする。我々は,クラウド上の成熟したネットワークが,ラベルのないデータを持つスマートデバイス上でのネットワークプルーニングと学習のオンラインガイダンスを提供するための,新しい学習フレームワーク LNPT を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:49:09 GMT)
Towards Reducing Diagnostic Errors with Interpretable Risk Prediction [18.5]
特定診断のリスクの増大または低下を示す患者EHRデータ中の証拠片をLCMを用いて同定する方法を提案する。私たちの究極の目標は、証拠へのアクセスを増やし、診断エラーを減らすことです。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:43:09 GMT)
DyBluRF: Dynamic Neural Radiance Fields from Blurry Monocular Video [18.4]
動きのぼかしに影響を受ける単眼ビデオから鋭い新しいビューを合成する動的放射場アプローチであるDyBluRFを提案する。入力画像中の動きのぼかしを考慮し、シーン内のカメラ軌跡とオブジェクト離散コサイン変換(DCT)トラジェクトリを同時にキャプチャする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:56:44 GMT)
Solving High Frequency and Multi-Scale PDEs with Gaussian Processes [18.2]
PINNは、しばしば高周波およびマルチスケールのPDEを解決するのに苦労する。我々はこの問題を解決するためにガウス過程(GP)フレームワークを利用する。我々はKroneckerの製品特性と多線型代数を用いて計算効率とスケーラビリティを向上する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:38:12 GMT)
Towards Multimodal In-Context Learning for Vision & Language Models [17.9]
本研究では、ICL命令に従うための最先端のVLMの機能を解析する。大規模な混合モダリティ事前訓練を受けたモデルでさえも、少数ショット(ICL)のデモンストレーションを行う際に、インターリーブ画像とテキスト情報のアンダーパフォーマンスを利用するように暗黙的にガイドされていることが判明した。我々は、ICLのサポート、方法論、カリキュラムで共通のVLMアライメントフレームワークを拡張するための、シンプルで、驚くほど効果的な戦略を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:53:37 GMT)
Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types [17.8]
ロボット支援給餌(RAF)のための空間的注意モジュールを備えた新しい視覚模倣ネットワークを提案する。本研究では,視覚認識と模倣学習を統合して,ロボットがスクーピング中に多様なシナリオを扱えるようにするためのフレームワークを提案する。 AVIL(adaptive visual mimicion learning, 適応的視覚模倣学習)と呼ばれる我々のアプローチは、異なるボウル構成にまたがる適応性と堅牢性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:40:57 GMT)
Class and Region-Adaptive Constraints for Network Calibration [17.6]
本稿では,異なるカテゴリや対象領域がもたらす固有の課題を考慮したセグメンテーションネットワークのキャリブレーション手法を提案する。手動で最適なペナルティウェイトを見つけることは不可能であり、最適化プロセスを妨げる可能性がある。本稿では,クラスと地域適応制約(CRaC)に基づくアプローチを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:19:57 GMT)
Arithmetic Feature Interaction Is Necessary for Deep Tabular Learning [17.4]
軽度な特徴相互作用を仮定した合成データセットを作成する。本稿では,AMFormerと呼ばれる数値的特徴相互作用を実現する改良型トランスフォーマーアーキテクチャについて検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:55:14 GMT)
BenLLMEval: A Comprehensive Evaluation into the Potentials and Pitfalls of Large Language Models on Bengali NLP [17.4]
大規模言語モデル(LLM)は、NLPにおいて最も重要なブレークスルーの1つである。本稿では,ベンガル語での性能をベンチマークするために,LLMを総合的に評価するBenLLM-Evalを紹介する。実験の結果、ベンガルのNLPタスクではゼロショットLLMは、現在のSOTA微調整モデルよりも性能が向上することが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:11:41 GMT)
Think, Act, and Ask: Open-World Interactive Personalized Robot Navigation [17.3]
Zero-Shot Object Navigation (ZSON)は、エージェントが未知の環境でオープン語彙オブジェクトへナビゲートすることを可能にする。我々は,Zero-shot Interactive Personalized Object Navigation (ZipON)を紹介した。我々は,Large Language Models (LLMs) を用いて,知覚,ナビゲーション,コミュニケーションの異なるモジュールを操作するためのシーケンシャルな決定を行う,Open-woRld Interactive persOnalized Navigation (ORION) と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:32:19 GMT)
IFFNeRF: Initialisation Free and Fast 6DoF pose estimation from a single image and a NeRF model [17.2]
IFFNeRFを導入し、所定の画像の6自由度カメラポーズを推定する。 IFFNeRFは特にリアルタイムに動作するように設計されており、最初のポーズ推定の必要性を排除している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:36:51 GMT)
Aria-NeRF: Multimodal Egocentric View Synthesis [17.1]
ニューラルラジアンス場(NeRFs)にインスパイアされた可変体積線トレーシングに基づく、エゴセントリックなデータから訓練されたリッチでマルチモーダルなシーンモデルの開発における研究の加速を目指す。このデータセットは、RGB画像、アイトラッキングカメラの映像、マイクからの音声記録、気圧計による気圧測定、GPSによる位置座標、デュアル周波数IMUデータセット(1kHzと800Hz)の情報を含む、総合的なセンサデータの収集を提供する。このデータセットで捉えた多様なデータモダリティと現実世界のコンテキストは、人間の行動に対する理解を深め、より没入的でインテリジェントな体験を可能にするための堅牢な基盤となる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:59:03 GMT)
RLingua: Improving Reinforcement Learning Sample Efficiency in Robotic Manipulations With Large Language Models [17.0]
強化学習(Reinforcement Learning, RL)は、様々なタスクを解く能力を示したが、サンプル効率が低いことで悪名高い。 RLinguaは大規模言語モデル(LLM)の内部知識を活用でき、ロボット操作におけるRLの複雑さを軽減できるフレームワークである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:52:09 GMT)
JORA: JAX Tensor-Parallel LoRA Library for Retrieval Augmented Fine-Tuning [16.9]
本稿では,Llama-2モデルのPEFT互換微調整のための新しいフレームワークについて紹介する。我々のフレームワークは、JAXのジャスト・イン・タイム(JIT)コンパイルと、効率的なリソース管理のためにテンソルシャーディングを独自に利用しています。実験では,Hugging Face/DeepSpeed実装を4GPUで実装するのに対して,GPUあたりのVRAMは半分以下であるのに対して,ランタイムでは12倍以上の改善が見られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:19:49 GMT)
The Relative Gaussian Mechanism and its Application to Private Gradient Descent [16.8]
相対的なL2感度仮定では、2つのクエリアウトプット間の距離がノルムに依存する可能性がある。 RGMは自然に出力のノルムを制御する潜在変数に適応することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:49:35 GMT)
Align before Adapt: Leveraging Entity-to-Region Alignments for Generalizable Video Action Recognition [16.8]
本稿では,ビデオ表現学習のための新しいパラダイム"Align before Adapt"(ALT)を提案する。我々は各フレームのエンティティ・ツー・リージョンのアライメントを利用して、領域認識画像の埋め込みをオフラインで構築したテキストコーパスにマッチングすることでアライメントを実現する。 ALTは計算コストを著しく低く保ちながら、競争性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:17:50 GMT)
What Does Evaluation of Explainable Artificial Intelligence Actually Tell Us? A Case for Compositional and Contextual Validation of XAI Building Blocks [16.8]
本稿では,説明可能な人工知能システムのためのきめ細かい検証フレームワークを提案する。技術的ビルディングブロック,ユーザによる説明的成果物,ソーシャルコミュニケーションプロトコルといった,モジュール構造の本質を認識します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:45:34 GMT)
Topological Representations of Heterogeneous Learning Dynamics of Recurrent Spiking Neural Networks [16.6]
スパイキングニューラルネットワーク(SNN)は神経科学と人工知能において重要なパラダイムとなっている。近年,深層ニューラルネットワークのネットワーク表現について研究が進められている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:37:26 GMT)
3D Semantic MapNet: Building Maps for Multi-Object Re-Identification in 3D [16.4]
具体化ツアーにおける3次元多目的再識別の課題について検討する。本稿では3Dセマンティックマップネットについて,RGB-Dビデオで動作する3Dオブジェクト検出器と,識別可能なオブジェクトマッチングモジュールからなる2段階の再同定モデルを提案する。全体として、3D-SMNetは、各レイアウトのオブジェクトベースのマップを構築し、その後、各ツアーのオブジェクトを再識別するために、差別化可能なマーカを使用する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:01:14 GMT)
VideoBadminton: A Video Dataset for Badminton Action Recognition [16.4]
高品質なバドミントン映像から得られたビデオバドミントンデータセットを紹介する。 VideoBadmintonの導入は、バドミントンアクション認識だけでなく、きめ細かいアクションを認識するためのデータセットも提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:52:06 GMT)
Learning Transferable Time Series Classifier with Cross-Domain Pre-training from Language Model [16.1]
CrossTimeNetは、さまざまなドメインから転送可能な知識を学ぶための、新しいクロスドメインSSL学習フレームワークである。 CrossTimeNetの重要な特徴の1つは、新しく設計された時系列トークン化モジュールである。我々は、様々な時系列分類領域にわたる実世界のシナリオにおいて広範な実験を行う。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:32:47 GMT)
D-Cubed: Latent Diffusion Trajectory Optimisation for Dexterous Deformable Manipulation [15.7]
D-Cubedは、タスクに依存しないプレイデータセットからトレーニングされた潜在拡散モデル(LDM)を用いた、新しい軌道最適化手法である。我々は、D-Cubedが従来の軌道最適化および競争ベースラインアプローチをかなりの差で上回ることを示した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:05:51 GMT)
Pipelined Biomedical Event Extraction Rivaling Joint Learning [15.6]
本稿では,BERT事前学習モデルに基づくn-ary関係抽出手法を提案する。 The GE11 and GE13 corpora of the BioNLP shared task with F1 scores 63.14% and 59.40%。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:52:58 GMT)
INSIGHT: End-to-End Neuro-Symbolic Visual Reinforcement Learning with Language Explanations [15.5]
構造化状態とシンボルポリシを同時に学習できるフレームワークを提案する。 9つのAtariタスクの実験では,既存のNSRL法よりもかなりの性能向上を示した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:21:20 GMT)
Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs [15.5]
本稿では,大規模言語モデル (LLM) から視覚言語モデル (VLM) へ機能を移行する手法を提案する。最近導入されたChartQAでは、citetchen2023pali3によるPaLI3-5B VLMに適用すると、最先端の性能が得られる。我々のモデルは、citethieh2023蒸留によって導入されたマルチタスク損失を用いて微調整される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:03:07 GMT)
Towards Interpretable Hate Speech Detection using Large Language Model-extracted Rationales [15.5]
ソーシャルメディアプラットフォームは、ユーザーが対人的な議論を行い、意見を述べるための重要な場である。ヘイトスピーチのインスタンスを自動的に識別し、フラグを付ける必要がある。本稿では,現在最先端の大規模言語モデル (LLM) を用いて,入力テキストから有理形の特徴を抽出することを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:22:35 GMT)
NetBench: A Large-Scale and Comprehensive Network Traffic Benchmark Dataset for Foundation Models [15.5]
ネットワークトラフィック(ネットワークトラフィック、英: network traffic)は、インターネット上のコンピュータやサイバー物理システム間のパケットの形で送信されるデータ量である。我々は,ネットワークトラフィック分類と生成タスクの両方において,機械学習モデル,特に基礎モデルを評価するための大規模かつ包括的なベンチマークデータセットであるNetBenchを紹介した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:36:53 GMT)
Self-generated Replay Memories for Continual Neural Machine Translation [15.3]
本稿では,ニューラルマシン翻訳システムを継続的に学習するための新しい手法を提案する。異なる言語からなる経験の流れを効果的に学習する方法を示す。我々は,トレーニングデータの明示的な記憶を必要とせずに,破滅的な忘れ込みを防止できることを実証的に実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:59:54 GMT)
E-DoH: Elegantly Detecting the Depths of Open DoH Service on the Internet [15.2]
エレガントで効率的なDoHサービス検出のためのE-DoH法を提案する。提案手法は, 時間効率が80%向上し, 検出作業の完了には4%～20%のトラフィック量しか必要としない。ワイルド検出では46kのDoHサービスが発見されました。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:19:02 GMT)
AdaptSFL: Adaptive Split Federated Learning in Resource-constrained Edge Networks [15.2]
Split Federated Learning(SFL)は、モデルのパーティショニングを通じて、最初のトレーニングワークロードをサーバにfloadする、有望なソリューションである。本稿では,資源制約付きエッジコンピューティングシステムにおいて,SFLを高速化するための新しいリソース適応型SFLフレームワークであるAdaptSFLを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:05:24 GMT)
Finding the Missing Data: A BERT-inspired Approach Against Package Loss in Wireless Sensing [15.0]
CSI回復のための変換器(BERT)からの双方向表現に基づく深層学習モデルを提案する。 CSI-BERTは、追加のデータを必要とせずに、ターゲットデータセット上で自己管理的な方法でトレーニングすることができる。実験の結果,CSI-BERTは従来の手法に比べて誤り率と速度が低いことがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:16:52 GMT)
Designing Informative Metrics for Few-Shot Example Selection [15.0]
本稿では,複雑性に基づく逐次タギングタスクのプロンプト選択手法を提案する。このアプローチは、サンプルの選択専用のモデルのトレーニングを避ける。文レベルと単語レベルの両方のメトリクスを用いて、例の複雑さと検討中の(テスト)文とを一致させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:51:09 GMT)
Moment Matching Denoising Gibbs Sampling [14.8]
エネルギーベースモデル(EBM)は、複雑なデータ分散をモデル化するための汎用的なフレームワークを提供する。スケーラブルなEMMトレーニングのための広く使われているDenoising Score Matching (DSM) 法は、矛盾の問題に悩まされている。モーメントマッチングを用いた効率的なサンプリングフレームワーク(pseudo)-Gibbsサンプリングを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:54:43 GMT)
Prodigy: An Expeditiously Adaptive Parameter-Free Learner [14.6]
Prodigyは、学習率を最適に設定するために必要な解からD$までの距離を確実に推定するアルゴリズムである。実験結果から,本手法はD-Adaptationより優れ,手書きAdamに近い精度で精度が向上することがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:01:06 GMT)
Evaluating Emerging AI/ML Accelerators: IPU, RDU, and NVIDIA/AMD GPUs [14.4]
Graphcore Intelligence Processing Unit (IPU)、Sambanova Reconfigurable Dataflow Unit (RDU)、拡張GPUプラットフォームについてレビューする。この研究は、これらの商用AI/MLアクセラレータの予備評価と比較を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:31:52 GMT)
Deep learning with noisy labels in medical prediction problems: a scoping review [14.3]
本研究の目的は,深層学習に基づく医療予測問題における騒音管理のラベル付けを包括的に検討することである。 2016年から2023年の間に、合計60の論文が包括的基準を満たした。医療研究の標準要素としてラベルノイズを検討することを推奨する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:24:00 GMT)
EAS-SNN: End-to-End Adaptive Sampling and Representation for Event-based Detection with Recurrent Spiking Neural Networks [14.0]
スパイキングニューラルネットワーク(SNN)は、スパーススパイク通信を通じてイベント駆動の操作を行う。本稿では,Residual potential Dropout (RPD) と Spike-Aware Training (SAT) を導入する。提案手法は,Gen1データセットの4.4%のmAP改善を実現し,パラメータの38%削減と3つの時間ステップを要した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:34:11 GMT)
Total Disentanglement of Font Images into Style and Character Class Features [14.0]
トータル・ディアンタングメント(Total Disentanglement)は、各フォントイメージを分解するニューラルネットワークベースの手法である。同じフォント内のすべてのA'-Z'画像から共通スタイルの特徴を抽出するために、シンプルだが注意深いトレーニング手順を使用する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:50:13 GMT)
Learning-guided iterated local search for the minmax multiple traveling salesman problem [13.9]
本稿では, ミンマックス多旅行セールスマン問題に対する, 傾き駆動型局所探索手法を提案する。提案アルゴリズムは,ソリューションの品質と実行時間の観点から,優れた結果が得られることを示す。特に、32の既知の結果が新たに達成され、35の他のインスタンスで最もよく知られた結果と一致している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:57:10 GMT)
Automated Data Curation for Robust Language Model Fine-Tuning [13.8]
本稿では,データセットのチューニングを行うための自動データキュレーションパイプライン CLEAR を提案する。 CLEARは、どのトレーニングデータが低品質であるかを見積もる。実験の結果、CLEARは多くのデータセットやモデルにまたがって微調整されたモデルの性能を一貫して改善していることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:44:45 GMT)
Differentiable Euler Characteristic Transforms for Shape Classification [13.6]
オイラー特性変換(ECT)は、形状とグラフの幾何学的特徴と位相的特徴を組み合わせた強力な表現であることが証明されている。我々は,ECTをエンドツーエンドで学習できる新しい計算層を開発した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:52:42 GMT)
Listenable Maps for Audio Classifiers [13.6]
本稿では,忠実で聞きやすい解釈を生成するポストホック解釈法であるリスナブル・マップ・フォー・オーディオ(L-MAC)を紹介する。 L-MACは、事前訓練された分類器の上のデコーダを使用して、入力オーディオの関連部分をハイライトするバイナリマスクを生成する。 L-MACは複数の勾配法やマスキング法よりも忠実な解釈を一貫して生成することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:32:48 GMT)
A Pre-trained Data Deduplication Model based on Active Learning [13.5]
汚れたデータ"問題は、ビッグデータの効果的な適用を著しく制限することができる。本研究では,能動学習に基づく事前学習型重複解法モデルを提案する。提案モデルでは、重複データ識別のための従来のSOTA(State-of-the-art)よりも優れている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:31:59 GMT)
DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks [13.4]
本稿では,困難条件下で頑健なマッチングを実現するために,グラフニューラルネットワークに基づくスパース特徴マッチングネットワークを提案する。我々は、キーポイント表現を最先端の機能マッチングネットワークとして強化するために、グラフエッジ上での注目集約という同様の手法を用いる。動作対象のキーポイントを排除したネットワークの性能は,最新の特徴マッチングネットワークと比較して,一連の実験により向上した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:12:00 GMT)
ScanTalk: 3D Talking Heads from Unregistered Scans [13.0]
ScanTalkは、スキャンされたデータを含む任意のトポロジで3D顔をアニメーションできるフレームワークである。我々のアプローチは、固定トポロジ制約を克服するために、DiffusionNetアーキテクチャに依存しています。結果を再生成するためのコードと、事前トレーニングされたモデルが利用可能になります。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:28:12 GMT)
Cross or Wait? Predicting Pedestrian Interaction Outcomes at Unsignalized Crossings [12.8]
我々は機械学習を用いて歩行者横断決定、横断開始時間(CIT)、横断時間(CD)などの歩行者横断行動を予測する。ロジスティック回帰ベースラインモデルと比較して,提案したニューラルネットワークモデルでは予測精度が4.46%,F1スコアが3.23%向上した。また、線形回帰モデルと比較して、CITとCDの根平均二乗誤差(RMSE)を21.56%、30.14%削減する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:30:26 GMT)
Best of Both Worlds: Hybrid SNN-ANN Architecture for Event-based Optical Flow Estimation [12.6]
非同期イベント駆動型計算でニューラルネットワーク(SNN)をスパイクすることは、イベントストリームから機能を抽出する大きな可能性を秘めている。本稿では,両者の強みを組み合わせた新しいSNN-ANNハイブリッドアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:35:51 GMT)
Unveiling Latent Causal Rules: A Temporal Point Process Approach for Abnormal Event Explanation [12.6]
本稿では,観測事象を説明するために,「if-then」論理規則を探索する自動手法を提案する。我々はこれを達成するために期待最大化(EM)アルゴリズムを用いる。提案手法は,ルールの発見と根本原因の同定の両方において,正確な性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:43:29 GMT)
VL-ICL Bench: The Devil in the Details of Benchmarking Multimodal In-Context Learning [12.5]
大規模言語モデル(LLM)は、創発的な文脈内学習(ICL)を示すことで有名である。本研究では,マルチモーダルインコンテキスト学習のためのベンチマークVL-ICL Benchを提案する。我々は,このベンチマークスイートに対して最先端のVLLMの能力を評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:31:56 GMT)
Bilevel Hypergraph Networks for Multi-Modal Alzheimer's Diagnosis [12.4]
アルツハイマー病の前段階の早期発見は、患者の予後と生活の質を高めるのに不可欠である。最小限のラベルを用いてマルチモーダルデータ間の高次関係を実現するための新しいハイパーグラフフレームワークを提案する。以上の結果から,アルツハイマー病の診断における現在の治療法よりも,我々の枠組みが優れていることが示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:28:03 GMT)
Global-guided Focal Neural Radiance Field for Large-scale Scene Rendering [12.3]
大規模シーンの高忠実なレンダリングを実現するグローバル誘導焦点型ニューラルレイディアンス場(GF-NeRF)を提案する。提案手法は,多種多様な大規模データセットに対して,高忠実で自然なレンダリング結果を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:45:54 GMT)
Towards Plastic and Stable Exemplar-Free Incremental Learning: A Dual-Learner Framework with Cumulative Parameter Averaging [12.2]
In this proposed a Dual-Learner framework with Cumulative。平均化(DLCPA) DLCPA は Task-IL と Class-IL の両方の設定において,最先端の既定ベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:45:53 GMT)
EmoVOCA: Speech-Driven Emotional 3D Talking Heads [12.2]
EmoVOCAと呼ばれる合成データセットを作成するための革新的なデータ駆動手法を提案する。次に,3次元顔,音声ファイル,感情ラベル,強度値を入力として受け入れる感情的3次元音声ヘッドジェネレータを設計,訓練し,顔の表情特性で音声同期唇の動きをアニメーション化することを学ぶ。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:33:26 GMT)
Adaptivity is not helpful for Pauli channel learning [12.1]
このノートは、適応戦略が、絡み合った入力でPauliチャネルを学習し、テストするための追加の利点を提供していないことを示している。まず、一般ノルム$l_p$に対して、絡み合った入力を持つパウリチャネルを学習する際の厳密なクエリ複雑性を確立する。誤差分布のエントロピーを特徴とするPauliチャネルのノイズレベルを推定するクエリの複雑さが$Theta(4n/n)$であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:04:42 GMT)
Super-High-Fidelity Image Compression via Hierarchical-ROI and Adaptive Quantization [12.1]
関心領域(ROI)を利用したMSEモデルと生成モデルを組み合わせる。顔,テキスト,複雑なテクスチャを含む領域の再構成を改善するために,H-ROIを用いて複数の前景領域と1つの背景領域に分割する。また、チャネル次元内における非線形マッピングによる適応量子化を提案し、視覚的品質を維持しながらビットレートを制約する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:19:11 GMT)
Geometric Constraints in Deep Learning Frameworks: A Survey [12.0]
ステレオフォトグラム法はシーン理解の新たな技術である。幾何ベースのフレームワークと深層学習ベースのフレームワークの重複について検討する。本稿では、現代のディープラーニングフレームワークで使用される制約を規定する、一般的な幾何学のための新しい分類法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:41:09 GMT)
Evaluatology: The Science and Engineering of Evaluation [12.0]
本稿では,評価の科学と工学を包含する評価学の分野を正式に紹介することを目的とする。本稿では,様々な分野にまたがって適用可能な概念,用語,理論,方法論を包含して評価するための普遍的な枠組みを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:38:26 GMT)
Topological data analysis on noisy quantum computers [12.0]
トポロジカルデータ解析(TDA)は,高次元データの複雑で価値の高い形状関連要約を抽出する強力な手法である。 TDA計算のための古典的アルゴリズムの計算要求は極端であり、高次特性に対してはすぐに非現実的になる。本稿では,高次元古典データに適用可能なエンドツーエンド量子機械学習アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:41:32 GMT)
Exploiting Optical Flow Guidance for Transformer-Based Video Inpainting [11.8]
本稿では,より効率的かつ効率的な映像インペイントを実現するためのフロー誘導トランス (FGT) を提案する。 FGT++は、既存のビデオインパインティングネットワークよりも優れていると実験的に評価されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:02:28 GMT)
Optimal and Adaptive Non-Stationary Dueling Bandits Under a Generalized Borda Criterion [11.8]
デュエル・バンディットでは、学習者は腕間の好みのフィードバックを受け取り、腕の後悔は勝者アームに対する過度な最適化によって定義される。本研究では,最初の最適で適応的なボルダ動的後悔の上界を確立する。驚くべきことに、非定常的なボルダデュエルバンディットに対する我々の技術は、コンドルセットの勝者設定内でも改善される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:50:55 GMT)
Bypassing LLM Watermarks with Color-Aware Substitutions [11.7]
セルフカラーテストベースの代替(SCTS)は、最初のカラーアウェアによる攻撃である。 SCTSは関連する作業よりも少ない編集数で透かし検出を回避した。我々はSCTSが任意の長さの透かしテキストの透かしを除去できることを理論的にも経験的にも示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:54:39 GMT)
Reflectivity Is All You Need!: Advancing LiDAR Semantic Segmentation [11.7]
本稿では、学習に基づくLiDARセマンティックセマンティックセグメンテーションフレームワークにおいて、校正強度を利用する利点について検討する。本研究は,モデルが強度の校正を学べることによって,性能が向上することを示す。特に, 反射率への変換は, オフロードシナリオの生強度を用いた場合と比較して, 平均対合(mIoU)の平均断面積を4%増加させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:57:03 GMT)
Negative Yields Positive: Unified Dual-Path Adapter for Vision-Language Models [11.5]
双対学習の概念を微調整型視覚言語モデル(VLM)に導入する。本稿では,VLMの正と負の両面からデュアルパス適応を実現するための新しいDualAdapter手法を提案する。実験の結果,提案したDualAdapterは,ショット学習とドメイン一般化の両タスクにおいて,既存の最先端手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:39 GMT)
M2DA: Multi-Modal Fusion Transformer Incorporating Driver Attention for Autonomous Driving [11.4]
自律運転にドライバ注意(M2DA)を組み込んだ多モード核融合トランスを提案する。ドライバーの注意を取り入れることで、自動運転車に人間のようなシーン理解能力を付与し、重要な領域を正確に特定し、安全性を確保する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:54:52 GMT)
FairSTG: Countering performance heterogeneity via collaborative sample-level optimization [11.3]
スマートStemporal Graph Learning(FairSTG)のためのモデルに依存しないFairness-awareフレームワークを提案する。本研究は, 都市部における時間的資源配分のリスクを軽減できる可能性がある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:59:50 GMT)
STG-Mamba: Spatial-Temporal Graph Learning via Selective State Space Model [11.2]
本稿では、STG学習のための強力な選択状態空間モデルを活用するための最初の探索として、空間時空間グラフマンバ(STG-Mamba)を紹介する。 STG-MambaはSTGネットワークをシステムとして扱い、時間次元にわたってSTGシステムの動的状態の進化を慎重に探求する。 STG予測性能の点で既存の最先端手法を超えるだけでなく、大規模グラフネットワークの計算ボトルネックを効果的に緩和する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:02:57 GMT)
Semantics, Distortion, and Style Matter: Towards Source-free UDA for Panoramic Segmentation [11.1]
本稿では、ピンホールからパノラマのセマンティックセマンティックセグメンテーションのための、ソースフリーな教師なしドメイン適応(SFUDA)について述べる。本稿では,Tangent Projection (TP) を用いて歪みを小さくし,固定されたFoVで正方形投影(ERP)をスリットしてピンホール画像を模倣する手法を提案する。本手法は, ピンホール・パノラマ適応のための従来のSFUDA法よりも優れた性能を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:11:53 GMT)
Can LLM Substitute Human Labeling? A Case Study of Fine-grained Chinese Address Entity Recognition Dataset for UAV Delivery [10.9]
CNER-UAVは、粒度の細かいtextbf Chinese textbfName textbfEntity textbfRecognitionデータセットである。データセットには5つのカテゴリがあり、NERモデルの総合的なトレーニングと評価を可能にする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:36:26 GMT)
HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning [10.8]
HYDRAは、信頼性と漸進的な一般的な推論のための構成的視覚的推論フレームワークである。本フレームワークは,4つの多種多様なデータセット上でのVRタスクにおける最先端性能を実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:31:30 GMT)
TexTile: A Differentiable Metric for Texture Tileability [10.7]
テクスチャ画像がそれ自身でベッドできる程度を定量化するための、新しい微分可能な計量であるTexTileを紹介する。タイル状テクスチャ合成の既存の方法は、一般的なテクスチャの品質に焦点をあてるが、テクスチャの本質的な特性の明示的な分析は欠如している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:09 GMT)
Algorithmic Collective Action in Recommender Systems: Promoting Songs by Reordering Playlists [10.7]
変圧器を用いた推薦システムにおけるアルゴリズム的集団行動について検討する。我々のユースケースは、アーティストがコントロールする既存のプレイリストに曲を戦略的に配置することで、アーティストの可視性を促進することを目的としたファンの集まりである。我々は,この目標に向けて,実装が容易な2つの戦略を導入し,主要な音楽ストリーミングプラットフォームがリリースするレコメンデータシステムモデル上で,その有効性を検証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:27:15 GMT)
Attribute-Efficient PAC Learning of Low-Degree Polynomial Threshold Functions with Nasty Noise [10.6]
我々は、$mathbbRn$で$K$sparse degree-$d$ PTFsのPAC学習を研究する。私たちの主な貢献は、時間$(nd/epsilon)O(d)$で実行される新しいアルゴリズムです。 PACは$eta leq O(epsilond)であっても$O(fracK4depsilon2d cdot log5d n)$でエラー率$epsilon$までクラスを学習する
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:01:36 GMT)
Clinical Reasoning over Tabular Data and Text with Bayesian Networks [10.4]
本稿では,ベイジアンネットワークをニューラルテキスト表現で拡張するための戦略を比較検討する。プライマリ・ケア・ユース・ケース(肺炎の診断)のシミュレーションの結果を概説し,より広範な臨床状況で考察した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:48:27 GMT)
CarbonNet: How Computer Vision Plays a Role in Climate Change? Application: Learning Geomechanics from Subsurface Geometry of CCS to Mitigate Global Warming [10.4]
炭素捕獲・隔離のための地下地形画像から地表面の変位を予測するためのコンピュータビジョンを用いた新しいアプローチを提案する。地下地形画像から直接モデルを訓練することで,これらの課題に対処する。本研究の目的は,炭素注入による地表面変位の応答を理解し,訓練されたモデルを用いてCCSプロジェクトの意思決定を通知することである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:58:51 GMT)
Verifiable Encodings for Secure Homomorphic Analytics [10.4]
ホモモルフィック暗号化は、機密データ上のクラウドで除算された計算のプライバシを保護するための有望なソリューションである。本稿では,クラウドベースの同型計算のクライアント検証を実現するための2つの誤り検出符号化とビルド認証手法を提案する。我々は,暗号化されたデータ上で実行されたアウトソース計算の検証システムであるVERITASにソリューションを実装した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:46:45 GMT)
Federated Semi-supervised Learning for Medical Image Segmentation with intra-client and inter-client Consistency [10.2]
フェデレートラーニングは、ローカルデータ交換なしで、分離されたクライアントの共有モデルをトレーニングすることを目的としている。本研究では,医用画像セグメンテーションのための新しい半教師付き学習フレームワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:52:38 GMT)
Dynamic Spatial-Temporal Aggregation for Skeleton-Aware Sign Language Recognition [10.0]
スケルトン対応手話認識は, 背景情報の影響を受けないままでいられるため, 人気が高まっている。現在の手法では、空間グラフモジュールと時空間モジュールを使用して、それぞれ空間的特徴と時空間的特徴をキャプチャする。本稿では,入力に敏感な連接関係を構築する2つの同時分岐からなる空間構造を提案する。そこで我々は,複雑な人間のダイナミクスを捉えるために,マルチスケールの時間情報をモデル化する新しい時間モジュールを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:42:57 GMT)
Memory-Efficient and Secure DNN Inference on TrustZone-enabled Consumer IoT Devices [9.9]
エッジインテリジェンスにより、元のデータを転送することなく、リソース要求のDeep Neural Network(DNN)推論が可能になる。プライバシに敏感なアプリケーションでは、ハードウェアアイソレーションされた信頼できる実行環境(TEE)にモデルをデプロイすることが不可欠である。我々は,モデル推論における包括的プライバシ保護を保証するため,TrustZoneにおける高度なモデル展開のための新しいアプローチを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:22:50 GMT)
Extracting the Multiscale Causal Backbone of Brain Dynamics [9.9]
脳力学のマルチスケール因果バックボーン(MCB)を提案する。我々のアプローチは、近年のマルチスケール因果構造学習の進歩を活用している。マルチスケールの性質のおかげで、因果ダイナミクスは高レベルの認知機能に関連する脳の領域によって駆動される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:53:38 GMT)
On the effectiveness of Large Language Models for GitHub Workflows [9.8]
大規模言語モデル(LLM)は、様々なソフトウェア開発タスクにおいてその効果を実証している。異なるレベルのプロンプトを持つ5つのワークフロー関連タスクにおけるLLMの有効性を理解するための、最初の総合的研究を行う。現状のLLMと細調整した3種類のLLMの評価結果から,LLMの現在の有効性と欠点について,様々な興味深い知見が得られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:14:12 GMT)
AdaFish: Fast low-rank parameter-efficient fine-tuning by using second-order information [9.8]
AdaFishは、低ランク分解に基づく微調整フレームワークにおいて、トレーニングプロセスを高速化するために設計された2次型の効率的なアルゴリズムである。我々のキーとなる観察は、関連する一般化されたフィッシャー情報行列が低ランクか極小スケールであることである。我々のアルゴリズムは最先端のAdamW法と非常に競合する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:57:37 GMT)
RA-Rec: An Efficient ID Representation Alignment Framework for LLM-based Recommendation [9.6]
LLMに基づくレコメンデーションのための効率的なID表現フレームワークであるRA-Recを提案する。 RA-Recは最先端のメソッドを大幅に上回り、最大3.0%のHitRate@100の改善を実現している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:56:54 GMT)
Self-Supervised Learning for Image Super-Resolution and Deblurring [9.6]
近年, 自己監督法は, 様々な画像逆問題において, 教師付き法と同程度に有効であることが証明されている。本稿では,多くの画像分布が大まかにスケール不変であるという事実を活用する,新たな自己教師型アプローチを提案する。提案手法が他の自己教師型手法より優れていることを示す実データセットに関する一連の実験を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:05:57 GMT)
Empowering Air Travelers: A Chatbot for Canadian Air Passenger Rights [9.5]
カナダの航空運送部門は、乗客の権利に関するフライト遅延、キャンセル、その他の問題に顕著な増加を見せている。本システムでは,複雑なユーザ入力を単純なクエリに分割し,航空旅行規制の詳細を記述した文書の集合から情報を取得する。このシステムは、複雑なユーザ入力を理解し、幻覚のない正確な回答を提供するという、2つの主要な課題をうまく克服する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:24:20 GMT)
Predicated Diffusion: Predicate Logic-Based Attention Guidance for Text-to-Image Diffusion Models [9.5]
拡散モデルは高品質で多彩で創造的な画像を生成することに顕著な成果を上げている。しかし、テキストベースの画像生成に関しては、しばしばテキストに示される意図された意味を捉えることに失敗する。ユーザの意図を表現する統合フレームワークであるPredicated Diffusionを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:27:18 GMT)
TabRepo: A Large Scale Repository of Tabular Model Evaluations and its AutoML Applications [9.5]
TabRepoは、モデル評価と予測の新しいデータセットである。 200データセットで評価された1310モデルの予測とメトリクスを含んでいる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:08:59 GMT)
Audio-Visual Compound Expression Recognition Method based on Late Modality Fusion and Rule-based Decision [9.4]
本稿では,第6回ABAWコンペティションの複合表現認識チャレンジにおけるSUNチームの結果について述べる。本稿では,複合表現認識のための新しい音声視覚手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:45:52 GMT)
Few-shot Object Localization [9.4]
本稿では,Few-Shot Object Localization (FSOL) の課題を紹介する。本課題は、少数のラベル付きサポートサンプルを利用して、対応する画像内のオブジェクトの位置情報をクエリすることで、一般化されたオブジェクトのローカライゼーションを実現する。本モデルでは,サポート画像とクエリ画像間の形状の関連性や勾配差を高めるために,デュアルパス機能拡張モジュールを統合した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:50:48 GMT)
Controllable Text-to-3D Generation via Surface-Aligned Gaussian Splatting [9.4]
本稿では,既存の多視点拡散モデルを強化するために設計されたニューラルネットワークアーキテクチャであるMulti-view ControlNet(MVControl)を紹介する。 MVControlは最適化ベースの3D生成のための3D拡散ガイダンスを提供することができる。効率性を追求するために、一般的に使用される暗黙の表現の代わりに、3Dガウスを表現として採用する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:17:18 GMT)
Training Survival Models using Scoring Rules [9.3]
生存分析(Survival Analysis)は、不完全な時間対イベントデータに対する重要な洞察を提供する。また、確率論的機械学習の重要な例である。柔軟性の異なるパラメトリックと非パラメトリックのサブフレームワークを確立します。我々は,本フレームワークを用いて,様々なパラメトリックモデルを復元し,オプティマイザベースの手法と比較して,最適化が等しく動作することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:58:38 GMT)
Multimodal Fusion Method with Spatiotemporal Sequences and Relationship Learning for Valence-Arousal Estimation [9.2]
本稿では,ABA6コンペティションにおけるVA(Valence-Arousal)推定タスクに対するアプローチを提案する。映像フレームと音声セグメントを前処理して視覚的・音声的特徴を抽出する包括的モデルを考案した。我々は、Transformerエンコーダ構造を用いて長距離依存を学習し、モデルの性能と一般化能力を向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:25:54 GMT)
Pruning for Improved ADC Efficiency in Crossbar-based Analog In-memory Accelerators [9.2]
クロスバー型アナログインメモリアーキテクチャはディープニューラルネットワーク(DNN)の高速化に魅力的であるクロスバー出力の通信にはアナログ・デジタル変換器(ADC)が必要である。 ADCは各クロスバー処理ユニットのエネルギーと面積の大部分を消費する。 ADC固有の非効率性を目標とするクロスバー調整プルーニングの動機付けを行う。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:26:45 GMT)
LUWA Dataset: Learning Lithic Use-Wear Analysis on Microscopic Images [9.1]
顕微鏡画像を用いたLithic Use-Wear Analysis (LUWA) は、未発見のビジョン・フォー・サイエンス研究領域である。考古学的アーティファクト、材料相互作用、ツール機能、歯科記録を理解する上で重要な作業材料を区別することを目指している。我々は,23,130個の顕微鏡画像を含む最初のオープンソースかつ最大のLUWAデータセットを構築した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:52:19 GMT)
Low-power, Continuous Remote Behavioral Localization with Event Cameras [9.1]
イベントカメラは、バッテリー依存のリモート監視にユニークな利点を提供する。我々はこのセンサを用いて、静電ディスプレイと呼ばれるチンストラップペンギンの挙動を定量化する。実験により、イベントカメラの動作に対する自然な応答は、継続的な行動監視と検出に有効であることが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:08:37 GMT)
Few-Shot Causal Representation Learning for Out-of-Distribution Generalization on Heterogeneous Graphs [8.9]
ヘテロジニアスグラフ(HGs)におけるラベル空間性問題に対処するヘテロジニアスグラフスショットラーニング(HGFL)が開発されている。本稿では,新しい因果OOD不均質グラフFew-shot学習モデル,すなわちCOHFを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:01:23 GMT)
Shared and Private Information Learning in Multimodal Sentiment Analysis with Deep Modal Alignment and Self-supervised Multi-Task Learning [8.9]
本稿では、モーダル間の共有情報を取得するための深いモーダル共有情報学習モジュールを提案する。また、自己教師付き学習戦略に基づくラベル生成モジュールを使用して、モダリティのプライベート情報をキャプチャする。当社のアプローチは,3つの公開データセットの指標のほとんどにおいて,最先端の手法よりも優れています。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:59:52 GMT)
High-Fidelity SLAM Using Gaussian Splatting with Rendering-Guided Densification and Regularized Optimization [8.8]
本稿では,3次元ガウススプラッティングに基づく高密度RGBD SLAMシステムを提案する。近年のニューラルかつ並列に開発されたガウススプラッティング RGBD SLAM ベースラインと比較して,本手法は合成データセット Replica の最先端結果と実世界のデータセット TUM の競合結果を得る。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:19:53 GMT)
Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling [8.8]
本稿では,第6回ABAW(Affective Behavior Analysis in-the-Wild)コンペティションについて述べる。第6回ABAWコンペティションでは,オフィシャル検証セットにおいて優れた結果を得た。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:20:59 GMT)
Chasing Day and Night: Towards Robust and Efficient All-Day Object Detection Guided by an Event Camera [8.7]
EOLOは、RGBとイベントモダリティの両方を融合させることで、堅牢で効率的な全日検出を実現する、新しいオブジェクト検出フレームワークである。我々のEOLOフレームワークは、イベントの非同期特性を効率的に活用するために、軽量スパイキングニューラルネットワーク(SNN)に基づいて構築されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:25:50 GMT)
$GRU^{spa}$: Gated Recurrent Unit with Spatial Attention for Spatio-Temporal Disaggregation [8.6]
我々は,低分解能,不規則な分割から高分解能,不規則な分割へ移動時間データを複雑化するモデルを考える。本稿では,空間的注意層をGRUモデルに統合したGated Recurrent Unit with Space Attention(GRUspa$)を提案する。 GRUspa$は、他のニューラルモデルや典型的な手法よりも大幅に改善されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:03:20 GMT)
SUN Team's Contribution to ABAW 2024 Competition: Audio-visual Valence-Arousal Estimation and Expression Recognition [8.6]
本研究では,感情認識における視覚的深層学習手法について検討する。細調整畳み込みニューラルネットワーク(CNN)と公共次元感情モデル(PDEM)に基づくアーキテクチャの有効性について検討する。多段階学習モード特化ディープニューラルネット(DNN)の埋め込みを用いた時間モデルと融合戦略の比較を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:24:15 GMT)
Boosting Transferability in Vision-Language Attacks via Diversification along the Intersection Region of Adversarial Trajectory [8.6]
視覚言語事前学習モデルは多モーダル逆例(AE)の影響を受けやすい本研究では,AEsの多様性を拡大するために,対向軌道の交点領域に沿って多様化する手法を提案する。潜在的なオーバーフィッティングを緩和するため、最適化経路に沿った最後の交差点領域から逸脱する逆テキストを指示する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:10:10 GMT)
FroSSL: Frobenius Norm Minimization for Efficient Multiview Self-Supervised Learning [8.6]
FroSSLは、共分散固有値正則化を調整し、より多くのビューを使用する。我々は,FroSSLが他のSSLメソッドよりも高速に競合精度に達することを示す。また、FroSSLは、複数のデータセット上でResNet18をトレーニングする際に、線形プローブ評価の競合表現を学習することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:20:51 GMT)
Toward Sustainable GenAI using Generation Directives for Carbon-Friendly Large Language Model Inference [8.6]
本稿では,ジェネレーティブ・Large Language Model (LLM) 推論サービスの炭素フットプリント削減を目的とした,革新的なフレームワークであるSproutを提案する。提案手法は,生態系の持続可能性と高品質な生成結果の需要のバランスをとる。 Llama2およびグローバル電力グリッドデータを用いた実世界の評価において, 炭素排出量を40%以上削減できることを実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:53:53 GMT)
A Canary in the AI Coal Mine: American Jews May Be Disproportionately Harmed by Intellectual Property Dispossession in Large Language Model Training [8.6]
ユダヤ系アメリカ人が著した不当な量のコンテンツが、彼らの同意なしに訓練に使われていることがわかりました。 LLMは、トレーニングデータを制作した人々の有給労働の代わりになる可能性があるため、今後数年でユダヤ人アメリカ人にさらに実質的で不均等な経済被害をもたらす可能性がある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:07:39 GMT)
Efficient Feature Extraction and Late Fusion Strategy for Audiovisual Emotional Mimicry Intensity Estimation [8.5]
Emotional Mimicry Intensity (EMI) Estimation Challenge taskは、シードビデオの感情的強度を評価することを目的としている。ビデオモダリティのためのResNet18とAUに基づいてリッチなデュアルチャネル視覚特徴を抽出し、オーディオモダリティのためのWav2Vec2.0に基づく効果的なシングルチャネル特徴を抽出した。視覚モデルと音響モデルの予測値を平均化し,視覚的感情的模倣強度をより正確に推定した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:14:35 GMT)
Compound Expression Recognition via Multi Model Ensemble [8.5]
複合表現認識は対人相互作用において重要な役割を果たす。本稿では,複合表現認識のためのアンサンブル学習手法に基づく解を提案する。提案手法はRAF-DBの精度が高く,C-EXPR-DBの一部部分でゼロショットで表現を認識できる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:30:56 GMT)
Algorithmic Complexity Attacks on Dynamic Learned Indexes [8.5]
本稿では,ALEXの最悪のシナリオを対象とした,アルゴリズム的複雑性攻撃(ACA)に関する最初の体系的な研究について述べる。まず、データノード上のACAは、ALEXのギャップ化された配列レイアウトを利用する。第2に、内部ノード上のACAは、ALEXの壊滅的なコスト軽減機構を利用する。第3に、ACAは、実際の鍵分布とデータノードの線形モデルとの相違を高めるために、病的挿入を生成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:46:56 GMT)
Deep Few-view High-resolution Photon-counting Extremity CT at Halved Dose for a Clinical Trial [8.4]
ニュージーランドの臨床試験において,PCCT画像の半減量と2倍の速度で再現する深層学習に基づくアプローチを提案する。本稿では,GPUメモリの制限を緩和するパッチベースのボリュームリファインメントネットワーク,合成データを用いたトレーニングネットワーク,およびモデルベースの反復リファインメントを用いて,合成データと実世界のギャップを埋める。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:07:48 GMT)
BAD-Gaussians: Bundle Adjusted Deblur Gaussian Splatting [8.4]
BAD-Gaussianは、不正確なカメラのポーズで、激しい動きをブラインドした画像を処理するための新しいアプローチである。提案手法は,従来の最先端のデブルーニューラルレンダリング手法と比較して,優れたレンダリング品質を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:31:44 GMT)
Wear-Any-Way: Manipulable Virtual Try-on via Sparse Correspondence Alignment [8.3]
Wear-Any-Wayは、仮想トライオンのためのカスタマイズ可能なソリューションである。まず、標準仮想試着のための強力なパイプラインを構築し、単一/複数衣料試着とモデル・ツー・モデル設定をサポートする。特定位置の生成を誘導するポイントベース制御を含むスパースアライメントアライメントを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:59:52 GMT)
WoLF: Large Language Model Framework for CXR Understanding [8.3]
胸部X線理解のための広スコープ大言語モデルフレームワークを提案する。実際の臨床シナリオにおける正確な診断に利用される多面的患者の記録を収集する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:39:23 GMT)
On the Diversity and Realism of Distilled Dataset: An Efficient Dataset Distillation Paradigm [8.2]
蒸留データの多様性とリアリズムを両立させるRDEDを提案する。完全なImageNet-1Kを7分以内で、クラス毎に10の画像からなる小さなデータセットに抽出し、注目すべき42%のトップ1精度を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:03:07 GMT)
Federated Foundation Models: Privacy-Preserving and Collaborative Learning for Large Models [8.2]
我々は、FMとFederated Learning(FL)の利点を組み合わせたFFM(Federated Foundation Models)パラダイムを提案する。我々は,FMの寿命にFLを組み込むことの潜在的なメリットと課題について論じ,事前学習,微調整,応用について論じる。エッジでの計算能力の増大は、データソースに近い新たに生成されたプライベートデータを用いてFMを最適化する可能性を解き放つ可能性があるため、FFMにおける連続的・長期学習の可能性を探る。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:04:43 GMT)
Semi-supervised Active Learning for Video Action Detection [8.1]
我々はラベル付きデータとラベルなしデータの両方を利用する、新しい半教師付きアクティブラーニング手法を開発した。提案手法は,UCF-24-101,JHMDB-21,Youtube-VOSの3種類のベンチマークデータセットに対して評価を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:12:26 GMT)
Dynamic Survival Analysis for Early Event Prediction [8.1]
本研究は、動的生存分析(DSA)による医療における早期事象予測(EEP)の進歩である。本研究は,新たなアラーム優先方式(最大11%のAuPRC差)により,脳波モデルに時間段階で対応し,事象レベルの指標を大幅に改善する能力を示す。このアプローチは、早期のイベント予測と管理のために、より微妙で実行可能なフレームワークを提供する、予測型ヘルスケアにおける重要な一歩である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:17:23 GMT)
Using construction waste hauling trucks' GPS data to classify earthwork-related locations: A Chengdu case study [8.1]
アースワーク関連地域(ERL)は、都市ごみ汚染の主な原因である(粒子状物質)。本研究は,16,000台以上の建設廃棄物運搬トラック(CWHT)のGPSトラジェクトリデータを用いた都市ERLの識別と分類を目的とする。いくつかの機械学習モデルを比較し,中国成都市における実世界データを用いた分類性能に及ぼす時空間的特徴の影響を検討した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:21:32 GMT)
Urban Sound Propagation: a Benchmark for 1-Step Generative Modeling of Complex Physical Systems [8.0]
本稿では,速度と物理的正確性の観点から,1ステップの推論モデルの評価のためのベンチマークを示す。本ベンチマークは, 都市環境における音源からの波動の2次元伝播をモデル化する, 物理的に複雑で実用的な作業に基づくものである。我々は100kのサンプルを用いて,各サンプルがOpenStreetmapから引き出された実2次元ビルディングマップとパラメータ化された音源と,与えられたシーンに対する模擬地上真実音の伝搬からなるデータセットを提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:37:28 GMT)
Knowing Your Nonlinearities: Shapley Interactions Reveal the Underlying Structure of Data [8.0]
我々はShapley Taylorインタラクション指標(STII)を用いて、基礎となるデータ構造がモデル表現に与える影響を分析する。マスキングおよび自己回帰言語モデル(MLとALM)の言語構造を考えると,STIIは慣用表現内で増加することが分かる。本研究の音声モデルでは, 音素の開口度が音素の文脈によってどの程度変化するかを, 音素の主成分として反映している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:13:22 GMT)
Active learning for effective Hamiltonian of super-large-scale atomic structures [8.0]
実効ハミルトニアンのパラメトリゼーション法は複雑であり、複雑な相互作用や複雑な成分でシステムを解くことはほとんどできない。そこで我々は,ベイズ線形回帰に基づく実効ハミルトニアンをパラメータ化するための,オンザフライアクティブ機械学習手法を開発した。このアプローチは、以前の方法では扱えない複雑なシステムを含むあらゆる考慮されたシステムに対して、効果的なハミルトンパラメータを計算する普遍的で自動的な方法を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:25:09 GMT)
Driving Animatronic Robot Facial Expression From Speech [7.9]
本稿では,音声からアニマトロニクスロボットの表情を駆動するスキン中心方式を提案する。提案手法では、リニアブレンドスキンニング(LBS)を中心表現として、エンボディメント設計とモーション合成の革新を導く。提案手法は、アニマトロニックな顔の音声から、非常にリアルでリアルタイムな表情を生成することができ、自然な相互作用のために、人間の表情を再現するロボットの能力を著しく向上させることができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:11:57 GMT)
FedDRL: A Trustworthy Federated Learning Model Fusion Method Based on Staged Reinforcement Learning [7.8]
2段階のアプローチに基づく強化学習を用いたモデル融合手法であるFedDRLを提案する。最初の段階では、我々の手法は悪意あるモデルをフィルタリングし、信頼されたクライアントモデルを選択してモデル融合に参加する。第2段階では、FedDRLアルゴリズムは信頼されたクライアントモデルの重みを適応的に調整し、最適なグローバルモデルを集約する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:21:07 GMT)
Multi-Dimensional Machine Translation Evaluation: Model Evaluation and Resource for Korean [7.8]
1200文のMQM評価ベンチマークを英語と韓国語で作成する。参照なしのセットアップはスタイルのディメンションにおいて、それよりも優れています。全体として、RemBERTは最も有望なモデルとして現れます。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:02:38 GMT)
UniBind: LLM-Augmented Unified and Balanced Representation Space to Bind Them All [7.8]
柔軟で効率的なUniBindを提案し、7つの様相の統一表現空間を学習する。 UniBindはすべてのCLIPスタイルのモデルよりも柔軟なアプリケーションに優れており、優れたパフォーマンス向上を実現している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:09:27 GMT)
ExACT: Language-guided Conceptual Reasoning and Uncertainty Estimation for Event-based Action Recognition and More [7.8]
本稿では,イベントに基づく行動認識をモーダルな概念化の観点から支援する新しいアプローチであるExACTを提案する。実験の結果、当社のExACTは、PAF、HARDVS、SeActデータセットでそれぞれ94.83%(+2.23%)、90.10%(+37.47%)、67.24%の認識精度を達成していることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:15:53 GMT)
EventBind: Learning a Unified Representation to Bind Them All for Event-based Open-world Understanding [7.8]
EventBindは、イベントベースの認識のためのビジョン言語モデル(VLM)の可能性を解き放つ新しいフレームワークである。まず、イベントからの時間情報を微妙にモデル化する新しいイベントエンコーダを紹介する。次に、コンテントプロンプトを生成し、ハイブリッドテキストプロンプトを利用してEventBindの一般化能力を向上するテキストエンコーダを設計する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:30:50 GMT)
SFPDML: Securer and Faster Privacy-Preserving Distributed Machine Learning based on MKTFHE [7.8]
MKTFHE(Multi-key homo encryption over torus)は、この問題に対処するための有望な候補の1つである。 MKTFHEの解読にはセキュリティ上のリスクがある可能性がある。対物回帰やニューラルネットワークなどの一般的な機械学習を高性能に実行することは依然として困難である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:06:35 GMT)
SceneScript: Reconstructing Scenes With An Autoregressive Structured Language Model [7.7]
SceneScriptは、構造化言語コマンドのシーケンスとして、フルシーンモデルを生成するメソッドである。本手法は,符号化された視覚データから直接構造化言語コマンドのセットを推論する。提案手法は,3次元オブジェクト検出において,構造的レイアウト推定における最先端の成果と競合する結果を与える。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:01:29 GMT)
MELTing point: Mobile Evaluation of Language Transformers [7.7]
大規模言語モデル(LLM)のモバイル実行の現状について検討する。我々は,デバイス上でのLLMのヘッドレス実行とベンチマークをサポートする,独自の自動化インフラストラクチャMELTを開発した。我々は、一般的な命令の微調整 LLM を評価し、それぞれのフレームワークを用いてエンドツーエンドおよび粒度の性能を計測する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:51:21 GMT)
Towards Better Statistical Understanding of Watermarking LLMs [7.7]
本稿では,大規模言語モデル(LLM)の透かし問題について検討する。モデル歪みと検出能力のトレードオフと,Kirchenbauer et alのグリーンレッドリストに基づく制約付き最適化問題とみなす。本稿では,この最適化定式化を考慮したオンライン二重勾配上昇透かしアルゴリズムを開発し,モデル歪みと検出能力の最適性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:57:09 GMT)
You Only Sample Once: Taming One-Step Text-To-Image Synthesis by Self-Cooperative Diffusion GANs [7.7]
YOSOは、高速でスケーラブルで高忠実なワンステップ画像合成のために設計された、新しい生成モデルである。提案手法は,一段階のモデルトレーニングをスクラッチから行うことができ,競争性能が向上することを示す。特に、512の解像度で訓練された1ステップで画像を生成できる最初の拡散変換器を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:34:27 GMT)
Emotion Recognition Using Transformers with Masked Learning [7.7]
本研究では、視覚変換器(ViT)と変換器(Transformer)のモデルを用いて、Valence-Arousal(VA)の推定に焦点をあてる。このアプローチは、従来の畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ベースのメソッドを超越し、新しいTransformerベースのフレームワークを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:26:53 GMT)
Fast Value Tracking for Deep Reinforcement Learning [7.6]
強化学習(Reinforcement Learning, RL)は、環境と対話するエージェントを作成することによって、シーケンシャルな意思決定問題に取り組む。既存のアルゴリズムはしばしばこれらの問題を静的とみなし、期待される報酬を最大化するためにモデルパラメータの点推定に重点を置いている。我々の研究は、カルマンパラダイムを活用して、Langevinized Kalman TemporalTDと呼ばれる新しい定量化およびサンプリングアルゴリズムを導入する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:18:19 GMT)
On the Effectiveness of Heterogeneous Ensemble Methods for Re-identification [7.6]
産業組織の再同定のための新しいアンサンブル手法を提案する。我々のアルゴリズムは、よく使われる複雑なサイムズニューラルネットワークを、初歩的なモデルのアンサンブルで置き換える。 77%以上のランク1の精度と99%以上のランク10の精度で、私たちのタスクでは最先端のパフォーマンスに達しています。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:17:26 GMT)
To Help or Not to Help: LLM-based Attentive Support for Human-Robot Group Interactions [7.5]
我々は,人間のグループを支援するロボットのための,新しいインタラクション概念であるAttentive Supportを紹介する。シーン認識、対話獲得、状況理解、行動生成を組み合わせている。我々はロボットの注意行動を示して評価し、必要なときに人間を支援し、助けるが、助けがいなければ邪魔はしない。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:09:44 GMT)
CASIMIR: A Corpus of Scientific Articles enhanced with Multiple Author-Integrated Revisions [7.5]
本稿では,学術論文の執筆過程の改訂段階について,原文資料を提案する。この新しいデータセットはCASIMIRと呼ばれ、OpenReviewの15,646の科学論文の改訂版とピアレビューを含んでいる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:34:05 GMT)
Do Physicians Know How to Prompt? The Need for Automatic Prompt Optimization Help in Clinical Note Generation [7.4]
本稿では,医療専門家,非医療専門家,APO強化GPT3.5およびGPT4のアウトプットを比較し,初期プロンプトを洗練するための自動プロンプト最適化フレームワークを提案する。その結果, GPT4 APO は, 臨床検査項目間での即時品質の標準化に優れていた。 Human-in-the-loopアプローチは、専門家が自身の修正を好みながら、APO以降のコンテンツ品質を維持することを示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:27:37 GMT)
A Practical Guide to Statistical Distances for Evaluating Generative Models in Science [7.2]
我々は、異なる方法論を表す統計距離の4つの一般的な概念に焦点を当てる。それぞれの距離の背後にある直感を強調し、そのメリット、スケーラビリティ、複雑さ、落とし穴を説明します。我々は、異なる科学的領域、すなわち意思決定のモデルと医療画像の生成モデルから生成モデルを評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:16:14 GMT)
MaxK-GNN: Extremely Fast GPU Kernel Design for Accelerating Graph Neural Networks Training [7.2]
アルゴリズムとシステム革新を統合した高性能GPUトレーニングシステムMaxK-GNNを提案する。実験により、マックスK-GNNシステムは、アムダールの法則に従って理論的なスピードアップ限界に接近できることが示された。我々はSOTA GNNに匹敵する精度を達成したが、Redditでは3.22/4.24倍のスピードアップ(理論上の限界vs, 5.52/7.27倍)を実現した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:17:43 GMT)
Approximation and bounding techniques for the Fisher-Rao distances [7.1]
我々はフィッシャー・ラオ距離の数値的ロバストな近似と有界化について考察する。特に、近似に対する任意の小さな加算誤差を保証するための一般的な方法を得る。我々は,フィッシャー・ラオ測地線のプロキシとして機能する曲線長をベースとした2つの新しい距離を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:58:17 GMT)
Towards Generalizing to Unseen Domains with Few Labels [7.0]
ラベル付きデータの限られたサブセットを活用することにより、ドメインの一般化可能な特徴を学習するモデルを得る。ラベル付けされていないデータを活用できない既存のドメイン一般化(DG)手法は、半教師付き学習(SSL)法に比べて性能が劣る。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:33:22 GMT)
Span-Based Optimal Sample Complexity for Average Reward MDPs [7.0]
平均回帰マルコフ決定過程(MDP)において,$varepsilon$-optimal Policyを生成モデルで学習する際のサンプル複雑性について検討した。我々は、$widetildeOleft(SAfracH (1-gamma)2varepsilon2 right)$, ここで、$H$は最適ポリシーのバイアス関数のスパンであり、$SA$は状態作用空間の濃度である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:24:43 GMT)
Analyzing the Impact of Partial Sharing on the Resilience of Online Federated Learning Against Model Poisoning Attacks [7.0]
我々は,部分共有型オンラインフェデレーション学習(PSO-Fed)アルゴリズムのモデルポゾン攻撃に対するレジリエンスを精査する。 PSO-Fedは、クライアントが各更新ラウンドでサーバとモデル見積のごく一部しか交換できないようにすることで、通信負荷を低減する。そこで本研究では,PSO-Fedのモデルポゾン攻撃に直面する場合,PSO-Fedには非自明なステップサイズが存在することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:15:38 GMT)
HateModerate: Testing Hate Speech Detectors against Content Moderation Policies [6.9]
HateModerateは、コンテンツポリシーに対する自動コンテンツモデレーターの動作をテストするデータセットです。我々は,HateModerateに対する最先端のヘイトスピーチ検出器の性能を検証した。我々は,オリジナルテストデータに匹敵するスコアを持ちながら,コンテンツポリシーに対するモデル適合性の大幅な改善を観察する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:17:22 GMT)
A Physics-embedded Deep Learning Framework for Cloth Simulation [6.9]
本稿では,布地シミュレーションの物理特性を直接エンコードする物理組込み学習フレームワークを提案する。このフレームワークは、従来のシミュレータやサブニューラルネットワークを通じて、外部の力や衝突処理と統合することもできる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:21:00 GMT)
Predictive, scalable and interpretable knowledge tracing on structured domains [6.9]
PSI-KTは、個人の認知特性と知識の前提構造の両方が学習力学にどのように影響するかを明確にモデル化する階層的生成手法である。 PSI-KTは、学習者や歴史の学習者であっても、実世界の効率的なパーソナライズの必要性を目標にしている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:19:29 GMT)
Trustworthiness of Pretrained Transformers for Lung Cancer Segmentation [6.7]
Swin UNETR と SMIT の2つの自己超越型トランスフォーマーモデルを用いて肺腫瘍の微細化試験を行った。両モデルとも分布内データに対して高い精度を示した。これらの発見は、現在および将来の事前訓練されたモデルの安全な開発と展開のガイドとなると期待している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:36:48 GMT)
Fixed points of nonnegative neural networks [6.7]
まず、非負の重みとバイアスを持つ非負のニューラルネットワークは、モノトニックで(弱く)スケーラブルなマッピングとして認識できることを示す。非負の重みとバイアスを持つ非負のニューラルネットワークの固定点集合の形状が間隔であることを証明する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:11:45 GMT)
The Impact of Adversarial Node Placement in Decentralized Federated Learning Networks [6.7]
連邦学習(FL)の人気が高まるにつれ、新しい分散フレームワークが広まりつつある。本稿では,ネットワーク内の配置を協調的に調整できる各種対向配置戦略において,分散FLの性能を解析する。本稿では,敵同士の平均ネットワーク距離を最大化することにより,敵の中央性よりも敵の拡散を優先する新たな攻撃アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:25:21 GMT)
Advancing Time Series Classification with Multimodal Language Modeling [6.6]
InstructTimeは、時系列分類を学習から生成までのパラダイムとして再形成するための新しい試みである。中心となる考え方は、タスク固有の命令と生の時系列の両方をマルチモーダル入力として扱うマルチモーダル理解タスクとして時系列の分類を定式化することである。ベンチマークデータセット上で大規模な実験が行われ、その結果、InstructTimeの優れたパフォーマンスが明らかになった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:32:24 GMT)
Equity through Access: A Case for Small-scale Deep Learning [6.5]
大規模資源は、計算、データ、エネルギー、炭素排出量の点で資源集約的な、徐々に大きなモデルを訓練するために使われてきた。これらのコストは、そのような規模のリソースへのアクセスが限られている研究者や実践者にとって、新たなタイプの参入障壁になりつつある。本稿では,既存の視覚タスク用DLモデルの展望を包括的に見て,リソースが制限されている環境での有用性を実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:17:18 GMT)
Towards Controllable Face Generation with Semantic Latent Diffusion Models [6.4]
本稿では,人間の顔生成と編集のための新しい遅延拡散モデルアーキテクチャに基づくSISフレームワークを提案する。提案システムは,SPADE正規化とクロスアテンションレイヤの両方を用いて形状とスタイル情報をマージし,人間の顔の各意味部分を正確に制御する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:02:13 GMT)
Toward Cost-effective Adaptive Random Testing: An Approximate Nearest Neighbor Approach [6.4]
Adaptive Random Testing (ART)は、ランダムテスト(RT)のテスト効率(障害検出機能を含む)を高める多くのARTアルゴリズムが研究されており、FSCS(Fixed-Size-Candidate-Set ART)やRRT(Restricted Random Testing)などがある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:23:07 GMT)
PCT: Perspective Cue Training Framework for Multi-Camera BEV Segmentation [6.4]
Cue Perspective Training (PCT) は、ラベルのない視点画像から生成された擬似ラベルを利用する新しいトレーニングフレームワークである。 PCTはラベルのないデータが利用できる様々な設定に適用できる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:08:12 GMT)
PointGrasp: Point Cloud-based Grasping for Tendon-driven Soft Robotic Glove Applications [6.4]
PointGraspは、家庭のシーンを意味的に識別するために設計されたリアルタイムシステムである。慣性測定ユニットを備えたRGB-Dカメラと、腱駆動のソフトロボットグローブに統合されたマイクロプロセッサとを備える。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:59:21 GMT)
Key-point Guided Deformable Image Manipulation Using Diffusion Model [6.2]
キーポイント誘導拡散確率モデル(KDM) 中間出力として光フローマップを組み込んだ2段階生成モデルを提案する。 KDMは様々なキーポイント条件付き画像合成タスクで評価される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:47:39 GMT)
CPA-Enhancer: Chain-of-Thought Prompted Adaptive Enhancer for Object Detection under Unknown Degradations [6.2]
本研究では, 未知の劣化下での物体検出のための適応エンハンサーCPA-Enhancerを提案する。私たちの知る限りでは、オブジェクト検出タスクのためにCoTのプロンプトを利用する最初の作業です。実験結果から,CPA-Enhancerはオブジェクト検出のための新しい手法の状態を設定できるだけでなく,未知の劣化下での他の下流視覚タスクの性能も向上することが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:02:10 GMT)
Understanding Why Label Smoothing Degrades Selective Classification and How to Fix It [6.2]
ラベル平滑化(LS)が選択的分類(SC)に悪影響を及ぼすことを示す。 LSは、エラーの確率が低い場合には最大ロジットを規則化し、エラーの確率が高い場合はより小さくすることで、過信と過信を増す。次に,LSによる損失SCの回復に対するロジット正規化の有効性を実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:46:24 GMT)
Neural Differential Algebraic Equations [6.1]
微分代数方程式(DAE)のデータ駆動モデリングに適したニューラル微分代数方程式(NDAE)を提案する。提案したNDAEs抽象化は、関連するシステム理論データ駆動モデリングタスクに適していることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:43:57 GMT)
WaterVG: Waterway Visual Grounding based on Text-Guided Vision and mmWave Radar [6.1]
WaterVGは、人間の意図に基づくUSVベースの水路知覚のために設計された最初の視覚的接地データセットである。 WaterVGには11,568のサンプルと34,950の参照対象が含まれている。ポタモイ (Potamoi) は、フェーズド・ヘテロジニアス・モダリティ・フュージョン (PHMF) 構造を設計した一段階パラダイムに基づくマルチモーダルビジュアルグラウンドモデルである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:45:18 GMT)
Incorporating Higher-order Structural Information for Graph Clustering [6.0]
グラフ畳み込みネットワーク(GCN)は、ディープクラスタリングの強力なツールとして登場した。グラフ構造情報をフル活用するための新しいグラフクラスタリングネットワークを提案する。提案手法は, 各種データセット上での最先端手法よりも優れる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:37:36 GMT)
Reinforcement Learning with Latent State Inference for Autonomous On-ramp Merging under Observation Delay [6.0]
遅延状態推論・安全制御(L3IS)エージェントを用いたレーンキーピング・レーンチェンジについて紹介する。 L3ISは、周囲の車両の意図や運転スタイルに関する包括的な知識を必要とせずに、オンランプのマージ作業を安全に行うように設計されている。本稿では,観測遅延を考慮に入れたAL3ISというエージェントを改良し,実環境においてより堅牢な決定を行えるようにした。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:46:55 GMT)
On Safety in Safe Bayesian Optimization [5.9]
本稿では,一般的なSafeOpt型アルゴリズムの安全性に関する3つの問題について検討する。まず、これらのアルゴリズムはガウス過程(GP)回帰に対する頻繁な境界の不確実性に批判的に依存する。第二に、ターゲット関数の再生カーネルヒルベルト空間(RKHS)ノルム上の上限を仮定する。第3に、SafeOptと派生アルゴリズムは離散的な検索空間に依存しており、高次元問題に適用することは困難である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:50:32 GMT)
Topological Defects in Floquet Circuits [5.8]
トポロジカルな欠陥を持つ駆動Ising鎖を記述したFloquet回路を導入する。対応するゲートはスピンを反転する欠陥と、クラマース・ワニエ双対変換を明示的に実装する双対性欠陥を含む。後者の場合、単一の未ペアローカライズされたMajorana 0 モードが現れることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:30:13 GMT)
BugNIST - a Large Volumetric Dataset for Object Detection under Domain Shift [5.8]
BugNISTデータセットは,12種類のバグタイプ9154マイクロCTボリュームと,密充填されたバグミックス388ボリュームからなる。このデータセットは、ソースドメインとターゲットドメインに同じ外観を持つオブジェクトによって特徴づけられる。本研究では,3次元物体検出手法のフィールド化をめざして,ベースライン検出解析を行う。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:40:25 GMT)
Bidirectional Temporal Diffusion Model for Temporally Consistent Human Animation [5.8]
本研究では,1つの画像,ビデオ,ランダムノイズから時間的コヒーレントな人間のアニメーションを生成する手法を提案する。両方向の時間的モデリングは、人間の外見の運動あいまいさを大幅に抑制することにより、生成ネットワーク上の時間的コヒーレンスを強制すると主張している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:35:37 GMT)
Equivariant Ensembles and Regularization for Reinforcement Learning in Map-based Path Planning [5.7]
本稿では,特定のニューラルネットワーク成分を使わずに,同変ポリシーと不変値関数を構築する手法を提案する。等変アンサンブルと正則化がサンプル効率と性能にどのような影響を与えるかを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:01:25 GMT)
Lifting Multi-View Detection and Tracking to the Bird's Eye View [5.7]
マルチビュー検出と3Dオブジェクト認識の最近の進歩により、性能が大幅に向上した。パラメータフリーとパラメータ化の両方の現代的なリフト法とマルチビューアグリゲーションを比較した。堅牢な検出を学習するために,複数のステップの特徴を集約するアーキテクチャを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:33:07 GMT)
A Fast and Optimal Learning-based Path Planning Method for Planetary Rovers [5.3]
本研究では,NNPPと呼ばれる標高マップの最適経路を高速に探索する学習手法を提案する。 NNPPモデルは、多くの事前注釈付き最適経路のデモから、スタート地点とゴール地点のセマンティック情報とマップ表現を学習する。 NNPPモデルにより生成された誘導場は,同じハードウェア条件下での最適経路の探索時間を著しく短縮できることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:13:53 GMT)
Asymptotically free sketched ridge ensembles: Risks, cross-validation, and tuning [5.3]
我々は、スケッチされたリッジ回帰アンサンブルの予測リスクを推定するために、ランダム行列理論を用いて、一般化されたクロスバリデーション(GCV)の整合性を確立する。正方形の予測リスクに対して,無作為な等価な暗黙のリッジバイアスとスケッチに基づく分散を分解し,無限アンサンブルにおけるスケッチサイズのみによるグローバルなチューニングが可能であることを証明した。また,小型のスケッチ付きリッジ・アンサンブルを用いて,GCVを用いて非ケッチ・リッジ・レグレッションのリスクを効率的に推定できるアンサンブル・トリックを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:23:59 GMT)
Perfect Zero-Knowledge PCPs for #P [5.3]
完全ゼロ知識確率的証明(PZK-PCP)を#Pのすべての言語に対して構築する。これは、BPP以外の言語向けのPZK-PCPの最初の構成である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:17:07 GMT)
Revisiting Backflow Corrections by Tensor Representations: Benchmarks on Fermi-Hubbard-type Models [5.3]
提案手法は,現在の最先端手法よりも競争力や低エネルギー化を実現していることを示す。我々は、STO-3Gに基づく分子と、周期的および円筒的ボーダリー条件を持つフェルミ・ハッバードモデルについてベンチマークを行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:18:17 GMT)
Securing Large Language Models: Threats, Vulnerabilities and Responsible Practices [4.9]
大規模言語モデル(LLM)は、自然言語処理(NLP)のランドスケープを大きく変えた。本研究は,5つのテーマの観点から,LLMに関するセキュリティとプライバシの懸念を徹底的に調査する。本稿は, LLMの安全性とリスク管理を強化するために, 今後の研究に期待できる道筋を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:10:58 GMT)
SC-Diff: 3D Shape Completion with Latent Diffusion Models [4.9]
本稿では, 形状の完成に最適化された3次元潜在拡散モデルを用いて, 3次元形状完備化手法を提案する。本手法は,空間的コンディショニングとクロスアテンションによる画像ベースコンディショニングを,キャプチャー部分スキャンからの3次元特徴の統合により組み合わせたものである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:01:11 GMT)
Integrated distributed sensing and quantum communication networks [4.8]
光ファイバーを用いた統合センシング・通信(ISAC)システムは、都市構造イメージング、地震波検出、パイプライン安全監視など、様々な機能を実現することができる。本稿では、複数のノード間のセキュアな鍵分布と、標準量子限界下での分散センシングを実現するための、ISAQN(Integrated Sensentration and Quantum Network)方式を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:12:30 GMT)
Unveiling the Anomalies in an Ever-Changing World: A Benchmark for Pixel-Level Anomaly Detection in Continual Learning [4.8]
連続学習環境における画素レベル異常検出の問題点について検討する。新しいデータは時間とともに到着し、新しいデータや古いデータでうまく機能することがゴールだ。アプローチを検証するために、ピクセルベースの異常のある実世界の画像データセットを使用する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:53:57 GMT)
System Support for Environmentally Sustainable Computing in Data Centers [4.8]
現代のデータセンターは環境維持性のサポートが不十分なため、炭素フットプリントの増大に悩まされている。予備的な結果を提示し、これをデータセンターにおける環境保全コンピューティングを前進させる大きな可能性を秘めているイニシアチブとして認識する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:56:02 GMT)
Multi-task real-robot data with gaze attention for dual-arm fine manipulation [4.7]
本稿では,2つのアームタスクや細かな操作を必要とするタスクを含む多種多様なオブジェクト操作のデータセットを紹介する。 224k エピソード (150時間, 1,104 言語命令) のデータセットを作成した。このデータセットには、視覚的注意信号とデュアルアクションラベル、アクションを堅牢な到達軌道とオブジェクトとの正確な相互作用に分離する信号、堅牢で正確なオブジェクト操作を実現するための言語命令が含まれる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:17:00 GMT)
Goal-conditioned dual-action imitation learning for dexterous dual-arm robot manipulation [4.7]
バナナの皮剥きなどの変形可能な物体の長い水平デキスタスロボット操作は問題となる課題である。本稿では,目標条件付きデュアルアクション・ディープ・模倣学習(DIL)アプローチを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:56:12 GMT)
Reweight-annealing method for calculating the value of partition function via quantum Monte Carlo [4.6]
量子モンテカルロフレームワークにおいて,非バイアスの低技術バリアアルゴリズムを提案する。この方法は古典的モンテカルロシミュレーションと量子的モンテカルロシミュレーションの両方で広く利用でき、コンピュータ上で容易に並列化できる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:31:12 GMT)
A polynomial-time quantum algorithm for solving the ground states of a class of classically hard Hamiltonians [4.5]
古典的ハードハミルトニアン群の基底状態を解くための量子アルゴリズムを提案する。ハミルトンの$Ldag L$は、LMEのシミュレーションが難しいと信じている場合、古典的なコンピュータでは難しいことが保証されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:38:44 GMT)
Practical ultra-low frequency noise laser system for quantum sensors [4.5]
レーザの周波数ノイズを抑制するための2つの一般的な方法は、ロックイン法でレーザーを原子遷移にロックするか、PDH法で超低熱膨張(ULE)ガラス空洞にロックすることである。この研究は、Rydberg原子超ヘテロダイン受信機のような多くの量子センシングアプリケーションにおいて、ULEキャビティへのロックと同じ性能を実現することを実証している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:33:19 GMT)
ADAPT to Robustify Prompt Tuning Vision Transformers [4.5]
本稿では,アダプティブ・チューニング・パラダイムにおける適応的対角訓練を行うための新しいフレームワークであるADAPTを紹介する。提案手法は,パラメータの1%だけを調整し,フルモデルファインチューニングによる40%のSOTAロバストネスの競合ロバスト精度を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:13:40 GMT)
CLASSLA-web: Comparable Web Corpora of South Slavic Languages Enriched with Linguistic and Genre Annotation [4.5]
本稿では,スロベニア人,クロアチア人,ボスニア人,モンテネグロ人,セルビア人,マケドニア人,ブルガリア人のウェブコーパスを比較検討する。これらのコーパスの収集には、合計で2600万件の文書から13億件のトークンが含まれている。全てのコーパスは、最先端のCLASSLA-Stanza言語処理パイプラインに言語的に注釈付けされていた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:30:47 GMT)
Digital Wellbeing Redefined: Toward User-Centric Approach for Positive Social Media Engagement [4.4]
本稿では、ポジティブなソーシャルメディア体験を促進することに焦点を当てた新しい視点を紹介する。 PauseNowは、ユーザのデジタル行動と意図を一致させるために設計された、革新的なデジタルウェルビーイングの介入である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:30:12 GMT)
Semantic Layering in Room Segmentation via LLMs [4.3]
SeLRoSは、Large Language Models (LLM) と従来の2次元マップベースのセグメンテーションを統合することによって、セマンティックルームセグメンテーションの高度な手法である。セグメント化された各領域に関する複雑な情報を解釈し、整理する新しいフレームワークを提供する。 SeLRoSの有効性は30種類の異なる3D環境にまたがって検証される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:23:44 GMT)
When Do "More Contexts" Help with Sarcasm Recognition? [4.3]
我々は、モデルにより多くのコンテキストを組み込むことによって、既存のメソッドがもたらす改善について検討する。 3つのサルカズム認識ベンチマークに対する4つのアプローチによる評価では、既存の最先端性能を実現する。我々は、より多くのコンテキストを使用することの固有の欠点を特定し、モデルが社会的バイアスを採用する必要があることを強調した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:01:02 GMT)
Towards Dense and Accurate Radar Perception Via Efficient Cross-Modal Diffusion Model [4.3]
本稿では, クロスモーダル学習による高密度かつ高精度なミリ波レーダポイント雲構築手法を提案する。具体的には, 2組の生レーダデータからLiDARのような点雲を予測するために, 生成モデルにおける最先端性能を有する拡散モデルを提案する。提案手法をベンチマーク比較と実世界の実験により検証し,その優れた性能と一般化能力を実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:25:20 GMT)
Optimal Single-Shot Decoding of Quantum Codes [4.2]
本稿では, 量子カルダーバンク・ソー・ステーン符号の単一ショット復号と故障症候群の測定について論じる。コードのパリティチェックマトリックスに冗長な行を追加することで、追加のシンドロームエラー訂正コードを得る。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:53:56 GMT)
Advancing Explainable Autonomous Vehicle Systems: A Comprehensive Review and Research Roadmap [4.2]
本研究は、説明生成とプレゼンテーションに関連する複雑さについて論じるものである。私たちのロードマップは、責任ある研究とイノベーションの原則によって支えられています。これらの研究の方向性を探ることで、説明可能なAVの開発と展開の指針となる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:43:41 GMT)
Information decomposition in complex systems via machine learning [4.2]
機械学習を用いて、各測定値の損失圧縮を共同最適化することにより、一連の測定値に含まれる情報を分解する。我々は, 塑性変形を受ける回路とアモルファス材料という, 2つのパラダイム的複雑系に着目した解析を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:36:47 GMT)
Professional Insights into Benefits and Limitations of Implementing MLOps Principles [4.2]
機械学習オペレーション(MLOps)は、マシンラーニングアプリケーションのデプロイとメンテナンスに開発、テスト、運用を組み合わせる一連のプラクティスとして登場した。オンライン教師あり学習におけるMLOps原則のメリットと限界を評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:40:41 GMT)
The Alignment Problem from a Deep Learning Perspective [4.0]
我々は、それを防ぐための十分な努力がなければ、AIGは人間の利益と矛盾する目標を追求することを学ぶことができると論じる。現代の最も有能なモデルのように訓練された場合、AGIはより高い報酬を受け取るために欺く行為を学ぶことができる。我々は、不整合AGIの展開が、世界における人類のコントロールを不可逆的に損なう可能性について、簡単に概説する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:07:47 GMT)
When Does Your Brain Know You? Segment Length and Its Impact on EEG-based Biometric Authentication Accuracy [4.0]
この研究は、EEGデータが認証目的の最大情報収率を提供するしきい値を特定することを目指している。この知見は非侵襲的生体計測技術の分野を推し進めるものである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:30:03 GMT)
AnimateDiff-Lightning: Cross-Model Diffusion Distillation [4.0]
AnimateDiff-Lightningを光速ビデオ生成用として提案する。本モデルは, プログレッシブ逆拡散蒸留法を用いて, 数ステップのビデオ生成における新しい最先端技術を実現する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:08:54 GMT)
Zeolite Adsorption Property Prediction using Deep Learning [3.9]
分子シミュレーションと比較して吸着特性が4～5桁高速なモデルを提案する。機械学習モデルから得られた予測はモンテカルロシミュレーションから得られた値と一致している。このモデルは, 吸着部位の同定に有効であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:49:08 GMT)
U-Net Kalman Filter (UNetKF): An Example of Machine Learning-assisted Ensemble Data Assimilation [3.8]
畳み込みニュートラルネットワーク(CNN)の一種であるU-Netを用いて,Ensemble Kalman Filter(EnKF)アルゴリズムの局所的なアンサンブル共分散を予測する。トレーニングされたU-Netは、U-Net Kalman Filter (UNetKF)実験において、フロー依存の局所化誤差共分散行列を予測するために使用される。 UNetKFの性能は、3DVar、En3DVar、EnKFと一致または超える。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:23:12 GMT)
VisionGPT: LLM-Assisted Real-Time Anomaly Detection for Safe Visual Navigation [3.8]
本稿では,画像ナビゲーションのためのゼロショット異常検出におけるLarge Language Modelsの可能性について検討する。提案フレームワークは,カメラキャプチャフレーム内の任意の障害を含む異常を識別し,異常を強調した簡潔な音声記述を生成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:55:39 GMT)
Gaussian Process Neural Additive Models [3.8]
ランダムフーリエ特徴を用いたガウス過程の単一層ニューラルネットワーク構築を用いたニューラル付加モデル(NAM)の新たなサブクラスを提案する。 GP-NAMは凸目的関数と、特徴次元と線形に成長する訓練可能なパラメータの数が有利である。 GP-NAMは,パラメータ数を大幅に削減して,分類タスクと回帰タスクの両方において,同等あるいはより優れた性能が得られることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:38:29 GMT)
Enhancing Multi-Domain Automatic Short Answer Grading through an Explainable Neuro-Symbolic Pipeline [3.7]
本稿では,正当性に基づく説明可能なASAGのためのニューロシンボリックモデルを提案する。我々のアプローチは、ショートアンサーフィードバックデータセットの最先端技術と比較してRMSEを0.24から0.3改善する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:40:52 GMT)
Tighter Confidence Bounds for Sequential Kernel Regression [3.7]
信頼性の強いバウンダリは、より優れた経験的パフォーマンスとより良いパフォーマンス保証を備えたアルゴリズムを生み出します。我々は、無限次元凸プログラムのマーチンゲールテール境界と有限次元再構成を用いて、シーケンシャルカーネル回帰のための新しい信頼境界を確立する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:47:35 GMT)
VQ-NeRV: A Vector Quantized Neural Representation for Videos [3.7]
Inlicit Neural representations (INR)は、ニューラルネットワーク内のビデオのエンコーディングに優れ、ビデオ圧縮やデノイングといったコンピュータビジョンタスクにおける約束を示す。本稿では,新しいコンポーネントであるVQ-NeRVブロックを統合した,高度なU字型アーキテクチャであるVector Quantized-NeRV(VQ-NeRV)を紹介する。このブロックには、ネットワークの浅い残差特徴とフレーム間の残差情報を効果的に識別するコードブック機構が組み込まれている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:19:07 GMT)
SIFT-DBT: Self-supervised Initialization and Fine-Tuning for Imbalanced Digital Breast Tomosynthesis Image Classification [3.7]
乳がん検診・診断において,Digital Breast Tomo synthesis (DBT) が広く用いられている。画像の異常を識別するために,ビューレベルのコントラスト型自己監督初期化とファインチューニングを用いた新しい手法を提案する。提案手法は92.69%の量的AUCを970のユニークな研究で評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:52:31 GMT)
Intention Action Anticipation Model with Guide-Feedback Loop Mechanism [3.7]
ビデオから人間の意図を予測するには、自動運転、ロボットアシスト技術、仮想現実などの幅広い応用がある。本研究では,人間の意図を示す行動を推定するために,エゴセントリックなビデオシーケンスを用いた意図的行動予測の問題に対処する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:21:12 GMT)
Transductive conformal inference with adaptive scores [3.6]
トランスダクティブな設定では、テストのサンプルとして$m$の新たなポイントが決定されます。本研究はP'olya urnモデルに従い, 実験分布関数の濃度不等式を確立することを目的とする。本研究では,2つの機械学習タスクに対して一様かつ不確率な保証を行うことにより,これらの理論的結果の有用性を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:19:22 GMT)
Optimizing edge state transfer in a Su-Schrieffer-Heeger chain via hybrid analog-digital strategies [3.6]
本稿では,SSHチェーンにおけるエッジ状態の非断熱的かつ高忠実な転送のために設計されたハイブリッドアナログデジタルプロトコルを提案する。サブラチテンAサイト間の次から次へと隣り合うホッピング項を支配的なCD駆動として同定し、変分量子回路を用いてそれらをさらに最適化する。このアナログデジタル転送プロトコルは、量子制御手法の拡張であり、エッジ状態転送のための堅牢なフレームワークを確立する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:18:12 GMT)
Answer Set Programming for Flexible Payroll Management [3.4]
我々は、clingo ASPシステムのマルチショット問題解決機能が、現実世界のインスタンスを扱うのに必要なパフォーマンスに到達するためにどのように使用できるかを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:24:49 GMT)
Hybrid Quantum Vision Transformers for Event Classification in High Energy Physics [3.4]
量子ベースのビジョントランスフォーマーモデルは、トレーニングと運用時間を短縮することでこの問題を軽減する可能性がある。我々は高エネルギー物理学における分類問題に対する量子ハイブリッド・ビジョン・トランスフォーマーのいくつかのバリエーションを構築した。以上の結果から,これらのハイブリッドモデルは,類似したパラメータを持つ古典的アナログに匹敵する性能を達成できることが示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:32:26 GMT)
Large Language Models to Generate System-Level Test Programs Targeting Non-functional Properties [3.3]
本稿では,テストプログラムを生成するためのLarge Language Models (LLM)を提案する。我々は、DUTの非機能特性を最適化するために、事前訓練されたLLMがテストプログラム生成でどのように機能するかを、一目で見てみる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:30:21 GMT)
Recursive Quantum Relaxation for Combinatorial Optimization Problems [3.3]
既存の量子最適化手法のいくつかは、最適量子状態から最も高い確率で測定される二項解を求める解法に統一可能であることを示す。テンソルネットワーク技術を用いたMAX-CUT問題における数百ノードの標準ベンチマークグラフの実験は、RQRAOがゴーマン-ウィリアムソン法より優れ、最先端の古典的解法に匹敵することを示した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:07:39 GMT)
Semisupervised score based matching algorithm to evaluate the effect of public health interventions [3.2]
1対1のマッチングアルゴリズムでは、マッチする多数の"ペア"は、大きなサンプルからの情報と多数のタスクの両方を意味する可能性がある。本稿では,2次スコア関数 $S_beta(x_i,x_j)= betaT (x_i-x_j)(x_i-x_j)T beta$ に基づく新しい1対1マッチングアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:24:16 GMT)
A Reinforcement Learning Approach to Dairy Farm Battery Management using Q Learning [3.1]
本研究は, 乳園における電池充電と排出をスケジューリングするQラーニングに基づくアルゴリズムを提案する。提案アルゴリズムは, 送電網からの電力輸入コストを13.41%削減し, ピーク需要を2%削減し, 24.49%削減する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:53:16 GMT)
A Parallel Workflow for Polar Sea-Ice Classification using Auto-labeling of Sentinel-2 Imagery [3.1]
本研究は, 極海氷をセンチネル2画像で分類する, 堅牢で効果的でスケーラブルなシステムを開発することを目的とする。 1つの大きな障害は、基礎となる真実として振る舞うためのラベル付きS2トレーニングデータ(イメージ)がないことである。そこで本研究では,S2画像のセグメンテーションと自動ラベル付けを行う,スケーラブルで高精度な手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:10:50 GMT)
Electioneering the Network: Dynamic Multi-Step Adversarial Attacks for Community Canvassing [3.1]
我々は,ネットワーク上の動的プロセスとして,GNNに対する勾配に基づく攻撃を可能としたコミュニティキャンバスをモデル化する。 MBACC問題はNP-Hardであり,その対策として動的マルチステップ・コミュニティ・キャンバスリング(MAC)を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:14:24 GMT)
Most Likely Sequence Generation for $n$-Grams, Transformers, HMMs, and Markov Chains, by Using Rollout Algorithms [3.0]
本稿では,ChatGPTの基盤となるような$n$-gram構造を持つ変換器について考察する。変換器は、単語列を生成するために使用できる次の単語確率を提供する。これらの確率に基づいて,確率の高い単語列の計算方法を検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:58:46 GMT)
MCRAGE: Synthetic Healthcare Data for Fairness [3.0]
医療データセットは、人種や民族、性別、年齢などのセンシティブな属性の観点から、しばしば不均衡である。そこで本稿では,MCRAGE (Generative Modeling) の強化による不均衡データセットの増大によるマイノリティクラス再バランスを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:34:10 GMT)
MATHSENSEI: A Tool-Augmented Large Language Model for Mathematical Reasoning [2.9]
数学的推論のためのツール強化された大規模言語モデルMATHSENSEIを提案する。数学的推論データセットの評価を通じて,これらのツールの補足的メリットについて検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:25:40 GMT)
Train Ego-Path Detection on Railway Tracks Using End-to-End Deep Learning [2.9]
本稿では,「列車エゴパス検出」の課題を紹介する。列車の直進経路、すなわち「エゴパス」を、潜在的に複雑でダイナミックな鉄道環境の中で特定することを目的としている。私たちの研究の中心は、エゴパス検出に適したエンドツーエンドのディープラーニングフレームワークであるTEP-Netです。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:46:32 GMT)
Single-Shot Readout and Weak Measurement of a Tin-Vacancy Qubit in Diamond [2.8]
ダイヤモンド(SnV$-$)の負電荷のスズ空洞は、次世代の長距離量子ネットワークを構築するための新興プラットフォームである。ここでは、1つのSnV$-$電子スピンと8.4%の単発読み出し忠実度の測定を実演する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:20:45 GMT)
Exploring the Impact of Large Language Models on Recommender Systems: An Extensive Review [2.8]
本稿では,リフォームレコメンダシステムにおける大規模言語モデルの重要性について述べる。 LLMは、言葉の複雑な解釈において、その適応性を示す、アイテムを推薦するのに非常に熟練している。トランスフォーメーションの可能性にもかかわらず、入力プロンプトに対する感受性、時には誤解釈、予期せぬ推奨など、課題は続いている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:56:40 GMT)
LLMs as Hackers: Autonomous Linux Privilege Escalation Attacks [2.8]
侵入テストにより、組織はシステム内の脆弱性を積極的に識別し、修正することができる。浸透試験の領域における最近の進歩の1つは言語モデル(LLM)の利用である。 LLMと浸透試験の交差点を探索し、特権拡大の文脈におけるそれらの能力と課題について考察する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:23:07 GMT)
Investigating Text Shortening Strategy in BERT: Truncation vs Summarization [2.8]
本研究は,テキスト分類作業における文書トランケーションと要約の性能について検討する。インドネシアのニュース記事に基づく要約タスクのデータセットを用いて分類試験を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:01:14 GMT)
Preventing Eviction-Caused Homelessness through ML-Informed Distribution of Rental Assistance [2.7]
われわれはアレゲニー郡と共同で、将来のホームレスのリスクに基づいて退去に直面している個人を優先する、積極的なアロケーションアプローチを模索した。州と郡の行政データを用いて、支援が必要な個人を正確に識別するシステムでは、人種や性別を問わず公平かつ公平でありながら、より単純な優先順位付けアプローチを少なくとも20%向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:09:41 GMT)
Conformal Monte Carlo Meta-learners for Predictive Inference of Individual Treatment Effects [2.7]
本稿では,個別化意思決定に有用な予測分布を創出する手法を提案する。結果の雑音分布に関する特定の仮定が,これらの不確実性予測にどのように影響するかを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:42:48 GMT)
A fast Multiplicative Updates algorithm for Non-negative Matrix Factorization [2.6]
本稿では,各サブプロブレムに対してヘッセン行列のより厳密な上界を構築することにより,乗法更新アルゴリズムの改善を提案する。コンバージェンスはまだ保証されており、我々は実際に合成と実世界の両方のデータセットで、提案したfastMUアルゴリズムが通常の乗算更新アルゴリズムよりも数桁高速であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:10:18 GMT)
Probabilistic Circuits with Constraints via Convex Optimization [2.6]
提案手法は,PCと制約の両方を入力とし,制約を満たす新しいPCを出力する。実証的な評価は、制約とPCの組み合わせには複数のユースケースが存在することを示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:55:38 GMT)
AI-enhanced Collective Intelligence: The State of the Art and Prospects [2.5]
人間とAIは、人間またはAIの集団的能力を単独で超える補完的能力を持っている。本稿では,人間-AI集団知能の多層表現を概念化するために,ネットワーク科学からの視点を取り入れた。エージェントの多様性と相互作用がシステムの集合的知性にどのように影響するかを考察する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:12:24 GMT)
Topologically protected negative entanglement [2.5]
ギャップレス2次元平面バンドは、新しい$Ssim -L_z2log L$絡み合い挙動を示す。我々の発見は、従来のトポロジ的絡み合いエントロピーの概念とは無関係なトポロジと絡み合いの新たな相互作用に光を当てている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:40:03 GMT)
A Study of Vulnerability Repair in JavaScript Programs with Large Language Models [2.5]
大規模言語モデル(LLM)は、複数のドメインにまたがる大幅な進歩を示している。実世界のソフトウェア脆弱性に関する我々の実験によると、LLMはJavaScriptコードの自動プログラム修復において有望であるが、正しいバグ修正を達成するには、しばしばプロンプトで適切なコンテキストを必要とする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:04:03 GMT)
Creativity and Machine Learning: A Survey [2.5]
機械学習とクリエイティビティの分野への関心が高まっている。本稿では,計算創造理論の歴史と現状について概説する。この分野における重要な貢献について批判的な議論を行った後、この分野における現在の研究課題と新たな機会について概説する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:00:02 GMT)
Efficient thermalization and universal quantum computing with quantum Gibbs samplers [2.4]
物質の熱状態の調製は量子シミュレーションにおいて重要な課題である。以上の結果より, 関連する浄化液や熱場二重状態の効率的な断熱調製法が示された。準局所散逸進化の族は、量子多体興味の大規模なクラスを効率的に準備する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:49:25 GMT)
RASP: A Drone-based Reconfigurable Actuation and Sensing Platform Towards Ambient Intelligent Systems [2.3]
RASPは、ドローンがセンサーやアクチュエータをわずか25秒で自動的に交換することを可能にする。 RASPは、センサモジュールを物理的に交換するメカニカル層と、センサ/アクチュエータへの電力線と通信線を維持する電気層と、当社のプラットフォーム内の任意のセンサーモジュールとの共通インターフェースを維持するソフトウェア層から構成される。 RASPは、家庭、オフィス、研究室、その他の屋内環境において、様々な有用なタスクを可能にすることを実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:57:32 GMT)
Guiding Masked Representation Learning to Capture Spatio-Temporal Relationship of Electrocardiogram [2.3]
本稿では,ST-MEM(S-Temporal Masked Electrocardiogram Modeling)を提案する。 ST-MEMは、不整脈に対する様々な実験的設定において、他のSSLベースラインメソッドよりも優れている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:17:00 GMT)
Simple Hack for Transformers against Heavy Long-Text Classification on a Time- and Memory-Limited GPU Service [2.3]
インドネシアでは、トランスフォーマーを用いた長文の分類ではごくわずかしか見つからなかった。本研究では,18kのニュース記事を用いて,トークンの出力長に基づいた事前学習モデルの使用を推奨する手法を検討する。句読点と低頻度の単語を保ちながら、停止語を削除することが、最良のハックであることに気付きました。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:17:25 GMT)
Fermionic quantum computation with Cooper pair splitters [2.2]
量子ビットではなく局所フェルミオンモード(LFM)を用いる普遍量子コンピュータの実践的実装を提案する。デバイスレイアウトは、ハイブリッド超伝導島で結合された量子ドットトンネルと、ドット間の可変容量結合からなる。クーパー対分割、弾性コツネリング、クーロン相互作用のコヒーレント制御により、量子ゲートの普遍的な集合を実装することができることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:32:28 GMT)
A Semi-automatic Cranial Implant Design Tool Based on Rigid ICP Template Alignment and Voxel Space Reconstruction [2.1]
頭蓋形成術は頭蓋移植を用いた神経頭蓋修復術だ近年の進歩にもかかわらず、患者固有のインプラント(PSI)の設計は、頭蓋形成術において最も複雑で、高価で、かつ、最も自動化されていないタスクである。半自動インプラント生成に適したグラフィカルユーザインタフェース(UI)を備えたプロトタイプアプリケーションを作成した。提案したインプラント生成プロセスの概略は、関心領域を設定し、テンプレートを整列させ、その後、ボクセル空間にインプラントを作成することである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:24:05 GMT)
Learning Weakly Convex Sets in Metric Spaces [2.1]
機械学習理論における中心的な問題は、ゼロエラーを持つ一貫した仮説を効率的に見つけることができるかどうかである。このアルゴリズムの一般的な考え方は、弱凸仮説の場合にまで拡張可能であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:02:11 GMT)
FedSR: A Semi-Decentralized Federated Learning Algorithm for Non-IIDness in IoT System [2.0]
IoT(Industrial Internet of Things)では、大量のデータが毎日生成される。プライバシーとセキュリティの問題により、これらのデータをまとめてディープラーニングモデルをトレーニングすることは困難である。本稿では,集中型フェデレーション学習と分散型フェデレーション学習を組み合わせて,半分散型クラウドエッジデバイス階層型フェデレーション学習フレームワークを設計する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:34:01 GMT)
A Benchmark for Data Management Challenges in Microservices [1.9]
コアデータ管理の課題を取り入れた,マイクロサービスベンチマークであるOnline Marketplaceを紹介します。これらの課題には、トランザクション処理、クエリ処理、イベント処理、制約執行、データレプリケーションなどが含まれる。提案するベンチマークは,マイクロサービス実践者の期待に応えるために,将来のデータシステムの設計を容易にするものだ。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:14:48 GMT)
Resolution- and Stimulus-agnostic Super-Resolution of Ultra-High-Field Functional MRI: Application to Visual Studies [1.8]
高分解能fMRIは脳のメソスケール組織への窓を提供する。しかし、高い空間分解能はスキャン時間を増加させ、低信号とコントラスト-ノイズ比を補う。本研究では,fMRIのための深層学習に基づく3次元超解像法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:53:39 GMT)
Enhancing Security of AI-Based Code Synthesis with GitHub Copilot via Cheap and Efficient Prompt-Engineering [1.8]
開発者や企業がその潜在能力を最大限に活用することを避けている理由の1つは、生成されたコードに対する疑わしいセキュリティである。本稿ではまず,現状を概観し,今後の課題について述べる。我々は、GitHub CopilotのようなAIベースのコードジェネレータのコードセキュリティを改善するために、プロンプト変換手法に基づく体系的なアプローチを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:13:33 GMT)
A Hybrid Transformer-Sequencer approach for Age and Gender classification from in-wild facial images [1.8]
本稿では,年齢と性別の分類問題に対する自己意識とBiLSTMアプローチを組み合わせたハイブリッドモデルを提案する。提案モデルでは, 年齢と性別の分類のための最先端実装に比べて, 約10%, 6%の改善が注目されている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:40:06 GMT)
A Laboratory Experiment on Using Different Financial-Incentivization Schemes in Software-Engineering Experimentation [1.7]
金融インセンティブの異なるスキームが開発者に与える影響について検討する。提案手法は,ソフトウェア工学実験における参加者のパフォーマンスに影響を及ぼす可能性が示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:45:02 GMT)
A Big Data Analytics System for Predicting Suicidal Ideation in Real-Time Based on Social Media Streaming Data [1.7]
本稿では,ソーシャルメディアコンテンツからの自殺思考を予測するため,ビッグデータアーキテクチャに基づく新しい手法を提案する。提案手法は、バッチ処理とリアルタイムストリーミング予測という2つのフェーズで、ソーシャルメディアデータの実用的な分析を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:46:52 GMT)
Regularization in Spider-Style Strategy Discovery and Schedule Construction [1.6]
本稿では,ヴァンパイア証明のための大規模実験について報告する。アンドレイ・ヴォロンコフ(Andrei Voronkov)のシステムスパイダー(Spider)のアイデアに基づいてスケジュールを構築する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:12:25 GMT)
JaxUED: A simple and useable UED library in Jax [1.6]
本稿では,最新のUnsupervised Environment Design (UED) アルゴリズムの依存性を最小限に抑えるオープンソースライブラリであるJaxUEDを紹介する。 cleanRLにインスパイアされた我々は、高速で、明確で、理解しやすく、容易に変更可能な実装を提供し、UEDの研究を加速することを目的としている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:40:50 GMT)
Multi-View Video-Based Learning: Leveraging Weak Labels for Frame-Level Perception [1.6]
本稿では,フレームレベルの認識に弱いラベルを持つビデオベースの行動認識モデルを訓練するための新しい学習フレームワークを提案する。弱いラベルを用いてモデルを訓練するために,新しい潜在損失関数を提案する。また、下流フレームレベルの行動認識および検出タスクにビュー固有の潜伏埋め込みを利用するモデルを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:49:31 GMT)
DeblurDiNAT: A Lightweight and Effective Transformer for Image Deblurring [1.5]
実世界のぼやけた画像からクリーンな画像を効率よく復元する小型エンコーダデコーダトランスであるDeblurDiNATを提案する。我々は,グローバルな特徴学習を目的とした交互拡張因子構造を採用する。我々の空間効率と時間節約法は、パラメータが3%-68%少ないより強力な一般化能力を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:31:31 GMT)
Physics-Guided Neural Networks for Intraventricular Vector Flow Mapping [1.5]
心内ベクターフローマッピング(iVFM)は、心臓画像におけるカラードプラの増強と定量化を目的としている。物理インフォームドニューラルネットワーク(PINN)と物理誘導型nnU-Netに基づく教師付きアプローチを用いて,従来のiVFM最適化方式に代わる新しい手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:35:17 GMT)
Open Stamped Parts Dataset [1.4]
自動車製造のための切削された金属シートの合成と実像を特徴とするOpen Stamped Partsデータセット(OSPD)を提示する。実際の写真は7台のカメラから撮影され、7,980枚の未ラベル画像と1,680枚のラベル画像で構成されている。合成データは、訓練用画像7,980枚、検証用画像1,680枚、テスト用画像1,680枚を含む。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:08:39 GMT)
Function Trees: Transparent Machine Learning [1.4]
このような関数のグローバルな性質を知ることは、データを生成するシステムを理解するのに役立つ。関数ツリーは、関数のメインとインタラクションのすべての効果を素早く識別し、計算するために使用することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:23:31 GMT)
Prompt-based Graph Model for Joint Liberal Event Extraction and Event Schema Induction [1.3]
イベントは、エンティティの状態の変化を記述する、スピーチとテキストの不可欠なコンポーネントである。イベント抽出タスクは、イベントを特定して分類し、イベントスキーマに従って参加者を見つけることを目的としている。研究者らは、イベント抽出とイベントスキーマの同時発見を目的とした、リベラルイベント抽出(LEE)を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:56:42 GMT)
GraphERE: Jointly Multiple Event-Event Relation Extraction via Graph-Enhanced Event Embeddings [1.3]
イベント関係抽出は自然言語を理解するために重要である。本稿では,Graph-enhanced Event Embeddingsに基づく共同で複数のEREフレームワークであるGraphEREを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:50:32 GMT)
RGBD GS-ICP SLAM [1.3]
一般化反復閉点(G-ICP)と3次元ガウススプラッティング(DGS)を融合した新しい密度表現SLAM手法を提案する。実験の結果,提案手法の有効性が示され,非常に高速な107 FPSが得られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:49:48 GMT)
Average circuit eigenvalue sampling on NISQ devices [1.2]
平均回路固有値サンプリング (ACES) はFlamia が arXiv:2108.05803 で導入した。この作業は、実際のデバイス向けのACESの完全な実装を示し、Superstaq arXiv:2309.05157にデプロイすることで、この方向に進んでいる。シミュレーションの結果,ACES は 1-および 2-qubit の非一様パウリ誤差チャネルを平均固有値絶対誤差$0.003$ 以下と推定できることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:02:35 GMT)
Mitigating Over-Smoothing and Over-Squashing using Augmentations of Forman-Ricci Curvature [1.1]
スケーラブルな曲率表記法であるAFRC(Augmented Forman-Ricci curvature)に基づく書き換え手法を提案する。 AFRCはメッセージパッシングGNNにおける過剰なスムースと過剰なスキャッシング効果を効果的に特徴付ける。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:11:25 GMT)
Enhanced Scalability in Assessing Quantum Integer Factorization Performance [1.1]
本章では、Shorのアルゴリズムを用いて整数分解タスクに必要な時間を分析することを目的とする。 Shorのアルゴリズムにおけるパラメータ事前選択の影響も観察する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:26:16 GMT)
How Spammers and Scammers Leverage AI-Generated Images on Facebook for Audience Growth [1.0]
スパマーや詐欺師は、すでにAI生成画像を使ってFacebook上で大きな注目を集めている。時には、Facebook Feedは未ラベルのAI生成画像をPagesにフォローせず、画像がAI生成であることを認識していないユーザーに推奨している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:43:16 GMT)
Castor: Competing shapelets for fast and accurate time series classification [0.9]
Castorは単純で効率的で正確な時系列分類アルゴリズムである。いくつかの最先端の分類器よりもはるかに正確な変換が得られることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 22:05:32 GMT)
A Trainable Feature Extractor Module for Deep Neural Networks and Scanpath Classification [0.9]
このモジュールの目的は、ディープニューラルネットワークアーキテクチャに直接使用可能な機能ベクトルにスキャンパスを変換することである。我々の特徴抽出モジュールはディープニューラルネットワークと共同で訓練可能である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:02:06 GMT)
GeoShapley: A Game Theory Approach to Measuring Spatial Effects in Machine Learning Models [0.9]
GeoShapleyは、機械学習モデルにおける空間効果を測定するゲーム理論のアプローチである。 GeoShapleyはモデルに依存しないアプローチであり、統計モデルやブラックボックス機械学習モデルに適用することができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:41:44 GMT)
HuLP: Human-in-the-Loop for Prognosis [0.9]
HuLPはHuman-in-the-Loop for Prognosisモデルであり、臨床コンテキストにおける予後モデルの信頼性と解釈性を高めるために設計された。我々は,HuLPの優位性を示すために,実世界の2つの公開医療データセットを用いて実験を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:15:15 GMT)
Embarrassingly Simple Scribble Supervision for 3D Medical Segmentation [0.8]
この課題の解決策として、スクリブル教師付き学習が登場し、大規模なデータセットを作成する際のアノテーションの労力の削減を約束する。そこで本研究では,解剖学と病理学の多様さを網羅した7つのデータセットからなるベンチマークを提案する。 nnU-Netを用いた評価の結果,既存の手法の多くは一般化の欠如に悩まされているが,提案手法は一貫して最先端の性能を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:41:16 GMT)
Yet Another ICU Benchmark: A Flexible Multi-Center Framework for Clinical ML [0.8]
Another ICU Benchmark (YAIB) は、再現性と同等の臨床ML実験を定義するためのモジュラーフレームワークである。 YAIBは、ほとんどのオープンアクセスICUデータセット(MIMIC III/IV、eICU、HiRID、AUMCdb)をサポートし、将来のICUデータセットに容易に適応できる。データセットの選択,コホート定義,前処理が予測性能に大きな影響を及ぼすことを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:39:03 GMT)
Electrical readout of spins in the absence of spin blockade [0.8]
半導体ナノ構造では、スピン遮断(SB)は電子スピンの読み出しの最もスケーラブルな機構である。本稿では,SB昇降機構が支配的である場合でもスピン状態の読み出しを行うため,2スピン系の偏光性に依存する手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:36:31 GMT)
Review of Generative AI Methods in Cybersecurity [0.7]
本稿では、Generative AI(GenAI)の現状について概観する。暴行、脱獄、即時注射と逆心理学の応用をカバーしている。また、サイバー犯罪におけるGenAIのさまざまな応用として、自動ハッキング、フィッシングメール、ソーシャルエンジニアリング、リバース暗号、攻撃ペイロードの作成、マルウェアの作成などを提供している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:21:20 GMT)
Fundamental limitations on the recoverability of quantum processes [0.7]
我々は、任意の量子スーパーチャネルの作用の下で、量子チャネルの量子相対エントロピーの単調性不等式を強化することにより、量子チャネルのデータ処理の不等式を洗練する。我々は、任意の量子チャネルのエントロピーが非減少する作用の下で、量子サブユニットチャネルの量子スーパーチャネルアナログであるように見える量子スーパーチャネルのクラスを同定する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:50:24 GMT)
Can AI Outperform Human Experts in Creating Social Media Creatives? [0.7]
本稿では,人間専門家と比較して,創造領域におけるAIの能力を評価する。本稿では,大規模言語モデルによる迅速な拡張を通じて,ソーシャルメディアの創造性を創出するための新しいPrompt-for-Promptを提案する。 AIは人間のエキスパートに優れており、Midjourneyは他のテキストから画像へのジェネレータよりも優れている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:41:45 GMT)
Pragmatic Competence Evaluation of Large Language Models for Korean [0.7]
本研究は,韓国語におけるLarge Language Models(LLMs)の実用的能力について考察する。我々は、自動評価に適応した従来のMCQフォーマットと、OEQ(Open-Ended Questions)の2つの異なる評価設定を採用している。その結果, GPT-4 は, MCQ と OEQ でそれぞれ81.11 と85.69 を, 韓国向けに最適化された LLM HyperCLOVA X では81.56 のスコアを, GPT-4 と比較して4.13 のスコアで比較した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:21:20 GMT)
Depth-guided NeRF Training via Earth Mover's Distance [0.7]
我々は、NeRF監視のための深度における不確実性に対する新しいアプローチを提案する。既訓練拡散モデルを用いて,デノナイジング過程における深度予測と不確かさの把握を行う。我々の深度誘導型NeRFは、標準深度測定値のすべてのベースラインを大きなマージンで上回る。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:54:07 GMT)
FUELVISION: A Multimodal Data Fusion and Multimodel Ensemble Algorithm for Wildfire Fuels Mapping [0.7]
森林調査計画(FIA)データを用いて「スコットとバーガン40」のようなランドスケープスケールの燃料を推定するために,アンサンブルモデルを訓練した。 Pseudo-labeled and fully synthetic datasets were developed using Generative AI approach to address the limit of ground truth data available。ディープラーニングニューラルネットワーク、決定木、勾配向上など、一連の手法を使用することで、燃料マッピングの精度は80%近く向上した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:20:46 GMT)
The status of the quantum PCP conjecture (games version) [0.6]
多重対数的に長いメッセージを持つ多目的対話型証明システムはREにおける任意の決定問題を解くことができることを示す。本稿では,(1)標準AM完全問題に対する効率的なプロバーを用いた簡潔なMIP*プロトコルを新たに構築し,(2)ナタラジャンとヴィディックのエネルギー増幅手順における誤差を説明する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:30:32 GMT)
A tweezer array with 6100 highly coherent atomic qubits [0.5]
我々は約12,000の場所で6,100個の中性原子をトラップする光学的ツイーザーを実験的に実現した。また、光ツイーザアレイにおける超微細量子ビットの記録である12.6(1)秒のコヒーレンス時間を示す。我々の結果は、他の最近の発展とともに、1万の原子量子ビットを持つ普遍量子コンピューティングが近い将来の展望であることを示している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:43:58 GMT)
The Emergence of Hardware Fuzzing: A Critical Review of its Significance [0.5]
ソフトウェアテスト方法論にインスパイアされたハードウェアファジングは、複雑なハードウェア設計におけるバグを識別する効果で有名になった。様々なハードウェアファジィ技術が導入されたにもかかわらず、ハードウェアモジュールのソフトウェアモデルへの非効率な変換などの障害は、その効果を妨げている。本研究は,脆弱性の同定における既存のハードウェアファジィング手法の信頼性を検証し,今後の設計検証技術の進歩に向けた研究ギャップを同定する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:12:11 GMT)
Automatic Information Extraction From Employment Tribunal Judgements Using Large Language Models [0.5]
本稿では,大規模言語モデルであるGPT-4の英国雇用裁判所事件からの自動情報抽出への応用について述べる。手動検証プロセスを用いて臨界情報を抽出する際のGPT-4の性能を慎重に評価した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:43:08 GMT)
Cryptographic Censorship [0.5]
我々は弱宇宙検閲予想の量子バージョンを証明した。我々は特異点を古典的、半プランク語型、プランク語型に分ける。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:19:05 GMT)
Re-identification from histopathology images [0.4]
本研究は, 比較的単純な深層学習アルゴリズムでも, 大規模な病理組織学データセットの患者を相当精度で再同定できることを実証する。本研究は, 患者プライバシに対するリスク評価手法について, 発表前のリスク評価手法を定式化した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:15:19 GMT)
Hybrid Quantum Solvers in Production: how to succeed in the NISQ era? [0.4]
我々は、最も頻繁に使用されるハイブリッド・ソルバについて記述し分類する。現在実運用にデプロイされている2つの解決器に特化しています。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:00:08 GMT)
Komodo: A Linguistic Expedition into Indonesia's Regional Languages [0.4]
コモド7Bはインドネシア語、英語、11の地域言語をシームレスに運営している。 Komodo-7B-Instructは様々なタスクや言語で最先端のパフォーマンスを達成することで際立っている。言語モデルの発展への我々のコミットメントは、限られた言語資産を持つ人々のギャップを埋めることを目的として、十分なリソースを持つ言語を超えて拡張されます。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:49:01 GMT)
Evaluation of GlassNet for physics-informed machine learning of glass stability and glass-forming ability [0.4]
ガラスの安定性(GS)を計算するのに必要な特性温度を予測できるオープンソースのトレーニング済みNNモデルGlassNetの適用について検討する。本研究では,これらの予測と組み合わせてGSの予測を行い,ランダムな森林モデルがGlassNetに類似した精度を提供することを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:37:39 GMT)
Emotic Masked Autoencoder with Attention Fusion for Facial Expression Recognition [0.3]
本稿では,MAE-Face self-supervised learning (SSL) 法とFusion Attention Mechanismを併用した表現分類手法を提案する。そこで本研究では,顔の特徴を強調する前処理手法を提案し,トレーニングと検証の双方におけるモデル性能を向上させる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:21:47 GMT)
Stochastic Halpern iteration in normed spaces and applications to reinforcement learning [0.3]
基礎となるオラクルが一様有界であれば,本手法は全体のオラクル複雑性が$tildeO(varepsilon-5)$であることを示す。平均報酬と割引報酬を決定するための新しい同期アルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 01:07:35 GMT)
Divide and not forget: Ensemble of selectively trained experts in Continual Learning [0.3]
クラス増分学習は、モデルがすでに知っていることを忘れずに適用範囲を広げるのに役立つため、人気が高まっている。この領域のトレンドは、異なるモデルがタスクを解決するために一緒に働く、エキスパートの混合技術を使うことである。 SEEDは、考慮されたタスクに対して最も最適な専門家である1人だけを選択し、このタスクからのデータを使用して、この専門家のみを微調整する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:09:31 GMT)
TT-BLIP: Enhancing Fake News Detection Using BLIP and Tri-Transformer [0.3]
本稿では,統合視覚言語理解・生成(BLIP)のためのブートストラップ言語画像事前学習を適用した,TT-BLIPと呼ばれるエンドツーエンドモデルを提案する。マルチモーダル・トリ・トランスフォーマーは3種類のマルチヘッドアテンション機構を用いてトリモーダル特徴を融合し、拡張表現のための統合モーダル性を確保し、マルチモーダルデータ解析を改善した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:36:42 GMT)
Defining Effective Engagement For Enhancing Cancer Patients' Well-being with Mobile Digital Behavior Change Interventions [0.3]
デジタル行動変化介入(DBCI)は、新しい健康行動の開発を支援している。本研究は, がん患者の生活の質を高めるために, がん患者に対するDBCIの効果的な関与を定義することを目的とする。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:55:05 GMT)
Navigating Compiler Errors with AI Assistance - A Study of GPT Hints in an Introductory Programming Course [0.2]
大学における初等プログラミングコースにおけるAI支援学習の有効性について検討した。我々は、GPT-4モデルを用いて、プラットフォーム内のコンパイラエラーに対するパーソナライズされたヒントを生成し、プログラム割り当ての自動評価を行った。最も一般的な6種類のエラーに対して、実験グループでGPTヒントへのアクセスが可能になったときに、性能の点で混合結果が観察された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:54:14 GMT)
On Predictive planning and counterfactual learning in active inference [0.2]
本稿では,「計画」と「経験から学ぶ」に基づくアクティブ推論における2つの意思決定手法について検討する。これらの戦略間のデータ-複雑さのトレードオフをナビゲートする混合モデルを導入する。提案手法を,エージェントの適応性を必要とするグリッドワールドシナリオで評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:02:31 GMT)
Designing high-fidelity two-qubit gates between fluxonium qubits [0.2]
本稿では,フッソニウム量子ビット間の2量子ゲートを最小誤差,速度,制御の簡易化のために提案する。我々のアーキテクチャは、線形共振器を介して結合された2つのフラクソニウムからなる。オープンシステムの平均CZゲート不忠実度は70nsで1.86倍10-4$である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:13:50 GMT)
Strong coupling and single-photon nonlinearity in free-electron quantum optics [0.2]
自由電子ファイバーとは、自由電子が2つの誘導モードで共伝播する1次元フォトニックシステムである。我々は、決定論的単一光子放出や複素非線形多モードダイナミクスなど、我々のシステムにおけるいくつかの興味深い観測可能な量子効果を予測する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:05:56 GMT)
Fast Cell Library Characterization for Design Technology Co-Optimization Based on Graph Neural Networks [0.2]
設計技術の共同最適化(DTCO)は、最適パワー、性能、領域を達成する上で重要な役割を果たす。本稿では,高速かつ正確なセルライブラリ解析のためのグラフニューラルネットワーク(GNN)に基づく機械学習モデルを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:06:48 GMT)
The optimal placement of the head in the noun phrase. The case of demonstrative, numeral, adjective and noun [0.2]
言語において好まれる順序によって、名詞は終わりの1つに置かれる傾向があることを示す。我々はまた、アンチローカリティ効果の証拠も示している: 望ましい順序における構文依存は、偶然に予想されるよりも長い。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:57:20 GMT)
A Comparison of Deep Learning Architectures for Spacecraft Anomaly Detection [0.1]
本研究では,宇宙船データの異常検出における各種ディープラーニングアーキテクチャの有効性を比較することを目的とする。調査中のモデルには、畳み込みニューラルネットワーク(CNN)、リカレントニューラルネットワーク(RNN)、Long Short-Term Memory(LSTM)ネットワーク、Transformerベースのアーキテクチャなどがある。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:08:27 GMT)
Wildfire danger prediction optimization with transfer learning [0.0]
畳み込みニューラルネットワーク(CNN)は、様々なコンピュータ科学領域で実証されている。本稿では,山火事の影響地域を特定するための地理空間データ解析へのCNNの適用について検討する。伝達学習の統合により,CNNモデルは燃焼領域の同定において95%の精度を達成した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:15:44 GMT)
When Layers Play the Lottery, all Tickets Win at Initialization [0.0]
プルーニングはディープネットワークの計算コストを削減する手法である。そこで本研究では,プルーニング処理によって層が取り除かれた場合の当選チケットの発見を提案する。優勝チケットは特にトレーニングフェーズをスピードアップし、二酸化炭素排出量の最大51%を削減しています。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:08:25 GMT)
Vortex loop dynamics and dynamical quantum phase transitions in 3D fermion matter [0.0]
広い種類のフェルミオン格子モデルに対するグリーン関数の位相における渦特異点の挙動について検討する。渦の全集合が1次元の動的物体を形成しており、これをエンフォレテックスループ (enmphvortex loops) と呼ぶ。本研究は,非平衡系における動的順序パラメータの定義の開発に有用な知見を提供する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:51:49 GMT)
Vison condensation and spinon confinement in a kagome lattice $\mathbb{Z}_2$ spin liquid: A numerical study of a quantum dimer model [0.0]
我々は,カゴメ格子上のスピン液体$mathbbZ$(mathZ$SL)と価結合固体(VBS)の遷移について検討した。この遷移は、$mathbbZ$ スピン液体の弦のバイソン励起の凝縮によって引き起こされる。スピン液体状態のトポロジカル縮退は、ビソン凝縮と相まって持ち上げられることが観察された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:07:27 GMT)
Vertical Federated Image Segmentation [0.0]
本稿では,共通条件下で動作可能な,革新的な垂直統合学習(VFL)モデルアーキテクチャを提案する。これは、VFL環境の制約の下で動作し、名目上の精度を維持しながらイメージセグメンテーションを実行するシステムの最初の(そして現在唯一の)実装である。 CamVidデータセット上でテストを行い、フェデレート間の情報の転送に必要な重い特徴圧縮の影響を判定した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:07:40 GMT)
Using evolutionary computation to optimize task performance of unclocked, recurrent Boolean circuits in FPGAs [0.0]
FPGAにおける非時計型リカレントネットワークに対する別の学習手法を示す。ネットワークノードの機能の進化には,進化計算を用いる。画像分類タスクにおいて精度30%の精度向上が得られる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:11:00 GMT)
Universal role of curvature in vacuum entanglement [0.0]
適切な真空状態で量子場に結合した量子プローブ間の絡み合いにおける時空曲率の役割に関する普遍的な特徴を強調した。解析により, 前記パラメータ空間の特定の領域において, 曲率を時空曲率のプローブとして利用しやすくすることで, 絡み合い特性を誘導できることが示唆された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:31:58 GMT)
Ultra-High-Resolution Image Synthesis with Pyramid Diffusion Model [0.0]
ピラミッド拡散モデル (PDM) は超高分解能画像合成のために設計された新しいアーキテクチャである。 PDMは、2つの新しいデータセットで実証された2K解像度の画像を初めて合成する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:12:58 GMT)
Transfer in Sequential Multi-armed Bandits via Reward Samples [0.0]
UCBに基づくアルゴリズムにより、前回のエピソードからの報酬サンプルを転送し、全てのエピソードに対する累積的後悔性能を改善する。提案アルゴリズムは, トランスファーを伴わない標準的な UCB アルゴリズムに対して, 大幅な改善が見られた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:35:59 GMT)
Towards early fault tolerance on a 2$\times$N array of qubits equipped with shuttling [0.0]
局所的に相互作用する量子ビットの2次元グリッドは、フォールトトレラント量子コンピューティングのための有望なプラットフォームである。本稿では,そのような制約のあるアーキテクチャも耐障害性をサポートすることを示す。エラー訂正が可能であることを実証し、このプラットフォームに自然に適合するコードのクラスを特定する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:48:13 GMT)
Towards Unsupervised Question Answering System with Multi-level Summarization for Legal Text [0.0]
本稿では,SCaLARチームによるSemEval-2024 Task 5: Legal Argument Reasoning in Civil procedureについて要約する。ラベルを生成するための,単純ながら斬新な類似性と距離に基づく教師なしアプローチを提案する。調査では, マクロF1スコアが20ポイント上昇し, テストセットが10ポイント上昇した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:15:13 GMT)
Time correlations in atmospheric quantum channels [0.0]
リモートパーティ間での量子情報の効率的な転送は、大気チャネル上での量子通信にとって重要な課題である。チャネル透過率のランダム変動は、その実践上の大きな障害要因である。本研究では,異なるタイミングでチャネル透過率の相関について検討し,二つの伝送プロトコルに着目した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:11:54 GMT)
Thermal Crosstalk Modelling and Compensation Methods for Programmable Photonic Integrated Circuits [0.0]
我々は,統合可能フォトニックメッシュの異なる場所における熱クロストークの効果を予測するために,3つのモデルを訓練および実験的に評価した。クロストークによる波長シフトの補正によりモデルの有効性を実験的に検証する。我々は、トレーニングされていないチップの一部に対する熱クロストークの効果を予測・補償するために、モデルの1つの一般化能力を評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:19:54 GMT)
The Lyapunov exponent as a signature of dissipative many-body quantum chaos [0.0]
正のリャプノフ指数は放散多体量子カオスの定義的特徴である。正のリャプノフ指数は、放散多体量子カオスの定義的特徴であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:07:22 GMT)
The Journey to Trustworthy AI- Part 1: Pursuit of Pragmatic Frameworks [0.0]
本稿では,信頼に値する人工知能(TAI)とその様々な定義についてレビューする。我々は、TAIの代わりにResponsibleやEthical AIといった用語を使うことに反対する。代わりに、フェアネス、バイアス、リスク、セキュリティ、説明可能性、信頼性といった重要な属性や特性に対処するアプローチを提唱します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:27:04 GMT)
Survey of Methods, Resources, and Formats for Teaching Constraint Programming [0.0]
本報告は,トロントで開催されたCP 2023カンファレンスにおいて,2023年の教科制約プログラミングワークショップのコミュニティ調査に基づくものである。本稿では,本調査の結果に加えて,制約プログラミングを教えるための書籍,ビデオコース,その他のチュートリアル資料について紹介する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:27:01 GMT)
Supporting Energy Policy Research with Large Language Models [0.0]
国家再生可能エネルギー研究所(NREL)は最近、このニーズを満たすために、公共の風と太陽座データベースを導入した。本稿では,Large Language Models (LLMs) を用いて,法的文書からこれらのシッティング規則を抽出する手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:28:51 GMT)
Stronger Graph Transformer with Regularized Attention Scores [0.0]
最近、Graph Transformerと呼ばれるTransformerベースのGNNでは、長距離依存が存在する場合、優れたパフォーマンスが得られることが示されている。位置決めの必要性を緩和する「エッジ正規化技術」の新たなバージョンを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:57:19 GMT)
Strong mechanical squeezing in a microcavity with double quantum wells [0.0]
二色コヒーレント光で励起される移動端ミラーを空洞内に配置した2つの量子井戸からなるハイブリッド量子システムにおいて、機械共振器の圧縮状態の形成に対処する。このようなシステムの実用化には, 熱ゆらぎ対策の頑健さが重要であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:46:08 GMT)
Spectral Properties of Transverse Laguerre-Gauss Modes in Parametric Down-Conversion [0.0]
パラメトリックダウンコンバージョンにおけるラゲール・ガウスモードのスペクトル依存性について検討した。我々は、よく知られた軌道角運動量エンタングルメントの純度を調整するために、スペクトルと空間のカップリングをどのように利用できるかを示す。この研究は、横方向の単一モードにおける絡み合った光子の効率的な収集、量子イメージング、高次元量子情報処理のための工学的純粋状態に影響を及ぼす。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:44:55 GMT)
Social bots sour activist sentiment without eroding engagement [0.0]
ボットは、加熱されたオンライン期間に、その逆よりも人間の行動に大きな影響を及ぼすことがわかった。政治的妨害ボットは活動量を増やし、他のボットは活動量を減少させる。個々のボットの遭遇による影響は小さいように見えるが、ボットの通信量が多すぎるため、累積効果は深刻なものである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:58:45 GMT)
Short-Term Solar Irradiance Forecasting Under Data Transmission Constraints [0.0]
太陽放射の短期予測のためのデータ並列機械学習モデルについて報告する。平均絶対誤差は74.34$W/m2$であり、ベースラインは134.35$W/m2$である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:17:21 GMT)
Segment Anything for comprehensive analysis of grapevine cluster architecture and berry properties [0.0]
本研究では,2次元クラスタ画像における個々のベリーの同定において,SAMの精度が高いことを示す。ヒトの識別したベリーとSAMの予測の相関は非常に強い。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:37:18 GMT)
Riemannian Stochastic Gradient Method for Nested Composition Optimization [0.0]
この研究は、各函数が期待を含むリーマン多様体上のネスト形式の函数の構成の最適化を考える。このような問題は、強化学習における政策評価やメタラーニングにおけるモデルカスタマイズといった応用において人気が高まっている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:33:55 GMT)
Rethinking of Encoder-based Warm-start Methods in Hyperparameter Optimization [0.0]
本研究では,Liltabパッケージ内に実装されたデータセットのエンコーダに基づく新しい表現を提案する。一般表現は,要求が抽出中に明示的に考慮されないメタタスクでは十分でないことを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:47:44 GMT)
Reproducibility and Geometric Intrinsic Dimensionality: An Investigation on Graph Neural Network Research [0.0]
これらの努力に基づいて構築することは、マシンラーニングにおけるもうひとつの重要な課題、すなわち次元の呪いに向かっています。本研究は,機械学習モデルが学習対象のデータセットの拡張次元にどのような影響を受けているのかを,本質的な次元の密接な関連概念を用いて検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:54:22 GMT)
Reliable confidence regions for quantum tomography using distribution moments [0.0]
本稿では,量子トモグラフィーの精度の高い誤差バーを決定するための計算効率が高く信頼性の高い手法を提案する。我々は,クラウドアクセス可能な量子プロセッサを用いてシミュレーションと実演の両方を用いて,多数の量子トモグラフィープロトコルのアプローチをベンチマークした。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:52:33 GMT)
Quasi-exactly solvable potentials in Wigner-Dunkl quantum mechanics [0.0]
直線上のダンクル高調波発振器は準正確に解けるものに一般化できることが示されている。後者のハミルトニアンはまた、拡張ダンクル微分の観点からより単純な方法で書き換えることができる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:20:03 GMT)
Quantum dynamical maps for single-qubit gates under non-Markovian phase noise [0.0]
量子デバイスにおけるノイズはユビキタスであり、精度が必要な設定では一般的に有害である。ここでは、単一実験入力のみを必要とする単一キュービットゲートに対して、コンパクトな顕微鏡誤差モデルを導出する。ランダム化ベンチマークを用いて測定し,量子プロセストモグラフィーを用いて再構成した平均ゲート誤差の実験的推定は,解析的推定値によって厳しく下界していることがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:06:04 GMT)
Quantum Onsager relations [0.0]
定常状態に近い系の力学をモデル化するOnsagerレート方程式の量子一般化を導出する。電流を再定義することにより、詳細なバランスを仮定することなく対称輸送テンソルを持つ方程式のバージョンを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:50:11 GMT)
Quantifying the accuracy of steady states obtained from the Universal Lindblad Equation [0.0]
普遍リンドブラッド方程式(ULE)によって予測される定常予測値は、有界補正まで正確であることを示す。また、ULEの導出時に使用される準局所的な準局所的な「メモリ・フォーミング」変換を同定する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:10:33 GMT)
Python Fuzzing for Trustworthy Machine Learning Frameworks [0.0]
我々はSydr-Fuzzを用いたPythonプロジェクトの動的解析パイプラインを提案する。私たちのパイプラインにはファジング、コーパスの最小化、クラッシュトリアージ、カバレッジ収集が含まれています。機械学習フレームワークの最も脆弱な部分を特定するために、攻撃の潜在的な表面を分析し、PyTorchのファズターゲットとh5pyなどの関連プロジェクトを開発する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:41:11 GMT)
Purifying photon indistinguishability through quantum interference [0.0]
光子間の区別不可能性は、スケーラブルなフォトニック量子技術にとって重要な要件である。我々は、量子干渉の過程によって、部分的に区別可能な単一光子がほぼ一様となるように精製できることを実験的に実証した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:10:50 GMT)
Prototipo de video juego activo basado en una cámara 3D para motivar la actividad física en niños y adultos mayores [0.0]
本論文は,子どもと高齢者の身体活動を促進するためのゲームプロトタイプの開発について述べる。プロトタイプはラップトップと3Dセンサー付きカメラで構成され、好ましくは液晶スクリーンまたはプロジェクターを必要とする。このプロトタイプのプログラミングコンポーネントは、子供向けのプログラミング言語であるScratchで開発された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:44:09 GMT)
Projective Quantum Eigensolver via Adiabatically Decoupled Subsystem Evolution: a Resource Efficient Approach to Molecular Energetics in Noisy Quantum Computers [0.0]
我々は,ノイズ中間スケール量子(NISQ)ハードウェアを用いて,分子系の基底状態エネルギーを正確に計算することを目的とした射影形式を開発した。本研究では,将来の耐故障システムにおいて,必要な精度を同時に確保しながら,ノイズ下での優れた性能を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:52:04 GMT)
Projection hypothesis in the setting for the quantum Jarzynski equality [0.0]
我々は、射影量子測定における射影仮説のハミルトン過程の実現に関する以前の結果を組み合わせる。次に、これら2つの相互独立な量子計測理論結果を同時に試験するための量子熱力学スキームを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:37:21 GMT)
Path Planning in a dynamic environment using Spherical Particle Swarm Optimization [0.0]
本研究では, 球面ベクトルを用いた粒子群最適化技術を用いたUAV用動的パスプランナ(DPP)を提案する。経路は、チェックポイントを再計画する一組の経路として構築されている。経路長、安全、姿勢、経路平滑性はすべて、最適な経路がどうあるべきかを決定する上で考慮される。実際のデジタル標高モデルを用いて4つのテストシナリオが実施される。それぞれのテストは、SPSO-DPPが安全で効率的な経路セグメントを生成することができるかを示すために、パスの長さと安全性に異なる優先順位を与える。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:56:34 GMT)
Open Quantum Systems with Kadanoff-Baym Equations [0.0]
本研究では, ボゾン粒子の熱浴中において, 量子力学的フェルミオン粒子が1次元の魅力的な正方形ウェルポテンシャル内で1つのバウンド状態を示すことを研究した。この開量子系に対して、系粒子の非平衡カダノフ・ベイム方程式を定式化する。一粒子グリーンズ関数に対する空間的に不均一な積分微分方程式を数値的に解く。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:27:24 GMT)
OSDaR23: Open Sensor Data for Rail 2023 [0.0]
OSDaR23は2021年9月にドイツのハンブルクで取得された45のサブシーケンスのマルチセンサーデータセットである。データセットには204091のポリリン、多角形、長方形、立方形アノテーションが含まれており、合計で20の異なるオブジェクトクラスがある。これは、鉄道コンテキストに関連するさまざまなオブジェクトクラスを持つ、初めて公開されたマルチセンサーアノテーション付きデータセットである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:40:44 GMT)
Noncommuting charges' effect on the thermalization of local observables [0.0]
本研究では,非可換電荷が局所的な可観測物の数を減らし,熱化を促進することを示す。その結果,非交換電荷が促進する熱化の面が示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:00:00 GMT)
Non-Hermitian Quantum Fermi Accelerator [0.0]
我々は、時間依存のディリクレ境界条件を持つ時間依存の非エルミートハミルトニアンからなる量子フェルミ加速モデルを解く。そのような系に対するヒルベルト空間は2つの等価な方法で定義される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:36:18 GMT)
Non-Coherent Over-the-Air Decentralized Gradient Descent [0.0]
Decentralized Gradient Descent (DGD) は分散最適化問題の解法としてよく用いられるアルゴリズムである。本稿では,無線システムに適したDGDアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:53:45 GMT)
Multi-fidelity surrogate with heterogeneous input spaces for modeling melt pools in laser-directed energy deposition [0.0]
MFモデリング(Multi-fidelity Modeling)は、様々なフィデリティソースからデータをインテリジェントにブレンドできる強力な統計手法である。メルトプールモデルの階層をマージするためにMFサロゲートを使用する際の大きな課題は、入力空間における可変性である。本稿では, 様々な複雑さのモデルを統合することで, 溶融プール形状を予測するためのMFサロゲート構築手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 20:12:46 GMT)
Modal Analysis of Spatiotemporal Data via Multivariate Gaussian Process Regression [0.0]
モーダル解析は複雑な流れのコヒーレントな構造を理解するための重要なツールとなっている。データ不足と不規則サンプリングの限界を克服するために,新しいモーダル解析手法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:47:02 GMT)
Mean-field neural networks-based algorithms for McKean-Vlasov control problems * [0.0]
本稿では,平均場ニューラルネットのクラスを用いて,McKean-Vlasov制御問題の数値解法について述べる。ポリシーや値による制御学習による動的プログラミングや,大域的あるいは局所的損失関数による最大原理からの逆SDEなど,いくつかのアルゴリズムを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 13:41:15 GMT)
Limits and prospects for long-baseline optical fiber interferometry [0.0]
本稿では,従来の(ソリッドコア)光ファイバのノイズ特性について概説する。我々は、構造繊維技術がこれらの制限を克服する機会を指摘する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:21:15 GMT)
Leveraging Spatial and Semantic Feature Extraction for Skin Cancer Diagnosis with Capsule Networks and Graph Neural Networks [0.0]
本研究では,グラフニューラルネットワーク(GNN)とCapsule Networksを統合して,分類性能を向上させるという,革新的なアプローチを提案する。本稿では,Tiny Pyramid Vision GNN(Tiny Pyramid ViG)アーキテクチャをCapsule Networkに組み込んで評価・拡張することに焦点を当てた。 75回のトレーニングの後、我々のモデルは89.23%と95.52%に達し、既存のベンチマークを上回った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:11:28 GMT)
LAGAN: Deep Semi-Supervised Linguistic-Anthropology Classification with Conditional Generative Adversarial Neural Network [0.0]
民族的少数派は独自の文化で成長し、彼らの母国語で教えることを好む。我々は,このような言語人類学に基づくエンゲージメントを半教師付き問題として定式化した。我々は,学生エンゲージメントにおける言語的エスノグラフィーの特徴を分類するために,LA-GANという条件付き深層生成逆ネットワークアルゴリズムを開発した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:08:36 GMT)
Krylov complexity is not a measure of distance between states or operators [0.0]
3つの状態の間のクリロフ複素数は三角形の不等式を満たすことができないことを示す。クリロフ複雑性が対象の状態や演算子への最も短い経路の長さであるような計量は存在しない。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:50:33 GMT)
Kinetically constrained models constructed from dissipative quantum dynamics [0.0]
強い散逸は創発的な非コヒーレンスな部分空間につながることを示す。我々は、GKSL力学によって構成されるユニタリ力学は、強く相互作用するハミルトン力学によって構成される力学よりもより厳密に制約されていると論じる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:48:09 GMT)
Kinetic inductance traveling wave amplifier designs for practical microwave readout applications [0.0]
チタン窒化ニオブ(NbTiN)をパラメトリック増幅に用いる速度インダクタンストラベリング波増幅器これらのデバイスは、約5.5-7.25GHzの3dB帯域を持つ10dB以上のゲインを示す。我々はNbTiN伝送路のインピーダンスミスマッチを観察するが、これは利得リップルの大半の源である可能性が高い。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:08:08 GMT)
Is open source software culture enough to make AI a common ? [0.0]
言語モデル(LM)は人工知能(AI)の分野でますます普及しているこの疑問は、ユーザコミュニティによって管理され、維持される共通のリソースであるかどうかというものである。 LMを作成するのに必要なデータとリソースをコモンズとして扱うことの潜在的な利点を強調します。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:43:52 GMT)
Introducing Quantum Entanglement to First-Year Students: Resolving the Trilemma [0.0]
量子絡み合いの概念は、典型的には入門物理学の教科書では全くカバーされていない。このトリレンマは、アインシュタインが時間拡張と長さ収縮の謎を解くのと全く同じ方法で解決する。量子絡み合いの原理は、アインシュタインが使ったのと同じ原理に基づいている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 18:34:18 GMT)
Intensity product-based optical sensing to beat the diffraction limit [0.0]
古典的に定義された光学位相感度は、ショットノイズ限界(SNL)または標準量子限界として知られている。しかし、光学干渉計では、Nプローブ光子が検出プロセスで解決されない限り、位相分解能はN=1のケースに留まる。標準干渉計におけるSNLを実現するために, 強度製品に基づく光センシングのための投影型計測法を提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 03:42:45 GMT)
Individual differences in knowledge network navigation [0.0]
年齢が知識空間のナビゲーション性能に悪影響を及ぼすのに対し、多言語主義はそれを強化することを示す。時間圧下では、参加者のパフォーマンスは改善し、男性は女性よりも優れ、時間圧なしではゲームでは観察できない効果である。本結果は,知識空間ナビゲーションにおける年齢,多言語性,時間制約の重要性を裏付けるものである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:38:16 GMT)
Individual and Product-Related Antecedents of Electronic Word-of-Mouth [0.0]
本研究では, 正および負の電子単語(eWOM)の固有性について検討した。個人的要因は、製品レビューやコメントをオンラインで書く意図の最も重要な先駆者である。正および負のeWOM意図は、再購入意図と関連している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:50:26 GMT)
Improving Interpretability of Scores in Anomaly Detection Based on Gaussian-Bernoulli Restricted Boltzmann Machine [0.0]
GBRBMによる異常検出では、GBRBMのエネルギー関数と同一のスコアに基づいて正規値と異常値のデータを分類する。本稿では,その累積分布に基づいて,スコアの解釈可能性を向上させる尺度を提案する。また、解釈可能な尺度を用いてしきい値を設定するためのガイドラインを確立する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:13:52 GMT)
Improved EATFormer: A Vision Transformer for Medical Image Classification [0.0]
本稿では,ビジョントランスフォーマを用いた医用画像分類のための改良されたアルゴリズムベースのトランスフォーマアーキテクチャを提案する。提案したEATFormerアーキテクチャは、畳み込みニューラルネットワークとビジョントランスフォーマーの長所を組み合わせたものだ。 Chest X-rayデータセットとKvasirデータセットの実験結果から,提案したEATFormerはベースラインモデルと比較して予測速度と精度を大幅に向上することが示された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:40:20 GMT)
IEEE-GDL CCD Smart Buildings Introduction [0.0]
この文書は、スマートな建物を開発するためのレイヤ、サービスの分類、ベストプラクティスを理解するための最初のガイドです。スマートな建物のためのイノベーションと機会の分野を特定するために、議論を行う。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:08:40 GMT)
Hybrid Unsupervised Learning Strategy for Monitoring Industrial Batch Processes [0.0]
本稿では,複雑な産業プロセスを監視するためのハイブリッド型教師なし学習戦略(HULS)を提案する。 HULSの概念の性能を評価するために,実験室のバッチに基づいて比較実験を行った。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:33:07 GMT)
Hermite coordinate interpolation kernels: application to image zooming [0.0]
幾何変換のような多くの基本的な画像処理タスクは、ピクセル以下の画像値を必要とする。この研究では、非等間隔線型格子上で定義される多次元エルミートスプラインを利用する。補間体の複雑さが増大しているにもかかわらず、カーネルが構築されると、Hermiteスプラインは他のより複雑な方法と同様に効率的に画像に適用できることが示される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 23:06:10 GMT)
Heat flow from a measurement apparatus monitoring a dissipative qubit [0.0]
測定器からキュービットには常に熱が流れることを示す。また,過渡期における熱電流と過熱の過渡ダイナミクスについても検討した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:14:37 GMT)
Geometric methods in quantum information and entanglement variational principle [0.0]
まず、幾何学的手法が量子情報理論に有用であることが証明された最も重要な設定について調査する。次に、エンタングルメント、コヒーレンス、反平坦性といった量子資源に対するアクション原理の一般的な枠組みを定めます。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:06:55 GMT)
Genetically programmable optical random neural networks [0.0]
遺伝的にプログラム可能であるが、光学的ランダムプロジェクションによる高性能を実現するための単純な光学ニューラルネットワークを実証する。ランダムプロジェクションカーネルとして機能する散乱媒質の配向を遺伝的にプログラミングすることにより,本手法は最適なカーネルを発見し,初期試験精度を7-22%向上させる。提案手法は,シンプルでスケーラブルな設計で,光ニューラルネットワークの高性能化を実現するための有望な手法である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 06:55:59 GMT)
Forward Gradient-Based Frank-Wolfe Optimization for Memory Efficient Deep Neural Network Training [0.0]
本稿では,よく知られたFrank-Wolfeアルゴリズムの性能解析に焦点をあてる。提案アルゴリズムは, 最適解に収束し, サブ線形収束率を示す。対照的に、標準的なフランク=ウルフアルゴリズムは、プロジェクテッド・フォワード・グラディエントへのアクセスを提供すると、最適解に収束しない。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 07:25:36 GMT)
FootstepNet: an Efficient Actor-Critic Method for Fast On-line Bipedal Footstep Planning and Forecasting [0.0]
本研究では,障害物のある環境下を移動するための効率的なフットステップ計画法を提案する。また,地域目標の異なる候補に到達するのに必要なステップ数を素早く推定できる予測手法を提案する。本研究は,RoboCup 2023コンペティションにおいて,シミュレーション結果と,子供サイズのヒューマノイドロボットへの展開によるアプローチの有効性を実証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:48:18 GMT)
Fine-Tuning Pre-trained Language Models to Detect In-Game Trash Talks [0.0]
本研究は,ゲーム内チャットにおける有害性の検出において,事前学習したBERTおよびGPT言語モデルの性能を評価し,評価する。この研究は、BERT(Base-uncased)、BERT(Large-uncased)、GPT-3モデルのトレーニングとテストのために、約2万のゲーム内チャットを収集することができた。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:36:53 GMT)
Exact thermal eigenstates of nonintegrable spin chains at infinite temperature [0.0]
非可積分スピン鎖の熱固有状態を初めて解析的に記述する。我々は、EAP状態が固有状態であるハミルトニアンを同定し、これらのハミルトニアンのうちいくつかが非可積分であることを示す。任意の温度における熱純状態は、EAP状態の想像時間進化によって得られる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:05:31 GMT)
Exact model reduction for conditional quantum dynamics [0.0]
本稿では,関心事結果の正確な分布を維持しつつ,量子フィルタの次元を小さくする手法を提案する。本手法は, 測定結果に依存し, システム理論の可観測性解析に基づく一般量子系に対して提案され, 実例で検証する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:34:13 GMT)
Estimating the electrical energy cost of performing arbitrary state preparation using qubits and qudits in integrated photonic circuits [0.0]
我々は、量子状態の準備を行うためにフォトニック回路をプログラムするために費やされる電気エネルギーの量の観点から、qubitとquditのアプローチを比較した。完全に再構成可能な干渉計の配列を持つPICを使用する場合、キュービットを使用するにはキュービットを使用するよりも多くのエネルギーを必要とする。しかしながら、専用CNOTブロックを持つ回路はエネルギー消費がはるかに小さく、大きな量子ビット数でも有効であることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 19:53:44 GMT)
Establishing Performance Baselines in Fine-Tuning, Retrieval-Augmented Generation and Soft-Prompting for Non-Specialist LLM Users [0.0]
本稿では,ベクトル化RAGデータベースへのアクセスが許された場合,GPT 3.5の修正されていないバージョン,微調整されたバージョン,および修正されていないモデルをテストする。それぞれのケースで、主に2021年9月以降に発生したイベントに関連する100の質問に、モデルが答える能力を試しました。 GPT 3.5 Turboでは,商用プラットフォームを使用,デフォルト設定をイテレーションなしで適用してアウトプットのベースラインセットを確立すると,微調整モデルの性能が向上することがわかった。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:32:16 GMT)
Enriched string-net models and their excitations [0.0]
ウォーカー・ワングモデルの境界線は通勤プロジェクターモデルの構築に使われてきた。本稿ではこの2次元境界モデルの厳密な扱いについて述べる。また,TQFT法を用いて,ウォーカー・ワンバルクの3次元バルク点励起をM "uger center" で示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 15:36:12 GMT)
Enhancing Formal Theorem Proving: A Comprehensive Dataset for Training AI Models on Coq Code [0.0]
Coqの証明アシスタントは、数学的アサーションとソフトウェアの正確性を検証するための厳格なアプローチで際立っている。人工知能と機械学習の進歩にもかかわらず、Coq構文と意味論の特殊性は大規模言語モデル(LLM)に固有の課題をもたらす。このデータセットは、10,000以上のCoqソースファイルのコレクションから派生したもので、幅広い命題、証明、定義を含んでいる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:53:40 GMT)
ETHNO-DAANN: Ethnographic Engagement Classification by Deep Adversarial Transfer Learning [0.0]
学生のモチベーションは、ポストコロニアル教育改革と青少年雇用市場適応の必要性から、重要な研究課題である。本稿では,エスノグラフィーエンゲージメント予測のための逆適応を用いたディープニューラルネットワークを用いたトランスファー学習アルゴリズムETHNO-DAANNを提案する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:09:04 GMT)
Does provable absence of barren plateaus imply classical simulability? Or, why we need to rethink variational quantum computing [0.0]
バレン高原を避けることができる構造も、古典的な損失を効率的にシミュレートするために利用できますか? 一般に用いられているバレン高原の証明不可能なモデルもまた古典的にシミュレート可能であるという強い証拠を提示する。我々の分析は、不毛の高原無地におけるパラメタライズド量子回路の情報処理能力の非古典性に深刻な疑問を呈している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 21:12:37 GMT)
Design of Coherent Passive Quantum Equalizers Using Robust Control Theory [0.0]
本稿では,量子通信チャネルにおけるコヒーレント等化フィルタの設計手法を提案する。目的は、元のシステムと結合すると環境の劣化効果を緩和する別の量子システムを得ることである。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:42:55 GMT)
Deep learning-based auto-segmentation of paraganglioma for growth monitoring [0.0]
no-new-UNnet (nUNet) を用いたディープラーニングセグメンテーションモデルに基づく腫瘍体積自動計測法を提案する。高齢者耳鼻咽喉科医の視力検査と数種類の定量的指標を用いて, モデルの性能評価を行った。生成したモデルと,腫瘍を時間とともに追跡するリンク手順を用いて,既知の成長関数の適合度に付加的な体積測定がどう影響するかを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 14:08:56 GMT)
Deep Recurrent Learning Through Long Short Term Memory and TOPSIS [0.0]
クラウドコンピューティングの安価で簡単で迅速な管理の約束により、ビジネスオーナーはモノリシックからデータセンタ/クラウドベースのERPへの移行を迫られます。クラウドERP開発には、計画、実装、テスト、アップグレードといった循環的なプロセスが伴うため、その採用はディープリカレントニューラルネットワーク問題として実現されている。我々の理論モデルは、キープレーヤー、サービス、アーキテクチャ、機能を明確にすることで、参照モデル上で検証される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:06:19 GMT)
Decoherence-free algebras in quantum dynamics [0.0]
ハイゼンベルク図形の有限次元開量子系の力学を解析する。この構造に動機付けられて、Choi-Effros decoherence-free algebraと呼ばれる新しい空間を導入する。誘引部分空間とChoi-Effros Decoherence-free algebraの間の等式は、忠実な力学にとって必要十分条件である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 17:29:13 GMT)
Deciphering AutoML Ensembles: cattleia's Assistance in Decision-Making [0.0]
Cattleiaは、回帰、マルチクラス、バイナリ分類タスクのアンサンブルを解読するアプリケーションである。 Auto-Sklearn、AutoGluon、FLAMLという3つのAutoMLパッケージで構築されたモデルで動作する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:56:21 GMT)
Controlling Large Electric Vehicle Charging Stations via User Behavior Modeling and Stochastic Programming [0.0]
本稿では,現実の制約を組み込んだ電気自動車充電ステーションモデルを提案する。ユーザが提供する情報を活用する2つのマルチステージプログラミング手法を提案する。日時依存プロセスに基づくユーザの行動モデルは、顧客満足度を維持しながらコスト削減を促進する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:28:13 GMT)
Contextualized Messages Boost Graph Representations [0.0]
グラフニューラルネットワーク(GNN)は、グラフとして表される任意の構造化されたデータを扱う能力のため、近年大きな関心を集めている。本稿では,ノードレベル,近傍レベル,グラフレベルの全レベルにわたるGNNの表現能力について,新たな視点を示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:05:49 GMT)
Community detection by spectral methods in multi-layer networks [0.0]
多層ネットワークにおけるコミュニティ検出は,ネットワーク解析において重要な問題である。 1つのアルゴリズムは隣接行列の和に基づいており、もう1つは2乗隣接行列の偏りの和を利用する。数値シミュレーションにより, このアルゴリズムは, 多層ネットワークにおける既存のコミュニティ検出手法を超越した2乗隣接行列のデバイアス和を用いていることを確認した。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 08:29:47 GMT)
Clustered Mallows Model [0.0]
ランク付け(英語: Rankings)とは、評価者が実用性の順序を下げてアイテムを配置する実験で生じる選好のエレクテーションの一種である。本稿では,有名なMallows (Mallows, 1957) モデルを拡張し,項目不一致に対応する。クラスタド・マロズ・モデル(CMM)は、データから関係が学習される結びついた位置のマロズ分布と解釈できる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:25:30 GMT)
Classical-Quantum correspondence in Lindblad evolution [0.0]
我々は、(多くは)古典的ハミルトン多様体と(多くは)線型的に成長する古典的ジャンプ関数を用いて定義されるリンドブラッドの進化について、量子可観測はエルベルト-シュミットノルムにおける古典的フォッカー-プランクの進化に近いままであることを示す。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:43:07 GMT)
Breakdown of the Meissner effect at the zero exceptional point in non-Hermitian two-band BCS model [0.0]
複素ギンズバーグ・ランダウモデルを経路積分による非エルミート二バンドBCSモデルから導出する。ヒッグス機構の類似性として、複素ギンズバーグ・ランダウモデルのマイスナー効果も例外点で分解され、ギャップパラメータは有限である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 00:51:56 GMT)
Bosonic KG-oscillators in Eddington-inspired Born-Infeld gravity: Wu-Yang magnetic monopole and Ricci scalar curvature effects [0.0]
Ricci scalar curvature $R=R_upsilon upscitationの存在下での重力効果について論じる。リッチスカラーの曲率の存在は、効果的かつ明白に、対応する量子力学的反発コアをより反発させる力場を導入することが観察された。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:16:13 GMT)
Behave-XAI: Deep Explainable Learning of Behavioral Representational Data [0.0]
行動マイニングのシナリオでは、説明可能なAIや人間の理解可能なAIを使用します。まず、深層畳み込みニューラルネットワークアーキテクチャにおける行動マイニング問題を定式化する。モデルが開発されると、ユーザーの前で説明が提示される。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 16:07:14 GMT)
Bangladesh Agricultural Knowledge Graph: Enabling Semantic Integration and Data-driven Analysis--Full Version [0.0]
我々はバングラデシュの農業データを統合する連合知識グラフを開発した。 BDAKGは多次元意味論を取り入れ、外部知識グラフとリンクし、OLAPと互換性があり、FAIRの原則に準拠している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 04:40:43 GMT)
Automated data processing and feature engineering for deep learning and big data applications: a survey [0.0]
現代の人工知能(AI)のアプローチは、データから直接学習するアルゴリズムを設計することを目的としている。従来のディープラーニングパイプラインのすべてのデータ処理タスクが自動化されたわけではない。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 09:36:27 GMT)
Assessing effect sizes, variability, and power in the on-line study of language production [0.0]
実験室とオンラインで行った同じ単語生成実験で得られた応答時間データを比較した。実験の過程における応答の整合性において,2つの設定が効果の大きさで異なるか否かを判定する。一連のシミュレーションにおいて,これらの違いが設計のパワーに与える影響を評価する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:49:03 GMT)
AraPoemBERT: A Pretrained Language Model for Arabic Poetry Analysis [0.0]
AraPoemBERTはアラビア語の詩文に特化して訓練されたアラビア語モデルである。 AraPoemBERTは、詩のジェンダー分類と詩のサブメーター分類という3つの新しいタスクのうちの2つにおいて、前例のない精度を達成した。この研究で使用されるデータセットには、オンラインソースから収集された2億9900万の詩が含まれている。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:59:58 GMT)
Andreev reflection mediated $Δ_T$ noise [0.0]
本稿では,1次元金属/絶縁体/超伝導接合部におけるショットノイズとサーマルノイズの寄与を伴うDelta_T$ノイズ自動相関の特性について検討する。アンドレーフ反射は、透過限界における金属絶縁体-金属接合とは対照的に、金属絶縁体-超伝導接合における$Delta_T$ノイズを高める。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 10:58:50 GMT)
An Alternative Graphical Lasso Algorithm for Precision Matrices [0.0]
本稿では,スパース精度行列を推定するためのDP-GLassoアルゴリズムを提案する。正規化された正規対数型は自然に凸関数を最小化しやすい2つの和に分解するが、そのうちの1つはラッソ回帰問題である。提案アルゴリズムは,最適化対象とする精度行列を最初から備えており,DP-GLassoアルゴリズムの良好な特性をすべて保持している。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 02:01:01 GMT)
Algorithm for AGC index management against crowded radio environment [0.0]
本稿では,パケット受信に使用する最適な自動利得制御(AGC)指数,あるいは最も適切な可変利得範囲を推定し,ペイロード受信中に出現する干渉者を予測した。これにより、受信機は、ゲインフリードペイロード受信期間中に発生しても干渉者に高い免疫を与えることができ、なおかつ、最適な感度レベルを確保できる。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 05:42:29 GMT)
Adaptive Multilevel Neural Networks for Parametric PDEs with Error Estimation [0.0]
ニューラルネットワークアーキテクチャは高次元パラメータ依存偏微分方程式(pPDE)を解くために提示されるモデルデータのパラメータを対応する有限要素解にマッピングするために構築される。適応有限要素法(AFEM)で生成される粗いグリッド解と一連の補正を出力する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:34:40 GMT)
Accelerated quantum search using partial oracles and Grover's algorithm [0.0]
グロバーのアルゴリズム(英: Grover's algorithm)は、順序のないデータベースを探索する手段として考案されたアルゴリズムであり、量子計算によって生成された結果集合から解を抽出する手法としても用いられる。本稿では,個別のオラクルをマッチング条件の各ビットに関連付け,独立にテスト可能な複数の部分的なオラクル関数を得るという考え方について検討する。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 11:32:02 GMT)
A new approach towards quantum foundation and some consequences [0.0]
6つの仮定に基づく一般的な理論が紹介される。基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳（メタデータ） (Tue, 19 Mar 2024 12:17:01 GMT)