Fugu-MT: arxivの論文翻訳(概要)

Visual Tuning [143.4]
微調整ビジュアルモデルは、多くの下流視覚タスクにおいて有望なパフォーマンスを示すことが広く示されている。最近の進歩は、事前訓練されたパラメータ全体をフルチューニングするよりも優れたパフォーマンスを達成することができる。この調査は、最近の作品の大規模かつ思慮深い選択を特徴付け、作業とモデルの体系的かつ包括的な概要を提供する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 06:14:42 GMT)
Labeled Morphological Segmentation with Semi-Markov Models [127.7]
いくつかのタスクを統一する形態的処理の代替として,ラベル付き形態的セグメンテーションを提案する。また、形態素タグセットの新しい階層も導入する。形態素を明示的にモデル化する識別型形態素分割システムであるモデル名を開発した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:51:53 GMT)
HyperCLOVA X Technical Report [119.9]
韓国語と文化に合わせた大型言語モデル(LLM)のファミリーであるHyperCLOVA Xを紹介する。 HyperCLOVA Xは韓国語、英語、コードデータのバランスの取れた混合でトレーニングされ、その後、高品質な人間アノテーション付きデータセットによる命令チューニングが行われた。このモデルは、韓国語と英語の両方で、包括的な推論、知識、常識、事実性、コーディング、数学、チャット、指示追従、無害など、様々なベンチマークで評価されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:06:19 GMT)
Logic Query of Thoughts: Guiding Large Language Models to Answer Complex Logic Queries with Knowledge Graphs [102.4]
LGOT(Logic-Query-of-Thoughts)は知識グラフ推論と大規模言語モデルを組み合わせた最初の方法である。実験の結果,ChatGPTよりも20%向上した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:14:10 GMT)
GeoGalactica: A Scientific Large Language Model in Geoscience [95.2]
大規模言語モデル(LLM)は、自然言語処理(NLP)における幅広いタスクを解く一般的な知識と能力で大きな成功を収めている。我々は、LLMを地学に特化させ、さらに、地学の膨大なテキストでモデルを事前訓練し、また、カスタム収集した指導チューニングデータセットで得られたモデルを教師付き微調整(SFT)する。我々はGeoGalacticaを65億のトークンを含む地球科学関連のテキストコーパスで訓練し、最大の地球科学固有のテキストコーパスとして保存する。次に、100万対の命令チューニングでモデルを微調整する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:05:03 GMT)
Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning [92.2]
対照的な自己指導型学習は、(深層)強化学習(RL)の実践にうまく統合されている我々は,低ランク遷移を伴うマルコフ決定過程(MDP)とマルコフゲーム(MG)のクラスにおいて,コントラスト学習によってRLをどのように強化できるかを検討する。オンライン環境下では,MDPやMGのオンラインRLアルゴリズムと対照的な損失を生かした,新しい高信頼境界(UCB)型アルゴリズムを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:08:51 GMT)
Merging by Matching Models in Task Parameter Subspaces [87.9]
モデルマージは、個々のタスク固有のモデルを単一のマルチタスクモデルに安価に結合することを目的としている。我々は、モデルマージに対するこのアプローチが、方程式の線形系を解くとみなす方法を定式化する。共役勾配法は閉形式解より優れていることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:31:25 GMT)
Generating Enhanced Negatives for Training Language-Based Object Detectors [86.2]
我々は、現代の生成モデルに組み込まれた膨大な知識を活用して、元のデータにより関連性のある負を自動で構築することを提案する。具体的には、大言語モデルを用いて、負のテキスト記述を生成するとともに、テキスト間拡散モデルを用いて、対応する負の画像を生成する。実験により, 生成した負データとの関連性を確認し, 言語ベースの検出器での使用により, 2つの複雑なベンチマークの性能が向上した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:21:10 GMT)
Taming Self-Training for Open-Vocabulary Object Detection [84.3]
オープン語彙オブジェクト検出(OVD)のための自己学習を目的としたSAS-Detを提案する。本稿では,標準検出をオープンブランチとクローズブランチに分割するスプリット・アンド・フュージョン(SAF)ヘッドを提案する。閉集合タスクとは違って,OVDのPL分布は教師モデルによってのみ決定されるため,教師への更新回数を削減し,PL分布の変化頻度を減少させる定期的な更新戦略を導入する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:40:03 GMT)
MMA-DFER: MultiModal Adaptation of unimodal models for Dynamic Facial Expression Recognition in-the-wild [81.3]
実世界のアプリケーションでは,音声およびビデオデータに基づくマルチモーダル感情認識が重要である。近年の手法は、強力なマルチモーダルエンコーダの事前学習に自己教師付き学習(SSL)の進歩を活用することに重点を置いている。 SSL-pre-trained disimodal encoders を用いて,この問題に対する異なる視点とマルチモーダル DFER の性能向上について検討する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:39:26 GMT)
Generative AI Agent for Next-Generation MIMO Design: Fundamentals, Challenges, and Vision [76.4]
次世代の多重入力多重出力(MIMO)はインテリジェントでスケーラブルであることが期待される。本稿では、カスタマイズされた特殊コンテンツを生成することができる生成型AIエージェントの概念を提案する。本稿では、生成AIエージェントをパフォーマンス分析に活用することの有効性を示す2つの説得力のあるケーススタディを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:39:36 GMT)
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation [73.6]
本稿では,確率分布を理解するための大規模言語モデルの能力について検討する。 LLMエージェントは,プログラムツールを用いても確率分布をサンプリングすることはできない。分析の結果,LLMエージェントはプログラムツールを用いても確率分布をサンプリングできないことがわかった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:59:28 GMT)
Adapting LLaMA Decoder to Vision Transformer [66.2]
本研究は,LLaMAなどのデコーダのみのトランスフォーマーをコンピュータビジョン分野に適用できるかどうかを検討する。まず、LLaMAのアーキテクチャと整合する標準的なViTのステップバイステップを「LLaMAfy」と呼び、カジュアルマスクを自己注意に直接適用することで、注意崩壊の問題が発生することを発見した。トレーニング開始時の自己注意にカジュアルマスクを徐々に導入し,最適化行動を容易にするソフトマスク戦略を開発する。イメージLLaMA (iLLaMA) はアーキテクチャにおいてLLaMAと似ており、直接的に使用することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:58:29 GMT)
NICEST: Noisy Label Correction and Training for Robust Scene Graph Generation [65.8]
我々は,SGG:NICESTのための新しいNoIsyラベルCorrEction and Sample Training戦略を提案する。 NICEはまずノイズのあるサンプルを検出し、さらに高品質な述語ラベルを割り当てる。 NICESTは任意のSGGアーキテクチャにシームレスに組み込んで、さまざまな述語カテゴリのパフォーマンスを向上させることができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:39:29 GMT)
MAPO: Advancing Multilingual Reasoning through Multilingual Alignment-as-Preference Optimization [65.3]
本稿では,他言語の推論過程を支配言語と整合させるために,MAPO(Multilingual-Alignment-as-Preference Optimization)フレームワークを提案する。具体的には,非支配言語と支配言語における回答の整合性について,既成の翻訳モデルを用いて検討する。実験により、MAPOは様々なモデルの多言語推論において、安定して大幅な改善を達成できることが示された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:27:04 GMT)
Enforcing Paraphrase Generation via Controllable Latent Diffusion [60.8]
textitLatent textitDiffusion textitParaphraser(LDP)を提案する。実験により, LDPはベースラインに比べて改良され, 多様なパラフレーズ生成を達成できることが示された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:24:32 GMT)
Dynamic Clue Bottlenecks: Towards Interpretable-by-Design Visual Question Answering [58.6]
本稿では, モデル決定を中間的人間法的な説明に分解する設計モデルを提案する。我々は、我々の本質的に解釈可能なシステムは、推論に焦点をあてた質問において、同等のブラックボックスシステムよりも4.64%改善できることを示した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:13:55 GMT)
Detoxifying Large Language Models via Knowledge Editing [57.1]
本稿では,Large Language Models (LLM) のデトックス化のための知識編集手法について検討する。我々は、強力な攻撃プロンプトを持つ9つの安全でないカテゴリをカバーするベンチマーク、SafeEditを構築した。いくつかの知識編集手法を用いて実験を行い、知識編集がLLMを効率的に解毒する可能性を示唆した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:39:50 GMT)
VeCAF: Vision-language Collaborative Active Finetuning with Training Objective Awareness [56.9]
VeCAFはラベルと自然言語アノテーションを使用して、PVMの微調整のためのパラメトリックデータ選択を行う。 VeCAFは微調整の目的を取り入れて重要なデータポイントを選択し、PVMをより高速な収束に向けて効果的に導く。 ImageNetでは、VeCAFは最大3.3倍のトレーニングバッチを使用して、完全な微調整に比べて目標のパフォーマンスに到達する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:56:49 GMT)
THQA: A Perceptual Quality Assessment Database for Talking Heads [56.4]
音声駆動方式は、人間の口の形や表情を操作するための新しい道を提供する。運転法が普及しているにもかかわらず、多くの音声ヘッド(TH)ビデオの品質が懸念されている。本稿では,8種類の音声駆動方式を用いて800 THビデオを生成するTHQAデータベースについて紹介する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:08:57 GMT)
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.2]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:52:04 GMT)
LAKE-RED: Camouflaged Images Generation by Latent Background Knowledge Retrieval-Augmented Diffusion [54.0]
カモフラージュ画像生成のためのLAKE-RED(Latent background Retrieval-Augmented Diffusion)を提案する。本手法は,カモフラージュ生成のための解釈可能性を持つ知識検索拡張手法である。実験の結果,本手法は既存の手法よりも優れていることがわかった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:01:50 GMT)
Statistical Inference of Constrained Stochastic Optimization via Sketched Sequential Quadratic Programming [53.6]
制約付き非線形最適化問題のオンライン統計的推測を考察する。これらの問題を解決するために、逐次二次計画法(StoSQP)を適用する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 21:08:29 GMT)
BooookScore: A systematic exploration of book-length summarization in the era of LLMs [53.4]
我々は,識別されたエラータイプを一切含まない要約文の割合を計測する自動測度BooookScoreを開発した。 GPT-4 や 2 のようなクローズドソース LLM は,オープンソースモデルよりも BooookScore の高いサマリーを生成することがわかった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:02:23 GMT)
On the Relation between Internal Language Model and Sequence Discriminative Training for Neural Transducers [52.9]
内部言語モデル(ILM)のサブトラクションは、RNN-Transducerの性能向上に広く応用されている。列識別訓練は, 理論的, 経験的両面からILMサブトラクションと強く相関していることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:06:37 GMT)
Motion2VecSets: 4D Latent Vector Set Diffusion for Non-rigid Shape Reconstruction and Tracking [52.4]
Motion2VecSetsは点雲列からの動的表面再構成のための4次元拡散モデルである。グローバルな潜在符号の代わりに、潜在集合で4Dダイナミクスをパラメータ化する。時間的コヒーレントな物体追跡のために、変形潜在集合を同期的に認知し、複数のフレーム間で情報を交換する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:23:21 GMT)
EIVEN: Efficient Implicit Attribute Value Extraction using Multimodal LLM [52.0]
EIVENは暗黙的な属性値抽出のためのデータおよびパラメータ効率の良い生成フレームワークである。本稿では,モデル混同を減らすための新しい学習・比較手法を提案する。実験の結果,EIVENは暗黙的属性値の抽出において既存の手法よりも有意に優れていることがわかった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:15:56 GMT)
AMU-Tuning: Effective Logit Bias for CLIP-based Few-shot Learning [50.8]
まず、ログバイアスの観点から、CLIPに基づく数ショット学習手法を統一的な定式化して分析する。本稿では,鍵成分の分析に基づいて,CLIPに基づく複数ショット分類のための効果的なロジットバイアスを学習するための新しいAMU-Tuning法を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:46:11 GMT)
Intuition-aware Mixture-of-Rank-1-Experts for Parameter Efficient Finetuning [50.7]
大規模言語モデル(LLM)はマルチメディアアプリケーションで複数のタスクを実行する上で大きな可能性を証明している。 MoEは、効率的なタスクデカップリングのためのスパースアーキテクチャによる有望なソリューションとして登場した。 Intuition-MoR1Eは14のパブリックデータセットで優れた効率と2.15%の全体的な精度向上を実現している。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:14:58 GMT)
One-step corrected projected stochastic gradient descent for statistical estimation [49.2]
これは、Fisherスコアリングアルゴリズムの1ステップで修正されたログ様関数の予測勾配勾配に基づいている。理論およびシミュレーションにより、平均勾配勾配や適応勾配勾配の通常の勾配勾配の代替として興味深いものであることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:17:27 GMT)
Adapting Fake News Detection to the Era of Large Language Models [48.6]
我々は,機械による(言い換えられた)リアルニュース,機械生成のフェイクニュース,人書きのフェイクニュース,人書きのリアルニュースの相互作用について検討する。我々の実験では、人書き記事のみに特化して訓練された検知器が、機械が生成したフェイクニュースを検出できる興味深いパターンを明らかにしましたが、その逆ではありません。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:52:01 GMT)
Voice Attribute Editing with Text Prompt [48.5]
本稿では,テキストプロンプトを用いた音声属性編集という新しい課題を紹介する。目標は、テキストプロンプトに記述された動作に応じて、音声属性を相対的に修正することである。この課題を解決するために,エンドツーエンド生成モデルであるVoxEditorを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:07:40 GMT)
M$^{2}$Chat: Empowering VLM for Multimodal LLM Interleaved Text-Image Generation [45.8]
textbf$M2Chat$は、インターリーブされたテキストイメージの会話を生成するための新しい統合マルチモーダルLLMフレームワークである。 M3Adapter$は、マルチモーダルプロンプトから、粒度の低い視覚情報と高レベルのセマンティック機能を統合する。 M3FT$ fine-tuning strategy イメージテキストアライメントとビジュアルインストラクションのために、パラメータの分離したグループを最適化する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:16:18 GMT)
Lifting topological codes: Three-dimensional subsystem codes from two-dimensional anyon models [45.0]
トポロジカルサブシステム符号は、測定ノイズが存在する場合でも、時間オーバーヘッドのない量子誤差補正を可能にする。我々は、アーベル量子二重モデルから構築された3次元の符号のクラスを1つのより少ない次元で体系的に構成する。我々の構成は、最近導入されたサブシステムトーリックコードを一般化するだけでなく、オリジナルのモデルのいくつかの側面について新たな視点を提供する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:11:02 GMT)
PILOT: Legal Case Outcome Prediction with Case Law [43.7]
判例法を用いて判例結果の予測を行う際の2つのユニークな課題を同定する。第一に、意思決定において裁判官の基本的な証拠となる関連する前例を特定することが重要である。第二に、初期の事例は異なる法的文脈に従う可能性があるため、時間とともに法原則の進化を考慮する必要がある。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:59:17 GMT)
Towards Efficient Resume Understanding: A Multi-Granularity Multi-Modal Pre-Training Approach [43.1]
本稿では,効率的な再帰的理解を実現するための新しいモデル ERU を提案する。まず,履歴書中のセグメントをテキスト情報,視覚情報,レイアウト情報を統合して符号化するレイアウト対応マルチモーダル融合変換器を提案する。次に、履歴書から構造化情報を取り出すために、多粒度シーケンスラベリングタスクでモデルを微調整する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:31:24 GMT)
CoLLaVO: Crayon Large Language and Vision mOdel [42.2]
現在のビジョン言語モデルが本当に品質の高いオブジェクトレベルの画像理解能力を持っているかどうかは、まだ解明されていない。その結果,現在のVLMのイメージ理解能力は,視覚言語(VL)タスクにおけるゼロショット性能と強く相関していることが判明した。オブジェクトレベルの画像理解を強化するために,Crayon Large Language and Vision mOdel (CoLLaVO)を提案する。本稿では,視覚的指導指導中に,オブジェクトレベルのイメージ理解を忘れずに維持するためのDual QLoRAの学習戦略を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:11:44 GMT)
Ab-Initio Calculations of Nonlinear Susceptibility and Multi-Phonon Mixing Processes in a 2DEG-Piezoelectric Heterostructure [41.9]
固体弾性波フォノンは、幅広い量子情報応用のための有望なプラットフォームである。圧電半導体ヘテロ構造を用いた汎用アーキテクチャを提案する。このシステムでは, 強い3階非線形性により, 音響キャビティ内でのシングルフォノンKerrシフトが可能であることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:54:08 GMT)
PNeRV: Enhancing Spatial Consistency via Pyramidal Neural Representation for Videos [40.9]
動画用ピラミッド型ニューラル表現(PNeRV)について紹介する。マルチスケール情報接続上に構築されており、軽量な再スケーリング演算子、Kronecker Fully- connected layer (KFc)、Selective Memory (BSM) 機構を備えている。 PNeRVはPSNRが+4.49dB、UVGが231%増加し、DAVISが+3.28dB、FVDが634%増加した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:50:17 GMT)
FreeReg: Image-to-Point Cloud Registration Leveraging Pretrained Diffusion Models and Monocular Depth Estimators [37.4]
イメージとポイントクラウド間のクロスモダリティ機能をマッチングすることは、イメージツーポイントクラウド登録の根本的な問題である。まず,事前学習した大規模モデルを用いて,画像と点雲のモダリティを統一することを提案する。画像から画像への拡散モデルから抽出した拡散特徴と呼ばれる中間的特徴が,画像と点雲の間で意味的に一致していることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:07:05 GMT)
DTOR: Decision Tree Outlier Regressor to explain anomalies [37.0]
Decision Tree Outlier Regressor (DTOR) は、個々のデータポイントに対してルールベースの説明を生成する技術である。本結果は,多数の特徴を持つデータセットにおいても,DTORの堅牢性を示すものである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:49:43 GMT)
Explainable Traffic Flow Prediction with Large Language Models [36.9]
大規模言語モデル(LLM)を用いて解釈可能なトラフィックフロー予測を生成する新しい手法を提案する。 TF-LLMは、マルチモーダルトラフィックデータを自然言語記述に転送することにより、複雑な時空間パターンと外部要因を包括的トラフィックデータからキャプチャする。 TF-LLMは、直感的で解釈可能な予測を提供しながら、ディープラーニングベースラインと比較して、競争精度を示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:12:53 GMT)
Constructing and Exploring Intermediate Domains in Mixed Domain Semi-supervised Medical Image Segmentation [36.5]
限られたアノテーションとドメインシフトは、医用画像のセグメンテーションにおいて一般的な課題である。混合ドメイン半監視医療画像コンポーネント(MiDSS)について紹介する。提案手法は,3つの公開データセットで示されるように,前立腺データセットにおけるDiceスコアの顕著な13.57%の改善を実現する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:15:51 GMT)
Improving Convergence and Generalization Using Parameter Symmetries [34.9]
異なる曲率を持つミニマへのテレポーティングにより一般化が向上し,最小曲率と一般化能力の関連性が示唆された。本結果は, テレポーテーションの汎用性を示し, 最適化に対称性を組み込むことの可能性を示した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:28:52 GMT)
CFN-ESA: A Cross-Modal Fusion Network with Emotion-Shift Awareness for Dialogue Emotion Recognition [34.2]
会話における感情認識のための感情シフト認識型クロスモーダルフュージョンネットワーク(CFN-ESA)を提案する。 CFN-ESAは、ユニモーダルエンコーダ(RUME)、クロスモーダルエンコーダ(ACME)、感情シフトモジュール(LESM)からなる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:05:05 GMT)
Graph Neural Networks with Diverse Spectral Filtering [32.7]
スペクトルグラフニューラルネットワーク(GNN)は、グラフ機械学習において大きな成功を収めている。本稿では,ノード固有のフィルタ重みを自動的に学習する新しいスペクトルフィルタリング(DSF)フレームワークを提案する。我々のフレームワークは、ノード分類タスクにおいて、モデル性能を最大4.92%向上させることができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:50:04 GMT)
ES-GNN: Generalizing Graph Neural Networks Beyond Homophily with Edge Splitting [32.7]
本稿では,学習タスクに関係のないグラフエッジを適応的に識別する新しいエッジ分割GNN(ES-GNN)フレームワークを提案する。本稿では,ES-GNNを非交叉グラフ記述問題の解とみなすことができることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:15:04 GMT)
X-Eval: Generalizable Multi-aspect Text Evaluation via Augmented Instruction Tuning with Auxiliary Evaluation Aspects [32.5]
X-Evalは、エンドユーザーがカスタマイズした視覚的側面と見えない側面の両方でテキストを評価するための2段階のインストラクションチューニングフレームワークである。 X-Evalは2つの学習段階から構成されており、モデルの性能を向上させるバニラ命令チューニング段階と、微粒化評価面間の接続を利用してテキスト品質を評価する拡張命令チューニング段階である。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:41:24 GMT)
Recent Advances in 3D Gaussian Splatting [31.4]
3次元ガウススプラッティングは、新規なビュー合成のレンダリング速度を大幅に高速化した。 3D Gaussian Splattingの明示的な表現は、動的再構成、幾何学的編集、物理シミュレーションなどの編集作業を容易にする。本稿では,3次元再構成,3次元編集,その他の下流アプリケーションに大まかに分類できる最近の3次元ガウス散乱法について,文献的考察を行う。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:40:52 GMT)
Anti-Overestimation Dialogue Policy Learning for Task-Completion Dialogue System [30.9]
過大評価問題は、強化学習(RL)に基づく対話政策において広く知られている問題である。本稿では,基底真理最大作用値の動的部分平均推定器(DPAV)を提案する。 DPAVは、予測された最大アクション値と最小アクション値との間の部分平均を計算する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:51:55 GMT)
Smart Help: Strategic Opponent Modeling for Proactive and Adaptive Robot Assistance in Households [30.3]
Smart Helpは、多様な障害を持つ人間のエージェントに対して、積極的にかつ適応的なサポートを提供することを目的としている。本稿では,主エージェントの能力と目標の微妙な理解を提供する,イノベーティブな対戦相手モデリングモジュールを紹介する。この結果から,AIを組み込んだ支援ロボットが,脆弱なグループの健康向上に寄与する可能性が示唆された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:03:59 GMT)
When and How: Learning Identifiable Latent States for Nonstationary Time Series Forecasting [30.0]
識別可能なlatEnt stAtes (IDEA) を学習し、分布シフトの発生を検知する。さらに、定常状態と非定常状態とを十分な観測仮定で切り離して、潜在状態がどのように変化するかを学ぶ。これらの理論に基づいて,自己回帰型隠れマルコフモデルを用いて潜伏環境を推定するIDEAモデルを考案した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:03:26 GMT)
Incremental Residual Concept Bottleneck Models [29.4]
Concept Bottleneck Models (CBM) は、ディープニューラルネットワークによって抽出されたブラックボックスの視覚表現を、解釈可能な概念のセットにマッピングする。本稿では,概念完全性の課題を解決するために,インクリメンタル・Residual Concept Bottleneck Model (Res-CBM)を提案する。提案手法は,任意のCBMの性能向上を目的としたポストホック処理法として,ユーザ定義の概念バンクに適用できる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:02:19 GMT)
Understanding Multimodal Deep Neural Networks: A Concept Selection View [29.1]
概念に基づくモデルは、ディープニューラルネットワークによって抽出されたブラックボックスの視覚表現を、人間の理解可能な概念のセットにマッピングする。人間の先入観を導入することなくコア概念をマイニングするための2段階概念選択モデル(CSM)を提案する。提案手法は,エンドツーエンドのブラックボックスモデルに匹敵する性能を実現する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:06:49 GMT)
Seeing Text in the Dark: Algorithm and Benchmark [28.9]
そこで本研究では,暗黒領域におけるテキストのローカライズのための,効率的かつ効果的な単一ステージアプローチを提案する。テキスト検出器の訓練段階において,制約付き学習モジュールを補助機構として導入する。様々な場面や言語を含む任意の字形テキストのための包括的低照度データセットを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:07:10 GMT)
No Need to Lift a Finger Anymore? Assessing the Quality of Code Generation by ChatGPT [28.7]
本稿では,ChatGPTを用いたコード生成の質について検討する。私たちは5つの言語(C、C++、Java、Python、JavaScript)で728のアルゴリズム問題と、コード生成タスクの54のコードシナリオを持つ18のCWEを活用しています。この結果から,ChatGPTベースのコード生成に生じる潜在的な問題や限界が明らかになった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:58:47 GMT)
Time-resolved quantum correlations in electronic noise [28.3]
電流変動の相関が$t$と$t+tau$が$V(t)$にどのように依存するかを実験的に示す。超伝導接合におけるアク・ジョセフソン効果の対向を、通常の非超伝導メソスコピックデバイスに示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:34:39 GMT)
Segment Anything Model for Road Network Graph Extraction [27.8]
衛星画像から大規模でベクトル化された道路網グラフを抽出するためのSAM-Roadを提案する。 SAM-Roadは単純で単純で最小限の設計で、最先端のRNGDet++で同等の精度を実現している。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:19:39 GMT)
RoNID: New Intent Discovery with Generated-Reliable Labels and Cluster-friendly Representations [27.8]
New Intent Discovery (NID)は、オープンワールドシナリオにおける新しい意図グループを特定することを目的としている。現在の手法は、不正確な擬似ラベルと表現学習に問題がある。本稿では,EMスタイルの手法により最適化されたロバスト・ニューインテント・ディスカバリー・フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:58:28 GMT)
Weakly-Supervised 3D Visual Grounding based on Visual Linguistic Alignment [26.9]
既存の3Dビジュアルグラウンドのアプローチでは、テキストクエリのバウンディングボックスアノテーションがかなり必要になります。 textbfVisual textbfLinguistic textbfAlignment に基づいたtextbf3Dビジュアルグラウンドの弱教師付きアプローチである textbf3D-VLA を提案する。我々の3D-VLAは、テキストと2D画像間のセマンティクスの整合において、現在の大規模視覚言語モデル(VLM)の優れた能力を利用する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:51:33 GMT)
Evaluating Spatial Understanding of Large Language Models [26.4]
大規模言語モデルは、様々なタスクにまたがる顕著な能力を示している。近年の研究では、LLM表現は基礎となる基礎概念の側面を暗黙的に捉えていることが示唆されている。自然言語ナビゲーションタスクを設計し,空間構造を表現・推論するLLMの能力を評価する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:59:06 GMT)
Active Learning for Control-Oriented Identification of Nonlinear Systems [26.2]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:40:39 GMT)
Diffusion Models Meet Remote Sensing: Principles, Methods, and Perspectives [26.0]
拡散モデルはコンピュータビジョン、自然言語処理、分子設計など、多くの分野で最先端の結果を達成した。リモートセンシングコミュニティはまた、拡散モデルの強力な能力に気づき、画像を処理するための様々なタスクに素早く適用した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:27:10 GMT)
Statistically Optimal K-means Clustering via Nonnegative Low-rank Semidefinite Programming [25.2]
K$-meansクラスタリングは、大規模なデータセットのパターンを識別する機械学習手法として広く使用されている。本稿では,非負の低ランクな$K$-means分解問題を解くNMFライクなアルゴリズムについて考察する。提案アルゴリズムは,スケーラビリティを維持しつつ,既存の最先端技術と比較して,誤クラスタリングエラーを著しく小さくする。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:05:41 GMT)
MAProtoNet: A Multi-scale Attentive Interpretable Prototypical Part Network for 3D Magnetic Resonance Imaging Brain Tumor Classification [25.1]
そこで本稿では,MAProtoNet と呼ばれるマルチスケール適応型部分ネットワークを提案し,より正確な属性マップを提供する。具体的には、四重項の注意層から注意的特徴をマージし、属性マップを生成するための簡潔なマルチスケールモジュールを提案する。医療画像における既存の解釈可能な部分ネットワークと比較して、MAProtoNetはローカライゼーションにおける最先端の性能を達成することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:30:17 GMT)
Multimodal Attack Detection for Action Recognition Models [24.6]
本稿では,任意の行動認識モデルに適合する新しいユニバーサル検出手法を提案する。 4つのアクション認識モデルをターゲットにした4つの最先端攻撃に対してテストされ、提案された検出器は16のテストケース平均0.911のAUCを達成する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:31:25 GMT)
PracticalDG: Perturbation Distillation on Vision-Language Models for Hybrid Domain Generalization [24.4]
本稿では,Hybrid Domain Generalization (HDG) と,アルゴリズムのロバスト性を評価するために,様々な分割を構成する新しい指標である$H2$-CVを提案する。提案手法は,複数のデータセット上での最先端アルゴリズムよりも優れており,特にデータ不足に直面する場合のロバスト性の向上に寄与する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:41:13 GMT)
MCPNet: An Interpretable Classifier via Multi-Level Concept Prototypes [24.3]
我々は、低レベルの特徴の意思決定プロセスに関する洞察が欠如している説明は、完全に忠実でも有用でもないと論じる。本稿では,クラス認識概念分布(CCD)の損失を通じて,分類目的のマルチレベル概念のプロトタイプ分布を学習・調整する新しいパラダイムを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:13:56 GMT)
Large Language Models for Mobile GUI Text Input Generation: An Empirical Study [24.3]
大規模言語モデル(LLM)は優れたテキスト生成機能を示している。本稿では,UIページに対するAndroidテキスト入力生成における9つの最先端LCMの有効性を広範囲に検討する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:56:50 GMT)
Probing Large Language Models from A Human Behavioral Perspective [24.1]
大規模言語モデル(LLM)は、現代のNLPにおいて支配的な基礎モデルとして登場した。フィードフォワードネットワーク (FFN) やマルチヘッド・セルフアテンション (MHSA) などの予測プロセスや内部メカニズムの理解はいまだに未解明のままである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:22:39 GMT)
Rethinking Channel Dependence for Multivariate Time Series Forecasting: Learning from Leading Indicators [23.5]
本稿では,まず,各段階における先行指標とその先行ステップを効率的に推定するLIFTという新しい手法を提案する。 LIFTは任意の時系列予測メソッドとシームレスに協調できるプラグインとして機能する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:26:56 GMT)
CodeCloak: A Method for Evaluating and Mitigating Code Leakage by LLM Code Assistants [23.5]
LLMベースのコードアシスタントを使用する場合、コード漏洩のリスクを軽減するための2つの補完手法を提案する。 1つ目は、コードアシスタントサービスに送信されたコードセグメントから、開発者のオリジナルを再構築するテクニックである。 2つ目は、コードアシスタントサービスに送信する前にプロンプトを操作する、新しいディープ強化学習エージェントであるCodeCloakである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:30:58 GMT)
Beyond Known Clusters: Probe New Prototypes for Efficient Generalized Class Discovery [23.4]
Generalized Class Discovery (GCD) はラベルを非ラベルデータに動的に割り当てることを目的としている。本稿では,学習可能な潜在的なプロトタイプを導入し,クラスタプロトタイプを拡張する適応型探索機構を提案する。我々の手法は、最も近い競争相手をかなりの差で上回っている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:41:40 GMT)
MING-MOE: Enhancing Medical Multi-Task Learning in Large Language Models with Sparse Mixture of Low-Rank Adapter Experts [22.6]
本稿では,MING-MOE(Mixture-of-Expert)をベースとした医療用大規模言語モデルを提案する。タスク固有のアノテーションを必要とせずに、多種多様な複雑な医療タスクを管理するように設計されている。 20以上の医療タスクで最先端(SOTA)のパフォーマンスを達成し、既存のモデルよりも大幅に改善されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:28:52 GMT)
Unraveling Batch Normalization for Realistic Test-Time Adaptation [22.1]
本稿では,ミニバッチ劣化問題について考察する。バッチ正規化を解き放つことにより、不正確なターゲット統計は、バッチのクラス多様性が大幅に減少することに起因することが判明した。テスト時間指数移動平均(TEMA)という簡単なツールを導入し、トレーニングとテストバッチ間のクラス多様性のギャップを埋める。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:00:35 GMT)
Safe Reinforcement Learning on the Constraint Manifold: Theory and Applications [22.0]
本稿では,学習に基づくロボットシステムに対して,複雑な安全制約を原則的に課す方法について述べる。我々のアプローチは、安全ロボット構成の集合を表すConstraint Manifoldの概念に基づいている。実世界のロボットエアホッケータスクにおいて,本手法の有効性を実証する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:55:15 GMT)
GraphRARE: Reinforcement Learning Enhanced Graph Neural Network with Relative Entropy [21.6]
GraphRAREはノード相対エントロピーと深層強化学習に基づいて構築されたフレームワークである。革新的なノード相対エントロピーは、ノードペア間の相互情報を測定するために使用される。グラフトポロジを最適化するために,深層強化学習に基づくアルゴリズムを開発した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:52:55 GMT)
EfficientDM: Efficient Quantization-Aware Fine-Tuning of Low-Bit Diffusion Models [21.2]
ポストトレーニング量子化(PTQ)と量子化学習(QAT)は、拡散モデルを圧縮・加速する2つの主要なアプローチである。我々は、PTQのような効率でQATレベルの性能を実現するために、EfficientDMと呼ばれる低ビット拡散モデルのためのデータフリーかつパラメータ効率の微調整フレームワークを導入する。提案手法は, PTQに基づく拡散モデルにおいて, 同様の時間とデータ効率を保ちながら, 性能を著しく向上させる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:33:57 GMT)
Projective Systematic Authentication via Reed-Muller Codes [20.8]
本稿では,2進線形符号に基づく計画的体系的認証方式を構築することの問題点について検討する。本稿では,与えられたコード中の高次元のコードワードにマッピングされたソースを,まず低次元ベクトルに投影する一般的な投影法を提案する。本稿では,認証システムの性能を評価するための主要な指標として広く考えられている,偽造の確率に関する分析結果を提供する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 21:58:02 GMT)
G-ACIL: Analytic Learning for Exemplar-Free Generalized Class Incremental Learning [20.5]
クラスインクリメンタルラーニング(CIL)は、カテゴリーを分けた逐次的なタスクでネットワークをトレーニングするが、破滅的な忘れ込みに悩まされる。本稿では,G-ACIL(Exemplar-free generalized analysis class incremental learning)を提案する。 G-ACILは解析学習(勾配のない訓練手法)を採用し、GCILのシナリオに解析的解(すなわちクローズドフォーム)を提供する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:06:35 GMT)
Learning Payment-Free Resource Allocation Mechanisms [19.6]
ニューラルネットワークを用いた自己関心エージェント間のリソース制限機構の設計について検討する。支払いなしのメカニズム設計に"マネーバーニング"というアイデアを取り入れた、新たなエンドツーエンドニューラルネットワークアーキテクチャであるExS-Netをコントリビュートしています。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:02:36 GMT)
Nonstationary Reinforcement Learning with Linear Function Approximation [19.5]
ドリフト環境下での線形関数近似によるマルコフ決定過程(MDP)における強化学習について考察する。まず、周期的再起動を伴う最小二乗値の楽観的な修正を開発し、変動予算が分かっている場合にその動的後悔を束縛する。非定常線型 MDP に対する最初の minimax dynamic regret lower bound を導出し、副生成物として Jin らによって未解決の線型 MDP に対する minimax regret lower bound を定めている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 06:52:10 GMT)
ComCLIP: Training-Free Compositional Image and Text Matching [19.4]
コントラスト言語-画像事前訓練は画像とテキストのマッチングに優れたゼロショット性能を示した。我々は新しいtextbftextittraining-free compositional CLIP model (ComCLIP) を提案する。 ComCLIPは、入力された画像を被写体、オブジェクト、アクションのサブイメージに切り離し、CLIPのビジョンエンコーダとテキストエンコーダを構成して、合成テキスト埋め込みとサブイメージ埋め込みに対する進化的なマッチングを実行する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:14:03 GMT)
WikiSplit++: Easy Data Refinement for Split and Rephrase [19.1]
Split と Rephrase は複雑な文を同じ意味を持つ複数の単純文に分割する。我々は、WikiSplitのインスタンスを削除してWikiSplit++を作成し、複雑な文は、より単純な文の少なくとも1つを含まない。本手法は,幻覚測定の指標である分割数とエンテーメント比において有意な利得を得た。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:07:32 GMT)
UAV-Rain1k: A Benchmark for Raindrop Removal from UAV Aerial Imagery [19.0]
UAVのレンズに付着した雨滴は、背景の視認性を阻害し、画質を低下させる。まず,UAV画像から雨滴を除去するUAV-Rain1kというベンチマークデータセットを構築した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:56:11 GMT)
On the Computational Complexity of Private High-dimensional Model Selection [19.0]
プライバシー制約下での高次元疎線形回帰におけるモデル選択の問題点を考察する。そこで本研究では,よく知られた指数モデルを用いて,高い効用性を有する微分プライベートなベストサブセット選択法を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:32:26 GMT)
Is Next Token Prediction Sufficient for GPT? Exploration on Code Logic Comprehension [18.9]
我々は、先進的な事前訓練タスク「Next Token Prediction+」を提案する。この事前トレーニングに続いて、コードドメイン事前トレーニングモデルであるCode LlamaとStarCoderの両方が、論理的に等価なコード選択タスクとコード補完タスクに大幅に改善されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:11:07 GMT)
Reformulating Sequential Recommendation: Learning Dynamic User Interest with Content-enriched Language Modeling [18.3]
本稿では、事前学習した言語モデルの意味理解機能を活用してパーソナライズされたレコメンデーションを生成するLANCERを提案する。我々のアプローチは、言語モデルとレコメンデーションシステムの間のギャップを埋め、より人間的なレコメンデーションを生み出します。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:32:33 GMT)
Countering Mainstream Bias via End-to-End Adaptive Local Learning [17.8]
CF(Collaborative Filtering)ベースのレコメンデーションは、主流のバイアスに悩まされる。主流ユーザとニッチユーザの両方に高品質なレコメンデーションを提供するために,新しいエンドツーエンド適応型ローカル学習フレームワークを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:17:33 GMT)
Forward Learning of Graph Neural Networks [17.8]
バックプロパゲーション(BP)はディープニューラルネットワーク(NN)のトレーニングにおけるデファクトスタンダードである BPは、生物学的に理解できないだけでなく、NN学習のスケーラビリティ、並列性、柔軟性を制限しているいくつかの制約を課している。本稿では,BPの制約を回避するために,実効的なレイヤワイドローカルフォワードトレーニングを行うForwardGNNを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:10:00 GMT)
LLMs Cannot Reliably Identify and Reason About Security Vulnerabilities (Yet?): A Comprehensive Evaluation, Framework, and Benchmarks [17.5]
大規模な言語モデル(LLM)は、自動脆弱性修正に使用するために提案されているが、ベンチマークでは、セキュリティ関連のバグが一貫して欠如していることが示されている。 SecLLMHolmesは,LLMがセキュリティ関連のバグを確実に識別し,原因を判断できるかどうか,これまでで最も詳細な調査を行う,完全に自動化された評価フレームワークである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:55:53 GMT)
Fast Gradient Computation for Gromov-Wasserstein Distance [17.5]
グロモフ=ワッサーシュタイン距離は最適な輸送の顕著な拡張である。グロモフ=ワッサーシュタイン距離と輸送計画の計算は高価である。本稿では,動的プログラミング手法により,精度の高い勾配計算を高速化する新しい手法を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:23:34 GMT)
Scalable Spatiotemporally Varying Coefficient Modelling with Bayesian Kernelized Tensor Regression [17.2]
カーネル化されたテンソル回帰(BKTR)は、低ランクの時間構造を持つモデリングプロセスに対する新しいスケーラブルなアプローチと考えられる。そこで本研究では,BKTRのモデル推定と推定において,BKTRの優れた性能と効率性を確認した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:25:28 GMT)
Objects With Lighting: A Real-World Dataset for Evaluating Reconstruction and Rendering for Object Relighting [16.9]
写真からオブジェクトを再構成し、仮想的に新しい環境に配置することは、標準的な新しいビュー合成タスクを超えます。この研究は、リライトのためのオブジェクトの再構築とレンダリングを測定するための実世界のデータセットを提供する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:43:01 GMT)
Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles [16.9]
ブラックボックスの客観的関数は、ランクのオラクルを通してのみ測定できる。ゼロ階最適化アルゴリズムZO-RankSGDを導入する。また,ZO-RankSGDは,数ラウンドのフィードバックだけで生成した画像のディテールを大幅に向上させることができることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:38:13 GMT)
IRAD: Implicit Representation-driven Image Resampling against Adversarial Attacks [16.6]
本稿では,画像再サンプリングという,敵対的攻撃に対する新たなアプローチを提案する。画像再サンプリングは、幾何学的変換によって指定されたシーンの再調整や再レンダリングの過程をシミュレートして、離散画像を新しい画像に変換する。本手法は,クリーンな画像の精度を維持しつつ,多様な深層モデルの様々な攻撃に対する対角的堅牢性を著しく向上することを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:57:15 GMT)
Learning Probabilistic Symmetrization for Architecture Agnostic Equivariance [16.5]
群対称性を持つ学習関数における同変アーキテクチャの限界を克服する新しい枠組みを提案する。我々は、不変量や変圧器のような任意の基底モデルを使用し、それを与えられた群に同変するように対称性付けする。実証実験は、調整された同変アーキテクチャに対する競争結果を示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:50:13 GMT)
Toward Informal Language Processing: Knowledge of Slang in Large Language Models [16.4]
我々は,スラングの自動処理に関連するタスクセットの評価を支援するデータセットを構築した。評価と微調整の両面で,2つのコアアプリケーションにおけるデータセットの有効性を示す。 GPT-4のようなLCMはゼロショット設定で優れた性能を発揮するが、我々のデータセットで微調整された小さなBERTのようなモデルは同等の性能を得る。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:17:01 GMT)
Towards Characterizing Domain Counterfactuals For Invertible Latent Causal Models [15.8]
本研究では,異なるドメインで生成された場合,サンプルがどのようなものであったのかを仮定した,ドメイン反事実と呼ばれる特定のタイプの因果クエリを解析する。本研究では, 潜在構造因果モデル (SCM) の回復は, ドメイン・デファクト・デファクトを推定するために不要であることを示す。また、モデル生成過程を単純化し、生成モデル推定を行うための理論的基盤となる実用的なアルゴリズムも開発する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 21:52:38 GMT)
Aligning LLMs for FL-free Program Repair [14.9]
本稿では,大規模言語モデル (LLM) をプログラム修復に適用するための新しいアプローチについて検討する。我々の中核的な洞察は、LLMのAPR能力は、単にトレーニング目標に出力を合わせるだけで大幅に改善できるということです。この知見に基づいて、我々はAPRの直接的なプロンプトフレームワークであるD4Cを設計した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:36:40 GMT)
Proof-of-Learning with Incentive Security [14.6]
ほとんどの並行ブロックチェーンシステムは、分散コンセンサスとセキュリティ保証のためのProof-of-Work(PoW)あるいはProof-of-Stake(PoS)メカニズムに大きく依存しています。計算効率,証明可能なインセンティブ-セキュリティ保証,制御容易な難易度を備えたPoL機構を設計する上で,既成の難しさを回避し,合理的なプローバーに率直に行動を促すインセンティブ-セキュリティの概念を導入する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:18:40 GMT)
SmartPathfinder: Pushing the Limits of Heuristic Solutions for Vehicle Routing Problem with Drones Using Reinforcement Learning [14.4]
Vehicle Problem with Drones (VRPD)は、トラックとドローンの両方のルーティングパスを最適化しようとしている。我々は、VRPDの解決、蒸留、およびコア要素への標準化のために設計された手法を網羅的に検討する。次に、ソリューションコンポーネントとシームレスに統合された、新しい強化学習フレームワークを開発します。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:10:54 GMT)
LoopGaussian: Creating 3D Cinemagraph with Multi-view Images via Eulerian Motion Field [13.8]
シネマグラフ(Cinemagraph)は、静止画と微妙な動きの要素を組み合わせた視覚メディアの一種である。本稿では,3次元ガウスモデルを用いて,2次元画像空間から3次元空間への撮影画像の高次化を提案する。実験の結果,提案手法の有効性を検証し,高品質で視覚的に魅力的なシーン生成を実証した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:07:53 GMT)
PM2: A New Prompting Multi-modal Model Paradigm for Few-shot Medical Image Classification [12.6]
本稿では,PM2と呼ばれるマルチモーダル基盤モデルに基づく医用画像分類のための新しいマルチモーダルモデルパラダイムを提案する。画像のモダリティに加えて、PM2はプロンプトとして知られる別の補足的なテキスト入力を導入し、対応する画像や概念クラスを記述している。我々のPM2は、プロンプトスキームによらず、かなり優れており、最先端のパフォーマンスを実現しています。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:27:06 GMT)
Event Grounded Criminal Court View Generation with Cooperative (Large) Language Models [12.6]
本稿では,共用(大規模)言語モデルを用いた刑事裁判所ビュー生成のためのイベントグラウンドドジェネレーション(EGG)手法を提案する。我々はまず,大量の注釈付きイベントを伴わずに事象を抽出できるLLMに基づく抽出法を設計する。そして,抽出した事象を事例事実と事象を融合して,裁判所ビュー生成に組み込む。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:58:44 GMT)
VRPD-DT: Vehicle Routing Problem with Drones Under Dynamically Changing Traffic Conditions [12.3]
動的に変化する交通条件(VRPD-DT)下でのドローンによる車両ルーティング問題という新しい問題を提案する。我々は,機械学習による走行時間予測アルゴリズムを用いて,実際の走行距離と予測走行時間を決定する新しいコストモデルを構築した。可変近傍降下(VND)アルゴリズムは,交通条件の動的条件下で最適なトラック走行経路を求めるために開発された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:28:24 GMT)
ShapeFormer: Shape Prior Visible-to-Amodal Transformer-based Amodal Instance Segmentation [11.5]
ShapeFormerは、可視的からアモーダルな遷移を持つTransformerベースのモデルである。これは出力セグメンテーション間の明示的な関係を促進し、アモーダル-可視遷移の必要性を回避する。 ShapeFormerは、Visible-Occluding Mask Head、Shape-Prior Amodal Mask Head、Calegory-Specific Shape Prior Retrieverの3つの主要なモジュールで構成されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:42:17 GMT)
On Speculative Decoding for Multimodal Large Language Models [11.2]
MLLM(Multimodal Large Language Models)による推論は,大規模な言語モデルのバックボーンのため遅い。言語のみのモデルがLLaVA 7Bを用いて投機的復号化のための優れたドラフトモデルとして機能することを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:02:36 GMT)
Multi-scale Attention Network for Single Image Super-Resolution [10.7]
ConvNetsは、より大きな受容場を利用することで、高いレベルのタスクでトランスフォーマーと競合することができる。本稿では,従来のマルチスケール機構と新たなカーネルアテンションを結合したマルチスケールアテンションネットワーク(MAN)を提案する。我々のMANはSwinIRと同等に動作し、最先端のパフォーマンスと計算とのトレードオフを多種多様なものにすることができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:36:29 GMT)
LIGHTCODE: Light Analytical and Neural Codes for Channels with Feedback [10.6]
我々は,通信システムに適した低複雑さの符号化方式を設計することに注力する。まず,Schalkwijk-Kailath (SK) および Gallager-Nakiboglu (GN) スキームにインスパイアされた解析的符号化スキームである POWERBLAST が,SK および GN スキームに対して顕著な信頼性向上を実現していることを示す。次に、低SNR領域の信頼性を高めるために、メモリと計算の一部を使用しながら最先端の信頼性を実現する軽量ニューラルネットワークであるLIGHTCODEを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:09:41 GMT)
Meply: A Large-scale Dataset and Baseline Evaluations for Metastatic Perirectal Lymph Node Detection and Segmentation [10.3]
今回,Meply という大規模な直腸転移性リンパ節CT画像データセットを初めて紹介した。本稿では,新しいリンパ節分節モデルであるCoSAMを紹介する。 CoSAMは、直腸癌における転移性リンパ節の分節を誘導する配列に基づく検出を利用する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:30:16 GMT)
Stability and Generalization in Free Adversarial Training [9.8]
本稿では,アルゴリズム的安定性フレームワークを用いた対向学習手法の一般化性能について検討する。証明された一般化境界は, 自由対数学習法が, トレーニングとテストサンプル間の一般化ギャップを低くすることができることを示している。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:07:20 GMT)
Shifting Spotlight for Co-supervision: A Simple yet Efficient Single-branch Network to See Through Camouflage [9.7]
Co-Supervised Spotlight Shifting Network (CS$3$Net)は、コンパクトだが効率的なシングルブランチネットワークである。私たちの研究は、シフトするスポットライトの下で動物のカモフラージュが容易に明らかにできるという効果を再現しています。効率のよいCODモデルと比較して、MAC(Multiply-Accumulate)操作を32.13%削減する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:10:33 GMT)
The Method of Detecting Flying Birds in Surveillance Video Based on Their Characteristics [9.6]
本稿では,Surveillance Video(FBOD-SV)におけるFlying Bird Object Detection法を提案する。新しい特徴集約モジュールである相関注意特徴集約(Co-Attention-FA)モジュールは、飛行する鳥の物体の特徴を集約するように設計されている。ダウンサンプリングとアップサンプリングを併用したフライングバードオブジェクト検出ネットワーク(FBOD-Net)が設計されている。また,SimOTA動的ラベル割り当て手法をワンカテゴリオブジェクト検出に適用した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:56:09 GMT)
Fidelity of Wormhole Teleportation in Finite-qubit Systems [9.3]
ホログラフィーの双対性は、重力と時空が強く相互作用する系から現れることを記述し、重力物理学の実験的な研究のための自然な道のりを提供する。顕著な例はワームホールテレポーテーションプロトコルによるワームホールのシミュレーションである。我々は、$N$-qubitシステムにおけるワームホールテレポーテーションの忠実度を計算するための理論的枠組みを開発する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:03:11 GMT)
Towards Enhancing Health Coaching Dialogue in Low-Resource Settings [9.2]
患者と会話し,特定の目標を創り,達成し,共感をもって感情に対処する対話システムを構築することを提案する。我々は, より共感的で, 流動的で, 一貫性のある応答を生成し, アノテーションを必要とせずとも, NLUタスクにおける最先端のタスクに優れることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:23:15 GMT)
Early detection of disease outbreaks and non-outbreaks using incidence data [9.2]
我々は、アウトブレイクやアウトブレイクを正確に予測する、現実世界のトレーニングデータを持たない一般的なモデルを開発する。アウトブレイクとアウトブレイクを区別する統計的特徴は,アウトブレイクが起こるずっと前から存在する。人工的なデータセットと実世界のデータセットの違いは、発生のずっと前に検出できる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:57:14 GMT)
A Mathematical Theory for Learning Semantic Languages by Abstract Learners [9.1]
大規模言語モデルの最近の進歩は、システムパラメータの数とトレーニングデータのサイズが一定の閾値を超えると、能力(学習スキル)が出現することを示した。我々は、学習(または訓練)過程を考慮して、学習スキルの出現を説明する数学的理論を開発する。本稿ではセマンティック圧縮の手法を提案し,そのセマンティックコミュニケーションへの応用について論じる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 06:43:47 GMT)
Systematic Assessment of Tabular Data Synthesis Algorithms [9.1]
データ合成アルゴリズムを評価するための体系的評価フレームワークを提案する。それらの制限に対処するために、フィリティ、プライバシ、ユーティリティの観点から、一連の新しいメトリクスを導入します。また,提案手法に基づいて,合成データの質を継続的に向上する,チューニングのための統一的な目標も考案した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:11:56 GMT)
Topology-induced symmetry breaking: a demonstration in antiferromagnetic magnons on a Möbius strip [8.9]
非自明な境界条件により、ハミルトニアンによって保存された特定の局所対称性が励起固有状態で破られるような位相誘起対称性の破れのメカニズムを提案する。実演として、2つの反強磁性結合スピン鎖からなるM"ビス帯上のマグノン励起について検討した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:19:32 GMT)
Large Transformers are Better EEG Learners [8.9]
AdaCT - 時系列データを2次元の擬似画像やテキスト形式に変換するためのプラグアンドプレイアダプタ。 AdaCTIは、マルチチャネルまたは長さの単一チャネル時系列データを擬似画像に変換して、微調整された事前学習された視覚変換を行う。 AdaCT-Tは、短い単一チャネルデータをテキストに変換し、訓練済み言語変換器を微調整する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:11:03 GMT)
Lower bounds on bipartite entanglement in noisy graph states [8.6]
我々は、初期量子ビットがCZ演算の適用前に非偏極雑音を受けるノイズモデルを考える。任意の量の(最大でない)偏極ノイズに対して厳密な正のコヒーレント情報を保持するグラフ状態の族を見つける。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:01:45 GMT)
Mixture of Experts Soften the Curse of Dimensionality in Operator Learning [8.4]
我々は,専門的ニューラル演算子のネットワーク上に分散した関数空間間のニューラル演算子(MoNO)の混合を構成する。 L2,[0,1]d)$空間の間の任意のリプシッツ非線型作用素がソボレフ単位球上で、与えられた任意の$varepsilon>0$精度に対して等しく近似できることを保証するテキスト分散普遍近似定理である。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 23:20:16 GMT)
Multimodal Cross-Document Event Coreference Resolution Using Linear Semantic Transfer and Mixed-Modality Ensembles [8.2]
イベントコア参照解決(英: Event coreference resolution、ECR)とは、イベントの別個の参照が、実際に同じ基礎となる発生にリンクされているかどうかを決定するタスクである。本稿では,視覚モデルと言語モデル間の単純な線形写像と,視覚的およびテキスト的手がかりを統合したマルチモーダル・クロスドキュメント・イベント・コア参照分解法を提案する。本研究は,ECRにおけるマルチモーダル情報の有用性を示すものである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:01:58 GMT)
Probabilistic Directed Distance Fields for Ray-Based Shape Representations [8.1]
Directed Distance Fields (DDF) は、古典的な距離場の上に構築された新しいニューラルな形状表現である。基礎分野における本質的な不連続性をモデル化する方法を示す。次に, 単一形状のフィッティング, 生成モデリング, 単一像の3次元再構成など, DDFを応用した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 21:02:49 GMT)
NeurIT: Pushing the Limit of Neural Inertial Tracking for Indoor Robotic IoT [7.7]
慣性トラッキングは、ロボットIoTにとって不可欠であり、低コストの慣性計測ユニット(IMU)とディープラーニングによるトラッキングアルゴリズムのおかげで人気を博している。我々は,追跡精度を新たなレベルに高めるシーケンス・ツー・シーケンス・フレームワークNeurITを紹介する。 NeurITはコアにTF-BRT(Time-Frequency Block-Recurrent Transformer)を採用し、リカレントニューラルネットワーク(RNN)とTransformerのパワーを組み合わせて、時間領域と周波数領域の両方で代表的な特徴を学習する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:24:50 GMT)
A Parametric Rate-Distortion Model for Video Transcoding [7.2]
パラメトリックレート歪み(R-D)トランスコーダモデルを提案する。ビデオのエンコーディングを必要とせず,様々な速度で歪みを予測できるモデルを開発した。トランスサイズにより視覚的品質改善(PSNR)を達成するために使用できる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:37:57 GMT)
On the best approximation by finite Gaussian mixtures [7.1]
一般ガウス位置混合を有限混合で近似する問題を考える。所定の精度を達成する有限混合の最小順序は定数係数で決定される。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 06:57:44 GMT)
PraFFL: A Preference-Aware Scheme in Fair Federated Learning [6.7]
フェアフェデレーション学習パラダイム(PrafFL)における優先度認識方式を提案する。 PraFFLは、ニーズを満たすために、各クライアントの好みに基づいてモデルを適応的に調整することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:40:05 GMT)
Zero-Shot Code Representation Learning via Prompt Tuning [6.4]
コード表現を学習するためのゼロショットアプローチであるZecolerを提案する。 Zecolerは、事前訓練されたプログラミング言語モデルの上に構築されている。我々はZecolerを,コードクローン検出,コード検索,メソッド名予測,コード要約,コード生成を含む5つのコードインテリジェンスタスクで評価する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:47:07 GMT)
PromptCodec: High-Fidelity Neural Speech Codec using Disentangled Representation Learning based Adaptive Feature-aware Prompt Encoders [6.4]
本稿では,特徴認識型プロンプトエンコーダを用いた新しいエンドツーエンドニューラルスピーチであるPromptCodecを提案する。提案したPromptCodecは、あらゆる異なる条件下で、最先端のニューラルスピーチモデルより一貫して優れています。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:48:31 GMT)
Content-based Controls For Music Large Language Modeling [6.2]
Coco-Mullaは、音楽大言語モデリングのためのコンテンツベースの制御方法である。トランスフォーマーベースのオーディオモデルに適したパラメータ効率細調整法(PEFT)を用いる。提案手法は,低リソース半教師付き学習による高品質な音楽生成を実現する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:19:46 GMT)
HEAT: Head-level Parameter Efficient Adaptation of Vision Transformers with Taylor-expansion Importance Scores [6.1]
Taylor-Expansion importance score (HEAT) を用いた効率的な適応 Taylor-Expansion importance score (HEAT)による熱適応 Taylor-Expansion importance score (HEAT)による熱適応
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:01:35 GMT)
Exploring Explainability in Video Action Recognition [5.8]
ビデオ行動認識と画像分類はコンピュータビジョンの基本課題である。 Video-TCAVは、ビデオ行動認識モデルの意思決定プロセスにおいて、特定の概念の重要性を定量化することを目的としている。本稿では,ビデオ-TCAVテストにおいて,映像行動認識に関連する空間的・時間的概念を生成するための機械支援手法を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:34:14 GMT)
Seismic Traveltime Tomography with Label-free Learning [5.6]
従来の断層法は迅速に実装できるが、その効果は以前の仮定によって制限されることが多い。深層学習と辞書学習を統合して,解像度を低解像度で向上する手法を提案する。合成データとフィールドデータの両方に対する数値実験により,提案手法の有効性を実証する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:22:03 GMT)
Adaptive User-Centric Entanglement Routing in Quantum Data Networks [5.4]
分散量子コンピューティング(DQC)は、量子データネットワーク(QDN)を介して複数の小さな量子コンピュータ(QC)を相互接続することで、量子コンピューティングの可能性を活用するという大きな可能性を秘めている。 QDN内の量子テレポーテーションのための2つのQC間の長距離量子絡み合わせを確立することは重要な側面であり、絡み合わせルーティングを伴う。既存のアプローチは主に、現在の絡み合い接続(EC)要求に対する絡み合い性能の最適化に重点を置いている。本稿では,ユーザの予算制約に固執しながら,絡み合いの成功率を最大化するために,長期にわたるユーザ中心の絡み合いルーティング問題を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:20:00 GMT)
ChimpVLM: Ethogram-Enhanced Chimpanzee Behaviour Recognition [5.3]
本稿では,カメラトラップ映像から直接抽出した視覚特徴のマルチモーダルデコードを利用する視覚言語モデルを提案する。我々はPanAf500とPanAf20Kのデータセットを用いてシステムを評価する。トップ1の精度で視覚モデルと視覚言語モデルに対して最先端の性能を実現する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:17:51 GMT)
Tackling Structural Hallucination in Image Translation with Local Diffusion [5.1]
本稿では,複数の局所拡散プロセスによる幻覚を緩和する学習自由拡散フレームワークを提案する。本手法は,実世界の医療・自然画像データセットの40%と25%の誤診を減らし,ベースラインモデルに対する幻覚を定量的かつ質的に緩和する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:10:00 GMT)
Airship Formations for Animal Motion Capture and Behavior Analysis [4.9]
複数の角度から野生の馬を追跡し、追跡し、視覚的に記録するために、飛行船の形成を使用するように設計されたシステムを紹介します。本研究では,複数の角度から野生の馬を追跡し,追跡し,視覚的に記録するための飛行船形成システムを紹介する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:18:19 GMT)
When are Lemons Purple? The Concept Association Bias of Vision-Language Models [4.9]
概念アソシエーションバイアス(CAB)と呼ばれる視覚言語モデルの興味深い現象を報告する。 CABのモデルは、入力を概念の袋として扱い、他の欠落した概念をクロスモーダルに埋めようとする傾向にある。 CABは、自己回帰的損失を併用しても、対照的な損失で訓練された視覚言語モデルで一般的である。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:02:25 GMT)
No Easy Way Out: the Effectiveness of Deplatforming an Extremist Forum to Suppress Hate and Harassment [4.8]
オンラインハラスメントやハラスメントを抑えるために、アクティブなコミュニティを非プラットフォーム化することは困難である。ケーススタディでは、2022年後半に最大で最長のハラスメントフォーラム「キウイ・ファームズ」が中断された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:45:12 GMT)
ChangeAnywhere: Sample Generation for Remote Sensing Change Detection via Semantic Latent Diffusion Model [4.7]
ChangeAnywhereはセマンティック潜伏拡散モデルと単一時間画像を用いた新しいCDサンプル生成手法である。 ChangeAnywhereは2つのCDサンプルをキャプチャする。つまり、変更は意味的に異なることを意味し、非変更は同じ意味的制約の下で合理的な変更を意味する。 ChangeAnywhere-100Kは、さまざまなディープラーニングベースのCDモデルのための2つのCDベンチマークデータセットにおいて、ゼロショットと少数ショットの両方のパフォーマンスを著しく改善した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:46:35 GMT)
DeDoDe v2: Analyzing and Improving the DeDoDe Keypoint Detector [4.6]
我々は最近提案されたDeDoDeキーポイント検出器の解析と改良を行った。まず、DeDoDeキーポイントが一緒にクラスタ化される傾向があることに気付きます。第2に、データ拡張に関する問題に対処する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:36:13 GMT)
Trustworthy Multimodal Fusion for Sentiment Analysis in Ordinal Sentiment Space [4.6]
マルチモーダルビデオ感情分析は、話者の意見や態度を分析するために複数のモーダル情報を統合することを目的としている。以前のアプローチでは、異なるモダリティを平等に扱うことができ、主に異なる貢献を無視している。本稿では,TMSON(Multimodal sentiment Ordinal Network)を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:15:57 GMT)
Improving Technical "How-to" Query Accuracy with Automated Search Results Verification and Reranking [4.5]
本稿では,オンライン技術支援検索結果の精度と関連性を改善するための新しい手法を提案する。我々はまず,AIエージェントが検索結果のステップ・バイ・ステップの指示を,制御されたAndroid環境で解釈し実行できるようにするソリューションを開発した。さらに,テスト手法の成功指標に基づいて検索結果を順序付けする機構に,エージェントの知見を組み込んだ。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:20:09 GMT)
MaSkel: A Model for Human Whole-body X-rays Generation from Human Masking Images [4.5]
マスク画像から2次元の人体X線を直接生成することを提案する。予測された画像は、同じイメージスタイルと解剖学的構造を持つ実際のものに似ている。高度な生成技術を活用することで、我々のモデルMaSkelは、人間のマスク画像から高品質なX線画像を生成することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:03:19 GMT)
Three Disclaimers for Safe Disclosure: A Cardwriter for Reporting the Use of Generative AI in Writing Process [4.4]
『カードライター』は、執筆過程における生成AIの使用を宣言する短い報告書を執筆者に向けて作成する。デモはhttps://cardwriter.vercel.app.comで公開されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:55:50 GMT)
Compressive Mahalanobis Metric Learning Adapts to Intrinsic Dimension [4.3]
マハラノビス計量を学習する問題を考察し、高次元データ上で低ランクの計量を訓練する代わりに、ランダムに圧縮されたデータを用いて、この縮小された特徴空間におけるフルランクの計量を訓練する。マハラノビス計量学習の誤差は、データ支持の安定な次元に依存するが、周囲の次元には依存しない理論的な保証を与える。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:00:38 GMT)
Getting Bored of Cyberwar: Exploring the Role of Low-level Cybercrime Actors in the Russia-Ukraine Conflict [4.1]
我々は、この2つの国に言及したHackフォーラムで、358kウェブサイトの偽装攻撃、1.7M UDP DDoS攻撃、1764のユーザーによる1764の投稿を分析した。この論争は短期間ではあるが、低レベルのサイバー犯罪俳優たちの注目を集めた。現在進行中のハイブリッド戦争におけるこれらのプレイヤーの役割はマイナーであり、国家が支援する作戦において、永続的で動機づけられた「ハックティビスト」から分離されるべきである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:42:17 GMT)
Bullion: A Column Store for Machine Learning [4.1]
Bullionは、機械学習ワークロードに適した列指向ストレージシステムである。データコンプライアンスの複雑さに対処し、長いシーケンススパース機能の符号化を最適化し、拡張可能なプロジェクションを効率的に管理し、ストレージに機能量子化を導入する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:01:54 GMT)
BG-YOLO: A Bidirectional-Guided Method for Underwater Object Detection [4.0]
既存の水中画像強調法は主に視覚面における指標の改善に焦点を当てている。本稿では,BG-YOLOと呼ばれる水中物体検出のための双方向誘導手法を提案する。提案手法は, 高度に劣化した水中のシーンにおいて, 検出器の性能が著しく向上したことを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:06:29 GMT)
Price-Discrimination Game for Distributed Resource Management in Federated Learning [3.7]
FedAvgのようなバニラ連合学習(FL)では、パラメータサーバ(PS)と複数の分散クライアントが典型的な買い手市場を形成する。本稿では、異なるクライアントに対して同じサービス価格を提供するのではなく、異なるクライアントが提供するサービスの価格を区別することを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:41:23 GMT)
Recursive Joint Cross-Modal Attention for Multimodal Fusion in Dimensional Emotion Recognition [3.6]
本稿では,RJCMA(Recursive Joint Cross-Modal Attention)を導入し,音声,視覚,テキストの両モード間の相互関係を次元的感情認識のために捉える。特に,共同音声・視覚・テキスト特徴表現と個々のモーダルの特徴表現との相互相関に基づく注目重みの計算を行う。 Affwild2データセット上で提案した核融合モデルの性能を評価するために大規模な実験を行った。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:52:19 GMT)
A Specific Task-oriented Semantic Image Communication System for substation patrol inspection [3.5]
Imag-STSCIのための特定のタスク指向セマンティック通信システムは、弱い信号の下でインテリジェントロボットがより鮮明な画像を得るように設計されている。このようなサブステーションパトロール検査作業において,画像の特定の詳細しか必要としない点に着想を得て,セマンティックエンハンスメントの新しいパラダイムを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:20:03 GMT)
An evaluation framework for synthetic data generation models [3.4]
高品質な合成データを開発するための合成データ生成モデルの能力を評価するための新しいフレームワークを提案する。 2つのユースケースシナリオは、合成データ生成モデルが高品質なデータを生成する能力を評価するための提案フレームワークの適用性を示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:16:45 GMT)
Adapting Mental Health Prediction Tasks for Cross-lingual Learning via Meta-Training and In-context Learning with Large Language Model [3.4]
モデルに依存しないメタラーニングと,このギャップに対処するために大規模言語モデル(LLM)を活用する。まず,自己超越型メタラーニングモデルを適用し,迅速な適応と言語間移動のためのモデル初期化を改良する。並行して、LLMのインコンテキスト学習機能を用いて、スワヒリのメンタルヘルス予測タスクにおけるパフォーマンスの精度を評価する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:11:35 GMT)
Optimized Dynamic Mode Decomposition for Reconstruction and Forecasting of Atmospheric Chemistry Data [3.1]
適応的かつ効率的な縮小順序モデルと予測ツールを構築するために最適化された動的モード分解を導入する。 DMDアルゴリズムは,夏季の大気汚染やバイオマス燃焼など,大気化学の既知の特徴を抽出することに成功した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:44:12 GMT)
Audio is all in one: speech-driven gesture synthetics using WavLM pre-trained model [2.8]
diffmotion-v2は、WavLM事前学習モデルを用いた音声条件拡散に基づく生成モデルである。生音声のみを使用して、個人的でスタイリングされたフルボディの音声合成ジェスチャを生成することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:22:53 GMT)
Semantic In-Domain Product Identification for Search Queries [2.8]
本稿では,ユーザ行動データからプロダクトをトレーニングするための新しいアプローチを提案する。我々のモデルでは、デプロイされた表面をクリックしてCTRが25%向上した。アプリカードの2倍の増加は、製品の可視性を高めるのに役立つ。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:18:14 GMT)
Introducing Super RAGs in Mistral 8x7B-v1 [2.6]
Super Retrieval-Augmented Generation (Super RAGs)は、大規模言語モデル(LLM)の性能を高めるために設計された新しいアプローチである。本稿では,8x7B v1へのスーパーRAGの統合について述べるとともに,精度,速度,ユーザ満足度の改善について検討する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:33:00 GMT)
Observation of a time crystal comb in a driven-dissipative system with Rydberg gas [2.5]
時間結晶は、時間翻訳対称性を破る安定かつ周期的な挙動を示す。オープン量子系では、散逸する多体相互作用により、前例のない方法で時間結晶秩序を発達させることができる。本稿では, 連続駆動型, 強く相互作用するRydberg熱ガス中の時間結晶コムの観察について報告する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 07:33:35 GMT)
GauU-Scene V2: Assessing the Reliability of Image-Based Metrics with Expansive Lidar Image Dataset Using 3DGS and NeRF [2.5]
本稿では,新しい3次元表現手法を用いたマルチモーダルな大規模シーン再構築ベンチマークを提案する。 GauU-Sceneは6.5平方キロメートル以上をカバーし、LiDARの地上真実と組み合わせた総合的なRGBデータセットを備えている。ドローンによるデータセットのためのLiDARおよび画像アライメント手法を最初に提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:53:28 GMT)
Improving Personalisation in Valence and Arousal Prediction using Data Augmentation [2.4]
本稿では、データ拡張を利用したパーソナライズ戦略の強化について述べる。提案手法であるDWA(Distance Weighting Augmentation)では,対象者のデータセットを拡大する重み付けに基づく拡張手法を採用している。 MuSe-Personalisation 2023 Challengeデータセットの実験結果から,提案手法は特徴セットの性能を著しく向上させることが示された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:57:37 GMT)
Pirates: Anonymous Group Calls Over Fully Untrusted Infrastructure [2.4]
Piratesは、通信不能という強力な匿名性を保証する最初のグループボイスコールプロトコルである。単一のサーバを持つPiratesは、11人の同時ユーザから3人のグループメンバによるグループコールをサポートし、365ms未満のレイテンシを持つことを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:39:07 GMT)
Fast Fishing: Approximating BAIT for Efficient and Scalable Deep Active Image Classification [1.9]
Deep Active Learning (AL)は、ディープニューラルネットワークのトレーニングに要するアノテーションコストを最小限にすることを目指している。 Fisher Informationをベースにした最近提案されたAL戦略であるBAITは、さまざまなデータセットで素晴らしいパフォーマンスを示している。本稿では,BAITの計算効率とスケーラビリティを向上する2つの手法を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:09:37 GMT)
Deep Reinforcement Learning based Online Scheduling Policy for Deep Neural Network Multi-Tenant Multi-Accelerator Systems [1.8]
本稿では,マルチテナント環境におけるDNNのオンラインスケジューリングを目的とした低オーバーヘッド深層強化学習アルゴリズムRELMASを提案する。ヘテロジニアス多加速器システムへのRELMASの適用により、SLAの満足度は最大で173%向上した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:13:07 GMT)
Part-Attention Based Model Make Occluded Person Re-Identification Stronger [1.8]
PAB-ReIDは,問題に効果的に対処するための部分認識機構を組み込んだ新しいReIDモデルである。まず、より正確な人的部分注意マップの生成を導くために、人間のパーシングラベルを導入する。また、背景干渉を抑えつつ、きめ細かい人間の局所的特徴表現を生成するための細粒度特徴焦点器を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:00:28 GMT)
PV-SSD: A Multi-Modal Point Cloud Feature Fusion Method for Projection Features and Variable Receptive Field Voxel Features [1.5]
非常にスパースな3Dデータからのリアルタイム推論は、非常に難しい課題だ。この問題に対処するため、典型的なアプローチのクラスは、点雲のキャストを正規のデータ表現に変換する。本稿では,射影特徴と可変受容野ボクセル特徴に対するマルチモーダル点雲特徴融合法を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:39:51 GMT)
Learning Decentralized Linear Quadratic Regulator with $\sqrt{T}$ Regret [1.5]
本稿では,システムのモデルが未知な場合,分散線形二次制御系を適応的に設計するオンライン学習アルゴリズムを提案する。我々のコントローラは、部分的にネストされた情報パターンの場合、時間軸の$T$で$sqrtT$までスケールする期待された後悔を楽しんでいます。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:02:47 GMT)
OOVs in the Spotlight: How to Inflect them? [1.0]
語彙外条件(OOV)における形態的屈折に着目した。 LSTMとTransformerに基づく2つのシーケンス・ツー・シーケンス(Sequence-to-Sequence:seq2seq)モデルである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:40:06 GMT)
SGPRS: Seamless GPU Partitioning Real-Time Scheduler for Periodic Deep Learning Workloads [1.0]
構成分割スイッチのゼロを考慮した最初のリアルタイムGPUスケジューラであるSGPRSを提案する。提案するスケジューラは、並列タスクの期限を多く満たすだけでなく、ピボットポイントを越えた全体的なパフォーマンスも維持する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:29:26 GMT)
A Lightweight Spatiotemporal Network for Online Eye Tracking with Event Camera [0.9]
イベントベースのデータは、効率性と低レイテンシが重要であるエッジコンピューティング環境で一般的に発生する。このようなデータと対話し,その時間的豊かさを活用するために,因果畳み込みネットワークを提案する。我々は,AIS 2024イベントベースのアイトラッキング課題に適用し,Kaggleプライベートテストセットで0.9916 p10の精度を達成した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:13:20 GMT)
Fractional Revivals in Elliptical Atomtronics [0.8]
フラクショナルリバイバルは、最近、円形の原子線学のために報告されているが、導波路幾何学の非ゼロ偏心性のために乱される。ここでは、任意の偏心性を持つ楕円型原子トロニクスのメカニズムについて述べる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:26:17 GMT)
Deep Reinforcement Learning-Based Approach for a Single Vehicle Persistent Surveillance Problem with Fuel Constraints [0.8]
永続的な監視任務では、1機の無人航空機が同じ優先順位で標的のセットを何度も訪問する必要がある。燃料や飛行時間制限のため、車両は定期的に燃料を補給するか、あるいは補給所で電池を充電する必要がある。この問題に対処するための深層強化学習に基づくアプローチを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:58:53 GMT)
On the critical path to implant backdoors and the effectiveness of potential mitigation techniques: Early learnings from XZ [0.8]
XZ Utilsのバックドアによる新たなサプライチェーン攻撃が特定されている。バックドアにより、攻撃者は事前認証なしでSSHを使用する脆弱なサーバ上でリモートでコマンドを実行することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:18:36 GMT)
BioImage.IO Chatbot: A Community-Driven AI Assistant for Integrative Computational Bioimaging [0.7]
我々は、大規模言語モデルを利用したAIアシスタントであるBioImage$.$IOツールセットを提示する。 BioImage.IOは、ユーザーの総合的な専門知識と革新を活用することで、生命科学の進歩を促進する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:48:30 GMT)
SQIAsignHD: SQIsignHD Adaptor Signature [0.7]
我々は超特異楕円曲線の等質性に基づく新しい量子抵抗型アダプタシグネチャスキームである$mathsfSQIAsignHD$を紹介する。我々は,超特異なDiffie-Hellman鍵交換プロトコル(SIDH)上の人工配向の考え方を基礎となるハードリレーションとして活用する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:25:28 GMT)
FM-G-CAM: A Holistic Approach for Explainable AI in Computer Vision [0.6]
我々は,コンピュータビジョンモデル,特に畳み込みニューラルネットワーク(CNN)に基づくモデルの予測を理解する必要性を強調した。既存のCNN予測法は、主にグラディエント重み付きクラスアクティベーションマップ(Grad-CAM)に基づいており、単一のターゲットクラスのみに焦点を当てている。本稿では,複数の上位予測クラスを考慮したFused Multi-class Gradient-weighted Class Activation Map (FM-G-CAM)を提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:45:47 GMT)
Label-free Anomaly Detection in Aerial Agricultural Images with Masked Image Modeling [0.5]
Masked Autoencoders (MAE)は、ラベルのない画像サンプルから意味のある正常な特徴を抽出する。我々は,異常画素の再構成を効果的に最小化する異常抑制損失機構を用いる。単一モデルは、Agri-Vision Challengeデータセット内のすべての異常カテゴリを一般化する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:49:17 GMT)
Quantum conjugate gradient method using the positive-side quantum eigenvalue transformation [0.4]
量子固有値変換(QET)を用いた量子共役勾配(QCG)法を提案する。数値的な結果から,本アルゴリズムは回路深度を大幅に改善し,QETに基づく別のアルゴリズムよりも3～4桁の精度で性能を向上する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:11:16 GMT)
A Fourier-enhanced multi-modal 3D small object optical mark recognition and positioning method for percutaneous abdominal puncture surgical navigation [0.3]
針挿入点として小さな単環の中心を識別するミューティモーダル3D小物体マーカー検出法を提案する。実験により,本手法は高精度かつ高安定性な位置決めを実現することを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:28:40 GMT)
Enhancing Security Awareness Through Gamified Approaches [0.2]
ゲーミフィケーションは情報セキュリティ意識訓練(SAT)の分野における新しい概念である。本稿では,スマートグリッドユーザ/オペレータを対象としたスマートメータコンポーネント間のセキュリティ意識向上におけるGamificationの有効性について検討する。 3段階の参加者のスコアは、それぞれ40%、35%、29%向上している。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:32:05 GMT)
Assessing Climate Transition Risks in the Colombian Processed Food Sector: A Fuzzy Logic and Multicriteria Decision-Making Approach [0.2]
本研究は,コロンビアの加工食品部門における主な気候変動リスクを特定し,評価する。遷移リスクは曖昧であるので、我々の手法はファジィ論理を使い、様々な複数基準の意思決定手法と比較する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 21:49:49 GMT)
Annealing Self-Distillation Rectification Improves Adversarial Training [0.1]
我々は、ロバストモデルの特徴を分析し、ロバストモデルがよりスムーズでよく校正された出力を生成する傾向があることを特定する。より優れた誘導機構としてソフトラベルを生成するアニーリング自己蒸留法を提案する。我々は、広範囲な実験とデータセット間の強力なパフォーマンスを通して、ADRの有効性を実証する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:01:14 GMT)
Using Letter Positional Probabilities to Assess Word Complexity [0.0]
いくつかのLPPと複雑性の間には強い統計的関連性がある。単純な単語はw, b, s, h, g, k, j, t, y, f で始まる傾向が著しく(p.001)、複雑な単語は i, a, e, r, v, u, d で始まる傾向が著しく(p.001)である。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:02:25 GMT)
Toward an Ethics of AI Belief [0.0]
我々は、AIの信念の倫理である、AIにおける哲学研究の新たな領域を追求する必要があると主張している。我々は、AI信念の倫理に適用可能な(人間)信念の倫理における、現存する研究における4つのトピックを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:12:16 GMT)
Toward an Artist-Centred AI [0.0]
本稿では、芸術におけるAIの使用に関する原則、実践、ツールの適合性と望ましい概念を文脈的に分析する。 AIがアート制作、流通、消費、収益化にもたらす課題を調べることで構成された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:43:23 GMT)
Theoretical research on generative diffusion models: an overview [0.0]
生成拡散モデルは、強力な理論的背景を持つ多くの分野で高い成功を収めた。データ分布をノイズに変換し、ノイズを取り除き、同様の分布を得る。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:08:56 GMT)
Rethinking Iterative Stereo Matching from Diffusion Bridge Model Perspective [0.0]
本稿では,拡散モデルを反復最適化プロセスに組み込む新しいトレーニング手法を提案する。我々のモデルはScene Flowデータセットで第1位であり、競合する手法と比較して7%以上の改善が達成されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:31:11 GMT)
Relativistic single-electron wavepacket in quantum electromagnetic fields: Quantum coherence, correlations, and the Unruh effect [0.0]
量子電磁場に結合した荷電相対論的粒子のガウス波束記述を用いた線形化有効理論を提案する。自由空間における空飛ぶ電子の脱コヒーレンスの問題と、アンルー効果が電子に与える影響に対処する。一様電場で加速される1つの電子に対して、電子の古典軌道からの偏差の2点相関子におけるアンルー効果を同定する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:50:07 GMT)
Reconfigurable Edge Hardware for Intelligent IDS: Systematic Approach [0.0]
侵入検知システム(IDS)は、ネットワークセキュリティを強制するための重要なセキュリティ対策である。本稿では,エッジデバイスの具体的な要件に対処しつつ,インテリジェントIDS(I-IDS)の概念を分析する。再構成可能なエッジハードウェア上でI-IDSを構築するための体系的なアプローチを導入する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:24:18 GMT)
Predicting Mergers and Acquisitions: Temporal Dynamic Industry Networks [0.0]
M&A活動は市場統合にとって重要な要素であり、企業が戦略的補完を通じて市場力を増強することができる。既存の研究はしばしば、企業間のM&A行動の相互影響であるピア効果を見落とし、業界ネットワーク内の複雑な相互依存を捉えるのに失敗する。本稿では,TDIN(Temporal Dynamic Industry Network)を利用して,時間的ポイントプロセスと深層学習を利用して,業界全体のM&Aダイナミクスを効果的に捉える,革新的なM&A予測モデルを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:54:27 GMT)
Performance analysis of a filtering variational quantum algorithm [0.0]
Filtering Variational Quantum Eigensolver (F-VQE) は、既存の量子コンピュータにおける最適化問題を解くために設計された変分型ハイブリッド量子アルゴリズムである。我々は、パラメータ化量子回路として、瞬時量子多項式回路を用いる。 F-VQEの実用的優位性には大きな発展が必要であると結論付けている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 08:50:44 GMT)
One-Way Quantum Repeater with Rare-Earth-Ions Doped in Solids [0.0]
一方向量子リピータは、二方向古典通信の必要性を排除している。希土類イオンを固体にドープし、ナノキャビティと結合することで、フォトニッククラスター状態を効率的に生成することができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 21:08:18 GMT)
Not as Simple as It Looked: Are We Concluding for Biased Arrest Practices? [0.0]
この研究は、説明を場所の種類、人物の種類、両方の組み合わせに分類する。暴力的逮捕結果の分析では、近隣のレベル特性に起因する観察結果の約40%が明らかとなった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:50:59 GMT)
Navigating the Landscape of Large Language Models: A Comprehensive Review and Analysis of Paradigms and Fine-Tuning Strategies [0.0]
本稿では,大規模モデルの微調整手法について概観する。本稿では,タスク適応型微調整などにおける最新の技術進歩と高度な手法の適用について検討する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 15:03:03 GMT)
Multilingual Evaluation of Semantic Textual Relatedness [0.0]
意味的テクスト関係性(STR)は、言語的要素や話題、感情、視点といった非言語的要素を考慮して、表面的な単語重複を越えている。以前のNLP研究は主に英語に焦点を合わせており、言語間の適用性を制限している。 Marathi、Hindi、スペイン語、英語でSTRを探索し、情報検索や機械翻訳などの可能性を解き放つ。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:16:03 GMT)
Multi-mode Gaussian State Analysis with one Bounded Photon Counter [0.0]
多モードガウス状態のどのような性質は、1つの検出器からの信号によって決定されるか。ガウス状態が$S$モードを占有し、すべての$nleq 8S$に対する$n$光子の確率が知られているなら、ガウス共分散行列のスペクトルを決定することができる。すべての光子数の確率が知られているとしても、それ以上のことは学べない。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:44:33 GMT)
Lossy anharmonic polaritons under periodic driving [0.0]
本研究では, 散逸性偏光子の定常エネルギー分布と熱力学における非調和的シグネチャについて検討した。我々は高調波,中等度,強無調波の偏光子間のエネルギー分布と熱力学にかなりの差を見出した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 04:09:42 GMT)
Latent Distance Guided Alignment Training for Large Language Models [0.0]
外部アノテーションを頼らずにアライメントの改善を追求するために,潜在距離ガイドアライメントトレーニング(LD-Align)を導入する。このアプローチは、潜在空間からのガイダンスを用いて、高品質な教師付き微調整データセットとモデルを整合させる。我々は,DPOに基づくアライメントトレーニングを誘導するために,潜時空間におけるサンプルペア間の距離を利用する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:20:45 GMT)
LaVy: Vietnamese Multimodal Large Language Model [0.0]
LLM(Large Language Models)とMLLM(Multimodal Large Language Models)は、複雑な推論と言語理解において印象的な能力を持つ嵐によって世界を席巻している。本稿では,ベトナムの最先端MLLMであるLaVyを導入することで,この問題に対処する。また,ベトナムの視覚言語タスクに対するMLLMの理解を評価するためのLaVy-Benchベンチマークも導入した。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 13:57:51 GMT)
LLMSat: A Large Language Model-Based Goal-Oriented Agent for Autonomous Space Exploration [0.0]
本研究は,宇宙船の高レベル制御システムとしてのLarge Language Models (LLMs)の適用について検討する。一般的なゲームエンジンであるKerbal Space Programでシミュレートされた一連の深宇宙ミッションシナリオをケーススタディとして使用し、要求に対する実装を評価する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 03:33:17 GMT)
LLM In-Context Recall is Prompt Dependent [0.0]
これを行うモデルの能力は、実世界のアプリケーションにおける実用性と信頼性に大きな影響を及ぼす。本研究は, LLMのリコール能力がプロンプトの内容に影響を及ぼすだけでなく, トレーニングデータのバイアスによって損なわれる可能性があることを示す。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:13:59 GMT)
L-TUNING: Synchronized Label Tuning for Prompt and Prefix in LLMs [0.0]
本稿では,自然言語推論(NLI)フレームワーク内での分類タスクの効率的な微調整手法であるL-Tuningを紹介する。 L-Tuningは、事前訓練されたLarge Language Models (LLM)を通して処理されるラベルトークンの微調整に焦点を当てている。実験の結果,従来のアプローチと比較して,L-Tuningによる学習効率と分類精度が有意に向上したことが示唆された。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 00:14:21 GMT)
Intellecta Cognitiva: A Comprehensive Dataset for Advancing Academic Knowledge and Machine Reasoning [0.0]
Intellectaデータセットは、現代言語モデルの認知処理能力を高めるために設計された、革新的な合成データセットとして登場した。 113億のトークンで構成されたIntellectaは、高度な推論と総合的な教育物語生成を促進するために作られている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 06:11:25 GMT)
Integrating Hyperparameter Search into Model-Free AutoML with Context-Free Grammars [0.0]
ハイパーパラメータ探索を含むより大きな検索空間をサポートするGramMLの拡張を提案する。提案手法をOpenMLベンチマークを用いて評価した結果,他の最先端技術と比較して大幅な改善が得られた。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 14:57:37 GMT)
Inconsistency Masks: Removing the Uncertainty from Input-Pseudo-Label Pairs [0.0]
Inconsistency Masks (IM) は、画像と擬似ラベルのペアの不確実性をフィルタリングし、セグメンテーションの品質を大幅に向上させる新しい手法である。 4つの多様なデータセットに対して10%のラベル付きデータで強力なセグメンテーション結果を得る。 3つのハイブリッドアプローチは、完全にラベル付けされたデータセットでトレーニングされたモデルよりも優れています。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:26:44 GMT)
Identifiability and Characterization of Transmon Qutrits Through Bayesian Experimental Design [0.0]
クォート系の量子特性評価のためのオンラインベイズ的手法を提案する。パラメータの点推定を行うほとんどの評価プロトコルとは異なり、提案手法は確率分布を推定することができる。モデルパラメータの理論的同定可能性の数学的証明と,パラメータが同定可能な量子状態に関する条件を提供する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:54:57 GMT)
Gophy: Novel Proof-of-Useful-Work blockchain architecture for High Energy Physics [0.0]
アーキテクチャはGolangを使って実装されており、CbmRootソフトウェア環境内で実行できる。ブロックチェーンはトークンベースの暗号通貨を特徴とし、計算力を寄付するマイナーに報酬を与える。 gophyという実装はGolangで実装されており、2024年末までにオープンソース化される予定である。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 22:34:48 GMT)
Generalising concentratable entanglement for practical applications: mixed, qudit, and optical states [0.0]
我々は,高次元(立方体)状態におけるテストの解析的確率式,多量子状態における2部切断の絡み合いの判定,およびいくつかの重要な絡み合い光学状態について述べる。実験状態は常にわずかに混合されているため、我々の研究はc-SWAP試験とCE測定を絡み合いを特徴づける実験に適用するのに適している。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 16:53:39 GMT)
GView: A Versatile Assistant for Security Researchers [0.0]
GViewは、さまざまなファイルタイプに対するガイド付き分析を提供することで、攻撃の可能性を調べるように設計されている。 GViewの背景にある概念は、複雑な攻撃において、すべてのペイロードへのナビゲーションを簡単にする。 GViewは、鑑識で使用される従来のツールと比較して、攻撃の分析時間を大幅に改善する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 18:33:54 GMT)
Enhancing path-integral approximation for non-linear diffusion with neural network [0.0]
本稿では,ブラック・カラシンスキーモデル構造における固定所得楽器の価格設定に関する既存のソリューションを強化することを目的とする。この手法は、拡張射影地平線を越えた複数のキャリブレーションに対して優れた結果を得ることができる。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 05:15:46 GMT)
Enhanced Hydrogen Evolution Activity of MOS$_2$-rGO Composite Synthesized via Hydrothermal Technique [0.0]
水素進化反応(HER)はクリーンで持続可能なエネルギー生産のための有望な技術である。本研究では,熱水によるMOS$とMoS$-rGOの合成について報告する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 02:06:32 GMT)
Energy Transfer Mechanism Under Incoherent Light Excitation in noisy Environments: Memory Effects in Efficiency Control [0.0]
ノイズの多い環境では、ゆらぎは量子コヒーレンスを含むいくつかの要因を通してエネルギー伝達の効率を制御することができる。近年の研究では、光誘起定常量子コヒーレンスが光励起を指定された「トラップ」状態に転送する効率に与える影響が研究されている。励起の減衰(基底状態)と励起の運動の方向を与える所望のトラップの効果を紹介する。光誘起ポンプの存在下では, 平均生存時間, 効率, および浴槽誘起変動の相関減衰時間との関係を確立する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:02:56 GMT)
Developing An Attention-Based Ensemble Learning Framework for Financial Portfolio Optimisation [0.0]
本稿では,アテンション機構や時系列,すなわちMASAATと統合されたマルチエージェントで自己適応的なポートフォリオ最適化フレームワークを提案する。時系列で財務データのトークンを再構築することにより、各エージェントの注意ベースの横断分析モジュールと時間分析モジュールは、資産と時間点間の依存関係との相関を効果的に捉えることができる。実験により、MASAATフレームワークは、よく知られたポートフォリオ最適化アプローチと比較して、印象的な拡張を実現していることが明らかとなった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 09:10:05 GMT)
CuriousLLM: Elevating Multi-Document QA with Reasoning-Infused Knowledge Graph Prompting [0.0]
我々は知識グラフとLLMベースのエージェントを組み合わせて推論と探索精度を向上させる新しい手法であるKGP(Knowledge Graph Prompting)を改良する。我々は,この枠組みを強化するために,理性注入型LLMエージェントを提案する。このエージェントは、人間の好奇心を模倣してフォローアップ質問を行い、検索をより効率的にナビゲートする。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 20:43:46 GMT)
Concentration properties of fractional posterior in 1-bit matrix completion [0.0]
この研究は、しばしば1ビット行列完備化と呼ばれるバイナリ観測のシナリオに特に対処する。一般の非一様サンプリング方式を考慮し、分数後方の有効性に関する理論的保証を提供することにより、このギャップに対処する。我々の結果は、頻繁な文献に見られるものと同等であるが、制限的な仮定は少ない。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 11:22:53 GMT)
ChatGPT Can Predict the Future when it Tells Stories Set in the Future About the Past [0.0]
本研究は,OpenAIのChatGPT-3.5とChatGPT-4が,2つの異なるプロンプト戦略を用いて,将来の事象を正確に予測できるかどうかを検討する。私たちは、直接予測と将来の物語と呼ばれる2つの促進戦略を採用しています。 100個のプロンプトを解析した結果,将来の物語的プロンプトはChatGPT-4の予測精度を大幅に向上させることがわかった。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 01:58:13 GMT)
Characterising and detecting genuinely high-dimensional genuine multipartite entanglement [0.0]
我々は、最悪の二部交絡次元を通した多部交絡次元をベンチマークする。この真に高次元かつ真に多次元の絡み合いを検出するために、我々はいくつかの一般的な基準のクラスを開発する。我々のアプローチは、よく研究された二部類システムを超えて、絡み合いの次元性の役割を理解するための一歩である。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:33:00 GMT)
Business models for the simulation hypothesis [0.0]
シミュレーション仮説は、我々がコンピュータシミュレーションに生きていることを示唆している。シミュレーション仮説と整合した宇宙の名前を欠いているため、擬似宇宙という用語を提案する。私たちは、プロジェクト、サービス、プラットフォームとしてのシミュバースのようなビジネスモデルシナリオを特定し、探求します。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 12:36:20 GMT)
Advanced Neural Network Architecture for Enhanced Multi-Lead ECG Arrhythmia Detection through Optimized Feature Extraction [0.0]
不規則な心臓リズムを特徴とする不整脈は、深刻な診断課題を呈する。本研究では,不整脈分類の複雑さに対処するために,ディープラーニング技術を活用した革新的なアプローチを提案する。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 19:56:15 GMT)
ALICE: Combining Feature Selection and Inter-Rater Agreeability for Machine Learning Insights [0.0]
本稿では,新たなPythonライブラリであるAutomated Learning for Insightful Comparison and Evaluation(ALICE)を提案する。これは、ブラックボックス機械学習モデルに対する洞察を求めるために、従来の特徴選択と、ユーザフレンドリなシンプルな方法で、ラタ間適合性の概念を融合する。このフレームワークは、MLにおける解釈可能性の主要な概念の概要に続いて提案されている。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 17:34:58 GMT)
A biologically inspired computational trust model for open multi-agent systems which is resilient to trustor population changes [0.0]
この研究は、シナプスの可塑性とヒト脳内の集合体の形成にインスパイアされた、分散化された計算信頼モデルであるCAに基づいている。我々はCAモデルとFIREを比較し,オープンMASのための分散型信頼と評価モデルを構築した。主な発見は、FIREが受託者人口の変化よりも優れているのに対して、CAは受託者人口の変化に対して回復力があることである。
論文参考訳（メタデータ） (Sat, 13 Apr 2024 10:56:32 GMT)