Motion Consistency Model: Accelerating Video Diffusion with Disentangled Motion-Appearance Distillation [134.2] 画像拡散蒸留は, 非常に少ないサンプリングステップで高忠実度生成を実現する。
これらのテクニックをビデオ拡散に直接適用すると、公開ビデオデータセットの視覚的品質が制限されるため、フレーム品質が不満足になることが多い。
本研究の目的は,高画質の画像データを用いて,フレームの外観を改善しながらビデオ拡散蒸留を改善することである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:09:46 GMT)
Hydra-MDP: End-to-end Multimodal Planning with Multi-target Hydra-Distillation [115.6] 教師-学生モデルに複数の教師を取り入れた新しいパラダイムであるHydra-MDPを提案する。
ルールベースの教師の知識により、Hydra-MDPは環境がプランニングにエンド・ツー・エンドでどのように影響するかを学ぶ。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:18:26 GMT)
Exploring Meta Information for Audio-based Zero-shot Bird Classification [113.2] 本研究では,メタ情報を用いてゼロショット音声分類を改善する方法について検討する。
我々は,多種多様なメタデータが利用可能であることから,鳥種を例として用いている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:29:51 GMT)
MIPI 2024 Challenge on Few-shot RAW Image Denoising: Methods and Results [105.5] MIPI 2024のRAW画像デノゲーショントラックについて概説し,概説する。
165人の参加者が登録され、7チームが最終テストフェーズで結果を提出しました。
この課題で開発されたソリューションは、Few-shot RAW Image Denoisingにおける最先端の性能を達成した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:59:55 GMT)
Commonsense-T2I Challenge: Can Text-to-Image Generation Models Understand Commonsense? [97.1] 本稿では,実生活における常識に適合した画像を生成するためのテキスト・画像生成モデルの能力を評価するための新しいタスクとベンチマークを提案する。
我々は、T2Iモデルが、例えば「電球は無光である」と「電球は無光である」というようなイメージを生成できるかどうかを評価する。
さまざまな最先端(ソータ)のT2Iモデルをベンチマークした結果、画像合成と実写写真の間にはまだ大きなギャップがあることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:48 GMT)
QuickLLaMA: Query-aware Inference Acceleration for Large Language Models [94.8] 大規模言語モデルに対するクエリ対応推論(Q-LLM)を導入する。
Q-LLMは、人間の認知に似た広範囲なシーケンスを処理するように設計されている。
特定のウィンドウサイズ内で関連する情報を正確にキャプチャし、クエリに対して正確な回答を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:55:03 GMT)
REAL Sampling: Boosting Factuality and Diversity of Open-Ended Generation via Asymptotic Entropy [93.8] 大規模言語モデル(LLM)の復号法は通常、事実性の確保と多様性の維持のトレードオフに苦慮する。
核サンプリングにおける事実性および多様性を向上させる復号法であるREALサンプリングを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:44:49 GMT)
Object-level Scene Deocclusion [92.4] オブジェクトレベルのシーン・デクルージョンのためのPArallel可視・コミュールト拡散フレームワークPACOを提案する。
PACOをトレーニングするために、500kサンプルの大規模なデータセットを作成し、自己教師付き学習を可能にします。
COCOAと様々な現実世界のシーンの実験では、PACOがシーンの排除に優れた能力を示し、芸術の状態をはるかに上回っている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:34:10 GMT)
A Survey on Diffusion Models for Time Series and Spatio-Temporal Data [92.1] 時系列およびS時間データにおける拡散モデルの使用について概観し、それらをモデル、タスクタイプ、データモダリティ、実用的なアプリケーションドメインで分類する。
我々は拡散モデルを無条件型と条件付き型に分類し、時系列とS時間データを別々に議論する。
本調査は,医療,レコメンデーション,気候,エネルギー,オーディオ,交通など,さまざまな分野の応用を幅広くカバーしている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:25:53 GMT)
Visual Representation Learning with Stochastic Frame Prediction [91.0] 本稿では,フレーム予測における不確実性を捉えることを学ぶ映像生成の考え方を再考する。
フレーム間の時間情報を学習するためのフレーム予測モデルを訓練するフレームワークを設計する。
このアーキテクチャは、両目的を相乗的かつ計算効率のよい方法で組み合わせることができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:05:15 GMT)
AutoTVG: A New Vision-language Pre-training Paradigm for Temporal Video Grounding [90.2] 時間的ビデオグラウンディング(Temporal Video Grounding)は、言語の説明から見れば、トリミングされていないビデオから瞬間をローカライズすることを目的としている。
従来のパラダイムの欠点を回避するため,TVGの新しいビジョン言語事前学習パラダイムであるAutoTVGを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:31:37 GMT)
CalibNet: Dual-branch Cross-modal Calibration for RGB-D Salient Instance Segmentation [88.5] CalibNetは3つの単純なモジュール、動的インタラクティブカーネル(DIK)と重量共有融合(WSF)で構成されている。
実験の結果、CalibNetは、COME15K-Nテストセット上で320*480の入力サイズを持つ58.0% APという有望な結果をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:07:59 GMT)
Open-Vocabulary Segmentation with Unpaired Mask-Text Supervision [87.2] Unpair-Segは、弱制御されたオープン語彙セグメンテーションフレームワークである。
未ペア画像マスクと画像テキストペアから学習し、独立して効率的に収集することができる。
ADE-847とPASCAL Context-459データセットで14.6%と19.5%のmIoUを達成した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:01:02 GMT)
Nash Learning from Human Feedback [86.1] ペアワイズフィードバックを用いた大規模言語モデルの微調整のための代替パイプラインを提案する。
我々はこのアプローチを人間のフィードバックからナッシュラーニング(NLHF)と呼ぶ。
ミラー降下原理に基づく新しいアルゴリズム解であるNash-MDを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:25:52 GMT)
Flextron: Many-in-One Flexible Large Language Model [85.9] 我々は,フレキシブルモデル展開をサポートするネットワークアーキテクチャとポストトレーニングモデル最適化フレームワークであるFlextronを紹介する。
本稿では,既存の学習用LDMをFlextronモデルに変換するための,サンプル効率のよいトレーニング手法と関連するルーティングアルゴリズムを提案する。
我々は、複数のエンドツーエンドトレーニングされた変種や他の最先端の弾性ネットワークよりも優れた性能を示し、これらは全て、オリジナルの事前訓練と比較してわずか7.63%のトークンを消費する単一の事前訓練ランで実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:16:10 GMT)
EgoPlan-Bench: Benchmarking Multimodal Large Language Models for Human-Level Planning [84.6] 実世界のシナリオにおけるMLLMの計画能力を評価するベンチマークであるEgoPlan-Benchを紹介する。
EgoPlan-Benchは、人間レベルのタスクプランニングを実現するためのMLLMの改善のかなりの範囲を浮き彫りにする。
また,EgoPlan-Bench上でのモデル性能を効果的に向上する特殊命令チューニングデータセットであるEgoPlan-ITを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:53:44 GMT)
FFB: A Fair Fairness Benchmark for In-Processing Group Fairness Methods [84.1] 本稿では,グループフェアネス手法のベンチマークフレームワークであるFair Fairness Benchmark(textsfFFB)を紹介する。
グループフェアネスの異なる概念を確実にするための最先端手法を包括的に分析する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:10:10 GMT)
EARS: An Anechoic Fullband Speech Dataset Benchmarked for Speech Enhancement and Dereverberation [83.3] EARSデータセットは、さまざまなバックグラウンドから107人の話者で構成され、100時間のクリーンで無響な音声データである。
データセットには、感情的なスピーチ、異なる読み方、非言語音、会話の自由なスピーチなど、幅広い種類の話し方が含まれている。
提案手法は,データセット上での音声強調とデバーベレーションのための様々な手法をベンチマークし,その性能を測定値を用いて評価する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:18:14 GMT)
1st Place Solution for MeViS Track in CVPR 2024 PVUW Workshop: Motion Expression guided Video Segmentation [81.5] ビデオオブジェクトセグメンテーション(RVOS)における静的支配データとフレームサンプリングの有効性について検討する。
本手法は,競技段階でのJ&Fスコア0.5447を達成し,PVUWチャレンジのMeViSトラックで1位となった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:05:26 GMT)
MAP: Low-compute Model Merging with Amortized Pareto Fronts via Quadratic Approximation [80.5] モデルマージは、同じトレーニング済みモデルから細調整された複数のシングルタスクモデルをマルチタスクモデルに結合する効果的なアプローチである。
既存のモデルマージ手法は、平均的なタスク精度の向上に重点を置いている。
Amortized Pareto Front (MAP) を用いた新しい低計算アルゴリズム Model Merging を導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:55:25 GMT)
Needle In A Multimodal Haystack [79.8] 本稿では,従来のMLLMの長大なマルチモーダル文書の理解能力を評価するために設計された,最初のベンチマークを示す。
我々のベンチマークには、マルチモーダル検索、カウント、推論の3種類の評価タスクが含まれている。
既存のモデルには、これらのタスク、特に視覚中心の評価において、改善の余地がまだ残っていることを観察する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:09:16 GMT)
Effectiveness Assessment of Recent Large Vision-Language Models [78.7] 本稿では,多言語多言語モデル(LVLM)の専門的および汎用的な課題における能力を評価する。
私たちは、自然、医療、産業という3つの異なるアプリケーションシナリオで6つの挑戦的なタスクを採用しています。
我々は,MiniGPT-v2,LLaVA-1.5,Shikraを含む最近の3つのオープンソースLVLMの視覚的認識および局所化性能について検討した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:42:51 GMT)
Vision Model Pre-training on Interleaved Image-Text Data via Latent Compression Learning [78.2] 本稿では,LCL(Latent Compression Learning)と呼ばれる視覚モデル事前学習手法を提案する。
学習対象は,1)視覚表現と先行文脈の対比学習,2)視覚表現に基づく後続テキストの生成という2つの基本課題に分解することができる。
実験により,本手法は,ペア付き事前学習データセット上でのCLIPの性能に適合するだけでなく,インターリーブ付き事前学習データの活用も可能であることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:35 GMT)
Provable Representation with Efficient Planning for Partial Observable Reinforcement Learning [74.7] ほとんどの実世界の強化学習アプリケーションでは、状態情報は部分的にしか観測できないため、マルコフ決定プロセスの仮定を破る。
我々は、部分的な観察から実践的な強化学習のためのコヒーレントな枠組みと抽出可能なアルゴリズムアプローチへと導く表現に基づく視点を開発する。
提案アルゴリズムは,様々なベンチマークで部分的な観察を行い,最先端の性能を超えることができることを実証的に実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:51:28 GMT)
A Probabilistic Framework for LLM Hallucination Detection via Belief Tree Propagation [72.9] 本稿では,幻覚検出のための確率的フレームワークであるBelief Tree Propagation (BTProp)を提案する。
BTPropは、親ステートメントを子ステートメントに分解することで、論理的に関連するステートメントの信念ツリーを導入する。
複数の幻覚検出ベンチマークにおいて,AUROCとAUC-PRにより評価された基準線を3%-9%改善する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:21:37 GMT)
Trim 3D Gaussian Splatting for Accurate Geometry Representation [72.0] 画像から正確な3次元形状を復元するためにTrim 3D Gaussian Splatting (TrimGS)を導入する。
実験および理論的解析により、比較的小さなガウススケールが複雑な詳細を表現・最適化する非無視因子であることが判明した。
元の3DGSと最先端の2DGSと組み合わせると、TrimGSは一貫してより正確な幾何学と高い知覚品質が得られる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:34:46 GMT)
Self-Alignment for Factuality: Mitigating Hallucinations in LLMs via Self-Evaluation [71.9] 大規模言語モデル(LLM)は、たとえ関連する知識を持っていたとしても、事実的不正確さに悩まされることが多い。
我々は,LLMの自己評価能力を活用し,現実性に向けてモデルを操る訓練信号を提供する。
提案手法は,Llamaファミリーモデルに対して,3つの重要な知識集約タスクにおいて,現実的精度を大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:22:14 GMT)
Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling [70.9] 選択状態空間モデル(SSM)であるMambaとSliding Window Attention(SWA)を組み合わせた単純なハイブリッドアーキテクチャであるSambaを提案する。
Sambaは、特定のシーケンスを選択的にリカレントな隠蔽状態に圧縮すると同時に、アテンション機構で正確に記憶を思い出す能力を維持している。
線形時間シーケンスモデルとして、Sambaは128Kの処理プロンプトでグループアテンションを持つトランスフォーマーに比べて3.73倍のスループットを保ち、無制限のストリーミングで64Kトークンを生成する場合の3.64倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:50:51 GMT)
DARA: Decomposition-Alignment-Reasoning Autonomous Language Agent for Question Answering over Knowledge Graphs [70.5] 本稿では,DARA(Decomposition Alignment-Reasoning Agent)フレームワークを提案する。
DARAは2つのメカニズムを通じて、質問を形式的なクエリに効果的に解析する。
我々は,DARAがKGQAの最先端列挙およびランク付けに基づく手法に匹敵する性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:09:37 GMT)
FaceGPT: Self-supervised Learning to Chat about 3D Human Faces [69.5] 我々は、画像やテキストから3次元の人間の顔を推論するために、VLM(Large Vision-Language Models)のための自己教師型学習フレームワークFaceGPTを紹介した。
FaceGPTは、VLMのトークン空間に3Dフォーマブルフェイスモデルのパラメータ(3DMM)を埋め込むことで、この制限を克服する。
我々は,FaceGPTが高品質な3次元顔再構成を実現し,汎用的な視覚指導の能力を維持していることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:13:29 GMT)
Self-Tuning: Instructing LLMs to Effectively Acquire New Knowledge through Self-Teaching [67.1] 大規模言語モデル(LLM)は最新の情報の提供に苦慮することが多い。
既存のアプローチは、通常、新しいドキュメントのトレーニングを継続する。
効率的なヒューマンラーニングにおけるFeynman Techniqueの成功に感銘を受けて、セルフチューニングを紹介した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:03:43 GMT)
When Do LLMs Need Retrieval Augmentation? Mitigating LLMs' Overconfidence Helps Retrieval Augmentation [66.0] 大規模言語モデル(LLM)は、特定の知識を持っていないことを知るのが困難であることが判明した。
Retrieval Augmentation (RA)はLLMの幻覚を緩和するために広く研究されている。
本稿では,LLMの知識境界に対する認識を高めるためのいくつかの手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:08:47 GMT)
Limited Out-of-Context Knowledge Reasoning in Large Language Models [65.7] LLM(Large Language Models)は、知識ベースとしての強力な能力と、コンテキスト内推論能力を示す。
本稿では、複数の知識を組み合わせて新しい知識を推論する、アウト・オブ・コンテクストの知識推論(OCKR: Out-of-context Knowledge Reasoning)について論じる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:58:59 GMT)
UVIS: Unsupervised Video Instance Segmentation [65.5] ビデオキャプションインスタンスのセグメンテーションには、ビデオフレームをまたいだすべてのオブジェクトの分類、セグメンテーション、追跡が必要である。
UVISは,ビデオアノテーションや高密度ラベルに基づく事前学習を必要とせずに,ビデオインスタンスのセグメンテーションを行うことのできる,新しいUnsupervised Video Instance (UVIS) フレームワークである。
本フレームワークは,フレームレベルの擬似ラベル生成,トランスフォーマーベースのVISモデルトレーニング,クエリベースのトラッキングという3つの重要なステップで構成されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:05:50 GMT)
The MuSe 2024 Multimodal Sentiment Analysis Challenge: Social Perception and Humor Recognition [64.5] マルチモーダル・センティメント・アナリティクス・チャレンジ (MuSe) 2024は、現代の2つのマルチモーダル・インフルエンスと感情分析の問題に対処する。
Social Perception Sub-Challenge (MuSe-Perception)では、参加者は16種類の個人の社会的属性を予測する。
クロスカルカルカルチャー・ヒューモー検出サブチャレンジ(MuSe-Humor)データセットは、Passau Spontaneous Football Coach Humorデータセット上に拡張される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:26:20 GMT)
SciMMIR: Benchmarking Scientific Multi-modal Information Retrieval [64.0] 科学領域内の画像テキストペアリングにおけるMMIR性能を評価するための最新のベンチマークは、顕著なギャップを示している。
オープンアクセス用紙コレクションを利用した特殊な科学的MMIRベンチマークを開発する。
このベンチマークは、科学的文書に詳細なキャプションのある数字や表から抽出された、530Kの精巧にキュレートされた画像テキストペアからなる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:18:08 GMT)
Fairness-Aware Meta-Learning via Nash Bargaining [63.4] 本稿では,機械学習におけるグループレベルの公平性の問題に対処する2段階のメタ学習フレームワークを提案する。
第1段階では、過度な競合を解決するためにNash Bargaining Solution(NBS)を使用して、モデルをステアリングする。
6つのキーフェアネスデータセットと2つの画像分類タスクにおいて、様々なフェアネス目標に対して経験的効果を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:34:15 GMT)
Label Alignment Regularization for Distribution Shift [63.2] 最近の研究は、教師あり学習におけるラベルアライメント特性(LAP)を強調している。
対象領域の予測と最上位特異ベクトルとのアライメントを促進する非教師なし領域適応の正規化法を提案する。
MNIST-USPSドメイン適応や言語間感情分析などのよく知られたタスクにおいて、ドメイン適応ベースラインよりもパフォーマンスが向上したことを報告した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:39:05 GMT)
NeRSP: Neural 3D Reconstruction for Reflective Objects with Sparse Polarized Images [62.8] NeRSPはスパース偏光画像を用いた反射面のニューラル3次元再構成技術である。
偏光画像形成モデルと多視点方位整合性から測光的および幾何学的手がかりを導出する。
我々は6つのビューのみを入力として、最先端の表面再構成結果を達成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:53:18 GMT)
Larimar: Large Language Models with Episodic Memory Control [62.7] Larimarは、分散エピソードメモリで大規模言語モデルを拡張するための、脳にインスパイアされたアーキテクチャである。
複数のファクト編集ベンチマークの実験結果は、Larimarが最も競争力のあるベースラインに匹敵する精度を達成したことを示している。
本稿では,Larimarを用いた選択的事実認識,情報漏洩防止,入力コンテキスト長の一般化のためのメカニズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:50:17 GMT)
LanEvil: Benchmarking the Robustness of Lane Detection to Environmental Illusions [61.9] レーン検出(LD)は自律走行システムにおいて不可欠な要素であり、適応型クルーズ制御や自動車線センターなどの基本的な機能を提供している。
既存のLDベンチマークは主に、環境錯覚に対するLDモデルの堅牢性を無視し、一般的なケースを評価することに焦点を当てている。
本稿では、LDに対する環境錯覚による潜在的な脅威について検討し、LanEvilの最初の総合ベンチマークを確立する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:40:50 GMT)
GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection [60.8] 拡散モデルは、特定のノイズを付加したテスト画像の通常の画像を再構成する傾向がある。
世界的視点から見ると、異なる異常による画像再構成の難しさは不均一である。
本稿では,非教師付き異常検出のためのグローバルかつ局所的な適応拡散モデル(GLADと略す)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:27:23 GMT)
Bench2Drive: Towards Multi-Ability Benchmarking of Closed-Loop End-To-End Autonomous Driving [59.7] 本稿では,E2E-ADシステムのマルチ能力をクローズドループで評価するための最初のベンチマークであるBench2Driveを紹介する。
我々は最先端のE2E-ADモデルを実装し、Bench2Driveで評価し、現状と今後の方向性について洞察を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:06:32 GMT)
T2S-GPT: Dynamic Vector Quantization for Autoregressive Sign Language Production from Text [59.6] 本稿では,手話における情報密度に基づいて符号化長を調整できる新しい動的ベクトル量子化(DVA-VAE)モデルを提案する。
PHOENIX14Tデータセットを用いて実験を行い,提案手法の有効性を示した。
我々は,486時間の手話ビデオ,音声,文字起こしテキストを含むドイツ語手話データセットPHOENIX-Newsを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:06:53 GMT)
Towards Realistic Data Generation for Real-World Super-Resolution [58.9] RealDGenは、現実世界の超解像のために設計された教師なし学習データ生成フレームワークである。
我々は,コンテンツ分解脱結合拡散モデルに統合されたコンテンツと劣化抽出戦略を開発する。
実験により、RealDGenは、現実世界の劣化を反映する大規模で高品質なペアデータを生成するのに優れていることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:34:57 GMT)
VersiCode: Towards Version-controllable Code Generation [58.8] VersiCodeは,大規模言語モデルが特定のライブラリのバージョンに対して検証可能なコードを生成する能力を評価するために設計された,最初の包括的なデータセットである。
バージョン別コード補完(VSCC)とバージョン別コード編集(VACE)の2つの専用評価タスクを設計する。
LLMのパフォーマンスをベンチマークするために総合的な実験が行われ、これらのタスクとVersiCodeの難しさを明らかにしている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:15:06 GMT)
Joint Demonstration and Preference Learning Improves Policy Alignment with Human Feedback [58.0] 我々は、報酬モデルとポリシーをトレーニングするために、AIHF(Alignment with Integrated Human Feedback)と呼ばれる単一ステージアプローチを開発する。
提案した手法は、一般的なアライメントアルゴリズムに容易に還元し、活用できる、効率的なアルゴリズムの集合を認めている。
本研究では,LLMにおけるアライメント問題と,MuJoCoにおけるロボット制御問題を含む広範な実験により,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:20:53 GMT)
Fast Context-Biasing for CTC and Transducer ASR models with CTC-based Word Spotter [57.6] この研究は、CTCベースのWord Spotterでコンテキストバイアスを高速化するための新しいアプローチを示す。
提案手法は,CTCログ確率をコンパクトなコンテキストグラフと比較し,潜在的なコンテキストバイアス候補を検出する。
その結果、FスコアとWERの同時改善により、文脈バイアス認識の大幅な高速化が示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:37:52 GMT)
Text Injection for Neural Contextual Biasing [57.6] 本研究では文脈テキストインジェクション(CTI)を提案する。
1000億のテキストを持つCTIは、強い神経バイアスモデルから43.3%の相対的なWER削減を達成することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:11:56 GMT)
A Glitch in the Matrix? Locating and Detecting Language Model Grounding with Fakepedia [57.3] 大規模言語モデル(LLM)は、そのコンテキストで提供される新しい情報を引き出すという印象的な能力を持つ。
しかし、この文脈的基盤のメカニズムはいまだに不明である。
本稿では,Fakepedia を用いたグラウンドディング能力の研究手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:37:23 GMT)
HOI-Swap: Swapping Objects in Videos with Hand-Object Interaction Awareness [57.2] 本稿では,自己指導型ビデオ編集フレームワークHOI-Swapについて紹介する。
第1ステージでは、HOI認識を備えた単一フレームでのオブジェクトスワップに焦点を当てている。
第2ステージは、シーケンス全体にわたって単一フレームの編集を拡張する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:31:29 GMT)
World Models with Hints of Large Language Models for Goal Achieving [56.9] 強化学習は、長期のタスクやスパース目標に直面して苦労する。
人間の認知にインスパイアされた新しいマルチモーダルモデルベースRLアプローチDreaming with Large Language Models (M.DLL.M)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:49:08 GMT)
Improving Logits-based Detector without Logits from Black-box LLMs [56.2] 大規模言語モデル(LLM)はテキスト生成に革命をもたらし、人間の文章を忠実に模倣する出力を生成する。
我々は、ブラックボックステキスト検出における最先端性能を再定義する革新的なフレームワークであるDLD(Dis Distribution-Aligned LLMs Detection)を提案する。
DALDは、サロゲートモデルの分布を未知の目標LLMの分布と整合させ、高速モデルの反復に対する検出能力とレジリエンスを向上するように設計されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:41:52 GMT)
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs [55.8] VideoLLaMA 2は、ビデオおよびオーディオ指向タスクにおける時空間モデリングと音声理解を強化するために設計されたビデオ大言語モデル(Video Large Language Models, Video-LLMs)のセットである。
VideoLLaMA 2は、オープンソースモデル間の競争結果を一貫して達成し、いくつかのベンチマークでいくつかのプロプライエタリなモデルに近づいた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:22:23 GMT)
An Expert is Worth One Token: Synergizing Multiple Expert LLMs as Generalist via Expert Token Routing [55.3] Expert-Token-Routing は、メタ LLM の語彙内の特別な専門家トークンとして、専門家 LLM を表現している。
既存の命令データセットから専門家のLSMの暗黙の専門知識を学ぶのをサポートする。
また、ユーザの視点から詳細なコラボレーションプロセスを隠蔽し、独特なLLMのように対話を容易にする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:12:09 GMT)
An Image is Worth 32 Tokens for Reconstruction and Generation [54.2] Transformer-based 1-dimensional Tokenizer (TiTok) は、画像を1D潜在シーケンスにトークン化する革新的なアプローチである。
TiTokは最先端のアプローチと競合するパフォーマンスを実現している。
我々の最高性能の変種は、DiT-XL/2 (gFID 2.13 vs. 3.04) をはるかに上回りながら、高品質なサンプルを74倍高速に生成できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:56 GMT)
4Real: Towards Photorealistic 4D Scene Generation via Video Diffusion Models [53.9] テキストから4Dシーン生成のための新しいパイプラインを提案する。
提案手法は,ビデオ生成モデルを用いて参照ビデオを生成することから始まる。
次に、凍結時間ビデオを用いて、ビデオの標準的な3D表現を学習する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:19:26 GMT)
SemEval-2024 Task 3: Multimodal Emotion Cause Analysis in Conversations [53.6] SemEval-2024 Task 3 "Multimodal Emotion Cause Analysis in Conversations" は、会話からすべての感情とそれに対応する原因を抽出することを目的としている。
異なるモダリティ設定の下では、2つのサブタスクから構成される: 会話におけるテキスト感情因果ペア抽出(TECPE)と会話におけるマルチモーダル感情因果ペア抽出(MECPE)である。
本稿では,タスク,データセット,評価設定について紹介し,トップチームのシステムを要約し,参加者の知見について議論する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:12:01 GMT)
Understanding Cross-Lingual Alignment -- A Survey [52.6] 言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:33:52 GMT)
Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B [52.2] 本稿では,大規模言語モデル (LLM) とモンテカルロ木探索 (MCTS) を革新的に統合した MCT Self-Refine (MCTSr) アルゴリズムを提案する。
このアルゴリズムは、セレクション、自己定義、自己評価、バックプロパゲーションの反復的なプロセスを通じてモンテカルロ探索木を構築する。
大規模な実験は、オリンピアードレベルの数学問題の解法におけるMCTSrの有効性を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:01:07 GMT)
GALA3D: Towards Text-to-3D Complex Scene Generation via Layout-guided Generative Gaussian Splatting [52.2] GALA3D, GALA3D, 生成3D GAussian, LAyout-guided control, for effective compositional text-to-3D generation。
GALA3Dは、最先端のシーンレベルの3Dコンテンツ生成と制御可能な編集のための、ユーザフレンドリーでエンドツーエンドのフレームワークである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:16:37 GMT)
Visual Prompt Tuning in Null Space for Continual Learning [52.0] 既存のプロンプトチューニング手法は、継続学習(CL)における印象的な性能を示す。
本稿では,従来のタスクの特徴に代表される部分空間に直交する方向のプロンプトを調整し,各タスクを学習することを目的とする。
実際には、即時勾配予測を実装するために、実効的なヌル空間に基づく近似解が提案されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:15:17 GMT)
Algorithmic Persuasion Through Simulation [51.2] 本研究では,受取人に製品購入などの二元的行動を取るよう説得するベイズ説得ゲームについて検討する。
送信者は、製品の品質が高いか低いかなどの世界の(バイナリ)状態について通知されるが、受信者の信念やユーティリティに関する情報は限られている。
顧客の調査やユーザスタディ、最近のAIの進歩によって動機づけられた私たちは、受信者の振る舞いをシミュレートする託宣をクエリすることで、送信側が受信者についてより深く学ぶことを可能にする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:51:08 GMT)
Benchmarking Trustworthiness of Multimodal Large Language Models: A Comprehensive Study [51.2] MultiTrustはMLLMの信頼性に関する最初の総合的で統一されたベンチマークである。
我々のベンチマークでは、マルチモーダルリスクとクロスモーダルインパクトの両方に対処する厳格な評価戦略を採用している。
21の近代MLLMによる大規模な実験は、これまで調査されなかった信頼性の問題とリスクを明らかにしている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:38:13 GMT)
TraceMesh: Scalable and Streaming Sampling for Distributed Traces [51.1] TraceMeshは、分散トレースのためのスケーラブルでストリーミングなサンプリングツールである。
以前は見つからなかったトレース機能を、統一的で合理化された方法で扱える。
TraceMeshは、サンプリング精度と効率の両方において、最先端の手法よりも大幅に優れている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:13:58 GMT)
Zero-shot Image Editing with Reference Imitation [50.8] 我々は、ユーザーがより便利に創造性を発揮できるように、模倣編集と呼ばれる新しい形態の編集を提示する。
ビデオクリップから2つのフレームをランダムに選択し、あるフレームのいくつかの領域をマスクし、他のフレームからの情報を用いてマスクされた領域を復元する、MimicBrushと呼ばれる生成学習フレームワークを提案する。
各種試験事例における本手法の有効性を実験的に示すとともに,既存手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:51 GMT)
Markov Constraint as Large Language Model Surrogate [49.9] NgramMarkovは制約プログラミング(CP)におけるテキスト生成に特化している
これは文のn-グラムの確率の積を制限する。
5グラムではなく4グラムで現実の問題が初めて解決された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:09:53 GMT)
Refined Sample Complexity for Markov Games with Independent Linear Function Approximation [49.6] マルコフゲーム(MG)はマルチエージェント強化学習(MARL)の重要なモデルである
本稿では、WangらによるAVLPRフレームワークを改良し(2023年)、最適部分ギャップの悲観的推定を設計する。
マルチエージェントの呪いに取り組み、最適な$O(T-1/2)収束率を達成し、同時に$textpoly(A_max)$依存性を避ける最初のアルゴリズムを与える。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:12:59 GMT)
DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.6] 本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:31:03 GMT)
Can We Achieve High-quality Direct Speech-to-Speech Translation without Parallel Speech Data? [49.4] 2パス直接音声音声変換(S2ST)モデルは、タスクを音声音声翻訳(S2TT)とテキスト音声翻訳(TTS)に分解する
本稿では,事前学習した任意のS2TTおよびTSモデルを直接S2STモデルにシームレスに統合できるComSpeechという複合S2STモデルを提案する。
また,S2TTとTSデータのみを利用した新しいトレーニング手法ComSpeech-ZSを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:17:12 GMT)
An Analysis of Quantum Annealing Algorithms for Solving the Maximum Clique Problem [49.2] 我々は、QUBO問題として表されるグラフ上の最大傾きを見つける量子D波アンナーの能力を解析する。
本稿では, 相補的な最大独立集合問題に対する分解アルゴリズムと, ノード数, 傾き数, 密度, 接続率, 解サイズの他のノード数に対する比を制御するグラフ生成アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:40:05 GMT)
II-Bench: An Image Implication Understanding Benchmark for Multimodal Large Language Models [49.1] マルチモーダルな大言語モデル(MLLM)は、様々なベンチマークで新しいブレークスルーをもたらしている。
本稿では,画像の高次知覚評価を目的とした画像意味理解ベンチマークII-Benchを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:33:42 GMT)
A Non-autoregressive Generation Framework for End-to-End Simultaneous Speech-to-Any Translation [48.8] 同時音声翻訳のための新しい非自己回帰生成フレームワーク(NAST-S2X)を提案する。
NAST-S2Xは、音声テキストと音声音声タスクを統合エンドツーエンドフレームワークに統合する。
3秒未満の遅延で高品質な同時解釈を実現し、オフライン生成において28倍のデコードスピードアップを提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:25:48 GMT)
Equivariance via Minimal Frame Averaging for More Symmetries and Efficiency [48.8] 最小フレーム平均化(Minimum Frame Averaging、MFA)は、証明可能な最小限のフレームを構築するための数学的フレームワークである。
その結果, 多様なタスクにまたがって, MFAによる対称性の符号化の有効性と効果が示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:58:56 GMT)
Simple and Effective Masked Diffusion Language Models [48.7] 単純なマスク付き離散拡散は以前考えられていたよりも性能が高いことを示す。
マスク拡散モデルの性能を向上させる効果的なトレーニングレシピを適用した。
私たちの目標はシンプルなフォーム -- 古典的なマスキング言語モデリング損失の混合です。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:51:40 GMT)
MSAGPT: Neural Prompting Protein Structure Prediction via MSA Generative Pre-Training [48.4] マルチシークエンスアライメント(MSA)は、タンパク質ファミリーの進化的軌道を明らかにする上で重要な役割を担っている。
MSAGPTは、低MSA状態下でのMSA生成前訓練を通じてタンパク質構造予測を促進する新しいアプローチである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:42:17 GMT)
FoldToken2: Learning compact, invariant and generative protein structure language [48.2] 我々はFoldToken2を提案し、元の構造の復元性を維持しつつ、同変構造を離散トークンに変換する。
タンパク質構造再構築タスクにおいてFoldToken2を評価し,従来のFoldToken1よりもTMScoreで20%,RMSDで81%優れていた。
我々はFoldToken2が、タンパク質構造表現学習、構造アライメント、構造生成タスクのさらなる改善をもたらすと考えている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:24:51 GMT)
Logical Distillation of Graph Neural Networks [47.9] グラフを学習するための論理に基づく解釈可能なモデルと,このモデルをグラフニューラルネットワーク(GNN)から抽出するアルゴリズムを提案する。
最近の結果は、GNNの表現性と数量化器を用いた一階述語論理の2変数フラグメント(C2)の関連性を示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:18:58 GMT)
Leveraging Large Language Models for Efficient Failure Analysis in Game Development [47.6] 本稿では,テストの失敗の原因となるコードの変更を自動的に識別する手法を提案する。
このメソッドは、LLM(Large Language Models)を利用して、エラーメッセージと対応するコード変更を関連付ける。
当社のアプローチは新たに作成したデータセットで71%の精度に達しています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:21:50 GMT)
Teaching with Uncertainty: Unleashing the Potential of Knowledge Distillation in Object Detection [47.1] 本稿では,物体検出のための知識の不確実性を考慮した特徴量に基づく蒸留パラダイムを提案する。
モンテカルロのドロップアウト手法を利用して,学生モデルの学習過程に知識の不確実性を導入する。
本手法は,複雑な構造や計算資源を必要とせずに,KDプロセス中に効果的に機能する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:51:02 GMT)
Can ChatGPT Detect DeepFakes? A Study of Using Multimodal Large Language Models for Media Forensics [47.0] AI生成メディアコンテンツを指すDeepFakesは、偽情報の手段としての利用が懸念されている。
本稿では,DeepFake検出におけるマルチモーダル大言語モデル(LLM)の機能について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:24:45 GMT)
Advancing Grounded Multimodal Named Entity Recognition via LLM-Based Reformulation and Box-Based Segmentation [47.0] Grounded Multimodal Named Entity Recognition (GMNER) タスクは、名前付きエンティティ、エンティティタイプ、および対応する視覚領域を識別することを目的としている。
我々は,大規模な言語モデルを活用することで,GMNERをMNER-VE-VGタスクに再構成する統一フレームワークであるRiVEGを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:52:29 GMT)
ExHuBERT: Enhancing HuBERT Through Block Extension and Fine-Tuning on 37 Emotion Datasets [46.9] EmoSet++は、37のデータセット、150,907のサンプル、合計119.5時間からなる包括的な多言語・多文化の音声感情コーパスである。
次に、バックボーン拡張とEmoSet++の微調整によって達成されたHuBERTの拡張バージョンであるExHuBERTを紹介します。
未知のデータセットに対する評価は、ExHuBERTの有効性を示し、様々なSERタスクに対する新しいベンチマークを設定した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:30:15 GMT)
AS-70: A Mandarin stuttered speech dataset for automatic speech recognition and stuttering event detection [46.9] AS-70は、マンダリンで公開されている最初の音声データセットである。
本稿では,マンダリン発声音声データセットAS-70について紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:35:50 GMT)
Polarization Wavefront Lidar: Learning Large Scene Reconstruction from Polarized Wavefronts [46.8] 我々は、放射光と受信光の偏光を変調する新しい長距離偏光波面センサ(PolLidar)を導入する。
我々は、新しい学習的再構成手法を用いて、屋外シナリオにおける正常、距離、材料特性を推定するために偏波波面を利用する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:56:15 GMT)
Image Neural Field Diffusion Models [46.8] 本稿では,画像ニューラルネットワーク上での拡散モデルのトレーニングにより連続画像の分布を学習することを提案する。
画像ニューラル場拡散モデルは、混合分解能画像データセットを用いて訓練でき、固定分解能拡散モデルよりも優れており、異なるスケールで適用された条件で効率よく逆問題を解くことができることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:24:02 GMT)
Back to the Color: Learning Depth to Specific Color Transformation for Unsupervised Depth Estimation [46.0] 実世界のデータに基づいて訓練されたモデルを用いて,奥行きからリアルな色を予測するフレームワークBack2Colorを提案する。
また、時間次元と空間次元の両方で教師なし学習の利点を統合する自動学習不確実性時空間融合法(Auto-UTSF)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:55:20 GMT)
Active learning for affinity prediction of antibodies [45.6] 抗体のような大きな分子では、抗体親和性を高める突然変異を同定することは困難である。
FERB法は、異なる変異が薬物候補の有効性と選択性に与える影響について、貴重な洞察を与えることができる。
本稿では,評価を行うシミュレータのシーケンスを反復的に提案し,改良されたバインダーの探索を高速化する能動的学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:42:49 GMT)
Autoregressive Pretraining with Mamba in Vision [45.3] 本稿では,マンバの視覚能力が自己回帰前訓練によって著しく向上できることを示す。
パフォーマンス面では、自動回帰事前訓練は、Mambaアーキテクチャを極めて高い精度で装備する。
大きめのMambaは、384時間384ドルの入力で微調整すると、画像ネットの精度が85.0%に達します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:58:34 GMT)
Blinded by Generated Contexts: How Language Models Merge Generated and Retrieved Contexts When Knowledge Conflicts? [45.2] 応答が生成されたコンテキストと検索されたコンテキストに関連付けられているかどうかを識別する。
実験では、誤った情報を提供する場合でも、生成されたコンテキストを優先する複数のLSMにおいて、重大なバイアスが示される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:52:58 GMT)
On the Recoverability of Causal Relations from Temporally Aggregated I.I.D. Data [45.2] 時間的アグリゲーションが一般環境における瞬時因果発見に及ぼす影響を考察する。
理論的,実験的に,因果発見結果は凝集により著しく歪む可能性があることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:53:39 GMT)
Understanding Visual Concepts Across Models [45.2] テキスト・ツー・イメージ生成、オープン・セット・オブジェクト検出、ゼロショット分類において、3つの最先端モデルの大規模解析を行う。
任意の概念を生成し、検出し、分類する事前埋め込みに対して、$epsilon$-ball内で摂動を見つける。
これらの新しい埋め込みが新しいモデルにスプリケートされると、元のモデルをターゲットにした微調整が失われる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:40:31 GMT)
Estimating the Hallucination Rate of Generative AI [44.9] 条件付き生成モデル(CGM)はデータセットでトリガーされ、そのデータセットに基づいて予測を行うように要求される。
我々は、ICL問題(すなわち、CGM、データセット、予測問題)をとる新しい方法を開発し、CGMが幻覚を発生させる確率を推定する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:01:52 GMT)
PatchScaler: An Efficient Patch-Independent Diffusion Model for Super-Resolution [44.3] 拡散モデルは、その印象的なコンテンツ生成機能により、超解像の品質を著しく向上させる。
近年、サンプリングステップの数を削減すべく、合理的な推論アクセラレーションについて検討されているが、各ステップが全画像上で実行されるため、計算コストは高いままである。
本稿では,パッチ非依存拡散に基づく単一画像超解像法であるPatchScalerを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:29:43 GMT)
Neural Gaffer: Relighting Any Object via Diffusion [43.9] 我々はニューラル・ギャファーと呼ばれる新しいエンドツーエンドの2次元ライティング拡散モデルを提案する。
我々のモデルは、任意の物体の1つの画像を取り、新しい照明条件下で、正確で高品質な信頼された画像を合成することができる。
本稿では,インターネット画像の総合化と精度の両面からモデルを評価し,その利点を一般化と精度の両面から示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:50:15 GMT)
Semantic-Aware Spectrum Sharing in Internet of Vehicles Based on Deep Reinforcement Learning [43.8] 深部強化学習(DRL)ソフトアクター・クリティック(SAC)アプローチに基づく意味認識スペクトル共有アルゴリズム(SSS)を提案する。
我々は、IoV環境におけるV2VおよびV2Iスペクトル共有における意味情報のメトリクスを再定義し、高速意味スペクトル効率(HSSE)と意味伝達率(HSR)を導入した。
この最適化は、V2VとV2Iの共有戦略の最適リンク、セマンティック情報を送信する車両の送信パワー、送信されるセマンティックシンボルの長さを含む。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:42:41 GMT)
Efficient 3D Molecular Generation with Flow Matching and Scale Optimal Transport [43.6] 本稿では,3次元分子生成のためのスケーラブルなE(3)等価メッセージパッシングアーキテクチャを提案する。
また,分子生成モデルであるMolFlowを導入し,フローマッチングと大規模最適輸送を併用して学習を行った。
本モデルでは,100個のサンプリングステップのみを用いて,ベンチマークデータセットの最先端結果を生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:51:51 GMT)
DUAL-REFLECT: Enhancing Large Language Models for Reflective Translation through Dual Learning Feedback Mechanisms [43.1] 自己回帰によって強化された大規模言語モデル(LLM)は機械翻訳において有望な性能を達成した。
既存の自己回帰法には効果的なフィードバック情報がなく、翻訳性能が制限されている。
本稿では,翻訳タスクの二重学習を利用して効果的なフィードバックを提供するREFLECTフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:10:39 GMT)
SceneTextGen: Layout-Agnostic Scene Text Image Synthesis with Diffusion Models [42.4] SceneTextGenは、事前に定義されたレイアウトステージの必要性を回避するために特別に設計された、拡散ベースの新しいモデルである。
SceneTextGenの斬新さは、3つの重要なコンポーネントの統合にある: 詳細なタイポグラフィ特性をキャプチャする文字レベルエンコーダと、文字レベルのインスタンスセグメンテーションモデルと、不要なテキスト生成とマイナーな文字不正確な問題に対処するワードレベルスポッティングモデルである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:17:02 GMT)
AutoStudio: Crafting Consistent Subjects in Multi-turn Interactive Image Generation [42.0] インタラクティブな画像を生成するためのAutoStudioという,トレーニング不要なマルチエージェントフレームワークを提案する。
AutoStudioは、対話を処理するために大きな言語モデル(LLM)に基づく3つのエージェントと、高品質な画像を生成するための安定した拡散(SD)ベースのエージェントを使用している。
パブリックなCMIGBenchベンチマークと人的評価の実験は、AutoStudioが複数のターンにわたる複数オブジェクトの一貫性を良好に維持していることを示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:29:53 GMT)
Shortcuts to adiabaticity designed via time-rescaling follow the same transitionless route [41.9] 近年,高速プロセスの設計手法として,時間再スケーリング(TR)が提案されている。
得られた高速力学は, 有名な反断熱 (CD) 手法を用いて設計したものと同様, 過渡的ではないことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:34:36 GMT)
CRS-Diff: Controllable Generative Remote Sensing Foundation Model [41.7] CRS-Diffは、RS画像生成に特化した新しいRS生成基盤フレームワークである。
我々の知る限り、CRS-Diffは、最初の多重条件制御可能な生成RS基盤モデルである。
私たちのCRS-Diffは、下流タスクのための高品質なトレーニングデータを生成するデータエンジンとして機能します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:34:01 GMT)
Mercury: A Code Efficiency Benchmark for Code Large Language Models [41.5] 我々は、Large Language Models for Code (Code LLMs)の最初のコード効率ベンチマークであるMercuryを提示する。
1,889のPythonタスクで構成され、それぞれに現実の効率のベースラインとして機能する適切なソリューションが伴っている。
そこで我々は,機能的正当性とコード効率を同時に反映する,実行時毎のパススコアを計算する新たな指標Beyondを導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:44:56 GMT)
A Semantic-Aware and Multi-Guided Network for Infrared-Visible Image Fusion [41.3] マルチモダリティ画像融合は、2つのソース画像から特定のモダリティ情報と共有モダリティ情報を融合することを目的としている。
本稿では,3分岐エンコーダデコーダアーキテクチャと,それに対応する融合層を融合戦略として提案する。
可視・近赤外画像融合および医用画像融合タスクにおける最先端手法と比較して,本手法は競争力のある結果を得た。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:32:40 GMT)
Gradient-based Parameter Selection for Efficient Fine-Tuning [41.3] グラディエントベース。
選択(GPS)はパラメータ効率の良い新しい微調整法である。
GPSはトレーニングと推論の段階で追加のパラメータや計算コストを導入していない。
GPSは3.33%(91.78% vs. 88.45%, FGVC)、9.61%(73.1% vs. 65.57%, VTAB)の精度向上を実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:45:49 GMT)
On the Hallucination in Simultaneous Machine Translation [41.3] 幻覚は同時機械翻訳において重要な問題である。
SiMTにおける目標側情報の過剰使用を減らして幻覚を軽減することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:20:07 GMT)
Towards Fundamentally Scalable Model Selection: Asymptotically Fast Update and Selection [40.9] 理想的なモデル選択スキームは、候補モデルの大きなプール上で2つの操作を効率的にサポートすべきである。
モデル選択に対する従来の解決策は、これらの2つの操作のうちの少なくとも1つに対して高い計算複雑性を必要とする。
モデル埋め込みを実証的に実現したStandardized Embedderを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:57:49 GMT)
Teaching Language Models to Self-Improve by Learning from Language Feedback [40.6] 本稿では、モデルフィードバックをアライメントに活用するSRT(Self-Refinement Tuning)を提案する。
SRTはベース言語モデル(例えばTulu2)を使用して、より高度なモデルによって批判され洗練される初期応答を生成する。
SRTはさらに、自己生成したフィードバックと改善から学び、モデルの改善を促進するフィードバックループを作成することで、モデルを最適化する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:20:05 GMT)
On the Benefits of Public Representations for Private Transfer Learning under Distribution Shift [40.6] 一般のプレトレーニングは、プライベートトレーニングをスクラッチから最大67%改善できることを示す。
この現象の理論的説明として、公開データとプライベートデータが低次元表現を共有している場合、公開表現は、プライベートトレーニングのサンプルの複雑さを改善することができることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:55:07 GMT)
Identifiable Object-Centric Representation Learning via Probabilistic Slot Attention [40.5] 既存の手法は、有望なオブジェクト結合能力を実証的に示すが、理論的な識別可能性の保証は比較的未発達のままである。
本稿では,オブジェクト中心のスロット表現に先行してアグリゲート混合を課す確率論的スロットアテンションアルゴリズムを提案する。
簡単な2次元データと高分解能画像データの両方を用いた理論的識別可能性の実証検証を行った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:40:54 GMT)
Budget-Constrained Tool Learning with Planning [40.5] 本稿では,予算制約ツール学習のための新しい手法を提案する。
当社のアプローチでは、ツールを利用する前に、予算制約の下で望ましいプランを作成します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:02:19 GMT)
Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem [40.5] 効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:57:23 GMT)
Closing the Gap: Achieving Global Convergence (Last Iterate) of Actor-Critic under Markovian Sampling with Neural Network Parametrization [40.4] Actor-Critic (AC)アルゴリズムの最近の理論的解析は、AC実装の実践的な側面に対処する上での遅延である。
我々は,5つの重要な実践的側面をすべて包含するACアルゴリズムの包括的理論的解析を行った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:32:16 GMT)
Transferring Knowledge from Large Foundation Models to Small Downstream Models [40.4] 事前訓練されたモデル間で知識を伝達するための適応的特徴伝達(AFT)を導入する。
AFTは純粋に機能で動作し、より小さな下流モデルから事前訓練されたモデルの選択を分離する。
AFTは、同様の計算コストの代替よりも、ダウンストリーム性能が大幅に向上する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:06:15 GMT)
Evolving from Single-modal to Multi-modal Facial Deepfake Detection: A Survey [40.1] AI生成メディアがより現実的になるにつれて、誤情報を拡散したり、身元確認詐欺を犯したりする危険性が高まっている。
この研究は、従来の単一モダリティ手法から、音声・視覚・テキスト・視覚シナリオを扱う高度なマルチモーダルアプローチへの進化を辿る。
私たちの知る限りでは、この種の調査はこれが初めてである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:48:04 GMT)
MLLMGuard: A Multi-dimensional Safety Evaluation Suite for Multimodal Large Language Models [40.0] 本稿では,MLLMの多次元安全性評価スイートであるMLLMGuardを紹介する。
バイリンガル画像テキスト評価データセット、推論ユーティリティ、軽量評価器が含まれている。
13種類の先進モデルに対する評価結果は,MLLMが安全かつ責任を負うことができるまでには,まだかなりの道のりを歩んでいることを示唆している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:41:33 GMT)
Treeffuser: Probabilistic Predictions via Conditional Diffusions with Gradient-Boosted Trees [40.0] Treeffuserは、表データの確率的予測のための使いやすい方法である。
Treeffuserはよく校正された予測分布を学習し、幅広い回帰タスクを処理できる。
Walmartの営業データを用いて、不確実性の下での在庫配分への応用について、その汎用性を実証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:59:24 GMT)
Faithful Logical Reasoning via Symbolic Chain-of-Thought [39.9] シンボリック表現と論理規則をChain-of-Thoughtプロンプトと統合するフレームワークであるSymbCoTを提案する。
我々は、SymbCoTがCoT法よりも大幅に改善されていることを示す。
これは、論理的推論のために記号表現と規則をCoTに結合する最初の方法である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:41:03 GMT)
Efficiently Exploring Large Language Models for Document-Level Machine Translation with In-context Learning [38.9] 文レベルの翻訳とは対照的に、文脈内学習に基づく大規模言語モデル(LLM)による文書レベルの翻訳(DOCMT)は2つの大きな課題に直面している。
本研究では,文脈認識型プロンプト法(CAP)を提案する。
様々なDOCMTタスクに対して広範な実験を行い,本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:11:17 GMT)
Aligning Large Language Models with Representation Editing: A Control Perspective [38.7] 人間の目的に合わせて微調整された大規模言語モデル(LLM)は、現実世界のアプリケーションには不可欠である。
プロンプトやガイドデコードといったテスト時のアライメント技術は、基礎となるモデルを変更しない。
表現編集によるLLMの整合性を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:18:24 GMT)
Agent-SiMT: Agent-assisted Simultaneous Machine Translation with Large Language Models [38.5] 同時機械翻訳(SiMT)は、原文を読みながらターゲット翻訳を生成する。
既存の SiMT メソッドは一般的に、ポリシーを同時に決定し、翻訳を生成する、従来の Transformer アーキテクチャを採用している。
本稿では,Large Language Models(LLM)と従来のSiMTメソッドの長所を組み合わせたフレームワークであるAgent-SiMTを紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:09:20 GMT)
AudioMarkBench: Benchmarking Robustness of Audio Watermarking [38.3] 本稿では,透かし除去と透かし偽造に対する音響透かしの堅牢性を評価するための最初の体系的ベンチマークであるAudioMarkBenchを紹介する。
以上の結果から,従来の透かし手法の脆弱性を強調し,より堅牢で公正な透かしソリューションの必要性を強調した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:18:29 GMT)
CARACAS: vehiCular ArchitectuRe for detAiled Can Attacks Simulation [37.9] 本稿では、CANメッセージによるコンポーネント制御やアタックインジェクション機能を含む車両モデルであるCARACASを紹介する。
CarACASは、バッテリ・エレクトリック・ビークル(BEV)モデルを含むこの手法の有効性を示し、2つの異なるシナリオでトルク制御を狙う攻撃に焦点を当てている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:16:55 GMT)
Pre-training Feature Guided Diffusion Model for Speech Enhancement [37.9] 音声強調は、雑音環境下での音声の明瞭さと明瞭さを著しく向上させる。
本稿では,効率的な音声強調に適した事前学習機能誘導拡散モデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:22:59 GMT)
Long-Context Language Modeling with Parallel Context Encoding [37.6] 既存のデコーダのみのLLMに適用可能なフレームワークを導入し、コンテキストウィンドウを拡張する。
CEPEは小さなエンコーダを使用して長い入力チャンクをチャンク単位で処理し、冷凍復号器はクロスアテンションを介して追加のコンテキストを利用することができる。
CEPEは、言語モデリングとコンテキスト内学習に強いパフォーマンスをもたらす。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:54:13 GMT)
M-LRM: Multi-view Large Reconstruction Model [37.5] M-LRM (Multi-view Large Restruction Model) は,高品位な3次元形状を多視点から3次元的に効率的に再構成するように設計されている。
大型再構成モデルと比較すると、提案したM-LRMは128倍の128ドルの高解像度の3次元形状のNeRFを生成することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:29:13 GMT)
Instant 3D Human Avatar Generation using Image Diffusion Models [37.5] AvatarPopUpは、異なる入力モードから高速で高品質な3Dアバターを生成する方法である。
我々のアプローチでは、わずか2秒で4桁のスピードアップw.r.tで3Dモデルを生成することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:47:27 GMT)
Advancing Tool-Augmented Large Language Models: Integrating Insights from Errors in Inference Trees [37.3] 決定木から抽出した選好データに基づく推論軌道最適化フレームワークを提案する。
提案実験により, TP-LLaMAは, 推定木における誤差から洞察を得ることにより, ベースラインを著しく上回ることを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:00:18 GMT)
FoodSky: A Food-oriented Large Language Model that Passes the Chef and Dietetic Examination [37.1] 食品データを理解するために食品指向の大規模言語モデル(LLM)を導入する。
中国料理の複雑さと典型性を考えると、我々はまず1つの総合的な中華料理コーパス「FoodEarth」を構築した。
そこで我々は,HTRAG(Herarchical Topic Retrieval Augmented Generation)機構とTS3M(Selective State Space Model)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:27:00 GMT)
Image and Video Tokenization with Binary Spherical Quantization [36.9] バイナリ球面量子化(BSQ)を用いたトランスフォーマベース画像およびビデオトークン化器を提案する。
BSQは、高次元の視覚的埋め込みを低次元の超球面に投影し、二値量子化を適用する。
我々のトークンライザは、可変長動画を入力としてサポートするために、単純なブロックワイズ因果マスキングを備えたトランスフォーマーエンコーダとデコーダを使用する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:53 GMT)
RIR-SF: Room Impulse Response Based Spatial Feature for Target Speech Recognition in Multi-Channel Multi-Speaker Scenarios [36.5] 室内インパルス応答(RIR)に基づく空間的特徴を持つRIR-SFについて紹介する。
RIR-SFは従来の3次元空間特性よりも優れており、理論的および経験的性能が優れている。
また、RIR-SFのための最適化されたオールニューラルマルチチャネルASRフレームワークを提案し、マルチチャネル設定におけるターゲット話者ASRに対するCERの相対的な21.3%削減を実現した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:09:26 GMT)
Ctrl-X: Controlling Structure and Appearance for Text-To-Image Generation Without Guidance [36.5] 最近の制御可能な生成手法は、補助モジュールを訓練することなく、テキスト・ツー・イメージ(T2I)拡散モデルにきめ細かい空間的および外観的制御をもたらす。
この研究は、追加のトレーニングやガイダンスなしでT2I拡散制御構造と外観の単純なフレームワークであるCtrl-Xを提示する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:01 GMT)
ICC: Quantifying Image Caption Concreteness for Multimodal Dataset Curation [36.4] ペア化されたテキストイメージデータのWebスケールトレーニングは、ますますマルチモーダルな学習の中心になりつつある。
標準的なデータフィルタリングアプローチでは、ミスマッチしたテキストイメージペアを削除できない。
画像参照なしで字幕テキストを評価し,その具体性を計測する新しい指標である画像キャプション具体性を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:18:44 GMT)
Diagnosing and fixing common problems in Bayesian optimization for molecule design [36.3] 分子設計のためのPMOベンチマークにおいて,基本的なBO設定でも高い総合性能が得られることを示す。
これらの結果から,BOは分子群集における機械学習のさらなる注目の恩恵を受ける可能性が示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:44:04 GMT)
HYDRA: Model Factorization Framework for Black-Box LLM Personalization [36.2] パーソナライゼーションは現代のインテリジェントシステムにおいて重要な研究領域として現れてきた。
ブラックボックスの大規模言語モデル(LLM)が示した驚くべき数ショットの能力にもかかわらず、それらのモデルパラメータの本質的な不透明さは、生成された出力を個々の期待と整合させる上で大きな課題である。
本研究では,履歴データからユーザ固有の行動パターンを抽出し,パーソナライズされた生成を提供するモデル因子化フレームワークHYDRAを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:51:57 GMT)
Towards more realistic evaluation of LLM-based code generation: an experimental study and beyond [36.2] 我々は,ソフトウェア開発の進化する性質を反映した,大規模言語モデルのコード生成性能を理解するための実証的研究を行った。
従来の非無視評価手法は10.0%から61.1%の範囲でLLMの膨らませた性能をもたらすことがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:19:18 GMT)
Physics3D: Learning Physical Properties of 3D Gaussians via Video Diffusion [35.7] ビデオ拡散モデルを用いて3Dオブジェクトの様々な物理的特性を学習する新しい手法である textbfPhysics3D を提案する。
本手法では,粘弾性材料モデルに基づく高一般化物理シミュレーションシステムを設計する。
弾性材料とプラスチック材料の両方を用いて, 本手法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:36:09 GMT)
LinguAlchemy: Fusing Typological and Geographical Elements for Unseen Language Generalization [35.1] LinguAlchemyは,類型的,地理的,系統的特徴を網羅する様々な言語情報を組み込んだ正規化手法である。
我々のLinguAlchemyは低リソース言語におけるmBERTとXLM-Rの性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:23:51 GMT)
MR-RawNet: Speaker verification system with multiple temporal resolutions for variable duration utterances using raw waveforms [35.1] MR-RawNetは、可変発話に対する話者検証システムの堅牢性を高めるように設計されている。
MR-RawNetは、多分解能特徴抽出器を介して生波形から時間周波数表現を抽出する。
VoxCeleb1データセットを用いて行った実験結果から,MR-RawNetは可変長発話の処理において優れた性能を示すことが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:42:47 GMT)
ULog: Unsupervised Log Parsing with Large Language Models through Log Contrastive Units [34.3] ULogは,効率的かつ既製のログ解析のための教師なしの手法である。
ログのこのようなグループをログコントラスト単位(Log Contrastive Units, LCU)と呼ぶ。
ULogは、LLMがコントラストパターンを特定し、LCUから意味のあるログ構造を抽出するための、新しい解析プロンプトを作成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:32:01 GMT)
Popularity-Aware Alignment and Contrast for Mitigating Popularity Bias [34.0] 協調フィルタリング(CF)は通常、現実のデータセットにおけるアイテムの不均一な分布のため、人気バイアスの課題に悩まされる。
このバイアスは、人気アイテムと不人気アイテムの間にかなりの精度のギャップをもたらす。
本稿では,2つの課題に対処するために,PAAC(Popularity-Aware Alignment and Contrast)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:29:46 GMT)
Guardrail Baselines for Unlearning in LLMs [33.9] ファインタニングは、大きな言語モデルから'未学習'の概念への有望なアプローチである。
ガードレールをベースとしたプロンプトやフィルタリングなどの手法が,ファインタニングに匹敵する未学習結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:47:39 GMT)
On the Robustness of Document-Level Relation Extraction Models to Entity Name Variations [33.6] 本研究では,DocREモデルのエンティティ名のバリエーションに対する堅牢性について検討する。
本稿では,元となるエンティティ名をWikidataから名前に置き換えることで,エンティティにリネームされたドキュメントを生成するための原則的パイプラインを提案する。
実験結果から、3つの代表的なDocREモデルと2つのコンテキスト内モデルの両方が、エンティティ名のバリエーションに十分なロバスト性が欠如していることが判明した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:51:14 GMT)
When is an Embedding Model More Promising than Another? [33.5] 埋め込みは機械学習において中心的な役割を担い、あらゆるオブジェクトを数値表現に投影し、様々な下流タスクを実行するために利用することができる。
埋め込みモデルの評価は一般にドメイン固有の経験的アプローチに依存する。
本稿では, 組込み器の評価を統一的に行い, 充足性と情報性の概念を考察する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:13:46 GMT)
CoEvol: Constructing Better Responses for Instruction Finetuning through Multi-Agent Cooperation [33.3] 命令に対する応答を改善するためのLLMベースのマルチエージェント協調フレームワークであるCoEvolを提案する。
実証的には、CoEvolを搭載したモデルはMT-BenchとAlpacaEvalで評価された競争ベースラインを上回った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:35:37 GMT)
AV-DiT: Efficient Audio-Visual Diffusion Transformer for Joint Audio and Video Generation [33.3] AV-DiTは,新規かつ効率的な音声・視覚拡散変換器である。
画像のみのデータに基づいて事前訓練された共有DiTバックボーンは、オーディオおよびビデオの生成を容易にする。
AIST++とLandscapeデータセットの実験は、AV-DiTが関節型オーディオ視覚生成において最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:05:58 GMT)
BertaQA: How Much Do Language Models Know About Local Culture? [33.3] 本稿では,英語とバスク語に平行なトリビアデータセットであるBertaQAを紹介する。
データセットは、バスク文化に関連する質問のあるローカルサブセットと、より広い関心を持つ質問を持つグローバルサブセットで構成されている。
バスク語での事前学習は、英語で質問しても、バスク語文化におけるモデルのパフォーマンスを大幅に向上させることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:30:34 GMT)
Instruct Large Language Models to Drive like Humans [33.2] 本研究では,大規模言語モデルを運動プランナに変換するインストラクトドライブ手法を提案する。
人間の論理に基づく運転指導データを導出する。
次に、最終計画をさらに推論するために解釈可能なInstructChainモジュールを使用します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:24:45 GMT)
diff History for Neural Language Agents [33.1] これらの問題に対するシンプルで効果的なソリューションである差分履歴を導入します。
The Unix diff command on continuous text observed in the interaction histories used to prompt LM policy, we can be abstract away redundant information。
意思決定のために長い水平推論を必要とする未解決のビデオゲームであるNetHackでは、diff履歴を調整したLMがニューラルエージェントの最先端のパフォーマンスにマッチする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:57:15 GMT)
TextGrad: Automatic "Differentiation" via Text [32.9] TextGradはテキストフィードバックをバックプロパゲートして、複合AIシステムの個々のコンポーネントを改善する。
さまざまなタスクに対してアウト・オブ・ボックスで動作し、ユーザはフレームワークのコンポーネントやプロンプトをチューニングすることなく、客観的な機能のみを提供する。
質問応答や分子最適化から放射線治療計画まで,様々な応用において,TextGradの有効性と汎用性を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:32:21 GMT)
A Survey of Large Language Models for Healthcare: from Data, Technology, and Applications to Accountability and Ethics [32.1] 医療分野における大規模言語モデル(LLM)の利用は、興奮と懸念の両方を引き起こしている。
本調査では、現在開発中のLLMs for Healthcareの能力について概説し、開発プロセスについて解説する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:13:59 GMT)
C3DAG: Controlled 3D Animal Generation using 3D pose guidance [32.1] C3DAGは3D生成フレームワークである。
与えられたポーズと整合した高品質な3D動物を生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:57:47 GMT)
Truth-Aware Context Selection: Mitigating Hallucinations of Large Language Models Being Misled by Untruthful Contexts [31.8] 大規模言語モデル(LLM)は、ユーザや知識強化ツールが提供する非現実的なコンテキストによって容易に誤解される。
本稿では,入力から非現実的コンテキストを適応的に認識し,マスクするために,TACS(Trath-Aware Context Selection)を提案する。
TACSは,非現実的な文脈を効果的にフィルタリングし,誤解を招く情報を提示した場合のLLMの応答の全体的な品質を著しく向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:53:10 GMT)
RWKV-CLIP: A Robust Vision-Language Representation Learner [31.5] コントラスト言語-画像事前学習(CLIP)は、様々な視覚言語タスクのパフォーマンスを大幅に改善した。
本稿では,Large Language Models(LLM)を利用して,Webベースのテキスト,合成キャプション,検出タグからコンテンツを合成・洗練する多種多様な記述生成フレームワークを提案する。
RWKV-CLIPは,変換器の効果的な並列学習とRNNの効率的な推論を組み合わせた,最初のRWKV駆動型視覚言語表現学習モデルである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:10:46 GMT)
Hate Speech Detection with Generalizable Target-aware Fairness [31.0] Generalizable target-aware Fairness (GetFair) は、推論中に多様で見えないターゲットを含む、各ポストを適切に分類する新しい方法である。
GetFairは、識別器を欺くために、対向パイプラインで一連のフィルタ関数を訓練する。
2つのHSDデータセットの実験では、サンプル外ターゲット上でのGetFairの利点が示されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:18:14 GMT)
GraphCoder: Enhancing Repository-Level Code Completion via Code Context Graph-based Retrieval and Language Model [30.6] GraphCoderは検索拡張コード補完フレームワークである。
一般的なコード知識と、グラフベースの検索生成プロセスを通じてリポジトリ固有の知識を使用する。
コードマッチでは+6.06、識別子マッチでは+6.23となり、時間と空間は少ない。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:55:32 GMT)
Situational Awareness Matters in 3D Vision Language Reasoning [30.1] SIG3Dは3次元視覚言語推論のためのエンド・ツー・エンドのコンディション・グラウンドド・モデルである。
我々は,3Dシーンをスパースボクセル表現にトークン化し,言語に基づく状況推定手法を提案する。
SQA3DとScanQAデータセットの実験により、SIG3Dは状況推定や質問応答において最先端のモデルよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:45 GMT)
Image Textualization: An Automatic Framework for Creating Accurate and Detailed Image Descriptions [30.1] 我々は、画像テクスチャライゼーション(IT)と呼ばれる革新的なフレームワークを提案する。
ITは、既存のマルチモーダル大言語モデル(MLLM)と複数のビジョンエキスパートモデルを活用することで、高品質な画像記述を自動的に生成する。
LLaVA-7Bは、IT処理による記述のトレーニングの恩恵を受け、よりリッチな画像記述を生成する能力の向上を図っている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:37:45 GMT)
Fundamental Limits of Membership Inference Attacks on Machine Learning Models [29.4] メンバーシップ推論攻撃(MIA)は、特定のデータポイントがトレーニングデータセットの一部であったかどうかを明らかにすることができる。
本稿では、機械学習モデルにおけるMIAに関する基本的な統計的制限を探索することによって理論的保証を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:51:48 GMT)
TernaryLLM: Ternarized Large Language Model [29.3] 大規模言語モデル(LLM)は自然言語処理(NLP)タスクにおいて顕著なパフォーマンスを達成した。
本稿では、Dual Learnable Ternarization (DLT)を導入し、スケールとシフトの両方を学習可能にする。
また、極低ビット量子化で失われた情報を復元するために、OFF(Outlier-Friendly Feature Knowledge Distillation)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:40:12 GMT)
G-Transformer: Counterfactual Outcome Prediction under Dynamic and Time-varying Treatment Regimes [29.3] 本稿では,G-Transformerを提案する。G-Transformerは動的かつ時間的に異なる処理戦略の下で,対実予測のためのg-computationをサポートするフレームワークである。
メカニスティックモデルによる2つのシミュレーション時系列データセットとMIMIC-IVによる実世界のセシスICUデータセットを用いて,G-Transformerを広範囲に評価した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:37:35 GMT)
Iterative Refinement of Project-Level Code Context for Precise Code Generation with Compiler Feedback [29.1] 我々は,コンパイラフィードバックを用いてLLM生成コードを改善する新しいコード生成手法であるCoCoGenを提案する。
CoCoGenは、まず静的解析を利用して、生成されたコードとプロジェクトのコンテキストのミスマッチを特定する。
その後、コードリポジトリから抽出された情報を使用して、識別されたエラーを反復的に調整し、修正する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:38:20 GMT)
Controlling Emotion in Text-to-Speech with Natural Language Prompts [29.0] 本稿では,感情に富んだテキストの繰り返しから派生した埋め込みを前提としたシステムを提案する。
話者とプロンプト埋め込みの合同表現は、トランスフォーマーベースアーキテクチャ内のいくつかの点で統合される。
本手法は感情音声とテキストデータセットを融合して学習し,モデルの一般化能力を高めるため,各訓練におけるプロンプトを変化させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:54:35 GMT)
Spectral Estimators for Structured Generalized Linear Models via Approximate Message Passing [28.9] 本研究では,高次元一般化線形モデルにおけるパラメータ推定の問題について考察する。
広く使われているにもかかわらず、厳密なパフォーマンス特性とデータ前処理の原則が、構造化されていない設計でのみ利用可能である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:56:46 GMT)
Generative Lifting of Multiview to 3D from Unknown Pose: Wrapping NeRF inside Diffusion [28.9] 生成モデル問題として未知のポーズから多視点再構成を行った。
シーンの無注釈2次元画像の集合から,2次元画像入力からカメラポーズを予測するネットワークと,3次元シーンに対するニューラルレージアンス場(NeRF)のパラメータの両方を同時に学習する。
我々のフレームワークは,入力された2D画像をそのポーズを予測し,そのポーズからNeRFをレンダリングすることで,そのタスクを達成する必要がある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:09:41 GMT)
Bridging Language Gaps in Audio-Text Retrieval [28.8] 本稿では,多言語テキストエンコーダ(SONAR)を用いた言語拡張 (LE) を提案し,テキストデータを言語固有の情報で符号化する。
我々は,一貫したアンサンブル蒸留(CED)の適用により,オーディオエンコーダを最適化し,可変長音声テキスト検索のサポートを強化した。
提案手法は,AudioCaps や Clotho などの一般的なデータセット上でのSOTA (State-of-the-art) の性能を示す,英語の音声テキスト検索に優れている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:12:12 GMT)
RACon: Retrieval-Augmented Simulated Character Locomotion Control [28.8] RACon: Retrieval-Augmented Simulated Character Locomotion Controlを紹介する。
エンドツーエンドの階層的強化学習法は,レトリバーとモーションコントローラを利用する。
本手法は,実証実験で実証したように,移動制御における品質と量の両方において既存の手法を超越した手法である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:21:28 GMT)
PLUM: Preference Learning Plus Test Cases Yields Better Code Language Models [28.8] PLUMは、コードLMにおける好み学習の重要な成功要因と潜在的利益について調査することを目的としている。
PLUMは、既存のコード生成ベンチマークにおける既存のコードLMのパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:07:18 GMT)
Ask Again, Then Fail: Large Language Models' Vacillations in Judgment [28.7] 我々は、現在の会話言語モデルが、フォローアップされた質問に直面すると、判断を揺るがすことが多いことを観察する。
我々は、この矛盾を定量化するための2つの指標とともに、textscFollow-up Questioning Mechanismを紹介した。
トレーニングベースのフレームワーク TextscUnwavering-FQ を開発した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:22:07 GMT)
Calibration of Time-Series Forecasting: Detecting and Adapting Context-Driven Distribution Shift [28.7] 本稿では,コンテキスト駆動分布シフトの検出と適応のための普遍的キャリブレーション手法を提案する。
レジデンシャルベースCDS検出器(Residual-based CDS detector)またはリコンディショナー(Reconditionor)と呼ばれる新しいCDS検出器は、モデルの脆弱性をCDSに定量化する。
高いリコンディショナースコアは、重度の感受性を示し、したがってモデル適応を必要とする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:07:17 GMT)
Faster Spectral Density Estimation and Sparsification in the Nuclear Norm [28.4] 我々は,新しいグラフスペーシフィケーションの概念を導入し,これを核スペーシフィケーションと呼ぶ。
また,本手法はスペクトル密度推定のための最初の決定論的アルゴリズムを導出することを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:50:20 GMT)
Paying More Attention to Source Context: Mitigating Unfaithful Translations from Large Language Model [28.3] 大規模言語モデル(LLM)は、印象的な多言語機械翻訳能力を示した。
エンコーダ-デコーダスタイルのモデルとは異なり、デコーダのみのLLMはソースとターゲットのコンテキストの間に明確なアライメントを欠いている。
我々はLLMに対して、ソースとターゲットの両方の観点から、ソースコンテキストにもっと注意を払うよう推奨する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:49:04 GMT)
Effectively Compress KV Heads for LLM [28.1] キーバリュー(KV)キャッシュを圧縮する新しい手法を提案する。
提案手法は,従来のLLMに匹敵する性能を維持しつつ,KVヘッドの4分の1以上を圧縮することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:37:33 GMT)
MeMSVD: Long-Range Temporal Structure Capturing Using Incremental SVD [27.5] 本論文は、長時間の時間窓上での人間の行動を認識すること(最大数分)を目標とする長期映像理解について述べる。
本稿では,Singular Value Decomposition を用いて取得したメモリの低ランク近似に基づくアテンションベースのスキームの代替を提案する。
提案手法には2つの利点がある: (a) 複雑度を1桁以上削減し, (b) メモリベース計算の効率的な実装が可能である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:03:57 GMT)
Textual Similarity as a Key Metric in Machine Translation Quality Estimation [27.2] 機械翻訳(MT)品質評価(QE)は、参照テキストなしで翻訳信頼性を評価する。
本研究では、文変換器とコサイン類似度を用いて意味的近接度を測定することにより、QEの新しい指標として「テキスト類似性」を導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:48:17 GMT)
OphNet: A Large-Scale Video Benchmark for Ophthalmic Surgical Workflow Understanding [27.0] 我々は,眼科手術ワークフロー理解のための大規模,専門家によるビデオベンチマークであるOphNetを紹介した。
66種類の白内障、緑内障、角膜手術にまたがる2,278本の手術ビデオの多彩なコレクションがあり、102回の手術フェーズと150回の手術の詳細な注記がある。
OphNetは、時間的ローカライズされたアノテーションを提供し、外科的シナリオ内の時間的ローカライゼーションと予測タスクを容易にする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:18:11 GMT)
Operator Splitting for Learning to Predict Equilibria in Convex Games [26.9] 平衡を自然に出力するニューラルネットワークのクラスであるNash Fixed Point Networks (N-FPNs)を紹介する。
N-FPNは暗黙のネットワークをトレーニングするための最近開発されたヤコビアンフリーバックプロパゲーション技術と互換性がある。
実験の結果,N-FPNは既存の学習ゲーム解法よりも桁違いに大きい問題にスケール可能であることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:32:53 GMT)
Closing the Computational-Query Depth Gap in Parallel Stochastic Convex Optimization [26.4] 我々は,リプシッツ,凸関数を次数次オラクルで最小化するための新しい並列アルゴリズムを開発した。
その結果,最もよく知られた問合せ深度と並列アルゴリズムの最もよく知られた計算深度とのギャップを埋めることができた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:41:48 GMT)
Open-World Human-Object Interaction Detection via Multi-modal Prompts [26.4] MP-HOIは多モードのPromptベースの強力なHOI検出器であり、オープンセットの一般化のためのテキスト記述と、説明の曖昧さを扱う視覚的見本の両方を活用するように設計されている。
MP-HOIは一般のHOI検出器として機能し、既存の専門家モデルのHOI語彙を30倍以上上回った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:01:45 GMT)
A Comprehensive Survey on Deep Learning Techniques in Educational Data Mining [26.3] 教育データマイニング(EDM: Educational Data Mining)は、計算技術の力を利用して教育データを分析する研究分野として発展してきた。
ディープラーニング技術は、データの分析とモデリングに関わる課題に対処する上で、大きな利点を示してきた。
この調査は、Deep LearningによるEDMの最先端を体系的にレビューすることを目的としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:38:57 GMT)
AIGB: Generative Auto-bidding via Diffusion Modeling [26.3] 本稿では,AIGB(AI-Generated Bidding)について紹介する。
このパラダイムでは、入札生成のための条件付き拡散モデルであるDiffBidを提案する。
Alibabaの広告プラットフォーム上で、実世界のデータセットとオンラインA/Bテストで実施された実験は、DiffBidの有効性を実証している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:33:23 GMT)
Beyond the Norms: Detecting Prediction Errors in Regression Models [26.2] 本稿では,回帰アルゴリズムにおける信頼できない振る舞いを検出するという課題に取り組む。
回帰器の出力が特定の不一致(または誤り)を超えた場合、回帰における不確実性の概念を導入する。
複数の回帰タスクに対する誤り検出の実証的改善を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:51:44 GMT)
Unleashing the Denoising Capability of Diffusion Prior for Solving Inverse Problems [26.1] ProjDiffアルゴリズムは、最適化フレームワーク内で事前学習された拡散モデルの事前情報と復調能力を利用する。
画像復元タスクとソース分離および部分生成タスクの実験により、ProjDiffは様々な線形および非線形逆問題に対して優れた性能を示すことが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:35:18 GMT)
Transforming Wearable Data into Health Insights using Large Language Model Agents [25.9] 本稿では,ウェアラブルの行動保健データを分析・解釈するエージェントシステムであるPersonal Health Insights Agent(PHIA)を紹介する。
650時間の人間と専門家による評価に基づいて、PHIAは事実の数値的な質問の84%以上と、クラウドソーシングされたオープンエンドな質問の83%以上に正確に対処することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:17:43 GMT)
A DeNoising FPN With Transformer R-CNN for Tiny Object Detection [25.9] そこで本稿では,Trans R-CNN (DNTR) を用いたFPNのデノベーション手法を提案する。
DNTRは、簡単なプラグイン設計、DeNoising FPN (DN-FPN)、効果的なTransformerベースの検出器であるTrans R-CNNで構成されている。
我々は、古いR-CNN検出器を新しいTrans R-CNN検出器に置き換え、自己注意を持つ小さな物体の表現に集中する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:50:33 GMT)
OntoType: Ontology-Guided and Pre-Trained Language Model Assisted Fine-Grained Entity Typing [25.5] きめ細かいエンティティタイピング(FET)は、コンテキストに敏感できめ細かいセマンティックタイプでエンティティをテキストに割り当てる。
OntoTypeは、粗いものから細いものまで、型オントロジ構造に従い、複数のPLMをアンサンブルすることで、型候補のセットを生成する。
Ontonotes、FIGER、NYTデータセットに関する我々の実験は、我々の手法が最先端のゼロショットの微細なエンティティタイピング方法よりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:16:19 GMT)
Online Structured Prediction with Fenchel--Young Losses and Improved Surrogate Regret for Online Multiclass Classification with Logistic Loss [25.5] フルインフォメーションフィードバックを用いたオンライン構造化予測について検討する。
我々はエクスプロイト・ザ・サロゲート・ギャップ・フレームワークをemphFenchelによるオンライン構造化予測に拡張する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:46:51 GMT)
OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline [25.5] 我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。
OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれている。
我々は, 立体マッチングにおける最近の展開の総合的分析とデコンストラクションを, 包括的アブレーション実験を通じて実施する。
私たちのStereoBaseは、SceneFlow、KITTI 2015、2012(Reflective)で第1位であり、すべてのメトリクスで最高のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:41:28 GMT)
LM4LV: A Frozen Large Language Model for Low-level Vision Tasks [25.4] $textbfLM4LV$は、大規模な言語モデルで、マルチモーダルデータや事前データなしで、さまざまな低レベルの視覚タスクを解決できるフレームワークである。
これは低レベルのビジョンにおけるLLMの強い可能性を示し、MLLMと低レベルのビジョンタスクの間のギャップを埋める。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:42:29 GMT)
GLIMPSE: Pragmatically Informative Multi-Document Summarization for Scholarly Reviews [25.3] 本稿では,学術レビューの簡潔かつ包括的概要を提供するための要約手法であるsysを紹介する。
従来のコンセンサスに基づく手法とは異なり、sysは共通の意見とユニークな意見の両方をレビューから抽出する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:27:01 GMT)
Never Miss A Beat: An Efficient Recipe for Context Window Extension of Large Language Models with Consistent "Middle" Enhancement [25.2] 位置インデクスを操作することで位置エンコーディングを補間する、$textbfC$ontinuity-$textbfR$elativity ind$textbfE$xing with g$textbfA$ussian $textbfM$iddle (CREAM)を提案する。
実験の結果、CREAM は Base 版と Chat 版の $textttLlama2-7B$ with Never Miss A Beat' で LLM をターゲット長まで拡張することができた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:35:49 GMT)
CDSA: Conservative Denoising Score-based Algorithm for Offline Reinforcement Learning [25.1] オフラインの強化学習において、分散シフトは大きな障害である。
以前の保守的なオフラインRLアルゴリズムは、目に見えないアクションに一般化するのに苦労した。
本稿では、事前学習したオフラインRLアルゴリズムから生成されたデータセット密度の勾配場を用いて、元の動作を調整することを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:29 GMT)
Finding and Editing Multi-Modal Neurons in Pre-Trained Transformers [24.9] そこで本研究では,重要なニューロンを識別する新しい手法を提案する。
本手法は,コストのかかる勾配計算の必要性を取り除き,効率と適用範囲の従来の作業を改善する。
同定されたニューロンに基づいて, センシティブな単語や幻覚を軽減できる多モーダルな知識編集手法を設計する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:30:02 GMT)
Reasoning in Token Economies: Budget-Aware Evaluation of LLM Reasoning Strategies [24.9] 本稿では,計算予算を評価に組み込む枠組みを提案する。
複雑な推論戦略は、アルゴリズムの創発性のため、純粋に単純なベースラインを超えないことが多い。
自己整合性とは異なり、マルチエージェントの議論やリフレクションのような特定の戦略は、より多くの計算予算が利用されれば悪化する可能性がある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:12:17 GMT)
PcLast: Discovering Plannable Continuous Latent States [24.8] 我々は、効率的な計画と目標条件付き政策学習のために、到達可能な状態を関連付ける表現を学習する。
提案手法は各種シミュレーションテストベッドで厳密に検証されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:32:58 GMT)
Mitigating Boundary Ambiguity and Inherent Bias for Text Classification in the Era of Large Language Models [24.1] 本研究では,大規模言語モデル (LLM) がテキスト分類における選択肢の数や配置の変化に対して脆弱であることを示す。
重要なボトルネックは、曖昧な決定境界と、特定のトークンや位置に対する固有のバイアスから生じます。
我々のアプローチは、ペア比較が境界のあいまいさと固有のバイアスを効果的に緩和できるという経験的観察に基づいている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:53:19 GMT)
Cinematic Gaussians: Real-Time HDR Radiance Fields with Depth of Field [23.9] 放射場法は、多視点写真から複雑なシーンを再構成する際の技法の状態を表現している。
ピンホールカメラモデルへの依存は、すべてのシーン要素が入力画像に集中していると仮定し、実用的な課題を提示し、新規な視点合成において再焦点を複雑にする。
様々な露光時間,開口の放射率,焦点距離を多視点LDR画像を用いて高ダイナミックレンジシーンを再構成する3Dガウススメッティングに基づく軽量解析手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:00:24 GMT)
An Optimism-based Approach to Online Evaluation of Generative Models [23.9] 利用可能なモデル群間の標準評価スコアを最大化する生成モデルを見つけるためのオンライン評価フレームワークを提案する。
具体的には、Fr'echet Inception Distance(FID)とInception Score(IS)のメトリクスに基づいて、生成モデルのオンライン評価を行う。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:57:48 GMT)
MINERS: Multilingual Language Models as Semantic Retrievers [23.7] 本稿では,意味検索タスクにおける多言語言語モデルの有効性を評価するためのベンチマークであるMINERSを紹介する。
我々は,200以上の多言語にわたるサンプルの検索において,LMの堅牢性を評価する包括的なフレームワークを構築した。
以上の結果から,意味論的に類似した埋め込みを検索することで,最先端のアプローチと競合する性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:26:18 GMT)
Open-LLM-Leaderboard: From Multi-choice to Open-style Questions for LLMs Evaluation, Benchmark, and Arena [23.3] 大規模言語モデル(LLM)を評価するために、MCQ(Multiple-choice Question)が頻繁に使用される。
LLMは、A/B/C/Dのような特定の解選択IDを本質的に好んでいるかもしれない。
本研究は,これらの課題に対処し,完全にオープンな質問を通じて新たなLCM評価ベンチマークを確立することを目的としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:47 GMT)
mHuBERT-147: A Compact Multilingual HuBERT Model [23.2] mHuBERT-147は90K時間のクリーンでオープンなデータに基づいて訓練された最初の汎用多言語HuBERT音声表現モデルである。
マルチイテレーションの HuBERT アプローチをスケールアップするために,ファイスベースのクラスタリングを用い,元の手法よりも5.2倍高速なラベル割り当てを実現した。
以上の結果から,mHuBERT147は多言語音声タスクの有望なモデルであり,高い性能とパラメータ効率のバランスを保っていることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:19:42 GMT)
Translating speech with just images [23.1] 既存の画像キャプションシステムを介して、画像とテキストをリンクすることで、この接続を拡張します。
このアプローチは、生成されたキャプションと異なる言語で音声を付加することにより、画像のみを用いた音声翻訳に使用できる。
実際の低リソース言語であるYorub'aについて検討し、Yorub'a-to- English 音声翻訳モデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:29:24 GMT)
Oceanship: A Large-Scale Dataset for Underwater Audio Target Recognition [22.9] 大規模かつ多様な水中オーディオデータセットであるOceanshipを提案する。
このデータセットは15のカテゴリで構成され、総期間は121時間であり、座標、速度、船舶タイプ、タイムスタンプといった包括的なアノテーション情報を含んでいる。
水中オーディオ検索のためのベースラインモデルであるOceannetを導入する。このモデルでは、67.11%の精度で1(R@1)、Deepshipデータセットで5(R@5)の精度で99.13%のリコールを実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:33:56 GMT)
SignMusketeers: An Efficient Multi-Stream Approach for Sign Language Translation at Scale [22.5] 手話ビデオ処理における永続的な課題は、手話表現の学習方法である。
提案手法は,シグナーの顔,手,体姿勢など,署名ビデオの最も関連性の高い部分のみに焦点を当てる。
我々のアプローチは、個々のフレームから(ビデオシーケンスではなく)学習することに基づいており、手話事前学習よりもずっと効率的である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:00:41 GMT)
CondTSF: One-line Plugin of Dataset Condensation for Time Series Forecasting [22.5] データセット凝縮の目的は、合成データセットでトレーニングされたモデルが、完全なデータセットでトレーニングされたモデルと互換性を持って動作できることを保証することである。
分類において、合成データは、全データセットで訓練されたモデルと合成データセットで訓練されたモデルが同じ入力に対して同一のラベルを生成する場合、よく蒸留されると考えられる。
TS予測において, 合成データ蒸留の有効性は, モデル間の距離によって決定される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:49:07 GMT)
Log Neural Controlled Differential Equations: The Lie Brackets Make a Difference [22.2] ニューラルCDE(英語版)(NCDE)は、時系列データを制御経路からの観測として扱う。
NCDEを学習するための新しい,効果的かつ効率的な手法であるLog-NCDEを紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:35:52 GMT)
UICoder: Finetuning Large Language Models to Generate User Interface Code through Automated Feedback [21.9] 大規模言語モデル(LLM)は、視覚的に関連する設計をコンパイルし、生成するUIコードを生成するのに苦労する。
生成を改善するための既存のアプローチは、高価な人間のフィードバックやプロプライエタリなモデルを蒸留することに依存している。
提案手法は,既存のLLMから始まり,大規模合成データセットを自己生成することにより,改良されたモデルを反復的に生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:53:46 GMT)
SSNVC: Single Stream Neural Video Compression with Implicit Temporal Information [21.5] SSNVCは、複数のベンチマークで最先端のパフォーマンスを達成でき、圧縮プロセスとトレーニングプロセスを大幅に単純化することができる。
実験により、SSNVCは複数のベンチマークで最先端のパフォーマンスを達成でき、圧縮プロセスとトレーニングプロセスを大幅に単純化できることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:20:39 GMT)
CodeR: Issue Resolving with Multi-Agent and Task Graphs [21.5] GitHubの問題解決は、アカデミックや業界から大きな注目を集めている。
報告されたバグの修復と解決のために,マルチエージェントフレームワークとタスクグラフを事前に定義したCodeRを提案する。
SWE-bench liteでは、CodeRは各問題に1回だけ提出した場合に28.33%の問題を解決することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:52:03 GMT)
Finite-Time Analysis for Conflict-Avoidant Multi-Task Reinforcement Learning [21.3] 本稿では,CA と FC という2つのサブプロデューサの選択肢に基づいて,新しい動的重み付けマルチタスク・アクター・クリティック・アルゴリズム (MTAC) を開発した。
MTAC-CAは、タスク間の最小値改善を最大化する競合回避(CA)更新方向と、MTAC-FCターゲットをはるかに高速な収束速度で見つけることを目的としている。
MT10における実験により,既存のMTRL法よりもアルゴリズムの性能が向上したことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:38:20 GMT)
Can Transformers Learn Optimal Filtering for Unknown Systems? [21.2] 過去の全ての出力予測を生成する変換器を用いた最適出力推定問題について検討する。
我々は、様々な異なるシステムを用いてトランスフォーマーを訓練し、未知のダイナミクスを持つ未知のシステムの性能を評価する。
非d.d.ノイズ、時間変化力学、未知のパラメータを持つ四元数系のような非線形力学のより複雑な設定では、トランスフォーマーも有望な結果を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:18:55 GMT)
Frame Interpolation with Consecutive Brownian Bridge Diffusion [21.2] ビデオフレーム補間(VFI)は、拡散に基づく条件付き画像生成問題としてVFIを定式化しようとする。
本稿では,Branian Bridge Diffusionを用いたフレーム補間法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:55:20 GMT)
CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only [21.1] 高度な推論能力を持つ大規模言語モデル(LLM)は、エージェントがより複雑で以前は目に見えないタスクをこなすためのステージを定めている。
環境認識のためのスクリーンショットのみに基づいて機能するエージェントを提案する。
67種類のMiniWoB++問題に対して94.4%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:21:20 GMT)
Automotive Object Detection via Learning Sparse Events by Spiking Neurons [20.9] スパイキングニューラルネットワーク(SNN)は、本質的にイベントベースのデータと整合した時間的表現を提供する。
自動車のイベントベース物体検出に最適化された特化スパイキング特徴ピラミッドネットワーク(SpikeFPN)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:57:25 GMT)
Active Scout: Multi-Target Tracking Using Neural Radiance Fields in Dense Urban Environments [20.8] 我々は、RGBと異なるバンテージポイントからの深度画像を使って、市内の神経放射野をオンラインで表現できることを示します。
この表現は、都市の未知の部分を探索し、ターゲットを追跡するための情報ゲインを計算するために使用される。
我々は、フィラデルフィアとニューヨーク市のオープンストリートマップデータを使ってカスタム構築されたシミュレーターを用いて、300ステップ以内に20の静止目標を探索、発見できることを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:34:16 GMT)
Fine-tuning with HED-IT: The impact of human post-editing for dialogical language models [20.7] 微調整ダイアログモデルにおける人間の介入が機械生成データに与える影響について検討する。
その結果、トレーニングデータの異なる品質が明確に認識され、そのようなデータでトレーニングされたモデルにも影響を及ぼすことが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:16:14 GMT)
Crayon: Customized On-Device LLM via Instant Adapter Blending and Edge-Server Hybrid Inference [20.7] オンデバイス LLM カスタマイズのための新しいアプローチである Crayon を提案する。
我々は,より要求の多いクエリや非カスタマイズタスクをサーバ上のより大きな,より有能なLDMに確実に割り当てるデバイスサーバハイブリッド推論戦略を開発する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:00:08 GMT)
Beware of Aliases -- Signal Preservation is Crucial for Robust Image Restoration [20.6] 現状の復元変圧器におけるエイリアスフリーパスを簡易に提供することで、復元性能の低コストでモデルロバスト性を向上させることができることを示す。
本稿では,変換器をベースとした画像復元モデルBOA-Restormerを提案する。このモデルでは,周波数領域の一部でダウンサンプリングとアップサンプリングを行い,モデル全体のエイリアスフリーパスを確保するとともに,関連するすべての高周波情報を保存することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:42:17 GMT)
Muffliato: Peer-to-Peer Privacy Amplification for Decentralized Optimization and Averaging [20.4] ローカルディファレンシャルプライバシ(LDP)の緩和であるペアワイズネットワークディファレンシャルプライバシを導入する。
我々は、局所勾配降下ステップとゴシップ平均化を交互に交互に行う、微分プライベートな分散最適化アルゴリズムを導出する。
我々のアルゴリズムは,グラフ内のノード間距離の関数として,プライバシー保証を増幅することを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:30:48 GMT)
Deep Implicit Optimization for Robust and Flexible Image Registration [20.3] ディープネットワークの層として最適化を取り入れることで,古典的手法と学習的手法のギャップを埋める。
繰り返し最適化によるエンド・ツー・エンドの識別を暗黙的に行うことで、学習した特徴は登録とラベル認識である。
我々のフレームワークは、ドメイン内のデータセットで優れたパフォーマンスを示し、ドメインシフトに依存しない。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:28:48 GMT)
Turbo Sparse: Achieving LLM SOTA Performance with Minimal Activated Parameters [20.1] 活性化間隔は活性化関数によって決定されるが、一般的に使用されるSwiGLUやGeGLUのような活性化間隔は限られている。
高品質なトレーニングデータ混合比とともに, LLMの活性化間隔を改善するために設計された新しいdReLU関数を提案する。
携帯電話では、TurboSparse-Mixtral-47Bが毎秒11トークンの推論速度を実現しています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:15:47 GMT)
LOGO: Video Text Spotting with Language Collaboration and Glyph Perception Model [20.0] ビデオテキストスポッティング(VTS)は、ビデオ内のテキストインスタンスを同時にローカライズ、認識、追跡することを目的としている。
最近の方法では、最先端の画像テキストスポッターのゼロショット結果を直接追跡する。
特定のデータセット上の微調整トランスフォーマーベースのテキストスポッターにより、パフォーマンスが向上する可能性がある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:10:53 GMT)
Erasing Radio Frequency Fingerprinting via Active Adversarial Perturbation [19.9] 本稿では、パイロット信号データから機械学習モデルを訓練して識別する、一般的なRFフィンガープリントシナリオについて考察する。
新たな対向攻撃ソリューションは適切な摂動を生成するように設計されており、パイロット信号はハードウェアの特徴を隠蔽し、モデルを誤分類することができる。
大規模な実験結果から,RF指紋を効果的に消去し,ユーザのプライバシーを保護できることが示されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:16:05 GMT)
Diffusion Models for Accurate Channel Distribution Generation [19.8] 強力な生成モデルはチャネル分布を正確に学習することができる。
これにより、チャネルの物理的測定の繰り返しコストを削減できる。
結果として得られる差別化チャネルモデルは、勾配ベースの最適化を可能にすることにより、ニューラルエンコーダのトレーニングをサポートする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:01:00 GMT)
Black-Box $k$-to-$1$-PCA Reductions: Theory and Applications [19.7] ブラックボックスデフレ法を$k$-PCAアルゴリズムを設計するためのフレームワークとして分析する。
我々の主な貢献は、$k$-PCAのデフレ法における近似パラメータの劣化に対する、よりシャープな境界である。
我々は,最先端の$k$-PCAアルゴリズムをデータセット汚染に頑健にするために,我々のフレームワークを適用した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:43:50 GMT)
Evolving Subnetwork Training for Large Language Models [19.5] 我々は、新しいトレーニングパラダイム、Evolving Subnetwork Training (EST)を提案する。
ESTサンプルは、大きな言語モデルのレイヤから、そして各レイヤで一般的に使用されるモジュールから作成される。
GPT2モデルのトレーニングとTinyLlamaモデルのトレーニングにESTを適用した結果,GPT2の26.7%のFLOPとTinyLlamaの25.0%の削減を実現した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:44:56 GMT)
How do Large Language Models Learn In-Context? Query and Key Matrices of In-Context Heads are Two Towers for Metric Learning [19.5] 文分類作業における文脈内学習(ICL)のメカニズムについて,意味的無関係なラベルを用いた検討を行った。
ICLの精度は87.6%から24.4%に大きく影響している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:58:51 GMT)
Mastering Zero-Shot Interactions in Cooperative and Competitive Simultaneous Games [19.5] アルバトロスはバトルスネークの競争ゲームで弱いエージェントを利用することができる。
これは、協調オーバークッキングベンチマークの以前の技術状況と比較して37.6%改善している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:26:30 GMT)
AViT: Adapting Vision Transformers for Small Skin Lesion Segmentation Datasets [19.4] AViTは、トレーニング済みのViTをSLSタスクに転送することで、ViTのデータハンガーを緩和する新しい戦略である。
AViTはSOTAよりも競争力があり、時には優れているが、訓練可能なパラメータは大幅に少ない。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:22:20 GMT)
Personalized LLM Response Generation with Parameterized Memory Injection [19.4] 大規模言語モデル(LLM)は、自然言語の理解と生成に優れた能力を発揮している。
パーソナライズされたLSM応答生成は、医療などの重要な分野の個人に多大な利益をもたらす可能性がある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:47:02 GMT)
Learning Domain-Invariant Features for Out-of-Context News Detection [19.3] マルチモーダル・アウト・オブ・コンテクストニュースは、オンラインメディアプラットフォームで一般的な誤報である。
本研究では,ドメイン適応型文脈外ニュース検出に焦点をあてる。
ドメイン不変の特徴を学習するために,コントラスト学習と最大平均誤差(MMD)を適用したConDA-TTAを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:34:02 GMT)
HalluDial: A Large-Scale Benchmark for Automatic Dialogue-Level Hallucination Evaluation [19.3] 大規模言語モデル(LLM)は自然言語処理(NLP)の分野で大きく進歩した。
HalluDialは、対話レベルの幻覚自動評価のための、初めての総合的な大規模ベンチマークである。
ベンチマークには4,094の対話があり、合計146,856のサンプルが含まれている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:56:18 GMT)
A Geometric Explanation of the Likelihood OOD Detection Paradox [19.2] 最小の確率質量を含む場合、高次領域は生成されないことを示す。
本稿では,事前訓練したDGMから得られた可能性とLID推定値とをペアリングするOOD検出手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:00:00 GMT)
MLCM: Multistep Consistency Distillation of Latent Diffusion Model [19.2] MLCM(Multistep Latent Consistency Models)は、低コストで高品質な画像合成のためのアプローチである。
MLCMは2~8ステップのみのサンプリングで高品質で楽しい画像を生成することができることを示す。
また、制御可能な生成、画像スタイル転送、中国画像生成を含むアプリケーションにおけるMLCMの汎用性を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:22:53 GMT)
Hybrid Reinforcement Learning from Offline Observation Alone [19.1] エージェントがオフラインデータとオンラインインタラクティブアクセスの両方にアクセス可能なハイブリッド強化学習環境について検討する。
リセットモデルを利用するアルゴリズムの性能を確実に一致させるトレースモデル設定における最初のアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:34:05 GMT)
Fun with Flags: Robust Principal Directions via Flag Manifolds [19.0] 主成分分析(PCA)はコンピュータビジョンと機械学習において不可欠である。
我々はPCAとその変種に対する統一的な形式論を示し、線形部分空間のフラグに基づくフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:01:18 GMT)
Multi-Modal Automatic Prosody Annotation with Contrastive Pretraining of SSWP [18.9] 本稿では,2段階自動アノテーションパイプラインを提案する。
第1段階では,音声文と単語句読解ペアのコントラスト事前学習を用いて,潜在表現における韻律情報を強化する。
第2段階では,事前訓練されたエンコーダ,テキスト合成方式,シーケンス分類器からなるマルチモーダルな韻律アノテータを構築した。
英語韻律境界の実験により,韻律語と韻律句に対する0.72と0.93f1のスコアで最先端のSOTA(State-of-the-art)を達成できた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:43:11 GMT)
Optimal Qubit Mapping Search for Encoding Classical Data into Matrix Product State Representation with Minimal Loss [18.4] Matrix Product State (MPS) は、古典的なデータを量子状態に符号化するためのフレームワークを提供する。
本研究では,MPS表現の効率性と精度を向上させる手法について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:19:05 GMT)
Return of EM: Entity-driven Answer Set Expansion for QA Evaluation [18.3] 本稿では,QAモデルの評価にエンティティ駆動型回答セット拡張を用いたソフトEMを提案する。
本手法は, 表面形状が実体の種類によっては特定のパターンに従うことがしばしばあるという観察に基づいて, 多様な表面形状を含むように金の解集合を拡張する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:14:02 GMT)
MambaLRP: Explaining Selective State Space Sequence Models [18.1] マンバモデルは線形時間で長い列の効率的な処理を可能にする。
これらのモデルは、言語モデリングのような広範囲のアプリケーションで急速に採用されている。
現実のシナリオにおける信頼性の高い利用を促進するためには、透明性を高めることが重要です。
我々は、より安定かつ信頼性の高い関連伝播を保証するLRPフレームワーク内での新しいアルゴリズムであるMambaLRPを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:15:47 GMT)
Out-Of-Context Prompting Boosts Fairness and Robustness in Large Language Model Predictions [17.8] 我々は,Frontier Large Language Modelsの信頼性を向上させるためのテストタイム戦略を開発する。
我々は因果性を利用して、LLMにおける信頼の2つの側面、すなわち公正性と堅牢性を公式にエンコードする。
文外処理により,フロンティアLLMの公平性と堅牢性は一貫して向上することを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:05:15 GMT)
CodeScore-R: An Automated Robustness Metric for Assessing the FunctionalCorrectness of Code Synthesis [17.7] 本稿では,コード合成機能を評価するために,CodeScore-Rと呼ばれるロバストな自動計測手法を提案する。
JavaとPythonのコード生成とマイグレーションのタスクでは、CodeScore-Rは他のメトリクスよりも優れています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:51:17 GMT)
GemNet: Menu-Based, Strategy-Proof Multi-Bidder Auctions Through Deep Learning [17.7] GemNetはアフィン法よりも収益の高いオークションを学習し、正確なSPを達成する一方、従来の一般的なマルチバイダ法はほぼSPであり、解釈可能性を大幅に向上した。
混合整数線形プログラムはメニュー変換に使われ、アダプティブグリッドやメニュー要素をスキップする方法など、多数の最適化によって、大規模なオークション設計問題にスケールする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:30:30 GMT)
UniAP: Unifying Inter- and Intra-Layer Automatic Parallelism by Mixed Integer Quadratic Programming [17.6] UniAPは、並列戦略の2つのカテゴリを共同で最適化し、最適解を見つけるための最初の並列手法である。
実験の結果、UniAPは最先端の手法よりもスループットが最大3.80$times$で、ストラテジー最適化の時間を最大107$times$で5つのTransformerベースのモデルで削減できることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:52:48 GMT)
A Framework for Efficient Model Evaluation through Stratification, Sampling, and Estimation [17.4] 本稿では,階層化,サンプリング,推定を含むモデル評価のためのフレームワークを提案する。
モデル性能の正確な予測に基づいて,k平均クラスタリングによる成層化を行うことで,効率的に推定できることを示す。
また、データセットのラベル付けされていない部分におけるモデル精度の予測を利用するモデル支援推定器は、一般的に従来の推定値よりも効率的であることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:49:04 GMT)
Two-Stage Adaptive Network for Semi-Supervised Cross-Domain Crater Detection under Varying Scenario Distributions [17.3] クロスクレーター検出のための2段階適応ネットワーク(TAN)を提案する。
我々のネットワークはYOLOv5検出器上に構築されており、そこではクロスドメインの一般化能力を高めるために一連の戦略が採用されている。
ベンチマークデータセットによる実験結果から,提案するネットワークは,様々なシナリオ分布下でのクレーター検出の領域適応性を向上できることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:13:38 GMT)
Enabling Large-Scale and High-Precision Fluid Simulations on Near-Term Quantum Computers [17.3] 量子計算流体力学(QCFD)は古典計算流体力学(CFD)に代わる有望な代替手段を提供する
本稿では,超伝導量子コンピュータ上に実装された包括的QCFD法を提案する。
Poiseuilleフローシミュレーションは0.2%以下の相対誤差を達成し、非定常音響波シミュレーションは5043次元行列を解いた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:54:57 GMT)
3D-Properties: Identifying Challenges in DPO and Charting a Path Forward [17.3] 実験効果を総合的に検討し,RLHF-PPOとの比較を行った。
DPOの学習結果のtextbf3D-properties を同定する。
我々はtextbf3D-properties による問題を緩和するための簡単な正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:59:24 GMT)
CT Reconstruction using Diffusion Posterior Sampling conditioned on a Nonlinear Measurement Model [17.3] 拡散後方サンプリングは, 高品質なCT画像の高画質化に用いられている。
現在の手法は、画像の再構成や復元にX線CT物理の線形モデルに依存している。
本研究では,拡散後サンプリングによる非線形CT画像再構成の逆問題を解決する手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:51:21 GMT)
BCAmirs at SemEval-2024 Task 4: Beyond Words: A Multimodal and Multilingual Exploration of Persuasion in Memes [17.1] 画像からの付加的な意味情報の影響とモダリティギャップを評価するためのキャプション生成ステップを導入する。
本モデルでは, テキストエンコーダとしてRoBERTa, 画像エンコーダとしてCLIPを微調整するために, GPT-4 生成キャプションとミームテキストを併用した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:34:19 GMT)
EmoBox: Multilingual Multi-corpus Speech Emotion Recognition Toolkit and Benchmark [17.0] 音声感情認識(SER)は人間とコンピュータの相互作用の重要な部分である。
EmoBox(エモボックス)は、マルチ言語対応のマルチコーパス音声感情認識ツールキットである。
そこで本研究では,14言語を含む32の感情データセットを対象とした10の事前学習音声モデルのコーパス内SER結果と,完全にバランスの取れたテストセットを持つ4つのデータセットに対するクロスコーパスSER結果を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:12:51 GMT)
Compact3D: Smaller and Faster Gaussian Splatting with Vector Quantization [16.8] 3D Gaussian Splatting (3DGS) は3次元放射場をモデリング・レンダリングするための新しい手法である。
本稿では,3DGSのストレージコストを40倍から50倍に削減し,レンダリング時間を2倍から3倍に削減し,レンダリング画像の品質を低下させる方法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:22:57 GMT)
LLaMA-E: Empowering E-commerce Authoring with Object-Interleaved Instruction Following [16.8] 本稿では、顧客、販売者、プラットフォームの文脈的嗜好に対処する統合eコマースオーサリングモデルであるLLaMA-Eを提案する。
広告生成,クエリ強化製品タイトル書き換え,製品分類,購入意図の推測,一般的なeコマースQ&Aといったタスクから導かれる命令セットを設計する。
提案したLLaMA-Eモデルは、最先端評価性能を達成し、ゼロショット実用的な応用において優位性を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:14:06 GMT)
Enhancing Tabular Data Optimization with a Flexible Graph-based Reinforced Exploration Strategy [16.8] 自動機能変換の現在のフレームワークは、反復的なシーケンス生成タスクに依存している。
3つのカスケーディングエージェントが繰り返しノードを選択し、新しい変換状態を生成する数学的操作を考えます。
この戦略はグラフ構造の性質を活用し、価値ある変換の保存と再利用を可能にする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:10:37 GMT)
ROADWork Dataset: Learning to Recognize, Observe, Analyze and Drive Through Work Zones [16.6] ROADWorkデータセットを提案し、ワークゾーンの認識、観察、分析、運転の仕方を学習する。
最先端のファンデーションモデルでは、作業ゾーンではパフォーマンスが悪いことが分かりました。
また,ワークゾーンナビゲーションビデオからドライビング可能な経路を計算し,ナビゲーションの目標を予測可能であることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:06:41 GMT)
Enhanced Gene Selection in Single-Cell Genomics: Pre-Filtering Synergy and Reinforced Optimization [16.5] 単一セルゲノミクスにおけるクラスタリングタスクに適用可能な反復的遺伝子パネル選択戦略を提案する。
本手法は、他の遺伝子選択アルゴリズムの結果を統合し、重要な予備的境界を提供する。
強化学習(RL)における探索プロセスの性質と,その連続最適化能力を取り入れた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:21:33 GMT)
Holistic Memory Diversification for Incremental Learning in Growing Graphs [16.5] 目標は、以前のタスクに対する推論能力を維持しながら、新しいタスクを処理するためにグラフモデルを継続的にトレーニングすることだ。
既存の方法は、通常、メモリの多様性の重要性を無視し、以前のタスクから高品質なメモリを効果的に選択することを制限する。
本稿では,グラフにおける漸進的学習のための包括的メモリ選択・生成フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:18:15 GMT)
Reinforcement Learning from Human Feedback without Reward Inference: Model-Free Algorithm and Instance-Dependent Analysis [16.3] モデルフリーなRLHFベストポリシー識別アルゴリズムである$mathsfBSAD$を、明示的な報酬モデル推論なしで開発する。
アルゴリズムは、人選好情報から直接、その最適方針を後方方向に識別する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:01:41 GMT)
CHARME: A chain-based reinforcement learning approach for the minor embedding problem [16.2] 本稿では,CHARME という名前の小さな埋め込み問題に対処するために,強化学習(RL)技術を利用した新しい手法を提案する。
CHARMEには、ポリシーモデリングのためのグラフニューラルネットワーク(GNN)アーキテクチャ、ソリューションの有効性を保証する状態遷移アルゴリズム、効果的なトレーニングのための順序探索戦略の3つの重要なコンポーネントが含まれている。
詳細では、CHARME は Minorminer や ATOM のような高速な埋め込み法に比べて優れた解が得られる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:12:10 GMT)
Data-dependent Generalization Bounds via Variable-Size Compressibility [16.2] 我々は「可変サイズ圧縮性」フレームワークのレンズによる一般化誤差に関する新しいデータ依存上界を確立する。
このフレームワークでは、アルゴリズムの一般化誤差を、その入力データの可変サイズの「圧縮率」にリンクする。
私たちが確立した新しい一般化境界は、テール境界、期待上のテール境界、および予想外境界である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:12:22 GMT)
MoreauPruner: Robust Pruning of Large Language Models against Weight Perturbations [16.2] 重みをモデル化するための摂動条件下での1ショット勾配プルーニングアルゴリズムは不安定な結果をもたらす可能性が示唆された。
本研究では,重量摂動に対するロバスト性を示す,MoreauPrunerと呼ばれるLLM構造解析法を提案する。
以上の結果から,MoreauPrunerの重量摂動に対する頑健さが示唆され,MoreauPrunerの精度に基づくスコアが得られたことが示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:19:04 GMT)
S-HR-VQVAE: Sequential Hierarchical Residual Learning Vector Quantized Variational Autoencoder for Video Prediction [16.1] 量子化可変ベクトルオートコーダ(SHR-VQE)の逐次階層的残差学習能力を提案する。
SHR-VQEは、時間的データの学習、高いぼやけた予測の処理、物理特性の暗黙的なモデリングなど、ビデオ予測の課題に対処できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:54:55 GMT)
Benchmarking Vision-Language Contrastive Methods for Medical Representation Learning [16.0] 医療領域におけるマルチモーダル表現学習のためのコントラストフレームワークの総合的なベンチマークを行う。
その結果,第1の質問に対する肯定的な回答,第2の質問に対する否定的な回答,きめ細かい特徴の学習のメリットが示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:55:38 GMT)
Benchmarking and Boosting Radiology Report Generation for 3D High-Resolution Medical Images [15.9] 大規模言語モデル(LLM)に基づく高分解能(HR)3Dボリュームの放射線学レポートを効率的に生成する新しいフレームワークを提案する。
具体的には、低解像度(LR)視覚トークンをクエリとして使用し、HRトークンから情報をマイニングし、詳細なHR情報を保存し、計算コストを削減する。
BIMCV-RGは、5,328 HRのボリュームとペアのレポートを持つ新しいデータセットで、3D HRの医療画像からレポートを生成するための最初のベンチマークを確立します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:45:59 GMT)
Unified Low-rank Compression Framework for Click-through Rate Prediction [15.8] 本稿では,CTR予測モデルを圧縮する低ランク分解フレームワークを提案する。
私たちのフレームワークはオリジナルのモデルよりも優れたパフォーマンスを実現できます。
我々のフレームワークは、様々なCTR予測モデルにテーブルやレイヤーを埋め込むのに利用できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:47:50 GMT)
Unsupervised Object Detection with Theoretical Guarantees [15.8] 我々は、教師なしオブジェクト検出アーキテクチャを開発し、学習された変数が、小さなシフトまでの真のオブジェクト位置に対応することを証明した。
理論的予測は個々のピクセルの精度まで検証する。
現行のSOTAオブジェクト検出法とは異なり,提案手法の予測誤差は常に理論的境界内にある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:12:31 GMT)
AIM: Let Any Multi-modal Large Language Models Embrace Efficient In-Context Learning [15.8] インコンテキスト学習(ICL)は、数十億のパラメータを更新することなく、下流タスクに創発的な能力を示す大規模言語モデルを容易にする。
ほとんどのMLLMはシングルイメージのデータセットでのみトレーニングされているため、マルチモーダルなデモンストレーションは読めない。
textbfAggregating textbf Image information of textbfMultimodal demonstrations to the dense latent space of the corresponding language part。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:12:43 GMT)
Errors are Robustly Tamed in Cumulative Knowledge Processes [15.7] 我々は,新たな知識単位の有効性が,その導出の正確性に依存する社会知識蓄積の過程を研究する。
根本的な疑問は、もし新しい導出の一定割合が間違っているなら、社会における一定の知識の一定割合が有効であることを保証できるか?
これらのモデルの$textitall$については、多くのユニットが依存するユニットの有界数をチェックするための単純な相互依存に従う限り、すべてのエラーを排除します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:28:28 GMT)
On the Distributed Evaluation of Generative Models [15.6] 我々は、広く使われている距離ベース評価指標であるFr'echet Inception Distance(FID)とKernel Inception Distance(KID)に焦点を当てる。
KID測定の場合、クライアントの平均KIDスコアを用いた生成モデルのスコアは、すべてのクライアントのデータを含む集合参照セットに対して集中的なKID評価と同じランキングとなることが証明される。
分散環境では、各クライアントが2つの生成モデルに同じFIDスコアを割り当てるが、2つのモデルの集中的なFIDスコアは著しく異なる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:33:04 GMT)
Improving Autoformalization using Type Checking [15.6] 大規模言語モデルは、自然言語を形式言語に自動翻訳するタスクである、自動形式化の約束を示す。
前回の報告では、Lean 3のCodexを使って達成されたProofNetの公式化ベンチマークのパフォーマンスが16.1%の非公式なステートメントの形式化に成功しただけだった。
解析の結果、これらのモデルの性能は、型チェックを成功させる形式的なステートメントを生成することができないため、大きく制限されていることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:01:50 GMT)
StreamingFlow: Streaming Occupancy Forecasting with Asynchronous Multi-modal Data Streams via Neural Ordinary Differential Equation [15.4] StreamingFlowは、非同期マルチセンサーデータストリームを融合するために取り込む、新しいBEV占有予測器である。
時間的地平線上でのBEV特徴の微分を学習し、融合プロセスの一部として暗黙センサのBEV特徴を更新し、BEV状態を望ましい将来時点に伝播する。
従来のビジョンベース、LiDARベースの手法よりも優れており、最先端の融合方式よりも優れた性能を示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:42:12 GMT)
PanoSSC: Exploring Monocular Panoptic 3D Scene Reconstruction for Autonomous Driving [15.4] 視覚中心の占有ネットワークは、セマンティクスを持った均一なボクセルで周囲の環境を表現する。
現代の占有ネットワークは主に、ボクセルのセマンティックな予測によって、物体表面から見えるボクセルを再構築することに焦点を当てている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:51:26 GMT)
Room Transfer Function Reconstruction Using Complex-valued Neural Networks and Irregularly Distributed Microphones [15.4] 第1室共鳴の周波数範囲における室内伝達関数を推定するために,複素数値ニューラルネットワークを用いる。
複雑な数値のニューラルネットワークが部屋の移動関数を推定するために使われるのは、これが初めてである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:54:45 GMT)
MM-KWS: Multi-modal Prompts for Multilingual User-defined Keyword Spotting [15.0] MM-KWSは、テキストと音声テンプレートのマルチモーダル入力を利用した、ユーザ定義のキーワードスポッティングの新しいアプローチである。
難解な単語の識別においてMM-KWSを強化するため、ハードケースマイニングのための高度なデータ拡張ツールを統合した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:38:29 GMT)
Blur-aware Spatio-temporal Sparse Transformer for Video Deblurring [14.8] 本稿では、browbfBSSTNet, textbfBlur-aware textbfStext-temporal textbfTransformer Networkを提案する。
提案したBSSTNetは、GoProやDVDのデータセットで最先端の手法よりも優れている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:56 GMT)
Distributional MIPLIB: a Multi-Domain Library for Advancing ML-Guided MILP Methods [14.8] 混合線形プログラミング(MILP)は最適化問題をモデル化するための基本的なツールである。
このアプローチの人気は高まっているが、同様のMILPインスタンスのディストリビューションを提供する共通のリポジトリがない。
ML誘導MILP法を進化させるための問題分散のマルチドメインライブラリであるDistributedal MIPLIBを紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:25:38 GMT)
EFFOcc: A Minimal Baseline for EFficient Fusion-based 3D Occupancy Network [14.8] 既存の3D占有ネットワーク(occnets)は、計算的に重く、ラベルの空白である。
本稿では,最先端の精度を達成しつつ,ネットワークの複雑さとラベル要件の最小化を目標とした,効率的な3d占有ネットワーク(EFFOcc)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:01:02 GMT)
Data-Driven Goal Recognition Design for General Behavioral Agents [14.8] 汎用行動モデルを持つエージェントを考慮に入れた,目標認識設計のためのデータ駆動型アプローチを提案する。
本稿では,様々な制約を満たす勾配に基づく最適化フレームワークを提案し,意思決定環境を最適化する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:45:56 GMT)
Cross-domain-aware Worker Selection with Training for Crowdsourced Annotation [14.7] 2つの重要なポイントが欠落しているのに対して、現場の真理のあるタスクにおける作業実績に基づいて作業者を選択する方法が既存の方法である。
本稿では、クロスドメイン・アウェア・ワーカー選択と呼ばれるアロケーション・スキームをトレーニング・アプローチで設計する際の2つの要因について考察する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:18:22 GMT)
MOSS: Motion-based 3D Clothed Human Synthesis from Monocular Video [14.7] ワンビューの人間の再構築は、仮想現実の応用において中心的な位置を占めている。
現在の手法は、運動が表面の変形に与える影響をしばしば見落とし、その結果、表面は大域的な動きによって課される制約を欠いている。
運動に基づく3次元衣料合成 (MOSS) を導入し, 運動認識型ガウス分割を実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:33:23 GMT)
Beyond ELBOs: A Large-Scale Evaluation of Variational Methods for Sampling [14.7] 標準化されたタスクスイートと幅広い性能基準を用いてサンプリング手法を評価するベンチマークを導入する。
モード崩壊の定量化のための既存のメトリクスについて検討し、この目的のために新しいメトリクスを導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:23:33 GMT)
Description and Discussion on DCASE 2024 Challenge Task 2: First-Shot Unsupervised Anomalous Sound Detection for Machine Condition Monitoring [14.6] このタスクは、ドメインの一般化に必要な設定下でのファーストショットの問題である。
第一弾問題の主な目的は、新しい種類のマシンにAPDシステムの迅速な展開を可能にすることである。
DCASE 2024 Challenge Task 2では、完全に新しいマシンタイプのデータが新たに収集され、評価データセットとして提供される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:32:40 GMT)
Leveraging Neural Radiance Fields for Pose Estimation of an Unknown Space Object during Proximity Operations [14.6] 本稿では、未知のターゲットに「オフ・ザ・シェルフ」宇宙船のポーズ推定装置を適用可能な新しい手法を提案する。
対象画像のスパースコレクションを用いてNeRFモデルをトレーニングし,視点と照明の両面で多様な大きなデータセットを生成する。
本手法は,スパース画像の集合から,市販の宇宙船のポーズ推定ネットワークの訓練に有効であることが実証された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:42:29 GMT)
Bisimulation Metrics are Optimal Transport Distances, and Can be Computed Efficiently [14.3] マルコフ連鎖間の最適な輸送距離を定式化するための新しい枠組みを提案する。
関節分布の全空間における最適輸送距離を計算することは、線形プログラムの解法として等価に定式化できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:53:28 GMT)
Mutual Information Guided Backdoor Mitigation for Pre-trained Encoders [14.2] 事前訓練されたエンコーダ上に構築された下流タスクは、ほぼ最先端のパフォーマンスを達成することができる。
バックドア緩和技術は 下流のタスクモデルのために設計されています
MIMICは、潜在的なバックドアエンコーダを教師ネットとして扱い、知識蒸留を用いて教師ネットからクリーンな学生エンコーダを蒸留する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:11:36 GMT)
A Lightweight Framework for Adaptive Retrieval In Code Completion With Critique Model [14.1] CARDは、検索の必要性に関する洞察を提供するために設計された軽量な批評手法である。
RAGベースのコード補完システムにシームレスに統合できる。
CARDはレイテンシを16%から83%に削減する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:37:06 GMT)
ToNER: Type-oriented Named Entity Recognition with Generative Language Model [14.1] 生成モデルに基づく新しいNERフレームワーク、すなわちToNERを提案する。
ToNERでは、文中に最も現れる可能性が最も高いエンティティタイプを特定するために、最初は型マッチングモデルが提案されている。
我々は、生成モデルのエンコーダを微調整するために、複数のバイナリ分類タスクを追加し、入力文の洗練された表現を生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:05:03 GMT)
Explaining Representation Learning with Perceptual Components [14.1] 自己教師付きモデルは明確な意味を持たない表現空間を作成する。
色,形状,テクスチャという3つの重要な知覚成分を用いて表現空間を解析する新しい手法を提案する。
我々のアプローチは表現空間の解釈可能性を高め、人間の視覚的知覚に共鳴する説明を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:08:37 GMT)
Tokenize features, enhancing tables: the FT-TABPFN model for tabular classification [13.5] FT-TabPFNはTabPFNの拡張版で、分類機能をよりよく扱うための新しい機能トークン化レイヤを含んでいる。
私たちの完全なソースコードは、コミュニティの利用と開発に利用可能です。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:13:46 GMT)
ExioML: Eco-economic dataset for Machine Learning in Global Sectoral Sustainability [13.4] 本稿では,サステナビリティ分析用に設計された最初の機械学習ベンチマークデータセットであるExioMLを紹介する。
セクターサステナビリティを評価し,データセットのユーザビリティを実証するために,温室効果ガスのレグレッションタスクを実施した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:06:34 GMT)
RudolfV: A Foundation Model by Pathologists for Pathologists [13.2] 計算病理学の基礎モデルを設計するための新しいアプローチを提案する。
我々のモデル "RudolfV" は、様々なベンチマークで既存の最先端基盤モデルを上回っています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:46:38 GMT)
FP-Inconsistent: Detecting Evasive Bots using Browser Fingerprint Inconsistencies [13.1] 本研究では,回避ボットの大規模な評価を行い,指紋の改ざんが検出の妨げになるかどうかを調査する。
DataDomeに対する平均回避率は52.93%、BotDに対する平均回避率は44.56%である。
回避ボットは指紋属性の整合性を確保するのに困難であると考えられるため、このような不整合を検出するためのルールを見つけるためのデータ駆動型アプローチを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:26:17 GMT)
VulDetectBench: Evaluating the Deep Capability of Vulnerability Detection with Large Language Models [13.0] 本研究では,Large Language Models(LLM)の脆弱性検出機能を評価するために,新しいベンチマークであるVulDetectBenchを紹介する。
このベンチマークは、LLMの脆弱性を特定し、分類し、発見する能力を、難易度を高める5つのタスクを通じて総合的に評価している。
本ベンチマークでは,脆弱性検出の特定のタスクにおいて,様々なLLMの能力評価を効果的に行うとともに,コードセキュリティの重要領域における今後の研究と改善の基盤となる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:42:57 GMT)
NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly Generation [12.9] 異常検出は、複雑なシステムにおいて稀かつしばしば重要な事象を特定するのに不可欠である。
半教師付きおよび教師付きアプローチは、そのようなラベル付きデータを活用することができ、パフォーマンスが向上する。
ラベル付き異常とラベル付けされていない大量のデータに基づいて擬似異常を新たに生成するアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:39:52 GMT)
ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization [12.9] ShiftAddLLMは大規模言語モデルの効率的な乗算自由モデルである。
5.6および22.7ポイントのパープレキシティ改善を同等または低いレイテンシで達成する。
5つのLLMファミリーと8つのタスクの実験は、ShiftAddLLMの有効性を一貫して検証している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:14:30 GMT)
Few-Body Quantum Chaos, Localization, and Multi-Photon Entanglement in Optical Synthetic Frequency Dimension [12.9] 光学系における合成周波数次元の概念を用いて、制御可能な周波数束縛光子を生成する新しい手法を提案する。
この研究は、合成次元において単一粒子を超えるリッチで制御可能な量子相を初めて探求した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:14:21 GMT)
Online Joint Fine-tuning of Multi-Agent Flows [12.9] 本稿では,ラーニング・トゥ・サーチフレームワークに触発された全フローのオンライン共同微調整手順について述べる。
このアプローチはシミュレータアクセスを活用して、エピソード全体の好みを減らし、個々のノード出力よりも好みを減らします。
私は、最先端の結果を達成するためのマルチホップQAデータセットMuseicに適用します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:08:53 GMT)
EEG-ImageNet: An Electroencephalogram Dataset and Benchmarks with Image Visual Stimuli of Multi-Granularity Labels [12.8] 我々は、画像Netデータセットから選択された4000の画像に露出した16人の被験者からの録音を含む新しいEEGデータセットであるEEG-ImageNetを紹介する。
EEG-ImageNetは、既存の類似のEEGベンチマークの5倍のEEGイメージペアで構成されている。
そこで本研究では,対象分類と画像再構成のベンチマークを構築し,対象分類の精度を60%,画像再構成の精度を64%程度で達成できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:52:17 GMT)
Design and Scheduling of an AI-based Queueing System [12.8] 本稿では,ジョブのクラスを予測モデルを用いて推定する大規模キューシステムについて考察する。
交通渋滞における誤予測が混雑コストに与える影響を特徴付けることにより,予測されたクラス情報をほぼ最適に組み込んだインデックスベースのポリシーを設計する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:01:42 GMT)
Triple-domain Feature Learning with Frequency-aware Memory Enhancement for Moving Infrared Small Target Detection [12.6] 赤外線小ターゲット検出の移動は、小さなターゲットサイズと背景とのコントラストが低いため、大きな課題となる。
本稿では,空間時間領域に周波数認識メモリを付加した新しいトリプルドメイン戦略(トリド)を提案する。
人間の視覚システムにインスパイアされた記憶強調は,映像フレーム間の空間的関係を捉えることを目的としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:21:30 GMT)
Turning the Tide on Dark Pools? Towards Multi-Stakeholder Vulnerability Notifications in the Ad-Tech Supply Chain [12.4] ダークプールの緩和を目的とした脆弱性通知キャンペーンの有効性について検討した。
当社の9ヶ月にわたるマルチステークホルダー通知調査は、通知がダークプールの脆弱性を減らす効果的な方法であることを示している。
オンライン広告エコシステムをターゲットとする最初の通知研究であるだけでなく、脆弱性通知において、マルチステークホルダーのコンテキストを初めて研究しました。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:31:29 GMT)
Tailoring Bound State Geometry in High-Dimensional Non-Hermitian Systems [12.1] 非エルミート効果(NHSE)は不純物境界状態の出現の障壁を生じる。
我々の研究は、高次元非エルミート系における凹凸と凸の間の境界状態の幾何学的遷移を明らかにする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:00:12 GMT)
Matryoshka Representation Learning for Recommendation [12.1] MRL4Rec(Mathryoshka representation learning for recommendation)を提案する。
ユーザとアイテムのベクターを漸進的に次元と重なり合うベクトル空間でマトリシカ表現に再構成し、ユーザの好みとアイテムの特徴を異なる階層レベルで明示的に表現する。
MRL4Recは、いくつかの実生活データセットにおいて、多くの最先端の競合より一貫して、実質的に優れることを示す実験である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:34:21 GMT)
Tailoring Mixup to Data for Calibration [12.1] Mixupはキャリブレーションと予測の不確実性を改善する技術である。
この研究では、データ間の距離が混合されるにつれて、多様体の侵入の可能性が増加することを論じる。
本研究では, 混合する試料間の類似度に応じて, 係数の基底分布を動的に変化させることを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:22:27 GMT)
When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models [12.0] 自己回帰型LDMに対する既存の線形注意法の有効性に関する総合的研究を行った。
本稿では,投機的復号化との整合性を保証する線形注意のための拡張手法を提案する。
提案手法は,LLaMAモデルにおけるパープレキシティの最大6.67低減と,従来の線形アテンション法と比較して,生成時の最大2$times$スピードアップを実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:34:43 GMT)
Minimizing Energy Costs in Deep Learning Model Training: The Gaussian Sampling Approach [11.9] ガウス分布からの勾配更新をサンプリングするために, em GradSamp という手法を提案する。
Em GradSampは、勾配の合理化だけでなく、エポック全体のスキップを可能にし、全体的な効率を向上させる。
我々は、標準CNNとトランスフォーマーベースモデルの多種多様なセットにまたがって、我々の仮説を厳格に検証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:01:20 GMT)
RS-DFM: A Remote Sensing Distributed Foundation Model for Diverse Downstream Tasks [11.7] 汎用情報マッピングとインタラクションに基づく分散センシング基礎モデル(RS-DFM)を提案する。
このモデルは、複数のプラットフォームにわたるオンライン協調認識と、さまざまな下流タスクを実現することができる。
本稿では、高周波・低周波特徴情報を分離するデュアルブランチ情報圧縮モジュールを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:46:47 GMT)
Beyond Model Collapse: Scaling Up with Synthesized Data Requires Reinforcement [11.6] モデル崩壊防止のための合成データに対するフィードバックの利用について検討する。
フィードバック強化された合成データからのトレーニングは、誤った予測を打つか、いくつかの推測のベストを選択することによって、モデル崩壊を防止できることが示される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:46:16 GMT)
Large Language Models Can Learn Temporal Reasoning [11.6] 本稿では,言語に基づく時間的推論のための新しいフレームワークTG-LLMを提案する。
元の文脈を推論する代わりに、潜時表現、時間グラフ(TG)を採用する。
合成データセット(TGQA)は完全に制御可能であり、最小限の監督を必要とする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:38:27 GMT)
Instances Need More Care: Rewriting Prompts for Instances with LLMs in the Loop Yields Better Zero-Shot Performance [11.6] 大規模言語モデル(LLM)はゼロショットタスクのパフォーマンスに革命をもたらした。
レッツ・シンク・バイ・ステップ(Let's Think by Step)」のようなトリガーフレーズを使った現在の手法は依然として限られている。
本研究では,タスクインスタンスのゼロショットプロンプトを最適化するPRomPTedを導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:00:03 GMT)
Metamorphic Relation Generation: State of the Art and Visions for Future Research [11.6] 本稿では, メタモルフィック・リレーション・ジェネレーションのための技術の現状について, 体系的なレビューを行う。
我々は、メタモルフィック関係の同定と構築のための理論と技法をさらに進めるためのビジョンを強調した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:55:32 GMT)
Measuring Spurious Correlation in Classification: 'Clever Hans' in Translationese [11.5] トピックベースの素早い相関に注目し,2つの方向から質問にアプローチする。
本研究では,教師なしトピックと対象分類ラベルとのアライメントを指標として,データ中の素早いトピック情報の表示方法を開発した。
本手法はクラスタリングにおける純度と同一であることを示し,分類のための「トピックフロア」(「ノイズフロア」など)を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:38:28 GMT)
Spatio-temporal Early Prediction based on Multi-objective Reinforcement Learning [11.3] 森林火災、犯罪、交通渋滞などの応用において、タイムリーな予測は人命と財産を守るのに不可欠である。
本稿では,複数目的強化学習に基づくモデルを提案する。
提案手法は,3つの大規模実世界のデータセットにおいて,早期の時系列・時間予測タスクにおける既存手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:14:56 GMT)
Generated Contents Enrichment [11.2] 生成コンテンツエンリッチメント(GCE)と呼ばれる新しい人工知能生成タスクについて検討する。
提案したGCEは、視覚領域とテキスト領域の両方でコンテンツ豊か化を明示的に行う。
The Visual Genome dataset on the Visual Genome showed promising and visually plausible results。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:12:26 GMT)
WeatherGNN: Exploiting Meteo- and Spatial-Dependencies for Local Numerical Weather Prediction Bias-Correction [11.1] 本研究では,気象的依存関係と空間的依存関係を利用した局所的なNWPバイアス補正手法であるWeatherGNNを提案する。
2つの実世界のデータセットに対する実験結果から、WeatherGNNは最先端のパフォーマンスを達成し、RMSEの平均4.75%で最高のベースラインを上回りました。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:13:13 GMT)
CAT: Coordinating Anatomical-Textual Prompts for Multi-Organ and Tumor Segmentation [11.1] CATは,医学領域の知識に富んだ3Dクロップ画像から得られた解剖学的プロンプトとテクスチャ的プロンプトをコーディネートする革新的なモデルである。
10のパブリックCTデータセットからなるコンソーシアムでトレーニングされたCATは、複数のセグメンテーションタスクにおいて優れたパフォーマンスを示している。
このアプローチは、マルチモーダルプロンプトのコーディネートが、医療領域における複雑なシナリオに対処するための有望な道であることを確認した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:22:39 GMT)
Neural Visibility Field for Uncertainty-Driven Active Mapping [11.0] アクティブマッピングに適用したニューラル・ラジアンス・フィールド(NeRF)の新しい不確実性定量化手法であるニューラル・ビザビリティ・フィールド(NVF)を提案する。
我々の重要な洞察は、トレーニングビューで見えない領域は、この領域でのNeRFによる本質的に信頼性の低い色予測につながり、合成ビューでは不確実性が増大するということである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:21:21 GMT)
Benchmarking PathCLIP for Pathology Image Analysis [11.0] 明るさ,コントラスト,ガウスのぼかし,解像度,彩度,色調,マークアップの7種類の汚職を4つの重度レベルで導入する。
PathCLIPは画像の破損に対して比較的堅牢であり,ゼロショット分類ではOpenAI-CLIPとPLIPを上回っている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:43:22 GMT)
Beyond Training: Optimizing Reinforcement Learning Based Job Shop Scheduling Through Adaptive Action Sampling [10.9] 推論における訓練深部強化学習(DRL)エージェントの最適利用について検討した。
我々の研究は、探索アルゴリズムと同様に、訓練されたDRLエージェントの利用は許容できる計算予算に依存するべきであるという仮説に基づいている。
そこで本稿では, 与えられた多数の解と任意の訓練されたエージェントに対して最適なパラメータ化を求めるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:59:18 GMT)
Robust Inverse Graphics via Probabilistic Inference [10.9] 雨や雪、霧といった汚職の存在下で、1枚の画像から3Dシーンを推測する方法を示す。
ベイズ的アプローチによる頑健な逆グラフ (RIG) を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:19:00 GMT)
Learning Disentangled Semantic Spaces of Explanations via Invertible Neural Networks [10.9] 切り離された潜在空間は、通常、より良い意味分離性と幾何学的性質を持ち、より良い解釈可能性とより制御可能なデータ生成をもたらす。
本研究では,より一般的な文意味的特徴の局所的な修正と制御を目的とした,文の絡み合いのより一般的な形態に着目した。
本稿では,トランスフォーマベース言語であるオートエンコーダ(AE)と統合されたフローベース可逆ニューラルネットワーク(INN)機構を導入し,より分離性に優れた潜在空間を実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:29:22 GMT)
The Multiscale Surface Vision Transformer [10.8] 表面深層学習のためのバックボーンアーキテクチャとして,Multiscale Surface Vision Transformer (MS-SiT)を導入した。
以上の結果から,MS-SiTは新生児の表現型予測タスクにおいて,既存の表面深層学習法よりも優れていた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:30:59 GMT)
Tuning-Free Visual Customization via View Iterative Self-Attention Control [10.7] この課題に対処するために、textitView Iterative Self-Attention Control (VisCtrl)を提案する。
VisCtrlは、ターゲット画像中の別の被写体にユーザ特定被写体の外観と構造を注入する、トレーニング不要な方法である。
提案手法は,数ステップで1つの参照画像のみを用いて一貫した,調和的な編集を行う。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:06:14 GMT)
Federated Representation Learning in the Under-Parameterized Regime [10.6] フェデレート・表現学習(FRL)は、クライアントが共通の表現をトレーニングし、パーソナライズされた頭を維持しながら連携する、パーソナライズド・フェデレーション・ラーニング(FL)フレームワークである。
本稿では、新しいFRLアルゴリズムFLUTEを提案し、線形モデルに対するサンプルの複雑さと収束率を理論的に特徴づける。
実験により、FLUTEは、合成タスクと実世界のタスクの両方において、最先端のFRLソリューションよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:51:26 GMT)
Post-Hoc Answer Attribution for Grounded and Trustworthy Long Document Comprehension: Task, Insights, and Challenges [10.5] 長期文書理解のためのポストホック応答帰属の新たな課題を定式化する。
我々は,既存の検索ベース属性の長所と短所を評価するために,既存のデータセットを精査し,回答の分解を提案する。
私たちは、既存のデータセットの制限と、このタスクにおけるシステムの実際のパフォーマンスを評価するデータセットの必要性に光を当てています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:31:54 GMT)
VoxNeuS: Enhancing Voxel-Based Neural Surface Reconstruction via Gradient Interpolation [10.5] 計算およびメモリ効率のよいニューラルサーフェス再構成のための軽量なサーフェス再構成法であるVoxNeuSを提案する。
トレーニングプロセス全体は15分で、1つの2080ti GPU上で3GB未満のメモリを必要とする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:26:27 GMT)
Private Geometric Median [10.4] データセットの幾何中央値(GM)を計算するための差分プライベート(DP)アルゴリズムについて検討する。
我々の主な貢献は、データポイントの有効直径でスケールする過剰なエラー保証を備えたプライベートGMのタスクのためのDPアルゴリズムのペアである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:13:09 GMT)
DualMamba: A Lightweight Spectral-Spatial Mamba-Convolution Network for Hyperspectral Image Classification [10.3] 本稿では,HSI分類のための軽量なデュアルストリームマンバ畳み込みネットワーク(DualMamba)を提案する。
具体的には,グローバルおよび局所スペクトル空間の特徴を抽出するために,並列軽量なMambaブロックとCNNブロックを開発した。
現状のHSI分類法と比較して、DualMambaが有意な分類精度を達成することを示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:26:42 GMT)
3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos [10.3] 3DGStreamは実世界のダイナミックシーンの効率的なFVVストリーミングのために設計された手法である。
提案手法は,12秒以内のフレーム毎の高速な再構築と,200FPSでのリアルタイムレンダリングを実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:26:34 GMT)
BvSP: Broad-view Soft Prompting for Few-Shot Aspect Sentiment Quad Prediction [10.3] アスペクト感情クワッド予測(ASQP)は、アスペクト項、意見項、アスペクトカテゴリー、感情極性を含む4つのアスペクトベースの要素を予測することを目的としている。
この研究はASQPを数ショットのシナリオに定式化し、実際のアプリケーションで高速に適応することを目的としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:32:32 GMT)
Large-Scale Contextual Market Equilibrium Computation through Deep Learning [10.3] 本稿では,市場均衡を近似する深層学習方式であるMarketFCNetを紹介する。
MarketFCNetは,既存の手法と比較して,競争性能と実行時間を大幅に低下させることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:36:00 GMT)
Post-hoc Orthogonalization for Mitigation of Protected Feature Bias in CXR Embeddings [10.2] 深層学習モデルの胸部X線写真埋め込みにおける保護的特徴効果の分析と除去を行う。
実験では、保護された特徴が病理の予測に重大な影響を及ぼすことが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:59:38 GMT)
Near-Tight Runtime Guarantees for Many-Objective Evolutionary Algorithms [10.2] 従来のベンチマークでは,SEMO,グローバルSEMO,SMS-EMOAアルゴリズムのほぼ28のランタイム保証が証明されている。
このような厳密な境界がこれらのMOEAの多目的利用に対して証明されたのはこれが初めてである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:41:49 GMT)
Reading Miscue Detection in Primary School through Automatic Speech Recognition [10.1] 本研究は,オランダ語母語話者の音声認識において,SOTA(State-of-the-art)事前学習モデルの有効性について検討した。
We found that Hubert Large finetuned on Dutch speech achieves SOTA phoneme-level child speech Recognition。
Wav2Vec2 Largeは最大リコール率0.83、Whisperは0.52、F1スコア0.52である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:41:21 GMT)
Spatio-Temporal Encoding of Brain Dynamics with Surface Masked Autoencoders [10.1] 表面仮面オートエンコーダ(sMAE)と表面仮面オートエンコーダ(MAE)
これらのモデルは、皮質発達と構造関数の強力な潜在表現を学習することにより、入力のマスクされたバージョンから皮質特徴写像を再構築するように訓練されている。
以上の結果から, (v)sMAE事前学習モデルでは, 複数のタスクにおける表現型予測性能が約26%向上し,スクラッチからトレーニングしたモデルに対してより高速な収束が得られた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:42:18 GMT)
Integrating Domain Knowledge for handling Limited Data in Offline RL [10.1] オフラインのRLアルゴリズムは、状態空間内の特定の領域に制限された限られたデータに直面した場合に、準最適に実行する。
本稿では、ドメイン知識に基づく新しい正規化手法を提案し、初期ドメイン知識を適応的に洗練し、部分的に省略された状態の限られたデータの性能を向上させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:59:17 GMT)
Augmenting Offline RL with Unlabeled Data [10.1] オフライン強化学習(Offline RL)におけるアウト・オブ・ディストリビューション(OOD)問題に対する新しいアプローチを提案する。
政策類似度尺度を補完するオフラインのRL教師学生フレームワークを導入する。
このフレームワークにより、学生の政策は、オフラインのRLデータセットだけでなく、教師の方針によって伝達される知識からも洞察を得ることができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:02:07 GMT)
Paraphrasing in Affirmative Terms Improves Negation Understanding [9.8] 否定は共通の言語現象である。
本研究では,否定を伴う推論を必要とする大規模コーパスであるCondaQAの改良と5つの自然言語理解タスクを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:30:03 GMT)
Post-train Black-box Defense via Bayesian Boundary Correction [9.8] 深層ニューラルネットワークのためのポストトレインブラックボックス防衛フレームワークを提案する。
事前訓練された分類器を、モデル固有の知識がほとんどないレジリエントな分類器に変えることができる。
また、新たなポストトレイン戦略も装備されており、再トレーニングを回避している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:14:18 GMT)
Coin-Flipping In The Brain: Statistical Learning with Neuronal Assemblies [9.8] 脳の計算モデルNEMOにおける統計的学習の出現について検討する。
アセンブリ間の接続が統計を記録し、環境騒音を利用して確率的選択をすることができることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:51:50 GMT)
DCA-Bench: A Benchmark for Dataset Curation Agents [9.6] 隠れたデータセットの品質問題を検知する大規模言語モデルの能力を測定するために,データセットキュレーションエージェントベンチマークであるDCA-Benchを提案する。
具体的には、テストベッドとして8つのオープンデータセットプラットフォームから、さまざまな実世界のデータセット品質の問題を収集します。
提案したベンチマークは、単に問題解決を行うのではなく、問題発見におけるLLMの能力を測定するためのテストベッドとしても機能する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:02:23 GMT)
Fast Controllable Diffusion Models for Undersampled MRI Reconstruction [9.3] 本研究は,MRIのアンダーサンプル再構成のための拡散モデルの制御可能な生成を促進させる,Predictor-Projector-Noisor (PPN) と呼ばれる新しいアルゴリズムを提案する。
以上の結果から, PPNは, 他の制御可能なサンプリング法に比べて, 再構成時間を大幅に短縮した, アンサンプ付きk空間計測に適合した高忠実MR画像を生成することがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:15:53 GMT)
A Survey on Graph Counterfactual Explanations: Definitions, Methods, Evaluation, and Research Challenges [9.2] グラフニューラルネットワーク(GNN)は、コミュニティ検出と分子分類においてよく機能する。
Counterfactual Explanations (CE) はブラックボックスモデルの透明性の限界を克服するための反例を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:18:57 GMT)
Using AI-Based Coding Assistants in Practice: State of Affairs, Perceptions, and Ways Forward [9.2] 我々は、AIアシスタントの使用方法に関する大規模な調査を行った。
我々は5つの幅広い活動について481人のプログラマの意見を収集した。
その結果,AIアシスタントの利用状況は,活動やステージによって異なることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:10:43 GMT)
Global Clipper: Enhancing Safety and Reliability of Transformer-based Object Detection Models [9.1] 推論中にビットフリップを引き起こすソフトエラーは、性能に大きく影響を与え、予測を変える。
本研究は,トランスフォーマーモデルに特化して設計された効果的な緩和戦略であるGlobal ClipperとGlobal Hybrid Clipperを紹介する。
ソフトエラーに対するレジリエンスを大幅に向上させ、欠陥推論を0%に削減する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:22:47 GMT)
Loss Gradient Gaussian Width based Generalization and Optimization Guarantees [9.1] 我々は、Los Gradient Gaussian Width (LGGW)によって測定された勾配の複雑さの観点から一般化と最適化を保証する。
有限和(確率)最適化におけるサンプルの再利用は、LGGWが小さい限り、経験的勾配を人口から逸脱させるものではないことを示す。
我々のLGGWの一般化と最適化の保証は、このタイプの最初の結果であり、予測器ラデマッハの複雑性に基づく解析の落とし穴を回避し、深層モデルの量的厳密な境界に対するかなりの保証を保っている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:46:32 GMT)
Reconstructing the Geometry of Random Geometric Graphs [9.0] ランダム幾何学グラフは、距離空間上で定義されたランダムグラフモデルである。
サンプルグラフから基底空間の幾何を効率的に再構成する方法を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:50:34 GMT)
Unified Modeling Enhanced Multimodal Learning for Precision Neuro-Oncology [8.8] ヒストロジーとゲノム学の両モードの共通性と相補的な特徴を利用する階層的アテンション構造を導入する。
本手法は,グリオーマ診断および予後タスクにおける従来の最先端手法を超越した手法である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:06:41 GMT)
Validating LLM-Generated Programs with Metamorphic Prompt Testing [8.8] 大規模言語モデル(LLM)は、ソフトウェア開発ライフサイクルにますます統合されています。
本稿では,これらの課題に対処するため,メタモルフィック・プロンプト・テストと呼ばれる新しい手法を提案する。
我々のHumanEvalに対する評価は,GPT-4が生成する誤プログラムの75%を,偽陽性率8.6%で検出できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:40:17 GMT)
LINGOLY: A Benchmark of Olympiad-Level Linguistic Reasoning Puzzles in Low-Resource and Extinct Languages [8.8] LingOlyベンチマークは、大規模言語モデルにおける高度な推論能力のための新しいベンチマークである。
非常に低リソースまたは絶滅した言語における言語パターンの文脈内同定と一般化の能力を評価する。
直接精度と非文脈ベースラインとの比較により,暗記を暗記する性能を評価する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:19:52 GMT)
Scalable MatMul-free Language Modeling [8.7] MatMul操作は大規模言語モデルから完全に除去可能であることを示す。
提案するMatMulフリーモデルは,最先端のトランスフォーマーと同等の性能を実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:18:28 GMT)
Eye-for-an-eye: Appearance Transfer with Semantic Correspondence in Diffusion Models [8.7] 対象画像と同じ構造を持つが、参照画像から色を塗った結果を生成する方法を提案する。
既存のメソッドは、自己アテンション層内のクエリキーの類似性に依存し、通常は欠陥のある結果を生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:08:48 GMT)
Graph Laplacian Learning with Exponential Family Noise [8.6] 指数関数的家族雑音によるグラフ信号から学習するための多目的グラフ推論フレームワークを提案する。
本フレームワークは,連続的なスムーズなグラフ信号から様々なデータタイプまで,従来の手法を一般化する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:52:10 GMT)
From Classification to Segmentation with Explainable AI: A Study on Crack Detection and Growth Monitoring [8.6] インフラの表面ひび割れのモニタリングは、構造的健康モニタリングに不可欠である。
機械学習アプローチはその効果を証明しているが、典型的には教師付きトレーニングには大きな注釈付きデータセットが必要である。
このコストを軽減するために、説明可能な人工知能(XAI)を利用して分類器の説明からセグメンテーションを導き、画像レベルの監督が弱いだけを必要とする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:55:48 GMT)
Guiding Catalogue Enrichment with User Queries [8.4] 我々は、豊かなデータポイントを特定し、汎用的なKGを用いてパフォーマンスの利点を示す直感を示す。
本手法は2つの人気のある百科事典KG, DBPedia と YAGO 4 について検討した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:38:46 GMT)
Hyperfine Structure of Quantum Entanglement [8.2] 我々は, 絡み合いの微細構造を導入し, 微細構造として知られる絡み合いの輪郭を粒子数累積に分解する。
我々の研究結果は、物理的システム間の量子絡み合いに関する新たな洞察を提供する、実験的アクセシビリティーを示唆している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:38:28 GMT)
Sample Complexity Reduction via Policy Difference Estimation in Tabular Reinforcement Learning [8.2] バンディットにおける既存の研究は、個々の政策の行動の違いを見積もることによって、最良の政策を特定できることを示している。
しかし、RLの最もよく知られた複雑さはこの利点を生かせず、代わりにそれぞれのポリシーの振舞いを直接見積もる。
単一の参照ポリシの振る舞いを見積もることができれば、他のポリシが参照ポリシからどのように逸脱するかを見積もるだけで十分である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:02:19 GMT)
SPIN: Spacecraft Imagery for Navigation [8.2] 本研究では、2つの宇宙船間の相対航法のためのオープンソースのリアルな宇宙船画像生成ツールSPINを提案する。
SPINはさまざまな地上データを提供し、研究者は衛星のカスタム3Dモデルを使用することができる。
実空間条件をシミュレートする一般的なテストベッドデータにおいて,平均誤差を50%削減することを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:35:39 GMT)
DecoR: Deconfounding Time Series with Robust Regression [8.0] この研究は、第3の観測されていない時系列によって構成される2つの時系列間の因果効果を推定することに焦点を当てている。
本稿では、周波数領域における頑健な線形回帰を用いて因果効果を推定する新しいアプローチである、ロバスト回帰(DecoR)によるデコンウンディングを導入する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:59:17 GMT)
Small-E: Small Language Model with Linear Attention for Efficient Speech Synthesis [7.9] 言語モデルを用いたテキスト音声合成(TTS)の最近の進歩は、自然性やゼロショット音声のクローニングの実現において顕著な能力を示した。
本稿では,リピートやスキップの問題を緩和する特別なクロスアテンション機構を導入し,トランスフォーマーを新たなアーキテクチャに置き換えることを提案する。
我々のアーキテクチャは、長いサンプルで効率的に訓練し、同等の大きさのベースラインに対して最先端のゼロショット音声クローンを実現することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:36:36 GMT)
Data Complexity in Expressive Description Logics With Path Expressions [7.8] 本稿では,表現的記述論理ZOIQ(ALCHb Self reg OIQ)の準フォレスト上でのデータ複雑性について検討する。
これにより、ZOIQの決定可能なフラグメントに対するデータ複雑性の展望が完成し、OWL2(SRファミリー)の決定可能なフラグメントに関する既知の結果が改善される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:37:51 GMT)
Failures Are Fated, But Can Be Faded: Characterizing and Mitigating Unwanted Behaviors in Large-Scale Vision and Language Models [7.7] 多くのタスクで驚くほどうまく機能しているように見える大きなディープニューラルネットワークでは、精度、社会的バイアス、人間の価値観との整合性に関連するいくつかの障害も観察します。
本研究では,事前学習した識別モデルと生成モデルを用いて,エンフディープ強化学習を用いて,障害モードの景観を探索・構築するポストホック手法を提案する。
提案手法の有効性を,コンピュータビジョン,自然言語処理,視覚言語タスクで実証的に示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:45:41 GMT)
Triage of 3D pathology data via 2.5D multiple-instance learning to guide pathologist assessments [7.7] 本稿では,3次元生検において最もリスクの高い2Dスライスを自動的に識別する深層学習トリアージアプローチであるCARP3Dを提案する。
前立腺がんのリスク層化のために、CARP3Dは2Dセクションの独立解析に依存して、90.4%の曲線(AUC)の領域を達成している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:42:07 GMT)
Large Language Model Meets Graph Neural Network in Knowledge Distillation [7.7] サービス指向アーキテクチャにおけるQoS(Quality of Service)を予測するための時間認識フレームワークを提案する。
提案するTOGCLフレームワークは,複数のメトリクスにわたって最先端のメソッドを著しく上回り,最大38.80%の改善を実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:17:12 GMT)
TelecomRAG: Taming Telecom Standards with Retrieval Augmented Generation and LLMs [7.7] 大規模言語モデル(LLM)は通信産業を変革する大きな可能性を秘めている。
LLMは、プロフェッショナルが複雑な標準を理解し、コードを生成し、開発を加速するのに役立ちます。
Retrieval-augmented Generation (RAG)は、正確な事実に基づく回答を生成する方法を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:35:23 GMT)
InterpreTabNet: Distilling Predictive Signals from Tabular Data by Salient Feature Interpretation [7.7] 本稿では,注意機構をGumbel-Softmax分布からサンプリングした潜在変数としてモデル化するTabNetモデルの変種を提案する。
これにより、KLディバージェンス正規化器を用いて、注意マスクの異なる概念を学習できるようにモデルを正規化することができる。
モデルの有効性を最大化し、解釈可能性を向上させるようなスパーシティを促進することで、重複した特徴選択を防止する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:53:03 GMT)
PVF (Parameter Vulnerability Factor): A Scalable Metric for Understanding AI Vulnerability Against SDCs in Model Parameters [7.7] 脆弱性因子(Vulnerability Factor, PVF)は、AIモデル脆弱性のパラメータ破損に対する定量化を目標とする指標である。
PVFは、フォールトプロテクションとパフォーマンス/効率のトレードオフのバランスをとる上で、AIハードウェアデザイナに重要な洞察を提供することができる。
推論中にPVFを3種類のタスク/モデルに適用するためのユースケースとして、DLRM、ビジョン分類(CNN)、テキスト分類(BERT)を挙げる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:37:33 GMT)
Enhancing Size Generalization in Graph Neural Networks through Disentangled Representation Learning [7.4] DISGENは、グラフ表現からサイズ因子をアンタングルするために設計された、モデルに依存しないフレームワークである。
実験の結果, DISGENは実世界のデータセットにおいて, 最先端のモデルよりも最大6%優れていた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:10:58 GMT)
Learning from Integral Losses in Physics Informed Neural Networks [7.4] 本研究は,部分積分微分方程式の下での物理インフォームドネットワークのトレーニング問題に対する解を提案する。
これらの積分を偏りのない推定値に置き換えることで、偏りのある損失関数や解が導かれることを示す。
また,提案手法が提案され,提案手法が提案されることにより,サンプルサイズの積分値と同等の精度で精度の高い解が得られることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:22:28 GMT)
Improved criteria of detecting multipartite entanglement structure [7.2] 本稿では,多部交絡構造をよりよく識別する,強力な絡み合いの目撃者を構築するための体系的手法を提案する。
我々の結果は、多くの量子情報処理タスクに適用できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:01:22 GMT)
CADS: A Systematic Literature Review on the Challenges of Abstractive Dialogue Summarization [7.2] 本稿では、英語対話におけるトランスフォーマーに基づく抽象要約に関する研究を要約する。
ダイアログ要約における主な課題(言語、構造、理解、話者、サリエンス、事実)をカバーします。
言語などいくつかの課題がかなりの進歩を遂げているのに対して、理解、事実性、サリエンスといった課題は依然として困難であり、重要な研究機会を持っている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:30:22 GMT)
Static Analysis Driven Enhancements for Comprehension in Machine Learning Notebooks [7.1] Jupyterノートブックを使えば、開発者はリッチテキストとインラインビジュアライゼーションでコードスニペットをインターリーブできる。
最近の研究では、Jupyterノートの大部分が文書化されておらず、物語構造が欠けていることが示されている。
本稿では、コードセルに分類型マークダウンヘッダーを付加する新しいツールベースのアプローチであるHeaderGenを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:37:17 GMT)
Gaussian Splatting with NeRF-based Color and Opacity [7.1] 本研究では、3Dオブジェクトの形状のGS表現と、色と不透明度のNeRFに基づく符号化を利用するハイブリッドモデルであるビューングディビジョン・ガウス・スティング(VDGS)を提案する。
我々のモデルは、テクスチャや光の成分を追加することなく、影、光の反射、そして3Dオブジェクトの透明さをよりよく記述します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:09:36 GMT)
Signature Kernel Conditional Independence Tests in Causal Discovery for Stochastic Processes [7.1] パス空間上での条件独立性(CI)のカーネルベーステストを開発する。
我々は非循環力学系に対する制約に基づく因果探索アルゴリズムを開発した。
開発したCIテストと因果発見アルゴリズムが、さまざまな設定でベースラインを上回っていることを検証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:37:51 GMT)
Speaking Your Language: Spatial Relationships in Interpretable Emergent Communication [7.1] 本稿では,エージェントが観察中の空間的関係についてコミュニケーションする方法について述べる。
コロケーション測度を用いて、エージェントがどのようにそのような参照を生成するかを実証する。
また、創発言語は人間によって解釈可能であることも示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:04:25 GMT)
DualBind: A Dual-Loss Framework for Protein-Ligand Binding Affinity Prediction [7.1] 本稿では、教師付き平均二乗誤差(MSE)と教師なし復調スコアマッチング(DSM)を統合して、結合エネルギー関数を正確に学習する新しいフレームワークであるDualBindを提案する。
実験の結果,DualBindは結合親和性の予測に優れ,ラベル付きデータとラベルなしデータの両方を有効利用して性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:29:48 GMT)
Nonlinear time-series embedding by monotone variational inequality [7.0] 非線形時系列の低次元表現を教師なしで学習する新しい手法を提案する。
学習された表現は、クラスタリングや分類といった下流の機械学習タスクに使用することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:19:31 GMT)
Graphical Perception of Saliency-based Model Explanations [6.9] 本研究では,視覚認知モデルに対するモデル説明の知覚,特に正当性に基づく説明について検討する。
以上の結果から, 可視化設計決定やアライメントの種類, サリエンシマップの質に関連する要因が, 人間がサリエンシに基づく視覚的説明を知覚する上で重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:29:25 GMT)
CUPID: Contextual Understanding of Prompt-conditioned Image Distributions [6.9] CUPIDは、プロンプト条件付き画像分布の文脈的理解のための可視化手法である。
CUPIDの中心は高次元分布を可視化する新しい手法であり、オブジェクトのコンテキスト化された埋め込みを低次元空間にマッピングする。
このような埋め込みによって、分布内のオブジェクトの健全なスタイルを発見できるだけでなく、異常なオブジェクトスタイルやまれなオブジェクトスタイルを識別できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:26:41 GMT)
LiSD: An Efficient Multi-Task Learning Framework for LiDAR Segmentation and Detection [6.8] LiSDはボクセルベースのエンコーダデコーダフレームワークで、セグメンテーションと検出の両方のタスクに対処する。
これは、ライダーのみの手法のnuScenesセグメンテーションベンチマークにおいて、83.3% mIoUの最先端性能を達成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:26:54 GMT)
Redefining Automotive Radar Imaging: A Domain-Informed 1D Deep Learning Approach for High-Resolution and Efficient Performance [6.8] 本研究では,1次元(1次元)信号の超解像スペクトル推定問題として,レーダー画像の超解像を再定義する。
自動車レーダイメージングのための最適化されたディープラーニングネットワークは、優れたスケーラビリティ、パラメータ効率、高速推論速度を示す。
我々のSR-SPECNetは、高解像度のレーダレンジ方位画像を作成するための新しいベンチマークを設定している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:07:08 GMT)
Wearable Sensor-Based Few-Shot Continual Learning on Hand Gestures for Motor-Impaired Individuals via Latent Embedding Exploitation [6.8] 本稿では,リプレイベースのFew-Shot連続学習フレームワークにおいて,Latent Embedding Exploitation (LEE) 機構を導入する。
本手法は,ジェスチャー先行知識として知られる保存された潜伏埋め込みを利用して,多様な潜伏特徴空間を生成する。
本手法は、運動障害者がウェアラブルデバイスを活用するのに役立ち、そのユニークな動作スタイルを学習し応用することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:33:20 GMT)
MBBQ: A Dataset for Cross-Lingual Comparison of Stereotypes in Generative LLMs [6.8] 生成的大規模言語モデル(LLM)は有害なバイアスやステレオタイプを示すことが示されている。
MBBQは、オランダ語、スペイン語、トルコ語でよく見られるステレオタイプを測定するデータセットである。
その結果、文化的な変化を抑えながら、英語以外の言語では、英語よりも偏見に悩まされていることが確認された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:23:14 GMT)
Quantum Speedup of the Dispersion and Codebook Design Problems [6.7] 分散問題はNPハードに分類される最適化問題である。
本稿では,Grover Adaptive Search(GAS)量子アルゴリズムによる解を実現するために,最大値と最大値の分散問題の新しい定式化を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:00:50 GMT)
Wearable Device-Based Physiological Signal Monitoring: An Assessment Study of Cognitive Load Across Tasks [6.7] 本研究では、最先端のウェアラブル監視技術を用いて、高精度で時間分解能の高い認知負荷評価を行う。
この研究は、SVS学生の認知負荷の評価における応用価値と、様々なタスクにまたがる有用性について考察した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:48:26 GMT)
Unifying Interpretability and Explainability for Alzheimer's Disease Progression Prediction [6.6] 強化学習は近年,アルツハイマー病(AD)の進行を予測できることが示唆されている。
RLアルゴリズムがどの処理に適しているかは明らかでない。
我々の研究は、予測精度と透明性を融合し、臨床医や研究者が疾患進行モデリングの強化を支援することを目的としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:54:42 GMT)
Adaptive quantum optimization algorithms for programmable atom-cavity systems [6.5] 光キャビティ内のコールド原子は、プログラム可能なオール・ツー・オール相互作用を持つ普遍量子として構築可能であることを示す。
標準量子近似アルゴリズム(QAOA)の成功確率は問題の大きさとともに急速に低下する。
反断熱駆動にインスパイアされたQAOAの適応アンサッツを提案し,NPPハミルトンのパラメータ自由度を高次反断熱項に一致させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:37:31 GMT)
MS-Diffusion: Multi-subject Zero-shot Image Personalization with Layout Guidance [6.5] 本研究では,マルチオブジェクトを用いたレイアウト誘導ゼロショット画像パーソナライズのためのMS-Diffusionフレームワークを提案する。
提案した多目的クロスアテンションオーケストラは、テキストの制御を保ちながら、オブジェクト間コンポジションを編成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:32:53 GMT)
The statistical thermodynamics of generative diffusion models: Phase transitions, symmetry breaking and critical instability [6.4] 生成拡散モデルが普遍性破壊現象に対応する2次相転移を行うことを示す。
相転移から生じる臨界不安定性は、その生成能力の中心にあると我々は主張する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:15:05 GMT)
TIM: Temporal Interaction Model in Notification System [6.4] 本稿では,短時間のビデオアプリケーションKuaishouにおいて,CTRを1日ごとの時間帯で推定することにより,ユーザの行動パターンをモデル化するTIMを提案する。
TIMはユーザ行動を予測するための信頼性の高いツールであり,不適切な障害を引き起こすことなく,ユーザのエンゲージメントを著しく向上させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:53:15 GMT)
Investigation of the effectiveness of applying ChatGPT in Dialogic Teaching Using Electroencephalography [6.3] 大規模言語モデル(LLM)には、知識を解釈し、質問に答え、文脈を考える能力がある。
この研究は、34人の大学生を参加者として募集し、ランダムに2つのグループに分けられた。
実験群はChatGPTを用いて対話型指導を行い,コントロール群は人間教師と対話した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:35:03 GMT)
Fast solution to the fair ranking problem using the Sinkhorn algorithm [6.3] 本稿では,インパクトに基づく公正ランキング問題に対する高速な解法を提案する。
提案アルゴリズムは高品質で,商用最適化ソフトウェアよりも約1000倍高速である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:21:24 GMT)
Generalized Principal-Agent Problem with a Learning Agent [6.2] 一般的な主要エージェント問題は、エージェントがプリンシパルのコミット戦略に最もよく反応する経済問題である。
エージェントが平均に基づく学習アルゴリズムを使用する場合、プリンシパルは非学習モデルよりもはるかに優れていることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:52:20 GMT)
Graph Mining under Data scarcity [6.2] 汎用グラフニューラルネットワーク(GNN)上に適用可能な不確実性推定フレームワークを提案する。
エンド・ツー・エンドの設定で、$n$-way、$k$-shotという古典的なエピソード学習パラダイムの下でこれらのモデルをトレーニングします。
提案手法は,GNNを用いたグラフ上のFew-shotノード分類における不確実性推定器の有効性を示すベースラインよりも優れる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:33:16 GMT)
ChatLang-8: An LLM-Based Synthetic Data Generation Framework for Grammatical Error Correction [6.2] そこで我々はChatLang-8という文法的誤り訂正タスクのための新しいデータセットを提案する。
ChatLang-8は、人間に似た文法エラーを特徴とする100万対で構成されている。
GECデータセットの代わりにChatLang-8を使用する場合のモデル性能の改善を観察する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:06:34 GMT)
Eyeballing Combinatorial Problems: A Case Study of Using Multimodal Large Language Models to Solve Traveling Salesman Problems [6.2] MLLM(Multimodal Large Language Models)は、多言語多言語モデル(MLLM)である。
本稿では,旅行セールスマン問題に対する「眼球」解に対するMLLMの視覚機能の利用について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:41:08 GMT)
OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments [6.1] オンリートラベル・ワン・プランナー」は複雑な環境下で繰り返し経路を減少させる効率的な探索プランナーである。
高速フロンティア更新、視点評価、視点改善が含まれる。
探査時間と移動距離を10%から20%削減し、フロンティア検出の速度を6~9倍向上させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:23:48 GMT)
Progressive Query Expansion for Retrieval Over Cost-constrained Data Sources [6.1] ProQEはプログレッシブなクエリ拡張アルゴリズムで、より多くのドキュメントを取得すると、クエリを反復的に拡張する。
その結果, ProQEは最先端のベースラインを37%上回り, 費用対効果が最も高いことがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:30:19 GMT)
A Latent Space Metric for Enhancing Prediction Confidence in Earth Observation Data [6.1] 本研究では,地球観測(EO)データを用いた回帰作業において,機械学習モデル予測における信頼度を推定するための新しい手法を提案する。
変動型オートエンコーダアーキテクチャを利用して、EOデータセットの潜在空間表現による信頼度を導出する。
本研究は,イタリア・ヴェネト地方とドイツのアッパーライン・バレーのEOデータセットに焦点をあて,蚊の集団に大きく影響された地域を対象としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:00:22 GMT)
Connected Speech-Based Cognitive Assessment in Chinese and English [6.1] 本稿では,コネクテッド音声の分析による認知機能評価のための新しいベンチマークデータセットと予測タスクを提案する。
このデータセットは、認知障害のレベルが異なる中国語と英語の話者のための音声サンプルと臨床情報で構成されている。
予測タスクは、軽度の認知障害診断と認知テストスコア予測を含む。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:04:29 GMT)
Random Features Approximation for Control-Affine Systems [6.1] 制御アフィン構造をキャプチャする非線形特徴表現の2つの新しいクラスを提案する。
提案手法はランダムな特徴(RF)近似を用いて,より少ない計算コストでカーネル手法の表現性を継承する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:32:16 GMT)
LLAMAFUZZ: Large Language Model Enhanced Greybox Fuzzing [6.0] 特殊なファジィザは複雑な構造化データを扱うことができるが、文法にさらなる努力が必要であり、低スループットに悩まされる。
本稿では,構造化データに対するグレーボックスファジングを強化するために,Large Language Modelを活用する可能性について検討する。
LLMベースのファザであるLLAMAFUZZは、LLMのパワーを統合して、構造化データをファザリングに理解し、変更する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:48:28 GMT)
GridPE: Unifying Positional Encoding in Transformers with a Grid Cell-Inspired Framework [5.9] 最近の神経科学的な発見は、空間表現の基本的な神経成分としてのグリッド細胞の役割を強調している。
本稿では,フーリエ解析にインスパイアされた新しい位置符号化手法とグリッドセルに関する計算神経科学の最新知見を紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:25:11 GMT)
Can Foundation Models Reliably Identify Spatial Hazards? A Case Study on Curb Segmentation [5.9] カーブは、安全な歩行者ゾーンを車載交通の危険から解放する重要な境界として機能する。
縁石の視覚的識別は、都市環境における安全なナビゲーションを補助する補助技術において最重要である。
主要な基礎モデルをベンチマークするために,これまでで最大規模のセグメンテーションデータセットを導入します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:22:49 GMT)
Low Rank Multi-Dictionary Selection at Scale [5.8] LRMDSという低ランクスパース符号化のための多次元原子選択手法を提案する。
我々は,合成データセットと実世界のデータセットの両方において,LRMDSのスケーラビリティを実証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:40:45 GMT)
Rethinking the impact of noisy labels in graph classification: A utility and privacy perspective [5.6] データプライバシとモデルユーティリティの観点から,ノイズラベルがグラフ分類に与える影響を測定した。
雑音ラベル付きグラフ分類を用いた頑健なグラフニューラルネットワーク手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:44:37 GMT)
RecMoDiffuse: Recurrent Flow Diffusion for Human Motion Generation [5.5] RecMoDiffuseは時間モデリングのための新しい再帰拡散定式化である。
人間の動作の時間的モデリングにおけるRecMoDiffuseの有効性を実証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:25:37 GMT)
Learning Minimal NAP Specifications for Neural Network Verification [5.5] ニューラルネットワークが与えられたら、ネットワークの堅牢性の形式的検証に十分な最小限の(最も粗い)NAPを見つける。
我々の正確なアプローチは、検証ツールを利用して、決定論的または統計的に最小限のNAP仕様を見つけます。
実験結果から,NAP仕様は最も洗練されているNAP仕様に比べて,ニューロンの分数が少ないことが示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:25:06 GMT)
Block-Diagonal Orthogonal Relation and Matrix Entity for Knowledge Graph Embedding [5.5] 知識グラフ埋め込み (KGE) は、実体の低次元表現と、行方不明な事実を予測するための関係を学習することである。
我々は,エンティティの行列と関係のブロック対角行列を用いた新しいKGEモデルOrthogonalEを紹介する。
実験結果から,我々の新しいKGEモデルOrthogonalEは汎用的かつ柔軟であり,最先端のKGEモデルよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:58:42 GMT)
Haptic Repurposing with GenAI [5.4] Mixed Realityは、デジタル世界と物理的な世界を融合して、没入型人間とコンピュータのインタラクションを作ることを目指している。
本稿では,Haptic Repurposing with GenAIを紹介し,任意の物理オブジェクトをAI生成仮想アセットの適応型触覚インターフェースに変換することによってMRインタラクションを強化する革新的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:06:28 GMT)
FLUX: Fast Software-based Communication Overlap On GPUs Through Kernel Fusion [5.4] 本稿では,GPUに依存する計算で通信遅延を著しく隠蔽する新しいFlux法を提案する。
Fluxは核融合によって最大96%の通信を重複させる可能性がある。
全体としては、様々なGPU世代と相互接続を持つ128GPUのクラスタ上で、Megatron-LM上でのトレーニングのために、最大1.24倍のスピードアップを達成することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:17:39 GMT)
HC-Mamba: Vision MAMBA with Hybrid Convolutional Techniques for Medical Image Segmentation [5.3] 本稿では,現代空間モデルMambaに基づく新しい医用画像分割モデルHC-Mambaを提案する。
HC-Mambaモデルに拡張畳み込み手法を導入し,より広い範囲の文脈情報を取得する。
さらに、HC-Mambaモデルでは、深度的に分離可能な畳み込みを採用し、パラメータの数とモデルの計算能力を大幅に削減する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:07:02 GMT)
SpikePipe: Accelerated Training of Spiking Neural Networks via Inter-Layer Pipelining and Multiprocessor Scheduling [5.3] トレーニングスパイキングニューラルネットワーク (Training Spiking Neural Networks, SNN) は、従来のニューラルネットワークに比べて計算コストが高い。
本稿では,シストリックアレイベースのプロセッサとマルチプロセッサスケジューリングを用いて,SNNのトレーニングを高速化するための層間パイプライニングを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:43:45 GMT)
Let Go of Your Labels with Unsupervised Transfer [5.3] データセットのラベル付けを検索する際に、完全に教師なしの転送が発生することを示す。
本稿では、この指針原理を効果的に活用し、基礎となるラベリングを明らかにするための、完全に教師なしの方法であるTURTLEを提案する。
TURTLEを26のデータセットからなる多様なベンチマークスイートで評価し、新しい最先端の教師なし性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:14:04 GMT)
Cubic* criticality emerging from a quantum loop model on triangular lattice [5.3] 三角格子量子ループモデル(QLM)は、ネマティック、ビソンプラケット(VP)結晶と、ロクサー・キヴェルソン量子臨界点に近い$mathbb$量子スピン液体(QSL)の豊富な基底状態相図をホストしていることを示す。
これらの解は、統計場理論と量子場理論の両方に直ちに関係し、また、リドベルク原子配列や量子モワール材料で急速に成長する実験にも関係している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:52:39 GMT)
Automated Question Generation for Science Tests in Arabic Language Using NLP Techniques [5.2] 本研究は,3段階のプロセス上に構築されたイノベーティブなアラビア質問生成システムを提案する。
提案手法と結果は83.50%の精度、78.68%のリコール、80.95%のFlスコアを示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:27:45 GMT)
DSig: Breaking the Barrier of Signatures in Data Centers [5.1] DSigは、データセンターシステムにおける署名、送信、検証のために1桁のマイクロ秒レイテンシを実現する最初のデジタル署名システムである。
我々は,前景で検証された安価なシングルユースハッシュベースの署名と,背景で事前に検証された従来のシグネチャを組み合わせた,新しいハイブリッドシグネチャ方式を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:44:16 GMT)
Breaking Free: Efficient Multi-Party Private Set Union Without Non-Collusion Assumptions [5.0] マルチパーティ・プライベート・セット・ユニオン(MPSU)プロトコルにより、$m$$(m > 2)$パーティがそれぞれセットを保持し、集合のユニオンをまとめて計算することができる。
本稿では,標準半高次モデルにおいて,暗黙の転送と対称鍵技術に基づく最初のMPSUプロトコルを提案する。
当社のプロトコルでは,それぞれ220ドルのアイテムをセットした3つのパーティに対して,オンラインフェーズで3.6ドル秒しか必要としない。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:10:45 GMT)
Dual Thinking and Perceptual Analysis of Deep Learning Models using Human Adversarial Examples [5.0] 視覚における双対思考の知覚は、直感的および論理的処理からの推論が異なるイメージを必要とする。
我々は、人間の視覚における二重思考の枠組みの証拠を提供するために、敵対的データセットを導入する。
また,人間の視覚の計算モデルとして分類モデルを用いた場合の批判についても検討した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:50:34 GMT)
Entropy-Reinforced Planning with Large Language Models for Drug Discovery [5.0] Entropy-Reinforced Planning for Transformer Decodingは、Entropy-Reinforceed Planningアルゴリズムを用いてTransformer Decodingプロセスを強化する。
我々はSARS-CoV-2ウイルス(3CLPro)とヒト癌細胞標的タンパク質(RTCB)のベンチマークでアルゴリズムを評価した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:29:13 GMT)
Learning Anatomically Consistent Embedding for Chest Radiography [5.0] 本稿では,医用画像解析のための新しいSSL手法PEAC(パッチ埋込み解剖学的整合性)を提案する。
具体的には、安定したグリッドベースのマッチング、事前学習されたPEACモデルを様々な下流タスクに転送することで、グローバルおよびローカルなコンバーテンシーを学習することを提案する。
我々はPEACが既存の最先端の完全/自己管理手法よりもはるかに優れた性能を発揮することを広く実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:17:59 GMT)
ReduceFormer: Attention with Tensor Reduction by Summation [5.0] 注意を払って効率よく最適化されたモデルのファミリーであるReduceeFormerを紹介します。
ReduceFormerは、reduceやement-wise multiplicationといった単純な操作のみを活用するため、アーキテクチャが大幅に単純化され、推論性能が向上した。
提案するモデルファミリは,計算資源とメモリ帯域幅が限られているエッジデバイスや,高いスループットを求めるクラウドコンピューティングに適している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:28:09 GMT)
FAULT+PROBE: A Generic Rowhammer-based Bit Recovery Attack [4.9] Rowhammerは、不正な攻撃者がDRAMセル内でエラーを誘発するセキュリティ脆弱性である。
FAULT+PROBEは,確認後故障チェック機構を回避するために用いられる可能性がある。
256ビットセッションキーを平均回復率22ビット/時間,100%の成功率で回収する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:00:47 GMT)
The Future of Software Engineering in an AI-Driven World [4.9] 今後5年間では、人間開発者とAIの共生的なパートナーシップが増加するだろう。
私たちは、AI駆動の世界におけるソフトウェア開発の未来に関するビジョンを示し、このビジョンを実現するために研究コミュニティが取り組むべき重要な課題を探求します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:46:19 GMT)
Sparse Bayesian Networks: Efficient Uncertainty Quantification in Medical Image Analysis [4.9] 疎(部分)ベイズネットワークのトレーニング手順を導入する。
両表現の利点を利用して高いタスク固有性能を実現し,予測の不確実性を最小化する。
提案手法はベイズパラメータを95%以上削減し,競合性能と予測不確実性を推定する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:12:00 GMT)
A generic and robust quantum agent inspired by deep meta-reinforcement learning [4.9] 深部メタ強化学習(深部メタRL)にヒントを得た新しいトレーニングアルゴリズムを開発する。
トレーニングされたニューラルネットワークは適応的で堅牢である。
また,ターゲットゲート生成に必要なパルス数を自動的に調整できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:04:30 GMT)
Large Language Models for Constrained-Based Causal Discovery [4.9] 因果関係は経済、脳、気候といった複雑なシステムを理解するのに不可欠である。
この研究は、因果グラフ生成のためのドメインエキスパートの代替として、LLM(Large Language Models)の能力を探求する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:45:24 GMT)
Conformalized Teleoperation: Confidently Mapping Human Inputs to High-Dimensional Robot Actions [4.9] 低次元人間の入力から高次元ロボット動作へのマッピングを学習する。
我々のキーとなる考え方は、訓練時に補助地図を適応させ、高次元のアクション量子化を付加的に見積もることである。
本研究では,不確実なユーザ入力やロボットの状態を検出する不確実なインターバル機構を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:16:46 GMT)
Question-Answering (QA) Model for a Personalized Learning Assistant for Arabic Language [4.8] 本稿では,アラビア語用にカスタマイズされたBERTトランスフォーマーを用いたパーソナライズされた学習アシスタントのための質問応答モデルの作成,最適化,評価について述べる。
私たちのアプローチでは、理科教育の分野における質問に対する正しい回答を自動的に生成するためにBERTの素晴らしい能力を使用します。
このモデルは、パレスチナのカリキュラムで11年生と12年生の生物学の本を用いて微調整することで、関連する情報を理解し、抽出する能力を向上させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:23:31 GMT)
Scholarly Question Answering using Large Language Models in the NFDI4DataScience Gateway [4.7] 本稿では,NFDI4DataScience Gateway上に,学術質問応答システム(QA)を導入する。
NFDI4DS Gatewayは、基礎的なフレームワークとして、さまざまな科学データベースをクエリするための統一的で直感的なインターフェースを提供する。
実験分析により,ゲートウェイと学術的なQAシステムの有効性を実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:36:19 GMT)
Marginalization Consistent Mixture of Separable Flows for Probabilistic Irregular Time Series Forecasting [4.7] 我々は,新しい確率的不規則時系列予測モデル,Marginalization Consistent Mixtures of Separable Flows (moses)を開発した。
mosesは、他の最先端のマーカライゼーション一貫性モデルより優れ、ProFITiと同等だが、ProFITiと異なり、マーカライゼーション一貫性を保証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:28:43 GMT)
Making 'syscall' a Privilege not a Right [4.7] nexpoline は Memory Protection Keys (MPK) と Seccomp or Syscall User Dispatch (SUD) を組み合わせたセキュアなsyscallインターセプション機構である。
nexpolineはバイナリ書き換えを安全にインターセプトできるので、ptraceのようなセキュアなインターセプション技術よりも効率がよい。
特に、カーネルの変更なしに動作し、ルート権限を必要とせず、現在のLinuxシステムで実行可能である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:33:56 GMT)
Delving into ChatGPT usage in academic writing through excess vocabulary [4.6] 大きな言語モデル(LLM)は、人間レベルのパフォーマンスでテキストを生成し、修正することができる。
しかし、多くの科学者が学術的な執筆を支援するためにそれを使ってきた。
2010年から2024年までの1400万のPubMed抽象語の語彙変化について検討し、LLMの出現がある種の単語の出現頻度の急激な増加につながったことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:16:34 GMT)
Knowledge Distillation of LLM for Automatic Scoring of Science Education Assessments [4.5] 本研究では,超微調整大言語モデル(LLM)の知識蒸留(KD)手法を提案する。
リソース制約のあるデバイスにこれらのモデルをデプロイするという課題を特にターゲットとしています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:01:09 GMT)
Improving the realism of robotic surgery simulation through injection of learning-based estimated errors [4.5] 現在のシミュレーターでは、ロボットは完璧またはほぼ完璧に正確であり、物理的に代表されるものではない。
本研究では,物理ロボットから収集したデータによってトレーニングされたニューラルネットワークのペアを提案し,制御誤差と運動的・非運動的誤差の両方を推定する。
これらの誤差推定はシミュレータ内で注入され、物理ロボットの特徴的性能を持つ模擬ロボットを生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:41:56 GMT)
Beyond Words: On Large Language Models Actionability in Mission-Critical Risk Analysis [4.5] リスク分析の原則はコンテキストレスです。
リスク分析には、国内外の規制や基準に関する膨大な知識が必要である。
大規模な言語モデルは、人間よりも少ない時間で情報を素早く要約することができ、特定のタスクに微調整することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:20:27 GMT)
Exploring Traffic Crash Narratives in Jordan Using Text Mining Analytics [4.5] この研究は、2018-2022年の7,587件の記録をカバーしたヨルダンの5つの主要高速道路の事故データを収集した。
事故データからパターンを学習するために,教師なし学習法を採用した。
その結果,テキストマイニング分析は有望な手法であり,交通事故の多因子的性質を裏付けるものであることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:07:39 GMT)
Memory Gym: Towards Endless Tasks to Benchmark Memory Capabilities of Agents [4.4] Memory GymはMortar Mayhem、Mystery Path、Searing Spotlightsという2D部分的に観測可能な環境のスイートを提供する。
これらの環境は、意思決定エージェントのメモリ能力をベンチマークするために設計されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:06:15 GMT)
AI Radiologist: Revolutionizing Liver Tissue Segmentation with Convolutional Neural Networks and a Clinician-Friendly GUI [4.3] AIラジオロジスト」は、畳み込みニューラルネットワーク(ConvNets)を用いた肝臓組織分割のためのグラフィカルユーザインタフェース(GUI)ツールである
オフラインで利用できるAIラジオロジストは、すべての肝臓組織をセグメンテーションするためにトレーニングされた3つのConvNetモデルを利用している。
肝臓、腫瘍、血管の2Dスライスを出力し、.objおよび.mtlフォーマットの3Dを出力し、任意の3D互換ソフトウェアを使って視覚化/印刷できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:10:16 GMT)
Is One GPU Enough? Pushing Image Generation at Higher-Resolutions with Foundation Models [4.3] 我々はPixelsmithを紹介した。これはゼロショットのテキスト・ツー・イメージ生成フレームワークで、1つのGPUで高解像度の画像をサンプリングする。
我々は,事前学習した拡散モデルの出力を1000倍に拡大できることを初めて示し,ギガピクセル画像生成への道を開いた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:33:33 GMT)
Decentralized Social Networks and the Future of Free Speech Online [4.2] MastodonやBlueSkyのような分散ソーシャルネットワークは近年注目を集め、議論の的となっている。
本稿では、分散化プロジェクトによるオンラインコミュニケーションの展望を批判的に評価する。
フリースピーチの規範的理論を用いて、分散化設計がユーザの表現の自由をオンラインで促進するかどうかを検証している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:18:53 GMT)
RGB-Sonar Tracking Benchmark and Spatial Cross-Attention Transformer Tracker [4.2] 本稿では,新しいRGB-Sonar(RGB-S)トラッキングタスクを提案する。
RGBとソナーモダリティの相互作用により、水中の標的の効率的な追跡を実現する方法について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:01:11 GMT)
RAD: A Comprehensive Dataset for Benchmarking the Robustness of Image Anomaly Detection [4.2] 本研究では,自由なビュー,不均一な照度,ぼやけたコレクションを備えたロバスト異常検出データセットを提案する。
RADは、ワーキングプラットフォーム上の異物を異常として識別することを目的としている。
RADを用いた非教師ありゼロショット法11点の評価と解析を行った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:39:44 GMT)
Realistic Data Generation for 6D Pose Estimation of Surgical Instruments [4.2] 手術器具の6次元ポーズ推定は,手術操作の自動実行を可能にするために重要である。
家庭や工業環境では、3Dコンピュータグラフィックスソフトウェアで生成された合成データが、アノテーションコストを最小限に抑える代替手段として示されている。
本稿では,大規模・多様なデータセットの自動生成を可能にする外科ロボティクスのシミュレーション環境の改善を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:59:29 GMT)
Transformer Models in Education: Summarizing Science Textbooks with AraBART, MT5, AraT5, and mBART [4.2] 我々はアラビア語の教科書を対象とする高度なテキスト要約システムを開発した。
このシステムは、パレスチナのカリキュラムにおいて、11年生と12年生の生物学教科書で見られる最も重要な文章を評価し、抽出する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:14:09 GMT)
On the Effects of Data Scale on Computer Control Agents [4.1] 我々は,ファインチューニング単独が現実のコンピュータ制御エージェント構築の有効なアプローチであるかどうかを考察する。
新しいデータセットであるAndroidControlをリリースし、Androidアプリによる日々のタスクのデモ15,283件で構成されています。
ドメインを微調整したモデルでテストすると、ゼロと数ショットのベースラインを上回り、ロバストなパフォーマンスを単純により多くのデータを収集して得られるようにスケールすることがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:19:38 GMT)
Coherent Erbium Spin Defects in Colloidal Nanocrystal Hosts [4.1] 酸化セリウムナノ結晶ホストでドープされたEr3+イオンにおけるスピンコヒーレンスの約1マイクロ秒間を実証した。
核スピンフリーホスト材料における瞬時拡散限界以下のドーパント密度を減少させることにより、長いスピンコヒーレンスを実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:55:18 GMT)
Evaluating Contextually Personalized Programming Exercises Created with Generative AI [4.0] 本報告では,GPT-4で作成した文脈別にパーソナライズされたプログラミング演習を含む,選択型プログラミングコースにおけるユーザスタディについて報告する。
その結果, GPT-4で発生する運動の質は概して高かった。
これは、AIが生成するプログラミング問題は、入門プログラミングコースに付加価値があることを示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:59:52 GMT)
A Tool for Test Case Scenarios Generation Using Large Language Models [3.9] この記事では、エピックやハイレベルなユーザストーリーとして、ユーザ要求を生成することに焦点を当てます。
LLMベースのエージェントを使用して、テストケースシナリオの自動生成をエンジニアリングに促す、Webベースのソフトウェアツールを導入している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:26:13 GMT)
Joint Learning of Context and Feedback Embeddings in Spoken Dialogue [3.9] コントラスト学習目標を用いて,同じ表現空間に短い対話コンテキストとフィードバック応答を埋め込む可能性を検討する。
実験結果から,本モデルは人間に同じランキングタスクを施し,学習された埋め込みはフィードバック応答の会話機能に関する情報を伝達することがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:22:37 GMT)
Sparsity in neural networks can improve their privacy [3.9] 本稿は、ニューラルネットワークがメンバーシップ推論攻撃に対していかに堅牢になるかを測る。
得られた実験結果から,ネットワークの疎結合性はネットワークのプライバシを向上し,手前のタスクに匹敵する性能を保っていることが示された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:10:46 GMT)
PreSto: An In-Storage Data Preprocessing System for Training Recommendation Models [3.8] PreSto - In-Storage Processing (ISP)を利用したストレージ中心の事前処理システム
PreStoは、CPU中心のベースラインシステムよりも9.6倍のスピードアップを実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:26:45 GMT)
Which Country Is This? Automatic Country Ranking of Street View Photos [3.8] 私たちは、写真が撮影されている国を推測するライブシステムである Country Guesserを紹介します。
特に、Googleストリートビューの画像が与えられた場合、当社のフェデレーションランキングモデルは、コンピュータビジョン、機械学習、テキスト検索の手法を組み合わせています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:06:09 GMT)
Improving Multi-hop Logical Reasoning in Knowledge Graphs with Context-Aware Query Representation Learning [3.7] 知識グラフのマルチホップ論理的推論は自然言語処理において重要な課題である。
本稿では,既存のマルチホップ論理推論手法の有効性を高めるモデルに依存しない手法を提案する。
提案手法は,3つのマルチホップ推論基盤モデルを継続的に強化し,最大19.5%の性能向上を実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:48:20 GMT)
Automated Pavement Cracks Detection and Classification Using Deep Learning [3.7] 本稿では, 道路舗装の亀裂の検出と分類を, 有名なYou Only Look Once (YOLO) バージョン5 (YOLOv5) とバージョン8 (YOLOv8) のアルゴリズムを用いて行う手法を提案する。
実験結果から, 照明条件と画像サイズが異なる場合, 舗装き裂検出精度は67.3%に達することがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:47:41 GMT)
Advancing Roadway Sign Detection with YOLO Models and Transfer Learning [3.7] 我々は、異なる照明条件下で異なる道路標識を検出し、分類するためにYOLOv5とYOLOv8を変更した。
YOLOv8モデルでは、エポックの数やバッチサイズによって、テストセットで94.6%から97.1%まで、一貫したMAP50スコアが得られる。
YOLOv5モデルは競合性能を示し、MAP50のスコアは92.4%から96.9%である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:00:52 GMT)
Gene-Level Representation Learning via Interventional Style Transfer in Optical Pooled Screening [3.7] 光プールスクリーニング(OPS)を用いて得られた遺伝的摂動細胞の画像から、遺伝子レベルの特徴表現を学習するためのスタイル変換アプローチを採用する。
本手法は,遺伝子機能に応じた遺伝子表現のクラスタリングにおける工学的特徴よりも優れ,潜伏する生物学的関係を明らかにするために有用であることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:56:50 GMT)
LangCell: Language-Cell Pre-training for Cell Identity Understanding [3.7] 我々は,事前学習期間中に,単一セルデータと自然言語の統一表現であるLangCellを紹介する。
以上の結果から,ゼロショットセル識別理解シナリオにおいて効果的に機能できる単一セルPLMはLangCellのみであることが示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:31:13 GMT)
Cooperative Sensing with Impurities in a Two-Dimensional Subwavelength Array [3.6] 本稿では,2次元サブ波長原子配列に不純物として埋め込まれた2つの散逸結合した遠方原子をベースとした多用途量子センシングプロトコルを提案する。
不純物原子の1つの集団を監視することにより、エミッタ共鳴における周波数シフトを検出することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:00:04 GMT)
Facial Misrecognition Systems: Simple Weight Manipulations Force DNNs to Err Only on Specific Persons [3.6] 顔認識モデルに新しい種類のバックドアを組み込む方法を示す。
このようなバックドアシステムは、特定の人物の2つの画像を異なる人物として分類できることを示す。
我々は,SOTA顔認識システムに対する攻撃を実験的に検証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:54:15 GMT)
Comment on paper: Position: Rethinking Post-Hoc Search-Based Neural Approaches for Solving Large-Scale Traveling Salesman Problems [3.6] 我々はSoftDistの論文(Xia et al.)の2つの主要な問題を特定する。
同じハードウェア環境で異なるベースラインのすべてのステップを実行することの失敗と、一貫性のない時間測定の使用は、欠陥のある結論につながる。
すべてのステップが同じハードウェア環境で実行される場合、SoftDistの主要なクレームはもはやサポートされない。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:14:19 GMT)
A simple connection from loss flatness to compressed representations in neural networks [3.6] ディープニューラルネットワークにおける学習の最終段階において、ニューラルネットワークの多様体の圧縮は、SGDが探索したミニマのまわりの損失の平坦さと相関することを示す。
我々の研究はMaとYingによる線形安定性の洞察に基づいており、様々な圧縮測定値と鋭さを含む量の不等式を導出する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:11:28 GMT)
A benchmark dataset for deep learning-based airplane detection: HRPlanes [3.5] Google Earth(GE)の画像を用いて,高分解能平面(HRPlanes)と呼ばれる新しい航空機検出データセットを作成する。
HRPlanは、様々な衛星から得られた様々な地形、季節、衛星の幾何学的条件を表すために、世界中の様々な空港のGE画像を含む。
予備的な結果から,提案したデータセットは将来のアプリケーションに有用なデータソースとベンチマークデータセットとなる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:04:06 GMT)
On the Convergence of Loss and Uncertainty-based Active Learning Algorithms [3.5] 本研究では、勾配降下法(SGD)アルゴリズムを用いて機械学習モデルの学習に必要な収束率とデータサンプルサイズについて検討する。
線形分類器と線形分離可能なデータセットに対する2乗ヒンジ損失と類似のトレーニング損失関数を用いた収束結果を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:17:57 GMT)
On the Communication Complexity of Secure Multi-Party Computation With Aborts [3.5] 暗号の中心的な目標は、セキュアマルチパーティ計算(MPC)である。
MPCは、当事者の大多数が悪意がある場合に、すべての当事者へのアウトプット配信を保証する。
本稿では,MPCの通信複雑性について検討し,このモデルでほぼ最適なプロトコルを考案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:15:39 GMT)
On the Hölder Stability of Multiset and Graph Neural Networks [3.4] 分離品質を向上した2つの新しいMPNNを提案する。
これらのMPNNは、敵の例を簡単に分類でき、標準的なグラフ学習タスクにおける標準MPNNと良好に比較できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:28:21 GMT)
Personalized Product Assortment with Real-time 3D Perception and Bayesian Payoff Estimation [3.4] リアルタイムレコメンデーションシステムを導入する。
本システムは,3次元コンピュータビジョンの最近の進歩を,認識と自動的,きめ細かな販売推定に活用する。
ドリンク製品を用いた2~8週間のA/Bテストで実店舗でテストを行い,それぞれ35%,27%の売り上げ増を示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:23:54 GMT)
Improving Commonsense Bias Classification by Mitigating the Influence of Demographic Terms [3.4] コモンセンス知識における人口統計学用語の存在は、NLPモデルの性能を妥協する潜在的リスクを生じさせる。
人口統計学用語の影響を緩和する3つの方法が提案されている。
実験の結果、第1の手法はベースライン上の精度を2.33%向上し、第2の手法は標準拡張法よりも0.96%向上した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:09:16 GMT)
StreamPrompt: Learnable Prompt-guided Data Selection for Efficient Stream Learning [3.3] ストリーム学習(SL)は、連続したデータストリームに迅速に適応するモデルを必要とする。
近年のSL法は、トレーニング用のデータサブセットを選択することで効率性を強調している。
本稿では、動的で学習可能なプロンプトを通じてデータ選択を強化する方法であるStreamPromptを紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:46:41 GMT)
ElasticRec: A Microservice-based Model Serving Architecture Enabling Elastic Resource Scaling for Recommendation Models [3.3] ElasticRecはRecSysのアーキテクチャを提供するモデルである。
リソースの弾力性と高いメモリ効率を提供する。
メモリ割り当てサイズが平均3.3倍、メモリユーティリティが8.1倍向上する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:25:48 GMT)
VTrans: Accelerating Transformer Compression with Variational Information Bottleneck based Pruning [3.3] 本稿では,変分情報ボトルネック (VIB) の原理によって導かれる反復的刈り取りフレームワーク VTrans を提案する。
提案手法は,VIBトレーニングマスクを用いた埋め込み,アテンションヘッド,層など,すべての構造成分を圧縮する。
特に,本手法は従来の最先端手法よりも最大70%圧縮を実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:11:43 GMT)
reBandit: Random Effects based Online RL algorithm for Reducing Cannabis Use [3.1] 大麻の使用と関連する大麻使用障害(CUD)は、世界中の公衆衛生上の問題を引き起こす。
我々はreBanditと呼ばれるオンライン強化学習(RL)アルゴリズムを開発し、パーソナライズされたモバイルヘルス介入を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:35:20 GMT)
WEIRD ICWSM: How Western, Educated, Industrialized, Rich, and Democratic is Social Computing Research? [3.1] 我々は,AAAI ICWSMカンファレンスで行った研究において,WEIRD人口に対する依存度を評価した。
その結果、これらの論文の37%は、欧米のデータにのみ焦点をあてていることがわかった。
ICWSMの研究では、教育、工業化、富の国からの人口を主に調査している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:34:09 GMT)
A Unified Framework for Integer Programming Formulation of Graph Matching Problems [3.0] 本研究の目的は,グラフマッチング問題のIP定式化のための統一的なフレームワークを提供することである。
このフレームワークには、文献における様々なグラフ最適化の問題が含まれている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:20:45 GMT)
A Synthetic Dataset for Personal Attribute Inference [2.9] LLMsは、オンラインのテキストから個人情報を正確に推測する能力だ。
個人属性を手動でラベル付けした7800以上のコメントからなる多様な合成データセットであるSynthPAIを生成する。
我々のデータセットを人間による研究で検証し、人間が実際のコメントを区別するタスクにおいて、ランダムな推測をわずかに上回っていることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:50:53 GMT)
Advancing Annotation of Stance in Social Media Posts: A Comparative Analysis of Large Language Models and Crowd Sourcing [2.9] ソーシャルメディア投稿における自動テキストアノテーションのための大規模言語モデル(LLM)は、大きな関心を集めている。
ソーシャルメディア投稿において,8つのオープンソースおよびプロプライエタリなLCMの性能分析を行った。
「我々の研究の顕著な発見は、姿勢を表わす文章の明快さが、LLMの姿勢判断が人間とどのように一致しているかにおいて重要な役割を担っていることである。」
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:26:07 GMT)
Stepwise Regression and Pre-trained Edge for Robust Stereo Matching [2.9] 本稿では,SR-Stereoと呼ばれる新しいステレオマッチング手法を提案する。
また,事前訓練されたエッジ(DAPE)に基づくドメイン適応手法を提案する。
これらの手法は,SceneFlow,KITTI,Middbury 2014,ETH3Dで広く評価されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:25:25 GMT)
Mining Frequent Structures in Conceptual Models [2.8] 本稿では,概念モデリング言語における頻繁な構造発見問題に対する一般的なアプローチを提案する。
我々は,頻繁な部分グラフマイニングアルゴリズムとグラフ操作手法を組み合わせる。
主な目的は、言語エンジニアのためのサポート施設を提供することである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:24:02 GMT)
Decipherment-Aware Multilingual Learning in Jointly Trained Language Models [2.8] 共同学習手法は、教師なし多言語学習において重要な解読過程であることを示す。
情報理論の観点からは、難解な解読設定におけるトークンアライメントの重要性を示す。
最後に、mBERTに語彙アライメントを適用し、異なる語彙群を下流のパフォーマンスに合わせることの寄与について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:10:30 GMT)
Quantifying Local Model Validity using Active Learning [2.8] 機械学習モデルの現実的な応用は、しばしば法律やポリシーに基づく規制の対象となる。
これらの規則のいくつかはモデルの妥当性を保証することを必要とし、すなわち近似誤差は閾値よりも小さい。
本稿では,モデル誤差を学習し,有効学習を通じて必要なデータ量を減らしながら,局所的妥当性推定値を取得することを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:20:28 GMT)
Efficient Topology-aware Data Augmentation for High-Degree Graph Neural Networks [2.8] 高次グラフ(HDG)上のグラフニューラルネットワーク(GNN)のための効率的かつ効果的なフロントマウントデータ拡張フレームワークであるTADを提案する。
内部では、(i)構造埋め込みによる機能拡張と(ii)トポロジと属性対応グラフのスパース化という、2つの重要なモジュールが含まれている。
TADAは、ノード分類の観点から8つの実ホモ親和性/ヘテロ親和性HDG上でのメインストリームGNNモデルの予測性能を大幅に改善する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:36:37 GMT)
Fetch-A-Set: A Large-Scale OCR-Free Benchmark for Historical Document Retrieval [2.7] このベンチマークには、紀元前2世紀にさかのぼる膨大な文書が収められている。
文化遺産の領域における複雑な抽出作業に焦点をあてることで、文学における重要なギャップを埋める。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:45:00 GMT)
Pseudoentropy sum rule by analytical continuation of the superposition parameter [2.7] 重ね合わせ状態の擬エントロピーと絡み合いエントロピーを接続する和則を確立する。
この枠組みの中では、(還元された)遷移行列、擬R'enyiエントロピー、擬エントロピーの和規則を自然に導出する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:31:52 GMT)
Mitigating Oversmoothing Through Reverse Process of GNNs for Heterophilic Graphs [2.7] グラフニューラルネットワーク(GNN)は拡散過程に似ており、多くの層を積み重ねる際の学習表現の過度な平滑化につながる。
本稿では, 逆過程の設計原理をGNNの3つの変種に適用する。
逆処理によって予測性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:35:27 GMT)
Partially Observed Trajectory Inference using Optimal Transport and a Dynamics Prior [2.7] 軌道推論は、時間的限界のスナップショットから集団の時間的ダイナミクスを回復しようとする。
この潜在軌道推定問題を解くためにPO-MFLを導入する。
我々は arXiv:2205.07146 の MFL フレームワークを活用し、ダイナミックス調整した隣接時間境界間のエントロピーOT に基づくアルゴリズムを生成する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:21:15 GMT)
Enhancing CTC-based speech recognition with diverse modeling units [2.7] 近年,エンド・ツー・エンド(E2E)自動音声認識(ASR)モデルの進化が目覚ましい。
E2Eシステムの上に、研究者はE2EモデルのN-best仮説を音素モデルで再現することで、かなり精度を向上した。
本稿では,E2Eモデルと多種多様なモデリングユニットを併用した効率的な共同学習手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:03:31 GMT)
Should XAI Nudge Human Decisions with Explanation Biasing? [2.6] 本稿では、説明可能なAI(XAI)の説明に自動バイアスを導入するアプローチであるNudge-XAIの以前の試行についてレビューする。
Nudge-XAIは、説明を提供することや強調することの影響を予測し、強制せずにAI推奨の意思決定に向けてユーザーを誘導するユーザモデルを使用している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:53:07 GMT)
Trainwreck: A damaging adversarial attack on image classifiers [2.5] 本稿では,ターゲットコンピュータビジョン(CV)モデルにダメージを与える敵攻撃(DAA)について検討する。
DAAは脅威モデルを定義し、コスト関数DAAを最大化し、成功のための3つの要件 – 有効性、ステルス、カスタマイズ性 – を設定することで形式化される。
DAAの先駆者として,訓練データに類似したクラスのデータを混在させる列車時攻撃であるTrawreckを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:53:51 GMT)
Semantic Similarity Loss for Neural Source Code Summarization [2.4] 本稿では,ニューラルネットワークの要約における損失関数として意味的類似度尺度を用いる手法を提案する。
コード要約は、ソースコードの自然言語記述を記述するタスクである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:57:56 GMT)
Incompressibility and spectral gaps of random circuits [2.4] 可逆回路と量子回路は、交互群 $mathrmAlt (2n)$ とユニタリ群 $mathrmSU (2n)$ のランダムウォークを形成する。
ランダム可逆回路のギャップは、すべての$tgeq 1$に対して$Omega(n-3)$であり、ランダム量子回路のギャップは$Omega(n-3)$ for $t leq Theta(2n/2)$であることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:23:16 GMT)
Large Language Model-empowered multimodal strain sensory system for shape recognition, monitoring, and human interaction of tensegrity [2.3] 緊張に基づくシステムは、不均一で予測不可能な環境を動的に探索する上で有望なアプローチである。
本稿では,深層学習モデルと大規模言語モデルの両方を活用することで,24個のマルチモーダルひずみセンサと6本のストラット張力積分を導入する。
この緊張感は、自動でiPhoneにデータを送信してワイヤレス監視し、データ分析、説明、予測、提案を人間に提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:26:04 GMT)
Non-Hermitian spacetime and generalized thermofield double formalism [2.3] 我々は、状態を記述するために非エルミート遷移を導入することは自然かつ必要であることを示した。
非エルミート時空の構成と解釈について概説する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:44:48 GMT)
On the Limitation of Kernel Dependence Maximization for Feature Selection [2.3] 文献からの一般的な提案は、非パラメトリック依存尺度としてヒルベルト・シュミット独立基準(HSIC)を使用している。
この根拠には欠陥があり、HSICによる機能選択は重要な機能を見逃す可能性があることを実証しています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:56:13 GMT)
Methods for Recovering Conditional Independence Graphs: A Survey [2.3] 条件付き独立グラフ(CIグラフ)は、機能関係に関する洞察を得るために使用される。
異なる手法をリストアップし、CIグラフを復元する手法の進歩について研究する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:58:07 GMT)
DR-RAG: Applying Dynamic Document Relevance to Retrieval-Augmented Generation for Question-Answering [2.3] 文書検索のリコールと回答の精度を向上させるために,DR-RAG(Dynamic-Relevant Retrieval-Augmented Generation)を提案する。
DR-RAGは回答の精度を大幅に向上させ,質問応答システム(QA)の新たな進歩を実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:15:33 GMT)
Watching Swarm Dynamics from Above: A Framework for Advanced Object Tracking in Drone Videos [2.2] 本研究では,無人ドローン映像から海中の魚の群れを追跡する新しい手法を提案する。
我々のフレームワークは、2Dで古典的な物体追跡を行うだけでなく、映像データとドローン搭載センサー情報(GPSとIMU)を融合させることで、世界座標における魚学校の位置と空間的拡張を追跡する。
提示された枠組みにより、研究者は非侵襲的でスケーラブルな方法で、自然の社会的・環境的な文脈で魚学校の集団行動を研究することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:57:00 GMT)
Four-qubit photonic system for publicly verifiable quantum random numbers and generation of public and private key [2.2] 本研究では,4量子フォトニクスシステムを用いて,公に検証可能な量子乱数を生成する実験を行った。
我々は370kbpsの速度で、公証かつ純粋に保護されたランダムビットを生成する。
このことは、量子セーフなアプリケーションに小型のマルチキュービットフォトニクスシステムの実用性を実証している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:02:56 GMT)
A mechanical qubit [2.1] システム内のシングルフォノンのアンハーモニック性はデコヒーレンス率を6.8倍に超える。
私たちの研究は、量子シミュレーション、センシング、情報処理のための強力な量子音響プラットフォームに、もうひとつのユニークな機能を加えています。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:27:02 GMT)
The Treatment of Ties in Rank-Biased Overlap [2.1] ランク・バイアスド・オーバーラップ(RBO)は、不確定ランクの類似度尺度である。
同じクエリに対して検索した文書のランキングを比較することで,検索エンジン間の差異を分析するために広く利用されている。
残念なことに、RBOにおける結合の処理は表面的で不完全なままである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:10:22 GMT)
Occlusion-Aware Deep Convolutional Neural Network via Homogeneous Tanh-transforms for Face Parsing [2.1] 顔解析は、各意味的顔成分に対して画素単位のラベルマップを推論する。
4つのタン変換からなる画像前処理のための新しい均一なタン変換を提案する。
均質なtanh-transformsに基づいて,隠蔽顔解析のためのオクルージョン対応畳み込みニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:19:24 GMT)
On Kernel's Safety in the Spectre Era (Extended Version) [2.0] レイアウトのランダム化は、メモリ分離を伴うシステムにおいて、同等の安全性を保証できることを示す。
サイドチャネルと投機的実行を使用できる攻撃者に対しては,カーネルの安全性を回復できないことを示す。
この条件下では,レイアウトのランダム化に頼らずに安全であることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:04:58 GMT)
Minimum discrepancy principle strategy for choosing $k$ in $k$-NN regression [2.0] 保持データを用いずに、$k$-NN回帰推定器でハイパーパラメータ$k$を選択するための新しいデータ駆動戦略を提案する。
本稿では,早期停止と最小一致原理に基づく実践的戦略を実践的に容易に導入することを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:15:26 GMT)
Anomaly Detection on Unstable Logs with GPT Models [2.0] 本稿では,不安定なログの異常検出のための微調整LDMと代替モデルの実験的比較について報告する。
膨大なデータセット上でのLLMの事前トレーニングは、多様なパターンやコンテキスト情報の堅牢な理解を可能にする可能性がある。
GPT-3と他の教師付きアプローチの違いは、ログシーケンスの変化の度合いが増加するにつれて、より顕著になる傾向にある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:13:18 GMT)
Theoretical Analysis of Submodular Information Measures for Targeted Data Subset Selection [1.9] サブモジュール・ミューチュアル・インフォメーション(SMI)は、文学における複数のタスクにまたがって適用され、ターゲットとするサブセット選択を行う。
我々は、サブセットの関連性や対象データのカバレッジに対する感度の観点から、SMIの理論的保証を提供する。
複数のアプリケーションで実証的に成功を収めたSMI関数は、理論的には、クエリ関連性およびクエリカバレッジが良好であることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:15:08 GMT)
Strong Repulsive Lifshitz-van der Waals Forces on Suspended Graphene [1.9] 原子間力顕微鏡による懸濁グラフェンのLifshitz-vdW反発率の直接測定を行った。
以上の結果から, 懸濁2次元材料は内因的に反発面であり, 湿潤性は著しく低下したことが示唆された。
増幅された Lifshitz-vdW は、分子の活性化や制御された原子組立のような技術的機会を提供することができた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:50:43 GMT)
Adversarial flows: A gradient flow characterization of adversarial attacks [1.9] ニューラルネットワークに対する敵攻撃を行う一般的な方法は、いわゆる高速勾配符号法である。
我々は、離散化と関連する勾配流の収束性を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:20:26 GMT)
Open-Ended Multi-Modal Relational Reasoning for Video Question Answering [1.9] このエージェントの主な焦点は、ビデオベースのシーン内で言語ベースのインタラクションを使用する個人を支援することである。
提案手法は,ロボットエージェント内にビデオ認識技術と自然言語処理モデルを統合する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:12:52 GMT)
Average-exact mixed anomalies and compatible phases [1.8] この研究は、平均的および正確な対称性を持つ無秩序なシステムに焦点をあてる。
我々は、乱れた基底状態のアンサンブルを表す混合状態は、特徴のないものではないと論じる。
異常混合状態は, 清浄限界における異常適合相と円滑に結びついているが, 清浄限界相を持たない無秩序相も見いだされた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:21:13 GMT)
On the relation between trainability and dequantization of variational quantum learning models [1.8] 変分量子機械学習(QML)のトレーニング容易性と定式化の関係について検討する。
我々はPQCベースのQMLモデルを構築するためのレシピを紹介した。
しかしながら、我々の研究は、より一般的な構造を見つけるための道のりを指している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:59:20 GMT)
Training Dynamics of Nonlinear Contrastive Learning Model in the High Dimensional Limit [1.8] モデル重みの実験的分布は、マッキーン・ブラソフ非線形偏微分方程式(PDE)によって支配される決定論的尺度に収束する
L2正則化の下で、このPDEは低次元常微分方程式(ODE)の閉集合に還元する。
ODEの固定点位置とその安定性を解析し,いくつかの興味深い結果を示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:07:41 GMT)
Active Dendrites Enable Efficient Continual Learning in Time-To-First-Spike Neural Networks [1.7] 活性デンドライトで強化された新しいスパイキングニューラルネットワークモデルを提案する。
我々のモデルは、時間的に符号化されたSNNにおいて破滅的な忘れを効果的に軽減することができる。
エッジデバイスにおける現実的なデプロイメントを実現するための,新たなディジタルハードウェアアーキテクチャを提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:34:27 GMT)
Normalized Orthography for Tunisian Arabic [1.6] チュニジア・アラビア(英語: Tunisian Arabic、ISO 693-3: aeb)は、チュニジア原産で、様々な歴史的影響を受け、アラビア語に由来する。
本研究は「チュニジア・アラビアのノーマライズド・オルソグラフィー(NOTA)」を紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:28:35 GMT)
Sustainable self-supervised learning for speech representations [1.6] 本稿では,音声表現学習のための自己教師型モデルを提案する。
提案モデルでは,資源効率のよいベースラインを改良し,メモリ使用量と計算コストの見積を削減した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:21:36 GMT)
QMGeo: Differentially Private Federated Learning via Stochastic Quantization with Mixed Truncated Geometric Distribution [1.6] Federated Learning(FL)は、複数のユーザがグローバル機械学習(ML)モデルを共同でトレーニングできるフレームワークである。
このような分散フレームワークの重要な動機の1つは、ユーザにプライバシ保証を提供することである。
本稿では,DPを提供するのに必要なランダム性を導入するために,混合幾何分布を用いた新しい量子化法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:52:05 GMT)
Just Because We Camp, Doesn't Mean We Should: The Ethics of Modelling Queer Voices [1.5] 私たちは、典型的なパイプラインが「ゲイ・ボイス」として知られるスタイルを捉える能力をテストする。
合成音声は「ゲイ音声」の話者に対して、それに対応する基礎的真実よりも、(LGBTQ+の参加者による)「無同性愛者」の音声として評価されている。
ゲイ・ボイス」の喪失はアクセシビリティに影響を及ぼす。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:39:46 GMT)
DISCO: An End-to-End Bandit Framework for Personalised Discount Allocation [1.5] DISCOは、ASOSのパーソナライズされたディスカウントコードアロケーションのためのエンドツーエンドのコンテキストラジットフレームワークである。
従来のトンプソンサンプリングアルゴリズムを整数プログラムに統合することで適応する。
グローバルな制約にもかかわらず、探索を効果的に実施し、時間とともにパフォーマンスを向上させることができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:16:34 GMT)
Loss Landscape of Shallow ReLU-like Neural Networks: Stationary Points, Saddle Escaping, and Network Embedding [1.5] 経験的二乗損失を学習したReLU様活性化関数を持つ一層ニューラルネットワークの損失状況について検討した。
アクティベーション関数は微分不可能であるため、固定点を完全に特徴づける方法は今のところ不明である。
定常点が一階条件で定義される「エスケープニューロン」を含まない場合、局所最小値でなければならないことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:08:58 GMT)
Generating Human Understandable Explanations for Node Embeddings [1.4] 我々は、Q2に答えるために、XM(eXplain eMbeddingのショート)と呼ばれる新しいフレームワークを紹介します。
XMの重要な側面は、生成された説明の核規範を最小化することである。
XM は既存のノード埋め込み手法の性能を保っているだけでなく,その説明可能性を高めることも示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:16:28 GMT)
Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types [1.3] 本稿では、同期語彙関係と単語の意味定義の両方から情報を活用するモデルを提案する。
具体的には,WordNet の構文定義と階層情報を用いて,Blank (1997) のセマンティックチェンジ型データセットのデジタル化バージョンでそれをテストする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:05:22 GMT)
Towards better visualizations of urban sound environments: insights from interviews [1.3] 我々は,そのような表現が重要視される都市住民を特定することによって,音源の表現の必要性を分析する。
本研究では, 産業と専門市民の騒音関連苦情, 市民の音質評価, 都市計画者への指導という, 音源表現の異なる3つの利用法について検討した。
視覚化は、対象のオーディエンスに適応したインジケータを使用し、データアクセシビリティーを可能にする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:39:48 GMT)
Approximate Quantum Compiling for Quantum Simulation: A Tensor Network based approach [1.2] 行列生成状態(MPS)から短深さ量子回路を生成する新しいアルゴリズムであるAQCtensorを導入する。
我々のアプローチは、量子多体ハミルトニアンの時間進化から生じる量子状態の準備に特化している。
100量子ビットのシミュレーション問題に対して、AQCtensorは、結果の最適化回路の深さの少なくとも1桁の縮小を実現していることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:45:08 GMT)
Towards Human-AI Collaboration in Healthcare: Guided Deferral Systems with Large Language Models [1.2] 大規模言語モデル(LLM)は医療における様々な応用に有用な技術であるが、幻覚の傾向は受け入れられない不確実性をもたらす。
人間とAIのコラボレーションは、より良い結果を得るために人間とAIの強みを組み合わせることで、この不確実性を軽減することができる。
本稿では,AIが人間の意思決定者に対してケースをデフェクトした場合にインテリジェントなガイダンスを提供する,新しいガイド付きデフェラルシステムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:41:54 GMT)
Are Word Embedding Methods Stable and Should We Care About It? [1.2] 単語類似度に基づく内在的評価を用いた単語埋め込み法(WEM)の安定性測定について検討する。
我々は、Word2Vec、GloVe、fastTextの3つの人気のあるWEMを実験した。
我々の実験は、3つのWEMの中で、fastTextが最も安定しており、GloVeとWord2Vecが続くことを示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:44:07 GMT)
Self-Improvement for Neural Combinatorial Optimization: Sample without Replacement, but Improvement [1.2] 建設的ニューラル最適化の現在の手法は、通常、専門家ソリューションからの行動クローニングや強化学習からのポリシー勾配手法を用いてポリシーを訓練する。
各エポックにおける現在のモデルを用いて、ランダムなインスタンスに対して複数の解をサンプリングし、その後、教師付き模倣学習のための専門家の軌跡として最適な解を選択することにより、この2つを橋渡しする。
我々は,旅行セールスマン問題とキャパシタントカールーティング問題に対する我々のアプローチを評価し,本手法で訓練したモデルは,専門家データで訓練したモデルと同等の性能と一般化を実現する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:48:33 GMT)
Monadic ortholattices: completions and duality [1.1] モナディック正則多様体の多様体は、マクニールと正準完備化の下で閉じていることを示す。
我々は、モナディック正則函数の圏とモナディック正則空間の間の双対共役を得る。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:19:06 GMT)
AI Sandbagging: Language Models can Strategically Underperform on Evaluations [1.0] トラストロックされたAIシステムは、AIシステムの安全性を保証するために不可欠である。
AIシステムの開発者は、サンドバッグ評価のためのインセンティブを持つかもしれない。
性能評価がサンドバッグに弱いことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:26:57 GMT)
LT4SG@SMM4H24: Tweets Classification for Digital Epidemiology of Childhood Health Outcomes Using Pre-Trained Language Models [1.0] 本稿では,子どもの医学的障害を報告した英語ツイートのバイナリ分類について,SMM4H24共有タスク5に対するアプローチを提案する。
テストデータに対するF1スコアの0.938を達成し,ベンチマークを1.18%上回った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:48:18 GMT)
Deception Analysis with Artificial Intelligence: An Interdisciplinary Perspective [1.0] 私たちは、欺くAIに関するタイムリーで意味のある学際的な視点を構築します。
DAMAS - 社会認知モデル作成のための総合的多エージェントシステムフレームワークで, 詐欺の分析を行う。
本稿では,コンピュータサイエンス,哲学,心理学,倫理,インテリジェンス・アナリティクスの観点から,AIアプローチによる騙しのモデル化と説明について述べる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:06:53 GMT)
THaLLE: Text Hyperlocally Augmented Large Language Extension -- Technical Report [0.9] 超局所的に拡張された大言語拡張(THaLLE)の財務分析拡張について述べる。
一連の8B LLMは、同じ大きさのモデルに対するモックCFA試験において、常に最高性能を達成している。
また、金融アドバイザとしてLLMを評価するための公開データセットであるFrare CFAについても紹介する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:40:00 GMT)
PufferLib: Making Reinforcement Learning Libraries and Environments Play Nice [0.9] PufferLibは、一般的な互換性問題を排除したワンライン環境ラッパーを提供する。
PufferLibを使えば、CleanRLやSB3といった慣れ親しんだライブラリを使って、AtariやProcgenといった古典的なベンチマークからNetHackやNeural MMOのような複雑なシミュレータまでスケールすることができる。
私たちのコードはすべて、MITライセンスの下でフリーでオープンソースのソフトウェアです。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:13:34 GMT)
Fault-tolerant quantum computation using large spin cat-codes [0.9] 本研究では、スピンキャット符号を用いて、大きなスピンキュウトに符号化された量子ビットに基づいて、フォールトトレラントな量子誤り訂正プロトコルを構築する。
我々は、量子制御とライダーベルク封鎖を用いて、ランク保存されたCNOTゲートを含む普遍ゲートセットを生成する方法を示す。
これらの知見は、量子情報処理において、耐障害性、高いしきい値、リソースオーバーヘッドを低減できる可能性を持つ、大きなスピンで量子ビットを符号化する方法を舗装している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:18:00 GMT)
Scalability enhancement of quantum computing under limited connectivity through distributed quantum computing [0.9] 単一QPU量子コンピューティングを用いた分散量子コンピューティングにおける2QPUエンタングルメントのベンチマークを行った。
平均ゲート忠実度,重出力確率,線形クロスエントロピーの3つの図形の1対1対応性を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:36:05 GMT)
Deep Learning-Based Approach for User Activity Detection with Grant-Free Random Access in Cell-Free Massive MIMO [0.9] 本稿では,アクティビティ検出問題への教師付き機械学習モデルの適用について検討する。
本研究では, セルフリー・マス・マルチ入力多重出力(CF-mMIMO)ネットワークにおいて, ユーザアクティビティ検出に特化して設計されたデータ駆動アルゴリズムを提案する。
このアルゴリズムは99%の精度を達成し、実世界のアプリケーションで有効性を確認します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:08:33 GMT)
Test-Driven Development for Code Generation [0.9] 大きな言語モデル(LLM)は、問題ステートメントから直接コードスニペットを生成する重要な機能を示している。
本稿では,テスト駆動開発(TDD)をAI支援コード生成プロセスに組み込む方法について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:53:35 GMT)
Are Normalizing Flows the Key to Unlocking the Exponential Mechanism? [0.8] 指数メカニズム(ExpM)は、歴史的に連続的なサンプル空間での使用から傍観されてきた。
本稿では,プライベート最適化とプライベート機械学習(ML)のためのExpMの運用を提案する。
SGD, DPSGD, ExpM+NF訓練法の精度とトレーニング時間をMIMIC-III健康データと比較した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:09:47 GMT)
Scalable UTXO Smart Contracts via Fine-Grained Distributed State [0.8] 現在のUTXOベースのスマートコントラクトは効率上のボトルネックに直面しており、更新されたコントラクト状態全体を特定するために、コントラクトに送信されるすべてのトランザクションが必要になる。
本稿では,拡張UTXOブロックチェーン上でのスマートコントラクトの効率的な実行手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:28:27 GMT)
Bilingual Sexism Classification: Fine-Tuned XLM-RoBERTa and GPT-3.5 Few-Shot Learning [0.8] 本研究の目的は、自然言語処理モデルを活用することにより、バイリンガル文脈(英語とスペイン語)における性差別の識別を改善することである。
我々はXLM-RoBERTaモデルを微調整し、性差別的コンテンツを分類するための数発の学習プロンプトでGPT-3.5を別々に使用した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:15:33 GMT)
Embedded Graph Convolutional Networks for Real-Time Event Data Processing on SoC FPGAs [0.8] イベントカメラは、組み込みリアルタイムシステムへの統合に大きな関連性を見出す。
イベント処理システムに必要なスループットとレイテンシを保証する効果的なアプローチの1つは、グラフ畳み込みネットワーク(GCN)の利用である。
我々は,ポイントクラウド処理用に設計されたGCNアーキテクチャであるPointNet++用に最適化された,ハードウェア対応の一連の最適化を紹介した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:47:36 GMT)
Guiding LLM Temporal Logic Generation with Explicit Separation of Data and Control [0.8] 時間論理は、反応系の合成と検証に広く使われている強力なツールである。
大規模言語モデルに関する最近の進歩は、そのような仕様を書くプロセスをよりアクセスしやすいものにする可能性がある。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:07:24 GMT)
OPFData: Large-scale datasets for AC optimal power flow with topological perturbations [0.8] 我々は現在までに解決されたAC-OPF問題の最も手軽に利用できるコレクションを提示する。
このコレクションは、既存の利用可能なデータセットよりも桁違い大きく、高容量のデータ駆動モデルのトレーニングを可能にする。
トポロジ的摂動(トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂動(トポロジ的摂動、トポロジ的摂動、トポロジ的摂動、トポロジ的摂
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:12:39 GMT)
CTIBench: A Benchmark for Evaluating LLMs in Cyber Threat Intelligence [0.7] CTIBenchは、CTIアプリケーションにおける大規模言語モデルの性能を評価するために設計されたベンチマークである。
これらのタスクにおけるいくつかの最先端モデルの評価は、CTIコンテキストにおけるその強みと弱みに関する洞察を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:42:02 GMT)
Progress Towards Decoding Visual Imagery via fNIRS [0.7] 我々は,fNIRS脳活動からのイメージ再構成の可能性を示し,必要な仕様に適合するプロトタイプの構築に着手する。
その結果, フル解像度fMRIでは93%, 2cmでは20%の精度で検索精度は71%であった。
我々は、レーザードライバ、光子検出器、デジタルコンバータシステムからなるプロトタイプの時間領域fNIRSデバイスの設計を共有している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:08:32 GMT)
Toward efficient resource utilization at edge nodes in federated learning [0.7] フェデレートされた学習により、エッジノードは、データを共有することなく、グローバルモデルの構築に協力的に貢献することができる。
計算リソースの制約とネットワーク通信は、ディープラーニングアプリケーションに典型的なより大きなモデルサイズにとって、深刻なボトルネックになる可能性がある。
デバイス上での資源利用を減らすため,転送学習にインスパイアされたFL戦略を提案し,評価する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:44:28 GMT)
D-GRIL: End-to-End Topological Learning with 2-parameter Persistence [0.7] GRILは標準ベンチマークグラフデータセットの2次フィルタ関数の学習に利用できることを示す。
この枠組みは、薬物発見における生物活性予測の文脈で適用することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:42:03 GMT)
Consistent Optimal Transport with Empirical Conditional Measures [0.7] 共振器における2つの関節分布間の最適輸送(OT)の問題点を考察する。
我々は、共同サンプル上で計算されたカーネル化された最小二乗項を使用し、輸送計画の条件的目的に暗黙的に一致する。
本手法は, 治療に対する細胞応答予測の文脈において, 短時間の分類のための即時学習や条件生成などの応用に適用する場合, 最先端の手法を改良する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 02:12:50 GMT)
A distribution testing oracle separation between QMA and QCMA [0.6] 量子複雑性理論において、$textitnon-deterministic$ 量子計算の定義が量子証人を必要とするかどうかという長い議論である。
本稿では,各計算複雑性クラスを分離したランダム化された古典オラクルを構築することにより,この問題を進展させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:19:12 GMT)
Quantum Wiretap Channel Coding Assisted by Noisy Correlation [0.6] 我々は、ユーザが共有量子状態のリソースにアクセス可能な量子通信路のプライベートな古典的容量について検討する。
我々は、与えられたリソースの状態を使って、秘密の古典的コミュニケーションのためのコードを構築する方法を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:11:18 GMT)
Cognitive Insights Across Languages: Enhancing Multimodal Interview Analysis [0.6] 軽度認知障害と認知スコアを予測できるマルチモーダルモデルを提案する。
提案モデルでは,インタビューで使用した言語を書き起こし,区別する能力を示す。
提案手法では,提案手法から得られた様々な特徴を詳細に検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:59:31 GMT)
MultiPragEval: Multilingual Pragmatic Evaluation of Large Language Models [0.6] MultiPragEvalは、英語、ドイツ語、韓国語、中国語でLLMを多言語で評価するための堅牢なテストスイートである。
以上の結果から,Claude3-Opusは全てのテスト言語で他のモデルよりも優れていた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:46:03 GMT)
The renormalized classical spin liquid on the ruby lattice [0.6] 熱力学限界において, エントロピー密度が一定の$S/N$, $ln(2)/6$に近づいた古典スピン液体が再正規化されている。
ファン・デル・ワールス相互作用では、定数エントロピープラトーは依然として発見されているが、その値は$delta$で変化する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:51:28 GMT)
MADGF: Multi-Agent Data Generation Framework [0.6] 本稿では,この課題に対処する新しいマルチエージェントデータ生成フレームワーク(MADGF)を提案する。
生成したMixed Cantonese and English (MCE)オーディオデータセットを利用して、オープンソースの多言語ASRモデルWhisperを微調整する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:06:43 GMT)
Unleashing the Power of Transfer Learning Model for Sophisticated Insect Detection: Revolutionizing Insect Classification [0.5] この研究では、MobileNetV2、ResNet152V2、Xecption、Custom CNNといったさまざまなモデルを使用します。
ResNet152V2アーキテクチャに基づく畳み込みニューラルネットワーク(CNN)の構築と評価を行った。
この結果は、昆虫の分類と昆虫学研究における現実世界の応用の可能性を強調している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:52:42 GMT)
Optimized QUBO formulation methods for quantum computing [0.5] 実世界の金融シナリオにインスパイアされたNPハード最適化問題に対して,我々の手法を適用する方法について述べる。
2つのD波量子異方体にこの問題の事例を提出し、これらのシナリオで使用される標準手法と新しい手法の性能を比較した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:59:05 GMT)
DERM12345: A Large, Multisource Dermatoscopic Skin Lesion Dataset with 38 Subclasses [0.5] 本研究は,12,345枚の皮膚内視鏡像と38種類の皮膚病変からなる多彩なデータセットをトゥルカイで収集した。
このデータセットは、5つのスーパークラス、15のメインクラス、38のサブクラス、12,345の高解像度皮膚内視鏡画像を持つ多様な構造を通して識別される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:27:32 GMT)
Novel Optimized Designs of Modulo $2n+1$ Adder for Quantum Computing [0.5] 量子変調 $ (2n+1)$ adder の既存の設計は存在しない。
モジュロ$(2n+1)$加算に特化した4つの量子加算器を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:27:11 GMT)
Beyond Bare Queries: Open-Vocabulary Object Retrieval with 3D Scene Graph [0.4] 既存のCLIPベースのオープンボキャブラリ手法は、単純な(悪い)クエリで3Dオブジェクトの検索に成功している。
本稿では,3次元空間グラフ表現を計量エッジで構築するBBQというモジュラー手法を提案する。
BBQは、3Dオブジェクトを形成するためにDINOを使ったロバストなアソシエーション、それらを2Dに投影する高度なレイキャストアルゴリズム、グラフノードとして記述するビジョン言語モデルを採用している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:57:04 GMT)
Quantifying spectral signatures of non-Markovianity beyond the Born-Redfield master equation [0.4] オープン量子力学における記憶または時間非局所効果は、理論的および実践的な課題を引き起こす。
系の定常状態における非マルコビアン性の検出が可能な非マルコビアン性の分光測度を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:23:58 GMT)
Towards Generalized Hydrological Forecasting using Transformer Models for 120-Hour Streamflow Prediction [0.3] 本研究では,米国アイオワ州における120時間流速予測のためのTransformerモデルの有効性について検討した。
我々はTransformerモデルの性能を3つのディープラーニングモデル(LSTM, GRU, Seq2Seq)とPersistenceアプローチと比較した。
本研究はトランスフォーマーモデルの優れた性能を示し、高い中央値のNSEおよびKGEスコアを維持し、最も低いNRMSE値を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:26:14 GMT)
DeformTime: Capturing Variable Dependencies with Deformable Attention for Time Series Forecasting [0.3] 入力空間から相関時間パターンを捕捉しようとするニューラルネットワークアーキテクチャであるDeformTimeを提案する。
これまでに確立されたベンチマークを用いて,6つのMTSデータセットに関する広範な実験を行った。
その結果,DeformTimeはMSS予測タスクの大部分にわたる従来の競合手法と比較して精度が向上することがわかった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:45:48 GMT)
Neuromorphic quadratic programming for efficient and scalable model predictive control [0.3] イベントベースおよびメモリ統合ニューロモルフィックアーキテクチャは、大規模な最適化問題を解決することを約束する。
本稿では,Intel のスケーラブルなニューロモルフィック研究チップ Loihi 2 上での2次コスト関数と線形制約を用いた凸連続最適化問題の解法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:34:43 GMT)
Spin-photon entanglement of a single Er$^{3+}$ ion in the telecom band [0.3] 量子中継器を用いた長距離量子通信はセキュアな通信を可能にする技術である。
量子リピータの構成要素として、スピン光子絡み合いは原子と固体の量子ビットの両方で実証されている。
ここでは, シリコンナノフォトニック回路に集積された固体結晶中の1つのEr$3+$イオンを用いたスピン光子エンタングルメントを実演する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:49:20 GMT)
Toxic Memes: A Survey of Computational Perspectives on the Detection and Explanation of Meme Toxicities [0.3] 有毒なミームの計算解析に関する研究は、過去5年間に大きく成長してきた。
計算有毒なミーム分析に関する3つの調査は、2022年までしか公表されていない。
我々の研究は、有害なミームに関するコンテンツベースの計算的視点を調査することによって、このギャップを埋める。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:22:48 GMT)
Benchmarking Instance-Centric Counterfactual Algorithms for XAI: From White Box to Black Box [0.3] 異なる機械学習モデルは、カウンターファクトの説明の生成にほとんど影響を与えない。
近接損失関数を一意に基礎とする対実的アルゴリズムは動作不可能であり、意味のある説明は提供しない。
カウンターファクトインスペクション分析は、カウンターファクトインスペクションの堅牢性を確保するために強く推奨される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:33:37 GMT)
Fully Adaptive Regret-Guaranteed Algorithm for Control of Linear Quadratic Systems [0.2] 線形二次制御問題に対する最初のアルゴリズムは$mathcalO(sqrtT)$を後悔している。
政策更新数を制御(探索・探索トレードオフを調整する)する最初の完全適応型アルゴリズムを提案する。
我々は、慎重に探索・探索のトレードオフ調整を行うことで、強いシーケンシャルな安定性という広く使われている概念にコミットする必要はないことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:04:59 GMT)
Recovery of resource through sequential noisy measurements [0.2] ノイズ測定の逐次的適用は、量子情報処理タスクにおけるノイズの悪影響を軽減することができることを示す。
量子ネットワークにおける選択ノードの絡み合いに集中する場合,量子ビットのアシストによる雑音測定によりこれを実証する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:46:27 GMT)
Experimenting with D-Wave Quantum Annealers on Prime Factorization problems [0.2] 8,219,999=32,749x251は、私たちが分解できる最も高い素数である。
これは、量子デバイスによって決定された史上最大の数である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:30:53 GMT)
Self-attention-based non-linear basis transformations for compact latent space modelling of dynamic optical fibre transmission matrices [0.2] 本稿では、自己アテンション層を用いて様々なファイバー行列の座標表現を変換する新しい概念を提案する。
本手法の有効性を,多種多様なファイバー・マトリックス・データセットに示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 23:51:06 GMT)
Convergence rate of random scan Coordinate Ascent Variational Inference under log-concavity [0.2] Coordinate Ascent Variational Inference schemeは、関心の確率分布の平均場近似を計算するために使われる一般的なアルゴリズムである。
対象密度の対数共共振仮定に基づいてランダムスキャンバージョンを解析する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:23:01 GMT)
Regularized quantum motion in a bounded set: Hilbertian aspects [0.2] 我々は、運動量作用素を正の有界関数で対称的に重み付けすることで、本質的な自己随伴性を取り戻すことができることを証明した。
この重み付き運動量作用素は、同様に重み付き古典運動量から一貫して得られる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:39:13 GMT)
Exploring the Potential of Large Language Models for Improving Digital Forensic Investigation Efficiency [0.1] デジタル法医学的分析を必要とするケースが増えていることで、法執行機関が迅速に調査を行う能力について懸念が高まっている。
本稿では,これらの課題に対処するために,大規模言語モデルとディジタル法科学調査の統合の可能性と有効性について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:01:05 GMT)
Autograding Mathematical Induction Proofs with Natural Language Processing [0.1] 本稿では,自由形式の数学的証明を自動分解できる一連のトレーニング手法とモデルを提案する。
モデルは、誘導問題によって4つの異なる証明から収集された証明データを用いて訓練される。
我々は、トレーニングデータと同じ証明を格付けするために、人間のグルーパーを雇い、最高のグルーパーモデルが、ほとんどの人間のグルーパーよりも正確であることに気付きました。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:30:26 GMT)
A Micro Architectural Events Aware Real-Time Embedded System Fault Injector [0.1] 本稿では,マイクロアーキテクチャイベントの監視,集約,検査を容易にする新しい故障インジェクタを提案する。
この手法はメモリシステム内のビットフリップを目標とし、CPUレジスタとRAMに影響を与える。
これらの断層注入の結果、ソフトエラーの影響を徹底的に解析し、同定された断層とSACRESが要求する本質的なタイミング予測可能性との間に堅牢な相関関係を確立することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:44:00 GMT)
Exploring Large Language Models for Relevance Judgments in Tetun [0.0] 本稿では,大規模言語モデル(LLM)による妥当性評価の自動化の可能性について検討する。
LLMは、Tetunで一連のクエリドキュメントペアを入力テキストとして提供することにより、関連判断タスクを自動化するために使用される。
本研究は,高ソース言語研究において報告された結果と密接に一致した結果を明らかにする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:28:24 GMT)
Work and efficiency fluctuations in a quantum Otto cycle with idle levels [0.0] We study the performance of a quantum Otto heat engine with two spins coupled by a Heisenberg interaction。
作業や効率の相対的な変動は大きいままであり、これはこの微視的なエンジンが作業の源としてあまり信頼できないことを意味している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:39:03 GMT)
What's in an embedding? Would a rose by any embedding smell as sweet? [0.0] 大規模言語モデル(LLM)は、真の「理解」と知識を「理解」する能力に欠けるとしてしばしば批判される。
我々は LLM が「幾何学的」な経験的な「下地」を開発しており, NLP の応用には十分と思われることを示唆する。
これらの制限を克服するために、私たちはLLMをエキスパートシステムで使用されるシンボリックAI要素を含む知識の「代数的」表現に統合すべきだと提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:10:40 GMT)
Vehicle Speed Detection System Utilizing YOLOv8: Enhancing Road Safety and Traffic Management for Metropolitan Areas [0.0] バングラデシュでは道路事故が主要な死因の1つとなっている。
YOLOv8モデルは、密接な監督の下で訓練されたときに、より高速で精度の高いビデオ中の車を認識、追跡することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:45:40 GMT)
Using General Large Language Models to Classify Mathematical Documents [0.0] 我々は,MSC 2020に基づき,arXiv.orgの事前印刷項目の分類を評価した。
サンプルの約60%において, LLMはarXivで既に報告されている一次分類マッチングを作成した。
しかし, これらの症例の詳細な検査では, LLMを推奨する分類は, 提供された分類よりも, 多くの場合において良好であった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:15:57 GMT)
Unused information in token probability distribution of generative LLM: improving LLM reading comprehension through calculation of expected values [0.0] トークン確率の操作により復号法を改良できることを示す2つの実験を行った。
まず,SummEvalの要約スコアリングデータセットを用いて,読解理解度を測定する。
スコアのエントロピーを高めるために,ロジットを高温でスケールする。
7BMistralでは6-8%から13-28%,Mixtralでは20%-46%から37%-56%に改善した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:24:18 GMT)
Unlocking the Potential of the Metaverse for Innovative and Immersive Digital Care [0.0] メタバースは、患者のケア、医療教育、研究を変革することで、医療に革命をもたらす大きな可能性を秘めている。
本稿では,この変革的技術にかかわる応用,メリット,課題について考察する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:58:27 GMT)
Trusting Fair Data: Leveraging Quality in Fairness-Driven Data Removal Techniques [0.0] 我々は、人口の公正な表現を目的としたトレーニングセットから特定のデータポイントを除去するバイアス軽減技術に対処する。
フェアネスに加えて、サブセットが満たさなければならない追加の要件と目的を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:22:14 GMT)
Trading T gates for dirty qubits in state preparation and unitary synthesis [0.0] 古典的数のリストで指定された任意の次元-$N$純量子状態を作成するための量子アルゴリズムを提案する。
我々のスキームは、$mathcalO(fracNlambda+lambdalogfracNepsilonlogNepsilon)$を使用して、Tゲートコストを$mathcalO(fracNlambda+lambdalogfracNepsilon)$に削減します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:32:14 GMT)
Towards Risk Analysis of the Impact of AI on the Deliberate Biological Threat Landscape [0.0] 生物工学と人工知能の融合によって生物リスクが増大する可能性があるという認識は、バイオテクノロジーと人工知能のガバナンスに注意を向けている。
2023年、人工知能の安全、安全、信頼に足る開発と利用に関する執行命令は、人工知能がバイオリスクをいかに高めるかを評価する必要がある。
この視点は、評価手法と評価手法が、生命科学におけるAIの進歩に追随しなければならないことを指摘して結論付けている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:45:58 GMT)
Topological phase transition in fluctuating imaginary gauge fields [0.0] 非エルミート格子モデルにおける正確な可解性と点ギャップ位相遷移について検討する。
適切な虚ゲージ変換を用いることで、任意の与えられた$g_n$によって特徴づけられる格子が、場の格子のない格子とスペクトル的に等価であることを明らかにする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:10:03 GMT)
Three-dimensional imaging of integrated-circuit activity using quantum defects in diamond [0.0] 開発前の多層集積回路内を流れる電流によって生成されたオアーステッド場を, ダイヤモンド中の窒素空孔近傍で探究する。
室温での空間分解能は,約$approx 10,rm mu A / mu m2$,sub-micronである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:43:11 GMT)
The magic of entangled top quarks [0.0] 我々は、古典的状態に対して真の計算上の優位性を持つこれらの量子状態を区別する魔法の性質を考える。
LHCにおけるトップアンチトップペア生産について検討し、自然がマジックトップを生産することを選択することを示す。
個々のパートニックチャネルとプロトンレベルでの結果を比較して、最終状態平均化がマジックを増大させることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:50:56 GMT)
The entanglement membrane in exactly solvable lattice models [0.0] 絡み合い膜理論はカオス量子多体系における絡み合いダイナミクスを記述する。
我々は、正確に解けるがカオス的なユニタリ回路のクラスにおける絡み線張力を計算する。
この結果は, マイクロフローケット格子モデルにおけるエンタングルメント膜理論に光を当てた。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:03:38 GMT)
The end of multiple choice tests: using AI to enhance assessment [0.0] 研究ベースの気晴らし(短い回答)を使うことは、本質的に彼らの提供する洞察に限られています。
これらの制限に対処するため、学生になぜ答えを選んだのかを説明することを勧める。
訓練された人工知能ベースのボットを使用して、説明を分析することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:24:30 GMT)
Text Information Retrieval in Tetun: A Preliminary Study [0.0] テトゥン語はティモール=レステの公用語の1つであり、ポルトガル語と並んでいる。
2002年にTimor-Lesteが独立を回復し、992,400人以上の話者を抱える低リソース言語である。
メディアは主にテトゥンを使用し、毎日10以上の全国紙がテトゥンでニュースを放送している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:01:03 GMT)
Tests of macrorealism in meson oscillation physics [0.0] マクロリアリズム(Macrorealism)は、ある時点においてシステムが一定の状態を占めるという直感的な概念を定式化する。
非シグナリング・イン・タイム条件は違反することが判明し、中間子物理学の解析にマクロ現実的記述を適用することは不可能であることが判明した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:36:12 GMT)
Tag and correct: high precision post-editing approach to correction of speech recognition errors [0.0] ASR(Automatic Speech Recognition)仮説の単語を単語単位で修正する方法を学ぶニューラルネットワークタグと、タグによって返される修正を適用する修正モジュールとから構成される。
提案手法はアーキテクチャによらず,任意のASRシステムに適用可能である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:52:33 GMT)
Supporting Changes in Digital Ownership and Data Sovereignty Across the Automotive Value Chain with Catena-X [0.0] デジタルツインズは、物理的資産のデジタル表現を記述する概念として進化してきた。
循環経済の概念を考えると、それぞれのデジタルツインがそれぞれの物理的資産のライフサイクルを通してどのように管理されているかを検討することが重要である。
本論文は,Digital Twinsの産業利用における3つのアプローチを提示し,比較する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:07:38 GMT)
Spread Complexity of High Energy Neutrino Propagation over Astrophysical Distances [0.0] 拡散複雑性は、基底のあらゆる選択における量子状態の最小の拡散を測定する。
複雑性に基づくフレーバー比の定義は、ニュートリノの大量注文に対してわずかながら非ゼロの感度を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:29:55 GMT)
Simplicity of mean-field theories in neural quantum states [0.0] 置換対称性を持つ平均場理論の基底状態は、独立したニューラルネットワークパラメータの限られた数しか必要としない。
完全連結横フィールドイジングモデル(TFIM)の基底状態への収束は1つのパラメータだけで実現できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:20:41 GMT)
Scientific Computing with Large Language Models [0.0] 本稿では,科学計算応用のための大規模言語モデルの出現について概説する。
物理システムを記述するために設計された科学文書や特殊言語を自然言語処理するユースケースを強調した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:39:07 GMT)
Scalability in Workforce Management: Applying Scalability Principles to Foster a Four-Day Work Week [0.0] この研究は、グレー文学と体系的なレビューアプローチを組み合わせた多言語リテラシー研究手法を用いている。
パイロットプログラム、明確なコミュニケーション、アジリティが重要な成功要因として認識されます。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 03:15:47 GMT)
Robustness of perfect transmission resonances to asymmetric perturbation [0.0] ミラー対称細胞を用いた摂動1次元有限周期系の完全透過共鳴(PTR)について検討した。
摂動の適切な設計で, 摂動症例にPTRがまだ現れるかを示す。
また、有限クロニグ・ペニー系の対称性にある2つの明らかに独立なPTR間の接続も明らかにする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:43:53 GMT)
Robustness of Variational Quantum Algorithms against stochastic parameter perturbation [0.0] 変分量子アルゴリズムは、現在の量子デバイスの制約内で実行されるように調整されている。
変動量子アルゴリズムに固有の現実的なゲート誤差を反映したノイズモデルを考える。
ゲートエラーが状態のコヒーレンスに著しく小さいことを示し、性能を損なうことなく実行時間を短縮できることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:34:54 GMT)
Rephasing spectral diffusion in time-bin spin-spin entanglement protocols [0.0] 絡み合った状態が生成されると、準定常周波数変動から位相誤差を補正する手法を提案する。
準定常周波数変動に対して、その忠実度はシェルビングに用いる励起状態の寿命によってのみ決定される。
このプロトコルは、絡み合いの発生率を低下させることなく、高忠実な絡み合いのスピンペアを生成するために使用できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:17:25 GMT)
Reconstructing the Tropical Pacific Upper Ocean using Online Data Assimilation with a Deep Learning model [0.0] 深層学習(DL)モデルは、気候モデルデータセットに基づいて訓練され、熱帯太平洋の線形逆モデル(LIM)と比較される。
DLモデルでは, 再解析データセットで検証した場合, LIMよりも精度の高い予測が得られた。
次に,24回の海面温度観測から,月平均上の海を再構築するためのアンサンブルカルマンフィルタの能力を評価する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:45:41 GMT)
Readout Error Mitigation for Mid-Circuit Measurements and Feedforward [0.0] 現在の量子コンピューティングプラットフォームでは、読み出しエラーが発生している。
本稿では,中間回路計測とフィードフォワードを用いた回路における期待値の読み出し誤差軽減法を提案する。
本手法の有効性を実証し,超伝導量子プロセッサの誤差を最大60%削減する手法を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:00:01 GMT)
Question Classification with Deep Contextualized Transformer [0.0] そこで我々は,Deep Contextualized Transformer を用いて質問・回答問題に対処する新しい手法を開発した。
また、SQuADおよびSwDAデータセットの広範囲な評価を行い、産業ニーズのQA問題分類よりも大幅に改善されたことを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:59:08 GMT)
Quantum reservoir probing of quantum phase transitions [0.0] 量子状態遷移は局所的な量子クエンチによって誘起される局所化された平衡外励起によって検出できることを示す。
局所的なクエンチの影響は異なる量子相によって異なり、量子臨界点付近で増幅された量子ゆらぎによって著しく抑制される。
我々は、QRPが、パラダイム的可積分および非可積分量子系における量子相転移、さらには位相的量子相転移を検出できることを実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:44:29 GMT)
Quantum repeaters based on stationary Gottesman-Kitaev-Preskill qubits [0.0] ボソニックな Gottesman-Kitaev-Preskill (GKP) 符号は、損失補正に基づく量子リピータの自然な選択であると考えている。
我々は、GKPベースの量子リピータの性能を解析し、評価し、初期状態生成と分布とは別に、決定論的線形モード変換によって全ての演算を行うことができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 11:04:49 GMT)
Quantum Simulations of Hadron Dynamics in the Schwinger Model using 112 Qubits [0.0] ハドロン波束は、IBMの133量子ビットHeron量子コンピュータibm_torinoの112キュービットを使用して、Schwingerモデルで準備され、時間的に進化する。
結果はMatrix Product State シミュレーションと良好に比較できる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:54:24 GMT)
Quantum Computation by Cooling [0.0] 本稿では,断熱進化に基づく量子計算のための特定のハミルトンモデルを提案する。
この冷却法に基づく量子計算は、その計算能力において量子回路に基づく計算と等価であることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:39:58 GMT)
Pseudo-Entanglement is Necessary for EFI Pairs [0.0] 我々は、新しい量子資源、擬似絡み合いを考察し、EFI対の存在が擬似絡み合いの存在を意味することを示す。
この結果は,計算暗号の分野において重要な意味を持つ。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:44:16 GMT)
Position Paper: Technical Research and Talent is Needed for Effective AI Governance [0.0] 我々は、EU、米国、中国の公共機関が発行する政策文書を調査する。
我々は、提案された政策行動の実施に必要な技術的要件と、現在の技術状況とを、特定の領域で切り離すことを強調します。
我々の分析は、AIガバナンスにおけるAI/ML研究コミュニティのより緊密な統合を呼び起こします。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:32:28 GMT)
Physics-guided weak-form discovery of reduced-order models for trapped ultracold hydrodynamics [0.0] 極性分子の高衝突・超低温・非退化ガスの緩和について検討した。
気体は流体ガスと流体ガスが結合し、一階の流体力学が崩壊する。
我々は,これらの観測値に対して,大幅に改良された低次モデルを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:50:04 GMT)
Photo-induced dynamics with continuous and discrete quantum baths [0.0] 離散的・実効的なボゾン自由度の集合を通して連続環境を記述する純状態未到達ハイブリッドバス法を提案する。
本手法は, 連続スペクトル密度と鋭いピークの双方を記述できる。
単元的記述と比較して、ボソニックモードの数は大幅に少なく、エクシトニックダイナミクスを正確に記述できることを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:20:50 GMT)
Partial yet definite emergence of the Kardar-Parisi-Zhang class in isotropic spin chains [0.0] カルダル・パリ・張普遍性類と等方スピン鎖の間の関係を見いだす。
これにより、等方性スピン鎖におけるKPZクラスの部分的な出現が確立される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:50:50 GMT)
PLT-D3: A High-fidelity Dynamic Driving Simulation Dataset for Stereo Depth and Scene Flow [0.0] 本稿では,エンジン5を用いて生成した高忠実度ステレオ深度およびシーンフローグラウンド真理データであるダイナミックウェザードライビングデータセットを紹介する。
特に、このデータセットには、様々な動的気象シナリオを再現する、同期された高解像度ステレオ画像シーケンスが含まれている。
Unreal-D3を用いたいくつかの重要な自動運転タスクのためのベンチマークが確立され、最先端モデルの性能を計測し、向上している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:21:46 GMT)
Optimal Matrix-Mimetic Tensor Algebras via Variable Projection [0.0] 行列緩和性(Matrix mimeticity)は、テンソルを、行列に類似した乗算、分解、解析が可能な作用素として解釈することから生じる。
我々は、データの事前の知識に頼ることなく、最適線形写像と対応するテンソル表現を学習する。
可変射影型アルゴリズムの変換と収束解析の独創性理論を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 04:52:23 GMT)
One-particle operator representation over two-particle basis sets for relativistic QED computations [0.0] 中間的な計算段階に現れる一粒子作用素の忠実な表現は、多粒子基底集合上に構築できることが示されている。
この発展の応用は、相関相対論的基準状態に対する量子電気力学補正の計算や、中から高のZ$ヘリウム系における高精度相対論的計算に応用することができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:24:10 GMT)
On the Application of Egocentric Computer Vision to Industrial Scenarios [0.0] エゴセントリックなビジョンは、一人称視点から世界を捉え、分析することを目的としている。
我々は、エゴセントリックなウェアラブルデバイスが産業用ユースケースを改善し、強化する可能性を探る。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:48:20 GMT)
Ollabench: Evaluating LLMs' Reasoning for Human-centric Interdependent Cybersecurity [0.0] 大規模言語モデル(LLM)は、複雑な相互依存型サイバーセキュリティシステムを表現することによってエージェントベースモデリングを強化する可能性がある。
既存の評価フレームワークは、しばしば、相互依存型サイバーセキュリティに不可欠なヒューマンファクターと認知コンピューティング能力を見落としている。
シナリオベースの情報セキュリティコンプライアンスや非コンプライアンス問題に答える上で,LLMの正確性,無駄性,一貫性を評価する新しい評価フレームワークであるOllaBenchを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:35:39 GMT)
Multi-objective Reinforcement learning from AI Feedback [0.0] 本稿では、AIフィードバック(RLAIF)からの強化学習を用いて訓練された言語モデルのアライメントと性能を改善するための新しいアプローチを提案する。
すべての人間の嗜好を表現するために、単一の嗜好モデルを訓練する標準的なアプローチとは対照的に、MORLAIFは、このタスクを毒性、事実性、梅毒といったより単純な原則に分解する。
我々の実験は、MORLAIFが標準のRLAIFベースラインより優れており、MORLAIFはより小さな言語モデルを用いて、より大きな言語モデルを調整するために使用できることを示している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:24:00 GMT)
Modeling language contact with the Iterated Learning Model [0.0] 反復学習モデルは言語変化のエージェントベースモデルである。
最近導入された反復学習モデルであるSemi-Supervised ILMは、言語接触をシミュレートするために使われている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:43:23 GMT)
Modeling Sustainable Resource Management using Active Inference [0.0] 本稿では,持続可能な資源管理戦略を学習するエージェントの計算モデルを提案する。
静的な環境では、エージェントはそのニーズを満たすためにリソースを一貫して消費することを学ぶ。
動的環境では、エージェントはその動作に適応し、短期的なリソースの可用性と即時的な要求のバランスをとる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:36:12 GMT)
Merging Improves Self-Critique Against Jailbreak Attacks [0.0] 大規模言語モデル(LLM)の、ジェイルブレイク攻撃のような敵の操作に対する堅牢性は、依然として大きな課題である。
本研究では, LLMの自己批判能力を高め, 衛生的な合成データよりも微調整する手法を提案する。
以上の結果から,メルジングと自己批判の組み合わせは,敵の攻撃成功率を大幅に低下させる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:01:09 GMT)
MeGA: Merging Multiple Independently Trained Neural Networks Based on Genetic Algorithm [0.0] 本稿では, 遺伝的アルゴリズムであるMeGAを用いて, 複数の事前学習ニューラルネットワークの重みをマージする新しい手法を提案する。
我々のアプローチは、トーナメントの選択、クロスオーバー、突然変異による遺伝的アルゴリズムを利用して重量の組み合わせを最適化し、より効果的な融合を生み出す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:17:44 GMT)
Many-body thermal states on a quantum computer: a variational approach [0.0] 量子XY$モデルのギブス状態を作成するためのハイブリッド量子-古典的変分量子アルゴリズムを提案する。
本稿では,Grover と Rudolph アルゴリズムで必要となる変動パラメータの指数関数的増加を著しく低減するために,多体系の対称性をいかに活用するかを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:54:59 GMT)
MPSDynamics.jl: Tensor network simulations for finite-temperature (non-Markovian) open quantum system dynamics [0.0] MPSDynamics.jlパッケージは、ゼロ温度と有限温度でオープン量子システムシミュレーションを実行するための使いやすいインターフェースを提供する。
Juliaプログラミング言語で書かれたMPSDynamics.jlは汎用的なオープンソースパッケージである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:34:59 GMT)
Is Stateful Fuzzing Really Challenging? [0.0] 我々は、ステートフルなファジィザを考案し、ベンチマークすることが難しい理由について論じる。
ファジィングはソフトウェアの脆弱性を見つけるのに非常に効果的であることが証明されている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:58:59 GMT)
Integrating Marketing Channels into Quantile Transformation and Bayesian Optimization of Ensemble Kernels for Sales Prediction with Gaussian Process Models [0.0] 本研究では,Rational Basis Function (RBF), Rational Quadratic, Mat'ern kernelsを統合したアンサンブルカーネルを用いた革新的なガウスプロセス(GP)モデルを提案する。
ベイズ最適化を適用することで、各カーネルの最適な重み付けを効率的に見つけることができ、複雑な販売データパターンを扱うモデルの能力を高めることができる。
我々のアプローチは従来のGPモデルよりも優れており、Mean Squared Error (MSE)、Mean Absolute Error (MAE)、Root Mean Squared Error (RMSE)、Coefficient of determined (R2)といった主要な指標に対して98%の精度と優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 01:59:25 GMT)
Improving Language Models for Emotion Analysis: Insights from Cognitive Science [0.0] 心理学と認知科学の主な感情理論を提示する。
本稿では,自然言語処理における感情アノテーションの主な手法を紹介する。
感情分析のための言語モデルを改善するための方向性を提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:42:13 GMT)
Impact of AI-tooling on the Engineering Workspace [0.0] Copilotユーザ間では,コーディング時間に有意な変化がみられた。
一部の企業は、PRのピックアップ時間を最大33%削減した。
ある企業は、メンテナンスとサポート作業から製品成長イニシアチブへの最大17%の労力を経験しました。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:04:09 GMT)
High-purity and stable single-photon emission in bilayer WSe$_2$ via phonon-assisted excitation [0.0] 重層WSe$$$量子エミッタの単一光子放出特性に及ぼす異なる光励起戦略の影響について検討する。
フォノンアシスト励起下では、狭く安定な単一光子放出が得られ、純度は 0.94pm 0.02,$ に達する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:37:59 GMT)
High-performance in-vacuum optical system for quantum optics experiments in a Penning-trap [0.0] カルシウムイオンおよびクーロン結晶から397nmの蛍光光子を検出するための新しい真空中光学系を提案する。
このシステムは、単一レーザー冷却されたイオンを点状のソースとして利用し、最終的な解像度は3.69(3)$mu$mに達する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:57:27 GMT)
High-fidelity single-spin shuttling in silicon [0.0] 電気ゲート電位を用いた異方性精製Si/SiGeヘテロ構造中の電子のシャットリングを報告する。
これにより、平均忠実度99%の200 ns以下の有効距離10m以上で電子を転位させることができる。
結果として、大規模半導体量子プロセッサの実現に向けた今後の取り組みが導かれる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:51:52 GMT)
Heterogeneous Learning Rate Scheduling for Neural Architecture Search on Long-Tailed Datasets [0.0] 本稿では,DARTSのアーキテクチャパラメータに適した適応学習率スケジューリング手法を提案する。
提案手法は,学習エポックに基づくアーキテクチャパラメータの学習率を動的に調整し,よく訓練された表現の破壊を防止する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:32:25 GMT)
Grapevine Disease Prediction Using Climate Variables from Multi-Sensor Remote Sensing Imagery via a Transformer Model [0.0] 本稿では,TabPFNモデルを用いたブロックワイドブドウ病の予測手法を提案する。
本手法は,高度な機械学習技術と詳細な環境データを統合することにより,疾患予測の精度と効率を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:33:15 GMT)
Geometric quantum discord of an arbitrary two-qudit state: the exact value and general upper bounds [0.0] 一般の2量子状態に対する幾何量子不協和の明確な正確な解析値を求める。
これにより、任意の2量子状態、純粋あるいは混合、幾何学的量子不協和の新たな一般上界を見つけることができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:36:37 GMT)
Generating multipartite nonlocality to benchmark quantum computers [0.0] 量子コンピュータは大規模に$n$の非局所性を生み出すのに利用できることを示す。
これにより、量子ビットの数や接続性に関わらず、古典的でない相関をベンチマークすることができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:03:35 GMT)
Generalized Zeno effect and entanglement dynamics induced by fermion counting [0.0] 一般化された測定プロセスにより,自由フェルミオンの1次元格子系について検討した。
その結果, フェルミオン計数および局地的職業計測にともなう自由フェルミオンの瞬時相関と絡み合い特性が著しく類似していることが判明した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:46:26 GMT)
From Complexity to Clarity: How AI Enhances Perceptions of Scientists and the Public's Understanding of Science [0.0] 本稿では, 科学コミュニケーションを簡素化し, 一般の科学理解を高めるために, 生成型AIの有効性を評価した。
研究1aは、PNAS要約(科学要約)と重要文(レイ要約)の簡易性について分析した。
研究2は、単純なGPT要約が科学者のより好ましい認識を促進することを実験的に実証した。
実験3では、参加者は単純なGPT要約を読めば、科学的文章の理解が良くなることを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:35:51 GMT)
FastAST: Accelerating Audio Spectrogram Transformer via Token Merging and Cross-Model Knowledge Distillation [0.0] FastASTはToken Merging(ToMe)をAudio Spectrogram Transformer(AST)フレームワークに統合するフレームワークである。
FastASTは、オーディオスペクトログラムに類似のトークンをマージすることで、広範な再トレーニングを必要とせずに、推論速度を向上させる。
実験によると、FastASTは精度に最小限の影響でオーディオ分類のスループットを向上させることができる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 19:50:50 GMT)
Fast measurements and multiqubit gates in dual species atomic arrays [0.0] ルビジウムおよびセシウム原子量子ビットの配列における高速シンドローム測定のためのアプローチを提案し,解析する。
このスキームは、$textsfCNOT_k$ gateを実装し、1つのセシウムアンシラ量子ビットを$kgeq 1$ rubidium量子ビットに絡み、状態測定に使用される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:26:00 GMT)
Existence of minimizers for the Dirac-Fock model of crystals [0.0] 結晶の平均場相対論的エネルギーを周期密度行列で導入する。
細胞1個あたりの電子数があまり多くない場合、基底状態の存在を証明します。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:28:26 GMT)
Entanglement, Squeezing and non-Locality in Filtered Two-Mode Squeezed Mixed States [0.0] 連続可変2モード圧縮混合状態のスペクトル成分間の絡み合いと非局在性について検討した。
我々は絡み合いと非局所性のための正確な境界を提供する。
また, 絡み合いの指標として2モードハイブリッド・クアチュアのスクイーズ評価を行った。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:57:35 GMT)
Entanglement of free-fermion systems, signal processing and algebraic combinatorics [0.0] 本稿では,グラフ上の自由フェルミオン系の絡み合いに関する最近の研究について述べる。
一方、時間と帯域制限問題との並列性を利用して、双スペクトル状態において、切断された相関行列と通勤する三角行列を得る。
一方、$P$-ポリノミカルアソシエーションスキームの文脈で生じるターウィリガー代数の既約分解は、単純化の枠組みをもたらす。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:39:32 GMT)
Enhancing non-Perl bioinformatic applications with Perl: Building novel, component based applications using Object Orientation, PDL, Alien, FFI, Inline and OpenMP [0.0] コンポーネントベースのソフトウェアエンジニアリング(CBSE)は、既存の再利用可能なソフトウェアコンポーネントを新しいアプリケーションに組み立てる方法論である。
Perlはこの分野で10年前まで広く使われていたが、最近のアプリケーションはBiioconductor/RまたはPythonを選択している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:32:50 GMT)
Enhanced Anomaly Detection in Automotive Systems Using SAAD: Statistical Aggregated Anomaly Detection [0.0] 本稿では,SAADと呼ばれる新しい異常検出手法を提案する。
SAADアプローチは、高度な統計技術と機械学習を統合し、その有効性は、自動車領域内のハードウェア・イン・ザ・ループ(HIL)環境からの実センサデータを検証することによって実証される。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:41:24 GMT)
Engineering impurity Bell states through coupling with a quantum bath [0.0] 我々は、ボソンの原子背景雲に浸漬された2つの区別可能な不純物を考え、システム全体がハーモニックトラップに閉じ込められている。
この2つの不純物は, ボゾン浴からの相互作用により空間的に絡み合ったバイポーラロン状態を形成することができることを示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:50:16 GMT)
Enforcing exact permutation and rotational symmetries in the application of quantum neural network on point cloud datasets [0.0] 量子機械学習の分野での最近の進歩は、量子回路の構造に物理対称性を取り入れるというアイデアを推進してきた。
回転と置換の両方に完全に不変な新しいQNN構造を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 05:13:50 GMT)
Embedding-based Multimodal Learning on Pan-Squamous Cell Carcinomas for Improved Survival Outcomes [0.0] PARADIGMは、マルチモーダルで異質なデータセットから学習し、臨床結果の予測を改善するフレームワークである。
膵扁平上皮癌においてGNNを訓練し,Moffitt Cancer Center肺SCCデータに対するアプローチを検証した。
我々のソリューションは、患者の状況を包括的に理解することを目的としており、異種データ統合と最大データビューの収束の利点についての洞察を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 22:19:14 GMT)
Efficient fidelity estimation: Alternative derivation and related applications [0.0] Uhlmann-Jozsa は、Uhlmann-Jozsa の二つの量子状態 $rho$ と $sigma$ の間の忠実さ、すなわち $F(rho,sigma):=(Trsqrtsqrtrhosigmasqrtrho)2$ は、$F(rho,sigma) = (Trsqrtrhosigma)2$ と簡単に書けることを示した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:25:11 GMT)
Efficient Parallel Multi-Hop Reasoning: A Scalable Approach for Knowledge Graph Analysis [0.0] マルチホップ推論(MHR)は様々な応用において重要な機能である。
本稿では,大規模グラフ上での時間効率の最適化に焦点をあてる。
ドメイン固有の学習埋め込みを利用する新しい並列アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:12:34 GMT)
Dynamical Mean-Field Theory of Self-Attention Neural Networks [0.0] トランスフォーマーベースのモデルは、様々な領域で例外的な性能を示している。
動作方法や期待されるダイナミクスについてはほとんど分かっていない。
非平衡状態における非対称ホップフィールドネットワークの研究に手法を用いる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:29:34 GMT)
Dispersive interaction between two atoms in Proca Quantum Electrodynamics [0.0] 2つの原子間の分散相互作用における質量光子の影響を解析する。
光子質量は、新しい長さスケールを導入するだけでなく、電磁場に対して縦方向の偏光を生じさせる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 00:32:24 GMT)
Dipole-dipole interacting two-level emitters in a moderately intense laser field [0.0] 共振器の共振特性について検討し, 共振器内での2レベルエミッタの共振特性について検討した。
世俗近似の下では、集団共鳴蛍光スペクトルは2N+1スペクトル線で構成されており、Nはサンプルから放出されるエミッタの数である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:27:04 GMT)
Detecting Markovianity of Quantum Processes via Recurrent Neural Networks [0.0] 本稿では、マルコフ的および非マルコフ的量子過程を分類するために、リカレントニューラルネットワーク(RNN)を利用する新しい手法を提案する。
このモデルは、様々なシナリオにまたがって95%を超える例外的な精度を示す。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:05:36 GMT)
Cybersecurity in Critical Infrastructures: A Post-Quantum Cryptography Perspective [0.0] 産業用通信ネットワークにおける暗号システムの実装は、通信のセキュリティと産業用インフラの償却との間のトレードオフに直面している。
サイバーセキュリティに対する新たな脅威は、量子コンピュータの理論的な提案によって生じた。
多くのグローバルエージェントは、セキュアな通信を量子セキュアなパラダイムに移行することが、フォールトトレランスの到来前に確立すべき優先事項であることを認識するようになった。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:29:10 GMT)
Computing $\varphi(N)$ for an RSA module with a single quantum query [0.0] RSAモジュールの$N$に対して$varphi(N)$を、ランダムに選択された整数の代入として$N$を演算する計算時間アルゴリズムを与える。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 08:13:09 GMT)
Comparing Deep Learning Models for Rice Mapping in Bhutan Using High Resolution Satellite Imagery [0.0] 本研究は,ブータン最上位の稲作地であるパロにおける作物の種類と収量に着目した。
2つのDeep Learningアプローチ、ポイントベース(DNN)とパッチベース(U-Net)モデルがクラウドコンピューティングプラットフォームと併用された。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:25:46 GMT)
Compact Polarization-Entangled Photon Source Based on Coexisting Noncritically Birefringent and Quasi Phase Matching in a Nonlinear Crystal [0.0] 周期的に偏光した非線形結晶中でコリニア偏光に絡み合った光子を生成する新しい光源を示す。
コンパクトソースは干渉計、繊細なドメイン構造、ポストセレクションを必要とせず、スケーラブルな量子コンピューティングと通信に有利である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 10:10:33 GMT)
Closed-channel parameters of Feshbach resonances [0.0] フェシュバッハ共鳴に関連する2体の観測物は、閉じたチャネルの性質に敏感である。
これは超低温原子における全ての磁気フェシュバッハ共鳴のケースである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 06:32:49 GMT)
Chebyshev Approximated Variational Coupled Cluster for Quantum Computing [0.0] 本稿では,量子コンピュータ上での変分結合クラスタ(VCC)理論を概ね実装する手法を提案する。
チェビシェフ近似VCC(C$d$-VCC)とエルミート部分チェビシェフ近似VCC(HC$d$-VCC)の2つの方法を導入する。
本稿では,量子特異値変換法を用いて,HC$d$-VCCの量子回路における実装について述べる。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:30:45 GMT)
Calibrating doubly-robust estimators with unbalanced treatment assignment [0.0] 本稿では、確率スコアモデリングのためのデータをアンサンプするDML推定器の簡単な拡張を提案する。
本論文は, 推定器が推定器の特性を保ち, 校正値が元の分布に一致することを示す理論的結果を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:11:52 GMT)
COVID-19 Twitter Sentiment Classification Using Hybrid Deep Learning Model Based on Grid Search Methodology [0.0] 感情予測は、Twitter COVID-19データセットへの埋め込み、ディープラーニングモデル、グリッド検索アルゴリズムを使用して達成される。
研究によると、新型コロナウイルスの接種に対する大衆の感情は、時間とともに改善しているようだ。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 07:48:06 GMT)
Breakdown of the quantum distinction of regular and chaotic classical dynamics in dissipative systems [0.0] 我々は、Grobe-Haake-Sommers予想がオープンディックモデルに当てはまらないことを示す。
この結果はGrobe-Haake-Sommers予想の普遍性に挑戦する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 18:00:03 GMT)
Bang-bang preparation of quantum many-body ground states in two dimensions: optimization of the algorithm with a two-dimensional tensor network [0.0] バンバン(BB)アルゴリズムは、2次元(2次元)量子多体ハミルトンの基底状態を作成する。
近傍テンソル更新を用いて、BB進化を無限対密度射影状態(iPEPS)でシミュレートする。
最適BBエネルギーは最適APエネルギーよりもはるかに速いバン数と収束する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:14:02 GMT)
Avoiding decoherence with giant atoms in a two-dimensional structured environment [0.0] 我々は、巨大原子が2次元の正方格子の空洞と結合する際にどのように振る舞うかを研究する。
連続体(BIC)における境界状態は、巨大原子が脱コヒーレンスを避けるために果たす役割を述べる。
光と物質の間の相互作用は、量子シミュレーションや量子情報処理に応用できるかもしれない。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 12:39:39 GMT)
Are Protein Language Models Compute Optimal? [0.0] 固定計算予算におけるモデルパラメータとトレーニングトークンの最適比について検討する。
本研究により, pLM サイズは計算予算とともにサブ線形にスケールし, モデルサイズが大きくなるにつれて性能が低下することが示された。
この研究は、より計算効率の良いPLMへの道を開き、そのトレーニングと計算生物学の実践的応用を民主化している。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 13:32:11 GMT)
About rescaling, discretisation and linearisation of $\mathtt{RNN}$ [0.0] 本稿では、リカレントニューラルネットワーク(mathtRNN$s)の数学的基礎と、時間的再スケーリング、離散化、線形化の3つの基本的な手順について考察する。
これらの技術は$mathttRNN$sの振る舞いを特徴づける重要なツールを提供し、時間力学、実用的な計算実装、解析の線形近似に関する洞察を可能にする。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:16:33 GMT)
A macroscopic delayed-choice quantum eraser using a commercial laser [0.0] 量子力学において、量子重ね合わせは互いに排他的な性質の間の確率振幅で表される。
遅延チョイス量子消去器は光子の性質のポスト決定のためのものである。
連続波レーザーを用いて、マクロな遅延チョイス量子消去器を実験的に実証した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 09:52:15 GMT)
A dynamical implementation of canonical second quantization on a quantum computer [0.0] 量子コンピュータの個別レジスタにおける生成・破壊演算子の実装に関する理論的手法を開発する。
有限メモリバンク上の可換(反可換)関係の定理を確立し、必要となる対称性および反対称性作用素を提供する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 14:46:21 GMT)
A Survey on Recent Random Walk-based Methods for Embedding Knowledge Graphs [0.0] 知識グラフ上の機械学習、ディープラーニング、NLPメソッドは、異なる分野に存在する。
知識グラフは通常、高次元を持つので、それらを低次元ベクトル空間に変換する必要がある。
埋め込みは、入力データ固有の特徴が保存される方法で高次元ベクトルを変換できる低次元空間である。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 16:08:39 GMT)
A Survey on Contextualised Semantic Shift Detection [0.0] セマンティックシフト検出(セマンティックシフト検出、Semantic Shift Detection、SSD)は、ターゲット語の意味における時間的変化を識別し、解釈し、評価するタスクである。
本稿では,意味表現,時間認識,学習モダリティ次元を特徴とする分類フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 15:33:13 GMT)
A PRISMA Driven Systematic Review of Publicly Available Datasets for Benchmark and Model Developments for Industrial Defect Detection [0.0] 進捗にとって重要な障壁は、注釈付き欠陥を含む包括的なデータセットの不足である。
2015年から2023年までのこの体系的なレビューでは、15の公開データセットが特定されている。
この体系的なレビューの目的は、これらのデータセットを単一の場所に集約し、研究者に包括的な参照を提供することである。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:14:59 GMT)
A Labelled Dataset for Sentiment Analysis of Videos on YouTube, TikTok, and Other Sources about the 2024 Outbreak of Measles [0.0] 本稿では2024年1月1日から5月31日までに264のウェブサイトで公表された麻疹の流行に関する4011件のビデオデータを含むデータセットを提案する。
YouTubeとTikTokはそれぞれ48.6%と15.2%を占めている。
これらのビデオのそれぞれについて、ビデオのURL、投稿のタイトル、投稿の説明、およびビデオの公開日をデータセット内の別の属性として提示する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:14:22 GMT)
A Deep Learning Approach to Detect Complete Safety Equipment For Construction Workers Based On YOLOv7 [0.0] 本研究では,建設作業員が着用する安全装置を同定する深層学習技術を提案する。
推奨されるアプローチは、YOLO v7オブジェクト検出アルゴリズムを使用して、これらの安全アイテムを正確に検出する。
トレーニングされたモデルでは,安全機器認識のための精度,リコール,F1スコアが良好に動作した。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 20:38:41 GMT)
A Concise Mathematical Description of Active Inference in Discrete Time [0.0] 本論文の主部は,行動選択理論の具体例を含む,このトピックの一般的な紹介として機能する。
付録では、より微妙な数学的詳細が議論されている。
この部分は、既に活発な推論文学を研究しているが、数学的詳細や導出を理解するのに苦労している読者を対象としている。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 21:09:45 GMT)
A Conceptual Framework For Trie-Augmented Neural Networks (TANNS) [0.0] Trie-Augmented Neural Networks (TANN)は、ニューラルネットワークとトリ構造を組み合わせることで、意思決定の透明性と機械学習の効率性を高める階層的な設計を形成する。
本稿では、リカレントニューラルネットワーク(RNN)とフィードフォワードニューラルネットワーク(FNN)を用いて、テキストおよび文書分類におけるTANNの使用について検討する。
論文参考訳(メタデータ) (Tue, 11 Jun 2024 17:08:16 GMT)