Explore In-Context Segmentation via Latent Diffusion Models [132.3] 潜在拡散モデル(LDM)は、文脈内セグメンテーションに有効な最小限のモデルである。
画像とビデオの両方のデータセットを含む、新しい、公正なコンテキスト内セグメンテーションベンチマークを構築します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:52:31 GMT)
Discriminative Probing and Tuning for Text-to-Image Generation [129.4] テキスト・ツー・イメージ生成(T2I)は、しばしば、生成された画像における関係の混乱のようなテキスト・イメージの誤調整問題に直面している。
本稿では,T2Iモデルの識別能力を向上し,より正確なテキストと画像のアライメントを実現することを提案する。
本稿では,T2Iモデル上に構築された識別アダプターを用いて,2つの代表課題における識別能力を探索し,テキスト画像のアライメントを改善するために識別微調整を利用する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:02:29 GMT)
Less is More: Data Value Estimation for Visual Instruction Tuning [127.4] 視覚的命令データにおける冗長性を除去する新しいデータ選択手法を提案する。
LLaVA-1.5の実験では、約7.5%のデータしか使用していないアプローチが、フルデータ微調整モデルと同等の性能を達成できることが示されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:47:25 GMT)
Exploring Safety Generalization Challenges of Large Language Models via Code [126.8] 本稿では,自然言語入力をコード入力に変換するフレームワークであるCodeAttackを紹介する。
調査によると、CodeAttackは全モデルの80%以上の安全ガードレールを一貫してバイパスしている。
CodeAttackと自然言語の間の大きな分散ギャップは、安全性の一般化を弱める。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:57:37 GMT)
Actional Atomic-Concept Learning for Demystifying Vision-Language Navigation [124.1] 行動原子概念学習(Actical Atomic-Concept Learning, ACL)は、視覚的な観察を行動原子の概念にマッピングしてアライメントを促進する。
AACLは、細粒度(R2R)と高レベル(REVERIEとR2R-Last)のVLNベンチマークで新しい最先端結果を確立する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:09:11 GMT)
What Sketch Explainability Really Means for Downstream Tasks [121.9] 我々は、人間の脳卒中の影響を強く強調し、説明可能性のためのスケッチの独特なモダリティを探求する。
我々は軽量でポータブルな説明可能性ソリューションを提案します -- 事前訓練されたモデルとシームレスに統合するプラグインです。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:22:33 GMT)
SketchINR: A First Look into Sketches as Implicit Neural Representations [120.4] 暗黙的ニューラルモデルを用いてベクトルスケッチの表現を前進させるSketchINRを提案する。
可変長ベクトルスケッチは、時間とストロークの関数として下層の形状を暗黙的に符号化する固定次元の潜時空間に圧縮される。
初めてSketchINRは、ストロークの数と複雑さの点で、さまざまな抽象化でスケッチを再現する人間の能力をエミュレートする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:49:29 GMT)
Log-linear Guardedness and its Implications [116.9] 線形性を仮定する神経表現から人間の解釈可能な概念を消去する方法は、抽出可能で有用であることが判明した。
この研究は、対数線ガードネスの概念を、敵が表現から直接その概念を予測することができないものとして正式に定義している。
バイナリの場合、ある仮定の下では、下流の対数線形モデルでは消去された概念を復元できないことを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:39:35 GMT)
HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting [113.4] 既存の方法は、スコア蒸留サンプリング(SDS)を通じてメッシュやニューラルフィールドのような3D表現を最適化する。
本稿では,高精細な形状とリアルな外観を持つ高品質な3D人間を創出する,効率的かつ効果的な枠組みであるHumanGaussianを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:14 GMT)
DyVal: Dynamic Evaluation of Large Language Models for Reasoning Tasks [112.7] 大規模言語モデル(LLM)の動的評価のためのプロトコルであるDyValを紹介する。
この枠組みに基づき、有向非巡回グラフの構造的利点を活用してグラフインフォームドDyValを構築する。
Flan-T5-large から GPT-3.5-Turbo および GPT-4 まで様々な LLM の評価を行った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:52:16 GMT)
Images are Achilles' Heel of Alignment: Exploiting Visual Vulnerabilities for Jailbreaking Multimodal Large Language Models [107.9] 本研究では,テキスト入力中の悪意のある意図の有害性を隠蔽し,増幅するHADESという新しいジェイルブレイク手法を提案する。
実験の結果、HADESは既存のMLLMを効果的にジェイルブレイクし、LLaVA-1.5では90.26%、Gemini Pro Visionでは71.60%の攻撃成功率を達成した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:24:55 GMT)
MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training [105.4] MLLM(Performant Multimodal Large Language Models)を構築する。
特に,さまざまなアーキテクチャコンポーネントとデータ選択の重要性について検討する。
本稿では,画像キャプチャ,インターリーブ画像テキスト,テキストのみのデータを組み合わせた大規模マルチモーダル事前学習について述べる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:51:32 GMT)
Easy-to-Hard Generalization: Scalable Alignment Beyond Human Supervision [99.0] 現在のAIアライメント手法は、人間が提供する実演や判断に依存している。
彼らの能力が人間のレベルを超えたとき、システムを改善するにはどうすればよいのか?
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:12:38 GMT)
TextField3D: Towards Enhancing Open-Vocabulary 3D Generation with Noisy Text Fields [98.6] 条件付き3D生成モデルであるTextField3Dを導入する。
テキストプロンプトを直接入力として使用するのではなく、与えられたテキストプロンプトの潜在空間に動的ノイズを注入することを提案する。
テクスチャとテクスチャの両面で条件生成を導くため、テキスト3D判別器とテキスト2.5D判別器でマルチモーダル識別を構築する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:36:29 GMT)
Eyes Closed, Safety On: Protecting Multimodal LLMs via Image-to-Text Transformation [98.0] MLLMの安全性を意識した新しいトレーニング不要保護手法ECSO(Eyes Closed, Safety On, Eyes Closed, Safety On)を提案する。
ECSOは、安全でない画像をテキストに適応的に変換することで、より安全な応答を生成し、あらかじめ整列されたLCMの本質的な安全性メカニズムを活性化する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:03:04 GMT)
Improving Distant 3D Object Detection Using 2D Box Supervision [97.8] 遠方の物体の欠損した深さを回復するフレームワークであるLR3Dを提案する。
我々のフレームワークは汎用的であり、3D検出手法を広く活用する可能性がある。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:54:31 GMT)
GiT: Towards Generalist Vision Transformer through Universal Language Interface [94.3] 本稿では,バニラ ViT のみを用いて,様々な視覚タスクに同時に適用可能な,シンプルかつ効果的な GiT フレームワークを提案する。
GiTはマルチタスクのビジュアルモデルで、タスク固有の微調整なしで5つの代表的なベンチマークで共同でトレーニングされている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:47:41 GMT)
depyf: Open the Opaque Box of PyTorch Compiler for Machine Learning Researchers [92.1] textttdepyfは、PyTorchコンパイラの内部動作を復号化するためのツールである。
textttdepyfは、PyTorchが生成したバイトコードを等価なソースコードに逆コンパイルする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:17:14 GMT)
CLOAF: CoLlisiOn-Aware Human Flow [90.2] CLOAFは、通常の微分方程式の微分同相性を利用して、身体の自己切断を除去する。
CLOAFは、異なるため、ポーズを微調整したり、全体のパフォーマンスを改善するために、ベースラインを形づくることができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:38:09 GMT)
Stability to Deformations of Manifold Filters and Manifold Neural Networks [89.5] 本論文は、多様体(M)畳み込みフィルタとニューラルネットワーク(NN)を定義し、研究する。
この論文の主な技術的貢献は、多様体の滑らかな変形に対する多様体フィルタとMNNの安定性を分析することである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:39:42 GMT)
BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences [89.5] 本稿では,BurstAttention'という分散アテンションフレームワークを提案し,メモリアクセスと通信操作を最適化する。
異なる長さ設定下での実験結果は、BurstAttentionが長いシーケンスを処理する上で大きな利点があることを示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:51:58 GMT)
DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model [84.3] 本研究は,マルチモーダル大言語モデル(MLLM)に基づく新しい解釈可能なエンドツーエンド自動運転システムであるDriveGPT4を紹介する。
DriveGPT4は、車両動作の解釈を促進し、関連する推論を提供し、ユーザによるさまざまな質問に効果的に対処する。
BDD-Xデータセットで行った評価では,DriveGPT4の質的,定量的な性能が向上した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:05:43 GMT)
Merge, Then Compress: Demystify Efficient SMoE with Hints from Its Routing Policy [84.1] わずかに活性化されたMixture-of-Experts(SMoE)は、ニューラルネットワークの学習能力のスケールアップを約束している。
ルーティング統計を利用したM-SMoEを提案する。
我々のMC-SMoEは最大80%のメモリと20%のFLOPを削減でき、性能は実質的に損なわれない。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:01:15 GMT)
Unveiling the Generalization Power of Fine-Tuned Large Language Models [81.7] 大規模言語モデル(LLM)に固有の内在的一般化能力に微調整が及ぼす影響について検討する。
本研究の主目的は、生成タスクと分類タスクを微調整したモデルが、異なる領域やタスクに一般化する際に異なる振る舞いを示すことである。
生成タスクの微調整中にコンテキスト内学習戦略を統合することで、モデルの一般化能力を高めることができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:18:59 GMT)
Probabilistic Contrastive Learning for Long-Tailed Visual Recognition [78.7] 細長い分布は、少数の少数派が限られた数のサンプルを含む実世界のデータにしばしば現れる。
近年の研究では、教師付きコントラスト学習がデータ不均衡を緩和する有望な可能性を示していることが明らかになっている。
本稿では,特徴空間の各クラスからのサンプルデータ分布を推定する確率論的コントラスト学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:35:41 GMT)
Large Language Models Cannot Self-Correct Reasoning Yet [78.2] LLM(Large Language Models)は、非並列テキスト生成機能を備えた画期的な技術として登場した。
生成したコンテンツの正確性と適切性に関する懸念が続いている。
現代の方法論である自己補正がこれらの問題に対する対策として提案されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:27:52 GMT)
FedImpro: Measuring and Improving Client Update in Federated Learning [77.7] フェデレートラーニング(FL)モデルは、不均一なデータによって引き起こされるクライアントのドリフトを経験することが多い。
我々は、クライアントのドリフトに対する別の視点を示し、改善されたローカルモデルを生成することにより、それを緩和することを目指している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:45:56 GMT)
VideoPoet: A Large Language Model for Zero-Shot Video Generation [76.8] VideoPoetは、高品質なビデオと一致するオーディオを合成できる言語モデルである。
VideoPoetはマルチモーダル入力を処理するデコーダのみのトランスフォーマーアーキテクチャを採用している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:08:11 GMT)
World Model on Million-Length Video And Language With Blockwise RingAttention [75.8] 現在の言語モデルは、言葉で簡単に説明できない世界の理解の側面に乏しく、複雑で長期的なタスクに苦しむ。
ビデオシーケンスは、言語と静的な画像に欠落する貴重な時間情報を提供するため、言語との共同モデリングには魅力的である。
数百万のビデオおよび言語シーケンスのトークンから学ぶことは、メモリ制約、計算複雑性、限られたデータセットによる課題を引き起こす。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:17:03 GMT)
Musketeer: Joint Training for Multi-task Vision Language Model with Task Explanation Prompts [75.8] 本稿では,全てのタスクに対してパラメータを共同で訓練し,複数の異種タスク間で完全に共有する視覚言語モデルを提案する。
単一のモデルで、Musteteerは単一のタスクでトレーニングされた強いベースラインに匹敵する結果を得る。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:30:52 GMT)
Generalized Predictive Model for Autonomous Driving [75.4] 本稿では,自動運転分野における最初の大規模ビデオ予測モデルを紹介する。
我々のモデルはGenADと呼ばれ、新しい時間的推論ブロックでシーンを駆動する際の挑戦的なダイナミクスを扱う。
アクション条件付き予測モデルやモーションプランナーに適応することができ、現実世界の運転アプリケーションに大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:33 GMT)
Self-Consistency Training for Hamiltonian Prediction [74.8] ハミルトン予測は自己整合性原理を持ち,ラベル付きデータを必要としない正確なトレーニング手法を提案する。
データスカースとアウト・オブ・ディストリビューションのシナリオにおけるより良い一般化と、アモート化によるより良い効率を実証的に実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:52:57 GMT)
Controlling Text-to-Image Diffusion by Orthogonal Finetuning [74.2] そこで本研究では,テキストから画像への拡散モデルを下流タスクに適用するための原理的な微調整手法であるorthogonal Finetuning(OFT)を提案する。
既存の方法とは異なり、OFTは単位超球上の対のニューロン関係を特徴付ける超球面エネルギーを確実に保存することができる。
我々のOFTフレームワークは、生成品質と収束速度において既存の手法よりも優れていることを実証的に示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:17:34 GMT)
CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.8] CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:33:51 GMT)
SOTOPIA-$π$: Interactive Learning of Socially Intelligent Language Agents [73.4] 本稿では,対話型学習手法であるSOTOPIA-$pi$を提案する。
この手法は,大規模言語モデル(LLM)の評価に基づいて,フィルタリングされた社会的相互作用データに対する行動クローニングと自己強化トレーニングを活用する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:13:20 GMT)
LILO: Learning Interpretable Libraries by Compressing and Documenting Code [72.9] LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:54:54 GMT)
XAL: EXplainable Active Learning Makes Classifiers Better Low-resource Learners [71.8] 低リソーステキスト分類のための新しい説明可能なアクティブラーニングフレームワーク(XAL)を提案する。
XALは分類器に対して、推論を正当化し、合理的な説明ができないラベルのないデータを掘り下げることを推奨している。
6つのデータセットの実験では、XALは9つの強いベースラインに対して一貫した改善を達成している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:55:44 GMT)
Self-Consistency Boosts Calibration for Math Reasoning [69.8] 数学推論タスクの自己整合性に基づく3つのオフ・ザ・シェルフ校正手法を設計する。
p(True) や logit に基づく既存手法よりもモデルの信頼性と精度を橋渡しする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:17:10 GMT)
Desigen: A Pipeline for Controllable Design Template Generation [69.5] Desigenは、背景画像と背景上のレイアウト要素を生成する自動テンプレート生成パイプラインである。
背景生成過程において,サリエンシ分布を制限し,所望領域の注意重みを低減させる2つの手法を提案する。
実験により、提案したパイプラインは人間の設計に匹敵する高品質なテンプレートを生成することが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:32:28 GMT)
IBVC: Interpolation-driven B-frame Video Compression [68.2] Bフレームビデオ圧縮は、双方向動作推定と動き補償(MEMC)符号化をミドルフレーム再構成に適用することを目的としている。
従来の学習アプローチでは、しばしば双方向の光フロー推定に依存するニューラルネットワークのPフレームコーデックをBフレームに直接拡張する。
これらの問題に対処するために,IBVC (Interpolation-B-frame Video Compression) という単純な構造を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:01:11 GMT)
3D-VLA: A 3D Vision-Language-Action Generative World Model [68.0] 最近の視覚言語アクション(VLA)モデルは2D入力に依存しており、3D物理世界の広い領域との統合は欠如している。
本稿では,3次元知覚,推論,行動をシームレスにリンクする新しい基礎モデルのファウンデーションモデルを導入することにより,3D-VLAを提案する。
本実験により,3D-VLAは実環境における推論,マルチモーダル生成,計画能力を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:41 GMT)
Eliciting the Translation Ability of Large Language Models via Multilingual Finetuning with Translation Instructions [68.0] 大規模事前学習言語モデル(LLM)は多言語翻訳において強力な能力を示している。
本稿では,多言語事前学習言語モデルであるXGLM-7Bを微調整して,多言語翻訳を行う方法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:04:49 GMT)
Expressive Losses for Verified Robustness via Convex Combinations [67.5] 本研究では, 過近似係数と異なる表現的損失に対する性能分布の関係について検討した。
表現性が不可欠である一方で、最悪の場合の損失のより良い近似は、必ずしも優れた堅牢性-正確性トレードオフに結びついていないことを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:20:50 GMT)
RepViT: Revisiting Mobile CNN From ViT Perspective [67.1] 軽量ビジョントランス (ViT) は、軽量畳み込みニューラルネットワーク (CNN) と比較して、優れた性能と低レイテンシを示す
本研究では、ViTの観点から軽量CNNの効率的な設計を再考し、モバイルデバイスへの将来性を強調した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:28:13 GMT)
InstructCV: Instruction-Tuned Text-to-Image Diffusion Models as Vision Generalists [66.9] 我々は,タスク固有の設計選択を抽象化する,コンピュータビジョンタスクのための統一言語インタフェースを開発する。
InstructCVと呼ばれる我々のモデルは、他のジェネラリストやタスク固有の視覚モデルと比較して競合的に機能する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:03:49 GMT)
ZeroFlow: Scalable Scene Flow via Distillation [66.7] シーンフロー推定は、時間的に連続する点雲間の3次元運動場を記述するタスクである。
State-of-the-artメソッドは、強い事前とテスト時の最適化技術を使用するが、フルサイズの点雲を処理するには数秒の順序を必要とする。
本研究では,ラベルなし最適化手法を用いて擬似ラベルを生成し,フィードフォワードモデルを監督する簡易でスケーラブルな蒸留フレームワークであるScene Flow via Distillationを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:38:36 GMT)
GroupContrast: Semantic-aware Self-supervised Representation Learning for 3D Understanding [66.6] 自己教師付き3D表現学習は、大規模未ラベルの点群から効果的な表現を学習することを目的としている。
本稿では,セグメンテーションとセマンティック・アウェア・コントラッシブ・ラーニングを組み合わせた新しいアプローチであるGroupContrastを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:59 GMT)
PoIFusion: Multi-Modal 3D Object Detection via Fusion at Points of Interest [65.5] PoIFusionは興味のある時点でRGB画像とLiDAR点雲の情報を融合する(略してPoI)
本手法は、ビュー変換による情報損失を防止し、計算集約的なグローバルな注意をなくす。
注目すべきは、私たちのPoIFusionは74.9%のNDSと73.4%のmAPを獲得し、マルチモーダルな3Dオブジェクト検出ベンチマークで最先端の記録を樹立したことです。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:28:12 GMT)
Emo-Avatar: Efficient Monocular Video Style Avatar through Texture Rendering [64.9] 遅延ニューラルレンダリングによる効率的なモノトニックビデオスタイルアバター (Emo-Avatar) を提案する。
Emo-Avatarは、スタイルのカスタマイズ時間を、既存の方法と比較して数時間からわずか5分に短縮する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:30:10 GMT)
GAIA: Zero-shot Talking Avatar Generation [64.8] GAIA(Generative AI for Avatar)を導入し、会話アバター生成におけるドメインの先行性を排除した。
GAIAは、自然性、多様性、リップシンク品質、視覚的品質の点で、これまでのベースラインモデルを上回っている。
汎用的で、制御可能な音声アバター生成やテキストインストラクションされたアバター生成など、さまざまなアプリケーションを可能にする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:49:40 GMT)
Open-Vocabulary Object Detection with Meta Prompt Representation and Instance Contrastive Optimization [63.7] 本稿ではメタプロンプトとインスタンスコントラスト学習(MIC)方式を用いたフレームワークを提案する。
まず、クラスとバックグラウンドのプロンプトを学習するプロンプトが新しいクラスに一般化するのを助けるために、新しいクラスエマージシナリオをシミュレートする。
第二に、クラス内コンパクト性とクラス間分離を促進するためのインスタンスレベルのコントラスト戦略を設計し、新しいクラスオブジェクトに対する検出器の一般化に寄与する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:25:10 GMT)
BEHAVIOR-1K: A Human-Centered, Embodied AI Benchmark with 1,000 Everyday Activities and Realistic Simulation [63.4] 本稿では,人間中心ロボットの総合シミュレーションベンチマークであるBEHAVIOR-1Kを提案する。
ひとつは、90以上のオブジェクトにリッチな物理的およびセマンティックな特性を付加した50のシーンで、1,000の日常的な活動を定義することである。
第二にOMNIGIBSONは、現実的な物理シミュレーションと剛体、変形可能な体、液体のレンダリングを通じてこれらの活動を支援する新しいシミュレーション環境である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:48:36 GMT)
Efficient Transferability Assessment for Selection of Pre-trained Detectors [63.2] 本稿では,事前学習対象検出器の効率的な伝達性評価について検討する。
我々は、事前訓練された検出器の大規模で多様な動物園を含む検出器転送性ベンチマークを構築した。
実験により,本手法は伝達性の評価において,他の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:23:23 GMT)
iTransformer: Inverted Transformers Are Effective for Time Series Forecasting [62.4] iTransformerを提案する。これは、逆次元に注意とフィードフォワードのネットワークを単純に適用する。
iTransformerモデルは、挑戦的な現実世界のデータセットの最先端を実現する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:45:57 GMT)
G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.9] 現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。
本手法は,テキスト応答とグラフの関連部分をハイライトする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:04:40 GMT)
MT-PATCHER: Selective and Extendable Knowledge Distillation from Large Language Models for Machine Translation [61.7] 機械翻訳(MT)分野における言語モデル(LLM)の強みを実証した。
我々は,LLMから既存のMTモデルに選択的かつ包括的かつ積極的に知識を伝達するMT-Patcherというフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:07:39 GMT)
Towards Natural Language-Guided Drones: GeoText-1652 Benchmark with Spatial Relation Matching [60.6] 自然言語コマンドを通じてドローンをナビゲートすることは、アクセス可能なマルチモーダルデータセットが不足しているため、依然として難しい。
我々は新しい自然言語誘導ジオローカライゼーションベンチマークGeoText-1652を紹介する。
このデータセットは、インタラクティブなヒューマンコンピュータプロセスを通じて体系的に構築される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:38:53 GMT)
Shake to Leak: Fine-tuning Diffusion Models Can Amplify the Generative Privacy Risk [60.4] 私たちは新しいプライバシーリスク、Shake-to-Leak(S2L)を明らかにしました。
最悪の場合、S2Lは拡散モデルにおける最先端の会員推論攻撃(MIA)を5.4%のAUCで増幅することができる。
この発見は、拡散モデルによるプライバシーリスクが、これまで認識されていたよりもさらに深刻であることを示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:48:37 GMT)
Large language models surpass human experts in predicting neuroscience results [60.3] 大きな言語モデル(LLM)は、人間の専門家よりも新しい結果を予測する。
BrainBenchは神経科学の結果を予測するためのベンチマークだ。
我々のアプローチは神経科学に特有ではなく、他の知識集約的な取り組みに伝達可能である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:32:15 GMT)
Multilingual Audio-Visual Speech Recognition with Hybrid CTC/RNN-T Fast Conformer [59.6] 本稿では,複数の改良を加えた多言語音声認識モデルを提案する。
我々は、6つの異なる言語に対する音声視覚訓練データの量を増やし、重複しない多言語データセットの自動書き起こしを生成する。
提案モデルでは, LRS3データセット上での新たな最先端性能を実現し, WERは0.8%に達した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:16:32 GMT)
Exploring Self-supervised Logic-enhanced Training for Large Language Models [59.2] 本稿では,自己指導型ポストトレーニングによる論理的知識の活用の可能性について検討する。
我々はMERItの自己回帰的目的変数を考案し、パラメータサイズが30億から13億の2つのLLM系列、すなわちFLAN-T5とLLaMAと統合する。
2つの挑戦的な論理的推論ベンチマークの結果は、LogicLLMの有効性を示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:05:08 GMT)
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering [59.1] ビジュアルテキストレンダリングは、テキストから画像生成モデルにとって根本的な課題である。
文字認識のBYT5エンコーダを微調整することで、一連のカスタマイズされたテキストエンコーダ、Glyph-ByT5を作成します。
本稿では,Glyph-ByT5をSDXLに統合する方法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:55:33 GMT)
KnowCoder: Coding Structured Knowledge into LLMs for Universal Information Extraction [59.0] コード生成によるユニバーサル情報抽出(UIE)を行うためのLarge Language Model(LLM)であるKnowCoderを提案する。
KnowCoderは、異なるスキーマをPythonクラスに一様に変換するコードスタイルのスキーマ表現メソッドを導入した。
KnowCoderには、2フェーズの学習フレームワークがあり、コード事前トレーニングによるスキーマ理解能力と、命令チューニングによるスキーマ追従能力を向上させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:47:41 GMT)
Few-Shot Class Incremental Learning with Attention-Aware Self-Adaptive Prompt [58.9] ASP(Attention-Aware Self-Adaptive Prompt)という新しいフレームワークを提案する。
ASP.NETはタスク不変のプロンプトを奨励し、注意点から特定の情報を減らすことで共有知識をキャプチャする。
要約すると、ASPはベースタスクの過度な適合を防ぎ、数秒のインクリメンタルタスクで膨大なデータを必要としない。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:34:53 GMT)
VIXEN: Visual Text Comparison Network for Image Difference Captioning [58.2] 画像間の視覚的差異をテキストで簡潔に要約する手法であるVIXENを提案する。
提案するネットワークは,事前学習された大規模言語モデルに対するソフトプロンプトを構築し,画像特徴を一対にマッピングする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:18:43 GMT)
The Butterfly Effect of Model Editing: Few Edits Can Trigger Large Language Models Collapse [58.0] 単一の編集でさえモデル崩壊を引き起こし、様々なベンチマークタスクで大幅なパフォーマンス低下を示す。
編集後の大規模言語モデルのベンチマークは、過激な時間とリソース集約である。
提案手法は,下流タスク性能と強い相関を示す広範な実験により検証され,サロゲート指標としてパープレキシティを用いる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:18:21 GMT)
Sculpt3D: Multi-View Consistent Text-to-3D Generation with Sparse 3D Prior [58.0] 本稿では,2次元拡散モデルを再学習することなく,抽出した参照オブジェクトから3次元先行を明示的に注入する,電流パイプラインを備えた新しいフレームワークSculpt3Dを提案する。
具体的には、スパース線サンプリングによるキーポイントの監督により、高品質で多様な3次元形状を保証できることを実証する。
これら2つの分離された設計は、参照オブジェクトからの3D情報を利用して、2D拡散モデルの生成品質を保ちながら、3Dオブジェクトを生成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:39:59 GMT)
EMDM: Efficient Motion Diffusion Model for Fast and High-Quality Motion Generation [57.5] 現在の最先端生成拡散モデルでは、優れた結果が得られたが、品質を犠牲にすることなく、高速な生成に苦慮している。
高速かつ高品質な人体運動生成のための効率的な運動拡散モデル(EMDM)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:49:25 GMT)
FedComLoc: Communication-Efficient Distributed Training of Sparse and Quantized Models [56.2] フェデレートラーニング(FL)は、異種クライアントがローカルにプライベートデータを処理し、中央サーバーと対話できるというユニークな特徴から、注目を集めている。
我々は,emphScaffnewに実用的で効果的な圧縮を統合し,通信効率を向上するFedComLocを紹介した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:29:59 GMT)
Don't Judge by the Look: A Motion Coherent Augmentation for Video Recognition [56.1] Motion Coherent Augmentation (MCA)は、ビデオ認識のためのデータ拡張手法である。
MCAはビデオの外観変化を導入し、静的な外観ではなく、モデルに動きのパターンを優先するよう暗黙的に促す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:53:04 GMT)
Neural Fields with Thermal Activations for Arbitrary-Scale Super-Resolution [56.1] 本稿では,適応型ガウスPSFを用いて点を問合せできる新しい設計手法を提案する。
理論的に保証されたアンチエイリアスにより、任意のスケールの単一画像の超解像のための新しい手法が確立される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:17:34 GMT)
Video Editing via Factorized Diffusion Distillation [56.0] EVE(Emu Video Edit)は,映像編集において,教師付き映像編集データに頼らずに新たな最先端技術を確立するモデルである。
EVEを開発するために、画像編集アダプタとビデオ生成アダプタを別々に訓練し、同じテキスト・画像モデルにアタッチする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:22:54 GMT)
Graph Neural Architecture Search with GPT-4 [56.0] GPT-4に基づくグラフニューラルアーキテクチャ探索法(略してGPT4GNAS)を提案する。
本手法の基本的な考え方は,GPT-4をグラフニューラルアーキテクチャの生成タスクへと導くための新しいプロンプトを設計することである。
プロンプトでGPT-4を反復実行することにより、GPT4GNASは高速収束でより正確なグラフニューラルネットワークを生成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:50:51 GMT)
Generalization of Scaled Deep ResNets in the Mean-Field Regime [55.8] 無限深度および広帯域ニューラルネットワークの限界におけるエンスケールResNetについて検討する。
この結果から,遅延学習体制を超えた深層ResNetの一般化能力に関する新たな知見が得られた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:48:00 GMT)
Right Place, Right Time! Towards ObjectNav for Non-Stationary Goals [55.6] 本研究では,屋内環境における非定常的かつ隠蔽されたターゲットに対して,ObjectNavタスクに取り組むための新しい手法を提案する。
本稿では,新しいメモリ拡張 LLM ベースのポリシーを用いて,その定式化,実現可能性,ナビゲーションベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:33:22 GMT)
AdaShield: Safeguarding Multimodal Large Language Models from Structure-based Attack via Adaptive Shield Prompting [54.9] textbfAdaptive textbfShield Promptingを提案する。これは、MLLMを構造ベースのジェイルブレイク攻撃から守るための防御プロンプトで入力をプリペイドする。
我々の手法は、構造に基づくジェイルブレイク攻撃に対するMLLMの堅牢性を一貫して改善することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:57:13 GMT)
BOP Challenge 2023 on Detection, Segmentation and Pose Estimation of Seen and Unseen Rigid Objects [54.9] BOPチャレンジ2023(BOP Challenge 2023)は、モデルベースの6Dオブジェクトのポーズ推定において、芸術の状態を捉えるために組織された一連のパブリックコンペティションの5番目である。
観察対象のベストメソッド(GPose)は、適度な精度向上を達成したが、2022のベストメソッドに比べて43%の実行時間改善を実現した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:37:46 GMT)
Deep Learning for Visual Speech Analysis: A Survey [54.5] 本稿では,視覚音声分析におけるディープラーニング手法の最近の進歩を概観する。
私たちは、基本的な問題、課題、ベンチマークデータセット、既存のメソッドの分類、最先端のパフォーマンスなど、視覚音声のさまざまな側面をカバーしています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:06:18 GMT)
Introducing Routing Functions to Vision-Language Parameter-Efficient Fine-Tuning with Low-Rank Bottlenecks [54.3] 低ランクボトルネックにおける視覚言語アライメントを高めるために,ルーティング関数と呼ばれる操作群を提案する。
ルーティング関数は線形演算を採用し、新しいトレーニング可能なパラメータを導入しない。
様々な視覚言語 PEFT タスクにまたがって,小型ながら一貫した改善を観察する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:27:42 GMT)
Learning Constrained Optimization with Deep Augmented Lagrangian Methods [54.2] 機械学習(ML)モデルは、制約付き最適化ソルバをエミュレートするために訓練される。
本稿では,MLモデルを用いて2つの解推定を直接予測する手法を提案する。
これにより、双対目的が損失関数であるエンドツーエンドのトレーニングスキームと、双対上昇法をエミュレートした原始的実現可能性への解推定を可能にする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:09:17 GMT)
TaxoLLaMA: WordNet-based Model for Solving Multiple Lexical Sematic Tasks [54.0] 本稿では,LLMがWordNetから語彙・意味的知識を抽出する能力について検討する。
4ビット量子化とLoRAにより軽量なオールインワンモデルであるTaxoLLaMAを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:21:25 GMT)
Reverse em-problem based on Bregman divergence and its application to classical and quantum information theory [53.6] 近年,反復を必要とせずにチャネル容量を計算できる解析手法が提案されている。
トヨタが提案した逆のEm-problemに注意を向けます。
逆の Em-problem の非定型式を導出する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:20:28 GMT)
Hyperparameters in Continual Learning: a Reality Check [53.3] ベンチマークデータセットで構築されたCLシナリオ上で、CLアルゴリズムをトレーニングすることは一般的なプラクティスである。
本稿では,この評価プロトコルは実用的でなく,CLアルゴリズムのCL能力を効果的に評価することができないことを主張する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:13:01 GMT)
AVIBench: Towards Evaluating the Robustness of Large Vision-Language Model on Adversarial Visual-Instructions [53.0] LVLM(Large Vision-Language Models)は、視覚的インストラクションに対するユーザからの対応において、大きな進歩を見せている。
LVLMのこのような脅威に対する堅牢性の重要性にもかかわらず、この分野の現在の研究は限られている。
AVIBenchは、様々な対向的な視覚的命令に直面した場合のLVLMの堅牢性を分析するために設計されたフレームワークである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:51:07 GMT)
Spatial-temporal Memories Enhanced Graph Autoencoder for Anomaly Detection in Dynamic Graphs [53.0] 動的グラフにおける異常検出は、グラフ構造と属性の時間的進化によって大きな課題となる。
空間記憶強調グラフオートエンコーダ(STRIPE)について紹介する。
STRIPEは、動的グラフの異なる空間的・時間的ダイナミクスを効果的に活用することにより、異常を識別する優れた能力を示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:26:10 GMT)
Instruction Tuning for Large Language Models: A Survey [52.9] 我々は、ITの一般的な方法論、ITデータセットの構築、ITモデルのトレーニング、異なるモダリティ、ドメイン、アプリケーションへのアプリケーションを含む、文献を体系的にレビューする。
また、ITの潜在的な落とし穴とそれに対する批判、および既存の戦略の現在の欠陥を指摘し、実りある研究の道筋を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:28:22 GMT)
Faceptor: A Generalist Model for Face Perception [52.8] Faceptorは、よく設計されたシングルエンコーダのデュアルデコーダアーキテクチャを採用するために提案されている。
Faceptorへのレイヤアテンションにより、モデルが最適なレイヤから機能を適応的に選択して、望ましいタスクを実行することができる。
我々のトレーニングフレームワークは補助的な教師付き学習にも適用でき、年齢推定や表現認識といったデータスパースタスクの性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:42:31 GMT)
Towards Generative Abstract Reasoning: Completing Raven's Progressive Matrix via Rule Abstraction and Selection [52.1] Raven's Progressive Matrix (RPM) は、マシンインテリジェンスにおける抽象的な視覚的推論を探索するために広く使われている。
RPMテストの参加者は、属性変更ルールを推論し、組み合わせることで、強力な推論能力を示すことができる。
本稿では,ルール AbstractIon と Selection を用いて,回答生成問題に対する潜時変数モデルを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:29:26 GMT)
AdaptiveClick: Clicks-aware Transformer with Adaptive Focal Loss for Interactive Image Segmentation [51.8] インタラクティブイメージ(IIS)のためのトランスフォーマーベースのマスク適応セグメンテーションフレームワークであるAdaptiveClickを紹介した。
Click-Aware Mask-Adaptive Transformer Decoder (CAMD) はクリックと画像の特徴の相互作用を強化する。
通常のViTバックボーンでは、9つのデータセットに対する広範な実験結果から、AdaptiveClickが最先端の手法よりも優れていることが示される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:40:20 GMT)
CodeChain: Towards Modular Code Generation Through Chain of Self-revisions with Representative Sub-modules [51.8] 我々は,自己修正の連鎖を通じてモジュール化されたコード生成を誘発する,新しい推論フレームワークであるCodeChainを提案する。
CodeChainは、生成したソリューションのモジュール性と正確性の両方を大幅に向上させ、APPSで35%、CodeContestsで76%の相対パス@1の改善を実現しています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:29:09 GMT)
A lower bound on the space overhead of fault-tolerant quantum computation [51.7] しきい値定理は、フォールトトレラント量子計算の理論における基本的な結果である。
振幅雑音を伴う耐故障性量子計算の最大長に対する指数的上限を証明した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:12:59 GMT)
Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.7] 本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:25:49 GMT)
Stable Nonconvex-Nonconcave Training via Linear Interpolation [51.7] 本稿では,ニューラルネットワークトレーニングを安定化(大規模)するための原理的手法として,線形アヘッドの理論解析を提案する。
最適化過程の不安定性は、しばしば損失ランドスケープの非単調性によって引き起こされるものであり、非拡張作用素の理論を活用することによって線型性がいかに役立つかを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:52:16 GMT)
3D-SceneDreamer: Text-Driven 3D-Consistent Scene Generation [51.6] 本稿では,2次元拡散モデル以前の自然画像と,現在のシーンのグローバルな3次元情報を利用して,高品質で新しいコンテンツを合成する生成的精細化ネットワークを提案する。
提案手法は,視覚的品質と3次元の整合性を改善した多種多様なシーン生成と任意のカメラトラジェクトリをサポートする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:31:22 GMT)
RAGGED: Towards Informed Design of Retrieval Augmented Generation Systems [51.2] 本稿では,RAGシステムの解析と最適化を行うRAGGEDフレームワークを紹介する。
エンコーダデコーダとデコーダのみのアーキテクチャにおいて,2つの古典的スパースと高密度検索器,および4つのトップパフォーマンスLMについて検討した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:26:31 GMT)
Unleashing Network Potentials for Semantic Scene Completion [51.0] 本稿では,新しいSSCフレームワーク - Adrial Modality Modulation Network (AMMNet)を提案する。
AMMNetは、モダリティ間の勾配流の相互依存性を可能にするクロスモーダル変調と、動的勾配競争を利用するカスタマイズされた逆トレーニングスキームの2つのコアモジュールを導入している。
AMMNetは最先端のSSC法よりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:13:21 GMT)
Leveraging Prototypical Representations for Mitigating Social Bias without Demographic Information [50.3] DAFairは、言語モデルにおける社会的バイアスに対処する新しいアプローチである。
偏見を緩和するために、原型的人口統計テキストを活用し、微調整プロセス中に正規化用語を取り入れる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:58:36 GMT)
Large Language Models are Parallel Multilingual Learners [50.1] 本研究では,多言語大言語モデル(LLM)の文脈内学習能力を明らかにする。
入力を複数の言語に翻訳することで、並列入力(PiM)をLLMに提供し、その理解能力を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:33:46 GMT)
Towards Comprehensive Multimodal Perception: Introducing the Touch-Language-Vision Dataset [50.1] タッチに関するマルチモーダル研究は 視覚と触覚のモダリティに焦点を当てています
我々は,人機械のカスケード協調によるTLV (Touch-Language-Vision) というタッチ言語ビジョンデータセットを構築した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:01:54 GMT)
PRIME: Prioritizing Interpretability in Failure Mode Extraction [49.9] 訓練された画像分類モデルにおいて、故障モードに対する人間の理解可能な記述を提供することの課題について検討する。
本稿では,この問題における解釈可能性を重視した新しい手法を提案する。
本手法は,障害モードの同定に成功し,それに関連する高品質なテキスト記述を生成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:29:54 GMT)
BjTT: A Large-scale Multimodal Dataset for Traffic Prediction [49.9] 従来の交通予測手法は、交通トレンドを予測するために、過去の交通データに依存している。
本研究では,交通システムを記述するテキストと生成モデルを組み合わせることで,交通生成にどのように応用できるかを考察する。
本稿では,テキスト・トラフィック生成のための最初の拡散モデルChatTrafficを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:10:47 GMT)
Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding [49.9] 状態空間モデルMambaは、長周期モデリングからビデオモデリングへの成功を拡大する有望な特性を示している。
我々は、マンバがビデオのモデリングにおいて様々な役割を担い、マンバが優位性を示す様々なタスクを調査しながら、包括的な研究を行う。
実験の結果,ビデオ専用タスクとビデオ言語タスクの両方において,Mambaの強い可能性を示すとともに,有望な効率と性能のトレードオフを示すことができた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:57:07 GMT)
Semi- and Weakly-Supervised Learning for Mammogram Mass Segmentation with Limited Annotations [49.3] 本稿では,マスセグメンテーションのための半弱教師付き学習フレームワークを提案する。
良好な性能を得るために, 限られた強ラベルのサンプルと十分な弱ラベルのサンプルを用いる。
CBIS-DDSMおよびINbreastデータセットを用いた実験により,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:05:25 GMT)
Enabling Language Models to Implicitly Learn Self-Improvement [49.2] 大規模言語モデル(LLM)は、オープンエンドテキスト生成タスクにおいて顕著な機能を示した。
我々は、人間の嗜好データから改善目標を暗黙的に学習するImPlicit Self-ImprovemenT(PIT)フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:27:23 GMT)
Executing Natural Language-Described Algorithms with Large Language Models: An Investigation [48.5] 自然言語で概説したアルゴリズムを理解・実行するための,今日の大規模言語モデルの能力について検討する。
我々は、30個のアルゴリズムを選択し、300個のランダムサンプリングされたインスタンスを生成し、人気のあるLCMがこれらのアルゴリズムを理解し実行できるかを評価した。
この結果から,LLM,特にGPT-4は,重数値計算を伴わない限り,自然言語で記述されたプログラムを効果的に実行できることが判明した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:25:13 GMT)
Anomaly Detection by Adapting a pre-trained Vision Language Model [48.2] トレーニング済みのCLIPモデルに適応することで,異常検出のためのCLIP-ADAという統合フレームワークを提案する。
学習可能なプロンプトを導入し、自己教師付き学習を通して異常パターンに関連付けることを提案する。
MVTec-AD と VisA の異常検出と局所化のための最新技術 97.5/55.6 と 89.3/33.1 を実現した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:35:07 GMT)
VisionGPT: Vision-Language Understanding Agent Using Generalized Multimodal Framework [47.6] 我々は、最新技術基盤モデルの統合と自動化を行うためにVisionGPTを導入する。
VisionGPTは一般化されたマルチモーダルフレームワーク上に構築されており、3つの重要な特徴を区別している。
本稿では,ビジョンGPTのアーキテクチャと能力について概説し,コンピュータビジョンの分野に革命をもたらす可能性を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:39:40 GMT)
VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding [47.6] VisionGPT-3Dはマルチモーダル基盤モデルの強みを基盤として多目的なマルチモーダルフレームワークを提供する。
様々なSOTAビジョンモデルをシームレスに統合し、SOTAビジョンモデルの選択に自動化をもたらす。
2次元深度マップ解析に対応する適切な3次元メッシュ生成アルゴリズムを特定し、多様なマルチモーダル入力に基づいて最適な結果を生成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:13:00 GMT)
Meta-Cognitive Analysis: Evaluating Declarative and Procedural Knowledge in Datasets and Large Language Models [47.3] 宣言的知識と手続き的知識はメタ認知理論の2つの重要な部分である。
本稿では,LLMに対する基礎的知識と実効性評価について述べる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:34:35 GMT)
HRLAIF: Improvements in Helpfulness and Harmlessness in Open-domain Reinforcement Learning From AI Feedback [47.1] 我々はAIフィードバック(HRLAIF)によるハイブリッド強化学習を提案する。
この方法は、応答に対するAIアノテーションの精度を高め、モデルのトレーニングプロセスにおける有用性をより堅牢にする。
HRLAIFはRLAIFの能力を継承し、低コストで結果に対する人間の嗜好を高めると同時に、反応の満足度を向上させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:24:41 GMT)
Self-Supervised Learning of Whole and Component-Based Semantic Representations for Person Re-Identification [46.5] 個人再識別(ReID)は、さまざまな設定にまたがって個人を特定することに焦点を当て、困難な問題である。
本稿では,対話モデルにインスパイアされた局所意味抽出(LSE)モジュールを提案する。
また,LSEを利用したセマンティックReID(Semantic ReID)を導入し,様々なReIDドメインやモダリティをシームレスに移動するための効果的なセマンティックスを学習する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:04:06 GMT)
Large Language Models and Causal Inference in Collaboration: A Comprehensive Survey [46.4] 因果推論は、自然言語処理(NLP)モデルの予測精度、公正性、堅牢性、説明可能性を高める可能性を示している。
生成型Large Language Models(LLM)の出現は、様々なNLPドメインに大きな影響を与えている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:47:20 GMT)
Mind the GAP: Improving Robustness to Subpopulation Shifts with Group-Aware Priors [46.0] 我々は、サブポピュレーションシフトの下でよく一般化するモデルを明示的に好むニューラルネットワークパラメータ上で、GAP(group-aware prior)分布のファミリーを開発する。
我々は、以前トレーニングされた非ロバストモデルの最終層のみをトレーニングしても、GAPによるトレーニングが最先端のパフォーマンスをもたらすことを実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:00:26 GMT)
Logits of API-Protected LLMs Leak Proprietary Information [46.0] 比較的少数のAPIクエリから,APIで保護されたLLMに関する驚くほど多くの非公開情報を学習することが可能であることを示す。
現代のLLMは、モデル出力を全出力空間の線型部分空間に制限するソフトマックスボトルネックに悩まされている。
これは、安価なコストでいくつかの機能をアンロックするモデルイメージやモデルシグネチャに自らを結び付けていることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:27:49 GMT)
From Zero to Turbulence: Generative Modeling for 3D Flow Simulation [45.6] 本稿では, 乱流シミュレーションを, 初期流れの状態に依存することなく, 可能な全ての乱流状態の多様体を直接学習する生成タスクとして提案する。
生成モデルでは、未知の物体による乱流の分布を捉え、下流アプリケーションのための高品質で現実的なサンプルを生成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:46:25 GMT)
Generating Feasible and Plausible Counterfactual Explanations for Outcome Prediction of Business Processes [45.5] データ駆動型アプローチであるREVISEDplusを導入し、妥当な対実的説明を生成する。
まず, プロセスデータの高密度領域内に存在する反ファクトデータを生成するために, 反ファクトアルゴリズムを限定する。
また、プロセスケースにおけるアクティビティ間のシーケンシャルなパターンを学習することで、妥当性を保証します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:56:35 GMT)
The NeRFect Match: Exploring NeRF Features for Visual Localization [45.4] 視覚的位置決めのためのシーン表現としてNeRF(Neural Radiance Fields)を提案する。
局所化のための正確な2D-3Dマッチングを確立する際に、NeRFの内部特徴の可能性を探ることで、認識された利点を拡大する。
ビュー合成により学習したNeRFの内部知識を活かした2D-3Dマッチング機能であるNeRFMatchを導入する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:11:49 GMT)
LocalMamba: Visual State Space Model with Windowed Selective Scan [45.0] Vision Mamba (ViM) を強化する鍵は、シーケンスモデリングのためのスキャン方向を最適化することにある。
画像を異なるウィンドウに分割し、ローカル依存関係を効果的にキャプチャする新しいローカルスキャン戦略を導入する。
我々のモデルは、同じ1.5G FLOPでImageNetでVim-Tiを3.1%上回りました。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:32:40 GMT)
Generalized Neural Sorting Networks with Error-Free Differentiable Swap Functions [44.7] より抽象的で表現力に富んだ入力に対するソート問題、例えば、マルチ桁画像や画像フラグメントのソート問題をニューラルネットワークを介して検討する。
高次元入力から順序変数への写像を学習するには、ソートネットワークの微分可能性を保証する必要がある。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:39:43 GMT)
Grasp Multiple Objects with One Hand [44.2] MultiGraspは、テーブルトップ上のデキスタラスな多指ロボットハンドを用いて、複数の物体をつかむための新しい2段階のアプローチである。
我々の実験は、主に二重物体の把握に焦点を合わせ、44.13%の成功率を達成した。
このフレームワークは、推論速度を犠牲にして2つ以上のオブジェクトをつかむ可能性を実証している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:53:05 GMT)
SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams [44.0] スパイクカメラは、動きの特徴を捉え、この不適切な問題を解くのに有効であることが証明されている。
既存の手法は教師付き学習パラダイムに陥り、現実のシナリオに適用した場合、顕著なパフォーマンス劣化に悩まされる。
本研究では,スパイク誘導動作の劣化に対する最初の自己教師型フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:29:09 GMT)
Most discriminative stimuli for functional cell type clustering [43.9] 網膜では、機能型は慎重に選択された刺激によって識別できるが、これは専門的なドメイン知識を必要とする。
視覚野では、どのような機能型が存在するのか、どのように識別するかはまだ分かっていない。
本稿では,ニューロンの機能的クラスタを得るために,深部予測モデルを用いた最適化に基づくクラスタリング手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:40:01 GMT)
StreamMultiDiffusion: Real-Time Interactive Generation with Region-Based Semantic Control [43.0] StreamMultiDiffusionは、最初のリアルタイムリージョンベースのテキスト画像生成フレームワークである。
我々のソリューションは、セマンティックパレットと呼ばれるインタラクティブな画像生成のための新しいパラダイムを開放する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:51:01 GMT)
Me LLaMA: Foundation Large Language Models for Medical Applications [42.8] 本研究は,基礎モデルであるMe LLaMA 13/70Bとチャット強化バージョンであるMe LLaMA 13/70B-chatを含む医療用LLMファミリーであるMe LLaMAを紹介する。
トレーニングと評価のためのドメイン固有のデータスイートには、129Bトークンを備えた大規模で連続的な事前トレーニングデータセットが含まれています。
Me LLaMAモデルは、ゼロショット、少数ショット、教師あり学習能力において、既存のオープンソース医療用LLMよりも全体的なパフォーマンスが向上する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:13:36 GMT)
ConDiSR: Contrastive Disentanglement and Style Regularization for Single Domain Generalization [42.8] 医療データは、しばしば分散シフトを示し、標準パイプラインを使用してトレーニングされたディープラーニングモデルのテスト時のパフォーマンス劣化を引き起こす。
本研究は、分類タスクの文脈において、単一ドメインの一般化フレームワークを探索することの重要性と課題を強調した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:50:44 GMT)
COMET: A Comprehensive Cluster Design Methodology for Distributed Deep Learning Training [42.5] 現代のディープラーニング(DL)モデルは、トレーニングする専門的でハイエンドなノードの大規模なクラスタを必要とするサイズに成長しています。
このようなクラスタを設計してパフォーマンスと利用の両方を最大化します。
本稿では,並列化戦略と鍵クラスタリソースのプロビジョニングが分散DLトレーニングのパフォーマンスに与える影響を共同で研究する,総合的なクラスタ設計方法論とワークフローであるCOMETを紹介する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:06:02 GMT)
OmniCount: Multi-label Object Counting with Semantic-Geometric Priors [42.4] 本稿では,オープン語彙フレームワークを用いて複数のオブジェクトカテゴリを同時カウント可能な,より実用的なアプローチを提案する。
我々のソリューションであるOmniCountは、事前訓練されたモデルから意味的および幾何学的な洞察を用いて、ユーザが指定したオブジェクトを数えることによって際立っている。
OmniCount-191の包括的な評価は、他の主要なベンチマークとともに、OmniCountの例外的なパフォーマンスを示しています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:58:49 GMT)
Holo-Relighting: Controllable Volumetric Portrait Relighting from a Single Image [41.6] ホロリライティング(Holo-Relighting)は、1枚の画像から新しい視点と新しい照明を合成できるボリュームリライティング法である。
これらの特徴を処理するために、所定の照明に条件付けされた照明モジュールを設計し、三面体という形で、信頼度の高い3D表現を予測する。
視点制御と照明制御に加えて、ホロライティングはヘッドポーズを条件として、ヘッドポジション依存の照明効果を可能にする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:56 GMT)
ProSwitch: Knowledge-Guided Language Model Fine-Tuning to Generate Professional and Non-Professional Styled Text [41.6] 本研究は、テキストプロフェッショナル主義に焦点をあて、ProSwitchという新しい方法論を導入する。
ProSwitchは、知識誘導型インストラクションチューニングを通じて、プロフェッショナルと非プロフェッショナルの両方のレスポンスを生成できる言語モデルを備えている。
汎用言語モデルと特殊言語モデルの比較分析により,プロと非プロのテキスト生成の切り替えにおいて,本手法がベースラインを上回っていることが判明した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:49:16 GMT)
Laying the Foundation First? Investigating the Generalization from Atomic Skills to Complex Reasoning Tasks [40.8] 本稿では,原子スキルが複雑な推論タスクに自然に一般化できるかどうかを探索する枠組みを提案する。
次に、より優れたスキルの一般化を実現するために、階層的なカリキュラム学習訓練戦略を導入する。
階層的なカリキュラム学習を活用することで、一般化を成功させ、複雑な推論タスクにおけるオープンソースのLMの性能を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:20:54 GMT)
Hardware Honeypot: Setting Sequential Reverse Engineering on a Wrong Track [40.8] この研究は、有限状態機械(FSM)のリバースエンジニアリング(RE)に対する新しいアプローチを示す。
ハードウェアのFSMミツバチはREツールを間違っていますが、ツールに関しては非常に魅力的なFSMです。
その結果、現在最先端のRE法はFSM候補として非常に魅力的なミツバチを好んでいるか、あるいは正しいFSMをもはや検出していないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:26:12 GMT)
From Graph to Word Bag: Introducing Domain Knowledge to Confusing Charge Prediction [40.0] 本稿では,紛らわしい突撃に対処する小説『From Graph to Word Bag』を紹介する。
まず、各電荷に対するキーワードの選択を支援するために、構成要素を含む法的な知識グラフを構築し、ワードバッグを形成する。
次に,注意機構を拡張し,単語バッグ内の単語を通して注意を誘導する新たな損失関数を導入する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:25:48 GMT)
SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation [39.8] SSRエンコーダ(SSR-Encoder)は、単一のまたは複数の参照画像から任意の対象を選択的にキャプチャするように設計された新しいアーキテクチャである。
テストタイムの微調整を必要とせずに、テキストやマスクなど、さまざまなクエリのモダリティに応答する。
SSRエンコーダはモデルの一般化性と効率によって特徴付けられ、様々なカスタムモデルや制御モジュールに対応している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:44:49 GMT)
A Comparative Study of Image Restoration Networks for General Backbone Network Design [39.7] 5つの古典的画像復元タスクの比較研究を行った。
ベンチマーク結果を提示し、異なるモデルの性能格差の背景にある理由を解析する。
我々は,新しい画像復元バックボーンネットワークであるX-Restormerを設計する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:39:07 GMT)
HeadEvolver: Text to Head Avatars via Locally Learnable Mesh Deformation [39.7] 本稿では、テキストガイダンスからスタイリングされたヘッドアバターを生成する新しいフレームワークであるHeadEvolverを紹介する。
HeadEvolverはテンプレートのヘッドメッシュからローカルに学習可能なメッシュ変形を使用して、詳細な編集とアニメーションのために高品質なデジタルアセットを生成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:15:23 GMT)
Re-Search for The Truth: Multi-round Retrieval-augmented Large Language Models are Strong Fake News Detectors [38.8] 大きな言語モデル(LLM)はその顕著な推論と生成能力で知られている。
クレーム検証のための Web ソースからキーエビデンスを自動的に戦略的に抽出する,新たな LLM フレームワークについて紹介する。
我々の枠組みは十分な証拠の取得を保証し、性能を向上させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:35:39 GMT)
Meaningful Learning: Advancing Abstract Reasoning in Large Language Models via Generic Fact Guidance [38.5] 大規模言語モデル(LLM)は、様々な推論シナリオにまたがる優れたパフォーマンスと強力な説明可能性を開発した。
それにもかかわらず、一般的な事実に支えられた単純な質問をタスクすると、LCMは一貫性のある正確な答えを提供しないことが多い。
このことは、LSMが真に推論しているのか、単に記憶しているだけなのか、という活発な議論を引き起こしている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:06:13 GMT)
GaitContour: Efficient Gait Recognition based on a Contour-Pose Representation [38.4] 歩行認識は、外見情報ではなく歩行パターンに基づいて、被験者をしっかりと識別する約束を持っている。
本研究では,身体形状と身体部分情報の両方をコンパクトに表現する,ポイントベースコントゥール・ポース表現を提案する。
さらに、この斬新な表現を活用するために、GaitContourと呼ばれるローカル・グローバル・アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:46:03 GMT)
S^2MVTC: a Simple yet Efficient Scalable Multi-View Tensor Clustering [38.4] 6つの大規模マルチビューデータセットの実験結果から、S2MVTCはクラスタリング性能とCPU実行時間において、最先端のアルゴリズムを大幅に上回っていることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:00:29 GMT)
Demonstration of a low loss, highly stable and re-useable edge coupler for high heralding efficiency and low g^(2) (0) SOI correlated photon pair sources [37.9] シリコンオン絶縁体(SOI)フォトニックチップから光ファイバーに光を結合する安定低損失方式を報告した。
この技術は、オンチップのテーパー導波路とクリーブされた小型コア光ファイバを用いて実現されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:39:52 GMT)
You Only Learn One Query: Learning Unified Human Query for Single-Stage Multi-Person Multi-Task Human-Centric Perception [37.7] 人間中心の知覚は、コンピュータビジョンの長年の問題である。
本稿では,一段階多人数マルチタスク人間中心認識(HCP)のための統合多目的フレームワーク(HQNet)を提案する。
Human Queryは、個人のための複雑なインスタンスレベルの機能をキャプチャし、複雑なマルチパーソンシナリオを分離する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:59:27 GMT)
On the Utility of 3D Hand Poses for Action Recognition [36.6] 3Dハンドポーズは、アクション認識のための未探索のモダリティである。
我々は,新しいマルチモーダルトランスであるHandFormerを提案する。
HandFormerは、精密なモーションモデリングのための高時間分解能で3Dのポーズを組み合わせる。
我々は,アセンブラ101およびH2O上での最先端性能を新たに達成し,エゴセントリックな動作認識を大幅に改善した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:52:34 GMT)
Making Language Models Better Tool Learners with Execution Feedback [36.3] ツールは、人間が環境を理解し、形を変えることができる重要なインターフェースとして機能する。
既存のツール学習手法は、ツールを無差別に活用するために大きな言語モデルを誘導する。
ツール実行からのフィードバックを通じてモデルを継続的に学習することを可能にする2段階のエンドツーエンドフレームワークであるTool leaRning wIth exeCution fEedback (TRICE)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:15:27 GMT)
Multi-Fidelity Bayesian Optimization With Across-Task Transferable Max-Value Entropy Search [36.1] 本稿では,現在のタスクに関する情報を取得する必要性と,将来的なタスクに伝達可能な情報を集めることのバランスをとる新しい情報理論獲得機能を提案する。
実世界の実世界の実例にまたがる実験結果から,提案手法が十分なタスク数を処理すると,最適化効率を大幅に向上できることが明らかとなった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:00:01 GMT)
EquiAV: Leveraging Equivariance for Audio-Visual Contrastive Learning [36.0] 音声・視覚のコントラスト学習に等価性を利用する新しいフレームワークであるEquiAVを紹介する。
我々のアプローチは、共有注意に基づく変換予測器によって促進される音声視覚学習への同値性の拡張から始まる。
多様な拡張から代表的な埋め込みへの機能の集約を可能にし、堅牢な監視を可能にします。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:44:19 GMT)
On Protecting the Data Privacy of Large Language Models (LLMs): A Survey [35.5] LLM(Large Language Model)は、人間の言語を理解し、生成し、翻訳できる複雑な人工知能システムである。
LLMは大量のデータを処理して生成し、データプライバシを脅かす可能性がある。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:17:57 GMT)
Warm-Starting and Quantum Computing: A Systematic Mapping Study [35.2] 量子コンピューティング領域におけるウォームスタート技術に関する科学文献の収集と分析を行う。
量子ソフトウェア技術者がウォームスタートテクニックを分類し、実際に適用できるようにすることを目標としています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:21:53 GMT)
Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking [34.6] 自己学習型推論器の一般化であるQuiet-STaRについて述べる。
LMは、将来のテキストを説明するために各トークンで合理性を生成することを学ぶ。
GSM8KとCommonsenseQAではゼロショットの改善が見られた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:16 GMT)
DiTMoS: Delving into Diverse Tiny-Model Selection on Microcontrollers [34.3] 我々は、セレクタ分類器アーキテクチャを備えた新しいDNNトレーニングおよび推論フレームワークであるDiTMoSを紹介する。
弱いモデルの合成は高い多様性を示すことができ、それらの結合は精度の上限を大幅に高めることができる。
我々は,Nucleo STM32F767ZIボード上にDiTMoSをデプロイし,人間の活動認識,キーワードスポッティング,感情認識のための時系列データセットに基づいて評価する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:11:38 GMT)
The First to Know: How Token Distributions Reveal Hidden Knowledge in Large Vision-Language Models? [34.3] 本研究では線形プローブを用いてLVLMの出力層における隠れた知識を隠蔽する。
本報告では,最初のトークンのロジット分布は命令に応答するかどうかを決定するのに十分な情報を含んでいることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:25:35 GMT)
Time-uniform central limit theory and asymptotic confidence sequences [34.0] 信頼シーケンス(CS)は任意の停止時間に有効な推論を提供し、データに対する「覗き見」に対する罰則を生じさせない。
CSは漸近的ではなく、有限サンプルの保証を楽しむが、上記の信頼区間の広範な適用性はない。
CLTのような汎用性と(漸近的な)時間一様保証に対する漸近的CSは非漸近的妥当性を否定する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:23:05 GMT)
OneTracker: Unifying Visual Object Tracking with Foundation Models and Efficient Tuning [33.5] 我々は、OneTrackerと呼ばれる様々なトラッキングタスクを統合するための一般的なフレームワークを提案する。
OneTrackerは最初に、Foundation Trackerと呼ばれるRGBトラッカーで大規模な事前トレーニングを行う。
次に、他のモダリティ情報をプロンプトとみなし、Foundation Tracker上にPrompt Trackerを構築する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:13 GMT)
UniCode: Learning a Unified Codebook for Multimodal Large Language Models [33.5] マルチモーダル大言語モデル(MLLM)の領域内での新しいアプローチである textbfUniCode を提案する。
UniCodeは、視覚、テキスト、潜在的に他の種類の信号を効率的にトークン化する統一されたコードブックを学習する。
トレーニング中にパラメータが大幅に少なく、データが少ないにもかかわらず、Unicodeは視覚的再構成と生成の有望な能力を示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:29:58 GMT)
USimAgent: Large Language Models for Simulating Search Users [33.2] 大規模言語モデル(LLM)は、人間レベルの知能をシミュレートする可能性を示している。
本稿では,LLMに基づくユーザ検索行動シミュレータUSimAgentを紹介する。
提案するシミュレータは,検索中のユーザのクエリ,クリック,停止をシミュレートし,完全な検索セッションを生成することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:40:54 GMT)
Trust AI Regulation? Discerning users are vital to build trust and effective AI regulation [33.0] 我々は、信頼できるAIとユーザー信頼を生み出すためには、規制当局に効果的に規制するインセンティブが必要であることを示した。
これを実現するための2つのメカニズムの有効性を実証する。
次に,規制当局の有効性について,ユーザが信頼判断を強制できる代替ソリューションを検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:56:39 GMT)
AutoLoRA: Automatically Tuning Matrix Ranks in Low-Rank Adaptation Based on Meta Learning [32.0] 低ランク適応 (LoRA) 低ランクインクリメンタル更新行列は、凍結事前訓練された重量の上に置かれる。
本稿では,各LoRA層の最適ランクを自動的に識別するフレームワークであるAutoLoRAを紹介する。
自然言語理解,生成,シーケンスラベリングに関する実験により,AutoLoRAの有効性が示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:29:35 GMT)
Truth-Aware Context Selection: Mitigating the Hallucinations of Large Language Models Being Misled by Untruthful Contexts [31.8] 大規模言語モデル(LLM)は、ユーザや知識向上ツールが提供する非現実的なコンテキストによって容易に誤解される。
我々は、入力から非現実的なコンテキストを保護するために、TACS(Truth-Aware Context Selection)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:40:22 GMT)
CacheGen: Fast Context Loading for Language Model Applications via KV Cache Streaming [31.8] CacheGenは、大きな言語モデル(LLM)のための高速なコンテキストローディングモジュールである
KVキャッシュを符号化/復号のオーバーヘッドを無視して、よりコンパクトなビットストリーム表現にエンコードする。
ストリーミング戦略を適用して、利用可能な帯域幅の変化に対処する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:52 GMT)
Shifted Autoencoders for Point Annotation Restoration in Object Counting [31.7] オブジェクトの形状の複雑さとアノテーションの主観性は、アノテーションの不整合につながる可能性がある。
そこで我々は,アノテーションの一貫性を向上する Shifted Autoencoders (SAE) を提案する。
SAEは初期点アノテーションにランダムなシフトを適用し、元の位置に復元するためにUNetを使用している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:40:56 GMT)
A collection of the accepted papers for the Human-Centric Representation Learning workshop at AAAI 2024 [31.4] この非アーキバル指標は完全ではなく、一部の論文ではインクルージョンのオプトアウトを選んだ。
受理されたすべての論文のリストはワークショップのウェブサイトで公開されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:46:07 GMT)
Renovating Names in Open-Vocabulary Segmentation Benchmarks [31.2] オープン語彙セグメンテーションベンチマーク(RENOVATE)における「改称」のためのフレームワークを提案する。
モデルにより生成された名前は、視覚セグメントのより正確な記述であることを示す。
改良された名前は、様々なベンチマークで元の名前から最大16%の相対的な改善をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:35:32 GMT)
Are Vision Language Models Texture or Shape Biased and Can We Steer Them? [29.8] 視覚言語モデル(VLM)におけるテクスチャと形状バイアスについて検討する。
VLMは、視覚エンコーダよりも形状バイアスが強く、視覚バイアスはテキストによってある程度変調されていることが示される。
例えば、偏見を49%から72%に抑えることができるのです。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:07:14 GMT)
Relaxing Accurate Initialization Constraint for 3D Gaussian Splatting [29.6] 3次元ガウス切削における正確な初期化制約の緩和)と呼ばれる新しい最適化手法を提案する。
複数のデータセットに対する定量的および定性的な比較による戦略の有効性を示し、全ての設定における性能を大幅に改善した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:04:21 GMT)
CLIP-EBC: CLIP Can Count Accurately through Enhanced Blockwise Classification [29.6] 本稿では,CLIPをベースとしたクラウドカウンティングモデルについて紹介する。
モデルに依存しないEBCフレームワークの中で、密度マップを生成することができるCLIP-EBCを導入した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:08:33 GMT)
MoPE: Parameter-Efficient and Scalable Multimodal Fusion via Mixture of Prompt Experts [29.5] 我々は,表現力を高めるために,プロンプトエキスパート(MoPE)技法の混合を導入する。
提案手法は, ファインチューニングの性能のマッチングや超越といった, 最先端の成果を達成できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:47:10 GMT)
MetroGNN: Metro Network Expansion with Reinforcement Learning [29.4] 都市の異種マルチグラフにおけるマルコフ決定プロセスに対処するための強化学習フレームワークを提案する。
このアプローチでは,グラフニューラルネットワークが取得した情報に基づいて,インテリジェントにノードを選択する,注意型ポリシネットワークを採用している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:09:15 GMT)
Analyzing the Expected Hitting Time of Evolutionary Computation-based Neural Architecture Search Algorithms [29.4] 期待ヒット時間(EHT)は、平均計算時間の複雑さを意味するため、理論上の最も重要な問題の一つである。
本稿では,ENASアルゴリズムのEHTを推定するための理論と実験を統合することによって,一般的な手法を提案する。
我々の知る限りでは、この研究はENASアルゴリズムの理論的基盤を確立する最初の試みである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:33:34 GMT)
A Typology for Exploring the Mitigation of Shortcut Behavior [29.4] 基本モジュールの共通集合を確立することにより,様々なXIL手法を単一型に統一する。
評価では、全ての手法がモデルの再検討を成功に導く。
しかし、個々のベンチマークタスクに顕著な違いが見られ、アプリケーションに関連する重要な側面が明らかになりました。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:25:16 GMT)
Template-Free Single-View 3D Human Digitalization with Diffusion-Guided LRM [29.1] 本稿では,拡散誘導フィードフォワードモデルであるHuman-LRMを提案する。
本手法は,例えばSMPLなどのテンプレートを使わずにヒトを捕獲し,リッチでリアルなディテールで咬合部を効果的に増強することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:12:46 GMT)
LM2D: Lyrics- and Music-Driven Dance Synthesis [28.9] LM2Dは、音楽と歌詞の両方で、ひとつの拡散生成ステップでダンスコンディションを作成するように設計されている。
ポーズ推定技術を用いて,音楽と歌詞の両方を包含する最初の3次元ダンスモーションデータセットを提案する。
その結果、LM2Dは歌詞と音楽の両方にマッチするリアルで多様なダンスを制作できることを示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:59:04 GMT)
ChartInstruct: Instruction Tuning for Chart Comprehension and Reasoning [28.2] 71Kチャートで生成した191K命令からなる新しいチャート固有視覚言語インストラクションフォローデータセットであるChartInstructを紹介した。
4つの下流タスクの実験において、まずモデルの有効性を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:40:23 GMT)
Prompting Large Language Models with Divide-and-Conquer Program for Discerning Problem Solving [28.1] 本稿では,優れた表現力を確保し,タスクの分解,サブタスクの解決,分解処理を解消するDivide-and-Conquerプログラムを提案する。
実験結果から,提案手法は中間誤りや誤認内容に悩まされるタスクにおいて,通常の手順よりも優れた性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:12:42 GMT)
Plum: Prompt Learning using Metaheuristic [28.0] メタヒューリスティックス(Metaheuristics)は、100以上の選択肢を持つ離散的な非視覚的最適化手法のブランチである。
パラダイム内では6つの典型的な手法をテストし、ホワイトボックスとブラックボックスのプロンプト学習の有効性を実証した。
これらの手法は、より人間に理解可能なプロンプトを発見でき、迅速な最適化の可能性のコルヌコピアへの扉を開くことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:43:52 GMT)
STRIDE: Single-video based Temporally Continuous Occlusion Robust 3D Pose Estimation [27.9] ビデオに先立って人間の動作に適合する新しいテストタイムトレーニング(TTT)手法であるSTRIDEを提案する。
筆者らのフレームワークは,モデルに依存しない柔軟性を示し,既製の3Dポーズ推定手法を用いて,堅牢性と時間的整合性を向上させる。
我々は、Occluded Human3.6M、Human3.6M、OCMotionのような挑戦的なデータセットに関する包括的な実験を通じてSTRIDEの有効性を検証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:36:00 GMT)
GaussianGrasper: 3D Language Gaussian Splatting for Open-vocabulary Robotic Grasping [27.8] 本稿では,ガウス的原始体のコレクションとして3次元シーンを表現したガウス的グラッパーについて述べる。
提案手法では,RGB-Dビューを限定的に取得し,タイルベースのスプラッティング技術を用いて特徴フィールドを作成する。
ガウス場の再構成幾何を用いて,事前学習したグルーピングモデルにより,衝突のないグルーピングポーズ候補を生成することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:46 GMT)
SynFundus-1M: A High-quality Million-scale Synthetic fundus images Dataset with Fifteen Types of Annotation [27.8] 我々は100万画素以上の画像を含む高品質な合成データセットであるSynFundus-1Mをリリースした。
我々の知る限り、SynFundus-1Mは現在、最も洗練されたアノテーションを備えた最大のファンドデータセットです。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:29:29 GMT)
Rethinking Autoencoders for Medical Anomaly Detection from A Theoretical Perspective [27.7] 再構成に基づく手法、特にオートエンコーダ(AE)を利用する手法がこの分野で優位である。
本研究は, 異常検出におけるAEを用いた再構成手法の理論的基礎を提供することに焦点をあてる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:51:01 GMT)
Cross-linguistically Consistent Semantic and Syntactic Annotation of Child-directed Speech [27.7] 本稿では,子指向音声のこのようなコーパスを,感性論理形式と組み合わせて構築する手法を提案する。
このアプローチは言語間一貫した表現を強制し、依存関係表現とセマンティック解析の最近の進歩に基づいている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:23:47 GMT)
SPI-GAN: Denoising Diffusion GANs with Straight-Path Interpolations [27.5] 本稿では,SPI-GAN(SPI-GAN)と呼ばれる改良されたGANに基づくデノナイズ手法を提案する。
SPI-GANは、CIFAR-10とCelebA-HQ-256のサンプリング品質、多様性、時間の中で最もバランスのとれたモデルの1つである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:28:04 GMT)
Griffon v2: Advancing Multimodal Perception with High-Resolution Scaling and Visual-Language Co-Referring [27.5] 我々は、視覚的およびテキスト的プロンプトによるフレキシブルなオブジェクト参照を可能にする、統合された高分解能一般化モデル、Griffon v2を導入する。
我々は,大規模言語モデルにおける入力トークン制約を克服するために,シンプルで軽量なダウンサンプリングプロジェクタを設計する。
実験により、Griffon v2は、視覚的およびテキスト的参照で関心のあるオブジェクトをローカライズし、REC、フレーズグラウンド、REGタスクにおける最先端のパフォーマンスを実現し、オブジェクト検出とオブジェクトカウントのエキスパートモデルより優れていることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:21:37 GMT)
GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting [27.3] Inlicit Neural representations (INR)は画像表現と圧縮で大成功を収め、10-1000 FPSで高画質で高速なレンダリング速度を提供する。
本稿では,2次元ガウススプラッティングによる画像表現と圧縮の基盤となるパラダイムであるガウス画像を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:32:00 GMT)
Learning invariant representations of time-homogeneous stochastic dynamical systems [27.1] 我々は,そのダイナミクスを忠実に捉えた状態の表現を学習する問題を研究する。
これは、転送演算子やシステムのジェネレータを学ぶのに役立ちます。
ニューラルネットワークに対する最適化問題として,優れた表現の探索が可能であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:05:08 GMT)
LAN: Learning Adaptive Neighbors for Real-Time Insider Threat Detection [26.9] 我々は、リアルタイムITDを活動レベルで初めて研究し、きめ細かいフレームワークLANを提示する。
具体的には、LANはアクティビティシーケンス内の時間的依存関係と、グラフ構造学習を伴うシーケンス間のアクティビティ間の関係を同時に学習する。
CERT r4.2 と CERT r5.2 の2つの広く使われているデータセット上での LAN の性能を評価する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:22:17 GMT)
Mamba-ND: Selective State Space Modeling for Multi-Dimensional Data [26.5] 状態空間モデルに基づくMambaは、テキストシーケンスをモデル化するための同等のパフォーマンスを実現することが示されている。
本稿では,Mambaアーキテクチャを任意の多次元データに拡張した汎用設計であるMamba-NDを提案する。
我々は,Mamba-NDが,多次元ベンチマークにおける最先端技術と性能の競争力を示すことを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:16:58 GMT)
Improving Reinforcement Learning from Human Feedback Using Contrastive Rewards [26.4] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデル(LLM)を人間の好みに合わせるために使われる主流パラダイムである。
しかし、既存のRLHFは、様々な情報源からのノイズに対して脆弱で敏感な正確で情報的な報酬モデルに大きく依存している。
本研究では,報酬に対するペナルティ項を導入することで,報酬モデルの有効性を向上する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:02:31 GMT)
Faithfulness vs. Plausibility: On the (Un)Reliability of Explanations from Large Language Models [26.1] 大規模言語モデル(LLM)は、いくつかの自然言語処理(NLP)アプリケーションのための強力なツールとしてデプロイされる。
最近の研究は、現代のLSMが自己説明(Ses)を生成できることを示している。
LLMが生成するSEの忠実度と妥当性の両立を論じる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:48:08 GMT)
EventRPG: Event Data Augmentation with Relevance Propagation Guidance [25.9] スパイキングニューラルネットワーク(SNN)におけるイベントベース分類タスクにおけるオーバーフィッティングは重要な問題である
データ拡張は、ニューラルネットワークの過度な適合を緩和し、一般化能力を改善するための、シンプルだが効率的な方法である。
本研究では、より効率的な拡張のために、スパイキングニューラルネットワーク上の関連伝播を利用するEventRPGを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:52:45 GMT)
Consistency Models as a Rich and Efficient Policy Class for Reinforcement Learning [25.8] 拡散モデルのようなスコアベース生成モデルは、画像生成から強化学習(RL)へのマルチモーダルデータのモデリングに有効であることが証明された。
本稿では,3つの典型的なRL設定に対するアクタ批判型アルゴリズムを用いて,一貫性モデルを効率的かつ表現力のあるポリシー表現として適用することを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:28:48 GMT)
ProMark: Proactive Diffusion Watermarking for Causal Attribution [25.8] 本稿では,因果帰属手法であるProMarkを提案する。
概念情報は、知覚不能な透かしを用いて入力訓練画像に積極的に埋め込まれる。
トレーニングデータに最大216ドルのユニークな透かしを埋め込むことができ、各トレーニング画像には複数の透かしが含まれています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:16:43 GMT)
The Impact of Explanations on Fairness in Human-AI Decision-Making: Protected vs Proxy Features [25.8] 説明は、人間とAIチームがより公平な意思決定のバイアスに対処するのに役立ちます。
モデルフェアネスに対する参加者の認識に及ぼす保護的・代理的特徴の有無の影響について検討した。
説明は直接的ではあるが間接的偏見を検出するのに役立ちます。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:12:53 GMT)
Towards the Reusability and Compositionality of Causal Representations [25.7] 我々は、どの因果因子を再利用できるかを検知し、以前に学習した因果表現から適応する必要があるフレームワークであるDECAFを紹介する。
私たちのアプローチは、各ステップでどの変数が摂動しているかを示す介入ターゲットの可用性に基づいています。
実験により、我々のフレームワークを最先端の4つのCRLアプローチに統合すると、少数のサンプルしか持たない新しい環境で正確な表現が得られます。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:36:07 GMT)
A Data Perspective on Enhanced Identity Preservation for Diffusion Personalization [25.6] 大規模なテキスト画像モデルは、自然言語を使って画像を生成する能力に革命をもたらした。
これはテキスト・ツー・イメージ・モデルのパーソナライズ方法への関心につながった。
テキストと画像の両レベルで、新しい正規化データセット生成戦略を導入する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:42 GMT)
SkateFormer: Skeletal-Temporal Transformer for Human Action Recognition [25.3] 我々はSkateFormer(SkateFormer)と呼ばれる新しい手法を提案する。
SkateFormerは、さまざまなタイプの骨格と時間の関係に基づいて関節とフレームを分割する。
アクション適応的な方法で、アクション認識に不可欠なキージョイントやフレームに選択的にフォーカスすることができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:55:53 GMT)
Multilingual Turn-taking Prediction Using Voice Activity Projection [25.1] 本稿では,音声対話における音声活動予測モデルである音声活動予測(VAP)の多言語データへの適用について検討する。
その結果, ある言語で訓練された単言語VAPモデルでは, 他の言語に適用してもよい予測が得られないことが示唆された。
3つの言語すべてでトレーニングされた多言語モデルは、すべての言語にわたるモノリンガルモデルと同等の予測性能を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:59:59 GMT)
A Comprehensive Dataset and Automated Pipeline for Nailfold Capillary Analysis [24.9] 包括的爪折り毛細管データセット-321 画像の構築に先駆的な取り組みを行い,68 名の被験者219 名の動画と臨床報告,専門家注記を行った。
教師付きラベルとして専門家アノテーションを用いた3つのディープラーニングモデルを微調整し、それらを新しいエンドツーエンドの爪折り毛細管分析パイプラインに統合した。
実験の結果, 自動パイプラインでは, 測定値の平均サブピクセルレベルの精度が89.9%, 形態異常が89.9%であった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:39:55 GMT)
Reawakening knowledge: Anticipatory recovery from catastrophic interference via structured training [24.7] 固定された繰り返しシーケンスで文書が循環的に提示される構造化された非IID環境で、ニューラルネットワークのトレーニングダイナミクスを探索する。
この環境では, LLMの興味深い, 注目すべき特性が連続的に見出され, 予測行動を示し, 文書の忘れ物から回復し, 再び遭遇する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:51:54 GMT)
EfficientMFD: Towards More Efficient Multimodal Synchronous Fusion Detection [24.7] 本稿では,1つのトレーニングステップのみで良好な性能を示すモデルを単純化するために,EfficientMFDと呼ばれる新しいエンドツーエンドのマルチモーダル核融合検出アルゴリズムを提案する。
いくつかの公開データセットで広範囲にテストし、視覚的に魅力的な融合だけでなく、良好な検出性能でも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:12:17 GMT)
Receler: Reliable Concept Erasing of Text-to-Image Diffusion Models via Lightweight Erasers [24.6] テキストから画像への拡散モデルにおける概念消去は、対象概念に関連する画像の生成から事前学習された拡散モデルを無効にすることを目的としている。
軽量エローザ(レセラー)による信頼性概念消去の提案
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:35:10 GMT)
SVD-PINNs: Transfer Learning of Physics-Informed Neural Networks via Singular Value Decomposition [24.4] 1つのニューラルネットワークは1つの偏微分方程式に対応する。
実際には、私たちは通常、PDEのクラスを1つだけでなく1つのクラスで解決する必要があります。
本稿では,特異ベクトルの保持と特異値の最適化によるPINNの転送学習手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:16:05 GMT)
SLiMe: Segment Like Me [24.3] 1つの注釈付きサンプルを用いて任意の粒度で画像を分割するSLiMeを提案する。
各種設計因子について知識豊富な実験を行い,SLiMeが既存の一発・小発のセグメンテーション法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:15:10 GMT)
VIRUS-NeRF -- Vision, InfraRed and UltraSonic based Neural Radiance Fields [24.2] 本稿では,超音波や赤外線による飛行時間センサなどの高効率な低分解能レンジセンサを提案する。
VIRUS-NeRFは、超音波と赤外線センサーの深さ測定を取り入れて、光線マーチングに使用される占有格子を更新する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:19:19 GMT)
Near Minimax-Optimal Distributional Temporal Difference Algorithms and The Freedman Inequality in Hilbert Spaces [24.0] 我々は,非パラメトリック分布型TDアルゴリズム (NTD) を$gamma$-discounted infinite-horizon Markov決定プロセスに対して提案する。
我々はヒルベルト空間における新しいフリードマンの不等式を確立し、これは独立な関心事である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:24:51 GMT)
MMoE: Robust Spoiler Detection with Multi-modal Information and Domain-aware Mixture-of-Experts [24.0] MMoEはマルチモーダルネットワークであり、複数のモーダルからの情報を利用してロバストなスポイラー検出を容易にする。
MMoEは2つの広く使用されているスポイラー検出データセット上で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:43:54 GMT)
Pixel-Aware Stable Diffusion for Realistic Image Super-resolution and Personalized Stylization [23.7] 高速なリアルISRとパーソナライズされた画像スタイリングを実現するために,画素対応安定拡散(PASD)ネットワークを提案する。
ベース拡散モデルをスタイリングされたものに置き換えることによって、PASDはペアのトレーニングデータを収集することなく、多様なスタイリングされた画像を生成することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:06:44 GMT)
Reconstruction and Simulation of Elastic Objects with Spring-Mass 3D Gaussians [23.6] 本稿では,3次元ガウスと物理シミュレーションを統合した新しいフレームワークであるSpring-Gausを提案する。
提案手法は3次元Spring-Massモデルを用いて,各点レベルでの物理パラメータの最適化を可能にする。
合成と実世界の両方のデータセット上でSpring-Gausを評価し,弾性物体の正確な再構成とシミュレーションを実証した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:25:10 GMT)
Speech Emotion Recognition with Distilled Prosodic and Linguistic Affect Representations [23.5] EmoDistillは、音声から強い言語的および韻律的な感情表現を学ぶための新しいフレームワークである。
本手法は,事前学習した韻律教師と言語教師のペアから,埋め込みレベルとロジットレベルの両方の情報を抽出する。
IEMOCAPベンチマーク実験により,本手法は,他の一様・多モード手法よりもかなり優れた性能を示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:46:37 GMT)
Exploring Hilbert-Space Fragmentation on a Superconducting Processor [23.4] 分離された相互作用量子系は一般的に熱化するが、エルゴディディティの分解にはいくつかの反例がある。
最近では、スターク多体局在と呼ばれる線形ポテンシャルを持つ系でエルゴディディディティ破壊が観測されている。
ここでは、最大24量子ビットのはしご型超伝導プロセッサを用いて、初期状態依存力学を実験的に検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:39:14 GMT)
Alleviating Exposure Bias in Diffusion Models through Sampling with Shifted Time Steps [23.1] 拡散確率モデル (DPM) は高品質な画像の合成において顕著な有効性を示した。
これまでの研究は、トレーニング中に入力を摂動することでこの問題を緩和しようと試みてきた。
モデルを再学習することなく,提案する新しいサンプリング手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:15:48 GMT)
Select and Distill: Selective Dual-Teacher Knowledge Transfer for Continual Learning on Vision-Language Models [22.9] 大規模視覚言語モデル(VLM)は、目に見えない領域データに対して強力なゼロショット一般化能力を示す。
本稿では,学習済みの知識とゼロショット機能を保持するために,選択型デュアル教師知識伝達フレームワークを提案する。
提案手法は,破壊的忘れとゼロショット劣化を防止するための最先端の継続的学習手法に好適である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:36:36 GMT)
Optimistic Verifiable Training by Controlling Hardware Nondeterminism [22.9] 本研究では,対象モデルよりも高精度なトレーニング,中間ステップ後のラウンドリング,ラウンドニング決定の格納を併用する手法を提案する。
我々は、ResNet-50 (23M) モデルと GPT-2 (117M) モデルのフルトレーニングと微調整の両方において、FP32の精度で正確なトレーニングレプリケーションを実現する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:44:35 GMT)
Pooling Image Datasets With Multiple Covariate Shift and Imbalance [22.5] カテゴリー論の観点からこの問題がいかに単純かつ効果的な解をもたらすかを示す。
提案手法の有効性を,実データを用いた広範囲な実験により示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:46:02 GMT)
OpenGraph: Open-Vocabulary Hierarchical 3D Graph Representation in Large-Scale Outdoor Environments [22.5] 大規模屋外環境のためのオープン語彙階層グラフ構造の表現であるOpenGraphを提案する。
OpenGraphは2Dファウンデーションモデルを使用して、画像からインスタンスとキャプションを抽出し、テキスト推論を強化する機能を備えたキャプションをエンコードする。
最後に、環境をレーングラフ接続に基づいてセグメント化して階層グラフを構築する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:03:29 GMT)
VisLingInstruct: Elevating Zero-Shot Learning in Multi-Modal Language Models with Autonomous Instruction Optimization [22.2] VisLingInstructは、ゼロショット学習においてマルチモーダル言語モデル(MMLM)を進化させる新しいアプローチである。
In-Context Learningを通じて、インストラクショナルテキストを自律的に評価し、最適化する。
TextVQAとHatefulMemesデータセットの先行技術よりも13.1%と9%の精度向上を実現している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:30:14 GMT)
MambaTalk: Efficient Holistic Gesture Synthesis with Selective State Space Models [22.0] マルチモーダル統合によるジェスチャーの多様性とリズムを向上させるMambaTalkを紹介する。
我々の手法は最先端のモデルの性能と一致するか超えている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:10:54 GMT)
Semantic Residual Prompts for Continual Learning [22.0] 提案手法は,最先端CLアプローチとゼロショットCLIPテストの両方で有意に優れていた。
我々の発見は、バックボーンモデルの事前学習知識に相当な領域ギャップを持つデータセットにも当てはまる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:27:04 GMT)
Anatomical Structure-Guided Medical Vision-Language Pre-training [21.7] 医用視覚表現を学習するための解剖学的構造ガイド(ASG)フレームワークを提案する。
解剖学的領域に対しては,放射線技師と協調して自動解剖学的領域文アライメントパラダイムを設計する。
画像の特徴を各サンプル内の各タグに関連付けるために,画像タグ認識デコーダを適用して画像タグとみなす。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:29:47 GMT)
Automatic Interactive Evaluation for Large Language Models with State Aware Patient Simulator [21.6] 大きな言語モデル(LLM)は、人間の相互作用において顕著な熟練性を示している。
本稿では,SAPS(State-Aware patient Simulator)とAIE(Automated Interactive Evaluation)フレームワークを紹介する。
AIEとSAPSは、多ターン医師-患者シミュレーションを通じてLCMを評価するための動的で現実的なプラットフォームを提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:05:08 GMT)
Does CLIP's Generalization Performance Mainly Stem from High Train-Test Similarity? [21.6] CLIPのようなファンデーションモデルは、数億のサンプルでトレーニングされており、新しいタスクやインプットに懸命に一般化されている。
これらの結果から,CLIPのOOD性能を説明するには列車試験の類似性が不十分であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:18:49 GMT)
Circuit Transformer: End-to-end Circuit Design by Predicting the Next Gate [20.8] 言語はシーケンシャルなシンボルを通して表現する卓越した人間の能力であり、近年の大規模言語モデル(LLM)の進歩によって計算的に習得されている。
LLMは理解と推論において前例のない能力を示した。
回路も十分に大きな「回路モデル」でマスターでき、次の論理ゲートを単に予測することで電子設計タスクを克服できるだろうか?
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:24:14 GMT)
Rethinking Class-incremental Learning in the Era of Large Pre-trained Models via Test-Time Adaptation [20.6] クラス増分学習(クラス増分学習、class-incremental learning、CIL)は、クラスを新しいタスクから分類する逐次学習を伴う課題である。
本稿では,最初のタスクでアダプタを用いてPTMを微調整するTTACIL(Test-Time Adaptation for Class-Incremental Learning)を提案する。
私たちのTTACILは、PTMの豊富な機能によって各タスクの恩恵を受けながら、一切忘れることはありません。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:10:05 GMT)
Learning Algorithms for Verification of Markov Decision Processes [20.6] マルコフ決定過程(MDP)の検証に学習アルゴリズムとガイダンスを適用するためのフレームワークを提案する。
提案するフレームワークは,検証における中核的な問題である確率的到達性に注目し,二つの異なるシナリオでインスタンス化される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:54:19 GMT)
Hyper-3DG: Text-to-3D Gaussian Generation via Hypergraph [20.5] 本稿では,ハイパーグラフ(Hyper-3DG)を用いた3次元ガウス生成法を提案する。
本フレームワークは, 凝集度を最適化し, 劣化を効果的に回避し, 微細に生成した3Dオブジェクトの創出を可能にする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:59:55 GMT)
Towards Diverse Perspective Learning with Selection over Multiple Temporal Poolings [19.8] 多様な視点から学習する新しい時間プール手法の提案:複数時間プールの選択(SoM-TP)
SoM-TPは、データごとに複数のメソッド間の最適時間プーリングを動的に選択する。
また,多くのUCR/UEAレポジトリを持つTSCにおいて,他の時間プールや最先端モデルに基づくCNNモデルよりも優れた性能を示すことを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:02:00 GMT)
MARVIS: Motion & Geometry Aware Real and Virtual Image Segmentation [19.5] 実画像領域と仮想画像領域のセグメンテーションのための新しい手法を提案する。
水面の複雑さを模倣するリアルな合成画像を作成することで、我々はネットワークにきめ細かいトレーニングデータを提供する。
我々は、目に見えない実世界の領域において、最先端の仮想画像分割性能を実現する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:18:08 GMT)
An Image Is Worth 1000 Lies: Adversarial Transferability across Prompts on Vision-Language Models [19.3] 従来のタスク固有の視覚モデルに関するよく知られた懸念は、それらは知覚できない逆境の摂動によって誤解される可能性があることである。
本研究では,クロスプロンプト攻撃(CroPA)を提案する。
CroPAは、学習可能なプロンプトで視覚的対向摂動を更新する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:35 GMT)
Continual Segmentation with Disentangled Objectness Learning and Class Recognition [19.2] 本稿では,CoMasTReを用いて連続的セグメンテーションを2段階に分割する手法を提案する。
CoMasTReは、2段階のセグメンタ学習クラスに依存しないマスクの提案を第1段階で使用し、認識は第2段階に留まる。
古いクラスの忘れを緩和するために,セグメンテーションに適した多ラベルクラスの蒸留戦略を設計する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:17:52 GMT)
HGCLIP: Exploring Vision-Language Models with Graph Representations for Hierarchical Understanding [19.0] 異なる階層レベルでカテゴリを分類する場合、従来のユニモーダルアプローチは主にイメージ機能に焦点を当て、複雑なシナリオにおける制限を明らかにする。
ビジョンランゲージモデル(VLM)とクラス階層を統合する最近の研究は、将来性を示しているが、階層関係を完全に活用するには至っていない。
本稿では,CLIPとグラフ表現学習による階層型クラス構造のより深い活用を効果的に組み合わせた新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:03:53 GMT)
WhisperFuzz: White-Box Fuzzing for Detecting and Locating Timing Vulnerabilities in Processors [18.9] 研究者は、プロセッサのタイミング脆弱性を検出するためにブラックボックスまたはグレイボックスファジィを適応した。
静的解析による最初のホワイトボックスファザであるWhisperFuzzを提案する。
プロセッサのタイミング脆弱性を検出し,検出し,微構造的タイミング行動のカバレッジを評価する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:15:56 GMT)
MAMBA: an Effective World Model Approach for Meta-Reinforcement Learning [18.8] 本稿では,メタRL法とメタRL法の要素に基づくメタRLの新しいモデルベースアプローチを提案する。
本稿では,メタRLベンチマークドメインに対するアプローチの有効性を実証し,より優れたサンプル効率でより高いリターンが得られることを示す。
さらに,より困難な高次元領域のスレート上でのアプローチを検証し,実世界の一般化エージェントへの一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:40:36 GMT)
Learning New Tasks from a Few Examples with Soft-Label Prototypes [18.4] NLPにおける「極端」少数ショット学習へのシンプルだが強力なアプローチを提案する。
ニューラルネットワーク(DeepSLP)でソフトラベルのプロトタイプを学習する
実験により、31/48のタスクと数ショット設定において、優れた性能を達成できることを実証した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:55:48 GMT)
Recurrent Drafter for Fast Speculative Decoding in Large Language Models [18.3] 本稿では,大規模言語モデルの提供効率向上を目的とした投機的復号化手法を提案する。
我々は、古典的な2モデル投機的復号法と、より最近のシングルモデルアプローチであるMedusaという2つの確立された手法の長所を生かしている。
提案手法がいくつかのポピュラーなオープンソース言語モデルに対して有効であることを実証的に示すとともに,このアプローチの適用に関わるトレードオフを包括的に分析する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:40:56 GMT)
Mitigating attribute amplification in counterfactual image generation [18.0] 因果生成モデリングは医療画像への関心が高まっている。
ほとんどの研究は、見栄えのよい偽物画像を作ることに重点を置いている。
属性増幅は,反実的トレーニングプロセスにおけるハードラベルの使用によって引き起こされることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:14:47 GMT)
Boosting Multitask Learning on Graphs through Higher-Order Task Affinities [17.7] 与えられたグラフ上のノードラベルの予測は、コミュニティ検出や分子グラフ予測など、多くのアプリケーションにおいて広く研究されている問題である。
本稿では,グラフ上の複数のノードラベリング関数を同時に予測し,マルチタスク学習の観点からこの問題を再考する。
我々は高次タスク親和性尺度に基づいて,タスクをグループにクラスタリングするアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:54:18 GMT)
HEAM : Hashed Embedding Acceleration using Processing-In-Memory [17.7] 今日のデータセンターでは、パーソナライズされたレコメンデーションシステムは、大きなメモリ容量と高い帯域幅の必要性といった課題に直面している。
これまでのアプローチでは、DIMMベースのニアメモリ処理技術や、メモリバウンド問題に対処するために3DスタックDRAMを導入していた。
本稿では、3DスタックDRAMとDIMMを統合してレコメンデーションシステムを高速化するヘテロジニアスメモリアーキテクチャであるHEAMを紹介する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:29:12 GMT)
Learning from straggler clients in federated learning [17.5] 実世界のアプリケーションでガイドされるクライアント遅延のモンテカルロシミュレーションを開発した。
我々はFedAvgやFedAdamのような同期最適化アルゴリズムと非同期FedBuffアルゴリズムについて検討する。
EMNIST、CIFAR-100、StackOverflowベンチマークのフェデレーション学習タスクによる実験は、新しいアルゴリズムがストラグラークライアントの精度で既存のアルゴリズムより優れていることを示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:06:45 GMT)
DiffSF: Diffusion Models for Scene Flow Estimation [17.5] 本稿では,変圧器を用いたシーンフロー推定とデノナイズ拡散モデルを組み合わせたDiffSFを提案する。
拡散過程は, 従来の手法に比べて, 予測の堅牢性を大幅に向上させることを示す。
異なる初期状態で複数回サンプリングすることにより、復調過程は複数の仮説を予測し、出力の不確実性を測定することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:48:43 GMT)
VDNA-PR: Using General Dataset Representations for Robust Sequential Visual Place Recognition [17.4] 本稿では、汎用データセット表現技術を用いて、堅牢な視覚的位置認識(VPR)記述子を生成する。
我々の実験は、我々の表現が、トレーニングデータ分布から真剣なドメインシフトへの現在の解決策よりも堅牢性を高めることができることを示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:30:28 GMT)
Quantum Annealing Approach for the Optimal Real-time Traffic Control using QUBO [17.0] 交通渋滞は都市部の主要な問題の一つである。
渋滞を緩和するために交通の流れを制御する方法が交通研究の中心的な問題の一つとなっている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:24:19 GMT)
Intention-driven Ego-to-Exo Video Generation [16.9] エゴ・ツー・エゴ・ビデオ生成とは、エゴ中心モデルに従って対応するエゴ・エゴ・ビデオを生成することを指す。
本稿では、アクション記述をビュー非依存表現として活用する意図駆動型エクソ生成フレームワーク(IDE)を提案する。
我々は,多様なエゴビデオペアを用いた関連データセットの実験を行い,主観的および客観的な評価において,最先端のモデルよりも優れることを示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:07:31 GMT)
AllSpark: Reborn Labeled Features from Unlabeled in Transformer for Semi-Supervised Semantic Segmentation [16.9] 半教師付きセマンティックセグメンテーション(SSSS)は、時間を要するピクセルレベルの手動ラベリングの負担を軽減するために提案されている。
ラベル付けされていないものからチャネルワイドのクロスアテンション機構でラベル付けされた機能を再起動するAllSparkを紹介します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:39:51 GMT)
Euclidean, Projective, Conformal: Choosing a Geometric Algebra for Equivariant Transformers [16.7] 我々は、このアーキテクチャのバージョンをユークリッド、射影、および共形代数のために研究する。
最も単純なユークリッドアーキテクチャは計算的に安価であるが、対称性群が小さく、サンプリング効率が良くない。
共形代数と射影代数の改良版の両方が、強力でパフォーマンスの良いアーキテクチャを定義する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:55:46 GMT)
uaMix-MAE: Efficient Tuning of Pretrained Audio Transformers with Unsupervised Audio Mixtures [16.6] Masked Autoencoders (MAE) はラベルのないデータからリッチな低レベル表現を学習する。
IDは高レベルのセマンティクスを強調し、MAEのアノテーション要求を緩和する潜在的なソリューションを提供する。
我々は、教師なしオーディオミキシングを利用する効率的なIDチューニング戦略であるuaMix-MAEを紹介する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:13:37 GMT)
LabelAId: Just-in-time AI Interventions for Improving Human Labeling Quality and Domain Knowledge in Crowdsourcing Systems [16.5] 本稿では,クラウドワーカー間でのラベル付け品質とドメイン固有の知識の両面を強化するために,ジャスト・イン・タイムのAI介入について検討する。
本稿では,PWS(Programmatic Weak Supervision)とFT変換器を組み合わせてラベルの正しさを推定する高度な推論モデルであるLabelAIdを紹介する。
その後、都市アクセシビリティのためのオープンソースのクラウドソーシングプラットフォームであるProject SidewalkにLabelAIdを実装しました。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:59:10 GMT)
Towards Faster Training of Diffusion Models: An Inspiration of A Consistency Phenomenon [16.4] 近年,拡散モデル (DM) が注目されている。
DMの訓練を加速する2つの戦略を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:27:04 GMT)
Symbiotic Game and Foundation Models for Cyber Deception Operations in Strategic Cyber Warfare [16.4] 私たちは現在、戦術の急速な進化、知性の非対称性の向上、ハッキングツールのアクセシビリティ向上など、前例のないサイバー戦争に直面しています。
本章は、サイバー詐欺戦術の分析、設計、実施におけるゲーム理論モデルと基礎モデル(FM)の重要な役割を強調することを目的とする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:17:57 GMT)
Consistent-1-to-3: Consistent Image to 3D View Synthesis via Geometry-aware Diffusion Models [16.3] Consistent-1-to-3は、この問題を著しく緩和する生成フレームワークである。
我々はNVSタスクを,(i)観察された領域を新しい視点に変換する,(ii)見えない領域を幻覚させる,の2つの段階に分解する。
本稿では,幾何制約を取り入れ,多視点情報をよりよく集約するための多視点アテンションとして,エピポラ誘導型アテンションを用いることを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:21:46 GMT)
Koopman operators with intrinsic observables in rigged reproducing kernel Hilbert spaces [16.0] 本稿では、再生カーネルヒルベルト空間(RKHS)とそのスペクトル上で定義されるクープマン作用素を推定するための新しいアプローチを提案する。
本稿では,RKHSの固有構造とジェットと呼ばれる幾何学的概念を活かしたJetDMD(Jet Dynamic Mode Decomposition)を提案する。
この手法は従来の拡張動的モード分解(EDMD)を精度よく洗練し、特に固有値の数値的な推定を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:04:37 GMT)
Uncertainty-guided Contrastive Learning for Single Source Domain Generalisation [15.9] 本稿では,Contrastive Uncertainty Domain Generalisation Network(CUDGNet)と呼ばれる新しいモデルを紹介する。
鍵となるアイデアは、架空のドメインジェネレータを通じて、入力空間とラベル空間の両方のソース容量を増大させることである。
また,提案手法は,1つのフォワードパスからジェネレータサブネットワークを経由した推論時間における効率的な不確実性推定も提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:21:58 GMT)
Safe and Generalized end-to-end Autonomous Driving System with Reinforcement Learning and Demonstrations [15.9] インテリジェントな運転システムは、現在の環境と車両状態に基づいて、適切な運転戦略を動的に定式化することができるべきである。
強化学習と模倣学習に基づく既存の手法は、安全性の低下、一般化の低さ、非効率サンプリングに悩まされている。
複雑・多種多様なシナリオを対象とした安全で汎用的なエンドツーエンド自動運転システムを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:47:03 GMT)
Optimal Top-Two Method for Best Arm Identification and Fluid Analysis [15.4] 最適な腕識別問題に対する最適トップ2型アルゴリズムを提案する。
提案アルゴリズムは$delta rightarrow 0$として最適であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:14:07 GMT)
Mind the map! Accounting for existing map information when estimating online HDMaps from sensor [15.3] HDMapをセンサーから推定することで、コストを大幅に削減できる。
提案手法は,HDMapを推定する際の正確な状況の既存のマップを推定する。
我々は,新しいオンラインHDMap推定フレームワークであるMapEXを紹介する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:09:08 GMT)
Osprey: Pixel Understanding with Visual Instruction Tuning [15.1] Ospreyは、細かいマスク領域を言語命令に組み込むことでMLLMを拡張するマスクテキスト命令チューニング手法である。
この目的を達成するために、まず724Kサンプルを用いてマスクベースの領域テキストデータセットをキュレートし、次いでLLMにピクセルレベルの表現を注入して視覚言語モデルを設計する。
具体的には、Ospreyは、畳み込みCLIPバックボーンを視覚エンコーダとして採用し、高解像度入力から正確な視覚マスク特徴を抽出するためにマスク対応視覚抽出器を使用している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:50:17 GMT)
Rectifying Demonstration Shortcut in In-Context Learning [15.1] 大規模言語モデル(LLM)は、ICL(In-context Learning)能力を利用したいくつかのデモで、様々なタスクを解くことができる。
LLMは、ICL予測を進めるために、インプット-ラベル関係よりも、事前に訓練されたデモのセマンティック先行に頼っていることが多い。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:30:14 GMT)
D3T: Distinctive Dual-Domain Teacher Zigzagging Across RGB-Thermal Gap for Domain-Adaptive Object Detection [15.1] オブジェクト検出のためのドメイン適応は、通常、ある可視領域から別の可視領域への知識の転送を必要とする。
本稿では,ドメイン毎に異なるトレーニングパラダイムを用いるD3T(Distinctive Dual-Domain Teacher)フレームワークを提案する。
提案手法は、よく知られた熱データセットを用いた新しい実験プロトコルを用いて検証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:05:43 GMT)
Smooth Tchebycheff Scalarization for Multi-Objective Optimization [15.0] 多目的最適化問題は、現実世界の多くのアプリケーションで見られる。
本稿では,勾配に基づく多目的最適化のための新しいスムーズなTchebycheffスキャラライズ手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:47:54 GMT)
Compositional preference models for aligning LMs [15.0] 構成的選好モデル(CPM)は、一つのグローバルな選好評価をいくつかの解釈可能な特徴に分解するフレームワークである。
CPMは、選好データのどの特性を使って選好モデルを訓練するかを制御し、人間の選好判断を過小評価していると考えられる特徴に基づいて構築することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:07:10 GMT)
A Multi-population Integrated Approach for Capacitated Location Routing [14.9] 本稿では, 静電容量化問題に対するマルチポピュレーション統合フレームワークを提案する。
効果的な地区ベースの局所探索、実現可能性回復手順、多様化指向の突然変異を含む。
文献からの281のベンチマークインスタンスの実験は、アルゴリズムが驚くほどよく機能していることを示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:11:30 GMT)
Vanishing Gradients in Reinforcement Finetuning of Language Models [14.8] 本研究は、強化微細化(RFT)における基本最適化障害を特定する。
モデル下での報酬標準偏差が小さい場合には,入力に対する期待勾配が消えることを示す。
次に、報酬標準偏差の小さいため、失効する勾配が一般的であり、有害であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:05:18 GMT)
Utilizing Contextual Clues and Role Correlations for Enhancing Document-level Event Argument Extraction [14.7] 文書レベルのイベント引数抽出は,情報抽出分野において重要な課題である。
本稿では、CARLGという新しいフレームワークを紹介し、CCA(Contextual Clues Aggregation)とRLIG(Role-based Latent Information Guidance)の2つの革新的なコンポーネントについて紹介する。
次に、CARLGフレームワークを、現在の主流EAEアプローチの2つのタイプに基づいて、2つの変種にインスタンス化します。特に、我々のCARLGフレームワークは、1%未満の新しいパラメータを導入し、性能を著しく改善しています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:39:14 GMT)
Synchronization is All You Need: Exocentric-to-Egocentric Transfer for Temporal Action Segmentation with Unlabeled Synchronized Video Pairs [14.6] 我々は、当初、遠心型(固定型)カメラ用に設計された時間的アクションセグメンテーションシステムを、エゴセントリックなシナリオに転送する問題を考える。
本稿では,既存のラベル付きエキソセントリックビデオを活用する新しい手法と,ラベルなし,同期化されたエキソセントリックビデオの新たなセットを提案する。
EgoExo4Dベンチマークでは,編集スコアも+3.32向上した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:34:45 GMT)
GraVoS: Voxel Selection for 3D Point-Cloud Detection [14.6] 大規模な3次元シーンにおける3次元物体検出は、3次元点雲の空間性と不規則性のために困難である。
我々は,要素(ボクセル)を付加するのではなく,要素(ボクセル)を除去することでシーンを変更することを提案する。
このアプローチでは、両方のタイプのデータセットの不均衡に対応する方法で、"意味のある"ボクセルを選択します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:53:48 GMT)
Intention-aware Denoising Diffusion Model for Trajectory Prediction [14.5] 軌道予測は、特に衝突回避システムにおいて、自律運転において不可欠な要素である。
本稿では,拡散モデルを用いて将来の軌道の分布を生成することを提案する。
Intention-aware denoising Diffusion Model (IDM)を提案する。
提案手法は,SDDデータセットでは13.83ピクセル,ETH/UCYデータセットでは0.36メートルのFDEで,最先端の結果が得られる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:05:25 GMT)
WeakSurg: Weakly supervised surgical instrument segmentation using temporal equivariance and semantic continuity [14.4] WeakSurgは、外科的シナリオを考慮に入れた時間的情報を利用する、計器のみの弱教師付きセグメンテーションアーキテクチャである。
以上の結果から,WeakSurgはセマンティックセグメンテーションの指標だけでなく,インスタンスセグメンテーションの指標においても最先端の手法と良好に比較できることがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:39:11 GMT)
Incorporating Graph Attention Mechanism into Geometric Problem Solving Based on Deep Reinforcement Learning [14.4] ほとんどの場合、問題はラインやポイントのような補助的なコンポーネントを追加することで解決される。
本稿では,BERT などの言語モデルに基づく深層強化学習フレームワークを提案する。
A3C-RLと呼ばれる新しいアルゴリズムは、エージェントにトップ戦略の選択を強制することで提案される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:00:09 GMT)
Why So Gullible? Enhancing the Robustness of Retrieval-Augmented Models against Counterfactual Noise [14.4] 検索された文書セットでは、「関連」文書でさえ誤った情報や誤った情報を含むことがある。
我々の研究は、"関連"文書でさえ誤った情報や誤った情報を含む、より困難なシナリオを調査します。
本稿では,識別器を明示的に微調整したり,GPT-3.5に識別能力の付与を促すことによって,検索した文書間の知識衝突を処理する手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:39:58 GMT)
When Semantic Segmentation Meets Frequency Aliasing [14.1] 我々は、ハードピクセルエラーを包括的に分析し、それらを偽応答、マージミス、変位の3つのタイプに分類する。
その結果, ダウンサンプリング中のフーリエ領域の周波数成分の重なりによる歪みが, ハードピクセルとエイリアシングの定量的な関連性を示した。
本稿では,Nyquist周波数よりも高い周波数を正確に除去・調整することにより,エイリアスを緩和する2つの新しいデエイリアスフィルタ (DAF) と周波数混合 (FreqMix) モジュールを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:12:02 GMT)
Sentinel-Guided Zero-Shot Learning: A Collaborative Paradigm without Real Data Exposure [14.0] SG-ZSLは、モデルや機密データを交換することなく、効率的なコラボレーションを促進するように設計されている。
教師モデル、学生モデル、両方のモデルエンティティをリンクするジェネレータで構成される。
ZSLやGZSLのタスク、特にホワイトボックスプロトコルでは一貫してパフォーマンスが向上している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:12:49 GMT)
Learning Semantic Proxies from Visual Prompts for Parameter-Efficient Fine-Tuning in Deep Metric Learning [14.0] 既存のソリューションは、既存の画像データセット上でトレーニング済みのモデルを微調整することに集中している。
我々は、事前学習された視覚変換器(ViT)における視覚プロンプト(VPT)の学習に基づく、新しい効果的なフレームワークを提案する。
セマンティック情報を用いた新しい近似が代表的能力よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:29:47 GMT)
Learning Macroeconomic Policies based on Microfoundations: A Stackelberg Mean Field Game Approach [13.9] 本稿は、textitStackelberg Mean Field Game (SMFG)に基づく最適マクロ経済政策問題をモデル化する。
また,実データに対する事前学習とモデルフリーなtextitStackelberg平均場強化学習(SMFRL)アルゴリズムを取り入れたSMFGの解を提案する。
実験の結果,SMFG法が他の経済政策よりも性能,効率・等価トレードオフ,SMFGの仮定分析において優れていることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:22:31 GMT)
Touch-GS: Visual-Tactile Supervised 3D Gaussian Splatting [13.9] 光触覚センサを用いた3次元ガウス撮影シーンの監視手法を提案する。
我々は、DenseTact光触覚センサとRealSense RGB-Dカメラを活用し、この方法でタッチとビジョンを組み合わせることで、視覚やタッチ単独よりも定量的に質的に優れた結果が得られることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:09:59 GMT)
Multi-Step Deductive Reasoning Over Natural Language: An Empirical Study on Out-of-Distribution Generalisation [13.9] 自然言語で表現された多段階推論のための反復型ニューラルネットワークであるIMA-GloVe-GAを紹介する。
本モデルでは,ゲートアテンション機構を備えたRNNに基づく反復型メモリニューラルネットワークを用いて推論を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:35:57 GMT)
Revisiting Zero-Shot Abstractive Summarization in the Era of Large Language Models from the Perspective of Position Bias [13.8] 位置バイアスを測定することにより,Large Language Models (LLMs) におけるゼロショット抽象要約を特徴付ける。
位置バイアスは入力テキストの特定の部分からの情報を不当に優先するモデルの傾向を捉え、望ましくない振る舞いをもたらす。
その結果,ゼロショット要約タスクにおけるモデルの性能と位置バイアスに関する新たな洞察と議論につながった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:20:33 GMT)
LAMP: A Language Model on the Map [13.8] 大規模言語モデル(LLM)は、私たちの生活においてますます重要な役割を担い、幅広いタスクに補助を提供しています。
本研究では,都市固有のデータに基づいて事前学習したモデルを微調整し,正確なレコメンデーションを実現するための新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:56:38 GMT)
Sabiá-2: A New Generation of Portuguese Large Language Models [13.5] ポルトガル語のテキストで訓練された大規模言語モデルのファミリーであるSabi'a-2を紹介する。
モデルはブラジルの大学へのエントリーレベルテストを含む様々な試験で評価される。
サービア-2 ミディアムは、試験64点中23点でGPT-4の成績を上回り、試験64点中58点でGPT-3.5を上回った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:44:48 GMT)
PreCurious: How Innocent Pre-Trained Language Models Turn into Privacy Traps [13.5] PreCuriousは、会員推測とデータ抽出の両方の一般的なプライバシーリスクを増大させることを目指している。
PreCuriousは、良性モデルで微調整するよりも、ステルス的な方法で陰性化の可能性を実証している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:54:17 GMT)
GNNX-BENCH: Unravelling the Utility of Perturbation-based GNN Explainers through In-depth Benchmarking [13.4] 本稿では,GNNの摂動に基づく説明可能性に関するベンチマーク研究を行う。
ノイズの優れた有効性と安定性を示す手法を同定する。
本研究は、GNNの分野におけるステークホルダーに、最先端の説明可能性手法の包括的理解を与えるものである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:52:05 GMT)
DA-PFL: Dynamic Affinity Aggregation for Personalized Federated Learning [13.4] 既存のパーソナライズされた学習モデルでは、学習モデルの性能を改善するために、類似したクライアントを同様のデータ分散で集約するのが好ましい。
本稿では,動的親和性に基づく個人化フェデレーション学習モデル(DA-PFL)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:12:10 GMT)
Bridging Quantum Computing and Differential Privacy: A Survey on Quantum Computing Privacy [13.4] 量子コンピューティングは暗号、サイバーセキュリティ、薬物発見などの分野で大きな注目を集めている。
量子コンピューティングは通常、センシティブなデータセットを必要とするため、プライバシー侵害は重要な懸念事項となっている。
微分プライバシ(DP)は古典コンピューティングにおいて有望なプライバシ保護手法であり、近年量子ドメインに拡張されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:40:30 GMT)
SOCIALITE-LLAMA: An Instruction-Tuned Model for Social Scientific Tasks [13.2] オープンソースでインストラクションをチューニングしたLlamaであるSocialite-Llamaを紹介します。
20種類の社会科学タスクにおいて、Socialite-LlamaはLlamaのパフォーマンスを改善し、最先端のマルチタスク微調整モデルのパフォーマンスをマッチまたは改善する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:30:41 GMT)
TimeMachine: A Time Series is Worth 4 Mambas for Long-term Forecasting [13.1] TimeMachineは時系列データのユニークな特性を利用して、マルチスケールで適切なコンテキストキューを生成する。
TimeMachineは、ベンチマークデータセットを使用して広範囲に検証されるように、予測精度、スケーラビリティ、メモリ効率において優れたパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:19:37 GMT)
Are Synthetic Data Useful for Egocentric Hand-Object Interaction Detection? [13.0] 本研究では,エゴセントリックな手・物体間相互作用検出における合成データの有効性について検討した。
実際のラベル付きデータの10%しか利用できないため、実際のデータにのみ訓練されたベースラインと比較して、全体的なAPの改善を実現しています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:59:14 GMT)
Make-Your-3D: Fast and Consistent Subject-Driven 3D Content Generation [12.7] 5分以内に高忠実で一貫した3Dコンテンツをパーソナライズできる新しい3Dカスタマイズ手法「Make-Your-3D」を導入する。
我々の重要な洞察は、多視点拡散モデルとアイデンティティ特異的な2次元生成モデルの分布を調和させ、所望の3次元対象の分布と整合させることである。
提案手法は,高画質で一貫した,かつ主観的な3Dコンテンツを生成することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:57:04 GMT)
MMSR: Symbolic Regression is a Multimodal Task [12.7] 記号回帰は、もともと最適化問題として定式化され、GPと強化学習アルゴリズムがそれを解決するために用いられた。
この問題を解決するために、研究者はデータから表現へのマッピングを翻訳問題として扱う。
本稿では,複数の主流データセット上で最も高度な結果が得られるMMSRを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:10:43 GMT)
Efficient Bitrate Ladder Construction using Transfer Learning and Spatio-Temporal Features [12.6] 本稿では,移動・学習機能を用いた効率的なはしご予測手法を提案する。
102の動画シーンでのテストでは、94.1%の複雑さと1.71%のBD-Rateコストでブルートフォースを減少させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:59:19 GMT)
Vision-Language Models are Zero-Shot Reward Models for Reinforcement Learning [12.6] 強化学習(Reinforcement Learning, RL)は、報酬関数を手動で指定するか、あるいは大量のフィードバックから報酬モデルを学ぶことを必要とする。
本稿では,事前学習された視覚言語モデル (VLM) をゼロショット報酬モデル (RM) として用いて,自然言語によるタスクの特定を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:16:00 GMT)
Basque and Spanish Counter Narrative Generation: Data Creation and Evaluation [12.5] 我々は,機械翻訳(MT)と専門的な後編集によって開発されたCN生成のための新しいバスク・スペイン語データセットを提案する。
パラレルコーパス(英語版)であり、元々の英語のCONANに対しても、CNの多言語および多言語自動生成に関する新しい研究を行うことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:12:47 GMT)
Plug and Play Active Learning for Object Detection [12.5] オブジェクト検出のためのPlug and Play Active Learning(PPAL)を導入する。
PPALは不確実性と多様性に基づくサンプリングフェーズを含む2段階の手法である。
我々は,MS-COCOおよびPascal VOCデータセット上で,異なる検出器アーキテクチャを用いてPPALをベンチマークした。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:35:59 GMT)
Reality Bites: Assessing the Realism of Driving Scenarios with Large Language Models [12.5] 大規模言語モデル(LLM)は、テキスト生成、要約、分類といったタスクにおいて顕著な可能性を示している。
我々は,LLMがタスクの実行に有効で堅牢であるかどうかを実証評価した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:38:20 GMT)
Robust Light-Weight Facial Affective Behavior Recognition with CLIP [12.4] 人間の感情行動分析は、人間の感情に対する理解を深めるために、人間の表情や行動を調べることを目的としている。
表現分類やAU検出における既存のアプローチは、しばしば複雑なモデルとかなりの計算資源を必要とする。
本稿では,表現分類とAU検出の両方を効率的に扱うための,最初の軽量フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:21:55 GMT)
Dissipative Gradient Descent Ascent Method: A Control Theory Inspired Algorithm for Min-max Optimization [12.2] 散逸性GDA法は、状態拡張および正規化サドル関数上で標準GDAを実行すると見なすことができる。
両線形および強凸凸凸凹面におけるDGDAの線形収束性を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:26:00 GMT)
Adaptivity is not helpful for Pauli channel learning [12.1] このノートは、適応戦略が、絡み合った入力でPauliチャネルを学習し、テストするための追加の利点を提供していないことを示している。
まず、一般ノルム$l_p$に対して、絡み合った入力を持つパウリチャネルを学習する際の厳密なクエリ複雑性を確立する。
誤差分布のエントロピーを特徴とするPauliチャネルのノイズレベルを推定するクエリの複雑さが$Theta(4n/n)$であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:54:29 GMT)
Attention-based Class-Conditioned Alignment for Multi-Source Domain Adaptive Object Detection [11.6] オブジェクト検出(OD)のドメイン適応手法は、ソースドメインとターゲットドメイン間の特徴調整を促進することによって、分散シフトの影響を軽減する。
MSDAは、複数のアノテートされたソースデータセットとラベルなしのターゲットデータを活用することで、検出モデルの正確性と堅牢性を改善する。
ドメイン間で各オブジェクトカテゴリのインスタンスをアライメントするMSDAのための注目型クラス条件アライメントスキームを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:31:41 GMT)
Attacking the Diebold Signature Variant -- RSA Signatures with Unverified High-order Padding [11.4] 広範に使われているDiebold Touch Screenと光走査投票機に実装されたRSAシグネチャ検証の自然な実装について検討する。
我々は、敵が任意のメッセージの署名を無視可能な時間で偽造できる非常に数学的に単純な攻撃を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:49:12 GMT)
Single Domain Generalization for Crowd Counting [11.2] MPCountは、さまざまなシナリオ下での最先端技術と比較して、カウント精度を著しく改善している。
MPCountは、狭いソース分布のトレーニングデータに保存されていない様々なシナリオ下でのテクニックの状態と比較して、カウントの精度を著しく改善する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:16:21 GMT)
LDPRecover: Recovering Frequencies from Poisoning Attacks against Local Differential Privacy [11.2] 周波数推定のためのローカルディファレンシャルプライバシ(LDP)プロトコルは、毒性攻撃に対して脆弱である。
毒殺事件から正確な集積周波数を復元する手法であるLPPRecoverを提案する。
以上の結果から, LDPRecoverは様々な毒素攻撃に対して, 正確かつ広く適用可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:57:20 GMT)
TBI Image/Text (TBI-IT): Comprehensive Text and Image Datasets for Traumatic Brain Injury Research [11.1] TBI-ITは外傷性脳損傷(TBI)の医学領域における新しいデータセットである
電子カルテ(EMR)と頭部CT画像の両方を含んでいる。
このデータセットは、TBIの診断と治療における人工知能の精度を高めるように設計されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:07:49 GMT)
rFaceNet: An End-to-End Network for Enhanced Physiological Signal Extraction through Identity-Specific Facial Contours [11.1] リモート光胸腺撮影(r)技術は、ビデオフレームの微妙なピクセル変化から血液体積パルス(BVP)信号を抽出する。
本稿では,顔の輪郭に着目して顔BVP信号の抽出を促進するrFaceNet法を紹介する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:11:16 GMT)
Annotation Free Semantic Segmentation with Vision Foundation Models [11.0] 我々は、自己教師付き事前訓練されたビジョンエンコーダの上に軽量モジュールを構築し、パッチ機能を事前訓練されたテキストエンコーダと整合させる。
既存の基盤モデルを使用して、セマンティックセグメンテーションデータセットの無料アノテーションを生成し、アライメントモジュールを無償でトレーニングします。
我々のアプローチは、最小限のトレーニングで訓練済みの視覚エンコーダに言語ベースのセマンティクスをもたらすことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:57:58 GMT)
Kernelized Reinforcement Learning with Order Optimal Regret Bounds [11.0] $pi$KRVI は最小自明なヒルベルト二乗値の楽観的な修正である。
我々は、一般的な設定の下で、最初の順序最適後悔保証を証明します。
マタン核の場合、順序が最適である部分線型後悔境界を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:36:01 GMT)
GazeMotion: Gaze-guided Human Motion Forecasting [11.0] 本稿では、過去の人間のポーズ情報と人間の目視情報を組み合わせた、人間の動き予測の新しい手法であるGazeMotionを紹介する。
人間の目と身体の動きが密接に調整されていることを示す行動科学のエビデンスにインスパイアされたGazeMotionは、まず過去の視線から将来の視線を予測し、その後予測された将来の視線と過去のポーズを視線のグラフに融合し、最後に身体の動きを予測するための残差グラフ畳み込みネットワークを使用する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:38:00 GMT)
Code Revert Prediction with Graph Neural Networks: A Case Study at J.P. Morgan Chase [11.0] コードリバース予測は、コード変更がソフトウェア開発で逆転またはロールバックされる可能性を予測または予測することを目的としている。
コード欠陥検出の以前の方法は、独立した機能に依存していたが、コードスクリプト間の関係を無視していた。
本稿では,コードインポートグラフとコード特徴を統合した,コード逆転予測のための系統的研究について述べる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:54:29 GMT)
A Continued Pretrained LLM Approach for Automatic Medical Note Generation [11.0] 13B Llama2 ベースの LLM は医療会話用に構築され、自動スクラブで測定される。
我々のモデルはPubMedQAで76.6%の精度でGPT-4より優れており、医療会話をSOAPノートにまとめる際の性能と一致している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:55:37 GMT)
Better Zero-Shot Reasoning with Role-Play Prompting [10.9] ロールプレイプロンプトは、ほとんどのデータセットで標準のゼロショットアプローチを一貫して上回っている。
これは、大きな言語モデルの推論能力を増強する可能性を強調している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:07:11 GMT)
Human Brain Exhibits Distinct Patterns When Listening to Fake Versus Real Audio: Preliminary Evidence [10.8] 本稿では,実聴・偽聴における脳活動の変動について検討する。
予備的な結果は、最先端のディープフェイクオーディオ検出アルゴリズムによって学習された表現は、実際の音声と偽オーディオの間に明確なパターンを示さないことを示唆している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:43:13 GMT)
Towards Dynamic and Small Objects Refinement for Unsupervised Domain Adaptative Nighttime Semantic Segmentation [10.8] 夜間セマンティックセグメンテーションは、自律運転のような実践的応用において重要な役割を果たす。
UDAはこれらの課題に対処する可能性を示し、夜間のセマンティックセグメンテーションにおいて顕著な結果を得た。
本稿では,夜間セマンティックセマンティックセグメンテーションのための動的および小型オブジェクトのラベルレベルと特徴レベルの両方を改良する新しいUDA手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:59:58 GMT)
An AI-Driven Approach to Wind Turbine Bearing Fault Diagnosis from Acoustic Signals [10.6] 本研究では, 風力タービン発電機の軸受欠陥を音響信号から分類する深層学習モデルを開発した。
畳み込み型LSTMモデルを構築し, 事前定義された5種類の故障の音声データを用いて, トレーニングと検証を行った。
このモデルでは, トレーニングサンプルの精度が優れ, 検証中に優れた一般化能力を示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:46:30 GMT)
Quasiprobability fluctuation theorem behind the spread of quantum information [10.6] 理論的には、情報不等式の背後にある量子ゆらぎ定理を明らかにする。
ゆらぎ定理は、基礎となる量子過程の統計を定量的に予測する。
準確率を構成する振幅を測定するために干渉法を実験的に適用した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:34:43 GMT)
Generalizing Denoising to Non-Equilibrium Structures Improves Equivariant Force Fields [10.6] 本稿では,非平衡構造(DeNS)を補助的タスクとして活用し,トレーニングデータの活用と性能向上を提案する。
DeNSを用いたトレーニングでは,まず3次元座標にノイズを加え,そのノイズを予測することで3次元構造を破損させた。
OC20,OC22,MD17データセット上で,DeNSを用いた同変ネットワークのトレーニングの有効性を検討した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:38:02 GMT)
Score-Guided Diffusion for 3D Human Recovery [10.6] Score-Guided Human Mesh Recovery (ScoreHMR)を提案する。
ScoreHMRはモデルフィッティングアプローチを模倣するが、拡散モデルの潜在空間におけるスコアガイダンスによって画像観察との整合が達成される。
提案手法は, (i) 単フレームモデルフィッティング, (ii) 複数視点からの再構成, (iii) ビデオシーケンスで人間を再構成することである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:56:14 GMT)
ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Image [10.5] 熱画像に基づくエゴセントリックな3D手ポーズ推定のための新しいベンチマークを提案する。
熱画像におけるエゴセントリックな3Dハンドポーズ推定に2つのトランスフォーマーモジュールを利用する,双対ベースライン手法TheFormerを導入する。
以上の結果から,TheFormerの先行性能と3Dハンドポーズ推定におけるサーマルイメージングの有効性が確認された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:01:06 GMT)
Red Teaming Models for Hyperspectral Image Analysis Using Explainable AI [10.5] 本稿では,ハイパースペクトル画像を用いた機械学習モデルの検討手法を提案する。
我々は、説明可能なAI(XAI)ドメインからのポストホックな説明手法を用いて、最高のパフォーマンスモデルを評価する。
当社のアプローチは,重要な欠点を指摘し,検証することで,モデルを効果的にチーム化するものです。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:40:34 GMT)
Clinical Reasoning over Tabular Data and Text with Bayesian Networks [10.4] 本稿では,ベイジアンネットワークをニューラルテキスト表現で拡張するための戦略を比較検討する。
プライマリ・ケア・ユース・ケース(肺炎の診断)のシミュレーションの結果を概説し,より広範な臨床状況で考察した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:25:23 GMT)
Fine-Grained Cryptanalysis: Tight Conditional Bounds for Dense k-SUM and k-XOR [10.4] a average-case variant of a $k$-SUM conjecture(英語版)は、$r$乱数のリストで 0 に等しい数を見つけることは $rlceil k/2 rceil$ time よりもはるかに少ない。
リストがより多くの数を持ち、多くの解が存在する高密度なパラメータ体系では、その中の1つを見つける複雑さは、ワーグナーの$k$-treeアルゴリズムによって著しく改善される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:14:47 GMT)
Comparing roughness maps generated by five roughness descriptors for LiDAR-derived digital elevation models [10.4] 本研究は, 一般的な5つの粗さ記述子を比較し, 異なる空間変動を有する3つの地形の地形表面粗さマップ間の相関関係について検討した。
その結果,大域的パターンの類似点と局所的パターンの相違点が抽出された粗さマップで明らかとなった。
空間スケールは、より粗い地形への影響を小さくし、手法は異なる記述子から派生した粗さマップに最小限の影響を及ぼした。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:18:25 GMT)
NAISR: A 3D Neural Additive Model for Interpretable Shape Representation [10.3] 科学的な形状発見のための解釈可能な形状表現のための3次元ニューラル付加モデル(テキストNAISR$)を提案する。
本手法は, 形状人口の傾向を把握し, 形状移動による患者固有の予測を可能にする。
我々の実験は、textitStarman$が解釈可能性を維持しながら優れた形状復元性能を発揮することを示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:37:07 GMT)
XReal: Realistic Anatomy and Pathology-Aware X-ray Generation via Controllable Diffusion Model [9.9] 大規模な生成モデルは、視覚的に魅力的な画像を生成する上で、印象的な能力を示している。
胸部X線画像を生成するための新しい制御可能な拡散モデルであるXRealを提案する。
本手法は,微調整をすることなく,事前学習したテキスト・画像拡散モデルに空間制御をシームレスに統合することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:03:58 GMT)
NM-FlowGAN: Modeling sRGB Noise with a Hybrid Approach based on Normalizing Flows and Generative Adversarial Networks [9.8] NM-FlowGANは、GANと正規化フローの両方の長所を利用するハイブリッドアプローチである。
我々のNM-FlowGANは、sRGBノイズ合成タスクにおいて、他のベースラインよりも優れています。
我々のモデルから合成画像対で訓練した認知ニューラルネットワークも、他のベースラインと比較して優れた性能を示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:56:35 GMT)
Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity [9.8] 本稿では、欠落したモダリティに関する現在の研究を低データ体制に拡張する。
フルモダリティデータと十分なアノテートされたトレーニングサンプルを取得することは、しばしばコストがかかる。
本稿では,この2つの重要な問題に対処するために,検索強化したテキスト内学習を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:19:48 GMT)
Model-free Reinforcement Learning of Semantic Communication by Stochastic Policy Gradient [9.6] 1949年のWeaverによる意味コミュニケーションのアイデアが注目されている。
セマンティック・コミュニケーション・システムの設計にポリシ・グラディエント(SPG)を適用した。
我々は、受信変数と対象変数の相互情報から、古典的および意味的なコミュニケーションの両方を導出する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:54:10 GMT)
TTA-Nav: Test-time Adaptive Reconstruction for Point-Goal Navigation under Visual Corruptions [9.6] TTA-Navは視覚的破損下でのポイントゴールナビゲーションのためのテスト時適応法である。
本手法は,最も深刻な汚職に対して,最先端の46%から94%のポイントゴールナビゲーションを成功率で改善する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:30:48 GMT)
Efficient Tensor Networks for Control-Enhanced Quantum Metrology [9.6] 本研究では,アンシラや有界アンシラを持たない多数の量子チャネルを推定するための効率的なテンソルネットワークアルゴリズムを提案する。
我々の第一のアプローチでは、$N-1$の任意のインターリーブド制御操作を推定するために$N$チャネル間で適用することができ、第二のアプローチは全ての制御操作を同一に制限する。
提案アルゴリズムは,N$が有限だが大きければ最適な量子誤り訂正プロトコルより優れている戦略を同定する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:02:27 GMT)
ORPO: Monolithic Preference Optimization without Reference Model [9.5] 選好アライメントの文脈において,教師付き微調整が果たす重要な役割について検討した。
モデルフリーなモノリシックオッズ比最適化アルゴリズムORPOを導入し、追加の選好アライメントフェーズの必要性を排除した。
具体的には、Phi-2 (2.7B)、Llama-2 (7B)、Mistral (7B)、ORPO on the UltraFeedbackは、7Bと13B以上のパラメータを持つ最先端言語モデルの性能を上回っている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:47:08 GMT)
CURSOR: Scalable Mixed-Order Hypergraph Matching with CUR Decomposition [9.5] 本研究は,高速なハイパーグラフマッチングを実現するために,新しい第2および第3次ハイパーグラフマッチングフレームワーク(CURSOR)を導入する。
CURベースの2階グラフマッチングアルゴリズムを用いて粗マッチングを行い、繊維CURベースのテンソル生成法であるCURSORのコアは、互換性テンソルのエントリを直接計算する。
大規模合成データセットと広く評価されたベンチマークセットの実験結果は、既存の手法よりもCURSORの方が優れていることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:45:04 GMT)
Mixture of Mixups for Multi-label Classification of Rare Anuran Sounds [9.3] マルチラベルの不均衡な分類は、機械学習において大きな課題となる。
本稿では,AnuraSetを用いてアヌラ種を分類する特定の事例に焦点を当てた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:39:14 GMT)
Platypus: Quick, Cheap, and Powerful Refinement of LLMs [9.0] プラティパス(英: Platypus)は、大規模言語モデル(Large Language Models)のファミリーである。
13B Platypusモデルは、$textita single$ A100 GPUで5時間で25kの質問を使ってトレーニングできる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:56:23 GMT)
Less is More: Revisiting the Gaussian Mechanism for Differential Privacy [8.9] 出力摂動による差分プライバシーは、機密データに対してクエリや計算結果をリリースするためのデファクトスタンダードとなっている。
既存のガウスのメカニズムはすべて、フルランクの共分散行列の呪いに苦しむ。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:31:01 GMT)
Stochastic Approximation with Decision-Dependent Distributions: Asymptotic Normality and Optimality [8.8] 我々は、アルゴリズムが使用するデータ分布が反復列に沿って進化する決定依存問題に対する近似を解析する。
軽微な仮定の下では、アルゴリズムの反復と解の偏差は正規であることを示す。
また,平均化アルゴリズムの性能は局所的に最小限であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:41:34 GMT)
xLP: Explainable Link Prediction for Master Data Management [8.7] このデモでは、ユーザがより快適な説明を選択できるように、リンク予測に関する説明を創造的な方法で提示する。
マスタデータ管理におけるリンク予測のために,解釈可能性,事実検証,パスランキング,ニューロシンボリック推論,自己説明型AIなど,さまざまな説明可能性ソリューションを構築した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:53:44 GMT)
Shielded Deep Reinforcement Learning for Complex Spacecraft Tasking [8.7] まず、宇宙船の作業や安全要件を形式化するための形式言語であるLTL(Linear Temporal Logic)について検討する。
次に、SDRLフレームワークにおける効果的なトレーニングのために、コセーフ仕様から報酬関数を自動で構築する方法を定義する。
いくつかの実験を通して、これらのシールドが異なるポリシーや報酬構造の柔軟性とどのように相互作用するかを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:37:02 GMT)
A Hierarchical Fused Quantum Fuzzy Neural Network for Image Classification [8.7] 我々は新しい階層型融合量子ファジィニューラルネットワーク(HQFNN)を提案した。
HQFNNは量子ニューラルネットワークを使用してファジィニューラルネットワークのファジィメンバシップ関数を学習する。
その結果,提案手法は既存手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:09:36 GMT)
A Neural-Evolutionary Algorithm for Autonomous Transit Network Design [8.6] 経路ネットワーク構築のポリシーとしてグラフニューラルネットモデルを使用し、進化的アルゴリズムにおいていくつかの突然変異演算子の1つとしてこのポリシーを使用する。
我々はこのアルゴリズムをトランジットネットワーク設計のための標準的なベンチマークセットで評価し、学習ポリシーを最大20%向上させ、リアルなベンチマークインスタンス上では最大53%の進化的アルゴリズムアプローチを立案した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:00:37 GMT)
Unlocking the conversion of Web Screenshots into HTML Code with the WebSight Dataset [8.6] 我々は、200万組のHTMLコードとそれに対応するスクリーンショットからなるデータセットであるWebSightを紹介する。
この分野での研究を加速するため、私たちはWebSightをオープンソースにしました。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:40:40 GMT)
Metadata-Driven Federated Learning of Connectional Brain Templates in Non-IID Multi-Domain Scenarios [8.5] そこで我々はメタFedCBTと呼ばれるメタデータ駆動のフェデレーション学習フレームワークを提案する。
本モデルは,ローカルクライアントベースの回帰器ネットワークを導入することで,メタデータを完全に教師付きで学習することを目的としている。
我々の教師付きメタデータ生成アプローチは、特定の脳状態のより中心的で代表的で総合的なCBTの教師なし学習を促進する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:38:22 GMT)
Learning the greatest common divisor: explaining transformer predictions [8.4] 小型変圧器の予測は、モデル入力と出力を見ることで完全に特徴付けられる。
このモデルは整数と小さな素数を表すために使用される基底の因子の積である整数の$mathcal D$を学習し、両方の入力を分割する$mathcal D$の最大の要素を予測する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:47:17 GMT)
SELECTOR: Heterogeneous graph network with convolutional masked autoencoder for multimodal robust prediction of cancer survival [8.4] がん患者生存のマルチモーダル予測は、より包括的で正確なアプローチを提供する。
本稿では、畳み込みマスクエンコーダに基づく異種グラフ認識ネットワークであるSELECTORを紹介する。
本手法は,モダリティ欠落とモダリティ内情報確認の両事例において,最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:23:39 GMT)
Adversarial Training with OCR Modality Perturbation for Scene-Text Visual Question Answering [8.4] Scene-Text Visual Question Answering (ST-VQA) は、画像中のシーンテキストを理解し、テキストコンテンツに関連する質問に答えることを目的としている。
既存の手法の多くは光学文字認識(OCR)システムの精度に大きく依存している。
本研究では,空間認識機能を備えたマルチモーダル対向学習アーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:22:06 GMT)
MCformer: Multivariate Time Series Forecasting with Mixed-Channels Transformer [8.3] Channel Independence(CI)戦略は、すべてのチャネルを単一のチャネルとして扱い、データセットを拡張する。
Mixed Channels戦略は、CI戦略のデータ拡張アドバンテージと、チャネル間の相関を忘れないように対処する機能を組み合わせたものだ。
モデルは特定の数のチャネルをブレンドし、チャネル間の相関情報を効果的に取得するための注意機構を活用する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:43:07 GMT)
VM-UNET-V2 Rethinking Vision Mamba UNet for Medical Image Segmentation [8.3] 本稿では,MambaアーキテクチャにインスパイアされたVison Mamba-UNetV2を提案する。
VM-UNetV2は、医用画像セグメンテーションタスクにおいて競合する性能を示す。
我々はISIC17、ISIC18、CVC-300、CVC-ClinicDB、Kvasir CVC-ColonDB、ETIS-LaribPolypDBのパブリックデータセットに関する包括的な実験を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:12:39 GMT)
Model-based causal feature selection for general response types [8.2] Invariant causal prediction (ICP) は、不均一な設定からのデータを必要とする因果的特徴選択の手法である。
我々は変換モデル(TRAM)ベースのICPを開発し、連続的、分類的、カウント型、非形式的に検閲された応答を可能にする。
我々は、オープンソースのRパッケージ「tramicp」を提供し、シミュレーションデータに対する我々のアプローチを評価し、重篤な患者の生存の因果的特徴を調査する事例研究を行った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:28:12 GMT)
Noise Dimension of GAN: An Image Compression Perspective [8.2] GAN(Generative Adversial Network)は、高次元ノイズをターゲット分布のサンプルにマッピングする生成モデルの一種である。
以前のアプローチでは、GANは連続分布から別の連続分布への写像であると見なされていた。
本稿では,GANを離散サンプリングとして扱うことを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:09:06 GMT)
WSI-SAM: Multi-resolution Segment Anything Model (SAM) for histopathology whole-slide images [8.2] 病理画像の正確なオブジェクト分割機能を備えたWSI-SAM, Segment Anything Model (SAM) を提案する。
トレーニングオーバーヘッドを最小化しながら、事前学習した知識を完全に活用するために、SAMは凍結し、最小限の追加パラメータと計算を導入します。
本モデルでは, 膵管癌 in situ (DCIS) セグメンテーションタスクと乳癌転移セグメンテーションタスクにおいて, SAMを4.1, 2.5パーセント上回った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:30:43 GMT)
Efficient Combinatorial Optimization via Heat Diffusion [8.1] 組合せ最適化問題は広く存在するが、本質的には離散的な性質のため困難である。
我々は,熱拡散を通じて解法に情報を積極的に伝播させることに重点を置いている。
私たちは、最も困難で広く認識されている最適化の範囲で優れたパフォーマンスを示します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:40:51 GMT)
Taming Cross-Domain Representation Variance in Federated Prototype Learning with Heterogeneous Data Domains [8.0] フェデレートラーニング(FL)は、プライベートデータを共有することなく、協調的な機械学習トレーニングを可能にする。
ほとんどのFLメソッドは、クライアント間で同じデータドメインを前提としていますが、現実のシナリオは、しばしば異種データドメインを伴います。
分散を意識した2段階のプロトタイプをクラスタリングし,新たな$alpha$-sparsityのプロトタイプロスを利用するFedPLVMを紹介した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:36:16 GMT)
Unsupervised Modality-Transferable Video Highlight Detection with Representation Activation Sequence Learning [7.9] 教師なしハイライト検出のためのクロスモーダル認識を用いた新しいモデルを提案する。
提案モデルでは,自己再構成タスクを通じて,画像と音声のペアデータから視覚レベルのセマンティクスを用いて表現を学習する。
実験結果から,提案手法は,他の最先端手法と比較して優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:52:03 GMT)
Robust agents learn causal world models [7.8] データ生成過程の因果関係を近似的に学習したと考えられる。
転帰学習や因果推論など,いくつかの研究領域において,この結果がもたらす意味について論じる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:30:42 GMT)
Adaptive Hybrid Masking Strategy for Privacy-Preserving Face Recognition Against Model Inversion Attack [7.8] 本稿では,モデル反転攻撃(MIA)に対する適応型ハイブリッドマスキングアルゴリズムを提案する。
具体的には、適応型MixUp戦略を用いて、周波数領域に顔画像が隠蔽される。
提案手法は,MIAに対するプライバシ保護と認識精度において,既存の防御アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:17:57 GMT)
K-pop Lyric Translation: Dataset, Analysis, and Neural-Modelling [7.8] 約89%がK-popの歌詞から成り立っている。
このデータセットは、韓国語と英語の歌詞を並べて、セクションごとに並べる。
ニューラル・リリック翻訳モデルを構築し,歌唱用リリック翻訳のための専用データセットの重要性を強調する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:36:17 GMT)
Variational Inference with Sequential Sample-Average Approximations [7.8] 逐次サンプル平均近似(VISA)を用いた変分推論を提案する。
VISAは、サンプル平均近似を用いて、重要重み付きフォワード-KL変量推論を拡張する。
我々は,VISAが標準重み付きフォワードKL変分推定に匹敵する近似精度を達成できることを実証した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:20:22 GMT)
Should we be going MAD? A Look at Multi-Agent Debate Strategies for LLMs [7.7] コスト、時間、正確性の間のトレードオフを探るため、さまざまな議論と戦略をベンチマークします。
マルチエージェントの議論システムは、現在の形式では、他の提案されたプロンプト戦略を確実に上回っているわけではない。
これらの結果に基づいて、エージェント合意レベルの調整など、議論戦略の改善に関する洞察を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:56:50 GMT)
Self-Supervised Learning for Time Series: Contrastive or Generative? [7.7] 自己教師付き学習(SSL)は、大規模未ラベルデータから表現を学習するための強力なアプローチとして登場した。
時系列におけるコントラスト的手法と生成的手法の総合的な比較研究について述べる。
この結果は,それぞれのアプローチの長所と短所に関する洞察を与え,適切なSSLメソッドを選択するための実践的な勧告を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:58:06 GMT)
XATU: A Fine-grained Instruction-based Benchmark for Explainable Text Updates [7.7] 本稿では,微粒な命令ベースの説明可能なテキスト編集用に設計された最初のベンチマークであるXATUを紹介する。
XATUは、語彙、構文、意味論、知識集約的な編集といった難易度の細かいテキスト編集タスクについて検討している。
各種編集タスクにおける命令チューニングの有効性と基礎となるアーキテクチャの影響を実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:23:14 GMT)
NN-Defined Modulator: Reconfigurable and Portable Software Modulator on IoT Gateways [7.7] 本稿では,IoTゲートウェイデバイスにおける物理層変調器の抽象化レイヤとしてニューラルネットワークを用いる新たなパラダイムを提案する。
提案したNN-Defined modulatorは、固体数学的基礎に根ざしたモデル駆動の方法論を用いている。
我々は,Nvidia Jetson NanoやRaspberry Piなど,さまざまなプラットフォーム上でNN定義変調器の評価を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:42:23 GMT)
Customizing Segmentation Foundation Model via Prompt Learning for Instance Segmentation [7.6] Segment Anything Model (SAM)は、画像セグメンテーションタスクの一般化性と柔軟性の顕著な進歩で際立っている。
そこで本研究では,SAMに適応した即時学習によるインスタンスセグメンテーションをカスタマイズする手法を提案する。
提案手法は,ユーザ意図に合うように入力プロンプトを埋め込み空間に調整するプロンプト学習モジュール (PLM) を備える。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:13:51 GMT)
Analyzing Data Augmentation for Medical Images: A Case Study in Ultrasound Images [7.5] 超音波画像における乳腺病変の分類における異なる拡張法の有効性について検討した。
特定の拡張が他のものよりもはるかに効果的であることを示し、それらの使用が大幅なパフォーマンス向上につながっていることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:33:57 GMT)
Distribution and Depth-Aware Transformers for 3D Human Mesh Recovery [7.3] 本稿では,エンド・ツー・エンド・エンドのトランスフォーマーアーキテクチャであるD2A-HMRを導入する。
提案手法は,特定のシナリオにおけるOODデータ処理における優れた性能を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:07:58 GMT)
FastSAM3D: An Efficient Segment Anything Model for 3D Volumetric Medical Images [7.3] NVIDIA A100 GPU上の128*128*128の3Dボリューム画像に対して,SAM推論を8ミリ秒に高速化するFastSAM3Dを提案する。
FastSAM3Dは2D SAMと8.75倍の527.38倍で、同じボリュームの3D SAMは性能が著しく低下しない。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:29:44 GMT)
InfoCon: Concept Discovery with Generative and Discriminative Informativeness [7.2] 我々は、様々なロボットタスクに適応し、再組み立て可能な操作概念の自己監督的な発見に焦点を当てる。
我々は、操作の概念を生成的かつ差別的な目標としてモデル化し、それらを意味のあるサブトラジェクトリに自律的にリンクできるメトリクスを導出する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:14:04 GMT)
On the Laplace Approximation as Model Selection Criterion for Gaussian Processes [7.0] ラプラス近似に基づく複数の指標を導入する。
実験により、我々のメトリクスはゴールド標準の動的ネストサンプリングに匹敵する品質を示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:28:28 GMT)
Minimax Optimal and Computationally Efficient Algorithms for Distributionally Robust Offline Reinforcement Learning [7.0] 分散ロバストなオフライン強化学習(RL)は、力学の不確実性をモデル化することによって環境摂動に対する堅牢な政策訓練を求める。
関数近似を実現するために,最小限の最適化と計算効率のアルゴリズムを提案する。
その結果、ロバストなオフラインRLの関数近似は、標準のオフラインRLと本質的に異なり、おそらくは難しいことが判明した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:55:10 GMT)
To Label or Not to Label: Hybrid Active Learning for Neural Machine Translation [6.8] アクティブラーニング(AL)技術は、アノテーションのためのラベルなしデータから、より小さな代表サブセットを選択することで、ニューラルネットワーク翻訳(NMT)モデルのラベリングコストを低減する。
文選択のための不確実性と多様性を組み合わせたNMTにおけるドメイン適応のためのハイブリッドAL戦略であるHUDSを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:33:28 GMT)
Transformers Get Stable: An End-to-End Signal Propagation Theory for Language Models [6.8] 本研究では, 変換器モデルを用いて, 前方信号のモーメントと後方信号のモーメントを制御できる統一信号伝搬理論を開発し, 公式を提供する。
我々のフレームワークは、ハイアテンションスコアに関連する、消失/爆発の勾配、ランク崩壊、不安定性を理解し、緩和するために使用することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:14 GMT)
Learning to Detect Slip through Tactile Estimation of the Contact Force Field and its Entropy [6.8] 本研究では,スリップ検出をリアルタイムで連続的に行う物理インフォームド・データ駆動方式を提案する。
我々は、光学式触覚センサーであるGelSight Miniを、カスタムデザインのグリップに装着して、触覚データを収集する。
その結果,最高の分類アルゴリズムは95.61%の精度が得られることがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:04:33 GMT)
X-CANIDS: Signal-Aware Explainable Intrusion Detection System for Controller Area Network-Based In-Vehicle Network [6.7] X-CANIDSは、CANデータベースを使用して、CANメッセージのペイロードを人間の理解可能な信号に分解する。
X-CANIDSはトレーニングフェーズにラベル付きデータセットを必要としないため、ゼロデイ攻撃を検出することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:14:24 GMT)
Diffusion-TS: Interpretable Diffusion for General Time Series Generation [6.6] Diffusion-TSは、高品質な時系列サンプルを生成する新しい拡散ベースのフレームワークである。
各拡散ステップのノイズの代わりにサンプルを直接再構成するようにモデルを訓練し、フーリエに基づく損失項を組み合わせた。
その結果,Diffusion-TSは時系列の様々な現実的解析において最先端の結果が得られることがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:35:34 GMT)
Dyadic Interaction Modeling for Social Behavior Generation [6.6] 本稿では,ダイアディックインタラクションにおける3次元顔の動きを効果的に生成するための枠組みを提案する。
既存の作業では、リスナーは話者の声や顔の動きに対する反射的な振る舞いを持つ反応剤であると考えられている。
我々のフレームワークの核心はDyadic Interaction Modeling (DIM)であり、これは話者の動作とリスナーの動きを共同でモデル化する事前学習のアプローチである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:21:33 GMT)
Predicting Generalization of AI Colonoscopy Models to Unseen Data [6.6] 見えないデータ中の現象を識別する「マスケシームズネットワーク」(MSN)。
MSNはラベルなしでポリプ画像のマスキング領域を予測する訓練を行った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:41:00 GMT)
Within-basket Recommendation via Neural Pattern Associator [6.5] in-basket Recommation(WBR)は、空でないショッピングバスケットを完了するまでアイテムを推薦するタスクである。
本稿では,ユーザの意図を明示的にモデル化したディープアイテム・アソシエーション・マイニング・モデルであるNeural Pattern Associator (NPA)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:08:34 GMT)
The statistical thermodynamics of generative diffusion models: Phase transitions, symmetry breaking and critical instability [6.4] 生成拡散モデルが対称性破壊現象に対応する2次相転移を行うことを示す。
相転移から生じる臨界不安定性は、その生成能力の中心にあると我々は主張する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:51:56 GMT)
Are you a robot? Detecting Autonomous Vehicles from Behavior Analysis [6.4] 本稿では,車両が自律的かどうかを判断するために,カメラ画像と状態情報を用いてアクティブな車両を監視するフレームワークを提案する。
基本的には、自動運転車を識別するための機械学習モデルを提供する道路上で取得したデータをシェアする車両間の協力に基づいて構築される。
実験により,ビデオクリップを80%の精度で解析することにより,2つの行動の識別が可能であることが確認された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:00:29 GMT)
Standing on FURM ground -- A framework for evaluating Fair, Useful, and Reliable AI Models in healthcare systems [6.3] Stanford Health Careは、公正で有用で信頼性の高いAIモデルを特定するための、テストと評価のメカニズムを開発した。
評価プロセスを説明し、6つのアセスメントを要約し、同様のアセスメントを行うためのフレームワークを共有します。
我々の新しい貢献 - シミュレーションによる有用性推定、持続可能性の定量化のための財務予測、倫理的評価を行うプロセス - は、他の医療システムにおいて、候補AIソリューションの実用的な評価を行うことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:37:53 GMT)
Differentiable and accelerated wavelet transforms on the sphere and ball [6.2] 方向性ウェーブレット辞書は、スケール、位置、方向をまたいだ情報を効率的にキャプチャし、セグメント化する。
多くの物理的に重要な信号は、宇宙論における天空のような球面領域上で観測される。
我々は, 2 次元球面 $mathbbS2$ および 3 次元球面 $mathbbB3 上に, 分散性が高く, 自動微分可能な方向ウェーブレット変換を新たに設計する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:08:36 GMT)
Analyzing and Mitigating (with LLMs) the Security Misconfigurations of Helm Charts from Artifact Hub [6.2] Helmは(K8s)アプリケーションの定義、インストール、アップグレードを可能にするパッケージマネージャである。
Helmチャートは、K8sクラスタ内にアプリケーションをデプロイするために必要なすべての依存関係、リソース、パラメータを記述するファイルの集合である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:26:40 GMT)
Comparing Rationality Between Large Language Models and Humans: Insights and Open Questions [6.2] 本稿では,大規模言語モデル(LLM)の急成長に焦点をあてる。
我々は,LLMの合理性と意思決定能力の増強において,人間フィードバックからの強化学習(RLHF)が果たす重要な役割を強調した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:36:04 GMT)
Graph-Based DDoS Attack Detection in IoT Systems with Lossy Network [6.1] 本研究では,モノのインターネット(IoT)システムにおけるDDoS(Distributed Denial of Service)攻撃を検出するための堅牢なソリューションを提案する。
グラフ構造内のノードとしてIoTデバイスを概念化することにより、損失のあるネットワーク環境でも効率的に動作可能な検出機構を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:00:42 GMT)
Soften to Defend: Towards Adversarial Robustness via Self-Guided Label Refinement [5.9] 敵対的訓練(AT)は、敵対的攻撃に対するディープニューラルネットワークの堅牢性を得る最も効果的な方法の1つである。
AT法は頑健なオーバーフィッティング、すなわちトレーニング曲線とテスト曲線の間の大きな一般化ギャップに悩まされている。
本稿では,AT のラベルリファインメント手法を提案する。この手法は,高信頼のハードラベルから,より正確かつ情報的なラベル分布を自己定義する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:48:31 GMT)
Uncertainty Quantification for cross-subject Motor Imagery classification [5.6] 不確実性定量化は、機械学習モデルがいつ間違っているかを決定することを目的としている。
ディープアンサンブルは、分類性能とクロスオブジェクト不確かさ定量化性能の両方において、最高の性能を示した。
ソフトマックス出力の標準CNNは、より先進的な手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:48:48 GMT)
Transferring BCI models from calibration to control: Observing shifts in EEG features [5.6] パブリックモーターイメージベースの脳コンピュータインタフェース(BCI)データセットは、より優れた分類器の開発に使用されている。
ユーザがそのようなBCIでコントロールタスクを実行しようとすると、EEGパターンにどのような変化が起こるかは、しばしば不明である。
標準校正セッションとEMGに基づく新しいBCI制御セッションを含む新しいパラダイムを実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:49:00 GMT)
SINDy-RL: Interpretable and Efficient Model-Based Reinforcement Learning [5.6] SINDy-RLは,SINDyと深層強化学習を組み合わせたフレームワークである。
SINDy-RLは最先端のDRLアルゴリズムに匹敵する性能を達成する。
我々は,ベンチマーク制御環境と流体問題に対するアプローチの有効性を実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:17:39 GMT)
Robust Subgraph Learning by Monitoring Early Training Representations [5.5] グラフニューラルネットワーク(GNN)は、グラフ学習やノード分類タスクにおける卓越したパフォーマンスに対して、大きな注目を集めている。
敵攻撃、特に感受性のあるノードによる攻撃に対する脆弱性は、意思決定において課題となる。
本稿では,SHERD(Subgraph Learning Hale through Early Training Representation Distances)を導入し,グラフ入力の性能と対角的堅牢性に対処する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:25:37 GMT)
REPQC: Reverse Engineering and Backdooring Hardware Accelerators for Post-quantum Cryptography [5.5] PQCハードウェアアクセラレータは、チップサプライチェーンにある2つの異なる敵によってバックドア化可能であることを示す。
本稿では,ハッシュ操作を確実に識別できる高度なリバースエンジニアリングアルゴリズムREPQCを提案する。
敵は悪質な論理をステルスなハードウェアトロイの木馬(HTH)の形で挿入する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:57:59 GMT)
Estimating the history of a random recursive tree [5.4] ヨルダン中心度尺度に基づく順序推定器を提案する。
提案した推定器が次数ベースおよびスペクトル順序付け法より優れていることを数値的に示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:02:00 GMT)
StainFuser: Controlling Diffusion for Faster Neural Style Transfer in Multi-Gigapixel Histology Images [5.4] 静止正規化アルゴリズムは、ソースマルチギガピクセルの組織像の色と強度特性を、対象画像と一致するように変換することを目的としている。
本稿では,新しい条件付き潜在拡散アーキテクチャを用いて,この問題をスタイル伝達タスクとして扱う新しいアプローチであるStainFuserを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:49:43 GMT)
MCFEND: A Multi-source Benchmark Dataset for Chinese Fake News Detection [5.3] 純粋に1つのニュースソースで訓練された方法は、現実のシナリオにはほとんど適用できない。
MCFENDと呼ばれる中国の偽ニュース検出のための、最初のマルチソースベンチマークデータセットを構築した。
MCFENDは、ベンチマークデータセットとして、中国の偽ニュース検出アプローチを現実世界のシナリオで前進させることを目的としている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:32:13 GMT)
Video Face Re-Aging: Toward Temporally Consistent Face Re-Aging [5.3] ビデオの顔のリエイジは、人の見かけの年齢をビデオのターゲット年齢に変更する。
ほとんどの再老化手法は、ビデオの時間的一貫性を考慮せずに、個々の画像を個別に処理する。
多様な年齢層にまたがって対象を特徴付ける新しい合成ビデオデータセットを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:13:55 GMT)
Deep Learning Technique for Human Parsing: A Survey and Outlook [5.2] 本調査では,1人のパース,複数人のパース,ビデオ人間のパースという3つのサブタスクを総合的にレビューする。
我々はトランスフォーマーに基づくヒューマンパーシングフレームワークを提案し、フォローアップ研究のための高性能なベースラインを提供する。
この分野では未検討のオープンな課題の集合を指摘し、今後の研究に向けた新たな方向性を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:00:19 GMT)
Hyper-CL: Conditioning Sentence Representations with Hypernetworks [5.2] 我々は、ハイパーネットワークとコントラスト学習を統合し、条件付き文表現を計算する効率的な手法であるHyper-CLを紹介する。
提案手法では,計算済み条件埋め込みを対応する射影層に変換する。
条件付きセマンティックテキスト類似性と知識グラフ補完という2つの代表的な条件付けベンチマークの評価は,Hyper-CLが文表現の柔軟条件付けに有効であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:30:25 GMT)
Consistent Prompting for Rehearsal-Free Continual Learning [5.2] 継続的な学習は、古い知識を忘れずに、モデルが絶えず変化する環境やデータストリームに自律的に適応することを可能にする。
既存のプロンプトベースの手法は、トレーニングとテストの間に不整合であり、その効果を制限している。
より整合性のあるトレーニングとテストのための新しいプロンプトベースの手法であるConsistent Prompting(CPrompt)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:26:17 GMT)
"Like a Nesting Doll": Analyzing Recursion Analogies Generated by CS Students using Large Language Models [5.2] 優れたアナロジーは、馴染みのない概念と慣れ親しんだ概念のギャップを埋めることができ、理解を助ける魅力的な方法を提供する。
大規模言語モデル(LLM)、特にChatGPTが、需要に応じた個人関連アナロジーにどの程度アクセスできるかを検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:01:26 GMT)
EucliDreamer: Fast and High-Quality Texturing for 3D Models with Stable Diffusion Depth [5.2] テキストプロンプトと3Dメッシュが与えられた3次元モデルのテクスチャを生成する新しい手法を提案する。
追加の深度情報を考慮し、スコア蒸留サンプリング(SDS)プロセスを実行する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:23:59 GMT)
FakeWatch: A Framework for Detecting Fake News to Ensure Credible Elections [5.2] フェイクニュースを検出するために慎重に設計された包括的フレームワークであるFakeWatchを紹介する。
我々のフレームワークは、従来の機械学習(ML)技術と最先端言語モデル(LM)の両方からなるモデルハブを統合している。
我々の包括的な目的は、誤情報を特定するのに十分な適応的で正確な分類モデルを提供することである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:39:26 GMT)
Optimal transport distances for directed, weighted graphs: a case study with cell-cell communication networks [5.1] 最適輸送の変種に基づく有向グラフを比較するための2つの距離測度を提案する。
これら2つの距離を評価し、シミュレーショングラフデータと実世界指向セル通信グラフの両方に対して、それらの相対的性能について考察する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:23:57 GMT)
SHAN: Object-Level Privacy Detection via Inference on Scene Heterogeneous Graph [5.1] プライバシオブジェクト検出は、画像内のプライベートオブジェクトを正確に見つけることを目的としている。
既存の手法は、精度、一般化、解釈可能性の重大な欠陥に悩まされている。
本稿では、画像からシーン異質グラフを構成するモデルであるSHAN(Scene Heterogeneous Graph Attention Network)を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:32:14 GMT)
Dial-insight: Fine-tuning Large Language Models with High-Quality Domain-Specific Data Preventing Capability Collapse [5.0] 高品質なデータを得るために設計された生産プロンプトを構築するための2段階のアプローチを提案する。
この方法は、幅広いタスクを包含し、多種多様な表現を示す多様なプロンプトの生成を含む。
生成したラベルデータの整合性を確保するため,コスト効率,多次元品質評価フレームワークを導入する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:27:32 GMT)
Impact of Synthetic Images on Morphing Attack Detection Using a Siamese Network [4.9] 本稿では,セミハードロス機能を有するシームズネットワークを用いて,合成画像がモーフィング攻撃検出(MAD)に与える影響を評価した。
この結果から, FERET, FRGCv2, FRLL からEfficientNetB0 をトレーニングしたMAD は SOTA と比較して誤差が低いことがわかった。
混合アプローチ(合成+デジタル)データベースは、MADを改善し、エラー率を低減するのに役立つかもしれない。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:31:56 GMT)
BRIEDGE: EEG-Adaptive Edge AI for Multi-Brain to Multi-Robot Interaction [4.8] BRIEDGEは、EEG適応型ニューラルネットワークと符号化復号通信フレームワークを通じて、マルチ脳からマルチロボットインタラクションのためのエンドツーエンドシステムである。
符号化復号通信フレームワークは、EEGベースのセマンティック情報をエンコードし、データ転送の過程でコマンドに復号する。
実験の結果,BRIEDGEは異種脳波データの最適分類精度と,雑音環境下でのより安定した性能を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:43:48 GMT)
XCoOp: Explainable Prompt Learning for Computer-Aided Diagnosis via Concept-guided Context Optimization [4.6] 本稿では,画像,学習可能なプロンプト,臨床概念に基づくプロンプトのセマンティクスを整合させることにより,医療知識を活用する新しい説明可能なプロンプト学習フレームワークを提案する。
我々のフレームワークは、大きな言語モデルから知識を引き出すことによって、価値ある概念アノテーションの欠如に対処する。
提案手法は,XAIにおける基礎モデルの有効性に光を当て,優れた診断性能,柔軟性,解釈可能性を実現する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:02:01 GMT)
SNAP: Semantic Stories for Next Activity Prediction [4.6] 進行中のプロセスにおける次のアクティビティを予測することは、ビジネスプロセス管理ドメインにおける最も一般的な分類タスクの1つです。
ビジネスプロセス予測のための現在の最先端AIモデルは、プロセスイベントログ内で利用可能なセマンティック情報を十分に活用していない。
本稿では,プロセス履歴イベントログから意味的文脈的ストーリを構築することで,言語基盤モデルを活用する新しいSNAP手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:22:37 GMT)
Robust gates with spin-locked superconducting qubits [4.6] 本稿では、スピンロックと呼ばれる動的疎結合の連続的なバージョンと、トランスモンのためのカプラベースのCZゲートを組み込んだ理論的提案を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:16:16 GMT)
BeLLM: Backward Dependency Enhanced Large Language Model for Sentence Embeddings [4.5] 後方依存性強化大言語モデル(BeLLM)を提案する。
特定の注意層を一方向から双方向に変換することで文の埋め込みを学習する。
自動回帰 LLM は文埋め込みの後方依存性の恩恵を受ける。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:04:17 GMT)
Scaling Behavior of Machine Translation with Large Language Models under Prompt Injection Attacks [4.5] 大規模言語モデル(LLM)は多くの自然言語処理タスクにおいて好まれる基盤プラットフォームになりつつある。
彼らの汎用性は、要求命令に埋め込み、モデルが無許可でおそらく安全でない方法で振る舞うエンドユーザによって、それらをサブバージョンに開放する。
本研究では,これらのプロンプトインジェクション・アタック(PIA)をLLMの複数のファミリーで機械翻訳タスクに適用し,モデルサイズが攻撃成功率に与える影響に着目した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:39:10 GMT)
Mitigating Data Consistency Induced Discrepancy in Cascaded Diffusion Models for Sparse-view CT Reconstruction [4.2] 本研究は, 離散性緩和フレームワークを用いた新規なカスケード拡散について紹介する。
潜在空間の低画質画像生成と画素空間の高画質画像生成を含む。
これは、いくつかの推論ステップをピクセル空間から潜在空間に移すことによって計算コストを最小化する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:58:28 GMT)
Surrogate Assisted Monte Carlo Tree Search in Combinatorial Optimization [4.2] 我々は,モンテカルロ木探索(MCTS)をサロゲートモデルで支援し,評価を高速化する。
その結果,高速サロゲート関数がサポートするMCTSは,一貫した解を維持しながら解を高速に生成できることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:54:19 GMT)
Quantum emitters in van der Waals α-MoO3 [4.2] ファンデルワールス物質からの単光子放出は遷移金属ジバルコゲナイドと六方晶窒化ホウ素で報告されている。
本稿では,ファンデルワールスα-MoO3の剥離および熱処理による単結晶からの単一光子生成の観察を報告する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:46:29 GMT)
Gun Culture in Fringe Social Media [4.1] 我々は4chanの武器盤/k/で銃文化を探求する。
様々な定量的手法を用いて,/k/上の4M以上のポストについて検討した。
以上の結果から, /k/ のガンカルチャーは比較的多種多様なトピックをカバーすることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:22:01 GMT)
Understanding the limitations of self-supervised learning for tabular anomaly detection [4.1] 自己教師付き学習は、コンピュータビジョンと自然言語処理における異常検出を改善した。
これは、ニューラルネットワークが無関係な特徴を導入し、異常検出の有効性を低下させることによるものである。
ニューラルネットワークの表現のサブスペースを使用することで、性能を回復できることを実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:15:38 GMT)
Virtual birefringence imaging and histological staining of amyloid deposits in label-free tissue using autofluorescence microscopy and deep learning [4.1] コンゴ赤染色(コンゴ赤し、英: Congo red stain)は、組織におけるアミロイド鉱床の可視化のための金標準化学染色である。
単一のトレーニングされたニューラルネットワークは、ラベルのない組織セクションの自己蛍光画像を、明視野および偏光顕微鏡等価画像に変換することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:48:06 GMT)
Uncertainty estimation in spatial interpolation of satellite precipitation with ensemble learning [3.9] 本研究では,9つの量子化に基づくアンサンブル学習装置を導入し,大規模な降水データセットに適用する。
私たちのアンサンブル学習者は6つの積み重ねと3つの簡単な方法(平均、中央値、最良の組み合わせ)を含む。
QRとQRNNで積み重ねると、量子レベルの関心事で最高の結果が得られる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:45:56 GMT)
StarMalloc: A Formally Verified, Concurrent, Performant, and Security-Oriented Memory Allocator [3.8] 本稿では,より効率的な検証を可能にするために,依存型とモジュール抽象に依存したStarMallocの特定と検証方法を示す。
StarMallocはFirefoxブラウザを含む現実世界のプロジェクトで使用でき、10の最先端メモリアロケータに対して評価することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:29:01 GMT)
Leveraging the Crowd for Dependency Management: An Empirical Study on the Dependabot Compatibility Score [3.7] クライアントパッケージが依存性の更新を受ける際のリスクを評価するのに役立つように、互換性スコアの有効性について検討する。
群衆からのデータ不足のため,依存関係更新の83%については,互換性スコアを計算できないことがわかった。
本稿では,群衆からのインプットを増幅する指標を提案し,それらの指標がクライアントパッケージによる更新成功の受け入れを予測できることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:26:19 GMT)
Analysis of singular subspaces under random perturbations [3.7] 我々はWedin-Davis-Kahan定理を完全に一般化した方法で拡張し、任意のユニタリ不変行列ノルムに適用する。
本稿では,ガウス混合モデルとサブマトリクス局所化問題の文脈において,これらの知見の実用的意義について考察する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:30:25 GMT)
Empowering Healthcare through Privacy-Preserving MRI Analysis [3.6] 本稿では,Ensemble-Based Federated Learning (EBFL)フレームワークを紹介する。
EBFLフレームワークは、機密性の高い患者データを共有することよりも、モデルの特徴を強調することによって、従来のアプローチから逸脱する。
グリオーマ,髄膜腫,下垂体,非腫瘍例などの脳腫瘍の分類において,有意な精度が得られた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:51:18 GMT)
Absence of barren plateaus in finite local-depth circuits with long-range entanglement [3.6] 浅いパラメータ化回路は、短距離の絡み合った状態を得るために効果的に訓練することができる。
深い回路は、バレンプラトー現象のために一般には訓練不可能である。
有限局所深度回路のトレーニングにおいてバレンプラトーが欠如していることを証明する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:07:39 GMT)
German also Hallucinates! Inconsistency Detection in News Summaries with the Absinth Dataset [3.5] この研究は、ドイツのニュース要約における幻覚検出のための手動注釈付きデータセットであるabsinthを提示する。
我々は,ドイツ語における幻覚検出のさらなる研究を促進するために,アブシンスデータセットをオープンソース化し,公開する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:30:54 GMT)
Double Descent and Overfitting under Noisy Inputs and Distribution Shift for Linear Denoisers [3.5] 教師付き denoising を研究する上での懸念は,テスト分布からのノイズレストレーニングデータが常に存在するとは限らないことだ。
そこで本研究では,分散シフト下での教師付きノイズ除去とノイズインプット回帰について検討した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:02:53 GMT)
SAM-Lightening: A Lightweight Segment Anything Model with Dilated Flash Attention to Achieve 30 times Acceleration [3.4] Segment Anything Model (SAM)は、ゼロショットの一般化能力のためにセグメンテーションタスクに大きな注目を集めている。
我々はSAMの亜種であるSAM-Lighteningを紹介し、Dilated Flash Attentionと呼ばれる再設計されたアテンション機構を特徴としている。
COCOとLVISの実験により、SAM-Lighteningは実行時の効率とセグメンテーション精度の両方において最先端の手法よりも大幅に優れていることが明らかになった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:07:34 GMT)
Adversarial Fine-tuning of Compressed Neural Networks for Joint Improvement of Robustness and Efficiency [3.3] アドリラルトレーニングは、より堅牢なモデルをもたらすことができる緩和戦略として提示されている。
本稿では,2つの異なるモデル圧縮手法(構造的重み打ち法と量子化法)が対向ロバスト性に及ぼす影響について検討する。
本研究では, 圧縮モデルの逆方向微調整により, 対向訓練モデルに匹敵する強靭性性能が得られることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:34:25 GMT)
Cooling-Guide Diffusion Model for Battery Cell Arrangement [3.3] 本研究では,冷却誘導拡散モデルを用いて電池セルのレイアウトを最適化する生成AI手法を提案する。
反復的な最適化と広範囲な推測に大きく依存する従来の設計プロセスは、遅くて非効率であることが知られている。
本研究は, 電池セルレイアウトを最適化し, 冷却効率を向上することを目的として, この分野において飛躍的な進歩を遂げた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:51:51 GMT)
Machine learning for structural design models of continuous beam systems via influence zones [3.3] この研究は、逆問題の観点から連続ビームシステムのための機械学習構造設計モデルを開発する。
本研究の目的は,任意のシステムサイズを持つ連続ビームシステムの断面積要求を予測できる非定常構造設計モデルを概念化することである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:53:18 GMT)
What Was Your Prompt? A Remote Keylogging Attack on AI Assistants [3.3] 私たちは、Web上でAIアシスタントから暗号化されたレスポンスを読むのに使用できる、新しいサイドチャネルを公開します。
私たちはOpenAIやMicrosoftを含む多くのベンダーがこのサイドチャネルを持っていることに気づきました。
大規模言語モデルのパワーを活用してこれを克服する方法を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:38:12 GMT)
Improving Real-Time Omnidirectional 3D Multi-Person Human Pose Estimation with People Matching and Unsupervised 2D-3D Lifting [3.2] 現在の人間のポーズ推定システムは、一人の人の正確な3次元世界的推定を取得することに焦点を当てている。
本稿では,リアルタイムに動作可能な最初の3次元人体ポーズ推定システムについて述べる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:30:31 GMT)
Parametric tuning of dynamical phase transitions in ultracold reactions [3.2] 生成分子間の汎用相互作用の存在は、臨界点の性質を根本的に変えることができることを示す。
この相互作用によって引き起こされる相関関係は、非自明な多体物理学を誘導する。
我々はこれらの多体効果の解析的および数値的な説明と、断熱的および非断熱的な状態における反応収率のスケーリング法則を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:24:32 GMT)
A Reinforcement Learning Approach to Dairy Farm Battery Management using Q Learning [3.1] 本研究は, 乳園における電池充電と排出をスケジューリングするQラーニングに基づくアルゴリズムを提案する。
提案アルゴリズムは, 送電網からの電力輸入コストを13.41%削減し, ピーク需要を2%削減し, 24.49%削減する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:42:26 GMT)
RoDUS: Robust Decomposition of Static and Dynamic Elements in Urban Scenes [3.1] 都市景観における静的要素と動的要素を分解するパイプラインであるRoDUSについて,移動成分と非移動成分を念頭に分離したNeRFモデルを提案する。
この戦略により、シーン内のダイナミックスを正確にキャプチャし、背景再構成におけるNeRFによるアーティファクトの低減を実現することができる。
特に,KITTI-360およびPandasetデータセットを用いた実験により,挑戦的な都市景観を正確に静的かつ動的成分に分解する手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:08:59 GMT)
Leveraging Foundation Model Automatic Data Augmentation Strategies and Skeletal Points for Hands Action Recognition in Industrial Assembly Lines [3.1] 我々は,効率的な,高品質で,大規模なデータセット拡張を実現するために,産業用データセットを拡張する戦略を開発した。
また,この戦略を映像行動認識にも適用した。
実際の組立ラインの「ワイヤ挿入時の手の動き」シナリオでは、手動作認識の精度は98.8%に達した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:55:06 GMT)
Zero-Shot Object Goal Visual Navigation With Class-Independent Relationship Network [3.1] ゼロショット(Zero-shot)とは、エージェントが探すべきターゲットがトレーニングフェーズ中にトレーニングされないことを意味する。
本研究では,学習中の目標特徴とナビゲーション能力の結合の問題に対処するために,クラス独立関係ネットワーク(CIRN)を提案する。
本手法は、ゼロショット目標視覚ナビゲーションタスクにおける最先端のアプローチよりも優れている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:40:15 GMT)
A Conversational Brain-Artificial Intelligence Interface [3.0] 脳知能インタフェース(BAI)を脳コンピュータインタフェース(BCI)の新しいクラスとして導入する。
BAIは人工知能の力を活用して、神経認知処理パイプラインの一部を置き換える。
本研究では,対話型BAIが言語を生成することなく,複雑なコミュニケーションを実現するための電話会話のシミュレーション実験を行った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:52:30 GMT)
Reconstructing Blood Flow in Data-Poor Regimes: A Vasculature Network Kernel for Gaussian Process Regression [3.0] 非ユークリッド空間である血管ネットワーク内のカーネルを再構築する新しい手法を提案する。
提案したカーネルは、時間的および血管間相関を符号化し、直接測定を欠いた血管における血流の再構築を可能にする。
本研究は, 単純Y字型分岐術, 腹部大動脈, ウィリス円の3症例において, モデルの性能を実証するものである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:41:15 GMT)
Counter-Samples: A Stateless Strategy to Neutralize Black Box Adversarial Attacks [3.0] 本稿では,ブラックボックス攻撃に対する新たな防御法を提案する。
入力サンプルの衛生化に依存する従来の前処理防御とは異なり、我々の戦略は攻撃プロセス自体に対処する。
我々のアプローチは最先端のブラックボックス攻撃に対して極めて効果的であり、CIFAR-10とImageNetデータセットの双方で既存の防御性能を上回っていることを実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:59:54 GMT)
On the Diminishing Returns of Width for Continual Learning [2.9] フィードフォワードネットワーク(FFN)において、幅が直接記憶に関連があることを証明するために連続学習理論を解析する。
具体的には, ネットワーク幅の増大と, ネットワーク幅の増大が収率の低下を実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:57:43 GMT)
Cloud gap-filling with deep learning for improved grassland monitoring [2.9] 農耕地変化のタイムリーなモニタリングには,未断の光学画像シリーズが不可欠である。
本研究では,クラウドフリー光(Sentinel-2)観測と気象非依存(Sentinel-1)合成開口レーダ(SAR)データを統合する深層学習手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:41:26 GMT)
Energy Disaggregation & Appliance Identification in a Smart Home: Transfer Learning enables Edge Computing [2.9] 非侵入負荷監視(NILM)またはエネルギー分散は、個々の家電機器の負荷プロファイルを抽出することを目的としている。
本研究は、NILM問題を解決するための新しいディープラーニングとエッジコンピューティングアプローチを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:50:35 GMT)
Deep-learning-assisted optical communication with discretized state space of structural light [2.9] 本稿では,LGモード認識のための高度な深層学習手法を提案する。
LGモードの状態空間を識別することにより、ニューラルネットワークモデルをトレーニングして、与えられたサンプルを分類する。
我々の研究は、構造光に基づく高容量光通信のための新たな道を開く。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:03:09 GMT)
LLM-based agents for automating the enhancement of user story quality: An early report [2.9] 本研究では,オーストリアのポストグループITアジャイルチームにおけるユーザストーリの品質向上を目的とした,大規模な言語モデルの利用について検討する。
我々は,自律型LLMエージェントシステムの参照モデルを開発し,企業で実装した。
調査におけるユーザストーリの品質と,これらのエージェントによるユーザストーリの品質改善の有効性は,6つのアジャイルチームの11人の参加者によって評価された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:35:53 GMT)
Keyformer: KV Cache Reduction through Key Tokens Selection for Efficient Generative Inference [2.8] キーフォーマー」は、KVキャッシュサイズとメモリ帯域幅利用に関する課題を軽減する革新的な推論時アプローチである。
我々はKeyformerの性能を,GPT-J,Cerebras-GPT,MPTの3つの基礎モデルで評価した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:42:42 GMT)
SD-Net: Symmetric-Aware Keypoint Prediction and Domain Adaptation for 6D Pose Estimation In Bin-picking Scenarios [2.8] 対称認識型キーポイント予測と自己学習領域適応(SD-Net)を備えた新しい6次元ポーズ推定ネットワークを提案する。
キーポイント予測段階では,高度に隠蔽されたシーンにおいても,ロバストな3Dキーポイント選択戦略を設計し,3Dキーポイントを特定する。
ドメイン適応段階において,学生-教員養成方式を用いた自己学習フレームワークを提案する。
パブリックなSil'eaneデータセットでは、SD-Netは最先端の結果を達成し、平均精度は96%である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:08:44 GMT)
Constrained and Vanishing Expressivity of Quantum Fourier Models [2.8] 量子モデルのフーリエ係数と符号化ゲートとの新たな相関関係を示す。
また、特定の設定で表現性を消滅させる現象を示す。
これらの2つの挙動は、PQCの表現性を制限する新しい形式の制約を暗示する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:05:24 GMT)
Deep Limit Order Book Forecasting [2.8] 我々は、最先端の深層学習手法を利用して、高頻度リミットオーダーブックの中間価格変化の予測可能性を探る。
大規模なリミットオーダーブックデータを効率的に処理するオープンソースコードベースであるLOBFrame'をリリースする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:44:10 GMT)
T5APR: Empowering Automated Program Repair across Languages through Checkpoint Ensemble [2.7] 本稿では,T5APRを提案する。T5APRは,複数のプログラミング言語にまたがるバグ修正のための統一的なソリューションを提供するニューラルプログラム修復手法である。
T5APRは1,985のバグを正しく修正する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:29:25 GMT)
Field test of mode-pairing quantum key distribution [2.6] 我々は、既存の都市間ファイバーリンクにモードペアリング方式を採用し、数十kmから100kmの範囲でフィールドテストを実施している。
我々のシステムは、195.85$kmの対称リンクで1.217$kbit/s、グローバル位相ロックなしで127.92$kmの非対称リンクで3.089$kbit/sというキーレートを達成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:32:50 GMT)
Eta Inversion: Designing an Optimal Eta Function for Diffusion-based Real Image Editing [2.6] 実際の画像を編集するための一般的な戦略は、拡散過程を反転させて元の画像のノイズ表現を得る。
本稿では, DDIMサンプリング式における$eta$の役割を理論的に解析し, 編集性の向上を図った, 実画像編集のための新規かつ適応的な拡散インバージョン手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:07:36 GMT)
Assessing the Influence of Toxic and Gender Discriminatory Communication on Perceptible Diversity in OSS Projects [2.5] 近年,オープンソースソフトウェア(OSS)コミュニティにおける有毒・性同一性推論言語の存在が研究者の焦点となっている。
本研究は,オープンソースソフトウェア開発チームのジェンダー,民族性,在職多様性にどのような影響を及ぼすかを検討することを目的とする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:07:48 GMT)
Parafermions with symmetry-protected non-Abelian statistics [2.4] 我々はSPNA統計学の概念をパラフェミオンゼロモード(PZM)をホストする強相関系に拡張する。
我々はPZMを局所結合から保護する一般ユニタリ対称性機構を公表する。
PZMが本質的にSPNA統計に従うことを厳密に証明する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:44:22 GMT)
CodeUltraFeedback: An LLM-as-a-Judge Dataset for Aligning Large Language Models to Coding Preferences [2.4] CodeUltraFeedbackは1万の複雑な命令の選好データセットで、LLMをAIフィードバックによるコーディング選好に調整し、調整する。
以上の結果から,CoDAL-Bench上では,AIフィードバックからの強化学習によりCodeLlama-7B-Instructが34B LLMを上回った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:51:35 GMT)
On the Convergence of Locally Adaptive and Scalable Diffusion-Based Sampling Methods for Deep Bayesian Neural Network Posteriors [2.3] ベイズニューラルネットワークは、ディープニューラルネットワークにおける不確実性をモデル化するための有望なアプローチである。
ニューラルネットワークの 後部分布からサンプルを生成することは 大きな課題です
この方向の進歩の1つは、モンテカルロ・マルコフ連鎖サンプリングアルゴリズムへの適応的なステップサイズの導入である。
本稿では,これらの手法が,ステップサイズやバッチサイズが小さくても,サンプリングした分布にかなりの偏りがあることを実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:01:45 GMT)
Near Optimal Adversarial Attacks on Stochastic Bandits and Defenses with Smoothed Responses [2.3] 本論文では2つの結果について述べる。
私はUCBとThompson Samplingに対する攻撃戦略を設計し、$widehatO(sqrtlog T)$コストしか使っていません。
スムーズな分析と行動経済学に関する文献に触発されて、私は2つの単純なアルゴリズムを示し、任意の比を1に近く達成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:04:43 GMT)
Perspective-Equivariant Imaging: an Unsupervised Framework for Multispectral Pansharpening [2.3] 光カメラベースイメージングシステムにおける視点可変性を活用するフレームワークである視点同変イメージング(EI)を提案する。
これは、群変換のよりリッチな非線型類を含むように、以前の EI の作業を拡張する。
パースペクティブ-EIは、文献における他の教師なし手法よりも優れているマルチスペクトルパンシャーピングにおいて、最先端の結果を達成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:17:07 GMT)
DF4LCZ: A SAM-Empowered Data Fusion Framework for Scene-Level Local Climate Zone Classification [2.1] LCZ分類のための新しいDual-stream Fusionフレームワーク(DF4LCZ)を提案する。
このフレームワークには、Segment Anything Model (SAM) によって強化された Graph Convolutional Network (GCN) モジュールが含まれており、Googleイメージからの機能抽出を強化する。
提案するDF4LCZの有効性を検証するため,LCZ分類に特化して設計されたマルチソースリモートセンシング画像データセットを用いて実験を行った。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:15:46 GMT)
Verification of Bell Nonlocality by Violating Quantum Monogamy Relations [2.1] 既存の量子モノガミー関係は、ベルの不等式を同時に違反する可能性を排除している。
これらのモノガミー関係に違反することは、部分系のベル非局所性を動的に目撃できることを実証する。
我々は、最大エンタングルされた2光子状態を用いて三部体モノガミー関係を破り、量子非局所性を検証する三部体実験を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:26:32 GMT)
Demonstration of universal contextuality through communication games free of both operational inequivalence and compatibility loopholes [2.0] 3,3) と (4,3) のコミュニケーションゲームを通して, 普遍的文脈性を実験的に検証した。
以上の結果から,3,3シナリオにおいて,普遍的文脈性は準備的文脈性よりも一般的であることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:38:39 GMT)
Dynamic Memory Compression: Retrofitting LLMs for Accelerated Inference [2.0] 本稿では,動的メモリ圧縮(DMC)を提案する。
DMCトランスフォーマーにプリトレーニング済みの大規模言語モデル(LLM)を適合させ,NVIDIA H100 GPUで最大3.7倍のスループット向上を実現した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:59:26 GMT)
Explorations in Texture Learning [2.0] 我々は,CNNにおけるテクスチャとオブジェクトクラスの関係に関する新たな知見を明らかにするために,テクスチャオブジェクトアソシエーションを構築した。
本分析は,テクスチャ学習における研究が,新たな解釈可能性の方法を可能にし,予期せぬバイアスを明らかにする可能性を示唆している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:30:52 GMT)
Emotional Intelligence Through Artificial Intelligence : NLP and Deep Learning in the Analysis of Healthcare Texts [1.9] 本論文は,医療関連テキストにおける感情評価における人工知能の利用に関する方法論的考察である。
我々は、感情分析を強化し、感情を分類し、患者の結果を予測するためにAIを利用する多くの研究を精査する。
AIの倫理的応用を保証すること、患者の機密性を保護すること、アルゴリズムの手続きにおける潜在的なバイアスに対処することを含む、継続的な課題がある。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:58:13 GMT)
Achieving Pareto Optimality using Efficient Parameter Reduction for DNNs in Resource-Constrained Edge Environment [1.9] 本稿では,既存のDeep Neural Network (DNN) の最適化を提案する。
精度を犠牲にすることなくモデルサイズを縮小し、トレーニング中のメモリ使用量を削減できるXceptionの効率的なパラメータ削減戦略を実装した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:40:58 GMT)
Explainable Machine Learning-Based Security and Privacy Protection Framework for Internet of Medical Things Systems [1.8] インターネット・オブ・メディカル・モノ(IoMT)は、従来の医療境界を超越し、反応性治療から予防への転換を可能にする。
その利点は、処理されたデータの感度と価値のために、ユーザの生活を危険にさらす、重大なセキュリティ上の課題に対処されている。
新しいIDS(Intrusion Detection Systems)フレームワークを導入し、ANN(Artificial Neural Networks)を侵入検知に利用し、FL(Federated Learning)をプライバシ保護に活用する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:57:26 GMT)
Towards AI Accountability Infrastructure: Gaps and Opportunities in AI Audit Tooling [1.8] 監査は、デプロイされた人工知能(AI)システムのリスクと限界を特定するための重要なメカニズムである。
私たちは利用可能なAI監査ツールの現在のエコシステムをマップします。
我々は、多くのAI監査実践者にとって、ニーズの全範囲を適切にサポートするリソースが不足していると結論付けている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:05:35 GMT)
Casimir repulsion with biased semiconductors [1.8] 強い反発力を示す中程度の偏りを持つ半導体を含むシステムについて検討する。
半導体から放出されるモードは、準ミクロン距離における魅力的な平衡カシミール力の寄与を克服する近い表面で反発力を発揮する。
我々の研究は、ナノテクノロジーのセンシングとアクチュエーターへの応用により、ナノとマイクロメートルのスケールで力を制御する新たな可能性を開く。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:04:13 GMT)
An Extensible Framework for Architecture-Based Data Flow Analysis for Information Security [1.8] セキュリティ関連プロパティは、しばしばデータフロー図(DFD)に基づいて分析される
データフロー解析のためのオープンかつフレームワークを提案する。
このフレームワークはDFDと互換性があり、Palladioアーキテクチャ記述言語からデータフローを抽出することもできる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:52:41 GMT)
Iterative Forgetting: Online Data Stream Regression Using Database-Inspired Adaptive Granulation [1.7] 本稿では、R*木からインスピレーションを得て、入ってくるデータストリームからグラニュラーを生成するデータベースインスピレーション付きデータストリーム回帰モデルを提案する。
実験により、この手法がデータを破棄する能力は、レイテンシとトレーニング時間において大幅に改善されることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:26:00 GMT)
QUCE: The Minimisation and Quantification of Path-Based Uncertainty for Generative Counterfactual Explanations [1.6] Quantified Uncertainty Counterfactual Explanations (QUCE) は、経路の不確実性を最小化する手法である。
そこで本研究では,QUCEが説明文の提示時に不確実性を定量化し,より確実な逆実例を生成することを示す。
本稿では,QUCE法の性能を,経路に基づく説明法と生成対実例の両方の競合手法と比較することによって示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:58:41 GMT)
Divide-and-Conquer Attack: Harnessing the Power of LLM to Bypass Safety Filters of Text-to-Image Models [1.5] 我々は、最先端TTIモデルの安全フィルタを回避するために、Divide-and-Conquer Attackを導入する。
我々はLLMを効果的に誘導するアタック・ヘルパーを設計し、非倫理的な描画意図を曖昧な記述に分解する。
本研究は,手工芸法や反復的TTIモデルクエリよりも,より深刻なセキュリティ上の意味を持つ。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:01:56 GMT)
How do Machine Learning Projects use Continuous Integration Practices? An Empirical Study on GitHub Actions [1.5] GitHub上の185のオープンソースプロジェクト(93のMLと92の非MLプロジェクト)の包括的な分析を行います。
本研究は,MLプロジェクトと非MLプロジェクト間のCI導入の差異を明らかにすることを目的として,定量化と定性的化の両面から構成する。
その結果,MLプロジェクトではビルド期間が長い場合が多く,中規模のMLプロジェクトでは非MLプロジェクトに比べてテストカバレッジが低いことがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:35:39 GMT)
More than words: Advancements and challenges in speech recognition for singing [1.5] 私は、これらのタスクが勢いを増し始めているのと同じように、これらのタスクについて研究する際の私の経験をいくつか説明します。
私の目標は、歌唱に音声認識を適用する複雑さを解明し、現在の能力を評価し、将来の研究方向性を概説することです。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:37:02 GMT)
Pantypes: Diverse Representatives for Self-Explainable Models [1.4] スパースオブジェクトの集合を通して入力分布の完全な多様性を捉えるために設計された,新しいプロトタイプオブジェクトのファミリーである Pantypes を紹介する。
パンタイプは、潜在空間の発散領域を占有することにより、原型的自己説明可能なモデルを強化することができることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:34:30 GMT)
Leveraging Constraint Programming in a Deep Learning Approach for Dynamically Solving the Flexible Job-Shop Scheduling Problem [1.4] 本稿では,制約プログラミング(CP)をディープラーニング(DL)ベースの方法論に統合し,両者の利点を活用することを目的とする。
本稿では,CP が生成する最適解を用いて DL モデルを訓練し,高品質なデータからモデルを学習する手法を提案する。
我々のハイブリッドアプローチは3つの公開FJSSPベンチマークで広範囲にテストされ、5つの最先端DRLアプローチよりも優れた性能を示している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:16:57 GMT)
An Extensive Comparison of Static Application Security Testing Tools [1.4] 静的アプリケーションセキュリティテストツール(SASTT)は、ソフトウェアアプリケーションのセキュリティと信頼性をサポートするソフトウェア脆弱性を特定する。
いくつかの研究は、偽アラームを発生させる傾向があるため、代替ソリューションがSASTTよりも効果的である可能性を示唆している。
SASTTの評価は、制御されているが合成されたJavaに基づいています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:37:54 GMT)
Measuring Renyi Entropy in Neural Network Quantum States [1.4] 一次元の逆場量子イジングモデルでRenyiエントロピーを計算する。
静的基底状態では、レニイエントロピーは常磁性から強磁性への量子相転移の臨界点を明らかにすることができる。
力学の場合、線形クエンチの終端の後、レニイエントロピーのコヒーレント振動が見つかる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:42:45 GMT)
Brain decoding: toward real-time reconstruction of visual perception [1.4] 過去5年間で、生成的および基礎的AIシステムの使用は、脳活動の復号化を大幅に改善した。
視覚知覚は、機能的磁気共鳴イメージング(fMRI)から顕著な忠実さでデコードできる。
本稿では、高時間分解能で脳活動を測定する神経イメージング装置である脳磁図(MEG)に基づく別のアプローチを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:15:38 GMT)
Zero-shot and Few-shot Generation Strategies for Artificial Clinical Records [1.3] 本研究は,Llama 2 LLMが患者情報を正確に反映した合成医療記録を作成する能力を評価するものである。
筆者らは,MIMIC-IVデータセットから得られたデータを用いて,現在史の物語を生成することに重点を置いている。
このチェーン・オブ・シークレットのアプローチにより、ゼロショットモデルが、ルージュのメトリクス評価に基づいて、微調整されたモデルと同等の結果が得られることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:57:59 GMT)
Methods for Matching English Language Addresses [1.3] 我々は、英語のアドレス対のマッチングとミスマッチを生成するためのフレームワークを形式化する。
アドレスマッチングを自動的に行うための様々な手法を評価する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:39:14 GMT)
A Tale of Two Communities: Exploring Academic References on Stack Overflow [1.3] Stack Overflowにおける学術的参照に関する大規模な研究を行っている。
この結果から,関心領域の異なるStack Overflowコミュニティが,様々な頻度と速度で学術文献に携わっていることが明らかとなった。
矛盾するパターンは、一部の規律が、その利益と開発軌道を、対応する実践者コミュニティから逸脱した可能性があることを示唆している。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:33:55 GMT)
Precision and Recall Reject Curves for Classification [1.3] 本稿では、精度とリコール、リコール・リジェクト曲線、精度・リジェクト曲線を評価するリジェクション曲線を提案する。
不均衡なベンチマークと、これらのシナリオに対して提案された精度とリコール曲線によりより正確な洞察が得られる実世界の医療データを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:19:15 GMT)
Covert Communication for Untrusted UAV-Assisted Wireless Systems [1.2] UAVによる隠蔽通信は、隠蔽性能を向上させるための支援技術である。
本稿では, トウホップUAVアシスト無線システムにおけるジョイントカバーとセキュリティ通信の性能について検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:17:56 GMT)
Emergence of entanglement and breakdown of causality in the quantum realm [1.2] 絡み合いは最も印象的だが、量子力学において最も奇妙な性質である。
ビーム分割による2つのフォトニックモードの量子力学について検討した。
一方のモードの初期波動関数がハイゼンベルクの不確実性に従わないウェーブパケットと異なる場合、他のモードの時間進化の因果関係を明示的に分解する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:16:00 GMT)
Geometric structure of Deep Learning networks and construction of global ${\mathcal L}^2$ minimizers [1.2] 我々は低パラメータ深層学習(DL)ネットワークにおける$mathcalL2$コスト関数の局所的および大域的最小化を明示的に決定する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:29:56 GMT)
RING-NeRF : Rethinking Inductive Biases for Versatile and Efficient Neural Fields [1.2] 本稿では2つの帰納バイアスを含むRING-NeRFアーキテクチャを提案する。
単一の再構成プロセスは、誘導バイアスを生かし、オンパー性能を実験的に示す。
また、これらの帰納バイアスを生かした単一再構成プロセスを設計し、オンパー性能を実験的に実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:58:06 GMT)
User Identification via Free Roaming Eye Tracking Data [1.1] フリーローミング(FR)とターゲットローミング(TR)の新しいデータセットを提案する。
41人の参加者が大学キャンパス(FR)を歩き回るか、図書館(TR)内の特定の部屋を探すよう依頼される。
ウェアラブルアイトラッカーを用いた眼球運動記録(Pupil Labs Neon at 200Hz)
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:04:37 GMT)
Zero Coordinate Shift: Whetted Automatic Differentiation for Physics-informed Operator Learning [1.0] 本稿では,物理インフォームド演算子学習のための新しい,軽量な自動微分(AD)アルゴリズムを提案する。
すべてのサンプル座標を葉変数とする代わりに、ZCSは空間的あるいは時間的次元ごとに1つのスカラー値の葉変数を導入する。
これは、関数の次元に沿った計算グラフの重複を避けることで、卓越した性能向上につながった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:21:37 GMT)
Region-based U-net for accelerated training and enhanced precision in deep brain segmentation [1.0] 本稿では,12の深層脳構造に対する深層学習に基づくセグメンテーション手法を提案する。
提案手法は平均Dice similarity Coefficient (DSC) 0.901, 95% Hausdorff Distance (HD95) 1.155mmの精度で得られた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:04:29 GMT)
Privacy Preserving Anomaly Detection on Homomorphic Encrypted Data from IoT Sensors [1.0] 均質な暗号化スキームは、暗号化されたままIoTデータ上での操作の処理と実行を可能にする、有望なソリューションである。
本稿では,IoTデバイスが生成する同型暗号化データを対象とした,新たなプライバシー保護型異常検出ソリューションを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:11:25 GMT)
Optimized generation of entanglement based on the f-STIRAP technique [0.9] 共振モードに結合した2つの量子ビット間の最大絡み合った状態(ベル状態)を生成することを検討する。
我々は,非断熱リークとシステム消散が絡み合い発生に及ぼす影響を定量化する。
最適プロファイル,操作時間,最大絡み合いの解析式が得られた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:33:00 GMT)
Architecture Analysis and Benchmarking of 3D U-shaped Deep Learning Models for Thoracic Anatomical Segmentation [0.9] 3次元U型モデルの変種に対する最初の系統的ベンチマーク研究を行う。
本研究では,異なる注意機構,解像度ステージ数,ネットワーク構成がセグメンテーション精度および計算複雑性に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:11:10 GMT)
Advanced Tumor Segmentation in Medical Imaging: An Ensemble Approach for BraTS 2023 Adult Glioma and Pediatric Tumor Tasks [0.8] 本研究はBraTS 2023の課題である成人グリオーマと小児腫瘍の2つの異なる課題の文脈における腫瘍の分節化方法について概説する。
本手法では,2つのエンコーダデコーダベースのCNNモデル,すなわちSegResNetとMedNeXtを用いて腫瘍の3つの領域を分割する。
提案手法は,BraTS 2023アダルトグリオーマチャレンジでは平均0.8313点,Dice 36.38点,HD95点の3位となる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:37:41 GMT)
Dynamics of Symmetry-Protected Topological Matter on a Quantum Computer [0.8] トポロジカルエッジモードの制御は、外部ノイズに対して弾力的に量子情報を符号化するのに望ましい。
本研究は,現在の量子プロセッサ上での相互作用多体系の安定な長期実装への道筋を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:53:43 GMT)
Socially Integrated Navigation: A Social Acting Robot with Deep Reinforcement Learning [0.8] 移動ロボットは様々な混み合った状況で大規模に使われており、私たちの社会の一部になっている。
個人を考慮した移動ロボットの社会的に許容されるナビゲーション行動は、スケーラブルなアプリケーションと人間の受容にとって必須の要件である。
本稿では,ロボットの社会行動が適応的であり,人間との相互作用から生じる,社会統合型ナビゲーション手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:25:40 GMT)
On STPA for Distributed Development of Safe Autonomous Driving: An Interview Study [0.8] System-Theoretic Process Analysis (STPA)は、防衛や航空宇宙といった安全関連分野に適用される新しい手法である。
STPAは、分散システム開発とマルチアトラクション設計レベルを備えた自動車システム工学において、完全には有効でない前提条件を前提としている。
これは継続的開発とデプロイメントにおける保守性の問題と見なすことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:56:02 GMT)
An Industrial Experience Report about Challenges from Continuous Monitoring, Improvement, and Deployment for Autonomous Driving Features [0.8] 本稿では,CDDM導入に向けた自動車分野からの課題について述べる。
CDDM戦略の適用はまた、プロセスの遵守とドキュメントの観点からも課題に直面します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:14:24 GMT)
End-to-end Graph-Sequential Representation Learning for Accurate Recommendations [0.8] 本稿では,これら2つのパラダイムの相乗効果を利用した新しい多表現学習フレームワークを提案する。
いくつかのデータセットに対する実験的な評価から,提案フレームワークによる逐次的およびグラフ的コンポーネントの相互学習が推奨性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:28:25 GMT)
Introducing Tales of Tribute AI Competition [0.8] 本稿では,新たなAIチャレンジであるT Tales of Tribute AI Competition(TOTAIC)を提案する。
このゲームは、The Elder Scrolls OnlineのHigh Isle章でリリースされた2人のプレイヤーによるデッキビルディングカードゲームに基づいている。
本稿では,競争の枠組みを紹介し,ゲームのルールを説明し,サンプルAIエージェント間のトーナメントの結果を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:49:29 GMT)
Stable Training of Probabilistic Models Using the Leave-One-Out Maximum Log-Likelihood Objective [0.7] カーネル密度推定(KDE)に基づくモデルは、このタスクの一般的な選択であるが、密度の異なるデータ領域に適応できない。
適応的なKDEモデルを用いてこれを回避し、モデル内の各カーネルは個別の帯域幅を持つ。
最適化速度を確実に高速化するために改良された期待最大化アルゴリズムを用いる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:24:43 GMT)
Breast Cancer Classification Using Gradient Boosting Algorithms Focusing on Reducing the False Negative and SHAP for Explainability [0.7] 本研究は,乳がん予測のためのブースティングに基づく各種機械学習アルゴリズムの性能評価に焦点をあてる。
本研究の目的は,AdaBoost,XGBoost,CatBoost,LightGBMといった最先端の促進アルゴリズムを用いて乳癌の予測と診断を行うことである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:35:43 GMT)
FlexNN: A Dataflow-aware Flexible Deep Learning Accelerator for Energy-Efficient Edge Devices [0.7] 本稿では,アジャイル設計の原則を取り入れたFlexNNを紹介する。
私たちの設計は、ソフトウェア記述子を通じてあらゆるタイプの適応可能なデータフローを可能にすることで革新的です。
スループットをさらに向上し、エネルギー消費を削減するために、スポーシティベースの新しい加速ロジックを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 01:39:12 GMT)
All incompatible measurements on qubits lead to multiparticle Bell nonlocality [0.7] 量子ビット上の任意の不整合の測定が、多粒子シナリオにおいて適切なベルの不等式を破ることにつながることを証明している。
この結果から,量子ビットの計測不整合性は常にデバイスに依存しない方法で証明できることが示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:09:24 GMT)
Welcome Your New AI Teammate: On Safety Analysis by Leashing Large Language Models [0.7] 「ハザード分析・リスクアセスメント」は、安全要件仕様の策定に欠かせないステップである。
本稿では,Large Language Models (LLMs) を用いた HARA の高度自動化を支援するフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:56:52 GMT)
DyRA: Portable Dynamic Resolution Adjustment Network for Existing Detectors [0.7] 本稿では,既存の検出器に画像特異的なスケールファクタを提供する動的解像度調整ネットワークDyRAを紹介する。
ロス関数は、スケールのための異なるサイズのオブジェクトの異なる目的に対する精度低下を最小限に抑えるために考案された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:22:51 GMT)
Geographically-Informed Language Identification [0.6] 本稿では,本モデルが考慮する言語の集合が問題となるテキストの地理的起源に依存する言語識別へのアプローチを開発する。
16の地域固有のモデルを定式化しており、それぞれが、その地域内の国で現れると思われる言語を含んでいる。
これらの地域モデルは、場所に関係なく、これらの言語を確実にカバーするために、31の国際言語も含んでいる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:55:17 GMT)
Retrieval augmented text-to-SQL generation for epidemiological question answering using electronic health records [0.6] 本稿では,テキスト・ツー・ジェネレーションと検索拡張生成(RAG)を組み合わせて疫学的な疑問に答えるエンド・ツー・エンド手法を提案する。
RAGは、現実的な業界環境で示すように、彼らの能力を改善するための有望な方向性を提供します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:45:05 GMT)
RANDAO-based RNG: Last Revealer Attacks in Ethereum 2.0 Randomness and a Potential Solution [0.6] RANDAO 2.0はスケーラビリティ、スループット、セキュリティを改善するための大きなアップグレードである。
LRA(Last Revealer Attack)と呼ばれる脆弱性は、このスキームのランダム性を損なう。
LRAを緩和するために,Shamir's Secret Sharing (SSS) を用いたRANDAO方式を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:28:33 GMT)
Adapting OC20-trained EquiformerV2 Models for High-Entropy Materials [0.6] オープン触媒プロジェクトから事前学習したEquiformerV2モデルの調整および微調整を行った結果について述べる。
結合部位の局所環境に基づいてエネルギーフィルタを適用することにより、ゼロショット推論が著しく改善される。
また、一般的な機械学習の可能性を想定したEquiformerV2は、より小さく、より焦点を絞った直接推論モデルに通知することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:59:54 GMT)
Gamified GUI testing with Selenium in the IntelliJ IDE: A Prototype Plugin [0.6] 本稿では,IntelliJ IDEA用のガミフィケーションプラグインのプロトタイプであるGIPGUTについて述べる。
このプラグインは、達成、報酬、プロファイルのカスタマイズを通じて、単調で退屈なタスクにテスタのエンゲージメントを高める。
その結果,ゲーミフィケーション要素の高利用性と肯定的な受容性が示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:11:11 GMT)
Learning Zero-Shot Material States Segmentation, by Implanting Natural Image Patterns in Synthetic Data [0.6] ここでは,MatchSeg 上のネット列車が既存の最先端手法を著しく上回っていることを示す。
また、クラス非依存の物質状態セグメンテーションのための最初の一般的なベンチマークを示す。
このベンチマークには、料理、食べ物、岩、建設、植物、そして様々な状態の液体(Wet/dry/stained/cooked/cooked/worn/rusted/sediment/foam...)など、さまざまな物質状態の画像が含まれている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 23:14:16 GMT)
Discrete approximations of Gaussian smoothing and Gaussian derivatives [0.5] 本稿では,離散データに適用するためのスケール空間理論におけるガウススムージングとガウス微分計算の近似問題に関する詳細な処理法を開発する。
我々は、これらのスケール空間の操作を明示的な離散的畳み込みの観点から区別する3つの主要な方法を考える。
本稿では,これら3つの主要な離散化手法の特性を理論的および実験的に検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:36:07 GMT)
Compute-first optical detection for noise-resilient visual perception [0.5] 本稿では,この問題に対処するために,検出前の光信号処理の概念を提案する。
線形変圧器によって空間的に再分配された光信号は、視覚的知覚タスクの検出ノイズ耐性を高めることができることを示す。
この計算ファースト検出方式は、産業や防衛用途に広く使われている赤外線機械ビジョン技術の進歩の道を開くことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:51:38 GMT)
Extended local ergotropy [0.5] システム環境化合物のフリー進化を利用した拡張局所エルゴトロピーの概念を導入する。
局所エルゴトロピーとの分散では、拡張された局所エルゴトロピーが増加し、時間の経過とともに増加せず、作業抽出のポテンシャルを活性化する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:30:52 GMT)
Helpful or Harmful? Exploring the Efficacy of Large Language Models for Online Grooming Prevention [0.5] 本稿では,Large Language Models (LLMs) のオンライングルーミング防止効果について検討する。
行動に一貫性が欠如しているため、オンラインのグルーミング防止に明確なモデルが適していないことが分かりました。
検索はベストプラクティスの使い方ガイドを知らせるのに使うことができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:27:43 GMT)
Learning to optimize with convergence guarantees using nonlinear system theory [0.4] 非制約対象関数に対する収束アルゴリズムのアンメトリゼーションを提案する。
具体的には、スムーズなパラメトリゼーションのための全収束アルゴリズムのアンメトリゼーションを提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:40:26 GMT)
AI on AI: Exploring the Utility of GPT as an Expert Annotator of AI Publications [0.4] 我々は、AI研究の機能的定義を導入し、専門家データアノテーションのタスクに基づいて最先端のAIモデルを評価する。
arXivのパブリッシュデータベースを基盤として,GPTモデルのプロンプトエンジニアリングにより,代替の自動化された専門家用アノテーションパイプラインを識別する実験を行った。
比較のために、科学出版物で事前訓練されたトランスフォーマー言語モデルであるSPECTERを微調整し、AI出版物の分類において96%の精度(GPTよりわずか2%高い)を達成する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:43:02 GMT)
How To Save Fees in Bitcoin Smart Contracts: a Simple Optimistic Off-chain Protocol [0.4] 私たちはBitcoinにおけるスマートコントラクトの実行を検討します。
当社では,Bitcoin契約の実行の大部分をオフチェーンで実行するプロトコルを導入しています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:20:36 GMT)
Evaluating LLMs for Gender Disparities in Notable Persons [0.4] 本研究では,事実情報の検索にLarge Language Models (LLMs) を用いることを検討した。
事実的不正確な「ハロゲン化」反応を作り出すことや、全く答えることができないことへの懸念に対処する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:58:27 GMT)
Knowledge Distillation in YOLOX-ViT for Side-Scan Sonar Object Detection [0.4] 本稿では,新しい物体検出モデルであるYOLOX-ViTについて述べる。
我々は、新しいサイドスキャンソナー画像データセットを導入し、それを用いて、対象検出器の性能を評価する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:03:28 GMT)
A semi-agnostic ansatz with variable structure for quantum machine learning [0.4] 変分量子アルゴリズム(VQA)は、短期量子コンピュータをプログラミングするための強力で柔軟なパラダイムを提供する。
本稿では,VQAのためのアンサーゼを構築するための可変構造アプローチを提案する。
我々は、凝縮物質および量子化学応用のための変分量子固有解法にVAnを用いる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:58:31 GMT)
Komodo: A Linguistic Expedition into Indonesia's Regional Languages [0.4] コモド7Bはインドネシア語、英語、11の地域言語をシームレスに運営している。
Komodo-7B-Instructは様々なタスクや言語で最先端のパフォーマンスを達成することで際立っている。
言語モデルの発展への我々のコミットメントは、限られた言語資産を持つ人々のギャップを埋めることを目的として、十分なリソースを持つ言語を超えて拡張されます。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:12:21 GMT)
Enhancing Trust in Autonomous Agents: An Architecture for Accountability and Explainability through Blockchain and Large Language Models [0.3] この研究は、ROSベースの移動ロボットに実装された説明可能性と説明可能性のアーキテクチャを示す。
提案されたソリューションは2つの主要コンポーネントで構成されている。まず、説明責任を提供するブラックボックスのような要素で、ブロックチェーン技術によって達成されるアンチタンパ特性を特徴とする。
第二に、前述のブラックボックスに含まれるデータに対して、Large Language Models(LLM)の機能を利用することで、自然言語の説明を生成するコンポーネントである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:57:18 GMT)
Multi-qubit Dynamical Decoupling for Enhanced Crosstalk Suppression [0.3] 静的クロストークは超伝導体や半導体量子ビットを含む様々なハードウェアプラットフォームに存在する。
駆動クロストークは、他のキュービット上の駆動ゲートからの漏れにより、望ましくない駆動用語として発生する可能性がある。
2組の量子ビットが同時に自由進化する「イドル・イドル」実験と、一方のペアが連続的に駆動される「駆動・イドル」実験である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:27:23 GMT)
Engineering nonequilibrium steady states through Floquet Liouvillians [0.3] 周期駆動下での散逸性超伝導量子ビットの過渡ダイナミクスを実験的に検討した。
我々の研究は、散逸性量子系における非ハーミティリティを制御するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:00:00 GMT)
Scalable Parity Architecture With a Shuttling-Based Spin Qubit Processor [0.3] 量子ドット(QD)を用いたパリティアーキテクチャの実現について検討する。
本稿では、Parity Approximate Quantum Optimization Algorithm (QAOA)を実装したスピンシャットリングと量子ゲートのシーケンスを示す。
本稿では、論理量子状態の復号化と量子エラー軽減の可能性について論じる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:06:50 GMT)
Science Checker Reloaded: A Bidirectional Paradigm for Transparency and Logical Reasoning [0.3] 長い文書のためにこれらのハードルに対処するための2ブロックのアプローチを導入する。
最初のブロックは、クエリ拡張によるスパース検索における言語理解を強化する。
第2のブロックは、複雑な質問に対して包括的で情報的な回答を提供することによって、結果をより深くする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:21:09 GMT)
Better than classical? The subtle art of benchmarking quantum machine learning models [0.3] 古典的なシミュレーションによるベンチマークモデルは、ノイズフリーハードウェアが利用可能になる前に量子機械学習におけるアイデアを判断する主要な方法の1つである。
我々はPennyLaneのソフトウェアフレームワークをベースとしたオープンソースパッケージを開発し、大規模な研究を行っている。
我々は、160個の個別データセットを作成するために使用される6つのバイナリ分類タスクに対して、12の一般的な量子機械学習モデルを体系的にテストした。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:02:26 GMT)
Silico-centric Theory of Mind [0.2] 心の理論(りょうりょう、英: Theory of Mind、ToM)とは、信念、欲望、意図、知識などの精神状態が自分自身や他者へ帰属する能力のこと。
複数の独立したAIエージェントを持つ環境におけるToMについて検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:22:51 GMT)
Heuristic Reasoning in AI: Instrumental Use and Mimetic Absorption [0.2] 我々は、論理処理とショートカット(ヒューリスティックス)の使用の間のAIが遷移する条件を形成する精度と労力削減の間のトレードオフを明らかにする。
我々は、AIが本質的な目標や自己認識を欠いているにもかかわらず、有界および二重プロセス理論の古典理論で説明されるように、資源-合理的な人間合理性の原理と一致する精度と効率の適応的バランスを示す証拠を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:53:05 GMT)
Upper Bound of Bayesian Generalization Error in Partial Concept Bottleneck Model (CBM): Partial CBM outperforms naive CBM [0.2] 概念ボトルネックモデル(Concept Bottleneck Model, CBM)は、ニューラルネットワークを説明する手法である。
部分的なCBM(PCBM)は部分的に観察された概念を使用する。
本稿では,PCBMにおけるベイズ一般化誤差を3層線形アーキテクチャで明らかにする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:19:50 GMT)
Dynamics of Pseudoentanglement [0.0] 擬似絡み合いの発生と伝播について検討する。
i) 擬アンタングルアンサンブルが時間関数としてシステム全体にどのように広がるか, および (ii) 擬アンタングルアンサンブルが初期積状態からどのように生成されるかを検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:54:27 GMT)
Assessing the Impact of Sequence Length Learning on Classification Tasks for Transformer Encoder Models [0.0] 分類アルゴリズムは、異なるクラスからの観察が異なる長さ分布を持つ場合、シーケンス長学習問題の影響を受け得る。
この問題は、重要なテキスト情報に頼るのではなく、シーケンス長を予測機能として使用するモデルを引き起こす。
ほとんどの公開データセットはこの問題の影響を受けていないが、医療や保険などの分野で個人所有のコーパスがこのデータバイアスを負う可能性がある。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:49:24 GMT)
EGIC: Enhanced Low-Bit-Rate Generative Image Compression Guided by Semantic Segmentation [0.0] EGICは、単一のモデルから歪み知覚曲線を効率的にトラバースできる拡張生成画像圧縮法である。
EGICは実装が簡単で、非常に軽量であり、優れた特性を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:08:20 GMT)
Entanglement and Absorbing-State Transitions in Interactive Quantum Dynamics [0.0] 量子コンピュータは、非古典的なシナリオにおける量子多体系の探索を動機付けている。
対象状態に向けてシステムを操ろうとするダイナミクスについて検討する。
我々は一般に、吸収状態遷移は個々の軌道における絡み合い遷移とは異なる臨界パラメータで起こると主張する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:59:29 GMT)
iBRF: Improved Balanced Random Forest Classifier [0.0] クラス不均衡は、異なる分類タスクにおいて大きな課題となる。
本稿では,予測性能を高めるために,バランスドランダムフォレスト(BRF)分類器の修正を提案する。
筆者らが提案するハイブリッドサンプリング手法は,ランダムフォレスト分類器のフレームワークに組み込むと,不均衡な分類タスクに使用される他のサンプリング手法よりも優れた予測性能が得られる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:59:36 GMT)
Viral Load Inference in Non-Adaptive Pooled Testing [0.0] 本研究では,現実的なバイラルロード信号の正確な推測を可能にするために,PCR特定ノイズ関数と併用したメッセージパッシングアルゴリズムを開発した。
この研究は非適応的な設定であり、ウイルスの負荷決定が臨床的に重要である効率的なスクリーニングの可能性を開く可能性がある。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:40:34 GMT)
Vertex coupling interpolation in quantum chain graphs [0.0] 周期量子グラフの帯域スペクトルを、線分と$delta$結合で連結された環の連鎖の形で解析する。
平坦なバンドは一般に欠落しており、負のスペクトルは非誘引的な$delta$結合であっても空でないことが分かる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:58:39 GMT)
VBART: The Turkish LLM [0.0] VBARTはトルコで最初のシークエンス・ツー・シークエンス大型言語モデルであり、スクラッチから大きなコーパスで事前訓練されている。
微調整されたVBARTモデルは、抽象的なテキスト要約、タイトル生成、テキストパラフレーズ化、質問応答、質問生成タスクにおいて、従来の最先端結果を上回る。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:37:37 GMT)
Unlocking the Potential of Open Government Data: Exploring the Strategic, Technical, and Application Perspectives of High-Value Datasets Opening in Taiwan [0.0] 本研究の目的は,世界有数の情報通信技術(ICT)製品の生産者である台湾において,高価値データセット公開のライフサイクルを理解し,評価することである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:31:20 GMT)
Uncertainty Estimation in Multi-Agent Distributed Learning for AI-Enabled Edge Devices [0.0] エッジIoTデバイスはFPGAとAIアクセラレータの導入によってパラダイムシフトを経験している。
この進歩は、エッジAIの実用性を強調し、その計算能力を大幅に増幅した。
本研究では,AI対応エッジデバイスによる分散データ処理を実現する手法について検討し,協調学習能力を向上する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:40:32 GMT)
Transforming Competition into Collaboration: The Revolutionary Role of Multi-Agent Systems and Language Models in Modern Organizations [0.0] 本稿では,マルチエージェントシステム理論(SMA)と大規模言語モデル(LLM)に基づく計算エンティティがユーザインタラクションに与える影響について考察する。
提案手法では,大規模言語モデル (LLM) から発達したエージェントを用いて,行動要素を考慮したプロトタイピングを行う。
我々は,多エージェントシステム理論(SMA)と大規模言語モデル(LLM)に基づく革新的な利用に基づいて,組織戦略に有用なエージェントの開発の可能性を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:16:18 GMT)
Towards a theory of model distillation [0.0] 蒸留は、複雑な機械学習モデルを、オリジナルを近似するより単純なモデルに置き換える作業である。
ニューラルネットワークを簡潔で明確な決定木表現に効率的に抽出する方法を示す。
我々は, 蒸留がスクラッチから学習するよりもはるかに安価であることを証明するとともに, その複雑さを特徴づけることを進める。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:42:19 GMT)
Topological invariant of velocity field in quantum systems [0.0] 速度場流のゼロモードが効果的なトポロジカル電荷や欠陥の役割を担っていることがわかった。
これらはポアンカーのホップの定理に基づくオイラー特性によって特徴づけられる。
この結果は量子状態のトポロジカル不変量を強化し、量子状態のトポロジカル不変量に関する新しい洞察を与える。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:31:58 GMT)
Thermodynamic phases in first detected return times of quantum many-body systems [0.0] 量子多体系の初期状態に対する第1帰還時間の確率分布について検討する。
この分布は、非相互作用領域が平衡状態にあるスピン鎖の正準分配関数の連続として解釈できることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:34:51 GMT)
The Quantum Gaussian-Schell Model: A Link Between Classical and Quantum Optics [0.0] 部分コヒーレント光場の構成多光子量子系の抽出について述べる。
我々の発見は、古典的世界と量子的世界の間に基礎的な橋渡しを確立する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:00:05 GMT)
Subsystem Symmetry Fractionalization and Foliated Field Theory [0.0] トポロジカル量子物質は、亜次元対称性によって富むと、様々なエキゾチックな現象を示す。
最近発見された例は、大域対称性分数化の異なるメカニズムを通して起こるサブシステム対称性分数化の一種である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:44:11 GMT)
SpokeN-100: A Cross-Lingual Benchmarking Dataset for The Classification of Spoken Numbers in Different Languages [0.0] ベンチマークは、コンパクトなディープラーニングモデルの性能を評価し、向上する上で重要な役割を果たす。
本研究では,音声認識に適した全く人工的なベンチマークデータセットを提案する。
SpokeN-100は、0から99までの話者数で構成され、4つの異なる言語で32の話者によって話される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:07:37 GMT)
Solving deep-learning density functional theory via variational autoencoders [0.0] 近年、機械学習モデルはデータから正確なエネルギー密度関数を学習するのに適していることが明らかになっている。
本稿では,様々な量子モデルの基底状態密度プロファイルの圧縮,フレキシブル,正規表現を構築するために,変分オートエンコーダを用いる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:11:50 GMT)
Sharp bounds for max-sliced Wasserstein distances [0.0] 我々は、分離可能なヒルベルト空間上の確率測度と、$n$サンプルからの経験的分布との予想最大1-ワッサーシュタイン距離の上限と下限を一致させる。
また、ユークリッド空間上の対称確率測度$mu$の間の予想最大2-ワッサーシュタイン距離に対して、対数係数まで鋭い上限を得る。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:58:35 GMT)
Sequential hypothesis testing for continuously-monitored quantum systems [0.0] 我々は、連続的に監視されている量子系を考察し、測定信号を生成する。
我々は、信号がリアルタイムで分析されるシーケンシャル戦略の利用を推進した。
本研究では, 停止時間挙動を解析し, シーケンシャルテストの性能を解析する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:52:35 GMT)
Scalability of Metropolis-within-Gibbs schemes for high-dimensional Bayesian models [0.0] 一般座標系MCMCスキーム(Metropolis-within-Gibbsサンプルなど)について検討する。
条件コンダクタンスの概念により、それらの収束特性を対応するギブスサンプリング器のものと関連付ける。
これにより、非共役階層モデルに対する人気のMetropolis-within-Gibbsスキームの性能を研究できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:04:44 GMT)
Revealing hidden physical nonclassicality with nonnegative polynomials [0.0] 非負の理論がデータキャプチャーを最適に活用する方法を示す。
非負は、標準検出方法から隠された場合でも、非古典性を明らかにすることができる。
物理的問題は、非負の性格化に関するいくつかの数学的洞察も引き起こした。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:56:18 GMT)
Regional inflation analysis using social network data [0.0] 本研究は、Vkontakteソーシャルネットワークの非構造データに基づいて、上下方向のインフレ傾向を分析する。
異なるコンテキストにおいて、プロインフレーション型と非インフレーション型を定義できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:34:28 GMT)
Randomized Principal Component Analysis for Hyperspectral Image Classification [0.0] 2つのハイパースペクトルデータセットの分類において,特徴量を20と30に減らした。
最も高い分類精度は、LightGBMによって0.9925と0.9639と得られた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:40:23 GMT)
Random Search as a Baseline for Sparse Neural Network Architecture Search [0.0] スパースニューラルネットワークは、高いパラメータ効率を保ちながら、密度の高いニューラルネットワークと同じような、あるいはより良い性能を示している。
これは、高性能なスパースネットワークを学習したり、検索したりするための多くの研究の動機となった。
本稿では,適切なスパース構成を求めるためのベースラインアルゴリズムとしてランダム検索を提案し,その性能について検討する。
本研究では,このスパースアーキテクチャ探索タスクにおいて,ランダムサーチによって発見されたスパースネットワークは,ランダムサーチよりも効率よくも効率良くも収束もできないことを観察する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 05:18:08 GMT)
Quantum walk on simplicial complexes for simplicial community detection [0.0] 本研究では、グラフ構造の高次一般化である単体錯体上の離散時間量子ウォークについて検討する。
本稿では,simplicial community(simplicial community)と呼ばれる高次コミュニティ構造を検出するための量子ウォークアルゴリズムを提案する。
我々の量子アルゴリズムのポテンシャルは、ザカリーの空手部ネットワークでテストされている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:43:23 GMT)
Quantum geometry of the parameter space: a proposal for curved systems [0.0] 量子幾何テンソルの定式化であるザナルディ等を一般化する等価な定義を導入する。
パラメータ依存計量は、量子計量テンソルとベリー曲率の両方の振舞いを純粋に幾何学的に修正する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:51:26 GMT)
Quantum analog of Landau-Lifshitz-Gilbert dynamics [0.0] ランダウ・リフシッツ・ギルベルト方程式(LLG)とランダウ・リフシッツ方程式(LL)は、固体における磁化のダイナミクスを記述する上で重要な役割を果たす。
本稿では,量子状態の純度を本質的に保存する量子 LLG 方程式を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:27:14 GMT)
Prethermalization in coupled one-dimensional quantum gases [0.0] 密度-密度相互作用により互いに弱結合する1次元ボースガス管の定常状態の問題を考察する。
衝突積分の先頭の順序が個々の気体中で単一粒子-ホール励起が生成されるとき、気体の状態はまず非熱的固定点へと進化する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:06:04 GMT)
Precise characterization of a silicon carbide waveguide fiber interface [0.0] 4H-SiCのような高屈折率材料中のエミッタは、内部反射による損失により光子の検出が減少する。
我々は4H-SiCにおける導波路集積V2欠陥に基づく明るい単一光子源を作成し、181,000カウント/秒の総光子カウント率を得る。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:24:37 GMT)
Position dependence of Nielsen complexity for the Thermofield double state [0.0] 本稿では、外部電界の影響による状態変化を示し、対応する回路の構築においてその重要性を示す。
数値解析により,周波数と外界が複雑性のダイナミクスに与える影響について検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:46:02 GMT)
Physically motivated improvements of Variational Quantum Eigensolvers [0.0] ADAPT-VQEは量子化学における電子構造問題に対する重要なアプローチとして登場した。
本研究はADAPT-VQEの有効性を高めるための試みである。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:57:03 GMT)
PTSD-MDNN : Fusion tardive de réseaux de neurones profonds multimodaux pour la détection du trouble de stress post-traumatique [0.0] PTSD-MDNNは、一過性の畳み込みニューラルネットワークを組み合わせて、検出エラー率を低くする。
このモデルは、テレコンスルテーションセッションの設定、患者旅行の最適化、人間とロボットの相互作用に使用できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:57:16 GMT)
Optimizing the Electrical Interface for Large-Scale Color-Center Quantum Processors [0.0] ダイヤモンドの色中心に基づく量子プロセッサは、将来の大規模量子コンピュータにとって有望な候補である。
このような量子ビットの制御と読み出しに必要な電気インターフェースは、システム全体の性能とスケーラビリティの両方を制限する可能性がある。
本研究は、多数の同一単位セルからなるスケーラブルなアーキテクチャにおいて、電子コントローラを効率的に実装する方法を検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:10:23 GMT)
On using Machine Learning Algorithms for Motorcycle Collision Detection [0.0] 衝突シミュレーションにより,エアバッグやシートベルトなどの受動的安全対策を装備すれば,車両衝突時の重傷や死亡のリスクを大幅に低減できることが示された。
本稿では,衝突を確実に検出する上での課題として,機械学習アルゴリズムの適用性について検討する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:32:25 GMT)
Older adults' safety and security online: A post-pandemic exploration of attitudes and behaviors [0.0] オンラインの安全性とサイバーセキュリティの異なる側面に関して,60歳以上の高齢者集団の行動と態度を調査した。
その結果,高齢者は個人情報の安全性について明確な懸念を抱いていることが明らかとなった。
保護体制の整備には高齢者を包含し、その多様性を認めなければならない。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:22:16 GMT)
Observation of quantum thermalization restricted to Hilbert space fragments [0.0] 量子熱化は、素粒子から複雑な物質まで幅広い種類の系で起こる。
量子系における熱化とメモリの同時実験を初めて実施する。
結果は量子プロセッサや量子センサーにおける絡み合いのダイナミクスを制御するために応用できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:01:26 GMT)
Non-Hermitian Persistent Current Transport [0.0] 永久電流は外部電源を必要とせずに連続的に循環する。
非エルミートフェルミ・ディラック分布を導入し、永続電流の解析式を導出する。
我々の定式化は、非エルミート系の量子多体観測を平衡で計算するための一般的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:00:00 GMT)
Neutron spin echo is a "quantum tale of two paths'' [0.0] 本研究では,SESANS信号のスピンエコー長の関数として減衰を予測できることを示す。
このような減衰は実験的に観測されず、ラーモアモデルが誤りであるか、あるいは波状パケットの逆幅が非常に大きいことを示唆している。
これとは対照的に, 単一中性子の2つのモード絡み合ったスピン状態が空間内で分離される量子力学的干渉モデルが, 格子との相互作用によって測定されたSESANS信号を正確に予測できることを理論的に示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:56:00 GMT)
Monte Carlo Spin Simulations of Magnetic Noise -- The Search for Pivoting [0.0] 超伝導量子干渉デバイス(SQUID)は量子ビット(量子ビット)として大きな可能性を秘めているが、フラックスノイズによって妨げられ続けている。
実験により、SQUID毎に異なる温度でのノイズパワースペクトルと周波数が共通の点で回転または交差していることが判明した。
2次元格子上の様々なスピン系のモンテカルロシミュレーションの結果を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:51:53 GMT)
Modeling non-genetic information dynamics in cells using reservoir computing [0.0] イオン勾配は, 環境情報を取得し, 分析し, 応答する, 動的で汎用的な生体システムを実現する。
提案したイオン力学は,実験観測と一致した情報外部摂動に対する応答の迅速な拡散を可能にすることを実証する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:26:00 GMT)
Mixed-Distil-BERT: Code-mixed Language Modeling for Bangla, English, and Hindi [0.0] 我々は、バングラ語、英語、ヒンディー語で事前訓練された多言語モデルTri-Distil-BERTと、コードミックスデータに基づいて微調整されたMixed-Distil-BERTを紹介する。
我々の2層事前学習アプローチは、多言語およびコード混在言語理解のための効率的な代替手段を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:32:16 GMT)
Matrix Mechanics of a Particle in a One-Dimensional Infinite Square Well [0.0] ハイゼンベルクの行列力学の手法を用いて無限ポテンシャル井戸問題を解く。
教育的価値に加えて、マトリックス力学は、このポテンシャルによって引き起こされる様々な非物理的問題に対処することができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:33:18 GMT)
M&M: Multimodal-Multitask Model Integrating Audiovisual Cues in Cognitive Load Assessment [0.0] 本稿では,認知負荷評価のためのAVCAffeデータセットに適用した,新しいマルチモーダルマルチタスク学習フレームワークであるM&Mモデルを提案する。
M&Mは、オーディオとビデオの入力のための特別なストリームを特徴とする、デュアル・パスウェイ・アーキテクチャを通じてオーディオヴィジュアル・キューを独自に統合する。
重要な革新は多面的マルチヘッドアテンション機構であり、同期マルチタスクの異なるモダリティを融合させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:49:40 GMT)
Long-lived collective Rydberg excitations in atomic gas achieved via ac-Stark lattice modulation [0.0] 本稿では,Rydbergの励起寿命を延長するためのプロトコルを提案する。
原則として、スピン波を凍結し、熱劣化の影響を完全にキャンセルすることができる。
我々の実施により、励起寿命は桁違いに拡張できることが判明した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:32:31 GMT)
Leap: molecular synthesisability scoring with intermediates [0.0] 薬物発見における一般的なアプローチは、合成アクセス可能な中間体を取り巻く化学空間を探索することである。
Leapは予測合成経路の深さ、または長い直線経路に基づいて訓練されたGPT-2モデルである。
本稿では,合成可能な分子の同定において,LeapがAUCスコアの少なくとも5%を越えていることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:53:35 GMT)
Label Dependencies-aware Set Prediction Networks for Multi-label Text Classification [0.0] グラフ畳み込みネットワークを活用し,ラベル間の統計的関係に基づいて隣接行列を構築する。
我々は,Bhattacharyya距離を設定された予測ネットワークの出力分布に適用することにより,リコール能力を向上する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 02:56:32 GMT)
Klein-Gordon theory in noncommutative phase space [0.0] 位置とモータ作用素の3次元非可換関係を4次元のものと拡張する。
プランク定数、プランク長さ、宇宙定数に関連する非可換パラメータを導出する。
電磁ゲージポテンシャルのアナログとして、非可換効果は有効ゲージ場として解釈できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:43:04 GMT)
Investigating the effect of noise channels on the quality of unitary t-designs [0.0] ユニタリt-設計は、量子データ暗号化やランダム化ベンチマークなど、量子情報理論に幅広い応用がある。
本稿では,単一量子t-設計の品質に及ぼすノイズチャネルの影響について検討する。
2つのノイズモデルが等価であることを示し、他のノイズチャネルでは、ユニタリーがノイズチャネルの非偏極チャネルへの変換を反射した後にノイズが適用されるモデルに対して、ランダム化ベンチマークと2つの設計による効果を生かした。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:59:07 GMT)
Innovations in Agricultural Forecasting: A Multivariate Regression Study on Global Crop Yield Prediction [0.0] 本研究は,27年間で開発途上国37カ国の収量予測に6つの回帰モデルを適用した。
4つの主要な訓練パラメータ, 殺虫剤 (tonnes), 降雨剤 (mm), 温度 (Celsius), 収量 (hg/ha) が与えられた結果, 我々のランダムフォレスト回帰モデルは0.94の判定係数 (r2) を達成した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 07:42:52 GMT)
Information Extraction: An application to the domain of hyper-local financial data on developing countries [0.0] この問題に対処する2つの自然言語処理技術(NLP)を開発し評価する。
まず、発展途上国の財務テキストデータのドメインに特有のカスタムデータセットをキュレートする。
次に,変換器をベースとしたT5モデルを用いてテキストからテキストへのアプローチを探索し,NERと関係抽出を同時に行うことを目的とする。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:49:36 GMT)
Hardy-type paradoxes for an arbitrary symmetric bipartite Bell scenario [0.0] そのようなパラドックスを任意の、しかし対称なベルシナリオに表すハーディの議論の2つの一般化を与える。
自然に、含意の推移性の失敗のデモンストレーションと解釈できる。
特別な場合としては、ハーディのパラドックスに対するはしご耐性型引数と同値である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:35:10 GMT)
Geometric quantum discord of an arbitrary two-qudit state: the exact value and general upper bounds [0.0] 一般の2量子状態に対する幾何量子不協和の明確な正確な解析値を求める。
これにより、任意の2量子状態、純粋あるいは混合、幾何学的量子不協和の新たな一般上界を見つけることができる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:44:47 GMT)
Generative artificial intelligence enhances creativity but reduces the diversity of novel content [0.0] 生成人工知能(GenAI)は、新しいアイデアを提供することによって人間がより創造的になること、あるいはGenAIのアイデアを定着させることによって創造的になることを約束する。
GenAIのアイデアへのアクセスは、著者の創造性を高め、ストーリーはより書きやすく、より楽しいものと評価される。
しかし、GenAI対応の物語は人間単独の物語よりも互いに似通っている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:30:18 GMT)
Generative Models and Connected and Automated Vehicles: A Survey in Exploring the Intersection of Transportation and AI [0.0] 本報告は、CAV(Connected and Automated Vehicles)とジェネレーティブモデルの歴史と影響について考察する。
この研究は、CAVの文脈における生成モデルの適用に焦点を当て、この統合が自動運転車における予測モデリング、シミュレーション精度、意思決定プロセスをどのように強化するかを明らかにすることを目的としている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 06:51:26 GMT)
GPT on a Quantum Computer [0.0] 大規模言語モデル(LLM)は、私たちが人工知能(AI)の能力と相互作用し理解する方法を変えました。
本稿では、量子コンピューティングパラダイムにおいて、ChatGPTと統合された基礎的なトランスフォーマーアーキテクチャを実装するためのフレームワークの概要を述べる。
量子機械学習(QML)の研究のための新たな道を開き、AI技術の継続的な進化に貢献したいと思っています。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 14:07:31 GMT)
Forecasting Geoffective Events from Solar Wind Data and Evaluating the Most Predictive Features through Machine Learning Approaches [0.0] 本研究では,機械学習技術を利用した地磁気障害の予測について検討した。
この問題は,SYM-H地磁気活動指数の50ドルnT未満の低下を事前に1時間予測することを目的とした2値分類としてアプローチされている。
地磁気嵐の発生を適切に予測するためのニューラルネットワークの最適性能を示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:13:26 GMT)
Fluctuating parametric drive of coupled classical oscillators can simulate dissipative qubits [0.0] 特に,2レベル系(TLS)の量子力学の古典的類似が,散逸性量子系の力学をシミュレートするために拡張できるかどうかという疑問に答える。
これらの貢献は, これらのシステムの制御装置に組み込むことができ, 特に, 浮遊ナノ粒子やナノストリング共振器へのこの理論の適用について論じる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:55:03 GMT)
Fisher Mask Nodes for Language Model Merging [0.0] 本稿では,トランスフォーマーの新たなモデルマージ手法について紹介し,フィッシャー重み付けにおける過去の研究成果とモデルプルーニングにおけるフィッシャー情報の利用について考察する。
提案手法は,BERTファミリーの各種モデルに対して,正規かつ顕著な性能向上を示し,計算コストのごく一部において,大規模フィッシャー重み付き平均値よりも優れていた。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:52:26 GMT)
Feasibility of a trapped atom interferometer with accelerating optical traps [0.0] 我々は,高帯域幅アプリケーションのためのセットアップを提案し,全体の感度を向上した。
最大103$-105$ m/s$2$の加速度は、AOD(Acousto-optic Reflector)を用いて達成できる。
適切なビームと光学安定化の限界において、10-14$ (m/s$2$)/$sqrtrm Hz$に近づく感度は1Hzで達成できる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:59:05 GMT)
Extremal graphical modeling with latent variables [0.0] 本稿では,潜在変数の存在下での極端グラフィカルモデル学習のためのトラクタブル凸プログラムを提案する。
提案手法では,H"usler-Reiss精度行列を,グラフィカル構造を符号化したスパース成分に分解する。
条件付きグラフと潜伏変数の数を連続的に復元することを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:45:24 GMT)
Exploring the Comprehension of ChatGPT in Traditional Chinese Medicine Knowledge [0.0] 我々は,TCM-QAという問合せデータセットを提示する。これは,1つの選択,複数の選択,真または偽の3つの問合せタイプからなる。
本研究では,LLMの2つの設定,ゼロショットと少数ショットの設定を評価し,英語と中国語のプロンプトの違いを同時に議論した。
以上の結果から,ChatGPTの精度は0.688であり,最も低い精度は0.241であることがわかった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:20:40 GMT)
Exploiting Finite Geometries for Better Quantum Advantages in Mermin-Like Games [0.0] 量子ゲームは、絡み合いや文脈性のような量子現象の非直感的な結果を表す。
本稿では、このような古典的戦略の背後にある幾何学的構造を考察し、この量子的優位性を最大化するためにシンプレクティック極空間の幾何学からアイデアを借りる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:56:43 GMT)
Explanation of Superluminal Phenomena Based on Wave-Particle Duality and Proposed Optical Experiments [0.0] 光子の波動-粒子双対性に基づく超微粒子現象の解明を提案する。
超光現象をテストするために、いくつかの実験が提案されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:43:30 GMT)
Ergonomic Design of Computer Laboratory Furniture: Mismatch Analysis Utilizing Anthropometric Data of University Students [0.0] コンピュータ・ラボラトリー・エルゴノミクスを改善するのに適した人文計測に基づく家具次元
調整不能椅子と調整不能椅子の2種類の家具について検討した。
提案した寸法は, 既設の家具と比較して, 男女ともに適合性が高く, ミスマッチ率も低かった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:02:24 GMT)
Era Splitting -- Invariant Learning for Decision Trees [0.0] 実生活における機械学習の問題は、ある時間から別の時間、あるいはある場所から別の場所へのデータの分散シフトを示す。
アウト・オブ・ディストリビューションの一般化の新たな分野は、新しい理論とアルゴリズムによってこの現実に対処する。
決定木に対する2つの新たな分割基準を開発し,OOD一般化研究のアイデアを決定木モデルに適用する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 17:31:06 GMT)
Energy-gap modulation and majorization in three-level quantum Otto engine [0.0] 2つのエネルギーギャップを持つ3レベル量子系は、量子熱エンジンの非自明な作用媒体を示す。
準静的極限のオットーエンジンは、第1量子断熱段階で少なくとも1つのエネルギーギャップが縮むと実現可能である。
n$レベルのシステムでは、エネルギーギャップの明確に定義された変化は、偏極関係と整合し、エンジンの動作を特徴付けることに留意する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:05:36 GMT)
Doppler-free three-photon spectroscopy on narrow-line optical transitions [0.0] 1S_0$$leftrightarrow$3P_0$光時計遷移と1S_0$$leftrightarrow$3P_1$対結合遷移のコヒーレントドップラーフリー3光子励起は880ドルSr原子の自由空間熱雲である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:07:07 GMT)
Design of an basis-projected layer for sparse datasets in deep learning training using gc-ms spectra as a case study [0.0] ディープラーニング(DL)モデルは、ビッグデータから複雑なパターンを学ぶことができる。
すべてのデータは、DLモデルを効果的にトレーニングするために、最初は適切な形式に格納されるわけではない。
これらのデータセットは一般に多くのゼロ値を含む。
スパースデータを高密度表現に変換するために基底投影層(BPL)が提案された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:03:51 GMT)
Decodable hybrid dynamics of open quantum systems with Z_2 symmetry [0.0] 局所的なデコヒーレンス(ノイズ)と局所射影測定を備えた「オープン」量子回路モデルのクラスを探索する。
スピンガラス相では、回路力学は量子反復符号として解釈できる。
コード空間における任意の初期キュービット状態を復元するための新しい復号アルゴリズムを考案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:22:17 GMT)
D-YOLO a robust framework for object detection in adverse weather conditions [0.0] ヘイズ、雪、雨などの逆の気象条件は、画像品質の低下を招き、深層学習に基づく検知ネットワークの性能低下を招きかねない。
画像復元とオブジェクト検出のタスクをよりうまく統合するために,注目機能融合モジュールを備えた二重経路ネットワークを設計した。
我々はまた,検出ネットワークにヘイズフリーな機能を提供するサブネットワークを提案し,特に,明瞭な特徴抽出サブネットワークと検出ネットワーク間の距離を最小化することにより,検出ネットワークの性能を向上させる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:57:15 GMT)
Contextual Clarity: Generating Sentences with Transformer Models using Context-Reverso Data [0.0] コンテキスト(KIC)生成におけるキーワードは、検索エンジン、パーソナルアシスタント、コンテンツ要約などのアプリケーションにおいて重要な役割を担っている。
本稿では,T5 トランスフォーマーモデルを用いて,Context-Reverso API から得られたデータを活用することによって,与えられたキーワードに対して不明瞭で簡潔な文文文を生成する手法を提案する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 10:47:32 GMT)
Competing Interactions in Strongly Driven Multi-Level Systems [0.0] マルチレベル効果は、強い外部駆動に重大な影響を与える可能性がある。
その結果, 強光駆動系における光偏光の不完全性や初期状態生成の関連性を強調した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 16:29:56 GMT)
Comparative Microscopic Study of Entropies and their Production [0.0] ボルツマン-表面,ギブス-体積,カノニカル,粗粒度観測,絡み合い,対角形)および3つの微視的温度定義(ボルツマン,ギブス,カノニカルエントロピーに基づく)の時間進化について検討した。
これは、シュレーディンガー方程式の数値積分に基づいて、ここでランダム行列理論でモデル化されたエネルギーを交換する2つの系の根元的非平衡設定のために行われる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 13:52:48 GMT)
Compactness of quantics tensor train representations of local imaginary-time propagators [0.0] 仮想時間プロパゲータの時空間依存性は量子トレイン(QTT)を用いて圧縮可能であることが判明した。
本稿では,QTTにおける1時間/周波数オブジェクトと2時間/周波数オブジェクトに対する局所的仮想時間プロパゲータのコンパクト性に関する包括的数値解析を行う。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:17:53 GMT)
Classical-Quantum correspondence in Lindblad evolution [0.0] 我々は、(多くは)古典的ハミルトン多様体と(多くは)線型的に成長する古典的ジャンプ関数を用いて定義されるリンドブラッドの進化について、量子可観測はエルベルト-シュミットノルムにおける古典的フォッカー-プランクの進化に近いままであることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 12:49:49 GMT)
Ciphertext-Only Attack on a Secure $k$-NN Computation on Cloud [0.0] 暗号化は、不正アクセス、データ漏洩、そしてその結果の金銭的損失、評判の損害、法的問題を防ぐことができる。
Sanyashiらは、クラウド上のプライバシー保護のための$k$-NN計算を容易にする暗号化スキームを提案した。
我々は、効率的なアルゴリズムを与え、その暗号方式が暗号文のみの攻撃(COA)に弱いことを実証的に示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 03:53:01 GMT)
Challenges of variational quantum optimization with measurement shot noise [0.0] 問題の大きさが大きくなるにつれて、量子資源のスケーリングが一定の成功確率に達するか検討する。
この結果から,ハイブリッド量子古典アルゴリズムは古典外ループの破壊力を回避する必要がある可能性が示唆された。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 18:42:01 GMT)
Caveat Lector: Large Language Models in Legal Practice [0.0] 大規模な言語モデルへの関心は、多くのユーザーが生成したテキストの品質を評価するための専門知識を欠いているという事実から来ている。
急流と表面的可視性の危険な組み合わせは、生成されたテキストを信頼する誘惑を招き、過信のリスクを生じさせる。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 08:19:41 GMT)
Brain Tumor Segmentation Based on Deep Learning, Attention Mechanisms, and Energy-Based Uncertainty Prediction [0.0] 脳腫瘍は、死亡率80%を超える最も致命的ながんの1つである。
医学的分析では、脳腫瘍の手動アノテーションとセグメンテーションは複雑な作業である。
本稿では,データ前処理中に実装された関心領域検出アルゴリズムを提案する。
ソフトアテンションを持つ完全畳み込みオートエンコーダは、異なる脳MRIをセグメント化する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 19:02:51 GMT)
Artificial Bugs for Crowdsearch [0.0] 人工的なバグを挿入して、実際の(有機的な)バグを検索するインセンティブを高めることで、このようなプログラムを強化することを提案する。
このために、人工的なバグをひとつだけ挿入するだけで十分であることを示す。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 15:27:14 GMT)
Are Colors Quanta of Light for Human Vision? A Quantum Cognition Study of Visual Perception [0.0] 量子計測過程におけるカテゴリー知覚の現象について検討する。
我々は知覚を、既存の物理的現実、刺激、そして迫力によって期待される現実の間の複雑な出会いと見なしている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:10:07 GMT)
AraTrust: An Evaluation of Trustworthiness for LLMs in Arabic [0.0] AraTrust 1はアラビア語でLLM(Large Language Models)の総合的信頼性ベンチマークである。
AraTrustは、真理、倫理、安全、身体的健康、メンタルヘルス、不公平、違法な活動、プライバシー、不快な言語に関連する様々な次元に対処する516の人間による多重選択質問で構成されている。
GPT-4はアラビア語で最も信頼できる言語であった。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 00:45:24 GMT)
Alternant Hydrocarbon Diradicals as Optically Addressable Molecular Qubits [0.0] 我々は、基底状態におけるラジカル-ラジカル相互作用を選択的に最小化するために、交互対称性を用いることを提案する。
交換炭化水素m-ジラジカルの励起状態は重要な対称性を含むことがわかった。
分子パラメータは、メタ位置で共有結合されたトリス(2,4,6-トリクロロフェニル)メチル(TTM)ラジカルジマーの文脈で設定される。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 04:51:17 GMT)
Absence of Spin Liquid Phase in the $J_1-J_2$ Heisenberg model on the Square Lattice [0.0] 我々は密度行列再正規化グループと完全拡張行列積状態法を用いて、大きな結合次元で前例のない精度に達する。
以前は、N'eel反強磁性(AFM)相とボンドソリッド(VBS)相で挟まれた狭いスピン液体相が存在すると考えられていた。
また, N'eel AFM 相と VBS 相の遷移が連続していることが判明した。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:30:56 GMT)
A new approach towards quantum foundation and some consequences [0.0] 6つの仮定に基づく一般的な理論が紹介される。
基本的な概念は、観測者または通信観測者のグループと関連付けられた理論変数である。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 09:43:23 GMT)
A generalized dominance ordering for 1/2-BPS states [0.0] 1/2-BPS状態の区別に必要なカシミール作用素の数について上限を決定するための予想を提案する。
我々はこの予想の数値的および解析的な証拠を提供する。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:42:15 GMT)
A field theory representation of sum of powers of principal minors and physical applications [0.0] 主極小の力の和(SPPM)のための新しい場の理論表現を導入する。
複雑な量子系の対称性に関する深い洞察を提供する。
この研究は、量子システム内の主マイナーーを理解するための理論的なギャップを埋める。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 21:09:46 GMT)
A complete logic for causal consistency [0.0] 本モデルでは,グラフ上の因果構造を調べるツールとしてグラフ型を導入する。
グラフ型の性質は、ポムセット論理を保守的に拡張する新しい因果論理の因果一貫性の完全性を証明するために使われる。
因果論理がポムセット論理を保守的に拡張するという事実を利用して、ポムセットとBVを分離する文の物理的に意味のある解釈を与える。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 11:36:53 GMT)
A Conceptual Framework For White Box Neural Networks [0.0] 本稿では、完全に説明可能なニューラルネットワーク層のための一般的な概念的枠組みとして意味的特徴を紹介する。
MNISTの関連するサブプロブレムに対するよく動機付けられた概念モデルの証明は、合計4.8Kの学習可能なパラメータを持つ4つの層で構成されている。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 20:50:03 GMT)
$W$ state is not the unique ground state of any local Hamiltonian [0.0] すべての量子状態の基底状態の特徴づけは、量子多体物理学において重要な問題である。
W$状態を含む新しい単純な状態のクラスを導入します。
論文参考訳(メタデータ) (Thu, 14 Mar 2024 22:15:20 GMT)