ADaPT: As-Needed Decomposition and Planning with Language Models [131.1] As-Needed Decomposition and Planning for Complex Tasks (ADaPT)について紹介する。
ADaPTは、Large Language Modelsがそれらを実行できない場合、複雑なサブタスクを明示的に計画し、分解する。
以上の結果から,ADaPTは強いベースラインを確立した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:42:17 GMT)
Deep Internal Learning: Deep Learning from a Single Input [88.6] 多くの場合、手元にある入力からネットワークをトレーニングする価値がある。
これは、トレーニングデータが少なく、多様性が大きい多くの信号および画像処理問題に特に関係している。
本研究の目的は,この2つの重要な方向に向けて,過去数年間に提案されてきた深層学習技術について報告することである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:56:17 GMT)
Getting Sick After Seeing a Doctor? Diagnosing and Mitigating Knowledge Conflicts in Event Temporal Reasoning [87.9] 出来事の時間的推論は、物語から2つ以上の出来事の間の時間的関係を特定することを目的としている。
知識の衝突は、コンテキスト内の事象の実際の時間的関係と、モデルによって学習された事前の知識やバイアスとの間にミスマッチがあるときに起こる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:59:53 GMT)
Exploiting Causal Graph Priors with Posterior Sampling for Reinforcement Learning [86.2] 後部サンプリングは、環境の遷移力学に関する事前知識の活用を可能にする。
本稿では,環境変数に対する因果グラフとして先行値が与えられる新しい後方サンプリング手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:52:32 GMT)
Self-Supervised Learning for Time Series Analysis: Taxonomy, Progress, and Prospects [84.7] 自己教師付き学習(SSL)は、最近、様々な時系列タスクで印象的なパフォーマンスを達成した。
この記事では、時系列データに対する最先端のSSLメソッドについてレビューする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:38:59 GMT)
Knowledge Distillation via the Target-aware Transformer [83.0] 本稿では,新しい一対一空間マッチング知識蒸留手法を提案する。
具体的には,教師の特徴のそれぞれのピクセルを,生徒の特徴の空間的位置すべてに蒸留する。
我々のアプローチは、様々なコンピュータビジョンベンチマークにおいて最先端の手法をはるかに上回っている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:59:24 GMT)
Modeling Uncertainty and Using Post-fusion as Fallback Improves Retrieval Augmented Generation with LLMs [80.7] 検索されたパスと大きな言語モデル(LLM)の統合は、オープンドメインの質問応答の改善に大きく貢献している。
本稿では,検索したパスをLLMと組み合わせて回答生成を向上させる方法について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:37:00 GMT)
SoundingActions: Learning How Actions Sound from Narrated Egocentric Videos [77.6] そこで本研究では,自己教師型埋め込み技術を用いて,自己中心型ビデオから行動音を学習する手法を提案する。
我々のマルチモーダルコントラッシブ・コンセンサス・コーディング(MC3)埋め込みは、すべてのモダリティ対が一致するとき、オーディオ、言語、視覚の関連を強化します。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:19:28 GMT)
ReFT: Representation Finetuning for Language Models [74.5] 我々は、$textbfRepresentation Finetuning (ReFT)$メソッドのファミリーを開発する。
LoReFTは、従来の最先端PEFTよりも10x-50倍高いパラメータ効率の介入を学習する。
本稿では,8つのコモンセンス推論タスク,4つの算術推論タスク,Alpaca-Eval v1.0,GLUEについて紹介する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:06:10 GMT)
MLP Can Be A Good Transformer Learner [73.0] 自己保持機構はトランスフォーマーの鍵であるが、その計算要求に対してしばしば批判される。
本稿では,非重要注意層を選択的に除去することで,視覚変換器の簡易化と計算負荷削減を実現する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:40:15 GMT)
360°REA: Towards A Reusable Experience Accumulation with 360° Assessment for Multi-Agent System [70.0] 評価フィードバックからの経験を総合的に評価し蓄積することは、システム性能を改善するための効果的なアプローチである、と我々は主張する。
360degREA(Reusable Experience Accumulation with 360deg Assessment)を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:43:13 GMT)
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance [68.2] マルチモーダルモデルは、下流の"ゼロショット"のパフォーマンスを線形改善するために、指数関数的に多くのデータを必要とする。
本研究は,大規模な訓練パラダイムの下での「ゼロショット」一般化能力の鍵となる訓練データに対する指数関数的要求を明らかにする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:14:43 GMT)
DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.1] 大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:59:24 GMT)
FreGS: 3D Gaussian Splatting with Progressive Frequency Regularization [67.5] 周波数空間における過度再構成問題に対処するために, 進行周波数正規化手法を開発した。
FreGSは優れた斬新なビュー合成を実現し、最先端の技術を一貫して上回っている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:16:56 GMT)
Scalable Frank-Wolfe on Generalized Self-concordant Functions via Simple Steps [66.9] 一般化自己一致は、多くの学習問題の目的関数に存在する重要な特性である。
検討対象の領域が一様凸あるいは多面体である場合など,様々な症例に対する収束率の改善を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:30:41 GMT)
MA-LMM: Memory-Augmented Large Multimodal Model for Long-Term Video Understanding [66.6] 本研究は,長期的映像理解のための効率的かつ効果的なモデルの設計に焦点を当てる。
我々は,過去の映像情報をメモリバンクに格納し,オンラインで動画を処理することを提案する。
我々のモデルは、複数のデータセットにわたって最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:59:24 GMT)
Better Monocular 3D Detectors with LiDAR from the Past [64.7] カメラベースの3D検出器は、画像の奥行きのあいまいさのため、LiDARベースの検出器に比べて性能が劣ることが多い。
本研究では,未ラベルの歴史的LiDARデータを活用することにより,単分子3D検出器の改良を図る。
複数の最先端モデルやデータセットに対して,9.66ミリ秒の追加レイテンシとストレージコストの低い,一貫性と大幅なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:38:43 GMT)
TIM: A Time Interval Machine for Audio-Visual Action Recognition [64.2] 音声と視覚イベントの時間的範囲を明示的にモデル化することで、長いビデオにおける2つのモード間の相互作用に対処する。
本稿では,TIM (Time Interval Machine) を提案する。
我々は、EPIC-KITCHENS、Perception Test、AVEの3つの長い音声視覚ビデオデータセットでTIMをテストする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:30:42 GMT)
SpeechAlign: Aligning Speech Generation to Human Preferences [51.7] 本稿では,言語モデルと人間の嗜好を一致させる反復的自己改善戦略であるSpeechAlignを紹介する。
我々は、SpeechAlignが分散ギャップを埋め、言語モデルの継続的自己改善を促進することができることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:21:17 GMT)
Physics of Language Models: Part 3.3, Knowledge Capacity Scaling Laws [51.7] スケーリング法則は、言語モデルのサイズと能力の関係を記述している。
我々は、ウィキペディアのページから(米国、首都ワシントンD.C.など)ドメインとして表される事実知識に焦点を当てる。
7Bモデルは、英語のウィキペディアと教科書を合わせた14Bビットの知識を保存できる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:11:31 GMT)
CodecLM: Aligning Language Models with Tailored Synthetic Data [51.6] 命令追従能力のための高品質な合成データを適応的に生成するフレームワークであるCodecLMを紹介する。
まず、ターゲットの指示分布をキャプチャするために、オンザフライで生成された簡潔なキーワードであるメタデータにシード命令をエンコードする。
また、デコード中に自己論理とコントラストフィルタを導入し、データ効率の良いサンプルを調整する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:15:36 GMT)
Predicting Overtakes in Trucks Using CAN Data [51.3] CANデータからトラックの積載量の検出について検討する。
私たちの分析では、オーバーテイクイベントの最大10秒前をカバーしています。
我々は、オーバーテイク・トリガーに近づくと、オーバーテイク・クラスの予測スコアが増加する傾向にあることを観察する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:58:22 GMT)
Show Your Work with Confidence: Confidence Bands for Tuning Curves [51.1] チューニング作業の関数としての曲線プロット検証性能。
そこで我々は,曲線のチューニングに有効な信頼帯域を構築するための最初の方法を提案する。
提案手法と比較し,提案手法の有効性を検証し,サンプルサイズの影響を解析し,モデルの比較に関するガイダンスを提供する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:21:53 GMT)
Chinese Tiny LLM: Pretraining a Chinese-Centric Large Language Model [49.6] 2B大言語モデル(LLM)であるCT-LLMを導入する。
CT-LLMは、スクラッチから一意に開始され、中国語のテキストデータを組み込んで従来の手法から分岐する。
CT-LLMは中国語のタスクに優れており、SFTを通して英語で適応性を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:33:57 GMT)
GHOST: Grounded Human Motion Generation with Open Vocabulary Scene-and-Text Contexts [48.3] 本稿では,オープンな語彙シーンエンコーダをアーキテクチャに統合し,テキストとシーン間の堅牢な接続を確立する手法を提案する。
提案手法は,従来の最先端ベースラインモデルと比較すると,目標目標距離距離を最大30%削減する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:24:12 GMT)
A Training-Free Plug-and-Play Watermark Framework for Stable Diffusion [48.0] 既存のアプローチには、トレーサビリティと責任帰属のために生成されたイメージに透かしを埋め込むためのトレーニングコンポーネントやSD全体が含まれる。
AI生成コンテンツ(AIGC)の時代において、SDの迅速なイテレーションは、ウォーターマークモデルによる再トレーニングをコストがかかる。
SDのためのトレーニング不要なプラグアンドプレイ透かしフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:29:46 GMT)
Efficient Quantum Circuit Design with a Standard Cell Approach, with an Application to Neutral Atom Quantum Computers [45.7] 従来の回路設計から借用した標準セルアプローチを用いて量子回路を設計する。
本稿では,自動ルーティング方式と比較してレイアウト対応ルータが大幅に高速で,より浅い3D回路を実現することを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:49:20 GMT)
T-DEED: Temporal-Discriminability Enhancer Encoder-Decoder for Precise Event Spotting in Sports Videos [45.6] T-DEED(T-DEED)は、スポーツビデオにおける精密イベントスポッティングのためのテンポラル・ディスクリミナビリティ・エンハンサー・デコーダである。
フレーム表現間の識別性の必要性、高い出力時間分解能、異なる時間スケールで情報を取得する必要性に対処する。
FigureSkating と FineDiving のデータセット上で SOTA のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:51:29 GMT)
Chinese Sequence Labeling with Semi-Supervised Boundary-Aware Language Model Pre-training [45.4] 現在の事前訓練された言語モデルは、境界情報をモデリングプロセスに明示的に組み込むことは滅多にない。
BABERTは、教師なしの統計境界情報を中国のBERTの事前学習目標に組み込んでいる。
本稿では, シンプルかつ効果的な「境界情報メトリクス」について紹介する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:32:52 GMT)
XL$^2$Bench: A Benchmark for Extremely Long Context Understanding with Long-range Dependencies [45.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著なパフォーマンスを示しているが、その小さなコンテキストウィンドウサイズによって制約されている。
最大200Kの入力トークンに対応するために、コンテキストウィンドウを拡張するための様々な取り組みが提案されている。
XL$2$Bench という,長距離依存によるコンテキスト理解のためのベンチマークを導入する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:29:07 GMT)
NLP Progress in Indigenous Latin American Languages [44.8] この論文は、急速な技術進歩に直面した先住民コミュニティの限界化に焦点を当てている。
これらの言語の文化的豊かさと、自然言語処理の領域で見過ごされるリスクを強調します。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:04:55 GMT)
Ferret-UI: Grounded Mobile UI Understanding with Multimodal LLMs [44.6] モバイルUI画面の理解を深めるためのMLLMであるFeret-UIを提案する。
Ferret-UIはUI画面の優れた理解とオープンエンド命令の実行能力を示す。
Ferret-UIは、ほとんどのオープンソースのUI MLLMを超えるだけでなく、すべての基本的なUIタスクにおいてGPT-4Vを超えている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:55:44 GMT)
Fairness and Bias in Algorithmic Hiring: a Multidisciplinary Survey [43.5] この調査は、システム、バイアス、尺度、緩和戦略、データセット、およびアルゴリズム雇用と公正性の法的側面のバランスよく統合されたカバレッジを持つ実践者や研究者を対象としている。
私たちの仕事は、現在の機会と制限を強調し、すべての利害関係者に対する共有メリットを保証するために、将来の作業に対する推奨を提供することによって、この技術のコンテキスト化された理解とガバナンスを支援します。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:47:39 GMT)
BatSort: Enhanced Battery Classification with Transfer Learning for Battery Sorting and Recycling [42.5] バッテリータイプ分類のための機械学習に基づくアプローチを導入し、アプリケーションにおけるデータ不足の問題に対処する。
本研究では,大規模なデータセットに最適化された既存の知識を活用するために移動学習を適用したBatSortを提案する。
実験の結果,BatSortの精度は平均92.1%,最大96.2%であった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:05:24 GMT)
Process Modeling With Large Language Models [42.1] 本稿では,大規模言語モデル(LLM)のプロセスモデリングへの統合について検討する。
プロセスモデルの自動生成と反復的改善にLLMを利用するフレームワークを提案する。
予備的な結果は、プロセスモデリングタスクを合理化するフレームワークの能力を示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:20:38 GMT)
DPHMs: Diffusion Parametric Head Models for Depth-based Tracking [42.0] 拡散パラメトリックヘッドモデル(DPHM)を紹介する。
DPHMは、単分子深度配列からの堅牢な頭部再構成と追跡を可能にする生成モデルである。
本稿では,ボリュームヘッドの再構築と追跡を正規化するために,遅延拡散に基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:33:12 GMT)
BinaryDM: Towards Accurate Binarization of Diffusion Model [39.8] 拡散モデルの重みを1ビットの限界まで押し上げるための,新しい高精度量子化対応トレーニング手法であるBinaryDMを提案する。
拡散モデルの最初の二項化法として、BinaryDMは16.0倍のFLOPと27.1倍のストレージを1ビットの重みと4ビットのアクティベーションで達成した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:46:25 GMT)
RoT: Enhancing Large Language Models with Reflection on Search Trees [39.6] 本稿では,木探索に基づくプロンプト手法の性能向上を目的としたLLMリフレクションフレームワークであるリフレクション・オン・サーチ・ツリー(RoT)について紹介する。
強力なLLMを使用して、以前の木探索経験からガイドラインを要約し、弱いLLMの能力を高める。
本稿では,RoTがより具体的で意味のあるガイドラインを生成するのを支援するために,歴史的検索プロセスから重要な情報を識別する新しい状態選択法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:31:23 GMT)
Attosecond Rabi Oscillations in High Harmonic Generation Resonantly Driven by Extreme Ultraviolet Laser Fields [36.4] 強紫外(EUV)磁場によって駆動される高次高調波発生は、量子光学とアト秒科学を融合させる。
我々はHe原子と強いEUVパルスの相互作用における超高速共鳴ダイナミクスを理論的に検討した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:01:25 GMT)
Mind-to-Image: Projecting Visual Mental Imagination of the Brain from fMRI [36.2] 視覚的想像力の再構築は、潜在的に革命的なアプリケーションにおいて、より大きな課題をもたらす。
この分野での主なハードルは、視覚画像のためのデータ収集プロトコルの欠如と、対象とするデータセットの欠如である。
我々は、提案したデータ収集プロトコルとともに、視覚画像に関するかなりのデータセット(約6hのスキャン)をコンパイルした。
これは、視覚画像の直接再構成を可能にする技術を構築するための重要なステップである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:46:39 GMT)
Harmonizing SO(3)-equivariance and Expressiveness for Deep Hamiltonian Regression in Crystalline Material Research [36.1] 本稿では,2段階の回帰フレームワークとして,ネットワーク機構の2つのカテゴリを相乗化するハイブリッド手法を提案する。
第1段階は、固有のSO(3)-同変特性を持つ群理論に基づくネットワーク機構に対応する。
第2のステージは、非線形表現性に高い能力を有する非線形3Dグラフ変換器ネットワークによって特徴づけられる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:51:57 GMT)
Sharpness-Aware Minimization and the Edge of Stability [35.3] 勾配降下(GD)をステップサイズ$eta$でトレーニングすると、損失のHessianのノルムが約2/eta$に達するまで増加し、その後この値に変動することを示す。
我々は、Sharpness-Aware Minimization (SAM) の「安定性の端」に到達するための同様の計算を行う。
GDの場合とは異なり、SAM-edgeの結果は勾配のノルムに依存する。3つのディープラーニングトレーニングタスクを用いて、SAMは、この分析によって同定された安定性の端で動作していることを実証的に確認する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:14:43 GMT)
Eagle and Finch: RWKV with Matrix-Valued States and Dynamic Recurrence [35.2] 本稿では,RWKV(RWKV-4)アーキテクチャを改良したシーケンスモデルであるEagle(RWKV-5)とFinch(RWKV-6)を紹介する。
アーキテクチャ設計の進歩には、マルチヘッド行列値状態と動的再帰機構が含まれる。
我々は1.12兆のトークンを持つ新しい多言語コーパスと、強化された多言語性のためのgreedyマッチングに基づく高速トークン化器を導入する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:20:59 GMT)
Mask-ControlNet: Higher-Quality Image Generation with An Additional Mask Prompt [34.9] マスクプロンプトを導入し,Mask-ControlNetというフレームワークを開発した。
マスクは拡散モデルの制御性を高め、参照画像に対する高い忠実性を維持することを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:18:32 GMT)
iVPT: Improving Task-relevant Information Sharing in Visual Prompt Tuning by Cross-layer Dynamic Connection [34.2] 本稿では,新しい視覚的プロンプトチューニング (VPT) 手法である textbfiVPT を提案する。
これは、隣接層からの入力プロンプトトークンのための層間動的接続(CDC)を導入し、タスク関連情報の効果的な共有を可能にする。
これらの基盤の上に構築されたiVPTは、透明な画像トークンを自動的に識別することで、注意力強化(AR)メカニズムを導入している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:23:12 GMT)
Two Hands Are Better Than One: Resolving Hand to Hand Intersections via Occupancy Networks [34.0] 自己閉塞と指の関節は推定に重大な問題を引き起こす。
我々は、手の体積を連続多様体として表す占有ネットワークを利用する。
我々は,手動交差点の可能性を最小限に抑えるために,交差点損失関数を設計する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:32:26 GMT)
PROMISE: A Framework for Developing Complex Conversational Interactions (Technical Report) [33.7] 本稿では,情報システムとの複雑な言語によるインタラクションを開発するためのフレームワークであるPROMISEを提案する。
本稿では、健康情報システムにおけるアプリケーションシナリオの文脈におけるPROMISEの利点を示し、複雑なインタラクションを扱う能力を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:32:31 GMT)
Synthetic data shuffling accelerates the convergence of federated learning under data heterogeneity [33.4] 合成データのシャッフルは、フェデレート学習アルゴリズムの性能を大きなマージンで向上させることを示す。
本稿では、局所的に生成された合成データをシャッフルすることで、データアクセス権問題に対処する実践的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:31:33 GMT)
Learning 3D-Aware GANs from Unposed Images with Template Feature Field [33.3] この研究は、未提示の画像から3D対応のGANを学習することを目的としている。
学習テンプレート特徴場(TeFF)を用いたトレーニング画像のオンザフライポーズ推定を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:42:08 GMT)
SIFU: Side-view Conditioned Implicit Function for Real-world Usable Clothed Human Reconstruction [33.0] 本稿では,Side-view Decoupling Transformerと3D Consistent Texture Refinementパイプラインを組み合わせた新しいアプローチであるSIFUを紹介する。
SMPL-X正規化をクエリとして使用して、2D機能を3Dにマッピングするプロセスにおいて、サイドビュー機能を効果的に分離する。
われわれのアプローチは、3Dプリンティングやシーンビルディングといった実用的応用にまで拡張され、現実世界のシナリオでその幅広い実用性を実証している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:24:30 GMT)
Negative Preference Optimization: From Catastrophic Collapse to Effective Unlearning [28.1] LLM(Large Language Models)は、事前トレーニング中に機密性のある、プライベートな、あるいは著作権のあるデータを持つことが多い。
LLMは、事前学習されたモデルから望ましくないデータの影響を取り除くことを目的としている。
我々は、ターゲットデータセットを効率的に解放できる単純なアライメントにインスパイアされた方法として、NPO(Negative Preference Optimization)を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:05:42 GMT)
SafetyPrompts: a Systematic Review of Open Datasets for Evaluating and Improving Large Language Model Safety [27.8] 我々は、大規模言語モデル(LLM)の安全性を評価し改善するためのオープンデータセットの最初の体系的なレビューを行う。
完全な合成データセットへのトレンドや、非英語データセットの明確な欠如など、データセットカバレッジのギャップといったトレンドを強調します。
当社のコントリビューションは,LLM安全性のためのオープンデータセットのリビングカタログであるSafetyPrompts.comに基づいています。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:57:25 GMT)
Photo-SLAM: Real-time Simultaneous Localization and Photorealistic Mapping for Monocular, Stereo, and RGB-D Cameras [27.5] Photo-SLAMは、ハイパープリミティブマップを備えた新しいSLAMフレームワークである。
そこで我々は,局所化のための明示的な幾何学的特徴を利用して,観測環境のテクスチャ情報を表現するために暗黙的な測光的特徴を学習する。
提案システムは,オンラインフォトリアリスティックマッピングのための最先端SLAMシステムよりも優れている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:17:05 GMT)
OmniGS: Omnidirectional Gaussian Splatting for Fast Radiance Field Reconstruction using Omnidirectional Images [27.5] 現在の3次元ガウス散乱システムは、歪みのない視点画像を用いた放射場再構成しかサポートしていない。
高速な放射野再構成のための全方位画像を利用するため,新しい全方位撮影システムであるOmniGSを提案する。
本手法は,全方位画像を用いた最先端の復元品質と高速レンダリングを実現する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:05:57 GMT)
TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods [27.5] 時系列は、経済、交通、健康、エネルギーといった様々な領域で生成される。
本稿では,時系列予測(TSF)手法の自動ベンチマークであるTFBを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:52:34 GMT)
LLM Reasoners: New Evaluation, Library, and Analysis of Step-by-Step Reasoning with Large Language Models [25.5] 完全自動推論チェーン評価のためのAutoRaceを導入する。
既存の推論アルゴリズムと新しい推論アルゴリズムのモジュール実装を標準化するためのライブラリである LLM Reasoners も開発している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:35:09 GMT)
Have Your Cake and Eat It Too: Toward Efficient and Accurate Split Federated Learning [25.5] Split Federated Learning (SFL)は、AIoTシステムで有望である。
SFLは低い推測精度と低い効率の課題に悩まされている。
本稿では,Sliding Split Federated Learning (S$2$FL) という新しいSFL手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:05:14 GMT)
Have You Merged My Model? On The Robustness of Large Language Model IP Protection Methods Against Model Merging [25.3] モデルマージシナリオにおけるIP保護手法の堅牢性に関する最初の研究を行う。
我々は、量子化ウォーターマーキングと命令フィンガープリントの2つの最先端IP保護技術について検討する。
実験結果から,現在のLarge Language Model (LLM) の透かし技術はマージモデルでは生き残れないが,モデルフィンガープリント技術では生き残ることが示唆された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 04:30:33 GMT)
Foundation Models for Education: Promises and Prospects [24.8] 本稿では,パーソナライズされた学習,教育の不平等,推論能力などの基礎モデルの強みについて論じる。
AIの過信と創造性のリスクと機会を強調します。
我々は、教育の基盤モデルが人間とAIの能力を調和させ、動的で包括的で適応的な教育エコシステムを育む未来を構想する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:59:37 GMT)
SALMONN: Towards Generic Hearing Abilities for Large Language Models [24.7] 音声音声言語音楽オープンニューラルネットワークSALMONNを提案する。
事前訓練されたテキストベースの大規模言語モデル(LLM)と音声および音声エンコーダを単一のマルチモーダルモデルに統合することによって構築される。
これは、そのタイプの最初のモデルであり、汎用的な聴覚能力を持つAIへのステップと見なすことができる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:12:52 GMT)
Detecting Every Object from Events [24.6] 本稿では,イベントベースの視覚において,クラスに依存しない高速なオープンワールドオブジェクト検出を実現するためのアプローチとして,イベント中のすべてのオブジェクトの検出(DEOE)を提案する。
私たちのコードはhttps://github.com/Hatins/DEOEで公開されています。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:20:53 GMT)
360Loc: A Dataset and Benchmark for Omnidirectional Visual Localization with Cross-device Queries [24.3] 本稿では,視覚的ローカライゼーションのための地平線ポーズを持つ360$circ$画像からなる新しいベンチマークデータセットである360Locを紹介する。
360$circ$画像から低FoVクエリフレームを生成するための仮想カメラ手法を提案する。
一方向の視覚的ローカライゼーションは、対称性と繰り返し構造を持つ大規模シーンに挑戦する上で、より堅牢であることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:15:03 GMT)
A First Step Towards Runtime Analysis of Evolutionary Neural Architecture Search [24.1] 本研究は、ENASの数学的ランタイム解析に向けた予備的なステップである。
我々は、二項分類問題を$textscUNIFORM$と定義し、ニューラルネットワークと分類精度の関係を表す明示的な適合関数を定式化する。
理論的な結果は、ローカルとグローバルの突然変異は、$textscUNIFORM$でほぼ同じパフォーマンスを達成していることを示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:36:54 GMT)
Towards AI Safety: A Taxonomy for AI System Evaluation [23.9] 高度なAIの出現は、包括的安全性評価の必要性を前面に浮かび上がらせる。
本稿では,3つのコンポーネントからなる総合的なAIシステム評価フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:49:59 GMT)
Towards Objectively Benchmarking Social Intelligence for Language Agents at Action Level [23.8] 社会シミュレーションタスク (Social Simulation Tasks in Sandbox, STSS) は、マルチエージェントシミュレーションのための言語レベルのベンチマークである。
我々の評価結果は、STSSベンチマークが最先端の言語エージェントに挑戦していることを示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:25:32 GMT)
Semantic Flow: Learning Semantic Field of Dynamic Scenes from Monocular Videos [23.3] モノクロビデオから動的シーンをニューラルネットワークで表現するセマンティックフローのパイオニアです。
まず、動的シーン内のフローを予測するフローネットワークを学習し、ビデオフレームからフロー特徴を抽出するフロー特徴集約モジュールを提案する。
そして,フローの特徴から動き情報を抽出するフローアテンションモジュールを提案し,それに続いてセマンティックネットワークを用いてフローの意味ロジットを出力する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:06:19 GMT)
LGSDF: Continual Global Learning of Signed Distance Fields Aided by Local Updating [22.9] ESDF (Euclidean Signed Distance Field) の暗黙の再構成では、任意の地点から最も近い障害物までの符号付き距離を回帰するためにニューラルネットワークを訓練する。
ローカル更新によるESDF連続グローバル学習アルゴリズムLGSDFを提案する。
複数の場面で得られた結果から,LGSDF は SOTA (State Of The Art) の明示的および暗黙的マッピングアルゴリズムと比較して,より正確な ESDF マップとメッシュを構築可能であることが示された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 04:27:36 GMT)
MoMA: Multimodal LLM Adapter for Fast Personalized Image Generation [22.7] フレキシブルなゼロショット機能を備えたオープン語彙でトレーニング不要なパーソナライズされたイメージモデルであるMoMAを紹介します。
特徴抽出器とジェネレータの両方に二重の役割を果たすために、MoMAをトレーニングします。
本稿では,画像拡散モデルに画像特徴を効率的に伝達する自己注意ショートカット手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:55:49 GMT)
The Hallucinations Leaderboard -- An Open Effort to Measure Hallucinations in Large Language Models [22.7] 大規模言語モデル(LLM)は自然言語処理(NLP)のランドスケープを、人間のようなテキストを理解して生成する優れた能力で変えてきた。
しかし、これらのモデルは幻覚(幻覚)の傾向があり、実際の現実や入力コンテキストと一致しない。
本稿では,各モデルの幻覚発生傾向を定量的に測定し,比較するオープンイニシアチブである幻覚リーダーボードを紹介する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 23:16:22 GMT)
Investigating the Impact of Quantization on Adversarial Robustness [22.6] 量子化は、ディープモデルのビット幅を減らし、実行時のパフォーマンスとストレージ効率を改善する技術である。
現実のシナリオでは、量子化されたモデルは、しばしば逆攻撃に直面する。
我々は、ロバストな最適化を組み込むことのできる量子化パイプラインコンポーネントの影響を、初めて分析する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:20:15 GMT)
Rethinking the Role of Token Retrieval in Multi-Vector Retrieval [22.5] ColBERT (Khattab and Zaharia, 2020) のようなマルチベクトル検索モデルは、クエリとドキュメント間のトークンレベルの相互作用を可能にする。
提案するXTR, ConteXtualized Token Retrieverは, 単純かつ斬新で客観的な関数を導入し, まず最も重要な文書トークンを検索する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:31:32 GMT)
LayoutLLM: Layout Instruction Tuning with Large Language Models for Document Understanding [21.9] 提案手法は,レイアウト対応事前学習とレイアウト対応監視ファインタニングの2つのコンポーネントから構成される。
標準ベンチマークの実験では、提案されたLayoutLLMは、文書理解のためにオープンソースの7B LLMs/MLLMを採用する既存の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:40:28 GMT)
SQATIN: Supervised Instruction Tuning Meets Question Answering for Improved Dialogue NLU [21.8] SQATIN は (i) 命令チューニングと (ii) 質問応答に基づく ID および VE タスクの定式化に基づく対話型 NLU のための新しいフレームワークである。
SQATINは対話型NLUの新たな状態を設定し、現在のモデルの性能を大幅に上回っている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:31:57 GMT)
Exploring the Deceptive Power of LLM-Generated Fake News: A Study of Real-World Detection Challenges [21.4] 条件付き変分オートエンコーダライズプロンプト(VLPrompt)と呼ばれる強力なフェイクニュース攻撃手法を提案する。
現行のメソッドとは異なり、VLPromptはコンテキストコヒーレンスを維持しながら追加のデータ収集を不要にする。
さまざまな検出方法や新しい人間の研究指標を含む実験を行い,その性能をデータセット上で評価した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:55:37 GMT)
Learning Optical Flow and Scene Flow with Bidirectional Camera-LiDAR Fusion [21.4] 同期した2Dデータと3Dデータから光フローとシーンフローを同時推定する問題について検討する。
従来の方法では、ジョイントタスクを独立したステージに分割する複雑なパイプラインを使用するか、アーリーフュージョンまたはレイトフュージョンの方法で2Dと3D情報を融合する。
本稿では,2次元および3次元の分岐からなり,各層に複数方向の融合接続を施した新しいエンドツーエンドフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:02:40 GMT)
Efficiently Tackling Million-Dimensional Multiobjective Problems: A Direction Sampling and Fine-Tuning Approach [21.2] 我々は,超大規模多目的最適化問題を,10万以上の決定変数を持つ多重目的量 (VLSMOP) の最適化として定義する。
超大規模多目的最適化フレームワーク(VMOF)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:30:56 GMT)
Enhancing Lip Reading with Multi-Scale Video and Multi-Encoder [21.2] リップリーダーは、ビデオで捉えたスピーカーのサイレントな唇の動きから、音声コンテンツを自動で書き起こすことを目的としている。
マルチスケールビデオデータとマルチエンコーダを組み込むことにより,リップリーディングを向上させることを提案する。
提案手法はICME 2024 ChatCLR Challenge Task 2で2位となった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:44:24 GMT)
PEEB: Part-based Image Classifiers with an Explainable and Editable Language Bottleneck [20.9] クラス名が不明なゼロショット設定では、PEEBはCLIPをはるかに上回っている。
PEEBは、教師付き学習環境(CUB-200とDogs-120でそれぞれ88.80%と92.20%の精度)における最先端技術(SOTA)であるだけでなく、ユーザーがテキスト記述子を編集して再訓練せずに新しい分類子を作成できるようにする最初の方法でもある。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:17:24 GMT)
ITA-ECBS: A Bounded-Suboptimal Algorithm for Combined Target-Assignment and Path-Finding Problem [20.1] ITA-ECBS を ITA-CBS の最初の有界-準最適変種として紹介する。
ITA-ECBSは,54,033例中87.42%でベースライン法であるCBS-TAよりも優れていた。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:36:42 GMT)
GeniL: A Multilingual Dataset on Generalizing Language [19.4] 生成言語におけるステレオタイプの存在を評価するための現在の手法は、単純なテンプレートや共起に基づく尺度に依存している。
意味的文脈を理解することは一般化の事例を検出するために重要であると論じる。
我々は、一般化の例に注釈を付けた9言語から50K以上の文からなる多言語データセットGeniLを構築した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:58:06 GMT)
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations [19.4] 3次元拡散政策(DP3)は、新しい視覚模倣学習手法である。
実験では、DP3は10のデモでほとんどのタスクを処理し、24.2%の相対的な改善でベースラインを超えた。
実際のロボット実験では、DP3は頻繁に行う基準法とは対照的に、安全要件にほとんど違反しない。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:46:38 GMT)
Reconstruction of dynamical systems from data without time labels [19.3] タイムラベルのないデータは、分子動力学、シングルセルRNAシークエンシングなど、多くのアプリケーションに現れる。
本稿では,確率分布から得られたデータをサンプルとして扱い,基礎となる力学系を再構築することを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:42:44 GMT)
UAV-Rain1k: A Benchmark for Raindrop Removal from UAV Aerial Imagery [19.0] UAVのレンズに付着した雨滴は、背景の視認性を阻害し、画質を低下させる。
まず,UAV画像から雨滴を除去するUAV-Rain1kというベンチマークデータセットを構築した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:28:13 GMT)
S$^{5}$Mars: Semi-Supervised Learning for Mars Semantic Segmentation [18.9] 火星のセマンティックセグメンテーションは、ローバーの自律計画と安全な運転の基盤である重要な火星ビジョンタスクである。
優れたモデルを得るためには、ほとんどのディープラーニングメソッドが正確に要求する、十分な詳細かつ高信頼のデータアノテーションが欠如している。
本稿では,共同データと手法設計の観点からその解決策を提案する。
実験結果から,本手法は最先端のSSL手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:11:22 GMT)
Single Mesh Diffusion Models with Field Latents for Texture Generation [18.8] 本稿では,3次元形状の表面に直接作用する固有潜在拡散モデルを提案する。
私たちは、メッシュ上の特定のテクスチャのバリエーションを生成するために、モデルがトレーニングされる、単一テクスチャ・メシュのパラダイムを考えています。
我々のモデルは、インペイントやラベル誘導生成などのユーザ制御編集タスクにも適応できる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:40:01 GMT)
Eraser: Jailbreaking Defense in Large Language Models via Unlearning Harmful Knowledge [18.7] 脱獄攻撃により、Large Language Models (LLM) は保護をバイパスし、有害なコンテンツを生成することができる。
既存のジェイルブレイク防御手法は、有害な知識がモデルの中に存在するという根本的な問題に対処できなかった。
本稿では,有害な知識の学習,一般知識の保持,安全性の維持という3つの目標を主目的として,エラザーと呼ばれる新しい防衛手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:26:22 GMT)
Effectiveness of Tree-based Ensembles for Anomaly Discovery: Insights, Batch and Streaming Active Learning [18.5] 本論文は,木に基づくアンサンブルを用いた異常発見の最先端化に大きく貢献する。
我々は,発見された異常の多様性を改善するために,新しいバッチ能動的学習アルゴリズムを開発した。
本稿では, ドリフトを頑健に検出するだけでなく, 異常検出を原理的に適応するための補正行動を行えるデータドリフト検出アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:23:50 GMT)
AV2Wav: Diffusion-Based Re-synthesis from Continuous Self-supervised Features for Audio-Visual Speech Enhancement [18.2] AV2Wavは再合成に基づく音声視覚音声強調手法である。
我々は、韻律や話者情報を保持するために、離散表現よりも連続表現を用いる。
提案手法は,自動計測と人間の聴取テストの両方の観点から,マスキングベースのベースラインよりも優れている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:23:21 GMT)
Nonadiabatic Field with Triangle Window Functions on Quantum Phase Space [18.2] 我々は、トライアングルウィンドウ(TW)関数とCPSマッピングカーネル要素を用いて、離散電子自由度(DOF)の新しい有用な表現を定式化する。
対称準古典 (SQC) 法と比較して, 領域内の原子運動の分岐特性が重要である場合, NaF-TWの性能は著しく向上する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:04:43 GMT)
CoReS: Orchestrating the Dance of Reasoning and Segmentation [17.8] セグメンテーションを推論する行為は、人間の視覚探索の認知段階を反映すべきである。
本稿では,Reasoning and Segmenting (CoReS) の連鎖を紹介する。
実験では、ReasonSegデータセットで最先端の手法を7.1%上回るCoReSの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:55:39 GMT)
DLoRA: Distributed Parameter-Efficient Fine-Tuning Solution for Large Language Model [17.7] DLoRAと呼ばれる分散パラメータ効率の微調整フレームワークを提案する。
DLoRAはスケーラブルなPEFT操作をクラウドとユーザデバイス間で協調的に実行可能にする。
DLoRAは、ユーザのデバイス上での計算と通信の負荷を大幅に低減し、精度とプライバシ保護に優れることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 04:14:02 GMT)
Understanding the Learning Dynamics of Alignment with Human Feedback [17.4] 本稿では,人間の嗜好アライメントの学習力学を理論的に解析する試みについて述べる。
選好データセットの分布がモデル更新率にどのように影響するかを示し、トレーニング精度に厳密な保証を与える。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:51:17 GMT)
Class Similarity Transition: Decoupling Class Similarities and Imbalance from Generalized Few-shot Segmentation [17.3] 本稿では, 基本クラスと新規クラスの関連性に着目し, 一般ファウショット(GFSS)の改良について述べる。
まず,基本クラス知識を持つ新しいクラスを学習するための類似性遷移行列を提案する。
次に、GFSSタスクにLDAM損失とトランスダクティブ推論を利用して、クラス不均衡の問題に対処する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 00:13:05 GMT)
Rethinking the Spatial Inconsistency in Classifier-Free Diffusion Guidance [17.3] テキストと画像の拡散モデルにおいて,異なる意味単位に対して指導度をカスタマイズする新しい手法を提案する。
我々は,各意味領域のCFG尺度を適応的に調整し,テキスト誘導度を均一なレベルに再スケールする。
実験は、様々なテキスト・画像拡散モデルにおける元のCFG戦略よりもS-CFGの方が優れていることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:45:29 GMT)
Human Detection from 4D Radar Data in Low-Visibility Field Conditions [17.2] 現代の4Dイメージングレーダは、範囲、垂直角度、水平角度、ドップラー速度の寸法にわたってターゲット応答を提供する。
セマンティックセグメンテーションにこの4Dレーダモダリティを利用するCNNアーキテクチャTMVA4Dを提案する。
このデータセット上でTMVA4Dを用いてmIoUスコア78.2%、mDiceスコア86.1%を達成し、背景と人物の2つのクラスで評価した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:53:54 GMT)
A Symbolic Framework for Evaluating Mathematical Reasoning and Generalisation with Transformers [17.1] 我々は変圧器の分布外数学的推論問題への一般化性を評価する。
GPT-4, GPT-3.5, 細調整BERTモデルのキャノンの比較を行った。
驚いたことに, 細調整モデルの平均分布性能がGPT-3.5を超え, ライバルのGPT-4を上回っていることが判明した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:29:06 GMT)
Multitask Online Learning: Listen to the Neighborhood Buzz [17.0] エージェントは任意の通信ネットワーク上で、隣人との情報交換しかできない環境で、マルチタスクオンライン学習を研究する。
我々は,タスク類似性とネットワーク構造との相互作用に依存するこの設定のための分散アルゴリズムである$textttMT-COtextttOL$を紹介した。
我々の分析によると、$textttMT-COtextttOL$の後悔は、エージェントが情報を共有していない場合に得られる境界よりも決して悪くはない(定数まで)。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:42:16 GMT)
SphereHead: Stable 3D Full-head Synthesis with Spherical Tri-plane Representation [17.0] PanoHeadは、正面と後方の両方のビューの画像をフルヘッド合成するために、大規模なデータセットを使用することの可能性を証明している。
本研究では,人間の頭部の幾何学的特徴に適合する球面座標系における新しい三面体表現であるSphereHeadを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:58:31 GMT)
Social-MAE: Social Masked Autoencoder for Multi-person Motion Representation Learning [16.9] マルチ対人動作データのためのトランスフォーマーベースのマスク付きオートエンコーダフレームワークであるSocial-MAEを紹介する。
このフレームワークは、マスク付きモデリングを使用して、エンコーダを事前訓練し、マスク付きヒト関節軌道を再構築する。
それは、多人数のポーズ予測、社会的グループ化、社会的行動理解など、様々な高度な社会的タスクに関する最先端の結果を達成する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:54:54 GMT)
Unsupervised Band Selection Using Fused HSI and LiDAR Attention Integrating With Autoencoder [16.7] ハイパースペクトルイメージング(HSI)における帯域選択は,データ処理の最適化と解析精度の向上に重要である。
従来のアプローチは、個々のバンド内のスペクトル特性と画素特性を独立して分析することに集中してきた。
本稿では、アテンション機構と、再構成に基づくバンド選択のためのオートエンコーダを組み込んだ、新しい教師なしバンド選択フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:47:28 GMT)
SambaLingo: Teaching Large Language Models New Languages [16.7] 我々は,LLMの新たな言語への適応に関する包括的調査を行う。
本研究は,語彙拡張や直接選好最適化など,このプロセスの主要なコンポーネントについて述べる。
9つの言語と2つのパラメータスケールでこれらの実験をスケールします。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:48:36 GMT)
A Neuromorphic Approach to Obstacle Avoidance in Robot Manipulation [16.7] カメラ搭載マニピュレータにおける障害物回避のためのニューロモルフィックアプローチを開発する。
提案手法は, 畳み込みSNNでエミュレートされたイベントデータを処理し, 反応操作による高次軌道計画に適応する。
本研究は,SNN学習の導入,ニューロモルフィックプロセッサの利用,およびニューロモルフィック手法の可能性を探るものである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:42:10 GMT)
Plug and Play with Prompts: A Prompt Tuning Approach for Controlling Text Generation [16.5] 大規模言語モデル(LLM)は、テキストベースのプロンプトに応答して、例外的な言語生成能力を示す。
本研究では,制御言語生成におけるPrompt Tuningの利用について検討する。
本稿では, 言語モデルによる有害, 有害, 偏見のあるテキストを緩和する手法の有効性を実証する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:54:28 GMT)
REMARK-LLM: A Robust and Efficient Watermarking Framework for Generative Large Language Models [16.2] 大規模言語モデル(LLM)のための新しい効率的で堅牢な透かしフレームワークREMARK-LLMを提案する。
ReMARK-LLMは、透かしのある内容における意味的整合性の保存を促進するために厳格に訓練されている。
透かしの検出と除去攻撃に対してより優れたレジリエンスを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 00:16:46 GMT)
Comprehensive Study on German Language Models for Clinical and Biomedical Text Understanding [16.2] 我々は、翻訳された英語の医療データとドイツの臨床データの3Bトークンから2.4Bトークンを抽出し、いくつかのドイツの医療言語モデルを事前訓練した。
得られたモデルは、名前付きエンティティ認識(NER)、多ラベル分類、抽出質問応答など、様々なドイツの下流タスクで評価された。
本研究は, 臨床モデルとスクラッチからトレーニングした成績を一致させたり, 上回ったりする能力が, 連続事前訓練によって実証されていることを結論する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:24:04 GMT)
Responsible Generative AI: What to Generate and What Not [15.9] 生成AI(GenAI)は様々な領域で注目されている。
本稿では,テキスト生成モデルと視覚生成モデルの両方の実用的責任要件について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:53:21 GMT)
Towards More General Video-based Deepfake Detection through Facial Feature Guided Adaptation for Foundation Model [15.6] 本研究では、ファンデーションモデルの内部に符号化されたリッチ情報に、内部に符号化されたリッチ情報を適応させることにより、新しいディープフェイク検出手法を提案する。
近年のパラメータ効率の良い微調整技術に触発されて,新しいサイドネットワーク型デコーダを提案する。
提案手法は,見知らぬディープフェイクサンプルの同定に優れた有効性を示し,顕著な性能向上を実現している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:58:52 GMT)
Rediscovery of Numerical Lüscher's Formula from the Neural Network [15.4] 連続空間における位相シフトから離散空間におけるスペクトルを予測することにより、ニューラルネットワークは数値L"uscherの公式を高い精度で再現することができる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:32:02 GMT)
MMIDR: Teaching Large Language Model to Interpret Multimodal Misinformation via Knowledge Distillation [15.3] MMIDRは,マルチモーダル誤報の意思決定プロセスにおいて,文章の質や質の良質な説明を提供するためのフレームワークである。
マルチモーダルな誤情報を適切な命令追従形式に変換するために,データ拡張の視点とパイプラインを示す。
さらに, オープンソースのLLMに多モード誤情報を説明するために, プロプライエタリなLLMを蒸留する効率的な知識蒸留手法を設計する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:30:06 GMT)
Fumbling in Babel: An Investigation into ChatGPT's Language Identification Ability [15.3] 我々はChatGPT(GPT-3.5とGPT-4の両方)の言語名と言語コードを識別する能力について検討した。
小型のLIDツールと比較すると、ChatGPTが遅れていることが分かります。
現在の大規模言語モデルは、多様なコミュニティに十分なサービスを提供する前に、さらなる開発から恩恵を受けるだろうと結論付けている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:57:40 GMT)
A parameter-free clustering algorithm for missing datasets [15.0] 欠落したデータセットに対する既存のクラスタリングアルゴリズムは、まず欠落した値を暗示し、次にクラスタリングを実行する。
入力パラメータが多すぎると、正確なクラスタリング結果を得るのが困難になる。
本研究では,SDCという単一次元クラスタリングアルゴリズムを提案する。このアルゴリズムは計算処理を除去し,決定グラフを欠落したデータセットに適応させる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:57:02 GMT)
Requirements Elicitation in Government Projects: A Preliminary Empirical Study [15.0] 政府開発計画は、範囲、利害関係者の複雑さ、規制要件の民間セクターイニシアチブと大きく異なる。
政府プロジェクトに特化した要求工学活動に焦点を当てた実証研究が欠如している。
政府プロジェクトに取り組む12人のプロソフトウェア実践者との半構造化されたインタビューを行った。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:50:40 GMT)
Deep Clustering Survival Machines with Interpretable Expert Distributions [14.9] 本稿では,ディープクラスタリングサバイバルマシンと呼ばれるハイブリッドサバイバル解析手法を提案する。
個々のインスタンスに対する専門的分布の重み付けは,特徴を識別的に学習する。
この方法は、関連する専門家分布に従って、すべてのインスタンスの解釈可能なサブグループ化/クラスタ化を容易にする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:57:42 GMT)
Indexing Analytics to Instances: How Integrating a Dashboard can Support Design Education [14.5] デザイン分析ダッシュボードをデザインインスタンスと統合した研究成果物と、学生がそれを作成するために使用するデザイン環境を開発する。
我々は、AIに基づくデザイン分析が、あるコースコンテキストにおけるインストラクターのアセスメントとフィードバック体験をどのようにサポートするかに対処する研究内容を開発する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:33:58 GMT)
A Unified Masked Autoencoder with Patchified Skeletons for Motion Synthesis [14.3] 本稿では,UNIMASK-Mと呼ばれる新しいタスク独立モデルを提案する。
Vision TransformersVi (Ts)にインスパイアされた私たちのUNIMASK-Mモデルは、人間の動きに存在する時間的関係を活用するために、人間のポーズを身体の一部に分解する。
実験の結果,Human3.6Mデータセット上での人間の動きの予測に成功していることがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:47:20 GMT)
What if you have only one copy? Low-depth quantum circuits have no advantage in decision problems! [14.3] 単一状態のサンプルであっても,特定の特性に対する洞察の収集が可能であることを示す。
この結果は、ノイズの影響のある量子状態を含む、回路の複雑さの低い量子状態に適用できる。
低深度量子回路を含む決定問題において、量子上の優位性は明らかにしない。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:52:03 GMT)
Privacy-Preserving Deep Learning Using Deformable Operators for Secure Task Learning [14.2] 既存のプライバシー保護方法は、画像暗号化や知覚変換アプローチに依存している。
安全なタスク学習に変形可能な演算子の集合を用いる新しいプライバシ保存フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:46:20 GMT)
Robust Human Motion Forecasting using Transformer-based Model [14.1] 本研究では,リアルタイムな3次元人体動作予測を短時間・長期で処理するTransformerに基づく新しいモデルを提案する。
本モデルでは, 騒音の多い環境下での3次元動作の復元と予測において, 人間の動きが著しく抑制されている状況において, その頑健さを実証する。
我々のモデルは,400msの入力プレフィックスを持つHumanre3.6Mデータセットにおいて,短期予測におけるST-Transformerの平均2乗誤差を8.89%,長期予測で2.57%削減する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:48:50 GMT)
Graph Neural Networks Automated Design and Deployment on Device-Edge Co-Inference Systems [13.9] グラフニューラルネットワーク(GNN)の最初の自動フレームワークであるGCoDEを紹介する。
GCoDEは、共同最適化のための統一された空間におけるアーキテクチャとオペレーションマッピングの探索を融合する。
GCoDEは、既存のアプローチと比較して最大44.9倍のスピードアップと980.2%のエネルギー削減を実現可能である。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:25:25 GMT)
Memory Effects in Quantum State Verification [13.9] ローカル検証器は量子状態のコピーを格納し、それらをまとめて測定することができる。
我々は,ベル測度のみを含む多ビットグラフ状態に対して,2コピー状態検証を最適化するための正確な解析式を確立し,グローバルに最適な2コピー戦略を与える。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:19:02 GMT)
360+x: A Panoptic Multi-modal Scene Understanding Dataset [13.8] 360+xは、複数の視点を複数のデータモダリティでカバーする最初のデータベースである。
私たちの知る限りでは、このデータベースは、複数の視点を複数のデータモダリティでカバーし、日々の情報が現実世界でどのようにアクセスされているかを模倣する最初のデータベースです。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:37:25 GMT)
Just Wing It: Optimal Estimation of Missing Mass in a Markovian Sequence [13.6] emphWindowed Good-Turing (textscWingIt) と呼ばれる線形実行時推定器を開発した。
リスクは$widetildemathcalO(mathsfT_mix/n)$で、$mathsfT_mix$は全変動距離におけるチェーンの混合時間を表す。
我々は推定器を拡張して、Xn$の小さな周波数で発生する要素上の定常質量を近似する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:55:07 GMT)
On the Effectiveness of Log Representation for Log-based Anomaly Detection [13.0] 本研究は,従来のログ解析研究から広く採用されているログ表現技術について検討し,比較する。
6つのログ表現手法を選択し、7つのMLモデルと4つの公開ログデータセットで評価する。
また、ログ表現技術を採用する際に、ログ解析プロセスと異なる特徴集約アプローチの影響についても検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:06:03 GMT)
Bridging Algorithmic Information Theory and Machine Learning: A New Approach to Kernel Learning [12.8] 我々は,スパースカーネルフローの手法を用いて,データからカーネルを学習する問題に対するAIIの視点を採用する。
このアプローチは、AITのツールを使用して機械学習のアルゴリズムを再構築する扉を開く。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:55:36 GMT)
STMGF: An Effective Spatial-Temporal Multi-Granularity Framework for Traffic Forecasting [12.8] 本稿では,道路網の長距離・長期情報収集を促進するため,時空間多言語フレームワーク(STMGF)と呼ばれる新しいフレームワークを提案する。
STMGFは、道路網の粒度情報を完全に活用し、階層的インタラクティブな方法で情報を集めることにより、長距離および長期の情報をモデル化する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:38:52 GMT)
Burst Super-Resolution with Diffusion Models for Improving Perceptual Quality [12.7] バーストLR画像を受け入れる以前のSRネットワークは、曖昧なSR画像を生成することが知られている決定論的方法で訓練される。
このようなぼやけた画像は知覚的に劣化しているので、我々は鋭い高忠実度境界を再構築することを目指している。
一方,提案手法では,初期バーストSR画像の再構成にバーストLR特性を用いる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:18:33 GMT)
Relation Extraction Using Large Language Models: A Case Study on Acupuncture Point Locations [12.6] GPT (Generative Pre-trained Transformers) は、キューポイント位置に関連する関係を抽出する重要な機会を提供する。
本研究では,GPTと従来の深層学習モデル(LSTM)とバイオメディカルテキストマイニング用トランスフォーマー(BioBERT)の双方向表現を比較した。
微調整のGPT-3.5は、全ての関係型でF1スコアの他のモデルよりも一貫して優れていた。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:33:00 GMT)
Unsupervised Training of Convex Regularizers using Maximum Likelihood Estimation [12.6] 我々は、凸ニューラルネットワーク正規化器の学習のための教師なしベイズ訓練手法を提案する。
古典的教師付き逆正則化法と比較して,自然画像ガウシアンデコンボリューションとポアソンデノナイズタスクの密接な性能を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:27:00 GMT)
MOSE: Boosting Vision-based Roadside 3D Object Detection with Scene Cues [12.5] Scene cuEsを用いたMonocular 3Dオブジェクト検出のための新しいフレームワークMOSEを提案する。
シーンキューバンクは、同じシーンの複数のフレームからシーンキューを集約するように設計されている。
トランスベースのデコーダは、集約されたシーンキューと3Dオブジェクト位置のための3D位置埋め込みをリフトする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:11:56 GMT)
A Benchmark Grocery Dataset of Realworld Point Clouds From Single View [12.4] 微細な食料品の物体認識は、自動チェックアウト、店内ロボットナビゲーション、視覚障害者のための補助技術など幅広い用途において重要なコンピュータビジョン問題である。
既存の食料品のデータセットは主に2Dイメージである。これらのデータセットでトレーニングされたモデルは、通常の2Dグリッドからの学習機能に限られる。
モバイル3Dセンサーが利用可能であるにもかかわらず、現在、食料品用の大規模な3Dデータセット専用のリアルタイムベンチマークは存在しない。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:36:23 GMT)
Exploiting Preference Elicitation in Interactive and User-centered Algorithmic Recourse: An Initial Exploration [12.2] Algorithmic Recourseは、自動化された機械学習モデルによって下される潜在的に望ましくない決定を覆すために、実行可能な説明、またはリコースプランを提供することを目的としている。
本稿では,ユーザの嗜好を抽出し,効果的なリコース介入に向かわせることを目的とした,ガイド付きインタラクションパターンに基づくインタラクションパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:00:05 GMT)
Deep Representation Learning for Multi-functional Degradation Modeling of Community-dwelling Aging Population [12.1] 本研究では,多機能劣化モデリングのための新しいフレームワークを提案する。
本手法は,高齢者の健康史から健康劣化のスコアを予測し,潜伏した不均一性を明らかにする。
実際のケーススタディでは、高齢者の劣化の複雑なダイナミクスを正確にモデル化する上で、有効性を示し、重要な貢献をしている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:40:22 GMT)
Label Propagation Training Schemes for Physics-Informed Neural Networks and Gaussian Processes [12.0] 本稿では,物理情報を用いた機械学習手法の訓練のための半教師付き方法論を提案する。
本稿では,これらの手法が情報伝達の時間を短縮する方法について述べる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:41:55 GMT)
Robust Data Pruning: Uncovering and Overcoming Implicit Bias [11.9] 我々は、この効果を初めて体系的に研究し、既存のデータプルーニングアルゴリズムが高度に偏りのある分類器を生成することを明らかにした。
本稿では,標準的なコンピュータビジョンベンチマークにおいて,その性能を実証的に実証する「フェアネス・アウェア」アプローチを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:55:35 GMT)
Rethinking Information Structures in RLHF: Reward Generalization from a Graph Theory Perspective [11.9] 本稿では,大言語モデル(LLMs)上で検証された予測を生成することができる報奨一般化の第一理論を紹介する。
木構造的嗜好データセットに基づいてトレーニングされた木構造報酬モデル(RM)は,$Theta(log n/loglog n)$がベースラインよりも分散度が低く,$n$がデータセットサイズであることを示す。
データセット情報構造の設計により、他の変更を必要とせずにアライメント性能を無償で取得できることが示されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:50:17 GMT)
TrailBlazer: Trajectory Control for Diffusion-Based Video Generation [11.7] テキスト・ツー・ビデオ(T2V)生成における制御性はしばしば課題である。
我々はキーフレーミングの概念を導入し、対象の軌跡と全体の外観を移動境界ボックスと対応するプロンプトの両方でガイドできるようにする。
箱の大きさが大きくなるにつれて、視界や仮想カメラへの移動といった新たな効果が生まれます。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:40:31 GMT)
Strict area law implies commuting parent Hamiltonian [11.6] 量子状態が厳密な領域法則に従って絡み合うエントロピーを持つとき、通勤親ハミルトニアンが認められることを示す。
より一般に、2次元における絡み合いブートストラップ公理は、通勤親ハミルトニアンの存在を暗示する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:01:49 GMT)
Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models [11.6] 我々は、大きな言語モデルを用いて、ウィキペディアのページに匹敵する幅と深さの長い記事をスクラッチから書く方法を研究した。
本稿では,検索と複数パースペクティブ質問応答によるトピックアウトライン生成のための記述システムSTORMを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:38:50 GMT)
Allowing humans to interactively guide machines where to look does not always improve a human-AI team's classification accuracy [11.6] 我々はCHM-Corr上にインタラクティブなインタフェースを構築し、CHM-Corrが提供する初期特徴属性マップを編集する。
ユーザスタディでは,静的な説明よりもCUB-200の鳥画像分類において,対話的アプローチはユーザの精度を向上しないことが示された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:09:15 GMT)
Robust Qubit Mapping Algorithm via Double-Source Optimal Routing on Large Quantum Circuits [11.4] Duostraは、実際のハードウェアデバイスで大規模量子回路を実装するという課題に対処するために設計されている。
ダブルキュービットゲートの最適経路を効率よく決定し、SWAPゲートを挿入することで動作する。
合理的なランタイム内で、良質な結果が得られます。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:55:12 GMT)
Deep Optics for Video Snapshot Compressive Imaging [10.8] ビデオ・スナップショット・イメージング(SCI)は、2D検出器の1枚のショットだけでビデオ・フレームのシーケンスをキャプチャすることを目的としている。
本稿では,マスクと再構成ネットワークを協調的に最適化する枠組みを提案する。
これは、現実世界のビデオSCIのマイルストーンだ、と私たちは信じている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:04:44 GMT)
Humanoid-Gym: Reinforcement Learning for Humanoid Robot with Zero-Shot Sim2Real Transfer [10.8] Humanoid-GymはNvidia Isaac Gymをベースにした、使いやすい強化学習フレームワークである。
アイザック・ギム(Isaac Gym)からムジョコ(Mujoco)までのSim-to-simフレームワークは、トレーニングされたポリシーを異なる物理シミュレーションで検証することを可能にする。
このフレームワークは、ZeroEraのXBot-SとXBot-Lによって、ゼロショットのsim-to-real転送を持つ実環境において検証される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:26:28 GMT)
LLsM: Generative Linguistic Steganography with Large Language Model [10.7] 言語ステガノグラフィー(LS)タスクは、秘密情報に基づいてステガノグラフィーテキスト(ステゴ)を生成することを目的としている。
既存のLS法は、特定の言説を含むステゴの制御可能な生成を考慮していない。
本稿では,Large Language Model (LLM) を用いた最初のLSである LLsM を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:50:39 GMT)
Energy-Calibrated VAE with Test Time Free Lunch [10.7] 可変オートエンコーダ(VAE)の強化のための条件付きエネルギーベースモデル(EBM)を提案する。
VAEは、生成方向に生成されたサンプルの調整されたトレーニングが欠如しているため、しばしばぼやけた生成サンプルに悩まされる。
我々は,EC-VAEの校正アイデアを変分学習と正規化フローに拡張し,ニューラルトランスポートとレンジヌル理論によるゼロショット画像復元にEC-VAEを適用した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:49:58 GMT)
The T-Complexity Costs of Error Correction for Control Flow in Quantum Computation [10.7] 多くの量子アルゴリズムは、物理量子ビットの不確実性を克服するために量子エラー補正を使用する必要がある。
エラー訂正は、T-複雑性(T-complexity)と呼ばれるパフォーマンスボトルネックを課し、アルゴリズムの実装を理想化されたハードウェアよりも遅く実行することができる。
本稿では,プログラムのT-複雑度を分析し,遅延の原因を特定するために,開発者が利用できるコストモデルを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:34:57 GMT)
From "AI" to Probabilistic Automation: How Does Anthropomorphization of Technical Systems Descriptions Influence Trust? [10.6] 本稿では,いわゆる「AI」制度の人為的形態的記述が,システムに対する信頼の自己評価に与える影響について検討する。
参加者は、全体的な非人為的製品記述よりも、人為的な製品記述を信頼しがちである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:01:09 GMT)
The Role of Code Proficiency in the Era of Generative AI [10.5] ジェネレーティブAIモデルは、開発者ワークスペースに不可欠なものになりつつある。
しかし、これらのモデルの多くに「ブラックボックス」の性質があるため、課題が浮かび上がっている。
このポジションペーパーは、これらの生成モデルに対する「白い箱」アプローチを提唱する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:20:42 GMT)
The Impact of Sanctions on GitHub Developers and Activities [10.5] GitHubは真にグローバルなソフトウェアの開発を加速させた。
ソフトウェアがグローバルな政治や社会規制に結びつくにつれ、同様に政府の制裁の対象にもなっていく。
2019年、GitHubは特定の場所にいるユーザの特定のサービスへのアクセスを制限したが、一部のコミュニティでこれらの制限をロールバックした。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:11:11 GMT)
Towards Optimal Circuit Size for Quantum Sparse State Preparation [10.4] 我々は、$s$非ゼロ振幅を持つ$n$量子ビットスパース量子状態の準備を検討し、2つのアルゴリズムを提案する。
最初のアルゴリズムは$O(ns/log n + n)$ gatesを使用し、以前のメソッドを$O(log n)$で改善する。
2番目のアルゴリズムは、短いハミルトニアンパスを示す二進弦向けに調整されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:13:40 GMT)
CARE: Causality Reasoning for Empathetic Responses by Conditional Graph Generation [10.2] 因果推論のための新しいモデル、すなわち条件変分グラフオートエンコーダ(CVGAE)を開発した。
この枠組み全体をCARE(CAusality Reasoning for Empathetic conversation)と命名した。
実験結果から,本手法は最先端性能を実現することが示唆された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:31:20 GMT)
Fedstellar: A Platform for Decentralized Federated Learning [10.0] 2016年、Googleはフェデレーション(FL)を、フェデレーションの参加者間で機械学習(ML)モデルをトレーニングするための新しいパラダイムとして提案した。
本稿では,Fedstellarについて述べる。Fedstellarは,多種多様なフェデレーションにまたがる分散化・半分散化・集中化方式でFLモデルを学習するためのプラットフォームである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:38:11 GMT)
Robot Interaction Behavior Generation based on Social Motion Forecasting for Human-Robot Interaction [9.8] 本稿では,共有ロボット表現空間における社会的動き予測のモデル化を提案する。
ECHOは上記の共有空間で活動し、社会的シナリオで遭遇したエージェントの将来の動きを予測する。
我々は,多対人動作予測タスクにおけるモデルの評価を行い,最先端の性能を大きなマージンで獲得する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:43:14 GMT)
ImitationNet: Unsupervised Human-to-Robot Motion Retargeting via Shared Latent Space [9.8] 本稿では,ロボットの動きに対する新しいディープラーニング手法を提案する。
本手法では,新しいロボットへの翻訳を容易にする,人間とロボットのペアデータを必要としない。
我々のモデルは、効率と精度の観点から、人間とロボットの類似性に関する既存の研究よりも優れています。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:44:31 GMT)
Know When To Stop: A Study of Semantic Drift in Text Generation [9.8] 現代のLSMは、まず正しい事実を生成し、次に「引き離し」、後に誤った事実を生成する傾向があることを示す。
この誤生成パターンは、いつ生成を中止すべきかを知ることで、事実精度を向上させることができることを示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:25:30 GMT)
Confronting Ambiguity in 6D Object Pose Estimation via Score-Based Diffusion on SE(3) [9.7] 単一のRGB画像から6Dオブジェクトのポーズを推定することは大きな課題である。
本稿では,$SE(3)$群に適用した新しいスコアベース拡散法を提案する。
広汎な評価は、その方法があいまいさに対処し、視点によって引き起こされるあいまいさを緩和する効果を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:28:38 GMT)
SiT-MLP: A Simple MLP with Point-wise Topology Feature Learning for Skeleton-based Action Recognition [9.7] グラフネットワーク(GCN)は骨格に基づく行動認識において顕著な性能を発揮している。
従来のGCNベースの手法は、精巧な人間の先行を過度に頼り、複雑な特徴集約機構を構築した。
本研究では骨格に基づく行動認識のための新しいモデルSiT-MLPを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:09:27 GMT)
Stochastic Online Optimization for Cyber-Physical and Robotic Systems [9.4] 本稿では,サイバー物理・ロボットシステムの文脈におけるプログラミング問題の解決のための新しいオンラインフレームワークを提案する。
我々の問題定式化制約は、一般に連続状態とアクション空間が非線形であるサイバー物理システムの進化をモデル化する。
我々は, 力学の粗い推定でも, アルゴリズムの収束性を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:08:59 GMT)
Taming Transformers for Realistic Lidar Point Cloud Generation [9.4] LidarGRITは、自動回帰変換器を用いて、画像空間ではなく潜在空間内のレンジ画像を反復的にサンプリングする生成モデルである。
以上の結果から,LidarGRITは,KITTI-360およびKITTIオドメトリーデータセット上のSOTAモデルと比較して,優れた性能を示すことが示された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:27:07 GMT)
Constructing Data Transaction Chains Based on Opportunity Cost Exploration [9.4] 本稿では、データ取引市場と従来の市場を比較し、データの複製性とプライバシがデータ市場に与える影響に焦点を当てる。
データ市場のコンテキストにおける従来のマイクロ経済の機会コストの概念を、データの複製性によって根本的に変える方法について論じる。
本稿では、プライバシドメインチェーン内のデータ循環の制約を概説し、これらの制約の下でデータの価値を最大化するモデルを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:02:18 GMT)
MindSet: Vision. A toolbox for testing DNNs on key psychological experiments [9.2] 我々は、30の心理的発見に基づいてディープニューラルネットワーク(DNN)をテストするために設計された画像データセットと関連するスクリプトの集合からなるツールボックスMindSet: Visionを紹介した。
すべての実験条件において、刺激は、人間の視覚知覚と物体認識に関する特定の仮説をテストするために体系的に操作される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:28:19 GMT)
Integrating Graceful Degradation and Recovery through Requirement-driven Adaptation [9.1] サイバー物理システム(CPS)は、悪質な操作条件、悪意のある攻撃、ハードウェアの劣化などの環境不確実性にさらされている。
CPSは,(1)優雅な劣化,(2)予期せぬ環境条件下での安全性の維持,(2)正常なシステム機能の再開を促進するための回復,の2つの操作に頼っている。
本稿では,自動トリガーによる自己適応型システムレジリエンス向上手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:44:50 GMT)
MR-Scout: Automated Synthesis of Metamorphic Relations from Existing Test Cases [9.0] オープンソースソフトウェアプロジェクトのテストケースからMRを自動的に合成するMR-Scoutを提案する。
符号化されたMRの97%以上は、自動テストケース生成に高品質である。
我々の質的研究は、コード化されたMRの55.76%から76.92%が開発者にとって容易に理解可能であることを示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:12:15 GMT)
On the price of exact truthfulness in incentive-compatible online learning with bandit feedback: A regret lower bound for WSU-UX [8.9] 古典的な予測ゲームと専門的なアドバイスと二進的な結果の1つの見方では、それぞれの専門家は反対に選択された信念を維持している。
本稿では、この問題の戦略的なバリエーションとして、自己中心的な専門家(レコメンデーション・シーキング)が紹介されている。
損失列の明示的な構成により、アルゴリズムは最悪の場合$Omega(T2/3)$lowboundに苦しむことを示した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:41:32 GMT)
LPSNet: End-to-End Human Pose and Shape Estimation with Lensless Imaging [8.8] レンズレス計測から3次元人のポーズや形状を復元する最初のエンドツーエンドフレームワークを提案する。
具体的には、レンズレス計測を復号化するためのマルチスケールレンズレス特徴デコーダを設計する。
また,人間の手足端推定精度を向上させるために,両頭補助補助機構を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:51:35 GMT)
Unlocking Adaptive User Experience with Generative AI [8.6] 我々はChatGPTと従来の手作業の両方を用いてユーザペルソナと適応インタフェースを開発する。
調査対象者37名と面接対象者4名のデータを収集した。
ChatGPT生成コンテンツと手動コンテンツの比較は有望な結果を示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:22:39 GMT)
Zero-Shot Segmentation of Eye Features Using the Segment Anything Model (SAM) [8.5] Segment Anything Model (SAM)は、画像セグメンテーションのための最初の基礎モデルである。
本研究では,VR機器で記録された視線画像から特徴を分割するSAMの能力を評価する。
我々の調査はSAMのゼロショット学習能力と、バウンディングボックスやポイントクリックのようなプロンプトの有効性に焦点を当てている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:23:47 GMT)
Xiwu: A Basis Flexible and Learnable LLM for High Energy Physics [8.5] 大規模言語モデル(LLM)は、急激な更新と変更の期間を経ている。
モデル自体を前進させながら、ユニークなドメイン知識を取得することは困難です。
Xiwuという名前の高度な大規模言語モデルシステムが開発され、最も先進的な基礎モデルの切り替えが可能になった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:37:31 GMT)
MimiC: Combating Client Dropouts in Federated Learning by Mimicking Central Updates [8.4] フェデレートラーニング(FL)は、プライバシー保護のための協調学習のための有望なフレームワークである。
本稿では、任意のクライアントドロップアウトを持つ古典的FedAvgアルゴリズムの収束性について検討する。
次に,MimiCという新しいトレーニングアルゴリズムを設計し,サーバが各モデル更新を前回のモデルに基づいて変更する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:00:42 GMT)
AnchorAL: Computationally Efficient Active Learning for Large and Imbalanced Datasets [8.3] 不均衡な分類タスクのアクティブラーニングは、マイノリティクラスが自然に発生することは滅多にないため、困難である。
標準的なプールベースのアクティブラーニングは、大きなプールでは計算コストがかかる。
これらの問題に対処するためにAnchorALを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:53:46 GMT)
GeoT: Tensor Centric Library for Graph Neural Network via Efficient Segment Reduction on GPU [8.2] グラフニューラルネットワーク(GNN)に特化した最先端テンソル中心ライブラリGeoTを紹介する。
GeoTは、新しい設計原則を導入するだけでなく、利用可能なデザイン空間を拡大する革新的な並列アルゴリズムをデビューさせた。
GeoTは平均演算子のスピードアップが1.80倍、エンドツーエンドのスピードアップが1.68倍であることを示すことでかなり進歩した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:06:38 GMT)
Power and Play: Investigating "License to Critique" in Teams' AI Ethics Discussions [8.1] 本研究は, ディスカージカル・クロージャ(discursive closure)を規定する基準と, 権力関係が, 人々が批判を高めるかどうか, どのように影響するかを検討する。
本報告では,ゲームの価値が議論にどのように影響するかを報告し,仮説的文脈が現実の変革に有効なメカニズムとは考えにくいことを明らかにする。
ゲームが製品やプラクティスへの直接的な変更を可能にする可能性は低いが、今後の集団行動に対して、メンバーが批判的に整合した同盟を見付ける可能性が高くなる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:43:45 GMT)
Lightweight Inference for Forward-Forward Training Algorithm [8.1] 本稿では,フォワードフォワードアルゴリズムを用いて学習したディープニューラルネットワークを対象とした,軽量な推論手法を提案する。
MNISTデータセットとCIFARデータセット、およびてんかん性発作検出と心臓不整脈分類の2つの現実的応用について検討した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:11:33 GMT)
MedExpQA: Multilingual Benchmarking of Large Language Models for Medical Question Answering [8.1] 大規模言語モデル(LLM)は、人工知能技術の発展を促進する可能性を秘めている。
本稿では,MedExpQAについて述べる。MedExpQAは,医学質問応答におけるLSMを評価するための,医学試験に基づく最初の多言語ベンチマークである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:03:57 GMT)
Automated discovery of symbolic laws governing skill acquisition from naturally occurring data [8.0] 本稿では,大規模学習ログデータからスキル学習の法則を明らかにすることを目的とする。
2段階のアルゴリズムは、観測不能な認知状態と探索におけるアルゴリズム的爆発の問題に対処するために開発された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:15:37 GMT)
A ground-based dataset and a diffusion model for on-orbit low-light image enhancement [7.8] 軌道上低光画像強調(LLIE)のためのバイドゥナビゲーション衛星のデータセットを提案する。
衝突することなく異なる方向と距離のポーズを均一にサンプリングするために、衝突のない作業空間と階層化サンプリングのポーズを提案する。
余剰露光や細部をぼかすことなく画像のコントラストを高めるために,構造と暗黒領域を強調するために,融合した注意を設計する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:50:51 GMT)
Adapting to Covariate Shift in Real-time by Encoding Trees with Motion Equations [7.8] Xenovert は完全な二分木で、連続的な入力空間を連続的な入力の流れを受信しながら、いくつかの均一な密度の間隔に適応的に分割する。
このプロセスは、ソースの分布をシフトしたターゲットの分布に間接的にマッピングし、データと下流デコーダ/運用の関係を保存する。
本稿では、Xenovertと統合されたニューラルネットワークが、5つのシフトしたデータセットのうち4つにおいて、より良い結果をもたらすことを実証した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:29:58 GMT)
ATFNet: Adaptive Time-Frequency Ensembled Network for Long-term Time Series Forecasting [7.7] ATFNetは、時間ドメインモジュールと周波数ドメインモジュールを組み合わせた革新的なフレームワークである。
本稿では,2つのモジュール間の重み調整機構であるドミナント・ハーモニック・シリーズ・エナジー・ウェイトリングを紹介する。
我々の複素数値スペクトル注意機構は、異なる周波数の組み合わせ間の複雑な関係を識別するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 04:41:39 GMT)
Learning Heuristics for Transit Network Design and Improvement with Deep Reinforcement Learning [7.7] グラフニューラルネットを用いた深層強化学習を用いて,進化的アルゴリズムの低レベル学習を行う。
これらの学習者は、70ノード以上のベンチマーク合成都市におけるアルゴリズムの結果を改善し、運用コストを最適化する際の最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:40:57 GMT)
Learning to Fly in Seconds [7.3] カリキュラム学習と高度に最適化されたシミュレータが,サンプルの複雑さを増し,学習時間の短縮につながることを示す。
我々のフレームワークは、コンシューマ級ラップトップで18秒のトレーニングをした後、直接制御するためのSimulation-to-Real(Sim2Real)転送を可能にする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:04:51 GMT)
Progressive Alignment with VLM-LLM Feature to Augment Defect Classification for the ASE Dataset [7.1] 従来の欠陥分類アプローチは2つの障壁に直面している。
不十分なトレーニングデータと不安定なデータ品質。
画像上に記録されたリッチなデータ記述を含む,欠陥分類のための特別なデータセットを提案するが,欠陥特徴を直接学習するのは困難である。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 04:17:27 GMT)
To Tell The Truth: Language of Deception and Language Models [6.8] 我々は,ハイテイク環境における会話が嘘をつくような,新しいテレビ番組データを分析する。
客観的な真理の存在下での偽りの潜在的な検証可能な言語手がかりの顕在化について検討する。
人間の被験者と同じような真理検出性能を持つ検出器群(アルゴリズム)が存在することを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:54:40 GMT)
Learning to Rank Context for Named Entity Recognition Using a Synthetic Dataset [6.6] 本稿では,Alpacaを用いた文脈検索学習データセットを提案する。
このデータセットを用いて、NERの関連するコンテキストを見つけることができるBERTモデルに基づいて、ニューラルネットワークコンテキストレトリバーをトレーニングする。
本手法は,40冊の本の第1章からなる英文データセットにおいて,NERタスクの検索ベースラインよりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:53:48 GMT)
Empirical Upscaling of Point-scale Soil Moisture Measurements for Spatial Evaluation of Model Simulations and Satellite Retrievals [6.6] 本研究では,融合と機械学習を組み合わせたアップスケーリング手法を提案し,点スケールSM測定を100mpxの解像度に外挿した。
我々は4倍のクロスバリデーションを行い,0.6から0.9の範囲で連続的に比較相関性能を示した。
提案手法は,研究領域内の2つの空間的部分集合を用いて,クラスタ間戦略に基づいてさらに検証された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:49:59 GMT)
Investigation of the effectiveness of applying ChatGPT in Dialogic Teaching Using Electroencephalography [6.6] 大規模言語モデル(LLM)には、知識を解釈し、質問に答え、文脈を考える能力がある。
この研究は、34人の大学生を参加者として募集し、ランダムに2つのグループに分けられた。
実験群はChatGPTを用いて対話型指導を行い,コントロール群は人間教師と対話した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:23:43 GMT)
Faithful and Robust Local Interpretability for Textual Predictions [6.5] FRED(Fithful and Robust Explainer for textual Documents)を提案する。
FREDは、モデル予測を説明するための3つの重要な洞察を提供する:(1)除去が予測に最も強い影響を及ぼす文書内の単語の最小セットを識別し、(2)重要スコアを各トークンに割り当て、モデルの出力にその影響を反映し、(3)非現実的な説明を提供する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:35:22 GMT)
Multi-Task Learning for Features Extraction in Financial Annual Reports [6.4] 我々は、財務テキスト分類に様々なマルチタスク学習手法を用いる。
我々は,金銭的感情,客観性,前向きな文予測,ESGコンテンツ検出に重点を置いている。
FTSE350企業の年次報告からテキストの特徴を抽出し,ESG定量スコアとそれらの特徴との関係について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:13:40 GMT)
On the Direct Construction of MDS and Near-MDS Matrices [6.4] 準最適分岐数を持つ近MDS(NMDS)行列は、拡散層としてのセキュリティと効率のバランスを良くする。
本稿では,NMDS行列の非再帰的および再帰的設定における直接構成について述べる。
本稿では,一般化Vandermonde行列を用いた不揮発性MDSおよびNMDS行列の構築手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:09:25 GMT)
Quantum Circuit for High Order Perturbation Theory Corrections [6.3] 摂動理論(PT)は、物理学者と化学者の両方にとって最も強力で実りの多い道具の1つかもしれない。
量子コンピューティングの進歩は、古典的な方法に代わる機会を提供する。
低次PT補正を推定する一般量子回路が提案されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:05:37 GMT)
Quantum-inspired activation functions in the convolutional neural network [6.1] 畳み込みニューラルネットワーク(CNN)に組み込まれた量子回路の表現可能性について検討する。
数値学習により,我々のハイブリッド量子古典CNNモデルは優れた特徴選択能力を示した。
量子アクティベーション関数は重要な特徴を選択し、重要でない情報を破棄する上でより効率的であることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 23:08:38 GMT)
Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.1] 我々は、異なるデータバッチ更新間で機械学習モデルを再学習する問題について、一意に考察する混合整数最適化アルゴリズムを開発した。
本手法は, モデル性能が小さめ, 制御可能な犠牲を負うモデルよりも安定性が強いことを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:52:11 GMT)
MVSA-Net: Multi-View State-Action Recognition for Robust and Deployable Trajectory Generation [6.0] LfOパラダイム(Learning-from-observation、LfO)は、ロボットが実行されているのを見るだけでタスクを実行することを学ぶための、人間にインスパイアされたモードである。
タスクアクティビティの複数の視点を認識できるように,SA-Netモデルを一般化したマルチビューSA-Netを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:57:55 GMT)
A Note on the Common Haar State Model [5.8] 共有ハール状態モデル(Common Haar state model)と呼ばれるこのモデルの量子アナログについて研究する。
このモデルでは、暗号システムのすべてのパーティが1つ以上のi.i.d Haar状態の多くのコピーを受け取る。
a) PRSGの出力長がキーサイズより厳密に大きい、(b) 敵が擬似乱数状態のコピーを$Oleft(fraclambda(log(lambda))1.01 で受け取ったとしても、セキュリティは保持する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:44:50 GMT)
LTNER: Large Language Model Tagging for Named Entity Recognition with Contextualized Entity Marking [5.7] 我々は、革命的コンテキスト化エンティティマーキングゲンメソッドを組み込んだ、LTNERと呼ばれるNER処理フレームワークを開発した。
コスト効率の高いGPT-3.5と文脈学習を組み合わせることで,NERタスクの処理におけるLLMの精度を大幅に向上した。
CoNLL03データセットのF1スコアは、初期の85.9%から91.9%に増加し、監督された微調整のパフォーマンスに近づいた。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:54:02 GMT)
Localizing Moments of Actions in Untrimmed Videos of Infants with Autism Spectrum Disorder [5.2] 乳児ビデオにおけるASD関連行動の同定を目的とした自己注意型TALモデルを提案する。
本研究は, 乳児の非トリミングビデオにおいて, エンド・ツー・エンドの時間的行動の局所化を初めて実施した症例である。
顔の70%の精度、顔の79%の精度、笑顔の72%、発声の65%を実現した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:31:27 GMT)
Case Study: Neural Network Malware Detection Verification for Feature and Image Datasets [5.2] 我々は、敵に対する具体的な保護を確保するのに役立つ新しい検証ドメインを提案する。
マルウェア分類と2種類の共通マルウェアデータセットについて述べる。
マルウェア分類の検証の改善と改善に必要な課題と今後の考察について概説する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:37:22 GMT)
Analysis of Off-Policy Multi-Step TD-Learning with Linear Function Approximation [5.2] 本稿では,線形関数近似,オフポリシー学習,ブートストラッピングを特徴とする多段階TD学習アルゴリズムを解析する。
2つのnステップのTD学習アルゴリズムが提案され分析され、このアルゴリズムは勾配と制御理論のモデルなし強化学習とみなすことができる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:45:28 GMT)
Unbridled Icarus: A Survey of the Potential Perils of Image Inputs in Multimodal Large Language Model Security [5.1] 強力なMLLMのような信頼性の高いAIシステムの追求は、現代研究の重要な領域として現れている。
本稿では,画像モダリティのMLLMへの導入に伴う多面的リスクの軽減に努める。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:54:18 GMT)
Normalizing Flows on the Product Space of SO(3) Manifolds for Probabilistic Human Pose Modeling [5.0] 我々は、SO(3)多様体の高次元積空間上で動く正規化フローモデルであるHuProSO3を紹介する。
HuProSO3の最先端アプローチに対する優位性は、3つの異なるアプリケーションにおいて優れたモデリング精度によって証明されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:56:05 GMT)
A Comprehensive Review of Knowledge Distillation in Computer Vision [4.9] 本稿では, 複雑なモデルをより小さく, より単純なものに圧縮する技術である, 知識蒸留研究の現状について検討する。
本稿では,知識蒸留に関する主要な原則と技術の概要を述べるとともに,コンピュータビジョン分野における知識蒸留の応用について概説する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:52:38 GMT)
NAF-DPM: A Nonlinear Activation-Free Diffusion Probabilistic Model for Document Enhancement [4.8] 文書のテキストや重要な特徴を保存しながらノイズを取り除くためには、重要な前処理ステップが不可欠である。
劣化文書の原品質を復元する拡散確率モデル(DPM)に基づく新しい生成フレームワークであるNAF-DPMを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:52:21 GMT)
DepthMOT: Depth Cues Lead to a Strong Multi-Object Tracker [4.7] 各オブジェクトを正確に区別することは、MOTアルゴリズムの基本的な目標である。
本稿では, (i) シーン深度マップのテクトitend-to-endの検出と推定, (ii) カメラのポーズ推定により不規則なカメラの動きを補正するtextitDepthMOTを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:39:12 GMT)
Cellular automata, many-valued logic, and deep neural networks [4.6] 我々は、進化トレースから、細胞オートマトン(CA)の挙動を規定する論理的ルールを学ぶためのディープニューラルネットワークの基本能力を特徴付ける理論を開発する。
これはまず、CAとLukasiewicz命題論理の間の新しい接続を確立することで達成される。
繰り返しニューラルネットワークによりCAの動的挙動を実現できることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:49:52 GMT)
A unified cross-attention model for predicting antigen binding specificity to both HLA and TCR molecules [4.5] 抗原とHLA-I/TCR分子との結合親和性は抗原提示とT細胞活性化に重要な役割を果たしている。
いくつかの計算手法は、抗原-HLAまたは抗原-TCR結合特異性を予測するために開発されたが、それらは一度に1つのタスクだけに焦点を当てている。
我々は,HLA分子とTCR分子の両方への抗原の結合を同時に予測するために,一貫したクロスアテンショントランスフォーマーモデルUnifyImmunを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:25:25 GMT)
Evaluating the Efficacy of Cut-and-Paste Data Augmentation in Semantic Segmentation for Satellite Imagery [4.5] 本研究では,衛星画像のセマンティックセグメンテーションにおけるカット・アンド・ペースト拡張手法の有効性について検討した。
私たちは、通常ラベル付きインスタンスを必要とするこの拡張を、セマンティックセグメンテーションのケースに適用します。
評価のためにDynamicEarthNetデータセットとU-Netモデルを用いて、この拡張により、テストセットのmIoUスコアが37.9から44.1に大幅に向上することを発見した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:18:30 GMT)
Comparison between parameter-efficient techniques and full fine-tuning: A case study on multilingual news article classification [4.5] Adapters and Low-Rank Adaptation (LoRA)は、言語モデルのトレーニングをより効率的にするために設計されたパラメータ効率の良い微調整技術である。
過去の結果は,これらの手法がいくつかの分類タスクの性能を向上させることさえできることを示した。
本稿では,これらの手法が完全微調整と比較して分類性能と計算コストに与える影響について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:01:17 GMT)
PetKaz at SemEval-2024 Task 8: Can Linguistics Capture the Specifics of LLM-generated Text? [4.5] 我々はSemEval-2024タスク8「マルチジェネレータ、マルチドメイン、ブラックボックスマシン生成テキスト検出」を提出する。
我々のアプローチは、RoBERTaベースからの埋め込みと多様性機能の組み合わせに依存し、再サンプリングされたトレーニングセットを使用する。
その結果,本手法は未知のモデルや領域にまたがって一般化可能であり,精度は0.91であることがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:05:02 GMT)
PetKaz at SemEval-2024 Task 3: Advancing Emotion Classification with an LLM for Emotion-Cause Pair Extraction in Conversations [4.5] 我々はSemEval-2023タスク3「会話におけるマルチモーダル感情原因分析の競争」に応募する。
我々のアプローチは感情分類のための微調整GPT-3.5と、原因を検出するためのBiLSTMベースのニューラルネットワークの組み合わせに依存している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:25:03 GMT)
PAT: Pixel-wise Adaptive Training for Long-tailed Segmentation [4.4] 長い尾のセグメンテーションに適した革新的なPixel-wise Adaptive Training (PAT)技術を提案する。
PATには,(1)クラスワイド勾配等級均質化,2)ピクセルワイドクラス固有損失適応(PCLA)の2つの重要な特徴がある。
PATは、NyUデータセットで現在の最先端を2.2%上回る、大幅なパフォーマンス向上を示している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:52:29 GMT)
Language Models on a Diet: Cost-Efficient Development of Encoders for Closely-Related Languages via Additional Pretraining [4.4] クロアチア語、セルビア語、ボスニア語、モンテネグロ語のベンチマークを設定しました。
我々は、利用可能な多言語モデルの追加事前学習により、専用のin-scratchモデルに匹敵する性能が得られることを示す。
また、Slovenianの場合、隣接する言語は、最終モデルの性能にほとんど、あるいは全く損なわない追加の事前訓練に含めることができることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:55:44 GMT)
On the Convergence of Continual Learning with Adaptive Methods [4.4] 適応型非連続学習法(NCCL)を提案する。
提案手法は,複数の画像分類タスクに対する継続学習既存手法の性能を向上させることを実証する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:28:27 GMT)
Echotune: A Modular Extractor Leveraging the Variable-Length Nature of Speech in ASR Tasks [4.1] 可変長アテンション機構を備えたピンブルモジュールであるEcho-MSAを紹介する。
提案した設計は,音声の可変長の特徴を捉え,固定長注意の限界に対処する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:30:34 GMT)
Computing Transition Pathways for the Study of Rare Events Using Deep Reinforcement Learning [4.1] 本研究では,特定の経路空間上でのコスト最小化問題としてパスフィニングタスクを定式化する。
コスト関数はFreidlin-Wentzellアクション関数から適用され、荒々しい潜在的な景観に対処できる。
この方法は、エピソードを生成するポリシーにシステムのポテンシャル力を取り入れ、システムの物理的特性と分子系の学習過程を組み合わせる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 23:30:15 GMT)
SAAS: Solving Ability Amplification Strategy for Enhanced Mathematical Reasoning in Large Language Models [4.1] 我々は,CoT(Chain-of-Thought)学習とPoT(Program-of-Thought)学習の統合に注力する。
本稿では,CoT学習からPoT学習へ戦略的に移行する,SAAS(Solving Ability Amplification Strategy)という逐次学習手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:05:08 GMT)
Proximity-Induced Exchange Interaction: a New Pathway for Quantum Sensing using Spin Centers in Hexagonal Boron Nitride [4.1] 六方晶窒化ホウ素(hBN)は2次元のファンデルワールス物質である。
hBNのスピンセンターはターゲット物質に近接して設計することができる。
我々は,hBNにおけるスピン中心と磁気基板との交換相互作用によって駆動される新しい量子センシングプロトコルを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:30:46 GMT)
The PetShop Dataset -- Finding Causes of Performance Issues across Microservices [3.9] 本稿では,マイクロサービスベースのアプリケーションにおける根本原因分析を評価するためのデータセットを提案する。
データセットは、分散アプリケーションから5分間隔で出力されるレイテンシ、リクエスト、可用性メトリクスを含んでいる。
通常の運用メトリクスに加えて、データセットには68のインジェクトされたパフォーマンス問題が含まれており、レイテンシが増加し、システム全体の可用性が低下する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:34:42 GMT)
What Are the Odds? Improving the foundations of Statistical Model Checking [3.8] マルコフ決定プロセス(MDP)は不確実性の下での意思決定の基本的なモデルである。
従来の検証アルゴリズムは、MDPの振る舞いを管理する確率の正確な知識を前提としている。
我々はMDPの知識を活用する専門的なアプローチを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:47:46 GMT)
Bidirectional Long-Range Parser for Sequential Data Understanding [3.8] BLRP(Bidirectional Long-Range)は,長距離タスクの性能向上と効率向上を目的とした,新規で汎用的なアテンション機構である。
我々は、最先端の手法に対する競争結果を示すことによって、ビジョンと言語ドメインに対するアプローチの利点と汎用性を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:45:03 GMT)
The Fact Selection Problem in LLM-Based Program Repair [3.7] コードコンテキストのような単純な構文的な詳細から、以前はPythonプロジェクトのコンテキストで探索されていなかった意味情報まで、それぞれの事実が有益であることを示す。
重要なことは、プログラム修復プロンプトの有効性は、使用済み事実の数よりも非単調であることが判明した。
我々は、特定のバグに固有の事実を抽出し、プロンプトに含める基本統計モデルManipleを開発した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:41:32 GMT)
Current dependence of the low bias resistance of small capacitance Josephson junctions [3.7] 小ジョセフソン接合のdc電流電圧特性について検討した。
名目上超伝導状態における低電流バイアスにおける接合の差抵抗の電流バイアス依存性に着目する。
同様のアプローチはマイクロ波状態における超伝導量子ビットのノイズに対する感度をモデル化するのに有用かもしれない。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:16:05 GMT)
Enhancing Software Related Information Extraction with Generative Language Models through Single-Choice Question Answering [3.7] 本稿では,言語モデル(GLM)を用いた学術テキスト間の関係抽出の改善に着目する。
この方法論は、ソフトウェア関連エンティティを抽出するために、GLMのコンテキスト内学習機能の使用を優先する。
SOMD共有タスクへの参加は、正確なソフトウェア引用プラクティスの重要性を強調します。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:00:36 GMT)
Evaluation of an LLM in Identifying Logical Fallacies: A Call for Rigor When Adopting LLMs in HCI Research [3.4] 本稿では,デジタル誤情報介入の一部となる論理的誤信を識別するLLMの評価について述べる。
ラベル付きデータセットと比較すると,GPT-4の精度は0.79であり,無効または未同定のインスタンスを除外したユースケースでは0.90であることがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:00:14 GMT)
Dynamical stability and chaos in artificial neural network trajectories along training [3.4] 浅いニューラルネットワークのネットワーク軌跡をこのレンズを通して解析することにより,このプロセスの動的特性について検討する。
我々は,学習率の仕組みによって,規則的かつカオス的な行動のヒントを見いだす。
この研究は、力学系理論、ネットワーク理論、機械学習のアイデアの交叉受精にも貢献している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:33:11 GMT)
Rydberg superatoms: An artificial quantum system for quantum information processing and quantum optics [3.4] ライドバーグ原子アンサンブルは、その強い長距離双極子-双極子相互作用によって媒介される集合的挙動を興味をそそる。
これらの集団効果は、量子情報処理や量子光学における潜在的な応用により、様々な分野において大きな注目を集めている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:17:56 GMT)
Distributing Arbitrary Quantum Cluster States by Graph Transformation [3.3] 量子クラスター状態は、量子粒子間の非局所状態の特別なクラスである。
我々は,強い絡み合い構造を持つ任意の量子クラスター状態を確立するアルゴリズムを,最先端技術よりもはるかに低コストで開発する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:06:42 GMT)
Examples of Atoms Absorbing Photon via Schrödinger Equation and Vacuum Fluctuations [3.3] 真空揺らぎが吸収結果のランダム性の起源であることを示す。
ランダム性を導入するメカニズムが存在しない場合、シュル「オーディンガー方程式」だけでプロセスの時間進化を制御している。
カシミール効果は真空のゆらぎと密接に結びついており、このメカニズムを検証するための有望な実験的道を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:59:55 GMT)
The Open Autonomy Safety Case Framework [3.3] 安全ケースは、自動運転車の安全性を測定し、管理し、通信するためのベストプラクティスとなっている。
本稿では,自動運転車産業との長年の連携によって開発されたオープン・オートノミー・セーフティ・ケース・フレームワークについて紹介する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:26:06 GMT)
Causality Extraction from Nuclear Licensee Event Reports Using a Hybrid Framework [3.1] 本稿では,核ライセンスイベントレポートからの因果検出と抽出のためのハイブリッドフレームワークを提案する。
因果関係分析のための20,129のテキストサンプルを用いたLERコーパスをコンパイルし,因果関係検出のための深層学習に基づくアプローチを構築した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:39:34 GMT)
Dynamical excitation control and multimode emission of an atom-photon bound state [3.0] 原子-光子結合状態は、分散工学的な導波路のバンドエッジへの量子エミッターの結合から生じる。
本研究では、周波数可変量子エミッタからマイクロ波メタマテリアルへの結合から生じる原子-光子結合状態のダイナミクスについて検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:16:41 GMT)
Novelty Heuristics, Multi-Queue Search, and Portfolios for Numeric Planning [3.0] ヒューリスティック検索は、計画問題の解決と数値計画のための強力なアプローチである。
本稿では,様々な強力な手法による数値計画の探索方法の改善について述べる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:01:35 GMT)
SegmentAnything helps microscopy images based automatic and quantitative organoid detection and analysis [2.9] オルガノイド(Organoids)は、生体組織や臓器のアーキテクチャや機能を忠実に模倣する、自己組織化された3D細胞クラスターである。
最近の顕微鏡技術は、オルガノイドの形態的特徴を取得する強力なツールを提供するが、手動画像解析は依然として手間と時間を要するプロセスである。
本稿では、SegmentAnythingを利用して個々のオルガノイドを正確に分離する顕微鏡解析のための包括的パイプラインを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:57:42 GMT)
Synergy of Large Language Model and Model Driven Engineering for Automated Development of Centralized Vehicular Systems [2.9] モデル駆動工学(MDE)とLarge Language Models(LLM)の相乗効果を利用したツールのプロトタイプを提案する。
CARLAシミュレータを用いて、緊急ブレーキのシナリオにおいて、生成されたコードをシミュレーション環境で評価する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:28:11 GMT)
Condition Monitoring with Incomplete Data: An Integrated Variational Autoencoder and Distance Metric Framework [2.8] 本稿では,未確認データに対する故障検出と条件モニタリングのための新しい手法を提案する。
我々は変分オートエンコーダを用いて、以前に見られた新しい未知条件の確率分布をキャプチャする。
故障は、健康指標のしきい値を確立することで検出され、そのモデルが重大で見えない断層を高い精度で識別することができる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:20:23 GMT)
Tree-Based versus Hybrid Graphical-Textual Model Editors: An Empirical Study of Testing Specifications [2.7] ツリーベースのモデルエディタとハイブリッドなグラフィカルテキストモデルエディタは、ドメインモデルを編集する際の利点と制限がある。
筆者らは22名の被験者を対象に実験を行い,ハイブリッド表記が優れているという暗黙の仮定を検証した。
モデル要素の順序付きリストを解析する上で,ツリーエディタが優れた性能を提供するのに対して,複雑な条件の理解やモデリングを必要とするアクティビティは,ハイブリッドエディタによってより高速に実行されることがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:25:23 GMT)
Optimal Approximation Rates for Deep ReLU Neural Networks on Sobolev and Besov Spaces [2.7] ReLU活性化関数を持つディープニューラルネットワークは、ソボレフ空間$Ws(L_q(Omega))$とBesov空間$Bs_r(L_q(Omega))$の関数を近似することができる。
この問題は、様々な分野におけるニューラルネットワークの適用を研究する際に重要である。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:09:25 GMT)
SepVAE: a contrastive VAE to separate pathological patterns from healthy ones [2.6] コントラスト分析VAE(Contrastive Analysis VAE)は、背景データセット(BG)と対象データセット(TG)の共通要因を分離することを目的とした変分自動エンコーダ(VAE)のファミリーである。
3つの医療応用と自然画像データセット(CelebA)における従来のCA-VAEs法よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:26:52 GMT)
Evaluating Task-oriented Dialogue Systems: A Systematic Review of Measures, Constructs and their Operationalisations [2.6] このレビューは、以前の作業で使われた構成とメトリクスの概要を提供する。
また,対話システム評価の文脈における課題についても論じる。
対話システム評価の将来に向けた研究課題を策定する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:36:48 GMT)
Quantum and Classical Two-photon Interference of Single Photons with Ultralong Coherence Time [2.6] 2光子干渉(TPI)は量子光学における基本的な現象である。
超長いコヒーレンス時間を持つ単一光子の量子及び古典的TPIの同時観測を報告する。
単一光子の列を持つ量子TPIは古典的TPIと同値である。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:51:39 GMT)
CA-Jaccard: Camera-aware Jaccard Distance for Person Re-identification [2.4] 本稿では,ジャカード距離の信頼性を高めるために,カメラ情報を活用したジャカード距離を提案する。
提案手法は,信頼性が高く,計算コストの低い人物再ID手法の一般的な距離測定基準として機能する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:59:06 GMT)
OPSD: an Offensive Persian Social media Dataset and its baseline evaluations [2.4] 本稿ではペルシャ語に対する2つの攻撃的データセットを紹介する。
第1のデータセットはドメインの専門家によって提供されるアノテーションで構成されており、第2のデータセットはWebクローリングによって得られたラベルなしデータの大規模なコレクションで構成されている。
得られたデータセットの3クラスと2クラスのF1スコアはそれぞれ76.9%、XLM-RoBERTaは89.9%であった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:08:56 GMT)
player2vec: A Language Modeling Approach to Understand Player Behavior in Games [2.2] 過去の行動ログから潜在ユーザ表現を学習する手法は、eコマース、コンテンツストリーミング、その他の設定におけるレコメンデーションタスクの注目を集めている。
本稿では,長距離トランスフォーマーモデルをプレイヤーの行動データに拡張することで,この制限を克服する新しい手法を提案する。
ゲームにおける行動追跡の具体性について議論し,文中の単語に類似した方法でゲーム内イベントを視聴することで,前処理とトークン化のアプローチを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:11:10 GMT)
Optimal Controller Realizations against False Data Injections in Cooperative Driving [2.2] サイバー攻撃に対する協調運転の堅牢性を高めるためのコントローラ指向のアプローチについて検討する。
与えられた動的CACCスキームを再構成することにより、ベースコントローラが新しいが等価なコントローラのクラスで表現できることを認識する。
FDI攻撃の影響を最小限に抑えるセンサの最適組み合わせを得る。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:53:42 GMT)
Use of a Structured Knowledge Base Enhances Metadata Curation by Large Language Models [2.2] 本稿では,メタデータ標準への準拠性を改善するため,大規模言語モデル (LLM) の可能性について検討する。
NCBI BioSampleレポジトリの肺がん関連サンプルを無作為に記録した200データについて実験を行った。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 22:29:53 GMT)
LLM-Augmented Retrieval: Enhancing Retrieval Models Through Language Models and Doc-Level Embedding [2.0] 本稿では,大規模言語モデル拡張によるモデルに依存しないドキュメントレベルの埋め込みフレームワークを提案する。
我々は広く利用されている検索モデルの有効性を大幅に改善することができた。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:29:07 GMT)
BirdSet: A Multi-Task Benchmark for Classification in Computational Avian Bioacoustics [2.0] 深層学習モデルは、環境の健康と生物多様性を診断するために、鳥類のバイオ音響学において強力なツールとして登場した。
研究におけるデータの断片化と不透明度は、モデル性能の包括的な評価を複雑にする。
本研究では,鳥の鳴き声の分類のための総合的なアプローチで研究活動を統合する統一的なフレームワークであるBirdSetベンチマークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:58:09 GMT)
Action-conditioned video data improves predictability [2.0] Action-Conditioned Video Generation (ACVG)フレームワークは、ロボットのアクションに条件付けられたビデオシーケンスを生成する。
ACVGはロボットの動作に規定された映像シーケンスを生成し、視覚と行動が相互にどう影響するかの探索と分析を可能にする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:18:01 GMT)
Measurement in the Age of LLMs: An Application to Ideological Scaling [1.9] 本稿では,大規模言語モデル(LLM)を用いて,社会科学的測定タスクに固有の概念的乱雑を探索する。
我々は、議員とテキストの両方のイデオロギー的尺度を引き出すために、LLMの顕著な言語的流布に依存している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 00:33:54 GMT)
WILBUR: Adaptive In-Context Learning for Robust and Accurate Web Agents [1.9] Wilburは、微分可能なランキングモデルと新しい命令合成手法を用いるアプローチである。
そこで本研究では,代表的目標を抽出する生成的オートカリキュラムのデータに基づいてランキングモデルをトレーニング可能であることを示す。
Wilbur氏はWebVoyagerベンチマークで最先端の結果を達成し、テキストのみのモデルを全体の8%、特定のウェブサイトで最大36%上回った。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 23:10:47 GMT)
Privacy and Security of Women's Reproductive Health Apps in a Changing Legal Landscape [1.8] 周期追跡および不妊監視アプリのプライバシーとセキュリティの脆弱性は、重大なリスクをもたらす。
当社のアプローチは、動的かつ静的な分析とともに、プライバシポリシとアプリのパーミッションを手動で観察することです。
私たちの分析では、アプリのコード脆弱性の61%が、上位10のOpen Web Application Security Project(OWASP)の脆弱性に分類されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:19:10 GMT)
How to Evaluate Entity Resolution Systems: An Entity-Centric Framework with Application to Inventor Name Disambiguation [1.8] 本稿では,要約統計をモニタリングする統合フレームワークと統合したエンティティ中心のデータラベリング手法を提案する。
これらのベンチマークデータセットは、モデルトレーニングやさまざまな評価タスクに使用できる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:53:29 GMT)
Improving Deep Learning Predictions with Simulated Images, and Vice Versa [1.8] 視覚的に現実的なシミュレーションを生成するために、植物の手続きモデルを作成することができる。
これらの合成画像は、表現型タスクのためのトレーニングニューラルネットワークにおいて、実際の画像を増強または完全に置き換えることができる。
本研究は,合成画像におけるリアリズムが予測を改善する程度について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:08:41 GMT)
An oscilloscope based method for pulsed Optically Detected Magnetic Resonance in an ensemble of NV centers in diamond [1.7] システム上のデータ平均化とオシロスコープのメモリを用いて高速に高SNRデータを得る方法を示す。
ラビ振動、ラムゼー干渉、T1測定、スピンエコーが示されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:00:21 GMT)
Centrality Estimators for Probability Density Functions [1.6] 我々は、H'older と Lehmer という2つの特定の中心性を紹介し、研究する。
提案した推定器群の有効性を示す数値シミュレーションが提供される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:40:25 GMT)
CNN-based Game State Detection for a Foosball Table [1.6] フォスボールのゲームでは、コンパクトで包括的なゲーム状態の記述は、フィギュアの位置シフトと回転と、時間とともにボールの位置で構成される。
本稿では,フォスボールのゲーム状態を決定するフィギュア検出システムについて述べる。
このデータセットを使用して、畳み込みニューラルネットワーク(CNN)ベースのエンドツーエンド回帰モデルをトレーニングし、各ロッドの回転とシフトを予測する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:48:02 GMT)
ÚFAL LatinPipe at EvaLatin 2024: Morphosyntactic Analysis of Latin [1.6] 我々は、Eva 2024 Dependency Parsingタスクの受賞申請である LatinPipe を提示する。
本システムでは, ベースと大型の事前学習型LMの微調整による結合が構成されている。
一般に公開されている7つのラテンコーパスからのサンプリングによって訓練される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:05:25 GMT)
Data Science In Olfaction [1.4] データサイエンスとAIの観点から嗅覚を概念化し、嗅覚の特性を鼻から脳への嗅覚システムでどのように認識し分析するかを関連づける。
色覚に区別を加えることで、嗅覚は刺激の複雑さ、感覚装置の高次元性、そして地上の真実を構成するものなど、ユニークな測定課題をもたらすと論じる。
本研究は,マウス嗅球にカルシウム画像で記録された嗅覚に対する神経反応の機械学習による分類を用いて行った。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:25:02 GMT)
Convergence analysis of controlled particle systems arising in deep learning: from finite to infinite sample size [1.4] サンプルサイズが無限に大きくなるにつれて, 関連する最適制御問題の制限挙動について検討した。
目的関数の最小値とニューラルSDEの最適パラメータの収束は,サンプルサイズNが無限大になる傾向にあることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 04:22:55 GMT)
Enhancing Ship Classification in Optical Satellite Imagery: Integrating Convolutional Block Attention Module with ResNet for Improved Performance [1.4] 本研究は,光衛星画像からの船舶分類のための高度な畳み込みニューラルネットワーク(CNN)アーキテクチャを提案する。
ベースラインであるResNet50の85%と比較して87%の精度を実現した。
このモデルは95%の精度を示し、精度、リコール、f1スコアは全て様々な船級で大幅に改善された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:11:48 GMT)
Electric Vehicle Routing Problem for Emergency Power Supply: Towards Telecom Base Station Relief [1.4] 電気自動車(EV)が基地局に電力を直接供給するソリューションについて検討する。
目標は、すべてのEVの総走行距離と、ダウンした基地局の数の両方を最小化するEVルートを見つけることである。
本稿ではルールベースの車両セレクタと強化学習(RL)ベースのノードセレクタを組み合わせた問題解決手法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:46:38 GMT)
A secure and private ensemble matcher using multi-vault obfuscated templates [1.4] 本稿では,バイオメトリックテンプレート情報を十分なチャフで隠蔽する難読化手法を提案する。
本稿では,GAN(Generative Adversarial Network)が生成した合成顔画像の有効性を,セキュアなVault認証システム内でランダムなシャフポイント'として示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:18:39 GMT)
Stitching Satellites to the Edge: Pervasive and Efficient Federated LEO Satellite Learning [1.3] 本稿では,衛星が大規模機械学習(ML)タスクを効率的に実行できるようにする新しいFL-SECフレームワークを提案する。
主な構成要素は、余分な衛星画像を特定して排除するディビジョン・アンド・コンカーによるパーソナライズドラーニングと、軌道毎に集約された「軌道モデル」を生成し、地上局に送る前に再訓練する軌道モデル再訓練である。
我々のアプローチではFL収束時間が30倍近く減少し、衛星のエネルギー消費は1.38ワットまで減少し、例外的な精度は96%まで維持される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:10:12 GMT)
PORTULAN ExtraGLUE Datasets and Models: Kick-starting a Benchmark for the Neural Processing of Portuguese [1.3] 我々は、一連の言語処理タスクのためのデータセットのコレクションと、これらの下流タスクに関する微調整されたニューラルネットワークモデルのコレクションにコントリビュートする。
もともと英語で開発された文献の主流ベンチマークと合わせると、データセットは英語から機械翻訳され、最先端の翻訳エンジンが組み込まれていた。
その結果得られた PortULAN ExtraGLUE ベンチマークは、今後の研究で改善が追求されるポルトガルの研究の基盤となっている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:22:41 GMT)
Quench dynamics of interacting bosons: generalized coherent states versus multi-mode Glauber states [1.2] 多モードグラウバーコヒーレント状態 (MMGS) と準モメンタムを持つブロッホ状態 (Bloch state) は、ボゾン多体系の凝縮相を記述するためにしばしば用いられる。
MMGSとGCSの2点相関器の差は熱力学的限界で消える。
この関係は、(オート-)相関と、したがって2つのケースの力学自由エネルギー密度が熱力学的極限においてもまだ異なることを明らかにしている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:50:52 GMT)
A DRL solution to help reduce the cost in waiting time of securing a traffic light for cyclists [1.0] サイクリストは、それらをモーター化された交通から切り離すインフラを使うのを好む。
交通信号を使って自動車と自転車の流れを分離し、自転車固有のグリーンフェーズを追加すれば、軽量で安価なソリューションになる。
本稿では,信号機のグリーン位相サイクルを交通に適応させる深層強化学習ソリューションを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:31:25 GMT)
DiffCJK: Conditional Diffusion Model for High-Quality and Wide-coverage CJK Character Generation [1.0] 本研究では, 標準グリフ形式を用いて, 対象とするスタイルでグリフを生成する新しい拡散法を提案する。
提案手法は,CJK以外の中国語にインスパイアされたスクリプトに対して,顕著なゼロショット機能を示す。
要約して,提案手法は,CJK文字に対する高品質な生成モデル支援フォント作成への扉を開く。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 05:58:07 GMT)
Towards Improved Semiconductor Defect Inspection for high-NA EUVL based on SEMI-SuperYOLO-NAS [1.0] 本研究の目的は、画像のスケールアップが可能なスケール不変ADCDフレームワークを提案することである。
ベースラインのYOLO-NASアーキテクチャ上に構築されたSEMI-SuperYOLO-NASとして、即興ADCDフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:51:30 GMT)
David and Goliath: An Empirical Evaluation of Attacks and Defenses for QNNs at the Deep Edge [1.0] 量子化(quantization)は、MCUへのニューラルネットワークの展開を可能にするための、確立されたテクニックである。
我々は,非拘束QNNからの攻撃と防御の有効性を実証的に評価した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:14:32 GMT)
Data Readiness for AI: A 360-Degree Survey [0.9] 粗悪な品質データは不正確で非効率なAIモデルを生成する。
データ品質の改善に多くの研究開発努力が費やされている。
本稿では、構造化データセットと非構造化データセットのためのAI(DRAI)メトリクスのためのデータ準備性の分類法を提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:19:57 GMT)
Automating Research Synthesis with Domain-Specific Large Language Model Fine-Tuning [0.9] 本研究は,SLR(Systematic Literature Reviews)の自動化にLLM(Funture-Tuned Large Language Models)を用いた先駆的研究である。
本研究は,オープンソースLLMとともに最新の微調整手法を採用し,SLRプロセスの最終実行段階を自動化するための実用的で効率的な手法を実証した。
その結果, LLM応答の精度は高く, 既存のPRISMAコンフォーミングSLRの複製により検証された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 00:08:29 GMT)
Technical Report: The Graph Spectral Token -- Enhancing Graph Transformers with Spectral Information [0.8] グラフトランスフォーマーは、メッセージパッシンググラフニューラルネットワーク(MP-GNN)の強力な代替品として登場した。
本稿では,グラフスペクトル情報を直接符号化する新しい手法であるグラフスペクトルトークンを提案する。
既存のグラフ変換器であるGraphTransとSubFormerを拡張して,提案手法の有効性をベンチマークする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:24:20 GMT)
PerkwE_COQA: enhance Persian Conversational Question Answering by combining contextual keyword extraction with Large Language Models [0.8] 本稿では,ペルシア語対話型質問応答システム(CQA)の性能向上のための新しい手法を提案する。
LLM(Large Language Models)と文脈キーワード抽出の長所を組み合わせる。
提案手法は,暗黙的な質問を効果的に処理し,文脈に関連のある回答を提示し,会話の文脈に大きく依存する複雑な質問に対処する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:14:58 GMT)
Neural Implicit Morphing of Face Images [0.8] フェイスフォーミングは、多くの芸術的および法医学的応用を持つコンピュータグラフィックスにおける問題である。
このタスクは、特徴アライメントのためのワープと、歪んだ画像間のシームレスな遷移のためのブレンディングで構成される。
我々は,このような歪みや顔画像のブレンドを表現するために,協調型ニューラルネットワークを活用することを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:04:29 GMT)
Quantum non-Gaussianity of multi-phonon states of a single atom [0.7] 我々は、個々のメカニカルフォック状態に対する量子非ガウス的基準の最も難しい階層を導出する。
我々は、機械的加熱下での量子非ガウス的特徴の深さを解析し、量子センシングへの応用を予測する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:17:30 GMT)
Constraining Large Language Model for Generating Computer-Parsable Content [0.7] 本研究では,特定の規則に忠実な構造化コンテンツを生成する際に,微調整なしでLLM(Large Language Models)をガイドする方法を提案する。
これにより、ターゲットデータ構造、型、命令を生成する際の安定性と一貫性が向上し、アプリケーション開発の複雑さが軽減される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:22:24 GMT)
Vulnerabilities of smart contracts and mitigation schemes: A Comprehensive Survey [0.7] 本稿では,開発者がセキュアなスマート技術を開発するのを支援することを目的とした,文献レビューと実験報告を組み合わせる。
頻繁な脆弱性とそれに対応する緩和ソリューションのリストを提供する。
サンプルのスマートコントラクト上でそれらを実行し、テストすることで、コミュニティが最も広く使用しているツールを評価します。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:33:46 GMT)
HOEG: A New Approach for Object-Centric Predictive Process Monitoring [0.6] 予測プロセスモニタリングは、残りの時間を予測するなど、進行中のプロセス実行の将来の状態を予測することに焦点を当てる。
オブジェクト中心のプロセスマイニングの最近の進歩は、オブジェクトとイベントデータと、イベント間の明示的な関係を豊かにしている。
本稿では,イベントとオブジェクトを多種多様なノード型でグラフ構造に統合するヘテロジニアスオブジェクトイベントグラフ符号化(HOEG)を提案する。
そして、予測タスクにこれらの多様なオブジェクト特徴を組み込んだ異種グラフニューラルネットワークアーキテクチャを採用する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:06:16 GMT)
Experimental demonstration of improved quantum optimization with linear Ising penalties [0.6] 我々は、線形イジング項のみを含む代替ペナルティ法を検討し、それを顧客データサイエンス問題に適用する。
我々は,線形イジングペナルティ法は量子最適化の性能を向上させるべきであるという仮説を支持した。
多くの制約がある場合、全ての罰則を線形にすることは不可能であり、線形の罰則と二次の罰則を組み合わせるための戦略について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:54:19 GMT)
Quantum optimization with linear Ising penalty functions for customer data science [0.5] 量子アルゴリズムでは、制約は典型的には2次ペナルティ関数で実装される。
このペナルティ法は大きなエネルギースケールを導入し、相互作用グラフをより密にすることができる。
線形イジングペナルティ関数は、物理資源をより効率的に利用するための制約を実装する代替手法であると考えている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:46:22 GMT)
Ground State Preparation via Dynamical Cooling [0.5] 本稿では,量子力学シミュレーションに基づく基底状態生成アルゴリズムを提案する。
我々の主な洞察は、量子信号処理によるシフト符号関数によるハミルトン変換である。
このアプローチはエネルギーギャップの事前知識に頼らず、入浴をモデル化するために追加のキュービットを必要としない。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:16:25 GMT)
The Argument for Meta-Modeling-Based Approaches to Hardware Generation Languages [0.5] 本稿の目的は,このようなMDAベースのアプローチが,実装の最小限の労力で,非常に強力なジェネレータを提供できることを示すことである。
本稿では,Meta-Modelingアプローチを,最も先進的なハードウェア生成言語に対して詳細に比較する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:20:14 GMT)
IA2: Leveraging Instance-Aware Index Advisor with Reinforcement Learning for Diverse Workloads [0.5] インスタンス認識インデックスアドバイザ(IA2)は、データベースにおけるインデックス選択を最適化するための、DRLベースの新しいアプローチである。
IA2 は Twin Delayed Deep Deterministic Policy Gradient - Temporal difference State-Wise Action Refinery (TD3-TD-SWAR) モデルを導入している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:40:26 GMT)
Youth as Peer Auditors: Engaging Teenagers with Algorithm Auditing of Machine Learning Applications [0.4] 本稿では、若年層を機械学習(ML)を利用したアプリケーションの監査者として位置づける。
2週間のワークショップで、13人の若者(14~15歳)がMLベースのアプリケーションを設計し、監査した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:15:26 GMT)
WEEP: A method for spatial interpretation of weakly supervised CNN models in computational pathology [0.4] モデル解釈のための新しい方法 Wsi rEgion sElection aPproach (WEEP) を提案する。
乳がん計算病理領域における二分分類課題におけるWEEPについて検討した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:14:45 GMT)
Alljoined -- A dataset for EEG-to-Image decoding [0.3] Alljoinedは、EEGから画像へのデコーディングに特化したデータセットである。
我々は64チャンネルの脳波ヘッドセットで記録された46,080の脳反応を収集した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:21:34 GMT)
Using a Deep Learning Model to Simulate Human Stock Trader's Methods of Chart Analysis [0.3] 提案手法は、過去600日間の株価に注目し、次のD日で株価が10%上昇するか、20%下落するかを予測する。
提案手法を用いて、シャープ比1.57の75.36%を返却し、それぞれ36%、0.61を上回った。
米国市場ではシャープ比0.61で27.17%のリターンを与え、NASDAQ、S&P500、DOW JONESの指数をそれぞれ17.69%、0.27で上回っている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:38:44 GMT)
CLIPping the Limits: Finding the Sweet Spot for Relevant Images in Automated Driving Systems Perception Testing [0.1] ニューラルネットワークを用いて、自然言語のプロンプトと類似性に応じてデータセット内の画像をソートする。
私たちの焦点は、偽陽性と偽陰性を平等に防止することにあります。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:57:32 GMT)
Iterative Refinement Strategy for Automated Data Labeling: Facial Landmark Diagnosis in Medical Imaging [0.0] 本稿では,顔のランドマーク診断における自動ラベリングのための反復的改善戦略を提案する。
提案手法は,手作業による介入の軽減とラベル品質の向上を両立させる。
本研究は, 医用画像における深層学習システムの能力を高めるために, 自動ラベリングにおける反復的改善の重要性を強調した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:33:40 GMT)
Fighting crime with Transformers: Empirical analysis of address parsing methods in payment data [0.0] 本稿では,変換器と生成大言語モデル(LLM)の性能について検討する。
実世界のノイズの多いトランザクションデータを扱うことのできるロバストモデルのトレーニングの必要性を示す。
以上の結果から,早期ストラップを用いた微調整トランスフォーマーモデルの方が,他の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:04:26 GMT)
Work fluctuation theorems with initial quantum coherence [0.0] ゆらぎ定理は、線形反応則を超えた非平衡熱力学の基本的な結果である。
作業変動定理における初期量子コヒーレンスの役割について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:51:06 GMT)
WebXR, A-Frame and Networked-Aframe as a Basis for an Open Metaverse: A Conceptual Architecture [0.0] この研究は、AフレームとNetworked-Aframeフレームワークを活用する、WebXRベースのクロスプラットフォームの概念アーキテクチャを提案する。
空間ウェブアプリの概念を導入することにより,メタバースについての議論に寄与する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:08:43 GMT)
WaveCatBoost for Probabilistic Forecasting of Regional Air Quality Data [0.0] この手紙は、大気汚染物質のリアルタイム濃度を予測するために設計された新しいWaveCatBoostアーキテクチャを提示する。
このハイブリッドアプローチは、時系列を高周波および低周波成分に効率よく変換し、ノイズから信号を抽出する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:01:25 GMT)
VietMed: A Dataset and Benchmark for Automatic Speech Recognition of Vietnamese in the Medical Domain [0.0] 医療分野におけるベトナム語音声認識データセットであるVietMedについて紹介する。
VietMedは7つの面で世界最大の公衆医療音声認識データセットである。
我々はベトナムのASR、w2v2-Viet、XLSR-53-Viet向けの最初の大規模事前訓練モデルをリリースする。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:43:52 GMT)
Unvortex Lattice and Topological Defects in Rigidly Rotating Multicomponent Superfluids [0.0] 我々は磁化テクスチャに新しい種類のトポロジカルな点欠陥を見出した。
系のスピンテクスチャは、平面から磁化の球面への等距離写像によって記述される。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:41:55 GMT)
Unveiling Latent Topics in Robotic Process Automation -- an Approach based on Latent Dirichlet Allocation Smart Review [0.0] 本研究は, RPAに関連する潜在トピックを明らかにすることで, RPAとその側面の科学マップを作成することを目的とする。
遅延ディリクレ割当に基づく教師なし機械学習手法を用いて2000以上の論文の要約を分析することができた。
このうち、100の異なる研究トピックが発見され、そのうち15のトピックが私たちが提供しているサイエンスマップに含まれています。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:03:06 GMT)
Topological photon pumping in quantum optical systems [0.0] 我々は、すべての交換相互作用を持つライス・ミールモデルの拡張版を導入する。
我々は1次元エミッタ鎖上の光子のトポロジー的に保護され、分散しない輸送を実証した。
双極子-双極子相互作用の長距離特性にもかかわらず、トポロジカルポンピングは1サイクルあたりの忠実度が99.9%に達する光子の輸送を促進する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:45:42 GMT)
Time-dependent conserved operators for non-relativistic Schrödinger equation with electromagnetic field and quantization of resistance [0.0] 2つの系が研究され、1つは定電場の影響下で荷電粒子、もう1つは定電場の影響下で荷電粒子である。
どちらの系に対しても、完全シュル「オーディンガー方程式」に対する時間依存の解を導出するのに使用できる時間依存の保存作用素を見つけることができる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 00:28:57 GMT)
The Quantum Ratio [0.0] 量子比の概念」は、ニュートンの方程式が、有限体温度で孤立した巨視体の質量の中心にどのように現れるかを理解するための最近の試みに現れた。
量子比の導入による重要な概念は、素粒子(電子と光子)が量子力学的であり、環境によって引き起こされたデコヒーレンスによって混合状態に変わったとしてもである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:47:52 GMT)
The Harmonic Oscillator Potential Perturbed by a Combination of Linear and Non-linear Dirac Delta Interactions with Application to Bose-Einstein Condensation [0.0] シュラー・オーディンガー方程式の1次元非線形バージョンの境界状態解析について検討する。
ボース気体の多体相互作用は、シュル・オーディンガー方程式の非線形項によって効果的に説明できる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:46:15 GMT)
Text clustering applied to data augmentation in legal contexts [0.0] 本研究では、自然言語処理ツールの力を利用して、専門家が慎重にキュレートしたデータセットを強化する。
データ拡張クラスタリングベースの戦略は、分類モデルの精度と感度の指標を著しく向上させた。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:18:33 GMT)
Similarity between a many-body quantum avalanche model and the ultrametric random matrix model [0.0] 我々は、時折「バランチェモデル」または「クアンタム太陽モデル」と呼ばれるおもちゃモデルを研究する。
モデルは以下の特徴を共有していると推測する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:23:51 GMT)
Semantic Stealth: Adversarial Text Attacks on NLP Using Several Methods [0.0] テキスト敵攻撃は、入力テキストを意図的に操作することで、モデルの予測を誤解させる。
本稿では,BERT,BERT-on-BERT,Fraud Bargain's Attack (FBA)について述べる。
PWWSは最も強力な敵として登場し、複数の評価シナリオで他のメソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:55:01 GMT)
Self-Labeling in Multivariate Causality and Quantification for Adaptive Machine Learning [0.0] ドメイン適応のための因果関係データストリームを自律的に関連付けるための対話型因果関係に基づく自己ラベル手法を提案した。
本稿では,これらの研究課題に対処する自己ラベルフレームワークとその理論的基盤をさらに発展させる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:16:22 GMT)
Quantum Annealers Chain Strengths: A Simple Heuristic to Set Them All [0.0] チップトポロジを直接マップしない問題の解決は、量子コンピュータでは依然として困難である。
相互接続された物理量子ビットの集合としての論理量子ビットの生成は、チップの間隔によって課される制限を克服する。
強磁性結合を維持するために、密結合された論理量子ビットはより低い鎖強度を必要とすることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:24:03 GMT)
Ordre public exceptions for algorithmic surveillance patents [0.0] ほとんどの場合、アルゴリズムによる監視特許を特許性から除外することは望ましくないと結論付けている。
このような特許の開示は、公共の監視のための監視のブラックボックスを開くことで、社会的観点から肯定的な外部性を持っている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:00:50 GMT)
Optimal work extraction from quantum batteries based on the expected utility hypothesis [0.0] 量子有限系における仕事の抽出は、量子熱力学において重要な問題である。
最適作業抽出が不整合なユニタリ変換によってどのように実行されるかを示す。
また、エネルギーベースにおける初期量子コヒーレンスの存在による作業抽出の影響についても検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:43:48 GMT)
New Online Communities: Graph Deep Learning on Anonymous Voting Networks to Identify Sybils in Polycentric Governance [0.0] 本研究では,ブロックチェーンに基づく分散自律組織(DAOs)におけるデジタル資産の多元的ガバナンスについて検討する。
理論的な枠組みを提供し、シビル(Sybils)を識別する手法を開発することで、分散ガバナンスに直面する重要な課題に対処する。
この実験方法は、オートエンコーダアーキテクチャとグラフ深層学習技術を用いて、ガバナンスデータセット内のSybilアクティビティを識別する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:53:25 GMT)
Neural Sequence-to-Sequence Modeling with Attention by Leveraging Deep Learning Architectures for Enhanced Contextual Understanding in Abstractive Text Summarization [0.0] 本稿では,単一文書の抽象TSのための新しいフレームワークを提案する。
構造、セマンティック、およびニューラルベースアプローチの3つの主要な側面を統合している。
その結果, 希少語, OOV語処理の大幅な改善が示唆された。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:33:59 GMT)
NMon: enhanced transmon qubit based on parallel arrays of Josephson junctions [0.0] ジョセフソン接合の並列配列を利用した新しい超伝導量子ビットアーキテクチャを提案する。
この設計は、通常、$|alpha_r| approx 0.1 - 0.3$の範囲内で、大幅に改善された相対的不調和を提供する。
また,提案装置は,フラキソニウム量子ビットの強化版と同様のパラメータ構造を含む,例外的なチューニング性も備えている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 00:48:33 GMT)
Modelling magnetically-levitated superconducting ellipsoids, cylinders and cuboids for quantum magnetomechanics [0.0] 反ヘルムホルツトラップに閉じ込められた磁気浮上超電導ローターの特性について検討した。
ローターの安定配向はローターのアスペクト比に依存することがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:47:24 GMT)
Modeling the effects of perturbations and steepest entropy ascent on the time evolution of entanglement [0.0] この研究は、急激なエントロピー指数量子熱力学(SEAQT)の運動方程式、リンドブラッド方程式、および絡み合いの損失の様々な尺度を用いて、ベル対角状態の進化を分析する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:53:24 GMT)
Mapping indefinite causal order processes to composable quantum protocols in a spacetime [0.0] 因果次数(QC-QC)の量子制御による量子回路の定式化が、時空における物理実験の観測構成可能性とどのように結びつくかを示す。
我々は、QC-QCフレームワークのセットアップ仮定を時間的視点に組み込んで、すべてのQC-QCが因果箱にマッピング可能であることを示す。
最近導入された微粒化の概念を用いて、因果箱がQC-QCの微粒化に対応することを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:09:50 GMT)
Majorization in some symplectic weak supermajorizations [0.0] シンプレクティック固有値は、いくつかの古典的固有値の不等式のアナログを満たすことが知られている。
本書簡の目的は,多角化によるシンプレクティック・弱い超並列化関係の飽和に必要かつ十分な条件を確立することである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:00:06 GMT)
Linguistic Changes in Spontaneous Speech for Detecting Parkinsons Disease Using Large Language Models [0.0] 本研究では,パーキンソン病を自動的に検出するための最先端の大規模言語モデルの有用性を,最大73%の精度で評価した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:00:10 GMT)
Kagome Hubbard model away from the strong coupling limit: Flat band localization and non Fermi liquid signatures [0.0] 加古目金属および絶縁体の低温特性と熱スケールについて報告する。
弱い結合状態において、フラットバンドの局所化絶縁体を確立する。
NFLの位相を、弾力性準粒子と短距離磁気相関で解析する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:00:02 GMT)
Is English the New Programming Language? How About Pseudo-code Engineering? [0.0] 本研究では,OpenAIの指導的言語モデルであるChatGPTに異なる入力形式がどのような影響を及ぼすかを検討する。
それは、意図、解釈可能性、完全性、創造性の4つのカテゴリにまたがるモデルの習熟度を調べる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:28:52 GMT)
Interpretability in Symbolic Regression: a benchmark of Explanatory Methods using the Feynman data set [0.0] 機械学習モデルの解釈可能性は、モデルの精度と同じくらい重要な役割を果たす。
本稿では,回帰モデルを説明するための説明手法を評価するためのベンチマーク手法を提案する。
その結果、シンボリック回帰モデルは、ホワイトボックスモデルやブラックボックスモデルに代わる興味深い選択肢になり得ることが示されている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 23:46:59 GMT)
Instability of quadratic band degeneracies and the emergence of Dirac points [0.0] ウェーブパペットのダイナミクスは、$bf D+$または$bf D-$の近くでスペクトル的に局所化され、対流項を持つディラック方程式の系によって支配されることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 21:51:53 GMT)
Incorporation of random alloy GaBi$_{x}$As$_{1-x}$ barriers in InAs quantum dot molecules: alloy strain and orbital effects towards enhanced tunneling [0.0] 自己集合InAs量子ドット(QD)は、長いホールスピンコヒーレンス時間を持ち、光学制御スキームに対応可能である。
そのような設計の1つは、量子ドット分子(QDM)を作るために2つのQDを垂直に積み重ねることである。
GaAs間障壁にBiを導入し, トンネルの結合性を高め, 点間をスピン混合する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:20:36 GMT)
In-situ Imaging of a Single-Atom Wave Packet in Continuous Space [0.0] 本研究では, 平面上に膨張する単原子波パケットのその場空間分布を, 量子ガス顕微鏡を用いて解析した。
本研究では,広帯域の波動関数を深い光学格子の部位に制御的に投影し,その後,単原子イメージングを行う。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:32:07 GMT)
Image-based Agarwood Resinous Area Segmentation using Deep Learning [0.0] 商用のアガーウッド産業は、コンピュータ数値制御(CNC)マシンを使用して、このタスクに人間の努力を置き換えようと積極的に研究している。
代わりにDeep Learning Image segmentation法を提案する。
私たちのセットアップでは、断面画像をキャプチャして、イメージファイルをコンピュータに渡します。
コンピュータは、自動画像セグメンテーションを実行し、CNCマシンにGコードスクリプトを供給する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:14:09 GMT)
Hybrid quantum systems with artificial atoms in solid state [0.0] 過去数十年の大半で支配的なシングルプラットフォームキュービットは、さまざまなプラットフォームの限界を強調してきた。
1つ以上のqubitプラットフォームを組み合わせることで、新しいハイブリッドプラットフォームを作ることができる。
生まれたばかりのこの領域は、堅牢でスケーラブルなqubit開発に新たな光を当てる可能性がある。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 03:49:29 GMT)
Hybrid Tree Tensor Networks for quantum simulation [0.0] ハイブリッドツリーネットワーク(hTTN)を用いた基底状態最適化のための新しいアルゴリズムを提案する。
我々は、hTTNsが古典的部分における等しい結合次元を持つ古典的等価性を改善することができることを示した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:00:00 GMT)
Hook-in Privacy Techniques for gRPC-based Microservice Communication [0.0] gRPCは現代の分散システムアーキテクチャの中心にあります。
広く採用されているにもかかわらず、gRPCにはトランスポートやトークンベースの認証以上の高度なプライバシ技術がない。
本稿では,このような高度なプライバシ技術をgRPCフレームワークに統合する,新たなアプローチを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:18:42 GMT)
Hamiltonian Learning using Machine Learning Models Trained with Continuous Measurements [0.0] 我々は最近の機械学習モデルを用いて、量子ビットの連続弱測定を入力としてハミルトンパラメータを推定する作業を構築した。
本モデルでは,(1)弱測定トレーニングレコードを既知のハミルトンパラメータでラベル付けできる教師なし学習と,(2)ラベルを使用できない教師なし学習の2つの設定について検討する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:50:50 GMT)
Gaussian decomposition of magic states for matchgate computations [0.0] マジック状態(英: Magic state)は、古典的にシミュレート可能なクリフォードゲートによる普遍量子計算において重要なものであり、しばしば資源のない安定化状態に分解される。
このアプローチは、安定度ランク、忠実度、範囲の3つの運用上の重要な指標をもたらす。
我々はこれらのシミュレーション手法をMGC(Matchgate circuits)に拡張し、この設定に等価なメトリクスを定義する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:33:11 GMT)
Forecasting Electric Vehicle Battery Output Voltage: A Predictive Modeling Approach [0.0] バッテリー管理システムは、電気自動車とハイブリッド車の安全性と信頼性を確保する上で重要な役割を担っている。
状態評価、監視、電荷制御、セルバランシングなど、BMSに統合されたさまざまな機能に責任がある。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 06:47:03 GMT)
FaaF: Facts as a Function for the evaluation of generated text [0.0] ファクト・アズ・ア・ファンクション(Facts as a Function, FaaF)は,大規模言語モデル(LM)の関数呼び出し機能を活用した事実検証タスクである。
FaaFは、テキスト中のサポート対象の事実を識別する能力を大幅に向上すると同時に、プロンプトベースの手法に比べて効率とコストを大幅に削減する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 14:49:52 GMT)
Experimental observation of a time rondeau crystal: Temporal Disorder in Spatiotemporal Order [0.0] 長期のストロボスコープの秩序を示すシステムにおいて, 短時間の短期障害の-調整可能な程度の最初の実験的観察を報告した。
我々の研究は、観測された非平衡時間秩序の風景を広げ、駆動量子物質を利用した新しい応用の道を開く。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:47:28 GMT)
Estimate of the time required to perform a nonadiabatic holonomic quantum computation [0.0] 非断熱ホロノミック量子計算は、断熱ホロノミック量子計算と同じ堅牢性を持つ量子論理ゲートを実装する方法として提案されている。
非線形ホロノミック量子計算の先駆的な論文で提案された普遍的なホロノミックゲートの実装手順は、等ホロノミック不等式を飽和させ、したがって時間的最適であることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:15:38 GMT)
Entanglement bounds for single-excitation energy eigenstates of quantum oscillator systems [0.0] 発振器系の固有状態の明示的な式を導出し、その絡み合いエントロピーの有界性を確立する。
我々の主な成果は、固有状態の絡み合いに対する対数修正された領域法であり、1つの励起に対応する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:51:02 GMT)
Energy exchange statistics and fluctuation theorem for non-thermal asymptotic states [0.0] 量子系を非熱状態へと導く散逸的な量子力学を考える。
条件$cal I$の物理的解釈を議論し、初期状態のほぼ完全なメモリ損失に等しいことを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:57:41 GMT)
Efficient Encodings of the Travelling Salesperson Problem for Variational Quantum Algorithms [0.0] 本研究では,トラベリングセールスマン問題に対する様々なエンコーディングについて検討する。
置換符号化は、実現可能性の問題に悩まされないため、良好な結果が得られるという証拠が得られます。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 12:30:07 GMT)
EcoVerse: An Annotated Twitter Dataset for Eco-Relevance Classification, Environmental Impact Analysis, and Stance Detection [0.0] EcoVerseは、さまざまな環境トピックにまたがる3,023のツイートからなる、英語の注釈付きTwitterデータセットである。
本研究では,環境関連分類,スタンス検出,環境影響分析のための独自のアプローチの導入を目的とした3段階のアノテーションスキームを提案する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 01:21:11 GMT)
Cooling dynamics of a free ion in a Bose-Einstein condensate [0.0] ボース・アインシュタイン凝縮体(BEC)を初期運動量を与えた後に移動するイオンのダイナミクスについて検討する。
ボゾン浴との相互作用は, 運動エネルギーと速度の期待値を下げることにより, イオンの冷却とピンニングを可能にすることがわかった。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:33:25 GMT)
Continuous-variable quantum key distribution with noisy squeezed states [0.0] 連続可変(CV)量子鍵分布(QKD)プロトコルのセキュリティと性能におけるノイズキャンザリングの役割について考察する。
圧縮された状態のノイズは、必然的にソースの光学的損失から生じるものであり、盗聴器による潜在的搾取に関する懸念を引き起こす。
我々は、盗聴者に対してより多くの情報を提供する可能性があるため、アンチ・スチーズ・ノイズは一般的にプロトコルのセキュリティにとって有害であることを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 07:23:27 GMT)
Comparative Analysis of Image Enhancement Techniques for Brain Tumor Segmentation: Contrast, Histogram, and Hybrid Approaches [0.0] この研究は、画像強調技術が畳み込みニューラルネットワーク(CNN)ベースの脳腫瘍に与える影響を系統的に研究した。
CNNベースのU-Netアーキテクチャ、トレーニング、検証プロセスの詳細な分析を行う。
比較分析は、精度、損失、MSE、IoU、DSCといったメトリクスを利用しており、ハイブリッドアプローチのCLAHE-HEは、他よりも一貫して優れています。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 09:27:42 GMT)
Coherent Heat Transfer Leads to Genuine Quantum Enhancement in Performances of Continuous Engines [0.0] 入浴時のコヒーレント熱伝達を利用した連続量子熱機関について紹介する。
コヒーレントエンジンは出力がはるかに高く、信号と雑音の比もはるかに低い。
コヒーレントエンジンの実験的実現可能性と、量子特性がどのように性能を高めるかの理解の改善は、新興量子技術において重要な意味を持つ可能性がある。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 18:01:11 GMT)
Clinical translation of machine learning algorithms for seizure detection in scalp electroencephalography: a systematic review [0.0] 臨床的翻訳性に着目し,機械学習の発作検出アルゴリズムを体系的に検討した。
一般性、実行時コスト、説明可能性、臨床関連パフォーマンス指標を評価する。
実世界の有効性に関する機械学習アルゴリズムの批判的評価は、臨床翻訳の加速に役立つ。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:19:28 GMT)
Certifying sets of quantum observables with any full-rank state [0.0] 量子オブザーバブルのいくつかの集合は等尺的に一意であり、任意の初期状態に対して同じ値が得られるような文脈性証人を持つことが示される。
これらの2つの性質が、逐次測定による実験の統計を見ることによって、これらの集合のどれでも証明可能であることを証明している。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:08:51 GMT)
Can we accurately read or write quantum data? [0.0] 私は、全ハミルトニアンが下から有界であれば、正確な測定と準備は不可能であることを示す。
この結果は、量子制御、量子コンピューティング、その他の量子技術の限界を再評価する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:09:51 GMT)
Berry phase and the Mandel parameter of the non-degenerate parametric amplifier [0.0] 非退化パラメトリック増幅問題のハミルトニアンを記述する。
我々のハミルトニアンが時間の明示的な関数であると仮定することで、マンデルベリー位相を計算する。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 19:22:32 GMT)
Autonomous Quantum Heat Engine Based on Non-Markovian Dynamics of an Optomechanical Hamiltonian [0.0] この量子熱エンジンの解析モデルと非マルコフ準古典モデルを構築した。
この提案は、非マルコフ政権における量子熱エンジンの詳細な研究を裏付けるものである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 10:35:12 GMT)
Assessment of practical satellite quantum key distribution architectures for current and near-future missions [0.0] 本稿では,SatQKDアーキテクチャの集合を構成する設計選択の多様体について概説する。
我々は、離散可変QKDダウンリンクの準備と測定のために、低地球軌道衛星を信頼できるノードとして使用する際の望ましい選択肢とみなす。
BB84のデコイ状態バージョンは、セキュリティ証明の成熟度、キー生成率の高さ、システム複雑性の低さにより、最も有望なQKDプロトコルであることが判明した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 16:52:15 GMT)
Aspects of human memory and Large Language Models [0.0] 大規模言語モデル(LLM)は、主にテキストを生成するために機能する巨大な人工ニューラルネットワークである。
我々は、人間の記憶の重要な特徴と驚くべき類似点を見出した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 13:47:49 GMT)
Approaching Emergent Risks: An Exploratory Study into Artificial Intelligence Risk Management within Financial Organisations [0.0] 本研究は,これらの実践の探索的研究を通じて,組織におけるAIリスク管理の理解に寄与することを目的とする。
深い洞察は、英国金融セクター内の異なる組織の9人の実践者へのインタビューを通じて得られる。
本研究の成果は,リスク管理フレームワークの即興性と,プロセスレベルと組織レベルの両方において,リスク管理に対する一般的なアプローチのレベルを明らかにするものである。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 20:28:22 GMT)
And Then the Hammer Broke: Reflections on Machine Ethics from Feminist Philosophy of Science [0.0] 視覚は知識の倫理的、政治的問題において重要な比喩である。
コンピュータビジョンの技術を具体化して認識する材料として理解するための事例である。
アプローチはコンピュータビジョン研究、現象学、フェミニスト理論のパラダイムに基づいている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 02:47:54 GMT)
An algebraic attack on stream ciphers with application to nonlinear filter generators and WG-PRNG [0.0] 我々は非線形フィルタ発生器に対する攻撃を特に効果的に設計する。
我々は,NISTコンペティションにおけるストリーム暗号の一つ,WG-PRNGのセキュリティレベルが,これまで述べたよりも低いことを示す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:21:11 GMT)
Accurate Hyperfine Tensors for Solid State Quantum Applications: Case of the NV Center in Diamond [0.0] 計算された超微粒子パラメータの絶対相対誤差は、弱い結合核スピンに対するVASPにおいて100%以上であることを示す。
得られたNV中心の正確な超微細データにより、NV量子ノードの高精度なシミュレーションが可能になる。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 08:52:55 GMT)
AI-Enabled System for Efficient and Effective Cyber Incident Detection and Response in Cloud Environments [0.0] クラウド環境における高度なサイバー脅威の増大は、戦略のパラダイムシフトを必要とする。
本研究は,AIとMLの応用を探求し,クラウド環境に対するAIを活用したサイバーインシデント応答システムを提案する。
この結果はランダムフォレストモデルの有効性を強調し、ネットワークトラフィックの精度90%、マルウェア分析デュアルモデルアプリケーションの96%を達成した。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 15:22:03 GMT)
A Survey in Mathematical Language Processing [0.0] インフォーマルな数学的テキストは、現実世界の量的推論とコミュニケーションを支える。
近年,5つの戦略的サブ領域にまたがる非公式な数学的言語処理手法の開発が進められている。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 11:09:35 GMT)
A Large-Scale Exploration of $μ$-Transfer [0.0] この$mu$-ization(mu$P)は、大規模なニューラルネットワークモデルを構築する際の課題に対する潜在的な解決策を提供する。
明らかな約束にもかかわらず、$mu$Pのスケーリングルールはまだ広く採用されていない。
我々は、$mu$-Transferが重要なケースの大部分が意図したとおりに機能することを示しているが、そうでない驚くべきケースもいくつか見出す。
論文参考訳(メタデータ) (Mon, 8 Apr 2024 17:59:44 GMT)