InternLM2 Technical Report [159.7] 本稿では,オープンソースのLarge Language Models (LLM) であるInternLM2を紹介する。
InternLM2の事前トレーニングプロセスは細部まで詳細に書かれており、多様なデータ型の準備が強調されている。
InternLM2は、4kトークンでトレーニングされた長期的依存関係を効率的にキャプチャし、事前トレーニングおよび微調整の段階で32kトークンに進む。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:53:24 GMT)
Deepfake Generation and Detection: A Benchmark and Survey [138.0] この調査は、ディープフェイクの発生と検出の最新の展開を包括的にレビューする。
代表的な4つのディープフェイク分野(顔スワップ、顔再現、話し顔生成、顔属性編集、外国検出)の研究に重点を置いている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:12:34 GMT)
OmniVid: A Generative Framework for Universal Video Understanding [133.7] 我々は、言語をラベルとして使用し、時間とボックストークンを付加することで、ビデオ理解タスクの出力空間を統合することを目指している。
これにより、分類、キャプション、ローカライゼーションなど、さまざまなタイプのビデオタスクに対処できる。
このようなシンプルで素直なアイデアは極めて効果的であり、最先端ないし競争的な結果を得ることができることを実証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:59:24 GMT)
HIVE: Harnessing Human Feedback for Instructional Visual Editing [127.3] 本稿では,ヒューマンフィードバックを利用した指導視覚編集(HIVE)のための新しいフレームワークを提案する。
具体的には、編集された画像に対する人間のフィードバックを収集し、報酬関数を学習して、基礎となるユーザの好みをキャプチャする。
次に、推定報酬に基づいて人間の好みを組み込むスケーラブルな拡散モデル微調整手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:59:52 GMT)
Segment and Caption Anything [126.2] 本稿では,地域キャプションを生成する機能を備えたセグメンション・アプライシング・モデルを提案する。
軽量なクエリベースの機能ミキサーを導入することで、地域固有の特徴と、後続キャプション生成のための言語モデルの埋め込み空間を整合させる。
提案手法の優位性を実証し,それぞれの設計選択を検証するために,広範な実験を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:56:55 GMT)
Efficient Video Object Segmentation via Modulated Cross-Attention Memory [123.1] 頻繁なメモリ拡張を必要とせず、時間的滑らかさをモデル化するトランスフォーマーベースの手法MAVOSを提案する。
我々のMAVOSは、単一のV100 GPU上で37フレーム/秒(FPS)で動作しながら、J&Fスコア63.3%を達成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:59:58 GMT)
Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability [118.3] 自己回帰モデルでは,格子空間における関節分布をモデル化することにより,2次元画像生成において顕著な結果が得られた。
自動回帰モデルを3次元領域に拡張し,キャパシティとスケーラビリティを同時に向上することにより,3次元形状生成の強力な能力を求める。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:06:00 GMT)
Unleashing the Emergent Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration [116.1] Solo Performance Promptingは、複数のペルソナと多ターンの自己コラボレーションをすることで、単一のLCMを認知的シナジストに変換する。
認知シナジスト(英: Cognitive Synergist)は、複雑なタスクにおける問題解決を強化するために、複数の心の強みと知識を協調的に結合するインテリジェントエージェントである。
より詳細な分析により,LLMに複数の微粒なペルソナを割り当てることによって,単一あるいは固定数のペルソナに比べて問題解決能力が向上することが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:32:33 GMT)
Mechanistic Design and Scaling of Hybrid Architectures [114.3] 我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。
本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。
我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:33:12 GMT)
Decoupled Pseudo-labeling for Semi-Supervised Monocular 3D Object Detection [108.7] SSM3ODに対するDPL(decoupled pseudo-labeling)アプローチを提案する。
提案手法は,擬似ラベルを効率的に生成するためのDPGモジュールを特徴とする。
また,擬似ラベルの雑音深度監視による最適化競合を軽減するために,DGPモジュールを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:12:18 GMT)
Boosting Diffusion Models with Moving Average Sampling in Frequency Domain [101.4] 拡散モデルは、現在のサンプルに頼って次のサンプルをノイズ化し、おそらく不安定化を引き起こす。
本稿では,反復的復調過程をモデル最適化として再解釈し,移動平均機構を利用して全ての先行サンプルをアンサンブルする。
周波数領域における平均サンプリング(MASF)の動作」という完全なアプローチを命名する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:57:55 GMT)
OVER-NAV: Elevating Iterative Vision-and-Language Navigation with Open-Vocabulary Detection and StructurEd Representation [96.5] OVER-NAVは、現在のIVLN技術を超えることを目指している。
解釈されたナビゲーションデータを完全に活用するために、構造化された表現、コード化されたOmnigraphを導入する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:34:48 GMT)
Object Detectors in the Open Environment: Challenges, Solutions, and Outlook [95.3] オープン環境のダイナミックで複雑な性質は、オブジェクト検出器に新しくて恐ろしい挑戦をもたらす。
本稿では,オープン環境におけるオブジェクト検出器の総合的なレビューと解析を行う。
データ/ターゲットの変化の次元に基づいて、4つの四分法(ドメイン外、カテゴリ外、堅牢な学習、漸進的な学習)を含むフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:11:28 GMT)
Mastering Text, Code and Math Simultaneously via Fusing Highly Specialized Language Models [93.9] 大規模言語モデル(LLM)は、3つのドメインすべてにまたがって高いパフォーマンスを同時に達成しようと試みている。
本稿では,すでに高度に特殊化されているモデルを融合する手法を提案する。
提案されているハウジングフレームワークであるUltraFuserは、すでに言語、コーディング、数学について十分に訓練されている3つの異なるスペシャリストで構成されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:29:51 GMT)
CLAMP: Contrastive LAnguage Model Prompt-tuning [90.0] このように適応すれば,大規模な言語モデルでも優れた画像分類性能が得られることを示す。
我々のアプローチは最先端のmLLMを13%上回り、カスタムテキストモデルによる対照的な学習をわずかに上回ります。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:58:28 GMT)
Efficient Image Pre-Training with Siamese Cropped Masked Autoencoders [89.1] CropMAEは、SiamMAEが導入したシームズ事前訓練の代替手法である。
本手法では,同じ画像から得られた2対の収穫画像を,異なる方法で収穫する。
CropMAEは、これまでで最も高いマスキング比(98.5%)を達成し、2つの目に見えるパッチのみを使用して画像の再構成を可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:04:19 GMT)
EulerFormer: Sequential User Behavior Modeling with Complex Vector Attention [88.5] 複素ベクトル注意を持つ新しい変圧器変圧器(EulerFormer)を提案する。
意味的差と位置的差の両方を定式化するための統一的な理論的枠組みを提供する。
意味的変動に対してより堅牢であり、原理上はより上述の理論的性質を持つ。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:18:43 GMT)
Optimal Data Splitting in Distributed Optimization for Machine Learning [86.0] 本研究は,サーバとローカルマシン間の分散データの最適比に着目し,通信コストとローカル計算のコストについて検討する。
ネットワークの実行時間は、一様分布と最適分布で比較される。
提案手法の優れた理論的性能を実験的に検証した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:29:07 GMT)
Activations and Gradients Compression for Model-Parallel Training [86.0] モデル並列分散トレーニングセットアップにおけるアクティベーションと勾配の同時圧縮が収束に与える影響について検討する。
グラデーションはアクティベーションよりも軽度な圧縮速度を必要とする。
実験では、TopKでトレーニングされたモデルが、推論中に圧縮も適用された場合にのみ正常に動作することが示されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:49:44 GMT)
FENICE: Factuality Evaluation of summarization based on Natural language Inference and Claim Extraction [85.3] 自然言語推論とクレーム抽出(FENICE)に基づく要約のファクチュアリティ評価を提案する。
FENICEは、ソース文書内の情報と、要約から抽出されたクレームと呼ばれる一連の原子的事実との間のNLIベースのアライメントを利用する。
我々の測定基準は、事実性評価のためのデファクトベンチマークであるAGGREFACTに関する新しい技術状況を設定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:14:52 GMT)
GPT-4 Is Too Smart To Be Safe: Stealthy Chat with LLMs via Cipher [85.2] 実験により、いくつかの安全領域において、GPT-4の安全性アライメントをバイパスするために、ある暗号がほぼ100%の時間で成功することが示された。
本稿では,ロールプレイのみを使用し,自然言語によるいくつかの実演を行い,これを誘発する新しいSelfCipherを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:23:12 GMT)
DiffFAE: Advancing High-fidelity One-shot Facial Appearance Editing with Space-sensitive Customization and Semantic Preservation [84.1] 本稿では,高忠実度顔画像編集に適した1段階かつ高効率な拡散ベースフレームワークDiffFAEを提案する。
高忠実度クエリ属性転送には、空間感性物理カスタマイズ(SPC)を採用し、忠実度と一般化能力を保証している。
ソース属性を保存するために、Regional-responsive Semantic Composition (RSC)を導入する。
このモジュールは、切り離されたソースを無視する特徴を学習するためにガイドされ、髪、服、背景などの非顔的属性からアーティファクトを保存し緩和する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:53:10 GMT)
Optimization-based Prompt Injection Attack to LLM-as-a-Judge [78.2] 我々は,LLM-as-a-Judgeに合わせた新しい最適化ベースのプロンプトインジェクションアタックであるJiceDeceiverを紹介する。
提案手法は, LLM-as-a-Judgeの意思決定プロセスに対する正確な最適化目標を定式化する。
本手法は,手技によるインジェクション攻撃と比較して,優れた有効性を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:58:00 GMT)
NeRF-HuGS: Improved Neural Radiance Fields in Non-static Scenes Using Heuristics-Guided Segmentation [76.0] 我々は,HuGS(Huristics-Guided harmonily)という新しいパラダイムを提案する。
HuGSは、手作り合成の強さと最先端セグメンテーションモデルを組み合わせることで、過渡的イントラクタからの静的シーンの分離を大幅に強化する。
非定常場面で訓練されたNeRFの過渡的乱れを緩和する手法の優位性とロバスト性を示す実験を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:42:28 GMT)
Robust and Scalable Model Editing for Large Language Models [76.0] LLM編集のスケーラビリティと堅牢性を向上させるため,EREN(Reading Notesによる編集モデル)を提案する。
既存の技術とは異なり、複数の編集から知識を統合することができ、構文的に類似しているが意味的に無関係な入力に正しく反応する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:57:23 GMT)
VRP-SAM: SAM with Visual Reference Prompt [73.1] そこで我々は,Segment Anything Model (SAM) を利用した新しいVisual Reference Prompt (VRP) エンコーダを提案する。
本質的には、VRP-SAMは注釈付き参照画像を使用して特定のオブジェクトを理解し、ターゲット画像内の特定のオブジェクトのセグメンテーションを実行することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:38:52 GMT)
ERM++: An Improved Baseline for Domain Generalization [69.8] 経験的リスク最小化(ERM)は、既存のドメイン一般化(DG)手法よりも優れていることを示す。
ERMは、学習率、ウェイト崩壊、バッチサイズ、ドロップアウトなどのハイパーパラメータのみをチューニングしながら、そのような強力な結果を得た。
結果、より強力なベースライン ERM++ を呼び出します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:46:10 GMT)
Large Language Models for Education: A Survey and Outlook [69.0] 各視点の技術的進歩を体系的にレビューし、関連するデータセットとベンチマークを整理し、教育におけるLSMの展開に伴うリスクと課題を特定する。
本調査は、LLMの力を利用して教育実践を変革し、より効果的なパーソナライズされた学習環境を育むための、教育者、研究者、政策立案者のための総合的な技術図を提供することを目的とする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:04:29 GMT)
AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.7] 本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:27:56 GMT)
Tackling Long Code Search with Splitting, Encoding, and Aggregating [67.0] 長いコード検索のための新しいベースラインSEA(Split, Encode, Aggregate)を提案する。
長いコードをコードブロックに分割し、これらのブロックを埋め込みにエンコードし、それらを集約して包括的な長いコード表現を得る。
エンコーダとしてGraphCodeBERTを使用すると、SEAはコードSearchNetベンチマークでGraphCodeBERTよりも10.1%高い0.785という総合的な平均逆ランキングスコアを達成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:51:38 GMT)
ReMoS: 3D Motion-Conditioned Reaction Synthesis for Two-Person Interactions [66.9] 本稿では,2人インタラクションシナリオにおいて,人の全身反応運動を合成する拡散モデルReMoSを提案する。
ReMoSはペアダンス、忍術、キックボクシング、アクロバティックといった難解な2人のシナリオにまたがってデモを行う。
また,全体動作と指動作を含む2人インタラクションのためのReMoCapデータセットも提供した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:54:04 GMT)
Towards more Practical Threat Models in Artificial Intelligence Security [66.7] 最近の研究で、人工知能のセキュリティの研究と実践のギャップが特定されている。
我々は、AIセキュリティ研究で最も研究されている6つの攻撃の脅威モデルを再検討し、実際にAIの使用と一致させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:06:28 GMT)
Secure Aggregation is Not Private Against Membership Inference Attacks [66.6] フェデレーション学習におけるSecAggのプライバシーへの影響について検討する。
SecAggは、単一のトレーニングラウンドであっても、メンバシップ推論攻撃に対して弱いプライバシを提供します。
以上の結果から,ノイズ注入などの付加的なプライバシー強化機構の必要性が浮き彫りになった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:07:58 GMT)
Provably Secure Disambiguating Neural Linguistic Steganography [66.3] サブワードに基づく言語モデルを使用する際に生じるセグメンテーションの曖昧さ問題は、時にはデコード障害を引き起こす。
そこで我々はSyncPoolという,セグメンテーションのあいまいさ問題に効果的に対処する,セキュアな曖昧さ回避手法を提案する。
SyncPoolは、候補プールのサイズやトークンの分布を変えないため、確実に安全な言語ステガノグラフィー手法に適用できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:25:57 GMT)
Every Shot Counts: Using Exemplars for Repetition Counting in Videos [66.2] ビデオの繰り返し回数は、ビデオ内で繰り返される行動や動きの回数を推測する。
本稿では,対象ビデオ内の繰り返しにまたがる映像の視覚的対応を見出すための例題に基づくアプローチを提案する。
提案したEvery Shot Counts (ESCounts) モデルは,注目度に基づくエンコーダデコーダであり,同じビデオや異なるビデオの例と並行して,様々な長さのビデオをエンコードする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:54:21 GMT)
Generalization Error Analysis for Sparse Mixture-of-Experts: A Preliminary Study [65.1] Mixture-of-Experts (MoE)計算アマルガメート予測
Sparse MoEは、限られた数、あるいは1つの専門家だけを選択的に扱うことで、経験的に保存され、時にはパフォーマンスが向上する一方で、オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:48:02 GMT)
AID: Attention Interpolation of Text-to-Image Diffusion [64.9] AID(Attention Interpolation via Diffusion)という,トレーニング不要な手法を導入する。
AIDは補間された注意を自己注意と融合させ、忠実性を高める。
また,条件に依存した生成過程として,拡散による条件誘導注意補間(AID)も提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:57:05 GMT)
ViT-Lens: Towards Omni-modal Representations [64.7] ViT-Lens-2は、モダリティ増加の表現学習のためのフレームワークである。
ViT-Lens-2は3Dポイントクラウド,奥行き,オーディオ,触覚,脳波の表現を学習できることを示す。
ViT-Lens-2をシームレスにMultimodal Foundation Modelsに統合することにより、テキストと画像生成へのAny-modalityを可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:32:06 GMT)
ObjectCompose: Evaluating Resilience of Vision-Based Models on Object-to-Background Compositional Changes [64.6] 本研究では,視覚モデルによる多様な背景背景環境に対するレジリエンスを評価する。
我々は、画像から画像への変換、画像から画像への変換、および画像から画像への変換モデルの生成機能を利用して、オブジェクトから背景への変換を自動的に生成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:26:17 GMT)
P2ANet: A Dataset and Benchmark for Dense Action Detection from Table Tennis Match Broadcasting Videos [64.6] この作品は、ワールド・テーブルテニス選手権とオリンピアードのプロの卓球試合の放送ビデオから収集された2,721本のビデオクリップで構成されている。
強調局所化と強調認識という2つのアクション検出問題を定式化する。
その結果、TheNameは依然として困難なタスクであり、ビデオからの高密度なアクション検出のための特別なベンチマークとして使用できることを確認した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:35:03 GMT)
Neural Clustering based Visual Representation Learning [61.7] クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:04:50 GMT)
ViT-Lens: Initiating Omni-Modal Exploration through 3D Insights [61.4] ViT-Lensは、事前訓練されたViTで新しいモダリティを知覚し、予め定義された空間に整列することで、効率的なOmni-Modal表現学習を可能にする。
ゼロショット3D分類では、ViT-Lensは従来の最先端技術よりも大幅に改善されている。
近い将来、さらなるモダリティに関するViT-Lensの結果を公表します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:11:07 GMT)
How Private is DP-SGD? [61.2] 2種類のバッチサンプリングを使用する場合、プライバシ分析の間に大きなギャップがあることが示される。
以上の結果から,2種類のバッチサンプリングを用いた場合のプライバシー分析には大きなギャップがあり,DP-SGDのプライバシパラメータの報告に注意が必要であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:02:43 GMT)
Vision Transformers with Hierarchical Attention [61.2] 本稿では、視覚変換器におけるMHSA(Multi-Head Self-Attention)に関連する計算・空間の複雑さに対処する。
階層型MHSA(Hierarchical MHSA, H-MHSA)を提案する。
我々は階層型アテンションベースのトランスフォーマーネットワーク,すなわちHAT-Netのファミリを構築する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:44:45 GMT)
NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.5] 本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:25:04 GMT)
TagAlign: Improving Vision-Language Alignment with Multi-Tag Classification [59.8] 画像とテキストのペア以外の追加データフォーマットを必要とせずに、画像とテキストの特徴の整合性を向上するための、恥ずかしいほど単純なアプローチを提案する。
画像中に存在する可能性が極めて高い記述からオブジェクトや属性を解析する。
実験は、既存の代替手段よりも平均5.2%のフレームワークの改善を裏付けるものです。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:47:12 GMT)
AV2AV: Direct Audio-Visual Speech to Audio-Visual Speech Translation with Unified Audio-Visual Speech Representation [58.7] システムの入力と出力はマルチモーダル(音声と視覚)である
私たちは、自分の主要言語を利用することで、仮想ミーティングで世界中の個人とリアルタイムな会話を行うことができます。
音声モダリティのみを翻訳する音声音声合成(A2A)とは対照的に,提案したAV2AVは音声・視覚音声を直接翻訳する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:21:28 GMT)
SINC: Spatial Composition of 3D Human Motions for Simultaneous Action Generation [58.3] 我々のゴールは、同時動作を記述するテキスト入力を与えられた3次元人間の動作を合成することである。
我々は「空間構成」というような同時的な動きを生み出すことを指す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:16:02 GMT)
Exploring Dynamic Transformer for Efficient Object Tracking [58.1] 効率的なトラッキングのための動的トランスフォーマーフレームワークであるDyTrackを提案する。
DyTrackは、様々な入力に対して適切な推論ルートを設定することを学習し、利用可能な計算予算をより活用する。
複数のベンチマークの実験では、DyTrackは単一のモデルで有望な速度精度のトレードオフを実現している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:31:58 GMT)
COIG-CQIA: Quality is All You Need for Chinese Instruction Fine-tuning [57.6] 高品質な中国語命令チューニングデータセットであるCOIG-CQIAを紹介する。
我々の目標は、モデル行動と人間の相互作用をよりよく整合させる、多種多様な命令チューニングデータセットを構築することである。
我々はCQIAの様々なサブセットで様々なスケールのモデルを訓練し、詳細な評価と分析を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:24:18 GMT)
AgentStudio: A Toolkit for Building General Virtual Agents [57.0] 我々はエージェント開発の全ライフサイクルをカバーするオンラインで現実的でマルチモーダルなツールキットであるAgentStudioを紹介した。
これには環境設定、データ収集、エージェント評価、可視化が含まれる。
環境、データセット、ベンチマーク、インターフェースをオープンソース化し、一般的な仮想エージェントの開発に向けた研究を促進しました。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:54:15 GMT)
Application-Driven Innovation in Machine Learning [56.9] 機械学習におけるアプリケーション駆動研究のパラダイムについて述べる。
このアプローチがメソッド駆動の作業と生産的に相乗効果を示す。
このようなメリットにもかかわらず、マシンラーニングにおけるレビュー、採用、教育のプラクティスが、アプリケーション主導のイノベーションを後押しすることが多いことに気付きます。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:59:27 GMT)
Take Care of Your Prompt Bias! Investigating and Mitigating Prompt Bias in Factual Knowledge Extraction [56.2] 近年の研究では、事前学習言語モデル(PLM)が、事実知識抽出において「急激なバイアス」に悩まされていることが示されている。
本稿では,突発バイアスを徹底的に調査し緩和することにより,既存のベンチマークの信頼性を向上させることを目的とする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:08:47 GMT)
A Design Space for Intelligent and Interactive Writing Assistants [56.0] タスク、ユーザ、テクノロジ、インタラクション、エコシステムの5つの側面について調べる。
各側面において、115の論文を体系的にレビューすることで、次元(アスペクトの基本成分)と符号(各次元の潜在的なオプション)を定義する。
私たちのデザインスペースは、研究者やデザイナーに、アシスタントを書く様々な可能性について、ナビゲートし、理解し、比較するための実用的なツールを提供することを目的としています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:53:14 GMT)
FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects [55.8] FoundationPoseは、6Dオブジェクトのポーズ推定と追跡のための統合基盤モデルである。
我々のアプローチは、微調整なしで、テスト時に新しいオブジェクトに即座に適用できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:25:53 GMT)
OCAI: Improving Optical Flow Estimation by Occlusion and Consistency Aware Interpolation [55.7] 本稿では,中間映像フレームと光フローを同時に生成することで,フレームのあいまいさを頑健に支援するOCAIを提案する。
我々は,Sintel や KITTI などの既存のベンチマークにおいて,優れた品質と光フロー精度を実証した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:23:48 GMT)
AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation [55.2] 人間のポーズと形状の復元のための新しいオールインワンステージフレームワークであるAiOSを、追加の人間検出ステップなしで導入する。
まず、画像中の人間の位置を探索し、各インスタンスのグローバルな機能をエンコードするために、人間のトークンを使用します。
そして、画像中の人間の関節を探索し、きめ細かい局所的特徴を符号化するジョイント関連トークンを導入する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:59:23 GMT)
Language Models for Text Classification: Is In-Context Learning Enough? [54.9] 最近の基礎言語モデルでは、ゼロショットや少数ショットの設定で多くのNLPタスクで最先端のパフォーマンスが示されている。
より標準的なアプローチよりもこれらのモデルの利点は、自然言語(prompts)で書かれた命令を理解する能力である。
これにより、アノテーション付きインスタンスが限られているドメインのテキスト分類問題に対処するのに適している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:47:39 GMT)
Byzantine-resilient Federated Learning With Adaptivity to Data Heterogeneity [54.1] 本稿では、ビザンツの悪意ある攻撃データの存在下でのグラディエント・ラーニング(FL)を扱う。
Average Algorithm (RAGA) が提案され、ロバストネスアグリゲーションを活用してデータセットを選択することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:33:16 GMT)
FaultGuard: A Generative Approach to Resilient Fault Prediction in Smart Electrical Grids [53.2] FaultGuardは、障害タイプとゾーン分類のための最初のフレームワークであり、敵攻撃に耐性がある。
本稿では,ロバスト性を高めるために,低複雑性故障予測モデルとオンライン逆行訓練手法を提案する。
本モデルでは,耐故障予測ベンチマークの最先端を最大0.958の精度で上回っている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:51:23 GMT)
MP5: A Multi-modal Open-ended Embodied System in Minecraft via Active Perception [53.2] MP5は、Minecraftシミュレーター上に構築された、オープンなマルチモーダルエンボディシステムである。
実現可能なサブオブジェクトを分解し、洗練された状況対応プランを設計し、実施可能なアクション制御を実行する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:08:05 GMT)
Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models [52.9] 画像生成のための数十億のデータセットが市販されているが、同じスケールの同様のビデオデータを集めることは依然として難しい。
本研究では,ビデオ合成タスクの実用的な解決策として,ビデオデータを用いた事前学習画像拡散モデルの微調整について検討する。
我々のモデルであるPreserve Your Own correlation (PYoCo)は、UCF-101およびMSR-VTTベンチマークでSOTAゼロショットのテキスト・ビデオ結果が得られる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:11:52 GMT)
Incoherent GRAPE (inGRAPE) for optimization of quantum systems with environmentally assisted control [51.3] オープン1ビットおよび2ビット系に対する非コヒーレントGRAPE法の高忠実度ゲート生成への応用について議論する。
クエトリットには、環境支援型非コヒーレント制御と時間依存デコヒーレンス率の定式化が提供される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:13:26 GMT)
ReMamber: Referring Image Segmentation with Mamba Twister [51.3] ReMamberは、マルチモーダルなMamba TwisterブロックとMambaのパワーを統合する新しいRISアーキテクチャである。
Mamba Twisterは画像とテキストのインタラクションを明示的にモデル化し、独自のチャネルと空間的ツイスト機構を通じてテキストと視覚的特徴を融合する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:27:37 GMT)
Solution for Point Tracking Task of ICCV 1st Perception Test Challenge 2023 [50.9] Tracking Any Point (TAP) タスクは、ビデオを通じて任意の物理的表面を追跡する。
既存のいくつかのアプローチは、スムーズな運動軌跡を得るための時間的関係を考慮し、TAPを探索してきた。
我々は,静的カメラが撮影したビデオの静的点追跡の修正に焦点を当てた,信頼度の高い静的点付きTAP(TAPIR+)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:50:39 GMT)
ConvoFusion: Multi-Modal Conversational Diffusion for Co-Speech Gesture Synthesis [50.7] マルチモーダルなジェスチャー合成のための拡散に基づくアプローチであるConvoFusionを提案する。
提案手法は,条件の異なる条件が与える影響をユーザが調節できる2つの誘導目標を提案する。
本手法は,モノログジェスチャを生成するか,会話ジェスチャを生成するかの訓練が可能である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:59:52 GMT)
Lodge: A Coarse to Fine Diffusion Network for Long Dance Generation Guided by the Characteristic Dance Primitives [50.4] 与えられた音楽に条件付けされた非常に長いダンスシーケンスを生成することができるネットワークであるLodgeを提案する。
提案手法は,グローバルな振付パターンと局所的な動きの質,表現性とのバランスを保ちながら,非常に長いダンスシーケンスを並列に生成することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:24:13 GMT)
2D Gaussian Splatting for Geometrically Accurate Radiance Fields [50.1] 3D Gaussian Splatting (3DGS)は近年,高画質の新規ビュー合成と高速レンダリングを実現し,放射界再構成に革命をもたらした。
多視点画像から幾何学的精度の高い放射場をモデル化・再構成するための新しいアプローチである2DGS(2D Gaussian Splatting)を提案する。
競合する外観品質、高速トレーニング速度、リアルタイムレンダリングを維持しつつ、ノイズフリーかつ詳細な幾何学的再構成を可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:21:24 GMT)
Toward a Theory of Causation for Interpreting Neural Code Models [49.9] 本稿では,ニューラルコードモデル(NCM)に特化したポストホック解釈法である$do_code$を紹介する。
$do_code$は、言語指向の説明を可能にする因果推論に基づいている。
その結果,NCMはコード構文の変化に敏感であることが判明した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:41:28 GMT)
Tandem Transformers for Inference Efficient LLMs [49.8] これらの問題に対処するために,新しいアーキテクチャであるタンデム変換器を導入する。
このアーキテクチャは、小さな自己回帰モデルとブロックモードで動作する大きなモデルを組み合わせたものである。
PaLM2プレトレーニングデータセットでは、PaLM2-BisonとPaLM2-Geckoのタンデムが次点予測精度を3.3%改善している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:13:56 GMT)
LM-Combiner: A Contextual Rewriting Model for Chinese Grammatical Error Correction [49.1] 過剰補正は中国の文法的誤り訂正(CGEC)タスクにおいて重要な問題である。
モデルアンサンブル法による最近の研究は、過剰補正を効果的に軽減し、ECCシステムの精度を向上させることができる。
本稿では,GECシステム出力の過度補正をモデルアンサンブルなしで直接修正できる書き換えモデルLM-Combinerを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:12:21 GMT)
Move as You Say, Interact as You Can: Language-guided Human Motion Generation with Scene Affordance [49.0] 本稿では,シーンアベイランスを中間表現として活用する新しい2段階フレームワークを提案する。
シーンアベイランスマップを活用することで,マルチモーダルな条件下での人間の動きを再現する難しさを克服する。
我々のアプローチは、HumanML3DやHUMANISEなど、確立されたベンチマークのベースラインを一貫して上回ります。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:41:07 GMT)
Automate Knowledge Concept Tagging on Math Questions with LLMs [48.6] 知識概念のタグ付けは、現代の知的教育応用において重要な役割を担っている。
伝統的に、これらの注釈は教育専門家の助けを借りて手作業で行われてきた。
本稿では,Large Language Models (LLM) を用いたタグ付けタスクの自動化について検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:09:38 GMT)
Aligning with Human Judgement: The Role of Pairwise Preference in Large Language Model Evaluators [48.5] 大規模言語モデル(LLM)は、生成された自然言語の品質を評価する上で有望な能力を示している。
LLMは依然として評価のバイアスを示しており、人間の評価と整合したコヒーレントな評価を生成するのに苦労することが多い。
Pairwise-preference Search (PairS)は、LLMを用いてペア比較を行い、候補テキストを効率よくランク付けする不確実性誘導探索手法である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:28:42 GMT)
SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM [48.2] SplaTAMは、単一のRGB-Dカメラからの高忠実度再構成を可能にするアプローチである。
基礎となるガウス表現に合わせて、単純なオンライントラッキングとマッピングシステムを採用している。
実験により,SplaTAMはカメラポーズ推定,マップ構築,既存手法に対する新規ビュー合成において最大2倍の性能を発揮することが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:20:57 GMT)
DataCook: Crafting Anti-Adversarial Examples for Healthcare Data Copyright Protection [47.9] DataCookは、配布前に生データを"クッキング"することで、この処理されたデータに対して正常に実行されるモデルの開発を可能にする。
デプロイメントフェーズでは、オリジナルのテストデータをDataCookを通じて“クッキング”して、通常のモデルパフォーマンスを保証する必要がある。
DataCookの背後にあるメカニズムは、モデルの信頼性を高めるために設計された反逆例(AntiAdv)を作ることである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:44:51 GMT)
Leave No Patient Behind: Enhancing Medication Recommendation for Rare Disease Patients [47.7] 本稿では,レアな疾患の正確性を高めるために,ロバストとメディケーションのための高精度勧告(RAREMed)と呼ばれる新しいモデルを提案する。
入力シーケンスを統一したトランスフォーマーエンコーダを使用して、疾患と手続きコードの間の複雑な関係をキャプチャする。
稀な疾患と一般的な疾患の両方に対して正確な薬物セットを提供し、薬の推奨システムにおける不公平を緩和する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:36:22 GMT)
Can ChatGPT Detect DeepFakes? A Study of Using Multimodal Large Language Models for Media Forensics [47.0] AI生成メディアコンテンツを指すDeepFakesは、偽情報の手段としての利用が懸念されている。
本稿では,DeepFake検出におけるマルチモーダル大言語モデル(LLM)の機能について検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:02:36 GMT)
DeepMIF: Deep Monotonic Implicit Fields for Large-Scale LiDAR 3D Mapping [46.8] 最近の学習ベース手法は,3次元シーンの表面を近似するために,ニューラル暗黙表現と最適化可能な特徴グリッドを統合している。
この作業では、LiDARデータを正確にフィッティングすることから離れ、代わりにネットワークが3D空間で定義された非メトリックモノトニック暗黙フィールドを最適化する。
提案アルゴリズムは,Mai City, Newer College, KITTIベンチマークで得られた複数の量的および知覚的測定値と視覚的結果を用いて,高品質な高密度3Dマッピング性能を実現する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:58:06 GMT)
Global Point Cloud Registration Network for Large Transformations [46.7] ローカルトランスフォーメーションの優れたパフォーマンスを維持しつつ,大規模なトランスフォーメーションが発生するケースに直面するアーキテクチャであるReLaToを提案する。
本稿では,ソフトマックスプーリング層を用いて2つの点集合間の相互一致関係を抽出し,最も確実な一致を抽出する。
そして、得られた一致と潜伏特徴の両方に目標誘導復調ステップを適用し、最終的な微妙な登録を推定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:52:48 GMT)
Targeted Visualization of the Backbone of Encoder LLMs [46.5] 注意に基づく大規模言語モデル(LLMs)は、自然言語処理(NLP)における最先端技術である。
エンコーダモデルの成功にもかかわらず、私たちはこの作業に集中していますが、バイアスの問題や敵の攻撃に対する感受性など、いくつかのリスクも抱えています。
決定関数の一部を2次元のデータセットとともに視覚化するDeepViewのNLPドメインへの応用について検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:51:02 GMT)
Track Everything Everywhere Fast and Robustly [46.4] ビデオ中の任意のピクセルを効率的に追跡するための新しいテスト時間最適化手法を提案する。
本稿では,関数表現を局所的な時空間特徴グリッドに分解する,新しい非可逆変形ネットワークCaDeX++を提案する。
本実験は,SoTA最適化手法であるOmniMotion上でのトレーニング速度( textbf10 倍の速度),堅牢性,精度を著しく向上したことを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:58:22 GMT)
SpectralWaste Dataset: Multimodal Data for Waste Sorting Automation [46.2] 本稿では, 廃棄物処理施設から収集した最初のデータセットであるSpectralWasteについて紹介する。
このデータセットには、分類植物によく見られるいくつかのカテゴリのオブジェクトのラベルが含まれている。
異なるオブジェクトセグメンテーションアーキテクチャを用いたパイプラインを提案し,その代替案をデータセット上で評価する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:39:38 GMT)
TRAM: Global Trajectory and Motion of 3D Humans from in-the-wild Videos [46.1] TRAMはSLAMを強固にし、ダイナミックな人間の存在下でカメラの動きを回復させる。
人間の運動運動を抑えるためのビデオトランスモデルを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:10:45 GMT)
Passive Non-Line-of-Sight Imaging with Light Transport Modulation [46.0] 一つのネットワークで複数の光輸送条件を効果的に処理する新しい受動NLOSイメージング法であるNLOS-LTMを提案する。
我々は、投影画像から潜在光輸送表現を推測し、この表現を用いて、投影画像から隠されたイメージを再構成するネットワークを変調する。
大規模受動的NLOSデータセットの実験により,提案手法の優位性を実証した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:55:40 GMT)
Deciphering the Impact of Pretraining Data on Large Language Models through Machine Unlearning [46.0] 大規模言語モデルの事前学習データの5つの主要なカテゴリから,48のデータセットが与える影響を系統的に分析した。
本研究は,LLMの性能に対する複数コーパスの寄与に関する実証的な結果を提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:45:40 GMT)
Verbing Weirds Language (Models): Evaluation of English Zero-Derivation in Five LLMs [45.9] 本稿では,変換に関する大規模言語モデルの振る舞いに関する最初の研究を報告する。
本研究では,モデルが音声の非典型的部分を持つ構成において,単語よりも一般化できる程度をテストするタスクを設計する。
GPT-4 は GPT-3.5 に次いでタスク上で最高の性能を発揮するが,オープンソースの言語モデルでもそれを実現することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:45:27 GMT)
First Tragedy, then Parse: History Repeats Itself in the New Era of Large Language Models [45.9] 多くのNLP研究者は、ChatGPTや他の大規模言語モデル(LLM)に基づくシステムの成功によって、現実的な危機を経験している。
機械翻訳のための大規模な$n$-gramモデル(MT)で2005年に始まったLLMの最初の時代からのガイダンスを探す。
我々は、スケールの格差は過渡的であり、研究者はそれらを減らすために働くことができると論じている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:23:27 GMT)
Addressing Social Misattributions of Large Language Models: An HCXAI-based Approach [45.7] 我々は,大規模言語モデル(LLM)における社会貢献のリスクに対処するために,社会透明性(ST)フレームワークの拡張を提案する。
LLMは、デザイナーの意図とユーザの社会的属性に対する認識のミスマッチを引き起こし、感情的な操作や危険な行動を促進するリスクを負う。
設計者やユーザによるLSMに割り当てられた特定の社会的属性を明らかにするため,第5の"W-question"によるSTフレームワークの拡張を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:02:42 GMT)
DreamComposer: Controllable 3D Object Generation via Multi-View Conditions [45.4] 最近の作品では、ワン・イン・ザ・ワイルド画像から高品質なノベルビューを生成することができる。
複数の視点からの情報がないため、これらは制御可能な新しい視点を生み出すのに困難に直面する。
我々はDreamComposerについて述べる。DreamComposerはフレキシブルでスケーラブルなフレームワークで、マルチビュー条件を注入することで既存のビュー認識拡散モデルを強化することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:13:11 GMT)
Blinded by Generated Contexts: How Language Models Merge Generated and Retrieved Contexts for Open-Domain QA? [45.2] 本稿では,Large Language Models (LLM) が生成および検索コンテキストをどのように統合するかを検討する。
実験では、誤った情報を提供する場合でも、生成されたコンテキストを優先する複数のLSMにおいて、重大なバイアスが示される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:47:14 GMT)
Compilation of a simple chemistry application to quantum error correction primitives [45.0] 我々は、最小限の化学例に基づいて、フォールトトレラントに量子位相推定を行うために必要な資源を推定する。
単純な化学回路でさえも1000キュービットと2300の量子誤差補正ラウンドを必要とすることがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:37:26 GMT)
Advancing Topic Segmentation and Outline Generation in Chinese Texts: The Paragraph-level Topic Representation, Corpus, and Benchmark [44.1] 段落レベルのトピック構造は、ドキュメント全体のコンテキストをより高いレベルから把握し、理解することができる。
大規模で高品質な中国語段落レベルの話題構造コーパスの欠如は研究や応用を妨げた。
コーパス構築を導くために,3層からなる階層的な段落レベルのトピック構造表現を提案する。
2段階のマンマシン・コラボレーティブ・アノテーションを用いて,中国最大規模のトピック構造コーパスを構築する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:29:21 GMT)
Constructions Are So Difficult That Even Large Language Models Get Them Right for the Wrong Reasons [43.7] 語彙重なりが大きいNLIのための小さな課題データセットを導入する。
GPT-4 と Llama 2 は強いバイアスで失敗する。
計算言語学の観点から、曲面特徴によって区別できない3種類の形容詞を持つ構成群を同定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:51:12 GMT)
Decomposing Disease Descriptions for Enhanced Pathology Detection: A Multi-Aspect Vision-Language Pre-training Framework [43.5] 医学的な視覚言語事前訓練は研究の最前線として現れ、ゼロショットの病理診断を可能にしている。
バイオメディカルテキストの複雑なセマンティクスのため、現在の方法では、医学的画像と、非構造化レポートの重要な病理学的所見の整合に苦慮している。
これは、大きな言語モデルと医療専門家に相談することで達成される。
近年の手法の精度は, それぞれ8.56%, 17.0%まで向上している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:26:21 GMT)
Assessment of Multimodal Large Language Models in Alignment with Human Values [43.0] 提案するCh3Efは,Ch3Ef,Ch3Ef,Ch3Ef,Ch3Ef,Ch3Ef,Ch3Ef。
Ch3Efデータセットには、hhh原則に基づいた12のドメインと46のタスクを含む、1002人の注釈付きデータサンプルが含まれている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:10:21 GMT)
CLHA: A Simple yet Effective Contrastive Learning Framework for Human Alignment [42.7] 人間からのフィードバックからの強化学習(RLHF)は、大規模言語モデル(LLM)と人間の嗜好を整合させる重要な手法である。
我々は,LLMと人間の嗜好を直接整合させる,単純かつ効果的な人間適応のためのコントラスト学習フレームワーク(CLHA)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:08:20 GMT)
Multiparameter quantum sensing and magnetic communications with a hybrid dc and rf optically pumped magnetometer [41.9] 我々は,1つのdc磁場成分と1つのRF磁場成分を同時に測定するハイブリッド光ポンピング磁気センサ(HOPM)を導入,実証する。
HOPMは、サブpT/$sqrtmathrmHz$感度をdcおよびRFフィールドの両方に対して達成し、低周波数でのスピンプロジェクションノイズと高周波数での光子ショットノイズによって感度に制限される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:58:47 GMT)
Unveiling the Pitfalls of Knowledge Editing for Large Language Models [41.8] 知識編集が潜在的なリスクをもたらす副作用をもたらすかどうかはまだ不明である。
本稿では,大規模言語モデルの知識編集に伴う潜在的な落とし穴について検討する。
実験結果は、知識編集が意図しない結果の影を必然的に落としてしまうことを鮮明に示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:38:23 GMT)
A Multimodal Approach to Device-Directed Speech Detection with Large Language Models [41.4] 我々は、ユーザが各コマンドをトリガーフレーズで開始しなければならないという要求を省くことが可能かどうかを探る。
音声波形から得られた音響情報のみを用いて分類器を訓練する。
本研究では,1-best仮説などの自動音声認識システムのデコーダ出力を,大規模言語モデルへの入力特徴とみなす。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:02:32 GMT)
AIOS: LLM Agent Operating System [40.9] AIOSは、大規模言語モデル(LLM)ベースのインテリジェントエージェントのためのオペレーティングシステムである。
巨大な言語モデルをOSの頭脳としてオペレーティングシステム(OS)に組み込んで、オペレーティングシステムを「魂を持って」可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:35:07 GMT)
Predicting risk of cardiovascular disease using retinal OCT imaging [40.7] 将来性心血管疾患(CVD)の予知法としての光コヒーレンス断層撮影の可能性について検討した。
我々は,変分オートエンコーダ(VAE)に基づく自己教師型ディープラーニング手法を用いて,高次元 OCT 画像の低次元表現を学習した。
OCT画像で見られる脈絡膜層は,新しいモデル説明可能性アプローチを用いて,今後のCVD事象の予測因子として同定された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:42:46 GMT)
Large scale paired antibody language models [40.4] IgBert と IgT5 は,これまでに開発された抗体特異的言語モデルの中で最も優れた性能を示した。
これらのモデルは、20億以上のObserved Spaceデータセットを使用して、包括的にトレーニングされている。
この進歩は、治療開発のための抗体設計を強化するために、機械学習、大規模データセット、高性能コンピューティングを活用する上で大きな前進となる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:21:54 GMT)
Large Language Models Produce Responses Perceived to be Empathic [40.4] LLM(Large Language Models)は、一般的な生活経験を説明する投稿に応答して共感的なメッセージを生成する。
いくつかのモデルで書かれた様々な反応を示し、その反応がいかに共感的であるかを評価した。
その結果, LLM生成応答は人文応答よりも共感的であった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:14:34 GMT)
Leftover-Lunch: Advantage-based Offline Reinforcement Learning for Language Models [40.0] 本稿では,新しいオフラインポリシー勾配アルゴリズムであるAdvantage-Leftover Lunch RL (A-LoL)を紹介する。
A-LoLは、シーケンスレベルの分類器や人間設計のスコアリング機能を報酬として組み込むことができる。
A-LoLとその変種の有効性を4つの異なる言語生成タスクで示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:07:01 GMT)
Segment Any Medical Model Extended [39.8] 我々は,新しいSAMモデルを統合し,より高速な通信プロトコルを採用し,新しいインタラクティブモードに対応し,モデルのサブコンポーネントの微調整を可能にするプラットフォームであるSAMM Extended (SAMME)を紹介した。
これらの機能はSAMのような基礎モデルの可能性を拡大し、画像誘導療法、複合現実インタラクション、ロボットナビゲーション、データ拡張などのアプリケーションに変換することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:37:25 GMT)
Interpretable cancer cell detection with phonon microscopy using multi-task conditional neural networks for inter-batch calibration [39.8] 本稿では,バッチ間キャリブレーションを同時に実現する条件付きニューラルネットワークフレームワークを提案する。
異なる実験バッチをトレーニングし、検証することで、我々のアプローチを検証する。
このモデルを拡張して, 診断信号の再構成を行い, 疾患状態を示す有能な特徴の物理的解釈を可能にした。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:20:10 GMT)
m3P: Towards Multimodal Multilingual Translation with Multimodal Prompt [39.3] マルチモーダル多言語ニューラルマシン翻訳(m3P)を導くためのマルチモーダルプロンプトを利用するフレームワークを提案する。
本手法は, 中心言語としてのイメージを考慮し, 異なる言語の表現距離を最小化することを目的とする。
実験の結果,m3Pは従来のテキストのみのベースラインや多言語マルチモーダルメソッドよりも大きなマージンで優れていた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:04:24 GMT)
Dual Memory Networks: A Versatile Adaptation Approach for Vision-Language Models [37.5] 3つの設定すべてで効果的に機能する多目的適応手法を導入する。
動的および静的なメモリコンポーネントからなるデュアルメモリネットワークを提案する。
私たちのアプローチは、3つのタスク設定の下で11のデータセットでテストされます。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:54:07 GMT)
In Search of a Data Transformation That Accelerates Neural Field Training [37.4] 画素位置の置換がSGDの収束速度にどのように影響するかに焦点をあてる。
対して、画素位置をランダムに変化させることで、トレーニングをかなり加速させることができる。
解析の結果、ランダムなピクセル置換は、初期最適化の妨げとなるが、信号の細部を捉えやすいパターンを取り除くことが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:21:43 GMT)
PWESuite: Phonetic Word Embeddings and Tasks They Facilitate [37.1] 音声による単語の埋め込みを構築するために,音声特徴を用いた3つの手法を開発した。
また、過去、現在、将来のメソッドを適切に評価するためのタスクスイートも提供します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:13:06 GMT)
SelfIE: Self-Interpretation of Large Language Model Embeddings [36.8] SelfIEは、大きな言語モデルが自身の組み込みを自然言語で解釈できるフレームワークである。
SelfIEは倫理的判断、インジェクションの内在化、有害な知識のリコールなどのケースにおける内部的推論を明らかにする。
そこで我々は,個々のレイヤの勾配だけを必要としながら,オープンな概念を編集できるSupervised Controlを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:15:09 GMT)
Learning with Unreliability: Fast Few-shot Voxel Radiance Fields with Relative Geometric Consistency [36.5] 本稿では,数発の放射場に対するボクセルに基づく最適化フレームワークReVoRFを提案する。
本手法は, 隣接する地域での相対深度関係が, 隠蔽領域の絶対色値よりも信頼性が高いという知見に基づく。
提案手法は,3FPSのレンダリング速度3分,360円のシーンをトレーニングするための7分,PSNRを既存の数ショット法よりも5%改善するなど,効率と精度を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:17:46 GMT)
Comparing Pre-trained Human Language Models: Is it Better with Human Context as Groups, Individual Traits, or Both? [36.0] 我々は、事前学習モデルと、グループ属性、個々のユーザー、および5つのユーザレベルおよび文書レベルタスクに対する組み合わせアプローチによる人間のコンテキストを比較した。
グループと個人の両方の特徴による事前学習は、年齢推定と性格評価という2つのユーザレベルの回帰タスクを著しく改善することがわかった。
以上の結果から,どちらの手法も特定のユースケースを持ち,人間中心言語モデリングの新たな道を開くことが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:28:15 GMT)
A performance characterization of quantum generative models [36.0] 量子生成モデリングに使用される量子回路を比較する。
2つの一般的なトレーニング手法を用いてデータセットの確率分布を学習する。
確率分布のコプラを学習する離散アーキテクチャの変種が、他のすべての手法より優れていることを実証的に見出した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:48:12 GMT)
Have Faith in Faithfulness: Going Beyond Circuit Overlap When Finding Model Mechanisms [35.5] エッジ属性パッチ(EAP: Edge Attribution patching)は、介入に対する勾配に基づく近似であり、この問題に対するスケーラブルだが不完全な解決策として現れている。
本稿では,回路のコア特性をよりよく維持することを目的とした,統合勾配付きEAP(EAP-IG)手法を提案する。
EAPを用いた回路はEAP-IGを用いた回路に比べて信頼性が低いことを示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:44:58 GMT)
Multi-Task Dense Prediction via Mixture of Low-Rank Experts [35.1] MLoRE(Mixture-of-Low-Rank-Experts)と呼ばれる,マルチタスクの高密度予測のためのデコーダに着目した新しい手法を提案する。
グローバルなタスク関係をモデル化するために、MLoREは元のMoE構造に汎用的な畳み込みパスを追加し、各タスク機能は、明示的なパラメータ共有のためにこのパスを通ることができる。
実験の結果,MLoREは従来のすべてのメトリクスの最先端手法に比べて優れた性能を示すことがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:40:17 GMT)
KC-GenRe: A Knowledge-constrained Generative Re-ranking Method Based on Large Language Models for Knowledge Graph Completion [34.8] 生成言語モデルに基づく知識制約付き生成復級法であるKC-GenReを紹介する。
ミスマッチ問題を克服するため、KGC再分類タスクを候補識別子ソート生成問題として定式化する。
誤注文問題に対処するため,候補者の識別とランク付けを強化する知識誘導型対話型トレーニング手法を開発した。
省略問題に対処するために、文脈的プロンプトと制御された生成を可能にする知識強化制約付き推論手法を設計する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:36:59 GMT)
RU22Fact: Optimizing Evidence for Multilingual Explainable Fact-Checking on Russia-Ukraine Conflict [34.3] 高品質な証拠は、ファクトチェックシステムを強化する上で重要な役割を担っている。
本稿では,Webから証拠を自動的に抽出・要約する大規模言語モデルを提案する。
RU22Factは、ロシアとウクライナの紛争に関する説明可能な事実チェックデータセットであり、16Kサンプルのうち2022年に構築された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:13:15 GMT)
Bridging Textual and Tabular Worlds for Fact Verification: A Lightweight, Attention-Based Model [34.1] FEVEROUSは、事実抽出と検証タスクに焦点を当てた、ベンチマークおよび研究イニシアチブである。
本稿では,モダリティ変換の必要性を解消する,単純だが強力なモデルを提案する。
提案手法は,異なるデータ型間の遅延接続を効果的に利用することにより,包括的かつ信頼性の高い検証予測を実現する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:54:25 GMT)
Addressing Myopic Constrained POMDP Planning with Recursive Dual Ascent [33.8] 我々は,大域的双対パラメータが探索中の筋活動選択に繋がることを示した。
局所的な行動選択をガイドする履歴依存型2変数を導入する。
モチベーション玩具の事例と2種類の大型CPOMDPについて,本手法の有効性を実証的に比較した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:46:33 GMT)
Joint Learning Neuronal Skeleton and Brain Circuit Topology with Permutation Invariant Encoders for Neuron Classification [33.5] 本稿では,スケルトンから得られるニューロンの形態情報と神経回路から得られるニューロン間のトポロジ情報を組み合わせたNeuNetフレームワークを提案する。
我々は、ヒト大脳皮質とショウジョウバエ脳の体積電子顕微鏡(VEM)画像からニューロン分類タスクのための2つの新しいデータセットを再処理し、リリースする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:45:29 GMT)
Medical Speech Symptoms Classification via Disentangled Representation [33.2] 本稿では,DRSC という医療用音声分類モデルを提案する。
本モデルでは,25種類の医学症状を平均95%の精度で検出する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:51:37 GMT)
All-in-One: Heterogeneous Interaction Modeling for Cold-Start Rating Prediction [33.1] 異種相互作用評価ネットワーク(HIRE)と呼ばれるフレキシブルなフレームワークを提案する。
HIRE線量は、事前に定義された相互作用パターンや、手動で構築された異種情報ネットワークにのみ依存しない。
実験では,実世界の3つのデータセットに対して,3つのコールドスタート設定でモデルを評価する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:29:34 GMT)
To Supervise or Not to Supervise: Understanding and Addressing the Key Challenges of 3D Transfer Learning [33.0] 下流3D作業における教師付きコントラスト付き事前学習戦略とその有用性について, より詳細な調査を行う。
教師付き事前学習の伝達性を向上する簡易な幾何正規化戦略を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:57:33 GMT)
PKU-DyMVHumans: A Multi-View Video Benchmark for High-Fidelity Dynamic Human Modeling [33.0] PKU-DyMVHumansは高忠実度再構成と動的人間のシナリオのレンダリングのための汎用的な人間中心のデータセットである。
フレーム数は820万フレームで、56台以上のカメラが様々なシナリオで捉えている。
ニューラルフィールド(NeRF)に基づくシーン表現の最近の進歩に触発されて、私たちは、オフザシェルフフレームワークを慎重にセットアップした。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:25:58 GMT)
Low-temperature benchmarking of qubit control wires by primary electron thermometry [33.0] 我々は,ミリケルビン系における電子温度を確立するために,クーロン遮断温度計を用いた一次電子温度測定技術を利用する。
また, 超伝導体-絶縁体-正規金属接合を用いた別の電子温度測定法を用いて, 実験結果の検証を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:03:19 GMT)
LLaFS: When Large Language Models Meet Few-Shot Segmentation [32.9] LLaFSは,大規模言語モデル(LLM)を数発のセグメンテーションで活用するための最初の試みである。
LLaFSは、アノテーション付きサポート画像からの制限された情報とバイアスのある情報のみに依存する従来の数ショットセグメンテーション法とは対照的に、LLMを直接使用して数ショットで画像のセグメンテーションを行う。
LLaFSは複数のデータセットで最先端の結果を達成し、数ショットのコンピュータビジョンタスクにLLMを使用する可能性を示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:55:24 GMT)
Domain Randomization via Entropy Maximization [32.8] そこで本研究では,実世界のデータを必要としないシミュレーションにおいて,シミュレーション中の動的分布を自動的に生成する,sim-to-realトランスファーに対処する新しい手法を提案する。
トレーニング分布のエントロピーを直接最大化する制約付き最適化問題であるEntropy Maximization (DORAEMON) によるDOmain RAndomizationを導入する。
我々は、高度に適応的で一般化可能な政策を得る上で、DORAEMONの一貫性のある利点を実証的に検証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:59:44 GMT)
COPR: Continual Learning Human Preference through Optimal Policy Regularization [32.5] 我々はCOPR(Continuous Optimal Policy Regularization)と呼ばれる新しい手法を提案する。
COPRは単一の学習フェーズを含み、複雑な強化学習を必要としない。
実験の結果、COPRは強力な継続的学習(CL)ベースラインを上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:52:59 GMT)
CCDSReFormer: Traffic Flow Prediction with a Criss-Crossed Dual-Stream Enhanced Rectified Transformer Model [32.5] 我々はCriss-Crossed Dual-Stream Enhanced Rectified Transformer Model (CCDSReFormer)を紹介する。
ReSSA(Enhanced Rectified Spatial Self-attention)、ReDASA(Enhanced Rectified Delay Aware Self-attention)、ReTSA(Enhanced Rectified Temporal Self-attention)の3つの革新的なモジュールが含まれている。
これらのモジュールは、疎注意による計算ニーズの低減、トラフィックダイナミクスの理解向上のためのローカル情報への注力、ユニークな学習手法による空間的および時間的洞察の融合を目的としている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:43:57 GMT)
SGHormer: An Energy-Saving Graph Transformer Driven by Spikes [32.3] 強力な表現学習能力を持つグラフトランスフォーマー(GT)は、幅広いグラフタスクで大きな成功を収めている。
GTの優れた性能の背後にあるコストは、より高いエネルギー消費と計算オーバーヘッドである。
メモリと計算コストを削減できる新しいスパイキング型グラフトランス (SGHormer) を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:39:02 GMT)
From Pretext to Purpose: Batch-Adaptive Self-Supervised Learning [32.2] 本稿では,自己教師付きコントラスト学習におけるバッチ融合の適応的手法を提案する。
公平な比較で最先端のパフォーマンスを達成する。
提案手法は,データ駆動型自己教師型学習研究の進展に寄与する可能性が示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:04:00 GMT)
Efficient Pre-training for Localized Instruction Generation of Videos [32.1] 手順ビデオは、レシピの準備のようなタスクのステップバイステップのデモを見せている。
ステップのアノテートと命令の記述にはコストがかかり、現在のデータセットのサイズが制限される。
より小さなデータセットを自動的にキュレートする手法であるSieve-&-Swapを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:58:26 GMT)
Text Is MASS: Modeling as Stochastic Embedding for Text-Video Retrieval [31.8] 本稿では,テキスト埋め込みを柔軟で回復力のあるセマンティックレンジで強化するテキストモデリング手法T-MASSを提案する。
具体的には,テキスト・ビデオ・ペアにテキスト・マスのスケールを適応させるために,類似性を考慮した半径モジュールを導入する。
T-MASSは5つのベンチマークデータセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:59:52 GMT)
MA4DIV: Multi-Agent Reinforcement Learning for Search Result Diversification [31.5] 我々は,MARL(Multi-Agent reinforcement learning)を検索結果のDIVersity(MA4DIV)に導入する。
このアプローチでは、各文書はエージェントであり、検索結果の多様化は複数のエージェント間の協調的なタスクとしてモデル化される。
我々は,MA4DIVが産業規模データセット上の既存のベースラインよりも有効性と効率の両面で大幅に向上していることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:34:23 GMT)
SLEDGE: Synthesizing Simulation Environments for Driving Agents with Generative Models [30.4] SLEDGEは、現実世界の走行ログに基づいて訓練された車両の運動訓練のための最初の生成シミュレータである。
そのコアコンポーネントは学習モデルであり、エージェント境界ボックスとレーングラフを生成することができる。
SLEDGEは、nuPlanのような既存のデータ駆動シミュレータでは見られない500mのルートをサポートすることができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:58:29 GMT)
Don't Listen To Me: Understanding and Exploring Jailbreak Prompts of Large Language Models [29.3] 生成AIは、大きな言語モデル(LLM)へのユビキタスアクセスを可能にした
脱獄プロンプトは、セキュリティ制限を回避し、本来禁止されるように設計された有害なコンテンツを引き出す最も効果的なメカニズムの1つとして現れてきた。
LLMの専門知識に関わらず、ユーザはしばしばジェイルブレイクを成功させる。
また,脱獄即時生成のプロセスを自動化するアシスタントとしてAIを用いたシステムも開発している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:47:42 GMT)
Introducing Syllable Tokenization for Low-resource Languages: A Case Study with Swahili [29.3] トークン化は、文字やサブワードに基づいて単語を分割することができ、言語の構造を最もよく表す単語埋め込みを生成する。
そこで我々は,スワヒリ語に基づく音節トークン化手法を提案し,実験中心の手法を適用した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:26:50 GMT)
Motion Generation from Fine-grained Textual Descriptions [29.0] 我々は,ファインヒューマンML3Dという微細なテキスト記述を専門とする大規模言語移動データセットを構築した。
新しいテキスト2モーションモデルであるFineMotionDiffuseを設計し、微細なテキスト情報をフル活用する。
FineMotionDiffuseはFinHumanML3Dで訓練し,FIDを0.38の差で改善した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:16:47 GMT)
SciCapenter: Supporting Caption Composition for Scientific Figures with Machine-Generated Captions and Ratings [29.0] 本稿では,科学的な図形キャプションのための最先端AI技術を統合する対話型システムであるSciCapenterを紹介する。
SciCapenterは学術論文で各人物の様々なキャプションを生成し、キャプションの品質を評価するためのスコアと包括的なチェックリストを提供する。
Ph.D.の学生によるユーザスタディによると、SciCapenterは字幕作成の認知負荷を著しく低下させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:16:14 GMT)
On the Benefits of Over-parameterization for Out-of-Distribution Generalization [29.0] 本稿では,過度なオーバーフィット条件下でのアウト・オブ・ディストリビューション(OOD)損失を考慮した機械学習モデルの性能について検討する。
モデルパラメータ化のさらなる増大はOOD損失を著しく減少させることを示した。
これらの知見は、モデルアンサンブルによるOOD一般化の実証的な現象を説明する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:01:53 GMT)
ExpressEdit: Video Editing with Natural Language and Sketching [28.8] マルチモダリティ$-$natural Language (NL) とスケッチは、人間が表現に使用する自然なモダリティであり、ビデオエディタをサポートするために$-$canを使用することができる。
我々は,NLテキストによる動画編集と映像フレームのスケッチを可能にするExpressEditを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:34:21 GMT)
Dual Prototype Attention for Unsupervised Video Object Segmentation [28.7] 教師なしビデオオブジェクトセグメンテーション(VOS)は、ビデオ中の最も有能なオブジェクトを検出し、セグメンテーションすることを目的としている。
本稿では,2つの新しいプロトタイプベースアテンション機構,IMA(Inter-modality attention)とフレーム間アテンション(IFA)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:09:43 GMT)
MapGuide: A Simple yet Effective Method to Reconstruct Continuous Language from Brain Activities [28.5] そこで本研究では,脳活動からマッピングしたテキスト埋め込みとの比較により,テキスト再構成を誘導する手法を提案する。
その結果, BLEUとMETEORでは平均77%, 54%の改善が見られた。
このような洞察は、将来の作業のために脳の活動から言語を再構築する作業を単純化することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:18:59 GMT)
Self-Rectifying Diffusion Sampling with Perturbed-Attention Guidance [28.4] Perturbed-Attention Guidance (PAG)は、無条件と条件の両方で拡散サンプルの品質を向上させる。
ADMとStable Diffusionの両方において、PAGは驚くほど、条件付きおよび条件なしのシナリオにおけるサンプル品質を改善します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:49:11 GMT)
Towards a Zero-Data, Controllable, Adaptive Dialog System [27.8] ダイアログツリーから直接データを生成するアプローチについて検討する。
合成データで訓練されたエージェントは、人間のデータで訓練されたモデルに匹敵するダイアログを達成できることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:45:11 GMT)
DS-AL: A Dual-Stream Analytic Learning for Exemplar-Free Class-Incremental Learning [27.6] クラスインクリメンタル・ラーニング (CIL) は, 先進的な制約を伴わず, 重大な課題を呈している。
本稿では,Dual-Stream Analytic Learning (DS-AL) アプローチを提案する。
実証実験の結果、DS-ALは非標準技術であるにもかかわらず、リプレイベースの手法に匹敵する性能を提供することが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:04:18 GMT)
Coimagining the Future of Voice Assistants with Cultural Sensitivity [27.5] 日本における非西洋的文脈における共同設計VAの価値について検討する。
日本語と英語のアメリカ・コンテクストのデザインガイドラインを提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:09:58 GMT)
Intrinsic Subgraph Generation for Interpretable Graph based Visual Question Answering [27.2] グラフに基づく視覚質問応答(VQA)に対する解釈可能なアプローチを提案する。
本モデルは,問合せ処理中に本質的にサブグラフを生成するように設計されている。
生成した部分グラフを,グラフニューラルネットワークの確立したポストホックな説明可能性法と比較し,人的評価を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:29:18 GMT)
Securing Blockchain Systems: A Novel Collaborative Learning Framework to Detect Attacks in Transactions and Smart Contracts [26.9] 本稿では、ブロックチェーントランザクションとスマートコントラクトの攻撃を検出するために設計された、新しい協調学習フレームワークを提案する。
当社のフレームワークは,マシンコードレベルでの複雑な攻撃を含む,さまざまな種類のブロックチェーン攻撃を分類する機能を示している。
我々のフレームワークは、広範囲なシミュレーションや、毎秒2150トランザクションを超えるスループットでリアルタイムな実験を通じて、約94%の精度で検出できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:59:17 GMT)
Towards Source-free Domain Adaptive Semantic Segmentation via Importance-aware and Prototype-contrast Learning [26.5] 本稿では、Importance-Aware と Prototype-Contrast Learning を用いた、エンドツーエンドのソースフリードメイン適応セマンティックセマンティックセマンティクス手法を提案する。
提案したIAPCフレームワークは、訓練済みソースモデルからドメイン不変知識を効果的に抽出し、ラベルなしターゲットドメインからドメイン固有知識を学習する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:54:40 GMT)
Large Language Model for Multi-objective Evolutionary Optimization [26.4] 多目的進化アルゴリズム(MOEA)は多目的最適化問題(MOP)を解決する主要な方法である
近年、MOEAにおいて手作業で設計された演算子を学習ベースの演算子に置き換える試みが試みられている。
本研究は,MOEA演算子の設計に強力な大規模言語モデル(LLM)を活用する新しいアプローチについて検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:04:44 GMT)
Generative 3D Part Assembly via Part-Whole-Hierarchy Message Passing [26.4] 効率的な3次元部分集合のための部分階層型メッセージパッシングネットワークを提案する。
まず、意味ラベルを使わずに幾何学的に類似した部分をグループ化してスーパーパーツを導入する。
我々は、潜在ポーズを用いて点雲を変換し、超部分情報を集約する部分エンコーダに供給する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:15:25 GMT)
Onboard deep lossless and near-lossless predictive coding of hyperspectral images with line-based attention [24.9] 本稿では,LineRWKVと呼ばれるニューラルネットワークを設計する。
HySpecNet-11kデータセットとPRISMA画像による実験により、LineRWKVはCSDS-123.0-B-2より優れる最初のディープラーニング手法であることが示された。
また、7W組込みシステムでスループットを推定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:05:02 GMT)
Deep Support Vectors [24.9] 本稿では,ディープラーニングモデルにおける深層支援ベクトル(DSV)の同定に焦点を当てた。
実証的な調査を通じて、DSVはSVM(Support Vector Machines)において、サポートベクトルと類似性を示すことを示す。
以上の結果から,SVM のプロセスに類似した DSV を用いてモデルを効果的に再構築できることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:24:32 GMT)
Domain Adaptation in Intent Classification Systems: A Review [24.8] 特定のタスクを実行する対話エージェントは、自然言語で人間とコミュニケーションするインテリジェントエージェントを構築するという、NLP研究者の長期的な目標の一部である。
我々は,対話システムの意図的分類部を訓練するために必要なデータセット,ドメイン,タスク,メソッドについて,徹底的な技術的レビューを行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:59:05 GMT)
Towards 3D Vision with Low-Cost Single-Photon Cameras [24.7] 小型で省エネで低コストな単光子カメラによる計測に基づいて,任意のランベルト物体の3次元形状を再構成する手法を提案する。
我々の研究は、画像ベースモデリングとアクティブレンジスキャンの関連性を引き合いに出し、単光子カメラによる3Dビジョンに向けた一歩である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:40:05 GMT)
Large Language Models in Biomedical and Health Informatics: A Bibliometric Review [24.5] 大規模言語モデル(LLM)は、バイオメディカル・ヘルスインフォマティクス(BHI)において、急速に重要なツールになりつつある。
本書評は,2022年から2023年までの研究論文やコラボレーションネットワークを調査し,LLMがBHIでどのように使われているかを示すパノラマ的な視点を提供することを目的とする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:24:36 GMT)
Invisible Gas Detection: An RGB-Thermal Cross Attention Network and A New Benchmark [24.1] 本稿では,RGBを用いた2ストリームネットワークアーキテクチャを用いて,RGB画像のテクスチャ情報と熱画像のガス領域情報を統合するRGB-Thermal Cross Attention Network (RT-CAN)を提案する。
Gas-DBは、約1.3Kの注釈付きRGB熱水画像と8種類のコレクションシーンを含む、大規模なオープンソースのガス検知データベースである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:58:47 GMT)
EthioLLM: Multilingual Large Language Models for Ethiopian Languages with Task Evaluation [24.1] 本稿では,エチオピア語5言語(Amharic, Ge'ez, Afan Oromo, Somali, Tigrinya)と英語の多言語大言語モデルであるEthioLLMを紹介する。
我々は,5つの下流自然言語処理(NLP)タスクにおいて,これらのモデルの性能を評価する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:01:38 GMT)
Decode Neural signal as Speech [23.8] 音声復号化における脳からテキストへのMEG信号の変換について検討する。
本モデルでは,プレトレーニングや教師の強制を伴わずに,60.30点,52.89点のBLEU-1スコアが得られた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:26:21 GMT)
Dr.Hair: Reconstructing Scalp-Connected Hair Strands without Pre-training via Differentiable Rendering of Line Segments [23.7] 映画やゲーム業界では、現実的な髪型を達成するには、頭皮由来の鎖を使うのが一般的である。
本研究では,事前学習の必要性を解消する最適化手法を提案する。
提案手法は,既存の手法の精度を越え,処理速度を大幅に向上させるとともに,堅牢かつ高精度な逆レンダリングを実現する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:53:25 GMT)
FastPerson: Enhancing Video Learning through Effective Video Summarization that Preserves Linguistic and Visual Contexts [23.6] 本稿では,講義ビデオにおける視覚情報と聴覚情報の両方を考慮した映像要約手法であるFastPersonを提案する。
FastPersonは、音声の書き起こしと画面上の画像とテキストを利用して要約ビデオを作成する。
従来のビデオ再生方式と同じレベルの理解度で視聴時間を53%短縮する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:16:56 GMT)
NeuS-PIR: Learning Relightable Neural Surface using Pre-Integrated Rendering [23.5] 本稿では,マルチビュー画像やビデオから可照性神経表面を復元するNeuS-PIR法を提案する。
NeRFや離散メッシュに基づく手法とは異なり,提案手法は暗黙のニューラルサーフェス表現を用いて高品質な幾何学を再構築する。
本手法は,現代のグラフィックスエンジンとシームレスに統合可能なリライトなどの高度なアプリケーションを実現する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:00:27 GMT)
Visual Whole-Body Control for Legged Loco-Manipulation [23.5] そこで本研究では,ロボットアームを用いた移動操作の問題点について検討する。
視覚的観察により全身制御を自律的に行うことのできる枠組みを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:00:27 GMT)
Topic Detection and Tracking with Time-Aware Document Embeddings [23.3] 我々は、時間的・テキスト的な情報をイベント検出のためのニュース文書の1つの表現に融合するニューラルネットワークを設計する。
振り返り設定では、クラスタリングアルゴリズムをタイムアウェアな埋め込みに適用し、News2013データセットのベースラインよりも大幅に改善したことを示す。
オンラインストリーミング設定では、既存の最先端のTDTパイプラインにドキュメントエンコーダを追加し、パフォーマンス全体のメリットを実証します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:26:18 GMT)
HoloVIC: Large-scale Dataset and Benchmark for Multi-Sensor Holographic Intersection and Vehicle-Infrastructure Cooperative [23.3] 複数レイアウトのホログラフィック交差点を構築し,HoloVICと呼ばれる大規模多センサのホログラフィック車両・赤外線協調データセットを構築した。
私たちのデータセットには3種類のセンサー(Camera, Lidar, Fisheye)が含まれています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:14:14 GMT)
Re2LLM: Reflective Reinforcement Large Language Model for Session-based Recommendation [23.2] セッションベースレコメンデーション(SBR)を強化するための有望なアプローチとして,大規模言語モデル(LLM)が登場している。
本稿では,SBR用アンダーライン強化アンダーラインモデル(Re2LLM)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:21:01 GMT)
Hierarchical Open-Vocabulary 3D Scene Graphs for Language-Grounded Robot Navigation [22.8] 本稿では,言語を基盤としたロボットナビゲーションのための3次元シーングラフマッピング手法HOV-SGを提案する。
HOV-SGは3つの異なるデータセットで評価され、オブジェクト、部屋、フロアレベルでのオープン語彙のセマンティック精度において、以前のベースラインを超える。
HOV-SGの有効性と一般化性を証明するため,実世界のマルチストレージ環境における言語条件ロボットナビゲーションの成功例を示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:36:43 GMT)
Graph Signal Diffusion Model for Collaborative Filtering [22.7] 協調フィルタリングはレコメンデータシステムにおいて重要な手法である。
我々は新しい拡散モデルの適応を行い、協調フィルタリングのためのグラフ信号拡散モデル(GiffCF)を提案する。
GiffCFは拡散モデルとグラフ信号処理の両方の利点を効果的に利用し、3つのベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:14:22 GMT)
Serpent: Scalable and Efficient Image Restoration via Multi-scale Structured State Space Models [22.7] Serpentは、そのコア計算ブロックにおける状態空間モデル(SSM)の最近の進歩を活用するアーキテクチャである。
予備的な結果から,Serpentは最先端技術と同等の再現性が得られることが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:43:15 GMT)
Asymptotic Bayes risk of semi-supervised learning with uncertain labeling [22.6] 本稿では,ガウス混合モデルに基づく半教師付き分類について考察する。
本モデルの主な目的はベイズリスクの計算であり,ベイズリスクの挙動と,このモデルで最もよく知られたアルゴリズムを比較する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:54:35 GMT)
STEntConv: Predicting Disagreement with Stance Detection and a Signed Graph Convolutional Network [22.1] 本稿では,2つのポストの著者が同意するか否かを予測するための,単純で新しい教師なしの手法を提案する。
STEntConvは、ユーザのグラフと、スタンスによって重み付けされた名前付きエンティティを構築するモデルである。
この情報を含むと、さまざまな議論を呼んでいるサブレディットトピックに対するReddit投稿のデータセットにおける不一致検出性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:26:04 GMT)
PlainMamba: Improving Non-Hierarchical Mamba in Visual Recognition [21.8] PlainMambaは、一般的な視覚認識のために設計された単純な非階層的状態空間モデル(SSM)である。
我々は,マンバの選択的走査過程を視覚領域に適応させ,二次元画像から特徴を学習する能力を高める。
私たちのアーキテクチャは、同一のPlainMambaブロックを積み重ねることで、使いやすく、拡張しやすいように設計されています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:35:10 GMT)
Continual Few-shot Event Detection via Hierarchical Augmentation Networks [21.6] ラベル付きサンプルのかなりの数がアクセスできない場合、より一般的に発生するシナリオである連続的数ショットイベント検出(CFED)を導入する。
CFEDタスクは、過去のイベントタイプを記憶し、数ショットのサンプルで新しいイベントタイプを学ぶため、難しい。
本手法は,複数の連発イベント検出タスクにおいて,これらの手法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:20:42 GMT)
Improving Pre-trained Language Model Sensitivity via Mask Specific losses: A case study on Biomedical NER [21.6] マスク特化言語モデリング(英語: Mask Specific Language Modeling、MSLM)は、ターゲットドメインの知識を効率的に取得する手法である。
MSLMはDS-termsとジェネリックワードを共同でマスクし、マスク固有の損失を学習する。
分析の結果,MSLMはDS項の感度と検出を改善した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:23:16 GMT)
NJUST-KMG at TRAC-2024 Tasks 1 and 2: Offline Harm Potential Identification [21.5] 本報告では, TRAC-2024オフラインハーム電位密度化法について詳述する。
この調査は、いくつかのインドの言語におけるソーシャルメディアのコメントからなる豊富なデータセットを利用した。
F1値はそれぞれ0.73と0.96の2つの異なるトラックで2位にランクインした。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:09:49 GMT)
Quantum Vulnerability Analysis to Accurate Estimate the Quantum Algorithm Success Rate [21.5] 量子コンピュータは、完全には理解されていない計算中にノイズに悩まされる。
本稿では,量子アプリケーションにおけるエラーの影響を定量化する量子脆弱性解析(QVA)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:48:51 GMT)
$\texttt{NePhi}$: Neural Deformation Fields for Approximately Diffeomorphic Medical Image Registration [21.4] NePhiは変形を機能的に表現し、メモリ消費の設計空間において大きな柔軟性をもたらす。
我々は,NePhiが単一解像度の登録設定において,ボクセルに基づく表現の精度に一致することを示す。
マルチレゾリューション登録では,現在のSOTA学習ベース登録手法とインスタンス最適化の精度を一致させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:17:40 GMT)
Using Domain Knowledge to Guide Dialog Structure Induction via Neural Probabilistic Soft Logic [21.4] ダイアログ構造誘導(DSI)は、与えられたゴール指向ダイアログの潜在ダイアログ構造を推定するタスクである。
既存のDSIアプローチは、ドメイン知識にアクセスせずに遅延状態を推論する純粋なデータ駆動のデプロイモデルであることが多い。
本稿では,ニューラル確率的ソフト論理対話構造誘導法(NEUPSL DSI)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:42:30 GMT)
Groupwise Query Specialization and Quality-Aware Multi-Assignment for Transformer-based Visual Relationship Detection [21.4] 最近、Transformerベースのアーキテクチャで視覚的関係検出(VRD)が大幅に進歩している。
トランスフォーマーをベースとしたVRDモデルのトレーニングにおいて,従来のラベル割り当てにおける2つの重要な制限を識別する。
これらの問題に対処するため,グループワイドクエリと品質を考慮したマルチアサイン(SpeaQ)が提案されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:56:34 GMT)
Out-of-distribution Rumor Detection via Test-Time Adaptation [21.3] 分布シフト(TARD)による騒音検出のための簡易かつ効率的なテスト時間適応法を提案する。
本手法は,伝搬グラフの形式でニュースの伝搬をモデル化し,伝搬グラフのテスト時間適応フレームワークを構築する。
実世界のソーシャルプラットフォームから収集した2つのグループデータセットを用いて行った実験は、我々のフレームワークがパフォーマンスにおいて最先端の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:24:01 GMT)
Predicting species occurrence patterns from partial observations [21.0] 本稿では,(a)衛星画像を用いた種発生パターンの予測と,(b)他の種の発生に関する既知の情報を紹介する。
この課題に対して,衛星画像,環境データ,蝶の観察データのデータセットであるSatButterflyを導入する。
そこで本研究では,見つからない部分的な観測データの利用を可能にする種発生パターンを予測するための一般モデルR-Tranを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:29:39 GMT)
SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation [21.0] 我々は、科学ニュースの自動生成を容易にするための新しいコーパスを提示する。
本データセットは,9分野にわたる学術出版物と,それに対応する科学報告から構成される。
我々は、最先端のテキスト生成モデルを用いてデータセットをベンチマークする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:54:48 GMT)
Living Scenes: Multi-object Relocalization and Reconstruction in Changing 3D Environments [20.9] MoREは進化する環境における多目的再局在と再構成のための新しいアプローチである。
これらの環境を「生きたシーン」とみなし、異なる時点のスキャンをオブジェクトインスタンスの3次元再構成に変換する問題について考察する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:16:26 GMT)
DiffCast: A Unified Framework via Residual Diffusion for Precipitation Nowcasting [20.7] 降水流速計は、気象科学とスマートシティの応用の両方に役立つ、現在の観測に基づいてレーダエコーのシーケンスを予測する重要なタスクである。
従来の研究では、決定論的モデリングや確率論的モデリングの観点から、この問題に対処している。
本稿では,大域的決定論的な動きと残留メカニズムによる局所的変動の観点から,カオス的進化的降水系を分解・モデル化することを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:52:48 GMT)
Simple and Scalable Strategies to Continually Pre-train Large Language Models [20.6] 大規模言語モデル(LLM)は、数十億のトークンで定期的に事前訓練されるが、新しいデータが利用可能になると、プロセスを再開する。
学習率のリウォーミング、LR再計算、過去のデータのリプレイをシンプルかつスケーラブルに組み合わせることで、スクラッチから完全に再学習する性能に匹敵することを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:58:48 GMT)
Not All Similarities Are Created Equal: Leveraging Data-Driven Biases to Inform GenAI Copyright Disputes [20.2] 本稿では,GenAIモデルの学習能力を利用した著作権法解析手法を提案する。
我々は、GenAIによって作成された作品の汎用性を特定するためのデータ駆動型アプローチを提案する。
著作権法における表現的汎用性を測定することの潜在的意味は深い。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:32:32 GMT)
Semi-Supervised Crowd Counting from Unlabeled Data [20.0] 群衆の行動分析は、スマートシティの構築に役立つ日々の交通統計と計画に役立つ。
最近の研究は有望なパフォーマンスを達成したが、高価な群衆アノテーションで監督されたパラダイムに依存していた。
我々は、ラベル付き/ラベル付き両方のデータを堅牢なクラウドカウントに活用できる半教師付き学習フレームワークである$S4textitCrowd$を提案した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:13:26 GMT)
Sharing the Cost of Success: A Game for Evaluating and Learning Collaborative Multi-Agent Instruction Giving and Following Policies [19.8] 本稿では、2人のプレイヤーが視覚と言語の観察を協調する必要がある、挑戦的な対話型参照ゲームを提案する。
本稿では,PPO(Proximal Policy Optimization)の標準設定が,パートナー行動のブートストラップによって高い成功率を達成することを示す。
神経パートナーのペアリングは、繰り返し演奏する際の測定された関節の労力を減少させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:58:28 GMT)
A Correction of Pseudo Log-Likelihood Method [19.7] Pseudo log-likelihood は、コンテキストブレイト、ソーシャルネットワークの影響、因果ブレイトなど様々な分野で使用される可能性推定 (MLE) の一種である。
本稿では,最大擬似対数類似度推定が失敗する反例を示し,このアルゴリズムを citepli 2017, zhang2022online, xiong2022binacomtorial, feng2023combinatorial1, feng2023combinatorial2 で正解する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:15:47 GMT)
Enhancing Zero-Shot Chain-of-Thought Reasoning in Large Language Models through Logic [19.5] 大規模言語モデルは、その推論手順が論理原理に制約されないため、幻覚を示す。
記号論理に根ざした原理を活用する自己改善促進フレームワークであるLoT(Logical Thoughts)を提案する。
算術,コモンセンス,記号,因果推論,社会問題など多種多様な領域における言語課題に対する実験的評価は,論理学による推論の強化の有効性を実証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:53:30 GMT)
SD4Match: Learning to Prompt Stable Diffusion Model for Semantic Matching [19.4] 画像ペア間で意味的に類似したキーポイントをマッチングするという課題に対処する。
既存の研究では、安定拡散中のUNetの中間出力が、堅牢な画像特徴マップとして機能することを示唆している。
基礎的なプロンプトチューニング手法を用いることで、安定拡散の本質的なポテンシャルを生かし、従来の手法よりも精度が大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:52:23 GMT)
DN-Splatter: Depth and Normal Priors for Gaussian Splatting and Meshing [19.4] 我々は3Dガウススプラッティングを奥行きと通常の手法で拡張し、屋内データセットに挑戦する。
具体的には,最適化手順を深度情報で正規化し,近傍のガウスの局所的な滑らかさを強制する。
ガウス表現からメッシュを直接抽出するために、この単純で効果的な正則化手法がいかに利用できるかを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:00:31 GMT)
The Solution for the ICCV 2023 1st Scientific Figure Captioning Challenge [19.3] 本稿では,紙の数字に対して生成されたキャプションの品質を改善するためのソリューションを提案する。
最終テストでは4.49点で1位にランクインした。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:03:50 GMT)
Diffusion Reflectance Map: Single-Image Stochastic Inverse Rendering of Illumination and Reflectance [19.2] 反射は、物体の外観における照明の周波数スペクトルを束縛する。
本稿では,照明の減衰周波数スペクトルを既知の幾何の物体の反射率とともに復元する第1逆レンダリング法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:21:29 GMT)
SocialCircle: Learning the Angle-based Social Interaction Representation for Pedestrian Trajectory Prediction [19.1] 我々は,ソーシャルインタラクションのコンテキストを継続的に反映する,新しいアングルベースのトレーニング可能なソーシャルインタラクション表現であるSocialCircleを構築した。
提案するSocialCircleの効果を,新たにリリースされたトラジェクトリ予測モデルとともにトレーニングすることで検証する。
実験によると、SocialCircleは予測性能を定量的に改善するだけでなく、質的にも社会的相互作用をシミュレートするのに役立つ。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:54:49 GMT)
Learning Flexible Body Collision Dynamics with Hierarchical Contact Mesh Transformer [19.0] 階層型メッシュ構造を用いて長距離依存を学習可能な階層型コンタクトメッシュトランス(HCMT)を提案する。
HCMTは長距離相互作用を可能にし、階層メッシュ構造はすぐに遠くの位置への衝突効果を伝播させる。
その結果,HCMTは既存の手法に比べて大幅な性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:50:54 GMT)
Generator-Retriever-Generator Approach for Open-Domain Question Answering [19.0] 文書検索手法と大規模言語モデル(LLM)を組み合わせた新しい手法を提案する。
並行して、デュアルエンコーダネットワークは、外部コーパスから質問に関連する文書を検索する。
GRGは最先端のgenerator-then-readおよびrecovery-then-readパイプラインより優れている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:40:50 GMT)
ELLEN: Extremely Lightly Supervised Learning For Efficient Named Entity Recognition [18.9] ELENは,微調整言語モデルと言語規則をブレンドした,シンプルで完全にモジュール化されたニューロシンボリックな手法である。
ELLENはCoNLL-2003データセット上で非常に強力なパフォーマンスを実現している。
ゼロショット設定では、ELENは金のデータに基づいてトレーニングされた強力で完全な教師付きモデルの75%以上の性能を達成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:11:51 GMT)
Octree-GS: Towards Consistent Real-time Rendering with LOD-Structured 3D Gaussians [18.8] 3D-GSは、NeRFベースのニューラルシーン表現と比較して、顕著なレンダリングの忠実さと効率を示した。
シーン表現のためのレベル・オブ・ディーテール分解をサポートするLOD構造型3次元ガウスアプローチを特徴とするOctree-GSを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:39:36 GMT)
Neural Multimodal Topic Modeling: A Comprehensive Evaluation [18.7] 本稿では,マルチモーダルトピックモデリングの体系的および包括的評価について述べる。
本稿では2つの新しいトピックモデリングソリューションと2つの新しい評価指標を提案する。
全体として、前代未聞の豊かで多様なデータセットのコレクションに対する評価は、両方のモデルが一貫性と多様なトピックを生成することを示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:29:46 GMT)
Multi-stream Transmission for Directional Modulation Network via distributed Multi-UAV-aided Multi-IRS [18.6] アクティブ・インテリジェント・リフレクション・サーフェス(IRS)は将来の6Gネットワークの革命的な技術である。
16個の小IRSとNSP-ZF-PAの比率は、すべての小IRSを1つの大きなIRSとして組み合わせることで、NSP-ZF-PAの約5倍である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:30:56 GMT)
The Need for Speed: Pruning Transformers with One Recipe [18.3] OPTINは、事前トレーニングされたトランスフォーマーアーキテクチャの効率を向上させるためのツールである。
自然言語、画像分類、トランスファーラーニング、セマンティックセグメンテーションタスクに関する最先端の結果を生成する。
NLPベースラインから$leq 2$%の精度低下と、競合するFLOP削減における画像分類における最先端手法から$0.5$%の改善を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:55:58 GMT)
Learning from Synthetic Human Group Activities [18.3] M3Actはマルチビュー・マルチパーソン・ヒューマン・アトミック・アクションとグループ・アクティビティのための合成データ・ジェネレータである。
Unity Engineによって開発されたM3Actは、複数のセマンティックグループ、非常に多様なフォトリアリスティックなイメージを備えている。
M3Actは、DanceTrackデータセットの最先端のMOTRv2を改善し、リーダボードを10位から2位までホップする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:04:33 GMT)
X-Portrait: Expressive Portrait Animation with Hierarchical Motion Attention [18.2] 本稿では,表現的かつ時間的コヒーレントなポートレートアニメーションを生成するための,革新的な条件拡散モデルであるX-Portraitを提案する。
外観参照として1つのポートレートが与えられた場合、駆動ビデオから得られる動きをアニメーション化し、非常にダイナミックかつ微妙な表情をキャプチャすることを目的としている。
実験により,X-ポートレートの多彩な顔画像および表現力のある運転シーケンスに対する普遍的効果が示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:15:02 GMT)
Integrative Graph-Transformer Framework for Histopathology Whole Slide Image Representation and Classification [18.2] デジタル病理学において、MIL(Multiple Case Learning)戦略は、弱い教師付き病理組織像全体(WSI)分類タスクにおいて広く用いられている。
既存の注意に基づくMILアプローチは、しばしば隣接する組織タイル間のコンテキスト情報や本質的な空間的関係を見落としている。
本稿では、文脈対応リレーショナル特徴とグローバルWSI表現を同時にキャプチャする統合グラフ変換フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:31:05 GMT)
All Rivers Run to the Sea: Private Learning with Asymmetric Flows [18.1] 我々は、非プライベートな集中型トレーニングとしてモデルパフォーマンスに匹敵する、新しいプライベートトレーニングと推論フレームワークであるDeltaを提案する。
デルタは情報に敏感な表現を低次元空間に埋め込み、情報に敏感な部分を高次元の残留物に押し込む。
理論的には、Deltaは公共環境における差分プライバシーを保証し、プライベート環境における複雑さを大幅に低減する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:35:38 GMT)
Hierarchical Multi-label Classification for Fine-level Event Extraction from Aviation Accident Reports [18.0] この記事では、イベント分類を活用すれば、イベントをより正確に識別できる、と論じる。
本稿では,新しい階層型アテンションモジュールをBERTに組み込むことで,階層型アテンションタスクを実現する。
その結果, 高精度な予測精度が向上し, 正規化期間が希少事象識別問題に有効であることが確認された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:51:06 GMT)
TGGLinesPlus: A robust topological graph-guided computer vision algorithm for line detection from images [17.8] 我々は,線検出のためのトポロジカルグラフ誘導アルゴリズムTGGLinesPlusを提案し,実装する。
幅広い領域の画像に対する我々の実験は、我々のアルゴリズムの柔軟性を実証した。
私たちは、TGGLinesPlusのオープンソース実装が、空間科学が重要な多くのアプリケーションに刺激を与え、道を開いたいと考えています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:49:56 GMT)
Retentive Decision Transformer with Adaptive Masking for Reinforcement Learning based Recommendation Systems [17.8] Reinforcement Learning-based Recommender Systems (RLRS) は、様々なアプリケーションで約束されている。
しかし彼らは、特に報酬関数の作成や、既存の大規模なデータセットの活用など、課題に悩まされている。
オフラインRLRSの最近の進歩は、これらの2つの課題に対処するためのソリューションを提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:08:58 GMT)
DiffGaze: A Diffusion Model for Continuous Gaze Sequence Generation on 360° Images [17.7] DiffGazeは、360deg画像上で、現実的で多様な連続した人間の視線シーケンスを生成する新しい方法である。
評価の結果,DiffGazeはすべてのタスクにおいて最先端の手法よりも優れていた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:13:02 GMT)
Powerful Lossy Compression for Noisy Images [17.6] 提案した信号対雑音比(SNR)対応ジョイントソリューションは、局所的および非局所的特徴を利用して画像圧縮と復調を同時に行う。
我々は,主エンコーダ分岐,誘導分岐,信号-雑音比(SNR)認識分岐を含むエンドツーエンドのトレーニング可能なネットワークを設計する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:15:12 GMT)
Chain-of-Action: Faithful and Multimodal Question Answering through Large Language Models [17.6] マルチモーダルおよび検索強化質問応答(QA)のためのチェーン・オブ・アクション・フレームワークを提案する。
文献と比較すると、CoAは現在のQAアプリケーションにおける2つの大きな課題を克服している: (i) リアルタイムやドメインの事実と矛盾しない不誠実な幻覚、(ii) 構成情報よりも弱い推論性能。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:51:01 GMT)
Practical Applications of Advanced Cloud Services and Generative AI Systems in Medical Image Analysis [17.4] 本稿では、医用画像における生成AIの変換可能性について考察し、合成ACM-2データを生成する能力を強調した。
データセットのサイズと多様性の制限に対処することにより、これらのモデルはより正確な診断と患者の結果の改善に寄与する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:55:49 GMT)
Clinical Domain Knowledge-Derived Template Improves Post Hoc AI Explanations in Pneumothorax Classification [17.4] 本稿では, 気胸の臨床知識をモデル説明に組み込むテンプレート誘導アプローチを提案する。
われわれはまず気胸発生の潜在領域を示すテンプレートを作成した。
このテンプレートはモデル説明に重ねて、余分な説明をフィルタリングする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:40:06 GMT)
Knowledge-Powered Recommendation for an Improved Diet Water Footprint [17.3] 世界の人口の3分の2は2025年までに水不足に直面している可能性がある。
本稿では,サステナブルかつ健全な食品消費を促進するために,知識グラフを活用した推薦エンジンを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:47:17 GMT)
Omega: Optimistic EMA Gradients [17.1] 我々は,その更新ルールに履歴勾配を組み込むことで,騒音の影響を緩和する楽観的な更新手法であるOmegaを紹介する。
収束保証は提供していないが,ゲーム実験により,線形プレイヤーに適用した場合に,オメガが楽観的勾配法より優れていることが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:21:41 GMT)
CMP: Cooperative Motion Prediction with Multi-Agent Communication [17.0] 本稿では,協調動作予測の実現可能性と有効性について検討する。
提案手法であるCMPは、LiDAR信号を入力として、追跡と予測能力を向上する。
特に、CMPは平均予測誤差を17.2%減らし、非協調条件と比較して、検出の欠如が少ない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:53:27 GMT)
An Analysis of Switchback Designs in Reinforcement Learning [16.8] 本稿では,A/Bテストにおけるスイッチバック設計について詳細に検討し,基本方針と新方針を時間とともに交互に検討する。
決定処理環境における平均二乗誤差(MSE)の計算を大幅に単純化する「弱信号解析」フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:25:32 GMT)
Exploring Representational Disparities Between Multilingual and Bilingual Translation Models [16.7] 多言語モデルにおける言語ペアの中には、バイリンガルモデル、特に1対多の翻訳設定において、パフォーマンスが悪くなるものもある。
与えられた言語対に対して、その多言語モデルデコーダ表現は一貫して等方的ではなく、同等のバイリンガルモデルデコーダ表現よりも少ない次元を占有していることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:16:37 GMT)
Mathematical Foundation and Corrections for Full Range Head Pose Estimation [16.7] 回転行列が座標系に依存することはよく知られており、ヨー、ロール、ピッチ角はそれらの適用順序に敏感である。
本稿では,300W-LPデータセットで定義されたEuler角,3DDFA-v2,6D-RepNet,WHENetなどの頭部ポーズ推定,およびEuler角の描画ルーチンの有効性について詳しく検討した。
必要であれば、提供されたコードから座標系とヨー、ロール、ピッチのシーケンスを推測する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:04:18 GMT)
Brokenwire : Wireless Disruption of CCS Electric Vehicle Charging [16.5] 電気自動車(EV)用直流急速充電技術として最も広く使われているコンバインド充電システムに対する新たな攻撃を提案する。
私たちの攻撃であるBrokenwireは、車両と充電器の間の必要な制御通信を中断し、充電セッションを中断します。
攻撃は実世界で成功し、1W未満の電力予算で47mの範囲で到達した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:20:12 GMT)
Superior and Pragmatic Talking Face Generation with Teacher-Student Framework [16.5] トーキングフェース生成技術は、任意の外観とモーション信号からトークビデオを生成する。
既存の手法は標準的な入力ではうまく機能するが、複雑な実世界の入力では深刻な性能劣化に悩まされる。
品質、堅牢性、コスト、編集性のバランスをとる教師学生向けフレームワークであるSuperFaceを紹介します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:13:17 GMT)
Mixing Artificial and Natural Intelligence: From Statistical Mechanics to AI and Back to Turbulence [16.4] この論文は、科学研究におけるAIの役割を反映しており、特に乱流研究に焦点を当てている。
これは、ディープニューラルネットワークの革新的利用を通じて、ラグランジアンモデルによる乱流の減少にAIが与える大きな影響を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:45:52 GMT)
ChroniclingAmericaQA: A Large-scale Question Answering Dataset based on Historical American Newspaper Pages [16.2] 485K問合せ対を持つ大規模データセットであるCentrallingAmericaQAを紹介する。
筆者らのデータセットは,120年にわたる日刊アメリカの新聞コレクションのサブセットから作成されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:48:13 GMT)
Dual Conic Proxies for AC Optimal Power Flow [16.0] 既存の学習ベースのアプローチでは、AC-OPFに有効な二重境界は提供できない。
本稿では,AC-OPFの凸緩和のための最適化プロキシをトレーニングすることで,このギャップを解消する。
本稿は、この新しいアーキテクチャと自己教師付き学習スキームを組み合わせることで、データ生成の費用のかかるトレーニングの必要性を軽減する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:00:59 GMT)
TP2O: Creative Text Pair-to-Object Generation using Balance Swap-Sampling [15.9] 本稿では,2つのテキスト埋め込みの要素をランダムに交換することで,新しいオブジェクト画像を生成するスワッピング機構を提案する。
また、新たに生成された画像集合から小さなサブセットを効率的にサンプリングするためのバランススワップ領域も導入する。
私たちの研究結果は、カエルブロッコリーのような人間のアーティストとさえ競合しています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:59:39 GMT)
GenesisTex: Adapting Image Denoising Diffusion to Texture Space [15.9] GenesisTexはテキスト記述から3次元幾何学のテクスチャを合成する新しい手法である。
我々は,各視点に対して潜在テクスチャマップを保持し,対応する視点の描画に予測ノイズを伴って更新する。
大域的整合性は、ノイズ予測ネットワーク内のスタイル整合性機構の統合によって達成される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:15:15 GMT)
Can multiple-choice questions really be useful in detecting the abilities of LLMs? [15.8] 大規模言語モデル(LLM)の評価には,MCQ(Multiple-choice Question)が広く用いられている。
課題と評価方法のミスアライメントは,MCQの有効性の思慮深い分析を必要とする。
質問応答(QA)データセットを中国語と英語の2言語で評価した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:43:48 GMT)
High-order Joint Constituency and Dependency Parsing [15.7] 我々は、入力文に対して、共同で選挙区と依存木を解析する話題、すなわち、互換性のある選挙区と依存木を同時に生成する話題を再考する。
我々は、7つの言語の実験と分析を行い、リッチリソースと低リソースの両方のシナリオをカバーしています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:04:36 GMT)
Curious Rhythms: Temporal Regularities of Wikipedia Consumption [15.7] 日中交替のグローバルなパターンを除去した後も,個々の物品の消費習慣は日中変化が強く維持されていることを示す。
我々はウィキペディアの記事のアクセスリズムの話題的・文脈的相関を調査し、記事の話題、読者国、アクセスデバイス(モバイル対デスクトップ)が日々の注意パターンの重要な予測因子であることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:25:23 GMT)
EgoPoseFormer: A Simple Baseline for Egocentric 3D Human Pose Estimation [15.6] EgoPoseFormerは、ステレオエゴセントリックな人間のポーズ推定のための、シンプルだが効果的なトランスフォーマーベースのモデルである。
本手法をステレオUnrealEgoデータセット上で評価し,従来の手法よりも大幅に優れていたことを示す。
意外なことに、適切なトレーニング手法により、私たちの第一段階のポーズ提案ネットワークでさえ、従来の技術よりも優れたパフォーマンスを達成できることがわかりました。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:02:48 GMT)
Sample complexity of quantum hypothesis testing [15.5] 量子仮説テストのサンプル複雑性について検討する。
目標は、所望の誤差確率に到達するために必要なサンプルの最小数を決定することである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:57:01 GMT)
Learning-based Axial Video Motion Magnification [15.5] 本稿では,ユーザが指定した方向に沿って動きを拡大する軸運動倍率という新しい概念を提案する。
提案手法は,ユーザ制御性という新たな特徴を付加することにより,特定の軸に沿った動きの正当性を向上させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:05:17 GMT)
Artificial Intelligence for Operations Research: Revolutionizing the Operations Research Process [15.5] 人工知能(AI)技術の急速な進歩により、オペレーティングリサーチ(OR)を含む様々な分野に革命をもたらす新たな機会が開かれた。
本稿では,AIのORプロセス(AI4OR)への統合について検討し,その有効性と効率を複数の段階にわたって向上させる。
AIとORの相乗効果は、多くの領域において、大幅な進歩と新しいソリューションを推し進める可能性がある。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:35:45 GMT)
DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions [15.4] DiffH2Oは,現実的,一方的あるいは一方的な物体相互作用を合成する新しい手法である。
タスクを把握段階とテキストベースのインタラクション段階に分解する。
把握段階では、モデルが手の動きのみを生成するのに対し、手と物の両方のポーズが合成される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:06:42 GMT)
Room Transfer Function Reconstruction Using Complex-valued Neural Networks and Irregularly Distributed Microphones [15.4] 第1室共鳴の周波数範囲における室内伝達関数を推定するために,複素数値ニューラルネットワークを用いる。
複雑な数値のニューラルネットワークが部屋の移動関数を推定するために使われるのは、これが初めてである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:57:46 GMT)
HIMap: HybrId Representation Learning for End-to-end Vectorized HD Map Construction [15.4] State-of-the-art法は主に正確な点座標を回帰する点レベルの表現学習に基づいている。
本稿では,HybrId フレームワーク HIMap を提案する。
我々は、大規模な実験を行い、nuScenesとArgoverse2データセットの両方で、従来手法より一貫して優れています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:40:20 GMT)
Tutorial on Diffusion Models for Imaging and Vision [15.3] このチュートリアルの目的は拡散モデルの基礎となる基本的なアイデアについて議論することである。
本チュートリアルの対象者には,拡散モデルの研究や,他の問題を解決するためにこれらのモデルを適用することに関心がある大学生や大学院生が含まれる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:01:41 GMT)
Threats, Attacks, and Defenses in Machine Unlearning: A Survey [15.1] マシン・アンラーニング(MU)は最近、安全なAIを実現する可能性についてかなりの注目を集めている。
この調査は、機械学習における脅威、攻撃、防衛に関する広範な研究のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:59:12 GMT)
SmoothQuant: Accurate and Efficient Post-Training Quantization for Large Language Models [14.9] 大規模言語モデル(LLM)は優れた性能を示すが、計算とメモリ集約性がある。
SmoothQuant, トレーニング不要, 精度保存, 汎用的なポストトレーニング量子化ソリューションを提案する。
最大1.56倍の高速化と2倍のメモリ削減を実現した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:36:31 GMT)
Unsupervised Semantic Segmentation Through Depth-Guided Feature Correlation and Sampling [14.9] 本研究では,シーンの構造に関する情報を学習プロセスに組み込むことにより,教師なし学習の進歩を構築する。
本研究では,(1)特徴マップと深度マップを空間的に相関させて深度-特徴相関を学習し,シーンの構造に関する知識を誘導する。
次に,シーンの深度情報に対する3次元サンプリング技術を利用して,より効果的に特徴を抽出するために,最遠点サンプリングを実装した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:31:28 GMT)
Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction [14.8] 大規模言語モデル(LLM)は、いくつかのタスクにおいて既存の自動評価指標より優れていることが報告されている。
本研究では, 文法的誤り訂正(GEC)評価におけるLLMの性能について, 従来の研究から着想を得たプロンプトを用いて検討した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:43:15 GMT)
Learning to Visually Localize Sound Sources from Mixtures without Prior Source Knowledge [14.8] マルチサウンド音源定位タスクの目標は、混合音からの音源を個別にローカライズすることである。
そこで本研究では,音源数に関する事前知識を必要とせずに,複数音源の局所化を行う手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:27:50 GMT)
Governing Through the Cloud: The Intermediary Role of Compute Providers in AI Regulation [14.7] 計算プロバイダは、AI開発とデプロイメントに関連する法的義務と倫理的責任を持つべきだ、と我々は主張する。
コンピューティングプロバイダは,4つの重要な能力を通じて,規制エコシステムにおいて重要な役割を果たすことができます。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:23:30 GMT)
AMuRD: Annotated Arabic-English Receipt Dataset for Key Information Extraction and Classification [14.4] AMuRDは、レシートから情報を取り出すために特別に設計された、新しい多言語人間アノテーション付きデータセットである。
各サンプルには、アイテム名や価格、ブランドなどの属性のアノテーションが含まれている。
この詳細なアノテーションはレシート上の各項目の包括的な理解を促進する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:05:51 GMT)
ChatGPT Needs SPADE (Sustainability, PrivAcy, Digital divide, and Ethics) Evaluation: A Review [14.4] ChatGPTも大きな言語モデル(LLM)である。
本稿では、上記の特徴に則って、チャットGPTにまつわる問題や懸念について詳細に論じる。
また,最近のEU AI 法について,SPADE の評価に従って簡潔に論じる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:22:54 GMT)
Language Models are Free Boosters for Biomedical Imaging Tasks [14.3] 本研究では,バイオメディカルイメージングタスクのエンコーダの一部として,残留型大規模言語モデル(LLM)の予期せぬ有効性を明らかにする。
これらのLCMは,2次元と3次元の視覚的分類タスクを含む,様々なバイオメディカルイメージングアプリケーションにおいて,性能を向上させることができることがわかった。
副産物として,提案手法は,MedMNIST-2Dと3Dの広範囲な標準化データセットに対して,最先端の成果を新たに設定し,優れた性能を実現した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:05:20 GMT)
Emergent Anomalous Hydrodynamics at Infinite Temperature in a Long-Range XXZ Model [14.3] スピン-1/2 XXZ鎖とパワー-ロー結合の異常な流体力学が発見された。
Kullback-Leibler分散を用いて量子カオスの度合いを定量化する。
この研究は、より広い範囲の非可積分量子多体系における創発的異常輸送現象のより深い理解を提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:50:04 GMT)
Physical 3D Adversarial Attacks against Monocular Depth Estimation in Autonomous Driving [14.2] 3D Depth Fool (3D$2$Fool)は、MDEモデルに対する最初の3Dテクスチャベースの敵攻撃である。
3D$2$Foolは、車種をモデル化するための3Dの敵対的なテクスチャを生成するために特別に最適化されている。
物理的車体モデルに3Dテクスチャを印刷した実世界の実験では、我々の3D$2$Foolが10メートル以上のMDEエラーを引き起こします。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:06:47 GMT)
Motion Planning Diffusion: Learning and Planning of Robot Motions with Diffusion Models [14.2] 新しい計画問題の先駆者として軌道生成モデルを学習することが極めて望ましい。
本研究では,移動計画問題のブートストラッピングに先立って,学習拡散モデルを提案する。
本研究では,ロボット運動の高次元軌跡分布を符号化する拡散モデルについて検討した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:50:43 GMT)
Reinforcement Learning-based Receding Horizon Control using Adaptive Control Barrier Functions for Safety-Critical Systems [14.2] 最適制御法は、安全クリティカルな問題に対する解決策を提供するが、容易に難解になる。
モデル予測制御を利用した強化学習に基づく回帰水平制御手法を提案する。
我々は、コネクテッド・アンド・オートマチック・ビークルにおける自動マージ制御問題に適用し、本手法の有効性を検証した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:49:08 GMT)
HERTA: A High-Efficiency and Rigorous Training Algorithm for Unfolded Graph Neural Networks [14.1] HERTAは、Unfolded GNNの高効率で厳格なトレーニングアルゴリズムである。
HERTAは元のモデルの最適値に収束し、アンフォールドGNNの解釈可能性を維持する。
HERTAの副産物として、正規化および正規化グラフラプラシアンに適用可能な新しいスペクトルスカラー化法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:03:06 GMT)
A Personalized Video-Based Hand Taxonomy: Application for Individuals with Spinal Cord Injury [14.1] 脊髄損傷(SCI)は手機能に障害があり、独立性を低下させる。
本研究の目的は,セマンティッククラスタリングを用いて,エゴセントリックビデオにおける支配的な手の動きを自動的に識別することである。
姿勢と外観データを統合した深層学習モデルを用いて、パーソナライズされた手分類を作成した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:30:55 GMT)
Batched Low-Rank Adaptation of Foundation Models [14.0] ローランド適応 (LoRA) は, トレーニング可能な低ランク行列を組み込んだファウンデーションモデルに注目されている。
我々はFast LoRA(FloRA)という,ミニバッチにおける各入力例を,そのユニークな低ランク適応重みに関連付けることのできるフレームワークを紹介した。
我々は,FLoRAがLoRAの性能特性を保っていることを実証的に証明し,8言語にまたがるMultipleコード生成ベンチマークと6言語にまたがる多言語音声認識タスクにおいて,競合する結果を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:53:56 GMT)
High-Rate Phase Association with Travel Time Neural Fields [14.0] 我々は、深層生成モデリングとニューラルフィールドに基づくハイレートアソシエーションフレームワークであるHarpaを紹介した。
Harpaは、到着シーケンスの比較に最適なトランスポートを使用することで、波動物理学を取り入れている。
したがって、未知の波動速度に対して頑健であり、波動速度モデルを相関の副産物として推定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:50:44 GMT)
Securing GNNs: Explanation-Based Identification of Backdoored Training Graphs [13.9] グラフニューラルネットワーク(GNN)は、多くのドメインで人気を集めているが、パフォーマンスと倫理的応用を損なう可能性のあるバックドア攻撃に弱い。
本稿では,GNNにおけるバックドア攻撃を検出する新しい手法を提案する。
提案手法は, バックドア攻撃に対するGNNの安全性向上に寄与し, 高い検出性能を達成できることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:41:41 GMT)
Aligning Large Language Models for Enhancing Psychiatric Interviews through Symptom Delineation and Summarization [13.8] 本研究は,精神科面接に大規模言語モデルを適用するという新たな分野に寄与する。
我々は、北朝鮮の亡命者からのカウンセリングデータを、外傷的な出来事や精神的な健康問題で分析する。
実験結果から, LLM は症状記述タスクと要約タスクの両方において高い性能が得られることが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:50:04 GMT)
Common Ground Tracking in Multimodal Dialogue [13.8] 本研究では,共有目標を持つグループの「議論」の下での,現在の共有信念と質問の集合を自動的に識別する手法を提案する。
我々は、音声の書き起こし、韻律的特徴、ジェスチャー、行動、コラボレーションの顔を含む、共有物理空間におけるマルチモーダル相互作用のデータセットを注釈付けする。
我々は、位置する証拠と信念の公理から導かれる正式なクロージャルールのセットにカスケードし、操作を更新します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:25:01 GMT)
Identity-aware Dual-constraint Network for Cloth-Changing Person Re-identification [13.7] CC-ReID(CC-Changing Person Re-Identification)は、歩行者が着替えを行うより現実的な監視シナリオにおいて、対象者を正確に識別することを目的としている。
大きな進歩にもかかわらず、既存のCC-ReIDデータセットの限られた布質変化トレーニングサンプルは、モデルが布質非関連の特徴を適切に学習することを妨げている。
本稿では,CC-ReIDタスクのためのID-Aware Dual-Constraint Network (IDNet)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:39:43 GMT)
ArabicaQA: A Comprehensive Dataset for Arabic Question Answering [13.7] アラビカQAは、アラビア語で機械読解とオープンドメイン質問応答のための最初の大規模データセットである。
また、アラビア語ウィキペディアコーパスで訓練された最初の高密度経路探索モデルであるAraDPRを提示する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:37:54 GMT)
Large Language Models as Financial Data Annotators: A Study on Effectiveness and Efficiency [13.6] LLM(Large Language Models)は、一般的なドメインデータセット上のデータアノテーションタスクにおいて、顕著なパフォーマンスを示す。
金融文書中の関係を抽出するための効率的なデータアノテータとしてのLCMの可能性について検討する。
我々は,現在最先端のLLMが,非熟練のクラウドワーカーに十分な代替手段であることを実証した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:32:52 GMT)
Sabiá-2: A New Generation of Portuguese Large Language Models [13.5] ポルトガル語のテキストで訓練された大規模言語モデルのファミリーであるSabi'a-2を紹介する。
モデルはブラジルの大学へのエントリーレベルテストを含む様々な試験で評価される。
サービア-2 ミディアムは、試験64点中23点でGPT-4の成績を上回り、試験64点中58点でGPT-3.5を上回った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:52:35 GMT)
Building Bridges across Spatial and Temporal Resolutions: Reference-Based Super-Resolution via Change Priors and Conditional Diffusion Model [13.4] RefSRは、リモートセンシング画像の空間的および時間的解像度にまたがる橋を構築する可能性がある。
条件付き拡散モデルにより、現実的な高解像度画像を生成する新たな機会が開かれた。
本稿では,RefSRに対するRef-Diffを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:48:49 GMT)
Graph Generation with $K^2$-trees [13.3] K2$-tree表現を利用した新しいグラフ生成手法を提案する。
また、プルーニング、フラットニング、トークン化プロセスを組み込んだシーケンシャルな$K2$-treerepresentationを提示する。
グラフ生成の優位性を確認するため,本アルゴリズムを4つの一般および2つの分子グラフデータセット上で広範囲に評価した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:18:13 GMT)
Understanding Performance of Long-Document Ranking Models through Comprehensive Evaluation and Leaderboarding [13.3] 我々は、長い文書のランク付けのためのTransformerモデルを評価し、それらを単純なFirstPベースラインと比較した。
その結果,MRRやNDCGでは,文書の長期化がFirstPより優れているか,あるいは平均で5%上回っていることがわかった。
これは、長いコンテキストを処理できないモデルによるものではなく、関連するパスの位置バイアスによるものだと推測した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:54:43 GMT)
A Simple and Scalable Representation for Graph Generation [13.1] 本稿では,エッジ数に適合する小さな表現サイズを持つ,ギャップ符号化エッジリスト (GEEL) という,新しい,シンプルでスケーラブルなグラフ表現を提案する。
GEELは、ギャップエンコーディングと帯域幅制限スキームを組み込むことにより、語彙サイズを著しく削減する。
我々は、GEELの有効性を実証し、10の非分散および2つの分子グラフ生成タスクを総合的に評価する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:10:53 GMT)
HILL: Hierarchy-aware Information Lossless Contrastive Learning for Hierarchical Text Classification [12.9] 本稿では,入力サンプルに固有の意味的・統語的情報を適切に予約したコントラッシブ学習方式の実現可能性について検討する。
構造エンコーダは、文書埋め込みを入力として、ラベル階層固有の本質的な構文情報を抽出し、構文情報をテキスト表現に注入する。
HILLの優位性を検証するために,3つの共通データセットの実験を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:29:17 GMT)
Multivariate Gaussian Approximation for Random Forest via Region-based Stabilization [12.8] ポアソン過程によって与えられる一連のトレーニングポイントに基づいて,ランダムな森林予測のためのガウス近似境界を導出する。
我々のアプローチは、ランダムな森林予測が地域ベースの安定化と呼ばれる特定の幾何学的特性を満たすという重要な観測に基づいている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:01:22 GMT)
Near-Optimal Algorithms for Constrained k-Center Clustering with Instance-level Background Knowledge [12.8] 我々は、広く採用されている$k$-centerクラスタリングに基づいて、その入力背景知識を must-link (ML) および cannot-link (CL) 制約セットとしてモデル化する。
制約付き$k$-centerの最初の効率的な近似アルゴリズムに到達します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:22:59 GMT)
Capacity Provisioning Motivated Online Non-Convex Optimization Problem with Memory and Switching Cost [12.8] オンラインの非最適化問題は、一連のサーバのフロータイム(トータル遅延)を目標とする。
各処理は、アクティブサーバ数の変更に伴うコストを最小限に抑えるために、任意の時間で処理できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:22:09 GMT)
Leveraging Near-Field Lighting for Monocular Depth Estimation from Endoscopy Videos [12.5] 内視鏡ビデオにおける単眼深度推定は、補助手術やロボット手術により、臓器のより良いカバレッジと様々な健康問題の検出が可能になる。
主流の自然画像深度推定では有望な進歩があったが、内視鏡画像では技術が不十分であった。
本稿では, 内視鏡から放射される光を表面から反射する光学的手がかりを用いて, 単分子深度推定を改善する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:52:23 GMT)
Prediction-sharing During Training and Inference [12.5] 予測モデルのみを共有する契約、推論時間のみを共有する契約、両方を共有する契約の違いについて検討する。
まず,本研究を円滑に進める一般ベイズ的枠組みを構築した。
分析の第3段階において、実ローンデータを用いた合成シミュレーションにおいて、概念の適用性を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:18:50 GMT)
Rumor Detection with a novel graph neural network approach [12.4] ソーシャルメディア上での噂を検出するために,ユーザ相関と情報伝達の表現を共同で学習する新しい検出モデルを提案する。
具体的には、グラフニューラルネットワークを利用して、二部グラフからユーザ相関の表現を学習する。
本研究では,ユーザ相関パターンを逆転させるには高いコストが必要であることを示すとともに,ユーザ相関をうわさ検出のために考慮することの重要性を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:23:23 GMT)
Image Captioning in news report scenario [12.4] 有名人の写真に特化された画像キャプションの領域を探求する。
この調査は、自動ニュースコンテンツ生成を強化し、よりニュアンスな情報発信を容易にすることを目的としている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:22:02 GMT)
Learning User Embeddings from Human Gaze for Personalised Saliency Prediction [12.4] 本稿では,自然画像のペアと対応する相性マップからユーザ埋め込みを抽出する新しい手法を提案する。
提案手法のコアとなるのは,異なるユーザのイメージと個人満足度マップのペアを対比することにより,ユーザの埋め込みを学習する,シームズ畳み込みニューラルエンコーダである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:45:09 GMT)
CT Synthesis with Conditional Diffusion Models for Abdominal Lymph Node Segmentation [12.2] 本稿では,リンパ節郭清のための条件拡散モデルとnnU-Netモデルを統合するパイプラインを提案する。
LN-DDPMはリンパ節マスクと解剖学的構造マスクをモデル条件として利用する。
腹部リンパ節データセットを用いた実験の結果,LN-DDPMは腹部リンパ節画像合成において他の生成法よりも優れており,下腹部リンパ節セグメント化作業の助けとなることが明らかとなった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:59:11 GMT)
RL$^3$: Boosting Meta Reinforcement Learning via RL inside RL$^2$ [12.1] メタRLへの入力において、従来のRLを通してタスク毎に学習されるアクション値を含むハイブリッドアプローチであるRL$3$を提案する。
RL$3$は、RL$2$と比較して、短期的にはデータ効率を保ちながら、長期的には累積的な報酬を多く得ており、アウト・オブ・ディストリビューション・タスクよりも一般化されていることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:13:20 GMT)
Spanish Resource Grammar version 2023 [12.0] スペイン資源文法(SRG)の最新バージョンについて紹介する。
このような文法は、文法に関する複雑な仮説の集合を符号化し、言語理論の実証的なテストのリソースとなる。
SRGのこのバージョンは、最新のFreeling形態を使っており、自動生成され、手動で検証された2,291文のツリーバンクと共にリリースされている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:26:04 GMT)
ProMamba: Prompt-Mamba for polyp segmentation [12.0] 本稿では,最新のVision-Mambaとプロンプト技術を組み合わせた,Prompt-Mambaに基づくセグメンテーションモデルを提案する。
我々は、最初にビジョン・マンバアーキテクチャをポリプセグメンテーションに適用し、最初にポリプセグメンテーションモデルでプロンプト技術を利用する。
本モデルでは,6つのデータセットに対して,従来の最先端手法を平均5%上回るセグメンテーションタスクを効率的に達成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:09:15 GMT)
Compositional Inductive Invariant Based Verification of Neural Network Controlled Systems [11.8] 本稿では,インダクティブ不変法を利用したNNCSの安全性検証手法を提案する。
本稿では、必要な分解述語を自動的に推論することで、与えられた候補の帰納性を自動的に検証できるアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:45:15 GMT)
GTA-HDR: A Large-Scale Synthetic Dataset for HDR Image Reconstruction [11.6] High Dynamic Range(画像とビデオ)は幅広い用途がある。
High Dynamic Range(画像とビデオ)は幅広い用途がある。
低ダイナミックレンジ(Low Dynamic Range, LDR)から視覚的に正確なHDR画像を再構成する難しい作業は、視覚研究コミュニティで注目を集めている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:24:42 GMT)
On the Computational Complexity of Stackelberg Planning and Meta-Operator Verification: Technical Report [11.5] Stackelberg Planingは、最近導入されたシングルターン2プレイヤー対逆計画モデルである。
本稿では,Stackelberg計画における最初の理論的複雑性解析を行う。
しかし、計画期間の制限の下では、Stackelberg計画は複雑性階層のレベルを高くし、古典的な計画へのコンパイルが最悪のケースで指数的な計画長の増加をもたらすことを示唆している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:06:33 GMT)
SeFFeC: Semantic Facial Feature Control for Fine-grained Face Editing [11.3] 本手法は,人間の理解し難い顔の特徴を操作できる。
顔のランドマークを使用することで、顔の特徴を正確に測定することができる。
SeFFeCは、顔の特徴の正確な値を決定論的に制御する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:34:16 GMT)
Hawk: Accurate and Fast Privacy-Preserving Machine Learning Using Secure Lookup Table Computation [11.3] 直接的なデータ共有のない複数のエンティティからのデータに対する機械学習モデルのトレーニングは、ビジネス、法的、倫理的制約によって妨げられるようなアプリケーションをアンロックすることができる。
我々はロジスティック回帰モデルとニューラルネットワークモデルのための新しいプライバシ保護機械学習プロトコルの設計と実装を行う。
評価の結果,ロジスティック回帰プロトコルは最大9倍高速であり,ニューラルネットワークトレーニングはSecureMLの最大688倍高速であることがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:51:12 GMT)
The Solution for the CVPR 2023 1st foundation model challenge-Track2 [11.1] 簡単な戦略により,歩行者検索と車両検索の2つのサブタスクに分割する。
歩行者検索タスクでは、IRRAをベースモデルとし、属性ラベルによる知識のマイニングのために属性分類を特に設計する。
最終B板試験では70.9点, 最終B板試験では1位であった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:40:52 GMT)
Compressed Federated Reinforcement Learning with a Generative Model [11.1] 強化学習は近年、前例のない人気を得たが、それでもサンプルの非効率さに悩まされている。
この課題に対処するため、フェデレーション強化学習(FedRL)が出現し、エージェントは局所的な推定を集約することで単一のポリシーを協調的に学習する。
通信効率のよいFedRL手法であるCompFedRLを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:36:47 GMT)
VMRNN: Integrating Vision Mamba and LSTM for Efficient and Accurate Spatiotemporal Forecasting [11.1] 時間的予測のためのRNNを持つVTやCNNは、時間的・空間的ダイナミクスを予測するのに相容れない結果をもたらす。
最近のMambaベースのアーキテクチャは、非常に長いシーケンスモデリング能力に熱中している。
本稿では,ビジョンマンバブロックの強度をLSTMと統合した再帰ユニットであるVMRNNセルを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:56:34 GMT)
DORE: A Dataset For Portuguese Definition Generation [11.0] 定義モデリング(英: Definition modelling、DM)とは、特定の単語の辞書定義を自動的に生成するタスクである。
DMは、教師付き自然言語生成問題であると考えられている。
DMデータセットは、英語や他の高ソース言語向けにリリースされた。
ポルトガル語のDMデータセットは提供されていない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:07:10 GMT)
Prioritized League Reinforcement Learning for Large-Scale Heterogeneous Multiagent Systems [11.0] 本稿では,大規模な異種協調問題に対処する優先的不均一リーグ強化学習(PHLRL)手法を提案する。
We use Unreal Engine to design a Large-scale Multiagent Operation (LSMO)。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:21:50 GMT)
REFeREE: A REference-FREE Model-Based Metric for Text Simplification [10.9] REFeREEは3段階のカリキュラムを備えたモデルベースのメトリックである。
実験の結果,REFeREEは,既存の基準基準指標よりも総合評価の精度が高く,特定の評価の予測において競合的かつ一貫した性能に到達し,推論時に参照の単純化を必要としないことがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:21:51 GMT)
DANCER: Entity Description Augmented Named Entity Corrector for Automatic Speech Recognition [10.8] 本稿では、自動音声認識(E2E ASR)における音声の混同を軽減するために、CorrEctoR(dubed DANCER)について述べる。
DANCERは、名前付きエンティティのAISHELL-1に対して、文字誤り率(CER)の約7%の削減により、強いベースラインである音声編集距離ベースNECモデル(PED-NEC)より優れている。
DANCERは、名前付きエンティティを含むHomophoneでテストすると、名前付きエンティティに対してPED-NECよりもCERが46%減少する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:27:32 GMT)
EgoLifter: Open-world 3D Segmentation for Egocentric Perception [10.7] EgoLifterは、エゴセントリックなセンサーから撮影したシーンを自動的に分割して、個々の3Dオブジェクトの完全な分解を行うシステムである。
このシステムはエゴセントリックなデータに特化して設計されており、シーンには自然(非走査)の動きから数百の物体が写っている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:48:27 GMT)
LocalTweets to LocalHealth: A Mental Health Surveillance Framework Based on Twitter Data [10.7] 我々は、メンタルヘルス(MH)の結果に焦点をあてて、公衆衛生を調査するための新しい枠組みを提案する。
地域ごとのつぶやきと、CDC(Center for Disease Control)が報告したMH結果とを合わせることで、ベンチマークデータセットであるLocalTweetsを作成します。
そこで我々は、LocalTweetsに基づくMH結果を予測するための効率的で効果的なLocalHealth法を開発した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:59:14 GMT)
Scalable and Precise Application-Centered Call Graph Construction for Python [10.5] PyCGはPythonプログラムのコールグラフを構築するための最先端のアプローチである。
本稿では,Python プログラム用のアプリケーション中心のコールグラフを構築するためのスケーラブルで正確なアプローチを提案し,プロトタイプツール JARVIS として実装する。
1つの関数を入力として、JARVISは、フローセンシティブなプロセス内分析とプロセス間解析を行う、オンザフライのコールグラフを生成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:50:00 GMT)
Spatiotemporal Besov Priors for Bayesian Inverse Problems [10.5] データサイエンスにおける多くの逆問題には、コンピュータ化された時間依存オブジェクトの列に由来する解を必要とする。
ランダムな係数を持つウェーブレット展開によって定義されるBesmoothsov Process (BP) がより適切な解として登場した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:29:35 GMT)
ChIRAAG: ChatGPT Informed Rapid and Automated Assertion Generation [10.5] ChIRAAGはOpenAI GPT4をベースとして、自然言語仕様からSVAアサーションを生成する。
ChIRAAGは、設計仕様を標準化されたフォーマットに体系的に分解する。
LLM生成したアサーションを検証・検証するためのテストベンチを開発した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:20:02 GMT)
Variational Graph Auto-Encoder Based Inductive Learning Method for Semi-Supervised Classification [10.5] 帰納的グラフ表現学習のための自己ラベル拡張VGAEモデルを提案する。
学習にラベル情報を活用するため,本モデルではノードラベルをワンホット符号化入力とし,モデルトレーニングにおいてラベル再構成を行う。
提案したモデルアーカイブは、セミ教師付き学習環境下でのノード分類において、特に優越する結果を約束する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:59:37 GMT)
A Novel Approach to Industrial Defect Generation through Blended Latent Diffusion Model with Online Adaptation [10.4] 本稿では,欠陥サンプルを増大させ,工業的異常検出(AD)性能を向上させる新しいアルゴリズムを提案する。
具体的には、広く知られているMVTec ADデータセットに基づいて、提案手法は、ADの最先端(SOTA)パフォーマンスを、ADメトリクスAP、IAP、IAP90に対してそれぞれ1.5%、1.9%、および3.1%向上させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:15:53 GMT)
Recommendation of data-free class-incremental learning algorithms by simulating future data [10.3] クラスインクリメンタルな学習は、クラスのバッチで構成されるシーケンシャルなデータストリームを扱う。
本稿では,将来的なデータストリームをシミュレートするアルゴリズムレコメンデーション手法を提案する。
シミュレーションストリーム上の最近のアルゴリズムを評価し,ユーザ定義のインクリメンタルな設定において,最高のパフォーマンスを示すアルゴリズムを推奨する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:26:39 GMT)
Ensemble learning for Physics Informed Neural Networks: a Gradient Boosting approach [10.3] 段階的強化(GB)と呼ばれる新しい訓練パラダイムを提案する。
与えられたPDEの解を1つのニューラルネットワークで直接学習する代わりに、我々のアルゴリズムは、より優れた結果を得るために、一連のニューラルネットワークを用いています。
この研究は、PINNでアンサンブル学習技術を採用するための扉も開ける。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:36:47 GMT)
Boosting Adversarial Training via Fisher-Rao Norm-based Regularization [10.0] 本稿では,ロバスト性と精度のトレードオフを軽減するため,LOAT(Logit-Oriented Adversarial Training)と呼ばれる新たな正規化フレームワークを提案する。
実験により,提案した正規化戦略により,有意な対向学習アルゴリズムの性能が向上することを示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:22:37 GMT)
ALISA: Accelerating Large Language Model Inference via Sparsity-Aware KV Caching [9.9] 我々は,KVキャッシングによる課題に対処するアルゴリズム-システム共設計ソリューションであるALISAを提案する。
アルゴリズムレベルでは、ALISAはスパースウィンドウ注意(SWA)アルゴリズムを介して新しいトークンを生成する上で最も重要なトークンを優先順位付けする。
システムレベルでは、ALISAは3フェーズのトークンレベルの動的スケジューリングを採用し、キャッシュと再計算の間のトレードオフを最適化する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:46:34 GMT)
A Real-Time Rescheduling Algorithm for Multi-robot Plan Execution [9.8] Switchable-Edge Search (SES) は最適通過順序を見つけるために設計されたA*スタイルのアルゴリズムである。
本研究では,SESの最適性を証明し,シミュレーションによる効率評価を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:10:41 GMT)
Juru: Legal Brazilian Large Language Model from Reputable Sources [9.8] ドメインの特殊化と高品質なデータによる事前訓練という2つの戦略がこの問題に対処するために現れている。
我々のモデルであるJuruは、事前学習データの少ない量でドメイン特殊化の利点を実証する。
本研究は,事前学習データ選択が大規模言語モデルの性能向上に寄与することを示す科学的根拠の増大に寄与する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:54:12 GMT)
Borrowing Treasures from Neighbors: In-Context Learning for Multimodal Learning with Missing Modalities and Data Scarcity [9.8] 本稿では、欠落したモダリティに関する現在の研究を低データ体制に拡張する。
フルモダリティデータと十分なアノテートされたトレーニングサンプルを取得することは、しばしばコストがかかる。
本稿では,この2つの重要な問題に対処するために,検索強化したテキスト内学習を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:38:38 GMT)
An optimal control perspective on diffusion-based generative modeling [9.8] 微分方程式(SDE)に基づく最適制御と生成モデルとの接続を確立する。
特にハミルトン・ヤコビ・ベルマン方程式を導出し、基礎となるSDE限界の対数密度の進化を制御している。
非正規化密度から抽出する新しい拡散法を開発した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:45:01 GMT)
EcoSense: Energy-Efficient Intelligent Sensing for In-Shore Ship Detection through Edge-Cloud Collaboration [9.8] 本稿では,タスクをオブジェクトの局所化ときめ細かい分類に分割する,エッジクラウド協調センシングシステムを提案する。
このフレームワークは、オブジェクトのローカライゼーション、分類、難易度推定のための低消費電力デバイス調整フロントエンドモデルと、微細な分類のためのトランスフォーマーグラフ畳み込みネットワークベースのバックエンドモデルから構成される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:47:20 GMT)
Quantum accelerated cross regression algorithm for multiview feature extraction [9.7] マルチビュー特徴抽出(MvFE)は、機械学習、画像処理、その他の分野に広く応用されている。
この課題に対処するために、MvFEのための量子加速クロスレグレッションアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:21:19 GMT)
Quantum Control Machine: The Limits of Control Flow in Quantum Programming [9.5] 本稿では、量子コンピュータ上で正しく実現可能な制御フローの抽象化特性の完全な評価を行う。
この設計により、開発者は論理ゲートの代わりにプログラムカウンタを使用して量子アルゴリズムの制御フローを正しく表現できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:28:28 GMT)
Bayesian data-driven discovery of partial differential equations with variable coefficients [9.3] 可変係数を用いたPDE探索のための高度なベイズスパース学習アルゴリズムを提案する。
実験では, 雑音環境下でのベースライン法よりも, tBGL-SS法の方がロバストであることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:21:24 GMT)
Quantum Entanglement on Fractal Landscapes [9.3] スケーリング限界におけるフォン・ノイマンエントロピーと絡み合いの輪郭を解析することにより、フラクタル幾何と量子絡み合いの相互作用を探求する。
化学ポテンシャルにおける状態の有限密度を示す隙間のない基底状態に対して、エンタングルメントエントロピーにおける対数偏差の存在を特徴とする超領域法則を明らかにする。
特筆すべきは、この模様は複雑な中国製紙に類似している点である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:22:49 GMT)
A Nonlinear African Vulture Optimization Algorithm Combining Henon Chaotic Mapping Theory and Reverse Learning Competition Strategy [9.3] ヘノンのカオスマッピング理論とエリート集団戦略は、ハゲワシの初期個体数のランダム性と多様性を改善するために提案されている。
逆学習競争戦略は、最適解に対する発見分野の拡大を目的としている。
提案したHWEAVOAは, 収束速度, 最適化能力, 解安定性における比較アルゴリズムよりも優れている全試験関数で第1位である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:42:09 GMT)
Choreographing the Digital Canvas: A Machine Learning Approach to Artistic Performance [9.2] 本稿では,属性記述に基づく芸術演奏のためのデザインツールについて紹介する。
このプラットフォームは、新しい機械学習(ML)モデルとインタラクティブインターフェースを統合して、芸術的な動きを生成、視覚化する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:42:13 GMT)
An Empirical Study of ChatGPT-related projects on GitHub [9.2] ChatGPTはローンチ以来、広く注目を集めている。開発者は世界中の最大のオープンソースプラットフォーム(GitHub)にホストされているソフトウェアプロジェクトを通じて、その強力な機能をさまざまなドメインに適用してきた。
私たちはGitHubプラットフォームからChatGPT関連プロジェクトを収集し、LDAトピックモデルを使用してトピックを特定しました。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:06:54 GMT)
MESIA: Understanding and Leveraging Supplementary Nature of Method-level Comments for Automatic Comment Generation [9.1] コードコメントが提供する補足情報の範囲を評価するため,MESIA(Mean Supplementary Information Amount)という新しい指標を提案する。
MESIA測定値を用いて、一般的なコード圧縮データセットと3種類のニューラルアプローチを用いて、メソッドレベルのコメントを生成する実験を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:44:51 GMT)
FedCau: A Proactive Stop Policy for Communication and Computation Efficient Federated Learning [9.1] 無線機器の無線ネットワーク上でのフェデレーション学習(FL)モデルの効率的な分散訓練について検討する。
総費用がかかると、背景通信トラフィックやトレーニング問題の寸法が増大するにつれて、トレーニング性能が低下することを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:34:14 GMT)
Boosting Few-Shot Learning with Disentangled Self-Supervised Learning and Meta-Learning for Medical Image Classification [9.0] 低データ体制下で訓練されたモデルの性能と一般化能力を改善するための戦略を提案する。
提案手法は、自己教師付き学習環境において学習した特徴をアンタングル化して、下流タスクの表現の堅牢性を向上する事前学習段階から開始する。
次に、メタファインニングのステップを導入し、メタトレーニングとメタテストフェーズの関連クラスを活用するが、レベルは変化する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:36:20 GMT)
PCToolkit: A Unified Plug-and-Play Prompt Compression Toolkit of Large Language Models [8.8] プロンプト圧縮は、重要な情報を保持しながら入力プロンプトを効率的に凝縮する革新的な方法である。
このツールキットは、Large Language Models (LLM) におけるプロンプトを圧縮するための統一的なプラグアンドプレイソリューションである。
PCToolkitはモジュラー設計で、ポータブルでユーザフレンドリーなインターフェースを通じて、新しいデータセットとメトリクスを簡単に統合できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:11:07 GMT)
Rotate to Scan: UNet-like Mamba with Triplet SSM Module for Medical Image Segmentation [8.7] 本稿では,新しいタイプの画像分割ネットワークとしてTriplet Mamba-UNetを提案する。
本モデルでは,従来のVM-UNetと比較してパラメータの3分の1の削減を実現している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:40:18 GMT)
ShapeGrasp: Zero-Shot Task-Oriented Grasping with Large Language Models through Geometric Decomposition [8.7] 不慣れな物体のタスク指向の把握は、動的家庭環境におけるロボットにとって必要なスキルである。
本稿では,対象物体の幾何学的分解を簡単な凸形状に生かしたゼロショットタスク指向の把握手法を提案する。
このアプローチでは、ゼロショットタスク指向の把握を容易にするために、最小限の必須情報(オブジェクト名と意図したタスク)を使用します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:26:53 GMT)
On permutation-invariant neural networks [8.6] Deep SetsやTransformersといったニューラルネットワークアーキテクチャの出現は、セットベースのデータ処理において大きな進歩を見せている。
この総合的な調査は、設定関数を近似するニューラルネットワークに関する様々な問題設定と進行中の研究の概観を提供することを目的としている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:06:01 GMT)
Parameterized Analysis of Bribery in Challenge the Champ Tournaments [8.6] 本研究では,初期チャンプに対する勝利確率を低くするために,選手を賄うことができる環境について検討する。
ゴールは、他の選手を刺してトーナメントに勝った最初のシャンプの確率を最大にすることであり、贈賄の予算を超えないことである。
プレイヤー数によってパラメータ化される場合、問題はNP-hard と W[1]-hard に弱いことが示される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:53:25 GMT)
Multi-Objective Trajectory Planning with Dual-Encoder [8.4] 時空最適軌道計画は、動的タスクにおけるロボットアームの性能向上に不可欠である。
従来の手法は複雑な非線形プログラミング問題を解くことに依存している。
時空最適軌道計画の高速化のための2段階の手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:32:45 GMT)
Image-based Novel Fault Detection with Deep Learning Classifiers using Hierarchical Labels [8.4] 本研究では、ディープニューラルネットワークに基づく故障分類器の未知の故障検出機能について考察する。
本稿では, 故障検出性能の未知化のために, 故障分類に関するラベルをいかに利用することができるかを示す方法論を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:22:29 GMT)
Expectations Versus Reality: Evaluating Intrusion Detection Systems in Practice [8.3] 最高のソリューションはないが、データセット内の攻撃の種類、複雑性、ネットワーク環境など、外部変数に依存している。
ディープニューラルネットワークソリューションは、テストされたデータセットの平均F1スコアが最も高かったが、必ずしも最高のパフォーマンスであるとは限らない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:46:27 GMT)
DISL: Fueling Research with A Large Dataset of Solidity Smart Contracts [8.2] DISLデータセットには、メインネットにデプロイされた514,506ドルのユニークなSolidityファイルのコレクションが含まれている。
現実世界のスマートコントラクトの大規模で多様なデータセットの必要性に対処する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:56:21 GMT)
Cyber-Security Knowledge Graph Generation by Hierarchical Nonnegative Matrix Factorization [8.2] サイバーセキュリティに関する人間の知識の多くは、増え続ける科学論文の中にカプセル化されている。
知識グラフ(KG)は、事実情報を構造化された方法で保存する手段として機能する。
科学文献からKGを構築する際の課題の1つは、構造化されていないテキストからオントロジーを抽出することである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:28:27 GMT)
Imitating Cost-Constrained Behaviors in Reinforcement Learning [8.1] 本稿では, トラジェクティブコスト制約の存在下で, 専門家分布に適合する手法を提案する。
試行錯誤学習手法はコスト制約の少ない動作を模倣することを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:41:54 GMT)
Attention-based Estimation and Prediction of Human Intent to augment Haptic Glove aided Control of Robotic Hand [8.1] 手紙は、特定の関心の対象を手動で操作するロボットハンドのハプティックグローブに基づく制御に焦点を当てている。
HGとRHの高次元運動信号は、固有変数を持つため、HGからRHへの運動信号の直接マッピングの確立が困難となる。
ロボットハンドで保持されている物体の目的のポーズに関連して,人間の制御器から取得した動作信号を定量化するための推定機構を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:52:36 GMT)
The Effects of Short Video-Sharing Services on Video Copy Detection [7.9] 10秒から30秒間のビデオを投稿できる短いビデオ共有サービスが近年注目を集めている。
本稿では,短いビデオ共有サービスがビデオコピー検出に与える影響について検討する。
我々の新しいデータセットは、公開されているデータセットから自動的に構築され、参照ビデオと固定された短時間のクエリビデオを持つ。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:47:17 GMT)
Test-time Adaptation Meets Image Enhancement: Improving Accuracy via Uncertainty-aware Logit Switching [7.8] テスト時間適応(TTA)は実用性からよく研究されている。
入力画像をTTA手法に組み込むことにより,予測の不確実性を低減できる。
TECA(Test-time Enhancer and Adaptation)は,予測の不確かさを低減し,TTA法の精度を向上させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:40:03 GMT)
Identification and multiply robust estimation in causal mediation analysis across principal strata [7.8] 治療後イベントの存在下での因果仲裁の評価について検討する。
我々は研究全体の自然媒介効果を同定する。
各メディエーション推定値に対する効率的な影響関数を導出する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:18:24 GMT)
Characterizing Dependency Update Practice of NPM, PyPI and Cargo Packages [7.7] 依存関係を最新に保つことで、時代遅れで脆弱な依存関係によるソフトウェアサプライチェーンの攻撃が防止される。
本稿では,依存関係の更新度と脆弱性のある依存関係の更新度を測定するための2つの更新指標を提案する。
我々は,2.9Mパッケージ,66.8Mパッケージバージョン,26.8Mユニークなパッケージ依存性関係を用いた大規模更新メトリクスの実証的研究を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:01:53 GMT)
Enhanced Short Text Modeling: Leveraging Large Language Models for Topic Refinement [7.6] トピックリファインメント(Topic Refinement)と呼ばれる新しいアプローチを導入する。
このアプローチは、トピックの初期のモデリングに直接関係せず、採掘後にトピックを改善することに重点を置いています。
素早いエンジニアリングを駆使して、所与のトピック内での話題外単語を排除し、文脈的に関係のある単語だけが、よりセマンティックに適合した単語で保存または置換されることを保証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:50:34 GMT)
Masked Multi-Domain Network: Multi-Type and Multi-Scenario Conversion Rate Prediction with a Single Model [7.6] 現実世界の広告システムでは、変換は性質の異なるタイプを持ち、異なる表示シナリオで広告を表示することができる。
これにより、マルチタイプおよびマルチシナリオCVR予測問題が発生する。
この問題を解決するために,Masked Multi-domain Network (MMN)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:42:23 GMT)
The Impact of Syntactic and Semantic Proximity on Machine Translation with Back-Translation [7.6] 人工言語を用いて実験を行い、言語の性質が効果的な学習方法としてバック翻訳するかどうかを判断する。
一般的な信念とは対照的に, (i) パラレルな単語頻度分布, (ii) 部分的に共有された語彙, (iii) 言語間の類似した構文構造は, バック翻訳の成功を説明するには不十分である。
言語間で平行なリッチなセマンティック依存関係は、バックトランスレーションに基づく教師なし手法の成功の根底にあると推測する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:38:14 GMT)
Analyzing the Quality Attributes of AI Vision Models in Open Repositories Under Adversarial Attacks [7.5] 敵対的攻撃は、AIモデルの堅牢性と説明可能性に対する潜在的な脅威である。
XAIは、入力を近似したアルゴリズムをポストホック出力に適用し、貢献する特徴を識別する。
本稿では,下流評価タスクのための統合プロセスを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:52:06 GMT)
D-PAD: Deep-Shallow Multi-Frequency Patterns Disentangling for Time Series Forecasting [7.4] 時系列予測のためのディープシャロー多周波パターンであるD-PADを提案する。
D-PADは最先端のパフォーマンスを達成し、それぞれMSEとMAEで平均9.48%と7.15%で最高のベースラインを上回っている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:52:36 GMT)
"You are an expert annotator": Automatic Best-Worst-Scaling Annotations for Emotion Intensity Modeling [7.4] 感情の強さの予測を自動化し、直接評価尺度の予測、ペアワイズ比較、ベストワーストスケーリングを比較します。
これらのデータに基づいて微調整されたトランスフォーマー回帰器は、オリジナルの手動アノテーションでトレーニングされたモデルとほぼ同等に動作する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:45:22 GMT)
Mining Architectural Information: A Systematic Mapping Study [7.4] 建築情報マイニングに関する文献がどのような文献で利用できるかは明らかになっていない。
建築情報のマイニングに関する文献を特定し,分析し,合成することを目的としている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:31:33 GMT)
ChatGPT Rates Natural Language Explanation Quality Like Humans: But on Which Scales? [7.3] 本研究では,ChatGPTと人的評価のアライメントについて,複数の尺度で検討する。
3つのNLEデータセットから300のデータインスタンスをサンプリングし、900人のアノテーションを収集します。
以上の結果から,ChatGPTはより粗いスケールで人間とよく一致していることがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:07:08 GMT)
Staircase Localization for Autonomous Exploration in Urban Environments [7.3] 都市環境を自律的に探索するロボットのための階段位置決め手法を提案する。
提案手法では, 階段検出, 線路セグメント検出, 階段位置決めモジュールの3つのモジュールからなるカスケードパイプラインの方式でモジュール設計を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:28:49 GMT)
Enhancing Legal Document Retrieval: A Multi-Phase Approach with Large Language Models [7.3] 本研究は,検索システムの最終段階として,プロンプトの可能性を最大化することに焦点を当てる。
COLIEE 2023データセットの実験では、LLMのプロンプト技術を検索システムに組み込むことで、検索精度が大幅に向上することが示された。
しかし、誤り解析は、まだ解決が必要な検索システムにおいて、いくつかの既存の問題を明らかにしている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:25:53 GMT)
Scenario-Based Curriculum Generation for Multi-Agent Autonomous Driving [7.3] 我々は,マルチエージェント交通シナリオフレームワークであるMATS-Gymを導入し,高忠実度運転シミュレータであるCARLAのエージェントを訓練する。
本稿では,交通シナリオ記述への既存のアプローチを1つのトレーニングフレームワークに統合し,教師なし環境設計の技術と一体化して適応型オートクラキュラの自動生成を実現する方法について述べる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:42:04 GMT)
Masked Autoencoders are PDE Learners [7.1] 我々は偏微分方程式(PDE)に対するマスク付き事前学習に適応する
仮面事前学習は、未知の方程式上のニューラルソルバの係数回帰とタイムステッピング性能を向上させることができる。
マスク付きプレトレーニングは、大規模でラベルなし、異質なデータセットにまたがる統一的な方法として現れることを願っている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:17:01 GMT)
Counterfactual Fairness through Transforming Data Orthogonal to Bias [7.1] 本稿では,データ前処理アルゴリズムであるOrthogonal to Bias(OB)を導入し,連続性のある変数群の影響を除去する。
OBはモデルに依存しず、幅広い機械学習モデルやタスクに対応している。
提案手法は,精度を損なうことなく,より公平な結果を実現する能力を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:40:08 GMT)
A randomized algorithm for nonconvex minimization with inexact evaluations and complexity guarantees [7.1] 勾配 Hessian に不連続な滑らかな非オラクル関数の最小化を考える。
提案手法の新たな特徴は, 負曲率の近似方向が選択された場合, 感覚緩和を等勾配で負となるように選択することである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:39:30 GMT)
FedCSD: A Federated Learning Based Approach for Code-Smell Detection [7.0] 本稿では,MLモデルの協調学習を可能にするフェデレートラーニングコードスメル検出手法を提案する。
3つの実験では、異なるコードの臭いのシナリオを検出し、調査することを目的とした、手動で検証された3つのデータセットを活用している。
98.34%の精度は、100回のトレーニングラウンドで10社でトレーニングされたグローバルモデルによって達成された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:07:30 GMT)
Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation [6.9] 工業生産における異常検出のためのクリーンなデータ取得の課題に対して,テキスト誘導型変分画像生成手法を提案する。
本手法では,対象対象物に関するテキスト情報を用いて,入力画像に類似した非欠陥データ画像を生成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:42:21 GMT)
Paths to Equilibrium in Normal-Form Games [6.8] マルチエージェント強化学習(MARL)では、エージェントは時間をかけて繰り返し対話し、新たなデータが到着するにつれて戦略を再検討する。
本稿では,強化学習における政策更新に触発された一対の制約を満たす戦略の列について検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:58:39 GMT)
GPFL: A Gradient Projection-Based Client Selection Framework for Efficient Federated Learning [6.7] フェデレートラーニングクライアントの選択は、参加者のクライアントを決定するために重要です。
本稿では,局所的およびグローバルな降下方向を比較することで,クライアントの値を測定するGPFLを提案する。
GPFLは、フェデレート学習における事前選択とパラメータ再利用により、より短い計算時間を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:14:43 GMT)
Fake or JPEG? Revealing Common Biases in Generated Image Detection Datasets [6.6] AI生成画像検出のための多くのデータセットには、JPEG圧縮と画像サイズに関するバイアスが含まれている。
我々は、検出器が本当にこれらの望ましくない要因から学習できることを実証した。
これにより、ResNet50とSwin-T検出器のクロスジェネレータ性能が11%以上向上する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:39:00 GMT)
Towards Explaining Hypercomplex Neural Networks [6.5] ハイパーコンプレックスニューラルネットワークは、ディープラーニングコミュニティへの関心が高まっている。
本稿では,本質的に解釈可能なPHNNと4元ネットワークを提案する。
我々は、このユニークなニューラルネットワークのブランチがどのように機能するかを洞察する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:58:07 GMT)
Noise2Noise Denoising of CRISM Hyperspectral Data [6.5] ノイズ2ノイズ4Mars (N2N4M) はCRISM画像からノイズを取り除くために導入された。
我々のモデルは自己教師型であり、ゼロノイズ対象データを必要としない。
これにより、提案された着陸地点を含む火星表面における重要な場所の詳細な分析が可能になる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:49:22 GMT)
Low-Latency Neural Stereo Streaming [6.5] 低レイテンシ・ニューラル for Stereo Video Streaming (LLSS) は低遅延ステレオビデオストリーミング用に設計された新しいステレオビデオ符号化法である。
LLSSは、左と右のビューを並列に処理し、レイテンシを最小化します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:11:51 GMT)
Sparse Logistic Regression with High-order Features for Automatic Grammar Rule Extraction from Treebanks [6.4] 本研究では,木バンクから重要な粒度の文法パターンを抽出し,探索する手法を提案する。
我々は,異なる言語にまたがる記述や規則を抽出し,合意と語順の2つの言語現象について考察する。
我々の手法は、スペイン語、フランス語、ウーロフにおける有名な文法規則とあまり知られていない重要な文法規則の両方を捉えている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:39:53 GMT)
Pseudo-MRI-Guided PET Image Reconstruction Method Based on a Diffusion Probabilistic Model [6.3] MRI情報を用いて解剖学的にPET再建を行ったところ,PET画像の画質が向上する可能性が示唆された。
本研究では,FDG-PET脳画像からT1強調MRI(deep-MRI)画像を推定するために拡散確率モデル(DPM)を用いた。
次にDPM生成T1w-MRIを用いてPET再建を誘導する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:50:36 GMT)
MUTE-SLAM: Real-Time Neural SLAM with Multiple Tri-Plane Hash Representations [6.3] 本稿では,複数平面のハッシュエンコーディングを用いたリアルタイムニューラルネットワークRGB-D SLAMシステムMUTE-SLAMについて紹介する。
MUTE-SLAMは、カメラの位置を効果的に追跡し、小型および大型の屋内環境のためのスケーラブルなマルチマップ表現を漸進的に構築する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:53:24 GMT)
Discretized Distributed Optimization over Dynamic Digraphs [6.2] 動的有向グラフ上での連続時間分散最適化の離散時間モデルを考える(図)
我々のアルゴリズムは、スイッチングトポロジの下で、一般に接続された動的ネットワーク上で機能する。
提案するフレームワークは,分散分類と学習に適用できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:54:27 GMT)
TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering [6.1] 本稿では,ガウス版とADOP版の両方のアイデアを組み合わせたTRIPS(Trilinear Splatting)を提案する。
評価の結果,TRIPS はレンダリング品質の点で既存の最先端手法を超越していることがわかった。
このパフォーマンスは、複雑な幾何学、広大な風景、自動露光映像など、困難なシナリオにまで拡張されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:30:20 GMT)
Exploiting Semantic Reconstruction to Mitigate Hallucinations in Vision-Language Models [6.0] 視覚言語モデルにおける幻覚は、特に長いキャプションの生成において、その信頼性に重大な課題をもたらす。
本研究では,幻覚の正確な局在化と罰則化による幻覚の発生抑制を目的とした,新しい教師なし学習フレームワークであるESREALを紹介する。
LLaVA, InstructBLIP, mPLUG-Owl2の幻覚を32.81%, 27.08%, 7.46%減少させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:14:25 GMT)
Fast Point Cloud to Mesh Reconstruction for Deformable Object Tracking [6.0] 本研究では,その非変形状態における物体のメッシュであるテンプレートメッシュと,同一物体の変形点雲を入力とする手法を開発する。
トレーニングしたモデルでは,3000頂点のテンプレートメッシュと5,000点の変形点雲を用いて,58Hzの速度でメッシュ再構成と追跡を行うことができる。
ダウンストリームアプリケーションの例は、操作されたオブジェクトの状態からオンラインフィードバックを必要とするロボットハンドの制御アルゴリズムである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:42:34 GMT)
Data-driven Energy Consumption Modelling for Electric Micromobility using an Open Dataset [6.0] 本稿では,E-ScootersとE-Bikesに関連するエネルギーモデリング研究のためのオープンデータセットを提案する。
本稿では,一組の機械学習アルゴリズムを用いて,データセットに基づくエネルギー消費モデリングの包括的解析を行う。
本研究は,データ駆動モデルに対して,エネルギー消費量を推定する数学的モデルと比較して,顕著な優位性を示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:08:05 GMT)
The Unreasonable Ineffectiveness of the Deeper Layers [6.0] 本研究では,オープンウェイトプレトレーニング LLM の一般家庭を対象とした簡易な階層分割戦略について検討する。
レイヤーの大部分が取り除かれるまで、パフォーマンスの最小限の劣化が見られます。
科学的見地からすると、これらのLCMの堅牢性からレイヤの削除は、現在の事前学習手法がネットワークの深い層におけるパラメータを適切に活用していない、あるいは浅い層が知識を保存する上で重要な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:20:04 GMT)
Riemannian Laplace Approximation with the Fisher Metric [6.0] ラプラスの手法は、目標密度とガウス分布をそのモードで近似する。
複雑なターゲットと有限データ後部では、しばしば近似が粗すぎる。
我々は、無限データの範囲内で正確である2つの代替変種を開発する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:05:11 GMT)
Visual Hallucination: Definition, Quantification, and Prescriptive Remediations [6.0] 幻覚はおそらくAIの進歩に最も重大な障害をもたらす。
画像キャプションと視覚質問応答 (VQA) の2つの課題に基づく幻覚のきめ細かいプロファイリングを提供する。
本研究では,8つの課題のキャプションとVQAを用いて生成した2,000のサンプルと,その言説に対する人間のアノテーションからなるデータセットをキュレートする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:28:42 GMT)
Oh! We Freeze: Improving Quantized Knowledge Distillation via Signal Propagation Analysis for Large Language Models [5.7] 大規模言語モデル(LLM)や拡散モデルといった大きな生成モデルは、それぞれNLPとコンピュータビジョンの分野に革命をもたらした。
しかし、その遅い推論、高い計算とメモリ要求により、エッジデバイスへのデプロイが困難になる。
本研究では, 知識蒸留(KD-QAT)を用いた軽量量子化対応微調整技術を提案し, 4ビット量化LDMの性能向上を図る。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:51:44 GMT)
Implicit Discriminative Knowledge Learning for Visible-Infrared Person Re-Identification [5.6] Visible-Infrared Person Re-identification (VI-ReID) は、横断歩行者検索の課題である。
既存の研究は主に、異なるモダリティのイメージを統一された空間に埋め込み、モダリティの共有された特徴をマイニングすることに焦点を当てている。
本稿では,モダリティ特定に含まれる暗黙的識別情報を発見・活用するために,新たなIDKLネットワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:21:52 GMT)
Transport meets Variational Inference: Controlled Monte Carlo Diffusions [5.6] 本稿では,経路空間上の発散に着目したサンプリングおよび生成モデリングのための原理的かつ体系的な枠組みを提案する。
ベイズ計算のためのemphControlled Monte Carlo Diffusion sampler (CMCD)を開発した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:48:49 GMT)
Identification of Craving Maps among Marijuana Users via the Analysis of Functional Brain Networks with High-Order Attention Graph Neural Networks [5.5] マリファナの過剰摂取は、かなりの心理的および社会的結果をもたらす可能性がある。
本稿では,マリファナ中毒の分類のための高次グラフ注意ニューラルネットワーク(HOGANN)を提案する。
我々のモデルは2つの異なるデータコホートにまたがって検証され、ベンチマークアルゴリズムよりもかなり高い分類精度が得られる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:58:01 GMT)
Quantum-Enhanced Simulation-Based Optimization for Newsvendor Problems [5.5] 古典モンテカルロシミュレーションと比較して量子振幅推定(QAE)の高効率性を利用する。
本研究では,シミュレーションに基づく最適化に量子エンハンスアルゴリズムを用い,NP-hardとして知られる古典ニュース問題の変種を解く。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:14:50 GMT)
Enriching Word Usage Graphs with Cluster Definitions [5.3] 本稿では,複数の言語に対する既存のWUGを,意味定義として機能するクラスタラベルに富んだ単語使用グラフ(WUG)のデータセットを提案する。
それらは、微調整エンコーダ-デコーダ言語モデルによってスクラッチから生成される。
人体評価の結果、これらの定義はWordNetから選択した定義よりもWUGの既存のクラスタとよく一致していることがわかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:22:05 GMT)
Sen2Fire: A Challenging Benchmark Dataset for Wildfire Detection using Sentinel Data [5.3] このデータセットは、Sentinel-2マルチスペクトルデータとSentinel-5Pエアロゾル製品から収集される。
各パッチのサイズは512$times$512で、13のバンドがある。
その結果、山火事検出に全バンドを使用するのに対し、特定のバンドの組み合わせを選択すると、優れた性能が得られることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:16:04 GMT)
QuakeSet: A Dataset and Low-Resource Models to Monitor Earthquakes through Sentinel-1 [5.3] 本稿では,Sentinel-1から得られた画像からなる新しいデータセットを提案する。
地震解析におけるMLモデルの有効性を評価するために,従来の機械学習モデルとディープラーニングモデルをベースラインとして提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:45:29 GMT)
GPTs and Language Barrier: A Cross-Lingual Legal QA Examination [5.3] 我々は,COLIEE Task 4データセットを用いた言語間法的質問応答システム(QA)における生成事前学習トランスフォーマー(GPT)の適用について検討する。
COLIEEタスク4において、文脈として機能する声明と関連する法的記事のセットが与えられた場合、その声明が法的に有効であるかどうかを決定することが目的である。
英語と日本語のプロンプトとデータの4つの組み合わせをベンチマークすることにより、多言語法的QAシナリオにおけるGPTのパフォーマンスに関する貴重な洞察を提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:47:32 GMT)
Extracting Biomedical Entities from Noisy Audio Transcripts [5.2] 本稿では,バイオメディカル領域におけるASR-NLPギャップを埋めるための新しいデータセットであるBioASR-NERを紹介する。
ゼロショット法と少数ショット法の両方について検討し, GPT4を用いた書き起こしクリーン化手法を提案する。
本研究は、さらに誤り解析、転写ソフトウェアにおけるエラーの種類、GPT4による修正、そしてGPT4が直面する課題について考察する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:58:52 GMT)
SGS-SLAM: Semantic Gaussian Splatting For Neural Dense SLAM [5.1] SGS-SLAMはSplattingに基づく最初の意味的視覚的SLAMシステムである。
外観幾何学とマルチチャネル最適化による意味的特徴は、ニューラル暗黙のSLAMシステムの過度な制限に対処する。
カメラポーズ推定、マップ再構成、正確なセマンティックセグメンテーション、およびオブジェクトレベルの幾何精度において最先端のパフォーマンスを提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:35:03 GMT)
Empowering Data Mesh with Federated Learning [5.1] 新しいパラダイムであるData Meshは、中央チームから各データドメインにデータオーナシップを分散することで、ドメインを第一級の関心事として扱う。
Paypal、Netflix、Zalandoといった数十万ドルの企業はすでに、この新しいアーキテクチャに基づいてデータ分析パイプラインを変革している。
我々はフェデレートラーニングをData Meshに組み込む先駆的なアプローチを導入します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:10:15 GMT)
Disentangling the Spectral Properties of the Hodge Laplacian: Not All Small Eigenvalues Are Equal [5.1] ホッジ・ラプラシアン (Hodge Laplacian) は、simplicial や cellular complex のような高階グラフモデルに対する通常のラプラシアンの一般化として注目されるようになった。
永続固有ベクトル類似性の概念を導入し、個々の調和、カール、勾配固有ベクトル/値を追跡する方法を提案する。
我々はまた、新しい形式のホッジスペクトルクラスタリングを導入し、エッジと高次の単純化を分類するために、私たちの洞察を利用する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:15:40 GMT)
Predicting Perceived Gloss: Do Weak Labels Suffice? [5.0] 我々は、人間のアノテーションのより小さなセットが、自動的に派生した「弱ラベル」で効果的に拡張できることを示します。
我々は、限られた注釈付きデータから人間の光沢知覚を予測するために、3つの代替弱ラベルを評価する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:02:38 GMT)
Equipping Sketch Patches with Context-Aware Positional Encoding for Graphic Sketch Representation [5.0] グラフィックスケッチ表現を学習するための変分描画保護手法を提案する。
スケッチ描画をグラフエッジに注入する代わりに、これらのシーケンシャル情報をグラフノードにのみ埋め込む。
実験結果から,本手法はスケッチのヒーリングと制御可能なスケッチ合成を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:26:12 GMT)
A Gaze-grounded Visual Question Answering Dataset for Clarifying Ambiguous Japanese Questions [4.8] 本稿では、視線情報を用いて曖昧な質問を明確化するGaze-grounded VQAデータセット(GazeVQA)を提案する。
また,視線目標推定結果を用いてGazeVQAタスクの精度を向上させる手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:49:35 GMT)
Accuracy enhancement method for speech emotion recognition from spectrogram using temporal frequency correlation and positional information learning through knowledge transfer [4.8] 視覚変換器(ViT)を用いた音声感情認識(SER)の精度向上手法を提案する。
時間とともに周波数の相関を解析するために,対数メルスペクトルの垂直分割パッチを用いる。
ViTに適した絶対位置符号化である画像座標符号化も提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:21:36 GMT)
Good, but not always Fair: An Evaluation of Gender Bias for three commercial Machine Translation Systems [4.8] 本稿では、Google Translate、DeepL、Modern MTの3つの商用機械翻訳システムについて綿密に評価する。
3つの言語ペア(英語/スペイン語、英語/イタリア語、英語/フランス語)に対して、このようなシステムの振る舞いを、いくつかのレベルの粒度と、翻訳において自然に生じる様々なジェンダー現象について精査する。
本研究は, オンラインMTツールの現状を把握し, 3つのシステムの性別翻訳における大きな相違点を明らかにし, 全体的な翻訳品質に関わらず, それぞれのシステムが様々なバイアスを呈示することを示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:54:48 GMT)
Topological extension including quantum jump [4.7] トポロジカルな視点からSu-Schrieffer-Heegerモデルの集合損失とゲインについて検討する。
本研究は、量子ジャンプ項の影響を定性的に分析し、量子システムにおけるそれらのユニークな役割を明らかにする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:06:57 GMT)
AniPortrait: Audio-Driven Synthesis of Photorealistic Portrait Animation [4.6] 本稿では,オーディオによる高品質なアニメーションを生成するためのフレームワークであるAniPortraitと,参照ポートレート画像を提案する。
実験により,AniPortraitの顔の自然性,ポーズの多様性,視覚的品質の面での優位性が示された。
本手法は,顔の動きの編集や顔の再現といった領域に効果的に適用可能な,柔軟性や制御性の観点からも有意な可能性を秘めている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:35:02 GMT)
ChatGPT Role-play Dataset: Analysis of User Motives and Model Naturalness [4.6] 本研究は,ChatGPTの会話における動作を,通常とロールプレイの両方で分析することにより,異なる環境での会話においてどのように振る舞うかを検討する。
本研究は,ChatGPTと対話する際のユーザのモチベーションの多様性を強調し,人間とAIの自然な会話の微妙なダイナミクスだけでなく,人間とAIのコミュニケーションの有効性向上のための新たな手段を提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:01:13 GMT)
Leak and Learn: An Attacker's Cookbook to Train Using Leaked Data from Federated Learning [4.5] フェデレートラーニング(Federated Learning)は、クライアントデータのプライバシを保護するために導入された分散学習パラダイムである。
以前の研究によると、攻撃者はクライアントのアップデートだけを使用してプライベートなトレーニングデータを再構築できる。
我々は、トレーニングレンズによるデータ再構成攻撃を調査し、漏洩したデータを用いてモデルを改善する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:05:24 GMT)
Fully Independent Communication in Multi-Agent Reinforcement Learning [4.5] MARL(Multi-Agent Reinforcement Learning)は、マルチエージェントシステム分野における幅広い研究領域である。
パラメータを共有しないMARLの独立学習者がいかにコミュニケーションできるかを検討する。
この結果から, 独立エージェントは, 課題にも拘わらず, コミュニケーション戦略を学習できることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:44:45 GMT)
CLASSLA-web: Comparable Web Corpora of South Slavic Languages Enriched with Linguistic and Genre Annotation [4.5] 本稿では,スロベニア人,クロアチア人,ボスニア人,モンテネグロ人,セルビア人,マケドニア人,ブルガリア人のウェブコーパスを比較検討する。
これらのコーパスの収集には、合計で2600万件の文書から13億件のトークンが含まれている。
全てのコーパスは、最先端のCLASSLA-Stanza言語処理パイプラインに言語的に注釈付けされていた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:32:34 GMT)
Are Compressed Language Models Less Subgroup Robust? [4.4] BERT言語モデルのロバスト性に及ぼす18種類の圧縮法の影響について検討する。
最悪のグループパフォーマンスは、モデルサイズだけでなく、使用する圧縮方法にも依存する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:50:37 GMT)
DGoT: Dynamic Graph of Thoughts for Scientific Abstract Generation [4.4] 本稿では,科学論文の要約を生成するための動的思考グラフ(DGoT)を提案する。
抽象生成タスクにおけるコスト効率は,他のマルチラウンドクエリプロンプト手法の43.7%から56.4%に過ぎなかった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:47:23 GMT)
Semi-Supervised Image Captioning Considering Wasserstein Graph Matching [4.4] We propose a novel Semi-Supervised Image Captioning method Using Wasserstein Graph Matching (SSIC-WGM)。
SSIC-WGMは、原画像のシーングラフと生成された文とをそれぞれ構成する。
1) モーダル間の一貫性と 2) モーダル間の一貫性の2つの側面から生成された文を制約する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:47:05 GMT)
Untangling Knots: Leveraging LLM for Error Resolution in Computational Notebooks [4.3] 本稿では,反復型LCMエージェントを用いて,計算ノートブックの誤りを解消するための潜在的解決策を提案する。
本稿では,本手法によって提起された問題について議論し,バグを含む新しい計算ノートブックのデータセットを共有する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:53:17 GMT)
Harmonic Control Lyapunov Barrier Functions for Constrained Optimal Control with Reach-Avoid Specifications [4.2] ハーモニックコントロール リアプノフ障壁関数(ハーモニックCLBF)は、リーチアビド問題のような制限された制御問題を支援する。
結果として、サンプル軌道に基づいて訓練されるのではなく、実験の開始時に開始することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:43:55 GMT)
Hierarchical Light Transformer Ensembles for Multimodal Trajectory Forecasting [4.2] 階層型光変圧器アンサンブル(HLT-Ens)という新しい手法を提案する。
HLT-Ensは、新しい階層的損失関数を用いて、トランスフォーマーアーキテクチャのアンサンブルを効率的に訓練する。
我々は、HLT-Ensが最先端の性能レベルを達成し、軌道予測技術を改善するための有望な道を提供することを示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:05:49 GMT)
Learn from Heterophily: Heterophilous Information-enhanced Graph Neural Network [4.1] 論理的に異なるラベルを持つノードは意味論的意味に基づいて接続される傾向があるが、グラフニューラルネットワーク(GNN)は、しばしば最適以下の性能を示す。
ヘテロフィリーに固有の意味情報をグラフ学習において効果的に活用できることを示す。
ノード分布を利用して異種情報を統合する新しいグラフ構造を構築する革新的な手法であるHiGNNを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:29:42 GMT)
A Unified Kernel for Neural Network Learning [4.1] 本稿では、勾配降下を伴うニューラルネットワークの学習力学を特徴付けるUnified Neural Kernel(UNK)を提案する。
UNK は NNGP と NTK の両方の制限特性を維持し、有限学習ステップで NTK に似た振る舞いを示す。
また、UNKカーネルの均一な厳密性と学習収束性を理論的に特徴づける。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:55:45 GMT)
Optimal Design of Volt/VAR Control Rules of Inverters using Deep Learning [4.0] 電圧を規制するために、IEEE標準1547は各DERにVolt/var制御規則に従って反応電力を注入することを推奨している。
この最適規則設計(ORD)の課題は、Volt/varルールが非線形力学を導入し、安定性と定常電圧プロファイルのトレードオフを生じるため、困難である。
より効率的な解を目指して,我々はORDを深層学習問題として再検討する。
アイデアは、Volt/varのダイナミクスをエミュレートするDNNを設計することだ。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:54:44 GMT)
Can Large Language Models Discern Evidence for Scientific Hypotheses? Case Studies in the Social Sciences [4.0] 強い仮説は、既存の証拠に基づく最良の推理であり、関連する文献の包括的な見解によって知らされる。
毎年発行される科学論文の数が指数関数的に増加すると、ある仮説に関連する証拠の手作業による集約と合成は困難である。
我々は,社会科学における研究のコミュニティ主導のアノテーションを用いた科学的仮説の課題のための新しいデータセットを共有する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:33:45 GMT)
Measuring Entrainment in Spontaneous Code-switched Speech [4.0] 我々は,人間間のコードスイッチによる自発音声における文字と音声のエントレメントのパターンについて検討した。
本研究は,コミュニケーション現象としてのエントレメントの「普遍的」性質に重要な意味を生じさせるものである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:31:34 GMT)
DiVa-360: The Dynamic Visual Dataset for Immersive Neural Fields [3.9] DiVa-360は、リアルタイムの360度ダイナミック・ヴィジュアル・データセットであり、同期された高解像度および長期のマルチビュー・ビデオ・シーケンスを含んでいる。
我々は、Diva-360上で最先端の動的ニューラルネットワーク手法をベンチマークし、既存の手法と長期的ニューラルネットワークキャプチャにおける今後の課題について考察する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:40:47 GMT)
Sketch2Prototype: Rapid Conceptual Design Exploration and Prototyping with Generative AI [3.9] Sketch2Prototypeは、手描きのスケッチを多種多様な2D画像と3Dプロトタイプに変換するAIベースのフレームワークである。
テキストを中間モダリティとして用いることで、多種多様な製造可能な3Dモデルを生成するために、直接スケッチから3Dのベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:12:17 GMT)
The opportunities and risks of large language models in mental health [3.9] メンタルヘルスの国際レートは上昇している。
既存のメンタルヘルスケアのモデルは、需要を満たすために適切に拡大しない、という認識が高まっている。
大規模言語モデル(LLM)の出現は、メンタルヘルスをサポートする新しい大規模ソリューションを作成するという彼らの約束に関して、非常に楽観的になっている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:10:10 GMT)
AI and Generative AI for Research Discovery and Summarization [3.9] AIと生成AIツールが今年中に登場し、仕事の生産性を高め、私たちの生活を改善する素晴らしい機会を生み出した。
これらのツールが大きな影響を与えうる分野の1つは、研究の発見と要約である。
我々は、研究発見と要約のためのAIと生成AIの開発をレビューし、これらのタイプのツールが将来進む可能性が高い方向を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:44:34 GMT)
RuBia: A Russian Language Bias Detection Dataset [3.9] 本稿では,RuBiaと呼ばれるロシア語に特化して設計されたバイアス検出データセットを提案する。
RuBiaデータセットは、性別、国籍、社会経済的地位、多様性の4つの領域に分けられる。
ルビアには、19の国に2000近いユニークな文が散在している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:01:01 GMT)
Exploring LLMs as a Source of Targeted Synthetic Textual Data to Minimize High Confidence Misclassifications [3.8] 本研究では,データ拡張のための大規模言語モデル (LLM) の利用を,分類タスク中に高い信頼度で誤った予測を行うNLPモデルの問題に対する潜在的な解決策として検討する。
緩和のために、人間またはLLMは、高い信頼性の誤分類の自然言語特性を提供し、合成データを生成し、トレーニングセットを拡張するのに使用される。
本研究では,3つの分類課題に対するアプローチを広範囲に評価し,信頼性の高い誤分類の数を減らし,その効果を実証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:49:25 GMT)
A Lightweight and Gradient-Stable Neural Layer [3.8] 世帯重み付けと絶対値活性化に基づく神経層アーキテクチャを提案する。
$d$-neuronsと$d$の出力を持つ完全連結層と比較して、Han層はパラメータの数とそれに対応する計算複雑性を減らす。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:47:13 GMT)
TDIP: Tunable Deep Image Processing, a Real Time Melt Pool Monitoring Solution [3.8] 製造プロセス中のメルトプール(MP)シグネチャには、プロセスのダイナミクスと品質に関する重要な情報が含まれている。
この情報を得るために、高速カメラベースの視覚モジュールのような様々な感覚的アプローチがオンライン製造監視に用いられている。
本稿では,Tunable Deep Image Processing (TDIP) 方式の実装を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:47:24 GMT)
Dynamics of Moral Behavior in Heterogeneous Populations of Learning Agents [3.7] 本研究では、道徳的に異質な集団が社会的ジレンマ環境で相互作用する学習力学について研究する。
我々は、親社会と反社会的エージェント間のいくつかの非自明な相互作用を観察する。
モラルエージェントのある種のクラスは、より協調的な行動に向けて利己的なエージェントを操ることができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:18:33 GMT)
Fully-fused Multi-Layer Perceptrons on Intel Data Center GPUs [3.7] 本稿では,Intel Data Center GPU Max 1550用のMulti-formedLayer Perceptrons(MLP)の実装について述べる。
これにより算術強度が大幅に向上し,特に推論性能が向上することを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:38:39 GMT)
High-Resolution Image Translation Model Based on Grayscale Redefinition [3.7] 本稿では,異なる領域間の画像翻訳のための革新的な手法を提案する。
高解像度画像翻訳タスクでは、グレースケール調整法を用いてピクセルレベルの変換を行う。
他のタスクでは、Pix2PixHDモデルを使い、粗大な生成装置、マルチスケールの判別器、画像翻訳性能を向上させるために損失の改善を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:21:47 GMT)
Towards Multilevel Modelling of Train Passing Events on the Staffordshire Bridge [3.7] 本稿では,スタッフォードシャー橋のモニタリングシステムから,列車通過イベントを総合的に表現する多段階モデルを提案する。
本稿では,2種類の通勤列車について,単純な単位から(各列車通過時の)ひずみエンベロープを表す組み合わせモデルを定式化した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:55:54 GMT)
Detection and Discovery of Misinformation Sources using Attributed Webgraphs [3.7] 本稿では、ラベル付きニュースドメインと、アウトリンクおよびバックリンクドメインへの接続を含む、新しい属性付きWebグラフデータセットを提案する。
本稿では,これらの属性付きWebグラフを用いたニュースサイトの信頼性検出におけるグラフニューラルネットワークの成功例を示す。
また、未知の誤報ニュースソースを発見するための新しいグラフベースのアルゴリズムを導入・評価する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:27:34 GMT)
An Open-source End-to-End Logic Optimization Framework for Large-scale Boolean Network with Reinforcement Learning [3.6] 本稿では,強化学習を伴う大規模ネットワークのためのオープンソースのエンドツーエンド論理最適化フレームワークを提案する。
この枠組みは強化学習における問題解決に有効であることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:25:01 GMT)
Transferring Relative Monocular Depth to Surgical Vision with Temporal Consistency [3.6] 相対的な単分子深度は、1つの画像からシフトとスケールの深さを推定するものであり、活発な研究トピックである。
大規模で多様なメタデータセットに基づいて訓練された最近のディープラーニングモデルは、自然画像の領域で優れたパフォーマンスを提供する。
内視鏡画像に真実の深さを与えるデータセットはほとんど存在せず、そのようなモデルをスクラッチからトレーニングすることは不可能である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:10:13 GMT)
A Survey on 3D Egocentric Human Pose Estimation [3.6] エゴセントリックな人間のポーズ推定は、人間のポーズを推定し、ファースト・パーソン・カメラの観点から身体表現を開発することを目的としている。
近年、XR技術、人間とコンピュータのインタラクション、フィットネストラッキングといった分野に幅広く応用されているため、広く普及している。
エゴセントリックな3次元ポーズ推定に関する提案された解決策に基づく体系的な文献レビューは行われていない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:29:26 GMT)
Two Birds with One Stone: Differential Privacy by Low-power SRAM Memory [3.6] 設計による差分プライバシーを実現するためのハードウェアベースの手法を開発した。
本設計では,メモリに格納されたデータに対して,固有のハードウェアノイズを制御されたLDPノイズに利用することにより,ローカルディファレンシャルプライバシ(LDP)を実現する。
結果は、開発技術は差分プライベートであり、88.58%のシステムパワーを節約し、ソフトウェアベースのDPメカニズムを106回以上高速化する一方で、2.46%のチップオーバーヘッドと7.81%のデータリカバリしか発生しないことを確認した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:14:55 GMT)
TractOracle: towards an anatomically-informed reward function for RL-based tractography [3.5] 強化学習(RL)に基づくトラクトグラフィーは、機械学習や古典的なトラクトグラフィーアルゴリズムと競合する代替手段である。
本稿では,ストリームライン分類に訓練された報酬ネットワークに依存する新たなRLトラクトグラフィーシステムであるTractOracleを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:34:05 GMT)
Improving Opioid Use Disorder Risk Modelling through Behavioral and Genetic Feature Integration [3.5] オピオイドは急性および慢性の痛みに対して効果的な鎮痛薬であるが、中毒のリスクを負い、毎年数百万のオピオイド使用障害(OUD)と数万の早死にを経験する。
我々は,OUDに関連する遺伝的変異をGPSとWi-Fiの時間座標から抽出した行動特徴と組み合わせ,OUDリスクを評価するための実験的設計と計算手法を開発した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:23:52 GMT)
BVR Gym: A Reinforcement Learning Environment for Beyond-Visual-Range Air Combat [3.4] 我々は、航空戦闘戦術の調査を支援するため、強化学習環境を構築します。
長距離ミサイルは、しばしば空中戦闘で使用される最初の兵器である。
この記事では、環境の構成要素といくつかのユースケースについて説明する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:39:21 GMT)
Selective inference using randomized group lasso estimators for general models [3.4] この手法は指数関数的な家族分布の使用、および過分散カウントデータに対する準様モデリングを含む。
ランダム化群正規化最適化問題について検討した。
選択されたモデルにおける回帰パラメータの信頼領域は、ウォルド型領域の形式をとり、境界体積を持つことを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:39:35 GMT)
Shotgun crystal structure prediction using machine-learned formation energies [3.4] 組み立てられた原子の安定あるいは準安定な結晶構造は、原子配置の空間上で定義されたエネルギー表面の大域的または局所的なミニマを見つけることで予測できる。
ここでは,簡単な機械学習ワークフローを用いて,結晶構造予測問題の解決に大きな進歩を遂げた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:50:55 GMT)
Chain of Compression: A Systematic Approach to Combinationally Compress Convolutional Neural Networks [3.3] 畳み込みニューラルネットワーク(CNN)は非常に人気があるが、その計算とメモリの強度は、リソース制約の計算システムに課題をもたらす。
量子化、プルーニング、早期出口、知識蒸留といった多くのアプローチは、ニューラルネットワークの冗長性を減少させる効果を示している。
本稿では、ニューラルネットワークの圧縮にこれらの一般的な手法を適用するために、組み合わせシーケンスで動作する圧縮の連鎖を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:26:00 GMT)
Solution for Emotion Prediction Competition of Workshop on Emotionally and Culturally Intelligent AI [3.3] 感情・文化特化プロンプトを用いた単一マルチモーダルという,シンプルで効果的な手法を提案する。
最終テストでは0.627で1位にランクインした。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:14:18 GMT)
Domain-Specific Evaluation Strategies for AI in Journalism [3.3] ドメイン固有の調整の恩恵を受けることができるAI評価のさまざまな側面について検討する。
そうすることで、ジャーナリズムにおけるAI評価をガイドする潜在的なフレームワークを構築できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:47:25 GMT)
GPT-4's assessment of its performance in a USMLE-based case study [3.2] 本研究は、医療応用におけるGPT-4の評価について検討する。
質問票は,フィードバック(WF)とフィードバック(NF)のない質問(NF)の2つに分類した。
結果は、フィードバックは相対的な信頼に影響を及ぼすが、継続的に増加または減少しないことを示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:12:18 GMT)
Activity-Biometrics: Person Identification from Daily Activities [3.2] ビデオからバイオメトリックな特徴を学ぶことは、衣料品の色や背景といった外観バイアスの複雑さと存在感のために困難である。
ABNetは,生体と非生体の特徴の絡み合いを利用して,日々の行動から効果的な人物識別を行う新しいフレームワークである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:53:00 GMT)
Driving Intelligent IoT Monitoring and Control through Cloud Computing and Machine Learning [3.1] この記事では、クラウドコンピューティングと機械学習によるインテリジェントなiotモニタリングと制御の推進方法について説明する。
また、iotモニタリングと制御技術の開発、iotモニタリングと制御におけるエッジコンピューティングの適用、データ解析と故障検出における機械学習の役割についても紹介する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:59:48 GMT)
JMultiWOZ: A Large-Scale Japanese Multi-Domain Task-Oriented Dialogue Dataset [3.1] JMultiWOZは日本語初の大規模マルチドメインタスク指向対話データセットである。
我々は,最先端手法の対話状態追跡と応答生成能力について検討した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:01:18 GMT)
Regularizing Self-supervised 3D Scene Flows with Surface Awareness and Cyclic Consistency [3.1] 2つの新たな一貫性損失を導入し、クラスタを拡大し、異なるオブジェクトに分散するのを防ぐ。
提案した損失はモデル独立であり、既存のモデルの性能を大幅に向上させるためにプラグアンドプレイ方式で使用できる。
また,4つの標準センサ一様駆動データセット上で,フレームワークの有効性と一般化能力を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:04:11 GMT)
DeepMachining: Online Prediction of Machining Errors of Lathe Machines [3.1] 深層学習に基づくAIシステムDeepMachiningについて述べる。
我々の知る限りでは、この研究は、学習済みの深層学習モデルを用いて、機械の加工誤差を予測する最初の工場実験の1つである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:35:08 GMT)
Particle identification with machine learning from incomplete data in the ALICE experiment [3.0] ALICEは、約100MeV/cから20GeV/cまでの運動量を持つ粒子の複数の検出器を介してPID情報を提供する。
私たちのソリューションでは、バイナリ分類器として複数のニューラルネットワーク(NN)を使用します。
本稿では,シミュレーションデータと実実験データ間の知識伝達に必要なML手法であるドメイン適応について論じる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:05:06 GMT)
Makeup Prior Models for 3D Facial Makeup Estimation and Applications [3.0] 既存の3次元顔前モデルを拡張するために,PCAベースとStyleGAN2ベースという2種類の化粧前モデルを導入する。
実験では,計算コストを数桁削減し,最大180倍の高速化を実現した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:51:53 GMT)
Learning Traffic Signal Control via Genetic Programming [3.0] 複雑な交差点における信号制御の新しい学習手法を提案する。
本手法では,各信号位相に対する位相緊急の概念を設計する。
緊急関数は、現在の道路条件に基づいて特定位相の位相緊急を算出することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:22:08 GMT)
Investigating Feature and Model Importance in Android Malware Detection: An Implemented Survey and Experimental Comparison of ML-Based Methods [2.9] 静的解析だけで抽出した特徴を用いて高い検出精度が得られることを示す。
ランダムフォレストは一般的に最も効果的なモデルであり、より複雑なディープラーニングアプローチよりも優れている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:29:16 GMT)
Fermihedral: On the Optimal Compilation for Fermion-to-Qubit Encoding [2.8] 本稿では、最適なFermion-to-qubitエンコーディングの発見に焦点を当てたコンパイラフレームワークであるFermihedralを紹介する。
Fermihedralは、Fermion-to-qubitエンコーディングの複雑な制約と目的をブール満足度問題に再定義する。
多様なフェルミオニオン系における評価はフェルミヘドラルの優越性を強調し、実装コスト、ゲート数、回路深さの大幅な削減を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:27:42 GMT)
Evaluating the Efficacy of Prompt-Engineered Large Multimodal Models Versus Fine-Tuned Vision Transformers in Image-Based Security Applications [2.8] 本稿では,重要なセキュリティ問題に対処するために,Gemini-pro LMMと微調整型視覚変換器(ViT)モデルの有効性について検討する。
画像中の小さな正方形、潜在的なバックドアの表示、視覚的表現によるマルウェア分類の非視覚的に明らかなタスクなど、視覚的に明らかな単純なトリガーを検出する2つのタスクに焦点をあてる。
Gemini-proは細調整されたViTモデルと比較して精度と信頼性が低い。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:20:49 GMT)
NEQRX: Efficient Quantum Image Encryption with Reduced Circuit Complexity [2.8] 一般化アフィン変換とロジスティックマップを組み合わせた量子画像暗号化アルゴリズムの効率的な実装手法を提案する。
セキュリティと効率を保ちながら、コストの50%の大幅な削減を実現しています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:41:06 GMT)
UADA3D: Unsupervised Adversarial Domain Adaptation for 3D Object Detection with Sparse LiDAR and Large Domain Gaps [2.8] 3次元物体検出(UADA3D)のための教師なし反転領域適応法について紹介する。
様々な適応シナリオにおいて有効性を示し、自動運転車と移動ロボットの両方の領域で顕著に改善されていることを示す。
私たちのコードはオープンソースで、まもなく利用可能になります。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:08:14 GMT)
Naive Bayes-based Context Extension for Large Language Models [2.7] Naive Bayes-based Context Extension (NBCE) と呼ばれる新しいフレームワークを導入する。
NBCEは、既存のLarge Language Models (LLMs) がインコンテキストラーニング (ICL) を実行可能にする。
NBCEは、特に実演例の数が増えるにつれて、性能を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:59:45 GMT)
Quantum magnetometry using discrete-time quantum walk [2.7] 離散時間量子ウォーク(DTQW)を用いた量子磁気学の手法を提案する。
1次元格子上にDTQWを実装するスピンハーフ粒子の力学は磁場の影響を受ける。
位置とスピン測定を用いて磁場の強度を推定できることが判明した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:39:32 GMT)
Snail: Secure Single Iteration Localization [2.7] ローカライゼーション(Localization)とは、画像と環境マップからカメラの位置と向きを決定するコンピュータビジョンタスクである。
本稿では,2つのローカライゼーション手法,ガーブロード回路に適したローカライゼーションのベースラインデータ公開適応と,新しいシングルイテレーションローカライゼーションを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:09:58 GMT)
Understanding Energy Level Structure Using Quantum Rubik's Cube [2.7] この研究は、量子ルービックキューブ行列とベナルカザール・ベルネヴィグ・ヒューズモデルを組み合わせたものである。
量子ルービックキューブ行列の操作をより明確にするために、ジョゼフス環を用いてルービックキューブ拡大の位相グラフを描く。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:13:45 GMT)
An Implicit GNN Solver for Poisson-like problems [2.7] $Psi$-GNNは、境界条件の混合でユビキタスなPoisson PDE問題を解決するための新しいグラフニューラルネットワーク(GNN)アプローチである。
Implicit Layer Theoryを活用することで、$Psi$-GNNは"無限の"ディープネットワークをモデル化する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:50:19 GMT)
PyDCM: Custom Data Center Models with Reinforcement Learning for Sustainability [2.6] PyDCMは、Pythonで実装されたカスタマイズ可能なデータセンターモデルである。
ベクトル化熱計算を用いることで、PyDCMのオーダーは現在のEnergy Plusのモデリング実装よりも桁違いに速い(30倍)。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:48:44 GMT)
Experimental Realization of Discrete Time Quasi-Crystals [2.6] 浮動小数点(周期的に駆動される)系は、平衡アナログなしで物質のユニークな非平衡相を生じさせる。
準周期ドライブの多周波特性は、異なる離散時間準結晶相に関連付けられた多様なパターンの形成を可能にすることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:29:03 GMT)
Climate Downscaling: A Deep-Learning Based Super-resolution Model of Precipitation Data with Attention Block and Skip Connections [2.4] 台湾では年間平均降水量は2,500ミリ (mm) に達するが、平均降水量は世界平均よりも低い。
低分解能降水データを高分解能にダウンスケールするために、スキップ接続、アテンションブロック、補助データ結合を備えたディープ畳み込みニューラルネットワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:36:50 GMT)
Artificial Neural Nets and the Representation of Human Concepts [2.4] 機械学習(ML)コミュニティは、ANNが複雑なタスクを実行するために抽象的なヒューマンコンセプトを開発する必要があるという物語を共有している。
さらには、これらの概念がネットワークの個々の単位に保存されていると考える人もいる。
ANNは複雑な予測タスクを実際に実行でき、人間や非人間の概念を学習することができると結論付けます。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:09:56 GMT)
RetroBridge: Modeling Retrosynthesis with Markov Bridges [2.3] 再合成計画は、市販の開始物質から標的分子への反応経路を設計することを目的としている。
本稿では,2つの離散分布間の依存性を近似する生成フレームワークであるマルコフブリッジモデルを紹介する。
次に, 新たなフレームワークでレトロシンセシス計画問題に対処し, テンプレートレスレトロシンセシスモデリング手法RetroBridgeを導入する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:32:36 GMT)
VDSC: Enhancing Exploration Timing with Value Discrepancy and State Counts [2.3] より洗練された探査戦略は、特定の、しばしばまばらな報酬環境において優れている。
本稿では,効率的な探索タイミングのための新しいアプローチであるホメオスタシス(VDSC)を通して,値の相違と状態のカウントを提示する。
Atariスイートの実験結果は,従来の手法よりも戦略が優れていることを示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:44:57 GMT)
HealthGAT: Node Classifications in Electronic Health Records using Graph Attention Networks [2.2] HealthGATは、EHRから埋め込みを生成するグラフアテンションネットワークフレームワークである。
本モデルでは,医療コードへの埋め込みを反復的に洗練し,EHRデータ解析の改善を実現している。
本モデルでは,ノード分類や,可読度予測や診断分類などの下流タスクにおいて,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:17:01 GMT)
Brain Networks and Intelligence: A Graph Neural Network Based Approach to Resting State fMRI Data [2.2] 本稿では,rsfMRIによる接続行列上のグラフニューラルネットワークを用いて,インテリジェンス(流動性,結晶化,全知能)を予測するBrainRGINという新しいモデリングアーキテクチャを提案する。
本手法では,脳のサブネットワーク組織の性質を反映するグラフ畳み込み層に,クラスタリングに基づく埋め込みとグラフ同型ネットワークを組み込む。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:05:13 GMT)
Towards Low-Energy Adaptive Personalization for Resource-Constrained Devices [2.1] Target Block Fine-Tuning (TBFT) はリソース制約のあるデバイスのための低エネルギー適応型パーソナライズフレームワークである。
我々は、エネルギーコストを削減して最適な性能を達成するために、モデルの異なるブロックを微調整する。
Block Avg$と比較すると、TBFTは平均15.30%の精度向上を示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:11:49 GMT)
The Pursuit of Fairness in Artificial Intelligence Models: A Survey [2.1] この調査は、研究者がAIシステムの公正性を促進する方法の相乗効果を提供する。
AIモデルのバイアスを軽減するために研究者が採用したアプローチとテクニックについて、徹底的な研究がなされている。
また、偏見付きモデルがユーザエクスペリエンスに与える影響や、そのようなモデルの開発とデプロイにおいて考慮すべき倫理的考慮についても調べます。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:33:36 GMT)
Enhancing Privacy in Federated Learning through Local Training [2.1] 我々は,(i)高価なコミュニケーションと(ii)プライバシー保護の課題を克服するために,フェデレートラーニングのためのtheFed-PLTを提案する。
i) 中央コーディネータと計算機エージェント間の通信回数を大幅に削減し, 部分的参加と局所訓練の両立を可能にした。
エージェントは、(確率的な)勾配降下や加速された勾配降下など、様々な局所的な訓練解法から選択する柔軟性がある。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:25:21 GMT)
A Semismooth Newton Stochastic Proximal Point Algorithm with Variance Reduction [2.0] 弱凸, 複合最適化問題に対する実装可能な近位点(SPP)法を開発した。
提案アルゴリズムは分散低減機構を組み込んでおり、その結果の更新は不正確なセミスムース・ニュートン・フレームワークを用いて解決される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:48:53 GMT)
Supervisory Prompt Training [2.0] 我々は,SPT(Supervisory Prompt Training)という新しいアプローチを提案する。
SPTは、LLM(Large Language Models)システムを使用して、非常に効果的なプロンプトを生成する。
本システムでは,1つのLCM,ジェネレータがタスクを実行し,もう1つのリフレクタがフィードバックを提供し,改良されたプロンプトを生成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:08:20 GMT)
Ransomware: Analysis and Evaluation of Live Forensic Techniques and the Impact on Linux based IoT Systems [2.0] Linuxシステムはサイバー犯罪者にとって興味深いものとなり、この傾向は続くと予想されている。
多くのIoTシステムはLinux(例えばクラウドインフラストラクチャとゲートウェイ)に基づいている。
本稿では,Linuxのランサムウェアに適用可能な法医学的手法について検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:22:05 GMT)
How many bits does your quantum estimation return? [2.0] 任意の量子推定戦略において、相互情報に2つの上限を与える。
ノイズの存在下での量子位相推定アルゴリズムを特徴付けることにより,これらの境界の有用性を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:08:00 GMT)
High-throughput Biomedical Relation Extraction for Semi-Structured Web Articles Empowered by Large Language Models [2.0] 関係抽出タスクを大言語モデルのバイナリ分類として定式化する。
メインタイトルをテールエンティティとして指定し、コンテキストに明示的に組み込む。
長い内容はテキストチャンクにスライスされ、埋め込みされ、追加の埋め込みモデルで検索される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:36:31 GMT)
Not All Federated Learning Algorithms Are Created Equal: A Performance Evaluation Study [1.9] フェデレートラーニング(FL)は、分散データからモデルをトレーニングするための実践的なアプローチとして登場した。
このギャップを埋めるために、いくつかの標準FLアルゴリズムで広範な性能評価を行う。
我々の総合的な測定結果から、異なるパフォーマンス指標に対して1つのアルゴリズムが最善を尽くさないことが判明した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:33:49 GMT)
ILLUMINER: Instruction-tuned Large Language Models as Few-shot Intent Classifier and Slot Filler [1.9] 本研究では、インテント分類(IC)とスロットフィリング(SF)のための人気のあるベンチマークデータセット上で、命令調整モデル(インストラクション-LLM)を評価する。
Instruct-LLM の言語生成タスクとして IC と SF をフレーミングする ILLUMINER を導入する。
FLAN-T5 11Bモデルを用いた複数のベースラインとの総合的な比較から,本手法は最先端のジョイントIC+SF法やGPT3.5 (175B) を用いたテキスト内学習よりも優れていた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:41:21 GMT)
Deep Learning for Segmentation of Cracks in High-Resolution Images of Steel Bridges [1.9] 鋼橋の高分解能画像における疲労き裂検出のための新しい深層学習法を開発した。
クラックセグメンテーションのために,従来の最先端エンコーダデコーダネットワークとConvNextニューラルネットワークを統合した。
鋼橋のき裂の高分解能画像に適用した場合, 背景パッチの使用がネットワーク性能に及ぼす影響を報告する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:13:44 GMT)
A foundation model utilizing chest CT volumes and radiology reports for supervised-level zero-shot detection of abnormalities [1.9] 3D医療画像における計算研究における大きな課題は、包括的なデータセットの欠如である。
CT-RATEは、画像とテキストレポートを組み合わせた最初の3D医療画像データセットである。
我々はCTに焦点をあてたコントラスト言語画像事前学習フレームワークであるCT-CLIPを開発した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:19:56 GMT)
Do large language models resemble humans in language use? [1.9] ChatGPTやVicunaのような大規模言語モデル(LLM)は、言語を解釈し、生成する際、顕著な能力を示している。
私たちはChatGPTとVicunaを、音から対話、事前登録、実験1回につき1000ラン(イテレーション)の12の実験に応用した。
ChatGPTとVicunaは、それぞれ12の実験のうち10と7で人間の言語使用パターンを再現した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:46:50 GMT)
Diffusion Models Generate Images Like Painters: an Analytical Theory of Outline First, Details Later [1.8] 画像生成の基盤となる逆拡散過程には,以下の特性がある。
個々の軌道は低次元であり、2次元回転に似ている」。
本手法は,事前学習したモデルに対する画像生成の初期フェーズを正確に記述する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:41:26 GMT)
EL-MLFFs: Ensemble Learning of Machine Leaning Force Fields [1.8] 機械学習力場(MLFF)は、量子力学的手法の精度を橋渡しするための有望なアプローチとして登場した。
本稿では,多種多様なMLFFからの予測を統合するため,階層化手法を利用した新しいアンサンブル学習フレームワークEL-MLFFを提案する。
我々は,Cu(100)表面に吸着したメタン分子とメタノールの2つの異なるデータセットに対するアプローチを評価した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:09:40 GMT)
Tiny Models are the Computational Saver for Large Models [1.8] 本稿では,TinySaverについて紹介する。TinySaverは,大規模モデルを適応的に置き換えるために小さなモデルを用いる,早期に出現する動的モデル圧縮手法である。
この手法をImageNet-1k分類で評価した結果,最大90%の演算数を削減できる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:14:30 GMT)
Confidence-Triggered Detection: Accelerating Real-time Tracking-by-detection Systems [1.8] 信頼強化検出(CTD)は、中間状態によく似たフレームのオブジェクト検出を戦略的に回避する革新的な手法である。
CTDは追跡速度を向上するだけでなく、既存の追跡アルゴリズムを超越して精度も維持する。
本実験はCTDフレームワークの堅牢性と汎用性を実証し,資源制約環境におけるリアルタイムトラッキングの実現の可能性を示した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:40:54 GMT)
Approximate and Weighted Data Reconstruction Attack in Federated Learning [1.8] 分散学習(FL)は、クライアントがプライベートデータを共有せずに、機械学習モデルを構築するためのコラボレーションを可能にする。
最近のデータ再構成攻撃は、攻撃者がFLで共有されたパラメータに基づいてクライアントのトレーニングデータを復元できることを実証している。
本稿では、クライアントのローカルトレーニングプロセスの中間モデル更新を生成することにより、FedAvgシナリオの攻撃を可能にする近似手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:39:23 GMT)
Explainable Graph Neural Networks for Observation Impact Analysis in Atmospheric State Estimation [1.7] 観測点と数値気象予報点を気象グラフに統合し,NWP点を中心とした$k$-hopのサブグラフを抽出する。
自己監督型GNNは、これらの$k$-hop radii内のデータを集約することで大気状態を推定するために使用される。
本研究は、推定過程における異なる観測の意義を定量化するために、勾配に基づく説明可能性法を適用した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:10:47 GMT)
R2D2 image reconstruction with model uncertainty quantification in radio astronomy [1.7] Residual-to-Residual'(R2D2)アプローチは、天文学におけるRI(Radio-Interferometric)イメージングのために最近導入された。
R2D2の再構成は、ディープニューラルネットワーク(DNN)の出力として反復的に推定される一連の残像として形成される
本稿では,R2D2画像推定プロセスのロバスト性について,その一連の学習モデルに関連する不確実性について検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:10:08 GMT)
S+t-SNE - Bringing dimensionality reduction to data streams [1.7] S+t-SNEは、無限のデータストリームを処理するように設計されたt-SNEアルゴリズムの適応である。
各ステップで最も重要なポイントを選択することで、アルゴリズムは情報的な視覚化を維持しながらスケーラビリティを確保する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:23:34 GMT)
Coarse-Tuning for Ad-hoc Document Retrieval Using Pre-trained Language Models [1.7] 情報検索システムの微調整には、クエリ表現とクエリドキュメントの関係の学習が必要である。
本研究では,事前学習と微調整を橋渡しする中間学習段階として粗調整を導入する。
粗いチューニングのためのクエリ文書ペア予測(QDPP)を提案し,クエリ文書ペアの適切性を予測する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:11:44 GMT)
An Extension-based Approach for Computing and Verifying Preferences in Abstract Argumentation [1.7] 本稿では,抽象的論証システムにおいて,計算と選好の検証のための拡張型アプローチを提案する。
選好集合の計算の複雑さは議論の数で指数関数的であることを示す。
計算された選好を検証(すなわち評価)するための新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:36:11 GMT)
AI Safety: Necessary, but insufficient and possibly problematic [1.7] この記事では、AI安全性に関する最近の誇大広告について批判的に考察する。
AIの安全性」とは実際に何を意味するのかを考察し、AIの安全性のデジタルフットプリントが持つ支配的な概念を概説する。
私たちは、AIの安全性が、悪用され有害なAIに安全を害することで、構造的危害を助長するAIを正規化する方法に関する懸念を共有します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:18:42 GMT)
Disambiguate Entity Matching through Relation Discovery with Large Language Models [1.6] 本稿では、純粋に意味的な類似点から、エンティティ間の「関係」を理解し定義することへ焦点を移す新しいアプローチを提案する。
本手法では,タスクに関連する一連の関係を事前に定義することにより,類似性のスペクトルをより効率的にナビゲートすることができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:07:32 GMT)
FPT: Fine-grained Prompt Tuning for Parameter and Memory Efficient Fine Tuning in High-resolution Medical Image Classification [1.6] きめ細かいPrompt Tuning(FPT)は、訓練済みのモデルを下流のタスクに転送するコスト効率の良い方法である。
FPTは、他のPEFT法と比較してメモリ消費を大幅に削減する。
FPTは, サイズ, モダリティ, 複雑さの異なる4つの医療データセットで評価した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:55:51 GMT)
PeersimGym: An Environment for Solving the Task Offloading Problem with Reinforcement Learning [1.6] 計算ネットワークにおけるタスクオフロード戦略の開発と最適化に適した,オープンソースのカスタマイズ可能なシミュレーション環境であるPeersimGymを紹介する。
PeersimGymは、幅広いネットワークトポロジと計算制約をサポートし、TextitPettingZooベースのインターフェイスを統合して、RLエージェントのデプロイを、単体とマルチエージェントの両方で行えるようにしている。
本稿では,分散コンピューティング環境におけるオフロード戦略を大幅に強化するRLベースのアプローチの可能性を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:12:44 GMT)
A Safe Preference Learning Approach for Personalization with Applications to Autonomous Vehicles [1.6] この研究は、自動運転車への適用とともに、所定の仕様に準拠することを保証する選好学習手法を導入している。
本稿では,ペア比較に基づく安全保証型選好学習の問題を定式化し,この課題を解決するためのアプローチを提案する。
提案手法は,従来の選好学習法と比較して,従来の選好学習法と比較して競争力があり,安全性を考慮した場合,特に優れる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:25:52 GMT)
MEDDAP: Medical Dataset Enhancement via Diversified Augmentation Pipeline [1.5] 我々はMEDDAPと呼ばれる新しいパイプラインを導入し、新しい情報付きラベル付きサンプルを自動生成することで、既存の小さなデータセットを拡張する。
USLoRAはSD内の重量を選択的に微調整することができ、SDのUNet部分のみを完全微調整するのに対し、パラメータは0.1%未満である。
このアプローチは、乳がんに関する臨床医の意思決定プロセスに触発され、腫瘍の形状が強度よりも重要な役割を担っていることが多い。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:29:49 GMT)
Born With a Silver Spoon? Investigating Socioeconomic Bias in Large Language Models [1.4] 大規模言語モデルで表現される社会経済的バイアスの度合いと,この度合いの変動をモデルサイズの関数として評価した。
分析の結果, 社会的に劣悪な言語モデルでは, 社会経済的に劣悪な言語モデルに共感できないことが判明した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:12:40 GMT)
AE SemRL: Learning Semantic Association Rules with Autoencoders [1.4] アソシエーションルールマイニング(アソシエーションルールマイニング、英: Association Rule Mining、ARM)は、データ特徴間の関連を論理ルールの形で学習するタスクである。
本稿では,時系列データから関連ルールを学習し,抽出するためのオートエンコーダに基づく手法を提案する。
実験の結果,オートエンコーダが生成した潜在表現から意味的関連ルールを抽出できることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:28:43 GMT)
Quadratic speed-ups in quantum kernelized binary classification [1.4] 量子カーネルをデータ間の類似性の尺度として使用するいくつかの量子機械学習アルゴリズムが登場し、量子状態として符号化されたデータセットのバイナリ分類を実行するようになった。
本稿では,QKCに対する新しい量子回路を提案し,量子ビットの数を1つ減らし,サンプルデータに対して回路深さを線形に減らした。
Irisデータセットの数値シミュレーションにより,従来の手法よりも2次的な高速化を検証した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:39:48 GMT)
Prediction Error Estimation in Random Forests [1.3] 分類の場合、ランダムフォレストによる予測誤差の推定は、真の誤差率と平均的に近いことを示す。
さらに、我々の結果は、クロスバリデーション、バッグング、データ分割など、さまざまなエラー推定戦略にまたがっていることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:33:12 GMT)
Confidence and second-order errors in cortical circuits [1.2] 大脳皮質予測誤差の最小化は大脳皮質の重要な計算目標と考えられている。
我々は、皮質領域が他の領域での活動を予測するだけでなく、その信頼性を共同で投影しなければならないという仮定の下で予測誤差を最小限に抑える神経力学を導出する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:58:15 GMT)
Molecular groundstate determination via short pulses on superconducting qubits [1.2] 本稿では,2ビットチャネルを組み込んだフリースタイルの超電導パルス最適化手法を提案する。
最小 0.22 ns のパルスで、H2基底状態は実際のハードウェア上で化学的精度で決定され、量子速度制限に近づいた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:21:12 GMT)
Divide, Conquer, Combine Bayesian Decision Tree Sampling [1.2] 決定木は、その柔軟性と解釈可能性のために予測モデルとして一般的に使用される。
本稿では,ベイズ推定手法を用いて決定木予測の不確かさを定量化する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:14:15 GMT)
Natural Language Requirements Testability Measurement Based on Requirement Smells [1.2] テスト可能な要件は、障害の防止、メンテナンスコストの削減、受け入れテストの実行を容易にする。
要求の匂いに基づいて、要求の検証可能性を測定するための自動的なアプローチは提案されていない。
本稿では,9つの要求の匂いの広範囲なセットに基づいて,自然言語の検証可能性の評価とランク付けを行う数学的モデルを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:19:29 GMT)
Simultaneous All-versus-Nothing Refutation of Local Realism and Noncontextuality by a Single System [1.1] 非局所性と文脈性の量子領域はベルの定理とコシェン=スペクターの定理によって導かれる。
本研究では、これらの2つの半論理定理の妥当性を同時に示す「全対無証明」を公表する。
我々の証明は、量子力学と隠れ変数理論の対立を別の観点から裏付けるだけでなく、既存の線形光学技術を利用して容易に検証することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:06:33 GMT)
Stable Linear Subspace Identification: A Machine Learning Approach [1.0] 本稿では,離散線形多段階状態空間SI法であるSIMBaを紹介する。
SIMBaが従来の線形状態空間SI法より一般的に優れていることを示す。
この新たなSIパラダイムは、データから構造化された非線形モデルを特定するための大きな拡張ポテンシャルを示すと仮定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:37:38 GMT)
Deep polytopic autoencoders for low-dimensional linear parameter-varying approximations and nonlinear feedback design [0.9] 制御用多目的オートエンコーダを開発した。
非線形系のLPV近似の観点から, 標準線形アプローチよりも優れた性能を示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:57:56 GMT)
Large Language Models Offer an Alternative to the Traditional Approach of Topic Modelling [0.9] 広範テキストコーパス内の話題を明らかにする代替手段として,大規模言語モデル (LLM) の未解決の可能性について検討する。
本研究は, 適切なプロンプトを持つLCMが, トピックのタイトルを生成でき, トピックを洗練, マージするためのガイドラインに固執する上で, 有効な代替手段として目立たせることを示唆している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:46:26 GMT)
ArtAdapter: Text-to-Image Style Transfer using Multi-Level Style Encoder and Explicit Adaptation [0.9] ArtAdapterは変換型テキスト・トゥ・イメージ(T2I)スタイルの転送フレームワークである。
提案した明示的な適応機構とマルチレベルスタイルエンコーダの統合により、ArtAdapterはスタイル転送において前例のない忠実性を実現することができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:28:02 GMT)
Decoding Probing: Revealing Internal Linguistic Structures in Neural Language Models using Minimal Pairs [0.9] 本稿では,ニューラルネットワークモデル層の内部言語特性を層単位で探索する新しい復号探索手法を提案する。
言語モデルを脳として扱い、その表現をニューラルアクティベーションとして扱うことにより、中間層の表現から最小対の文法ラベルをデコードする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:56:06 GMT)
SimLVSeg: Simplifying Left Ventricular Segmentation in 2D+Time Echocardiograms with Self- and Weakly-Supervised Learning [0.9] 狭義の心エコービデオから一貫した左室(LV)セグメンテーションを行うビデオベースネットワークであるSimLVSegを開発した。
SimLVSegは、時間的マスキングによる自己教師付き事前トレーニングと、スパースアノテーションからのLVセグメンテーションに適した弱い教師付き学習で構成されている。
我々は、SimLVSegが、最大の2D+時間心エコー画像データセットで93.32%のダイススコアを達成して、最先端のソリューションをいかに優れているかを実証する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:41:17 GMT)
Supervised Training of Neural-Network Quantum States for the Next Nearest Neighbor Ising model [0.8] 物質相の異なる状態におけるフィードフォワードニューラルネットワーク量子状態の性能を評価する。
重なり合う損失関数は、ニューラルネットワークの再スケーリングを条件として、すべてのフェーズにわたるモデルのより良いトレーニングを可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:08:05 GMT)
CANOS: A Fast and Scalable Neural AC-OPF Solver Robust To N-1 Perturbations [0.8] 最も単純な設定では、OPF (Optimal Power Flow) はコストを最小限に抑えるためにどれだけの電力を生成するかを決定する。
電力グリッド演算子はAC-OPF問題の近似を用いる。
本研究では,計算速度を損なうことなく,準最適解(真のAC-OPFコストの1%)を予測するためのディープラーニングシステム(CANOS)を訓練する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:47:04 GMT)
A Moreau Envelope Approach for LQR Meta-Policy Estimation [0.7] 離散時間線形時間不変不確実な力学系における線形二次レギュレータ(LQR)のポリシー推定問題について検討する。
本稿では,不確実なシステムの有限な実現法から構築した代用LQRコストを提案し,新しい実現法に適応可能なメタポリティクスを効率的に定義する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 04:02:09 GMT)
Two-compartment neuronal spiking model expressing brain-state specific apical-amplification, -isolation and -drive regimes [0.7] 脳状態特異的神経機構は、過去と文脈の知識を現在の、入ってくる証拠の流れと統合する上で重要な役割を担っている。
この研究の目的は、脳の状態に応じた学習を支援するのに不可欠な特徴を組み込んだ2成分のスパイクニューロンモデルを提供することである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:26:31 GMT)
Graph Language Model (GLM): A new graph-based approach to detect social instabilities [0.7] 本稿では,ニュースデータセットを用いた重要な政治事象の早期予測手法を提案する。
この手法は自然言語処理、グラフ理論、斜め解析、意味的関係を利用して隠れた予測信号を明らかにする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:53:02 GMT)
Asynchronous Quantum Repeater using Multiple Quantum Memory [0.6] 本稿では,ポストマッチングの考え方を用いた量子リピータプロトコルを提案する。
我々の研究は、量子鍵分布と量子リピータの間の内部接続を明らかにする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:14:19 GMT)
Spatio-temporal load shifting for truly clean computing [0.6] 本研究では、時間と場所の双方において、コンピュータジョブのシフトと関連する電力負荷の影響について検討する。
我々は,ロードブルティの情報利用に関連する3つの信号を分離した。
24/7 CFEのコストは1.29$pm$0.07 EUR/MWhに削減される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:36:42 GMT)
Fast quantum integer multiplication with zero ancillas [0.6] 我々は,ゼロアンシラ量子ビットを用いた準四進時間量子乗法の新しいパラダイムを導入する。
関連するキュービットは入力と出力レジスタ自身のみである。
我々のアルゴリズムは、実際的な問題の大きさよりも優れている可能性がある。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:00:03 GMT)
SugarcaneNet2024: An Optimized Weighted Average Ensemble Approach of LASSO Regularized Pre-trained Models for Sugarcane Disease Classification [0.6] サトウキビNet2024は、サトウキビ病を自動的にかつ迅速に検出する従来の方法よりも優れたユニークなモデルである。
提案モデルは、7つのカスタマイズおよびLASSO正規化事前学習モデルの最適化された平均アンサンブルを集約する。
この最適化されたサトウキビNet2024モデルは、精度、精度、リコール、F1スコアの99.67%、100%、100%、100%を達成し、サトウキビ病の診断に最適であった。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:23:08 GMT)
Tensor decompositions with applications to LU and SLOCC equivalence of multipartite pure states [0.6] Kraus' (2010) アルゴリズムは HOSVD を用いて、局所ユニタリ群の作用の下でほぼすべての$n$-qubit純状態の正規形式を計算した。
我々は、SLOCC群の作用の下で、ほぼ全ての$n$-qubit純状態に対して正規形式を計算する類似のアルゴリズムを作成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:38:24 GMT)
Towards a RAG-based Summarization Agent for the Electron-Ion Collider [0.6] A Retrieval Augmented Generation (RAG)ベースのEIC用要約AI(RAGS4EIC)が開発中である。
このAIエージェントは情報を凝縮するだけでなく、関連する応答を効果的に参照する。
まず、関連するすべての実験情報を含む包括的ベクトルデータベースを問合せし、次に、Large Language Model(LLM)を用いて、ユーザクエリと検索データに基づく引用に富んだ簡潔な要約を生成する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:42:08 GMT)
The Privacy Policy Permission Model: A Unified View of Privacy Policies [0.5] プライバシポリシ(英: privacy policy)とは、組織がどのようにクライアントのデータを収集し、利用し、開示し、保持するかを指定するステートメントのセットである。
ほとんどのプライバシポリシには、データプロバイダの情報の使用方法に関する明確で完全な説明が欠けている。
本稿では,プライバシーポリシーの統一的かつ理解しやすい表現を提供するプライバシポリシ許可モデル(PPPM)を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:12:38 GMT)
For those who don't know (how) to ask: Building a dataset of technology questions for digital newcomers [0.5] 本稿では,デジタル新参者や外部者の質問を抽出するデータセットの作成を提案する。
計画されている取り組みと、このデータセットの潜在的な利用について概説する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:08:33 GMT)
Cross-system biological image quality enhancement based on the generative adversarial network as a foundation for establishing a multi-institute microscopy cooperative network [0.5] 生物学的システムの高品質蛍光イメージングは、光漂白や光毒性といったプロセスによって制限される。
本稿では,2つの異なる顕微鏡システム間のコントラスト伝達のためのGAN(Generative-Adversarial Network)を提案する。
このような転送が可能であることを実証し、低平均二乗誤差(MSE)、高構造類似度指数(SSIM)、高ピーク信号-雑音比(PSNR)を特徴とするHQ生成画像の受信を可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:23:31 GMT)
Healthcare Data Governance, Privacy, and Security - A Conceptual Framework [0.5] データの豊富さは、あらゆる面で世界を変えました。
これらの進歩にもかかわらず、プライバシとセキュリティは医療業界にとって重要な関心事である。
概念的プライバシとセキュリティ駆動型医療データガバナンスフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:29:56 GMT)
Using quantum computers in control: interval matrix properties [0.5] 本稿では,システムや制御理論における関連する問題に対する量子コンピュータの利用について検討する。
量子コンピュータ上での非特異性や安定性などの間隔行列特性の検証の原型例を示す。
以上の結果から,量子コンピュータは,さらなる計算複雑化問題への適用性を探求する上で,有望な制御ツールであることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:58:21 GMT)
Using Stratified Sampling to Improve LIME Image Explanations [0.4] コンピュータビジョンタスクのためのモデルに依存しない説明可能なAI手法であるLIME Imageの階層化サンプリング手法について検討する。
このようなアーティファクトは、説明されている画像の周りの合成近傍における依存変数のアンダーサンプリングによるものである。
我々は,不偏成層化サンプリング推定器に必要な式と調整因子をすべて導出する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:30:23 GMT)
Towards the Intuitive Understanding of Quantum World: Sonification of Rabi Oscillations, Wigner functions, and Quantum Simulators [0.3] 量子力学現象の直観的理解に向けた手法として音素化を提案する。
本稿では、音源データや性能設定に応じて量子データの音素化・スコア化を行う様々な手法について述べる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:01:31 GMT)
Emotic Masked Autoencoder with Attention Fusion for Facial Expression Recognition [0.3] 本稿では,MAE-Face self-supervised learning (SSL) 法とFusion Attention Mechanismを併用した表現分類手法を提案する。
そこで本研究では,顔の特徴を強調する前処理手法を提案し,トレーニングと検証の双方におけるモデル性能を向上させる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:52:05 GMT)
Typical thermalization of low-entanglement states [0.3] 我々は, 高精度条件下での低絡み合い状態の熱化を証明した。
我々は、初期状態の絡み合いが低いとき、局所的な熱化につながる局所ハミルトニアンのランダムなエネルギー平滑化を定義する。
このような変換はギブズ状態にも軽度条件下においても短時間のダイナミクスにも影響しないことを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:00:05 GMT)
Towards Explainable Clustering: A Constrained Declarative based Approach [0.3] 古典的クラスタリング基準の観点から,高品質なクラスタリングを実現することを目指しており,その説明が可能である。
クラスタリングに関する優れたグローバルな説明は、各クラスタの特徴を、そのオブジェクトを記述する能力を考慮して与えるべきである。
そこで我々は,ECS と呼ばれる新しい解釈可能な制約付き手法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:00:06 GMT)
Tripartite entanglement and Bell non-locality in loop-induced Higgs boson decays [0.2] 標準模型の文脈における3体$Htogamma lbarl$崩壊($l=e,mu,tau$)の絡み合い特性について検討する。
本研究の目的は, 位相空間における最終光子, レプトン, アンティルプトン間の絡み合いの分布を明らかにすることである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:21:10 GMT)
The Need for Climate Data Stewardship: 10 Tensions and Reflections regarding Climate Data Governance [0.2] 記事は、マルチステークホルダガバナンス、データスチュワードシップ、公平なデータプラクティスへのパラダイムシフトを提唱している。
これらの課題をナビゲートする上で、データスチュワードは重要な役割を担っている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:16:03 GMT)
From Computing to Quantum Mechanics: Accessible and Hands-On Quantum Computing Education for High School Students [0.1] 本稿では,高校における量子コンピューティング教育への代替的アプローチについて概説する。
高度な数学と物理学の知識が限られている学生向けに調整されている。
このコースは最初、香港教育局(Hong Kong Education Bureau)の下で贈与された高校生向けのプログラムで実施された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:30:20 GMT)
Green HPC: An analysis of the domain based on Top500 [0.1] 本稿では,HPC システムのエネルギー消費の隠蔽問題について考察する。
本研究の目的は,Top500とGreen500のデータを分析し,その環境影響に関する領域の動態を明らかにすることである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:55:40 GMT)
Labeling subtypes in a Parkinson's Cohort using Multifeatures in MRI - Integrating Grey and White Matter Information [0.1] 相互K-Nearest Neighbor(MKNN)を用いた脳ネットワーク解析
パーキンソン病180例のMRI像とNIMHANS70例の解析を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:32:52 GMT)
Annotated Biomedical Video Generation using Denoising Diffusion Probabilistic Models and Flow Fields [0.0] 本稿では,現実的な合成顕微鏡ビデオを生成するバイオメディカルビデオ拡散モデル(BVDM)を提案する。
BVDMは任意の長さのビデオをピクセルレベルのアノテーションで生成することができる。
高忠実な合成細胞顕微鏡画像を生成する拡散確率モデル(DDPM)と、連続するビデオフレーム間の非剛性変換を予測するフロー予測モデル(FPM)から構成される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:45:29 GMT)
Proceedings Sixth Workshop on Models for Formal Analysis of Real Systems [0.0] この巻には、European Joint Conference on Theory and Practice of Software である ETAPS 2024 の一部として開催されている Models for Formal Analysis of Real Systems の6番目のワークショップが含まれている。
MARSワークショップは、ネットワーク、サイバー物理システム、ハードウェア/ソフトウェアの共同設計、生物学など、複雑なモデルが発生する分野において、実際のシステムの形式モデルを開発している異なるコミュニティの研究者を集めている。
1 大規模ケーススタディは、仕様形式とモデリング技術が現実のシステムに適用可能であることを示すのに不可欠であるが、多くの研究論文ではおもちゃの例や小さなケースしか考慮していない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:49:46 GMT)
Project MOSLA: Recording Every Moment of Second Language Acquisition [0.0] 第二言語習得は複雑で動的なプロセスである。
Project MOSLAは参加者に対して,2年間にわたって3つのターゲット言語のうちの1つをスクラッチから学ぶように求めている。
データセットには、人間のアノテータと細調整された最先端の音声モデルの両方によって、話者/言語IDと転写文が半自動アノテートされる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 01:52:59 GMT)
Stability of long-sustained oscillations induced by electron tunneling [0.0] 量子デバイスでは、単一電子力学と機械運動の相互作用によって自己振動が発生することがある。
このメカニズムの複雑さにより、これらの自己振動は破裂し、消滅し、あるいは、政権サイクルを引き起こす不安定な行動を示す可能性がある。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:56:59 GMT)
Weak entanglement improves quantum communication using only product measurements [0.0] 秘密共有と呼ばれる暗号プリミティブに対応する通信タスクを導入する。
我々は、全てのステアブル2量子等方性状態が、製品測定のみを用いて成功率に量子的優位性をもたらすことを示した。
次に、より洗練された標準のベル状態分析に基づく秘密共有の亜種を検討する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:41:36 GMT)
Two-Particle Scattering on Non-Translation Invariant Line Lattices [0.0] 量子ウォークは、当初から量子アルゴリズムの開発に用いられてきた。
我々は,行グラフのごく一部にのみ作用する場合に,CPHASEゲートを高忠実度で実現可能であることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:20:37 GMT)
Transcribing Bengali Text with Regional Dialects to IPA using District Guided Tokens [0.0] 本稿では,バングラデシュの6つの地区にまたがる新しいデータセットについて,DGT(District Guided Tokens)技術を紹介する。
DGTテクニックは、この新しいデータセットに基づいて、いくつかのトランスフォーマーベースのモデルを微調整する。
ByT5モデルを用いたDGTの有効性を示す実験結果が得られた。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:55:21 GMT)
Training BERT Models to Carry Over a Coding System Developed on One Corpus to Another [0.0] 本稿では,ハンガリーの文芸雑誌の段落で開発されたコーディングシステムを通じて,BERTモデルを学習する方法について述べる。
コーディングシステムの目的は、1989年のハンガリーにおける政治変革に関する文学翻訳の認識の傾向を追跡することである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:03:57 GMT)
Tracing and segmentation of molecular patterns in 3-dimensional cryo-et/em density maps through algorithmic image processing and deep learning-based techniques [0.0] 論文はアクチンフィラメントを 追跡する高度な計算技術の開発に焦点を当てています
BundleTrac、Stereociliumで発見された束状アクチンフィラメントをトレースするSpagetti Tracer、アクチンネットワークでランダムに配向されたアクチンフィラメントをトレースするStruwwel Tracerの3つの新しい手法が開発されている。
論文の第2の構成要素は、中分解能(5-10アングストローム)3次元低温電子顕微鏡におけるヘリスやベータシートなどのタンパク質二次構造の位置を決定する畳み込みニューラルネットワーク(CNN)に基づくセグメンテーションモデルの導入である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 00:41:54 GMT)
Towards a FAIR Documentation of Workflows and Models in Applied Mathematics [0.0] MaRDMOとMathModDB Knowledge Graphの相互作用を示す。
このデモンストレーションは、元の数値領域を超えて、両方のサービスの汎用性を強調します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:11:18 GMT)
Towards a Dutch hybrid quantum/HPC infrastructure [0.0] 量子インスピレーション(Quantum Inspire)は、ハイブリッドアルゴリズムの実行を可能にする設定を開発することで、量子アプリケーションを実現するための重要なステップを採っている。
サーバと量子コンピュータ間のインタラクションをオーケストレーションする高速タスクマネージャが開発されている。
最初のステップは、SURFが主催するオランダ国立ハイパフォーマンスコンピューティングセンターとの統合に向けたものだ。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:31:27 GMT)
Toward Local Madelung Mechanics in Spacetime [0.0] 非相対論的マドルング方程式を用いた完全相対論的量子流体処理について述べる。
マドルング流体中の全ての粒子は等しくリアルであり、定位置、運動量、運動エネルギー、ポテンシャルエネルギーを持つ。
エネルギーの局所的な保存を可能にするには、量子ポテンシャルエネルギー電流を定義する必要がある。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:14:32 GMT)
Topological photonic band gaps in honeycomb atomic arrays [0.0] 本研究では,二次元平面型ハニカム格子の励起スペクトルについて検討した。
バンドギャップ開きの条件を確立し,ギャップの幅を計算し,そのトポロジ的特性をトポロジ的指標により特徴付ける(Chern number)。
より大きな$d$は、キャビティミラーの反射によって構築され、自由な格子のバンドギャップ内に周波数を持つ光学モードの伝播を可能にし、後者を閉じる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:01:29 GMT)
Topological defect formation in a phase transition with tunable order [0.0] キブル・ズレック機構(KZM)は、二階相転移中の系の非平衡ダイナミクスと位相欠陥の形成を記述している。
超伝導体や荷電超流動体の遷移は, ゆらぎの影響を考慮した場合, 典型的には2次に分類されるが, 弱い1次特性を示す。
このような位相遷移におけるクエンチによるトポロジ的欠陥の形成について検討し、KZMと核生成理論を組み合わせることでその密度を予測できることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:41:17 GMT)
Topological Orders Beyond Topological Quantum Field Theories [0.0] 量子トポロジカル秩序を示すシステムは、量子コンピューティングスキームに非常に魅力的なロバストな特性を持つ。
ここでは、この共通パースペクティブの外にあるシステムについて検討し、距離依存相互作用性エノンを持つトポロジカル秩序を示すモデルの豊富なクラスを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:53:53 GMT)
The recessionary pressures of generative AI: A threat to wellbeing [0.0] 生成人工知能(AI)は、パラドックスを示す変換力である。
経済成長に前例のない機会を提供し、経済の安定と社会福祉に重大な脅威をもたらす可能性がある。
本稿では,両者が真である可能性のある条件について考察する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:51:05 GMT)
The operadic theory of convexity [0.0] 我々は、PROP上の代数の観点から凸性を特徴づけ、凸集合の圏上でテンソル積のような対称モノイド構造を確立する。
この構成を、Baez, Fritz, Leinsterのエントロピーのカテゴリー的特徴付けと、単純分布の枠組みにおける量子的文脈性の研究に適用する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:01:39 GMT)
The Solution of the Zodiac Killer's 340-Character Cipher [0.0] ゾディアック・キラー事件は、歴史上最も広く知られている未解決の連続殺人事件の一つである。
身元不明の犯人は5人の既知の犠牲者を殺害し、カリフォルニア州を脅かした。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 03:28:02 GMT)
Strong Thermomechanical Noise Squeezing Stabilized by Feedback [0.0] センサとして使用される高調波発振器の4次雑音をスクイーズすることで、特定の測定方式における感度を高めることができる。
本手法を高強度窒化ケイ素膜共振器に適用し, 数ナノグラムの有効質量と品質係数を108以上とした。
我々は,記録高17dBと21dBによる最大熱力学的スクイージングを観測し,デバイス設計に最小限の変更を加えることで,さらに大きな値を得ることができると主張している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:56:56 GMT)
State of the art applications of deep learning within tracking and detecting marine debris: A survey [0.0] 我々は,海洋破片の深層学習の最も最近かつ重要な貢献のうち,28点について,より深く,最新の概要と分析を行う。
研究論文の相互参照から、YOLOファミリーは、他のオブジェクト検出方法よりも大幅に優れています。
この分野には、現在機械学習では水中の破片の包括的なデータベースが利用できないという分類学的に合意している、多くの尊敬された貢献がある。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:36:50 GMT)
Spectral and dynamical validity of the rotating-wave approximation in the quantum and semiclassical Rabi models [0.0] 量子ラビモデルにおける超強結合(USC)は、回転波近似(RWA)の分解によって特徴づけられる
この批判的な再評価は、磁場周波数とのカップリングの固定比でUSCの定義が不十分であると結論付けている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:04:25 GMT)
Sentiment Analysis in Finance: From Transformers Back to eXplainable Lexicons (XLex) [0.0] 本稿では,レキシコン法とトランスフォーマーモデルの両方の利点を組み合わせた新しい手法を提案する。
我々は, 変圧器を用いた説明可能なレキシコンが, ベンチマークLoughran-McDonald (LM)レキシコンの語彙カバレッジを向上させることを実証した。
得られたレキシコンは、財務データセットのSAにおいて標準のLMレキシコンよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:32:51 GMT)
Scalable Non-Cartesian Magnetic Resonance Imaging with R2D2 [0.0] 本研究では,非電子磁気共鳴画像再構成のための新しい手法を提案する。
我々は「Residual to-Residual DNN series for high range imaging (R2D2)」を利用する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:45:06 GMT)
SSF3D: Strict Semi-Supervised 3D Object Detection with Switching Filter [0.0] SSF3Dは、ポイントクラウドデータ用に特別に設計された半教師付き3Dオブジェクト検出(SS3DOD)フレームワークを変更した。
我々は,偽ラベルの量と品質のバランスを追求する代わりに,真偽ラベルのみを保持し,他のファジィラベルをポイントでトリミングする戦略を採用する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:19:15 GMT)
Quantum state preparation via engineered ancilla resetting [0.0] フラストレーションのない親ハミルトニアンの基底状態を作成するために,周期的量子リセットを組み込んだプロトコルについて検討する。
このプロトコルでは、ハミルトニアンを操り、システムとアシラリー自由度の間の局所的な結合を可能にする。
以上の結果から,アンシラ系の絡み合いはより高速な収束に不可欠であることが示唆された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:29:04 GMT)
Quantum Optimization for the Future Energy Grid: Summary and Quantum Utility Prospects [0.0] Q-GRID」は、電力網における潜在的な量子ユーティリティ最適化の応用を評価することを目的としている。
このプロジェクトは、分散エネルギーの生成と伝達に関連する2つの最適化問題と、Peer-2-Peerエネルギートレーディングやマイクログリッド形成のような新しいエネルギー輸送/交換手法に焦点を当てている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:52:54 GMT)
Polariton Creation in Coupled Cavity Arrays with Spectrally Disordered Emitters [0.0] 集積フォトニクスは、強い相関系における凝縮物質現象のアナログ量子シミュレーションのための有望なプラットフォームである。
オープン量子Tavis-Cummings-Hubbardフレームワークにおけるエネルギーバンド形成と波動関数特性について検討した。
実効ハミルトニアンのアプローチと組み合わせた新しいメトリクスは、固体系の空洞量子力学工学のための強力なツールボックスであることが証明された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:36:18 GMT)
PerOS: Personalized Self-Adapting Operating Systems in the Cloud [0.0] 大規模な言語モデル(LLM)機能を備えたパーソナライズされたOSであるPerOSを提案する。
PerOSは、宣言型インターフェース、自己適応型カーネル、スケーラブルなクラウド中心アーキテクチャにおけるセキュアなデータ管理を通じて、プライバシと個人情報を保護しながら、カスタマイズされたユーザエクスペリエンスを提供することを目指している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:10:31 GMT)
Panonut360: A Head and Eye Tracking Dataset for Panoramic Video [0.0] 15のパノラマ動画を50人のユーザが視聴する頭部と眼の追跡データセットを提示する。
データセットは、ビューポートの詳細を提供し、ユーザーの注意を向ける。
我々の分析では、視野に対する視線固定において、一貫した下向きのオフセットが明らかである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:54:52 GMT)
Paired Diffusion: Generation of related, synthetic PET-CT-Segmentation scans using Linked Denoising Diffusion Probabilistic Models [0.0] 本研究では,複数のPET-CT-腫瘍マスクペアをペアネットワークと条件エンコーダを用いて生成できる新しいアーキテクチャを提案する。
我々のアプローチには、DDPMサンプリング一貫性を改善するための革新的で時間的なステップ制御機構とノイズ探索戦略が含まれる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:21:49 GMT)
PINN surrogate of Li-ion battery models for parameter inference. Part I: Implementation and multi-fidelity hierarchies for the single-particle model [0.0] この原稿は、パラメータ推論のためのLiイオン電池モデルのPINNサロゲートを導入した2部シリーズの最初のものである。
複数個のニューラルネットを複数の物理損失フィデリティでトレーニングし、サロゲート精度を大幅に向上させるマルチフィデリティ階層的トレーニングが示される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:22:36 GMT)
PINN surrogate of Li-ion battery models for parameter inference. Part II: Regularization and application of the pseudo-2D model [0.0] 擬似2D(P2D)バッテリモデルのキャリブレーションのサロゲートとして物理インフォームドニューラルネットワーク(PINN)を開発した。
パラメータ推論研究では、これらのPINNを使用してカソードLi拡散と陽極交換電流密度のスケーリングパラメータを校正する能力を強調している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:35:15 GMT)
Non-reciprocal dynamics and non-Hermitian skin effect of repulsively bound pairs [0.0] 本稿では,Bose-Hubbardモデルとエンジニアリング環境との結合について検討する。
単一粒子と二重粒子は反対の方向で拡散できることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:49:47 GMT)
Navigating the EU AI Act: A Methodological Approach to Compliance for Safety-critical Products [0.0] 本稿では,リスクの高いAIシステムに対するEU AI Act要件を解釈するための方法論を提案する。
まず,AIシステムに対する製品品質モデルの拡張を提案し,現行の品質モデルではカバーされない法に関する属性を取り入れた。
次に、ステークホルダーレベルで技術的要件を導出するための契約ベースのアプローチを提案します。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:59:17 GMT)
Multimodal CLIP Inference for Meta-Few-Shot Image Classification [0.0] CLIPのようなマルチモーダル基盤モデルは、ジョイント(イメージ、テキスト)埋め込みを学ぶ。
本研究では、CLIPのテキストと画像エンコーダのモダリティを組み合わせることで、広く採用されているベンチマークにおいて、最先端のメタファ学習者より優れていることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:47:54 GMT)
Multi-Objective Optimization for Sparse Deep Multi-Task Learning [0.0] 重み付きチェビシェフスキャラライゼーションを用いたディープニューラルネットワーク(DNN)のトレーニングのための多目的最適化アルゴリズムを提案する。
本研究の目的は,DNNモデルの持続可能性問題,特にDeep Multi-Taskモデルに焦点をあてることである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:12:19 GMT)
Maximum Discrepancy Generative Regularization and Non-Negative Matrix Factorization for Single Channel Source Separation [0.0] 本稿では,正規化関数の逆学習の概念を生成モデルの学習に適用する。
画像と音声の分離の数値実験において、再構成された信号が明らかに改善されることが示されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:16:01 GMT)
Lifecycle of a sub-metered tertiary multi-use (GreEn-ER) building's open energy data: from resource mobilisation to data re-usability [0.0] オープン・エナジー・データ・ライフサイクル(OPENDAL)という新しいオープン・エナジー・データ・ライフサイクル・モデルを紹介します。
それは、より人気のあるライフサイクルにおける重要なテーマの上に構築され、サイクル間の情報フローとデータを取り巻く利害関係者間の相互作用をよりよく説明することによってそれらを拡張しようとしている。
また,フランスの混在型教育施設であるGreEn-ERビルディングのデータセットにライフサイクルモデルを適用した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:52:41 GMT)
Learning the Optimal Power Flow: Environment Design Matters [0.0] 強化学習(RL)は、最適潮流(OPF)問題を解決するための有望な新しいアプローチである。
RL-OPFの文献は、OPF問題の正確な定式化に関して、RL環境として強く分かれている。
本研究では,トレーニングデータ,観察空間,エピソード定義,報酬関数選択に関する文献から,多様な環境設計決定を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:13:55 GMT)
Large Language Models for Human-Robot Interaction: Opportunities and Risks [0.0] 本稿では,社会ロボットに展開する大規模言語モデルの可能性についてメタスタディを示す。
我々は,これらの言語モデルが社会的規範や問題を理解するためにいかに安全に訓練されるかを研究する。
この研究は、言語モデルをロボットに組み込むことに興味を持つ他のロボット研究者に、豊富なガイドを提供することを期待している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:36:40 GMT)
Ion Trap with In-Vacuum High Numerical Aperture Imaging for a Dual-Species Modular Quantum Computer [0.0] 量子システム間のフォトニック相互接続は、スケーラブルな量子コンピューティングと量子ネットワークの両方において中心的な役割を果たす。
本稿では,量子ネットワークにおける光子収集効率が最も高いイオントラップシステムを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 21:46:44 GMT)
Integrating Mamba Sequence Model and Hierarchical Upsampling Network for Accurate Semantic Segmentation of Multiple Sclerosis Legion [0.0] 我々は,堅牢で効率的なセグメンテーションタスクに適した新しいアーキテクチャであるMamba HUNetを紹介する。
私たちはまず、HUNetを軽量バージョンに変換し、パフォーマンスの同等性を保ち、この軽量版HUNetをMamba HUNetに統合し、その効率をさらに向上した。
特に多発性硬化症病変のセグメンテーションでは,Mamba HUNetが様々なセグメンテーションタスクで有効であることが示されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 06:57:50 GMT)
Incorporating Exponential Smoothing into MLP: A Simple but Effective Sequence Model [0.0] 最近開発されたStructured State Space (S4) は、長距離シーケンスをモデル化する上で大きな効果を示した。
帰納バイアスの増大と低減を目的とした指数的平滑化(ETS)を提案する。
我々のモデルはLRAベンチマークでS4に匹敵する結果を得る。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 07:23:46 GMT)
Hyacinth6B: A large language model for Traditional Chinese [0.0] Hyacinth6B は LLM のコア機能を活用するために開発された。
トレーニング手法は、LoRA法を用いてパラメータ効率の良い微調整を行う。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:24:46 GMT)
HOOD: Real-Time Human Presence and Out-of-Distribution Detection Using FMCW Radar [0.0] 60GHz短距離FMCWレーダを用いたリアルタイム能動人体の存在・分布外検出法
Hoodは人間の存在を正確に検知することを目的としている。
60GHzの短距離FMCWレーダーで収集したデータセットでは、平均94.36%のAUROCを達成した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:17:24 GMT)
Grad-CAMO: Learning Interpretable Single-Cell Morphological Profiles from 3D Cell Painting Images [0.0] 教師付き特徴抽出器のための新しい単一セル解釈可能性スコアであるGrad-CAMOを紹介する。
Grad-CAMOは、関心の細胞と背景の細胞に集中しているモデルの注意率を測定する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 11:48:37 GMT)
Goal-Oriented Bayesian Optimal Experimental Design for Nonlinear Models using Markov Chain Monte Carlo [0.0] 本稿では,非線形観測および予測モデルに適した予測目標指向OED(GO-OED)の計算フレームワークを提案する。
GO-OEDはQoIで最大のEIGを提供する実験的な設計を求めている。
非線形GO-OED法の有効性を実証し,従来の非GO-OED法と比較した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:49:58 GMT)
Forest-ORE: Mining Optimal Rule Ensemble to interpret Random Forest models [0.0] 本研究では,局所的およびグローバル的解釈のための最適化されたルールアンサンブル(ORE)を用いて,ランダムフォレスト(RF)を解釈可能にする手法であるフォレスト-OREを提案する。
良く知られた手法の比較分析は、フォレスト-OREが予測性能、解釈可能性カバレッジ、モデルサイズの間の優れたトレードオフを提供することを示している。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:54:07 GMT)
Fingerprinting web servers through Transformer-encoded HTTP response headers [0.0] 最先端のディープラーニング、ビッグデータ、自然言語処理を活用して、脆弱なWebサーババージョンの検出を強化しています。
我々は、さまざまな曖昧で非標準のHTTPリクエストを477万のドメインに送信して実験を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:24:28 GMT)
FastCAR: Fast Classification And Regression Multi-Task Learning via Task Consolidation for Modelling a Continuous Property Variable of Object Classes [0.0] FastCARは、分類と回帰タスクのためのマルチタスク学習(MTL)における新しいタスク統合アプローチである。
オブジェクト分類と連続特性変数回帰(continuous property variable regression)に対処する。
FastCARは従来のMTLモデルファミリよりも優れており、アーキテクチャや損失重み付けの分野でパラメタ化されている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:57:20 GMT)
Equilibration of objective observables in a dynamical model of quantum measurements [0.0] 本稿では、古典世界の出現を説明するために導かれた量子ダーウィン主義の枠組みに基づく。
観測者が間違った測定結果を得る確率を定量化するために、測定誤差を確立する。
この誤差境界を用いて、オブザーバブルのオブザーバブルはハミルトニアンの集合の下で平均的に容易に平衡することを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:04:17 GMT)
Equality of magnetization and edge current for interacting lattice fermions at positive temperature [0.0] 格子フェルミオンの大規模なモデルに対して,バルク磁化は熱力学的限界におけるエッジ電流と等しいことを証明した。
このようなバルクエッジ対応は、本質的にはギブス状態のバルクおよび局所性における均質性の結果であることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:20:15 GMT)
Entanglement Entropy in Scalar Quantum Electrodynamics [0.0] 我々はスカラー量子電磁力学において真空状態の部分領域の絡み合いエントロピーを求める。
円錐ユークリッド空間におけるマクスウェル・プロカプロパゲータを導出する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:11:31 GMT)
EinExprs: Contraction Paths of Tensor Networks as Symbolic Expressions [0.0] We present EinExprs.jl, a Julia package for contraction path that provides state-of-the-art method。
シンボル表現に基づくネットワークの縮退経路の表現を提案する。
本稿では,ランダム量子回路のシミュレーションから得られた例を用いて,このライブラリをベンチマークする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:38:00 GMT)
Efficient Multi-Band Temporal Video Filter for Reducing Human-Robot Interaction [0.0] インフラカメラは、効率的な時間とルートを選択するために、アクティビティ分析をコンパイルするために、人間の活動を継続的にキャプチャすることができる。
本稿では,2次元の短期的・長期的活動を効率的に抽出するカスケード時間フィルタリング法について述べる。
テストベッド32カメラネットワークでは,このハイブリッド方式が毎秒8倍のスループット向上を実現し,システムの消費電力を6.5倍削減できることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:41:35 GMT)
Efficient Hamiltonian reconstruction from equilibrium states [0.0] 熱平衡における量子状態のハミルトニアンと温度を、制限された一連の測定値を用いて復元する新しいアルゴリズムについて述べる。
我々は,100kbitのスピンチェーン上で最近傍のハミルトニアンを学習する問題について,アルゴリズムのベンチマークを行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:26:13 GMT)
Dynamical signatures of non-Markovianity in a dissipative-driven qubit [0.0] ボゾン環境に結合した周期駆動量子ビットの力学における非マルコビアン性のシグネチャについて検討する。
非マルコフ的特徴は、量子散逸に対する多様で相補的なアプローチからの予測を等しく基礎に比較することによって定量化される。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:48:45 GMT)
Double well ground state energy splitting (or instanton flipping rate); rendering the implicit explicit [0.0] 量子トンネルの第一の例は、対称二重井戸ポテンシャルの準古典的な「エネルギー分割」である。
基底状態エネルギー分裂に対する(滑らかな)ポテンシャル関数の表現は、古典力学から得られる完全明快さには追われていない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 19:06:53 GMT)
Digital Twins: How Far from Ideas to Twins? [0.0] デジタル双生児には理論的・実用的な考え方が提案されている。
理論的には、デジタルツインとは、モダリティ間のデータマッピングの融合である。
実用の観点からは、デジタルツインはモノのインターネットとモデルに基づくシナリオ実装である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 02:24:23 GMT)
Digital Twin for Wind Energy: Latest updates from the NorthWind project [0.0] NorthWindは、風力エネルギーの最先端の研究とイノベーションを推進することを目指している。
デジタルツイン(Digital twins)は、物理資産やプロセスの仮想表現である。
ディジタル双生児はリアルタイムの予測、最適化、監視、制御、情報による意思決定を可能にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:47:52 GMT)
Deterministic Bethe state preparation [0.0] 本稿では、任意の$U(1)$-eigenstateを量子コンピュータに用意する明示的な量子回路を提案する。
このアルゴリズムは決定論的であり、補助量子ビットを必要とせず、QR分解を必要としない。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 18:52:41 GMT)
Detecting Sexual Content at the Sentence Level in First Millennium Latin Texts [0.0] 我々は,紀元前300年から900年までの約2500の文からなる,性意味論を含む新しいコーパスを紹介した。
我々は,様々な文分類手法と異なる入力埋め込み層を評価し,単純なトークンベースの検索を一貫して上回ることを示す。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 08:46:07 GMT)
Depending on yourself when you should: Mentoring LLM with RL agents to become the master in cybersecurity games [0.0] SecurityBotは、サイバーセキュリティオペレーションをサポートするために、事前訓練されたRLエージェントが指導する強化学習エージェントである。
動作ガイドラインを生成するプロファイルモジュール、ローカルエクスペリエンスを蓄積するメモリモジュール、選択を再評価するリフレクションモジュール、アクションスペースを削減するアクションモジュールがサポートされている。
CybORG の実験フレームワーク上に構築された経験から,SecurityBot は LLM や RL のスタンドアロンと比較して,大幅なパフォーマンス向上を実現しています。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 13:02:46 GMT)
Defining the semiclassical limit of the quantum Rabi Hamiltonian [0.0] ここでは、半古典的モデルを量子ハミルトニアンから直接導出するための形式主義が展開される。
これは量子-古典遷移を研究するためのフレームワークを提供し、量子技術に潜在的な応用をもたらす。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:19:52 GMT)
Decoding excellence: Mapping the demand for psychological traits of operations and supply chain professionals through text mining [0.0] 本研究では、オペレーティング・マネジメント(OM)とサプライ・チェーン・マネジメント(SCM)の専門家の心理的特徴をプロファイリングするための革新的な方法論を提案する。
テキストマイニングとソーシャル・ネットワーク・アナリティクスの革新的な手法とツールを用いて,ジョブ記述の集合から関連スキルの需要をマッピングする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 09:51:43 GMT)
Convergence of Iterative Quadratic Programming for Robust Fixed-Endpoint Transfer of Bilinear Systems [0.0] 両線形アンサンブル系の固定終端転送のための開ループ最小ノルム制御合成法を提案する。
2段階の計算を用いて、まず所望の端末状態への転送を保証し、次に制御関数のノルムを最小化する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:24:11 GMT)
Compressed sensing enhanced by quantum approximate optimization algorithm [0.0] 本稿では,量子サブルーチンを用いた大規模圧縮センシング問題に対処する枠組みを提案する。
本研究は, 量子コンピュータを圧縮センシング分野に適用する有望な方法を探るものである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 05:26:51 GMT)
Compressed Multi-task embeddings for Data-Efficient Downstream training and inference in Earth Observation [0.0] 本稿では,生データではなく,データコンシューマへの圧縮埋め込みの転送に基づくNeural Embedding Compression(NEC)を提案する。
我々は、学習したニューラルネットワークを用いて基礎モデル(FM)を適用し、マルチタスク埋め込みを生成する。
シーン分類とセマンティックセグメンテーションという2つのEOタスクにおけるNECの評価を行った。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 17:19:23 GMT)
Comment on "Recovering noise-free quantum observables" [0.0] 従来の補間手法は、そのような不特定分散雑音設定に適用可能であることを示す。
我々は、ZNEの文脈において、変更可能なグローバルノイズ源が意味するものを明確にする。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:47:36 GMT)
Band engineering and study of disorder using topology in compact high kinetic inductance cavity arrays [0.0] 超伝導マイクロ波メタマテリアルは、量子光学と情報科学に大きな可能性を秘めている。
回路量子電気力学の文脈では、そのようなメタマテリアルは結合キャビティアレイ(CCAs)として実装できる。
高温超伝導NbN薄膜を利用した小型CCAアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:19:51 GMT)
BAN-PL: a Novel Polish Dataset of Banned Harmful and Offensive Content from Wykop.pl web service [0.0] 本稿では,ポーランド語に対する攻撃的ソーシャルメディアコンテンツのオープンデータセットを提案する。
このデータセットは、しばしば"Polish Reddit"と呼ばれる人気のオンラインサービスであるWykop.plのコンテンツで構成されている。
691,662件の投稿とコメントが含まれており、「有害」と「中立」の2つのカテゴリに分けられている。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:31:35 GMT)
Automated Report Generation for Lung Cytological Images Using a CNN Vision Classifier and Multiple-Transformer Text Decoders: Preliminary Study [0.0] 感度と特異度はそれぞれ100%,96.4%であった。
生成されたテキストの文法とスタイルは、金本位とよりよく一致して正しいものと確認された。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 23:32:29 GMT)
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli [0.0] 合成メディアによる誤解に対する主な防御は、人間の観察者が実物と偽物とを視覚的に聴覚的に識別する能力に依存する。
被験者1276名を対象に, 合成画像, 音声のみ, ビデオのみ, 映像のみ, 音声視覚刺激を正当性から識別する能力について検討した。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:17:51 GMT)
Antiscarring in Chaotic Quantum Wells [0.0] 本研究では,古典周期軌道近傍で量子確率密度が増大する単一粒子波動関数のスカーリングについて検討する。
これらの量子障害は古典的カオスの量子的抑制を示し、古典的量子関係を従来の限界を超えて探索するユニークな方法を提供する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 20:06:00 GMT)
AniArtAvatar: Animatable 3D Art Avatar from a Single Image [0.0] 単一画像からアニマタブルな3D認識アートアバターを生成するための新しいアプローチを提案する。
我々は、ビュー条件付き2次元拡散モデルを用いて、中性表現で1枚の絵画像から多視点画像を合成する。
アバターアニメーションでは、制御点を抽出し、これらの点で動きを転送し、暗黙の正準空間を変形する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 12:08:04 GMT)
Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation, and Multimodal Intelligent Graph Reasoning [0.0] 我々は1000の科学論文からなるデータセットを、オントロジ知識グラフに変換した。
我々はノード度を計算し、コミュニティと接続性を同定し、クラスタリング係数とピボットノード間の重心性を評価した。
グラフは本質的に無スケールの性質を持ち、高連結であり、グラフ推論に使用できる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 14:46:04 GMT)
Accelerating Radio Spectrum Regulation Workflows with Large Language Models (LLMs) [0.0] 本稿では,Large Language Models (LLMs) を用いたスペクトル制御プロセスの高速化の例を示す。
この文脈でLLMが果たせる様々な役割について検討し、対処すべき課題をいくつか挙げる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:54:48 GMT)
A new double-pass type of the optical spring [0.0] 変形した光学キャビティでは、ミラーに作用する放射圧は、その変位に依存する。
キャビティを必要としない新しいタイプの光バネについて検討する。
本稿では,原子スピンアンサンブルとレーザー重力波検出器の2つの実装法を提案する。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 15:31:37 GMT)
A Survey on Deep Learning and State-of-the-arts Applications [0.0] ディープラーニングモデルの構築は、アルゴリズムの複雑さと現実世界の問題の動的な性質のため、難しい作業である。
本研究の目的は,コンピュータビジョン,自然言語処理,時系列解析,広範コンピューティングにおける最先端のディープラーニングモデルを網羅的にレビューすることである。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 10:10:53 GMT)
A Floquet analysis perspective of driven light-matter interaction models [0.0] 時間依存ハミルトニアンとフロケ理論の両方の数値積分を用いて調和駆動のJaynes-CummingsとLipkin-Meshkov-Glickモデルを解析する。
前者のモデルにおける駆動と内在的ラビ振動の時間スケールの分離のために、駆動は有効周期反転する。
駆動リプキン-メシュコフ-グリック模型のカオス的な性質にもかかわらず、適度なシステムサイズは様々なシステムパラメータの下で質的に異なる振る舞いを示すことができる。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 16:53:32 GMT)
A Few-Shot Learning Focused Survey on Recent Named Entity Recognition and Relation Classification Methods [0.0] 本稿では、エンティティ認識と関係分類に対処する最近のディープラーニングモデルについて調査する。
本調査は,テキストマイニングの最近の技術を知る研究者や,生テキストから構造化情報を取り出す研究者に有用である。
論文参考訳(メタデータ) (Tue, 26 Mar 2024 22:59:36 GMT)