Fugu-MT: arxivの論文翻訳(概要)

MUSE: Machine Unlearning Six-Way Evaluation for Language Models [109.8]
言語モデル(LM)は、プライベートおよび著作権のあるコンテンツを含む大量のテキストデータに基づいて訓練される。総合的な機械学習評価ベンチマークであるMUSEを提案する。人気のある8つのアンラーニングアルゴリズムがハリー・ポッターの本やニュース記事をいかに効果的に解き放つかをベンチマークする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:14:02 GMT)
Lightning Fast Video Anomaly Detection via Adversarial Knowledge Distillation [106.4]
本稿では,ビデオ中の異常検出のための非常に高速なフレームレベルモデルを提案する。複数の高精度なオブジェクトレベルの教師モデルから知識を抽出することで、異常を検出することを学ぶ。提案モデルでは,これまで聞こえなかった1480 FPSの速度のため,速度と精度の最良のトレードオフを実現している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:34:21 GMT)
Optimal Kernel Choice for Score Function-based Causal Discovery [92.7]
本稿では,データに最も適合する最適なカーネルを自動的に選択する,一般化スコア関数内のカーネル選択手法を提案する。合成データと実世界のベンチマークの両方で実験を行い,提案手法がカーネル選択法より優れていることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:32:20 GMT)
Parameter-Efficient and Memory-Efficient Tuning for Vision Transformer: A Disentangled Approach [87.8]
本稿では,学習可能なパラメータをわずかに限定して,事前学習した視覚変換器を下流認識タスクに適用する方法を示す。学習可能で軽量なモジュールを用いてタスク固有のクエリを合成する。本手法はメモリ制約下での最先端性能を実現し,実環境における適用性を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:50:32 GMT)
Adapting Large Language Models via Reading Comprehension [86.2]
ドメイン固有コーパスの事前学習が大規模言語モデルに与える影響について検討する。生のコーパスでのトレーニングはドメイン知識でモデルを養うが、問合せ能力を大幅に損なう。生コーパスを可読テキストに変換する簡単な方法を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:17:44 GMT)
Nonverbal Interaction Detection [83.4]
この研究は、社会的文脈における人間の非言語的相互作用を理解するという新たな課題に対処する。我々はNVIと呼ばれる新しい大規模データセットを寄贈し、人間とそれに対応する社会グループのための境界ボックスを含むように細心の注意を払ってアノテートする。第2に,非言語的インタラクション検出のための新たなタスクNVI-DETを構築し,画像から三つ子を識別する。第3に,非言語相互作用検出ハイパーグラフ (NVI-DEHR) を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:33:57 GMT)
A Survey on Self-supervised Learning: Algorithms, Applications, and Future Trends [82.6]
自己教師付き学習(SSL)は、ラベル付きラベルを頼らずにラベル付きデータから識別的特徴を学習することを目的としている。 SSLは最近大きな注目を集め、多くの関連するアルゴリズムの開発に繋がった。本稿では,アルゴリズム的側面,アプリケーション領域,3つの重要なトレンド,オープンな研究課題を含む,多様なSSL手法のレビューを行う。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:30:45 GMT)
Selective Learning: Towards Robust Calibration with Dynamic Regularization [79.9]
ディープラーニングにおけるミススキャリブレーションとは、予測された信頼とパフォーマンスの間には相違がある、という意味である。トレーニング中に何を学ぶべきかを学ぶことを目的とした動的正規化(DReg)を導入し、信頼度調整のトレードオフを回避する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:12:25 GMT)
Controllable Human-Object Interaction Synthesis [77.6]
本研究では,3次元シーンにおける同期物体の動きと人間の動きを生成するための制御可能な人間-物体相互作用合成(CHOIS)を提案する。ここでは,高レベルな計画から効果的に抽出できるスタイルや意図を言語記述が通知し,シーン内の動きをグラウンド化する。我々のモジュールは経路計画モジュールとシームレスに統合され、3D環境における長期的相互作用の生成を可能にします。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 23:00:54 GMT)
Visual Prompt Selection for In-Context Learning Segmentation [77.2]
本稿では,サンプル選択戦略の再考と改善に焦点をあてる。まず、ICLに基づくセグメンテーションモデルが異なる文脈に敏感であることを示す。さらに、経験的証拠は、文脈的プロンプトの多様性がセグメンテーションを導く上で重要な役割を担っていることを示している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:02:54 GMT)
Restoring Images in Adverse Weather Conditions via Histogram Transformer [75.7]
悪天候による画像の復元に有効なヒストグラム変換器(Histoformer)を提案する。これはヒストグラム自己アテンション( histogram self-attention)と呼ばれるメカニズムで、空間的特徴を強度ベースのビンに分類し、セグメント化する。ヒストグラムの自己アテンションを高めるために,従来のコンボリューションが類似画素上で動作できるようにするダイナミックレンジ・コンボリューションを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:59:22 GMT)
SingingHead: A Large-scale 4D Dataset for Singing Head Animation [75.6]
我々は,27時間以上の同期歌唱ビデオ,3D顔の動き,歌声音声,バックグラウンド音楽からなる大規模歌唱ヘッドデータセットであるSingingHeadを収集した。 SingingHeadデータセットとともに、既存の音声駆動型3D顔アニメーション法と2Dトーキングヘッド法を歌唱タスク上でベンチマークする。 We propose a unified singing head animation framework called UniSinger to achieve both singing audio-driven 3D singing head animation and 2D singing portrait video synthesis。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:16:43 GMT)
Hierarchical Multi-modal Transformer for Cross-modal Long Document Classification [74.5]
階層構造テキストと埋め込み画像で長い文書を分類する方法は、新しい問題である。本稿では,階層型マルチモーダル変換器 (HMT) を用いたクロスモーダルな文書分類手法を提案する。本稿では,マルチモーダル変換器と動的マルチスケールマルチモーダル変換器を用いて,画像特徴とセクションと文特徴の複雑な関係をモデル化する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:12:25 GMT)
Ada-NAV: Adaptive Trajectory Length-Based Sample Efficient Policy Learning for Robotic Navigation [72.2]
軌道長は強化学習アルゴリズムの学習過程において重要な役割を果たす。本稿では,RLアルゴリズムのトレーニングサンプル効率を向上させるための適応軌道長スキームであるAda-NAVを紹介する。我々は,Ada-NAVが従来の手法より優れている実世界のロボット実験を実演する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:35:43 GMT)
ZoomNeXt: A Unified Collaborative Pyramid Network for Camouflaged Object Detection [70.1]
最近のオブジェクト(COD)は、現実のシナリオでは極めて複雑で難しい、視覚的にブレンドされたオブジェクトを周囲に分割しようと試みている。本研究では,不明瞭な画像を観察したり,ズームインしたりアウトしたりする際の人間の行動を模倣する,効果的な統合協調ピラミッドネットワークを提案する。我々のフレームワークは、画像とビデオのCODベンチマークにおいて、既存の最先端の手法を一貫して上回っている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:02:22 GMT)
Survey of Hallucination in Natural Language Generation [70.0]
近年,シーケンス間深層学習技術の発展により,自然言語生成(NLG)は指数関数的に向上している。深層学習に基づく生成は意図しないテキストを幻覚させる傾向があるため、システム性能は低下する。この調査は、NLGにおける幻覚テキストの課題に取り組む研究者の協力活動を促進するのに役立つ。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:40:59 GMT)
Retrieval-Augmented Generation and Knowledge-Grounded Reasoning for Faithful Patient Discharge Instructions [68.8]
言語モデル(LM)は、臨床医が様々な臨床ノートを作成するのを助ける可能性がある。本稿では,Re$3$Writer法を提案する。本手法が患者の退院指示生成に有効であることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:02:20 GMT)
A3S: A General Active Clustering Method with Pairwise Constraints [66.7]
A3Sは、適応クラスタリングアルゴリズムによって得られる初期クラスタ結果に対して、戦略的にアクティブクラスタリングを調整する。さまざまな実世界のデータセットにわたる広範な実験において、A3Sは、人間のクエリを著しく少なくして、望ましい結果を達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:37:03 GMT)
Multi-Granularity Semantic Revision for Large Language Model Distillation [66.0]
LLM蒸留における多粒性セマンティックリビジョン法を提案する。シーケンスレベルでは、シーケンス修正と再生戦略を提案する。トークンレベルでは、蒸留目的関数として、Kulback-Leibler損失を補正する分布適応クリッピングを設計する。スパンレベルでは、シーケンスのスパン前処理を利用して、スパン内の確率相関を計算し、教師と学生の確率相関を一貫性に制約する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:51:49 GMT)
What Makes and Breaks Safety Fine-tuning? Mechanistic Study [65.0]
安全性の微調整は、大規模な言語モデル(LLM)を、安全なデプロイメントのための人間の好みに合わせるのに役立つ。安全微調整法として, 教師付き安全微調整, 直接選好最適化, 未学習の3つの方法を検討した。逆入力(例えばjailbreak)が提供されると、そのアクティベーションはより安全なサンプルに近づき、それが安全であるかのようにモデル処理される。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:12:57 GMT)
All Roads Lead to Rome: Unveiling the Trajectory of Recommender Systems Across the LLM Era [63.6]
我々は、リコメンデータシステムをより広い視野に統合し、将来の研究のためのより包括的なソリューションの道を開くことを目指しています。我々は、リストワイズレコメンデーションと会話レコメンデーションを通じて、現代のレコメンデーションシステムの2つの進化経路を特定する。本稿では,ユーザの獲得コストを削減しつつ,推薦情報の有効性を高めることを指摘する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:02:21 GMT)
Attractor Memory for Long-Term Time Series Forecasting: A Chaos Perspective [63.6]
textbftextitAttraosはカオス理論を長期時系列予測に取り入れている。本研究では,AttraosがPatchTSTと比較して,パラメータの12分の1しか持たない主流データセットやカオスデータセットにおいて,LTSF法よりも優れていることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:46:50 GMT)
Can Adversarial Examples Be Parsed to Reveal Victim Model Information? [62.8]
本研究では,データ固有の敵インスタンスから,データに依存しない被害者モデル(VM)情報を推測できるかどうかを問う。我々は,135件の被害者モデルから生成された7種類の攻撃に対して,敵攻撃のデータセットを収集する。単純な教師付きモデル解析ネットワーク(MPN)は、見えない敵攻撃からVM属性を推測できることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:13:02 GMT)
3D Small Object Detection with Dynamic Spatial Pruning [62.7]
本稿では,3次元小物体検出のための効率的な特徴解析手法を提案する。空間分解能の高いDSPDet3Dというマルチレベル3次元検出器を提案する。ほぼ全ての物体を検知しながら、4500k以上のポイントからなる建物全体を直接処理するには2秒もかからない。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:36:42 GMT)
Shape2Scene: 3D Scene Representation Learning Through Pre-training on Shape Data [61.4]
Shape2Scene(S2S)は3次元形状データから大規模3次元シーンの表現を学習する新しい手法である。 MH-P/Vは、複数のスケールにわたる深い意味情報をキャプチャする高解像度機能への直接パスを確立する。 S2SSアマルガメートは様々な形状を指して、トレーニングデータのためのランダムな擬似シーン(複数のオブジェクトを含む)を作成する。実験では,MH-P/Vで学習した3次元表現の形状レベルおよびシーンレベルの3次元タスク間での伝達性を示した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:42:05 GMT)
Heterogeneous window transformer for image denoising [60.0]
画像復調のためのヘテロジニアスウィンドウトランス (HWformer) を提案する。提案されているHWformerは、一般的なRestormerの30%しか利用できない。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:40:49 GMT)
MPM: A Unified 2D-3D Human Pose Representation via Masked Pose Modeling [59.7]
mpmcanは、3D人間のポーズ推定、クラッドされた2Dポーズからの3Dポーズ推定、3Dポーズ完了をtextocbsingleフレームワークで処理する。 MPI-INF-3DHPにおいて、広く使われているポーズデータセットの広範な実験とアブレーション研究を行い、最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:13:33 GMT)
Roleplay-doh: Enabling Domain-Experts to Create LLM-simulated Patients via Eliciting and Adhering to Principles [58.8]
ドメインエキスパートから定性的なフィードバックを引き出す新しい人間-LLMコラボレーションパイプラインであるRoleplay-dohを開発した。このパイプラインを適用して、シニアメンタルヘルスサポーターが、シミュレートされた実践パートナのためにカスタマイズされたAI患者を作成できるようにします。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:35:34 GMT)
VALOR-EVAL: Holistic Coverage and Faithfulness Evaluation of Large Vision-Language Models [57.4]
LVLM(Large Vision-Language Models)は幻覚に悩まされ、このモデルでは可聴音を発生させるが、実際には誤出力を発生させる。既存のベンチマークはスコープに限られており、主にオブジェクト幻覚に焦点を当てている。対象,属性,関係を多次元のベンチマークで表現し,連想バイアスに基づいて画像を選択する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 23:11:05 GMT)
WildAvatar: Web-scale In-the-wild Video Dataset for 3D Avatar Creation [55.9]
WildAvatar(ワイルドアバター)は、YouTubeから抽出されたウェブスケールの人間のアバター生成データセットである。我々は,アバター作成における現実のアプリケーションにおける未探索課題を,データセット上でいくつかの最先端アバター作成手法を評価した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:15:12 GMT)
Lean-STaR: Learning to Interleave Thinking and Proving [53.9]
証明の各ステップに先立って,非公式な思考を生成するために,言語モデルをトレーニングするフレームワークであるLean-STaRを紹介します。 Lean-STaRは、Lean定理証明環境内のminiF2F-testベンチマークで最先端の結果を達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 01:43:07 GMT)
Cross-Lingual Multi-Hop Knowledge Editing -- Benchmarks, Analysis and a Simple Contrastive Learning based Approach [53.0]
言語横断的な設定で様々なSoTA知識編集技術の性能を計測・解析するための多言語多言語知識編集パラダイムを提案する。具体的には、知識編集能力を測定するために並列言語間ベンチマーク CROLIN-MQUAKE を作成します。次に,言語間マルチホップ知識編集システムであるCLEVER-CKEを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:18:16 GMT)
A Closer Look at the Limitations of Instruction Tuning [52.6]
インストラクションチューニング(IT)は,大規模言語モデル(LLM)における知識やスキルの向上に失敗することを示す。また、一般的なIT改善手法は、シンプルなLoRA微調整モデルよりも性能改善につながるものではないことも示している。この結果から,事前学習した知識のみから生成した応答は,オープンソースデータセット上でITから新たな知識を学習するモデルによって,一貫した応答性能が向上することが判明した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:14:57 GMT)
CLIP-Guided Networks for Transferable Targeted Attacks [52.3]
トランスファー可能な敵攻撃は、ブラックボックスのシナリオで敵が特定した予測を出力するモデルを誤解させることを目的としている。 textitsingle-target 生成攻撃は、高い転送可能な摂動を生成するために、各ターゲットクラスのジェネレータを訓練する。 textbfCLIP-guided textbfGenerative textbfNetwork with textbfCross-attention module (CGNC) to enhance multi-target attack。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:30:32 GMT)
From PEFT to DEFT: Parameter Efficient Finetuning for Reducing Activation Density in Transformers [52.2]
本稿では,事前学習したモデルにおいて,高い活性化空間性を促進する新しい密度損失を提案する。提案手法である textbfDEFT は,RoBERTa$_mathrmLarge$ で textbf44.94% ,Flan-T5$_mathrmXXL$ で textbf53.19% (エンコーダ密度) と textbf90.60% (デコーダ密度) で常に活性化密度を減少させることができる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:32:36 GMT)
DiffBP: Generative Diffusion of 3D Molecules for Target Protein Binding [52.0]
従来の研究は通常、原子の要素タイプと3次元座標を1つずつ生成する自己回帰的な方法で原子を生成する。現実世界の分子系では、分子全体の原子間の相互作用が大域的であり、原子間のエネルギー関数が結合する。本研究では、標的タンパク質に基づく分子3次元構造の生成拡散モデルを構築し、非自己回帰的に全原子レベルで構築する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 06:41:36 GMT)
Affordance-Guided Reinforcement Learning via Visual Prompting [51.4]
本稿では、視覚言語モデル(VLM)によって形成される報酬について研究し、ロボット学習における報酬の密度を定義する。自然言語記述によって指定された実世界の操作タスクにおいて、これらの報酬は自律的RLのサンプル効率を向上させる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:41:29 GMT)
Revisiting Adaptive Cellular Recognition Under Domain Shifts: A Contextual Correspondence View [49.0]
生物学的文脈における暗黙の対応の重要性を明らかにする。モデル構成成分間のインスタンス認識トレードオフを確保するために, 自己適応型動的蒸留を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:41:16 GMT)
Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.8]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。 HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:36:45 GMT)
Logical Distillation of Graph Neural Networks [47.9]
グラフを学習するための論理に基づく解釈可能なモデルと,このモデルをグラフニューラルネットワーク(GNN)から抽出するアルゴリズムを提案する。最近の結果は、GNNの表現性と数量化器を用いた一階述語論理の2変数フラグメント(C2)の関連性を示している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:19:30 GMT)
Noise Calibration: Plug-and-play Content-Preserving Video Enhancement using Pre-trained Video Diffusion Models [47.5]
コンテンツの視覚的品質と一貫性の両方を考慮した新しい定式化を提案する。コンテントの整合性は,事前学習した拡散モデルのデノナイジングプロセスを利用して視覚的品質を向上させるとともに,入力の構造を維持可能な損失関数によって保証される。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:59:56 GMT)
SpikeGS: 3D Gaussian Splatting from Spike Streams with High-Speed Camera Motion [46.2]
新しいビュー合成は、3Dシーンのマルチビュー画像から新しい2Dレンダリングを生成することで重要な役割を果たす。高フレームレートの高密度3D再構成は、現実世界の物体やシーンの詳細なモデリングを可能にする重要な技術として現れる。スパイクカメラは、新しいタイプのニューロモルフィックセンサーであり、超高時間分解能でシーンを継続的に記録する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:19:30 GMT)
ToxVidLM: A Multimodal Framework for Toxicity Detection in Code-Mixed Videos [46.1]
ToxVidLMには、マルチモーダルモジュール、クロスモーダルシンクロナイゼーションモジュール、マルチタスクモジュールという3つの重要なモジュールが含まれている。本稿では,YouTubeから収集した931の動画と4021のコード混成ヒンディー語発話からなるベンチマークデータセットを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:09:42 GMT)
Warming Up Cold-Start CTR Prediction by Learning Item-Specific Feature Interactions [45.4]
EmerGは、アイテム固有の特徴相互作用パターンを学習することで、コールドスタートCTR予測を温める新しいアプローチである。 EmerGは、新しいアイテムの最も優れたNo、数、そして十分なインスタンスを一貫して実行します。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:58:13 GMT)
Density Estimation via Binless Multidimensional Integration [45.2]
非パラメトリック、ロバスト、およびデータ効率の高い密度推定のためのBinless Multidimensional Thermodynamic Integration (BMTI)法を提案する。 BMTIは、近隣のデータポイント間の対数密度差を計算し、その密度の対数を推定する。この方法は様々な複雑な合成高次元データセットでテストされ、化学物理学の文献から現実的なデータセットでベンチマークされる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:38:16 GMT)
DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models [44.4]
本研究では拡散モデルを用いて高解像度画像を生成する問題に対処するDistriFusionを提案する。提案手法では,モデル入力を複数のパッチに分割し,各パッチをGPUに割り当てる。提案手法は,最近の安定拡散XLに品質劣化のない適用が可能であり,NVIDIA A100の8台に対して最大6.1$timesの高速化を実現している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:30:14 GMT)
Spurious Feature Diversification Improves Out-of-distribution Generalization [43.8]
アウト・オブ・ディストリビューション(OOD)データへの一般化は、機械学習において重要な課題である。トレーニング済みモデルと微調整済みモデルの間を補間する一般的な重量空間アンサンブル法であるWiSE-FTについて検討する。 We observed an unexpected FalseFalseTrue, where WiSE-FT successfully corrects many case that each each model makes wrong corrects。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:02:49 GMT)
DPStyler: Dynamic PromptStyler for Source-Free Domain Generalization [43.7]
Source-Free Domain Generalization (SFDG) は、ソースドメインに頼ることなく、未確認のターゲットドメインに対して機能するモデルを開発することを目的としている。 SFDGにおける研究は、主に大規模視覚言語モデルの既存の知識に大きく依存している。本稿では,動的PromptStyler(DPStyler)について紹介する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:27:42 GMT)
WPS-SAM: Towards Weakly-Supervised Part Segmentation with Foundation Models [43.3]
Weakly-supervised Part (WPS) と WPS-SAM という手法を提案する。 WPS-SAMは画像から直接プロンプトトークンを抽出し、部分領域のピクセルレベルのセグメンテーションを実行するために設計されたエンドツーエンドフレームワークである。実験により、事前訓練された基礎モデルに埋め込まれた豊富な知識を利用することで、WPS-SAMはピクセルレベルの強いアノテーションで訓練された他のセグメンテーションモデルより優れていることが示された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:31:21 GMT)
Reinforcement Learning in a Safety-Embedded MDP with Trajectory Optimization [42.3]
この研究は、このトレードオフを効果的に管理するために、RLと軌道最適化を組み合わせた新しいアプローチを導入する。我々のアプローチは、修正マルコフ決定プロセス(MDP)の動作空間に安全制約を埋め込む。この新しいアプローチは、セーフティ・ジムの課題に挑戦するパフォーマンスに優れており、推論中にはるかに高い報酬とほぼゼロに近い安全違反を達成している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:56:37 GMT)
MoAI: Mixture of All Intelligence for Large Language and Vision Models [42.2]
Mixture of All Intelligence (MoAI)は、命令調整型大規模言語および視覚モデル(LLVM)である。 MoAIは外部セグメンテーション、検出、SGG、OCRモデルの出力から得られる補助的な視覚情報を使用する。 MoAIは、多数のゼロショットビジョン言語(VL)タスクにおいて、オープンソースとクローズドソースのLLVMの両方を著しく上回っている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:13:53 GMT)
When Pedestrian Detection Meets Multi-Modal Learning: Generalist Model and Benchmark Dataset [40.2]
本稿では,マルチモーダル知覚のための新しい一般化モデルであるMMPedestronを紹介する。提案手法は,モーダル表現と融合のための統一エンコーダと,歩行者検出のための汎用ヘッドを備える。マルチモーダルジョイントトレーニングでは、幅広い歩行者検出ベンチマークにおいて最先端の性能を実現する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:16:49 GMT)
Evolving from Single-modal to Multi-modal Facial Deepfake Detection: A Survey [40.1]
AI生成メディアがより現実的になるにつれて、誤情報を拡散したり、身元確認詐欺を犯したりする危険性が高まっている。この研究は、従来の単一モダリティ手法から、音声・視覚・テキスト・視覚シナリオを扱う高度なマルチモーダルアプローチへの進化を辿る。私たちの知る限りでは、この種の調査はこれが初めてである。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:27:56 GMT)
GaussCtrl: Multi-View Consistent Text-Driven 3D Gaussian Splatting Editing [38.9]
GaussCtrlは、3D Gaussian Splatting(3DGS)によって再構成された3Dシーンを編集するテキスト駆動方式である。私たちの重要な貢献は、複数ビューの一貫性のある編集であり、1つの画像を反復的に編集する代わりに、すべての画像を一緒に編集できる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:31:58 GMT)
Hybrid quantum physics-informed neural networks for simulating computational fluid dynamics in complex shapes [37.7]
本稿では3次元Y字ミキサー内の層流をシミュレートするハイブリッド量子物理学インフォームドニューラルネットワークを提案する。我々のアプローチは、量子モデルの表現力と物理インフォームドニューラルネットワークの柔軟性を組み合わせることで、純粋に古典的なニューラルネットワークに比べて21%高い精度を実現している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:24:07 GMT)
You Only Learn One Query: Learning Unified Human Query for Single-Stage Multi-Person Multi-Task Human-Centric Perception [37.7]
人間中心の知覚は、コンピュータビジョンの長年の問題である。本稿では,一段階多人数マルチタスク人間中心認識(HCP)のための統合多目的フレームワーク(HQNet)を提案する。 Human Queryは、個人のための複雑なインスタンスレベルの機能をキャプチャし、複雑なマルチパーソンシナリオを分離する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:33:09 GMT)
Parameter Estimation for Generalized Low-Rank Matrix Sensing by Learning on Riemannian Manifolds [37.5]
我々は、一般化された低ランク行列センシングのための収束保証を証明した。最適推定器の局所収束に着目し、最適化の問題を無視する。我々の解析は、パラメータ空間の回転対称性を扱うためにリーマン幾何学のツールに依存している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:11:13 GMT)
MKDTI: Predicting drug-target interactions via multiple kernel fusion on graph attention network [37.4]
グラフアテンションネットワークの様々な層埋め込みからカーネル情報を抽出することにより、MKDTIと呼ばれるモデルを定式化する。我々は、Dual Laplacian Regularized Least Squaresフレームワークを使用して、新規なドラッグターゲットエンティティ接続を予測する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:53:25 GMT)
LeanQuant: Accurate Large Language Model Quantization with Loss-Error-Aware Grid [36.3]
大規模言語モデル (LLM) は様々な分野にまたがって多くの応用がある。重み量子化は、LLMの復号遅延とメモリ要求を低減する効果的な手法である。本稿では,逆対角Hessianを利用して損失エラー対応量子化グリッドを学習するLeanQuantを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 00:23:51 GMT)
Text-Anchored Score Composition: Tackling Condition Misalignment in Text-to-Image Diffusion Models [35.0]
既存のモデルの制御性を改善するために,テキストアンコールスコア合成(TASC)と呼ばれる学習自由アプローチを提案する。そこで本研究では,これらを個別に計算した結果に対して,新たな競合を回避するためのクロスアテンション機構を用いてアテンション操作を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:51:28 GMT)
Multiscale Sliced Wasserstein Distances as Perceptual Color Difference Measures [34.9]
マルチスケールスライスされたワッサースタイン距離に基づく知覚CD測度について述べる。実験結果から,写真画像のCD評価においてCD測定が好適であることが示唆された。数学的な意味では測度として機能し、画像やビデオのカラー転送タスクの損失関数としてその可能性を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:48:16 GMT)
Event Trojan: Asynchronous Event-based Backdoor Attacks [33.5]
本稿では,イミュータブルトリガと可変トリガの2種類のトリガを含むEvent Trojanフレームワークを提案する。私たちの2種類のイベントトリガは、シミュレーションされたイベントスパイクのシーケンスに基づいています。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:40:13 GMT)
FSD-BEV: Foreground Self-Distillation for Multi-view 3D Object Detection [33.2]
本稿では,分散の相違を効果的に回避するFSD方式を提案する。また2つのポイントクラウド拡張(PCI)戦略を設計し、ポイントクラウドの幅を補う。マルチスケール・フォアグラウンド・エンハンスメント(MSFE)モジュールを開発し,マルチスケール・フォアグラウンドの特徴を抽出・融合する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:39:44 GMT)
Pattern Guided UV Recovery for Realistic Video Garment Texturing [32.8]
本稿では,UVのパターンに基づくアプローチと,キャプチャした実映像からシェーディングリカバリを行い,衣服のテクスチャを自動的に置き換える手法を提案する。本稿では,UVマッピングのジャコビアンに新たな損失を生じさせ,折りたたみ領域と閉塞領域の境界付近の快適なシームを創出する。本実験では, 衣類の折り畳みや重ね合わせを著しく保存できるため, テクスチャの質素な代替効果を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:47:37 GMT)
A Watermark-Conditioned Diffusion Model for IP Protection [32.0]
拡散モデルにおけるコンテンツ著作権保護のための統一的な透かしフレームワークを提案する。そこで我々はWaDiffと呼ばれるWadmark条件付き拡散モデルを提案する。本手法は,検出タスクと所有者識別タスクの両方において有効かつ堅牢である。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 06:53:20 GMT)
InfiniMotion: Mamba Boosts Memory in Transformer for Arbitrary Long Motion Generation [31.8]
現在の手法では、計算コストが高いため、単一の入力として長い動き列を扱うのに苦労している。自己回帰フレームワーク内で任意の長さの連続的な動き列を生成する手法であるInfiniMotionを提案する。約8万フレームの連続した1時間の人間の動きを生成することで、その画期的な能力を強調します。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:12:19 GMT)
Part2Object: Hierarchical Unsupervised 3D Instance Segmentation [31.4]
教師なしの3Dインスタンスセグメンテーションは、アノテーションなしで3Dポイントクラウドからオブジェクトをセグメントすることを目的としている。 Part2Objectは、ポイントからオブジェクトの部分やオブジェクトへの多層クラスタリングを採用しており、任意のレイヤでオブジェクトが表現できる。階層型3Dオブジェクト部分とインスタンスセグメンテーションをサポートするHi-Mask3Dを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:18:15 GMT)
RS-NeRF: Neural Radiance Fields from Rolling Shutter Images [30.7]
本稿では,RS歪みを用いた入力を用いて,新しいビューから通常の画像を合成する手法であるRS-NeRFを提案する。これは、RS条件下で画像形成過程を再現する物理モデルを含む。さらに,基本RS-NeRFモデルの本質的な欠点を,RS特性を掘り下げ,その機能を強化するアルゴリズムを開発することで解決する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:27:11 GMT)
The Lottery Ticket Hypothesis in Denoising: Towards Semantic-Driven Initialization [30.6]
ランダムなガウス雑音像を復調する際の抽選券仮説を定式化する。我々は、既知の当選チケットから初期ノイズを生成する意味駆動型初期画像構築を実装した。この結果から,入賞チケットを初期雑音画像に集約することで,モデルが対応する位置で特定対象を生成できることが示唆された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:06:47 GMT)
WordRobe: Text-Guided Generation of Textured 3D Garments [30.6]
WordRobeは、ユーザフレンドリーなテキストプロンプトから非ポーズでテクスチャ化された3Dメッシュを生成するための新しいフレームワークである。本研究では,3次元衣服空間の学習,衣服合成,テクスチャ合成において,現在のSOTAよりも優れた性能を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:05:06 GMT)
TwinS: Revisiting Non-Stationarity in Multivariate Time Series Forecasting [29.2]
非定常周期分布に対処するTransformer-based TwinSモデルを提案する。ウェーブレット畳み込みモデルは、ウェーブレットのような畳み込みカーネルサイズをスケールすることで、ネストした期間をモデルとした。周期認識注意は、畳み込みサブネットワークを通して周期関連スコアを生成することによって注意を誘導する。 Channel-Temporal Mixedは、チャネル時混合学習を通じて時系列間の全体的な関係をキャプチャする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:55:16 GMT)
Depicting Beyond Scores: Advancing Image Quality Assessment through Multi-modal Language Models [28.2]
本稿では,従来のスコアベース手法の制約を克服するDepicted Image Quality Assessment法(DepictQA)を提案する。 DepictQAは、マルチモーダルな大規模言語モデルを利用することで、詳細な言語ベースの人間のような画像品質の評価を可能にする。これらの結果はマルチモーダルIQA法の研究の可能性を示している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:33:05 GMT)
MTMamba: Enhancing Multi-Task Dense Scene Understanding by Mamba-Based Decoders [27.5]
マルチタスクシーン理解のための新しいマンバベースアーキテクチャであるMTMambaを提案する。 NYUDv2とPASCAL-Contextデータセットの実験では、TransformerベースのメソッドとCNNベースのメソッドよりも、MTMambaの方が優れたパフォーマンスを示している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:50:04 GMT)
Improving Neural Biasing for Contextual Speech Recognition by Early Context Injection and Text Perturbation [27.1]
文脈認識型ASRモデルを改善するための2つの手法を提案する。 LibriSpeechでは, バイアスや浅い融合に比べて, 単語誤り率を60%, 25%削減する。 SPGISpeechと実世界のデータセットConECでは、ベースラインよりも優れた改善が得られます。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:32:33 GMT)
Pre-training with Fractional Denoising to Enhance Molecular Property Prediction [26.9]
本稿では,Frad(Farential Denoising)と呼ばれる分子前訓練フレームワークを導入し,ノイズ設計と強制学習等価性による制約を分離する。実験により、我々のフレームワークは既存の手法を一貫して上回り、力の予測、量子化学特性、結合親和性タスクにまたがって最先端の結果を確立する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:09:42 GMT)
Scalable Spin Squeezing from Finite Temperature Easy-plane Magnetism [26.6]
有限温度で簡単な平面強磁性を示すハミルトニアンは、スケーラブルなスピンスクイーズを生成することができると推測する。我々の結果は、気象学的に有用な量子状態を生成するのに使用できるハミルトンの風景についての洞察を提供する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 23:56:17 GMT)
Improving Graph Out-of-distribution Generalization on Real-world Data [25.3]
本稿では,環境-ラベル依存性と可変理性不変性の定理について述べる。分析研究に基づき, 実世界データ上でのOODグラフの確率依存性と合理性」という, 変分推論に基づく新しい手法を紹介した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:48:25 GMT)
ViSAGe: A Global-Scale Analysis of Visual Stereotypes in Text-to-Image Generation [24.9]
我々は、T2Iモデルにおける国籍に基づくステレオタイプの評価を可能にするために、ViSAGeデータセットを導入する。また, 他の属性と比較して, ViSAGe のステレオタイプ属性は, 対応するアイデンティティの生成画像中に存在する可能性が示唆された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:17:05 GMT)
Learning to Steer Markovian Agents under Model Uncertainty [23.6]
ステアリング問題に対して,モデルに基づく非エポゾディック強化学習(RL)の定式化を導入する。我々は,エージェントの学習力学に関する本質的なモデルの不確実性を扱うために,歴史に依存した運営戦略を学習することに集中する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:01:38 GMT)
Practical Unlearning for Large Language Models [23.5]
機械学習(MU)は、これらの問題に対処するための有望なソリューションとして登場した。 MUは通常、実用性を維持するために元のトレーニングデータへの完全なアクセスを前提とします。既存のLLMアンラーニング手法は、望ましくないデータアンラーニングに最も影響を受けるデータへのアクセスを前提としていることが多い。我々は,これらの課題を克服し,実践的なLLMアンラーニングを実現するためのO3フレームワークを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:26:17 GMT)
CrossScore: Towards Multi-View Image Evaluation and Scoring [23.4]
相互参照画像品質評価法は画像評価景観のギャップを埋める。本手法は,地上の真理参照を必要とせず,精度の高い画像品質評価を可能にする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:58:33 GMT)
RAPiD-Seg: Range-Aware Pointwise Distance Distribution Networks for 3D LiDAR Segmentation [22.9]
本稿では,Range-Aware Pointwise Distance Distribution(RAPiD)と関連するRAPiD-Segアーキテクチャを紹介する。 RAPiDの特徴は剛性変換不変性を示し、点密度の変動に効果的に適応する。本稿では,高次元特徴を管理可能なボクセル・ワイド・埋め込みにエンコードする,新しいクラス認識型埋め込み目的を持つ2次元オートエンコーダ構造を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:59:34 GMT)
Plain-Det: A Plain Multi-Dataset Object Detector [22.8]
Plain-Detは、新しいデータセットに対応する柔軟性、さまざまなデータセットのパフォーマンス、トレーニング効率を提供する。 13の下流データセットに対して広範な実験を行い、Plain-Detは強力な一般化能力を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:18:06 GMT)
Time-SSM: Simplifying and Unifying State Space Models for Time Series Forecasting [22.8]
状態空間モデル(SSM)は、基底関数の集合を用いて連続系を近似し、それらを離散化して入力データを処理する。本稿では,SSMを時系列データに適用するためのより直感的で汎用的なガイダンスを提供する,動的スペクトル演算子(Dynamic Spectral Operator)と呼ばれる新しい理論フレームワークを提案する。パラメータの7分の1しか持たない新しいSSM基盤モデルであるTime-SSMを紹介する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:40:20 GMT)
The Hidden Influence of Latent Feature Magnitude When Learning with Imbalanced Data [22.5]
不均衡データを用いた学習における一般化の障害の主な原因の1つは、MLモデルが推論を行う固有の方法であることを示す。攻撃的データ拡張は一般にマイノリティクラス予測の精度を向上するが、パラメトリックMLモデルはクラスラベルと限られた機能の組み合わせを関連づける。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:20:50 GMT)
Beyond Prompt Learning: Continual Adapter for Efficient Rehearsal-Free Continual Learning [22.1]
C-ADA (Continuous Adapter) という,RFCL タスクに対する超高速学習手法を提案する。 C-ADAは、CALの特定の重みを柔軟に拡張し、各タスクの新たな知識を学び、古い重みを凍結して以前の知識を保存する。提案手法は,現状のSOTA(State-of-the-art)法よりも優れ,性能とトレーニング速度を大幅に向上させる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:40:40 GMT)
Key-Point-Driven Mathematical Reasoning Distillation of Large Language Model [21.8]
KPDD(Key-Point-Driven Mathematical Reasoning Distillation)を提案する。 KPDDは、問題解決プロセスを3段階に分割することで、SLMの推論性能を向上させる。実験により、KPDD-CoTは推論能力を大幅に向上し、KPDD-PoTは数学的推論タスクにおける最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:41:03 GMT)
You Can Wash Hands Better: Accurate Daily Handwashing Assessment with Smartwatches [21.5]
スマートウォッチを用いたウェアラブルソリューションであるUWashを提案し,ハンドウォッシングの手順を評価する。コンピュータビジョンにおけるアクションセグメンテーション問題と同様の動作センサの読み書きによるハンドウォッシング評価の課題に対処する。 51人以上の被験者による実験では、UWashはハンドウォッシングジェスチャー認識において92.27%の精度を達成している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:35:23 GMT)
Follow the Rules: Reasoning for Video Anomaly Detection with Large Language Models [21.5]
ビデオ異常検出は、セキュリティ監視や自動運転といったアプリケーションには不可欠である。既存のVADメソッドは、検出の背後にある根拠をほとんど示さず、現実世界のデプロイメントに対する公衆の信頼を妨げる。本稿では,大言語モデルを用いたVADのためのルールベースの推論フレームワークであるAnomalyRulerを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:23:12 GMT)
Defending Against Repetitive-based Backdoor Attacks on Semi-supervised Learning through Lens of Rate-Distortion-Perception Trade-off [20.7]
半教師付き学習(SSL)は、わずかなラベル付きデータで顕著なパフォーマンスを達成した。信頼できないデータの大規模なプールは、データ中毒に極めて脆弱であり、バックドア攻撃につながる可能性がある。トリガーパターンとターゲットクラスの関係を阻害する新しい手法であるunlabeled Data Purification (UPure)を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:42:11 GMT)
Tree-D Fusion: Simulation-Ready Tree Dataset from Single Images with Diffusion Priors [20.6]
我々は,600,000の環境に配慮した3次元シミュレーション対応ツリーモデルの最初のコレクションを特徴とするツリーD融合について紹介する。再構成された各3Dツリーモデルは、GoogleのAuto Arboristデータセットの画像に対応する。本手法は,木種を特定するためのテキストプロンプトを利用して,2種類の木適応拡散モデルのスコアを蒸留する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:56:07 GMT)
PAFUSE: Part-based Diffusion for 3D Whole-Body Pose Estimation [20.4]
本研究では,3次元全体のポーズ推定に新たなアプローチを導入し,身体部分間のスケールと変形性-分散の課題に対処する。不均一なサンプルデータにおける動きの活用という課題に対処するだけでなく、安定な拡散と階層的な部分表現を結合する。 H3WBデータセットでは,時間情報の活用に失敗した技術の現状を大幅に上回っている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:24:05 GMT)
Disrupting Diffusion-based Inpainters with Semantic Digression [20.1]
Web やソーシャルメディア上での視覚的誤情報の生成は,テキスト・画像拡散モデルの出現とともに指数関数的に増加している。すなわち、安定拡散のインペイントは、個人的および私的人物の悪意に塗られたイメージと、ディープフェイク(deepfakes)として知られる著作権のあるコンテンツの合成を可能にする。このような世代と戦うために、フォトガードと呼ばれる破壊的枠組みが提案され、環境画像に逆ノイズを加えて、その影響を和らげる合成を妨害する。彼らのフレームワークは拡散に親しみやすいアプローチを提案するが、破壊は十分に強くはなく、コンテキストイメージを免疫するのにかなりの量のGPUと時間を必要とする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:21:19 GMT)
Enhancing Low-Precision Sampling via Stochastic Gradient Hamiltonian Monte Carlo [20.0]
深層ニューラルネットワークのトレーニング効率を高めるための、有望な低コスト技術として、低精度トレーニングが登場している。本稿では, グラディエント・ハミルトン・モンテカルロ(SGHMC)による低精度サンプリングについて検討する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:02:27 GMT)
Divide & Bind Your Attention for Improved Generative Semantic Nursing [19.7]
複数のエンティティを含む複雑なプロンプトやシナリオによって生じる課題に対処するために、Divide & Bindを提案する。我々のアプローチは、複雑なプロンプトからの属性アライメントを改善して、所望のオブジェクトを忠実に合成する能力において際立っている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:20:19 GMT)
Enhancing Emotion Prediction in News Headlines: Insights from ChatGPT and Seq2Seq Models for Free-Text Generation [19.5]
我々は、ニュース見出しを読んでからどのように感じるかについて、自由テキストで書かれた人々の感情の説明を使う。感情分類では、自由文の説明は見出しによって引き起こされる支配的な感情と強く相関する。マクネマールの重要度テストを用いて、GPT生成自由テキストの説明を取り入れた手法は大幅に改善された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 06:04:11 GMT)
Textless Dependency Parsing by Labeled Sequence Prediction [18.3]
自動音声認識システムなしで音声表現を処理する「テキストレス」手法提案手法は,木をラベル付きシーケンスとして表現し,音声信号から係り受け木を予測する。本研究は,解析性能を高めるために,単語レベルの表現と文レベルの韻律を融合させることの重要性を強調した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:38:14 GMT)
Have ASkotch: Fast Methods for Large-scale, Memory-constrained Kernel Ridge Regression [18.1]
KRRソルバを大規模データセットにスケールすることは困難である。我々は, KRR の反復解法における記憶と繰り返しの複雑さを低減するために ASkotch を提案する。我々の研究は、幅広い分野にわたるKRRの非想像的応用の可能性を開く。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:11:10 GMT)
A Framework for Evaluating Privacy-Utility Trade-off in Vertical Federated Learning [18.0]
プライバシ・ユーティリティ評価問題を定式化する評価フレームワークを提案する。我々は,3つの広くデプロイされたVFLアルゴリズムに対して,最先端のプライバシ攻撃に対する幅広い保護機構を評価する。 VFLシステムのプライバシー保護機能を改善するための具体的なアドバイスを提供する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:23:56 GMT)
Nonrigid Reconstruction of Freehand Ultrasound without a Tracker [17.1]
トラッカーを使わずに2Dフリーハンド超音波(US)フレームを3次元空間に再構成する手法は,近年,ディープラーニングの進歩を目にしている。本研究では, 3次元USの再構成における非剛性変換の予測手法とその利点について検討した。そこで本稿では, トラッカーからの接地構造によって制御されたUSフレーム間の剛性変換を同時に推定する, 正規化された登録ネットワークによって最適化された非剛性変形を同時に最適化するアルゴリズムを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:36:37 GMT)
On the Importance of Uncertainty in Decision-Making with Large Language Models [17.0]
自然言語を入力とする意思決定問題における不確実性の役割について検討する。我々は、Laplace Approximation、Dropout、Epinetsなどの不確実性推定に異なる手法を採用する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:20:59 GMT)
Proof-of-Learning with Incentive Security [16.9]
ほとんどの並行ブロックチェーンシステムは、分散コンセンサスとセキュリティ保証のためのProof-of-Work(PoW)あるいはProof-of-Stake(PoS)メカニズムに大きく依存しています。計算効率,証明可能なインセンティブ-セキュリティ保証,制御容易な難易度を備えたPoL機構を設計する上で,既成の難しさを回避し,合理的なプローバーに率直に行動を促すインセンティブ-セキュリティの概念を導入する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:56:10 GMT)
Look Within, Why LLMs Hallucinate: A Causal Perspective [16.9]
大規模言語モデル(LLM)は、生成人工知能のマイルストーンであり、テキスト理解と生成タスクにおいて大きな成功を収めている。 LLMは深刻な幻覚障害に悩まされ、LLMの実用化に重大な課題が生じた。 LLMの自己注意層に介入し,その構造とサイズをそのまま維持する手法を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:47:44 GMT)
Augmented Neural Fine-Tuning for Efficient Backdoor Purification [16.7]
最近の研究では、様々なバックドア攻撃に対するディープニューラルネットワーク(DNN)の脆弱性が明らかにされている。神経活動の最適再編成を目的としたニューラルマスクファインチューニング(NFT)を提案する。 NFTはトリガー合成プロセスを緩和し、逆探索モジュールの要求をなくす。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:36:54 GMT)
Proto-CLIP: Vision-Language Prototypical Network for Few-Shot Learning [16.6]
Proto-CLIPは、CLIPのような大規模ビジョン言語モデルに基づく、数発の学習のためのフレームワークである。 Proto-CLIPは、CLIPからのイメージとテキストエンコーダの埋め込みを、いくつかの例を使って共同で調整する。 Proto-CLIPにはトレーニング不要と微調整の2種類がある。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:47:19 GMT)
SpreadFGL: Edge-Client Collaborative Federated Graph Learning with Adaptive Neighbor Generation [16.6]
Federated Graph Learning (FGL)は、分類タスクのために複数のクライアントで協調的なトレーニングを可能にすることで、広く注目を集めている。本研究では,エッジ・クライアント・コラボレーションにおける情報フローの促進を目的とした新しいFGLフレームワークSpreadFGLを提案する。本研究では,SpreadFGLが最先端のアルゴリズムに対して精度が高く,より高速な収束を実現することを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:34:19 GMT)
Restore-RWKV: Efficient and Effective Medical Image Restoration with RWKV [15.8]
医用画像修復のための最初のRWKVモデルであるRestore-RWKVを提案する。本稿では,線形計算複雑性を伴う大域的依存関係を捕捉する再帰的WKV(Re-WKV)アテンション機構を提案する。 Restore-RWKVは様々な医用画像復元作業において優れた性能を発揮することを示す実験を行った。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:22:05 GMT)
Rethinking Unsupervised Outlier Detection via Multiple Thresholding [15.7]
本稿では,既存のスコアリング手法を進化させるために,マルチしきい値(Multi-T)モジュールを提案する。これにより、2つのしきい値が生成され、不正なターゲットデータセットからインレーヤとアウトレーヤを分離する。実験により,Multi-Tが提案したアウトリースコアリング法を大幅に改善できることが確認された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:33:19 GMT)
Lost and Found: Overcoming Detector Failures in Online Multi-Object Tracking [15.5]
マルチオブジェクト追跡(MOT)は、時間とともに複数のオブジェクトのアイデンティティと位置を正確に推定する。現代の検出器は、あるフレーム内のいくつかのオブジェクトを見逃すことがあるため、トラッカーは早めに追跡をやめる。オンラインTbDシステムと互換性のある汎用フレームワークであるBUSCAを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:45:12 GMT)
ChatLogic: Integrating Logic Programming with Large Language Models for Multi-Step Reasoning [15.5]
本稿では、推論タスクに特化したフレームワークChatLogicを紹介する。 ChatLogicでは、言語モデルが中心的な役割を担い、コントローラとして機能し、すべてのシステム運用ステージに参加する。本稿では,論理問題を推論エンジンとのシンボリックな統合に変換する新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:06:43 GMT)
SUP-NeRF: A Streamlined Unification of Pose Estimation and NeRF for Monocular 3D Object Reconstruction [15.2]
我々は,オブジェクトポース推定とNeRFに基づくオブジェクト再構成の合体であるSUP-NeRFを提案する。 SUP-NeRFは物体の次元推定を分離し、スケールと深さのあいまいさを解決するために精細化を行う。 SUP-NeRFは、nuScenesデータセットの再構成とポーズ推定の両方を行う。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:50:38 GMT)
RecGS: Removing Water Caustic with Recurrent Gaussian Splatting [13.9]
水の因果関係は浅海域の海底画像データでよく見られる。画像から因果パターンを取り除く従来の方法は、注釈付きデータセットで2Dフィルタリングや事前トレーニングに依存することが多い。本稿では,今日の光現実的3次元再構成技術である3DGSを活用する新しい手法であるRecurrent Gaussian Splattingを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:24:44 GMT)
3D Foundation Models Enable Simultaneous Geometry and Pose Estimation of Grasped Objects [13.6]
本研究では,ロボットが把握した物体の形状と姿勢を共同で推定する手法を提案する。提案手法は,推定幾何をロボットの座標フレームに変換する。我々は,実世界の多様な物体の集合を保持するロボットマニピュレータに対する我々のアプローチを実証的に評価した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:02:55 GMT)
LabelDistill: Label-guided Cross-modal Knowledge Distillation for Camera-based 3D Object Detection [13.2]
クロスモーダルな知識蒸留は、LiDAR 3D検出器で性能ギャップを埋めることができる。本研究では,アレータティックな不確実性のない特徴を地中真理ラベルから活用する手法を提案する。本手法は,ベースラインモデルと比較して,mAPとNDSを5.1ポイント,4.9ポイント改善する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:18:00 GMT)
V2I-Calib: A Novel Calibration Approach for Collaborative Vehicle and Infrastructure LiDAR Systems [13.1]
本稿では,自動車と道路インフラのLiDARシステムのための新しいキャリブレーション手法を提案する。親和性行列を構成することにより,車両ノードとインフラノード間の共通マッチングボックスを探索する。 DAIR-V2Xデータセットの実験により,本手法の優位性が確認された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:34:00 GMT)
A Quantum Automatic Tool for Finding Impossible Differentials [13.0]
不可能な微分を探索するための2つの量子自動ツールを提案する。提案した量子アルゴリズムは、ミス・イン・ザ・ミドル(英語版)の概念と、切り刻まれた微分の性質を利用する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:00:24 GMT)
Gaussian in the Wild: 3D Gaussian Splatting for Unconstrained Image Collections [12.8]
制約のない画像における光度変化と過渡オクルーダは、元のシーンを正確に再構築することが困難である。ニューラルレージアンスフィールド(NeRF)におけるグローバルな外観特徴の導入による課題への先行的アプローチこの事実に触発されて,3次元ガウス点を用いてシーンを再構築する手法であるGaussian in the wild (GS-W)を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:25:46 GMT)
Empowering ChatGPT-Like Large-Scale Language Models with Local Knowledge Base for Industrial Prognostics and Health Management [12.4]
ChatGPTのような大規模言語モデル(LLM)は、AI分野における新たなイノベーションのラウンドをリードし始めている。 ChatGPTのようなLLMには豊富な知識と強力な言語理解と生成能力があるが、ドメイン固有の専門知識は欠如している。本研究は,産業用PHMにおける局所知識ベース(LKB)によって付与されるChatGPT-like LLMを用いて,上記の制限を解決することを目的とする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:01:01 GMT)
MuDPT: Multi-modal Deep-symphysis Prompt Tuning for Large Pre-trained Vision-Language Models [12.4]
マルチモーダル・ディープ・サイコフィック・プロンプト・タニングと呼ばれる新しいアプローチを提案し,その手法を MuDPT と呼ぶ。 MuDPTは、モデルに依存しない変換ネットワークを学習し、深い階層的な双方向のプロンプト融合を可能にすることで、独立したマルチモーダル・プロンプトチューニングを拡張している。最先端の手法と比較すると, MuDPT は認識能力と一般化能力が向上し, マージンは明らかである。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:08:13 GMT)
GRAPE: Generalizable and Robust Multi-view Facial Capture [12.3]
ディープラーニングベースのマルチビュー顔キャプチャ手法は、従来のメッシュ登録パイプラインよりも数桁高速で、印象的な精度を示している。本研究では,異なるカメラアレイ上での推論(すなわち,新しいデータをキャプチャする)に訓練されたモデルを容易に利用できるように,一般化能力を向上させることを目的とする。 FaMoSデータセットとFaceScapeデータセットの実験により,提案手法の有効性が示された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:24:17 GMT)
Parallel Ising Annealer via Gradient-based Hamiltonian Monte Carlo [11.3]
Ising annealerは最適化問題に対する量子インスパイアされたコンピューティングアーキテクチャである。主な革新は、近似勾配に基づくアプローチをイジングアニールに融合させることである。プロトタイプアニーラーは1つの低コストFPGA基板上で最大200スピンの整数係数と分数係数のイジング問題を解く。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:51:35 GMT)
Rapid Biomedical Research Classification: The Pandemic PACT Advanced Categorisation Engine [10.7]
Pandemic PACTプロジェクトは、アウトブレイクの可能性のある幅広い病気の研究資金と臨床証拠を追跡し、分析することを目的としている。本稿では,Pandemic PACT Advanced Categorisation Engine(PPACE)と関連するデータセットを紹介する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:22:53 GMT)
Evaluating Language Model Context Windows: A "Working Memory" Test and Inference-time Correction [10.4]
大規模言語モデルは現実世界のアプリケーションで顕著に使われ、しばしば大量の文書を推論する。本稿では,標準テストの限界に対処する評価フレームワークであるSWiMを提案する。また,この効果を緩和する,単純かつ効果的なトレーニングフリーアプローチであるメドイド投票を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:47:13 GMT)
Evolutionary Trigger Detection and Lightweight Model Repair Based Backdoor Defense [10.3]
ディープニューラルネットワーク(DNN)は、自律運転や顔認識など、多くの分野で広く利用されている。 DNNモデルのバックドアは、トリガーによる有毒な入力によってアクティベートされ、誤った予測につながる。進化的トリガ検出と軽量モデル修復に基づく効率的なバックドア防御を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:25:25 GMT)
Learning Unlabeled Clients Divergence via Anchor Model Aggregation for Federated Semi-supervised Learning [10.3]
SemiAnAggはアンカーモデルを通じて未ラベルのクライアントコントリビューションを学習する。 SemiAnAggは4つの広く使用されているFedSemiベンチマークにおいて、最先端の新たな結果を達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:50:40 GMT)
Resource-efficient Direct Characterization of General Density Matrix [10.1]
逐次弱測定により、密度行列全体を世界規模で再構成するのではなく、個々の密度行列要素を直接抽出することができる。汎用マルチキュージットシステムの密度行列を直接特徴付けるリソース効率の手法(RES)を提案する。我々はRESを一般の単一光子クォート状態と2光子絡み状態の直接的評価に実験的に適用した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:03:42 GMT)
"Add more config detail": A Taxonomy of Installation Instruction Changes [10.0]
インストール関連セクションの更新に重点を置いた1,163のコミットでGitHubリポジトリを調査した。調査の結果,コミットの変更には,プリインストール命令,インストール後のインストレーション命令,ドキュメント提示,外部リソース管理の6つの大きなカテゴリが明らかになった。そこで本稿では,ドキュメント更新時にドキュメンテーションメンテナが参照するインストール関連セクションをカバーするテンプレートを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:37:33 GMT)
Towards detailed and interpretable hybrid modeling of continental-scale bird migration [9.9]
我々は最近開発された大陸規模の鳥の移動のハイブリッドモデルを構築し、流体力学にインスパイアされた運動モデルと繰り返しニューラルネットワークを組み合わせる。 F FluxRGNNは、重要なマイグレーションパターンの予測に成功しているが、その空間分解能は、気象レーダーから得られる典型的な希薄な観測によって制限されている。本稿では,モデルコンポーネントの解釈可能性の制御を提供しながら,望まれるテッセル化に関するより詳細な予測を可能にする2つの大きな修正を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:52:19 GMT)
Vector Field Attention for Deformable Image Registration [9.9]
変形可能な画像登録は、固定画像と移動画像の間の非線形空間対応を確立する。既存のディープラーニングベースの手法では、ニューラルネットワークが特徴マップの位置情報をエンコードする必要がある。本稿では、位置対応の直接検索を可能にすることにより、既存のネットワーク設計の効率を高める新しいフレームワークであるベクトル場注意(VFA)を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:06:58 GMT)
Mitigating Translationese in Low-resource Languages: The Storyboard Approach [9.7]
本稿では,より流動的で自然な文を引き出すために,ストーリーボードを活用した新しいデータ収集手法を提案する。提案手法では,視覚刺激のあるネイティブ話者をストーリーボード形式で提示し,その記述を原文に直接露出することなく収集する。従来のテキスト翻訳手法とストーリーボードによるアプローチを,精度と流布率の観点から総合評価した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:47:03 GMT)
Progress and Perspectives on Weak-value Amplification [9.7]
WVA(Weak-value Amplification)は、超小さな物理効果を効果的に増幅する気象プロトコルである。 WVAは、精密気象学におけるポストセレクションの重要な役割を認識するための新しい視点を提供する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:26:53 GMT)
Weighted Aggregation of Conformity Scores for Classification [9.6]
コンフォーマル予測は、有効なカバレッジ保証を備えた予測セットを構築するための強力なフレームワークである。本稿では,共形予測器の性能向上のために,複数のスコア関数を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:58:03 GMT)
UTOPIA: Universally Trainable Optimal Prediction Intervals Aggregation [9.4]
UTOPIA(Universally Trainable Optimal Predictive Intervals Aggregation)と呼ばれる新しい戦略を導入する。この技術は、予測帯域の平均幅を小さく保ちながら、複数の予測間隔を効率的に集約し、カバレッジを確保する。合成データとファイナンスとマクロ経済学における2つの実世界のデータセットに適用することで検証されている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:50:02 GMT)
Free-Editor: Zero-shot Text-driven 3D Scene Editing [9.0]
大規模なデータセットが不足しているため、3次元シーン編集に特化した拡散モデルを訓練することは困難である。モデル再学習を必要とせずに3Dシーンを編集できる「textscFree-Editor」という新しい3Dシーン編集技術を紹介した。本手法は,SOTA(State-of-the-art)手法におけるマルチビュースタイルの不整合の問題を効果的に解決する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:52:51 GMT)
Enhancing Weakly-Supervised Histopathology Image Segmentation with Knowledge Distillation on MIL-Based Pseudo-Labels [8.9]
病理組織像分割のための新しい蒸留フレームワークを提案する。この枠組みは, 学生が教師の総合的な成果から直接学習できる, 反復的融合知識蒸留戦略を導入している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:15:47 GMT)
Raising the Ceiling: Conflict-Free Local Feature Matching with Dynamic View Switching [8.9]
本稿では3つの側面からマッチングのシーリングを向上するRCMという特徴マッチング手法を提案する。 RCMは、画像中のマッチング可能な点の不足に対処する動的ビュー切替機構を導入している。 RCMは、複数対1のマッチング戦略を通じて、ターゲット画像内の競合に対処する、競合のない粗いマッチングモジュールを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:43:55 GMT)
OpenTracer: A Dynamic Transaction Trace Analyzer for Smart Contract Invariant Generation and Beyond [8.8]
現在、完全なトランザクション情報の包括的な追跡を提供するオープンソースツールは存在しない。 OpenTracerは、すべての実行ステップの包括的なトラッキングを保証し、完全なトランザクション情報を提供する。このツールは完全にオープンソースであり、トランザクションの振る舞いを研究する開発者や研究者にとって貴重なリソースとなっている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 01:35:22 GMT)
Demystifying Invariant Effectiveness for Securing Smart Contracts [8.8]
本稿では,上位監査会社やセキュリティ専門家が支持する,著名なプロトコルに展開する8つのカテゴリの23種類の不変量について検討した。我々は、その履歴トランザクションデータに基づいて、所定の契約用にカスタマイズされた新しい不変量を動的に生成するツールTrace2Invを開発した。以上の結果から,最も有効な不変ガード単独で,ガスオーバーヘッドを最小限に抑えた27種のうち18種をブロックできることが判明した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 01:13:43 GMT)
Towards Adapting Reinforcement Learning Agents to New Tasks: Insights from Q-Values [8.7]
ポリシー勾配メソッドは、サンプル効率のよい方法でそれらを活用する方法に悩まされる限り、多くのドメインで有用です。我々は、強化学習におけるDQNのカオス的な性質を探求し、トレーニング時に保持する情報を、異なるタスクにモデルを適用するためにどのように再利用するかを理解した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:28:27 GMT)
PARE-Net: Position-Aware Rotation-Equivariant Networks for Robust Point Cloud Registration [8.7]
回転不変の特徴を学習することは、ポイントクラウド登録の基本的な要件である。既存の手法では、回転に敏感なネットワークを用いて特徴を抽出し、回転拡大を用いて近似不変写像を無作為に学習する。高速で軽量でロバストな登録のための位置認識型回転同変ネットワークを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:26:38 GMT)
Boosting Transferability in Vision-Language Attacks via Diversification along the Intersection Region of Adversarial Trajectory [8.6]
視覚言語事前学習モデルは多モーダル逆例(AE)の影響を受けやすい我々は,AEsの多様性を拡大するために,対向軌道の交差領域に沿った多様化を利用することを提案する。潜在的なオーバーフィッティングを緩和するため、最適化経路に沿った最後の交差点領域から逸脱する逆テキストを指示する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:58:57 GMT)
Transferable 3D Adversarial Shape Completion using Diffusion Models [8.3]
3Dポイントクラウド機能学習は、3Dディープラーニングモデルのパフォーマンスを大幅に改善した。既存の攻撃方法は、主にホワイトボックスのシナリオに焦点を当てており、最近提案された3Dディープラーニングモデルへの移行に苦労している。本稿では,拡散モデルを用いて高品質な対向点雲を生成する。提案した攻撃は、ブラックボックスモデルとディフェンスの両方に対して、最先端の敵攻撃法より優れている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:51:32 GMT)
Evolutionary Retrosynthetic Route Planning [8.2]
本稿では,進化的最適化に基づく再合成経路計画法を提案する。進化的アルゴリズム(EA)は、多段階の逆合成の分野で初めて使われる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:43:23 GMT)
Computational Copyright: Towards A Royalty Model for Music Generative AI [8.1]
生成的AIは、特に音楽業界において、著作権問題に拍車をかけた。本稿では,これらの課題の経済的側面に焦点をあて,著作権分野における経済的影響が中心的な課題となっていることを強調する。我々は、AI音楽生成プラットフォーム上での収益分配のための実行可能なロイヤリティモデルを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:49:37 GMT)
SACNet: A Spatially Adaptive Convolution Network for 2D Multi-organ Medical Segmentation [7.9]
医用画像解析における多臓器分割は診断と治療計画に不可欠である。本稿では、変形可能な畳み込みV3の知識を利用して、空間適応畳み込みネットワーク(SACNet)を最適化する。 ACDCとSynapseの3Dスライスデータセットの実験は、SACNetが既存のいくつかの手法と比較して優れたセグメンテーション性能を提供することを示した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:58:09 GMT)
Reinforcement Learning in High-frequency Market Making [7.7]
本稿では、高周波市場形成における強化学習(RL)の適用に関する、新しい包括的理論的解析手法を確立する。我々は、現代RL理論と高周波金融経済学における連続時間統計モデルを橋渡しする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:07:48 GMT)
Mapping the Scholarship of Dark Pattern Regulation: A Systematic Review of Concepts, Regulatory Paradigms, and Solutions from an Interdisciplinary Perspective [7.5]
本研究は,暗黒パターンに対する法学研究のユニークな傾向と特徴を合成し,五つの根問題と三重層害を同定する。法律理論やセクター法の観点から現在の規制を批判し、暗黒パターンに対処する上での彼らの意味を強調している。本研究は、効果的なダークパターン規制の現在の障壁を批判的に議論し、有望な規制ソリューションを探究する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:41:18 GMT)
AdvDiff: Generating Unrestricted Adversarial Examples using Diffusion Models [7.4]
制限のない敵攻撃は、深層学習モデルや敵防衛技術に深刻な脅威をもたらす。以前の攻撃法は、しばしば生成モデルのサンプリングに投影された勾配(PGD)を直接注入する。本稿では,拡散モデルを用いた非制限逆例を生成するAdvDiffと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:48:53 GMT)
STGFormer: Spatio-Temporal GraphFormer for 3D Human Pose Estimation in Video [7.3]
本稿では,映像中の3次元ポーズ推定のためのグラフベースのフレームワークを提案する。具体的には,各アテンション層に直接グラフ情報を統合するグラフベースのアテンションメカニズムを開発する。提案手法は,3次元人物のポーズ推定において,最先端の性能を実現することを実証する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 06:45:27 GMT)
BiasAlert: A Plug-and-play Tool for Social Bias Detection in LLMs [7.3]
BiasAlertは、LLM(Large Language Models)のオープンテキスト世代における社会的バイアスを検出するために設計されたプラグアンドプレイツールである。外部の人間の知識と固有の推論能力を統合し、バイアスを確実に検出する。大規模な実験により、BiasAlertはGPT4-as-A-Judgeのような最先端の手法でバイアスを検出するのに優れていた。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:17:02 GMT)
Contrastive Learning of Shared Spatiotemporal EEG Representations Across Individuals for Naturalistic Neuroscience [7.1]
本研究は、個人間での共有時空間脳波表現(CL-SSTER)のコントラスト学習の枠組みを提案する。このネットワークは、脳波に固有の空間的パターンと時間的パターンを同時に学習するために、空間的・時間的畳み込みを用いた。 CL-SSTERは、自然主義神経科学において、オブジェクト間共有神経表現を識別するための解釈可能でスケーラブルなフレームワークとして機能する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:48:28 GMT)
HSFusion: A high-level vision task-driven infrared and visible image fusion network via semantic and geometric domain transformation [7.1]
意味的および幾何学的領域変換を用いた高レベルの視覚タスク駆動赤外線・可視画像融合ネットワークを提案する。 CycleGANはドメイン変換パターンを学習し、これらのパターンの制約の下でCycleGANの再構成プロセスを実行する。融合段階において,2つのセフェレートサイクロンの再構成過程から抽出した赤外・可視的特徴を統合し,融合結果を得た。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:16:13 GMT)
MSD: A Benchmark Dataset for Floor Plan Generation of Building Complexes [7.0]
textbfModified Swiss Dwellings (MSD) - 大規模なフロアプランデータセット。 MSDは中規模から大規模の複合住宅の5.3K以上のフロアプランがあり、18.9K以上のアパートをカバーしている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:51:25 GMT)
Q&A Prompts: Discovering Rich Visual Clues through Mining Question-Answer Prompts for VQA requiring Diverse World Knowledge [6.9]
我々は、堅牢な相互モダリティ推論能力を持つAIモデルを装備するためのQ&A Promptsを提案する。まず、視覚的質問生成モデルの入力と出力として、画像と回答のペアと対応する質問をトレーニングセットとして使用する。次に、画像タグモデルを用いて様々なインスタンスを識別し、パッケージ化された画像タグペアを視覚質問生成モデルに送信し、抽出した画像タグと関連する質問を回答として生成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:18:05 GMT)
Learning to Refuse: Towards Mitigating Privacy Risks in LLMs [6.7]
大規模言語モデル(LLM)は、自然言語の理解と生成において顕著な能力を示す。本研究は、LLMが完全再トレーニングを必要とせず、特定の個人のプライベートデータを保護できることの課題に対処する。プライバシ保護のためのネーム・アウェア・アンラーニング・フレームワーク(NAUF)を導入する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:05:53 GMT)
Adaptive Differentially Quantized Subspace Perturbation (ADQSP): A Unified Framework for Privacy-Preserving Distributed Average Consensus [6.4]
本稿では適応微分量子化部分空間(ADQSP)という一般手法を提案する。本研究では,単一の量子化パラメータを変化させることで,提案手法がSMPC型の性能とDP型性能に異なることを示す。この結果から,従来の分散信号処理ツールを暗号保証に活用する可能性が示唆された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:20:50 GMT)
Order parameters and phase transitions of continual learning in deep neural networks [6.3]
継続学習(CL)により、動物は事前知識を消去することなく新しいタスクを学習することができる。ニューラルネットワーク(NN)におけるCLは、破滅的な忘れが原因で困難であり、新しい学習は古いタスクのパフォーマンスを低下させる。本稿では,ネットワークの入出力マッピングがタスク列を学習する際に特徴付ける,深層広帯域NNにおけるCLの統計力学理論を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:22:36 GMT)
AlphaDou: High-Performance End-to-End Doudizhu AI Integrating Bidding [6.2]
本稿では、強化学習を用いてDeep Monte Carloアルゴリズムの枠組みを変更し、勝利率と期待値を同時に推定するニューラルネットワークを得る。このRLモデルは、現実的なDouDiZhu環境で訓練され、公開モデルの最先端レベルを達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:32:36 GMT)
3DEgo: 3D Editing on the Go! [6.1]
本稿では,テキストプロンプトで案内されたモノクロ映像から3Dシーンを直接合成する新しい問題に対処する3DEgoを紹介する。本フレームワークは,従来のマルチステージ3D編集プロセスを一段階のワークフローに合理化する。 3DEgoは、様々なビデオソースの編集精度、速度、適応性を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:03:50 GMT)
Numbers Matter! Bringing Quantity-awareness to Retrieval Systems [5.7]
本稿では,2つの量対応ランキング技術を導入し,その量とテキストの内容のランク付けを共同で行う。これらの技術は、利用可能な検索システムに量情報を導入し、数値条件が等しく、より大きく、より少ないクエリに対処することができる。提案モデルの有効性を評価するため,ファイナンスと医療の領域に2つの新しい量対応ベンチマークデータセットを導入する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:56:11 GMT)
Risks of uncertainty propagation in Al-augmented security pipelines [5.7]
AI技術の使用は、ソフトウェアベースのシステムのセキュアな開発に浸透している。パイプライン内のエラーの伝播を考慮すると、AIが拡張したシステムの不確実性を推定する以前の研究はない。本研究では,不確かさの伝播を把握し,不確かさを定量化するためのシミュレータを開発し,2つのケーススタディで誤りの伝播シミュレーションを評価する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:02:20 GMT)
SynCode: LLM Generation with Grammar Augmentation [5.2]
SynCodeは、LLMによる効率的で一般的なデコードのための新しいフレームワークである。形式言語のCFGに対する健全性と完全性を保証し、無効なトークンをフィルタリングしながら有効なトークンを効果的に保持する。我々の実験は、SynCodeがすべての構文エラーを排除し、最先端のベースラインを大幅に上回ることを示した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:22:59 GMT)
AgileCoder: Dynamic Collaborative Agents for Software Development based on Agile Methodology [5.2]
AgileCoderは、Agile Methodology(AM)をフレームワークに統合するマルチエージェントシステムである。このシステムは、Product Manager、Developer、Testerといった特定のAMロールを異なるエージェントに割り当て、ユーザ入力に基づいて協調してソフトウェアを開発する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:14:30 GMT)
Building holographic code from the boundary [4.4]
AdS/CFT対応を仮定した量子情報構造であるホログラフィック量子誤り訂正符号は、新しい方向に注目を集めている。我々は、潜在的に広範かつ学際的な文脈に適用可能なホログラフィックコードを構築するための新しいアプローチを開始する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:51:17 GMT)
ReactAIvate: A Deep Learning Approach to Predicting Reaction Mechanisms and Unmasking Reactivity Hotspots [4.4]
我々は,反応ステップ分類の精度を96%とほぼ均一に達成した,解釈可能な注意に基づくGNNを開発した。我々のモデルは、配布外クラスからでも、キー原子を十分に識別します。この一般性は、モジュラーな方法で新しい反応型を包含することができるため、新しい分子の反応性を理解するための専門家にとって価値がある。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:53:18 GMT)
DistillSeq: A Framework for Safety Alignment Testing in Large Language Models using Knowledge Distillation [4.3]
大きな言語モデル(LLM)は、自然言語の理解、翻訳、さらにはコード生成を含む様々な領域において、その顕著な能力を誇示している。 LLMが有害なコンテンツを生成できる可能性は大きな懸念事項である。本研究は, テスト段階におけるコスト削減戦略について検討し, 資源利用の制約と徹底的な評価の必要性をバランスづけるものである。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:21:54 GMT)
Group Projected Subspace Pursuit for Block Sparse Signal Reconstruction: Convergence Analysis and Applications [4.3]
本稿では,グループ・プロジェクテッド・サブスペース・パースーツ(GPSP)アルゴリズムの収束解析について述べる。 GPSPは、観測がうるさいときに真のブロックスパース信号を回復する。 GPSPは様々なブロック間隔やブロックサイズに対して,ほとんどの場合,他のアルゴリズムよりも優れています。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 03:18:43 GMT)
Semantic Understanding and Data Imputation using Large Language Model to Accelerate Recommendation System [3.9]
そこで本稿では,LLM(Large-Tune Large Language Model)を提案する。大量のテキストで訓練されたLLMは、データ間の複雑な関係を理解し、行方不明の情報をインテリジェントに埋めることができる。この強化されたデータは、より正確でパーソナライズされた提案を生成するためにレコメンデーションシステムによって使用される。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:53:36 GMT)
psifx -- Psychological and Social Interactions Feature Extraction Package [3.6]
psifxはマルチモーダルな特徴抽出ツールキットである。それは、人間の科学研究に最先端の機械学習技術を使うことを容易にし、民主化することを目的としている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 16:20:42 GMT)
A Self-Supervised Learning Pipeline for Demographically Fair Facial Attribute Classification [3.5]
本稿では,人口統計学的に公平な顔属性分類のための完全自己教師付きパイプラインを提案する。我々は、事前訓練されたエンコーダ、多様なデータキュレーション技術、メタラーニングに基づく重み付きコントラスト学習を通じて、完全にラベル付けされていないデータを活用する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 07:11:57 GMT)
Cycle Index Polynomials and Generalized Quantum Separability Tests [3.5]
純粋な二分項状態の1つのシェアの混合性は、全体状態が分離可能で非絡み合い状態であるかどうかを決定する。量子分離性テストの族を導出し、それぞれが有限群によって生成される。これら全てのアルゴリズムに対して、受理確率は群のサイクル指数によって決定されることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:20:48 GMT)
Maximum mean discrepancies of Farey sequences [3.3]
クラスは、少なくとも1-半の順序のすべてのマトエルン核を含む。このクラスは、少なくとも半順序のすべてのマトエルン核を含む。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:16:03 GMT)
Qubit-count optimization using ZX-calculus [3.1]
非クリフォードゲート数を保存しながら量子回路内の量子ビット数を最適化する方法を示す。我々のアプローチの1つは、いくつかの$T$-countsで使用される手続きである、アダマール門のガジェット化を反転させることである。また、この手法を用いて、量子回路における量子ビットの数をZX計算を中間表現として効率的に最適化する方法について述べる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:58:53 GMT)
Multiple data sources and domain generalization learning method for road surface defect classification [2.9]
本稿では,カメラ画像を用いた路面欠陥の分類手法を提案する。一般化モデルを開発するための領域一般化学習アルゴリズムを提案する。その結果,従来は見つからなかったデータに基づいて,道路表面の欠陥を効率的に分類できることが示唆された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:37:47 GMT)
SENTINEL: Securing Indoor Localization against Adversarial Attacks with Capsule Neural Networks [2.7]
SENTINELは、屋内のローカライゼーションソリューションの敵攻撃に対するレジリエンスを高めるための、新しい組込み機械学習フレームワークである。 RSSRogueLocも導入しています。これは実世界の屋内環境からローグAPの効果を計測するデータセットです。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:40:12 GMT)
An exactly solvable model for emergence and scaling laws [2.6]
本稿では,新たな能力(スキル)を基礎関数として表現するフレームワークを提案する。新たなスキルの出現と、トレーニング時間、データサイズ、モデルサイズ、最適計算による損失の法則のスケーリングに関する分析式を見つける。私たちの単純なモデルでは、単一の適合パラメータを使用して、トレーニング時間、データサイズ、モデルサイズが増大するにつれて、複数の新しいスキルのシグモダルな出現を捉えます。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:28:01 GMT)
SyDRA: An Approach to Understand Game Engine Architecture [2.5]
本稿では,ゲームエンジンアーキテクチャの理解を支援するために,サブシステム依存回復アプローチ(SyDRA)を提案する。 SyDRAはゲームエンジン開発者がゲームエンジンアーキテクチャを理解し、ゲームエンジンの開発に情報を与えるのに役立つ。我々は,SyDRAにより,設計上の理解や影響分析に関連するタスクを,これらのモデルなしでより少ない時間で,高精度に完了させることができることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:37:35 GMT)
Spatial-Temporal Graph Representation Learning for Tactical Networks Future State Prediction [2.1]
本稿では,戦術通信ネットワークのための空間時間グラフデコーダ(STGED)フレームワークを紹介する。 STGEDはグラフベースのアテンション機構を利用して、一連の通信ネットワーク状態を空間的に符号化する。我々は,STGEDが時間ステップの異なる入力に対して,ベースラインモデルよりも大きなマージンで一貫した性能を示すことを示した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:59:14 GMT)
Ontology-driven Reinforcement Learning for Personalized Student Support [1.9]
本稿では,バーチャル教育システムに適用可能な,パーソナライズされた学生支援のための汎用フレームワークを提案する。データ収集とマルチエージェント強化学習を組み合わせたセマンティックな組織に応用する。その結果、学生にパーソナライズされた支援を提供するために、どんなバーチャル教育ソフトウェアにも適応できるモジュールシステムとなった。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:11:44 GMT)
KAT: Dependency-aware Automated API Testing with Large Language Models [1.7]
KAT(Katalon API Testing)は、APIを検証するためのテストケースを自律的に生成する、AI駆動の新たなアプローチである。実世界の12のサービスを用いたKATの評価は、検証カバレッジを改善し、文書化されていないステータスコードを検出し、これらのサービスの偽陽性を低減できることを示している。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:48:18 GMT)
PLACIDUS: Engineering Product Lines of Rigorous Assurance Cases [1.7]
クリティカルなソフトウェアエンジニアリングでは、構造化保証ケース(AC)が、重要なプロパティがエビデンスアーティファクトによってどのようにサポートされているかを示すために使用されます。本稿では,形式的手法とソフトウェア製品ラインエンジニアリングを統合する手法であるPLACIDUSを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:13:44 GMT)
Addressing Domain Discrepancy: A Dual-branch Collaborative Model to Unsupervised Dehazing [1.7]
本稿では、この問題に対処する新しい二分岐協調脱ハージングモデル(DCM-dehaze)を提案する。具体的には,DDSCM (Double Deepwise Separable Convolutional Module) を設計し,より深い特徴の情報を強化する。さらに、画像のエッジ特徴を最適化し、画像の明瞭度と忠実度を高めるために、双方向の輪郭関数を構築した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:47:32 GMT)
What Appears Appealing May Not be Significant! -- A Clinical Perspective of Diffusion Models [1.6]
本研究は, 異なる病態の合成ポリープ画像の臨床的意義を評価するための戦略について検討する。質的結果と臨床関連性との関係について検討した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 00:06:12 GMT)
LAB-Bench: Measuring Capabilities of Language Models for Biology Research [1.6]
言語エージェント生物学ベンチマーク(LAB-Bench)を紹介する。これは、AIシステムを評価するための2,400以上の複数の選択質問のデータセットである。また,本ベンチマークに対して,複数のフロンティア言語モデルの性能を測定し,人間の専門生物学研究者と比較して結果を報告する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 23:52:25 GMT)
GenSco: Can Question Decomposition based Passage Alignment improve Question Answering? [1.6]
ジェンスコ(GenSco)は,マルチホップ質問の予測分解に基づく経路選択手法である。広範に確立された3つのマルチホップ質問応答データセットについて評価した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:25:08 GMT)
The Error Analysis of the Secret Key Generation Algorithm Using Analog Function Computation [1.4]
本研究では,分散ノード間の暗号秘密鍵生成アルゴリズムを用いて,セキュアな無線通信を実現する分散型手法を提案する。フェードチャネル条件下でのモデルの有効性を成功率で評価する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:20:54 GMT)
Synthetic high angular momentum spin dynamics in a microwave oscillator [1.3]
本研究では、高調波クディットの共振駆動に付随する連続的な発電機を実現するために、高調波発振器をオンデマンドで変更する方法を示す。初めて線形高調波演算を用いて、4つの論理ゲートを高調波キュート符号化で達成する。この結果は、閉ヒルベルト空間上の運動が量子情報処理にどのように役立つかを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:13:14 GMT)
AutoGRAMS: Autonomous Graphical Agent Modeling Software [1.3]
本稿では,言語モデルとマルチステップインタラクションを行うためのAutoGRAMSフレームワークを紹介する。 AutoGRAMSはAIエージェントをグラフとして表現し、各ノードは言語モデリング命令または従来のコードのいずれかを実行することができる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:25:45 GMT)
The Interpretation Gap in Text-to-Music Generation Models [1.3]
本稿では,制御の表現,解釈,実行を含む音楽対話プロセスを記述する枠組みを提案する。既存のテキスト-音楽モデルとミュージシャンの主なギャップは、モデルがミュージシャンの制御を解釈する能力に欠ける解釈段階にある、と我々は主張する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:51:08 GMT)
Topological Optimized Convolutional Visual Recurrent Network for Brain Tumor Segmentation and Classification [1.2]
我々は,脳腫瘍の分類と分類のためのトポロジカルデータ解析に基づく改良型永続ホモロジーと畳み込み移動学習と視覚的反復学習モデルを開発した。他の既存の脳腫瘍の分類モデルと比較して、提案されたCTVR-EHOおよびTDA-IPHアプローチは、高い精度(99.8%)、高いリコール(99.23%)、高い精度(99.67%)、高いFスコア(99.59%)を示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:41:54 GMT)
Generative Modeling by Minimizing the Wasserstein-2 Loss [1.2]
本稿では,分布依存常微分方程式(ODE)を用いて2次ワッサーシュタイン損失($W$損失)を最小化することにより,教師なし学習問題にアプローチする。主要な結果から、ODE の時空間法則は、$W$損失に対して勾配流を形成し、真のデータ分布に指数関数的に収束することを示す。アルゴリズムはスキームに従い、永続的なトレーニングを適用することで設計されます。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 05:54:39 GMT)
Dominant Design Prediction with Phylogenetic Networks [1.1]
製品進化は、技術進化と市場選択の結果である。支配的なデザインの形成は、技術開発の軌跡を決定する。将来の支配的な設計を予測する方法は、技術予測と新製品開発において重要な問題となっている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:00:02 GMT)
Pathwise Differentiation of Worldline Path Integrals [1.1]
本研究では,スカラー場のワールドライン型経路積分の導関数を計算し,力,エネルギー曲率,トルクを計算する方法を提案する。カシミール・ポルダー型経路積分では、経路の原点に関する微分を必要とするが、この微分は経路積分の単純な再重み付けによって計算することができる。カシミール力、曲率、およびマクロ体間のトルクの計算についても論じる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:12:32 GMT)
Efficient Facial Landmark Detection for Embedded Systems [1.1]
本稿では、電力消費と時間遅延に関する課題に直面するエッジデバイス向けに特別に設計された、効率的な顔画像位置検出(EFLD)モデルを提案する。 EFLDは軽量のバックボーンとフレキシブルな検出ヘッドを備えており、それぞれがリソース制約されたデバイスの運用効率を大幅に向上する。予測コストを増大させることなく,モデルの一般化性と堅牢性を高めるためのクロスフォーマットトレーニング戦略を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:49:20 GMT)
FreeCG: Free the Design Space of Clebsch-Gordan Transform for Machine Learning Force Field [1.1]
置換不変入力にCG変換層を実装することで、対称性に影響を与えることなく、この層の設計が完全に自由になることを示す。我々は,群CG変換をスパースパス,抽象エッジシャッフル,アテンションエンハンサーで実現し,強力かつ効率的なCG変換層を形成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:40:35 GMT)
The Feasibility of a Smart Contract "Kill Switch" [1.0]
いくつかの主要なブロックチェーンプラットフォームにおけるスマートコントラクトの終了メカニズムについて検討する。我々は、これらのメカニズムとEUデータ法の要件との整合性を評価する。いわゆるスマートコントラクト「キルスイッチ」の実施に伴う課題について論じる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:31:15 GMT)
Augmented prediction of a true class for Positive Unlabeled data under selection bias [0.9]
本稿では, 観測時刻をラベル付けした正のアンラベル(PU)データに対して, 新たな観測環境を提案する。我々は、追加情報は予測に重要であると主張し、このタスクを"Augmented PU prediction"と呼んでいる。このようなシナリオで経験的ベイズ則のいくつかの変種を導入し、それらの性能について検討する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:58:01 GMT)
A graph-based formalism for surface codes and twists [0.8]
我々は、ツイストで曲面コードを構築するための厳密な形式主義を提供する。特に、曲面符号を2次元多様体上に埋め込まれた幻グラフ$G$に関連付ける。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:48:44 GMT)
Unexpected Benefits of Self-Modeling in Neural Systems [0.7]
人工ネットワークが内部状態を補助的タスクとして予測することを学ぶと、それらが根本的に変化することを示す。自己モデルタスクをより良く実行するために、ネットワークはよりシンプルで、より正規化され、よりパラメータ効率が良いものにすることを学ぶ。この自己正規化は、最近の機械学習文献で報告されている自己モデルの有用性を説明するのに役立つかもしれない。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:16:23 GMT)
MambaForGCN: Enhancing Long-Range Dependency with State Space Model and Kolmogorov-Arnold Networks for Aspect-Based Sentiment Analysis [0.7]
ABSAにおけるアスペクトと意見語間の短距離および長距離の依存関係を高める新しいアプローチであるMambaForGCNを提案する。 3つのベンチマークデータセットの実験結果は、MambaForGCNの有効性を示し、最先端(SOTA)ベースラインモデルを上回っている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:23:07 GMT)
Ensemble Deep Random Vector Functional Link Neural Network Based on Fuzzy Inference System [0.6]
アンサンブルディープランダムベクトル汎関数リンク(edRVFL)ニューラルネットワークは、従来の人工ニューラルネットワークの限界に対処する能力を示した。本稿では,ファジィ推論システム(edRVFL-FIS)に基づく新しいEDRVFLを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:37:14 GMT)
Towards a Unified Framework for Evaluating Explanations [0.6]
我々は、モデルと利害関係者の間の仲介者として、本質的に解釈可能なモデルであれ、不透明なブラックボックスモデルであれ、説明が役立ちます。本稿では,学習者の行動を予測するための解釈可能なニューラルネットワークの例を用いて,これらの基準と具体的な評価手法について述べる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 01:11:22 GMT)
Digital Twin Evolution for Sustainable Smart Ecosystems [0.4]
我々は4つの異なるデジタルツイン進化シナリオを用いて、デジタルツイン進化の7R分類の使い方を説明する。私たちは、ソフトウェアエンジニアリングのプラクティスを活用して堅牢なスマートエコシステムを開発する上で、大きなギャップを埋めることを目指しています。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:33:13 GMT)
Efficient tensor network simulation of multi-emitter non-Markovian systems [0.3]
非接触浴に結合した複数のエミッタ系をシミュレーションする数値計算法を提案する。ボソンの正方格子に結合した複数のエミッタからの集合放出について検討した。また、多重励起初期状態から有界状態における励起の動的準備をシミュレートする。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:24:23 GMT)
Coincidence detection for photon triplet sources [0.3]
本研究は,ソースキャラクタリゼーションにおける検出限界に対処するために,一致検出の確率理論を提案する。超伝導ナノワイヤ単光子検出器を用いた1-72時間以上の音源特性評価には、1-100Hzのトリプルト生成速度が必要である。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:00:08 GMT)
Thyroidiomics: An Automated Pipeline for Segmentation and Classification of Thyroid Pathologies from Scintigraphy Images [0.2]
本研究の目的は,甲状腺シンチグラフィー画像を用いた甲状腺疾患分類を向上する自動パイプラインを開発することである。 2,643人の甲状腺シンチグラフィー画像を収集し,DG(diffuse goiter),MNG(multinodal goiter),甲状腺炎(TH)に分類した。パイプラインは、さまざまなクラスにわたるいくつかの分類指標で、医師のセグメンテーションに匹敵するパフォーマンスを示した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:29:28 GMT)
Stable generative modeling using Schrödinger bridges [0.2]
本稿では,Schr"odinger BridgesとLangevin dynamicsを組み合わせた生成モデルを提案する。我々のフレームワークは自然に条件付きサンプルを生成し、ベイズ推論問題に拡張することができる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:18:26 GMT)
Two-electron two-nucleus effective Hamiltonian and the spin diffusion barrier [0.2]
動的核偏極(DNP)は、未対電子から超微細結合核への偏極移動を伴う。ハイパーファインカップリングは、核双極子フリップフロップ遷移を抑制し、バルクへの核双極子輸送を妨げると考えられている。電子双極子と核双極子フリップフロップを結合したエネルギー保存型電子核四スピンフリップフロップが同定される。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:25:12 GMT)
Addressing Class Imbalance and Data Limitations in Advanced Node Semiconductor Defect Inspection: A Generative Approach for SEM Images [0.1]
限られたデータ構造内で拡散モデルを用いて合成半導体SEM画像を生成する手法を提案する。従来のシミュレーション手法による画像とは対照的に,提案手法により生成されたSEM画像は実SEM画像とよく似ており,そのノイズ特性と表面粗さを適応的に再現する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:25:05 GMT)
Curriculum Learning for Small Code Language Models [0.1]
本稿では,プログラム言語モデルの性能向上におけるカリキュラム学習の可能性について考察する。十分に設計されたカリキュラム学習手法は,デコーダのみの小さな言語モデルの精度を大幅に向上させることを示した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:32:24 GMT)
Nullpointer at CheckThat! 2024: Identifying Subjectivity from Multilingual Text Sequence [0.0]
本研究は、文または段落のテキストシーケンスが主観的か客観的かを決定するために、二分分類タスクに対処する。タスクはアラビア語、ブルガリア語、英語、ドイツ語、イタリア語の5つの言語にまたがる。感情に基づくトランスフォーマーモデルであるMarieAngeA13/Sentiment-Analysis-BERTをデータセット上で微調整した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:37:28 GMT)
xLSTMTime : Long-term Time Series Forecasting With xLSTM [0.0]
本稿では、時系列予測のための拡張LSTM (xLSTM) と呼ばれる最近のアーキテクチャの適応について述べる。我々は、xLSTMTimeの性能を、複数の実世界のda-tasetにまたがる様々な最先端モデルと比較する。この結果から,改良されたリカレントアーキテクチャは時系列予測において,トランスフォーマーモデルに代わる競合的な代替手段を提供する可能性が示唆された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:15:00 GMT)
Why Teach Quantum In Your Own Time: The Values of Grassroots Organizations Involved in Quantum Technologies Education and Outreach [0.0]
本稿では,量子技術(QT)教育の領域で活動する草の根組織における目標と価値の交わりについて検討する。この分析は、これらの組織が、持続的な成長と開発を目標にしながら、基礎的な価値に固執するという2つの課題に悩まされる、初期段階の段階をナビゲートする方法を明らかにしている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:02:46 GMT)
TokenSHAP: Interpreting Large Language Models with Monte Carlo Shapley Value Estimation [0.0]
TokenSHAPは、大規模言語モデルを解釈する新しい方法である。これは、協調ゲーム理論から自然言語処理へのシェープリー値の適応である。トークンの重要性を解釈可能で定量的に測定する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:07:50 GMT)
Surpassing legacy approaches to PWR core reload optimization with single-objective Reinforcement learning [0.0]
単目的および多目的の最適化のための深層強化学習(DRL)に基づく手法を開発した。本稿では、PPO(Proximal Policy Optimization)を用いて、RLに基づくアプローチの利点を実証する。 PPOは学習可能なウェイトを持つポリシーで検索機能を適応し、グローバル検索とローカル検索の両方として機能する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 14:45:52 GMT)
Share, Collaborate, Benchmark: Advancing Travel Demand Research through rigorous open-source collaboration [0.0]
旅行需要の文献が効果的にポリシーを伝えるのを防ぐ重要な障壁は、明確な統合されたベンチマークのない出版物の量である。新型コロナウイルス(COVID-19)のパンデミックのような動的条件下での性能に着目した交通需要予測モデルのための協調的なインフラを提案する。 LSTM深層学習手法の予測誤差は,1.5ヶ月以内に平均弧状絶対パーセンテージ誤差(MAAPE)が約0.12に安定化したのに対し,他のモデルでは,パンデミックから1年以内に高いエラー率を示し続けた。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:11:43 GMT)
Research Experience of an Undergraduate Student in Computer Vision and Robotics [0.0]
本稿では,コンピュータビジョンとロボティクスの分野に精通するコンピュータ工学の学部生の教育経験に焦点を当てる。カメラが翻訳動作を行うとき、光学フローとその応用がどのように移動物体を検出するのかを探求し、遭遇した課題とそれらを克服するための戦略を強調した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 02:01:50 GMT)
Reduction of Class Activation Uncertainty with Background Information [0.0]
マルチタスク学習は、一般化を改善したハイパフォーマンスニューラルネットワークをトレーニングするための一般的なアプローチである。マルチタスク学習と比較して,より低い計算量での一般化を実現するためのバックグラウンドクラスを提案する。本稿では,背景画像の選択手法を提案し,今後の改善について論じる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:40:22 GMT)
Quantum weak values and the 'which way?' question [0.0]
不確実性原理は、量子系が旅行した2つの経路のどれかを決定することを禁ずる。弱いポインタが同時に不正確なポインタであることを示し、個々の試行においてシステムによって取られた経路に関する情報が必然的に失われることを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 23:41:24 GMT)
Quantum hashing algorithm implementation [0.0]
我々は1988年にAmbainisとFreevaldsが発表したフィンガープリント技術に基づく量子ハッシュアルゴリズムをゲートベース量子コンピュータ上で実装した。我々は,LNN(Linear Nearest Neighbor)ではない隣接アーキテクチャを表すキュービットの特殊グラフを持つ16量子および27量子のIBMQを考察する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:41:16 GMT)
Merging Improves Self-Critique Against Jailbreak Attacks [0.0]
大規模言語モデル(LLM)の、ジェイルブレイク攻撃のような敵の操作に対する堅牢性は、依然として大きな課題である。本研究では, LLMの自己批判能力を高め, 衛生的な合成データよりも微調整する手法を提案する。以上の結果から,メルジングと自己批判の組み合わせは,敵の攻撃成功率を大幅に低下させる可能性が示唆された。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:27:14 GMT)
Integrating AI Tutors in a Programming Course [0.0]
RAGManはLLMベースのチューターシステムで、様々なコース特化および宿題特化AIチューターをサポートする。本稿では,AI教師とのインタラクション,学生のフィードバック,および比較グレード分析について述べる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 00:42:39 GMT)
Insecurity of Quantum Two-Party Computation with Applications to Cheat-Sensitive Protocols and Oblivious Transfer Reductions [0.0]
我々は、不正な当事者が不正行為をすることができるが、検出されるリスクがある、不正に敏感なOTの可能性を厳格に確立する。セキュアな関数評価に必要なプリミティブのエントロピー境界を提供する。我々の結果は、特に有限個のプリミティブ間の変換と任意の誤差に対して成り立つ。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:48:17 GMT)
Identity Chain [0.0]
IdentityChainは、プライバシと説明責任の原則を統合する新しいフレームワークである。目標は、既存の規制に準拠しつつ、プライバシーを維持することだ。プライバシーと説明責任は、暗号化の進歩がなければ一緒にはできないでしょう。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 13:14:16 GMT)
Hyperplane Arrangements and Fixed Points in Iterated PWL Neural Networks [0.0]
我々は超平面配置の枠組みを活用して(安定な)固定点の潜在的領域を分析する。分割線形(PWL)アクティベーション機能を備えた多層ニューラルネットワークに対する固定点数の上限を与える。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 18:01:28 GMT)
Hyperbolic non-Abelian semimetal [0.0]
我々は、位相的に保護された半金属バンド交差の概念を、負の曲面の双曲格子に拡張する。それらの異なる変換群構造のため、そのような格子は高次元の相互空間と結びついている。逆空間における余次元5のノルダル多様体を照らす。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 11:23:25 GMT)
Hybrid Quantum-Classical Photonic Neural Networks [0.0]
従来のネットワーク層とトレーニング可能な連続可変量子回路の組み合わせを示す。分類タスクでは、ハイブリッドネットワークは2倍の大きさの完全古典的ネットワークに対してベンチマークすると、同じ性能を達成する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:15:26 GMT)
Hierarchy of emergent cluster states by measurement from symmetry-protected-topological states with large symmetry to subsystem cat state [0.0]
逐次サブシステム射影測定により相関状態間に出現する測定生成階層を提案する。また,大規模システムおよび大規模対称クラスタSPT状態に適用した逐次サブシステム射影測定により,対称性-縮小階層を検証した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 09:38:33 GMT)
Harnessing Feature Clustering For Enhanced Anomaly Detection With Variational Autoencoder And Dynamic Threshold [0.0]
北極圏の融雪のような極端な気候現象に影響を及ぼす臨界期間と特徴を識別する異常検出手法を導入する。この方法は動的しきい値と相関に基づく特徴クラスタリングと統合された変分オートエンコーダを利用する。この枠組みは、VAEが局所的な依存関係を識別し、気候データにおける時間的関係を学習する能力を高める。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 01:52:10 GMT)
Explainable bank failure prediction models: Counterfactual explanations to reduce the failure risk [0.0]
銀行失敗予測モデルの正確性と理解性が重要である。ランダムフォレスト、サポートベクターマシン、ディープラーニングのような複雑なモデルは、高い予測性能を提供するが、説明性は低い。この課題に対処するためには, 対実的な説明を用いることが提案されている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:27:27 GMT)
Evolved Developmental Artificial Neural Networks for Multitasking with Advanced Activity Dependence [0.0]
活動依存(AD)の新たな拡張による有望な結果を示す。我々は、健康や位置を含む新しい神経パラメータについて、ADを介してより顕著な改善を示す。今後の作業にはいくつかの有望な方向性を提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 23:39:07 GMT)
Emergent World Models and Latent Variable Estimation in Chess-Playing Language Models [0.0]
我々は,Othelloゲーム上でGPTモデルをトレーニングし,ボード状態の内部表現を学習した。この作業をチェスのより複雑な領域に拡張し、実際のゲームでトレーニングし、モデルの内部表現を調査します。 Li et al. の以前の合成データセットアプローチとは異なり、我々の分析では、このモデルがプレイヤースキルのような潜伏変数を推定し、次のキャラクタをより正確に予測する方法も学んでいる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:23:19 GMT)
Efficient classical simulation of quantum computation beyond Wigner positivity [0.0]
我々は、パウリ可観測物の閉集合と非コンテキスト集合に基づく CNC 形式主義の一般化を、奇素次元キューディットの設定に提示する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:25:13 GMT)
Does Burrows' Delta really confirm that Rowling and Galbraith are the same author? [0.0]
スタイラスパッケージは、テキスト間の距離を計算するために使用できる周波数テーブルを含む。研究課題とより関係のあるテキスト上で,本手法の性能を検証した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 19:28:48 GMT)
Deep learning architecture for decrypting information on the event horizon [0.0]
深層学習アルゴリズムを用いて、AdSブラックホールの事象の地平線上の情報の断片が、どのように整合境界に復号されるかを示すモデルを見つける。可換性とAdS/CFTを組み合わせることで、共形境界がホログラフィックスクリーンを実装しているという視点を超えて進むことができる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 20:15:59 GMT)
Deep Learning Algorithms for Early Diagnosis of Acute Lymphoblastic Leukemia [0.0]
急性リンパ性白血病(英語: acute lymphoblastic leukemia、ALL)は、白血球に影響を及ぼす血液がんの一種である。本研究では,ALの診断過程を支援するバイナリ画像分類モデルを提案する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 15:35:39 GMT)
Deep Learning Activation Functions: Fixed-Shape, Parametric, Adaptive, Stochastic, Miscellaneous, Non-Standard, Ensemble [0.0]
活性化関数(AF)は、ディープラーニングモデルのアーキテクチャにおいて重要な役割を果たす。本稿では, 固定形, 適応型, 非標準型, アンサンブル/組合わせ型など, 様々な種類のAFについて概観する。本研究は,12種類の最先端AFを比較検討した。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:53:49 GMT)
Critical behaviors of non-stabilizerness in quantum spin chains [0.0]
非安定化器性は、量子状態が安定化器状態から逸脱する程度を測定する。本研究では, 量子スピン鎖の臨界度に関する非安定化剤の挙動について検討する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 12:10:25 GMT)
Correlated catalyst in quantum thermodynamics [0.0]
熱的操作の2つの重要な特性,ギブス保存特性と共変特性について検討した。ギブス保存操作の状態変換性は、熱力学の第2法則によって完全に特徴づけられる。共変演算の状態可換性は、初期状態が有限コヒーレンスである限り自由であることが示される。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 06:27:17 GMT)
Comparing Complex Concepts with Transformers: Matching Patent Claims Against Natural Language Text [0.0]
特許出願や特許ポートフォリオを管理する重要な能力は、請求書を他のテキスト、例えば特許仕様と比較することである。 2つの新しいLCMベースのアプローチをテストし、両者が以前公表した値よりもかなり優れたパフォーマンスを提供することを示した。あるドメインからの密集した情報を、異なる語彙で表されるはるかに多くの分散情報とマッチングする能力は、知的財産空間を超えても有用である。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 22:31:07 GMT)
CATT: Character-based Arabic Tashkeel Transformer [0.0]
タシュケル(Tashkeel)は、アラビア語のテキストの理解を大幅に強化する。本稿では,ATDモデルのトレーニングに新たなアプローチを提案する。 11の商用およびオープンソースモデルとともに、当社のモデルを評価します。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 10:01:40 GMT)
Artificial Intelligence from Idea to Implementation. How Can AI Reshape the Education Landscape? [0.0]
論文は、AI技術が理論的構成から、教育的アプローチや学生のエンゲージメントを変える実践的なツールへとどのように移行してきたかを示す。このエッセイは、教育におけるAIの可能性について議論し、技術的進歩と社会的意味の両方を考慮するバランスのとれたアプローチの必要性を強調することで締めくくられている。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 04:40:16 GMT)
An Interpretable Neural Network for Vegetation Phenotyping with Visualization of Trait-Based Spectral Features [0.0]
UPWINS スペクトルライブラリーで訓練された解釈可能なニューラルネットワークで, 種, 健康, 成長段階, 年次変動, 環境条件など, 13種の指標種, 天然の共通背景種を多種多様なメタデータで分析した。ネットワーク内のニューロンは, ネットワーク重量の可視化を通じて, 化学的および生理的特性のスペクトル指標を学習し, それらの特性が, 実験セット上で90%の精度で, 種同定のためのネットワークによってどのように結合されているかを示す。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 21:20:37 GMT)
A Study on Internet of Things in Women and Children Healthcare [0.0]
IoT(Internet of Things)は、患者のデータを絶え間なく収集する機能を持つ。医師は、合併症を避けるために患者を早期に診断することができ、必要に応じてさらなる修正を提案することができる。本稿では,女性や子どもの医療分野におけるIoTに関するいくつかの方法,実践,プロトタイプについて述べる。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 17:34:00 GMT)
A Bag of Tricks for Scaling CPU-based Deep FFMs to more than 300m Predictions per Second [0.0]
フィールド認識ファクトリゼーションマシン(FFM)はクリックスルー率予測の強力なモデルとして登場した。我々は、社内のRustベースのDeep FFM実装を詳細に分析し、CPUのみのマルチデータセンタスケールへの展開について詳述する。
論文参考訳（メタデータ） (Sun, 14 Jul 2024 08:10:20 GMT)