Summary of a Haystack: A Challenge to Long-Context LLMs and RAG Systems [124.8] 我々は、文書のHaystackを合成する手順を設計し、特定のテキストが文書間で繰り返されることを保証します。
すると、"Summary of a Haystack"(SummHay)タスクは、Haystackを処理し、クエリ、関連する洞察を特定し、ソースドキュメントを正確に引用する要約を生成するシステムを必要とする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:23:42 GMT)
Eliminating Position Bias of Language Models: A Mechanistic Approach [119.3] 位置バイアスは現代言語モデル (LM) の一般的な問題であることが証明されている。
因果的注意は一般的に、モデルが遠方のコンテンツを好むのに対して、RoPEのような相対的な位置エンコーディングは近くのものを好む。
本研究では,異なる入力セグメント順序(例えばLM-as-a-judgeのオプション,QAの検索文書)によって生じる位置バイアスを,TRAINING-FREE ZERO-SHOT方式で推定する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:06:57 GMT)
Predicting Text Preference Via Structured Comparative Reasoning [110.5] 我々は、構造化中間比較を生成することによって、テキストの嗜好を予測するプロンプト方式であるSCを導入する。
我々は、テキスト間の差異を明確に区別するためのペアワイズ整合コンパレータと一貫した比較を選択する。
要約,検索,自動評価など多種多様なNLPタスクに対する総合的な評価は,SCがテキスト優先予測における最先端性能を達成するためにLLMを装備していることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:57:56 GMT)
Evaluating Copyright Takedown Methods for Language Models [100.4] 言語モデル(LM)は、潜在的に著作権のある資料を含む様々なデータに対する広範な訓練からその能力を引き出す。
本稿では,LMの著作権削除の可能性と副作用を初めて評価する。
システムプロンプトの追加、デコード時間フィルタリングの介入、未学習アプローチなど、いくつかの戦略を検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:12:45 GMT)
Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text [98.3] 密接に関連する2つの言語モデルとの対比に基づくスコアは、人文と機械文の分離に極めて正確である。
本稿では,一対の事前学習 LLM を用いた簡単な計算しか必要としない新しい LLM 検出器を提案する。
Binocularsと呼ばれるこの方法は、トレーニングデータなしで最先端の精度を実現する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:17:10 GMT)
Evaluation of Text-to-Video Generation Models: A Dynamics Perspective [94.3] 既存の評価プロトコルは主に時間的一貫性とコンテンツの連続性に焦点を当てている。
本稿では,T2Vモデルを評価するための動的次元に着目した効果的な評価プロトコルDEVILを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:51:22 GMT)
Rethinking LLM Memorization through the Lens of Adversarial Compression [93.1] Webスケールデータセットでトレーニングされた大規模言語モデル(LLM)は、許容可能なデータ使用に関する重大な懸念を提起する。
ひとつ大きな疑問は、これらのモデルがすべてのトレーニングデータを"記憶する"のか、それとも、人間がどのように情報を学び、合成するかに何らかの方法で多くのデータソースを統合するのかである。
本稿では,LLMの記憶度を評価する指標として,ACR(Adversarial Compression Ratio)を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:43:11 GMT)
KoLA: Carefully Benchmarking World Knowledge of Large Language Models [88.0] 我々は知識指向LLMアセスメントベンチマーク(KoLA)を構築した。
人間の認知を模倣して、知識関連能力の4段階の分類を形成し、19ドルのタスクをカバーします。
私たちは、LLMによって事前訓練されたコーパスであるウィキペディアと、継続的に収集された新興コーパスを使用して、目に見えないデータや進化する知識を扱う能力を評価します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:38:57 GMT)
Fine-tuning can cripple your foundation model; preserving features may be the solution [87.4] タスク上の概念を認識できる微調整モデルの能力は、事前訓練されたモデルに比べて大幅に低下する。
我々は、下流タスクに関連する新しい概念を学習しながら、モデルが事前学習した知識を保存できる「textitLDIFS$」という新しい微調整手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:14:27 GMT)
Rethinking Machine Ethics -- Can LLMs Perform Moral Reasoning through the Lens of Moral Theories? [78.4] 倫理的AIシステムの開発には倫理的判断が不可欠である。
一般的なアプローチは主にボトムアップ方式で実装されており、モラルに関するクラウドソースの意見に基づいて、大量の注釈付きデータを使用してモデルをトレーニングする。
本研究は、学際的な研究から確立された道徳理論を用いて道徳的推論を行うために、言語モデル(LM)を操る柔軟なトップダウンフレームワークを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:33:51 GMT)
Self-Cognition in Large Language Models: An Exploratory Study [77.5] 本稿では,Large Language Models(LLMs)における自己認識の先駆的研究を行う。
まず,LLMが自己認識を示す場所を評価するために,自己認識指導のプールを構築した。
モデルサイズ, トレーニングデータ品質, 自己認識レベルとの間には, 正の相関関係が認められた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:52:05 GMT)
SeaLLMs -- Large Language Models for Southeast Asia [76.5] 東南アジア(SEA)言語に焦点を当てた,革新的な言語モデルであるSeaLLMを紹介した。
SeaLLMはLlama-2モデルに基づいて構築され、さらに拡張語彙、特殊命令、アライメントチューニングによる事前訓練が継続されている。
包括的評価により,SeaLLM-13bモデルは言語タスクやアシスタントスタイルの指示追従能力に優れた性能を示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:52:31 GMT)
Long-term drought prediction using deep neural networks based on geospatial weather data [75.4] 農業計画や保険には1年前から予測される高品質の干ばつが不可欠だ。
多様な時間的ニューラルネットワークモデルを用いたエンドツーエンドアプローチを導入することで、干ばつデータに対処する。
主な発見は、TransformerモデルであるEarthFormerが、正確な短期(最大6ヶ月)の予測を行う際の例外的なパフォーマンスである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:58:07 GMT)
Long Context Transfer from Language to Vision [74.8] ビデオシーケンスは貴重な時間情報を提供するが、既存の大規模マルチモーダルモデル(LMM)は非常に長いビデオを理解するには不十分である。
本稿では,言語モデルの観点からこの問題にアプローチする。
言語バックボーンの文脈長を単純に外挿することで、LMMはビデオトレーニングなしで桁違いに多くの視覚的トークンを理解できるようになる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:59:29 GMT)
Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time [73.8] 本稿では、画像と音声のきめ細かい理解を備えた音声視覚LLMであるMeerkatを紹介する。
Meerkatは、音声参照画像の接地、画像案内音声の時間的局所化、音声-視覚的事実チェックといった課題に取り組むことができる。
我々は、これらの下流タスクすべてにおいて、37.12%の相対的な改善で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:32:25 GMT)
A Look Into Training Large Language Models on Next Generation Datacenters [70.3] 私たちは、Microsoftが1000億ドルのMLデータセンターを構築する計画から始めて、関連研究の方向性を見つけるために、従来からあるアプローチを取っています。
私たちのゴールは、このようなデータセンターでどんなモデルをトレーニングできるか、それに直面する可能性のあるハイレベルな課題を理解することです。
データセンタの構築とそのようなモデルのトレーニングは技術的に可能であると結論付けていますが、これは新しいNICベースのマルチパストランスポートと、トレーニングスタック全体の再設計が必要です。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:33:46 GMT)
Tree Search for Language Model Agents [69.4] 対話型Web環境での探索と多段階計画を行うために,LMエージェントの推論時探索アルゴリズムを提案する。
我々のアプローチは、実環境空間内で機能する最優先木探索の一形態である。
現実的なWebタスクにおいて有効性を示すLMエージェントのための最初の木探索アルゴリズムである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:07:55 GMT)
Accelerating Diffusion Sampling with Optimized Time Steps [69.2] 拡散確率モデル(DPM)は高分解能画像合成において顕著な性能を示した。
彼らのサンプリング効率は、通常多くのサンプリングステップのため、依然として望まれている。
DPM用高次数値ODEソルバの最近の進歩により、サンプリングステップがはるかに少ない高品質な画像の生成が可能になった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:01:38 GMT)
Assessing the Brittleness of Safety Alignment via Pruning and Low-Rank Modifications [69.1] 大きな言語モデル(LLM)は、その安全性メカニズムに固有の脆さを示す。
本研究では, プルーニングと低ランク改造を利用した安全アライメントの脆性について検討した。
安全クリティカル領域への変更が制限された場合でも,LSMは低コストの微調整攻撃に対して脆弱であることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:11:17 GMT)
Quantifying Language Models' Sensitivity to Spurious Features in Prompt Design or: How I learned to start worrying about prompt formatting [68.2] 言語モデル(LLM)は、言語技術の基本コンポーネントとして採用されている。
いくつかの広く使われているオープンソースLLMは、数ショット設定でプロンプトフォーマットの微妙な変更に対して非常に敏感であることがわかった。
本稿では,与えられたタスクに対して有効なプロンプトフォーマットのサンプルセットを迅速に評価するアルゴリズムを提案し,モデル重み付けにアクセスせずに期待性能の間隔を報告する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:28:01 GMT)
SuperGaussian: Repurposing Video Models for 3D Super Resolution [67.2] 本稿では,幾何学的および外観的詳細を付加することにより,粗い3次元モデルをアップサンプルする,単純でモジュラーで汎用的な手法を提案する。
既存の3次元超解像モデルを直接再利用できることを実証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:01:40 GMT)
Towards Graph Foundation Models: A Survey and Beyond [66.4] ファンデーションモデルは、さまざまな人工知能アプリケーションにおいて重要なコンポーネントとして現れてきた。
基礎モデルがグラフ機械学習研究者を一般化し、適応させる能力は、新しいグラフ学習パラダイムを開発する可能性について議論する。
本稿では,グラフ基礎モデル(GFM)の概念を紹介し,その重要な特徴と基礎技術について概説する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:06:42 GMT)
DogeRM: Equipping Reward Models with Domain Knowledge through Model Merging [65.4] textbfDomain knowledtextbfge merged textbfReward textbfModel(DogeRM)を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:01:54 GMT)
SINKT: A Structure-Aware Inductive Knowledge Tracing Model with Large Language Model [64.9] 知識追跡(KT)は、学生が次の質問に正しく答えるかどうかを判断することを目的としている。
大規模言語モデルを用いた構造認識帰納的知識追跡モデル(SINKT)
SINKTは、学生の知識状態と質問表現とを相互作用させることで、対象の質問に対する学生の反応を予測する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:44:52 GMT)
Cutting through buggy adversarial example defenses: fixing 1 line of code breaks Sabre [64.6] SabreはIEEE S&P 2024で受け入れられた敵の例に対する防御である。
まず,勾配マスキングの明確な兆候を示す評価の重大な欠陥を明らかにする。
次に、このマスキング勾配の原因を示す:元の評価コードにバグがある。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:57:59 GMT)
Investigating the potential of Sparse Mixtures-of-Experts for multi-domain neural machine translation [59.4] トレーニング中に見られるさまざまなドメインのデータを扱うことができ、トレーニング中に見つからないドメインに対して堅牢な効率的なモデルを開発することを目的として、マルチドメインニューラルネットワーク翻訳に重点を置いている。
SMOE(Sparse Mixture-of-Experts)モデルは、効率的なモデルスケーリングを可能にするため、このタスクに適していると仮定する。
マルチドメインシナリオにおけるSMoEの有用性を検証するための一連の実験を行い、Transformerの簡単な幅スケーリングは、実際はよりシンプルで驚くほど効率的なアプローチであり、SMoEと同等の性能レベルに達することを発見した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:45:22 GMT)
Roleplay-doh: Enabling Domain-Experts to Create LLM-simulated Patients via Eliciting and Adhering to Principles [58.8] ドメインエキスパートから定性的なフィードバックを引き出す新しい人間-LLMコラボレーションパイプラインであるRoleplay-dohを開発した。
このパイプラインを適用して、シニアメンタルヘルスサポーターが、シミュレートされた実践パートナのためにカスタマイズされたAI患者を作成できるようにします。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:43:02 GMT)
PosterLLaVa: Constructing a Unified Multi-modal Layout Generator with LLM [58.7] 本研究では,グラフィックレイアウトの自動生成のための統合フレームワークを提案する。
データ駆動方式では、レイアウトを生成するために構造化テキスト(JSONフォーマット)とビジュアルインストラクションチューニングを用いる。
我々は、大規模な実験を行い、パブリックなマルチモーダルレイアウト生成ベンチマーク上で、最先端(SOTA)性能を達成した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:05:58 GMT)
Scene Graph Generation in Large-Size VHR Satellite Imagery: A Large-Scale Dataset and A Context-Aware Approach [58.0] 衛星画像(SAI)におけるシーングラフ生成(SGG)は、認識から認知へのシナリオのインテリジェントな理解を促進する。
画像サイズは512 x 768から27,860 x 31,096ピクセルで、RSGと命名され、210,000以上のオブジェクトと40,000以上のトリプルを含む大規模VHR SAIのSGG用データセットを構築した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:10:43 GMT)
SCAR: Efficient Instruction-Tuning for Large Language Models via Style Consistency-Aware Response Ranking [56.9] 本研究は、応答スタイルをプレゼンテーションスタイルとコンポジションスタイルに分解する。
SCAR(Style Consistency-Aware Response Ranking)を紹介する。
SCARは、そのレスポンススタイリスティックな一貫性に基づいて、トレーニングセット内の命令-レスポンスペアを優先順位付けする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:55:01 GMT)
AdaOcc: Adaptive Forward View Transformation and Flow Modeling for 3D Occupancy and Flow Prediction [56.7] CVPR 2024 における nuScenes Open-Occ データセットチャレンジにおいて,視覚中心の3次元活動とフロー予測トラックのソリューションを提案する。
我々の革新的なアプローチは、適応的なフォワード・ビュー・トランスフォーメーションとフロー・モデリングを取り入れることで、3次元の占有率とフロー予測を向上させる2段階のフレームワークである。
提案手法は回帰と分類を組み合わせることで,様々な場面におけるスケールの変動に対処し,予測フローを利用して将来のフレームに現行のボクセル特徴をワープする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:32:15 GMT)
OSL-ActionSpotting: A Unified Library for Action Spotting in Sports Videos [56.4] 我々は,スポーツビデオ分析における研究と応用の合理化のために,さまざまなアクションスポッティングアルゴリズムを統合するPythonライブラリであるOSL-ActionSpottingを紹介する。
我々はOSL-ActionSpottingに3つの基本アクションスポッティング手法を統合することに成功した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:17:37 GMT)
Bytes Are All You Need: Transformers Operating Directly On File Bytes [55.8] 推論時にファイルの復号化を必要とせず、ファイルバイトの分類を行うことにより、モダリティ非依存表現学習について検討する。
私たちのモデルであるByteFormerは、ImageNet Top-1の分類精度を$5%改善します。
我々は、同じByteFormerアーキテクチャが、修正やモダリティ固有の前処理なしでオーディオ分類を行うことができることを示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:54:17 GMT)
Expressive and Generalizable Low-rank Adaptation for Large Models via Slow Cascaded Learning [55.6] LoRA Slow Cascade Learning (LoRASC)は、LoRAの表現性と一般化能力を高めるために設計された革新的な技術である。
提案手法は,混合低ランク適応を可能にするカスケード学習戦略により表現性を増強し,複雑なパターンをキャプチャするモデルの能力を高める。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:28:59 GMT)
A General Verification Framework for Dynamical and Control Models via Certificate Synthesis [55.0] システム仕様を符号化し、対応する証明書を定義するためのフレームワークを提供する。
コントローラと証明書を形式的に合成する自動化手法を提案する。
我々のアプローチは、ニューラルネットワークの柔軟性を利用して、制御のための安全な学習の幅広い分野に寄与する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:08:14 GMT)
Exploring the Potential of Large Language Models in Computational Argumentation [54.9] 大規模言語モデル (LLM) は、文脈を理解し、自然言語を生成するという印象的な能力を実証している。
この研究は、ChatGPT、Flanモデル、LLaMA2モデルなどのLLMをゼロショットと少数ショットの両方で評価することを目的としている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:40:58 GMT)
EgoVideo: Exploring Egocentric Foundation Model and Downstream Adaptation [54.3] CVPR 2024のEgoVis Challengesには、Ego4Dチャレンジの5トラックとEPIC-Kitchensチャレンジの3トラックが含まれています。
ビデオ言語2towerモデルを構築し,厳密に整理された自我中心型ビデオデータを活用することにより,EgoVideoという新しい基礎モデルを導入する。
このモデルは、エゴセントリックなビデオの特徴に特化して設計されており、当社のコンペティションへの強力なサポートを提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:44:11 GMT)
Mimicking User Data: On Mitigating Fine-Tuning Risks in Closed Large Language Models [53.5] 小さなデータセット上の微調整された大きな言語モデルは、特定の下流タスクのパフォーマンスを向上させることができる。
悪意のあるアクターは、ほぼすべてのタスク固有のデータセットの構造を微妙に操作することで、より危険なモデル行動を促進することができる。
本稿では,タスク形式を模倣した安全データとユーザデータのスタイルを混合した新しい緩和戦略を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:17:58 GMT)
MoreStyle: Relax Low-frequency Constraint of Fourier-based Image Reconstruction in Generalizable Medical Image Segmentation [53.2] MoreStyleと呼ばれるデータ拡張のためのPlug-and-Playモジュールを紹介します。
MoreStyleは、フーリエ空間の低周波制約を緩和することで、イメージスタイルを多様化する。
敵対的学習の助けを借りて、MoreStyleは潜在機能の中で最も複雑なスタイルの組み合わせを指差している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:52:58 GMT)
CRAB: Cross-environment Agent Benchmark for Multimodal Language Model Agents [52.8] Crabは、クロス環境タスクをサポートするように設計された最初のベンチマークフレームワークである。
私たちのフレームワークは複数のデバイスをサポートし、Pythonインターフェースで簡単に任意の環境に拡張できます。
実験の結果, GPT-4oの単剤は35。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:55:04 GMT)
Normalization and effective learning rates in reinforcement learning [52.6] 正規化層は近年,深層強化学習と連続学習文学においてルネッサンスを経験している。
正規化は、ネットワークパラメータのノルムにおける成長と効果的な学習速度における崩壊の間の等価性という、微妙だが重要な副作用をもたらすことを示す。
そこで本研究では,正規化・プロジェクトと呼ぶ単純な再パラメータ化により,学習率を明示的にする手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:58:01 GMT)
A Closer Look at Deep Learning on Tabular Data [52.5] タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:24:07 GMT)
IID Relaxation by Logical Expressivity: A Research Agenda for Fitting Logics to Neurosymbolic Requirements [50.6] 本稿では、ニューロシンボリック・ユースケースにおける既知のデータ依存と分布制約を利用する利点について論じる。
これは、ニューロシンボリックな背景知識と、その論理に必要とされる表現性に関する一般的な疑問を伴う新しい研究課題を開く。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:44:38 GMT)
fVDB: A Deep-Learning Framework for Sparse, Large-Scale, and High-Performance Spatial Intelligence [50.4] fVDBは、大規模な3Dデータのディープラーニングのための新しいフレームワークである。
私たちのフレームワークは、既存のパイプラインとの相互運用性を可能にするPyTorchと完全に統合されています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:20:33 GMT)
DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.4] 我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:58:22 GMT)
KV Cache Compression, But What Must We Give in Return? A Comprehensive Benchmark of Long Context Capable Approaches [49.4] 長期の文脈能力は、大規模言語モデル(LLM)にとって重要な能力である
この研究は、現在の手法の分類を提供し、長いコンテキストタスクの7つのカテゴリにまたがる10以上の最先端のアプローチを評価する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:59:47 GMT)
CVLUE: A New Benchmark Dataset for Chinese Vision-Language Understanding Evaluation [49.4] 我々は、新しい中国語ビジョン言語理解評価ベンチマークデータセットを提案する。
オブジェクトカテゴリとイメージの選択は、完全に中国のネイティブスピーカーによって駆動される。
中国文化関連VLデータセットの微調整により,VLMの中国文化理解が効果的に向上することが確認された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:35:37 GMT)
Influence of a squeezed prewell on tunneling properties and bound states in heterostructures [49.2] 荷電粒子の伝送に対する極薄電位井戸の共振トンネル効果について検討した。
ピーク・ツー・ヴァレー比は井戸のスクイーズによって著しく増加することが示されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:24:57 GMT)
Calibrated Large Language Models for Binary Question Answering [49.2] よく校正されたモデルは、その予測が正しい可能性を正確に反映する確率を生成するべきである。
本稿では、帰納的Venn-Abers予測器(IVAP)を用いて、バイナリラベルに対応する出力トークンに関連する確率をキャリブレーションする手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:31:03 GMT)
The signaling dimension in generalized probabilistic theories [49.0] 物理系のシグナリング次元は、与えられた系のすべての入出力相関を再現するために必要な古典系の最小次元を定量化する。
線量測定を線量効果で考えるのに十分であることを示すとともに、そのような測定の要素の数を線形次元で表す。
有限個の極端効果を持つ系に対しては、極端測定を光線-極端効果で特徴づけるという問題を再放送する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:39:37 GMT)
WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models [48.2] WaterBenchは、大規模言語モデル(LLM)における透かしの最初の包括的なベンチマークである。
LLM透かしの最初の総合的なベンチマークであるWaterBenchを紹介し、3つの重要な要素を設計する。
オープンソースの透かしを2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/2ドル/3ドル/3ドル/3ドル/3ドル/3ドル/3ドル/3ドル/3ドル/3ドル/3ドル/3ドル/
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:17:42 GMT)
MIA-Bench: Towards Better Instruction Following Evaluation of Multimodal LLMs [47.9] MIA-Benchは、マルチモーダルな大規模言語モデル(MLLM)を、複雑な命令に厳密に準拠する能力に基づいて評価するために設計されたベンチマークである。
私たちのベンチマークでは、400のイメージプロンプトペアで構成されており、それぞれが階層化された命令に対するモデルのコンプライアンスに挑戦するために作られています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:53:35 GMT)
From Introspection to Best Practices: Principled Analysis of Demonstrations in Multimodal In-Context Learning [47.8] マルチモーダルICLの動作の背景となる原理について検討する。
マルチモーダル ICL では,タスクごとにモダリティが異なることが示される。
本原理分析は,マルチモーダル・イン・コンテクスト学習における実演の役割を包括的に理解する方法を提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:57:21 GMT)
Hypformer: Exploring Efficient Hyperbolic Transformer Fully in Hyperbolic Space [47.4] 双曲幾何学のローレンツモデルに基づく新しい双曲変換器Hypformerを導入する。
我々は,双曲空間における線形自己保持機構を開発し,双曲変換器が数十億のグラフデータと時系列入力を初めて処理できるようにする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:44:38 GMT)
End-to-End Breast Cancer Radiotherapy Planning via LMMs with Consistency Embedding [47.4] 放射線腫瘍学の分野に適した包括的大規模マルチモーダルモデル(LMM)であるRO-LMMを提案する。
このモデルは臨床ワークフロー内の一連のタスクを効果的に管理し、臨床コンテキストの要約、放射線治療計画の提案、計画誘導されたターゲットボリュームセグメンテーションを含む。
クリーン入力処理の整合性を維持しつつ,LMMのノイズ入力に対する堅牢性を向上する,CEFTune(Consistency Embedding Fine-Tuning)技術を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:51:59 GMT)
Fast and Efficient: Mask Neural Fields for 3D Scene Segmentation [47.1] MaskFieldは、弱い監督下でニューラルネットワークによる3Dオープン語彙セグメンテーションを可能にする。
トレーニング中の高次元CLIP機能の直接的なハンドリングを克服する。
非常に高速な収束を実現し、トレーニングのわずか5分で従来の方法より優れています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:07:26 GMT)
Mobile-Bench: An Evaluation Benchmark for LLM-based Mobile Agents [46.8] 大規模言語モデル(LLM)は人間とコンピュータの相互作用においてホットスポットとなっている。
Mobile-Benchは、LLMベースのモバイルエージェントの能力を評価するための新しいベンチマークである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:10:01 GMT)
Explainability of machine learning approaches in forensic linguistics: a case study in geolinguistic authorship profiling [46.6] 法医学的文脈を考慮した機械学習手法の説明可能性について検討する。
我々は、ドイツ語圏のソーシャルメディアデータに基づく未知のテキストのジオ言語的プロファイリングの手段として、多種多様な分類に焦点を当てた。
抽出した語彙的特徴がそれぞれの品種を実際に代表しており、訓練されたモデルは分類の場所名にも依存していることに注意する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:58:11 GMT)
FastCLIP: A Suite of Optimization Techniques to Accelerate CLIP Training with Limited Resources [45.4] 我々は、高度な合成最適化技術に基づいて構築された一般的なCLIPトレーニングフレームワークであるFastCLIPを紹介する。
我々のフレームワークは、通信オーバーヘッドを低減するための効率的な勾配低減戦略を備えている。
我々は、FastCLIPと最先端のトレーニングベースラインのパフォーマンスを、異なる計算スケールでベンチマークする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:37:18 GMT)
$R^3$-NL2GQL: A Model Coordination and Knowledge Graph Alignment Approach for NL2GQL [45.1] 我々はR3$-NL2GQLという新しいアプローチを導入し、ランク付け、書き換え、タスクの精錬のために、小規模と大規模なファンデーションモデルを統合する。
我々は、グラフデータベースマニュアルと選択されたオープンソース知識グラフ(KGs)を基にしたバイリンガルデータセットを開発した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:59:58 GMT)
Meta-Learning Based Optimization for Large Scale Wireless Systems [45.0] 文献における従来の最適化アルゴリズムの限界は、無線システムにおける送信アンテナ数や通信ユーザ数によって増大することが知られている。
本稿では,教師なしメタラーニングに基づく手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:45:27 GMT)
LLM See, LLM Do: Guiding Data Generation to Target Non-Differentiable Objectives [44.8] 合成データ統合の結果を系統的に研究し, モデル特性の受動的継承の影響について検討した。
合成データが「中立」に見える場合でも、モデルが特定の属性に対して驚くほど敏感であることがわかった。
本研究では,非微分不可能な目的に応じて意図的に合成データを制約する用語として,アクティブ継承を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:26:21 GMT)
Unified Dual-Intent Translation for Joint Modeling of Search and Recommendation [44.6] We propose a novel model named Unified Dual-Intents Translation for joint modeling of Search and Recommendation (UDITSR)。
ユーザの推奨する要求意図を正確にシミュレートするために,検索データからの実際のクエリを監視情報として利用し,その生成をガイドする。
大規模な実験では、UDITSRは検索とレコメンデーションの両方においてSOTAベースラインを上回っている。
論文参考訳(メタデータ) (Mon, 01 Jul 2024 02:36:03 GMT)
Are LLMs Rational Investors? A Study on Detecting and Reducing the Financial Bias in LLMs [44.5] 大規模言語モデル(LLM)は、複雑な市場データとトレンドを解釈する金融分析において、ますます採用されている。
Financial Bias Indicators (FBI)は、Bias Unveiler、Bias Detective、Bias Tracker、Bias Antidoteといったコンポーネントを備えたフレームワークである。
我々は、23のLLMを評価し、財務因果知識に基づく非バイアス化手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:42:15 GMT)
Harnessing the Power of MLLMs for Transferable Text-to-Image Person ReID [44.4] 本稿では,提案する大規模データベース上でモデルをトレーニングするReID問題について検討する。
MLLM(Multi-modal Large Language Models)による訓練データを得る。
画像に対応しない記述中の単語を自動的に識別する新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:06:31 GMT)
Federated Temporal Difference Learning with Linear Function Approximation under Environmental Heterogeneity [44.2] モデル推定の交換により,エージェント数の線形収束速度が向上することを示す。
低ヘテロジニティ系では、モデル推定を交換すると、エージェントの数で線形収束速度が向上する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:07:58 GMT)
Optimizing Age of Information in Vehicular Edge Computing with Federated Graph Neural Network Multi-Agent Reinforcement Learning [44.2] 本稿では,データ更新の鍵となる情報時代(AoI)に着目し,RSU通信資源制約下での車両のタスクオフロード問題について検討する。
本稿では,Federated Graph Neural Network Multi-Agent Reinforcement Learning (FGNN-MADRL) と名付けたグラフニューラルネットワーク(GNN)を組み合わせた分散分散学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:37:38 GMT)
Stationary Kernels and Gaussian Processes on Lie Groups and their Homogeneous Spaces II: non-compact symmetric spaces [43.9] 対称性は、考慮できる事前情報の最も基本的な形態の1つである。
本研究では,非ユークリッド空間の非常に大きなクラス上に定常ガウス過程を構築するための構築的および実践的手法を開発する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:48:19 GMT)
Recovering the Pre-Fine-Tuning Weights of Generative Models [43.6] そこで本研究では,いくつかの低ランク(LoRA)微調整モデルを用いて,プレファインチューニングモデルの重みを復元する手法を提案する。
このアプローチでは、パーソナライズされたStable DiffusionやアライメントされたMistralといった大規模モデルに対して、この新しい脆弱性を活用しています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:48:51 GMT)
Addressing a fundamental limitation in deep vision models: lack of spatial attention [43.4] この写本の目的は、現在の深層学習モデル、特に視覚モデルにおいて重要な限界を強調することである。
我々は、次世代のより効率的な視覚モデルに道を開くことのできるソリューションを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:21:09 GMT)
μ-Bench: A Vision-Language Benchmark for Microscopy Understanding [43.3] 視覚言語モデル(VLM)は、大規模生物学的画像解析に有望なソリューションを提供する。
VLMを評価するための、標準化された、多様な、そして大規模なビジョンベンチマークが欠如している。
mu-Benchは22のバイオメディカルタスクを含む専門家によるベンチマークである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:30:26 GMT)
Tokenize the World into Object-level Knowledge to Address Long-tail Events in Autonomous Driving [43.2] 従来のエンド・ツー・エンドの運転モデルは、トレーニング・ディストリビューション内での珍しいまたは目に見えない入力のために、長い尾のイベントに悩まされる。
オブジェクトレベルの知識に世界をトークン化する新しい多モード大規模言語モデル(MM-LLM)であるTOKENを提案する。
ToKENは、従来のエンドツーエンドの駆動モデルを活用することにより、データの不足と非効率なトークン化を効果的に軽減する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:34:50 GMT)
How Does Overparameterization Affect Features? [43.0] まず、これらのモデルの特徴の表現性について検討し、パラメータ化されていない多くの特徴を連結することにより、オーバーパラメータ化ネットワークの特徴空間を分散できないことを示す。
次に、これらのモデルの性能を評価し、パラメータ化されたネットワークでは、パラメータ化されたネットワークよりも性能が高いことを示す。
本稿では,パラメータ化ネットワークが学習できない重要な特徴を,パラメータ化ネットワークがいかに学習できるかを説明するための玩具セットを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:01:03 GMT)
DynaThink: Fast or Slow? A Dynamic Decision-Making Framework for Large Language Models [43.0] 大規模言語モデル(LLM)は、Chains-of-Thoughtプロンプトを通じて、さまざまな推論タスクにまたがる創発的な機能を示している。
本稿では,LLMが高速かつ低速な推論手法を自律的に選択できることの課題に対処する。
LLMが高速に高信頼の解を識別するタスクに指定された「Fast」と、LLMが複雑だと認識するタスクに割り当てられた「Slow」という2つの異なる経路に分類する動的意思決定フレームワークを導入する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:45:13 GMT)
Learning Unsigned Distance Fields from Local Shape Functions for 3D Surface Reconstruction [42.8] 本稿では, 局所形状関数を利用してUDFを学習し, 3次元点雲から表面を再構成する新しいニューラルネットワーク, LoSF-UDFを提案する。
3D形状は局所的な領域で単純なパターンを示すので、ポイントクラウドパッチのトレーニングデータセットを作成するのに役立ちます。
提案手法は,各問合せ点付近の特定の半径内の特徴を学習し,注意機構を用いてUDF推定の重要な特徴に焦点をあてる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:39:03 GMT)
TransferAttn: Transferable-guided Attention Is All You Need for Video Domain Adaptation [42.6] ビデオにおける教師なしドメイン適応(UDA)は、画像ベースのUDA技術と比較しても十分に検討されていない課題である。
視覚変換器(ViT)は多くのコンピュータビジョンタスクで最先端のパフォーマンスを達成する。
我々のキーとなる考え方は、トランスフォーマー層を特徴として利用し、空間的および時間的伝達可能性の関係をアテンション機構に組み込むことである。
Transferable-Guided Attention (TransferAttn)フレームワークが開発され、トランスフォーマーの能力を利用してドメイン間の知識を適応する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:29:27 GMT)
Deepfake Audio Detection Using Spectrogram-based Feature and Ensemble of Deep Learning Models [42.4] 本稿では,ディープフェイク音声検出作業のためのディープラーニングベースシステムを提案する。
特に、ドロー入力オーディオは、まず様々なスペクトログラムに変換される。
我々は、Whisper、Seamless、Speechbrain、Pyannoteといった最先端のオーディオ事前訓練モデルを利用して、オーディオ埋め込みを抽出する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:10:43 GMT)
PointViG: A Lightweight GNN-based Model for Efficient Point Cloud Analysis [42.2] 本研究では,点雲解析のための効率的なフレームワークであるb>Pointb>sion b>Gb>NN(PointViG)を紹介する。
PointViGには、ローカル機能を効率的に集約する軽量なグラフ畳み込みモジュールが組み込まれている。
実験により、PointViGは最先端のモデルに匹敵する性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:55:45 GMT)
RouteLLM: Learning to Route LLMs with Preference Data [41.7] 大きな言語モデル(LLM)は、幅広いタスクにわたって印象的な機能を示すが、どのモデルを使うかの選択は、パフォーマンスとコストのトレードオフを伴うことが多い。
推論において,より強いLLMと弱いLLMを動的に選択する効率的なルータモデルを提案する。
我々は、人間の嗜好データとデータ拡張技術を利用して、これらのルータのためのトレーニングフレームワークを開発し、性能を向上する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:38:08 GMT)
Empirical Tests of Optimization Assumptions in Deep Learning [41.1] 本稿では,理論解析において制御しなければならない重要な量を追跡するための新しい経験的指標を開発する。
テストされたすべての仮定は、確実に最適化性能を捉えられません。
このことは、理論解析に使用される解析的仮定の新しい実証的検証の必要性を強調している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:56:54 GMT)
DistML.js: Installation-free Distributed Deep Learning Framework for Web Browsers [40.5] DistML.jsは、Webブラウザ内で機械学習モデルのトレーニングと推論のために設計されたライブラリである。
実用的なアプリケーションとともに、DistML.jsの設計、API、実装に関する包括的な説明を提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:13:14 GMT)
RegMix: Data Mixture as Regression for Language Model Pre-training [40.5] 本稿では,レグレッションタスクとして定式化することで,ハイパフォーマンスなデータ混合物を自動的に識別するRegMixを提案する。
RegMixでは、さまざまなデータ混在の小さなモデルのセットをトレーニングし、レグレッションモデルを適用してパフォーマンスを予測する。
提案手法は,人間の選択に比較して優れた性能を示し,DoReMiに匹敵する結果を得る。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:31:03 GMT)
AutoFlow: Automated Workflow Generation for Large Language Model Agents [39.7] 大規模言語モデル(LLM)は、複雑な自然言語を理解する上で大きな進歩を見せている。
LLMエージェントが与えられたタスクを解決するための効果的で信頼性の高い手順に従うようにするために、手動で設計されるのが通常である。
複雑なタスクを解決するためにエージェントを自動的に生成するフレームワークであるAutoFlowを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:05:02 GMT)
SignCLIP: Connecting Text and Sign Language by Contrastive Learning [39.7] SignCLIPは、大規模な多言語ビデオテキストペアから手話処理に有用な視覚表現を学習する効率的な方法である。
SpreadthesignでSignCLIPを事前訓練し,最大44の手話で5万本のビデオクリップを収録した手話辞書を作成した。
我々は、音声言語テキストと手話ポーズによって形成される潜伏空間を分析し、さらなる言語学的洞察を提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:17:35 GMT)
GraphWiz: An Instruction-Following Language Model for Graph Problems [39.7] GraphInstructは、言語モデルに明示的な推論パスを用いて、幅広いグラフ問題に対処する機能を持たせるために設計されたデータセットである。
GraphWizは、明確な推論プロセスを生成しながら、さまざまなグラフ問題タイプを解決できるオープンソースの言語モデルです。
拡張モデルであるGraphWiz-DPOは、9つのタスクで平均65%の精度を達成し、GPT-4を平均43.8%上回っている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:15:38 GMT)
Improving Multilingual Instruction Finetuning via Linguistically Natural and Diverse Datasets [38.9] ほとんどのインストラクションファインチューニング(IFT)データセットは、主に英語で書かれており、他の言語でのモデルパフォーマンスが制限されている。
多言語IFTデータセットを作成する従来の方法は、言語的ニュアンスを捕捉し、迅速な(指示)多様性を確保するのに苦労している。
本稿では,言語的自然性を維持し,迅速な多様性を保証する多言語IFTデータセットの収集手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:47:09 GMT)
Video-Language Understanding: A Survey from Model Architecture, Model Training, and Data Perspectives [38.8] 人間は環境を理解するために複数の感覚を使う。視覚と言語は、私たちの思考を簡単に伝え、周りの世界を知覚できるため、最も重要な感覚の2つだ。
ビデオ言語ペアは、我々の言語媒体と視覚環境の両方を時間的ダイナミクスで模倣できるので、ヒューマンライクな感覚でビデオ言語理解システムを構築することには、多くの関心が寄せられている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:05:01 GMT)
Information Density Bounds for Privacy [36.9] 本稿では,プライベートデータと公開データ間の情報密度を低くすることで,プライバシ保証の意義を考察する。
我々は、ポイントワイド・最大コスト(PMC)と呼ばれる運用上有意義なプライバシー対策を導入し、PMCに上界を付与することは、情報密度に下限を課すことと等価であることを示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:38:02 GMT)
Adversaries Can Misuse Combinations of Safe Models [36.9] 開発者は、AIシステムが敵によって悪用されるかどうかを、リリース前に評価しようとする。
各モデルが安全である場合でも、敵はモデルの組み合わせを誤用できることを示す。
私たちの研究は、完全に整合したフロンティアシステムでさえ、悪意のある出力を生成することなく、誤用を可能にすることを示唆しています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:58:00 GMT)
EquiBot: SIM(3)-Equivariant Diffusion Policy for Generalizable and Data Efficient Learning [36.0] 本研究では,ロボット操作タスク学習のための頑健で,データ効率が高く,汎用的なアプローチであるEquiBotを提案する。
提案手法は,SIM(3)等価なニューラルネットワークアーキテクチャと拡散モデルを組み合わせたものである。
実世界では,新しいオブジェクトやシーンに容易に一般化できる6つのモバイル操作タスクの合計10種類のバリエーションが示される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:09:43 GMT)
A Simple Framework for Open-Vocabulary Zero-Shot Segmentation [36.0] SimZSSはオープン語彙のZero-Shotセグメンテーションのためのフレームワークである。
テキストと言語知識の離散的な性質を利用して、字幕内の局所的な概念をピンポイントする。
SimZSSは,8つのベンチマークデータセットのうち7つについて,15分以内で最先端の結果を達成している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:33:12 GMT)
E-ANT: A Large-Scale Dataset for Efficient Automatic GUI NavigaTion [34.9] textbfE-ANTは中国初のGUIナビゲーションデータセットで、5000以上の小さなappsで4万の人間がトレースしている。
各種MLLMをE-ANT上で評価し,実験結果を十分な精度で示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:37:14 GMT)
3D Human Mesh Estimation from Virtual Markers [34.7] 体表面上の64個のランドマークキーポイントを学習する仮想マーカーを中間表現として提示する。
提案手法は3つのデータセット上で最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:20:37 GMT)
Look Ahead or Look Around? A Theoretical Comparison Between Autoregressive and Masked Pretraining [34.6] 自己回帰型SSLとマスク型SSLの2つの主要な生成型SSLパラダイム間の最初の理論的比較を確立する。
分類タスクでは、マスクされたSSLにおけるターゲットトークンの柔軟性により、よりサンプル間の接続が促進される。
コンテンツ生成タスクでは、テストサンプルの柔軟な長さと未翻訳テキストの固定長との相違が、その生成性能を妨げる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:35:59 GMT)
FAFE: Immune Complex Modeling with Geodesic Distance Loss on Noisy Group Frames [34.0] FAPE(Frame Aligned Point Error)として知られるAF2の一次損失関数の解析
フレームアラインドフレームエラー(FAFE)と呼ばれる新しい測地損失を提案する。
評価セットで52.3%(DockQ $>$ 0.23)、低ホモロジーのサブセットで43.8%の正レートを達成し、それぞれAF2を182%、100%と大幅に改善した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:47:21 GMT)
Unleashing the Power of Meta-tuning for Few-shot Generalization Through Sparse Interpolated Experts [33.6] Sparse MetA-Tuning (SMAT) はスパース・ミックス・オブ・エキスパート・アプローチにインスパイアされた手法である。
SMATはOOD感度を克服し、ビジョンファウンデーションモデルの転送能力を高めることを約束する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:29:16 GMT)
MathCAMPS: Fine-grained Synthesis of Mathematical Problems From Human Curricula [33.6] 本研究では,高品質な数学問題を大規模に合成する手法であるMath CAMPSを提案する。
それぞれの標準を形式文法でエンコードし、様々な記号問題とその解をサンプリングする。
我々は、記号構造からフォローアップ質問を導き、それらをフォローアップ単語問題に変換する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:56:28 GMT)
Enhancing the Capability and Robustness of Large Language Models through Reinforcement Learning-Driven Query Refinement [32.9] 大きな言語モデル(LLM)の、正直で無害で有用な応答を生成する能力は、ユーザープロンプトの品質に大きく依存している。
本研究では,LSMに入力される前にユーザプロンプトを洗練する,転送可能でプラグイン可能なフレームワークを提案する。
この戦略はクエリの品質を改善し、LCMにより誠実で良質で有用なレスポンスを生成する権限を与えます。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:55:28 GMT)
From Alexnet to Transformers: Measuring the Non-linearity of Deep Neural Networks with Affine Optimal Transport [32.4] 本稿では,DNNの非線形性シグネチャの概念を紹介する。これはディープニューラルネットワークの非線形性を測定するための,理論上初めての音響解である。
提案した非線形署名の実用性を明らかにするための実験結果について述べる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:39:54 GMT)
Fast Unsupervised Deep Outlier Model Selection with Hypernetworks [32.2] 我々はDODモデルのチューニングにHYPERを導入し、監視なしでの検証とHP/モデル空間の効率的な探索という2つの基本的な課題に対処する。
鍵となるアイデアは、HPをメインのDODモデルの最適な重みにマッピングする新しいハイパーネットワーク(HN)を設計し、訓練することである。
HYPERは、多くのDODモデルの重みを動的に生成できる単一のHNを利用する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:10:34 GMT)
Geometry-Aware Score Distillation via 3D Consistent Noising and Gradient Consistency Modeling [31.9] 我々は,3次元一貫したノイズ発生,幾何に基づく勾配のゆらぎ,新しい勾配のゆらぎの損失を導入する。
我々は,テキスト・ツー・3次元生成タスクにおける幾何学的不整合を最小限のコストで解決し,既存のスコア蒸留モデルとの整合性を実現した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:55:12 GMT)
Needle in the Haystack for Memory Based Large Language Models [31.9] 本稿では,メモリ拡張型大規模言語モデル(LLM)アーキテクチャを用いて,潜在的に長いコンテキストから事実のリコール能力を向上させることのメリットを実証する。
ケーススタディでは,LLMデコーダを外部連想メモリで拡張するLLMアーキテクチャであるLARIMARをテストする。
テスト時に外部メモリを適応させて、トレーニング中に見られるものよりもはるかに長いコンテキストを処理できることを実証します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:32:16 GMT)
Towards Robust Physical-world Backdoor Attacks on Lane Detection [31.8] ディープラーニングに基づく車線検出(LD)は、適応クルーズ制御のような自律走行システムにおいて重要な役割を果たす。
LD上の既存のバックドア攻撃手法は、動的現実シナリオにおいて限られた効果を示す。
本稿では,現実の動的シーン要因の変化に耐えるように設計されたLDの動的シーン適応バックドアアタックであるBadLANEを紹介する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:27:42 GMT)
Searching for Best Practices in Retrieval-Augmented Generation [31.4] Retrieval-augmented Generation (RAG) 技術は最新情報の統合に有効であることが証明されている。
本稿では,既存のRAG手法とその潜在的な組み合わせについて検討し,最適なRAG手法を同定する。
我々は、パフォーマンスと効率のバランスをとるRAGをデプロイするためのいくつかの戦略を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:06:34 GMT)
We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic Fields [30.6] 自然言語処理の分野横断は減少している。
NLPの引用の8%以下は言語学に関するものである。
NLPの引用の3%以下は数学と心理学に関するものである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:31:46 GMT)
ProTrix: Building Models for Planning and Reasoning over Tables with Sentence Context [30.3] 本稿では,テーブル上のクエリに文コンテキストで応答するPlan-then-Reasonフレームワークを提案する。
フレームワークはまず、コンテキスト上の推論パスを計画し、次に各ステップをプログラムベースまたはテキスト推論に割り当てて最終回答に到達する。
このフレームワークは、コンテキスト内学習と微調整の両方におけるテーブル推論能力を向上させる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:31:21 GMT)
ExcelFormer: A neural network surpassing GBDTs on tabular data [30.1] ExcelFormerは、堅牢で、効果的で、データセットに耐性があり、ユーザフレンドリな表形式予測アプローチのためのフレームワークである。
ExcelFormerは、(P1)回転分散特性の欠如、(P2)大容量データ需要、(P3)過滑らかなソリューションなど、深い表形式モデルの3つの重要な欠点に対処する。
実世界のデータセットで実施された大規模で階層化された実験は、我々のモデルが過去のアプローチより優れていることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:26:51 GMT)
Efficient Expert Pruning for Sparse Mixture-of-Experts Language Models: Enhancing Performance and Reducing Inference Costs [30.1] 我々は,SMoEモデルのエキスパートの育成を促進するため,EEP(Efficient Expert Pruning)と呼ばれる勾配のない進化戦略を導入する。
EEPは、ダウンストリームタスクのパフォーマンスを維持したり改善したりしながら、モデル推論(すなわち、勾配計算をしない)とより大きな疎性にのみ依存する。
実験の結果,Mixtral 8times7$B-Instructのエキスパートの75%が,性能損失を最小限に抑えたパラメータの大幅な削減を達成できた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:57:35 GMT)
Mask and Compress: Efficient Skeleton-based Action Recognition in Continual Learning [29.6] CHARON(Continual Human Action Recognition On skeletoNs)を導入し、効率的なフレームワーク内で動作しながら一貫した性能を維持する。
Split NTU-60 と提案した Split NTU-120 データセットに関する実験により,CHARON がこの領域に新たなベンチマークを設定できることが示されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:48:49 GMT)
A Policy Gradient Primal-Dual Algorithm for Constrained MDPs with Uniform PAC Guarantees [29.0] オンラインマルコフ制約決定過程(CMDP)に対する原始二重強化学習(RL)アルゴリズムについて検討する。
本稿では,一様に近似した正当性(Uniform-PAC)を保証し,最適ポリシへの収束,サブ線形後悔,任意の目標精度に対するサンプル複雑性を同時に確保する,新しいポリシー勾配PDアルゴリズムを提案する。
特に、これはオンラインCMDP問題に対する最初のUniform-PACアルゴリズムである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:08:25 GMT)
Causal Bandits: The Pareto Optimal Frontier of Adaptivity, a Reduction to Linear Bandits, and Limitations around Unknown Marginals [28.9] 条件付き良性環境と任意の環境下での学習性能におけるトレードオフの可能性について,上界と下界の整合性を証明した。
この問題を線形バンディット設定に還元することで、最初に因果バンディットのインスタンス依存境界を求める。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:12:15 GMT)
The Potential and Challenges of Evaluating Attitudes, Opinions, and Values in Large Language Models [28.7] 本稿では,大規模言語モデル(LLM)における態度,意見,価値(AOV)の評価に関する最近の研究の概要について述べる。
これにより、社会科学におけるモデル、人間とAIの整合性、下流の応用を理解するための可能性と課題に対処する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:04:09 GMT)
CLEME2.0: Towards More Interpretable Evaluation by Disentangling Edits for Grammatical Error Correction [28.5] 本稿では,文法的誤り訂正(GEC)メトリクスの解釈可能性の向上に焦点をあてる。
GECシステムの4つの基本次元を記述可能な基準ベース評価戦略であるCLEME2.0を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:35:58 GMT)
The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.4] 我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:30:57 GMT)
Entrywise Inference for Missing Panel Data: A Simple and Instance-Optimal Approach [27.3] 停滞した採用によって引き起こされたパネルデータの欠落データバージョンに関連する推論的疑問を考察する。
我々は、予め特定されたカバレッジでエントリワイドな信頼区間を構築するためのデータ駆動方式を開発し、分析する。
我々は、欠落したエントリを推定する際に、そのエラーに非漸近的かつ高い確率境界を証明した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:10:28 GMT)
Uni-Mol2: Exploring Molecular Pretraining Model at Scale [27.2] 原子レベル, グラフレベル, 幾何学構造レベルを統合した分子事前学習モデルUni-Mol2を提案する。
我々は8億のコンフォメーションを事前トレーニングすることで、Uni-Mol2を11億のパラメータに拡張することに成功し、これまでで最大の分子前訓練モデルとなった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:08:44 GMT)
Textual Similarity as a Key Metric in Machine Translation Quality Estimation [27.2] 機械翻訳(MT)品質評価(QE)は、参照テキストなしで翻訳信頼性を評価する。
本研究では、文変換器とコサイン類似度を用いて意味的近接度を測定することにより、QEの新しい指標として「テキスト類似性」を導入する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:30:34 GMT)
UniST: A Prompt-Empowered Universal Model for Urban Spatio-Temporal Prediction [26.7] 都市時間予測は、交通管理、資源最適化、出現応答などの情報的意思決定に不可欠である。
大規模言語モデルによる広範囲のシナリオにまたがる一般都市時間予測のためのユニバーサルモデルUniSTを紹介する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:51:58 GMT)
BERGEN: A Benchmarking Library for Retrieval-Augmented Generation [26.2] Retrieval-Augmented Generationは、外部知識による大規模言語モデルの拡張を可能にする。
一貫性のないベンチマークは、アプローチを比較し、パイプライン内の各コンポーネントの影響を理解する上で大きな課題となる。
本研究では,RAGを体系的に評価するための基礎となるベストプラクティスと,RAG実験を標準化した再現可能な研究用ライブラリであるBERGENについて検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:09:27 GMT)
Adam-mini: Use Fewer Learning Rates To Gain More [26.0] Adam-miniはAdamの学習率リソースを削減してメモリを削減します。
Adam-miniは、メモリフットプリントを45%から50%削減したAdamWよりも、オンパーまたは優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:46:19 GMT)
An Empirical Comparison of Generative Approaches for Product Attribute-Value Identification [25.9] 本稿では,製品属性と価値同定(PAVI)について,これまでで最も包括的な評価を行っている。
3つのデータセット上での微調整エンコーダデコーダモデルに基づく3つの属性値生成戦略を比較した。
実験により、計算効率のよいエンドツーエンドのAVGアプローチは、他の戦略よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:02:17 GMT)
Minimax Excess Risk of First-Order Methods for Statistical Learning with Data-Dependent Oracles [25.6] 我々は, 強い凸とスムーズな統計的学習の最小限超過リスクに対して, 鋭い上下境界を提供する。
この新しいオーラクルのクラスは、任意のデータ分布で勾配をクエリできる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:44:15 GMT)
FRoG: Evaluating Fuzzy Reasoning of Generalized Quantifiers in Large Language Models [25.5] ファジィ推論のための新しいベンチマークFRoGを導入する。
ファジィ推論は大きな言語モデルにとって大きな課題であり続けている。
また、強い数学的推論スキルが必ずしもベンチマークの成功を示すものではないことも示している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:56:14 GMT)
On the Hardness of Faithful Chain-of-Thought Reasoning in Large Language Models [25.0] 大規模言語モデル(LLM)は、医療などの重要な領域における現実世界のアプリケーションにますます採用されている。
これらのモデルによって生成されたCoT(Chain-of-Thought)推論が、その基盤となる振る舞いを忠実に捉えることが重要である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:36:29 GMT)
Human-like object concept representations emerge naturally in multimodal large language models [24.0] 大規模言語モデルにおける対象概念の表現が人間とどのように関連しているかを明らかにするために,行動解析と神経画像解析を併用した。
その結果,66次元の埋め込みは非常に安定で予測的であり,人間の心的表現に類似したセマンティッククラスタリングが認められた。
本研究は、機械知能の理解を深め、より人間的な人工知能システムの開発を知らせるものである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:17:19 GMT)
Explaining the Explainers in Graph Neural Networks: a Comparative Study [23.5] グラフニューラルネットワーク(GNN)は多くの科学・工学分野に広く応用されている。
近年、GNNの解説者が登場し始めており、多くの手法が他のドメインから導入されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:48:40 GMT)
BeHonest: Benchmarking Honesty of Large Language Models [23.2] 我々は、大規模言語モデルにおける誠実さを評価するために特別に設計された、先駆的なベンチマークであるBeHonestを紹介する。
BeHonest氏は、知識境界の認識、偽造の回避、応答の一貫性の3つの重要な側面を評価している。
以上の結果から,LSMの正直性には改善の余地がまだ残っていることが示唆された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:18:07 GMT)
SplitLoRA: A Split Parameter-Efficient Fine-Tuning Framework for Large Language Models [23.1] SplitLoRAはSFLフレームワーク上に構築されており、FLからの並列トレーニングとSLからのモデル分割の利点を融合している。
SplitLoRAはSL LLMファインチューニングのための最初のオープンソースベンチマークである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:13:25 GMT)
FunBO: Discovering Acquisition Functions for Bayesian Optimization with FunSearch [21.4] 本稿では、FunBOを用いて、コンピュータコードで書かれた新しい取得関数を学習する方法を示す。
本稿では,FunBOが関数のトレーニング分布の内外をよく一般化するAFを特定する方法を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:48:24 GMT)
An Expectation-Maximization Algorithm for Training Clean Diffusion Models from Corrupted Observations [21.4] 本稿では, 予測最大化(EM)手法を提案し, 劣化した観測から拡散モデルを訓練する。
本手法は, 既知拡散モデル(E-step)を用いた劣化データからのクリーン画像の再構成と, これらの再構成(M-step)に基づく拡散モデル重みの精製とを交互に行う。
この反復過程は、学習された拡散モデルを真のクリーンなデータ分布に徐々に収束させる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:00:17 GMT)
Data on the Move: Traffic-Oriented Data Trading Platform Powered by AI Agent with Common Sense [21.4] 私たちはData on The Move(DTM)というトラフィック指向のデータトレーディングプラットフォームを導入しました。
DTMはトラフィックシミュレーション、データトレーディング、AIエージェントを統合する。
提案するAIエージェントベースの価格設定手法は,合理的な価格を提供することでデータトレーディングを強化する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:17:18 GMT)
Gloss2Text: Sign Language Gloss translation using LLMs and Semantically Aware Label Smoothing [21.2] 本稿では,事前学習された大言語モデル(LLM),データ拡張,ラベルの平滑化損失関数を活用することで,いくつかの進歩を提案する。
提案手法は,Em Gloss2Text翻訳における最先端性能を上回る。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:46:45 GMT)
Woven Fabric Capture with a Reflection-Transmission Photo Pair [20.7] 本稿では,2枚の画像から織布のパラメータを復元することを提案する。
携帯電話カメラと2つの点灯で反射・透過写真を撮影し、軽量ネットワークを介して布のパラメータを推定する。
その結果、推定パラメータのレンダリングは、初めて反射と透過の両方の入力画像と一致する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:38:19 GMT)
Proceedings of The second international workshop on eXplainable AI for the Arts (XAIxArts) [20.5] この第2回説明可能なAI for the Arts(XAIxArts)に関する国際ワークショップは、HCI、インタラクションデザイン、AI、説明可能なAI(XAI)、デジタルアートの研究者のコミュニティを集めて、XAI for the Artsの役割を探求した。
第16回 ACM Conference on Creativity and Cognition (C&C 2024) でワークショップを開催した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:49:09 GMT)
StyleShot: A Snapshot on Any Style [20.4] テスト時間チューニングを伴わない汎用的なスタイル転送には,優れたスタイル表現が不可欠であることを示す。
スタイル認識型エンコーダと、StyleGalleryと呼ばれるよく編成されたスタイルデータセットを構築することで、これを実現する。
当社のアプローチであるStyleShotは,テストタイムチューニングを必要とせずに,さまざまなスタイルを模倣する上で,シンプルかつ効果的なものです。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:05:18 GMT)
σ-GPTs: A New Approach to Autoregressive Models [19.8] 出力に位置エンコーディングを追加するだけで、この順序をオンザフライ・イン・サンプルで変調できることを示す。
我々は,言語モデリング,パス解決,航空機の垂直速度予測など,様々な領域にわたる手法の評価を行った。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:46:36 GMT)
ASCENT: Amplifying Power Side-Channel Resilience via Learning & Monte-Carlo Tree Search [19.2] パワーサイドチャネル (PSC) 解析は、暗号ハードウェアのセキュア化に重要である。
以前の技術は、チップ設計自動化から得られたゲートレベルのネットリストの確保に重点を置いていた。
我々は,PSC対策の全体的レジリエンスを高めるため,論理段階を改良する"セキュリティファースト"アプローチを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:52:56 GMT)
SeFlow: A Self-Supervised Scene Flow Method in Autonomous Driving [18.9] 連続したLiDARスキャンで各点における3次元運動を予測する。
現在の最先端の手法は、シーンフローネットワークをトレーニングするために注釈付きデータを必要とする。
本研究では,効率的な動的分類を学習に基づくシーンフローパイプラインに統合するSeFlowを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:22:54 GMT)
GalLoP: Learning Global and Local Prompts for Vision-Language Models [18.6] Global-Local Prompts(GalLoP)は、グローバルとローカルの両方の視覚的特徴を活用する複数の多様なプロンプトを学習する新しいプロンプト学習手法である。
GalLoPは、ドメインの一般化とOOD検出の両方において強い堅牢性を示し、専用のOOD検出方法よりも優れている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:50:15 GMT)
Exploring the Potential of Multi-Modal AI for Driving Hazard Prediction [18.3] 本稿では,車載ダッシュカムが捉えた単一入力画像を用いて,差し迫った事故を予測するためのタスクとして定式化する。
この問題は、不確実な観測に基づいて将来の出来事を予測し、推論する必要がある。
この調査対象領域の研究を可能にするために、DHPRデータセットと呼ばれる新しいデータセットが作成される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:29:39 GMT)
TimeToM: Temporal Space is the Key to Unlocking the Door of Large Language Models' Theory-of-Mind [18.3] 時間空間を構築し,それを基盤として大規模言語モデルのToM能力を向上させるTimeToMを提案する。
本研究では,時間空間における文字間の信念伝達を考慮し,文字の高次信念を他の文字の1次信念に変換する新しいツール・ビリーフ・ソルバを設計する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:50:49 GMT)
Learning to Explore and Select for Coverage-Conditioned Retrieval-Augmented Generation [18.0] ユーザが特定の範囲の情報を要求するシナリオにおけるクエリアウトラインの役割に焦点を当てる。
C2$のシナリオでは、特定のトピックについて様々な視点で10Kの情報検索クエリであるQTreeを構築します。
検索強化世代(RAG)を対象とした自動評価と人的評価によるアウトライン生成の有効性の分析を行った。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:26:19 GMT)
Preserving Multilingual Quality While Tuning Query Encoder on English Only [17.8] 二重エンコーダの問合せ部が英語のみのデータセットで調整された場合、多言語検索の品質がどの程度劣化するかを調べることを目的として実験を行った。
我々は、英語のみのチューニングが、多言語検索の本来の品質を保っているだけでなく、改善していることを観察する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:03:18 GMT)
M-to-N Backdoor Paradigm: A Multi-Trigger and Multi-Target Attack to Deep Learning Models [17.7] 我々は新たな$M$-to-$N$攻撃パラダイムを提案し、攻撃者が任意の入力を操作してターゲットクラスを攻撃できるようにする。
我々の攻撃は、ターゲットクラスごとに$M$のクリーンイメージをトリガーとして選択し、提案した有毒画像生成フレームワークを活用する。
我々の新たなバックドア攻撃は、複数のターゲットクラスを攻撃し、前処理操作や既存の防御に対して堅牢である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:23:31 GMT)
Toward Automated Detection of Biased Social Signals from the Content of Clinical Conversations [17.6] 過度なバイアスは患者と患者の間の相互作用を阻害し、不適切なケアにつながる。
患者と患者との対話において,音声認識(ASR)と自然言語処理(NLP)を用いて社会的信号の同定を行った。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:20:37 GMT)
Open-TeleVision: Teleoperation with Immersive Active Visual Feedback [17.5] Open-TeleVisionは、オペレーターが立体的にロボットの周囲を積極的に知覚することを可能にする。
このシステムは操作者の腕と手の動きをロボットに反映し、没入感のある体験を作り出す。
本システムの有効性は,長期的かつ正確な4つの課題に対して,データ収集と模倣学習ポリシーの訓練によって検証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:55:35 GMT)
Smoothed Analysis for Learning Concepts with Low Intrinsic Dimension [17.5] 教師付き学習の伝統的なモデルでは、学習者の目標は、あるクラスから最も適した概念の競争的($epsilon$以内)な仮説を出力することである。
学習者が最高の無知としか競合しないスムーズな分析フレームワークを導入する。
時間内に$k$-halfspacesの交点を前向きに学習する最初のアルゴリズムを得る。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:58:36 GMT)
Revealing User Familiarity Bias in Task-Oriented Dialogue via Interactive Evaluation [17.4] 我々は,現実的なシナリオに対して,TODシステムがいかに脆弱であるかを明らかにするために,インタラクティブなユーザスタディを実施している。
我々の研究は、オープンゴール設定での会話がシステムの破滅的な失敗につながることを明らかにした。
我々は,システムの能力を超えても,システムがユーザの要求を処理するふりをする,新たな“予測”行動を発見した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:23:10 GMT)
RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing [17.1] RoadFormer(ロードフォーマー)は、トランスフォーマーベースの道路シーン解析用データフュージョンネットワークである。
RoadFormerは、ロードシーン解析のための最先端ネットワークをすべて上回っている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:01:29 GMT)
Distilling Event Sequence Knowledge From Large Language Models [17.1] イベントシーケンスモデルは、イベントの分析と予測に非常に効果的であることが判明した。
我々は大規模言語モデルを用いて、確率的イベントモデル構築に効果的に使用できるイベントシーケンスを生成する。
提案手法は,入力KGの知識ギャップを埋めて,高品質なイベントシーケンスを生成することができることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:43:56 GMT)
DIR-BHRNet: A Lightweight Network for Real-time Vision-based Multi-person Pose Estimation on Smartphones [17.1] スマートフォン上のリアルタイムMPPEのための軽量ニューラルネットワークDIR-BHRNetを提案する。
DIR-BHRNetを現行のAndroidスマートフォンに実装し,10FPS以上の性能を実現している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:49:06 GMT)
Evaluating Knowledge-based Cross-lingual Inconsistency in Large Language Models [16.9] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて例外的な性能を示している。
彼らの成功にもかかわらず、これらのモデルはしばしば異なる言語で同じ概念を処理する際に大きな矛盾を示す。
本研究は,LLMにおける言語間不整合の存在,これらの不整合が現れる特定の側面,LLMの言語間整合性と多言語機能との相関の3つの主要な疑問に焦点をあてる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:11:37 GMT)
Complementary Fusion of Deep Network and Tree Model for ETA Prediction [16.8] 本稿では,木モデルとニューラルネットワークのアンサンブルであるETA推定問題に対する新しい解を提案する。
我々はSIGSPATIAL 2021 GISCUPコンクールで優勝した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:17:09 GMT)
uDistil-Whisper: Label-Free Data Filtering for Knowledge Distillation via Large-Scale Pseudo Labelling [16.7] ラベル付きデータを使わずに比較的小さなモデルにWhisperモデルを蒸留できることを示す。
私たちのモデルは、教師モデルと同等以上の性能を維持しながら、計算とメモリ効率が25~50%向上しています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:07:01 GMT)
Does Writing with Language Models Reduce Content Diversity? [16.2] 大規模言語モデル(LLM)は、モデルアシストによる協調的な記述の急増につながっている。
異なるユーザが同じモデルから提案を取り入れているため、生成したコンテンツの多様性が低下するリスクがある。
多様性指標のセットを開発し,InstructGPTによる記述は(GPT3ではなく)統計的に有意な多様性低下をもたらすことを示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:36:30 GMT)
Dual Process Learning: Controlling Use of In-Context vs. In-Weights Strategies with Weight Forgetting [15.7] 言語モデルには、コンテキスト内学習(ICL)を実行する能力があり、コンテキストに基づいた振る舞いを柔軟に適応させることができる。
実演モデルと玩具モデルの両方を用いて、単純な音声設定における構造的インコンテキストアルゴリズムについて検討する。
モデルが新しい言語に一般化するのを助けるために最近導入された手法である能動的忘れ字法は、構造的コンテキスト内学習ソリューションを採用するようモデルに強制する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:23:43 GMT)
Revisiting Random Walks for Learning on Graphs [15.6] 我々は、グラフ上のランダムウォークが機械可読レコードを生成する、グラフ上の機械学習の簡単なアイデアを再考する。
これらの機械をランダムウォークニューラルネットワークと呼ぶ。
確率におけるグラフ関数の普遍近似を可能としながら、同型不変として設計できることが示される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:59:59 GMT)
Large Language Model Enhanced Knowledge Representation Learning: A Survey [15.6] 大言語モデル(LLM)と知識表現学習(KRL)の統合は、人工知能分野における重要な進歩を意味する。
本研究では,これらの拡張モデルの基本成分とプロセスについて検討する。
我々は、この未発見領域における将来的な研究の方向性を特定し、探求する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:37:35 GMT)
Robust Stance Detection: Understanding Public Perceptions in Social Media [15.5] スタンス検出は、明確に定義されたトピックに対する正確な位置を特定する。
従来のスタンス検出モデルは、新しいドメインやトピックに適用すると、パフォーマンスが低下することが多い。
本稿では,反実データ拡張と対照的な学習を組み合わせることで,姿勢検出の堅牢性を高める方法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:06:00 GMT)
Hybrid RAG-empowered Multi-modal LLM for Secure Healthcare Data Management: A Diffusion-based Contract Theory Approach [15.3] 本稿では,医療データ管理のためのハイブリッドなレトリーバル拡張生成(RAG)を用いた医療MLLMフレームワークを提案する。
我々は、MLLMのデータフレッシュネスの影響を間接的に評価するために情報の年齢を採用し、契約理論を利用して医療データ保有者にデータ共有のインセンティブを与えます。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:28:40 GMT)
RMS-FlowNet++: Efficient and Robust Multi-Scale Scene Flow Estimation for Large-Scale Point Clouds [15.1] RMS-FlowNet++は、正確で効率的なシーンフロー推定のための、エンドツーエンドの学習ベースの新しいアーキテクチャである。
我々のアーキテクチャは最先端の手法よりも高速な予測を提供し、高いメモリ要求を回避し、同時に250K以上の高密度点雲上の効率的なシーンフローを可能にする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:51:17 GMT)
Investigating Nudges toward Related Sellers on E-commerce Marketplaces: A Case Study on Amazon [15.1] eコマース市場は世界中の何百万もの売り手にビジネスチャンスを提供する。
これらの売り手の中には、子会社のサービスを利用することで、マーケットプレースと特別な関係を持つ者もいる。
関連販売業者を総称して「関連販売業者」と呼ぶ。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:05:40 GMT)
Multimodal Conditional 3D Face Geometry Generation [15.0] アートスケッチ,2D顔のランドマーク,キャニーエッジ,FLAME顔モデルパラメータ,ポートレート写真,テキストプロンプトから生成された3D顔のデモを行った。
本手法は,2次元パラメータ化UV領域における3次元形状を生成する拡散過程に基づく。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:25:59 GMT)
Extracting Protocol Format as State Machine via Controlled Static Loop Analysis [14.2] この研究は、制約付き正規表現によって記述され、有限状態マシンを用いて解析されるプロトコルのクラスに焦点を当てる。
本手法では,各ループを状態として,ループ間の依存性を状態遷移として,状態マシンを抽出する。
評価結果は、状態マシンを推測し、90%以上の精度とリコールでメッセージフォーマットを5分以内で推測できることを示している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:43:28 GMT)
Fast and Efficient 2-bit LLM Inference on GPU: 2/4/16-bit in a Weight Matrix with Asynchronous Dequantization [14.2] 大規模言語モデル(LLM)は、推論コストが高価である間、様々な領域で印象的な能力を示してきた。
2ビットの単精度重み量子化を適用すると、3%の精度が失われる。
本稿では,各重み行列に対する混合精度量子化と,推論時の非同期dequantizationを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:13:54 GMT)
Revitalizing Multivariate Time Series Forecasting: Learnable Decomposition with Inter-Series Dependencies and Intra-Series Variations Modeling [14.2] 動的傾向情報をより合理的に捉えるための学習可能な分解戦略を導入する。
また、シリーズ間の依存関係とシリーズ間のバリエーションを同時にキャプチャする2つのアテンションモジュールを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:39:50 GMT)
CILF-CIAE: CLIP-driven Image-Language Fusion for Correcting Inverse Age Estimation [14.2] 年齢推定タスクは、画像中の顔の特徴を分析して、個人の年齢を予測することを目的としている。
既存のCLIPベースの年齢推定手法では、高いメモリ使用量が必要であり、エラーフィードバック機構が欠如している。
逆年齢推定(CILF-CIAE)のための新しいCLIP駆動画像言語融合法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:31:40 GMT)
An Outline of Prognostics and Health Management Large Model: Concepts, Paradigms, and Challenges [14.2] 予後と健康管理(PHM)は、航空宇宙、製造、海洋、鉄道、エネルギーなどにおいて広く採用されている。
PHMの開発は、一般化、解釈、検証能力といったボトルネックによって制約されている。
本稿では,PHMとLarge Modelを統合したPHM-LM(Prognosis and Health Management Large Model)の新たな概念と3つのパラダイムを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:37:00 GMT)
How to Leverage Digit Embeddings to Represent Numbers? [13.9] 1+2の代わりに100+200を解くような一般化は、モデルの性能に大きく影響する。
数字の文字レベルの埋め込みは、数値表現を改善するための有望なアプローチとして現れている。
我々は、数値的な先行計算を用いて、集約された桁埋め込みを計算し、これらの集合をトランスフォーマーモデルに明示的に組み込む。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:31:41 GMT)
Enhancing Speech-Driven 3D Facial Animation with Audio-Visual Guidance from Lip Reading Expert [13.6] 口唇の動きを正確に生成するための音声駆動型3次元顔アニメーション法を提案する。
この損失は、音声駆動の3D顔アニメーターを訓練し、音声書き起こしと整合した可塑性な唇の動きを生成するためのガイダンスを提供する。
提案手法の有効性を広範に検証し, 唇同期性能と唇可読性性能を顕著に改善した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:39:28 GMT)
On Statistical Rates and Provably Efficient Criteria of Latent Diffusion Transformers (DiTs) [13.6] 低次元線形潜時空間仮定の下で、潜時テキストbfDiffusion textbfTransformers(textbfDiTs)の限界について検討する。
具体的には、潜時空間次元のサブ線形である潜時DiTのスコアネットワークに対して、近似誤差を導出する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:34:40 GMT)
FairLay-ML: Intuitive Debugging of Fairness in Data-Driven Social-Critical Software [13.5] データ駆動型ソリューションの公平さをテストし、説明するためのツールネームを提供する。
ツールネームは、データセット、トレーニングされたモデル、所定のデータポイントの決定のロジックを視覚化する。
開発データセットを超えたバグを見つけるための、反ファクトの公平性テストが組み込まれている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:13:54 GMT)
DynamicGlue: Epipolar and Time-Informed Data Association in Dynamic Environments using Graph Neural Networks [13.4] 本稿では,困難条件下で頑健なマッチングを実現するために,グラフニューラルネットワークに基づくスパース特徴マッチングネットワークを提案する。
我々は、キーポイント表現を最先端の機能マッチングネットワークとして強化するために、グラフエッジ上での注目集約という同様の手法を用いる。
動作対象のキーポイントを排除したネットワークの性能は,最新の特徴マッチングネットワークと比較して,一連の実験により向上した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:04:31 GMT)
Cost Aware Best Arm Identification [13.4] emphCost Aware Best Arm Identification (CABAI)と呼ぶ。
平方根規則に基づくemphChernoff Overlap (CO)と呼ばれる単純なアルゴリズムを提案する。
この結果から,不均一な動作コストを無視すると,実行時の準最適性が得られ,また,簡単なアルゴリズムにより,幅広い問題に対してほぼ最適性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:35:19 GMT)
GMT: A Robust Global Association Model for Multi-Target Multi-Camera Tracking [13.3] 本稿では,第1追跡段階への依存を2段階の手法で解決し,クロスカメラマッチングを向上するオンラインMTMC追跡モデルを提案する。
具体的には,トランスフォーマーをベースとしたグローバルMTMCアソシエーションモジュールを提案し,様々なカメラやフレームを対象とするアソシエーションを探索する。
高シーンの多様性と複雑な照明条件の変化に対応するため、VisionTrackデータセットを構築した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:39:14 GMT)
Beyond Throughput and Compression Ratios: Towards High End-to-end Utility of Gradient Compression [13.3] 勾配圧縮は、勾配凝集ボトルネックに対する有望な解決策である。
しかし、勾配圧縮スキームは、精度を保ちながらトレーニングプロセスの加速を達成できない。
本研究では,従来の勾配圧縮システムと評価手法の共通点について述べる。
本稿では,これらの課題に対処するための設計・評価手法をいくつか提案し,今後の課題に対するガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:32:28 GMT)
FAITH: Frequency-domain Attention In Two Horizons for Time Series Forecasting [13.3] 時系列予測は、産業機器の保守、気象学、エネルギー消費、交通流、金融投資など、様々な分野で重要な役割を果たしている。
現在のディープラーニングベースの予測モデルは、予測結果と基礎的真実の間に大きな違いを示すことが多い。
本稿では、時系列をトレンドと季節成分に分解する2つのホライズンズにおける周波数領域注意モデルを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:01:11 GMT)
Active Human Pose Estimation via an Autonomous UAV Agent [13.2] 本稿では,人の行動を捉えた映像から人間のポーズ推定を行うタスクに焦点を当てる。
これを解決するためには、ビューを明確にするために、カメラを新しいベタージュポイントに移す必要がある。
提案手法は、NeRFベースのDrone-Viewデータ生成フレームワーク、カメラビューエラー推定のためのOn-Drone Network、複合プランナーの3つの主要コンポーネントから構成される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:20:52 GMT)
Towards a fully declarative neuro-symbolic language [13.0] 我々は、完全に宣言的な神経述語のための一般的なフレームワークを提案し、実装する。
まず、宣言的拡張は任意のクエリに答えることができながら、学習と推論能力を保っていることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:58:55 GMT)
Capacity Provisioning Motivated Online Non-Convex Optimization Problem with Memory and Switching Cost [12.8] オンラインの非最適化問題は、一連のサーバのフロータイム(トータル遅延)を目標とする。
各処理は、アクティブサーバ数の変更に伴うコストを最小限に抑えるために、任意の時間で処理できる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:35:14 GMT)
SketchQL Demonstration: Zero-shot Video Moment Querying with Sketches [12.8] スケッチベースのクエリインタフェースでビデオモーメントを検索するビデオデータベース管理システム(VDBMS)であるSketchQLを提案する。
このインターフェースでは、単純なマウスドラッグアンドドロップ操作でオブジェクトのトラジェクトリイベントを指定できる。
SketchQLは、ビデオ上の類似検索を実行し、ビジュアルクエリに最も近いクリップを特定することで、ゼロショットビデオモーメント検索を実現する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:10:50 GMT)
VIPriors 4: Visual Inductive Priors for Data-Efficient Deep Learning Challenges [12.6] VIPriors: Visual Inductive Priors for Data-Efficient Deep Learning”ワークショップの第4版では、2つのデータ不足の課題が紹介されている。
これらの課題は、限られたデータでコンピュータビジョンタスクのディープラーニングモデルをトレーニングする際の問題に対処する。
深層学習モデルのデータ効率を向上させるために,帰納的バイアスを取り入れた新しい手法の開発を促進することを目的としている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:59:13 GMT)
Beyond Human Preferences: Exploring Reinforcement Learning Trajectory Evaluation and Improvement through LLMs [12.6] 強化学習(Reinforcement Learning, RL)は、複雑なゲームタスクにおけるポリシートラジェクトリを評価する上での課題である。
PbRLは、人間の嗜好を重要な報酬信号として活用する先駆的なフレームワークである。
LLM4PG という LLM 対応自動選好生成フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:32:48 GMT)
Accurate Passive Radar via an Uncertainty-Aware Fusion of Wi-Fi Sensing Data [12.5] Wi-Fiデバイスは、周囲で何が起きているのかを検知し、人間の活動を識別するパッシブレーダーシステムとして効果的に利用することができる。
本稿では,データ生成に係わる潜在分布を推定するために,変分自動エンコーダを用いたアーキテクチャを提案する。
我々は、同一のWi-Fi受信機の異なるアンテナで処理された融合データにより、人間の活動認識の精度が向上することを確認した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:26:15 GMT)
CodeIt: Self-Improving Language Models with Prioritized Hindsight Replay [12.5] コードイット(Code It)と呼ばれる,言語モデルによる自己改善のための新しい,スケーラブルな手法を提案する。
Code It repeaterates between 1) program sample and hindsight relabeling, and 2) learn from Priord Experience replay。
CodeItをARCデータセットに適用することにより、事前トレーニングとデータ拡張とともに、優先順位付けされた後視リプレイがタスク間の一般化を成功させることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:03:33 GMT)
VisEval: A Benchmark for Data Visualization in the Era of Large Language Models [12.1] 事前訓練された大規模言語モデル(LLM)の最近の進歩は、自然言語から可視化を生成するための新たな道を開いた。
本稿では,新しいNL2VISベンチマークであるVisEvalを提案する。
このデータセットには、146のデータベースをカバーする2,524の代表的なクエリが含まれており、正確にラベル付けされた基底真理とペアリングされている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:35:30 GMT)
Adaptive RKHS Fourier Features for Compositional Gaussian Process Models [12.0] ディープガウス過程(Deep Gaussian Processs, DGP)は、非定常過程をモデル化するために構成構造を利用する。
DGP推論の最近の進歩は、再生カーネルヒルベルト空間(RKHS)からのグローバルフーリエ特徴を取り入れることで、複雑な非定常パターンを捕捉するDGPの能力を向上できることを示している。
本稿では,これらの特徴を線形変換を含む構成GPに拡張する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:56:56 GMT)
Bridging Smoothness and Approximation: Theoretical Insights into Over-Smoothing in Graph Neural Networks [12.0] グラフ上で定義される関数の近似理論について検討する。
グラフ畳み込みネットワーク(GCN)を用いて,対象関数に対する近似の下位境界を評価する枠組みを確立する。
出力の高周波エネルギーがGCNの過度な平滑化の指標である崩壊する様子を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:35:53 GMT)
We-Math: Does Your Large Multimodal Model Achieve Human-like Mathematical Reasoning? [11.9] WE-MATHは、エンド・ツー・エンドのパフォーマンスを超えた問題解決の原則を探求するために設計された最初のベンチマークである。
我々は67の階層的な知識概念と5層の知識の粒度にまたがる6.5Kの視覚数学の問題を慎重に収集・分類する。
視覚数学的推論において既存のLMMを徹底的に評価し、解法ステップと問題固有の性能との負の相関を明らかにする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:39:08 GMT)
AI Agents That Matter [11.8] AIエージェントはエキサイティングな新しい研究方向であり、エージェント開発はベンチマークによって駆動される。
他のメトリクスに注意せずに正確性に焦点が当てられている。
モデルと下流の開発者のベンチマークの必要性が混じり合っている。
多くのエージェントベンチマークはホールトアウトセットが不十分であり、時にはまったくない。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:48:14 GMT)
Deciphering the Factors Influencing the Efficacy of Chain-of-Thought: Probability, Memorization, and Noisy Reasoning [11.8] Chain-of-Thought(CoT)プロンプトは、Large Language Models(LLM)の多段階推論能力を高めることが示されている。
シフト暗号をデコードするシンボリック推論タスクのケーススタディとして、アルファベットのいくつかのステップで文字を前進させる。
GPT-4は標準のプロンプトでほとんどのシフト暗号の精度をゼロにするが、CoTでは平均32%に向上する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:01:07 GMT)
First-Step Advantage: Importance of Starting Right in Multi-Step Math Reasoning [11.8] 言語モデルは、予測のための合理性を生成することを学ぶことによって、複雑な推論タスクをよりよく解決することができる。
より小さなモデル、特に修正された場合には、彼らが他の方法で苦労したであろうタスクを解決できることを観察します。
我々はQuestCoTを提案し、より小さなモデルがまず、推論の連鎖で進む前に、どのように開始するかを自問する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:25:57 GMT)
Is Synthetic Data all We Need? Benchmarking the Robustness of Models Trained with Synthetic Images [11.7] 本稿では,3種類の合成クローンモデル,すなわち,教師付き,自己監督型,マルチモーダル型の最初のベンチマークを行う。
合成クローンは、実際のデータで訓練されたモデルよりも、敵対的および現実的なノイズの影響を受けやすいことがわかりました。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:28:26 GMT)
The Solution for Temporal Sound Localisation Task of ICCV 1st Perception Test Challenge 2023 [11.6] 視覚的特徴と音声的特徴を組み合わせるために,マルチモーダル融合方式を用いる。
最先端の自己教師付き事前学習ネットワークを用いて高品質な視覚特徴を抽出する。
同時に、音声機能は、モデルが音の開始と終了をよりよくローカライズするのに役立つ補完的な情報として機能する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:52:05 GMT)
Inverse Evolution Layers: Physics-informed Regularizers for Deep Neural Networks [11.6] 本稿では,PDEに基づく進化モデルの逆過程にインスパイアされた新しい正規化手法を提案する。
出力が望ましくない特性を持つニューラルネットワークをペナルタイズするために,不適切な特性増幅器として機能する逆進化層(IEL)を提案する。
熱拡散IELを用いたセマンティックセグメンテーションタスクに着目し,ノイズラベル効果の軽減効果を実証した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:47:32 GMT)
Framing image registration as a landmark detection problem for label-noise-aware task representation (HitR) [11.5] 画像登録精度の臨床的関連性に着目したランドマークヒットレート(HitR)と呼ばれる新しい評価指標を提案する。
HitRは、登録アルゴリズムが定義された信頼ゾーン内にランドマークを配置することに成功しているかどうかを考察する。
提案手法は,画像登録アルゴリズムのより現実的で有意義な評価を提供し,臨床・バイオメディカル応用への適合性を反映している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:58:21 GMT)
Weight Clipping for Deep Continual and Reinforcement Learning [11.4] 深い連続学習と強化学習における多くの失敗は、重量の増大と関連している。
既存の学習システムに簡単に追加できる手法として,ニューラルネットワークの重みをクリップして特定の範囲に制限する手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:29:29 GMT)
Orbital phases of $p$-band ultracold fermions in the frustrated triangular lattice [11.4] 本研究では、スピンレスフェルミオン原子を2次元フラストレーションされた三角形格子の$p$軌道バンドにロードする。
このシステムは、実空間力学平均場理論の軌道バージョンを用いて数値的に解決される拡張フェルミ・ハバードモデルによって記述することができる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:33:08 GMT)
Robust and Reliable Early-Stage Website Fingerprinting Attacks via Spatial-Temporal Distribution Analysis [11.4] Webサイトフィンガープリント(WF)攻撃は、トラフィック分析を行うことで、ユーザーが訪問したウェブサイトを識別する。
DLベースのWF攻撃の有効性は、ページ読み込み中に収集された完全なトラフィックと純粋なトラフィックに依存する。
我々は、堅牢で信頼性の高いアーリーステージWF攻撃であるホームズを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:51:26 GMT)
ZeroDDI: A Zero-Shot Drug-Drug Interaction Event Prediction Method with Semantic Enhanced Learning and Dual-Modal Uniform Alignment [11.3] 以前は未観測/未確認のDDIEが登場しており、未確認のクラスがトレーニング段階でラベル付きインスタンスを持たない場合に、新しい分類タスクを呈している。
既存の計算手法はZS-DDIEには直接適用されないが、この方法には2つの主要な課題がある。
ZS-DDIEタスクのためのZeroDDIという新しい手法を提案する。これは重要な生物学的意味論を強調し、DDIE表現学習のための識別的分子サブ構造関連意味論を蒸留する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:28:14 GMT)
Entropic Optimal Transport Eigenmaps for Nonlinear Alignment and Joint Embedding of High-Dimensional Datasets [11.1] 本稿では,理論的保証付きデータセットの整列と共同埋め込みの原理的アプローチを提案する。
提案手法は,2つのデータセット間のEOT計画行列の先頭特異ベクトルを利用して,それらの共通基盤構造を抽出する。
EOT計画では,高次元状態において,潜伏変数の位置で評価されたカーネル関数を近似することにより,共有多様体構造を復元する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:48:55 GMT)
Papez: Resource-Efficient Speech Separation with Auditory Working Memory [11.1] Papezは軽量で計算効率のよい単一チャネル音声分離モデルである。
我々は、チャンク変換器を小型の聴覚ワーキングメモリに置き換える。
さらなる処理を必要としない入力トークンを適応的にプルークする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:23:06 GMT)
Mechanistic Interpretation through Contextual Decomposition in Transformers [11.0] 変換器(CD-T)の文脈分解について述べる。
CD-Tは変圧器の柔軟な解釈法である。
また,CD-T蒸留により,より忠実なアテンションヘッド回路が実現され,計算効率が向上した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:12:20 GMT)
A Survey on Safe Multi-Modal Learning System [10.9] マルチモーダル学習システム(MMLS)は、様々なモーダル入力から情報を処理し統合する能力で注目を集めている。
安全に関する体系的な研究が欠如していることは、この分野の進歩にとって重要な障壁である。
MMLSの安全性を体系的に分類し評価する最初の分類法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:03:26 GMT)
Decomposing Global Feature Effects Based on Feature Interactions [10.9] グローバルエフェクトの一般化付加分解(GADGET)は特徴空間の解釈可能な領域を見つけるための新しいフレームワークである。
フレームワークの数学的基盤を提供し、限界特徴効果を可視化する最も一般的な手法に適用可能であることを示す。
提案手法の理論的特性を,異なる実験環境における様々な特徴効果法に基づいて実験的に評価した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:26:49 GMT)
Large Language Models Assume People are More Rational than We Really are [10.9] AIが人と効果的にコミュニケーションするためには、意思決定の仕方を理解する必要があります。
以前の実証的な証拠は、これらの暗黙のモデルが正確であることを示唆しているようである。
人々の選択をシミュレートし、予測する場合は、実際にはそうではありません。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:29:54 GMT)
Collaborative Performance Prediction for Large Language Models [10.8] 我々は、新しいフレームワーク、協調的パフォーマンス予測を導入する。
様々なモデルの歴史的性能を活用することで予測精度を大幅に向上させる。
また、過去のパフォーマンスと追加設計要素の両方を含むオンラインプラットフォームからのコラボレーティブデータを収集する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:56:42 GMT)
IBSEN: Director-Actor Agent Collaboration for Controllable and Interactive Drama Script Generation [10.6] IBSENは、ドラマスクリプトを生成し、エージェントがプレイするプロットをより制御しやすいものにする監督・監督調整エージェントフレームワークである。
監督エージェントは、ユーザーが見たいと願うプロットの概要を書き、俳優エージェントにキャラクターをロールプレイするように指示し、人間のプレイヤーがシナリオに参加するときにプロットを再スケジュールし、プロットが目的に向かって進行していることを確認する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:49:57 GMT)
A Fingerprint for Large Language Models [10.6] 大規模言語モデル(LLM)のための新しいブラックボックスフィンガープリント手法を提案する。
実験結果から,提案手法はPEFT攻撃に対するオーナシップ検証とロバスト性において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:25:42 GMT)
Unveiling the Unseen: Exploring Whitebox Membership Inference through the Lens of Explainability [10.6] 提案手法は, 生データの最も影響力のある特徴を識別し, メンバーシップ推論攻撃を成功に導くための, 攻撃駆動型説明可能なフレームワークを提案する。
提案したMIAは,最先端MIAの最大26%の改善を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:07:46 GMT)
LHManip: A Dataset for Long-Horizon Language-Grounded Manipulation Tasks in Cluttered Tabletop Environments [10.4] 本稿では,200エピソードからなるLong-Horizon Manipulationデータセットについて述べる。
タスクには、グルーピング、プッシュ、積み重ね、非常に散らかった環境でオブジェクトを投げるなど、複数のサブタスクが含まれる。
データセットは、Open X-Embodimentデータセットの一部を構成する176,278の観測-アクションペアで構成されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:10:55 GMT)
Neuro-Symbolic Fusion of Wi-Fi Sensing Data for Passive Radar with Inter-Modal Knowledge Transfer [10.4] 本稿では,Wi-FiセンシングのためのニューロシンボリックアーキテクチャであるDeepProbHARを紹介する。
これは、Wi-Fi信号が脚や腕の動きなどの単純な動きと区別できるという最初の証拠を提供する。
DeepProbHARは、人間の活動認識における最先端技術に匹敵する結果を達成している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:43:27 GMT)
Generalization Error of Graph Neural Networks in the Mean-field Regime [10.4] グラフ畳み込みニューラルネットワークとメッセージパッシンググラフニューラルネットワークという,広く利用されている2種類のグラフニューラルネットワークについて検討する。
我々の新しいアプローチは、これらのグラフニューラルネットワークの一般化誤差を評価する平均場内上限を導出することである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:27:34 GMT)
Joint Pruning and Channel-wise Mixed-Precision Quantization for Efficient Deep Neural Networks [10.2] ディープニューラルネットワーク(DNN)は、エッジデバイスへのデプロイメントに重大な課題をもたらす。
この問題に対処する一般的なアプローチは、プルーニングと混合精度量子化である。
そこで本研究では,軽量な勾配探索を用いて共同で適用するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:07:02 GMT)
Cross-Modal Attention Alignment Network with Auxiliary Text Description for zero-shot sketch-based image retrieval [10.2] ゼロショットスケッチに基づく画像検索のための補助テキスト記述を用いたクロスモーダルアライメント・アライメント・ネットワークを提案する。
私たちの重要なイノベーションは、画像の補助情報としてテキストデータを使用することであり、それによって言語が提供する本質的にゼロショットの一般化能力を活用することです。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:32:06 GMT)
Contributing Back to the Ecosystem: A User Survey of NPM Developers [10.2] NPMエコシステムの49人の開発者を対象とした調査。
開発者は、エコシステムにコントリビュートするよりも、独自のパッケージをメンテナンスする傾向にあります。
当社の成果は,これらのエコシステムを維持するためのツールサポートと研究への新たな道を開くものである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:15:55 GMT)
Video Anomaly Detection in 10 Years: A Survey and Outlook [10.1] ビデオ異常検出(VAD)は、監視、医療、環境監視といった様々な領域において非常に重要である。
この調査では、従来の教師付きトレーニングパラダイムを超えて、弱教師付き、自己監督型、教師なしのアプローチを包含する、ディープラーニングベースのVADを調査している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:31:53 GMT)
Evolutionary Morphology Towards Overconstrained Locomotion via Large-Scale, Multi-Terrain Deep Reinforcement Learning [10.0] 本稿では,進化形態学にインスパイアされたデザインと学習の視点から,過剰に拘束された移動の新たなクラスについて検討する。
本研究では,従来の平面型4バーリンケージ,過剰拘束型ベネットリンケージ,球面型4バーリンケージとしてパラメトリックに再構成可能な3次元プリント可能なロボットアームの設計を提案する。
以上の結果から,両肢は前方および側方で異なる地形を歩行するときに,平面下肢よりも効率のよい移動が認められた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:57:01 GMT)
From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.0] 本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:19:36 GMT)
Robot Instance Segmentation with Few Annotations for Grasping [10.0] セミスーパーバイザードラーニング(SSL)とラーニング・スルー・インタラクション(LTI)を組み合わせた新しいフレームワークを提案する。
提案手法は,自己スーパービジョンによる注釈付きデータを利用して,ラベルのない静止画像から生成された擬似シーケンスを用いて時間的コンテキストを組み込む。
本手法をARMBenchmix-object-toteとOCIDの2つのベンチマークで検証し,最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:58:32 GMT)
Small Aerial Target Detection for Airborne Infrared Detection Systems using LightGBM and Trajectory Constraints [10.0] 本稿では,航空機搭載赤外線検知システムのための簡易かつ効果的な小型空中目標検出手法を提案する。
公開データセットの実験では,提案手法は他の既存手法よりも優れた性能を示した。
私たちの知る限りでは、このデータセットはこの分野で最大のデータスケールとリッチなシーンタイプを持っています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:33:40 GMT)
First Place Solution of 2023 Global Artificial Intelligence Technology Innovation Competition Track 1 [9.9] 我々は,グローバル人工知能技術革新コンペティショントラック1のチャンピオンソリューションを提示する。
我々はテキスト生成タスクのベースモデルとしてCPT-BASEを選択する。
驚いたことに、我々のシングルモデルはリーダーボードAで2.321点を獲得し、複数のモデル融合スコアはAとBのリーダーボードで2.362点と2.320点である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:22:22 GMT)
E.T. the Exceptional Trajectories: Text-to-camera-trajectory generation with character awareness [9.8] 本稿では,文字情報とテキストキャプションとともに,カメラトラジェクトリを用いた例外トラジェクトリ (E.T.) と呼ばれるデータセットを提案する。
私たちの知る限りでは、この種のデータセットとしてはこれが初めてのものです。
E.T.データセットの潜在的な応用を示すために、DIRECTORという拡散に基づくアプローチを提案する。
評価指標にContrastive Language-Trajectory 埋め込みである E.T. データセット CLaTr をトレーニングする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:58:02 GMT)
Is one brick enough to break the wall of spoken dialogue state tracking? [9.8] タスク指向対話(TOD)システムでは、システムのユーザの要求に対する理解を正しく更新することがスムーズな対話の鍵となる。
伝統的に、TODシステムは、ユーザの発話の書き起こし、キーコンセプトのセマンティック抽出、以前に特定された概念によるコンテキスト化という3つのステップでこの更新を実行する。
本稿では,(1)完全ニューラル音声によるDSTに対する新しいアプローチ,(2)芸術カスケード手法の状況との比較,(3)より優れた文脈伝播への道筋について述べる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:15:33 GMT)
A Survey on Deep Clustering: From the Prior Perspective [9.6] この調査は、6種類の事前知識に分類することで、ディープクラスタリング手法の包括的なレビューを提供する。
広範に使われている5つのデータセットのベンチマークを提供し、様々な先行する手法のパフォーマンスを分析する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:10:16 GMT)
3D Feature Distillation with Object-Centric Priors [9.6] CLIPのような2Dビジョン言語モデルは、2Dイメージのオープン語彙グラウンドディングに優れた機能を備えているため、広く普及している。
最近の研究は、特徴蒸留によって2D CLIP機能を3Dに高めることを目的としているが、シーン固有のニューラルネットワークを学ぶか、室内のスキャンデータにフォーカスする。
提案手法は, 3次元CLIPの特徴を再構築し, 接地能力と空間的整合性を改善した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:55:10 GMT)
DiffIR2VR-Zero: Zero-Shot Video Restoration with Diffusion-based Image Restoration Models [9.6] 本稿では,事前学習画像復元拡散モデルを用いたゼロショット映像復元手法を提案する。
本手法は,ゼロショット映像復元において最高の性能を発揮することを示す。
本手法は任意の2次元復元拡散モデルで動作し,広範に再トレーニングを行うことなく,映像強調作業のための汎用的で強力なツールを提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:59:12 GMT)
Accelerated Algorithms for Constrained Nonconvex-Nonconcave Min-Max Optimization and Comonotone Inclusion [9.6] 非コンケーブなmin-max最適化問題の構造化クラスであるコモノトンmin-max最適化について検討する。
最初のコントリビューションでは、extra Anchored Gradient (EAG)アルゴリズムを制約付きコモノトン min-max 最適化に拡張する。
第2のコントリビューションでは、FEG(Fast Extra Gradient)アルゴリズムを制約のないmin-max最適化に拡張する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:14:01 GMT)
A Learned Generalized Geodesic Distance Function-Based Approach for Node Feature Augmentation on Graphs [9.5] 我々はLGGD(Learned Generalized Geodesic Distances)と呼ばれるアプローチを導入する。
この方法は、訓練パイプラインを通して一般化された測地距離関数を学習することによりノード特徴を生成する。
この手法の強みは、一般化された測地線距離からノイズや外れ値への強靭性にある。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:39:15 GMT)
Universal Approximation Theory: The basic theory for large language models [9.5] 大規模トランスフォーマーネットワークは、自然言語処理アルゴリズムの進歩において、急速に主要なアプローチとなっている。
本稿では,大規模言語モデル(LLM)の理論的基礎について考察する。
理論的な背景を提供し、これらの進歩を支えるメカニズムに光を当てている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:29:35 GMT)
Learnability in Online Kernel Selection with Memory Constraint via Data-dependent Regret Analysis [9.5] 本稿では,カーネル選択とオンライン予測手順のメモリが固定予算に限定されたメモリ制約によるオンラインカーネル選択について検討する。
この結果から,2つのデータ複雑度が線形である場合,小さなメモリ制約内で学習が可能であることが示唆された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:42:27 GMT)
On noise in swap ASAP repeater chains: exact analytics, distributions and tight approximations [9.3] 損失は量子ネットワークにおける絡み合いの分布の主要なボトルネックの1つである。
等間隔リピータの事例を解析的に検討する。
最大25セグメントまでの忠実度の全モーメントについて、正確な解析公式を求める。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:50:22 GMT)
Benchmarking Mental State Representations in Language Models [9.3] モデルの内部的な精神状態の表現に関する研究は依然として限られている。
最近の研究は、LMが自分自身や他人の信念を表現できることを示すのに、プローブを用いている。
モデルサイズが異なる様々なLMタイプを用いた広範囲なベンチマークを報告する。
我々は,素早い変化が心的タスクの理論における探索的パフォーマンスにどのように影響するかを初めて研究する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:48:34 GMT)
DreamPBR: Text-driven Generation of High-resolution SVBRDF with Multi-modal Guidance [9.2] テキストとマルチモーダル制御によって誘導される空間的に変化する外観特性を創出するための,新しい拡散型生成フレームワークを提案する。
多様な高品質なPBR素材生成を実現するための鍵は、数十億のテキストイメージ対で訓練された最近の大規模視覚言語モデルの能力を統合することである。
教材作成におけるDreamPBRの有効性を実証し,その汎用性とユーザフレンドリさを幅広い制御可能な生成・編集アプリケーション上で示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:43:15 GMT)
From Category to Scenery: An End-to-End Framework for Multi-Person Human-Object Interaction Recognition in Videos [9.2] ビデオベースのヒューマンオブジェクトインタラクション(HOI)認識は、人間とオブジェクトの間の複雑なダイナミクスを探索する。
本研究では,シーンフレームワークCATSに新たなエンドツーエンドカテゴリを提案する。
我々は,これらの拡張幾何学的視覚的特徴をノードとして構成し,人間とオブジェクトのカテゴリ間の関係を学習する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:42:55 GMT)
Model Generation with LLMs: From Requirements to UML Sequence Diagrams [9.1] 本稿では,NL要求から特定のモデル,すなわちシーケンス図を生成するChatGPTの能力について検討する。
本稿では,ChatGPTが生成した28種類の要求文書と異なるドメインのシーケンス図について検討する。
以上の結果から, モデルが標準に適合し, 合理的な理解可能性を示す一方で, 要求条件に対する完全性や正当性は, しばしば課題となることが示唆された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:16:49 GMT)
Enabling Mixed Effects Neural Networks for Diverse, Clustered Data Using Monte Carlo Methods [9.0] 混合効果ニューラルネットワーク(MENN)はクラスタ固有の「ランダム効果」とクラスタ不変の「固定効果」を分離する
本稿では,モンテカルロ法による一般化混合効果ニューラルネットワークの学習手法であるMC-GMENNを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:24:04 GMT)
Towards Multimodal Open-Set Domain Generalization and Adaptation through Self-supervision [9.0] 本稿では,マルチモーダルなオープンセット・ドメイン・ジェネリゼーションを実現するための新しいアプローチを提案する。
本稿では,マルチモーダルな自己教師型プリテキストタスクであるMasked Cross-modal TranslationとMultimodal Jigsaw Puzzlesを提案する。
我々は、特に対象ドメインからのラベルなしデータが利用可能なシナリオにおいて、マルチモーダルなオープンセットドメイン適応問題にも取り組みます。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:59:09 GMT)
Artificial Leviathan: Exploring Social Evolution of LLM Agents Through the Lens of Hobbesian Social Contract Theory [8.8] 大規模言語モデル(LLM)と人工知能(AI)の進歩は、大規模に計算社会科学研究の機会を提供する。
我々の研究は、複雑な社会的関係が動的に形成され、時間とともに進化するシミュレーションエージェント・ソサイエティを導入している。
我々は、この理論が仮定しているように、エージェントが秩序と安全保障と引き換えに絶対的な主権を放棄することで、残酷な「自然の状態」から逃れようとするかどうかを分析する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:06:13 GMT)
CLHOP: Combined Audio-Video Learning for Horse 3D Pose and Shape Estimation [8.7] 単眼ビデオから馬の3次元形状と運動回復性を高めるために,音声を用いた検討を行った。
本研究は,3次元動物の運動回復における音声の役割を初めて研究したものである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:39:50 GMT)
FALCON: Frequency Adjoint Link with CONtinuous Density Mask for Fast Single Image Dehazing [8.7] この研究は、品質と速度の両面で最先端の性能を達成するシングルイメージデハージングシステムであるFALCONを紹介する。
本研究では, 連続密度マスクを用いた大気散乱モデルに基づいて, 基礎となるヘイズ分布を利用する。
複数の最先端手法とアブレーション解析を含む実験は、FALCONの脱ハージング品質と速度の両方における異常な性能を実証している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:16:26 GMT)
Evaluating Model Performance Under Worst-case Subpopulations [8.6] コア属性Zに対して定義された任意のサイズの全てのサブポピュレーションに対するモデルの最悪のケース性能について検討する。
我々は、最先端モデルのロバスト性を評価できるスケーラブルだが原則化された2段階推定手法を開発した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:24:05 GMT)
Improve ROI with Causal Learning and Conformal Prediction [8.4] 本研究は,各種産業におけるコスト対応二元処理割り当て問題(C-B)について考察する。
最先端の直接ROI予測(TAP)手法に焦点を当てている。
これらの課題に対処することは、さまざまな運用状況における信頼性と堅牢な予測を保証するために不可欠である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:16:25 GMT)
Cross-Slice Attention and Evidential Critical Loss for Uncertainty-Aware Prostate Cancer Detection [8.2] 本稿では,グローバル情報とローカル情報の両方を利用した新しい2.5Dクロススライスアテンションモデルを提案する。
我々は2つの異なるデータセットでモデルを用いて広範な実験を行い、前立腺癌検出における最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:14:23 GMT)
Topo4D: Topology-Preserving Gaussian Splatting for High-Fidelity 4D Head Capture [8.2] 自動幾何およびテクスチャ生成のための新しいフレームワークであるTopo4Dを提案する。
まず、時系列面を固定位相を持つ動的3次元ガウス面の集合として表現する。
次に、高品質な幾何学とテクスチャ学習のためのフレーム・バイ・フレームの代替的な幾何学とテクスチャ最適化を行う。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:15:37 GMT)
AdaDistill: Adaptive Knowledge Distillation for Deep Face Recognition [8.0] 知識蒸留は、高性能な教師モデルから知識を蒸留することで、コンパクトな学生モデルの性能を向上させることを目的としている。
AdaDistillはKDの概念をソフトマックスの損失に組み込み、教師から蒸留されたクラスセンターでマージンペナルティのソフトマックスの損失を学習する。
大規模な実験とアブレーション研究により、AdaDistillは生徒の差別的学習能力を高めることができることが示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:39:55 GMT)
Exploring Extreme Quantization in Spiking Language Models [8.0] 本稿では,新しい2進/3進(1/1.58ビット)スパイクLMアーキテクチャの開発を提案する。
提案手法は,1/1.58ビットの1次スパイキングLMとして大きく進歩した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:38:48 GMT)
VTG-LLM: Integrating Timestamp Knowledge into Video LLMs for Enhanced Video Temporal Grounding [7.9] ビデオ時間グラウンド(VTG)は、言語クエリに基づいて、特定のビデオ内のイベントタイムスタンプを正確に識別することに焦点を当てている。
ビデオ大言語モデル(ビデオLLM)は、ビデオコンテンツを理解する上で大きな進歩を遂げてきたが、ビデオ内のタイムスタンプを正確に特定する上で、しばしば課題に直面している。
本稿では,VTGタスクのための特殊なビデオLLMモデルであるVTG-LLMを提案し,タイムスタンプの知識を視覚トークンに効果的に統合する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:14:04 GMT)
Cross-Lingual Transfer Learning for Speech Translation [7.8] ゼロショットの言語間移動は、様々なNLPタスクで実証されている。
音声に基づくモデルが同じ伝達能力を示すかどうかを考察する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:51:48 GMT)
Paraphrase Types for Generation and Detection [7.8] これらのタスクをパラフレーズ型生成とパラフレーズ型検出と呼ぶ。
以上の結果から,従来の手法は二項分類のシナリオではうまく機能するが,微粒なパラフレーズ型の含みは大きな課題となることが示唆された。
我々は、パラフレーズ型が将来、パラフレーズモデルの開発とタスクの解決のための新しいパラダイムを解き放つことができると考えている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:32:37 GMT)
SGCCNet: Single-Stage 3D Object Detector With Saliency-Guided Data Augmentation and Confidence Correction Mechanism [7.6] 単一段階点ベース3次元物体検出器は、低品質物体(ILQ)の不十分な学習や、局所化精度と分類信頼度(MLC)の不一致といった課題に直面している。
ILQでは、SGCCNetがSaliency-Guided Data Augmentation(SGDA)戦略を採用し、低品質オブジェクトに対するモデルの堅牢性を高める。
MLCでは、ポイントベースマルチクラス検出器に特化して信頼性補正機構(CCM)を設計する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:36:01 GMT)
DCoM: Active Learning for All Learners [7.6] Dynamic Coverage & Margin Mix (DCoM)はこのギャップを埋めるために設計された新しいアクティブラーニングアプローチである。
コールドスタート問題を克服するDCoMの能力を実証し、予算の異なる制約にまたがって結果を継続的に改善する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:06:34 GMT)
GRACE: Graph-Regularized Attentive Convolutional Entanglement with Laplacian Smoothing for Robust DeepFake Video Detection [7.6] 本稿では,グラフラプラシアンを用いたグラフ畳み込みネットワークに基づく,堅牢なDeepFakeビデオ検出手法を提案する。
提案手法は,雑音の多い顔シーケンス下でのDeepFakeビデオ検出における最先端性能を実現する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:06:59 GMT)
Silver Linings in the Shadows: Harnessing Membership Inference for Machine Unlearning [7.6] ニューラルネットワークから特定のデータサンプルの影響を除去する新しい学習機構を提案する。
この目的を達成するために、我々は、ターゲットモデルの重みやアクティベーション値からプライバシーに敏感な情報を排除するための、新しい損失関数を構築した。
本研究の結果は,未学習の有効性とレイテンシ,および主課題の忠実度の観点から,我々のアプローチの優れた性能を示すものである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:20:26 GMT)
Hong-Ou-Mandel Interference with a Coexisting Clock using Transceivers for Synchronization over Deployed Fiber [7.5] 独立に生成された光子間の干渉は、遠距離で絡み合うための重要なステップである。
ここでは,遠方に位置する2つの源間の香港-奥羽-マンデル差を観測することにより光子-光子干渉を実証する。
最大視認性は0.58 pm 0.04$で、2つのソースが4.3$kmのファイバで接続されているときに達成される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:16:35 GMT)
Predicting Fairness of ML Software Configurations [7.4] 木回帰器とXGBootsはディープニューラルネットワークを著しく上回り,HPの公正性を正確に予測するベクトルマシンをサポートした。
本手法は,機械学習学習アルゴリズムの微調整を効率的に行い,HPと公正性の関係を理解するための枠組みを提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:16:34 GMT)
Superconstant Inapproximability of Decision Tree Learning [7.4] PAC学習決定木をクエリで適切に学習する作業について検討する。
Koch, Strassle, および Tan の最近の研究は、仮説木 $T$ が最適に小さいことが要求されるこのタスクの最も厳密なバージョンは NP-hard であることを示した。
仮に$T$が最適の任意の定数係数の範囲内にあるとしても、そのタスクはNPハードのままであることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:53:03 GMT)
NLPGuard: A Framework for Mitigating the Use of Protected Attributes by NLP Classifiers [7.4] NLP分類器における保護属性への依存を軽減するためのフレームワークであるNLPGuardを紹介する。
NLPGuardは、有害言語、感情分析、職業分類の3つの分類タスクに適用されている。
評価の結果,現在のNLP分類器は保護属性に大きく依存しており,これらの属性に関連付けられている単語の最大23%が有効であることがわかった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:08:17 GMT)
Diffusion Transformer Model With Compact Prior for Low-dose PET Reconstruction [7.3] 低線量PET画像の再構成品質を高めるために,JCP(Joint compact prior)により導かれる拡散変圧器モデルを提案する。
DTMは拡散モデルの強力な分布マッピング能力と変圧器の容量を組み合わせて長距離依存を捉える。
本手法は放射線曝露リスクを軽減するだけでなく,早期診断や患者管理のためのPETイメージングツールも提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:54:43 GMT)
Deep learning for automated detection of breast cancer in deep ultraviolet fluorescence images with diffusion probabilistic model [6.7] 拡散確率モデル(DPM)は高品質な画像を生成する可能性を示している。
本稿では,乳がん分類の改善を目的とした深部紫外線蛍光(DUV)画像データセットの増強にDPMを適用した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:00:26 GMT)
Large Language Models Are Involuntary Truth-Tellers: Exploiting Fallacy Failure for Jailbreak Attacks [6.6] 言語モデルでは、誤った推論や偽りの推論を発生させることが困難であることがわかった。
本稿では、悪意のある出力に対して一致した言語モデルを引き出すジェイルブレイク攻撃法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:23:43 GMT)
An Efficient Instance Segmentation Framework Based on Oriented Bounding Boxes [6.6] 本稿では,一貫した粗大なインスタンスセグメンテーションフレームワークCFNetを提案する。
ボックスプロンプトベースのセグメンテーション基礎モデル(BSM)を使用する。
CFNetは、産業用と公共用両方のデータセットにおいて、現在のインスタンスセグメンテーションメソッドよりも優れています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:16:02 GMT)
Unmasking Bias in AI: A Systematic Review of Bias Detection and Mitigation Strategies in Electronic Health Record-based Models [6.3] 人工知能を電子健康記録と共に活用することは、医療を改善する変革の可能性を秘めている。
しかし、医療格差を悪化させるAIのバイアスに対処することは見過ごせない。
本研究では,EHRデータを用いたAIモデルにおいて,多様なバイアスを検出・緩和する手法について検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:26:23 GMT)
YOLOv10 to Its Genesis: A Decadal and Comprehensive Review of The You Only Look Once Series [6.2] 本研究は, YOLOv10からYOLOv9, YOLOv8, その後のバージョンに至るまで, YOLOアルゴリズムが導入した進歩について検討する。
この研究は、自動車安全、医療、工業製造、監視、農業の5つの重要な分野におけるYOLOの変革的な影響を強調している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:04:51 GMT)
DRAGON: Drone and Ground Gaussian Splatting for 3D Building Reconstruction [6.2] DRAGONは、ドローンと地上の建築画像を入力として取り出し、3D NVSモデルを作成することができる。
Google Earth Studioを使って,9つの大きな建物シーンの半合成データセットを作成した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:52:32 GMT)
Adversarial Attacks on Reinforcement Learning Agents for Command and Control [6.1] 近年の研究では、学習に基づくアプローチは敵の摂動に非常に敏感であることが示されている。
本稿では,敵が制御する環境において,指揮制御タスクのために訓練されたエージェントの堅牢性について検討する。
実験により,これらのアルゴリズムを用いて訓練したエージェントは,敵が注入したノイズに非常に敏感であることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:45:52 GMT)
Stealing Maggie's Secrets -- On the Challenges of IP Theft Through FPGA Reverse Engineering [5.7] iPhone 7の内部で発見されたLattice iCE40FPGAの実際のケーススタディを示す。
マギーに実装された独自の信号処理アルゴリズムをリバースエンジニアリングすることで,FPGAのIP盗難に要する実際の作業について,新たな知見が得られる。
次に、必要な手作業を大幅に削減する一般的なネットリストリバースエンジニアリング技術を紹介します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:21:50 GMT)
FoldGPT: Simple and Effective Large Language Model Compression Scheme [5.6] ネットワーク帯域幅とメモリ制限は、モバイルデバイスに数十億レベルのモデルをデプロイする上で問題となる。
ブロック除去とブロックパラメータ共有を組み合わせたFoldGPTを提案する。
実験により、FoldGPTは従来の最先端(SOTA)手法よりも効率の良いモデル圧縮性能を示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:17:53 GMT)
Learning the boundary-to-domain mapping using Lifting Product Fourier Neural Operators for partial differential equations [5.6] 我々は、任意の境界関数を領域全体の解にマッピングできる新しいFNOベースのアーキテクチャ、Lifting Product FNO(LP-FNO)を提案する。
2次元ポアソン方程式に対して提案したLP-FNOの有効性と分解能の独立性を実証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:27:50 GMT)
MARLP: Time-series Forecasting Control for Agricultural Managed Aquifer Recharge [5.6] 農業用管理帯水層(Ag-MAR)は,表層水を用いて農地を人工的に浸水させて帯水層を養殖する。
現在のAg-MARスケジューリングは、気象や土壌酸素のような複雑な環境要因を考慮していない。
本稿では,Ag-MARの最初のエンドツーエンドデータ駆動制御システムであるMARLPを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:36:40 GMT)
The generalized strong subadditivity of the von Neumann entropy for bosonic quantum systems [5.5] ボゾン量子ガウス系に対するフォン・ノイマンエントロピーの強い部分付加性の一般化を証明した。
本稿では,量子メモリとの新たなエントロピー不確実性関係,量子エントロピーパワー不等式の一般化,および二次ハミルトニアンによる絡み合いエントロピーの線形時間スケーリングについて述べる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:08:29 GMT)
Good Gottesman-Kitaev-Preskill codes from the NTRU cryptosystem [5.5] 我々は,いわゆるNTRU暗号系の暗号解析から得られた,ランダムなGottesman-Kitaev-Preskill(GKP)符号のクラスを導入する。
NTRU-GKP符号の派生型は、変位ノイズモデルの復号化がNTRU暗号システムの復号化と等価であるという付加的な性質を持つ。
この構造は、GKPコードがどのように古典的誤り訂正、量子誤り訂正、およびポスト量子暗号の側面を橋渡しするかを強調している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:05:52 GMT)
Deep Reinforcement Learning for Adverse Garage Scenario Generation [5.5] 本論文では,自律運転シミュレーションテストのための自動プログラム生成フレームワークを提案する。
深層強化学習に基づいて、3Dモデルファイルとマップモデルファイルが構築される異なる2Dグラウンドスクリプトコードを生成することができる。
生成された3DグラウンドシーンはCarlaシミュレータに表示され、実験者はこのシーンをナビゲーションアルゴリズムのシミュレーションテストに使用することができる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:41:18 GMT)
Reducing Vision Transformer Latency on Edge Devices via GPU Tail Effect and Training-free Token Pruning [5.2] 本稿では,エッジデバイス上でトランスフォーマーベースのニューラルネットワークを効率的に展開する方法を検討する。
最近の手法では、トークンを除去またはマージすることで、トランスフォーマーニューラルネットワークのレイテンシを小さくする。
レイテンシとワークロードサイズの関係はGPUのテールエフェクトによって制御されていることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:42:40 GMT)
$Classi|Q\rangle$ Towards a Translation Framework To Bridge The Classical-Quantum Programming Gap [5.2] $Classi|Qrangle$は、クラシックコンピューティングと量子コンピューティングを橋渡しするフレームワークである。
PythonやC++のようなハイレベルなプログラミング言語を低レベルな言語、例えばQuantum Assemblyに翻訳する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:37:09 GMT)
Optimizing Entanglement and Bell Inequality Violation in Top Anti-Top Events [5.2] スピン-スピン相関を対角化する基礎は,スピン相関,絡み合い,ベル不等式違反の最大化に最適であることを示す。
LHCと将来の$e+e-$コライダーのイベントにおいて,絡み合いやベルの不等式違反に対する感受性を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:00:01 GMT)
Semantic-guided Adversarial Diffusion Model for Self-supervised Shadow Removal [5.1] GANベースのトレーニングは、しばしばモード崩壊や不安定な最適化といった問題に直面している。
自己教師付きシャドウ除去のための意味誘導逆拡散フレームワークを提案する。
複数の公開データセットで実験を行い,本手法の有効性を実証した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:14:38 GMT)
Contextualized Hybrid Ensemble Q-learning: Learning Fast with Control Priors [5.0] 適応型ハイブリッド強化学習アルゴリズムCHEQ(Contextualized Hybrid Ensemble Q-learning)を提案する。
CHEQは、(i)適応重みを文脈変数として扱う適応ハイブリッドRL問題の時間不変な定式化、(ii)批判アンサンブルのパラメトリック不確実性に基づく重み適応機構、(iii)データ効率RLのためのアンサンブルベースの加速度の3つの重要な要素を組み合わせる。
CHEQをカーレースタスクで評価することで、最先端の適応型ハイブリッドRL法よりもデータ効率、探索安全性、未知のシナリオへの転送性が大幅に向上する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:02:45 GMT)
Macroeconomic Forecasting with Large Language Models [5.0] 本稿では,従来のマクロ時系列予測手法と比較して,Large Language Models(LLM)の精度を評価する。
本研究は, LLMの長所と短所について, 実世界のシナリオにおける適用性に光を当てながら, マクロ経済時系列の予測における長所と短所について, 貴重な知見を提供するものである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:25:26 GMT)
LLM4PM: A case study on using Large Language Models for Process Modeling in Enterprise Organizations [5.0] 本稿では,大規模言語モデル(LLM)を用いてプロセスモデル作成を支援する可能性について検討する。
多国籍企業でLLMベースのロボット PRODIGY を開発した。
実世界におけるプロセスモデリングにおける LLM の実用化について紹介する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:57:36 GMT)
Neural Networks Trained by Weight Permutation are Universal Approximators [4.6] 本研究では,一次元連続関数の近似にReLUネットワークを誘導する置換に基づく学習手法を提案する。
重み調整中の顕著な観察は、置換訓練がネットワーク学習行動を記述する革新的なツールとなることを示唆している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:33:00 GMT)
Applying Bayesian Data Analysis for Causal Inference about Requirements Quality: A Controlled Experiment [4.6] 要求仕様の品質がその後のソフトウェアエンジニアリング活動に影響を与えることは一般的に受け入れられている。
要求品質の欠陥がソフトウェアエンジニアリング活動に与える影響について実証的な証拠を提供することを目的としている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:20:02 GMT)
Neurovascular Segmentation in sOCT with Deep Learning and Synthetic Training Data [4.5] 本研究は, 連続断面光コヒーレンストモグラフィー画像における神経血管セグメンテーションのための合成エンジンについて述べる。
提案手法は,ラベル合成とラベル・ツー・イメージ変換の2段階からなる。
前者の有効性を,より現実的なトレーニングラベルの集合と比較し,後者を合成ノイズと人工物モデルのアブレーション研究により実証した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:09:07 GMT)
The Impact of an XAI-Augmented Approach on Binary Classification with Scarce Data [4.4] ポイント・オブ・ケア超音波(Point-of-Care Ultrasound、POCUS)は、臨床医が患者のベッドサイドで超音波スキャンを行い、解釈する手法である。
POCUSデバイスは、携帯電話のサイズにおいて妥当なコストで利用できるようになった。
POCUSデバイスを救命ツールに変える上での課題は、超音波画像の解釈には専門的な訓練と経験が必要であることである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:09:31 GMT)
DaBiT: Depth and Blur informed Transformer for Joint Refocusing and Super-Resolution [4.3] 多くの現実のシナリオでは、録画されたビデオは偶然の焦点がぼやけている。
本稿では、焦点ずれ(再焦点)とビデオ超解像(VSR)に最適化されたフレームワークを提案する。
我々は、既存のビデオ復元方法よりも1.9dB以上のPSNR性能で、最先端の結果を得る。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:22:16 GMT)
Reducing False Discoveries in Statistically-Significant Regional-Colocation Mining: A Summary of Results [4.3] 特徴型のセットemphSが与えられた場合、emphS>のサブセットemphCが$r_g$の統計的に重要な地域コロケーションパターンであるような$aリージョン(r_g$)を見つけることが目的である。
提案手法は,Bonferroni補正を用いた複数比較型地域鉱山(MultComp-RCM)を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:03:04 GMT)
Engineering Conversational Search Systems: A Review of Applications, Architectures, and Functional Components [4.3] 本研究では,対話型検索システムの理論的研究と技術的実装の関連について検討する。
階層型アーキテクチャフレームワークを提案し,対話型検索システムの中核機能について説明する。
我々は,大規模言語モデルの急速な進歩を踏まえ,その能力,限界,今後の研究の方向性について考察する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:24:11 GMT)
Enhancing the LLM-Based Robot Manipulation Through Human-Robot Collaboration [4.2] 大規模言語モデル(LLM)はロボット工学の分野で人気を集めている。
本稿では,人間ロボットコラボレーション(HRC)によるLLMに基づく自律操作の性能向上のための新しいアプローチを提案する。
このアプローチでは、高レベルの言語コマンドをロボットによって実行できる一連の動作に分解するために、引き起こされたGPT-4言語モデルを使用する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:11:31 GMT)
Learning Robust 3D Representation from CLIP via Dual Denoising [4.2] 私たちはCLIPから堅牢で一般化された3D表現を学習するための新しいフレームワークであるDual Denoisingを提案する。
3D事前トレーニングのための、デノナイジングベースのプロキシタスクと、新たな機能デノナイジングネットワークを組み合わせたものだ。
実験により,本モデルは3次元学習ネットワークの表現学習性能と対角的ロバスト性を効果的に向上できることが示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:15:03 GMT)
GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection [4.2] 本研究では,GSO-YOLO(Global stability Optimization YOLO)モデルを用いて,複雑な建設現場の課題に対処する。
このモデルはグローバル・オプティマイズ・モジュール(GOM)とステアディ・キャプチャ・モジュール(SCM)を統合し、グローバル・コンテクスト情報取得と検出安定性を向上させる。
SODA、MOCS、CISといったデータセットの実験では、GSO-YOLOが既存のメソッドよりも優れており、SOTAのパフォーマンスが達成されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:15:27 GMT)
A Geometric Algorithm for Tubular Shape Reconstruction from Skeletal Representation [4.1] 骨格表現から管状形状を復元するための新しいアプローチを提案する。
本手法では,全ての骨格点を全体として処理し,入力構造を複数のセグメントに分割する必要がない。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:46:25 GMT)
Metric-Entropy Limits on Nonlinear Dynamical System Learning [4.1] 本稿では,リプシッツ特性を満足する非線形系を学習し,計量エントロピーの最適方法で過去の入力を十分に早く忘れることのできるリカレントニューラルネットワーク(RNN)について述べる。
私たちが考えるシーケンス・ツー・シーケンス・マップの集合は、ディープ・ニューラルネットワーク近似理論において一般的に考慮される関数クラスよりもはるかに大きいので、洗練された計量エントロピー特性が必要である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:57:03 GMT)
Singular Excitement Beyond the Horizon of a Rotating Black Hole [4.0] 我々は、ブラックホール質量、ブラックホール角運動量、検出器エネルギーギャップ、無限遠での場境界条件の異なる値に対する検出器の遷移率を数値計算する。
この結果は、BTZブラックホールの時空における粒子検出器の挙動をより一般化した記述に繋がる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:00:01 GMT)
Deep Active Audio Feature Learning in Resource-Constrained Environments [3.8] ラベル付きデータの不足により、バイオ音響アプリケーションにおけるDeep Neural Network(DNN)モデルのトレーニングが困難になる。
アクティブラーニング(AL)は、ラベル付けの労力をほとんど必要とせず、この学習を支援するアプローチである。
本稿では,ALループに特徴抽出を組み込んだALフレームワークについて述べる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:17:51 GMT)
Gradient-based Class Weighting for Unsupervised Domain Adaptation in Dense Prediction Visual Tasks [3.8] 本稿では,クラスウェイトをUDA学習損失に組み込んだクラスバランス緩和戦略を提案する。
損失勾配を通してこれらの重みを動的に推定する斬新さは、グラディエントに基づくクラス重み付け(GBW)学習を定義する。
GBWは、大きな表現されたクラスによって学習が妨げられるクラスの貢献を自然に増大させる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:34:25 GMT)
SemanticFormer: Holistic and Semantic Traffic Scene Representation for Trajectory Prediction using Knowledge Graphs [3.7] 自動運転におけるトレイ予測は、運転シーンのすべての関連状況の正確な表現に依存している。
本稿では,交通シーングラフの推論によるマルチモーダル軌道の予測手法であるSemanticFormerを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:51:21 GMT)
Adapting Multilingual LLMs to Low-Resource Languages with Knowledge Graphs via Adapters [3.7] 本稿では,言語から多言語大モデル(LLM)へのグラフ知識の統合について検討する。
我々は、感情分析(SA)および名前付きエンティティ認識(NER)における低リソース言語(LRL)の性能向上のために、言語固有のアダプタを使用している。
構造化グラフ知識が,SA および NER における LRL の多言語 LLM の性能に与える影響を評価する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:56:24 GMT)
Face4RAG: Factual Consistency Evaluation for Retrieval Augmented Generation in Chinese [3.7] 従来の検索時拡張世代(RAG)における事実整合性エラーの大きな問題は、FCE(Factual Consistency Evaluation)の研究を動機づけている
我々は,基礎となるLarge Language Models (LLM) に依存しないRAGのための,最初の総合的なFCEベンチマークemphFace4RAGを提案する。
提案するベンチマークでは,既存のFCE手法が論理的誤りを検出できないことを発見した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:35:04 GMT)
How We Built Cedar: A Verification-Guided Approach [3.7] 私たちは検証誘導開発(VGD)を使用して、表現力、高速、安全、分析可能な承認のための新しいポリシー言語であるCedarを構築します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:01:07 GMT)
Exploring the Reversal Curse and Other Deductive Logical Reasoning in BERT and GPT-Based Large Language Models [3.6] 自己回帰型デコーダ大言語モデル(LLM)は、BとAが別個であり、互いに一意に識別できると仮定して、"B is A"を学習できない。
これにより、知識グラフの構築など、ある種の一般的なタスクにGPTモデルを使用することで、赤旗を掲げる。
そこで本研究では,両方向性 LLM であるBERT について検討し,逆行性呪いに対する免疫性が確認された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:13:24 GMT)
ToffA-DSPL: an approach of trade-off analysis for designing dynamic software product lines [3.6] toffA-DSPLという設計時におけるDSPLのトレードオフ解析手法を提案する。
NFRとコンテキスト間の相互作用を考慮した構成選択プロセスを扱う。
一般に、ToffA-DSPLによって提案される構成は、NFRの高い満足度を提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:51:32 GMT)
On the Abuse and Detection of Polyglot Files [3.6] ポリグロットファイルは、フォーマット固有の検出/署名にファイルをルーティングするマルウェア検出システムに問題を引き起こす。
既存のファイルフォーマットと組み込みファイル検出ツールは、野生で使われているポリグロットファイルを確実に検出できない。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:59:54 GMT)
A Differentiable Approach to Multi-scale Brain Modeling [3.6] 本稿では,脳シミュレータBrainPyを用いたマルチスケール微分脳モデリングワークフローを提案する。
単一ニューロンレベルでは、微分可能なニューロンモデルを実装し、電気生理学的データへの適合を最適化するために勾配法を用いる。
ネットワークレベルでは、生物学的に制約されたネットワークモデルを構築するためにコネクトロミックデータを組み込む。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:31:37 GMT)
Explicit Flow Matching: On The Theory of Flow Matching Algorithms with Applications [3.5] 本稿では,フローベース生成モデルのトレーニングと解析を行うための新しい手法であるExplicit Flow Matching (ExFM)を提案する。
ExFMは、理論的に基礎付けられた損失関数、ExFM損失を利用して、トレーニング中のばらつきを実証的に低減し、より早く収束し、より安定した学習をもたらす。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:28:19 GMT)
Classification under Nuisance Parameters and Generalized Label Shift in Likelihood-Free Inference [3.5] 本稿では,不確実性定量化のための新しい手法を提案する。
提案手法は,ドメイン適応能力を持つ事前学習型分類器を効果的に提供し,高出力を維持しながら有効な予測セットを返却する。
現実的な力学モデルから得られたデータを用いて、生物学と天体物理学における2つの挑戦的な科学的問題に対して、その性能を実証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:51:25 GMT)
Protecting Privacy in Classifiers by Token Manipulation [3.5] テキスト分類モデルに焦点をあて、様々なトークンマッピングとコンテキスト化された操作機能について検討する。
いくつかのトークンマッピング関数の実装は簡単で簡単ですが、ダウンストリームタスクのパフォーマンスに大きな影響を与えます。
比較すると、文脈化された操作はパフォーマンスを改善する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:41:59 GMT)
Evaluation of Temporal Change in IR Test Collections [3.5] 本研究では,有効性評価の時間的一般化性について検討する。
提案手法は,検索結果の変化を適切に記述できることを示す。
論文参考訳(メタデータ) (Mon, 01 Jul 2024 15:25:31 GMT)
Pytorch-Wildlife: A Collaborative Deep Learning Framework for Conservation [3.4] Pytorch-Wildlifeは、PyTorch上に開発されたオープンソースのディープラーニングプラットフォームである。
強力なAIモデルの作成、修正、共有のために設計されている。
アマゾン・レインフォレストにおける動物分類モデルの訓練や、ガラパゴス諸島における侵入性オポッサムの認識に利用されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:22:38 GMT)
Quantum Simulation with Gauge Fixing: from Ising Lattice Gauge Theory to Dynamical Flux Model [3.4] ゲージ理論をシミュレートする伝統的な方法が2つある。1つは、ゲージ理論のフルハミルトニアンを局所ゲージ対称性で直接シミュレートすることである。
もう1つは、射影ハミルトニアンを1つのゲージ部分セクターで設計することである。
この研究は、凝縮物質と高エネルギー物理学の両方に関連するゲージ固定の概念を用いて、格子ゲージ理論を量子的にシミュレートする方法を舗装する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:12:17 GMT)
Adaptive control of reaction-diffusion PDEs via neural operator-approximated gain kernels [3.3] PDEバックステッピングにおけるゲインカーネルのニューラル演算子近似は、リアルタイムでコントローラを実装するための実行可能な方法として現れている。
本稿では,ハイパーボリックPDEの適応制御からベンチマークパラボリックPDEの適応制御まで,ニューラル演算子手法を拡張した。
パラメータ適応のリアプノフ設計のためのプラント状態のグローバルな安定性と制御を証明した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:24:36 GMT)
Implementation of a scalable universal two-qubit quantum processor with electron and nuclear spins in a trapped ion [3.3] イオンの4つの内部レベルを利用したスケーラブルなn-イオン-2n量子ビットプロセッサを提案する。
電子スピンと1つの171Yb+イオンの核スピンを用いた1-イオン-2量子ビットユニバーサルプロセッサを実験的に実装した。
我々の研究は、n 個のイオンを持つ量子計算ヒルベルト空間のサイズが 2n 倍になるための道を開いた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:40:45 GMT)
SCIF: A Language for Compositional Smart Contract Security [3.3] SCIFは、構成的にセキュアなスマートコントラクトを構築するための言語です。
SCIFは、セキュアな情報フローの基本的な構成原理に基づいている。
相互作用するプリンシパルと部分信頼の豊富なエコシステムをサポートする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:51:21 GMT)
Energy-Aware Decentralized Learning with Intermittent Model Training [3.2] 分散学習(DL)は、ノードが生データを共有せず、中央サーバーの調整もせずにモデルを協調的に訓練する強力なフレームワークを提供する。
本研究では,分散学習におけるエネルギー消費を最小化する新しいDLアルゴリズムであるSkipTrainについて述べる。
256ノードを用いた実験により,従来のDLアルゴリズムであるD-PSGDと比較して,SkipTrainはエネルギー消費量を50%削減し,モデル精度を最大12%向上することを示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:39:03 GMT)
Overcoming Common Flaws in the Evaluation of Selective Classification Systems [3.2] タスクアライメント、解釈可能性、柔軟性に関する選択的な分類において、マルチスレッドメトリクスに対する5つの要件を定義します。
本稿では,全要件を満たす総合リスクカバレッジ曲線(mathrmAUGRC$)に基づくエリアを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:32:58 GMT)
Development of Cognitive Intelligence in Pre-trained Language Models [3.2] 近年の研究では、大規模事前学習言語モデルにおける創発的認知能力の証拠が示されている。
PLMの発達軌跡は、人間の認知発達に対する最大限の調整の窓を一貫して示している。
この窓のあと、トレーニングは損失を減らすという工学的な目標に役立っているように見えるが、人間の認知との整合性を高めるという科学的目標ではない。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:56:36 GMT)
How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs? [3.2] このような手法のメタ評価を行い、その信頼性を幅広いタスクにわたって評価する。
自動評価手法は、特定の条件下で人間の評価を近似することができるが、その妥当性は文脈に依存している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:59:08 GMT)
Simulating the non-Hermitian dynamics of financial option pricing with quantum computers [3.2] シュロディンガー方程式は、量子状態が系のハミルトニアンに従ってどのように進化するかを記述する。
物理系の場合、ハミルトニアンはユニタリ力学を保証するエルミート作用素でなければならない。
反エルミート的ハミルトニアンに対しては、シュロディンガー方程式は虚数時間における量子状態の進化をモデル化する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:14:34 GMT)
Optimal Design and Implementation of an Open-source Emulation Platform for User-Centric Shared E-mobility Services [3.1] 既存の共有E-mobilityサービスは重要な設計上の欠陥を示す。
E-mobility研究コミュニティに利益をもたらすような、統合されたオープンソースプラットフォームはありません。
本稿では,共有E-mobilityのためのオープンソースプラットフォームを提供することで,このギャップを埋めることを目的とする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:46:52 GMT)
Text2Robot: Evolutionary Robot Design from Text Descriptions [3.1] ユーザテキスト仕様とパフォーマンス選好を物理的四足歩行ロボットに変換するフレームワークであるText2Robotを紹介した。
Text2Robotは、高速なプロトタイピングを可能にし、生成モデルによるロボットデザインの新しい機会を開く。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:05:22 GMT)
Race and Privacy in Broadcast Police Communications [3.0] シカゴ市警察(CPD)の放送警察通信(BPC)による法執行官(LEO)の活動の調整について検討する。
2018年8月10日午前9時から午後5時にかけて放送されたラジオ放送の文字起こしを,最近収集した80,775時間のBPCのアーカイブから分析した。
警察がBPCで用いた語彙や言論行為を探索し、地域住民への個人的特徴の言及、BPC上で共有される個人情報、およびそれらと比較する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:34:51 GMT)
To Switch or Not to Switch? Balanced Policy Switching in Offline Reinforcement Learning [3.0] いくつかの決定問題では、政策変更の可能性に直面し、それは無視できないコストを引き起こす。
本稿では,利得とスイッチングコストを柔軟かつ原則的にバランスをとるための新しい戦略を提案する。
提案するスイッチング式に対する基本特性を確立し,Net Actor-Criticアルゴリズムを設計する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:24:31 GMT)
Robust Model-Based Reinforcement Learning with an Adversarial Auxiliary Model [2.9] 特定のマルコフ決定過程(MDP)で訓練するRLエージェントは、ほぼ同一のMDPでよく機能するのにしばしば苦労する。
我々は,ロバストMDPの枠組みをモデルベース設定に適用し,新しい学習遷移モデルを導入する。
実験結果から,高次元MuJoCo制御タスクにおけるポリシーロバスト性の顕著な改善が示唆された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:35:44 GMT)
MalAlgoQA: A Pedagogical Approach for Evaluating Counterfactual Reasoning Abilities [2.9] 本稿では,Large Language Models (LLM) の対実的推論能力を評価するために設計された新しいデータセットであるMalAlgoQAを紹介する。
データセットは、数学と理解的な質問を読み取り、それぞれに4つの答えの選択とそれに対応する有理性が伴う。
私たちは、誤った答えの合理性に注目し、誤った答えにつながる欠陥のある推論ステップを強調し、誤った思考プロセスに関する貴重な洞察を与えます。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:39:13 GMT)
Unifying quantum spatial search, state transfer and uniform sampling on graphs: simple and exact [2.9] 本稿では,量子ウォークの交互化による新しい,簡潔なアルゴリズムフレームワークを提案する。
量子空間探索、状態移動、および大規模なグラフの均一サンプリングを統一する。
このアプローチは、グラフのラプラシア固有値集合の深さにのみ依存する簡潔な形式性を持っているため、簡単に利用できる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:09:19 GMT)
Staying vigilant in the Age of AI: From content generation to content authentication [2.8] Yangtze Seaプロジェクトは、生成AI(GAI)が生成した偽のコンテントとの戦いのイニシアチブである。
その取り組みの一環として、メガネとクリップオンの形状の推測的事実チェックウェアラブルの開発を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 03:01:11 GMT)
Ground and excited state energy calculations of the H2 molecule using a variational quantum eigensolver algorithm on an NMR quantum simulator [2.7] 本研究では,H2分子の基底状態エネルギーを計算するために,変分量子固有解法アルゴリズムを実装した。
我々は変分量子デフレレーションアルゴリズムを用いてH2分子の励起状態をシミュレートし、NMR量子プロセッサで実験的にそれを実証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:29:45 GMT)
Min P Sampling: Balancing Creativity and Coherence at High Temperature [2.7] min-$p$は、トップ候補トークンの確率に応じてスケールする動的トランケーションサンプリング手法である。
min-$p$は高温でも生成したテキストのコヒーレンスと品質を改善することを実証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:37:25 GMT)
Asymmetric transfer matrix analysis of Lyapunov exponents in one-dimensional non-reciprocal quasicrystals [2.6] 非エルミチアン準結晶では、非相互ホッピングによって誘導される非エルミチアン効果は、局在中心の反対側に2つの異なるリャプノフ指数が現れる。
本研究では,非相互準結晶の局在特性と運動量エッジを総合的に検討する手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:25:07 GMT)
Bayesian grey-box identification of nonlinear convection effects in heat transfer dynamics [2.6] 熱伝達力学における対流を同定する計算手法を提案する。
この手順はガウス過程潜在力モデルに基づいている。
シミュレーションシステムからのデータと物理アセンブリからの測定の両方でシミュレーション誤差による手順を検証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:17:01 GMT)
Safe and Responsible Large Language Model : Can We Balance Bias Reduction and Language Understanding in Large Language Models? [2.1] 大規模言語モデルからバイアスのないアウトプットを生成するための現在のアプローチは、バイアスを減らすことができるが、知識の保持を犠牲にしている。
我々は、生成されたテキストのバイアスを減らすために、安全性と応答性大言語モデル(textbfSR$_textLLM$)を開発した。
textbfSR$textLLM$は、バイアスの低減と言語知識の整合性維持の両面において、従来の微調整手法よりも優れていることを確認した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:40:13 GMT)
Towards objective and systematic evaluation of bias in artificial intelligence for medical imaging [2.1] 医療画像におけるバイアスがAIモデルに与える影響を調査するための新しい分析フレームワークを提案する。
医用画像AIの偏りを評価するために, サイリコ試験の制御を行うためのこのフレームワークを開発し, テストした。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:30:53 GMT)
Predicting Trust Dynamics with Dynamic SEM in Human-AI Cooperation [2.0] 人間のAIに対する信頼は、人間とAIのシナジスティックな関係を育む上で重要な要素である。
人間がAIを過信したり過信したりした場合、誤用や事故などの深刻な問題が発生する。
動的構造方程式モデリングを用いた信頼度動態の予測モデルを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:31:07 GMT)
What is the spectral density of the reservoir for a lossy quantized cavity? [2.0] キャビティと貯水池のカップリングの周波数依存性は,キャビティの内容と使用するゲージの両方に依存していることを示す。
我々はスペクトル密度の形式を特定し、$sim omega-1$ prefactor scaling と空間依存的な寄与を明らかにする。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:56:15 GMT)
ViANLI: Adversarial Natural Language Inference for Vietnamese [1.9] 敵NLIデータセットをNLP研究コミュニティに導入し,その名称をViANLIとした。
このデータセットには、10K以上の前提-仮説ペアが含まれている。
テストセットで最も強力なモデルの精度は48.4%にしか達しなかった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:19:51 GMT)
Observation of topological transitions associated with a Weyl exceptional ring [1.9] 点のような特異点から拡張されたワイル例外環 (WER) は特に興味深い。
ここでは、WERを超伝導量子ビット制御で合成し、減衰共振器と共振器を結合した回路において、このトポロジーについて検討する。
WER の特異な特徴である多様体 $-$a の大きさを縮めることによって引き起こされる位相遷移を実演する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:08:58 GMT)
Formal Verification of Object Detection [1.9] Deep Neural Networks(DNN)は、現実世界のアプリケーションではユビキタスだが、エラーや敵攻撃に対して脆弱である。
この研究は、コンピュータビジョンモデルの安全性を確保するために正式な検証を適用するという課題に取り組み、画像分類を超えてオブジェクト検出まで検証を拡張した。
本稿では,オブジェクト検出モデルのロバスト性を形式的検証を用いて証明するための一般的な定式化と,最先端の検証ツールと互換性のある実装戦略の概要を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:47:54 GMT)
Bridging the Gap: Transfer Learning from English PLMs to Malaysian English [1.8] マレーシア英語は低資源クレオール言語である。
名前付きエンティティ認識モデルは、マレーシア英語のテキストからエンティティをキャプチャするときに性能が低下する。
MENmBERT と MENBERT は,文脈理解を伴う事前学習型言語モデルである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:26:03 GMT)
Language Portability Strategies for Open-domain Dialogue with Pre-trained Language Models from High to Low Resource Languages [1.7] オープンドメイン対話システムに使用される大規模事前学習言語モデル(PLM)の言語ポータビリティ戦略について検討する。
特に、ターゲットの低リソース言語(L_T)は、タスク固有のリソースがないため、フランス語でシミュレートされる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:20:54 GMT)
SecureSpectra: Safeguarding Digital Identity from Deep Fake Threats via Intelligent Signatures [1.7] DeepFake(DF)オーディオモデルは、音声認識システムに重大な脅威をもたらす。
音声に不可逆なシグネチャを埋め込んでDF脅威に対処する防御機構SecureSpectraを導入する。
Mozilla Common Voice、LibriSpeech、VoxCelebのデータセットに対する評価では、SecureSpectraの優れたパフォーマンスを示し、検出精度が最大71%向上した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:36:27 GMT)
Scalable Nested Optimization for Deep Learning [1.6] そこでは、パラメータのサブセットがそれぞれの内部にネストされた異なる目的に対して更新される2レベルまたはネストされた最適化があります。
この論文では、ディープラーニングのセットアップにスケールするネスト最適化のためのツールを構築します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:59:41 GMT)
A Polynomial Time Quantum Algorithm for Exponentially Large Scale Nonlinear Differential Equations via Hamiltonian Simulation [1.6] 量子コンピュータ上で効率よく解ける非線形ODEのクラスを導入する。
具体的には、非線形ODEの系をハミルトン力学にマッピングするために、クープマン・フォン・ノイマン線型化を用いる。
これにより、$O(rm log(N))$ overhead で非線形ODEを解くのに最適なハミルトンシミュレーション手法を利用できる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:55:12 GMT)
Integrated feature analysis for deep learning interpretation and class activation maps [1.6] 深層学習モデルから抽出した中間的特徴を深く調べる統合的特徴分析法を提案する。
この統合された機能分析は、データセットのオーバーフィット、共同創設者、アウトリーチに関する情報を提供する可能性がある。
CAMの平均クラスアクティベーションレベルとモデルのロジットとの整合性を計算することにより,本手法の評価を行った。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:10:57 GMT)
Unaligning Everything: Or Aligning Any Text to Any Image in Multimodal Models [1.5] 我々は、識別可能なテキストの埋め込みを、目立たない敵の攻撃によって、任意の画像に合わせることができることを示す。
本手法は,複数の情報源からのテキストデータセットや画像に適用した場合,100%の成功率を達成する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:25:47 GMT)
Deep Domain Specialisation for single-model multi-domain learning to rank [1.5] 複数のモデルをトレーニングし、メンテナンスし、更新するコストは、すべてのドメインに責任を持つ単一のモデルを持つよりも高い。
本稿では,複数のドメインをひとつのモデルに統合するディープ・ドメイン・スペシャライゼーション(DDS)のアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 01 Jul 2024 08:19:19 GMT)
Evaluating the Role of Data Enrichment Approaches Towards Rare Event Analysis in Manufacturing [1.4] 希少な出来事は、一般的な通常の出来事よりもはるかに低い頻度で起こる出来事である。
製造業では、計画外のダウンタイム、設備寿命の短縮、高エネルギー消費につながるため、このような事象を予測することが特に重要である。
本稿では,データエンリッチメント技術と教師付き機械学習技術を組み合わせて,まれな事象の検出と予測を行う役割について検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:05:56 GMT)
Finding Hidden Swing Voters in the 2022 Italian Elections Twitter Discourse [1.4] 2022年のイタリア総選挙において、Twitter上での政治メッセージと有権者行動の動態について検討した。
分析の結果,選挙期間中に政治家の人気が高まり,説得力のある言語技術の利用に顕著な違いがあることが判明した。
スウィング有権者は、様々な種類の政治的シフトの脆弱性パターンの違いがある非スウィング有権者に比べて、これらのプロパガンダ技術に弱い。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:34:29 GMT)
Quantum phase properties of a state driven by a classical fild [1.3] 我々は、駆動場の存在下で原子空洞相互作用によって生成される非古典的状態を考える。
出力空洞場に対応する量子状態は、$|psi(t)ranglelanglepsi(t)|$から原子部分を追跡することによって得られる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:47:23 GMT)
Parameter Tuning of the Firefly Algorithm by Standard Monte Carlo and Quasi-Monte Carlo Methods [1.2] Firefly Algorithm (FA) はパラメータ値が効率に与える影響を評価するために用いられる。
2つのベンチマーク関数とスプリング設計問題は、調整されたFAの堅牢性をテストするために使用される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:17:27 GMT)
A Deep Reinforcement Learning Approach to Battery Management in Dairy Farming via Proximal Policy Optimization [1.2] 本研究は, 農林水産経営の高度化をめざすための政策最適化の応用について検討する。
電力網への依存を減らす能力に基づいて,提案アルゴリズムの有効性を評価する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:46:09 GMT)
Exploring Advanced Large Language Models with LLMsuite [1.2] このチュートリアルでは、大規模言語モデルの開発における進歩と課題について説明する。
時間的知識の遮断、数学的不正確さ、誤った情報の生成など、固有の制限に対処する。
Retrieval Augmented Generation (RAG)、Program-Aided Language Models (PAL)、ReActやLangChainといったフレームワークなどのソリューションを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:37:17 GMT)
Are you sure? Analysing Uncertainty Quantification Approaches for Real-world Speech Emotion Recognition [1.2] 不確実性定量化(UQ)は、現実のシナリオにおけるニューラルネットワークの信頼性向上のための重要なビルディングブロックである。
単純なUQ手法は予測の不確実性を示すことができることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:11:08 GMT)
Towards debiasing code review support [1.2] 本稿では,コードレビュー中の認知バイアスによる有害症例について検討する。
特に,確認バイアスと判定疲労をカバーするプロトタイプを設計する。
既存のコードレビューツールで実装できるテクニックがあることを示します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:58:14 GMT)
Universal Quantum Tomography With Deep Neural Networks [1.1] 純量子状態トモグラフィーと混合量子状態トモグラフィーの両方に対する2つのニューラルネットワークに基づくアプローチを提案する。
提案手法は,実験データから混合量子状態の再構成を行なえることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:09:18 GMT)
A quantum algorithm to simulate Lindblad master equations [1.1] マルコフマスター方程式の族をシミュレートする量子アルゴリズムを提案する。
このアプローチでは、リンドブラッドマスター方程式の2階積公式を用いる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:41:46 GMT)
Survey and Analysis of IoT Operating Systems: A Comparative Study on the Effectiveness and Acquisition Time of Open Source Digital Forensics Tools [1.1] 本研究プロジェクトの主な目的は,IoT(Internet-of-Things)デバイスから収集したデジタルエビデンスに対する,オープンソース法医学ツールの有効性と速度を評価することである。
このプロジェクトでは、一般的なIoTオペレーティングシステム間で多くのIoT環境を作成し、設定し、この目標を達成するために一般的な法医学的タスクを実行する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:06:32 GMT)
Improved Monte Carlo tree search (MCTS) formulation with multiple root nodes for discrete sizing optimization of truss structures [1.1] 本稿ではモンテカルロ木探索(MCTS)を用いたトラス構造の離散最適設計法を提案する。
更新プロセスは、最終ソリューションが見つかると、次の検索ツリーの最初のソリューションとして使用されることを意味する。
最高の報酬は、バックプロパゲーションステップで使用されます。
探索木幅を減らし,最大反復回数を減らして高速化技術を導入する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:44:38 GMT)
H-SynEx: Using synthetic images and ultra-high resolution ex vivo MRI for hypothalamus subregion segmentation [1.0] 視床下部領域の自動セグメンテーションのための機械学習手法であるH-SynExを紹介する。
H-SynExは、リトレーニングなしで異なるMRIシーケンスと解像度を一般化する。
5mm間隔のFLAIR画像において,アルツハイマー病患者に対してコントロールを識別することができた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:33:32 GMT)
The House Always Wins: A Framework for Evaluating Strategic Deception in LLMs [1.0] 大規模言語モデル(LLM)における戦略的偽装を評価するための枠組みを提案する。
Llama3-70B, GPT-4-Turbo, Mixtralをブラックジャックでベンチマークした。
その結果,暗黙的ランダム性指示を受けると,LLMはフェアプレイから大きく逸脱することが判明した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:07:49 GMT)
Performance of large language models in numerical vs. semantic medical knowledge: Benchmarking on evidence-based Q&As [1.0] 大規模言語モデル(LLM)は言語ベースの臨床実践の多くの側面において有望な結果を示す。
包括的医療知識グラフ(50,00以上の査読済み記事から得られたデータ)を用いて「EBMQA」を作成しました。
私たちはこのデータセットを、最先端の2つのLLMであるChat-GPT4とClaude3-Opusについて24,500以上の質問を使ってベンチマークした。
いずれのLLMも数値QAよりもセマンティックに優れており,Claude3は数値QAでGPT4を上回っていることがわかった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:36:02 GMT)
Robustness of Higher Dimensional Nonlocality against dual noise and sequential measurements [1.0] Collins-Linden-Gisin-Masser-Popescuの不等式(CGLMP)の破れの頑健性は、測定と状態の両面から検討される。
次元の増大に伴い,非局所領域において,最大違反状態はより高められることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:49:17 GMT)
Data After Death: Australian User Preferences and Future Solutions to Protect Posthumous User Data [0.9] 1020人のオーストラリア人を対象に行った調査によると、ほとんどの人は死後のデータ管理のレベルを望んでいました。
平均的なオーストラリア人は、その死後に誰が自分のデータを管理したいのかは不明だ。
ソーシャルメディア企業は、死後のデータ管理の信頼性と利便性に関して低いランクを付けた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:38:45 GMT)
A Deep Learning Approach for Overall Survival Prediction in Lung Cancer with Missing Values [0.9] 非小細胞肺癌(NSCLC)患者の生存率を低下させる新しい治療法を提案する。
このモデルはトランスアーキテクチャの強みを利用して、計算戦略を必要とせずに利用可能な機能のみを考慮します。
検閲された患者と無検閲の患者の両方、そして時間の経過とともにリスクの変化を説明できる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:01:56 GMT)
Everything that can be learned about a causal structure with latent variables by observational and interventional probing schemes [0.9] 2つの因果構造が同一のmDAG構造と関連付けられている場合、区別できないことが判明した。
また,ある因果構造が他の因果構造を支配下に置く場合の問題点についても考察する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:01:07 GMT)
Leveraging Speaker Embeddings in End-to-End Neural Diarization for Two-Speaker Scenarios [0.9] エンドツーエンドのニューラルスピーカダイアリゼーションシステムは、音声重複を効果的に処理しながら、話者ダイアリゼーションタスクに対処することができる。
本研究は,話者識別能力を高めるため,エンド・ツー・エンドシステムへの話者情報埋め込みの導入について検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:26:28 GMT)
Robust Low-Cost Drone Detection and Classification in Low SNR Environments [0.9] ドローンを検知し、分類する能力について、様々な畳み込みニューラルネットワーク(CNN)を評価した。
本稿では,標準コンピュータ,ソフトウェア定義無線(SDR),アンテナを用いた低コストドローン検知システムについて紹介する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:07:16 GMT)
Pron vs Prompt: Can Large Language Models already Challenge a World-Class Fiction Author at Creative Text Writing? [0.9] 言語モデル(LLM)は、言語に関連した幅広いタスクにおいて、平均的な人間よりも優れています。
我々は,DeepBlue vs. Kasparov や AlphaGo vs. Lee Sidol といったAIと人間のデュエルの精神において,Patricio Pron と GPT-4 の対戦を行った。
結果は、LLMは人間のクリエイティブな作家に挑戦するほど遠くないことを示している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:28:58 GMT)
Object Segmentation from Open-Vocabulary Manipulation Instructions Based on Optimal Transport Polygon Matching with Multimodal Foundation Models [0.9] 対象オブジェクトに対するセグメンテーションマスクをオブジェクト操作命令から生成するタスクについて検討する。
本研究では,オープンな語彙命令からセグメンテーションマスクを生成する手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:48:48 GMT)
Comparing AI Algorithms for Optimizing Elliptic Curve Cryptography Parameters in e-Commerce Integrations: A Pre-Quantum Analysis [0.9] 本稿では遺伝的アルゴリズム(GA)と粒子群最適化(PSO)の比較分析を行う。
この研究は、バイオインスパイアされたアルゴリズムのどちらがECC構成に対するより良い最適化結果をもたらすかを洞察する。
量子コンピューティングの普及に先立って,これらの発見の即時検討を推奨する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:19:27 GMT)
Random Pulse Sequences for Qubit Noise Spectroscopy [0.8] クビットノイズスペクトロスコピーは、オープン量子系の実験的研究にとって重要なツールである。
ここでは、スペクトル密度を素早く特徴づける別の方法について述べる。
現実的な物理系, 自己集合量子ドット上でのランダムパルス列の性能のシミュレーションにより, ノイズスペクトルの抽出における桁違いの高速化が明らかとなった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:26:38 GMT)
Embedded FPGA Developments in 130nm and 28nm CMOS for Machine Learning in Particle Detector Readout [0.7] フィールドプログラマブルゲートアレイ(eFPGA)技術は、アプリケーション固有の集積回路(ASIC)の設計における再構成可能なロジックの実装を可能にする
FABulous"と呼ばれるオープンソースのフレームワークは、130nmと28nmのCMOS技術ノードを用いたeFPGAの設計に使用された。
ソースにおけるセンサデータの削減のために設計された機械学習ベースの分類器を合成し、eFPGA上に構成した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:07:16 GMT)
Image-to-Text Logic Jailbreak: Your Imagination can Help You Do Anything [0.7] 本稿では,意味のある画像からテキストへの論理的ジェイルブレイクの問題について考察する。
大規模ビジュアル言語モデルを用いたテキストからテキストへのジェイルブレイクのためのフレームワークを開発した。
我々の研究は、画像からテキストへのジェイルブレイクに関する現在のVLMの重大な脆弱性を明らかにしている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:58:55 GMT)
tPARAFAC2: Tracking evolving patterns in (incomplete) temporal data [0.7] 進化因子の時間的スムーズ性正規化を利用した t(emporal)PARAFAC2 を導入する。
シミュレーションおよび実データを用いた数値実験により,時間的滑らか度正則化の有効性が示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:10:55 GMT)
Immutable in Principle, Upgradeable by Design: Exploratory Study of Smart Contract Upgradeability [0.7] 本研究は、アップグレード可能なコントラクトを特定し、そのアップグレード履歴を調べて、変更に関連するトレンド、好み、課題を明らかにする。
4400万以上の契約を分析した結果、アップグレード可能な特性を持つのはわずか3%、アップグレード中のアップグレードは0.34%に過ぎなかった。
アップグレードとユーザアクティビティの関係は複雑で、進化を超えてスマートコントラクトの使用に大きな影響を与えることが示唆されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:35:37 GMT)
Universal quantum computing with qubits embedded in trapped-ion qudits [0.7] Quditベースの量子コンピューティングの最近の発展は、物理情報キャリアの数を増やすことなく量子プロセッサをスケールする興味深い可能性を開く。
そこで本研究では,量子回路を量子ビットに埋め込んだ場合の量子回路のコンパイル手法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:40:25 GMT)
Efficient realization of quantum algorithms with qudits [0.7] マルチレベル量子システム(キューディット)を用いた量子アルゴリズムの効率的な実装手法を提案する。
提案手法は,Quditベースのプロセッサのパラメータに依存する標準量子ビット方式の回路のトランスパイレーションを用いる。
特定の普遍集合から取られた単一量子ゲートと2量子ゲートの列に量子回路を変換する明示的なスキームを提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:55:37 GMT)
Empathic Grounding: Explorations using Multimodal Interaction and Large Language Models with Conversational Agents [0.7] 話者の感情がフォアグラウンドされるとき、共感的な接地が必要である。
本稿では,ユーザ音声および表情を入力とし,聴取エージェントに対するマルチモーダルグラウンド動作を生成するモデルについて述べる。
本研究は,会話エージェントに対する適切な接地行動を生み出す上での,感情意識とマルチモーダリティの役割を強調した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 21:46:30 GMT)
The Need for Guardrails with Large Language Models in Medical Safety-Critical Settings: An Artificial Intelligence Application in the Pharmacovigilance Ecosystem [0.7] 大規模言語モデル(LLM)は、特定の種類の知識処理を効果的にスケールする能力を備えた有用なツールである。
しかし、高リスクで安全に重要な領域への展開は、特に幻覚の問題など、ユニークな課題を生んでいる。
これは特に、不正確さが患者を傷つける可能性がある薬物の安全性のような設定に関係している。
我々は、特定の種類の幻覚と薬物安全性のエラーを軽減するために特別に設計されたガードレールのコンセプトスイートを開発し、実証した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:52:41 GMT)
Spin Resonance in Perspective of Floquet Theory and Brillouin-Wigner Perturbation Method [0.7] 上の三角要素 $langle alpha | H1 | beta rungle$ は共鳴が起こるかどうかを決定する。
一般化されたRabi周波数とBloch-Siegertシフトは、第1次および第2次解として簡単に解かれた。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:27:06 GMT)
ammBoost: State Growth Control for AMMs [0.6] 自動市場メーカ(AMM)は、分散ファイナンス(DeFi)アプリケーションの主要な例である。
その人気と高いトレーディング活動により、数百万のオンチェーントランザクションが深刻なスケーラビリティの問題を引き起こしました。
本稿では,新しいサイドチェーンアーキテクチャをレイヤ2ソリューションとして利用することにより,AMMのオンチェーンストレージオーバーヘッド問題に対処する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:10:56 GMT)
Privacy-First Crowdsourcing: Blockchain and Local Differential Privacy in Crowdsourced Drone Services [0.6] 本稿では,一般消費者向けドローンをブッシュファイア管理に組み込むためのプライバシー保護フレームワークを提案する。
主な機能としては、データプロバイダを保護するためのローカルな差分プライバシーと、公正なデータ交換と説明責任を保証するブロックチェーンベースのソリューションがある。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:46:25 GMT)
Decentralized PKI Framework for Data Integrity in Spatial Crowdsourcing Drone Services [0.6] 本論文では,IoT(Internet of Drone Things, IoDT)用に設計されたブロックチェーンベースのPKIフレームワークであるD2XChainについて述べる。
CAインフラストラクチャの分散化により、D2XChainはこの単一障害点を排除し、ドローン通信のセキュリティと信頼性を高める。
この革新的なアプローチは、さまざまなセキュリティ脅威に対するドローンサービスの防御を強化するだけでなく、プライベートなテストベッドへの展開を通じて、その実践的応用を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:55:07 GMT)
Classical and Quantum Frequency Combs for Satellite-based Clock Synchronization [0.6] 次世代の宇宙ネットワークには、衛星内に埋め込まれた光時計が含まれる。
現在の実験では、古典的な周波数コムが遠隔の光時計を自由空間上で同期させる可能性を示している。
しかし、スクイーズや絡み合いのような量子的性質を示す量子周波数コムは、標準的な量子限界を超える経路を提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 01:56:18 GMT)
Integrating Deep Learning in Cardiology: A Comprehensive Review of Atrial Fibrillation, Left Atrial Scar Segmentation, and the Frontiers of State-of-the-Art Techniques [0.5] 心房細動(英: atrial fibrillation、AFib)は、心臓不整脈である。
LGE-MRIを用いた心房粗動の分節化の最近の進展を概観する。
AFibの処理と管理における正確な傷痕測定の重要性を強調している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:33:52 GMT)
Biology-inspired joint distribution neurons based on Hierarchical Correlation Reconstruction allowing for multidirectional neural networks [0.5] HCRを用いた新しい人工ニューロン(階層的相関再構成)
ネットワークはまた、確率分布(例えば $rhoy,z|x)$ も伝播することができる。
また、テンソル分解によるdirect $(a_mathbfj)$ Estimationのような追加のトレーニングアプローチも可能である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:46:06 GMT)
A Comprehensive Survey on Diffusion Models and Their Applications [0.4] 拡散モデルは拡散過程をシミュレートして現実的なサンプルを作成する確率論的モデルである。
これらのモデルは、画像処理、音声合成、自然言語処理といった領域で人気を博している。
このレビューは、拡散モデルをより深く理解し、より広く採用することを目的としている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:10:29 GMT)
Training morphological neural networks with gradient descent: some theoretical insights [0.4] 形態素ネットワークに適用された微分に基づくアプローチとバックプロパゲーションの可能性と限界について検討する。
我々は、特に学習率に関する洞察と最初の理論的ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:40:03 GMT)
Human-Robot Mutual Learning through Affective-Linguistic Interaction and Differential Outcomes Training [Pre-Print] [0.4] 本研究では,感情言語コミュニケーションが人間ロボットの文脈における相互学習にどのように影響するかを検証する。
児童介護のダイナミックスからインスピレーションを得て、私たちの人間とロボットのインタラクションのセットアップは、内部的、ホメオスタティックに制御されたニーズのコミュニケーション方法を学ぶための(シミュレートされた)ロボットで構成されています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:35:08 GMT)
CoMadOut -- A Robust Outlier Detection Algorithm based on CoMAD [0.4] データセット上の機械学習アルゴリズムの予測を歪める可能性があるため、アウトレーヤは重要な役割を果たす。
この問題に対処するために,ロバストな外乱検出アルゴリズムCoMadOutを提案する。
われわれの手法は、外乱検出タスクの堅牢な代替手段と見なすことができる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:05:59 GMT)
Resilience of the quantum critical line in the Schmid transition [0.4] シュミドは、抵抗環境に結合した1つのジョセフソン接合が、シャント抵抗が抵抗量子$h/(4 e2)$を超えるとき、絶縁相への量子相転移を起こすと予測した。
最近の測定と理論的研究は、この遷移の場所がジョセフソンと充電エネルギーの比に依存するかどうかの議論を引き起こしている。
超伝導と絶縁挙動の遷移線はこのエネルギー比とは無関係であることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:12:51 GMT)
On the Generalization and Approximation Capacities of Neural Controlled Differential Equations [0.3] Neural Controlled Differential Equations (NCDE) は、不規則サンプル時系列を用いた教師あり学習のための最先端のツールである。
ニューラルネット上の古典的近似結果がNCDEにどのように移行するかを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:29:57 GMT)
Deep Dive into MRI: Exploring Deep Learning Applications in 0.55T and 7T MRI [0.3] ディープラーニング (DL) 技術の 0.55T と 7T MRI への統合について検討する。
DLが0.55Tと7TのMRIデータにどのように貢献するかを強調し、これらの技術の改善と精錬におけるDLの可能性を示している。
レビューは、今後数年でMRI技術がどのように進化していくか、という簡単な概要で終わる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:26:31 GMT)
Large Language Models are Zero-Shot Recognizers for Activities of Daily Living [0.3] LLMに基づく新しいADL認識システムであるADL-LLMを提案する。
ADL-LLMは、生センサデータをLLMによって処理されたテキスト表現に変換し、ゼロショットADL認識を行う。
ADL-LLMを2つの公開データセット上で評価し,その有効性を示した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:32:38 GMT)
sec-certs: Examining the security certification practice for better vulnerability mitigation [0.3] 致命的な脆弱性は保証レベルの高い認定製品で発見される。
このような脆弱性によって認定された製品が影響を受けるかを評価するのは、非構造化の認定関連データが大量にあるため、複雑である。
NISTのNational Vulnerability Databaseから、既存の認定製品に影響を与える脆弱性を学ぶために、教師なしのモデルをトレーニングしました。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:16:29 GMT)
APACE: AlphaFold2 and advanced computing as a service for accelerated discovery in biophysics [0.3] 我々は、APACE、AlphaFold2および高度なコンピューティング・アズ・ア・サービスを紹介します。
APACEは、独自のAlphaFold2実装よりも最大2桁高速である。
この計算手法は、科学的な発見を自動化し、加速するために、ロボティクス研究所と容易に関連付けられる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:25:05 GMT)
Investigating the Segment Anything Foundation Model for Mapping Smallholder Agriculture Field Boundaries Without Training Labels [0.2] 本研究は,インド・ビハール州の農地境界を規定するSegment Anything Model(SAM)について検討した。
我々はSAMの性能を3つのモデルチェックポイント、様々な入力サイズ、マルチ日付衛星画像、エッジ強調画像で評価した。
異なる入力画像サイズを使用することで精度が向上し、マルチ日付衛星画像を使用する場合に最も顕著な改善がなされる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:06:02 GMT)
Graph-theoretic insights on the constructability of complex entangled states [0.2] 本稿では,実験用量子光学において重要なオープンな疑問に答える実験用グラフ上での局所スペーサー化手法を紹介する。
これにより、量子資源理論、特定の量子フォトニクス系の制限、および量子物理学の実験を設計するためのグラフ理論技術の使用に関するさらなる洞察が得られます。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:05:25 GMT)
Representing Arbitrary Ground States of Toric Code by Restricted Boltzmann Machine [0.2] 隠れたニューロンと可視ニューロンの局所的接続のみを有する制限ボルツマンマシンによるトーリック符号基底状態の表現可能性の解析を行った。
我々は制限ボルツマン機械を改良し、効率的な非局所接続を導入することで任意の基底状態に適応する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:44:43 GMT)
Analyzing Persuasive Strategies in Meme Texts: A Fusion of Language Models with Paraphrase Enrichment [0.2] 本稿では,ミームテキストにおける説得手法の階層的マルチラベル検出へのアプローチについて述べる。
本研究の範囲は、革新的なトレーニング技術とデータ強化戦略を通じて、モデルパフォーマンスの向上を含む。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:25:20 GMT)
Multimodal Learning With Intraoperative CBCT & Variably Aligned Preoperative CT Data To Improve Segmentation [0.2] コーンビームCT(CBCT)はコンピュータ支援による介入を促進する重要なツールである。
劣化した画像品質は下流のセグメンテーションに影響を及ぼす可能性があるが、高品質の術前スキャンが利用可能であることは、改善の可能性を示唆している。
本稿では,CBCT と CT のほぼ一致したスキャンを融合させるマルチモーダル学習法を提案し,CBCT の品質と誤調整が最終的なセグメンテーション性能に与える影響について検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:57:32 GMT)
The Future of QKD Networks [0.0] 現時点で最大のQKDイニシアチブはEuroQCIで、規模が大きいため市場は成熟している。
そこで我々は,QKD仮想ネットワークを,柔軟性とセキュリティを向上するための有用なインフラストラクチャ抽象化として提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 00:56:13 GMT)
The African Woman is Rhythmic and Soulful: Evaluation of Open-ended Generation for Implicit Biases [0.0] 本研究では,Large Language Models (LLMs) における微妙かつしばしば隠蔽されるバイアスについて検討する。
LLMがますますプロプライエタリになるにつれて、そのようなバイアスを測定するという課題はさらに悪化する。
本研究では,心理学的方法論に触発されたバイアスの革新的な尺度を紹介する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:21:33 GMT)
The #Somos600M Project: Generating NLP resources that represent the diversity of the languages from LATAM, the Caribbean, and Spain [0.0] LATAM、カリブ海、スペインの言語は人工知能(AI)システムで表現する必要があるため、私たちは#Somos600Mプロジェクトを立ち上げた。
世界の人口の7.5%にも拘わらず、インストラクション・チューン・大型言語モデル(LLM)のデータセットは公開されていない。
我々は、教育と評価データセットの最初のバージョンを国際オープンソースコミュニティとして作成する方法について紹介する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:01:41 GMT)
Tensor networks for black hole interiors: non-isometries, quantum extremal surfaces, and wormholes [0.0] 双曲テンソルネットワークを用いてブラックホール内部のホログラフマップを構築する。
地平線の背後にある非等方性と量子超曲面の関係について検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:00:00 GMT)
Symmetry: a fundamental resource for quantum coherence and metrology [0.0] 量子状態が作用素$A$の固有状態であるとき、観測可能な$G$は、完全に非対角的であり純粋に量子ゆらぎを持つことを示す。
この性質は、量子状態の純度に関係なく成り立ち、これは相推定の計量的資源を非対角的ゆらぎで表すことを意味する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:19:37 GMT)
Statistical signatures of abstraction in deep neural networks [0.0] 我々は、ベンチマークデータセットに基づいてトレーニングされたDeep Belief Network(DBN)において、抽象表現がどのように現れるかを研究する。
表現は最大関連性の原理によって決定される普遍モデルに近づくことを示す。
また、プラスチック度は脳のそれと同じような深さで増加することも示しています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:13:11 GMT)
State preparation by shallow circuits using feed forward [0.0] 我々は,この4ステップ方式を用いて,フォールトトレラントな計算を行わず,短い,一定の深さの量子回路を強化する。
LAQCC回路は、一定の深さの量子回路では達成できない長距離相互作用を創出できることを示す。
我々は、任意の数の状態に対する一様重ね合わせのための3つの新しい状態準備プロトコルを作成する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:31:40 GMT)
Sociocultural Considerations in Monitoring Anti-LGBTQ+ Content on Social Media [0.0] オープンソーストレーニングデータの開発におけるアンチLGBTQ+スラーのキーワード検索アプローチは、スラーに過度に適合する検出モデルを奨励する。
実証的なアウトプットと質的な洞察を組み合わせることで、これらのシステムが目的に合うようにすることを推奨します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 10:17:13 GMT)
SecGenAI: Enhancing Security of Cloud-based Generative AI Applications within Australian Critical Technologies of National Interest [0.0] SecGenAIはクラウドベースのGenAIアプリケーションのための包括的なセキュリティフレームワークである。
オーストラリアのプライバシ原則、AI倫理原則、オーストラリアサイバーセキュリティセンターおよびデジタルトランスフォーメーションエージェンシーのガイドラインに従っている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:19:50 GMT)
Rényi second laws for black holes [0.0] ホーキングのブラックホール領域の定理は、熱力学の第二法則と重力過程の制約を実現するものである。
我々は、AdallyS空間におけるブラックホールの合併に焦点を当て、これらのR'enyi第二法則が最終状態に課す新たな制限を決定する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:31:29 GMT)
Reinvestigating the R2 Indicator: Achieving Pareto Compliance by Integration [0.0] 多目的最適化では、セットベースの品質指標がベンチマークと性能評価の基礎となる。
最もよく使われるセットベースメトリクスの1つは、R2インジケータである。
本稿では、(Tchebycheff)ユーティリティ関数の連続的一様分布を持つという前提のもと、R2インジケータを再検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:50:44 GMT)
Reflection and Transmission Amplitudes in a Digital Quantum Simulation [0.0] 短距離ポテンシャルを持つ粒子の一次元散乱の反射・透過振幅をディジタル量子シミュレーションで測定する方法を示す。
これにより、1量子ビットの読み出しから、一般的な複素数である散乱振幅をトモグラフィ的に再構成することができる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:00:01 GMT)
Ranking by Lifts: A Cost-Benefit Approach to Large-Scale A/B Tests [0.0] 大規模なテストを行うA/Bテスタは、nullの偽の拒絶をコントロールできることを望んでいる。
本研究は、偽発見率(FDR)制御を受ける利益を最大化する決定論的枠組みを開発する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:40:08 GMT)
Quantum signal processing over SU(N) [0.0] 量子信号処理(QSP)と量子特異値変換(QSVT)は、量子アルゴリズムの開発を単純化するための重要なツールである。
これらの手法は、ブロック符号化行列の固有値や特異値の変換を利用する。
本研究では、複数の制御量子ビットを導入することにより、元のQSPアンサッツを拡張する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:53:37 GMT)
Quantum interrogation using weak value measurement [0.0] 本稿では, 構成的干渉とポストセレクションを用いた量子問合せ測定手法を提案する。
本手法は, 弱減衰源だけでなく, 偏光単光子に対しても有効であることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:11:00 GMT)
Optimized Learning for X-Ray Image Classification for Multi-Class Disease Diagnoses with Accelerated Computing Strategies [0.0] 偽陽性は、非存在条件を誤って特定するリスクを導入し、誤診や患者のケア品質の低下につながる。
本研究では,X線画像のマルチクラス診断に適した事前学習型ResNetモデルを提案する。
通常のトレーニングと推論高速化トレーニングの間には,実行時の大幅な改善が示されている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:31:30 GMT)
Optimization of Retrieval-Augmented Generation Context with Outlier Detection [0.0] そこで本研究では,質問応答システムに必要な文脈の小型化と品質向上に焦点をあてる。
私たちのゴールは、最も意味のあるドキュメントを選択し、捨てられたドキュメントをアウトリーチとして扱うことです。
その結果,質問や回答の複雑さを増大させることで,最大の改善が達成された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:53:29 GMT)
Optimal Sample Lens Positioning in Digital Camera Systems [0.0] 本稿では,焦点探索におけるレンズ位置の最適化に不可欠な数学的複雑さと実践的考察について考察する。
速度と精度のバランスをとるなど、AFシステムで遭遇する課題に対処する。
提案手法は適応性と拡張性を提供し,広い範囲のカメラシステムに統合するのに適している。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:30:06 GMT)
Operational advantage of quantum resources in a semi-device independent framework [0.0] 線形独立な自由状態や自由操作が$d2$未満の任意のリソース理論に対して、量子リソースの存在を検出する相関が存在することを示す。
量子チャネルが量子ビットのみを送信することを制約されている場合、我々は様々な量子資源の存在を観察するために証人を明示的に構成する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:05:13 GMT)
Online Learning of Temporal Dependencies for Sustainable Foraging Problem [0.0] 持続可能な採餌問題は、マルチエージェント環境での社会的ジレンマを扱う際のエージェント認知の形式を探究するための動的環境テストベッドである。
本稿では,ニューロ進化とディープ・リカレントQ-ネットワークスにおけるオンライン学習の手法を検討する。
その結果, 長期記憶支援エージェントの統合は, 単一エージェントの持続可能な戦略開発に有効であったが, 多エージェントシナリオにおいて生じる社会的ジレンマの管理には役に立たなかった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:47:31 GMT)
On the feasibility of detecting quantum delocalization effects on relativistic time dilation in optical clocks [0.0] 重力場が存在する場合の光学格子配置において、非局在化原子時計の予測時間拡張を導出する。
古典的一般相対性理論の領域外にある相対論的時間拡張を持つ運動のエキゾチックな量子状態について検討する。
予測された量子相対論的時間拡張効果の大きさは、現在の8,7mathrmSr$光格子クロックにおいて検出可能な範囲外であることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 08:15:48 GMT)
On Implications of Scaling Laws on Feature Superposition [0.0] この理論的な注記は、法則のスケーリング結果を用いて、次の2つの文は同時に真であるとは限らないと論じている。
スパース特徴が層全体に線型に表現されるような重ね合わせ仮説は、特徴表現の完全な理論である。
同じデータでトレーニングされ、同等のパフォーマンスを達成する2つのモデルは、同じ特徴を学習する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:54:07 GMT)
Offline Digital Euro: a Minimum Viable CBDC using Groth-Sahai proofs [0.0] 現在のデジタル決済ソリューションは脆弱で、従来のキャッシュよりもプライバシーが低い。
サーバの障害や停電時にトランザクションは実行できない。
この論文は、オフラインファーストのデジタルユーロの設計と最初の実装を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:55:14 GMT)
Observation of a giant Goos-Hänchen shift for matter waves [0.0] グース・H・アンチェン(GH)シフト(英語版)は、反射面に沿って偏光ビームが横向きに変換される現象を記述している。
我々は全反射における中性子スピン状態の相対位相を測定した。
物理的GHシフトの存在は、導波路層における中性子吸収の観測によって確認される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 11:31:25 GMT)
Nullpointer at ArAIEval Shared Task: Arabic Propagandist Technique Detection with Token-to-Word Mapping in Sequence Tagging [0.0] 本稿では、ArAIEval共有タスク1から、ツイートやニュース節を含むアラビア語テキストにおけるプロパガンダ技術検出の最適化について検討する。
実験結果から,単語の最初のトークンをテクニック予測に頼っていると,最高の性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:15:24 GMT)
Non-Hermitian skin effect in arbitrary dimensions: non-Bloch band theory and classification [0.0] 非エルミート皮膚効果(Non-Hermitian skin effect, NHSE)は、非エルミート系において特徴的な現象である。
NHSEは、系の境界における固有状態の顕著な蓄積によって特徴づけられる。
任意の次元における幾何適応非ブロックバンド理論を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:49:53 GMT)
Neutrino oscillations originate from virtual excitation of Z bosons [0.0] ニュートリノ振動は空間上を拡散するZボゾン場の仮想励起に由来する。
ニュートリノが物質中に伝播するとき、その挙動は散乱に起因するコヒーレントフレーバー変換とデコヒーレンス効果の競合によって決定される。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 04:16:04 GMT)
My part is bigger than yours -- assessment within a group of peers using the pairwise comparisons method [0.0] プロジェクト(例えば、共同研究論文を書くなど)は、しばしばグループ作業である。最後に、各コントリビュータは、自分の貢献を、しばしば口頭で識別する。
このことは、論文作成におけるシェア(パーセント)が個々の著者によるものであるかという問題に繋がる。
本稿は, 専門家の意見の収集と, 他の専門家による評価とを直接リンクする簡易モデルを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:54:51 GMT)
Multifidelity linear regression for scientific machine learning from scarce data [0.0] 本稿では,線形回帰を用いた科学機械学習のための多面的学習手法を提案する。
我々は,提案手法の精度を保証し,高忠実度データの少ないロバスト性を向上する新しい推定器のバイアスと分散分析を行う。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:11:32 GMT)
Model Compression Method for S4 with Diagonal State Space Layers using Balanced Truncation [0.0] 本稿では, モデル圧縮手法として, 事前学習したS4モデルのDSS層に適用した, 制御理論における一般的なモデル縮小手法であるバランストランケーションを提案する。
数値実験により,従来のSkiw-HiPPOを用いたモデルよりも,トレーニングモデルとバランスの取れたトランケーションが優れていることが示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 07:55:40 GMT)
Microscopic origin of the quantum Mpemba effect in integrable systems [0.0] ムペンバ効果(Mpemba effect)は、非平衡状態は、平衡からさらに離れるとより速く緩和する。
U(1)保存電荷を持つ閉体系で発生するMpemba効果の量子バージョンについて検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:04:29 GMT)
Local-Aware Global Attention Network for Person Re-Identification Based on Body and Hand Images [0.0] 本稿では,身体画像と手動画像の両面から,人物Re-Idに対するエンドツーエンドの識別的深層特徴学習のための複合的アプローチを提案する。
提案手法は既存の最先端手法よりも一貫して優れている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:50:35 GMT)
Let Hybrid A* Path Planner Obey Traffic Rules: A Deep Reinforcement Learning-Based Planning Framework [0.0] 本研究では、ハイブリッドA*経路計画のような低レベルアルゴリズムと深層強化学習(DRL)を組み合わせることで、高レベルな意思決定を行う。
ハイブリッドA*プランナーは、モデル予測コントローラ(MPC)によって実行される衝突のない軌道を生成することができる
さらに、DRLアルゴリズムは、選択した時間内にレーン変更コマンドを一貫性を保つことができる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:00:10 GMT)
GAT-Steiner: Rectilinear Steiner Minimal Tree Prediction Using GNNs [0.0] グラフニューラルネットワーク(GNN)を用いて,RSMTにおける最適なスタイナー点を高精度に予測できることを示す。
我々は、ISPD19ベンチマークにおいて、ネットの99.846%を正確に予測するグラフアテンションネットワークモデルであるGAT-Steinerを提案する。
ランダムに生成されたベンチマークでは、GAT-Steinerは99.942%を正確に予測し、準最適ワイヤ長ネットでは平均で0.420%しか増加しない。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:32:49 GMT)
Fluorescence enhancement of single V2 centers in a 4H-SiC cavity antenna [0.0] 空洞型光アンテナにおけるV2中心の統合について報告する。
この構造は、平面キャビティとして機能する銀でコーティングされた135nmの薄膜4H-SiC膜からなる。
低温下で80MHz以下の平均幅の10V2中心を観測した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:58:22 GMT)
Flood Prediction Using Classical and Quantum Machine Learning Models [0.0] 本研究では,洪水予測の改善を目的とした量子機械学習の可能性について検討する。
私たちは2023年にドイツのウッパー川沿いで毎日の洪水イベントに焦点を合わせています。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:31:41 GMT)
Fault-tolerant noise guessing decoding of quantum random codes [0.0] 本稿では,不完全復号処理が可能な量子乱数線形符号(QRLC)のデコーダを提案する。
QRLCの耐故障特性を新しいノイズガッシング復号法を用いて解析する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:54:23 GMT)
Fast Iterative Solver For Neural Network Method: II. 1D Diffusion-Reaction Problems And Data Fitting [0.0] dBN法は、質量行列を含む線形方程式系の解法を必要とする。
我々は、$cal O(n)$演算で線形方程式の系を解くことができる質量行列の分解について述べる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:42:29 GMT)
Exploring Many-body Interactions Through Quantum Fisher Information [0.0] 多体インタラクションは、より高速な絡み合い生成、マルチビットゲートの実装、エラー修正の改善につながる可能性がある。
本研究では,適切な境界の違反を観測することにより,ハミルトニアンに対する多体結合を検出する可能性を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:36:35 GMT)
Exceeding the maximum classical energy density in fully charged quantum batteries [0.0] 古典電池では、各サブシステムのエネルギー密度は最大値に達し、$E_C$と表される。
我々は、量子エネルギーテレポータイオン(QET)のプロトコルにより、この限界を量子電池で超過できることを実証した。
提案プロトコルは,効率の向上,量子コンピュータの実験的複雑さの低減,即時エネルギー充電を実現する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:14:27 GMT)
Evaluation of Deep Learning Semantic Segmentation for Land Cover Mapping on Multispectral, Hyperspectral and High Spatial Aerial Imagery [0.0] 気候変動の台頭で、土地被覆マッピングは環境モニタリングにおいて緊急に必要となってきた。
本研究では,Unet,Linknet,FPN,PSPnetなどのセマンティックセグメンテーション手法を用いて植生や水などの分類を行った。
LinkNetモデルは、すべてのデータセットで0.92の精度でIoUで取得した。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:30:23 GMT)
Estimation of the set of states obtained in particle number measurement schemes [0.0] 本研究では,2モードの絡み合ったガウス状態の1つのモードにおける粒子数を測定することで生成する非ガウス状態の集合について検討した。
あるパラメータはガウス的特性に、他のパラメータは非ガウス的特性に、あるパラメータは非ガウス的特性に、という2つのタイプのパラメータに依存することが実証された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 13:26:54 GMT)
Entanglement is indispensable for masking arbitrary set of quantum states [0.0] 混在性や相互可換性に関わらず、2つの単一量子状態の任意の集合をマスキングするには絡み合いが必要であることを示す。
このことは、混合性や相互可換性に関わらず、2つの単一キュービット状態の任意の集合を隠蔽するためには絡み合いが必要であることを明らかにしている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:36:01 GMT)
Entanglement Hamiltonians and the quasiparticle picture [0.0] エンタングルメント・ハミルトニアン(英語版)は、多体量子系におけるバイパルタイトエンタングルメントの最も包括的な特徴づけを提供する。
非平衡な状況では、解析結果はまれであり、主に連続場理論に限られる。
非相互作用フェルミオンモデルにおける一般的な量子クエンチに従って、EHの正確な解析結果を示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:03:47 GMT)
Efficient Learning of Convolution Weights as Gaussian Mixture Model Posteriors [0.0] 畳み込み層の特徴写像は、画像モデリングのための特別な種類のガウス混合の非正規化ログ後部と等価であることを示す。
次に,モデルを拡張して多様な特徴を駆動し,モデルを学ぶための対応するEMアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:57:47 GMT)
Deep Image-to-Recipe Translation [0.0] Deep Image-to-Recipe Translation(ディープ・イメージ・ツー・レシピ・トランスレーション)は、鮮やかな食品記憶と料理作りの技法のギャップを埋めることを目的としている。
我々の主な目的は、所定の食品画像から成分を予測することである。
我々のアプローチは、正確性だけで誤解を招く可能性のあるシナリオにおいて、IoU(Intersection over Union)やF1スコアのようなメトリクスの重要性を強調します。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 02:33:07 GMT)
Decoherence of dielectric particles by thermal emission [0.0] 任意サイズおよび形状の剛性ローターの運動量子状態に対する熱放射の影響を説明するマスター方程式を提案する。
逆直観的な意味は、光学的等方性体の配向重ね合わせは、小粒子極限においても、その対称性によって保護されないということである。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 12:00:03 GMT)
DCSI -- An improved measure of cluster separability based on separation and connectedness [0.0] あるデータセットのクラスラベルが意味のあるクラスタに対応するかどうかは、実世界のデータセットを用いたクラスタリングアルゴリズムの評価に不可欠である。
密度に基づくクラスタリングにおける分離性の中心的な側面は、クラス間の分離とクラス内の連結性である。
新たに開発された尺度 (density cluster separability index, DCSI) は、これらの2つの特性を定量化することを目的としており、CVIとしても使用できる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:04:12 GMT)
Coordinated Disclosure of Dual-Use Capabilities: An Early Warning System for Advanced AI [0.0] 本稿では,先進的なAI開発者や米国政府機関,その他の民間企業との早期情報共有を支援するプロセスとして,CDDC(Coordinated Disclosure of Dual-Use Capabilities)を提案する。
これは、米国政府、デュアルユースファンデーションモデル開発者、その他のアクターに、公衆の安全とセキュリティに大きな影響を与える可能性のあるAI機能の概要と、対応の最大時間を提供することを目的としている。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:09:54 GMT)
Control of multi-modal scattering in a microwave frequency comb [0.0] 周波数コムのモード間の結合の制御は、測定に基づく量子計算への重要なステップである。
95モードのマイクロ波コンブにおける2乗ラダー相関グラフの作成を実証する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:08:19 GMT)
Column and row subset selection using nuclear scores: algorithms and theory for Nyström approximation, CUR decomposition, and graph Laplacian reduction [0.0] 我々は,高速,効率的,理論的に保証された列選択のための統一手法を開発した。
まず、カーネル近似やCUR分解といったタスクに適用可能な空間分割決定アルゴリズムを導出し、実装する。
次に、保証濃度境界を満たすランダム化スキームに依存する行列自由形式を考案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 18:10:19 GMT)
Classicality concept test on neutral pseudoscalar meson qubits with Wigner inequalities [0.0] 弱不等式は2つの瞬間に依存し、潜在的に3つの瞬間に拡張される。
Wignerの不等式は、バックグラウンドプロセスがシステムの最大50%を構成している場合でも検出可能であることを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:39:38 GMT)
Chronological Analysis of Rigvedic Mandalas using Social Networks [0.0] リグ・ヴェーダには10のマンダラスがあり、それぞれ別々に作曲されている。
我々は、異なるマンダラスで信仰されている神と神々に焦点をあてることで、マンダラスの内部の年代学へのもっともらしい指針を考察する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:16:46 GMT)
Can Small Language Models Learn, Unlearn, and Retain Noise Patterns? [0.0] 小型言語モデル(SLM)は、一般に大型言語モデル(LLM)のよりコンパクトなバージョンと考えられている。
本研究は,インターネット上では通常見つからない雑音を学習・保持・除去する小型言語モデルの能力について検討する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 06:22:38 GMT)
CSFNet: A Cosine Similarity Fusion Network for Real-Time RGB-X Semantic Segmentation of Driving Scenes [0.0] マルチモーダルなセマンティックセグメンテーション手法は、高い計算複雑性と低い推論速度に悩まされる。
本稿では,リアルタイムRGB-XセマンティックセマンティックセグメンテーションモデルとしてCosine similarity Fusion Network (CSFNet)を提案する。
CSFNetは最先端の手法と競合する精度を持ち、速度に関しては最先端の手法である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:34:32 GMT)
CGRclust: Chaos Game Representation for Twin Contrastive Clustering of Unlabelled DNA Sequences [0.0] CGRclustは、DNA配列のChaos Game Representations(CGR)と畳み込みニューラルネットワーク(CNN)を組み合わせた、教師なし双対のコントラストクラスタリングの新規な組み合わせである
CGRclustは、DNA配列のクラスタリングデータセットのイメージ分類に教師なし学習を使用する最初の方法である。
CGRclustは、魚類のミトコンドリアDNAゲノムで検査された4つの分類レベル全てで81.70%を超える唯一の方法である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 23:24:05 GMT)
Acceleration method for generating perception failure scenarios based on editing Markov process [0.0] 本研究では, 地下駐車場環境に合わせて, 認識障害シナリオを高速化する手法を提案する。
この方法は、認識障害シナリオの密度の高いインテリジェントなテスト環境を生成する。
認識障害シナリオデータ内のマルコフプロセスを編集し、トレーニングデータ内の臨界情報の密度を増大させる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 05:33:48 GMT)
Accelerate Intermittent Deep Inference [0.0] 現代のトレンドは、Deep Neural Net (DNN) Modelsをバッテリレス断続的なデバイスで実行可能にすることに焦点を当てている。
我々は,256KB未満を対象とする最適化推論モデルのパワーを活用し,間欠的パワー内でのスケジューリングと実行を可能にするために,高速化された間欠的深部推論を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 20:15:16 GMT)
Absorbing State Phase Transition with Clifford Circuits [0.0] 接触過程における1次元量子ビット鎖の吸収状態相転移について検討した。
我々は、安定化器の定式化で記述できる状態を持つ離散時間量子モデルを採用する。
我々は解析を非クリフォード回路モデルに拡張し、小さなシステムにおける仮のスケーリング解析によって臨界指数が明らかになる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 14:41:40 GMT)
A diagrammatic language for the Causaloid framework [0.0] カウサロイドフレームワークは、一般相対性理論(動的因果構造、量子理論)の根本的側面と不確定性の両方を収容することを目的としている。
一般化された確率論(英語版)(GPT)の一般化と見なすことができるが、先験領域は特定の因果関係を持たないと仮定される。
これは、コーサロイド(GPTを許す)とヒルベルト空間を用いた後量子研究の間のギャップを埋めることを目的とした論文三部作における最初の論文である。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 17:59:23 GMT)
A Study of Nationality Bias in Names and Perplexity using Off-the-Shelf Affect-related Tweet Classifiers [0.0] バイアス検出のためにテンプレートや特定のデータセットに頼るのではなく、ターゲットドメインデータに小さな摂動を持つ対実例を作成します。
感情,感情,ヘイトスピーチなどの主観的分析に広く用いられている分類器について,本研究の結果は,ある国で話されている言語に関する肯定的なバイアスを示す。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 22:17:17 GMT)
A Global-Local Attention Mechanism for Relation Classification [0.0] 本稿では,関係分類のための新たなグローバルアテンション機構を提案する。
そこで我々は,局所的な注意を喚起するための潜在的なキーワードを特定するために,革新的なハードおよびソフトな局所化機構を提案する。
SemEval-2010 Task 8のデータセットに対する実験結果から,従来のアテンションに基づく関係分類手法と比較して,提案手法の優れた性能が示された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 16:14:25 GMT)
A Domain Decomposition-Based CNN-DNN Architecture for Model Parallel Training Applied to Image Recognition Problems [0.0] モデル並列トレーニング戦略を自然にサポートする新しいCNN-DNNアーキテクチャを提案する。
提案手法は,グローバルモデルと比較して,必要なトレーニング時間を著しく短縮することができる。
その結果,提案手法は,基礎となる分類問題の精度向上にも有効であることが示唆された。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 19:12:49 GMT)
A Convex Hull Cheapest Insertion Heuristic for the Non-Euclidean TSP [0.0] 凸船体で最も安価な挿入は、ユークリッド空間におけるトラベリングセールスパーソン問題に対する良い解を生み出すことが知られている。
本稿では、多次元スケーリングを用いて、まず非ユークリッド空間からユークリッド同値空間へ点を投影する適応法を提案する。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 15:56:49 GMT)
$σ$-PCA: a building block for neural learning of identifiable linear transformations [0.0] $sigma$-PCAは線形および非線形PCAの統一モデルを定式化する手法である。
非線形PCAは、ばらつきと統計的独立性の両方を最大化する方法と見なすことができる。
論文参考訳(メタデータ) (Mon, 1 Jul 2024 09:55:40 GMT)