- 2024-11-06Frequent Directions
目录概FrequentDirectionsFrequentDirectionsoverSliddingWindows代码GhashamiM.,LibertyE.,PhillipsJ.M.andWoodruffD.P.Frequentdirections:Simpleanddeterministicmatrixsketching.2015.YinH.,WenD.,LiJ.,WeiZ.,ZhangX.,HuangZ.andL
- 2024-10-14题解:P2315 [HNOI2005] 数三角形
ProblemLink[HNOI2005]数三角形题意输入一个大三角形的各个边存在情况,输出里面有多少个正三角形。Solution简单暴力即可,用\(4\)个数组维护每条边能延伸的最大长度,然后逐个判断三角形是否可行即可。如图,l_upper维护左端点向上(即$\ell_{BA}$),l_lower维护左端点向下(即
- 2024-10-11Auxiliary Learning by Implicit Differentiation
目录概AuxiLearn问题设定理解两阶段的训练代码NavonA.,AchituveI.,MaronH.,ChechikG.andFetayaE.Auxiliarylearningbyimplicitdifferentiation.ICLR,2021.概通过implicitdifferentiation优化一些敏感的参数.AuxiLearn在实际的训练中,我们常常会通过
- 2024-10-10似然
似然问题背景:我们观察到随机变量\(Y\)的值\(y\),而\(Y\)的概率密度函数\(f(y;\theta)\)已知,但依赖于参数\(\theta\)。参数\(\theta\)来自参数空间\(\Theta\),观测数据来自样本空间\(\mathcal{Y}\)。目标是根据观测数据\(y\),推断参数\(\theta\)的可能取值范围
- 2024-09-11Lagrange 插值
给定\(n\)个横坐标不同的点,求过这\(n\)个点的\(n-1\)次多项式。算法引入这可以直接用高斯消元做,但是时间复杂度\(\mathcalO(n^3)\)不可接受,我们需要优化。我们令\((x_1,y_1),(x_2,y_2),\dots,(x_t,y_t)\)为这些点。考虑构造一个函数\(\ell_j(x)\)满足\[\ell_
- 2024-09-10Memory-Efficient Adaptive Optimization
目录概符号说明SM3区间的划分代码AnilR.,GuptaV.,KorenT.,SingerY.Memory-efficientadaptiveoptimization.NeurIPS,2019.概本文提出了一种memory-efficient的优化器:SM3.符号说明\(t=1,\ldots,T\),optimizationrounds;\(w_t\in\mathbb{R}^d\),par
- 2024-07-24FlashAttention全解
目录LLM大模型训练加速利器FlashAttention详解一、FlashAttention1.1硬件基础1.2FlashAttention核心思想1.3计算前提1.4FlashAttention算法二、FlashAttention-22.1硬件特性2.2标准的注意力实现2.3FlashAttention-12.3.1前向传播2.3.2反向传播2.4FlashAttention-22.4
- 2024-07-15动态图连通性笔记
首先离线的话有几种方法:线段树分治动态维护最大生成树:边的权值为他的(下一次)删除时间,加边正常做,询问时问路径最小值是否小于当前时刻.动态图连通性Holm-deLichtenberg-Thorup(HLT)暴力:维护生成森林,若删树边则暴力找另一条边能替代这条树边.思想:给每条边赋一个“不重
- 2024-07-10闲话 24.7.10
闲话啊,zzz真好玩啊!慢热型,战斗非重点,美术风格超赞。如果不排斥米家f2p游戏,推荐大家玩一玩。我是冲着妹妹去的未来会补一些杨表公式的证明。现在先咕!推歌:辰砂byLicisetal.feat洛天依AI增补:另类杨图对应杨表计数前置知识:杨表什么是另类?不是一般的杨图,就是另类的杨图
- 2024-07-07An Attentive Inductive Bias for Sequential Recommendation beyond the Self-Attention
目录概符号说明BSARec(BeyondSelf-AttentionforSequentialRecommendation)代码ShinY.,ChoiJ.,WiH.andParkN.Anattentiveinductivebiasforsequentialrecommendationbeyondtheself-attention.AAAI,2024.概本文在attentionblock中引入高低频滤波.
- 2024-05-11ELL-8051-LIB - 面向8051的高效低封装函数库+KLite - 简洁易用的嵌入式操作系统内核
1、Arm-2D-基于Cortex-M的2D图形加速库ARM官方出品的2D图形加速库,在Cortex-M55系统频率8MHz下就可以实现30fps的渲染(6图层。320x240,rgb565)。项目主页: https://github.com/ARM-software/EndpointAI/tree/master/Kernels/Research/Arm-2DArm-2D库特性包括但不限于:*
- 2024-03-18数据的压缩编码
\(\newcommand{\E}{\mathbb{E}}\)\(\newcommand{\X}{\mathcal{X}}\)现在我们要开始讨论熵的意义,为此我们依然要回到数据的压缩编码这一核心概念上。首先我们要严格地定义编码。在这里,我们默认是用二进制进行编码。事实上,我们将要证明的所有结论对于一般的\(\mathcal{D}\)进制而言
- 2024-03-11【论文阅读】N-BEATS Neural basis expansion analysis for interpretable time series forecasting
原始题目:N-BEATS:Neuralbasisexpansionanalysisforinterpretabletimeseriesforecasting中文翻译:N-BEATS:可解释时间序列预测的神经基展开分析发表时间:2020-02-20平台:arXiv文章链接:http://arxiv.org/abs/1905.10437开源代码:https://github.com/servicenow/n-beats
- 2023-12-20Min-25筛
Min-25筛学习笔记现在写了。拜谢oi-wiki。波特好闪。liuhangshin是我们的红太阳。Chery写完OJWhen?启动!问题\[\sum_{i=1}^{n}f(i)\]其中\(f\)是积性函数,\(f(p)\)是低阶多项式,\(f(p^c)\)能快速求值。条件其实非常宽松。约定和记号\(p_k\):第\(k\)小的质数。
- 2023-12-12Huffman 编码的估计
\(\newcommand{\HH}{\operatorname{H}}\)我们熟知一些说法,比如一个二叉树如果第\(i\)个节点的访问次数是\(w_i\),那么最优的建树会使得总共访问节点次数是\[O\left(\sumw_i\log\frac{W}{w_i}\right)\]量级的,其中\(W=\sumw_i\).那么这个说法到底有多精确呢?
- 2023-09-26解析几何 | 第 2 版
\(\boldsymbol{Analytic\Geometry}\text{II}\)bydjs.latestupdateforI:2023.07.03latestupdateforII:2023.09.26构建思路小题一般用几何。下一步:列式方向、条件翻译、计算量预判、二级结论的应用。二级结论有些乱还。资料:\(\elli\)\(nk\)一个不错的视频
- 2023-08-12论文解读(TAT)《 Transferable Adversarial Training: A General Approach to Adapting Deep Classifiers》
Note:[wechat:Y466551|可加勿骚扰,付费咨询]论文信息论文标题:TransferableAdversarialTraining:AGeneralApproachtoAdaptingDeepClassifiers论文作者:HongLiu,MingshengLong,JianminWang,MichaelI.Jordan论文来源:ICML2019论文地址:download 论文代码:download
- 2023-06-17 【CF1841C 题解】
首先,我们把\(s\)翻转。考虑dp,\(f_{i,j,k}\)表示到了第\(i\)个字符,操作了\(j\)个字符,最大的字符为\(k\)的最大值。转移时枚举\(i-1\)的最大字符\(\ell(0\le\ell<5)\)。不操作第\(i\)个字符;\(f_{i,j,k}=\max\{f_{i-1,j,\ell}+w\}\)。操作第\(i\)
- 2023-06-07Deep One-Class Classification
DeepOne-ClassClassifificationDeepSVDD(DeepSupportVectorDataDescription)训练一个神经网络,最小化包含数据表征的超球的体积(如图1所示)DeeoSVDD的目标函数soft-boundaryDeepSVDD输入空间\(\mathcal{X}\subseteq\mathbb{R}^d\)和输出空间\(\mathcal{F}\subs
- 2023-06-04权重衰减
1.通常权重衰减等价于L2正则化控制模型容量方法:模型变得比较小,即参数比较少。参数值的选择范围比较小。权重衰减通过限制参数值的选择范围来控制模型容量:\[min\\ell(\mathbf{w},b)\\\\subject\to\\||\mathbf{w}||^2\leqslant\theta\tag{1}\]通常不限制偏
- 2023-05-27Basics of Neural Network Programming
目录BasicsofNeuralNetworkProgrammingLogisticRegressionBasicsofNeuralNetworkProgrammingLogisticRegressiongivenx,want\(\hat{y}=P(y=1|x)\),\(x\in\R^{n_x}\)\(\hat{y_1}=w_{11}*x_{11}+w_{12}*x_{12}+\dots+w_{1n_x}*x_{1n_x}+b_1\).P
- 2023-05-15Solution Set - “说选个晴日,露能滴出彩虹”
目录0.「BZOJ#3457」Ring1.「CF1824C」LuoTianyiandXOR-Tree2.「CF1824D」LuoTianyiandtheFunction3.「CF1728F」Fishermen4.「CF1305H」KuronithePrivateTutor⭐5.「十二省联考2019」「洛谷P5291」希望⭐6.「IOI2007」「洛谷P4649」训练路径7.「BJOI2018」「
- 2023-05-09Solution Set - “请背诵每条魔法的禁忌”
目录0.「HAOI2018」「洛谷P4494」反色游戏1.「JSOI2010」「洛谷P6029」旅行2.「CTSC2017」「洛谷P3774」最长上升子序列⭐3.「CTSC2018」「洛谷P4566」青蕈领主⭐4.「CTSC2008」「洛谷P4528」图腾5.「SDOI2017」「洛谷P3779」龙与地下城6.「JSOI2018」「洛谷P4558
- 2023-04-23Solution Set - “卷起击碎定论的漩涡”
目录0.「CF1788F」XOR,Tree,andQueries1.「CF1815F」OHNO1(-2-3-4)2.「CF1787F」InverseTransformation3.「CF1797F」LiHuaandPath4.「CF1815B」SumGraph5.「AGC022C」RemainderGame6.「CTT2021」「洛谷P8986」基因编辑7.「CTT2021」「洛谷P8985」魔塔OL⭐
- 2023-04-13脑力体操: 半在线卷积能做到多好? (van der Hoeven, 2007)
固定一个可以\(O(1)\)运算的effectivefield\(K\),并且假设其上的FFT时间复杂度为\(O(N\logN)\).有序列\(\{g\}\)和\(\{\phi\}\),如何计算半在线卷积\(f_n=\phi_i(\sum_{i>0}g_if_{n-i})\)?Folklore把序列拆成两个\(N/2\)长度的段,左边算完了算左边对右边