网站首页
编程语言
数据库
系统相关
其他分享
编程问答
要会
2025-01-07
【NLP高频面题 - Transformer篇】Position encoding为什么选择相加而不是拼接呢?
**【NLP高频面题-Transformer篇】Positionencoding为什么选择相加而不是拼接呢?**重要性:★首先明确:Transformer会对原始输入做嵌入(embedding),从而映射到需要的维度,可采用一个变换矩阵做矩阵乘积的方式来实现,Transformer中的positionembedding也是加在这个嵌入后
2025-01-04
NLP高频面题 - LLM架构篇】使用SwiGLU相对于ReLU有什么好处?
【NLP高频面题-LLM架构篇】使用SwiGLU相对于ReLU有什么好处?重要性:★★★
2024-12-04
【NLP高频面题 - LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势?
【NLP高频面题-LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势?重要性:⭐⭐⭐
2024-12-01
作为Linux初学者,这25个命令一定要会!
Linux系统以其强大的命令行操作而闻名,对于初学者来说,掌握一些基础的命令是入门的关键。这篇文章将详细介绍25个Linux常用命令,每个命令都有其独特功能和用途,希望能够帮助你快速上手。一、文件和目录管理命令1.pwd:显示当前目录当你打开终端时,你的位置默认是用户主目
2024-12-01
【NLP高频面题 - LLM架构篇】旋转位置编码RoPE如何进行外推?
【NLP高频面题-LLM架构篇】旋转位置编码RoPE如何进行外推?重要性:★★★
2024-11-30
【NLP高频面题 - LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势?
【NLP高频面题-LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势?重要性:⭐⭐⭐
2024-11-29
【NLP高频面题 - LLM架构篇】大模型为何使用RMSNorm代替LayerNorm?
【NLP高频面题-LLM架构篇】大模型为何使用RMSNorm代替LayerNorm?重要性:★★★
2024-11-28
【NLP高频面题 - LLM架构篇】LLM对Transformer都有哪些优化?
【NLP高频面题-LLM架构篇】LLM对Transformer都有哪些优化?⚠︎重要性:★★★
2024-11-28
【NLP高频面题 - LLM架构篇】LLM为何使用GQA代替MHA?
【NLP高频面题-LLM架构篇】LLM为何使用GQA代替MHA?重要性:★★
2024-11-28
【NLP高频面题 - LLM架构篇】LLM对Transformer都有哪些优化?
【NLP高频面题-LLM架构篇】LLM对Transformer都有哪些优化?⚠︎重要性:★★★
2024-11-26
【NLP高频面题 - 分布式训练】ZeRO1、ZeRO2、ZeRO3分别做了哪些优化?
【NLP高频面题-分布式训练】ZeRO1、ZeRO2、ZeRO3分别做了哪些优化?重要性:★★NLPGithub项目:NLP项目实践:fasterai/nlp-project-practice介绍:该仓库围绕着NLP任务模型的设计、训练、优化、部署和应用,分享大模型算法工程师的日常工作和实战经验AI藏经阁:https://gite
2024-11-25
【NLP高频面题 - LLM架构篇】什么是旋转位置编码(RoPE)?
【NLP高频面题-LLM架构篇】什么是旋转位置编码(RoPE)?重要性:★★★
2024-11-24
【LLM训练】从零训练一个大模型有哪几个核心步骤?
【LLM训练】从零训练一个大模型有哪几个核心步骤?⚠︎重要性:★★★NLPGithub项目:NLP项目实践:fasterai/nlp-project-practice介绍:该仓库围绕着NLP任务模型的设计、训练、优化、部署和应用,分享大模型算法工程师的日常工作和实战经验AI藏经阁:https://gitee.com/fas
2024-11-24
【淘汰9成NLP面试者的高频面题】RNN是如何基于时间进行参数学习(BPTT)的?
【淘汰9成NLP面试者的高频面题】RNN是如何基于时间进行参数学习(BPTT)的?重要性:★★本题主要考察面试者有有以下几点:①理解RNN循环的概念,认识到截断的BPTT的必要性②理解深度学习框架在处理反向传播时需要在保存各个时刻的中间(前向计算)数据,会消耗大量的显存这是我常用
2024-11-24
【LLM训练】从零训练一个大模型有哪几个核心步骤?
【LLM训练】从零训练一个大模型有哪几个核心步骤?⚠︎重要性:★★★NLPGithub项目:NLP项目实践:fasterai/nlp-project-practice介绍:该仓库围绕着NLP任务模型的设计、训练、优化、部署和应用,分享大模型算法工程师的日常工作和实战经验AI藏经阁:https://gitee.com/fastera
2024-11-23
【淘汰9成NLP面试者的高频面题】RNN是如何基于时间进行参数学习(BPTT)的?
【淘汰9成NLP面试者的高频面题】RNN是如何基于时间进行参数学习(BPTT)的?重要性:★★本问题主要考察面试者有有以下几点:①理解RNN循环的概念,认识到截断的BPTT的必要性②理解深度学习框架在处理反向传播时需要在保存各个时刻的中间(前向计算)数据,会消耗大量的显存这是我常用
2024-12-12
人工智能时代,财务人的自救指南
在人工智能迅猛发展的当下,财务领域正经历着深刻变革。财务、会计这类与算数紧密相关的职业首当其冲,受到人工智能的强烈冲击。 就拿商场、门店来说,收银工作已从人工转变为机器操作。以往收银时需一件件扫码,如今只需将商品全部放入识别箱,就能批量扫码并快
2024-07-06
lambda必须要会的十种姿势
flatmap的使用处理嵌套,一般是二维数组(集合)importjava.util.*;importjava.util.stream.*;classBook{privateList<Chapter>chapters;publicBook(List<Chapter>chapters){this.chapters=chapters;}publicList<Chapter>
2024-03-09
互联网运营者为什么要会运用热点思维?
互联网运营者需要运用热点思维,主要是出于以下几个方面的原因:吸引注意力:在互联网信息爆炸的时代,用户的注意力变得极为宝贵。热点事件具有天然的吸引力,能够迅速吸引大量用户的关注和讨论。通过运用热点思维,运营者可以借助热点事件,将品牌或产品与热门话题相结合,从而吸引用户的注意力
2024-01-23
泛微OA触发关联流程提交操作思路
1.首先数据下数据字典,查询workflow_requestbase表的currentnodeid,currentnodetype.根据判断条件requestid查询即可2.第二部完成数据库端数据的查询更新,及前端页面的效果测试 3.更新好节点ID和节点类型后会发现流程会出现在下一个节点,这个时候编写action即可(可加各种判断条
2023-10-31
老是听到做PPT要会“内容可视化”,到底啥是内容可视化?
在PPT中,内容可视化是指将文字、数据和概念等抽象信息转化为图像、图表、图表及其他可视化元素来呈现。通过合适的颜色、形状、大小和布局等视觉设计元素来强调信息的关键点和关系,从而提高观众对信息的理解和记忆。内容可视化是一种将复杂的信息和数据转换为易于理解和吸引人
2023-07-05
从事工程、OSPO 或开发者关系领域工作人员为什么一定要会写文档?
我是Postman开放技术计划办公室的负责人,最近,在一次PostmanOpenTechnologies团队会议上,我提出了一个非常笼统的方向:我们必须成为以文档著称的团队,并需要个人和团队共同记录所有内容。虽然还有更多背景信息,比如我们与产品团队的协作等等,但这也是我给自己以及其他从事工程、OS
2023-02-24
月薪没到30K的测试员必须要会的技能,我先啃为敬
最近感慨面试难的人越来越多了,一方面是市场环境,更重要的一方面是企业对软件测试的人才要求越来越高了。基本上这样感慨的分为两类人第一,虽然挂着3、5年经验,但肚子里货少,也没
2023-02-08
JS解密解密必须要会的一些小语法技巧
此文章由jsjiami.com技术提供,需要js加解密可直接官网底部联系方式。一、数组相关1、数值类型转数组JS版本constcastArray=(value)=>(Array.isArray(value)?v
2022-11-22
进大厂必须要会的单元测试
本文将按照如下顺序给大家简单讲讲单元测试应该怎么写什么是单元测试单元测试又称模块测试,是针对软件设计的最小单位(模块)就行正确性的校验的测试,检查每个程序模块是否实