ChatGLM2 源码解析：`MLP`

时间：2023-09-04 18:11:06浏览次数：54

标签：ChatGLM2 bias MLP 源码 device hidden config self

class MLP(torch.nn.Module):
    """MLP.

    MLP will take the input with h hidden state, project it to 4*h
    hidden dimension, perform nonlinear transformation, and project the
    state back into h hidden dimension.
    """

    def __init__(self, config: ChatGLMConfig, device=None):
        super(MLP, self).__init__()

        self.add_bias = config.add_bias_linear

        # Project to 4h. If using swiglu double the output width, see https://arxiv.org/pdf/2002.05202.pdf
        # LL1，最后一维 ES => 4ES
        self.dense_h_to_4h = nn.Linear(
            config.hidden_size,
            config.ffn_hidden_size * 2,
            bias=self.add_bias,
            device=device,
            **_config_to_kwargs(config)
        )

        def swiglu(x):
            x = torch.chunk(x, 2, dim=-1)
            return F.silu(x[0]) * x[1]

        self.activation_func = swiglu

        # LL2，最后一维 4ES => ES
        self.dense_4h_to_h = nn.Linear(
            config.ffn_hidden_size,
            config.hidden_size,
            bias=self.add_bias,
            device=device,
            **_config_to_kwargs(config)
        )

    def forward(self, hidden_states):
        # 输入 -> LL1 -> swiglu -> LL2 -> 输出
        intermediate_parallel = self.dense_h_to_4h(hidden_states)
        intermediate_parallel = self.activation_func(intermediate_parallel)
        output = self.dense_4h_to_h(intermediate_parallel)
        return output

标签：ChatGLM2,bias,MLP,源码,device,hidden,config,self
From： https://www.cnblogs.com/apachecn/p/17677762.html

百度上传下载组件源码
以ASP.NETCoreWebAPI 作后端 API ，用 Vue 构建前端页面，用 Axios 从前端访问后端 API,包括文件的上传和下载。准备文件上传的API #region 文件上传可以带参数 [HttpPost("upload")] publicJsonResultuploadProject(I......
java智慧工地：智慧工地大数据中心源码
智慧工地技术架构：微服务+Java+SpringCloud+Vue+UniApp+MySql智慧工地形成安全、质量、进度、人员、机械、绿色施工六大针对性解决方案。安全管理围绕重大危险源提供管控，可视化跟踪消防、安防、基坑、高支模、临边防护、卸料平台等设施设备的安全状态、管理痕迹、趋势预测，......
分享实用工具源码--实现Windows IDE中查看Linux下编译信息
作者:fbysss关键字：实用工具源码 Windows下查看Linux编译信息一、背景：本人写C程序不多，更不用说Linux下了。偶然一个机会，接了个这样的活，vi我用的还马马虎虎，但程序超过一千行，看起来就有些眼花了。于是只好在VC下编写代码，ftp传到Linux服务器，再用gcc编译，出错了再到VC下修改，再上传，如......
直播带货源码，iOS 获取图片主题色
直播带货源码，iOS获取图片主题色 -(void)getMostColorFormImage:(UIImage*)image{ WEAKSELF [imagegetPaletteImageColorWithMode:ALL_MODE_PALETTEwithCallBack:^(PaletteColorModel*recommendColor,NSDictionary*allModeColorDic,NSError*error){ ......
直播源码，自定义progressBar样式
直播源码，自定义progressBar样式1、layout中xml布局如下： <RelativeLayout android:layout_height="16dp" android:layout_width="match_parent"> <ProgressBar style="?android:attr/progressBarStyleHorizontal" android......
百度上传下载控件源码
我们平时经常做的是上传文件，上传文件夹与上传文件类似，但也有一些不同之处，这次做了上传文件夹就记录下以备后用。首先我们需要了解的是上传文件三要素：1.表单提交方式:post(get方式提交有大小限制,post没有)2.表单的enctype属性:必须设置为multipart/form-data.3.表单必须......
一口气用Python写了13个小游戏（附源码）
今天给大家分享13个游戏源码，可以自己复现玩玩，研究下里面的编程逻辑，对学习编程（特别是初学者）应该会有很大帮助。1、吃金币源码分享：importosimportcfgimportsysimportpygameimportrandomfrommodulesimport*'''游戏初始化'''definitGame():#初始化pygame,设......
【腾讯云 Cloud Studio 实战训练营】使用在线编程的方式用Nuxt3开发一个后台管理系统（
前言大家好，我是刘明，开源技术爱好者，十年创业老兵。CSDN近期联合腾讯云、Coding、CloudStudio组织了【腾讯云CloudStudio实战训练营活动】，苦于前些日子一直在备考注册会计师，没有很好的体验CloudStudio的云IDE产品。现在考试结束了，体验了一把云IDE,不禁感慨云端开发原来可以这么......
全开源风车im源码（前端uniapp可发布H5及app/后端java含视频搭建教程）
互联网彻底改变了我们的沟通方式，电子邮件是迄今为止采用最快的通信形式。不到二十年前，还没有多少人听说过它。现在，我们中的许多人都用电子邮件而不是写信，甚至打电话给别人，世界各地的人们每天发送数十亿封电子邮件。源码：ms.jstxym.top但有时甚至电子邮件也不够快。您可能不知道您......
基于微信小程序的图书馆座位预约系统设计与实现-计算机毕业设计源码+LW文档
选题意义：该系统可以监测到图书馆座位的使用情况，便于学生查询图书馆的分布、座位多少、是否空闲等基本数据。学生可以通过手机或者计算机等终端进行座位预约，方便快捷。对于占座现象，学生可以通过系统进行反馈，方便图书馆管理人员及时处理。基于微信小程序的图书馆座位预约系统的使......

ChatGLM2 源码解析：`MLP`

相关文章

赞助商

阅读排行