自从 OpenAI 发布 ChatGPT 4.0 之后,大模型热度一直不减,国内不管是大厂还是创业团队纷纷杀入大模型领域,大模型的建立首先离不开的是数据,数据才是一切大模型训练的基础,那么目前国内大模型团队的数据需求究竟是什么?如何通过学习数据采集,对大模型数据预测商业发展呢?
大模型训练数据方面的公开知识几乎是空白,为此,行行AI人才特邀北京八友科技创始人梁斌博士,通过直播与大家交流“目前国内大模型团队的主要数据需求、预处理方法;公开数据采集的主要技术和难点;数据采集和使用的法律风险;世界各国对大模型发展的支持“这几方面内容,感兴趣的同学提前搬好小板凳前排观看哦!(尤其适合希望了解大模型数据测商业发展,对数据采集感兴趣的技术人员)
梁斌博士,北京八友科技创始人,于2015年在清华大学计算机科学与技术系获得博士学位。曾在搜狗搜索从事搜索算法研究,发表多项相关书籍和专利。2015年博士毕业后,梁斌创办北京八友科技,从事公开数据的采集和分析相关工作。大模型浪潮下已服务30多家知名大模型团队,积攒了非常丰富的大数据行业经验。
6月25日周日晚上20点,跟随梁斌博士走近大模型,了解大模型训练数据的故事!还可以和梁斌博士通过直播连麦互动!
线上直播课操作指引:
1、扫上面海报中的二维码添加行行人才小秘书,授课当天为您推送课程链接
2、开课前会收到行行人才小秘书发送的“会议提醒”点击链接也可进入直播间