首页 > 其他分享 >首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级

首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级

时间:2024-06-13 09:43:19浏览次数:12  
标签:场景 云盘 模型 研发 华为 代码

本文分享自华为云社区《首批!华为云盘古研发大模型通过代码大模型评估,获当前最高等级》,作者: 华为云头条。

近日,在中国信通院组织的首轮代码大模型评估中,华为技术有限公司的华为云盘古研发大模型最终获得4+级,成为国内首批通过该项评估的企业之一。

盘古研发大模型-(1).jpg

参与本次评估的华为云盘古研发大模型在研发场景丰富度方面表现突出,在通用能力、专用场景能力、应用成熟度三个能力域上均获得优异结果:

  • 在通用能力方面,在代码解释、代码转换、代码优化等方面表现突出;
  • 在专用场景方面,支持网站开发、移动应用开发、大数据开发、人工智能开发等多个场景的开发能力;
  • 在应用成熟度方面,推理性能表现优异,且在数据分类分级、数据安全合规、推理结果准确性、模型服务可追溯性、风险可控性、可维护性方面均表现突出。

2.png

此次验证,依据《智能化软件工程技术和应用要求 第1部分:代码大模型》标准(本标准已完成ITU国际标准立项)开展,评价指标覆盖6大通用能力场景、7大专用能力场景、3大服务成熟度,多维度验证研发大模型在研发场景能力和人效优化效果方面的场景丰富度,重点考察研发大模型在代码理解、代码生成和补全、研发问答、单元测试用例生成等方面的能力支持度,全方位评估研发大模型在数据合规性、模型成熟度、服务成熟度方面的应用成熟度。

3.png

在算法、数据和算力保证的基础上,华为云开发并训练出了在业界公认的代码评测基准上领先的华为云盘古研发大模型。当前,华为云盘古研发大模型支持通过公有云模式使用,也支持私有化部署模式,提供多种部署规格和模型规格,供客户定制化选择。

目前,华为云盘古研发大模型已经在金融、制造、交通、教育、泛互联网等多个行业应用并输出优秀实践案例。

cke_40287.png

HDC 2024,6月21日-23日,东莞松山湖,期待与您相见!

更多详情请关注官网:

中文:https://developer.huawei.com/home/hdc

英文:https://developer.huawei.com/home/en/hdc

点击关注,第一时间了解华为云新鲜技术~

 

标签:场景,云盘,模型,研发,华为,代码
From: https://www.cnblogs.com/huaweiyun/p/18245257

相关文章

  • AI大模型的战场:通用与垂直的较量
    目录AI大模型的战场:通用与垂直的较量1.引言2.通用大模型的优势2.1概念2.2谷歌的BERT模型2.3 OpenAI的GPT模型2.4 微软的VisualStudioCode2.5结论3.垂直大模型的崛起3.1概念3.2 医疗影像分析的AI模型3.3 自动驾驶领域的AI模型3.4 金融风控模型3.5结论......
  • LLM大模型: llama源码要点解读(二)
    1、attention机制:这算是transformer架构最大的创新点了!利用attention机制,找到token之间的相似度(或则说距离),根据相似度调整token本身的embedding值,本质就是根据token的context调整自身的embedding值,这个思路非常符合人脑对语言和语义的理解!比如”苹果“这个词,如果只看这一个t......
  • 【AI应用探讨】— GPT-4o模型应用场景
    目录1.自然语言处理(NLP)任务文本生成机器翻译问答系统2.聊天机器人与虚拟助手智能聊天机器人虚拟助手与陪伴3.内容创作与辅助创意写作代码生成4.教育辅助学习工具5.客户服务与支持客户服务聊天机器人技术支持6.研究与分析数据分析市场研究科学研究7.......
  • 文科生脑回路| AI大模型-Agent入门自学笔记
    大型语言模型(LargeLanguage Models,LLM)能通过分析海量文本数据,学习人类语言的内在规律和知识结构,从而展现出惊人的语言理解和生成能力。通过与大语言模型交互,不仅可以获取所需信息,还能生成高质量的文本内容、解决复杂的问题、开发智能应用程序等。以大型语言模型为核心......
  • Qwen2 阿里最强开源大模型(Qwen2-7B)本地部署、API调用和WebUI对话机器人
    阿里巴巴通义千问团队发布了Qwen2系列开源模型,该系列模型包括5个尺寸的预训练和指令微调模型:Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B以及Qwen2-72B。对比当前最优的开源模型,Qwen2-72B在包括自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的Lla......
  • 42.CSS之盒子模型和浮动
    CSS之盒子模型和浮动【一】盒子模型1.概念是指网页设计中,用于描述和布局元素的一种模型2.组成部分内容区域盒子的实际内容,如文本、图像内边距内容区域与边框之间的空间,用于控制内容与边框之间的距离边框围绕内容区域与内边距的线条,用于给元素添加外观和样式......
  • Qwen 2 模型介绍及其应用探索
    引言Qwen2模型家族最近引起了广泛关注,作为继Qwen1.5的升级版,这些模型在多语言支持、推理能力和长上下文处理等方面表现出色。本文将深入探讨Qwen2模型的特点、应用场景以及具体的代码示例,帮助读者更好地理解和使用这些模型。Qwen2模型概述Qwen2模型家族涵盖......
  • 分析GIS在疾病传播模型和公共卫生决策中的作用
    在这个全球化日益加深的时代,疾病的跨国界传播成为全球公共卫生面临的重大挑战。地理信息科学(GIS)作为一门集成了空间数据采集、处理、分析及可视化的技术体系,在公共健康领域展现出其不可替代的价值。本文旨在深入探讨GIS如何助力于疾病传播模型的构建以及在制定公共卫生决策中扮......
  • CodeArts Snap 华为云智能开发助手
    CodeArtsSnap是华为云推出的一款基于大模型技术的智能开发助手,旨在提高开发人员的生产力和代码质量,为开发者带来全新的编程方式和体验。优势:八大核心功能:CodeArtsSnap提供单元测试用例生成、代码生成、代码解释、代码调试、研发知识问答、代码注释、代码检查和代码翻译等......
  • Python中用PyTorch机器学习神经网络分类预测银行客户流失模型|附代码数据
    阅读全文:http://tecdat.cn/?p=8522最近我们被客户要求撰写关于神经网络的研究报告,包括一些图形和统计输出。分类问题属于机器学习问题的类别,其中给定一组特征,任务是预测离散值。分类问题的一些常见示例是,预测肿瘤是否为癌症,或者学生是否可能通过考试在本文中,鉴于银行客户的某些......