首页 > 其他分享 >下载量突破400万,百万开发者首选的 AI 编码工具通义灵码是如何炼成的?

下载量突破400万,百万开发者首选的 AI 编码工具通义灵码是如何炼成的?

时间:2024-08-16 17:30:57浏览次数:16  
标签:通义 AI 代码 生成 400 下载量 企业 灵码

通义灵码是由阿里云和通义实验室联合推出的一款基于通义大模型的智能编码辅助工具,它具备代码智能生成和研发智能问答等多项功能,旨在帮助开发者提高编码效率和代码质量。

我们非常高兴的宣布,通义灵码插件下载量突破400万啦! 目前,通义灵码每天推荐代码超 3000 万次,被开发者采纳代码行数超亿行,在中国信通院可信AI代码大模型测评中,通义灵码获得首个最高级。

核心优势

  • 代码智能生成:通义灵码能够根据当前代码文件及跨文件的上下文,生成行级/函数级代码、单元测试和代码注释,帮助开发者更高效地完成编码工作。
  • 自然语言生成代码:通过自然语言描述功能需求,通义灵码可以在编辑器中直接生成相应的代码和注释,保持编码的连续性。
  • 单元测试生成:支持根据多种测试框架生成单元测试代码,包括但不限于JUnit、Mockito、Spring Test等,提高代码的测试覆盖率。
  • 研发智能问答:基于大量研发文档和API/SDK数据,通义灵码能够解答编程相关问题,提供解决方案和建议。
  • 异常报错智能排查:当代码运行出现异常时,通义灵码可以结合运行代码和异常堆栈信息,快速提供排查思路或修复建议。
  • 多IDE支持:通义灵码支持包括JetBrains全家桶、VS Code以及Visual Studio在内的多种集成开发环境,提供一致的编码体验

此前,我们采访了多位开发者,大家对通义灵码在单元测试、代码生成准确度和生成速度上的表现非常满意。

通义灵码对个人开发者免费开放使用,降低使用门槛,让更多开发者能够享受到AI编码带来的便利。

为满足企业客户在私域知识检索、企业数据合规、统一管理等方面的需求,通义灵码推出标准版、专属版。标准版“开箱即用”,可以接入企业私域知识,实现私域知识问答,让 AI 推荐的代码更贴合企业规范;专属版在标准服务之外,提供公共云上专属实例部署、企业私有模型训练、独立企业账号系统等服务,满足大中型企业客户定制模型、节约算力的需求。

阿里云致力于持续推动多智能体的自主研发,进一步推动AI编程的发展。今年6月推出首个“AI 程序员”,它具备架构师、开发工程师、测试工程师等多种岗位的技能,能一站式自主完成任务分解、代码编写、测试、问题修复、代码提交整个过程,最快分钟级即可完成应用开发,大幅提升研发效率。

未来用户只需定义问题、提出需求,分钟级完成一个应用开发将成为常态。通过 AI 编程助手和 AI 程序员的共同加持,每个人类程序员都将成为超级个体。

针对开发者和企业关注的问题,我们整理了一套问答 List,也欢迎大家反馈产品体验建议,与我们一起,推动 AI 编码在国内更广泛的落地!

快问快答

AI 程序员是什么样的产品形态?跟通义灵码的关系是什么?

A: 人机交互的模式分为三个阶段,第一个阶段是人机配合,以人为主,机器为辅,我们把它叫做 Copilot 模式;接下来会进入到 Agent 模式,由单个 Agent 自主完成一个小任务,比如写一个测试用例;最后是多 Agent 协同模式,可以完成非常复杂的一件事。

AI 程序员是基于多 Agent 协同架构下产生的产品,人机交互模式已经发生了质变,变成了机器为主,人为辅。人在这个过程中更多是提出需求,及时对 AI 程序的运行做纠偏,以及去校验它最终生成的结果,编程的生产力会有大幅度的提升,发生质变。通义灵码更多是第一个阶段,就是 Copilot 的模式,真正到了 Multi-Agent 或者机器为主时,产品形态一定是 AI 程序员。

市面上智能编码工具非常多,开发者选择时有什么标准吗?

A: 从我们观察来看,程序员首先对代码助手 IDE 插件的第一要求就是准,采纳率一定得高;第二个是代码生成要足够的快,不能太卡顿;三是能否跟企业内部的规范或个人开发习惯进行结合;最后还需考虑安全性。

引入智能代码助手,对企业来讲意味着什么?

A: 通义灵码上线后,有大量头部企业,中小企业来跟我们交流,企业使用AI提效是未来的必然趋势了。ROI 是决策者首先要考虑的事,经过数据测算,如果我们帮助企业提升 10% 至 15% 的效能,但就算只有 5%,其实 ROI 都是非常高的。我们这类产品是用一个极低的成本,帮助程序员干了最核心的事情。

开源模型和商业模型如何选?

A: 企业可以基于开源模型去做一些应用,代码领域比较特殊,现在市面上的模型多是 Base Model,灵码基于 CodeQwen,针对各种语言、框架及跨文件引用,还有自适应生成粒度决策等等构造了大量人工标注数据去对它进行训练。经过训练后,这个模型的采纳率和智能化就有进一步提升了。自训练模型这部分成本很高,如果企业都自研,那 ROI 是非常低的。

如何通过智能编码助手辅助开发人员进行代码走读,快速了解代码?

A: 大量开发者是通过代码解释功能,快速了解整个代码的含义。除了简单的代码解释,圈选代码就可以完成。另外还可以通过 @workspace 功能,让大模型对整个库进行走读,然后给出相应的解释,我们可以让它定位到某个文件,甚至某个类或者是某个目录,让它去进行走读,来帮助我们快速了解。

对于新的技术栈或选型,如何从头编写一个程序,编码助手可以怎么来使用?

A: 这里面有两个场景。第一个场景是要写一个框架,想做一个 demo,那直接把我们的自然语言输进去。大模型可以快速针对它原来的知识,给出相应的新技术框架,或者一个语言程序,这是大模型非常擅长的。还有一种情况,企业内部已经有一些模板了,这时我们通过企业知识检索增强的方式,调用原来企业的代码模板,再让大模型基于这个模板去按照我们的要求生成,也可以快速的完成新工程的开发。

如何通过智能编码助手辅助去实现一个功能要求?

A: 开发者用的最多的是代码续写,也就是说还是按照原来的习惯去写。大家注意到经常可能要写一些注释来提示大模型生成业务代码,甚至可能连注释都不用写,在这种场景下,仍能达到 30% 的采纳率。还有一种情况,就是让它去完成一个类似 API 接口的调用,生成一段完整的代码,或者直接让它生成一个算法,我直接把这一段代码完整拷贝到 IDE 区,也可以快速去完成一个功能。

代码的 RAG 知识库是什么功能?应该怎么管理才能提升代码编写的准确性?

A: 检索增强是我们最近针对企业版推出的重要功能。这里面包括两种,第一个是代码补全的 RAG,主要是在代码续写时进行辅助,它可以模仿我们原来写好的业务逻辑去生成,或者说按照原来的自研组件库或者资源框架的方式去进行服务生成,或者按照原来的 API 调用范式去生成。

在编写代码的时候,它自动去企业的知识库召回了相似的代码。第二种是企业的知识问答,可以将企业里面研发文档,或者 API 定义的文档上传,只需要通过 #team docs,就可以让大模型去针对问题去实时到企业知识库去进行查找,联合生成。

@workspace 的能力可以用在哪些应用场景中?

A: @workspace 是最近我们推出并且不断调优的产品能力。核心就是它可以读整个工程的代码,并且来按照自然语言的描述去进行代码生成,或者说是代码走读,或者是生成一个小功能。它比较擅长给它一个明确的代码任务。第二个就是它可以去做代码的 review。它不擅长宽泛的、复杂的业务逻辑,还没有办法做到这么强的对语言的感知能力。

在推理过程中,用到的代码上下文片段是如何来保证隐私性的?

A: 企业特别关注代码安全,代码是他们的核心资产。首先从技术上,我们可以做到所有的跟代码相关的全部存在本地,也就是说云上是企业一行代码都不存储,在整个推理链路上都是不会存储客户代码的,云上不留痕,就没有代码泄露的风险。二是我们在整个传输链路全部都用了加密,就算黑客把中间拦截掉,也没有办法去拿到我们的代码。我们还针对大客户去推出了 VPC 隔离技术,包括端侧的敏感信息过滤技术等,还把隐私政策写到我们条款里。

针对不同部门,怎么进行个性化数据的区分跟管理?

A: 这是刚刚上线的功能。考虑到企业有非常多的部门,每个部门都可以设置自己的知识库,并且可以指定这个知识库是企业公共的,还是部门私有的,它可以分配到部门和到个人的权限。当每次使用检索增强的时候,它可以根据这个人能够触达的数据,自动地路由召回数据。

企业后续如果能够扩展灵码能力的话,会在哪些开发场景中做辅助呢?

A: 灵码的扩展能力是很多企业关注也是我们未来建设的一个重点,包括在自定义的 prompt,自定义的上下文,自定义的 Agent 这种场景做很多的功能,也就是说企业有什么研发规范、经常使用的编程范式,都可以固化出来变成 prompt,给整个企业其他的员工使用。还可以定义各种各样的 Agent,跟企业内部的 DevOps 平台联动,将灵码的能力不仅仅局限于代码的 IDE 里面的生成,且赋能整个 DevOps 链条,这也是我们未来要支持的目标。

点击此处,下载体验通义灵码。

标签:通义,AI,代码,生成,400,下载量,企业,灵码
From: https://www.cnblogs.com/yyds114/p/18363304

相关文章

  • 【课程总结】day24(下):大模型部署调用(vLLM+LangChain)
    前言在上一章【课程总结】day24(上):大模型三阶段训练方法(LLaMaFactory)内容中主要了解一个大模型的训练过程,无论是第三方的大模型还是自研的大模型,都需要部署到服务端,提供对应API接口供上层应用使用。所以,本章将主要了解vLLm+langchain的基本使用方法。大模型应用框架......
  • 界面控件DevExpress即将推出全新AI功能,WinForms & Blazor组件可用!
    DevExpress拥有.NET开发需要的所有平台控件,包含600多个UI控件、报表平台、DevExpressDashboardeXpressApp框架、适用于VisualStudio的CodeRush等一系列辅助工具。屡获大奖的软件开发平台DevExpress近期重要版本v24.1已正式发布,该版本拥有众多新产品和数十个具有高影响力......
  • InstructGPT: Training language models to follow instructions with human feedback
    文章目录1.InstructGPT目标2.数据集2.1SFT数据集2.2RM数据集2.3PPO数据集3.训练细节3.1SFT训练3.2RM训练3.3RLHF训练4.结论1.InstructGPT目标InstructGPT探讨了如何通过人类反馈来训练语言模型以更好地遵循用户的意图。通过对模型进行监督学习和强化......
  • Llamaindex RAG实践
    任务要求:基于LlamaIndex构建自己的RAG知识库,寻找一个问题A在使用LlamaIndex之前InternLM2-Chat-1.8B模型不会回答,借助LlamaIndex后InternLM2-Chat-1.8B模型具备回答A的能力,截图保存。1.直接询问,不是预期结果2.结合RAG询问,得到符合资料的回答3.运行,使用端口转......
  • 数业智能心大陆 AI解答如何应对焦虑
    在当今社会,焦虑已成为许多人常见的心理挑战。它可能由工作压力、人际关系、未来不确定性等多种因素引发,对人们的身心健康产生负面影响。长期处于焦虑状态还可能导致更严重的心理健康问题,如焦虑症、抑郁症等。焦虑是一种对未来不确定性的担忧和恐惧情绪,常常导致身体和心理上的不......
  • HDU 3980 Paint Chain
    题目链接:HDU3980【PaintChain】思路    第一次操作,无论从哪个珠子开始染色,都会得到相同的长度为n-m的链,然后就是在这条链中取一段长度为m的珠子染色,当这一段珠子在链条中间的时候,就会把链条分成两段,就是一个简单的两段连续珠子的长度的sg值异或一下,求出sg[n-m]的......
  • nuxt2 优化asyncData 里多个接口await串行请求的弊端,改为并行请求
    优化前多个接口await串行请求,若一个接口用时1秒,3个接口一共得用时3秒才行asyncasyncData(){letres1=awaitdanielService.getAllDanielByIndex();letres2=awaitjournalService.getJournalType();letparams={page:1,pagesize:10,......
  • redis启动失败报错:Job for redis.service failed because the control process exited
    问题描述启动报错如下:查看redis的启动信息:systemctlstatusredis.service或journalctl-xe由提示可以看不是配置文件,内存等原因造成的。解决方案原因:linux的一个安全子系统(SELinux)阻止了服务的启动。查看SELinux的工作模式cat /etc/selinux/configSELinu......