首页 > 其他分享 >函数计算 FC:首发 GPU 极速模式,更弹性、更降本

函数计算 FC:首发 GPU 极速模式,更弹性、更降本

时间:2024-09-24 18:55:09浏览次数:10  
标签:函数 AI 降本 帐房 FC 计算 GPU

函数计算 FC 作为轻量灵活、事件驱动的全托管计算服务,一直以来以弹得更快、粒度更细、成本更低为广大开发者与企业客户所青睐。

2024 云栖大会上,函数计算 FC 为 AI 加码,首发 GPU 极速模式, 让 GPU 可以更弹性、更便宜。

函数计算 FC:首发 GPU 极速模式,更弹性、更降本_极速模式

阿里云智能集团产品专家 洪晓龙

首发 GPU 极速模式,分钟级到秒级别

函数计算全新发布的 Serverless GPU 极速模式,通过预置快照提前锁定弹性资源确保刚性交付,可自动根据您的请求并发数实现极速伸缩(CPU 毫秒级,GPU 秒级),有效避免冷启动,实现成本与性能均衡。业界首创 CPU/MEM 与 GPU 解耦,1/N 卡更便宜,秒级启动首包耗时降低 95%,助力大模型推理加速。

  • 技术升级:创新的显存快照技术,低峰时 GPU 缩容到 0 ,高峰时秒级启动。
  • 自动容灾:GPU 实例宕机自动容灾,大幅降低错误率,无冗余成本。
  • 指标升级:0->1 首包耗时对比 K8s 弹性模式,自分钟级优化至秒级。

函数计算 FC:首发 GPU 极速模式,更弹性、更降本_极速模式_02

阿里云智能集团高级技术专家 聂大鹏

架构更先进、集成更丝滑,为 AI 创新加速

函数计算化繁为简,加速云产品集成,通过 FC + EB + CloudFlow 引领云产品间集成新范式,让数据可以互通,让灵活定制得以标准化。

函数计算 FC:首发 GPU 极速模式,更弹性、更降本_极速模式_03

函数计算 FC 提供 Stable Diffusion、LangChain 等 AI 应用样板间,深度集成通义产品系列、魔搭社区等,让 AI 应用开发更简单。

  • 魔搭社区: 50+ 热门大模型支持一键部署至用户指定阿里云账号,快速体验或二次开发。
  • 模版/模型服务: 20+ 热门 AI 应用模板如 Stable Diffusion、ComfyUI、Flux 等支持一键部署,快速托管热门模型如 Qwen、Baichuan2 等。

函数计算 FC:首发 GPU 极速模式,更弹性、更降本_Server_04

阶梯定价+峰谷定价,成本更优

  • 峰谷定价,夜间 0~6 时享受 5 折优惠。
  • 阶梯定价越用越便宜,官网限时 8 折优惠。
  • 节省计划,超低折扣、降低用云成本。

函数计算 FC 按量付费、资源包限时 8 折优惠,以及面向中国站的中国内地地域夜间 5 折优惠活动正在进行中:https://www.aliyun.com/product/fc

与客户、合作伙伴携手同行

并发性能提升 4 倍!云帐房用函数计算 FC 轻松应对瞬时业务洪峰

云帐房网络科技有限公司(以下简称“云帐房”)是一家 AI+RPA 技术驱动的业财税云平台公司。随着业务规模不断扩大,云帐房报税业务对 IT 的能力要求呈指数型提升,且具有显著的周期。在业务高峰期时,需要在短时间内拉起数万核 CPU 资源,而报税期之外,CPU 资源需求几乎为 0。

函数计算 FC 为其提供了开箱即用,用完即走,按量付费的 Serverless 能力,资源弹性可定时按量自动伸缩,轻松解决云帐房遇到的问题,成功实现并发性能提升 4 倍,资源成本降低 64%。

函数计算 FC:首发 GPU 极速模式,更弹性、更降本_极速模式_05

云帐房首席架构师 李嘉陵

Serverless GPU 与 NVIDIA TensorRT/TensorRT-LLM 达成合作

阿里云函数计算 FC 与NVIDIA TensorRT/TensorRT-LLM 的合作推动了 AI 技术的实际应用落地,特别是在计算密集型的任务如图像生成、自然语言处理等领域,能够通过无缝集成的高效计算平台,大规模部署 AI 模型。

函数计算 FC:首发 GPU 极速模式,更弹性、更降本_Server_06

NVIDIA 解决方案架构师 金国强

开发者可以借助这类平台,快速开发并迭代 AI 产品,从而缩短从概念到实际应用的时间。同时,这种合作还支持企业灵活应对动态的计算需求,特别是在面对高并发或大规模任务时,实现弹性扩展和高效资源管理,为 AI 在各个行业的广泛应用提供了坚实的技术基础。

标签:函数,AI,降本,帐房,FC,计算,GPU
From: https://blog.51cto.com/u_13778063/12101385

相关文章

  • 基于旗芯微FC4150系列的DMA详解
    1.概述DMA的中文名称是直接内存访问,它不需要CPU的参与,实现数据传输的技术(但是也会占用总线带宽,所以有时候使用DMA虽然会降低CPU负载,但提高访问数据速度并不高)。1.1旗芯微FC4150系列芯片DMA特征·所有数据的传输都是从源地址写入到目标地址,源地址和目标地址以及传输大小都是......
  • 函数计算 FC:首发 GPU 极速模式,更弹性、更降本
    函数计算FC作为轻量灵活、事件驱动的全托管计算服务,一直以来以弹得更快、粒度更细、成本更低为广大开发者与企业客户所青睐。2024云栖大会上,函数计算FC为AI加码,首发GPU极速模式,让GPU可以更弹性、更便宜。阿里云智能集团产品专家洪晓龙首发GPU极速模式,分钟级到......
  • 降本 60%!小熊油耗使用阿里云 SAE 更加稳定可靠
    作者:赵世振、黛忻把业务迁移到阿里云SAE之后,我们的产品更加稳定,用户体验更流畅,提高了业务连续性和稳定性,降本60%。———么么互联CEO张雄小熊油耗介绍“小熊油耗”是北京么么互联信息技术有限公司推出的汽车油耗计算APP,可以帮助用户计算日常使用过程中车辆的实际油耗水平,旨在......
  • 降本 60%!小熊油耗使用阿里云 SAE 更加稳定可靠
    作者:赵世振、黛忻把业务迁移到阿里云SAE之后,我们的产品更加稳定,用户体验更流畅,提高了业务连续性和稳定性,降本60%。———么么互联CEO张雄小熊油耗介绍“小熊油耗”是北京么么互联信息技术有限公司推出的汽车油耗计算APP,可以帮助用户计算日常使用过程中车辆的实际油耗水......
  • css布局中BFC的事情
    在页面布局中,其实很多地方都用到了BFC只不过,不知道它叫这个名字。BFC,说是块盒作用域上下文,包括从开始写页面,html,也是一个bfc形成这个的因素很多。最开始布局使用的浮动,清除浮动,就是给2个相邻的元素创建各自的BFC,这样就不会收到浮动的影响,比如:父元素下面2个div都浮动了,导致它两......
  • MFC 之 Progress Control 控件的使用
    提到ProgressControl控件,大家可能会觉得在UI界面里面装一个进度条控件,一下就会让UI界面变得高级了些,所以可能会认为这个控件可能比较难搞。其实恰恰相反,这个控件使用起来特别容易,调用方法也就寥寥几个。不过本文重点内容并不是讲ProgressControl的使用,而是会重点介绍一......
  • 聚类分析 | FCM模糊c均值聚类,三种优化算法(SSA、PSO、GA)对FCM初始中心点寻优
    聚类分析|FCM模糊c均值聚类,三种优化算法(SSA、PSO、GA)对FCM初始中心点寻优目录聚类分析|FCM模糊c均值聚类,三种优化算法(SSA、PSO、GA)对FCM初始中心点寻优效果一览基本介绍程序设计参考资料效果一览基本介绍聚类分析|FCM模糊c均值聚类,三种优化算法(SSA、PSO、GA)对FCM初始中心点......
  • SY5072BABT 单相过渡模式PFC控制器
    SY5072B为恒压过渡模式带功率因数校正(PFC)的升压控制器函数。常开时间控制应用于实现高PF和低THD,无需乘法器。它以准谐振模式驱动升压变换器高效率和更好的电磁干扰性能。它采用特殊设计,实现快速启动、快速运行可靠的安全保护要求。•谷开通,实现低开关损耗轻载时......
  • MFC 程序基本界面配置
    不经常写MFC程序,虽然MFC的基础界面配置较为简单,但是每次很久没写MFC,再写的时候各种搜资料感觉还是挺麻烦的,所以写一个MFC的基本界面配置笔记,主要记录如何设置窗体大小、设置标题、修改图标、添加最大化最小化按钮、添加背景图等等,方便后续查阅。当然,我们首先要新建一个MF......
  • 搭建基于Grafana+Prometheus+Nvidia_gpu_exploter的GPU监控平台
    搭建基于Grafana+Prometheus+Nvidia_gpu_exploter的英伟达GPU监控平台在现代数据科学和机器学习领域,GPU已成为不可或缺的硬件资源。为了高效管理和监控GPU的使用情况,构建一个实时、直观的监控系统变得尤为重要。本文将详细介绍如何使用Grafana、Prometheus以及Nvidia_gpu_explote......