首页 > 其他分享 >每日一看大模型新闻(2024.1.11)2024属于小模型时代?TinyLlama 小模型发布后爆火:参数轻量级,性能重量级!;广告人上手AI作图的那些痛,这个平台真懂了;文心大模型融入荣耀Magic

每日一看大模型新闻(2024.1.11)2024属于小模型时代?TinyLlama 小模型发布后爆火:参数轻量级,性能重量级!;广告人上手AI作图的那些痛,这个平台真懂了;文心大模型融入荣耀Magic

时间:2024-03-13 18:02:20浏览次数:22  
标签:11 2024.1 AI 模型 Quora TinyLlama 文心 轻量级

1.产品发布

1.1红旗品牌虚拟代言人上线“旗羿”和“旗妙”

发布日期:2024.1.11

一汽红旗携手腾讯混元大模型,提升服务体验

主要内容:一汽红旗品牌近日推出了微信小程序“旗羿旗妙说”,该小程序基于腾讯混元大模型提供智能底座,为一汽红旗进行了全面的知识升级。同时,腾讯QQ联合一汽红旗打造了年轻化国风皮肤品牌虚拟代言人“旗羿”和“旗妙”,通过微信小程序为用户提供智能交互问答服务。这标志着一汽红旗首次在营销领域尝试使用大模型来提升用户服务体验。在上线10天内,该小程序的访问人数已突破百万次。

1.2 2024属于小模型时代?TinyLlama 小模型发布后爆火:参数轻量级,性能重量级!

发布日期:2024.1.11

2024属于小模型时代?TinyLlama 等小模型爆火:参数轻量级,性能重量级!-腾讯云开发者社区-腾讯云

主要内容:随着大模型参数规模达到百亿甚至千亿级别,研究者开始关注小巧且高性能的小模型。这些小模型在边缘设备上具有广泛应用,如智能手机和物联网设备,由于计算和存储能力有限,无法运行大型语言模型。新加坡科技设计大学的研究者推出了TinyLlama,这是一个11亿参数的语言模型,经过大约3万亿个token的预训练。尽管规模较小,但TinyLlama在多个任务中表现出色,优于同等大小的开源模型。此外,TinyLlama使用了优化方法,如flash attention 2、FSDP和xFormers,训练吞吐量达到了每A100-40G GPU每秒24000个token。

论文地址https://arxiv.org/pdf/2401.02385.pdf

开源地址GitHub - jzhang38/TinyLlama: The TinyLlama project is an open endeavor to pretrain a 1.1B Llama model on 3 trillion tokens.

项目地址https://huggingface.co/ahxt/LiteLlama-460M-1T

1.3吉利:推出汽车行业全场景AI大模型星睿

发布日期:2024.1.11

今天干件大事:我官宣自己

主要内容:吉利推出了星睿AI大模型,据称是汽车行业首个全栈自研全场景AI大模型。星睿大模型具有多模态、语音、数字孪生等三大基础模型,以及多模态感知、NPDS研发、多模态生成、AI DRIVE、NLP语言、数字生命等六大能力模型,支持文生成图、文生成视频、文生成音乐、图生成图、图生成视频等功能。

1.4广告人上手AI作图的那些痛,这个平台真懂了

发布日期:2024.1.11

广告人上手AI作图的那些痛,这个平台真懂了

主要内容:腾讯广告妙思是一个一站式的AI广告创意平台,它利用了腾讯混元大模型的能力,可以帮助广告主解决从创意激发到投放的全流程问题。这个平台提供了多种功能,如智能扩写、图生图、商品背景合成等,使得广告制作更加高效和便捷。此外,腾讯广告妙思还具有原生感强、符合投放标准等特点,大大提高了广告的投放效果。在未来,广告主需要掌握这些工具,进入全身心卷创意的时代。

2.技术更新

2.1阿里云:发布第八代企业级实例,AI推理提速7倍

发布日期:2024.1.11

AI推理性能提升7倍 阿里云第八代企业级实例g8i来了!

主要内容:阿里云正式发布了第八代企业级通用计算实例ECS g8i。该实例基于阿里云自研的「飞天+CIPU」架构体系和第五代英特尔至强可扩展处理器,整机性能最高提升85%,AI推理性能最高提升7倍。此外,该实例还可支持72B参数的大语言模型,降低了中小规模模型的建成本50%。新款实例还提供了端到端安全防护,为企业构建可信AI应用提供隐私增强算力支撑。

2.2微软Copilot被曝正推出GPT-4 Turbo

发布日期:2024.1.11

https://twitter.com/itsPaulAi/status/1745138348036096308?s=20

主要内容:社交平台X的网友Paul Couvert发现,微软似乎正在聊天机器人Copilot中免费推出GPT-4 Turbo模型。用户可以通过搜索网页源代码中的“gpt4turbo”来查看是否有访问权限。微软在去年12月宣布Copilot将接入GPT-4 Turbo,并表示将在几周内广泛集成。

3.商业动态

3.1文心大模型融入荣耀MagicOS!打造大模型“端云协同”创新样板 

发布日期:2024.1.11

文心大模型融入荣耀MagicOS!打造大模型“端云协同”创新样板_应用_用户_移动

主要内容:荣耀宣布与百度智能云合作,将百度文心大模型整合进荣耀MagicOS,共同打造“百模生态计划”。此计划旨在构建端云协同的大模型服务生态系统,提升用户体验。荣耀YOYO助理将借助文心大模型提供本地化的文本创作、知识问答和生活建议。合作旨在发掘大模型在端侧应用的最佳实践,为用户带来更全面的个性化体验。这一创新尝试标志着大模型时代的发展趋势,有望推动MagicOS成为引领移动应用新一轮创新与增长的关键力量。

3.2 Quora融资7.5亿美元

发布日期:2024.1.11

Quora融资7.5亿美元,加速发展AI聊天机器人Poe (msn.cn)

主要内容:Quora成功融资7500万美元,资金将用于加速发展其AI聊天机器人平台Poe。Quora致力于打造基于AI聊天机器人的创作者经济,让创作者通过构建有趣的AI机器人来实现收入。自Poe一年前推出以来,Quora取得了不俗的增长,拥有超过4亿月活跃用户,融资估值为5亿美元。Quora首席执行官Adam D’Angelo表示,大部分资金将用于支付平台上机器人创作者的收入。这次巨额融资让Quora能够吸引优秀的开发者加入Poe,并承诺提供财务补偿。尽管Quora在2017年最后一次融资时估值约为18亿美元,但此次融资使公司估值降至5亿美元。尽管如此,自Poe推出以来,Quora取得了显著的增长。

3.3大模型应用,最重要的是逻辑推理能力

发布日期:2024.1.11

大模型应用,最重要的是逻辑推理能力|面壁智能李大海@MEET2024

主要内容:在MEET2024智能未来大会上,面壁智能联合创始人、CEO李大海强调了大模型在法律行业落地时逻辑推理能力的重要性。他们在模型训练过程中针对逻辑推理做了大量细致工作,并将其拆分成包括归纳、演绎、时间、空间等多个维度进行攻克和提升。他们的千亿多模态大模型CPM-Cricket可以对标GPT-3.5的水平,且在公考行测的逻辑推理试题测试中,CPM的总正确率达到63.76%,甚至超过GPT-4的61.88%。李大海认为,大模型是新的技术革命,可以与工业革命、电力革命、信息革命相提并论。他提出“大模型+Agent”的解决方案,将大模型比作汽车的引擎,而AI Agent则是引擎提供动力后需要的转向系统、底盘等其他组件,共同构成一个完整的汽车产品。

标签:11,2024.1,AI,模型,Quora,TinyLlama,文心,轻量级
From: https://blog.csdn.net/liuxiuxiu3/article/details/136686893

相关文章

  • yolov5模型压缩-PAGCP
    参考论文:Performance-awareApproximationofGlobalChannelPruningforMultitaskCNNs(https://arxiv.org/pdf/2303.11923.pdf)基本原理:研究不同卷积核之间的联合重要性来实现全局剪枝策略模型压缩效果在yolov5上进行剪枝训练,流程如下:1、按照yolo正常训练2、和mod......
  • yolov5模型压缩-eagleeye
    参考论文:EagleEye:FastSub-netEvaluationforEfficientNeuralNetworkPruning(https://arxiv.org/abs/2007.02491)基本原理:揭示剪枝不同的DNN结构对最终精度的影响,从而找到现在的剪枝后精度最高的模型模型压缩效果1、新建eagleeye.py,添加如下代码:importargparseim......
  • 【模型转换】PyTorch模型转ONNX模型
    我们主要使用torch.onnx.export()函数来实现PyTorch模型到ONNX模型的转换。importtorchimporttorchvision.modelsasmodelsdevice="cpu"#加载预训练的ResNet18模型model=models.resnet18(pretrained=True)model.eval().to(device)#定义输入input=torc......
  • R语言【paleoTS】——compareModels:比较模型适合于古生物学时间序列
    Package paleoTS version0.5.3Description获取模型拟合函数的输出,并将模型拟合信息(对数似然、AICc等)编译成一个方便的表。UsagecompareModels(...,silent=FALSE,sort=FALSE)Arguments参数【...】:任意数量的模型拟合(as.paletsfit)对象。参数【silent】......
  • Threejs实现模型对接音乐节奏
            昨天看到一个网站是2维的柱形图随着音乐节奏起伏,我突然想到二维形状可以起伏,三维应该也可以,最终原理应该都是将音乐频谱分解为数据,通过数据的切换不断地改变图形的形状来实现,因为找了分析音乐频谱的源码,解析完,再通过threejs的动画实现了3D场景下的模型随着音乐......
  • 从零开始利用MATLAB进行FPGA设计(一):建立脉冲检测模型的Simulink模型2
    目录1.模块的总体结构1.1从工作空间导入输入信号1.2FIR滤波器2.Subsystem3.MATLABFunction文章灵感来源于MATLAB官方免费教程:HDLCoderSelf-GuidedTutorial考虑到MATLAB官网的英文看着慢,再加上视频讲解老印浓浓的咖喱味,我决定记录利用MATLAB&Simulink&SystemGenerat......
  • 基于大模型的 Agent 进行任务规划的10种方式
    本文首发自博客基于大模型的Agent进行任务规划的10种方式基于大模型的Agent基本组成应该包含规划(planning),工具(Tools),执行(Action),和记忆(Memory)四个方面,上一篇中重点讲了进行长记忆管理的8种方案,本节将从Agent的概念、ReAct框架、示例、以及一些论文思路来具体......
  • 大模型时代企业知识全生命周期管理解决方案
    ©作者|Zhongmei来源|神州问学 摘要 越来越多的企业开始意识到数据的重要性。同时意识到,企业想保持长远的发展,还需要协调组织协作、利用现有的数据沉淀经验知识、累积数据资产。据IDC调查,目前企业结构化数据仅占到全部数据量的20%,其余80%都是以文件形式存在的非结构化......
  • AI推介-大语言模型LLMs论文速览(arXiv方向):2024.03.05-2024.03.10—(1)
    文章目录~1.EditingConceptualKnowledgeforLargeLanguageModels2.TRAD:EnhancingLLMAgentswithStep-WiseThoughtRetrievalandAlignedDecision3.AreYouBeingTracked?DiscoverthePowerofZero-ShotTrajectoryTracingwithLLMs!4.CanLLMSubstit......
  • 线性回归模型公式推导完整简洁版
    线性回归模型公式推导完整简洁版这里做模型简化,假设有4个样本,每个样本有3个特征,然后使用平方误差作为损失函数,公式推导反向传播的求导过程。设训练样本为\[X=\left[\begin{matrix}x_{1}^{(1)}&x_{2}^{(1)}&x_{3}^{(1)}\\x_{1}^{(2)}&x_{2}^{(2)}&x_{3}^{(2)}\\x_......