首页 > 其他分享 >谈谈我对大模型的想法

谈谈我对大模型的想法

时间:2024-05-08 18:25:22浏览次数:23  
标签:层面 模型 coding 想法 谈谈 做点 画个 启发

【2024年5月8日思考】
整一个软件整了多少天了,没有进展,指望GPT给我启发,有些收获,不过问题离真正解决差得远。这么搞,路子不对!
现在市面上说大模型很火,就像多年前大家热衷说深度学习一样。现在在科研院所,做研究也一样,被动卷着,也要提提深度学习、大模型的字眼。说实话,你高校,其实大多数老师连A100显卡都买不到,很多coding的能力……不想多说了。想想自己为什么到科研院所,如果coding能力强,学历也拿到了,去业界不更香?老老实实做科研,做点偏门的,做点不那么热门的,不好嘛?现在学界有一股风,也跟着什么大模型一起卷?我就纳闷你那拿着人家的模型来调参,其中很多细节都搞不清楚的,一些大佬也跟着就知道发顶会?陷入细节中,把某项任务的解决从某个或某些个指标上提升了效果,有真正的理解?是从基础学科回答了一些本质的问题?还是从应用角度,也能去干一家公司?很难说。
现在市面上一些大模型,让画个画啦,甚至来一段视频了,效果真的很惊艳。那可能是以前没有过,从无到有确实惊艳。问题是?然后呢?你们一帮人瞎跟着?从一个黑箱到另一个黑箱。我就说一个点,你不画图嘛?能从数据到图像,给画出来?问题是,真的大模型就能把你给的上千上万的数据来画个图,做可视化了,问题是你信服嘛?它这个图怎么画的,严谨嘛?说实话,有些工作,真上大模型,就是瞎搞。
大模型就是答答题,应付应付文科的东西,在某些点上给些启发,思想层面的启发。特别实操层面的,细节层面的,小众层面的,最近最新的,它可能真的做不了做不好的。

标签:层面,模型,coding,想法,谈谈,做点,画个,启发
From: https://www.cnblogs.com/zhengw28/p/18180566

相关文章

  • (一)文本分类经典模型之CNN篇
    CNN源于计算机视觉研究,后来诸多学者将其应用于短文本分类,其基本结构如下图所示:由上图可知,基于CNN的短文本分类模型,通常包括输入层、卷积层、池化层、全连接层和输出层五部分,其中卷积层和池化层是最为关键的特征提取环节。卷积层通过构造二维卷积核,并将其上下移动,在卷积窗口内与......
  • YOLOv8 模型训练后验证
    验证代码:fromultralyticsimportYOLOpath="E:/resource/yolo8_all/ultralytics-main/"#训练后进行验证model=YOLO(path+"runs/detect/train11/weights/best.pt")metrics=model.val(data=path+"data_NEUDET.yaml")#自动评估训练的数据 参考链接......
  • 当「软件研发」遇上 AI 大模型
    作者:陈鑫(神秀)大家好,我是通义灵码的产品技术负责人陈鑫。过去有八年时间,我都是在阿里集团做研发效能,即研发工具相关的工作。我们从2015年开始做一站式DevOps平台,然后打造了云效,也就是将DevOps平台实现云化。到了2023年,我们明显感觉到大模型时代来了以后,软件工具将面临着......
  • 当「软件研发」遇上 AI 大模型
    作者:陈鑫(神秀)大家好,我是通义灵码的产品技术负责人陈鑫。过去有八年时间,我都是在阿里集团做研发效能,即研发工具相关的工作。我们从2015年开始做一站式DevOps平台,然后打造了云效,也就是将DevOps平台实现云化。到了2023年,我们明显感觉到大模型时代来了以后,软件工具将面临着......
  • 基于总线设备驱动模型的按键读取驱动程序
    本次实验基于总线设备驱动模型实现按键驱动程序的编写,给上层应用程序提供检测按键是否按下的操作接口,上层应用根据按键是否按下控制led的亮灭。所以上层应用程序会同时使用led和按键的驱动接口,但是对于下层驱动而言,这二者是分离的,因此只需要专注于编写按键驱动程序就可以了。在正......
  • 一种光电容积波PPG 转换到心电图ECG进行房颤检测的神经网络模型
    具体的软硬件实现点击http://mcu-ai.com/MCU-AI技术网页_MCU-AI人工智能光电体积描记法(PPG)是一种经济有效的非侵入性技术,利用光学方法测量心脏生理学。PPG在健康监测领域越来越受欢迎,并用于各种商业和临床可穿戴设备。与心电图(ECG)相比,PPG并没有提供实质性的临床诊断价值,尽管......
  • 创建个人博客网站记录-2.3 建立模型以及对应的CRUD操作
    2.3、建立模型以及对应的CRUD操作在本节中,创建了USER用户类和BLOG博文类两个对象类,并实现了其基本的增删改查的操作。#flaskr/models.pyfromflaskimportgfromflask_sqlalchemyimportSQLAlchemyfromsqlalchemyimportColumn,Integer,String,TIMESTAMP,ForeignKey,T......
  • 【OpenVINO™】基于 C# 和 OpenVINO™ 部署 Blazeface 模型实现人脸检测
     前言OpenVINO™C#API是一个OpenVINO™的.Netwrapper,应用最新的OpenVINO™库开发,通过OpenVINO™CAPI实现.Net对OpenVINO™Runtime调用,使用习惯与OpenVINO™C++API一致。OpenVINO™C#API由于是基于OpenVINO™开发,所支持的平台与OpenVINO™完全一......
  • 轻量化城市三维模型CIM的主要技术方法
    轻量化城市三维模型CIM的主要技术方法 城市三维模型CIM(CityInformationModeling)是在数字化时代中,为城市规划、管理和可视化提供重要支持的关键工具。然而,大规模的城市模型往往具有复杂的几何结构和庞大的数据量,给数据存储、计算和可视化带来了挑战。为了解决这个问题,轻量化......
  • CVPR 2024 | 字节提出视觉基础模型:ViTamin,实现多项SOTA!
    前言 视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin,专为视觉语言时代设计。本文转载自量子位(QbitAI)仅用于学术分享,若侵权请联系删除欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘......