谈谈我对大模型的想法

时间：2024-05-08 18:25:22浏览次数：23

【2024年5月8日思考】
整一个软件整了多少天了，没有进展，指望GPT给我启发，有些收获，不过问题离真正解决差得远。这么搞，路子不对！
现在市面上说大模型很火，就像多年前大家热衷说深度学习一样。现在在科研院所，做研究也一样，被动卷着，也要提提深度学习、大模型的字眼。说实话，你高校，其实大多数老师连A100显卡都买不到，很多coding的能力……不想多说了。想想自己为什么到科研院所，如果coding能力强，学历也拿到了，去业界不更香？老老实实做科研，做点偏门的，做点不那么热门的，不好嘛？现在学界有一股风，也跟着什么大模型一起卷？我就纳闷你那拿着人家的模型来调参，其中很多细节都搞不清楚的，一些大佬也跟着就知道发顶会？陷入细节中，把某项任务的解决从某个或某些个指标上提升了效果，有真正的理解？是从基础学科回答了一些本质的问题？还是从应用角度，也能去干一家公司？很难说。
现在市面上一些大模型，让画个画啦，甚至来一段视频了，效果真的很惊艳。那可能是以前没有过，从无到有确实惊艳。问题是？然后呢？你们一帮人瞎跟着？从一个黑箱到另一个黑箱。我就说一个点，你不画图嘛？能从数据到图像，给画出来？问题是，真的大模型就能把你给的上千上万的数据来画个图，做可视化了，问题是你信服嘛？它这个图怎么画的，严谨嘛？说实话，有些工作，真上大模型，就是瞎搞。
大模型就是答答题，应付应付文科的东西，在某些点上给些启发，思想层面的启发。特别实操层面的，细节层面的，小众层面的，最近最新的，它可能真的做不了做不好的。

标签：层面,模型,coding,想法,谈谈,做点,画个,启发
From： https://www.cnblogs.com/zhengw28/p/18180566

（一）文本分类经典模型之CNN篇
CNN源于计算机视觉研究，后来诸多学者将其应用于短文本分类，其基本结构如下图所示：由上图可知，基于CNN的短文本分类模型，通常包括输入层、卷积层、池化层、全连接层和输出层五部分，其中卷积层和池化层是最为关键的特征提取环节。卷积层通过构造二维卷积核，并将其上下移动，在卷积窗口内与......
YOLOv8 模型训练后验证
验证代码：fromultralyticsimportYOLOpath="E:/resource/yolo8_all/ultralytics-main/"#训练后进行验证model=YOLO(path+"runs/detect/train11/weights/best.pt")metrics=model.val(data=path+"data_NEUDET.yaml")#自动评估训练的数据参考链接......
当「软件研发」遇上 AI 大模型
作者：陈鑫（神秀）大家好，我是通义灵码的产品技术负责人陈鑫。过去有八年时间，我都是在阿里集团做研发效能，即研发工具相关的工作。我们从2015年开始做一站式DevOps平台，然后打造了云效，也就是将DevOps平台实现云化。到了2023年，我们明显感觉到大模型时代来了以后，软件工具将面临着......
当「软件研发」遇上 AI 大模型
作者：陈鑫（神秀）大家好，我是通义灵码的产品技术负责人陈鑫。过去有八年时间，我都是在阿里集团做研发效能，即研发工具相关的工作。我们从2015年开始做一站式DevOps平台，然后打造了云效，也就是将DevOps平台实现云化。到了2023年，我们明显感觉到大模型时代来了以后，软件工具将面临着......
基于总线设备驱动模型的按键读取驱动程序
本次实验基于总线设备驱动模型实现按键驱动程序的编写，给上层应用程序提供检测按键是否按下的操作接口，上层应用根据按键是否按下控制led的亮灭。所以上层应用程序会同时使用led和按键的驱动接口，但是对于下层驱动而言，这二者是分离的，因此只需要专注于编写按键驱动程序就可以了。在正......
一种光电容积波PPG 转换到心电图ECG进行房颤检测的神经网络模型
具体的软硬件实现点击http://mcu-ai.com/MCU-AI技术网页_MCU-AI人工智能光电体积描记法（PPG）是一种经济有效的非侵入性技术，利用光学方法测量心脏生理学。PPG在健康监测领域越来越受欢迎，并用于各种商业和临床可穿戴设备。与心电图（ECG）相比，PPG并没有提供实质性的临床诊断价值，尽管......
创建个人博客网站记录-2.3 建立模型以及对应的CRUD操作
2.3、建立模型以及对应的CRUD操作在本节中，创建了USER用户类和BLOG博文类两个对象类，并实现了其基本的增删改查的操作。#flaskr/models.pyfromflaskimportgfromflask_sqlalchemyimportSQLAlchemyfromsqlalchemyimportColumn,Integer,String,TIMESTAMP,ForeignKey,T......
【OpenVINO™】基于 C# 和 OpenVINO™ 部署 Blazeface 模型实现人脸检测
前言OpenVINO™C#API是一个OpenVINO™的.Netwrapper，应用最新的OpenVINO™库开发，通过OpenVINO™CAPI实现.Net对OpenVINO™Runtime调用，使用习惯与OpenVINO™C++API一致。OpenVINO™C#API由于是基于OpenVINO™开发，所支持的平台与OpenVINO™完全一......
轻量化城市三维模型CIM的主要技术方法
轻量化城市三维模型CIM的主要技术方法城市三维模型CIM（CityInformationModeling）是在数字化时代中，为城市规划、管理和可视化提供重要支持的关键工具。然而，大规模的城市模型往往具有复杂的几何结构和庞大的数据量，给数据存储、计算和可视化带来了挑战。为了解决这个问题，轻量化......
CVPR 2024 | 字节提出视觉基础模型：ViTamin，实现多项SOTA！
前言视觉语言模型屡屡出现新突破，但ViT仍是图像编码器的首选网络结构。字节提出新基础模型——ViTamin，专为视觉语言时代设计。本文转载自量子位（QbitAI）仅用于学术分享，若侵权请联系删除欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘......

谈谈我对大模型的想法

相关文章

赞助商

阅读排行