【大模型技术】什么时候需要训练和微调属于自己的大模型——小微企业必须要明白的问题

标签：小微训练 AI 模型微调技术业务

“ 从问题出发，先有需求再有解决方案 ”

老板和员工在思维方式上有一个很大的差别就是，作为老板他们喜欢寻找现有的解决方案，如果现有的解决方案无法满足的情况下，才会自己设计一个解决方案。

而作为员工来说特别是技术人员，大都有一种技术至上的心态，比如说很多技术人员找工作会特别在乎公司用的技术是否足够牛逼，足够高大上。

之所以产生这种现象的原因是因为，技术人员的心态是学会牛逼的技术，走到哪里都不怕。

而老板的心态是，能解决问题把业务跑起来最重要，现有的解决方案或许不是最好的，但它却是经过验证的，能够保证业务的稳定性；但如果提出新的解决方案，就要承担新方案潜在的各种风险。等以后业务稳定之后，可以慢慢的优化现有的方案。

什么时候需要训练和微调模型？

在上面的内容中，描述了一下员工与老板思维以及心态上的区别；这两种思维方式没有绝对的对错之分，区别只是两种完全不同的发展方向，一种是打工人的思维方式，一种是创业者的思维方式。

就拿大模型训练与微调来说，很多技术人员都想亲自参与或体验一下一个模型从无到有的诞生过程；但受限于各种原因，有机会参与这样工程的人还是比较少的；因此很多人都退而求其次，想做一下模型的训练与微调。

举个例子，你是某个小公司的技术人员，老板想引入大模型技术来升级现有的业务系统，然后让你做一下前期调查和简单的解决方案。

不管使用的是大模型的什么技术，比如Agent，知识库，AIGC等；很多技术人员下意识的方式就是先搞一个本地模型，试试能不能训练和微调一下，然后就陷入各种技术细节中无法自拔。

但事实上，市面上已经有很多大模型服务商，他们有专门训练和微调过的模型；根据现有的业务体系，或许随便找一个合适的模型就可以用了。

为什么不建议企业引入大模型技术时，就直接打造属于自己的大模型？

原因就是，你还不知道怎么把大模型技术与自己的业务场景相结合；虽然市面上可能有一些相似的案例，但每个企业都有其独特的运作方式，适合别人的不一定适合你。

简单来说就是，你都不知道现有业务引入大模型能解决哪些问题，以及潜藏着哪些问题；说白了就是，你都不知道要训练和微调出一个需要解决什么问题的模型，这样的模型怎么可能做的好呢？

就类似于你需求都不清楚，就直接开始开发产品了，这样的产品能有人用吗？

当然，如果说你觉得你是上帝之子，即使需求不明确也能做出符合业务场景的大模型；或者说你不差钱，训练一次不行就重新训练，那也可以。

因此，什么时候开始训练和微调模型？

最好的时机就是，在你的业务成型之后，有一些问题确实需要解决或者说需要节约成本；这时，你再去考虑训练和微调一个模型，甚至是找模型服务商帮你重新设计一个模型都可以。

一句话就是，在你的需求明确之后，也就是你知道要训练出一个什么样的模型，并且你有足够的技术和资金支持，那么你就可以训练和微调自己的模型了。

说到底还是那句话，技术是为业务服务的，技术的发展是基于业务场景的落地，而不是从技术去推动业务场景的发展，虽然技术的发展也有可能颠覆现有的业务场景，但那是技术与业务场景的深度融合的结果。

总之，不要一开始就想着训练和微调属于自己的模型，要从问题出发，而不是从结果出发。

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

标签：小微,训练,AI,模型,微调,技术,业务
From： https://blog.csdn.net/python123456_/article/details/142355815