首页 > 其他分享 >机器学习(ML)和大型语言模型(LLMs)学习路线图

机器学习(ML)和大型语言模型(LLMs)学习路线图

时间:2024-11-23 11:33:47浏览次数:10  
标签:机器 LLMs ML 模型 学习 Python https org

学生应该在微积分、统计学、计量经济学、基本经济理论和任何高级语言(最好是Python)的编程经验方面有扎实的基础。

微积分有助于理解优化问题,这是许多机器学习算法的核心,特别是在梯度下降和神经网络。统计对于理解概率分布、假设检验和推理至关重要,这些是大多数机器学习模型的基础。如果您有兴趣将机器学习技术应用于经济或金融数据,计量经济学特别有用,因为它提供了分析关系和从数据中得出结论的技能。基础经济理论对于理解影响金融模型的潜在因素非常重要,有助于创建预测性或规范性模型。实现算法和模型需要编程经验,Python是首选,因为它拥有庞大的机器学习和数据分析库生态系统,如NumPy、Pandas、Scikit-Learn、TensorFlow和PyTorch。有了这些先决条件,你就可以开始学习机器学习(ML)和大型语言模型(LLM)。

下面是一个结构化的路线图来指导你的学习之旅:

步骤1: 机器学习基础

  1. 复习线性代数与概率

学习线性代数(向量、矩阵、运算)和概率论的基础知识。

资源

  1. DeepLearning.AI 推出的 Mathematics for Machine Learning and Data Science 专项课程 Probability & Statistics for Machine Learning and Data Science 虽然口音有点重,但是真的容易理解 https://www.bilibili.com/video/BV1Fo4y1N7AX?p=1&vd_source=e1382be5be85cdcfd0d80d83c7c62002 【搬运自Coursera】

  2. Essence of Linear Algebra 非常容易理解的短片系列 https://www.bilibili.com/video/BV1u4411H7Ry/?vd_source=e1382be5be85cdcfd0d80d83c7c62002 【搬运自油管】

  3. 可汗概率学院:https://www.khanacademy.org/math/statistics-probability

  4. 线性代数可汗学院:https://www.khanacademy.org/math/linear-algebra

  5. Python编程基础

如果你还没有熟悉Python,请熟悉它,因为它广泛用于ML。

关键库:NumPy、Pandas、Matplotlib。

资源

  1. Bill Lubanovic 的《Introducing Python》

  2. Python.org教程:https://docs.python.org/3/tutorial/index.html

  3. W3School Python教程:https://www.w3schools.com/python/

Python的网上资源非常的多,这里就不一一赘述了。如果需要,请**联系我(**nihe78 # gmail.com)。

  1. 机器学习导论
  • 从基本的机器学习概念开始,如监督学习和无监督学习。

  • 了解线性回归、逻辑回归、K近邻和决策树等关键算法。

资源

  1. 周志华《机器学习》:这本书是机器学习领域的经典入门教材之一,被称为“西瓜书”。它涵盖了机器学习的基础知识和各种算法,内容全面且易于理解,适合初学者入门。
    Github 资源
    https://github.com/datawhalechina/pumpkin-book _开源组织Datawhale将《机器学习》中1-16章节的公式进行了整理,并对难点公式进行了详解和补充,创建了《pumpkin-book》南瓜书项目
    _https://github.com/Vay-keen/Machine-learning-learning-notes 周志华《机器学习》的学习笔记,记录了在学习这本书的过程中的理解思路以及一些有助于消化书内容的拓展知识,笔记中参考了许多网上的大牛经典博客以及李航《统计学习》的内容。

  2. 李航 《统计学习方法》这本书全面系统地介绍了统计学习的主要方法,特别是监督学习方法,包括感知机、k近邻法、朴素贝叶斯法、决策树、逻辑斯谛回归与支持向量机、提升方法、EM算法、隐马尔可夫模型和条件随机场等。
    Github 资源

    https://github.com/zhengjingwei/statistical-learning-method _用python手动实现和sklearn实现《统计学习方法》中所提到的算法。_https://github.com/datawhalechina/statistical-learning-method-solutions-manual 完成了《统计学习方法》的所有习题解答,并提供Python代码和运行截图。内容包括感知机、K近邻法、朴素贝叶斯法、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升方法、EM算法、隐马尔可夫模型、条件随机场等章节的习题解答。
    - https://github.com/WenDesi/lihang_book_algorithm 致力于将《统计学习方法》一书中所有算法实现一遍。提供了详细的代码示例和注释,帮助读者理解和实现书中的算法

  3. 吴恩达的Coursera ML课程:https://www.coursera.org/learn/machine-learning

  4. Scikit学习用户指南:https://scikit-learn.org/stable/user_guide.html

4. 练习机器学习模型

  • 练习使用Scikit-Learn构建简单模型。

  • 使用Kaggle或UCI机器学习库中的数据集来实现您的模型。

步骤2: 中级机器学习技术

  1. 深度学习基础
  • 了解神经网络、激活函数、损失函数和优化器。

  • 了解反向传播和梯度下降的基础知识。

资源

  1. Ian Goodfellow, Yoshua Bengio, and Aaron Courville《Deep Learning》这本书是深度学习领域的经典著作,被称为“深度学习AI圣经”。它涵盖了深度学习的概念、方法以及工业界实践应用,适合对深度学习感兴趣的读者深入学习。

  2. Christopher Bishop《Pattern Recognition and Machine Learning》比较老,但是非常经典的读物,相对《Deep Learning》容易理解一些。

  3. 深度学习 Coursera 课程:https://www.coursera.org/specializations/deep-learning

  4. TensorFlow.org教程:https://www.tensorflow.org/tutorials

2. 深度学习框架

  • 获得TensorFlow和PyTorch的实践经验。

  • 从构建用于分类和回归任务的简单神经网络开始。

3. 评估指标和模型调整

  • 了解评估指标,如准确性、精确度、召回率、F1评分、ROC曲线和AUC。

  • 练习超参数调整、正则化和模型选择。

步骤3: NLP和大语言模型(LLMs)

  1. 自然语言处理(NLP)基础
  • 了解Tokenization、Embedding、Indexing等技术。

  • 理解RAG技术,了解如何从Huggingface调用大语言模型。

资源

  1. HuggingFace上的资源 https://huggingface.co/learn/nlp-course/

  2. Jurafsky和Martin的《Speech and Language Processing》https://web.stanford.edu/~jurafsky/slp3/ 第三版的电子资源

  3. Delip Rao和Brian McMahan的 “Natural Language Processing with PyTorch”

  4. 斯坦福NLP课程:https://web.stanford.edu/class/cs224n/

2. Transformers和LLM

  • 了解构成LLM基础的Transformer架构。

  • 研究注意力机制、序列到序列模型和自我注意力。

资源

  1. 《Transformer》:https://jalammar.github.io/illustrated-transformer/

  2. “Attention is All You Need”论文:https://arxiv.org/abs/1706.03762

  3. HuggingFace Transformers概述:https://huggingface.co/transformers/

  4. LLM实践

  • 学习使用预训练的LLM,如GPT、BERT,并针对特定任务对其进行微调。

  • 框架:HuggingFace Transformers,用于实现最先进的NLP模型。

  • 使用HuggingFace练习文本分类、摘要和生成。

步骤5: 应用和实践

  1. 构建机器学习项目
  • 实施各种机器学习项目,如股价预测、情绪分析和推荐系统。

  • 将计量经济学知识应用于机器学习模型,以解决金融相关问题。

  1. 微调LLMs
  • 承担涉及聊天机器人、摘要工具或使用LLM进行语言翻译的项目。

  • 练习使用不同的数据集,如财务报告、社交媒体数据或其他特定领域的文本,为自定义应用程序微调LLM。

  1. 强化学习
  • 学习强化学习(如Bandit learning, Q-learning)和对抗模型(GAN)的基础知识。

  • 探索这些在金融中的应用,如算法交易。

  1. 研究论文和实践经验
  • 开始阅读相关的研究论文,了解最新进展。

  • 实施和实验论文中的模型,以亲身了解前沿研究。

建议时间表

  • 第1-3个月:基础和Python基础。

  • 4-6个月:中级机器学习,从深度学习开始。

  • 第7-9个月:NLP和LLMs。

  • 第10-12个月:应用和竞赛。

推荐工具

  • VS CodeJupyter Notebook用于实验。

  • Huggingface适合LLMs。

  • Scikit learnTensorFlowPyTorch用于ML。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

标签:机器,LLMs,ML,模型,学习,Python,https,org
From: https://blog.csdn.net/2401_84205765/article/details/143989397

相关文章

  • 大模型应用学习路线
    大模型技术已经成为推动人工智能发展的关键力量。无论你是初学者还是有经验的开发者,想要掌握大模型应用,都需要遵循一定的学习路线。从核心技术解析到模型微调与私有化部署,逐步深入大模型应用的世界。一、核心技术解析Transformer架构:这是大模型的基石。你需要理解Transfor......
  • matlab中mrdivide和mldivide记录
    解方程中常常见到Ax=B的形式,虽然可以用A^{-1}Ax=A^{-1}B的形式,也就是把A的逆矩阵求解出来的方式处理,但是A不是方阵时是没有办法用求逆的方法处理的,matlab中提供了mldivide和mrdivide的方式,具体如下:1.Ax=BA在x的左侧,调用mldivide(A,B),此处的l与A对应,表明左边的A在变量的左侧2.x......
  • PyTorch框架——基于深度学习YOLOv3神经网络目标检测x光安检违禁品检查系统
    基于深度学习神经网络YOLOv3目标检测的x光安检违禁品检查系统,其能识别的违禁品有5种(刀、枪、扳手、钳子、剪刀),见如下:第一步:YOLOv3介绍yoloV3以V1,V2为基础进行的改进,主要有:利用多尺度特征进行目标检测;先验框更丰富;调整了网络结构;对象分类使用logistic代替了softmax,更适用于......
  • 怎么在IE8及以下实现HTML5的兼容?
    IE8以及更早版本的IE浏览器不支持HTML5。要让HTML5的新特性在这些老旧浏览器上工作,你需要使用一些polyfill和JavaScript库。以下是几种常用的方法:HTML5Shiv:也称为HTML5shiv或shiv.js,这个JavaScript库可以让IE6-8识别HTML5的新语义元素,例如<article>,<aside>,<nav>,<se......
  • 基于Java+SpringBoot+Vue+HTML5人事管理系统(源码+LW+调试文档+讲解等)/人力资源管理/
    博主介绍......
  • D50【python 接口自动化学习】- python基础之类
    day50init方法学习日期:20241027学习目标:类--64init方法:如何为对象传递参数?学习笔记:魔术方法init方法classKlass(object):#定义初始化方法,类实例化时自动进行初始化def__init__(self,name,age):self.name=nameself.age=agede......
  • D51【python 接口自动化学习】- python基础之模块与标准库
    day51模块的导入学习日期:20241028学习目标:模块与标准库--66模块的导入:如何使用其他人编写好的代码功能?学习笔记模块的作用导入模块的方法#导入模块#方式一importos#获取当前的位置print(os.getcwd())#方式二fromosimportgetcwd#获取当前的位置pr......
  • SAP-ABAP开发学习-FUNCTION ALV
    ALV概览        ALV全称SAPListView,是SAP提供的一个强大的数据报表显示工具。ALV实质上是一个屏幕控件对象,它通过程序传递数据内表的方式来显示数据。实现方式:调用标准函数;优化接口:用户可以实现对字段的排序、筛选及统计等功能。显示方式:List类似于write语句输......
  • JavaWeb知识点总结 我的学习笔记
    JavaWeb我的学习笔记一、动态网页开发1.动态网页2.系统架构C/S架构B/S架构B/S与C/S的比较3.URL通信三要素4.Tomcat服务器二、Servlet1.Servlet简介2.Servlet快速入门入门样例执行原理3.Servlet的体系结构4.servlet的十大方法5.Servlet生命周期6.在web.xml中配置servl......
  • 【Linux学习】(6)编译器gcc/g++
    前言本节重点:掌握gcc/g++编译器的使用,并了解其过程,原理一、Linux编译器-gcc/g++使用1.gcc/g++的基本使用在前面我们学习了vim,知道如何在Linux中编写代码。但又是如何编译代码的?——在Linux中我们编译代码使用的是gcc/g++。gcc只能用来编译C语言,g++即可编译C也可编译......