首页 > 编程语言 >开源!《AI 算法工程师手册》中文教程正式发布!

开源!《AI 算法工程师手册》中文教程正式发布!

时间:2023-01-02 21:07:53浏览次数:58  
标签:教程 AI 神经网络 算法 学习 -- 开源 install


最近红色石头在浏览网页的时候,偶然发现一份非常不错的 AI 资源,就是这本《AI 算法工程师手册》 。本文将给大家推荐这本优秀教材,并作详细的介绍。

这本《AI 算法工程师手册》已正式开源,无需购买纸质书籍,可以直接在线阅读,体验感爆棚。在线阅读地址为:

​http://www.huaxiaozhuan.com/​

作者简介

首先不得不提一下本书的作者,作者华校专,曾经在阿里巴巴担任资深算法工程师,现任智易科技首席算法研究员。他还是《Python 大战机器学习》书籍的作者。

书籍介绍

这本《AI 算法工程师手册》是作者多年以来学习总结的笔记,经整理之后开源于世。关于为什么将完整书籍开源,作者是这样说的:曾有出版社约稿,但是考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此就采取开源的形式。

既然本书是 AI 算法工程师的手册,因此内容非常丰富,基本涵盖了机器学习、深度学习等领域的很多重要理论知识和实战经验,同时也介绍了工程应用中经常使用的 AI 工具和编程库。

书籍整体包含了 5 大块内容,分别是:

  • 数学基础
  • 统计学习
  • 深度学习
  • 自然语言处理
  • 工具

下面我们分别来看一下各模块的内容。

1. 数学基础

提升 AI 内功心法离不开扎实的数学基础。本书数学基础这部分,作者主要介绍了最重要的 4 点:

  1. 线性代数基础
  2. 概率论基础
  3. 数值计算基础
  4. 蒙特卡洛方法与 MCMC 采样

例如线性代数部分最基本的基础知识:

开源!《AI 算法工程师手册》中文教程正式发布!_源码编译

2. 统计学习

这部分内容作者花了比较大的篇幅,主要介绍的是机器学习中一些常见的算法,包括线性回归、感知机、支持向量机、决策树、集成学习等。同时还包括模型评估、特征选择、降维等。具体内容如下:

  1. 机器学习简介
  2. 线性代数基础
  3. 支持向量机
  4. 朴素贝叶斯
  5. 决策树
  6. knn
  7. 集成学习
  8. 梯度提升树
  9. 特征工程
  10. 模型评估
  11. 降维
  12. 聚类
  13. 半监督学习
  14. EM算法
  15. 最大熵算法
  16. 隐马尔可夫模型
  17. 概率图与条件随机场
  18. 边际概率推断

每个算法的理论介绍非常详细、数学推导完整,例如支持向量机中关于对偶问题的推导:

开源!《AI 算法工程师手册》中文教程正式发布!_源码编译_02


开源!《AI 算法工程师手册》中文教程正式发布!_AI_03


开源!《AI 算法工程师手册》中文教程正式发布!_源码编译_04

3. 深度学习

这部分主要介绍深度学习神经网络的基本知识和模型,包括前馈神经网络、卷积神经网络、循环神经网络等。具体内容如下:

  1. 深度学习简介
  2. 反向传播算法
  3. 正则化
  4. 最优化基础
  5. 卷积神经网络
  6. 循环神经网络
  7. 工程实践指导原则

这部分详细介绍了神经网络模型的基本结构和训练方法,例如列举了经典 CNN 结构:LeNet、AlexNet、VGG-Net、Inception、ResNet、ResNet 变种、SENet、DenseNet。

1998 年 LeCun 推出的 LeNet 网络:

开源!《AI 算法工程师手册》中文教程正式发布!_深度学习_05

4. 自然语言处理

这部分作者主要介绍了自然语言处理领域的 2 个方面:

**1. 主题模型 **

  • Unigram Model
  • pLSA Model
  • LDA Model
  • 型讨论

2. 词向量

  • 向量空间模型 VSM
  • LSA
  • Word2Vec
  • GloVe

5. 工具

这部分主要介绍了 AI 常用工具和函数库,具体内容如下:

  1. CRF
  2. lightgbm
  3. xgboost
  4. scikit-learn
  5. spark
  6. numpy
  7. scipy
  8. matplotlib
  9. pandas

这部分的内容更加侧重于 AI 实战,包含很多具体函数库的使用教程和代码。例如 lightbgm 是一个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。本书对 lightbgm 的安装、各参数含义、调参、使用等都作了详细的介绍,宛如一份优秀的中文文档!

这里附上 lightbgm 简单的 pip 安装方法:

pip install lightgbm
pip install --no-binary :all: lightgbm #从源码编译安装
pip install lightgbm --install-option=--mpi #从源码编译安装 MPI 版本
pip install lightgbm --install-option=--gpu #从源码编译安装 GPU 版本
pip install lightgbm --install-option=--gpu --install-option="--opencl-include-dir=/usr/local/cuda/include/" --install-option="--opencl-library=/usr/local/cuda/lib64/libOpenCL.so" #从源码编译安装,指定配置
#可选的配置有:
# boost-root
# boost-dir
# boost-include-dir
# boost-librarydir
# opencl-include-dir
# opencl-library

同样,像 xgboost、scikit-learn 等库,书中也作了详尽的解释。除此之外,还有 spark 的内容哦,可以说是非常全面了。

最后

不得不说,这本《AI 算法工程师手册》是一本比较完备的 AI 书籍,既包含了算法理论,也有实战 AI 算法库的使用。作为一份参考手册还是非常不错的!

更重要的是本书完全开源,直接在线阅读就好了。不过注意该书籍仅供个人学习使用,非作者同意不得应用于商业领域。


开源!《AI 算法工程师手册》中文教程正式发布!_机器学习_06


标签:教程,AI,神经网络,算法,学习,--,开源,install
From: https://blog.51cto.com/u_14481745/5984052

相关文章

  • 干货 | 126 篇 AI 原创文章精选(ML、DL、资源、教程)
    一年多来,公众号【AI有道】已经发布了140+的原创文章了。内容涉及林轩田机器学习课程笔记、吴恩达deeplearning.ai课程笔记、机器学习、深度学习、笔试面试题、资源教程......
  • 开源引导工具Ventoy 1.0.86 发布
    开源装机工具Ventoy1.0.86正式发布,可使用ISO或者IMG等磁盘镜像格式创建可启动媒体。Ventoy支持在一个U盘上放置多个磁盘镜像,从而可以在一个设备上运行不同版......
  • 回收站管理器 - 开源研究系列文章
    这些天弄了一个回收站管理器,主要是判断回收站里是否有文件,以及清空等操作。关键是把回收站放到任务栏里,方便操作,桌面的回收站也能够关闭显示了。1、      ......
  • 鹅厂大佬爆肝200小时的编程导航是什么样的(已开源)
    前言同样是潜水或者销声匿迹,但有的人却是偷偷发育,然后惊艳所有人,这不鹅厂好友鱼皮花了一个月开源了一个编程导航,内容上也是相当丰富,页面也是非常nice,现在分享给大家。最近一......
  • 论文解读(CAN)《Contrastive Adaptation Network for Unsupervised Domain Adaptation》
    论文信息论文标题:ContrastiveAdaptationNetworkforUnsupervisedDomainAdaptation论文作者:GuoliangKang,LuJiang,YiYang,AlexanderGHauptmann论文来源:CVPR......
  • daily study 7
    学习数组作为函数的参数:写一个冒泡排序函数,将一个整形数组排序冒泡排序:两两相邻元素进行比较,然后进行交换#include<stdio.h>voidth(intarr[],intsz){ //确定冒泡排序......
  • C# 开源库大全非常好
     商业协作和项目管理平台-TeamLab网络视频会议软件-VMukti驰骋工作流程引擎-ccflow【免费】正则表达式测试工具-Regex-TesterWindows-Phone-7-SDKExcel-读写组......
  • AutoCAD Civil3D 2023安装图文教程
    ​Civil3D2023简单介绍Civil3D设计软件是土木工程师的首选软件,也是民用大众领域的综合解决方案,同时Civil3D提供了AutoCAD和AutoCADMap3D的功能,该软件使用基于模型的......
  • Python类的封装教程
    一、什么是封装封装的本身意思其实就和闭包函数一样,就是把一个函数和变量全都包在一起,但其实这样的说法不是很具体,就是一种很片面的解释二、为什么要封装封装数据的主要......
  • 课程设计 --- 黑白棋中的 AI
    到了考试周了佯,可是偏偏这个时候迎来了很多很多的课程设计,幸好教授把C语言的课程设计提前发出了,不然都在最后几周,加上数据结构的课程设计就没有时间做这个啦~刚开始打算做成......