文献与代码管理工具及统计基础
学习方法:好好上网,文献与代码管理工具
1.好好上网
2.Mendeley
3.github
1.好好上网,好好学习,好好提问
上网入口:搜索引擎(Google、Bing)
查文献:
问问题:提出一个好的问题
- 用什么工具上网?
- 用什么工具搜索?为什么学会上网很重要,尤其在学习深度学习的过程中
- stackoverflow
- 知乎
- csdn,比如说支持向量机的三重境界
2.学习资源整理
学习资源几类 (每一个层次都需要动手做实践)
-
视频
- 万门,网易云课堂,coursera, Udacity
-
教科书
- 周志华老师《机器学习》(南大教授)
- Ian Goodfellow 《深度学习》(生成对抗网络GAN的发明者)
- W. Mckinney 《Python for data analysis》
Notes:周老师的《机器学习》,业内又称“西瓜书”,是入门机器学习的一本比较好的教材。
Ian Goodfellow 《深度学习》,国内有中文翻译版,建议有一定基础的去看。 -
paper论文或者小章节 (理论基础较好者,在有志学习深度学习以及人工智能时,应多读paper, 比如说)
- Sabour, S., Frosst, N., & Hinton, G. E. (2017). Dynamic Routing Between Capsules, (Nips). Retrieved from http://arxiv.org/abs/1710.09829
- LeCun, Y. (n.d.). Gradient-based learning applied to document. https://doi.org/10.1109/5.726791
- Covington, P., Adams, J., & Sargin, E. (2016). Deep Neural Networks for YouTube Recommendations. Proceedings of the 10th ACM Conference on Recommender Systems - RecSys ’16, 191–198. https://doi.org/10.1145/2959100.2959190
- Ng, A. (2012). 8. The EM Algorithm. Machine Learning, 1(X), 139–172. https://doi.org/10.1007/978-3-642-21551-3_6
文献管理工具
3. Github
Github是程序员必备工具,作为版本控制(version control)和协同合作的利器,让人爱不释手。
- 几个概念:
- 缓存区
- 代码库
- 本地
- 远端
- 安装github for windows, 注册账户
- 基本命令
- git init, 建一个新的repository
- git clone 克隆一个repository
- git add 加入新的内容到缓存区
- git commit 实际提交改动
- git push 推送改动到远端
- git checkout -b 做一个分支branch
- git pull 获取并合并远端的版本 (fetch+merge)
- git merge 合并其他版本, 遇到冲突怎么办?
- git log 查看记录
几个名词:工作区(workspace),暂存区(index),代码库(Repository),远端(Remote)
看看github的workflow
- 在主干master之外,建立新的branch
- 在本地修改,提交到暂存区
- 提交pull requests
- 群组讨论,进一步修改
- merge到master上面
上手练练
Step1. 建立新的repository (本机)
1.1 本机建立repository: 在命令行中新建一个文件夹,进入文件夹后,使用git init进行初始化
1.2 添加一点文字文档内容,对本文件夹进行一定改动
Step2. 在远端建立repository, 并保存远端地址
Step3. 保存远端地址, 并在本地的command line命令行工具中,添加远端地址,这样就把本地和远端链接起来了
Step4. 将变动推送到主干master上
Step5. 创建新的分支branch, 同时进入该新branch
Step6. 查看过去记录
下面开始
Step1. 建立新的repository (本机)
- 从0开始,git init开始
1.1 本机建立repository: 在命令行中新建一个文件夹,进入文件夹后,使用git init进行初始化
mkdir newgame
cd newgame
git init
1.2 添加一点文字文档内容,对本文件夹进行一定改动 使用jupyter notebook或者sublime或者记事本,在文件夹内新建一个文档,这时对本文件夹产生了变动.
检查变动,使用
git status
1.3 将改动提交到暂存去,然后再交到代码库
git add ./
git commit -m '第一次改动‘
Step2. 在远端建立repository, 并保存远端地址 (需要先注册一个账号
In [ ]:
Step3. 保存远端地址, 并在本地的command line命令行工具中,添加远端地址,这样就把本地和远端链接起来了。要链接起来,还有更简单的方式,直接git clone
git remote add origin
- 这一步有更方便的办法,克隆已有的远端 repository,连最初的git initi也不用了,直接git clone ---远端的地址
tep4. 将变动推送到主干master上
git push -u origin master
Step5. 创建新的分支branch, 同时进入该新branch
git checkout -b 'newbranch'
newbranch是新branch的名称,用户可以随意改动
如果要改回 master 主干,使用
git checkout master
Step6. 查看过去记录
git log
这个是标准的查看过去记录的语句
git的功能非常多,简单介绍了这几个,在以后工作中,还会有 git merge, git fetch, git pull, 等用法
统计基础
- 均值
- 方差
- 大数定理
- 中心极限定理
- 假设检验
- p-value定义
基础的均值与方差,在讨论回归的时候,很有意义,需要明确概念
我们在讨论假设检验的时候,先不要引入具体的概率分布,不要想t-分布, 而是直接从原假设与备择假设上面考虑。这次听不懂没关系,我们在下周的课程中,会专门讨论假设检验,p-value的定义及其应用
1.均值
\[\begin{equation*} \bar{X}_n=\frac{1}{n}\left(\sum_{k=1}^n X_k\right) \end{equation*} \]连续整体的期望值是
\[\begin{equation*} \mu = E\left(X\right) = \int xp(x)dx \end{equation*} \]2.样本的方差
\[\begin{equation*} S^2 = \frac{1}{n-1}\sum_{i=1}^n\left(X_i-\bar{X}\right)^2 \end{equation*} \]整体的方差
\[\begin{equation*} Var(X) = \sigma^2 = \int \left(x-\mu\right)^2 f(x)dx \end{equation*} \]\[\begin{equation*} Var(X) = E[(X-\mu)^2] = E(X^2) - E^2(X) \end{equation*} \]3.大数定理
样本数量越多,则其平均就越趋近期望值
\[\begin{equation*} n\rightarrow \infty, \bar{X}_n \rightarrow \mu \end{equation*} \]4.中心极限定理
中心极限定理说明,在适当的条件下,大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。
5.假设检验
6.p-value 最具争议的统计概念 定义:在原假设成立的情况,出现观测值以及更极端情况的概率
标签:git,repository,代码,管理工具,文件夹,master,远端,文献,equation From: https://www.cnblogs.com/isLinXu/p/17026862.html