首页 > 其他分享 >强化学习科研入门

强化学习科研入门

时间:2024-06-17 14:00:10浏览次数:15  
标签:入门 模型 评阅 学习 神经网络 深度 强化 科研

强化学习科研入门路线

先从深度学习开始

想学好强化学习,必要的深度学习基础是不可或缺的,好比盖楼打地基,如果说机器学习是地基,深度学习是钢筋混凝土等支柱,那么,强化学习无疑就是在这些基础上的上层建筑,成熟的强化学习模型,可以在瞬息万变的环境中自主地做出合理的决策,像人一样思考,而非只是仅仅通过一对一的 input和output,端到端地把题目做出来。不必急于求成,路都是一步一个脚印走好的,一个伟大的万能的决策者,不也是从简单的做题开始的吗,机器学习基础固然重要,时间有限,我们不妨从深度学习开始。

人工智能入门(速速过一遍)

笔者的建议是:这些库懂得用就行(好比你知道哆啦A梦有哪些道具,你找他取就是),不用像考试一样背下来,不现实,要用的时候忘记了懂得问gpt,然后可以自己用pytorch搭建那些基础的网络,cnn或rnn等加深对代码和网络的理解

  1. Python编程
  2. Numpy矩阵运算
  3. Pandas数据科学库
  4. Matplotlib
  5. 线性代数

机器学习核心技术(目前可不学)

深度学习核心技术(必学)

  1. 人工神经网络
    • 感知机
    • 损失函数
    • 激活函数
    • 全连接层
    • DropOut
    • 优化方法及正则化
  2. BP神经网络
    • 正向计算
    • 链式法则
    • 权重更新
    • Back Propagation
    • 梯度消失/爆炸
    • Batch Normalization
  3. CNN卷积神经网络
    • 局部感受野
    • 权值共享
    • 卷积层
    • 池化层
  4. RNN循环神经网络
    • 梯度裁剪
    • 双向长短时记忆网络(BiLSTM)
    • 长短时记忆网络(LSTM)
    • 门控神经网络(GRU)
  5. Pytorch(学会看源码哦!)
    • 定义损失函数
    • 自动微分功能
    • 定义优化器
    • *定义模型结构

选修部分

(学到这边,其实就可以开始强化学习之旅了,这里按需学习,可以做科研地时候遇到再学)

  1. Transfomer原理(当今的大热门,对gpt感兴趣的可以看看)
  • 编码器
  • 解码器
  • 注意力机制
  • 语言模型
  • 模型超参数
  • 模型验证
  1. RNN及变体
  • 传统RNN
  • LSTM
  • Bi-LSTM
  • GRU
  • Bi-GRU
  • Seq2Seq

挑战者部分

笔者与深度学习的渊源在于大一上学期期末,1月份报名的中国大学生服务外包创新创业大赛,主打一个以赛促学,当时笔者只有一点Java基础,不会python,也没有深度学习基础,通过边学边做题的方式,大约历时一个半月(45-50天时间)的时间完成了服创A01基于文心大模型的智能阅卷平台设计与开发赛题,并取得了东部赛区三等奖,最重要的是,这样一段经历加深了我对AI的了解,增强了在这个领域走下去的兴趣与动力,有兴趣有时间的朋友,可以试试用所学知识大概把框架设计出来(比如说实现思路),我觉得这就很厉害了,当然如果能把python完全实现出来,那么真的会是一件很棒的事情

整体背景

在当前大语言模型(LLM)快速发展的技术背景下,教育领域正在经历着重大的变革。在试卷评阅场景中,教师对自动化和智能化的评阅需求逐渐凸显。因此,设计一个自动评阅平台,结合计算机视觉的图像分析和大语言模型的语
义理解与生成能力,有望提高试卷评阅的效率、准确性和评阅维度丰富性。

标签:入门,模型,评阅,学习,神经网络,深度,强化,科研
From: https://www.cnblogs.com/cjtaaa/p/18252236

相关文章

  • 从事网络安全领域吃香吗?零基础入门精通就业,附学习笔记
    吃香是真的会吃香?但是很辛苦。在安服这行工作是做的痛并快乐着。工作是没有轻松的,都是付出和回报成正比的,而且还要不停学习提升,丝毫不敢懈怠。不可能不加班,能正常作息很难,网络安全系列的岗位是IT行业里最辛苦的,接触了太多圈内同行朋友,基本上都是007,996真是福报奢侈,有时候......
  • 大数据开发语言Scala入门
    大数据开发语言Scala入门指南在当今数据驱动的世界中,Scala语言因其在大数据领域的卓越表现而受到青睐,特别是在ApacheSpark等框架中。本文将为你提供一个Scala语言的入门指南,帮助你理解Scala的基本概念,并指导你如何开始使用Scala进行大数据开发。Scala简介Scala是一种多......
  • java从入门到精通
    java从入门到精通1.进制转换1.1二进制和十进制1.2八进制packagecom.itheima.variable;publicclassASCIIDemo1{publicstaticvoidmain(String[]args){//目标:掌握ASCII编码表的编码特点。System.out.println('a'+10);//97+10=10......
  • 人工智能入门-第一周
    人工智能入门-第一周神经网络什么是神经网络?神经网络(NeuralNetwork)是一种模拟生物神经系统的计算模型,由大量相互连接的人工神经元组成。这些神经元通过权重连接成多个层次,从而可以学习和处理复杂的非线性关系。神经网络的基本结构神经元通常包含三层:输入层(InputLayer):接......
  • 音频信号处理入门-第一周
    音频信号处理学习-第一周音频掩蔽效应音频掩蔽效应(AudioMaskingEffect)是指在特定条件下,一个声音(通常称为掩蔽声,Masker)能够掩盖另一个声音(通常称为被掩蔽声,Maskee),使得后者在听觉上不容易被听到或完全听不到的现象。音频掩蔽效应在听觉处理的过程中十分常见,并且在音频压缩和......
  • JS逆向入门
    C级通关第一题打开页面https://www.aqistudy.cn/实现接口https://www.aqistudy.cn/apinew/aqistudyapi.php的正常请求并获取明文响应分析开着F12进页面遇到无限debugger一个neverpausehere下去关闭所有断点Activatebreakpoint(Ctrl+F8),随便逛逛网站找找目标接口......
  • 自学编程Java入门基础教学
    (首先下载typora/15天免费使用)MARKDOWN标题(符号必须英文输入法)标题#(#个数分级别)空格文案二级标题三级标题文字world!(前后两个*加粗)world!(1斜体*)world!(3*斜体加粗)world!(两个~波浪号删除线)引用吗喽小帆船自学Java寻大厂offer(>空格)分割线(三个-获三个*分割线)......
  • Kettle 数据抽取工具使用教程:从入门到实战
    一、简介Kettle是PentahoDataIntegration(PDI)的一个组成部分,是一个开源的数据集成工具。它被广泛用于数据的抽取、转换和加载(ETL)过程。Kettle提供了一个易于使用的图形界面,可以轻松设计和执行ETL流程。github源码地址:https://github.com/pentaho/pentaho-......
  • JDBC入门
    JDBC简介JDBC概念JDBC就是使用Java语言操作关系型数据库的一套API全称:(JavaDataBaseConnectivity)Java数据库连接JDBC是一套标准接口,实现同一套Java代码,操作不同的关系型数据库JDBC本质官方(sun)公司定义的一套操作所有关系型数据库的规则,即接口各个数据库厂商去实现这套接口......
  • FASTAPI从入门到进阶
    fastapi框架fastapi,一个用于构建API的现代、快速(高性能)的web框架。fastapi是建立在Starlette和Pydantic基础上的,Pydantic是一个基于Python类型提示来定义数据验证、序列化和文档的库。Starlette是一种轻量级的ASGI框架/工具包,是构建高性能Asyncio服务的理性选择。快速:可与......