• 2024-06-30【机器学习】Datawhale-AI夏令营分子性质AI预测挑战赛
    #ai夏令营#datawhale#夏令营1.赛事简介还是大家熟悉的预测算法类:分子性质AI预测挑战赛要求选手根据提供的demo数据集,可以基于demo数据集进行数据增强、自行搜集数据等方式扩充数据集,并自行划分数据。运用深度学习、强化学习或更加优秀人工智能的方法预测PROTACs的降解
  • 2024-05-15【datawhale打卡】深入剖析大模型原理——Qwen Blog
    教程及参考文档QwenBlog科普神文,一次性讲透AI大模型的核心概念Largelanguagemodels,explainedwithaminimumofmathandjargon0.前置知识由于我没有LLM基础,所以直接上手看文档看的是一头雾水。然后就去补了一下基础知识,这里算是一点简单的个人理解和总结吧。LLM
  • 2024-04-21datawhale-动手学图深度学习task04
    动手学图深度学习图表示学习研究在嵌入空间(EmbeddingSpace,指在高维数据被映射到低维空间的数学结构)表示图的方法,在图上表示学习核嵌入指的是同一件事,“嵌入”是指将网络中的每个节点映射到低维空间(需要深入了解节点的相似性和网络结构),旨在捕捉图结构中的拓扑信息、节点内容信
  • 2024-04-20第5章 复杂推理——像人类一样思考
    第5章复杂推理——让大模型更加像人一样思考  在之前的章节中,我们学习了如何使用大型语言模型来处理自然语言理解和文本生成任务。目前的大型语言模型已经能够轻松应对日常任务,但当任务的复杂度超过一定阈值时,这些模型可能无法胜任。本章将在现有任务的基础上,探讨如何让大型模
  • 2024-04-17datawhale-动手学图深度学习task02
    动手学图深度学习task2第二章:图理论基础图的背景图论中著名问题:柯尼斯堡七桥问题问题:当时东普鲁士柯尼斯堡,市区跨普列戈利亚河两岸,河中心有两个小岛。小岛与河的两岸有七条桥连接。在所有桥都只能走一遍的前提下,如何才能把这个地方所有的桥都走遍?解决思路:将问题简化
  • 2024-04-15datawhale-动手学图深度学习task01
    动手学图深度学习task1第一章:介绍充满图的世界图包括人类社会、化学相互作用、知识图谱等,可以分为自然定义的和人造的两种,图有时也称为网络,例如社交网络、经济网络等(这些情况下的网络指的不是深度神经网络)。图的现实世界应用社交网络:有个著名结论是6度分离(两个人之间可以
  • 2024-03-18datawhale-动手学数据分析task4笔记
    动手学数据分析task4数据可视化matplotlib的图像都位于figure对象中,创建新的对象用plt.figure。plt.subplot()方法可以更方便地创建一个新figure,并返回一个含有以创建的subplot对象的numpy数组。'''参数说明:nrows=int,subplot的行数ncols=int,subplot的列数sharex=Bool
  • 2024-03-13datawhale-动手学数据分析task2笔记
    动手学数据分析task2数据清洗及特征处理缺失值观察与处理.isnull()和.isna()可判断表中所有缺失值,缺失值处为True,优先用.isna()。.isna().sum()可以获得columns的缺失值数量。.info()可以获得dataframe中columns的non-null值,从而推断出缺失值数量。.dropna()方法可
  • 2024-03-13【DataWhale学习】用免费GPU线上跑StableDiffusion项目实践
    用免费GPU线上跑SD项目实践​DataWhale组织了一个线上白嫖GPU跑chatGLM与SD的项目活动,我很感兴趣就参加啦。之前就对chatGLM有所耳闻,是去年清华联合发布的开源大语言模型,可以用来打造个人知识库什么的,一直没有尝试。而SD我前两天刚跟着B站秋叶大佬和Nenly大佬的视频学习过
  • 2024-03-12datawhale-动手学数据分析task1笔记
    动手学数据分析task1第一节:数据载入及初步观察载入数据数据集下载导入numpy库和pandas库。importnumpyasnpimportpandasaspd载入数据。相对路径载入数据。df=pd.read_csv('train.csv')绝对路径载入数据。path=os.path.abspath('train.csv')df
  • 2024-03-12python数据分析 datawhale
    数据分析数据载入及初步观察载入数据导入Numpy和pandasimportnumpyasnpimportpandasaspd使用相对路径和绝对路径载入数据df=pd.read_csv('train.csv')df=pd.read_csv('/Users/chenandong/Documents/datawhale数据分析每个人题目设计/招募阶段/第一单元项目集
  • 2023-11-21聪明办法学python【安装】+【启航】
    聪明办法学python—1任务【0】安装conda配置顺便了解了anniconda和miniconda的联系:mini体谅更小,但是没有图形化界面配置下载的一般流程:找一个镜像网站(因为服务器在国外,直接下载很慢)​校园网联合镜像站https://help.mirrors.cernet.edu.cn/​阿里巴巴开源
  • 2023-11-21Datawhale_0&1
    安装与启航安装Minicondagit创建和激活CONDA环境创建Conda环境condacreate-np2spython=3.12激活Conda环境condaactivatep2s删除某个Conda环境condadeactivate#退出该环境condaremove-np2s--all#删除整个环境PIP安装与展示Pip安装第三方库
  • 2023-11-21datawhale task01,02
    python要点conda![1700559481851](C:\Users\25322\Documents\WeChatFiles\wxid_xc71h7t6nm2i22\FileStorage\Temp\1700559481851.png)注释单行注释以#开头多行注释可以用多个#号,还有'''和""".程序员最讨厌的10件事:0:别人的代码不写注释​
  • 2023-10-29DataWhale DAY8 结课竞赛
    DataWhaleDAY8结课竞赛今天是结课竞赛,当游记写了。其实题目本身没什么好写的,都是一些基础题。唯一有意思的是使用python进行的简化。以前做那道字符串的题还比较繁琐,这次利用打包好的功能可以直接秒。顺便感慨自己的码力下降了不少,老是在一些小地方写错。最后的结果是T2WA
  • 2023-10-25diffusion扩散模型\datawhale组队学习——v3先运行一半(下)
    微调:好像是用新数据训练旧模型的管道。微调的参数有:图形大小:image_size数据批次:batch_size为减轻显卡压力,将数据批次再切分为2(n)倍,num_epochs相对应的,权重更新频率也乘2(n)倍,grad_accumulation_steps总感觉对模型影响不大捏?难道是为了加大图形质量和效果,就相应地延长训练时
  • 2023-10-24DataWhale DAY6 循环
    DataWhaleDAY6循环今天学习循环方面的知识。语法部分:https://www.cnblogs.com/hewo/p/17635277.html感觉python的for是真的像自然语言。range:​range(stop)#[0,stop)range(start,stop)#[start,stop)range(start,stop,step)#+=step关于while和for(其
  • 2023-10-23diffusion扩散模型\datawhale组队学习——v3先运行一半
    今天我们一起学习如何对模型微调和引导。微调,用原模型,跑新数据,得到新输出。引导,引导生成过程,改变输出结果。 作者之前用过sd模型,不同的采样方法在不同的采样步数下有不同的效果。首先采样步数并非越高越好或越低越好,有一个最佳使用区间,其次,不同采样方法有自己不同的最佳采样
  • 2023-10-22DataWhale DAY5 条件语句
    DataWhaleDAY5条件语句本次学习python中的条件语句。语法博客:https://www.cnblogs.com/hewo/p/17635277.html注意点位:1.减少炫技般的使用特殊方法的判断,从理解方面简化你的代码,对于python,没有必要时不用使用奇技淫巧优化。对于true/false和0/1:​ 首先,bool是int的
  • 2023-10-20DataWhale DAY4 变量和函数
    DataWhaleDAY4变量和函数语法部分:https://www.cnblogs.com/hewo/p/17635277.html上文提到过的一点,python是动态数据类型,它没有传统的定义,自然就可以在赋值的时候,新值不一定要和旧值相同类型。老生常谈的问题:别乱用关键词,其实python的关键词啊什么的还好,基本上要先加上库,不
  • 2023-10-20diffusion扩散模型\datawhale组队学习——v2-抄别人代码还要矫情一下
    如果想学diffusion,又没有买纸质书咋办捏?datawhale为我们提供了大佬的中文笔记!学习来源:https://relph1119.github.io/my-team-learning/#/diffusion_models_learning51/ch03/ch03 甚至比看github的代码还方便。但是又不得不矫情一下,跟着做还有点问题。(小弟就不放大佬的笔记
  • 2023-10-19DataWhale DAY3 数据类型和操作
    DataWhaleDAY3数据类型和操作写在前面的:python基本操作统一放在https://www.cnblogs.com/hewo/p/17635277.html本文放一些有意思的东西首先味大的python提供了很是自动的动态类型。对象性质作为一个面向对象的语言,python具有很好的“面向对象友好”性质。举个例
  • 2023-10-17DataWhale DAY2 基础语法1
    DataWhaleDAY2基础语法1今天主要是一点入门语法,import什么的,所以重点不放在上面。语法部分专门开一章:https://www.cnblogs.com/hewo/p/17635277.html关于浮点数精度问题,倒是有点意思。以前学c++的时候,尤其是计算几何的时候,经常设一个极小常量来比较,现在明白本质上是进
  • 2023-10-16prompt提示工程/diffusion扩散模型/datawhale组队学习///day1 看直播
    今日学习来源【纯干货】提示工程(PromptEngineering)-AI编程新范式_哔哩哔哩_bilibili 抄一下评论区的课代表: -0:00
  • 2023-08-22《Datawhale人工智能培养方案》发布!
     Datawhale干货 开源贡献:Datawhale团队结合周志华老师的西瓜书,我们发布了第一个开源教程《Pumpkinbook-南瓜书》,到现在我们已经开源了51份学习教程,共获得Github 4.3w star。你认为Datawhale体现的价值?Datawhale团队已经有200多个成员,我们在一起坚持做开源的意义和价值是什么?其