首页 > 其他分享 >5 Amazing AI Projects, Open Source !

5 Amazing AI Projects, Open Source !

时间:2023-06-16 11:24:48浏览次数:47  
标签:Diffusion AI 模型 开源 生成 Source Amazing 图像

过去一周,AI大模型的快速演进仍然在继续上演。今天继续介绍GitHub上的一些实用的大模型开源项目。

1. ChatGLM-6B:Open Source ChatGPT Alternative
ChatGLM-6B是一个基于GLM架构的开源对话语言模型,支持中英双语,有62亿参数。结合模型量化技术,可以在消费级显卡上本地部署,效果堪比ChatGPT。2023年3月开源,3周时间已经积累超过100万次下载,目前全球接近300万次下载量。

2. CodeGeeX:Open Source Github Copilot Alternative
CodeGeeX是一个基于AI大模型的代码生成神器,拥有130亿参数,支持23种编程语言。CodeGeeX可以根据自然语言或代码片段生成完整的代码,“Ask CodeGeeX”功能可以在IDE中通过对话的方式直接操作代码,开发者普遍认为是Github Copilot的平替产品CodeGeeX是开源免费的,支持VS Code和IDEAs平台,目前全球安装使用的用户量超过100,000+。

3. Meta open source AI generative music model
这是Meta在GitHub上开源的名为Audiocraft的Python库,可以直接用人工智能生成音乐。其中主要使用了一个名为MusicGen的音乐生成模型。MusicGen是一个基于单阶自回归Transformer的预训练模型,使用32kHz EnCodec tokenizer,并以50Hz采样的方式生成了4个codebooks。

与现有的方法(如MusicLM)不同,MusicGen不需要自监督语义学习,而是一次性生成了所有4个codebooks。在文本生成和文生图之后,看看用文本生成音乐的效果如何。

4. Diffusers发布重要更新

Diffusers v0.17.0正式发布,改进了LoRA、Kandinsky 2.1、Torch编译加速等功能。Diffusers是一个在GitHub上的Diffusion Model预训练模型常用库,广受欢迎,可用于生成图像、音频,甚至是分子的3D结构。

无论是寻找简单的推理解决方案还是训练自己的Diffusion Models,Diffusers作为一个模块化工具包提供支持。
库的设计更注重易用性和可定制性,主要提供以下三个核心组件:

  • 先进的Diffusion pipeline,只需几行代码即可进行推理;
  • 可互换的noise schedulers,用于不同的Diffusion速度和输出质量;
  • 预训练模型可用作构建模块,并与schedulers结合使用,创建自己的端到端Diffusion Systems。

这个项目是由Hugging Face免费开源的,可以使用它来快速训练ControlNet,进一步提高AI绘画的效果和质量。

5. Everything is identifiable

Meta之前在GitHub上开源了一个名为Segment Anything Model的图像分割模型,可以自动实现图像分割。然而,该模型在图像定位方面表现良好,但在图像识别方面的表现却一般。

为此,复旦大学与OPPO的研究人员以及International School of Digital Economy,共同在GitHub上开源了一个基础图像标注模型:Recognize Anything Model (RAM)。采用了一种新的图像标注范式,可以识别各种常见类别。而且用来训练的数据,是通过大规模的图像自动生成文本来进行标注,取代了手动标注。

经过基准评估,RAM的标记能力表现优秀,效果明显优于CLIP和BLIP。有用户认为RAM甚至超过了完全监督的方法,与Google API相当。同时,项目中还包含一个名为Tag2Text的工具,可以批量直接为图像中的指定对象生成标签。如果与Meta的开源SAM模型结合使用,我们可以批量删除图像中的指定对象,进一步提高图像处理效率。

本文由博客一文多发平台 OpenWrite 发布!

标签:Diffusion,AI,模型,开源,生成,Source,Amazing,图像
From: https://www.cnblogs.com/chattech/p/17485100.html

相关文章

  • 更新公告:Airtest更新至1.2.10.2版本
    1.前言本次是Airtest库更新,版本提升至1.2.10.2,内容主要是Android录屏功能的改动。2.更改部分在Airtest1.2.9中提供的cv2模式已经被舍弃,因为容易引发错误,效果也不如ffmpeg;只有Android需要mode参数,默认为yosemite模式;Window/iOS的start_recording不再需要有mode参数;录......
  • 基础语法-main方法
    main方法是Java程序的入口点,也是程序执行的起始位置。当你运行一个Java程序时,JVM(Java虚拟机)会自动查找并执行包含main方法的类。在main方法中,你可以编写程序的逻辑代码,包括调用其他方法、处理输入输出、控制流程等。它允许你指定程序的初始行为,并定义程序执行的步骤和......
  • getResourceAsStream()返回值为null
    getResourceAsStream()返回值为nulljavaWeb项目,写文件下载的时候遇到getServletContext().getResourceAsStream("/store/"+filename)获取的值为null//获得读取本地文件的输入流in=getServletContext().getResourceAsStream("/store/"+filename);目录结构如下查......
  • Linux中/var/spool/postfix/maildrop/占用inode索引及磁盘空间解决办法
    问题表现和检查:1.运行df-i查看inode使用是否满;2.查看/var/spool/postfix/maildrop是否有非常多的小文件,ls直接卡死等情况;解决:1、清空/var/spool/postfix/maildrop/目录下的内容cd/var/spool/postfix/maildrop/ls|xargsrm-f2、不让系统再发垃圾邮件vi/etc/crontab;将......
  • HDU5293 Tree chain problem
    HDU5293TreechainproblemSolution1考虑dp。把链的信息挂在深度最浅的节点上,自下而上更新答案。记\(f_u\)表示\(u\)子树内的最大权值和,\(S\)表示挂在\(u\)上的某条链,\(son(x)\)表示点\(x\)的儿子集合,\(T_u\)表示子树\(u\)的点集。则\(f_u\)的初始值为:\[f_......
  • 浅析视频监控技术及AI发展趋势下的智能化视频技术应用
    视频监控技术是指通过摄像机对指定区域进行实时视频直播、录制、传输、存储、管理和分析的技术系统。它可以用于监控各种场所,如校园、工厂、工地、工作场所、公共区域、交通工具等。视频监控技术主要涉及到以下几个部分:1、摄像机摄像机是视频监控技术的核心设备,它主要用于捕捉画......
  • 6月13日,OpenAI再给ChatGPT、GPT-4加码,API函数调用上线、上下文长度提高4倍、价格降低
    下面是是openAI官方发给用户的邮件内容: 英文不好需要翻译,之后的内容:    ~~~~~~~~~~可以忽略~~~~~~~~~~~~~发现一个不错的国内chatGPT网站,方便易用。点击直达......
  • How to work around rustup-init failure
    Howtoworkaroundrustup-initfailure(JinQing’sColumn,Mar.,2022)rustup-init.exemayfailifsomeanti-virussoftwareisrunningwithrealtimeprotection.Theerrormessageislikethisaftermanyretries:error:couldnotrenamecomponentfilefrom�......
  • python使用aiohttp通过设置代理爬取基金数据
    说到python爬虫,我们就会想到它那强大的库,很多新手小白在选择框架的时候都会想到使用Scrapy,但是仅仅停留在会使用的阶段。在实际爬虫过程中遇到反爬机制是再常见不过的,今天为了增加对爬虫机制的理解,我们就通过手动实现多线程的爬虫过程,同时引入IP代理池进行基本的反爬操作。这里我们......
  • tailwindcss基本使用
    目录一、tailwindcss基本使用1、设置tailwind和postcss一、tailwindcss基本使用1、设置tailwind和postcss命令*npminit-y*npmitailwindcsspostcss-cliautoprefixer*npxtailwindinit编辑tailwind.config.jsmodule.exports={content:["./public/**/*.......