- 2024-09-13开源视觉大模型
MiniCPM-V2.6https://github.com/OpenBMB/MiniCPM-VMiniCPM-Visaseriesofend-sidemultimodalLLMs(MLLMs)designedforvision-languageunderstanding.Themodelstakeimage,videoandtextasinputsandprovidehigh-qualitytextoutputs.SinceFebruary
- 2024-09-09大模型的两个重要能力 (IF + FC)
MiniCPMhttps://github.com/OpenBMB/MiniCPM面壁智能推出的大模型,在如下方面支持能出众。推理长文本RAG都是常见的能力。其中指令遵从(IF=instructionfollow)和工具调用(FC=functioncall),威力强大,可以用作很多语音控制场景。 MiniCPM3.0MiniCPM3.0是一
- 2024-08-14MiniCPM-V 2.6 面壁“小钢炮”,多图、视频理解多模态模型,部署和推理实战教程
MiniCPM-V2.6是清华和面壁智能最新发布的多模态模型,亦称面壁“小钢炮”,它是MiniCPM-V系列中最新、性能最佳的模型。该模型基于SigLip-400M和Qwen2-7B构建,仅8B参数,但却取得20B以下单图、多图、视频理解3SOTA成绩,一举将端侧AI多模态能力拉升至全面对标GPT-4V水平
- 2024-07-05FAILED: cpu_adam.so /usr/bin/ld: cannot find -lcurand collect2: error: ld returned 1 exit status
FAILED:cpu_adam.so c++cpu_adam.ocpu_adam_impl.o-shared-lcurand-L/home/deeplp/anaconda3/envs/minicpm/lib/python3.10/site-packages/torch/lib-lc10-ltorch_cpu-ltorch-ltorch_python-ocpu_adam.so/usr/bin/ld:cannotfind-lcurandcollect2:error:ld
- 2024-06-17LLM大模型: DPO原理和源码解析
1、前段时间国外某大学反向抄袭国内某团队的大模型闹得沸沸扬扬,国内被抄袭的大模型是MiniCPM,详细资料:https://github.com/OpenBMB/MiniCPM;能被国外同行抄袭,必定有过人之处,粗略看了一下https://github.com/OpenBMB/MiniCPM/blob/main/model/modeling_minicpm.py模型文件,发
- 2024-06-04斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
ChatGPT狂飙160天,世界已经不是之前的样子。新建了免费的人工智能中文站https://ai.weoknow.com新建了收费的人工智能中文站https://ai.hzytsoft.cn/更多资源欢迎关注斯坦福Llama3-Vvs清华MiniCPM-Llama3-V-2.5在GPT-4o出世后,Llama3的风头被狠狠盖过。