首页 > 其他分享 >书生·浦语大模型全链路开源体系——学习笔记day2&day3--纯纯新手入门

书生·浦语大模型全链路开源体系——学习笔记day2&day3--纯纯新手入门

时间:2024-04-05 17:33:21浏览次数:25  
标签:纯纯 6006 -- demo day2 internlm root ssh

学习链接:tutorial/helloworld/hello_world.md at main · InternLM/tutorial (github.com) 【精彩,照着做就能体验很多本来遥不可及的东西】

笔记分享链接:https://github.com/InternLM/tutorial/discussions/37

 

本笔记定位是对学习链接的补充和小白发牢骚,希望大佬能愿意点评一下,还有和刚入门的朋友们一起交流。

 

上回说到,俺是纯新手,先记录一些小白特有的体会:

1、平台给的算力很充足。一开始很忐忑学得慢会不会浪费算力的时间,但是一步一步照着做,仔细看,其实一节课三四小时就够了。而目前为止,平台送了快20个小时。

2、云平台界面既简洁又完美。简洁的网站,完美的jupyter、终端、vscode三合一。day2主要使用jupyter和终端,所以不用担心平台不熟悉。感觉比colab好用。

 

 

说完初见印象,下面是学习过程

3、在终端界面,每个程序执行完会跳出格式为(XXX)XXX:XXX# 的句子,提示输入下一句,如果没跳出来,就等待他运行,或者ctrl+C停止,或者关了重开。下面就是等待的样子,不要像我这样干等着或者还没运行完就输入新句子。此外,粘贴键有shift+insert。如果ctrl+V用不了可以试试。

4、本地的powershell也是这样的,当输入链接命令后,就没有任何反应了。原来没有反应就表示他已经连上了。后来把intern的云主机关掉以后,本地链接自动断了,才提示说它断了。第一次用还犹豫了一会,难道这就成功了吗?

ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 34887

 

4、感觉学习的核心就是部署和使用,部署的话就是尽量复刻大佬的办法,避开潜在的坑。使用就是入门者最关心好奇的问题了,

 

 

 

 

 

做第四个的时候遇到的问题:

第四个项目快速复制

conda activate xcomposer-demo
mkdir -p /root/model/Shanghai_AI_Laboratory
cp -r /root/share/temp/model_repos/internlm-xcomposer-7b /root/model/Shanghai_AI_Laboratory
cd /root/code/InternLM-XComposer
python examples/web_demo.py  \
    --folder /root/model/Shanghai_AI_Laboratory/internlm-xcomposer-7b \
    --num_gpus 1 \
    --port 6006

 

 

lass 'transformers_modules.internlm-xcomposer-7b.modeling_InternLM_XComposer.InternLMXComposerForCausalLM'>
/root/code/InternLM-XComposer/examples/web_demo.py:1068: GradioDeprecationWarning: The `style` method is deprecated. Please set these arguments in the constructor instead.
chat_textbox = gr.Textbox(
Running on local URL: http://0.0.0.0:6006

Could not create share link. Missing file: /root/.local/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.2.

Please check your internet connection. This can happen if your antivirus software blocks the download of this file. You can install manually by following these steps:

1. Download this file: https://cdn-media.huggingface.co/frpc-gradio-0.2/frpc_linux_amd64
2. Rename the downloaded file to: frpc_linux_amd64_v0.2
3. Move the file to this location: /root/.local/lib/python3.10/site-packages/gradio

 

方便复制2:

conda activate internlm-demo

cd /root/code/InternLM

 ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 34887
ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 34890
 

bash
conda activate internlm-demo # 首次进入 vscode 会默认是 base 环境,所以首先切换环境
cd /root/code/InternLM
streamlit run web_demo.py --server.address 127.0.0.1 --server.port 6006

 

按照教程的步骤做,就做出来一个回答问题的机器人。挺好玩的,虽然说话比较慢,但是能写python代码。让它手撕平衡树。

 

 

day3的作业:部署一个知识库

 

整个流程大概是:

下载文本文件,主要是txt和md,作为数据库。

这些数据库来自:xtuner,opencompass,lagent等等。位置在root/data里面。但是对于其中的结构还是不太了解。

 接着是,处理数据。包括:获取文件、加载文件、构建向量数据库、开源词向量模型。……

然后把internlm接入langchain中,构建检索问答链,

最后部署web demo,如上面截图。

 

标签:纯纯,6006,--,demo,day2,internlm,root,ssh
From: https://www.cnblogs.com/cosmowind/p/17959165

相关文章

  • 07 | Swoole 源码分析之 Channel 通道模块
    原文首发链接:Swoole源码分析之Channel通道模块大家好,我是码农先森。引言通道,用于协程间通讯,支持多生产者协程和多消费者协程。底层自动实现了协程的切换和调度。通道与PHP的Array类似,仅占用内存,没有其他额外的资源申请,所有操作均为内存操作,无IO消耗。底层使用......
  • 如何在Windows下启动Koa并隐藏窗口
    我打算在本地可以随时打开http://127.0.0.1:3000/这样使用本地的网页程序了。但是通过cmd执行nodeapp.js那个黑色的窗口看着碍眼,于是有了这个教程。 要使命令提示符窗口在后台运行且不可见,可以使用VBS脚本(VisualBasicScript)来实现。VBS脚本可以通过Windows脚本宿......
  • JAVA学习-类型信息.空对象
        空对象(NullObject)是一种特殊的对象,它表示一个不引用任何实际对象的对象。在Java中,空对象通常用null表示,它可以赋值给引用类型的变量。空对象在编程中具有一些特点和使用方法,与其他对象进行比较和高级应用。一、特点:1.空对象没有实际的内容或状态,它不指向任何......
  • JAVA学习-类型信息.instanceof与Class的等价性
    Java中的类型信息主要通过instanceof和Class来实现。1.instanceof:instanceof是Java关键字,用于判断某个对象是否是指定类型或其子类型的实例。它的语法如下:objectinstanceoftype其中object表示要判断的对象,type表示要判断的类型。如果object是type类型或其子类型的实例,则......
  • 蓝桥杯备考随手记: 常用的三种排序算法(冒泡排序、插入排序、选择排序)
    1.冒泡排序(BubbleSort)冒泡排序是一种简单直观的排序算法,在待排序序列中不断地交换相邻两个元素的位置,通过多次遍历,将最大(或最小)的元素逐渐向右(或左)移动到正确的位置,直到整个序列有序。冒泡排序的基本思想如下:从序列的第一个元素开始,比较相邻两个元素的大小。如果前一个元......
  • 剧本杀小程序开发,门店的新神器!
    在数字化浪潮的推动下,线下娱乐形式逐渐与互联网技术融合,其中“剧本杀”作为一种新兴的角色扮演游戏,正吸引着众多年轻人的目光。随着市场需求的不断扩大,不少创业者开始思考如何将这一线下活动通过线上平台进行拓展,而小程序因其便利性和易传播的特点,成为门店数字化转型的首选......
  • LeetCode 13. 罗马数字转整数
    解题思路通过样例我们可以知道,将目标对应值和下一个目标对应值进行比较,如果小于,则sum=sum+目标对应值,如果大于,则sum=sum-目标对应值。最终的sum就是正确答案。相关代码classSolution{public:intromanToInt(strings){unordered_map<char,int>a;......
  • 面试(01)————JVM篇,最大白话的一集,常见概念的讲解以及GC监控调优等等
    一、JDK体系结构图 二、JVM整体架构三、JVM组成说起JVM组成是什么,我们的第一印象就是堆、栈、方法区、程序计数器等等,但是这样是不对的,真实的JVM的组成由类装载子系统、运行时数据区和字节码执行引擎这三部分组成。而我们之前的回答只是片面的,所以需要留意一下,防止面试......
  • 算法分析与设计——实验1: 递归与分治
    实验一 递归与分治一、实验目的        1、理解分治算法的概念和基本要素;        2、理解递归的概念;        3、掌握设计有效算法的分治策略。二、实验内容和要求实验要求:通过上机实验进行算法实现,保存和打印出程序的运行结果,并结合程序进行......
  • 常见面试算法题-发广播
    ■ 题目描述某地有N个广播站,站点之间有些有连接,有些没有。有连接的站点在接受到广播后会互相发送。给定一个N*N的二维数组matrix,数组的元素都是字符’0’或者’1’。matrix[i][j]=‘1’,则代表i和j站点之间有连接,matrix[i][j]=‘0’代表没连接,现在要发一条广播,问初始最少......