书生·浦语大模型全链路开源体系——学习笔记day2&day3--纯纯新手入门

时间：2024-04-05 17:33:21浏览次数：25

标签：纯纯 6006 -- demo day2 internlm root ssh

学习链接：tutorial/helloworld/hello_world.md at main · InternLM/tutorial (github.com) 【精彩，照着做就能体验很多本来遥不可及的东西】

笔记分享链接：https://github.com/InternLM/tutorial/discussions/37

本笔记定位是对学习链接的补充和小白发牢骚，希望大佬能愿意点评一下，还有和刚入门的朋友们一起交流。

上回说到，俺是纯新手，先记录一些小白特有的体会：

1、平台给的算力很充足。一开始很忐忑学得慢会不会浪费算力的时间，但是一步一步照着做，仔细看，其实一节课三四小时就够了。而目前为止，平台送了快20个小时。

2、云平台界面既简洁又完美。简洁的网站，完美的jupyter、终端、vscode三合一。day2主要使用jupyter和终端，所以不用担心平台不熟悉。感觉比colab好用。

说完初见印象，下面是学习过程

3、在终端界面，每个程序执行完会跳出格式为（XXX）XXX：XXX# 的句子，提示输入下一句，如果没跳出来，就等待他运行，或者ctrl+C停止，或者关了重开。下面就是等待的样子，不要像我这样干等着或者还没运行完就输入新句子。此外，粘贴键有shift+insert。如果ctrl+V用不了可以试试。

4、本地的powershell也是这样的，当输入链接命令后，就没有任何反应了。原来没有反应就表示他已经连上了。后来把intern的云主机关掉以后，本地链接自动断了，才提示说它断了。第一次用还犹豫了一会，难道这就成功了吗？

ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 34887

4、感觉学习的核心就是部署和使用，部署的话就是尽量复刻大佬的办法，避开潜在的坑。使用就是入门者最关心好奇的问题了，

做第四个的时候遇到的问题：

第四个项目快速复制

conda activate xcomposer-demo
mkdir -p /root/model/Shanghai_AI_Laboratory
cp -r /root/share/temp/model_repos/internlm-xcomposer-7b /root/model/Shanghai_AI_Laboratory
cd /root/code/InternLM-XComposer
python examples/web_demo.py  \
    --folder /root/model/Shanghai_AI_Laboratory/internlm-xcomposer-7b \
    --num_gpus 1 \
    --port 6006

lass 'transformers_modules.internlm-xcomposer-7b.modeling_InternLM_XComposer.InternLMXComposerForCausalLM'>
/root/code/InternLM-XComposer/examples/web_demo.py:1068: GradioDeprecationWarning: The `style` method is deprecated. Please set these arguments in the constructor instead.
chat_textbox = gr.Textbox(
Running on local URL: http://0.0.0.0:6006

Could not create share link. Missing file: /root/.local/lib/python3.10/site-packages/gradio/frpc_linux_amd64_v0.2.

Please check your internet connection. This can happen if your antivirus software blocks the download of this file. You can install manually by following these steps:

1. Download this file: https://cdn-media.huggingface.co/frpc-gradio-0.2/frpc_linux_amd64
2. Rename the downloaded file to: frpc_linux_amd64_v0.2
3. Move the file to this location: /root/.local/lib/python3.10/site-packages/gradio

方便复制2：

conda activate internlm-demo

cd /root/code/InternLM

 ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 34887

ssh -CNg -L 6006:127.0.0.1:6006 root@ssh.intern-ai.org.cn -p 34890

bash
conda activate internlm-demo # 首次进入 vscode 会默认是 base 环境，所以首先切换环境
cd /root/code/InternLM
streamlit run web_demo.py --server.address 127.0.0.1 --server.port 6006

按照教程的步骤做，就做出来一个回答问题的机器人。挺好玩的，虽然说话比较慢，但是能写python代码。让它手撕平衡树。

day3的作业：部署一个知识库

整个流程大概是：

下载文本文件，主要是txt和md，作为数据库。

这些数据库来自：xtuner，opencompass，lagent等等。位置在root/data里面。但是对于其中的结构还是不太了解。

接着是，处理数据。包括：获取文件、加载文件、构建向量数据库、开源词向量模型。……

然后把internlm接入langchain中，构建检索问答链，

最后部署web demo，如上面截图。

标签：纯纯,6006,--,demo,day2,internlm,root,ssh
From： https://www.cnblogs.com/cosmowind/p/17959165

07 | Swoole 源码分析之 Channel 通道模块
原文首发链接：Swoole源码分析之Channel通道模块大家好，我是码农先森。引言通道，用于协程间通讯，支持多生产者协程和多消费者协程。底层自动实现了协程的切换和调度。通道与PHP的Array类似，仅占用内存，没有其他额外的资源申请，所有操作均为内存操作，无IO消耗。底层使用......
如何在Windows下启动Koa并隐藏窗口
我打算在本地可以随时打开http://127.0.0.1:3000/这样使用本地的网页程序了。但是通过cmd执行nodeapp.js那个黑色的窗口看着碍眼，于是有了这个教程。要使命令提示符窗口在后台运行且不可见，可以使用VBS脚本（VisualBasicScript）来实现。VBS脚本可以通过Windows脚本宿......
JAVA学习-类型信息.空对象
空对象（NullObject）是一种特殊的对象，它表示一个不引用任何实际对象的对象。在Java中，空对象通常用null表示，它可以赋值给引用类型的变量。空对象在编程中具有一些特点和使用方法，与其他对象进行比较和高级应用。一、特点：1.空对象没有实际的内容或状态，它不指向任何......
JAVA学习-类型信息.instanceof与Class的等价性
Java中的类型信息主要通过instanceof和Class来实现。1.instanceof：instanceof是Java关键字，用于判断某个对象是否是指定类型或其子类型的实例。它的语法如下：objectinstanceoftype其中object表示要判断的对象，type表示要判断的类型。如果object是type类型或其子类型的实例，则......
蓝桥杯备考随手记: 常用的三种排序算法（冒泡排序、插入排序、选择排序）
1.冒泡排序（BubbleSort）冒泡排序是一种简单直观的排序算法，在待排序序列中不断地交换相邻两个元素的位置，通过多次遍历，将最大（或最小）的元素逐渐向右（或左）移动到正确的位置，直到整个序列有序。冒泡排序的基本思想如下：从序列的第一个元素开始，比较相邻两个元素的大小。如果前一个元......
剧本杀小程序开发，门店的新神器！
在数字化浪潮的推动下，线下娱乐形式逐渐与互联网技术融合，其中“剧本杀”作为一种新兴的角色扮演游戏，正吸引着众多年轻人的目光。随着市场需求的不断扩大，不少创业者开始思考如何将这一线下活动通过线上平台进行拓展，而小程序因其便利性和易传播的特点，成为门店数字化转型的首选......
LeetCode 13. 罗马数字转整数
解题思路通过样例我们可以知道，将目标对应值和下一个目标对应值进行比较，如果小于，则sum=sum+目标对应值，如果大于，则sum=sum-目标对应值。最终的sum就是正确答案。相关代码classSolution{public:intromanToInt(strings){unordered_map<char,int>a;......
面试（01）————JVM篇，最大白话的一集，常见概念的讲解以及GC监控调优等等
一、JDK体系结构图二、JVM整体架构三、JVM组成说起JVM组成是什么，我们的第一印象就是堆、栈、方法区、程序计数器等等，但是这样是不对的，真实的JVM的组成由类装载子系统、运行时数据区和字节码执行引擎这三部分组成。而我们之前的回答只是片面的，所以需要留意一下，防止面试......
算法分析与设计——实验1：递归与分治
实验一递归与分治一、实验目的 1、理解分治算法的概念和基本要素； 2、理解递归的概念； 3、掌握设计有效算法的分治策略。二、实验内容和要求实验要求：通过上机实验进行算法实现，保存和打印出程序的运行结果，并结合程序进行......
常见面试算法题-发广播
■ 题目描述某地有N个广播站，站点之间有些有连接，有些没有。有连接的站点在接受到广播后会互相发送。给定一个N*N的二维数组matrix,数组的元素都是字符’0’或者’1’。matrix[i][j]=‘1’,则代表i和j站点之间有连接，matrix[i][j]=‘0’代表没连接，现在要发一条广播，问初始最少......

书生·浦语大模型全链路开源体系——学习笔记day2&day3--纯纯新手入门

相关文章

赞助商

阅读排行