首页 > 其他分享 >当 GPT-4 拥有了 Diff 视图,那真的是如虎添翼!

当 GPT-4 拥有了 Diff 视图,那真的是如虎添翼!

时间:2023-08-17 16:37:25浏览次数:38  
标签:task workers 视图 taskQueue GPT Diff GoPool pool

目录

1. 当你要求 GPT-4 帮你写点代码时

如下图所示,我希望 GPT-4 给我的项目 GoPool 添加一个小功能:

这时候 GPT-4 给出的回答如下:

--- 从这里开始 ---


  • 用户希望将任务队列的大小从固定值改为可配置的。
  • 当前的任务队列大小在 NewGoPool 函数中被硬编码为 1e6

为了实现这个需求,我们可以在 goPool 结构体中添加一个新的字段 taskQueueSize,并在 NewGoPool 函数中使用这个字段来初始化 taskQueue。同时,我们需要添加一个新的选项函数 WithTaskQueueSize 来允许用户在创建 GoPool 时设置任务队列的大小。

以下是修改后的代码:

package gopool

import (
	"context"
	"sync"
	"time"
)

// GoPool represents a pool of workers.
type GoPool interface {
	// AddTask adds a task to the pool.
	AddTask(t task)
	// Wait waits for all tasks to be dispatched and completed.
	Wait()
	// Release releases the pool and all its workers.
	Release()
	// GetRunning returns the number of running workers.
	Running() int
	// GetWorkerCount returns the number of workers.
	GetWorkerCount() int
}

// task represents a function that will be executed by a worker.
// It returns a result and an error.
type task func() (interface{}, error)

// goPool represents a pool of workers.
type goPool struct {
	workers     []*worker
	workerStack []int
	maxWorkers  int
	// Set by WithMinWorkers(), used to adjust the number of workers. Default equals to maxWorkers.
	minWorkers int
	// tasks are added to this channel first, then dispatched to workers. Default buffer size is 1 million.
	taskQueue chan task
	// Set by WithTaskQueueSize(), used to set the size of the task queue. Default is 1e6.
	taskQueueSize int
	// Set by WithRetryCount(), used to retry a task when it fails. Default is 0.
	retryCount int
	lock       sync.Locker
	cond       *sync.Cond
	// Set by WithTimeout(), used to set a timeout for a task. Default is 0, which means no timeout.
	timeout time.Duration
	// Set by WithResultCallback(), used to handle the result of a task. Default is nil.
	resultCallback func(interface{})
	// Set by WithErrorCallback(), used to handle the error of a task. Default is nil.
	errorCallback func(error)
	// adjustInterval is the interval to adjust the number of workers. Default is 1 second.
	adjustInterval time.Duration
	ctx            context.Context
	// cancel is used to cancel the context. It is called when Release() is called.
	cancel context.CancelFunc
}

// NewGoPool creates a new pool of workers.
func NewGoPool(maxWorkers int, opts ...Option) GoPool {
	ctx, cancel := context.WithCancel(context.Background())
	pool := &goPool{
		maxWorkers: maxWorkers,
		// Set minWorkers to maxWorkers by default
		minWorkers: maxWorkers,
		// workers and workerStack should be initialized after WithMinWorkers() is called
		workers:        nil,
		workerStack:    nil,
		taskQueue:      nil,
		taskQueueSize:  1e6,
		retryCount:     0,
		lock:           new(sync.Mutex),
		timeout:        0,
		adjustInterval: 1 * time.Second,
		ctx:            ctx,
		cancel:         cancel,
	}
	// Apply options
	for _, opt := range opts {
		opt(pool)
	}

	pool.taskQueue = make(chan task, pool.taskQueueSize)

	pool.workers = make([]*worker, pool.minWorkers)
	pool.workerStack = make([]int, pool.minWorkers)

	if pool.cond == nil {
		pool.cond = sync.NewCond(pool.lock)
	}
	// Create workers with the minimum number. Don't use pushWorker() here.
	for i := 0; i < pool.minWorkers; i++ {
		worker := newWorker()
		pool.workers[i] = worker
		pool.workerStack[i] = i
		worker.start(pool, i)
	}
	go pool.adjustWorkers()
	go pool.dispatch()
	return pool
}
package gopool

import (
	"sync"
	"time"
)

// Option represents an option for the pool.
type Option func(*goPool)

// WithTaskQueueSize sets the size of the task queue for the pool.
func WithTaskQueueSize(size int) Option {
	return func(p *goPool) {
		p.taskQueueSize = size
	}
}

这样,用户就可以在创建 GoPool 时通过 WithTaskQueueSize 函数来设置任务队列的大小了。例如:

pool := gopool.NewGoPool(100, gopool.WithTaskQueueSize(5000))

--- 到这里结束 ---

GPT-4 给出的第一段代码有接近100行,这就让我犯难了,我能猜到这里面只有不到10行是更新的内容,但是我怎么才能直观地看到这10行修改,然后判断这10行修改是否符合我的预期呢?我需要在100行里找出10行然后将其贴到我原先200多行的源文件中合适的位置,这听起来一点也不酷。

行,今天的故事就从“让这件事变酷”开始。

2. 你需要的背景知识都在这里

容我先介绍下 GoPool 的工作原理以及我想要添加的新功能。

2.1 关于 GoPool 和 DevChat

  1. GoPool 是一个高性能,功能完善且简单易用的 Golang worker pool 库;
  2. DevChat 是一个对接了 GPT-4 的 VS Code 辅助编程插件。

2.2 关于 GoPool 的工作原理

GoPool 大概是这样用的:

package main

import (
    "sync"
    "time"

    "github.com/devchat-ai/gopool"
)

func main() {
    pool := gopool.NewGoPool(100)
    defer pool.Release()

    for i := 0; i < 1000; i++ {
        pool.AddTask(func() (interface{}, error){
            time.Sleep(10 * time.Millisecond)
            return nil, nil
        })
    }
    pool.Wait()
}

也就是说你可以通过 GoPool 来创建一个 worker pool,然后向这个 pool 中添加任务,GoPool 会自动将任务分配给 worker 来执行。

在 GoPool 的源码中有一个 goPool 结构体,其中有2个“队列”,分别是表示 “worker 池”的 workers 和表示“任务队列”的 taskQueue

type goPool struct {
	workers     []*worker
    // ......
	// tasks are added to this channel first, then dispatched to workers. Default buffer size is 1 million.
	taskQueue chan task
    // ......
}

当调用 AddTask() 方法的时候,task 会被先加入到 taskQueue 中,然后被 dispatch() 函数取出并分配给 worker 来执行。

2.3 我想要让 taskQueue 的大小可配置

多数情况下被 AddTask() 方法添加到 taskQueue 中的 task 会被很快取出并分配给 worker 来执行,顺利的话 taskQueue 会被快速“消费”。但是如果 task 的执行时间过长,workers 很繁忙,这时候调用方又一直疯狂地“add task”的话,那么 taskQueue 就会被填满,这时候新添加的 task 就会被阻塞。

当然,阻塞本身并没有大问题,疯狂“add task”除了阻塞也没有其他办法(难道丢弃?似乎阻塞相对更合理一些)。这里的问题是如果 taskQueue 过大,会不会占用过多的内存?举个例子,如果 task 比较复杂,那么当 taskQueue 中有100万个 task 时,那么这100万个 task 就可能会占用过多的内存,这或许不是用户期望的结果。

因此我希望用户可以通过类似 WithTaskQueueSize() 的方式来设置 taskQueue 的大小,这样用户就可以根据自己的需求来灵活排队的 task 的数量了。

3. 用 Diff 视图来看 GPT-4 写的新代码

当你看到这局面的时候,是不是感觉有点迷:

这也是我们通过网页版 ChatGPT 写代码的时候会遇到的困境:怎么知道具体改了那几行?

这时我才发现 DevChat 里的 view diff 功能太好用了:

如上图,点一下“View Diff”按钮,这样就知道了 GPT-4 写的代码具体改了哪些地方了。

你还可以通过这个小箭头选择“不接受”某一处修改:

啥意思呢,就是默认情况下点击 “apply diff” 按钮会应用全部的修改,但是如果你不想应用某一处修改,那么你可以点击这个小箭头。

比如图中的场景,GPT-4 给的代码其实只包含涉及更新的一大段代码,后面还有100行没有给出来,所以直接 “apply diff” 就会导致“后面的100行被删掉”。

所以我们先点击下面这个小箭头,然后再点击 “apply diff” 就可以了:

接着你也可以通过 VS Code 的“Source Control”面板来检查下修改:

4. 通过 Diff 内容让 GPT-4 总结 Commit Message

当代码写完后,就到了最考验人的“commit message”编写环节了。别再“update”一个单词走天下了,让 GPT-4 来帮你写吧:

步骤如下:

  1. 可以用 IDE 里的 Source Control 相关插件来“Stage Changes”,也可以通过 git add 命令来手动添加修改;
  2. 然后在 DevChat 窗口里点击“+”,选择“git diff --cached”,这样就能将当前 diff 内容添加到你和 GPT-4 聊天的“上下文”里;
  3. 在 DevChat 里发送 commit_message 命令,接着就能让 GPT-4 基于当前的 diff 内容来生成 commit message 了。如下图:

最后你可以选择直接在 DevChat 窗口里完成 commit,也可以复制这段 commit message 到其他地方进一步编辑,应用:

BTW:这次我提交的代码是:Add configurable task queue size to GoPool

5. 总结

又到一天总结时,今天我们获得的新技能是:

  1. 通过 DevChat 的“View Diff”功能来查看 GPT-4 写的代码具体改了哪些地方;
  2. 将 “git diff --cached” 内容添加到 GPT-4 聊天上下文,可以让 GPT-4 基于当前的 diff 内容来生成 commit message。

打完收工。

标签:task,workers,视图,taskQueue,GPT,Diff,GoPool,pool
From: https://www.cnblogs.com/daniel-hutao/p/devchat-gpt-in-5min-9-diff.html

相关文章

  • 【ChatGPT系列】彻底搞懂软链接
    [本文出自天外归云的博客园]什么是软链接?软链接(SymbolicLink),也称为符号链接或符号连接,是在文件系统中创建的一种特殊文件类型。软链接提供了一个指向另一个文件或目录的引用,类似于快捷方式或别名。与硬链接不同,软链接是一个指向目标文件或目录的路径的文件,而不是目标文件或目......
  • 文心一言 VS 讯飞星火 VS chatgpt (77)-- 算法导论7.3 2题
    二、如果用go语言,在RANDOMIZED-QUICKSORT的运行过程中,在最坏情况下,随机数生成器RANDOM被调用了多少次?在最好情况下呢?以θ符号的形式给出你的答案?文心一言:在RANDOMIZED-QUICKSORT的运行过程中,最坏情况下,随机数生成器RANDOM的调用次数为O(n)。这是因为在最坏情况下,每次分......
  • Chat GPT 大战弱智吧 -3
    话剧篇......
  • 文心一言 VS 讯飞星火 VS chatgpt (77)-- 算法导论7.3 2题
    二、如果用go语言,在RANDOMIZED-QUICKSORT的运行过程中,在最坏情况下,随机数生成器RANDOM被调用了多少次?在最好情况下呢?以θ符号的形式给出你的答案?文心一言:在RANDOMIZED-QUICKSORT的运行过程中,最坏情况下,随机数生成器RANDOM的调用次数为O(n)。这是因为在最坏情况下,每......
  • [GPT] gradio-chatbot 原理及代码解析
     GradioChatBot是一个基于Gradio的聊天机器人,它可以与不同的URL进行对话。其原理是通过将用户输入的文本发送到指定的URL,然后接收并解析URL返回的响应,然后将响应展示给用户。具体来说,GradioChatBot首先会将用户输入的文本作为参数,发送到指定的URL。URL可以是一个自......
  • 通过微软Azure调用GPT的接口API-兼容平替OpenAI官方的注意事项
    众所周知,我们是访问不通OpenAI官方服务的,但是我们可以自己通过代理或者使用第三方代理访问接口现在新出台的规定禁止使用境外的AI大模型接口对境内客户使用,所以我们需要使用国内的大模型接口国内的效果真的很差,现在如果想使用GPT大模型,可以使用微软Azure的OpenAI服务。 负责......
  • DoctorGPT
    DoctorGPT使用LLaMA2作为基座模型,在医疗对话数据上进行了SFT微调,然后通过强化学习(ReinforcementLearning)进一步提升了模型效果。DoctorGPTgithub代码仓库:https://github.com/SpeechOceanTech/DoctorGPTDoctorGPThuggingface模型仓库:https://huggingface.co/llSourcellMac上......
  • 利用GPT打造你的博客|论文的专属讲解员
    文章目录1前言2搭建我的博客问答系统2.1平台介绍(不需要魔法即可访问)2.2前期准备2.3上传博客作为数据集至Dify2.4搭建你的博客回答专员3利用有针对性的GPT帮助我们阅读前沿论文4结语个人博客专属问答员:demo1前言GPT是生成式预训练Transformer的缩写。它是由OpenAI开发的......
  • chatgpt写作机器人项目开发
      最近的新项目ChatGPT问答机器人已经成为了一个备受关注的项目,该项目旨在开发一款能够自动生成文字的人工智能工具,能够帮助用户快速地完成各种写作任务。  ChatGPT写作软件的核心技术是自然语言处理技术和深度学习算法。通过使用这些技术,机器人能够理解用户输入的语句,并......
  • 人工智能chatgpt会员版软件
      ChatGPT问答机器人软件的优势:让你的聊天机器人更智能、更个性化  ChatGPT问答机器人是一款备受瞩目的人工智能聊天机器人,它的强大之处在于它能够根据用户不同的需求,提供个性化的智能回答。而现在,ChatGPT推出了会员版,让用户可以享受到更加智能和个性化的服务。  付......