Databend 如何利用 GPT-4 进行质量保证

时间：2023-12-06 19:12:30浏览次数：23

标签：Tests SQL 质量保证 Databend 测试 sql GPT

背景

在数据库行业，质量是核心要素。

Databend 的应用场景广泛，特别是在金融相关领域，其查询结果的准确性对用户至关重要。因此，在快速迭代的过程中，如何确保产品质量，成为我们面临的重大挑战。

随着 Databend 开源社区的快速发展，新功能的持续增加和现有功能的优化提出了新的测试挑战。我们致力于在每次代码更新中实施严格的测试，确保稳定性并防止任何潜在问题。

Databend 的测试方法

为了确保软件的稳定性和可靠性，Databend 的测试方法覆盖从代码级到系统级的各个方面。

Unit Tests

单元测试作为测试的基石，着重验证代码的基本功能和逻辑。我们在每次代码提交前自动运行单元测试，确保及时捕捉任何潜在问题。

SQL Logic Tests

Databend 引入了大量的 DuckDB、CockroachDB 和 PostgreSQL 的 SQL 逻辑测试（感谢他们）。这些测试覆盖了广泛的 SQL 场景，帮助我们发现并修复潜在问题，保障 SQL 查询的精确性。

Compatible Tests

兼容性测试确保新版本与旧版本的向后兼容，帮助用户平稳过渡到 Databend 的更新版本，保障业务的连续性和稳定性。

Perf Tests

Databend 使用 ClickBench hits 数据集和 TPCH-SF100 作为性能指标，通过这些测试来确保每个版本的性能都符合预期。

Longrun Tests

Longrun 测试专注于数据写入、更新和合并等操作的长期效果，通过监测 CPU 和内存的稳定性，确保 Databend 的长期运行稳定性和可靠性。

除 Longrun Tests 外，这些测试在每个 GitHub Pull Request 提交时都会执行，以保证任何更改都符合我们的质量标准。

借助 GPT-4 生成测试模型

尽管已经采用了多种测试方法，Databend 团队始终在寻求创新。近期，我们引入了 GPT-4 来进一步提升测试流程。

双缝探测模型

针对涉及核心路径的修改，我们采用双缝探测模型进行验证。这种方法通过比较当前 PR 版本与主分支（main）版本的结果集来进行验证。如果两者结果一致，则可视为无大碍。但这些验证的 SQL 语句的质量至关重要，这正是我们利用 GPT-4 生成的部分。首先，我们指导 GPT-4 根据需求推理出随机数据生成方式，如 setup.sql 所示。然后，基于这些数据，GPT-4 进一步生成用于校验的 SQL 语句，例如 check.sql。这些验证 SQL 语句可以根据不同场景进行调整。接下来，我们在这两个版本的 Databend 上运行这些 SQL 语句，以验证结果集的一致性。

结果集正确性模型

为了确保 Databend 的结果集的正确性，我们选择了 Snowflake 作为参考。这一方法包括三个步骤：

setup.sql： 在 Databend 和 Snowflake 上分别构建表并导入随机数据集。
action.sql：在 Databend 和 Snowflake 上分别执行数据变更操作，如 Replace/Merge 等。
check.sql： 在 Databend 和 Snowflake 上分别执行并验证结果。

这些 SQL 语句都是由 GPT-4 根据 setup.sql 的数据模式生成的，更加复杂和随机，以便更有效地探测潜在的问题。

总结

Databend 团队通过引入 GPT-4，为测试流程带来了显著的进步。我们已在 Databend Wizard 项目中发布了更多测试集：

https://github.com/datafuselabs/wizard

借助这些 GPT-4 生成的测试模型，Databend 的质量和稳定性又前进了一大步，科技是第一生产力。

References

[1] datafuselabs/wizard
[2] Databend
[3] Snowflake

关于 Databend

Databend 是一款开源、弹性、低成本，基于对象存储也可以做实时分析的新式数仓。期待您的关注，一起探索云原生数仓解决方案，打造新一代开源 Data Cloud。

标签：Tests,SQL,质量保证,Databend,测试,sql,GPT
From： https://www.cnblogs.com/databend/p/17880311.html

在科技行业的热门趋势中，你必定无法忽视日益增长的人工智能大模型的影响力。无论是你热
在科技行业的热门趋势中，你必定无法忽视日益增长的人工智能大模型的影响力。无论是你热衷浏览的短视频还是见不得的“AI绘画”，或者是你的朋友圈中充斥的“虚拟试衣”和智能聊天软件ChatGPT，这些都在告诉你，AI大模型正在为日常生活带来革命性的改变。今天，我们就来探讨如何使用AI大模型......
文心一言 VS 讯飞星火 VS chatgpt （130）-- 算法导论11.2 2题
二、用go语言，对于一个用链接法解决冲突的散列表，说明将关键字5,28,19,15,20,33,12,17,10插入到该表中的过程。设该表中有9个槽位，并设其散列函数为h(k)=kmod9。文心一言：在这个问题中，我们使用Go语言来解决一个散列（Hash）表的问题，该问题需要我们使用链接法解决冲突。我们的散列......
ChatGPT全线大崩溃！奥特曼亲自致歉：流量远超预期
OpenAI前脚科技春晚炸翻全球，后脚自家院子却没能守住。原因无他，就是火爆......
文心一言 VS 讯飞星火 VS chatgpt （129）-- 算法导论11.1 4题
四、用go语言，我们希望在一个非常大的数组上，通过利用直接寻址的方式来实现一个字典。开始时该数组中可能包含一些无用信息，但要对整个数组进行初始化是不太实际的，因为该数组的规模太大。请给出在大数组上实现直接寻址字典的方案。每个存储对象占用O(1)空间；SEARCH、INSERT和DELETE操......
爆料！马斯克 xAI 打造的ChatGPT竞品被曝光！
作者|王二狗马斯克旗下公司xAI的第一款AI模型曝光！名为：Grōk ，有望成为ChatGPT最强竞品！Grōk是什么意思呢？二狗我问了一下GPT-4：GrōkAI曝光12项功能这次Grōk模型都曝光了什么内容呢？推特热心网友“小互”帮忙做了一个总结：1.超长prompt（SuperPrompt）：GrōkAI能够处理长达25,000个......
文心一言 VS 讯飞星火 VS chatgpt （150）-- 算法导论12.2 6题
六、用go语言，考虑一棵二叉搜索树T，其关键字互不相同。证明：如果T中一个结点x的右子树为空，且x有一个后继y，那么y一定是x的最底层祖先，并且其左孩子也是x的祖先。(注意到，每个结点都是它自己的祖先。)文心一言，代码正常运行：灵捷3.5。为了证明上述命题，我们需要定义几个......
文心一言 VS 讯飞星火 VS chatgpt （150）-- 算法导论12.2 6题
六、用go语言，考虑一棵二叉搜索树T，其关键字互不相同。证明：如果T中一个结点x的右子树为空，且x有一个后继y，那么y一定是x的最底层祖先，并且其左孩子也是x的祖先。(注意到，每个结点都是它自己的祖先。)文心一言，代码正常运行：灵捷3.5。为了证明上述命题，我们需要定义几个辅助......
百度曾出价 8500 万挖“AI 教父”被拒；GPT-3.5 图灵测试中败给上世纪 AI丨 RTE 开发者
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（RealTimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑......
Unevictable LRU Infrastructure （翻译 by chatgpt）
原文：https://www.kernel.org/doc/html/latest/mm/unevictable-lru.htmlIntroductionThisdocumentdescribestheLinuxmemorymanager's"UnevictableLRU"infrastructureandtheuseofthistomanageseveraltypesof"unevictable"folios......
ChatGPT 同类工具推荐
原文：https://openaigptguide.com/chatgpt-similar%20software/ChatGPT是一款由美国OpenAI公司开发的人工智能语言模型，类似的软件有：火山写作(VolcanoWriting)：它是一款用户友好的写作软件，可以自动生成具有创造性和连贯性的文本。这款软件的功能丰富，支持快速生成文章、段落、句......