首页 > 其他分享 >评估 ChatGPT 的数据分析改进:交互式表格和图表

评估 ChatGPT 的数据分析改进:交互式表格和图表

时间:2024-07-23 23:55:34浏览次数:18  
标签:数据分析 表格 图表 交互式 ChatGPT 数据

           欢迎来到雲闪世界.2024 年 5 月,随着 GPT-4o 的激动人心的发布,OpenAI 宣布对 ChatGPT 中的数据分析进行改进,包括提供交互式表格和图表,以及与 Google Drive 和 Microsoft OneDrive 的集成。

在本文中,我将评估这些新功能并展望使用 ChatGPT 进行数据分析的未来。

ChatGPT 数据分析简史

ChatGPT 进军数据分析的旅程始于 2023 年 3 月推出的代码解释器,并于 2023 年 7 月向 Plus 用户推出。

后来,OpenAI 将其重新命名为 Advanced Data Analysis,然后是 Data Analysis,现在是Data Analyst,作为官方 GPT 之一。今天,你可以使用这个独立的 Data Analyst GPT 或直接使用提示 ChatGPT 来执行数据分析功能。

ChatGPT 团队创建的 GPT

OpenAI 一直在不断改进这些功能。值得注意的是,它于 2024 年 5 月宣布改进 ChatGPT 中的数据分析,增强了与表格和图表交互的能力。

您可以在这里找到他们最新的帮助中心文章:使用 ChatGPT 进行数据分析

评估最近的聊天GPT数据分析增强功能

在我之前的文章《评估数据科学中的 ChatGPT:以客户流失预测分析为例》中,我介绍了一个使用 ChatGPT 的真实数据科学用例。尽管它提供了快速而合乎逻辑的分析,但我得出的结论是,由于数据准备、数据科学专业知识和业务知识方面的差距,ChatGPT 尚未准备好取代熟练的数据科学家。

在本节中,我将评估最新功能:与 ChatGPT 中的表格和图表进行交互。

1. 加载和预览数据集

让我们从一个实际的例子开始。我将使用Kaggle上一家电子商务公司的交易数据集(CC0 许可证)。假设我是一名销售经理,希望分析此数据集以识别销售增长机会。这是我的提示:

### 背景
我是一家英国电子商务(在线零售)公司的销售经理。
这家位于伦敦的商店自 2007 年以来一直通过网站销售成人和儿童礼品和家居用品。
他们的客户来自世界各地,通常直接为自己购买。
还有一些小企业批量购买并通过零售店渠道卖给其他客户。

### 数据集
我有一个一年的销售交易数据集。
该数据集包含 500K 行和 8 列。
以下是每列的描述。
- TransactionNo(分类):定义每笔交易的六位唯一编号。代码中的字母“C”表示取消。
- 日期(数字):生成每笔交易的日期。
- ProductNo(分类):用于标识特定产品的五位或六位唯一字符。
- 产品(分类):产品/物品名称。
- 价格(数字):每件产品每单位的价格,以英镑(£)为单位。
- 数量(数字):每笔交易每种产品的数量。与取消的交易相关的负值。
- CustomerNo(分类):定义每个客户的五位唯一数字。
- Country(分类):客户所在国家/地区的名称。

数据集中有一小部分订单取消。
这些取消大部分是由于某些产品缺货。
在这种情况下,客户倾向于取消订单,因为他们希望一次性交付所有产品。

### 目标
我的目标是使用此数据集来获取见解并制定销售策略以推动销售增长。
您今天正在协助我分析这个数据集。
请帮我加载数据集。

以前,将数据集上传到 ChatGPT 只会显示一个文件图标。但现在,ChatGPT 创建了一个交互式表格,您可以将其展开到全屏视图以更仔细地查看数据。它还提供建议提示,引导您更深入地了解数据。

上传数据文件后的数据集预览及建议提示

展开为全屏视图的交互式表格

此外,您现在可以从 Google Drive 或 Microsoft OneDrive 上传数据文件到 ChatGPT,从而使文件管理和共享更加容易,尤其是对于团队或企业用户而言。

新的文件上传选项

2. 生成和自定义可视化

接下来,让我们问一个简单但重要的问题:“分析每月的销售趋势”。ChatGPT 生成了一个简单的折线图,我可以扩展它并与之交互。

首先,当您将鼠标悬停在点上时,它会在工具提示中显示值。

交互式折线图示例

其次,您可以通过单击右上角的设置图标来更改线条颜色,并使用您喜欢的配色方案轻松下载 PNG 格式的图表。

调整图表的线条颜色

但是,并非所有可视化类型都受支持。例如,我要求 ChatGPT 在一张图表中绘制月销售额和交易数量。它正确生成了图表,但不是交互式格式。

根据 OpenAI 的帮助中心文章

“目前,大多数情况下只有条形图、饼图、散点图和折线图具有交互性。ChatGPT 可以生成多种非交互式图表,包括:直方图、散点图、箱线图 (Box-and-Whisker Plots)、热图、面积图、雷达图、树形图、气泡图和瀑布图。”

尽管折线图被列为受支持的类型,但更复杂或更细微的折线图(例如带有两个轴)仍然保持静态。

双轴折线图保持静止

3.观察和参考表格

      现在让我们尝试与表格交互。我展开了 ChatGPT 计算的月度销售和交易表,单击第 12 行,并要求 ChatGPT 调查 11 月份的销售激增情况。这是我们在查看业务指标时常见的数据问题。您可以看到聊天中引用了“第 12 行”,这有助于 ChatGPT 了解上下文。它合理地回应了 11 月份最畅销产品的列表及其对激增的假设。

引用表格中的一行
ChatGPT 对 11 月销售激增的回应

您还可以选择一组单元格。例如,我选择了排名前 10 位的产品,并要求 ChatGPT 显示它们的月度销售趋势,以查看它们是否都在 11 月出现了销售高峰。ChatGPT 捕获了 10 种产品的列表,并提供了它们的月度趋势和见解。

引用一组细胞

ChatGPT 对 Top 10 产品月度销量趋势的响应

交互式表格和图表的用例

上面我们测试了 ChatGPT 中与表格和图表交互的新功能。我认为,这次更新主要针对非数据专业人士,降低他们进行数据分析的门槛。

  1. 效率:用户现在可以使用交互式表格以更像 Excel 的方式探索数据,但效率提高了 10 倍。在我的示例中,在 Excel 中创建月度销售趋势图表需要几个步骤 - 创建一个计算销售额(数量 x 价格)的新列,透视表格以按月计算总销售额,然后生成折线图。但现在,您只需与 ChatGPT 交谈即可完成此操作。
  2. 引导分析:建议的提示充当数据分析助手,在用户不确定下一步该怎么做时引导他们更深入地探索数据。
  3. 演示用的视觉效果:自定义可视化功能使非技术利益相关者更容易准备演示用的数据证据来支持他们的业务决策。

ChatGPT 数据分析的发展方向是什么?

那么,您对这些更新有何感想?老实说,尽管取得了进步,但我发现当前的交互有些受限,感觉像是未来更新的 MVP。从字里行间,我感觉 OpenAI 正在瞄准一些雄心勃勃的目标。这是我的大胆猜测:OpenAI 可能正在构建基于对话的商业智能 (BI) 工具。

以下是一些线索:

  1. 产品演进:识别何时输出交互式表格/图表的基础工作已经完成,扩展这些功能是下一个合乎逻辑的步骤。如果他们就此止步,然后说:“是的,线条/条形的颜色是你唯一可以改变的东西。”那我会感到惊讶。

    标签:数据分析,表格,图表,交互式,ChatGPT,数据
    From: https://blog.csdn.net/2401_85233349/article/details/140635108

相关文章

  • 跟着ChatGPT学习设计模式 - 工厂模式
    1.前言在工作过程中,越发觉得设计模式的重要性。经常会有人说工作5年的人,大学生随便培训1-2月也能做同样的工作,没错,大学生的确可以做。但其写的代码,可维护性、可扩展性、添加新功能时方便还是简单。甚至是软实力的表现,如何沟通、如何推进项目进展、如何做项目排期,其实都是应届生......
  • 解锁Nginx日志的宝藏:GoAccess——你的实时、交互式Web日志分析神器!
    在当今数字化的时代,网站的流量和用户行为数据就像是一座蕴藏着无尽秘密的宝藏。而如何有效地挖掘和分析这些数据,成为了许多网站管理者和开发者头疼的问题。GoAccess,一款开源的实时Web日志分析工具,或许能为我们提供一扇窥探这些秘密的窗口。GoAccess:你的流量分析好帮手GoAccess......
  • 数据分析实战 -----美国人口密度
     资源包地址链接:百度网盘请输入提取码 提取码:6666 步骤导入库importnumpyasnpimportpandasaspd首先导入文件,并查看数据样本#州的全称和州名称简写对应关系表abb=pd.read_csv('./data/state-abbrevs.csv')#州的全称和面积表areas=pd.read_csv('......
  • AI盛行的今天还有必要学习数据分析吗?
    1.引言在过去十年中,人工智能(AI)技术以令人瞩目的速度发展,正在深刻改变我们的生活和工作方式。无论是自动驾驶汽车、智能家居,还是AI医疗诊断和金融市场预测,AI技术都在各个领域展现出强大的影响力。特别是在中国,AI技术的研究和应用取得了显著进展,政府和企业的高度重视使得中......
  • 哔哩哔哩_B站_Bilibili视频弹幕爬取与数据分析python
    ​B站弹幕爬取与数据分析一、项目背景在互联网时代,用户生成内容(UGC)成为了研究社交行为和文化趋势的重要数据来源。B站(哔哩哔哩)作为一个主要的弹幕视频分享平台,聚集了大量的用户评论和互动数据。弹幕作为一种实时的用户反馈形式,具有即时性和高互动性的特点,为数据分析提供了丰富......
  • 嵌入式C++、STM32F103、MQTT、InfluxDB存储和Grafana可视化:工厂设备的实时监控和数据
    1.项目概述随着工业4.0的推进,智能制造已成为制造业发展的必然趋势。本文介绍了一套基于STM32和MQTT协议的小型工厂设备监控系统,可实现对工厂设备的实时监控和数据分析,有效提高生产效率和安全性。系统主要包括三个部分:设备端:使用STM32MCU连接各种传感器,采集设备运行......
  • 【大模型教程】用大模型做数据分析,可视化,仅需一键
    最近在外面冲浪看到@eviljer分享了DeepSeekCoder一步到位做数据分析的玩法。我复刻后试了一下,确实很爽只需要塞进去excel,告诉它分析哪些指标,自动生成代码,自动执行,输出可视化图表。原文使用DeepSeek官方API,我冲了1元钱,跑一次只需要花费1分钱如果一分钱都不......
  • Pandas数据分析与处理
    Pandas主要有三种数据结构。1)Series,带标签的一维数组。2)Dataframe,带标签且大小可变的二维表格结构。3)Panel,带标签且大小可变的三维数组。本次主要总结的是pandas用于操作Dataframe的相关操作。一、导入扩展库numpy和pandas,按照Python社区的惯例,在导入扩展库numpy时会起一个......
  • 文心一言 VS 讯飞星火 VS chatgpt (307)-- 算法导论22.2 5题
    五、证明:在广度优先搜索算法里,赋给结点u的u.d值与结点在邻接链表里出现的次序无关。使用图22-3作为例子,证明:BFS所计算出的广度优先树可以因邻接链表中的次序不同而不同。如果要写代码,请用go语言。文心一言:首先,我们来证明在广度优先搜索(BFS)算法中,赋给结点$u$的......
  • Milvus 实践(1) --- 文本-图片交互式search搭建及原理
    目录背景训练素材downloadtorchvision简介python代码执行结果模型训练模型训练参数训练模型注意事项模型加载录入vectorDB使用预加载的模型参数对图片进行编码录入milvus查询效果查询编码milvussearch模型适用列表总结背景应该说Milvus在2.4以上版......