首页 > 其他分享 >ChatGPT时代原来大佬们最关心的是这些事情

ChatGPT时代原来大佬们最关心的是这些事情

时间:2023-06-10 21:01:18浏览次数:62  
标签:csv 人工智能 词云 words news 关心 import ChatGPT 大佬

ChatGPT时代原来大佬们最关心的是这些事情

前言

随着人工智能技术的发展,聊天机器人越来越智能,越来越能够与人类进行自然的对话。其中,基于GPT模型的ChatGPT是一个非常先进的聊天机器人,它可以根据用户的输入生成流畅、有趣、有逻辑的回复,甚至可以创作诗歌、故事、代码等内容。ChatGPT引起了很多人的关注和兴趣,也引发了很多人的讨论和探索。那么,在ChatGPT时代,大佬们最关心的是什么呢?他们都在和ChatGPT聊些什么呢?有没有什么有趣或有意义的话题呢?

为了回答这些问题,我们利用python的可视化工具,对澎湃新闻中人工智能的数据进行了词云分析,从中挖掘出了一些关键词和热门话题。接下来就看看我们是怎么做的吧!

一、获取热点新闻数据

要制作一个词云分析可视化,首先需要获取一些文本数据。我们可以利用网络爬虫技术,从网上抓取一些人工智能领域最新的时事热点新闻,作为我们的数据源。以下是一个简单的爬虫程序,使用了 python 的 requests 和 BeautifulSoup 库,从澎湃新闻网站上抓取了最近一周的人工智能相关的新闻标题和摘要,并保存到了一个 csv 文件中。

import http.client
import json
from bs4 import BeautifulSoup
import csv

def crawl_news():

   conn = http.client.HTTPSConnection("api.thepaper.cn")

   pageNum = 1 # 初始化页码为1
   pageSize = 10 # 每页数据条数为10
   maxLoops = 20 # 最大循环次数为3
   loopCount = 0 # 当前循环次数为0
   # 创建一个空列表,用于存储新闻数据
   respData = []

   while loopCount < maxLoops:
      payload = json.dumps({
      "word": "人工智能",
      "orderType": 1,#按时间从新到旧
      "pageNum": pageNum,
      "pageSize": pageSize,
      "searchType": 1#按时间排序
      })
      headers = {
      'Pragma': 'no-cache',
      'Cookie': 'acw_tc=ac11000116858486118484123e00ce3d0543219693c94e0300ab0466132c07; ariaDefaultTheme=undefined',
      'User-Agent': 'Apifox/1.0.0 (https://apifox.com)',
      'Content-Type': 'application/json'
      }
      conn.request("POST", "/search/web/news", payload, headers)
      res = conn.getresponse()
      resData = res.read()

      data = json.loads(resData)
      # 处理当前页数据
      for item in data['data']['list']:
         name = BeautifulSoup(item['name'], 'html.parser').get_text().strip()
         summary = BeautifulSoup(item['summary'], 'html.parser').get_text().strip()

         respData.append([name, summary])
      # 更新循环计数器
      loopCount += 1

      # 更新页码
      pageNum += 1

   conn.close()
   # 返回列表
   return respData


all_data = crawl_news()

# 打开一个 csv 文件,用于保存数据
with open('ai_news.csv', 'w', encoding='utf-8', newline='') as f:
    # 创建一个 csv 写入对象
    writer = csv.writer(f)
    # 写入表头
    writer.writerow(['title', 'summary'])
    # 写入数据
    writer.writerows(all_data)

# 关闭文件
f.close()

运行上述代码后,我们就得到了一个名为 ai_news.csv 的文件,里面包含了 140 条人工智能相关的新闻标题和摘要。这些数据就是我们接下来要进行词云分析可视化的原材料。

image-20230604133408348

二、制作可视化词云

要制作一个词云分析可视化,我们需要对文本数据进行一些预处理,比如去除停用词、分词、统计词频等。然后我们可以利用 python 的 wordcloud 和 matplotlib 库,根据词频生成一个词云图,并进行可视化展示。以下是一个简单的词云分析可视化程序,使用了 python 的 jieba, wordcloud 和 matplotlib 库,从 ai_news.csv 文件中读取新闻数据,并生成了一个词云图。

# 导入库
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import csv

# 定义停用词列表
stopwords = ['人工智能', '的', '是', '在', '和', '了', '有', '为', '与', '将', '也', '等', '对', '不', '让', '更', '可以']

# 打开 csv 文件,读取新闻数据
with open('ai_news.csv', 'r', encoding='utf-8') as f:
    # 创建一个 csv 读取对象
    reader = csv.reader(f)
    # 跳过表头
    next(reader)
    # 创建一个空字符串,用于存储所有新闻文本
    text = ''
    # 遍历每条新闻,提取标题和摘要,并拼接到字符串中
    for row in reader:
        title = row[0]
        summary = row[1]
        text += title + summary

# 关闭文件
f.close()

# 对文本进行分词,并去除停用词
words = jieba.cut(text)
words = [word for word in words if word not in stopwords]

# 将分词后的结果转换为字符串,用空格隔开每个词
words = ' '.join(words)

# 创建一个词云对象,并设置参数
wc = WordCloud(font_path='simhei.ttf',
               width=800,
               height=600,
               background_color='white',
               max_words=100)

# 根据文本生成词云图
wc.generate(words)

# 使用 matplotlib 库显示词云图
plt.figure()
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.show()

运行上述代码后,我们就得到了一个类似下图的词云图。从中我们可以看出,在人工智能领域最新的时事热点中,比较突出的关键词有“技术”、“发展”、“创新”、“应用”、“产业”、“数据”、“学习”、“模型”等。这些关键词反映了人工智能领域的发展趋势和研究方向。

大语言模型能力提高,各种AI应用体验和质量会提高,工具也更简单实用。最重要的是学习运用各种AI工具,大幅释放生产力。 想上手使用new bing,了解更多AI技术、应用和ChatGPT进展,欢迎点击如下链接加入 GPT4体验

标签:csv,人工智能,词云,words,news,关心,import,ChatGPT,大佬
From: https://blog.51cto.com/u_13279124/6455566

相关文章

  • ChatGPT是哪家公司开发
    ChatGPT是OpenAI公司开发,ChatGPT是一个原型人工智能聊天机器人,专注于可用性和对话。由OpenAI开发,采用基于GPT-3.5架构的大型语言模型。 我们找到了官方对于这个模型优势解释的paper:使语言模型更大并不能从本质上使它们更好地遵循用户的意图。例如,大型语言模型可能会生......
  • 能让你生活更容易的6个AI组件(除了ChatGPT)
    目录1、Tom:AI驱动的演示构建者2、QuillBot:一个AI工具可以增强你的写作能力3、Descript:更容易的视频与音频的编辑4、BHuman:上规模的AI驱动的个性化视频5、CleanupPictures6、NotionAI:写作更快并且增加你的创造力但是,那不是全部。除了生成文本,NotionAI也是一个强大的编辑器。他......
  • 如何使ChatGPT成为强大的翻译工具​
    ChatGPT有很强大的多种功能,准确的上下文翻译就是其中之一。虽然ChatGPT不是专门为翻译而构建的,但ChatGPT正在迅速成为一种可靠的翻译工具。ChatGPT经过数十种语言的大型文本语料库的培训,并部署在对话界面上,在翻译方面提供了无与伦比的灵活性,远远超过传统翻译工具所能提供的灵活......
  • ChatGPT能否取代传统律师职业?​
    搜狐上看到一个律师事务所写了一篇文章,最终给出的结果“CHATGPT未来可能更多替代的,是刷题出来的知识信息总结与提炼;也就是“解题思维”的律师。但,无法替代律师洞察出案件的输赢关键,更无法替代律师作出决策性的解决方案。”,看看这位律师出了一个什么刁钻的问题,把ChatGPT都绕进去了?我......
  • ChatGPT教我用200行代码写一个简版Vue框架 - OpenTiny
    AI是未来最好的老师最近,我正在准备一份关于Vue基础的学习材料。期间我突发奇想:能否利用现在热门的ChatGPT帮我创建学习内容?其实Vue本身不难学,特别是基础用法,但是,如果你想深入掌握Vue,就要通过阅读Vue的源码来了解其原理。然而,不是每个人都有足够的时间和耐心阅读Vue的......
  • ChatGPT背后技术概述
    ChatGPT背后的技术概述ChatGPT是OpenAI研究院开发的一款基于Transformer的聊天机器人。它运用了自然语言处理和深度学习等技术,可以与人进行自然的对话。自然语言处理(NLP)自然语言处理是一门研究计算机理解、生成和处理人类语言的技术。ChatGPT利用NLP技术来理解用户的输入,并......
  • 文心一言 VS 讯飞星火 VS chatgpt (36)-- 算法导论5.3 6题
    六、请解释如何实现算法PERMUTE-BY-SORTING,以处理两个或更多优先级相同的情形。也就是说,即使有两个或更多优先级相同,你的算法也应该产生一个均匀随机排列。文心一言:算法PERMUTE-BY-SORTING是一种基于排序的随机排列算法,它通过将输入数组中的元素按照优先级排序,然后根据优先级依......
  • 零代码编程:用ChatGPT提取新闻网站上的文本
    现在国内的新闻网站上,乱七八糟的广告和其他不相干内容太多。怎么能批量提取出新闻标题和正文呢?GeneralNewsExtractor(GNE)是一个通用新闻网站正文抽取模块,输入一篇新闻网页的HTML,输出正文内容、标题、作者、发布时间、正文中的图片地址和正文所在的标签源代码。GNE在提取今日头条、......
  • 文心一言 VS 讯飞星火 VS chatgpt (36)-- 算法导论5.3 6题
    六、请解释如何实现算法PERMUTE-BY-SORTING,以处理两个或更多优先级相同的情形。也就是说,即使有两个或更多优先级相同,你的算法也应该产生一个均匀随机排列。文心一言:算法PERMUTE-BY-SORTING是一种基于排序的随机排列算法,它通过将输入数组中的元素按照优先级排序,然后根据优先级......
  • 记者出身的商界大佬
    新浪董事长曹国伟曹国伟毕业于上海复旦大学新闻系,毕业后在上海电视台当了两年记者。然后赴美求学,辗转于奥克拉荷马大学和德州奥斯汀大学,拿到了新闻学硕士和财务专业硕士。1999年9月加入新浪,先后任主管财务的副总裁、首席财务官、首席运营. 农夫山泉董事长钟睒睒......