首页 > 其他分享 >与 AI 同行,利用 ChatGLM 构建知识图谱

与 AI 同行,利用 ChatGLM 构建知识图谱

时间:2023-07-14 12:34:44浏览次数:41  
标签:实体 AI 图谱 知识 构建 ChatGLM ChatGPT

大家好,我是东方财富的一名算法工程师,这里分享一些利用大模型赋能知识图谱建设的一些实践。

为什么知识图谱需要大模型

在金融场景中,天然会有大量结构化的数据需要投入大量的人力去生产和维护,而这样的数据又会大量被应用在下游的标签、推荐、风控等场景。比如基金关联的基金经理,基金净值,基金重仓股等信息,需要从各个基金公司的公告信息中进行提取。

做个类比,在 1.0 时代,我们会利用大量的规则和人力去提取和校验相应的数据,但这种方法往往需要针对特定的文本内容去维护各自的规则,成本较高。在 2.0 时代我们可以构建相应的深度学习模型,去辅助完成 NER、实体链接等工作。在这个过程中,数据的清洗,标注和训练,往往需要非常专业的标注人员和算法开发参与,而且其准确率需要大量的工作来提高。在大模型时代,我们发现 ChatGPT 能以一个相对非常高的准确率去完成各式各样的任务,这也让我们有一个想法,是否可以利用大模型去辅助我们建设知识图谱(毕竟不是啥业务都上得起大模型,一个图谱能解决下游很多任务)。

通过一些实践发现,ChatGPT 的确可以根据海量文本数据自动生成实体、属性和关系三元组等知识元素,从而快速构建大规模的知识图谱。

利用 ChatGPT 构建知识图谱

社区里已经有不少利用 ChatGPT 甚至 GPT4 构建知识图谱的案例:

假设我们已经在图数据库中建了一些节点,囊括了所以上市公司,我们的目标是想构建一个关于上市公司的知识图谱,包括董事长,上市时间等信息。

这里推荐修改下面的代码,构建相应的知识图谱:https://github.com/cocacola-lab/ChatIE,我们只需将预设的实体类型和关系类型修改成我们需要的种类,就能实现零样本的大规模知识图谱构建,当然能用 GPT4 的话效果更佳。

本地部署的 ChatGLM 方案

考虑到本地部署的数据隐私问题,也可以将 ChatIE 中的 ChatGPT 接口换成 ChatGLM-6B,理论上可以接近 ChatGPT 的效果。

但在实际应用中,我们发现 ChatGLM 虽然具备了一定的内容抽取和链接能力,但是生成内容的可控性较差。

比如我们希望令模型按(实体1,实体2,...)或者 实体1 关系1 实体2 \n这样的格式输出结果,可以在大模型的输入中添加:不要编造答案,并严格按照(实体1,实体2,...)的格式回答,不要有额外内容“ 类似的话。

但往往结果中还是有大量不可控的内容,需要做大量的正则匹配去清洗数据。

在后来的尝试中,我们在 ChatGLM 中前置了两轮对话达到了较好的效果。具体的代码 demo 可以参考
利用 ChatGLM 进行金融知识抽取,具体的效果演示参考下图:

当然这只是一个初级的 demo,后续还有更多利用 ES 和 NebulaGraph 进行校验和应用的代码,欢迎大家进行讨论。

同主题线上分享

如果你对 LLM、知识图谱感兴趣,可以看看同主题的线上分享:和 LLM、图数据库从业者一起夜谈这波 AI 风

标签:实体,AI,图谱,知识,构建,ChatGLM,ChatGPT
From: https://www.cnblogs.com/nebulagraph/p/17553381.html

相关文章

  • java8xiazai
    Java8下载文件在Java8中,文件下载是一个常见的任务。无论是从互联网下载文件还是从本地服务器下载文件,Java8都提供了一些强大的功能来处理这些任务。本文将介绍如何使用Java8来下载文件,并提供一些示例代码来帮助您更好地理解。使用URLConnection下载文件URLConnection是Java......
  • ChatGLM2 部署全过程每一步超详细
    打开autodl,创建实例TeslaT4*1卡使用miniconda镜像。方法一:从huggingface下载这个步骤不稳定我们换种下载方式apt-getupdateaptinstallgit-lfsgitlfsinstallgitclonehttps://huggingface.co/THUDM/chatglm2-6b方法二:去清华云下载模型这个链接只能下载所有的模型......
  • 从硅谷到北京,百位AI大咖连续两天集聚讨论AI智能和实践
    全球AI大咖齐聚北京,探讨人工智能前沿!百位AI大咖倾力出席,冲向AI大浪潮!AI从业者和企业家们,一场引领未来的科技盛宴即将在北京掀起!我们荣幸地宣布,第四届“数据智能创新与实践人工智能大会”将于7月21-22日在北京朝阳悠唐皇冠假日酒店举行。为了满足广大AI从业者和企业家对于人工......
  • 10分钟带你了解AI人工智能机器人技术都有哪些常见种类
    一、什么是人工智能人工智能技术是一种模拟和扩展人类智力的计算机系统和应用程序。它可以学习、理解、推理、适应和自我修复。在当今社会中,人工智能技术已经成为了各行各业的关键技术,如医疗保健、金融、交通、能源等等。除此之外,人工智能技术还可以用于监视和预测自然灾害、提......
  • AIGC:新AI时代,推动数字人进化的引擎
    摘要:CV、NLP、大模型...AI技术的加持下,让数字人内外在更加生动真实。在未来的发展中,数字人的应用场景越来越广泛,并将发挥出重要的作用,让美好照进生活。本文分享自华为云社区《AIGC:新AI时代,推动数字人进化的引擎》,作者:华为云社区精选。现在我们在手机视频里经常看到,几百平方米的......
  • cenots7安装Loki+promtail+grafana
    loki是主服务器,负责存储日志和处理查询promtail是代理,负责收集日志并将其发送给loki Grafana用于UI展示1、官方网站上下载对应的loki和promatail版本包https://github.com/grafana/loki/releases/打开链接后,往下翻 点击Showall56assets后,往下翻,找到对应你操作系统......
  • Certificate Chain of Trust
    WhatistheCertificateChainofTrust?HTTPS详解二:SSL/TLS工作原理和详细握手过程 ......
  • mybaits2
    sql片段标签 映射       ......
  • ai
    https://app.copilothub.ai/chat?id=5323免费使用GPT4,每个月500次,建议使用华为邮箱在网站login,再通过邮箱里的验证链接进入,再创建prompt,信息随便写即可 https://chat.forefront.ai/ https://claude.ai好像要把代理设置成英国或美国Claude重磅升级,免费可用!第一手实测在此,网......
  • Stable Diffusion AI 绘画使用
    界面参数在使用 StableDiffusion 开源 AI 绘画之前,需要了解一下绘画的界面和一些参数的意义目前AI绘画对中文提示词的效果不好,尽量使用英文提示词最主要一些参数如下:Prompt: 正向提示词,也就是 tag,提示词越多,AI 绘图结果会更加精准Negativeprompt: 反向提示词,也就......