首页 > 其他分享 >2023 re:Invent 用 Amazon Q 打造你的知识库

2023 re:Invent 用 Amazon Q 打造你的知识库

时间:2024-02-26 11:35:09浏览次数:15  
标签:索引 数据源 生成式 Invent re Amazon 文档 rust

image.png

前言

随着 ChatGPT 的问世,我们迎来了许多创新和变革的机会。一年一度的亚马逊云科技大会 re:Invent 也带来了许多前言的技术,其中 Amazon CEO Adam Selipsky 在 2023 re:Invent 大会中介绍 Amazon Q 让我印象深刻,这预示着生成式 AI 的又一个里程碑。

亚马逊云科技开发者社区为开发者们提供全球的开发技术资源。这里有技术文档、开发案例、技术专栏、培训视频、活动与竞赛等。帮助中国开发者对接世界最前沿技术,观点,和项目,并将中国优秀开发者或技术推荐给全球云社区。如果你还没有关注/收藏,看到这里请一定不要匆匆划过,点这里让它成为你的技术宝库!

在本文中,我们将探讨 Amazon Q 是什么以及它能为我们做些什么。我们还将详细介绍如何使用 Amazon Q 来构建知识库,并分享一些实际案例。无论是个人学习,还是团队协作,Amazon Q 都将是您的理想之选。

让我们一起深入了解 Amazon Q,并探索如何在知识库建设中充分发挥其潜力。

Amazon Q 是什么

Amazon Q 是一款基于生成式人工智能的助手,通过连接如代码仓库、网址、数据库、文档、email 等各种信息库来帮助企业或者个人以自然语言对话的方式,提供历史数据检索、摘要生成、内容撰写等。

Amazon Q 与通用生成式 AI 的区别

通用的生成式 AI 最大问题在于内容来源于互联网的公开数据,无法针对特定的数据源进行训练,比如无法跟企业内部数据,业务相结合,也无法满足个人的个性化需求,记得当时玩 ChatGPT 遇到最大的问题在于数据源的限制,为了让 ChatGPT 学习某个特定的技能,需要将内容拆分再提供给 ChatGPT 学习,这大大限制了生成式 AI 的能力。因此 Amazon Q 较 ChatGPT 而言有以下优势:

  • 与特定业务相结合;

  • 支持多种数据源;

  • 将权限引入生成式 AI 中,在企业中可以根据组织架构对人员设置不同的访问权限;

  • 使用 Amazon Kendra 可以将已训练完成的数据源进行共享,大大缩短训练时间。

接下来我们用 Amazon Q 打造一个 Rust 知识库。

用 Amazon Q 打造知识库

第一步

打开 Amazon Q 登录或创建账号,进入如下页面。在页面的开头就清晰描述 Amazon Q 的工作方式。点击【Create Application】,填写 Application 基本信息,点击【Create】进入下一步。

image.png

第二步

为应用程序选择索引器。有以下两种索引器:

  • native retriever

  • existing retriever

很遗憾,未能从官方文档中了解到这两种索引器的使用场景。但经过操作发现,native retriever 只能在当前应用下使用,existing retriever 一旦创建可以被多个应用使用。第一次使用我选择了 native retriever。

image.png

第三步

添加数据源,Amazon Q 提供了多种数据源,我选了其中的 Web crawler ,填写数据源名称、url 等关键信息。其他信息按照提示填写。特别注意 Sync scope,尽可能缩小范围,避免爬取诸多无用的页面,进而影响索引速度和内容相关性。

image.png

第四步

点击【Sync now】后,需完成两个步骤:

  1. 抓取页面内容

  2. 为页面创建索引

网页数量越多,完成以上两步的时间就越久。

比较耗时的步骤在于创建索引。所以尽可能缩小爬取范围。其中:

image.png

第五步

点击【Preview web experience】进行预览,将会打开一个对话界面进行测试。也可以通过最后一步使用 IAM 集成符合 SAML 2.0 的外部身份提供商 (IdP) 的方式进行部署对外通过访问。

image.png

测试结果如下,确实如官方文档所言目前仅支持对英文文档进行索引,虽然能用多种语言进行对话,但英语对话的效果最佳。

image.png

总结

Amazon Q 旨在改变企业与数据交互的方式。该可以帮助用户解答特定于业务的问题,而不需要手动搜索。Amazon Q 可以通过亚马逊云科技管理控制台、公司文档页面、Slack 等多个渠道访问,并保证数据隐私和安全。

想象在公司内的几个场景:

  • 一个新人,想要了解公司的业务

  • A 项目现在谁负责,都有谁参与

  • A 项目 B 业务板块怎么操作,文档在哪

  • ……

当有了 Amazon Q 这一切都会发生改变,我们期待的未来已来~

本文参与了「构」向云端 | 亚马逊云科技 x 思否 2023 re:Invent 构建者征文大赛 ,欢迎正在阅读的你也加入。

授权声明:本篇文章授权活动官方亚马逊云科技文章转发、改写权,包括不限于在 Developer Centre,知乎,自媒体平台,第三方开发者媒体等亚马逊云科技官方渠道

文章来源:https://dev.amazoncloud.cn/column/article/658986055d096603bb18c78d?sc_medium=regulartraffic&sc_campaign=crossplatform&sc_channel=bokey

 

标签:索引,数据源,生成式,Invent,re,Amazon,文档,rust
From: https://www.cnblogs.com/AmazonwebService/p/18033932

相关文章

  • 多线程系列(九) -ReentrantLock常用方法详解
    一、简介在上一篇文章中,我们介绍了ReentrantLock类的一些基本用法,今天我们重点来介绍一下ReentrantLock其它的常用方法,以便对ReentrantLock类的使用有更深入的理解。二、常用方法介绍2.1、构造方法ReentrantLock类有两个构造方法,核心源码内容如下:/***默认创建非公平锁*/......
  • 【Gorm 错误收集】Error 1215 (HY000): Cannot add foreign key constraint
    错误:Error1215(HY000):Cannotaddforeignkeyconstraint相关mysql错误:Error1215(HY000):Cannotaddforeignkeyconstraint。场景:为了方便测试人员测试产品的功能以及后续报告,PM设计了一个测试用例的功能,用于记录需要测试的产品的操作步骤。针对这个功能,我建立......
  • redis-深入分析redis之listpack,取代ziplist?
    ziplist的不足主要在于当ziplist中元素个数过多,它的查找效率就会降低。而且如果在ziplist里新增或修改数据,ziplist占用的内存空间还需要重新分配;更糟糕的是,ziplist新增某个元素或修改某个元素时,可能会导致后续元素的prevlen占用空间都发生变化,从而引起连锁更新问题,导致......
  • Re: End of a Dream
    根据之前我的进度,时间根本来不及,并且根据之前计划完成度,我的计划可能较之前的计划略显宽松,但是较现状较为紧密。目前进度较预期靠后,所以后期可能会出现极端情况。而我会根据补题与计划的冲突情况,稍变动每天的计划。(大多数情况其实根本不管/tx)使用表格过于极端,所以直接用文字。c......
  • C++ GDAL用CreateCopy()新建栅格并修改波段的个数
      本文介绍基于C++语言GDAL库,为CreateCopy()函数创建的栅格图像添加更多波段的方法。  在C++语言的GDAL库中,我们可以基于CreateCopy()函数与Create()函数创建新的栅格图像文件。其中,CreateCopy()函数需要基于一个已有的栅格图像文件作为模板,将模板文件的各项属性信息(例如空间......
  • vue init webpack 和vue create的几点区别
    vueinitwebpack和vuecreate的几点区别:https://blog.csdn.net/xilejie/article/details/130061075?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170891269616800184194526%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request......
  • DataStream API(三)
    DataStreamAPI(三)目录5.3.4物理分区(PhysicalPartitioning)5.4输出算子(Sink)5.4.1连接到外部系统 5.4.2输出到文件5.4.3输出到Kafka5.4.4 输出到MySQL(JDBC)5.4.5 自定义Sink输出5.5本章总结5.3.4物理分区(PhysicalPartitioning)防止数据倾斜,保证各个分......
  • [oeasy]python0008_输出h字符_REPL_引号_括号_什么是函数
    输出h字符_REPL_引号_括号_什么是函数......
  • [超实用插件]在Visual Studio中查看EF Core查询计划
    前言EFCore是我们.NET开发中比较常用的一款ORM框架,今天我们分享一款可以直接在VisualStudio中查看EFCore查询计划调试器可视化工具(帮助开发者分析和优化数据库查询性能):EFCore.Visualizer。值得推荐的.NETORM框架对于还不知道怎么选择.NETORM框架的同学可以看下面这两篇文......
  • SpringBoot:通过实现自定义接口获取实现类的@RequestMapping注解请求路径
    1.自定义接口//什么都不用写,就定义一个空接口publicinterfaceMyMark{}2.Controller接口类实现自定义接口@RestControllerpublicclassDayControllerimplementsMyMark{@RequestMapping("/day1")publicStringget1(){return"day1";}......