首页 > 其他分享 >天壤小白v1.1.0版本上线,超实用的大模型文档集功能优化Tips,快来一探究竟!

天壤小白v1.1.0版本上线,超实用的大模型文档集功能优化Tips,快来一探究竟!

时间:2023-08-10 18:57:37浏览次数:43  
标签:模型 支持 v1.1 小白 文档 应用 Tips 天壤

Hi!小白的用户伙伴们,你们好!

上月,「天壤小白」大模型产品三件套首次亮相2023WAIC。其中,应用开发平台最具特点的文档集功能,集成大模型强大的语义理解和推理技术,不仅有效破解大模型“幻觉”,还助力天壤快速适配企业需求,发布20+企业级智能应用。

今天,天壤小白v1.1.0版本上线!除了「模型版本」的升级外,我们针对「文档集」功能做了更多增强优化,希望能够帮助大家更高效地管理和分析各类文档,提升大模型输出内容质量,从而快速和准确地获取和应用知识信息。

 

1、模型更新

我们针对不同成本的小白大模型均进行了迭代升级:1、支持更长的文本输入(3K);2、优化了训练数据质量,提示模型效果。

模型版本:xiaobai-001 、xiaobai-001-small 、xiaobai-001-tiny。

2、功能更新

(1)支持添加结构化文档

我们新增了「结构化文档」功能,并支持多种格式文件的自动解析,如excel,csv,jsonl等,满足更多类型的文档需求和功能应用开发,帮助你更好地提取、定位和汇总信息。

平台上传文档类型包含:xls, xlsx, csv, jsonl, pdf, html, htm, md, markdown, txt, doc, docx, jpg, jpeg, png, bmp, gif, tif, xls, xlsx, csv, jsonl。

(2)支持上传图片和自动OCR处理识别所有文字

 如果你想要提取和处理图片中的文字,或是解析一份包含图片的PDF报告,我们提供具有高准确率的OCR技术,能够自动识别大量图片中的文字。同时,支持多种语言的识别,包含中文、英文、日语等,帮您节省大量时间的同时,避免人工输入可能出现错误。

处理文档类型:txt、doc、xls、xlsx、pdf、jpg、png等常见文本、图片文件。

(3)支持从URL下载文档,获取文档更快捷

当你想要获取某网站的精彩信息,平台为你提供更加便捷、高效、安全的方式。无需安装任何插件,只要打开浏览器,输入网址信息,即可轻松地从URL获取文档,方便更好地工作和学习。

(4)支持设置字段类型以及选择是否加入语义索引

若你的文档包含多个字段类型,你可以根据需求选择一个或多个不同字段进行文本的分析和处理;相比此前默认分片储存的方式,基于字段的文档分类、字符分割将更清晰合理。同时选择加入语义搜索,使文档的提问和回答更完整。

3、应用配置更新

(1)选择结构化文档集时,支持设置召回字段

我们支持上传结构化文档,并提供更明确的文本分类。当你创建应用时,可将选择的字段内容作为上下文输入,也可以直接用作搜索内容。这样一来,系统就可以召回与之强匹配的原始片段内容,或基于大模型生成更准确的回答。

(2)自定义上下文提示词模版,根据应用需求去调整

如果你有其他应用需求,我们也支持你根据自己的需求进行提示词的优化和定义,自行调整提示词模版,使模型输出的文本更符合你的要求和预期。

示例教程 

接下来,我们将为您展示几个完整的操作示例:

1、如何创建一个结构化文档

2、如何基于文档创建应用

3、如何识别一个图片文件

4、如何通过URL下载文档

以上就是本次版本更新的全部内容啦。如有任何疑问,可从微信后台加入社群,我们将为您解答!

我们将不定期更新关于产品的教程和学习视频,帮助大家快速玩转天壤小白开放平台!

 

标签:模型,支持,v1.1,小白,文档,应用,Tips,天壤
From: https://www.cnblogs.com/tianrang/p/17621239.html

相关文章

  • H7-TOOL的高速DAPLINK用于新版STM32CubeIDE V1.13及其以上版本的超简单实现方法(2023-0
    之前分享了一个方法,太繁琐了,H7-TOOL群的群友提供了一个方法,实现非常简单。1、使用STM32CubeMX或者自己创建一个STM32CubeIDE工程后,设置这两个地方即可: 配置调试器,设置完毕记得点击右下角的Apply2、然后修改这个cfg文件,F407IGTDebug.cfg,注意和第1步cfg是一个文件。修改......
  • 神秘的 tips
    command_block'stips证明:找比较显然的,不要找那些坚涩分散的东西。资源:博客、目录。查别人水表,翻找那些博客。题:推荐ATC物美价廉,还可以问LGJ,要。学习方法:慢慢想or像我一样天天贺题,积累tricks可以薄纱别人。想题方法可以慢慢培养。停课:三周以上保证睡午觉,三周以下一般......
  • Tips(烂笔头3)
    摘要:telnet;1、当telnet某站点或者ip加端口号出现Escapecharacteris'^]'就说明连接对端的端口成功了。[root@k8s-node03~]#nc-l-p6996Escapecharacteris‘^]’.只是一个提示,提示使用Ctrl键+]键可以呼出telnet的命令行。[root@k8s-master03~]#telnet192.168.31.2......
  • [Docker] Docker Node.js project tips
    BasicnodeimageFROMnode:12-stretchCOPYindex.jsindex.jsCMD["node","index.js"]Builddockerimage:dockerbuild-tmy-node-app.--initdockerrunmy-node-app,afterdockerisrunning,youpressCTRL+C,itdoesn'texit......
  • Visual Studio 调试技巧[Command Window & Immediate Window ](Tips)
    VisualStudio调试技巧[CommandWindow&ImmediateWindow](Tips)1.immediatewindow定义的一些alias(//z2012-3-1314:04:44PMIS2120alias?Debug.Printalias??Debug.QuickWatchaliasAddProjFile.AddNewProjectaliasaliasTools.Al......
  • 绕过杀软NetUser的小tips
    在拿了shell上线了的情况下,通过netuseradd新建用户经常会被杀软拦截拒绝访问,以比较常用的火绒和360为例,简单说一下绕过的小tips某绒可以看到通过netuser命令新建用户,火绒拦了,检测的是cmd.exe去执行C:\Windows\System32\net.exe把C:\Windows\System32\net.exe复制出来放到别......
  • web前端tips:js继承——原型链继承
    原型链继承原型链继承是JavaScript中实现继承的一种方式,它通过使用原型来实现对象之间的继承关系。在JavaScript中,每个对象都有一个原型(prototype),它是一个指向另一个对象的引用。当我们访问一个对象的属性时,如果该对象自身没有该属性,则会去它的原型上查找,如果原型上也没有,则......
  • qForms tips
    官方教程http://www.pengoworks.com/qforms/docs/index.htm1set和getform中的field的代码本来obj.fieldName.getValue()可以用来获取form中某个field的值,用obj.fieldName.setValue()可以用来设置form中某个field的值。如js为:functiontestqForm(){alert(wfqForm.tex......
  • nginx反代配置tips
    nginx轮训导致验证码不正确在upstream里添加ip_hash;,例子:http{upstreamtest{#这样同一台电脑会一直访问到同一台机器ip_hash;server172.0.0.1:8080;}}静态资源访问出错在location里重写header:server{location/{......
  • 【Tips】克隆网站为单个HTML文件、将一个完整的页面保存到单个 HTML 文件中
    ProjectonGitHub:https://github.com/gildas-lormeau/SingleFileChrome插件市场https://chrome.google.com/webstore/detail/singlefile/mpiodijhokgodhhofbcjdecpffjipkle ......