最近在创建一个DEMO,是想实现RAG的。最初是想能够通过向量数据库来作为数据源的保存点的,他比起传统的ES有着很大的优势,比如好的模型生成的文本向量数据之间,如果意思相近,则距离更近,即使没有关键字命中也可以关联到相关的文本。但是,好的中文Text Embedding太难找了,就想着想用ES凑合一下,结果自己蠢了。
要用ES注意三点:
- ElasticSearch 对应mapping中的
field
类型:- keyword:关键字
- text:分词模糊查询
- ES对应的分词器,默认英文是用空格分词的
- 我就是用的 hahaha 和 haha 作为两个文本来查,一直用haha只能查出来一条数据,人都麻了(奇蠢)
- 不要轻易怀疑SpringDataElasticSearch官方接口的权威性
后面的再补充吧,可能标题都会变。
标签:错误,haha,自己,关键字,SpringDataElasticSearch,向量,分词,ES From: https://blog.csdn.net/u011180726/article/details/142142370