首页 > 数据库 >向量数据库和异常数据

向量数据库和异常数据

时间:2024-08-12 20:38:07浏览次数:8  
标签:存储 数据库 学习 量化 异常 向量 进行

书接上文:https://www.cnblogs.com/k4n5ha0/p/18314781

最近学习机器学习期间,了解到了向量数据库:

1)可以将文本向量化存储(如上图,将不同语句向量化)

2)在 检索向量的时间复杂  和  对比向量相似度的时间复杂度(例如余弦相似度)充分调优

3)可以调用TPU、GPU等硬件加速运算

4)高度适配向量所以性能明显好于某些插件化支持向量的数据库

 

所以对上文的设计可以进一步的优化:

1)构建一组安全正则表达式,用户可以根据业务场景选择匹配业务且安全的正则表达式,此类业务数据不再进行存储以及自学习

2)可以对输入值选择“向量判断”选项,选择此选项后网关对该值不再进行正则判定,而进行向量化判定

3)定期搜集、维护、构造各类攻击代码并进行预处理(降噪):

  2.1)例如SQL注入需要进行语义处理,去掉注释、异常ASCII、多余的空白字符等并进行格式化后再存储为向量

  2.2)XSS进行语义处理,分析html标签、标签属性等进行格式化后存储为向量

  2.3)其他log4j、spring4shell、fastjson等恶意poc也进行单独向量化存储

  2.4)此类向量记录为denyVector

4)在网关1~2周学习期间:

  3.1)启动waf产品将业务数据先过滤

  3.2)降噪(上一条(2)中的预处理过程)

  3.3)去重

  3.4)最后向量化存储,此类向量记录为allowVector

5)学习结束后,对“向量判断”的业务输入进行判断,向量相似性通过计算与 denyVector 和 allowVector 的距离判断是否为恶意请求

标签:存储,数据库,学习,量化,异常,向量,进行
From: https://www.cnblogs.com/k4n5ha0/p/18355705

相关文章

  • 词向量的转换理解以及与真实的关系
     实际上就是去除该矩阵的某一行。该矩阵实际上就是一个有N个词的300维向量,或者说该矩阵就是一个完整的词向量词汇表。而这个词汇表是通过交叉熵损失最小来构造的。即归根到底是“在特定语料库中(包含context中共现概率),以数学方法计算输入产生哪些输出”最复合“实际情况,即语料......
  • 你敢相信,我5分钟做了模式植物的GO和KEGG富集分析,并创建了orgDb数据库
    原文教程:我5分钟做了模式植物的GO和KEGG富集分析,并创建了orgDb数据库一边学习,一边总结,一边分享!本期教程获得本教程DataandCode,请在后台回复:20240811。2022年教程总汇2023年教程总汇写在前面我们在前面的教程分享了模式植物构建orgDb数据库|以org.Slycompe......
  • mysql数据库:使用Python操作MySQL
    mysql数据库:使用Python操作MySQL安装第三方模块pymysqlpipinstallpymysql操作MySQLimportpymysql#创建连接#需要传入一些参数:#hostmysql所在的主机名或者是域名或者是ip地址#portmysql运行的端口号#ps-aux|grepmysql找到MySQL运行的进程......
  • 达梦数据库系列—46.DMHS实现DM8到DM8的同步
    目录DMHS实现DM8到DM8的同步1、准备介质2、安装图形化安装静默方式安装3、准备DM8数据库软件安装数据库创建打开归档开启附加日志创建辅助表创建连接用户创建测试用户和表4、同步配置修改服务配置双向同步配置单向同步配置5、启动DMHS服务装载字典启动cpt......
  • 达梦数据库系列—47.DMHS实现Oracle12C到DM8的同步
    目录1、准备介质2、安装3、准备源端Oracle和目标端DM8软件安装数据库创建打开归档开启附加日志创建辅助表Oracle端安装ODBC创建连接用户创建测试用户和表4、同步配置修改服务配置Oracle到Dm单向同步配置Dm到Oracle单向同步配置5、启动DMHS服务初始装载装载数......
  • JSP广州中小学学校信息管理系统_j3o8r(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表系统功能:用户,区域分类,招生信息,机构活动,成绩排名,获奖排名,社团排名,特色排名开题报告内容一、项目背景与意义随着教育信息化步伐的加快,广州作为教育强市,对......
  • 【YashanDB数据库】YAS-02024 lock wait timeout, wait time 0 milliseconds
    【标题】错误码处理【问题分类】锁等待超时【关键字】YAS-02024【问题描述】执行语句时候,因锁等待超时执行语句失败【问题原因分析】数据库默认锁等待时间为0秒,如果执行语句存在锁等待过长会执行失败【解决/规避方法】调整锁等待的时间altersystemsetDDL_LOCK_TIMEOUT=......
  • 使用orcale数据库的springboot项目打war包部署到tomcat后启动报错解决办法(缺少UCP数据
    我将在我本丢运行ok的springboot项目打成war包后部署到tomcat后,启动tomcat的时候一直显示:由于之前的错误,Context[/ruoyi]启动失败......,查看tomcat的日志文件发现报错:12-Aug-202410:20:35.183严重[main]org.apache.catalina.core.StandardContext.listenerStart配置应用......
  • 单片机的异常定位方案,采用axf文件定位的办法
    【STM32F303开发】+使用fromelf反汇编keil生成的AXF文件 【STM32F303开发】+使用fromelf反汇编keil生成的AXF文件(stmicroelectronics.cn)【STM32F303开发】+如何找到导致程序出现HardFault的代码【STM32F303开发】+如何找到导致程序出现HardFault的代码-STM32团队ST意法......
  • Springboot计算机毕业设计广金考研助力系统(程序+源码+数据库)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表学生,学长,学校百科,考研全知道,学长学姐说,身份认证,分类,寻研友,每日打卡开题报告内容一、研究背景与意义1.1研究背景随着社会的快速发展和高等教育的普及......