之前聊过,通过数据活动分析上市公司股价未来趋势期望,这篇主要就头部的安全厂商所属客户和提供的产品服务进行分析。
数据采集&数据清洗
对于此类数据的采集清洗通常都比较头疼,因为信息源分散,格式不统一,清洗难度大,多属于非结构化数据,对后期的分析工作较为困难。
所以采用一种新型的数据采集方式,调用大模型接口进行数据采集,一方面省去大量不同信息源的代码,一方面可以通过大模型的语义转换结构化数据进行清洗。
所以我们只需要写一份代码就可以了。考虑到不同大模型之间的分析能力的差异,我们采用先采集处理清洗,然后汇总聚类分拆进行手工清洗。
具体流程如下图:
接着我们得到这样一张表,3197条数据。
安全建设省份
对所有的建设省份进行去重,生成了这样的词云图。
可以看到目前的安全建设需求主要集中在北京、广东、上海、浙江等地。
涉及产品或者服务
抽取产品或者服务,我们可以清晰的看到,目前这块的主流仍然在网络安全相关,比如一些漏洞扫描、漏洞管理,网络安全态势、网络安全设备等占据较大板块。
我们接着筛选一下包含数据相关的产品或者服务。
数据安全产品或服务
可以看到大多数的数据安全建设是数据安全管控平台,数据安全服务、数据安全风险评估、数据安全管理等。
这些数据虽然没问题,但是从客户分布来讲较为敏感,所以不再深入展开主要客户、活跃区域、厂商产品分析了。
对于前几篇提到的投机,大家可以面向大模型去咨询一下,最近本月上市公司那几家在哐哐招聘数据分析师,那几家做数据治理,数据安全,那几家公司在搞安全防护手段建设。
标签:数据分析,网络安全,厂商,服务,甲方,采集,数据安全,清洗,数据 From: https://blog.csdn.net/u010872591/article/details/144469953