• 2024-07-25美团一面:如何在 100 亿数据中找到中位数?
     海量数据中找到中位数,内存肯定是无法一次性放下这么多数据的中位数定义:数字排序之后,位于中间的那个数。比如将100亿个数字进行排序,排序之后,位于第50亿个位置的那个数就是中位数。桶排序1)创建多个小文件桶,设定每个桶的取值范围,然后把海量数据元素根据数值分配
  • 2023-11-18自然语言处理预训练——预训练BERT
    原始的BERT有两个版本,其中基本模型有1.1亿个参数,大模型有3.4亿个参数。在预训练BERT之后,我们可以用它来表示单个文本、文本对或其中的任何词元。在实验中,同一个词元在不同的上下文中具有不同的BERT表示。这支持BERT表示是上下文敏感的。
  • 2023-06-12VirusTotal——您身边的企业安全专家
    【本文由CloudAce整理发布。CloudAce是谷歌云全球战略合作伙伴,拥有300多名工程师,也是谷歌最高级别合作伙伴,多次获得GoogleCloud合作伙伴奖。作为谷歌托管服务商,我们提供谷歌云、谷歌地图、谷歌办公套件、谷歌云认证培训服务。】​1、企业的信息安全问题不容忽视Cl
  • 2023-01-05<<Redis 核心技术与实战>> 小记随笔 —— 有一亿个keys要统计,应该用哪种集合?
    聚合统计应用场景统计手机App每天的新增用户数和第二天的留存用户数解决方案由于Set类型可以实现并集、交集、差集等能力。所以设计一个Set存所有的用户Id,并且
  • 2022-11-14Java 几分钟处理完 30 亿个数据?
    1.场景说明现有一个10G文件的数据,里面包含了18-70之间的整数,分别表示18-70岁的人群数量统计。假设年龄范围分布均匀,分别表示系统中所有用户的年龄数,找出重复次数最多
  • 2022-10-09亿个小细节
    啊啊啊,最近老是因为各种小细节与100%失之交臂,今天就来总结一下。DFS、BFS和各种递归型功能函数都要用void要不然用int的话在本地的诡异编辑器会过编译并正常运行,但到了万