首页 > 其他分享 >Snowflake与Databricks:科技巨头之间的激烈竞争

Snowflake与Databricks:科技巨头之间的激烈竞争

时间:2024-08-16 09:22:52浏览次数:15  
标签:微软 AI Databricks 巨头 客户 Snowflake 公司

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

Snowflake公司一直在寻找收购机会,其中一家初创公司Tabular看起来是一项极具潜力的资产,能够帮助这家软件公司在人工智能领域追赶竞争对手。Snowflake为此展开了独家谈判,拟以超过6亿美元的价格收购该公司。

然而,Snowflake的主要竞争对手Databricks突然介入,最终以近20亿美元的价格收购了Tabular。据知情人士透露,这个价格对于一家年收入仅约100万美元的初创公司来说是前所未有的。更令Snowflake尴尬的是,这笔交易恰巧在Snowflake年度大会的开幕主题演讲前宣布,新任CEO斯里达尔·拉马斯瓦米(Sridhar Ramaswamy)的演讲还没开始,Tabular的交易新闻就已经传遍了整个行业。

这场围绕Tabular的争夺战,揭示了科技行业中最激烈的竞争之一。Snowflake和Databricks正在争夺成为组织、分析和利用海量数据以支持AI应用的核心平台的地位。超过四十多名软件供应商的现任或前任员工、客户或合作伙伴参与了这篇报道,他们中的大多数人选择匿名,以避免在这个充满竞争的环境中遭受职业报复。这些员工还描述了一个日益增长的共识,即大型云基础设施提供商,尤其是微软公司,正对他们的业务构成最大威胁。

两家公司都成立于2010年代初期,最初在数据软件领域有各自的细分市场。它们曾相互推荐业务,甚至Databricks的营销团队也使用Snowflake进行数据分析。

但近年来,随着两家公司推出了重叠的产品,这种合作关系开始破裂。Snowflake发展迅速,并在2021年完成了有史以来规模最大的企业软件首次公开募股(IPO)。而如今,Databricks则成为全球估值最高的初创公司之一,市场对其IPO的期待也日益高涨。

曾被视为“小兄弟”的Databricks,现在通过积极的市场营销和销售策略,扮演了公开挑战者的角色。据多位知情人士透露,Databricks内部有一个名为“SnowMelt”的计划,旨在从Snowflake手中夺取业务,尤其是在数据仓库领域。销售人员还能通过将Snowflake客户迁移到Databricks的竞争服务上获得奖金。此外,Databricks的销售人员有时还会为潜在客户提供抵消Snowflake合同费用的积分,或者以大幅折扣争取客户。

Databricks的典型宣传是其平台不仅功能更全面,还能为企业节省更多成本,尤其是在处理复杂的非结构化数据时,Databricks在构建AI模型方面更有优势。销售团队会使用一款程序来估算客户从Snowflake迁移到Databricks后能够节省的金额。

Snowflake方面则声称自己的产品更便宜。“关于成本的说法让我抓狂,”Snowflake的产品负责人Christian Kleinerman在接受采访时表示。“我告诉客户,试试就知道了,去跑个代表性的基准测试。”

Databricks的宣传通过广告广为传播。当参加Snowflake 2023年用户大会的与会者抵达拉斯维加斯时,机场和会场外的广告牌上都写着Databricks的产品比Snowflake便宜九倍。

Databricks的CEO阿里·戈德西(Ali Ghodsi)以言辞激烈的媒体采访和在LinkedIn上发布迁移案例或有利的基准测试结果而闻名。员工们回忆说,他们曾被要求在自己的社交媒体账户上点赞或分享这些帖子。

戈德西在采访中表示,挑战Snowflake帮助提高了Databricks的知名度。“两三年前,选择Snowflake作为数据仓库并不会让人丢掉工作——但我认为现在不再如此。”他说,现在他已经不再专注于将员工的注意力放在Snowflake身上,而是转向推广AI和数据治理等新产品。

尽管很难确定Databricks的成功是否归因于其激进的风格,但无论如何,Databricks的确发展迅速。根据今年6月的投资者演示,其收入增长正在加速。预计到7月,其年化经常性收入将达到24亿美元,其中与Snowflake直接竞争的新仓储产品贡献了超过4亿美元的收入。

Snowflake也没有忽视竞争。公司在过去12个月中报告了30亿美元的年销售额,但其增长速度仅为Databricks的一半左右。Snowflake的首席财务官Mike Scarpelli在采访中表示,公司盈利能力更强。“现实情况是,我们在盈利,而他们在烧钱。他们还能坚持多久?”

无论是Snowflake还是Databricks,都可以用来处理和分析大量数据。例如,一家航空公司可以使用这些工具来分析哪些乘客最有可能根据票价、目的地和天气情况取消航班。这个市场正在快速增长,且并非零和博弈——许多公司同时使用Databricks和Snowflake来处理不同类型的工作,而根据市场研究公司Enterprise Technology Research的数据,仍有无数公司在使用传统工具,这些公司都是这些平台的潜在客户。

今年7月,ETR对同时使用这两款软件的公司进行了调查,结果显示,更多的客户正在将工作负载转移到Databricks上,但绝大多数客户表示他们会继续使用两者。尽管如此,Databricks的首席营收官Ron Gabrisko表示,他预计从长远来看,客户将选择其中一个平台。

“我不知道他为什么如此痴迷于Snowflake,因为我并没有痴迷于Databricks。”Scarpelli在谈到戈德西时说道。

Snowflake作为更成熟的软件供应商,收入更高,言辞上却没有那么激烈。但它也自豪地宣称自己挖走了Databricks的客户,并推出了与Databricks竞争的产品,例如用于数据工程和机器学习的工具。“SparkAttack”是公司内部的一项计划,旨在从Databricks手中夺取机器学习工作流,这个名字则源于戈德西和其他Databricks高管团队创造的“Spark”技术。

Scarpelli还补充道:“他们展示了这些客户——实际上,这些客户几乎都是Snowflake的核心数据仓库客户,并且业务还在我们这里不断增长。”他还指出,“作为一家私营公司,他们可以随便说自己想说的话。”

Snowflake的产品主管Kleinerman表示,Databricks的负面营销提出了诸如成本和产品广度等方面的主张,但这些主张在近年来并不准确。他指出,Snowflake在机器学习、非结构化数据和成本管理等产品领域取得了巨大的进展。

Snowflake主打的卖点之一是易用性,尤其是在公司之间共享数据方面。销售人员经常将该平台比作易于操作的iPhone,而Databricks则被比作高度可定制但有时容易出错的Android系统。两家公司都根据客户的使用量收费,类似于公用事业账单的模式,而不是应用软件中常见的固定费率订阅模式。提供计算能力和存储的云公司,如亚马逊的AWS,也采用这种收费方式。

总部位于加拿大的客户体验公司Bond Brand Loyalty通过将大部分数据工作标准化为Snowflake节省了成本并提高了性能。该公司数据部门负责人Francis Silva表示,由于技术要求较低的用户能够使用Snowflake,而他们无法轻松使用Databricks,这带来了明显的优势。

然而,Snowflake一直处于防守状态。由于华尔街担忧客户削减软件支出,这影响了公司的销售增长,其股价今年下跌了36%。最近,一场针对没有启用多因素身份验证的客户的黑客攻击活动引发了大量负面报道。

拉马斯瓦米,这位前谷歌广告业务负责人于今年2月接任Snowflake CEO,专注于推出新产品。Snowflake的首席财务官Scarpelli表示:“他的到来给公司带来了更多的活力——更强的紧迫感。”

拉马斯瓦米最初是通过2023年Snowflake收购的AI搜索初创公司Neeva加入公司的。据知情人士透露,当时Databricks也曾参与了Neeva的竞购。当拉马斯瓦米成为CEO时,Databricks的戈德西曾在接受彭博电视采访时表示,这与他们施加的压力有关。“我认为我们给了他们很大的压力,”戈德西说道。“Snowflake基本上没有在做任何与AI相关的工作。”

尽管这种竞争引发了人们对早期科技巨头之争的联想,但每家公司面临的最大竞争风险可能来自大型云服务提供商——微软、亚马逊和谷歌。这些巨头已经是数据计算基础层的必需品,如今他们正在改善自己的数据产品,具备了捆绑不同工具并可能以更低价格击败较小供应商的能力。

“我们现在看到的最大竞争对手实际上是谷歌的BigQuery,”Snowflake的Scarpelli说道,并指出微软也是一个正在崛起的威胁。

在Databricks内部,合作竞争的概念越来越常见。该公司与微软的长期合作关系依然紧密——由于通过Azure云服务销售的联合服务,Databricks的大量业务来自于使用微软云基础设施的客户。据知情人士透露,2017年底,微软曾与Databricks讨论过收购事宜。

微软一直在投资其竞争性的数据分析服务,并在去年将其重新命名为“Fabric”。这款软件与Power BI一起销售,后者是许多Databricks和Snowflake客户常用的数据可视化工具。作为全球最大的软件制造商,微软在今年7月的文件中首次将Databricks列为竞争对手。

Databricks产品高级副总裁Adam Conway谈到微软的Fabric时表示:“这是一款相对较新的产品。公开场合我就说到这里。”他还补充道:“我不担心其他公司会在创新方面超越我们。”

尽管合作关系仍然是官方立场,但Databricks似乎正在对微软采取更强硬的态度。今年早些时候,Databricks推出了自己的可视化工具,与Power BI直接竞争。一些销售人员还收到了新的反Fabric的宣传指导,而其他人则在研究类似“SnowMelt”的Fabric竞争代号。正如Databricks员工曾在社交媒体上对Snowflake发起攻击,他们现在也开始对微软发起攻势。上个月,一位主管在LinkedIn上发布了一篇关于Fabric的帖子,类似于过去经典的反Snowflake策略。

一名Databricks员工在LinkedIn上写道:“公告:如果你或你认识的人正在考虑使用Fabric作为数据平台或构建生成式AI应用程序,请务必仔细阅读条款,否则你可能会在某些工作负载上支付三倍的费用。”

标签:微软,AI,Databricks,巨头,客户,Snowflake,公司
From: https://blog.csdn.net/2301_79342058/article/details/141234133

相关文章

  • 苹果新规引发开发者声讨:科技巨头与欧盟《数字市场法》的较量
    本文首发于公众号“AntDream”,欢迎微信搜索“AntDream”或扫描文章底部二维码关注,和我一起每天进步一点点苹果新规引发开发者声讨:科技巨头与欧盟《数字市场法》的较量在科技巨头与监管机构的较量中,苹果公司的最新举措再次成为焦点。面对欧盟《数字市场法》(DMA)的压力,苹果......
  • CF685B Kay and Snowflake
    思路从下往上处理每个子树的重心。对于任意点\(u\),其所在子树的中心一定在\(u\)和\(ans[to]\)之间,\(ans[to]\)是重儿子\(to\)的重心结点。对于任意一点\(u\),其所在子树的重心深度一定不大于\(ans[to]\)。代码假设一个结点\(u\)的子树大小为\(sz[u]\)。对于......
  • 如何使用 Databricks 扩展 YOLOv8 推理
    我已经使用UltralyticsPython包成功训练了YOLOv8模型,现在的目标是对存储在S3存储桶中的1亿张图像进行推理。目前,我有一个具有GPU加速功能的Databricks笔记本,可以执行推理,但我不知道如何扩展它。从Databricks文档中,我了解到使用DatabricksAutoloader从S3......
  • 了解 Databricks 文件系统 (DBFS) 中的文件访问与使用 Python 和 Spark 的卷的比较
    我当前正在尝试从Databricks文件系统(DBFS)读取和显示文件,但遇到了问题。这是我使用的代码:file_path="/dbfs/cluster-logs/use_case/default_job_cluster/cluster_id/init_scripts/cluster_id/20240801_proxy-init.sh.stderr.log"withopen(file_path,'r')asfile:......
  • 英特尔:从硅谷创业到全球科技巨头
    在科技行业,英特尔不仅是一个品牌,更是一种精神的象征。自1968年成立以来,英特尔经历了从初创企业到全球半导体产业领导者的华丽转变,其发展历程是科技创新与市场战略完美结合的典范。本文将深入探讨英特尔的发展历程,包括其初创时期、微处理器时代的到来、技术创新与市场扩张,以及近......
  • 通过 python 连接到 Snowflake 时出错“UnpicklingError: invalid load key, '\x00'
    我在使用snowflake.connector.connect通过python连接到snowflake时遇到以下错误importsnowflake.connector#pipinstallsnowflake-connector-python#iamgettingtheenvfrom.envfileistoredlocallycnx=snowflake.connector.connect(user=os.getenv('USER'),pass......
  • Pandas to_csv 无法附加到 Databricks 云中的文件(OSError Errno 95 不支持操作)
    为什么我无法使用下面的代码覆盖文件?我希望创建文件b.csv,然后附加每次迭代。虽然我给出mode='a'(追加),但不知何故我可能会创建文件但不追加到它。files=dbutils.fs.ls("/mnt/lake/RAW/test/billion-row-ingestion-time/table/")parquet_file_list=[each.pat......
  • 使用snowflake.connector 3.0.3上的密钥对从python连接到snowflake
    我正在尝试使用Snowflake.connector包从我的Python代码连接到Snowflake。不幸的是,由于遗留代码,我只能在python3.7.3上使用Snowflake连接器版本3.0.3,并且无法升级我确实设法从我自己的计算机进行连接,使用:con=Snowflake.connector。连接(...私有密钥文件=......
  • 跳过 Python Spark Pyspark Databricks 未知字段异常中的不良记录
    我想知道是否有人知道如何跳过我们从json文件获取的记录这是错误[UNKNOWN_FIELD_EXCEPTION.NEW_FIELDS_IN_RECORD_WITH_FILE_PATH]在解析过程中遇到未知字段:这是失败的代码sent=spark.readStream.format('cloudFiles')\.option('cloudFiles.format','json')......
  • 使用 python 截断 Databricks 中的增量表
    对于Python和SQL,这里给出了Delta表删除操作,并且给出了使用SQL的截断这里但我找不到Python截断表的文档。如何在Databricks中对增量表执行此操作?HowtodoitfordeltatableinDatabricks?虽然Databricks中没有直接使用PythonAPI截断De......