首页 > 其他分享 >对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键

对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键

时间:2023-08-29 21:38:43浏览次数:42  
标签:开发人员 人工智能 肖恩 Mullaney 搜索引擎 搜索 Algolia 查询

原创 | 文 BFT机器人

对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键_人工智能


人物背景

Character Background

Sean Mullaney是Algolia(端到端人工智能搜索和发现平台)的首席技术官,也是前 Stripe和谷歌高管,拥有扩展工程组织、开发人工智能驱动的搜索和发现工具以及在全球范围内发展API优先解决方案的背景。

在Algolia,他负责监督仅次于谷歌的第二大搜索引擎背后的技术,该引擎每年的搜索量超过1.5万亿次。最近,他领导公司推出了AlgoliaNuralSearc一一世界上最快的、超可扩展且经济高效的矢量和关键字搜索API。


对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键_搜索_02


兴趣萌芽

Budding Interests

采访者:计算机科学最初吸引你的地方是什么?

Sean Mullaney:我10岁的时候,父母给家里买了第一台电脑。我想做的第一件事就是弄清楚如何编写一款我从书上抄下来的文字冒险游戏。几年后,我开始学习 c++,但作为一个刚刚开始探索计算机科学的青少年,对于设计和制作电脑游戏的兴趣还是比较大。


经验历程

Experience History

采访者:你在谷歌工作了7年多,在那里你帮助建立并领导了战略、运营、大数据和机器学习方面的团队。你最喜欢的项目是什么?你从这个经历中学到了什么?

Sean Mullaney我们弄清楚了如何利用我们拥有的关于广告商如何使用我们的产品来帮助销售团队的大数据。我们编写开发的自定义规则(后来更复杂的神经网络)来预测应该在什么时闻用什么产品接触哪些客户,从而最大限度地提高销售人员的时间并带来可观的收入。谷歌上有超过100万的广告商,这个工具极大地帮助销售团队在大海捞针。


Algolia的存在价值

Algolia Existence Value

采访者:在最近的DevBit总结中,你描述了Algolia的目的是让用户能够索引世界并将内容运转起来,能详细解释一下这句话是什么意思吗?

Sean Mullaney:最终,我们希望帮助我们的客户从他们的数据中获得价值。互联网创造了大量的内容和电子商务产品,虽然这一发展是一个重要的里程碑,但现在大量的信息意味着,作为用户,找到你真正想要的东西比以往任何时候都要困难。然而,当搜索和发现由人工智能驱动时,可以智能地访问不断增长的内容列表,并将其付诸行动,真正帮助用户,而不仅仅是压倒他们。


NeuralSearch技术介绍

Technical Introduction


采访者:2022年9月,Search.io及其专有旗舰产品NeuralSearch™被Algolia收购,您能讨论一下这项搜索技术具体是什么吗?

Sean Mullaney简而言之,Algolia NeuralSearch将关键字匹配与基于向量的自然语言处理集成在一个API中,这是业界首创。该解决方案结合了我们专有的首创神经散列技术,使矢量的使用可扩展,并且使用成本效益提高90%——这是其他人工智能公司(包括 ChatGPT)面临的问题。这款突破性产品真正令人兴奋的是,它使真正的人工智能搜索可扩展到企业级组织。

新技术还允许零售商等客户理解并提供与查询相匹配的内容,这些查询通常过于会话化,无法提供准确或任何结果(被认为是长尾)。这些内容占当前网站搜索量的55%。作为唯一一个将人工智能应用于查询理解、检索和排名的端到端人工智能搜索解决方案,,NeuralSearch真正理解这些查询,并将错失的机会转化为收入。

采访者:除了Neuralsearch™之外,还使用了哪些其他机器学习方法?

我们将人工智能整合到三个主要功能中一一查询理解、查询检索和结果排序。我们在Algolia称之为人工智能搜索三明治:

查询理解Alqolia的高级自然语言理解(NLU)和AI驱动的矢量搜索提供自由形式的自然语言表达理解和AI驱动的查询分类,可准备和构建用于分析的查询。此外,基于用户反馈的自适应学习可以对意图理解进行微调。

检索然后检索最相关的结果,并从最相关到最不相关进行排序。检索过程使用相同的索引将神经散列结果与关键字进行合并,以方便检索和排序。这种方法解决了“空结果”问题,并显著提高了点击位置和点击率。在搜索和发现领域中没有其他搜索平台能够提供这种强大的功能。

排名最后,Algolia的人工智能重新排名将最好的结果推到顶部,该排名考虑了搜索查询附带的许多信号(包括精确的关键字匹配分数、上下文个性化配置文件、观察到的受欢迎程度、项目的数量、语义匹配分数等)并学习达到最大的相关性。

此外,随着索引的变化、新产品的添加、新内容的上传,或者术语的新含义,人工智能驱动的AlgoliaNeuralSearch产品将自动学习和调整。它不需要任何额外的人员统计或人工操作,它会根据查询或搜索短语自动匹配关键字或概念(可能是两者的混合)。这使搜索处于自动驾驶状态。


Algoia的成功关键

keys To Success

采访者:Algolia最近将其免费计划从提供1万条记录增加到100条记录,这背后的想法是什么,市场反应如何?

Sean Mullaney:我们选择通过引入两个新的面向开发人员的计划来改进Algolia的定价和包装,使其更加适合开发人员:一个是免费的“构建”计划,一个是以实惠的价格提供轻松可扩展性的“增长”计划。

新的Build计划将开发人员可以在Algoli中存储的免费记录数量从1玩条增加到现在的 100万条记录。这意味着开发人员现在可以在Algolia中建立索引的免费记录数量增加了 100倍。此外,Algolia将其Grow计划中的搜索请求成本削减了50%,将记录成本削减了60%。

我们更新的“构建”定价计划背后的想法是让开发者免费访问其人工智能搜索和发现平台的全部功能。当开发人员准备扩展其应用程序时,“增长”计划使开发人员能够为实时生产设置提供更适合开发人员的基于使用的定价。

这里需要注意的一点是,任何设计师、创建者或构建者(无论他们是临时的还是完全投入的软件工程师)都可以快速轻松地访问需要的所有工具、文档、示例代码、教育内容和跨平台集成功能,以便开始管理他们的数据、构建搜索前端、配置分析等等(所有这些都是免费的)。此外,他们还可以立即访问拥有500多万构建者组成的不断增长的开发人员社区。


个性化神器

CORPORATE CULTURE

采访者:你能讨论一下他们提供的搜索个性化工具吗?

Sean Mullaney:Algolia为公司提供了多种搜索个性化工具,帮助他们利用数据更好地改进推荐,包括不同类型的推荐和利用数据实际驱动这些推荐的独特方法。

其中的几个例子包括:

趋势:建议其他流行趋势并与客户进行的搜索相关的项目。

基于评级:人们想希望购买评分最高的产品。

个性化:根据您上次购买的产品、浏览历史、位置或其他因素,我们推荐这些产品。

这些数据驱动的方法可以根据客户与产品的互动方式,帮助快速增强和改善结果,所以更有可能推荐那些真正转化最好的产品。


神经散列的神辅助

Divine Assistance


采访者:你将Algolia描述为世界上最具扩展性的混合人工智能搜索引擎。Algolia是如何设计得如此高效的?

Sean Mullaney:这一切都回到了神经散列。这和尖端的解决方案可以压缩并显著加快了每个查询的速度。计算散列相似度比计算标准向量相似度要快得多,并且可以在几号秒内返回结果。

神经散列代表了将人工智能检索应用于各种各样的生产中,结合人工智能查询处理和重新排名,有望释放人工智能现场搜索的全部力量。在Algolia取得专有突破之前,基于矢量的搜索计算成本太高,无法在生产中运行。

我最想关注的部分是三明治中的肉:检索。之所以说我们是唯一真正的端到端AI搜索引警,是因为在搜索行业的幕后,一直有一场将AI添加到检索中的斗争。信息检索是一个极其复杂的过程,而大规模掌握高性能、经济高效的AI检索则更为复杂。我们通过突破性的神经散列技术掌握了它。


对话谷歌首席技术官肖恩,搜索引擎的里程碑,来看看搜索引擎界的大哥Algolia的“快、准、狠”突围关键_搜索_03


读者感悟:

人工智能技术在随着社会的需求变化不同而不断创新,伴随着社会架构和经济的发展,极大的促进了社会的进步和经济的发展。而人工智能搜索发展至今,技术在不断成熟完善,肖恩作为人工智能搜索重要技术人员,他现如今所在的公司Algolia,还在推出新的人工智能搜索技术,实现扩展到了企业组织上这一突破,让企业发展更加高效。相信在不久的将来人工智能搜索会惠及到人类社会的方方面面。


作者 | 春花

排版 | 春花

审核 | 猫


若您对该文章内容有任何疑问,请于我们联系,将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

标签:开发人员,人工智能,肖恩,Mullaney,搜索引擎,搜索,Algolia,查询
From: https://blog.51cto.com/bftrobot/7279522

相关文章

  • 深入了解Elasticsearch搜索引擎篇:倒排索引、架构设计与优化策略
    什么是倒排索引?有什么好处?倒排索引是一种用于快速检索的数据结构,常用于搜索引擎和数据库中。与传统的正排索引不同,倒排索引是根据关键词来建立索引,而不是根据文档ID。倒排索引的建立过程如下:首先,将每个文档拆分成一系列的关键词或词项,然后建立一个词项到文档的映射。对每个关键......
  • 动态HTTP代理与搜索引擎优化(SEO)的关系
     作为一名专业的爬虫代理供应者,今天我要和大家聊一聊动态HTTP代理与搜索引擎优化(SEO)之间的关系。你可能会觉得这两个话题没有直接联系,但实际上它们是息息相关的。在这篇文章中,我将向大家解释为什么使用动态HTTP代理对于提升网站的SEO效果至关重要,并分享一些实用的技巧。 首先......
  • 搜索引擎优化:从技巧到策略的完整指南
    导言:在当今数字化时代,搜索引擎已成为人们获取信息和产品的主要途径。为了在竞争激烈的网络世界中脱颖而出,搜索引擎优化(SEO)变得至关重要。本文将为您提供一个从技巧到策略的完整SEO指南,帮助您在搜索结果中获得更高的排名和更多的流量。一、关键词研究和优化目标定位: 确定您的......
  • ChatGPT联网查询基于yahoo搜索引擎
    联网查询原理很简单1.对搜索内容分词2.将分词后的内容用yahoo搜索3.将搜索返回的内容交给ChatGPT整理提炼Demo代码如下importfetchfrom'node-fetch';importSegmentfrom'segment';import{HttpsProxyAgent}from'https-proxy-agent';constproxyUrl='http://1......
  • 爬虫与搜索引擎优化:通过Python爬虫提升搜索排名
    作为一名专业的爬虫程序员,我深知网站的搜索排名对于业务的重要性。在如今竞争激烈的网络世界中,如何让自己的网站在搜索引擎结果中脱颖而出,成为关键。今天,和大家分享一些关于如何通过Python爬虫来提升网站的搜索排名的技巧和实践经验。无论你是在提升自己的网站排名还是优化客户的SE......
  • 针对搜索引擎优化您的网站(面向新手)
    今天文章将简明扼要的介绍如何优化您的网站有助于提升网站在Google搜索结果中的排名Google不会通过收取费用来提高网站排名,也不会因网站在Google上投放广告而提高其排名。任何与此不符的消息均是子虚乌有。描述应贴切:您的网页应使用准确的描述性标题。我们建议将不同的主题、......
  • Hexo主题Next配置algolia站内搜索
    Algolia是一家为网站与移动应用提供托管式搜索API的初创企业,成立于2012年,总部位于旧金山,曾参加过去年的YC训练营。网站或移动应用只需嵌入简单代码数分钟即可实现搜索功能。实现的效果如下search注册Algolia打开Algolia进行注册。可直接使用github账号进行注册。创建index点......
  • 【ChatGPT】ChatGPT 不会取代程序员,但搜索引擎应该担心。为什么 ChatGPT 不会很快取代
    目录ChatGPTwillnotreplaceprogrammers,butSearchEnginesshouldbeworriedChatGPT不会取代程序员,但搜索引擎应该担心Justthefacts,ma’am 只是事实Searchisaboutknowledge,notwebcontent搜索是关于知识,而不是网络内容ChatGPTandSearchEnginesareanunfair......
  • 一个突破搜索引擎的信息茧房方法
    搜索引擎为我们提供了一个广阔的知识世界,通过基于关键词的搜索算法,帮助我们快速、准确地找到所需的信息,包括文章、新闻、图片、视频等各种类型的内容。所以我们要善于使用搜索引擎,帮助我们探索知识、寻找答案和解决问题,扩展自己的知识储备和理解世界。突破搜索引擎的信息茧房在......
  • 程序员必备:使用AI工具通义千问,没有广告没有假链接,比搜索引擎要便捷多了,回答还算满意
    我提的问题是:使用Python连接Oracle,cx_Oracle和oracledb那个效率更高,功能更全,请列出他们的区别和实例代码回复是:以下是使用Python连接Oracle时,cx_Oracle和oracledb的效率和功能比较及实例代码:效率比较:cx_Oracle是一个Python官方标准库,使用了JIT编译技术,可以提高查询性能。ora......