沃顿商学院商业人工智能笔记(一)
P38:4_向上游移动客户体验.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
在这个模块中,我们将讨论一些令人兴奋的内容。
这是关于公司如何在客户旅程中向上游移动。
现在我们谈到了预测客户旅程,使其更短。
让我们尝试对比一下。首先以一个例子开始。
当你开始思考搜索时,或许谷歌是你首先想到的公司。
但是看看这些数字。它们暗示的是,当人们在寻找购买的产品时。
事实上,如果有什么的话,亚马逊的能力远超谷歌。对于会员用户。
亚马逊和谷歌之间的差异更大。这表明了什么?
这表明,如果你是亚马逊的会员,当你访问亚马逊网站时。
亚马逊所能做的,不仅仅是推荐产品给你。
当然,他们可以做到这一点。但他们能够做的是策划你整个旅程。这是。
如果你考虑购买智能手机,你会在亚马逊上查看你的过去购买记录。
查看他们对你所知道的所有事情,他们可能不会。
只是能够推荐你应该购买的智能手机,但他们可能能够。
也就是说,查看你整个客户旅程,看看你应该如何购买。
所以这就是在客户旅程中向上游移动的理念。
那么让我们重新审视亚马逊Alexa和谷歌Home的例子。
所以当我谈论这个例子时,我们谈到了谷歌Home和亚马逊Alexa。
缩短客户旅程。让我们进一步探讨一下这个例子,看看他们如何拥有客户旅程。
亚马逊,例如,当然也拥有Whole Foods。
那么让我们想象一个在亚马逊Alexa上的应用,在某种程度上你可以制作。
购物清单。你当然可以制作购物清单并将其保存在那里。
这很好。但是你在某种程度上也可以决定从Whole下订单。
Whole Foods。那么这在做什么呢?这不仅仅是缩短客户旅程的方式。
这完全是在策划整个旅程,从你可能开始使用的认知阶段。
使用亚马逊Alexa来制作你的购物清单。然后你可以直接从Alexa下单。
它还会为你完成购买。同样,对于谷歌Home也是如此。
你可以开始搜索附近的餐厅,但你也可以在上面预订。
所以这是我想要传达的重点,结合许多其他例子,作为一家公司。
你可以开始思考的不仅仅是缩短客户旅程或预测。
客户旅程。你可以开始思考我所称之为拥有客户旅程的概念。
我想引起您注意的就是超级应用。比如说。
您可能在手机上使用Facebook应用时会感到舒适。
也许是Twitter应用或Spotify应用。当然这些都是独立的应用。
这意味着您在Twitter上浏览,看看Twitter上发生了什么。
您回到外面,去Facebook等,您正在访问不同的应用。
但是在许多其他国家也发生了很多事情,许多应用程序。
被称为超级应用,这在某种意义上已成为您的起始页面。
每个人都可以获得各种不同的东西。例如,在韩国是K-Talk。
在中国是VChat等,这些应用将做什么?
它们已经成为大型门户。
例如,在中国,您可以使用VChat像支付给同龄人一样付款。
在美国,这里使用Venmo。您当然可以在这里拥有社交网络环境。
您可以进行购买,您可以与其他企业交流。
基本上它已成为起始页面。您可以想象,使用VChat或K-Talk时客户体验的不同。
与使用Facebook或Twitter相比,为什么?因为在某种意义上,VChat。
K-Talk和在印度的PTM,它们想要做什么?
它们在某种意义上正成为您客户旅程的策展人。
所以这就是我所说的向上走。您在某种意义上成为客户开始他们旅程的地方。
让我们从娱乐的角度再举一个例子。
而且在美国,您有许多不同的流媒体平台。Roku是其中之一。
Apple TV等设备。
现在当您开始思考这个问题时,为什么我说它们在某种意义上。
理清如何向上走?对于那些使用过Roku的人来说,平台的设置是。
您会有不同的页面,比如您有Netflix、Amazon Prime等许多其他应用。
那么,您最终会做什么?您会考虑想观看的内容。
您访问Netflix的页面,然后进入Netflix流媒体应用。寻找内容等。
例如,Apple TV与Amazon Fire完全不同。
您最终会查看想搜索的内容,他们可能会展示所有。
您可以在不同地方找到它。所以看看使用Roku时的不同方式。
Apple TV、Amazon、Firestick,您以某种方式获得了非常不同的策划体验。
您的客户旅程是不同的。比如说,Roku通过不同的流媒体平台策划这段旅程。
您决定想访问Netflix、Amazon Prime或其他迪士尼+等内容。
而在Apple TV上,您是从想观看的内容开始思考的。
注意你可以采取的两种不同方式。
当然,这两种不同的方式对客户的旅程有不同的影响。
让我们考虑一下医疗保健。
当然,医疗保健行业是一个非常分散的行业。医疗保健中发生了很多事情。
所以我想引起你对“谁拥有数据”的关注,为什么我要提这个。
与我们之前讨论的那些公司相同。
我在这页上的例子是关于苹果、亚马逊和谷歌的。
我们之前谈到的那些公司现在正逐渐进入医疗保健。
对于苹果来说,很多是我称之为移动技术的内容。全是关于可穿戴设备。
你佩戴的苹果手表,你拥有的手机,当然变得更加。
更加兼容你可能想进行的各种测量。
所以,苹果手表可以查看你的心率等等。
正如苹果的口号所说,科技让医疗保健更加个性化。
同样,亚马逊也进入了医疗保健领域。
例如,谷歌正在关注许多其他公司,例如它们正在探索的。
进行大量早期测试和研究等。这里的大问题是你是否会选择苹果的路径。
Google路线、亚马逊,无论情况如何,他才是拥有数据的人。
数据在哪里以及会发生什么样的应用将会是重点。
可以基于这些数据构建。所以再次回到苹果的例子。
通过查看他们的手机、手表和应用程序,显然可以做到。
他们正在努力在某种意义上使医疗保健更加个性化。
显然,如果你购买了苹果生态系统的产品,你可能在某种程度上被锁定。
这个生态系统涉及他们拥有的各种设施。
所以在医疗环境中,思考谁拥有数据变得非常关键。
现在我们来举一个我称之为上游和下游的例子。这里的想法是什么?
这里的想法是,我们举了很多例子,展示公司如何向上游发展。
这是思考意识,思考如何缩短旅程,拥有那个。
旅程等等。但当然,一旦有人购买,旅程并不会停止。
旅程继续,为什么?因为还有很多其他的购买选择。
例如,卡斯珀公司在美国提供的床垫价格更低。
它想成为他们所称的“睡眠的耐克”。这里的想法是什么?
它们在某种意义上想拥有那个特定的“睡眠”垂直领域。
所以他们想考虑提供哪些其他设施,能提供哪些其他产品。
提供的产品超出了床垫。所以,Nectar另一家竞争者想扩展他们的产品线。
所以这里的想法是,当您开始思考客户旅程时,您不仅仅是。
想想客户旅程的最初阶段,那就是向上游去。
您还可以开始思考当特定购买完成后会发生什么。
还有什么其他东西可以提供给客户?让我们再举一个例子。
Airbnb。 当然,Airbnb是一项非常受欢迎的服务,从某种意义上说,您可以继续进行。
您想度假时,可以选择租用某人家的房间。
您可以租用整栋房子等等。但Airbnb也意识到,当人们度假时,他们不仅仅是去。
在某人的公寓或房子里住宿。他们想做很多其他活动。
因此,如果您注意到Brian Chesky,他是Airbnb的联合创始人之一,他基本上说对于。
在酒店消费的每一美元,您在那个城市的消费是三美元。您在那里的用餐。
娱乐,您全天所做的事情。他们基本上希望将此视为一个长期机会。
所以有一个叫做Airbnb体验的东西。因此,如果您访问Airbnb,您可以看到,例如,假设您想去费城。
或者在纽约,您可以看看在那个城市还有什么其他事情可做。
旅行。所以这就是我谈到向上游和向下游去的地方,这就是拥有。
客户旅程不仅仅是从初始选择的角度出发,还有拥有。
整个体验。
让我们再举一个例子。这次从B2B的角度来看,企业与企业之间的视角。
Shopify当然是一家非常大的公司,它帮助中小型企业进入网络。
这就是他们的起点。在某种意义上,您可以想象当地的小商店想要上线。
互联网他们是如何搭建的。Shopify使这变得简单。那么他们是从哪里开始的呢?
他们基本上是通过提供服务开始的,在某种意义上,您知道放置。
您可以非常轻松地在网上拥有自己的网站,设置所有后端等等。
因此,作为公司老板,您并不需要非常懂技术。Shopify会处理这一切。
然后他们基本上说,一旦您在某种意义上让人们上网,进入网站。
好吧,也许我们也可以开始提供销售点服务。
因此,Shopify开始在店内提供销售点服务。
所以他们首先是在线的,然后变成了离线的。
所以在某种意义上,他们开始与客户的其他业务整合得更多。
然后他们说好的,非常棒。现在我们有了在线和离线,我们可以开始考虑一个重要的需求。
为公司的服务,即库存。
然后他们开始进入Shopify履行网络。
以这种方式,他们实际上已成为亚马逊的竞争对手,但他们提供 Shopify 履行服务。
网络服务于他们的小型和中型企业。
这也很好。当然,随着 Shopify 更加了解客户,你可以想象他们还能做什么。
开始思考?那么,我们应该把钱给哪些客户?
这就是他们获得资金的地方。所以,从 Shopify 和他们客户的视角来看整个旅程。
可以说 Shopify 是从最后开始的。他们开始思考客户如何。
他们的客户是企业,可以在网络上进行操作。
然后他们开始向上游或向下游移动。所以思考资金问题。
思考履行或不同的痛点。
他们客户的其他企业可能拥有的资源。这就是我所说的,仔细思考客户旅程并向上游移动。
以及下游。所以我在这里看到的是,在我们接触新技术之前,我们开始思考。
AI 应用不应本末倒置。
从“为什么”开始。你的客户需求是什么?你究竟是在解决什么问题?
你如何解决这个问题很重要,但有时从“如何”开始可能会使事情变得复杂。
你会忘记“为什么”。所以首先要认真思考“为什么”,无论你是 B2B 公司。
无论你是 B2C 公司,考虑客户需求是至关重要的。
一旦你考虑到客户需求,就开始思考什么样的技术。
可能会有帮助。是视觉 AI 吗?是语言 AI 吗?还是为什么是 AI?它是什么?
在我看来,这是思考“如何”的下一个方式。
然后你就会在“为什么”和“如何”之间形成良好的协同。
所以,这是我想请你思考的。当你开始考虑如何满足客户需求时,你扮演的角色是什么?
你在其中扮演什么角色?你在客户旅程中扮演着向上游移动的角色吗?
我给你举的例子是关于 Shopify、Roku 的例子,甚至是亚马逊 Prime。
以及 Google Home,你在策划整个旅程。如果你能做到这一点,那就是一个很大的胜利。
当然你也可以先从小处开始。首先思考你能否预测下一个客户旅程。
这就是关于预测。因此,那些是我给你举的关于亚马逊的例子,例如它的预测。
根据你购买的商品,你接下来可能会买什么。
当然,你也可以开始考虑缩短客户旅程。
所以思考你可以发挥的最佳角色,然后开始思考技术。
你所拥有的数据资产可以帮助你发挥这一角色。[BLANK_AUDIO]。
P1:0_面向业务的AI简介.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
欢迎。这是一门关于商业AI的课程。在这门课程中,我们将从。
从管理的角度来看。我们研究了几个人工智能在商业中的应用案例。
我们将研究一个战略框架,供管理者使用,以获得收益。
从AI投资中获得收益。我是卡尔蒂克·哈萨纳加。我是一名技术与数字。
沃顿商学院的商业研究。我研究的重点是数字经济。因此。
我关注互联网商务、数字媒体、数字营销和基于数据的决策。
我之前是Yodl的联合创始人,这是一种针对小企业的营销平台。
多年来我与许多初创企业和大公司合作,关注。
特别关注人工智能和数据科学在商业中的应用。我也是一名作者。
这本书的名字是《人类的机器智能指南》。
关注使用人工智能的影响。
智能以便在企业内部和外部做出商业决策。
人工智能或AI无处不在。AI旨在让计算机完成。
需要人类智能的各种事情。例如,理解语言、推理。
物理世界、学习等等。机器学习是人工智能的一个子领域,专注于。
关于让计算机在没有明确编程的情况下学习。人工智能正在不断发展。
被视为数字转型的下一个阶段。多年来,各种不同的数字。
技术帮助实现了商业转型。
这是组织或转型的理念,包括公司和活动。
并利用数字技术创造的新机遇。现在。
在90年代末,帮助实现这一转型的技术是互联网。
一些公司开设在线部门以利用这一机会。
不幸的是,一些公司在之后也关闭了这些在线部门。
在互联网泡沫期间。那些坚持的少数公司实际上在长期内受益匪浅。
而没有坚持的公司最终付出了重大代价。在2000年代中期。
云计算同样带来了类似的变化。在这里,许多公司。
开始投资云计算。但再次提到,一些公司在面临挑战时选择退出。
意识到他们早期进入云计算的尝试面临许多相关挑战。
在将数据迁移到云端或遵守监管合规方面的安全问题。但这些。
退出的公司再次付出了代价,而坚持的公司则。
那些在长期内处于良好定位并帮助创造一定收益的公司。
带来商业敏捷性,这在长期内帮助了他们。在2000年代末,移动计算。
帮助创造了类似的变化。那些早期投资于移动计算的公司帮助。
真的创造了以移动为主的产品,并帮助转型企业。
进入一个移动世界。如今,人工智能似乎也将具有同样的变革性。
实际上,有早期证据表明,人工智能可以被视为通常所说的。
作为一种通用技术。现在,通用技术是指在多个不同的行业中。
其在多个行业广泛应用的潜力。而这些通用技术。
技术能够激励创新并推动经济增长。在组织层面上。
它们还可以为产品战略和组织整体设计提供信息。现在。
三个因素被视为技术是否为通用技术的指示。
第一个因素是该技术在多个行业中广泛应用。
第二个因素是与该技术相关的大量研究职位。
而这些研究职位本身也分布在其他多个行业中。
在Goldfarb等人的一项研究中,研究人员探讨了人工智能。
显示出作为通用技术的潜力。因此,他们研究了一些最近的技术。
在媒体上受到关注。例如,机器学习、地理信息。
系统、CRISPR、量子计算、压裂、机器人技术、纳米技术、物联网。
以及云计算。他们还考察了数百万个职位发布,并对这些职位进行了分类。
基于与哪些技术相关。他们评估了机器学习。
作为人工智能的一个子领域,看起来是否不同。正如你在幻灯片中看到的。
研究人员发现,许多职位发布与机器学习有关。
还包括其他一些技术,如机器人技术和云计算。事实上,最多可达14。
6%几乎占所有机器学习相关职位的15%。现在的研究。
相关工作是通用技术的重要指标,因为它们。
帮助展示该技术具有持续改进的能力。
而这种持续的改进,创造了显著的未来潜力。
一些目前尚未被认可的内容。当然,机器学习。
人工智能的最重要子领域似乎展示了这一能力。
研究人员还考察了工作,尤其是机器学习职位是否分布广泛。
他们确实发现机器学习职位可以。
可以在多个不同的行业中看到,主要是在教育服务、专业。
服务、制造业、金融服务等。相比之下。
其他一些技术,如量子计算,主要出现在一两个行业,例如专业服务。
简而言之,似乎机器学习职位在多个行业中可用,并且。
多个行业今天都看到这些技能的价值。接下来,研究人员观察是否。
特别是研究职位在各个行业中也普遍存在。而在这里,研究人员。
发现许多行业,包括制造业、专业服务、信息。
与技术相关的职位,金融、教育,所有这些都需要与之相关的研究职位。
机器学习。并不是所有其他技术都表现出这种广泛性。简而言之,有很多。
这些统计数据确实表明,尤其是机器学习和人工智能总体上可能会。
一种通用技术。这有许多含义。首先是公司。
经理们需要意识到机器学习和人工智能将在广泛。
在各种行业中,仅仅因为你不是技术行业并不意味着你。
免受影响,机器学习的变革性影响。其次,事实上。
很多这些工作是研究职位,这也意味着技术的发展也表明这一点。
经理们需要对技术保持耐心。技术的变革性影响可能。
伴随着缺乏。因此,为了有效利用这些机会。
经理们需要理解技术及其应用。
他们需要对他们的商业模式、技术基础设施进行许多改变。
适应他们的组织流程和文化。
所有这些都需要重大变化。本课程的目的是帮助你。
达到这一点。[BLANK_AUDIO]。
P10:9_强化学习.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
接下来我们来看强化学习,特别是多臂老丨虎丨机算法。
更加深入地了解。这些算法在你有连续数据输入时是一个强大的工具,我们可以。
从数据中学习以改善决策。例如。
考虑一个媒体网站,比如一个希望个性化的新闻媒体网站。
该网站需要为其用户决定,例如,展示成千上万条不同新闻中的哪一条。
文章在其主页的顶部展示。或者考虑一个电商零售商。
我们称之为Nanophone,假设这是一个手机零售商。
当消费者登录网站时,Nanophone需要决定如何个性化产品。
向消费者展示的页面。他们可能需要决定向消费者展示10种不同手机图片中的哪一种。
他们可能需要决定向消费者强调哪些产品特性。例如。
是不是应该关注手机的电池续航?
还是应该专注于时尚的设计或其他产品属性?
他们可能希望决定向这些消费者提供哪几种不同的折扣。
零折扣、五折、十折。
他们可能会有多个行动号召。并且他们需要选择使用哪个行动号召。
因此,行动空间或决策集或可供营销人员选择的选项集。
在这个背景下,目标是决定选择哪些行动以最大化收入。
这个问题的核心是我们探索多少,利用多少。
我们所说的探索是关于收集更多关于。
决策环境。例如,提出这个问题。
如果我选择不强调电池,会发生什么呢?
尽量少考虑电池续航,而选择关注手机的时尚设计。相反。
利用是关于在当前信息基础上做出最佳决策。
单纯基于当前信息,我们相信最能吸引的营销信息是。
消费者是一个强调电池续航的信息。
那我们应该坚持那个,还是尝试一些新的东西?
现在我们在日常生活中经常使用探索和利用的理念。例如。
假设你要去餐厅。你会去一个全新的餐厅,这相当于探索吗?
还是去你常去的最喜欢的餐厅,你知道那里的情况。
是不是经过验证的?那就是利用。而有时你可能会选择去你最喜欢的餐厅。
选择去利用。而有时你可能会说让我们尝试一些新的东西,了解。
餐厅。即使这冒着我们可能不喜欢食物或体验的风险。
这就是探索。这类决策问题的核心问题是我们如何平衡探索。
探索与利用?我们如何决定何时尝试一个全新的营销信息或完全不同的。
将网页提供给消费者,或者何时使用一些已经有效的内容。
过去的经验。这种权衡正是多臂赌博算法等算法真正处理的内容。
我之前提到的,这种方法有点像经典的强化学习方法。
现在,多臂赌博问题是一个固定或有限资源集的问题。
必须在多个选择之间分配。
例如,想象一下赌场中的一个赌徒面临一排老丨虎丨机。
赌徒必须决定拉哪个老丨虎丨机,而赌徒在赌场中只有有限的时间。
因此只能进行100次或200次拉动不同的老丨虎丨机。
因此,他们必须随时决定是否尝试一个全新的老丨虎丨机。
如果它与更高的获奖概率相关联,赌徒应该如何选择。
坚持一个已经产生合理回报的老丨虎丨机。
现在有许多算法可以用于平衡探索与利用。
确实有许多算法用于多臂赌博问题。
例如,一种叫做Epsilon优先的策略本质上是一种启发式方法,我们往往倾向于。
提早进行实验,也就是在早期进行大量探索,然后一旦我们学到了一些东西。
然后我们开始利用这些信息。所以在个性化纳米手机网站的背景下,我们可能会在。
在最初的几周,我们可能选择探索并尝试许多不同的营销信息。
尝试许多不同的图像等等。一旦我们学会了想要的内容,我们选择利用,也就是分配。
100%的流量分配给我们在前几周发现的表现最佳的变体。
探索的几周。另一个可用的算法是汤普森采样。
对于纳米手机面临的问题,汤普森采样可能会最初。
将进入网站的网络流量平均分配给所有不同的。
公司正在考虑的选择。意味着我们是否应该强调显示电池的消息和视觉效果。
我们是否应该使用谈论流线型设计的视觉和信息?
我们是否应该使用关于手机应用商店等的视觉和信息。
汤普森采样将最初把流量平等地分配给这些选择。
概率。但是,随着越来越多的数据进入,汤普森采样将选择那些。
产生更高或更好的结果。它会以更高的概率选择它们。
所以如果例如强调应用商店的信息和视觉效果是那一个。
逐渐但稳步地产生比选择的概率更好的结果。
被选择的内容将不断增加。定性而言,这就是算法的作用。
显然,算法如何工作的细节可能不是大多数人最感兴趣的。
我们的重点是讨论人工智能的商业应用,但希望你能感受到。
这些方法背后的直觉。总之,我们假设机器学习是基于对大型数据集的访问。
强化学习提供了一种依赖较少训练数据但更多依赖。
在动态实验中学习哪些策略表现更好,并更多地使用这些策略。
更多。强化学习在游戏和在线个性化方面找到了许多应用。
也就是说,今天并不像其他机器学习方法(如监督学习)那样广泛使用。
机器学习。鉴于监督机器学习在商业环境中是多么普遍,我们将。
现在深入探讨监督机器学习方法的世界。[BLANK_AUDIO]。
P100:37_课程总结.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
好吧,大家,我们的四模块课程和四个多小时的内容到此结束。
或者说,你和我们在一起的时间,所以我们一起度过了很长时间。
我记得多年前有一项关于一个典型美国家庭的研究,表示他们。
每周仅相互交流约20分钟。如果这是真的。
我们就像一个在这里待了几个月的家庭。
因此,我们感谢您与我们共度的时光。我们将尝试在这里花几分钟总结,并提醒您。
这是我们在整个节目过程中一直在讨论的一个重要主题。
我们正处于数据科学正在带来一些相当重大变化的边缘。
这是一种解决问题和做决策的完全不同的方法。
这是需要记住的第一件事。它优先考虑做出准确的决策。
这可以是非常好的事情。因为我们现在在工作场所做出的许多决策并不特别。
好的,特别是在招聘方面。我们并不仔细招聘。
我们不一定能招到最优秀的人,而我们现在的做法也有不少。
其中包含的偏见。关于数据科学需要记住的一点是,那些决策。
优化决策并不一定符合公平性测试。
它们不一定符合可解释性测试,即能够向一个人说明。
为什么做出这样的决策,以一种他们能够理解的方式。
这些决策也不一定与其他公平目标一致,例如。
所以,将这些工具应用于人力管理的挑战在于平衡。
我们拥有来自数据科学的优化工具,这些工具可以提供很多指导。
在管理人员方面,我们也有其他所有的担忧,这些担忧并不是。
当我们将数据科学应用于机器时,总是有对简单规则的需求。
而且总是有一种把人当作机器对待的需求。
这可以追溯到我们刚开始时提到的,大约一百年前在美国的弗雷德里克。
泰勒在科学管理方面的工作。问题是我们在过去一百年里大致上都已证明。
或者说,特别是在过去六十或七十年里,这种方法效果并不好。
员工的参与确实很重要。让他们参与某些决策过程就是参与。
在我们的背景下,这可能意味着让他们参与数据科学的练习。
这引出了关于如何做决策的建议。不过这里也有一个主题。
这个主题是人工智能和。
现在数据科学可能会推动我们管理员工和工作的其他变化。
这可能和数据科学本身一样重要。这里有两个例子。
第一个是我们必须收集更多数据。为了进行这些数据科学练习。
我们需要更多的数据。这些数据可能是我们早就应该知道的事情。
比如说让我们尝试测量人的表现。
让我们尝试在多个维度上进行测量。
让我们看看是否能收集关于人们培训的信息,以尝试了解它是否真正有效。
一旦我们开始收集数据,一旦我们开始测量事情,它会引导我们朝向。
实际上试图分析并查看我们的决策是否明智。
数据科学带来的最后一种重要方法是一个好事。
这并不像用新眼光看待旧问题。
因此,在人力资源管理中,我们有一个相当古老的范式。
这里的情况几乎保持不变,除了在至少二战以来进行了一些微调。
II。当数据科学人员进入工作场所时,他们能做的最好的事情之一是。
我们只需问,为什么要这样做?这可以引发许多变化,即使他们没有产生新的算法。
提供了完美的解决方案。因此总结一下。
我认为对我们来说一个好消息是,随着数据科学的发展,我们正在。
我们正处于工作场所一些重大变化的边缘。其中一些是由数据科学本身驱动的。
其中一些仅仅是由于组织变革过程而思考不同的方式。
这些问题。我们祝愿您在这些问题中顺利导航。
非常感谢您与我们在一起。[BLANK_AUDIO]。
P101:0_AI战略简介.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
这是一门关于人工智能战略和治理的课程。
我们将首先讨论以人工智能驱动的商业转型。
我们将谈论为何一些公司早期的人工智能倡议失败。
我们该如何应对。具体来说,我们将查看成功公司的策略。
利用人工智能获得竞争或商业优势。
这些包括发展长期项目组合和短期项目的想法。
我们还将讨论机器学习的民主化如何降低各企业使用人工智能的障碍。
特别是,我的同事桑尼·坦贝将讨论企业中使用人工智能的众多输入。
这包括软件、人员、计算和数据。
以及公司应如何考虑这四个输入以正确的方式结合起来。
我还将讨论人工智能在组织结构中的作用。具体而言。
当前成功应用人工智能的组织有哪些行为模式?接下来。
我的同事林吴教授将讨论人工智能与变革管理。
特别是人工智能在业务流程重组中的重要角色。
我们将讨论人工智能面临的一些挑战。我们将谈论人工智能算法可能失败的方式。
以及这些失败带来的风险及对公司的影响。
我们将以讨论公司如何建立治理框架作为结束。
以保护自己免受人工智能失败的影响。
我的同事们,凯文·伍尔巴克教授和桑尼·坦贝教授将讨论人工智能伦理的原则。
关于人工智能可解释性和法律的问题。[空白音频]。
P102:1_AI驱动的业务转型.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
你好,本模块将专注于AI战略和治理。
在本次讲座中,我将专注于AI驱动的业务转型。
我们还将稍微讨论一下AI的机会,以及有哪些。
在AI方面面临的挑战和潜在失败。在本模块后面的讲座中。
我们将探讨战略框架,以确保公司。
可以从他们的AI投资中获得回报。我们还将讨论AI治理框架。
现在商业领袖将AI视为机会和风险。
最近,波士顿咨询集团和NMIT对许多大型公司的高管进行了调查。
报告显示,十分之九的公司认为AI是一个重要的商业机会。
与此同时,45%的公司将AI视为潜在的商业风险。
风险在于竞争对手可能能够使用AI并超越公司。
因此,在这些机会和风险的驱动下,公司开始大量投资。
在AI方面。我们在许多不同的行业中看到许多AI应用。在这门课程中。
我们讨论了一些在金融领域的应用,但AI也正在零售中得到应用。
AI正在医疗、交通等领域得到应用。
许多其他行业。但同时。
我们倾向于注意到早期投资并不总是获得回报。
由BCG和MIT进行的调查报告称,90%的公司已经在AI上进行了一些投资。
但在这些已经在AI上投资的公司中,只有40%的公司实际上。
报告称看到业务收益。
如果我们关注这些公司的一个子集,并仅关注这些公司。
在这些对AI进行了非常重要投资的子群体中,我们发现。
只有60%的人看到了业务收益。
换句话说,早期对AI的投资尚未产生结果。
这引发了一个担忧,即早期的失败可能导致这些组织的非理性撤退。
我们以前见过这种情况。例如,在90年代末。
当互联网开始出现时,许多公司进行了投资。
互联网和创建在线部门,并对这些投资抱有很高的期望。
早期投资没有获得回报。实际上,互联网泡沫破灭,许多公司撤回甚至关闭。
他们的在线部门。这些公司为这些撤退付出了沉重的代价。在2000年代中期。
再次,企业投资于云计算。但有些因为安全或合规等监管问题而撤回。
而那些坚持下来的公司能够创造出一定的商业敏捷性,实际上。
使他们在长期内处于非常有利的位置。而那些实际上撤退的公司仍在努力追赶。
2000年代末,移动计算也发生了类似的事情。我相信人工智能也是如此。
我之前已经论证了为什么人工智能应该被视为一种通用技术。
可以对多个不同的行业产生影响。
因此,早期失败导致公司撤退的类似模式可能是危险的。
因此,公司必须对此保持谨慎。在接下来的几场讲座中。
我将讨论公司可以采取的一些框架。
用于规划他们在人工智能上的投资,并确保这些早期投资能够产生回报。
在中长期来看。[BLANK_AUDIO]。
P103:2_开发组合.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
我们讨论过早期失败如何导致对技术的非理性退缩。
从长远来看可能会产生影响。现在我们将探讨公司如何在较长时间内投资技术。
随着时间的推移,当短期或中期的回报不明确时。
我倡导的一个关键原则是,公司应该思考如何。
开发一组人工智能项目以进行追求。那么让我们更深入地探讨这个想法。
建立人工智能投资组合的想法是提出一组项目,这些项目可以。
被视为公司可以获得快速胜利的项目,以及一系列被视为。
作为长期项目,这些项目不太可能在短期内产生结果。
所以让我们逐一看一下这些。对于快速胜利来说。
公司可以选择优化员工或客户的简单接触点。
对于长期项目,公司可以思考如何重新定义整个端到端。
流程。让我们先考虑快速胜利。那么对于快速胜利来说。
公司可以考虑使用现成的机器学习包或。
解决方案,最初利用这些来改善内部员工接触点。
随着时间的推移,也许可以利用这些技术来改善客户接触点。
现在注意,当我说你在使用现成的机器学习时,每个竞争对手。
还可以访问,并且你使用这些技术来改善内部员工接触点。
这些项目可能不太可能转变业务,但它们服务于不同的目的。
首先,它们有助于让组织和组织中的怀疑者接触到潜力。
人工智能。这有助于达成共识,了解什么是可行的,什么是可以做到的。
我与C-suite及许多组织合作的一个观察是,即使如此。
一个人工智能项目或数字化转型项目可能在组织内有一个倡导者。
组织内部也存在多个怀疑者。
当高层管理人员不一致时,让组织朝同一个方向前进是很困难的。
对于持怀疑态度的领导者来说,C-suite首先建立共识是很重要的。
建立共识的一种方式是追求快速、简单的项目,即使这些项目能够在短时间内展示成果。
三到六个月内人工智能能实现什么。再次强调,这可能不会对公司的营业收入或净利润产生变革性影响。
但是,它帮助人们理解如何在短时间内推动事情进展。
人工智能如何变革。快速胜利的另一个好处是,它帮助公司建立重要技能。
关于人工智能的技能。这些技能涉及大规模收集数据和处理数据。
标注数据,以便创建训练数据集,最终分析数据。
解释分析结果。这一切都需要时间来建立,尤其是在没有数据的组织中。
科学在其DNA中。仅仅雇佣几个数据科学家是无法改变这一点的。
要改变这一点需要时间,而快速胜利和短期项目有助于实现。
这有助于组织看到结果,并帮助组织获得经验。
通过数据收集、标注和分析。快速胜利的一些例子可能是,假设我们讨论的是一家药房。
药剂师需要查找替代药物,当某种药物不可用时,他们可能会。
通常会进入计算机,通过接口输入不可用的药物。
或者症状,然后他们可能会得到一份可用替代药物的列表。
一个简单的短期快速胜利项目可能是提供一个语音接口。
这样药剂师就可以更快速地查找,而无需花费太多精力输入。
使用现成的自然语言和语音识别软件,这很简单。
也有类似的工具可以协调内部会议或讨论。
这非常简单。注意我经常提到利用内部员工接触点作为起点。
这个点的风险非常低,如果出现问题,尤其是在组织内部。
如果没有AI经验,那么对于内部员工来说,风险实际上是很低的。
接触点。随着公司经验的积累,可以将其推广到客户接触点。
接下来进入长期项目。长期项目的理念是,这些项目必须有影响力,并提供战略价值。
或者为组织带来竞争优势。这可能涉及重新思考整个端到端的流程,而不仅仅是优化。
在某个时点。现在一个长期项目的例子可以想到一家接收索赔的保险公司。
处理保险索赔,然后进行处理,最终做出决策。
现在对于汽车保险,可以想象一种情况,客户可以上传他们的保险。
在移动应用上提交索赔。客户可以拍摄汽车或损坏的照片并上传到应用中。
许多公司已经在他们的应用中支持这种能力。
一旦索赔进入,通常保险代理会分析索赔并做出决策。
现在可以利用技术自动化这个过程的某些部分。
例如,使用图像识别算法可以分析索赔并识别。
这种损害的类型,尤其是利用针对过去数据训练的机器学习算法。
过去索赔的数据以及哪些索赔被批准、哪些未被批准的数据。
收到了一千美元的赔偿与一万美元的赔偿之间的区别。
可能只是十美元的赔偿。他们可以在这种数据上进行训练,然后也可以自动化。
批准或拒绝决策。现在,公司可能无法自动化所有进入的索赔。
然而,随着时间的推移,公司可以达到一个点,50%、60%、70%的索赔。
更简单的索赔可以由能够查看性质的机器学习系统处理。
评估损害是否为真实索赔,将索赔与过去的索赔进行比较并做出决定。
损害的程度以及需要给予的赔偿程度。
随着时间的推移,组织中的人类代理可以专注于更复杂的任务。
请注意,我们谈论的是从客户开始自动化整个索赔流程。
将索赔上传到他们的移动应用程序,系统正在分析索赔并弄清楚。
将损害的性质发送到另一个系统,该系统将其与过去的索赔进行比较,然后。
自动化决策本身。这种自动化在长期内可以在降低成本方面产生影响。
但同时也改善了客户的工作流程,赢得了未来客户对组织的信任。
我刚才倡导的投资组合方法是一些公司使用过的。
取得巨大成功。谷歌就是一个很好的例子。
几年前,谷歌首席执行官Sundar Pichai宣布他们希望成为一家人工智能优先的公司。
他们希望利用机器学习来转变多种产品,并本质上带来。
关于整个组织的变革。当谷歌开始这一工作时,他们确实考虑了长期的倡议,例如无人驾驶。
我们谈论过的汽车,但同时谷歌明确表示人工智能是为了。
对整个组织而言,这种转变是革命性的,而不仅仅是无人驾驶等一两个部门。
汽车。因此,公司决定在所有产品中推广人工智能。
包括Gmail、数据中心团队、Google照片和人力资源团队在内的多个部门。
以及其他多个团队以各种形式推出了人工智能。
当谷歌最初开始人工智能驱动的业务转型时,谷歌内的所有团队。
被要求以某种形式整合人工智能。
事实上,他们被告知最初专注于短期项目,以便能够推出。
以某种方式使用人工智能。Gmail在多个小方面利用机器学习来改善Gmail应用程序内的工作流程。
随着时间的推移,随着他们对机器学习的适应,他们开始推出许多新的。
基于机器学习的功能。例如Gmail的智能回复。
智能回复建议用户可能会使用的回复,用户只需点击。
在智能回复的基础上,回复任何收到的电子邮件。
智能回复基于机器学习,它会查看过去的回复并基于此进行判断。
数据它试图推测一个人可能会输入什么样的回复。
这再次是可行的,因为Gmail团队开始使用机器学习来处理简单任务。
随着时间的推移,一旦他们变得舒适,他们开始进行更重要的项目。
功能。如今,智能回复是Gmail上客户非常常用的功能。
在客户中非常受欢迎的功能。还有其他几个例子,比如谷歌照片。
机器学习用于分析图像并自动标记图像。
例如,机器学习可以查看一张图片并识别它是否是某种图像。
一只狗或猫,或在特定类别内,例如狗,它可以识别出是什么品种。
它是何种狗,等等。最终,所有这些信息也可以用于指导图像搜索。
当一个人输入搜索查询,尤其是与图像相关的搜索查询时,可以快速找到图片。
即使搜索查询非常具体且细致。
例如,你去谷歌搜索边境牧羊犬的图片,然后系统。
可以展示几张边境牧羊犬的图片,还可以让你进一步微调。
通过选择额外的搜索术语,可以进一步缩小搜索范围。
所有这一切都是基于使用机器学习自动分析图像并提取。
这些图片的详细元数据。这些例子展示了谷歌如何在多个不同的产品中使用机器学习。
在组织内部,事实上,这只是众多应用中的一部分。
谷歌在各种产品中应用机器学习。
谷歌的AI战略成功,因为它有一个流程,使其。
进行了几个长期项目,例如无人驾驶汽车,但也关注。
有许多短期的项目,多个产品团队被要求应用机器学习。
在产品中应用学习。他们被告知要应用,而不是被要求展示投资回报。
投入这些功能的资金。相反,重点是帮助员工获得机器学习的经验和技能。
这将允许他们构思更具雄心的项目并执行这些项目。
除了这些短期项目和拥有一个项目组合之外,谷歌还有其他的事情。
还进行了大规模的培训活动。
谷歌启动了许多培训项目,最初是面对面的,后来有了很多在线课程。
培训数以万计的工程师学习机器学习的课程。
谷歌还邀请了许多员工从他们的核心产品中抽出几个月的时间。
和机器学习团队一起花时间,他们可以与导师合作。
在一个机器学习项目上。
导师能够指导他们,一旦这个人对机器学习感到舒适。
他们回到了自己的产品团队。这有助于确保机器学习这种最初只有少数人知道的技能。
人们的技能更加集中,变得更加分散和去中心化。
整个公司以及所有不同的产品团队。
我们已经看到谷歌在项目和员工培训的投资组合中投入。
为了从其人工智能战略中获益,谷歌确实在这方面取得了巨大的成功。
这是我建议你在组织内尝试的一个简单练习。
理想情况下,你希望作为一个团队进行这个练习,例如创建一个研讨会或会议。
与你组织内的海平面或高管沟通,可能会花两天时间。
在这项活动上最多花三个小时,或者如果你无法让一组人工作的话。
如果你与我一起做这个,那么也许你可以单独尝试这个。
首先识别出你可以通过自动化的活动集。
机器学习。这可以是跨多个职能的活动,也可以是各种产品的活动。
团队,理想情况下你希望有几十个活动,因为对于大多数组织来说,情况是这样的。
在许多不同的职能中,有很多不同的产品,机器学习都很相关。
一旦你想出了一系列几十个活动,我们就要对这些活动进行分类。
将活动分为短期活动,意思是可以在让我们看看。
说大约六个月或需要几年时间的长期活动。
一旦你有了这个分类,我们再来看一下投资回报率。
为组织带来这些活动的收益。
基于这些活动的投资回报评估,以及评估。
根据组织内可用的数据资产,你可以识别出这些资产的一个较小子集。
将成为你三年投资组合的一部分的活动。
三年投资组合可以由几个短期活动组成,比如五到六个。
几个长期活动,也许一到两个长期活动。
这些是你可能想作为组织追求的活动。
在海平面团队和整体团队内进行辩论,讨论哪些活动。
哪些是值得追求的,哪些不是。这样的辩论是健康的,可以帮助构建投资组合。
一旦你构建了投资组合,你需要弄清楚AI团队将在哪里。
符合组织架构。有些公司有单独的AI团队,独立于其他部门工作。
团队并帮助推动转型,几乎像一个与之合作的咨询小组。
这些其他团队。一些像谷歌这样的组织引入了机器学习、AI和数据科学。
在所有不同的产品团队中都具备这些能力。在这种情况下,我们希望AI在组织内去中心化或扩散。
适合公司的方案可能取决于组织的规模和文化。
组织等。所以你可能想辩论哪种结构适合你的公司。
这是一个我认为在与多位高管合作时很有用的练习。
我尝试过这个练习,它促成了非常健康的对话,我非常推荐。
这对你也一样。[BLANK_AUDIO]。
P104:3_降低AI使用壁垒.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
在上一次讲座中,我们谈到谷歌如何利用AI重塑自己并创造了。
一个以AI为首的组织正在为公司带来丰厚的回报。
现在很容易看出,大公司,像谷歌这样的科技公司拥有资源。
以及内部的工程能力来围绕AI进行重塑。
但是小公司如何做到这一点,或者没有技术基因的大公司又该如何做呢?
好消息是,正在发生一场转变,即机器学习的民主化。
允许各种组织访问某些能力和资源的学习。
和开展以AI驱动的业务转型所需的资产。
当我谈论机器学习的民主化时,我是说民主化。
在进行机器学习的硬件、软件和数据方面。
进行机器学习、机器学习模型本身,以及人们。
进行机器学习所需的数据科学家。让我们从这些方面看一下。
首先,让我们从硬件开始。大规模机器学习通常需要定制硬件。
例如,甚至用于重度机器学习的处理器都是定制的。
有用于机器学习的GPU,而不是传统的CPU。
现在,对于公司来说,创建定制硬件和定制基础设施可能非常昂贵。
用于机器学习。好消息是,大多数主要的云计算平台,如亚马逊。
谷歌、微软、阿里巴巴等公司已经创建了可扩展的计算平台来进行机器学习。
所以公司不必提前投资,而是可以以低价格租用。
当它们需要时。这降低了进行机器学习的硬件门槛。
另一个对许多组织非常有帮助的趋势是,许多开源。
已经创建了框架来进行机器学习,因为它们是开源的。
非常容易获取,再次降低了进行机器学习的门槛。
还有许多可用的开发者工具,可以自动化数据科学。
处理并允许公司利用其软件工程师,这些工程师可能没有深厚的背景。
和数据科学实际贡献于数据科学的努力。
实际上有很多龙狗工具,还有许多可视化工具。所有这些都可以被利用。
这些工具来自微软、亚马逊和谷歌等大公司,但它们也。
包括像H2O这样的开源工具,以及来自其他供应商的许多工具,如Data和Robot。
最终,这些工具使得公司能够轻松入门机器学习。
无需构建自定义软件。最后,要成功应用机器学习,您需要良好的数据和优秀的模型。
现在出现了一些市场,公司可以下载或购买数据集。
还可以下载或购买算法或模型来进行机器学习。
例如,Kaggle已成为一个提供数据和算法的市场。
包括亚马逊、Snowflake等在内的一些主要云计算平台正在创建。
数据市场和算法市场也在不断发展。
所有这些最终将降低进行大规模数据科学工作的成本。
最后,需要数据科学家来进行数据科学,当然,数据科学家。
这在今天可能是昂贵的。但随着越来越多的工程师和数据科学家的培训,数据的成本。
科学家的数量也在减少。所有这些趋势都意味着,在您的行业中使用机器学习的门槛正在降低。
迅速下降。其含义是,您希望在人工智能方面进行缓慢而稳定的投资,而不是一次性大量投资。
大量前期投资,缓慢而稳定的投资将在长期内产生回报。
未来几年,门槛将继续下降,使得应用变得越来越容易。
供公司启动或发展其人工智能项目。[BLANK_AUDIO]。
P105:4_AI软件的经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
当我们考虑人工智能如何与经济学、竞争等互动时,这是。
重要的是考虑一些人工智能的关键输入。
所以这些包括机器学习和人工智能所需的软件,以及你需要的技能。
实现它们所需的计算资源,以构建和运行模型,以及。
你需要的数据来训练模型。那么让我们谈谈这些输入的一些成本。
输入本身正在演变,这可能会对未来人工智能的经济学和人工智能的意义产生影响。
对于竞争。因此让我们从第一个开始,即软件。
所以,人工智能当然是一个极其强大的工具。机器学习也非常。
在其功能方面非常强大。但是,编程,例如神经网络。
是相对困难的。这需要高水平的专业知识,聘请博士是昂贵的。
组建神经网络所需的数学类型。
训练神经网络等是相对先进的。
使用神经网络进行预测需要大量的数学。
因此,在某种程度上,人工智能的商业影响受到相对较高的限制。
你可以称之为价格,这样的软件组合是很昂贵的。
基于深度学习的预测模型所需的。
几年前发生了一次重大变化,价格下降,而这正是深度学习。
开源了。我所说的意思是几个公司。
谷歌是首批这样做的公司之一,他们在代码层面上向任何想要使用的人提供了深度学习基础设施。
开源软件渠道。如果开源对你来说是新的。
当软件免费提供给你下载时。
使用并可能贡献给他人。因此,最早的一个例子是谷歌在 2015 年 11 月发布 TensorFlow。
TensorFlow 是一个软件包,编码了谷歌关于许多内容的知识。
机器学习,关于深度学习。现在我们正在使用 TensorFlow 作为几种密切相关的深度学习框架之一。
你可能还会听到 Torch、Keras、Cafe 等,它们基本上包含了相同的大部分内容。
它们中的一种智能类型。但是 TensorFlow 绝对是首批推出的,并且被广泛使用。
所以 TensorFlow 是由谷歌发布的。对 TensorFlow 包的兴趣和接受度立刻提高。
许多人对如何获取谷歌提供的软件感兴趣。
正在与使用和实施深度学习相关的开源。
TensorFlow 可用于许多平台,因此可以使用 Python、RC++、Swift 实现。
Go 和其他语言。
它所做的就是使得创建和部署神经网络变得容易得多。
所以这本质上将其从你可能认为的博士级任务改变。
这绝不是一项简单的任务,但所需的培训比可能需要的少。
从零开始部署神经网络的人。因此,它仍然需要一些代码,但本质上使得它变得更简单。
拥有硕士学位的人可以在一个。
这比以前快得多,简单得多。当然,问题就来了。谷歌为什么。
为什么其他做过同样事情的公司?他们为什么开源TensorFlow?
他们为什么会将其提供给包括竞争对手在内的其他人?
还有很多潜在的答案。这可能是为了鼓励其他人合作、沟通和贡献。
回馈给TensorFlow包本身。这可能与人才管道有关。
有时公司会将软件开源,以吸引希望。
与良好的代码库合作。他们可能有兴趣销售互补的服务。
但无论出于什么原因,这种逻辑或能力在软件中的可用性。
对于世界来说是一个游戏规则的改变,在使得。
让其他人更容易使用这种软件,并以此作为跳板。
为他们自己的应用程序开发自己的深度学习引擎。
在下一个视频中,我们将讨论这对开发所需技能概况意味着什么。
深度学习应用。[BLANK_AUDIO]。
P106:5_AI技能的经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
TensorFlow及类似软件包的发布。
显著改变了企业实施深度学习解决方案所需的人才结构。
此外,使用这些类型的软件变得越来越简单。
因为越来越好的用户界面正在被开发,以利用这些框架。
这些类型框架的开发。因此,从头开始开发神经网络是非常困难的。
这些软件包通过代码使得访问变得更加容易,但新界面正在被开发。
让人们可以访问这些类型的框架,有时甚至不需要使用代码。
有多种无代码工具,如谷歌的Teachable Machine。
这些框架正在被开发、研究,并介绍给世界。
使用像TensorFlow这样的框架作为后端。
但这使得人们非常非常容易构建基本的机器学习框架。
可以用于不同的任务,并部署这些任务。
这反过来又将进一步降低应用机器学习背景的入门门槛。
部署这些应用程序变得越来越容易,即使对于技能相对较少的人。
或者甚至完全没有编码背景。这就是其中一大优势。
使得人工智能的想法和创新更容易实现。
显然,有很多优秀的想法,以及创新的空间。
而且在许多行业中,许多都是未预见的。历史上一个大瓶颈当然是。
一直以来,从想法到实现,机器学习领域需要大量的软件。
以及正在提供的新工具和技能。
正在提供的新框架使得从想法直接转化为实现变得比以往任何时候都容易。
实际上实现这些想法的价值。对于员工来说,这将比以往任何时候都更容易。
在不同的行业、不同的领域,市场营销、金融、人力资源可以直接与人工智能进行互动。
这消除了重要的瓶颈,使其更接近于人人可用的目标。
使事情更接近于实现目标,为企业的各种任务提供可用性。
所以随着我们消除技能瓶颈,软件变得更易于使用。
因为使用软件所需的技能越来越少,接下来,剩下的两大要点是什么。
部署人工智能系统所需的主要是数据和计算。
我们将接下来讨论这些。[沉默]。
P107:6_AI计算的经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
随着我们看到人工智能在软件使用方面变得更容易。
就所需技能而言。
我们将看到更多的组织和更多地区用于更多的案例。
使用这些类型的技术。到目前为止,许多机器学习的进展都是由摩尔定律推动的。
这就是基本上支配技术进步的定律,涉及芯片的计算速度和存储能力。
这些进展基本上推动了最近机器学习的许多改善。
当我们思考机器学习时,虽然它正在扩展到更多组织和用例中。
机器学习的计算需求将开始超过这些计算的改善。
随着我们看到人工智能被用于更多的案例和更多的人。
我们将需要越来越多的计算能力来构建和运行这些不同应用所需的模型。
因此,作为回应,深度学习硬件的市场正在变得更好且越来越专业化。
因此,许多机器学习已从对CPU(中央处理单元)的依赖转变。
这些是通用的GPU。现在正从GPU转向更专业的硬件,如TPU。
这是一个张量处理单元(tensor processing unit),是谷歌所创造的。
此外,初创企业中专门为机器学习计算开发的AI芯片市场也十分活跃。
在消费者领域,例如苹果公司,在开发其新芯片时。
添加了一个专注于机器学习的重要组成部分。
因此,围绕定制硬件和专门化的活动和能量一直非常强劲,这种方式特别快速。
在某些情况下,当涉及到运行机器学习应用时,能源效率也是一个考虑因素。
举个例子,谷歌的TPU被专门设计用来补充tensorflow背后的某些算法逻辑。
它运行得比其他芯片更快。它的效率也比其他芯片更高。
现在,为什么要关注计算?因为这无疑是围绕人工智能的新兴背景。
如果我们考虑为什么这些公司进行投资,制造可以运行、构建和训练机器学习算法的芯片和硬件。
在未来几年中,将会有一个大规模的转变,企业将利用人工智能寻找能够提供所有后端计算的供应商。
我们考虑的许多应用需要的计算量太大,无法在组织内部运行。
或者这只是个不方便的问题。因此一些大型云服务提供商,比如亚马逊。
像谷歌、微软这样的公司,会对成为这些AI计算的云端后端非常感兴趣。
自然地,这可以说是一种互补的投资活动。
主要是开发硬件基础,以便能够高效地运行这些类型的操作。
因此能够提供专门针对AI操作的高效云服务。
而对于你可能称之为AI栈的这场斗争才刚刚开始。
当然,你可以看到亚马逊、谷歌、微软的很多活动。
还有其他方面,以确保人们理解当他们想要在云中运行AI时的需求。
这些公司能够提供后端服务以实现这一点。
新的参与者也正在进入这个市场。特斯拉最近宣布将提供这一领域的服务。
但这是一个将继续发展,特别是围绕运行机器学习算法所需的计算资源的市场。
[空白音频]。
P108:7_AI数据的经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
我们讨论过软件技能计算。
机器学习的最后一个关键输入是数据。而训练数据确实是机器学习应用的关键。
所以有一种普遍的观点认为,编码和这些其他输入确实有很大的关系。
结合差异化应用。但现实是,训练数据在深度学习性能中扮演着更重要的角色。
与几乎其他任何东西相比。因此,当我们思考时,数据的获取真的是一个关键差异化因素。
在机器学习领域的性能。与数据相关的一个细微差别是。
与深度学习和其他类型的机器学习一起。
事实证明,随着数据规模的增加,对于大多数传统的机器学习模型。
浅层机器学习模型,性能虽然提升,但在某个层面会达到瓶颈。
深度学习在这一层面上处于非常不同的状态。
事实证明,对于深度复杂的神经网络应用,性能是持续提升的。
数据规模上升已持续了很长很长时间。这意味着,对于依赖复杂深度学习网络的应用。
因此,拥有大量数据有着巨大的优势,这就是为什么你可能会听到这个词。
数据是新的石油。对于复杂的应用,例如自动驾驶汽车。
有些公司一直在收集关于如何使用这些输入数据进行自动驾驶的数据。
汽车决策已经很长时间以来都在收集大量数据。从某种意义上说。
数据是新的石油,因为它可以为这些预测提供价值。
以一种无法被许多其他公司轻易复制的方式。
所以有些公司拥有大量关于从购买到其他一切的数据资产。
模式,如果你是一个在线网站或信用卡公司,自然会搜索旅行数据。
数据。所以这些庞大的数据资产已经非常有价值。
随着数据的使用变得越来越容易,它们只会变得越来越有价值。
在机器学习的意义上做出预测。通常可以看到围绕数据收集的良性循环。
本质上,富者愈富。我指的是你拥有的数据越多。
你能构建的产品越好,构建的产品就越好。
你能开始收集的数据越多。所以在搜索引擎的案例中,例如。
我们都可能更喜欢某个特定的搜索引擎,因为。
它展示了我们想要的结果,但我们越使用,它们就能提供更多的数据。
收集数据。所以这导致了一个良性循环,在数据驱动的经济中,往往是这样的。
数据丰富的那些继续变得越来越富有,逐渐拉开与那些没有数据的人的差距。
有很多数据,但在开始和收集数据资产方面很困难。
他们需要构建出同样质量的算法。谢谢。[沉默]。
P109:8_自动机器学习的经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
我们一直在讨论数据和计算在机器学习中变得越来越重要。
在这个过程中,软件和技能的重要性可能会稍微降低。
差异化因素。下一个阶段可能会将其提升到更高的层次。
越来越多的工作流程正在被提供,真正允许人们开发机器。
学习应用几乎没有软件或技能专业知识可用。
例如,AutoML 或者说自动化机器学习,基本上是一个将。
我们如何看待机器学习,从数据收集到清理再到标记。
数据准备和特征工程结合在一起,然后运行模型并进行优化的工作流程。
查看预测。AutoML 将该工作流程基本上接管几乎所有步骤。
你需要做的就是获取数据,然后运行它直到得到预测。
AutoML 的工作方式本质上是不断投入计算,直到它。
它可以替代许多不同类型的专业知识。
所以 AutoML 能够对这个问题进行大量计算,从而尝试不同的变体。
直到它找出最佳模型。所以你甚至不需要指定要运行的模型。
它也会找出最佳模型。它只是在这个问题上投入了大量计算。
你只需指定数据以及你想要预测的标签。
而且,AutoML 是 Google 开发的一款产品。
这可以通过 Google Cloud 运行。因此这里的想法是,我们从 Google 的人那里听到的关于 AutoML 的讨论。
这个想法是,他们将能够利用计算能力来替代机器学习的需求。
任何类型的专业知识,只是让运行变得越来越简单。如果你按照工作流程进行。
你只需要以正确的格式上传数据。
到那个时候,实际上只有一个选项。你上传带有训练标签的数据。
只剩下一个选项,那就是训练模型。
因此,它使得这个过程变得极其容易实现,但在计算上却非常非常消耗资源。
资源。
因此,例如,如果我通过 AutoML 运行模型,我已经做过好几次,如果我上传。
我将数据输入,训练模型。然后在几个小时内,我会收到一封包含结果的电子邮件。
所以 Google 基本上会尝试不同的模型,告诉我哪个是最佳的。我会得到结果。
当然,我也会收到账单。所以这是通过他们的云服务运行的。
我正在利用他们的计算来运行这个模型。使得这一切比以往任何时候都更简单。
但它将一些我所需的专业知识成本转移到了后端的计算上。
他们只需将结果发送到电子邮件,并附上云服务的账单。
所使用的技术。因此,实际上这意味着用越来越多的原始计算能力来交换专业知识。
现在,我们谈到了 AutoML,但还有许多不同类型的自动化机器学习。
从不同公司出现的学习。微软称之为自动化机器学习。
亚马逊提到 SageMaker,Autopilot,IBM 则称之为 AutoAI。
这些不同的公司正在开发不同的工作流程,使其变得越来越简单。
对于那些专业知识较少但有强大数据和预测需求的人来说。
以一种能够做出有效算法决策的方式整合 AI。这些当然会有影响。
这只会对市场、机器学习、技能和计算产生进一步的影响。
我们本质上正在朝着一个生态系统发展,任何人都应该能够部署 AI 解决方案。
但对计算和数据资产的需求将会更高。
正如我们接下来将讨论的,也许对于能够上下文化和解释数据的人。
AI 预测。[BLANK_AUDIO]。
P11:10_机器学习的详细视图.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
你好,在这次讲座中,我们将深入探讨机器学习的细节。
特别是,我会尽量提供机器学习的高层次视角,以及它的驱动因素。
机器学习模型的准确性。在这个讨论中。
我将专注于监督学习技术。这是有充分理由的。
如果我们观察AI的实践,我会说几乎90%甚至更高。
90%的实际商业AI应用往往是机器学习。
如果你查看机器学习,几乎90%的机器学习实践。
通常是监督机器学习。所以在一个非常高层次的讨论中,机器学习。
我会将注意力集中在监督学习算法上。正如我之前提到的。
编辑得分,监督机器学习就是处理一组数据。
输入变量和预测某个结果变量。
现在我们在现实生活中经常这样做。例如。
如果你观察到乌云密布和强风,我们可以预测可能会下雨。
或者我们可能会看看某人穿着的衣服,或者更好的是,他们如何互动。
和我们在一起。我们可能会对我们是否可能成为好朋友做出一些推测或预测。
在与他们的工作场所中,我们可能会查看一个人的教育背景。
我们可能会查看他们的工作经验和技能,预测他们是否会成功。
在工作中。这些都是我们日常解决的典型预测问题。
现在,这些预测有许多商业应用。例如。
在商业环境中,我们试图预测某人是否会购买产品。
我们试图预测某人是否会点击或添加。
如果我们有良好的训练,所有这些预测都可以通过监督学习来实现。
数据。让我们考虑一个例子。假设我们有关于用户访问我们网站的数据。
我们可能知道他们过去在我们网站上查看了多少页面。
我们可能根据他们的IP地址知道他们的邮政编码。
我们可能知道他们是从哪个设备访问我们的页面。
我们可能还知道该设备的操作系统。最终。
我们试图预测这个人是否会购买产品,或者不会。
现在这是一个典型的预测问题。至于我们关于用户的数据。
这意味着我们用来做预测的输入数据。
一般将这些输入数据称为我们模型的预测变量或特征。
有时仅仅是数据和模型的变量或协变量。
有许多不同的名称,但最终我们可以将所有这些变量视为。
我们模型的输入。现在给定这些输入,我们也在试图预测某些东西。
这是我们模型的输出或结果变量。
所以我们可能用字母 X 描述输入变量,我们可能描述结果。
用字母 Y 表示变量。现在我们面临的预测问题是,我们试图弄清楚给定输入。
X 我们试图预测 Y。也就是说,我们试图弄清楚某个函数 F,它将 X 作为输入并预测。
Y。监督机器学习的整个任务归结为提出一个高准确度的。
这个函数 F 的近似,以便我们能够在给定情况下尽可能准确地预测 Y。
输入 X。现在准确性的概念内嵌在我刚刚描述的内容中。
对于任何预测问题,我们将准确性视为本质上是衡量预测。
预测的真实性或预测与现实的接近程度。
比如说,如果我们试图预测一个人是否会购买,如果我们进行。
如果有100次预测,其中93次是正确的,我们可能会说这个预测。
我们模型的准确性为93%。我们希望这个预测准确性尽可能高,因此自然问题是。
询问是什么驱动模型的预测准确性。
驱动机器学习模型准确性的一个因素是数据的数量,意味着。
我们作为模型输入的不同观测数量。
比如说,如果我们只有过去访问过我们网站的100个客户的数据。
我们很难对未来客户做出准确的预测。
基于这100个用户的观察,访问我们的网站。
另一方面,如果我们有一百万用户的数据,那么我们会有更多的数据,因此显然。
更多的观测有助于提高我们模型的准确性。
预测准确性的另一个驱动因素是我们对每个观测的了解有多少。
现在在我刚刚描述的例子中,对于每个消费者,我们只知道页面的数量。
他们过去的浏览记录,我们知道他们使用的操作系统,我们还恰好知道。
它们的位置。但这些数据量可能不足以让我们实际做出预测。
另一方面,如果我们有关于每个用户更多的数据,比如我们知道。
用户的兴趣,我们还知道这个人的收入水平,我们还恰好知道是否。
他们过去曾在我们网站上购物,以及更多类似的观测。
那么我们模型的预测准确性可能会显著提高。
换句话说,似乎驱动模型准确性的两个因素是数量。
行的数量我们可以视为数据点的数量,以及列的数量。
我们可以将其视为可用特征的数量或每行中的 x 变量数量。
它们共同驱动机器学习模型的准确性,以非常显著的方式。
但这绝不是唯一的两个因素,还有许多其他因素,例如如何。
相关的信息是你拥有的。如果我们试图预测今天是否会下雨。
了解今天有多少人带着伞,比仅仅知道衣服的颜色更有用。
人们穿的衣服。因此,显然拥有更多相关数据是重要的。
同样,模型的复杂性也很重要,如果我们限制使用非常简单的。
模型可能无法捕捉到非常复杂的关系。
在环境中。因此,一些更现代的机器学习方法,如深度学习,我将描述。
在后续的讲座中,我们将能够建立更灵活和更复杂的关系。
输入变量和结果变量,这有助于提高预测准确性。
模型的另一个因素是所谓的特征工程。
本质上,这是分析师利用其领域知识创造新特征的能力。
作为结果预测的特征或新的输入变量。
这归结为拥有深厚的领域知识,并识别我们可能添加的新数据。
以便于我们的数据集,或者我们如何变换数据集以更好地进行预测。
总之,驱动机器学习模型成功的因素有很多。
当然,人们必须考虑许多这些因素。
一切都始于拥有高质量和大量的数据,包含许多行和许多。
列的数量。在下次讲座中,我们将讨论一些具体的机器学习算法,以便于。
让你更好地理解这些机器学习算法究竟是做什么的。[BLANK_AUDIO]
P110:9_自动机器学习的傲慢经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
关于推出自动机器学习等工具的讨论之一,这使得工具变得极其。
对几乎所有拥有强大数据集的人来说,开发AI应用变得简单。
是人工智能在某种意义上是否过于简单的问题。
这意味着,与人工智能的偏见或潜在误用相关的问题。
对人工智能的理解不足可能会加剧使用者的问题,尤其是对算法的运作。
构建这些工具时,任何构建算法的人都必须稍微深入。
理解数据内部结构的能力,了解数据问题可能出现的位置以及预测。
引擎可能会面临与数据相关的问题,或者它们可能产生。
偏见或误导性的结果。借助自动机器学习,这一切发生得如此简单,问题随之而来:我们能否足够关注。
在部署之前,从用户的角度关注算法正在做什么。
真正做好治理,确保我们没有将不当内容投入生产。
导致社会伤害的算法。关于自动机器学习傲慢的问题引发了许多担忧。
这种对内部运作缺乏理解的观点将导致问题,尤其是在。
如果我们围绕人工智能发展出一种傲慢,尤其是在人工智能特别。
部署或投入生产变得容易。这可能会推动能够应对其影响的人迅速增加。
关于算法决策的内容。对更安全的人工智能伦理学家或真正理解决策过程的人可能有更高的需求。
是如何得出结论的,并思考这从算法的角度意味着什么。
一些陷阱和危险点可能存在。谢谢。[BLANK_AUDIO]
P111:10_AI的竞争影响经济学.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
思考日益增强的竞争影响也是很重要的。
在算法决策制定中对数据和计算的影响。
我们讨论过数据在某种意义上存在令人担忧的规模经济。
拥有更好数据的公司或组织能够在某种程度上收集更好的数据。
成为一个良性循环。我们已经注意到在数据经济和数字经济中显著的平台。
影响是富者越富,数据经济可能只会加剧这一现象。
这些。
我们确实看到,在过去十年左右,市场集中度不断增加。
在相对较小的一组技术密集型数据丰富的公司之间分享和经济学。
机器学习的潜力进一步放大这一问题。
由此产生的副产品是,我们在近几年看到的另一件事是,摆动的钟摆。
公众舆论在我们对数据资产的感受上开始有所转变。
这些公司所拥有的个人数据的使用可能用于推荐或开发产品。
所以公众舆论和政策制定者的观点有了些许变化。
以及这些数据关系周围的情况。因此,围绕数据可移植性等事宜已经有了一些立法倡议。
一些倡议使平台必须向用户提供对其的访问。
以便他们可以更轻松地将数据转移到其他平台或网络。
越来越多的领导者正在就技术是否应该。
受到更严格的监管,是否对技术规模过大存在严重担忧。
在公司、公司规模和权力方面也是如此。
现在有一些领导者正在围绕数据的问题进行竞选。
所有权以及数据是否真的应该属于这些平台,是否应该。
属于提供这些数据的用户。
所以,竞争影响、政策影响以及当然还有其他方面正在不断增加。
随着向数据和计算转变而产生的监管影响。
机器学习经济。谢谢。[BLANK_AUDIO]。
P112:11_Apoorv Saxena访谈.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
我们谈过使用投资组合来管理AI项目。
我们讨论过机器学习的民主化进程。
这是我与曾在此工作的Appur Saxena广泛撰写的主题。
谷歌并实施了许多AI倡议。
目前他是摩根大通的全球人工智能负责人。
我们撰写的这些文章作为本课程的一部分,提供为可选阅读。
我鼓励大家去看看它。现在让我们与Appur进行对话。
所以Appur作为全球AI负责人,显然你个人。
但你的组织整体上在AI方面投入很多。当公司在AI方面大量投资时。
问题是,你需要具备哪些条件才能获得回报?
因为正如我们所见,许多公司正在投资于AI。
但不仅仅是看到回报。所以告诉我们你对此的看法。
你认为哪种AI战略有效,并且可能在长远中产生回报?
这是一个非常好的观点。我认为要注意的一点是,开始AI是非常简单的。
我觉得你实际上可以雇佣几位数据科学家。
给他们一台笔记本电脑,他们应该能够启动并运行AI或。
从事机器学习或数据科学。我认为你需要关注的是如何产生巨大的影响。
AI的变革性影响?我认为我们看到的有效方式有三种。
首先,你必须具备合适的基础设施以规模化开展AI。这意味着什么?
本质上,这意味着要有数据就位。数据要易于发现,易于标注。
然后是训练模型的能力,大规模模型的能力。
所以这基本上就是我所称的AI基础设施。和Facebook,谷歌。
世界在这方面投入了大量资金。这就是他们能够超越行业的原因。
第二部分是你必须从头到尾审视你的业务流程。
观点并看看AI如何应用于整体流程。
而不是整体流程的一小部分。第三部分我会说。
你必须提出方案,并且可以利用AI,也应该利用AI来创造新的数字体验。
这就是你将随着时间推移看到最大影响的地方。
你能通过AI创造出什么样的新数字体验?
我认为AI一直无法做到的事情,但也能做出惊人的成果。
通过对话创造新体验。语音转文本的准确性大幅提高。
生成新文本的能力,完全由AI生成的文本大幅增加。
现在你可以想到在两三年前根本不可能的体验。
就在两三年前。因此正确的例子。
如果你在私营领域讨论,有很多低接触的机会。
高频交易通常是银行希望自动化的。例如,嘿。
你早上醒来想检查你的投资组合,看看情况如何,为什么下跌?
所以你醒来,跟Alexa对话,这个数字助手,告诉她。
为什么我的投资组合下跌了百分之二?然后AI助手会分析你的投资组合。
它提供非常合理的原因来解释为什么下跌,并给你提供交易信息。当然。
在这一切体验中,如果你想深入探讨,能够深入了解。
你实际上打电话给你的财富顾问。但这就是我们所讨论的那种体验。
所以显然可以清楚地看到如何应用AI来改善现有的体验。
但当你谈论创造新体验时,你具体指的是什么?
所以AI使得如何与之互动的体验发生了彻底的变革。
与机器对话以及如何生成新的文本,机器生成的文本。
所以这两项进展可以转变你与银行的互动方式。举个例子。
通常与之的低接触、高频率的互动。
你的私人财富顾问通常是银行希望自动化的内容。
这方面的一个例子是,你早上醒来,通过你的Alexa对话。
通过Alexa联系银行,询问,嘿,我的投资组合今天表现如何?我昨天的表现如何?
然后它会说,嘿,下跌了百分之二,然后你开始更深入地挖掘,嘿。
为什么下跌了百分之二?它告诉你你的投资组合是如何构建的。
这就是下跌的原因,依此类推。
这种交互非常低接触,但频率非常高。
但今天你可以轻松自动化的事情。
这就是我所说的体验。>> 好吧,我们就这样吧。
三个支柱如同建议的那样。第一个是在我们开始大型AI项目之前。
确保基础设施、数据基础设施和平台到位。
第二,不要单独考虑个别接触点,而是。
实际上,考虑整个端到端的流程,看看AI如何改变这一切。
整个流程。最后,利用AI确实可以转变现有体验,但。
还要认真考虑AI如何为你创造全新的体验。
客户的体验可以是战略性的,也是公司改变游戏规则的关键。>> 向上。
再次感谢你们的参与。>> 感谢你们的邀请。[BLANK_AUDIO]。
P113:12_组织架构中的AI.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
我们已经谈到构建投资组合是AI策略的重要组成部分。
作为他们AI策略的一部分,管理者还能做哪些事情?在本讲座中。
我们将探索一些这些策略。BCG和MIT对高管进行了调查,询问他们的AI策略。
特别是,他们询问了那些从AI投资中获得成果的公司。
他们做了哪些事情?以下是一些似乎对这个群体有效的策略。
第一个原则是AI策略整合,即你可以整合。
将AI策略融入更广泛的组织战略中。
许多公司为AI单独制定了策略。换句话说。
他们将使用AI视为一个独立的目标。相比之下。
更有效的策略是将AI概念化并设想在。
在更广泛的组织战略背景下。所以无论你想用AI做什么,都基于更广泛的战略目标。
组织以及AI如何帮助推动这一进程。
当然,现在重要的是意识到,尽管我们希望长期内实现整合。
对于公司而言,从不太整合和不太雄心勃勃的目标开始是可以的。
在短期内作为建立共识和获取一些AI技能的方式。
所以在短期内拥有其中一些是可以的,但即便如此你也希望有一些。
与整体长期策略相整合或对齐的长期倡议。
作为一个组织。第二个关键原则是,能够有效利用AI并获得收益的组织。
从AI中获得价值的公司不仅关注AI的成本效益,而是利用AI来推动。
增长或收入。因此,不太有效的策略就是仅仅将AI视为降低成本的工具。
相比之下,利用AI承担风险的公司追求更高的风险和更高的。
回报项目是那些从AI中看到回报的项目。
同样,另一个非常重要的想法是,为了在AI上取得成功,你需要。
拥有合适的基础设施至关重要。而最重要的基础设施是数据基础设施。
真正考虑在多个部门整合数据资产的公司。
在组织内拥有多个产品和多个数据源的公司才是那些。
正在取得成效。换句话说,如果你的数据仍然孤立,并且被个别部门孤立使用。
如果各部门孤立运作,整个组织不太可能从AI中获得显著收益。
相比之下,那些在AI上取得成功的公司是那些努力进行整合的公司。
他们的数据。请回忆在早期模块中,我们谈到过数据仓储作为其中的一种方式。
是可以完成的。数据仓储涉及将来自不同来源的数据整合到一个单一的存储库中。
这是一个容易访问的分析应用程序。这是一个非常重要的练习。
投资数据基础设施是一个非常重要的练习,因为没有它。
否则你只能获得一个非常分散的客户或组织本身的视图。接下来。
我们不仅应该考虑生产 AI,还应该考虑作为一个组织如何使用 AI。
我们的意思是,虽然拥有数据科学家和机器学习专家很重要。
正在创造新的机器学习能力的专家,我们也希望有消费者。
在业务中利用 AI,这意味着经理们将消耗这些洞察。
机器学习的数据科学并从中做出管理决策。
为了做到这一点,你需要有数据基因的经理。
所以并不是所有经理都有这种素质。这可能也涉及一定程度的再培训。
你需要与数据科学家紧密合作并努力的经理。
理解数据分析的结果,挑战数据分析的对象,以及谁。
他们将自己的领域知识带入数据分析中。
所有这些都是必要的,以便你不仅有数据科学家在内部创造 AI。
组织中有经理在消费数据科学和 AI 的洞察。接下来。
投资人才非常重要。这个原则我之前提到过。
但是如果你有一个孤立的四到五个数据科学家的团队,我们就无法在 AI 上取得成功。
你需要在整个组织中拥有 AI 知识、理解和洞察力。
这既包括在组织内招聘新的 AI 人才,也包括重新培训现有的人才。
员工以及教他们如何在自己的工作中最佳利用 AI。
所以我提到了一些帮助转型组织所需的不同原则。
关于 AI 的思考。这包括帮助创造组织学习的想法。
还使用投资组合来。
追求多个项目,将你的 AI 战略与更广泛的组织战略结合起来。
建立一个数据基础设施,以便你可以利用它进行 AI 努力等等。
但是在提到所有这些 AI 机会的同时,我们也必须考虑某些。
AI 的风险。在接下来的几节课中,我们将讨论这些 AI 特有的风险,以及如何创建。
一个治理框架来管理这些风险。[BLANK_AUDIO]。
P114:13_Barkha Saxena访谈.zh_en - GPT中英字幕课程资源 - BV1Ju4y157dK
在2001年网络泡沫末期,Barka Saxena开始了她的数据科学职业生涯。
现在她是Poshmark的首席数据官,Poshmark是一家领先的新旧风格社交市场。
通过结合实体购物的人际连接,结合规模和便利性。
电子商务的选择优势,Poshmark让买卖变得简单而社交。
而且可持续。生态系统中的每个人都是潜在的。
在市场的两边,作为买家和卖家。Barka,欢迎。 - 谢谢你,Mary。
感谢如此精彩的介绍。嗯,我非常兴奋不仅能谈谈你的职业生涯。
但是你在Poshmark的影响力。发生了很多事情。
尽管今年受到疫情的影响,但仍然如此。因此让我们从你的角度开始。
你能告诉我们一些关于你在Poshmark担任首席数据官的当前角色吗?
你和你的团队自加入以来产生的影响? - 是的,绝对如此。
所以我负责Poshmark的整体数据策略,并管理一个集中化的团队。
数据科学家、机器学习、分析和数据工具的领域。
我们在所有业务职能中工作。我的团队的任务是提供更高的投资回报率。
以更快的速度。我在2014年加入了Poshmark,那时它还处于起步阶段。
从大约30到35人的小公司开始,到今天我们刚刚上市。
这是一段漫长的旅程。吸引我来到Poshmark的是Manisha的强大愿景。
在移动空间中将社交引入商业。如果你想想。
那是移动商务的早期阶段。我清晰地看到了数据将发挥的作用。
在那个领域。像今天,我们是一家拥有超过8000万用户的公司。
我们有超过3亿个产品,来自9000多个品牌。
我们的用户每天在平台上花费27分钟。到了2020年。
我们看到了来自这些用户的300亿次互动。所以你可以想象它创造的数据量。
而在其中是机会,能够跨越所有业务职能工作。
从市场营销到产品到运营到社区服务。
并利用这些数据为我们的买家和卖家提供美好的体验。所以,是的。
在过去七年里我们一直很忙,从建立数据基础设施开始。
这是我做的第一件事,现在只是提供许多数据解决方案。
从分析、统计分析到机器学习模型等各种类型。
为每个职能带来很多价值。 - 我认为这就是你所建立的。
所有不同的问题你必须处理,基本上在一夜之间因为疫情。
这真的帮助我们深入了解,逐渐剥离出更深的层次。
我真正想和你谈的第一件事是,帮助你的算法。
通过你的运营效率,服务你的客户,吸引你的用户。
所以在你的生态系统中的客户,可能同时是两方。
你在市场上的买家和卖家。你是如何训练算法的。
识别消费者的数据,可能同时是买方和卖方。
我相信这种情况经常发生。所以如果你能稍微告诉我们一些。
在不泄露你们秘密的方法的情况下,更详细地说明。
你和你的团队如何训练这些模型,以识别数据的细微差别。
供应商可以在卖方找到的利益。- 如果这是种很好的感觉。
我们发现这是平台的一大优势,因为人们在同一平台上买卖。
所以他们非常投入。要回答一个具体的问题,比如,我们如何训练算法?
玛丽,你和许多其他从业者交谈过,我相信你对此有所了解。
所有这些问题的答案,从数据本身开始。
如果没有数据,算法将无所作为。所以我们所做的,如我所提到的。
我在Poshmark的旅程始于构建数据基础设施。就像。
在构建过程中,我们建立了数据基础设施。
这是一个经过深思熟虑的事件模式,你用它来收集新数据。
以及在数据建模方面,你是如何丰富数据的。
最后一步是数据表,数据存储的方式。
无论是临时的还是实时的。但我们花费了大量时间和精力。
花费了很多小时的对话,来构思结构,即使它是相同的。
我们在收集所有信息和卖方意图。通过使用这些。
仅仅拥有数据基础设施,使我们能够区分。
这就是第一步。从这里开始,当我们开始建立这些算法时。
一切从,嘿,我们到底想做什么开始?在建立算法之前。
你心中有一个商业问题。如果那个商业问题是以购买为中心。
然后我们创建我们的特征,经过整个特征工程等。
以这样的方式,你主要关注购买网站的功能。举个例子。
我们有一个美丽的个人推荐,去往公司的推荐,每天推荐。
所有买家一套策划好的项目,适合你的品味。
基于你过去提供的所有信号。当我们为此提取数据时。
我们只提取与您的购买行为相关的数据。所以关注。
无论是社交联系,还是商业行为或喜欢等。
你在其他人的衣橱、其他人的物品上所做的,而不是在你的类别内。
因为我们在寻找信号,关于你和谁互动。
因为当你去其他人的衣橱时,那是你对购买物品感兴趣的时候。
所以我们使用信号的买方侧。再说一次,数据基础设施。
我们存储数据的方式使我们能够从买方侧提取数据。
以销售网站为例,我们有列表评分。
我们试图了解列表的质量。
这就是卖方行为重要的地方。
这就是我们知道卖家分享的内容,卖家关注的人。
当你创建内容时,有很多相关的信息。
因此,我们提取卖方侧的属性,以创建特征来构建模型。
当然,每个算法的目标函数。
确保我们在为买方侧而非卖方侧进行培训。这样说来。
在某些情况下,我们确实需要一起考虑双方。
客户细分中,我们有这种核心用户细分,这是一个案例。
因为当你想到核心用户时,你并不是说核心买家或核心卖家,对吗?
你在谈论核心用户。这就是我们实际创建特征的地方。
来自双方的合作。我们训练这些算法。
基于多个目标函数。在完成这项工作后。
我们实际上与双方的业务利益相关者进行了很多讨论。
获取他们的反馈。这些地方,我认为商业专长。
知识确实很重要。有时我可能会称之为。
像是特征的精挑细选,这为我们提供了双方的良好视角。
然后我们最终训练模型,以便我们能够描绘出核心用户的图像,具有不同的维度。
但我通常是一个很大支持人们所称的可解释AI的支持者。
我需要能够向任何人解释最复杂的模型,用简单的英语。
如果我需要的话。但是,当你面临这种情况时,这就变得更加关键。
每个用户从买方和卖方的两个不同视角被观察。
- 我认为这真的帮助我们理解你是如何。
你如何框定和分类你的数据,并组织你的数据。
因此,它可以在双方使用。但这确实是这些买方信号。
当他们查看他人的衣橱时,你确定了这就是意图。
然后与主题专家合作。
或专家关于哪些具体数据片段或数据对象。
对回答问题至关重要。我怀疑如果你能谈谈。
当你谈论模型的可解释性时。
这是Poshmark内的一个目标,不仅仅是你的团队,还有这些。
主题专家,让人们理解这些模型是如何工作的。
或者可解释性只是局限于你的团队,他们能够解释模型。
每个人都明白这些模型在Poshmark内是如何工作的吗?- 是的,实际上我们。
这是一个有意识的努力,没有任何模型会被称为最终模型。
在经过我们称之为业务团队的审核之前。
他们可能是商业利益相关者,或者可能是产品团队。
因为在这个领域工作了 20 多年,从人们那里听到这一点非常有价值。
这些人在日常工作中进行此项工作。当你尝试构建某样东西时。
关于客户留存,你真的需要和市场人员交谈。
采取这些行动的人,因为他们有一些学习,这将帮助我们确保。
你正在构建一个模型,这个模型能够经得起时间的考验。
这不仅仅是完全由历史数据驱动。
一旦市场人员改变了策略,这种情况就会发生变化。
所以将他们纳入其中是非常重要的。
这就是我们组建团队并建立流程的原因,让它成为书面流程的一部分。
在经过审核之前,是不会完成的。- 好吧,Tiffany,你能解释一下吗?
但你能解释一下为什么 Poshmark 的移动应用从一开始就非常重要吗?
在早期与买家的互动中,这一点非常重要。关于这一点的第二个问题是。
AI 和机器学习如何真正促进买家的无缝旅程?- 是的。
好问题。老实说,我已经,我是说,我在 Poshmark 时。
当时你们已经在实施移动战略。所以我也对 Manish 的远见感到惊讶。
所以在 2010 年,他开始参与 Poshmark 时。
网络曾是人们购物的主要方式。移动端虽然出现了,但并不是很好。
人们会在网上找到东西,然后他们会稍微使用一下移动设备,对吧?
也许你正在重新检查某些东西,等等。但他明显看到随着移动电话的持续发展。
为了改善,这将是人们购物的方式。所以他基本上押注于移动端。
这是将成为人们主要购物的设备。
当 iPhone 4 发布时,那是第一款手机。
这款产品配备了优秀的相机和良好的视觉效果,屏幕也很出色,可以查看物品。
质量确实很高。这就是为什么变得非常明确。
现在我们准备下注,因为看起来这是一种设备。
许多人认为可以实现的事情。所以我们全力投入了移动优先的战略。
我们的用户对此作出了回应,因为从购买的角度来看。
他们发现能轻松滚动许多列表和各种风格,真是太方便了。
你不必坐着。而这就是时尚发展的方向,对吧?
当你获得时尚灵感时,它可以在任何地方发生,对吧?
它不会等你回到家。因此,偏见确实对此有所反应。
卖家们喜欢能随时随地快速拍照的便利。
能够在60秒内列出商品。所以从双方的角度来看都很有效。
但我会说这是一种恶意的视野,以及他对移动设备的押注。
我想他对苹果非常有信心,推出了那款美丽的手机。
- 所以我喜欢你如何分类,他真的有后艺术的信条,与时尚相结合。
而且由于这个前瞻性,利用它作为一个如此关键的平台。
你能否再多解释一下,机器学习方面的情况。
你是否需要加大对机器学习和人工智能的投入,使之成为无缝的旅程。
或者你团队当前的压力是什么,以确保这一过程是成功的。
在疫情结束后你们会如何前进? - 是的,确实如此。
正如我提到的数据量,对吗?当你有300亿次互动时。
在平台上发生的事情,你需要能够利用这些数据。
因为这是你能够为用户提供无缝体验的唯一方式。
但当你作为买家进入平台时,你会看到个性化信息流。
你希望它个性化为你喜欢的东西,你会期望,嘿。
我已经使用你的平台这么长时间,你显然知道我喜欢什么。
我不喜欢,所以为我个性化处理。同样,当你搜索时。
两个人可以在“黑色”这个词上搜索,但他们期望不同的东西,对吧?
根据上下文。因此,用户期望我们应该提供的内容。
所以我们对此作出回应,唯一的回应方式是,当你有超过8000万用户时。
而你所拥有的数据量,实际上是用来利用这些数据。
你利用过去的信号,提供买家体验,使其为你量身定制。
但同时你仍然留有发现的空间,对吧?否则。
如果你只是不断向用户展示他们过去的互动。
你将如何接触新事物?所以我们在推荐中平衡了这两者。
因为Poshmark也是一个寻找新时尚灵感的地方,对吧?所以,我的意思是。
使用机器学习,在各种购物体验中提供那种体验,我会说。
不是渠道,但你知道,买家在跟踪时有很多方式。
无论是个性化信息流,还是我们给你推荐,或者你在搜索。
但基本上就是你与买家的互动方式。当涉及到卖方时。
他们创建所有这些列表,并在市场营销上投入所有时间。
它们在平台上的列表,无论是通过分享还是互动。
与买家一对一,他们提供这些折扣。
这就是我们利用所有数据,帮助我们的卖家提高效率的地方。
当他们想要提供折扣时。
Poshmark为其配备了某种运输折扣。
这增加了他们能够以更快的速度销售商品的机会。再一次。
像这样,拥有超过两亿个正在销售的商品,这些商品在Poshmark上列出。
我们需要引入数据和机器学习,以确保商品在销售。
最终,它回归到,我喜欢称之为的。
这是买家和卖家之间的匹配,或者是商品与买家所寻找的东西之间的匹配。
唯一能做到这一点的方法是,像我们内部使用的这些鸟。
比如需求匹配和供应匹配。没有其他高效的方式。
或以高质量而不使用机器学习。
机器学习之所以有用,是因为数据如此庞大。
你不能写规则来处理它。你需要构建智能。
以这样的方式引入它,随着时间的推移,它将继续学习,变得越来越好。
随着我们对用户了解得更多,及对环境中变化趋势的更多了解。
我们处于一个幸运的位置,用户给我们提供了如此多的数据。
幸运的是,我们在管理和维护数据方面做得很好。
并以一种方式构建它,以便我们可以利用它。与此同时,像。
你知道,一些过程等,我曾提到过的,我谈到过,像。
你知道,在解决任何问题之前,我们从最上面开始。
我们试图解决的商业问题是什么。信不信由你,很多时候。
人们实际上没有花足够的时间在那里。然后你可能最终构建一个模型。
这并不完全解决问题。所以我们非常执着于花费大量时间。
精确聚焦于,好的,这正是我们要解决的问题。
然后我们从架构图的角度来看。
从怎样与决策整合的角度来看。
有时这是一个产品特性。有时是你所提供的某些东西。
向你的市场经理或产品经理。
谁会利用它来做决策。但整个画面必须清晰。
在你真正开始提取数据,构建模型之前。
然后我与商业利益相关者和内部人员讨论了整个视频过程。
我们在这方面花了很多时间。再次,目标是,随着Poshma的不断扩展。
用户不断给我们更多信号。事物必须自动继续扩展。
所以并不是说我们必须拆除并重建。我们必须建立这个。
以这种增长和扩展为目标进行构建,以便我们能继续延迟。
通过我们的买家,提供他们期望的这种令人惊叹的体验。- 就是这样。
非常感谢你今天的时间,巴尔卡。- 谢谢,玛丽。
与你交谈总是一种愉悦。(嗡嗡声),(嗡嗡声)。
标签:机器,人工智能,我们,学习,AI,沃顿,数据,商学院 From: https://www.cnblogs.com/apachecn/p/18486871