首页 > 其他分享 >深度学习库 SynapseML for .NET 发布0.1 版本

深度学习库 SynapseML for .NET 发布0.1 版本

时间:2022-11-15 17:31:20浏览次数:74  
标签:SynapseML 0.1 https Apache NET com Spark

2021年11月 微软开源一款简单的、多语言的、大规模并行的机器学习库 SynapseML(以前称为 MMLSpark),以帮助开发人员简化机器学习管道的创建。具体参见[1]​​微软深度学习库 SynapseML:可直接在系统中嵌入 45 种不同机器学习服务、支持 100 多种语言文本翻译​​。

2022年8月12日 微软在.NET 博客上发布了[2] ​​用于 .NET 的 SynapseML​​,建立在其去年 11 月首次亮相的大规模机器学习开源项目SynapseML 的基础上。作为新 SynapseML v0.10 版本的一部分,微软宣布了一组新的 .NET API,用于大规模可扩展的机器学习。 博客文章中说:“这允许我们通过 .NET for Apache Spark 语言绑定来创作、训练和使用来自 C#、F# 或 .NET 系列中的其他语言的任何 SynapseML 模型。 ”

深度学习库 SynapseML for .NET 发布0.1 版本_microsoft

SynapseML 在 Apache Spark 上运行并且需要安装 Java,因为 Spark 使用 JVM 来运行 Scala。但是,它具有针对 Python 或 R 等其他语言的绑定。当前的 0.10.0 版本添加了针对 .NET 语言的绑定。该工具可以帮助开发人员在各种 Microsoft 领域构建可扩展的智能系统,包括:

微软去年首次开源这个项目时是这么说的 ”统一的 API 标准化了当今的许多工具、框架和算法,简化了分布式 ML 体验, 这使开发人员能够为需要多个框架的用例快速构建不同的 ML 框架,例如 Web 监督学习、搜索引擎创建等。它还可以在单​​节点、多节点上训练和评估模型,以及可弹性调整大小的计算机集群,因此开发人员可以在不浪费资源的情况下扩展他们的工作。”。 这段话对于熟悉微软的另一个捐献给CNCF的 开源项目[3]​​Dapr​​ 的同学来说是不是很熟悉?

SynapseML for .NET包含在一组 SynapseML NuGet 包中。这些包尚未发布到主要的 NuGet 源,必须手动添加它们的源。安装后,即可从 .NET 应用程序调用 SynapseML API。

以下代码片段说明了如何从 C# 应用程序调用 SynapseML API。

// Create LightGBMClassifier

var lightGBMClassifier = new LightGBMClassifier()
.SetFeaturesCol("features")
.SetRawPredictionCol("rawPrediction")
.SetObjective("binary")
.SetNumLeaves(30)
.SetNumIterations(200)
.SetLabelCol("label")
.SetLeafPredictionCol("leafPrediction")
.SetFeaturesShapCol("featuresShap");// Fit the model

var lightGBMClassificationModel = lightGBMClassifier.Fit(trainDf);// Apply transformation and displayresults

lightGBMClassificationModel.Transform(testDf).Show(50);


SynapseML 允许开发人员调用其管道中的其他服务。该库支持 Microsoft 自己的[4]​​认知服务​​​,这是一组由 Microsoft 训练的模型提供支持的通用 AI 服务。此外,当前版本的 SynapseML 允许开发人员在其解决方案中利用预训练的[5]​​OpenAI​​​模型,例如用于自然语言理解和生成的[6]​​GPT-3​​以及用于代码生成的 Codex。目前使用 OpenAI 模型需要访问 Azure OpenAI 服务。

最后,当前版本增加了对[7]​​MLflow​​的支持,这是一个管理 ML 生命周期的平台。开发人员可以使用它来加载和保存模型,并在模型执行期间记录消息。

现在.NET 机器学习社区加入了一新的成员SynapseML:

  • [8]​​ML.NET​​ 是一个 .NET 库,用于使用 .NET 语言运行单机工作负载:

在 .NET 社区中,开发人员对所有这些库如何相互比较或它们是否相互替换存在混淆。SynapseML 项目成员在[16]​​Reddit​​上积极回答这些问题。

​​深度学习库 SynapseML for .NET 发布0.1 版本_.net_02​​

SynapseML 构建在​​Apache Spark for .NET​​项目之上,该项目为 Apache Spark 分布式计算框架提供 .NET 支持。Apache Spark 是用 Scala(JVM 上的一种语言)编写的,但具有 Python、R、.NET 和其他语言的语言绑定。此版本为 SynapseML 库中的所有模型和学习器添加了完整的 .NET 语言支持,因此您可以在 .NET 中创作分布式机器学习管道,以便在 Apache Spark 集群上执行。

相关链接:

[1]微软深度学习库 SynapseML:可直接在系统中嵌入 45 种不同机器学习服务、支持 100 多种语言文本翻译: ​​https://mp.weixin.qq.com/s/UBoF3wYsf5fqBsbRpHk4pg​

[2]用于 .NET 的 SynapseML: ​​https://devblogs.microsoft.com/dotnet/announcing-synapseml-for-dotnet/​

[3]Dapr: ​​http://dapr.io/​

[4]认知服务 : ​​https://azure.microsoft.com/zh-cn/services/cognitive-services/​

[5]OpenAI: ​​https://openai.com/api/​

[6]GPT-3: ​​https://en.wikipedia.org/wiki/GPT-3​

[7]MLflow: ​​https://mlflow.org/​

[8]ML.NET :​​https://dotnet.microsoft.com/zh-cn/apps/machinelearning-ai/ml-dotnet​

[9]TensorFlow.NET:​​https://github.com/SciSharp/TensorFlow.NET​

[10]Keras.NET: ​​https://github.com/SciSharp/Keras.NET​

[11]TorchSharp: ​​https://github.com/dotnet/TorchSharp​

[12]ONNX RT:​​https://github.com/microsoft/onnxruntime​

[13]Apache Spark for .NET:​​https://dotnet.microsoft.com/en-us/apps/data/spark​

[14]Microsoft Cognitive Toolkit (CNTK):​​https://docs.microsoft.com/en-us/cognitive-toolkit/using-cntk-with-csharp​

[15]Accord.NET: ​​http://accord-framework.net/​

[16]Reddit: ​​https://www.reddit.com/r/dotnet/comments/wk7zkq/microsoft_announces_new_scalable_machine_learning/​

标签:SynapseML,0.1,https,Apache,NET,com,Spark
From: https://blog.51cto.com/shanyou/5853311

相关文章