首页 > 其他分享 >深度比较常见库中序列化和反序列化性能的性能差异

深度比较常见库中序列化和反序列化性能的性能差异

时间:2023-09-18 10:12:17浏览次数:45  
标签:文件大小 Newtonsoft 性能 耗时 Json 内存 库中 序列化

背景和目的

本文介绍了几个常用的序列化和反序列化库,包括System.Text.Json、Newtonsoft.Json、 Protobuf-Net、MessagePack-Net,我们将对这些库进行性能测评

库名称 介绍 Github地址
System.Text.Json .NET Core 3.0及以上版本的内置JSON库,用于读写JSON文本。它提供了高性能和低分配的功能。 System.Text.Json
Newtonsoft.Json 也被称为Json.NET,是.NET中最常用的JSON序列化库之一。它提供了灵活的方式来转换.NET对象为JSON字符串,以及将JSON字符串转换为.NET对象。 Newtonsoft.Json
Protobuf-Net .NET版本的Google's Protocol Buffers序列化库。Protocol Buffers是一种语言中立、平台中立、可扩展的序列化结构数据的方法。 Protobuf-Net
MessagePack-Net MessagePack是一个高效的二进制序列化格式,它允许你在JSON-like的格式中交换数据,但是更小、更快、更简单。 MessagePack-Net

性能测试

测评电脑配置

组件 规格
CPU 11th Gen Intel(R) Core(TM) i5-11320H
内存 40 GB DDR4 3200MHz
操作系统 Microsoft Windows 10 专业版
电源选项 已设置为高性能
软件 LINQPad 7.8.5 Beta
运行时 .NET 7.0.10

准备工作

0、导入Nuget包

1、Bogus(34.0.2)
2、MessagePack(2.5.124)
3、Newtonsoft.Json(13.0.3)
4、protobuf-net(3.2.26)
5、System.Reactive(6.0.0)

1、性能测试函数

IObservable<object> Measure(Action action, int times = 5)
{
	return Enumerable.Range(1, times).Select(i =>
	{
		var sw = Stopwatch.StartNew();

		long memory1 = GC.GetTotalMemory(true);
		long allocate1 = GC.GetTotalAllocatedBytes(true);
		{
			action();
		}
		long allocate2 = GC.GetTotalAllocatedBytes(true);
		long memory2 = GC.GetTotalMemory(true);

		sw.Stop();
		return new
		{
			次数 = i,
			分配内存 = (allocate2 - allocate1).ToString("N0"),
			内存提高 = (memory2 - memory1).ToString("N0"),
			耗时 = sw.ElapsedMilliseconds,
		};
	}).ToObservable();
}

这个测量函数的它的作用

多次执行指定的动作,并测量每次执行该动作时的内存分配和执行时间。

然后,对于每次操作,它创建并返回一个新的匿名对象,该对象包含以下属性:

次数:操作的次数。
分配内存:操作期间分配的内存量(操作结束后的已分配字节减去操作开始前的已分配字节)。
内存提高:操作期间内存的增加量(操作结束后的总内存减去操作开始前的总内存)。
耗时:操作的执行时间(以毫秒为单位)。

2、生成随机数据的函数

IEnumerable<User> WriteData()
{
	var data = new Bogus.Faker<User>()
		.RuleFor(x => x.Id, x => x.IndexFaker + 1)
		.RuleFor(x => x.Gender, x => x.Person.Gender)
		.RuleFor(x => x.FirstName, (x, u) => x.Name.FirstName(u.Gender))
		.RuleFor(x => x.LastName, (x, u) => x.Name.LastName(u.Gender))
		.RuleFor(x => x.Email, (x, u) => x.Internet.Email(u.FirstName, u.LastName))
		.RuleFor(x => x.BirthDate, x => x.Person.DateOfBirth)
		.RuleFor(x => x.Company, x => x.Person.Company.Name)
		.RuleFor(x => x.Phone, x => x.Person.Phone)
		.RuleFor(x => x.Website, x => x.Person.Website)
		.RuleFor(x => x.SSN, x => x.Person.Ssn())
		.GenerateForever().Take(6_0000);
	return data;
}

Bogus 是一个非常有用的 C# 库,它可以帮助你生成伪造的数据,或者说“假数据”。这在测试或开发阶段非常有用,你可以使用它来填充数据库,或者在没有实际用户数据的情况下测试应用程序。

如果想详细了解使用请参考 这篇文章https://www.cnblogs.com/sdflysha/p/20190821-generate-lorem-data.html

3、数据实体类

[MessagePackObject, ProtoContract]
public class User
{
    [Key(0), ProtoMember(1)]
    public int Id { get; set; }

    [Key(1), ProtoMember(2)]
    public int Gender { get; set; }

    [Key(2), ProtoMember(3)]
    public string FirstName { get; set; }

    [Key(3), ProtoMember(4)]
    public string LastName { get; set; }

    [Key(4), ProtoMember(5)]
    public string Email { get; set; }

    [Key(5), ProtoMember(6)]
    public DateTime BirthDate { get; set; }

    [Key(6), ProtoMember(7)]
    public string Company { get; set; }

    [Key(7), ProtoMember(8)]
    public string Phone { get; set; }

    [Key(8), ProtoMember(9)]
    public string Website { get; set; }

    [Key(9), ProtoMember(10)]
    public string SSN { get; set; }
}

开始性能测试

以下测试代码会加入写入文件,以模拟真实的使用场景,性能怎么样

1、System.Text.Json 性能测试

序列化测试代码

void TextJsonWrite()
{
	var data = WriteData();

	Measure(() =>
		{
			string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data1.json");
			using var file = File.Create(path);
			System.Text.Json.JsonSerializer.Serialize(file,data);
		})
	.Dump();
}

文件大小:14.3MB

测试结果

次数 分配内存 内存提高 耗时
1 1,429,688,200 67,392 2494
2 1,429,960,352 320 2610
3 1,429,596,256 8 2615
4 1,430,126,504 -64 2753
5 1,429,549,184 -432 2918

反序列化测试代码

void TextJsonRead()
{
	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data1.json");
		byte[] bytes = File.ReadAllBytes(path);
		System.Text.Json.JsonSerializer.Deserialize<List<User>>(bytes);
	}).Dump();
}

测试结果

次数 分配内存 内存提高 耗时
1 42,958,536 43,728 212
2 43,093,448 48 185
3 42,884,408 24 120
4 42,883,312 24 129
5 43,100,896 24 117

2、Newtonsoft.Json 性能测试

序列化测试代码

void JsonNetWrite()
{
	var data = WriteData();

	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data2.json");
		var jsonData = Newtonsoft.Json.JsonConvert.SerializeObject(data);
		File.WriteAllText(path, jsonData);
	})
	.Dump();
}

文件大小:14.3MB

测试结果

次数 分配内存 内存提高 耗时
1 1,494,035,696 42,608 2196
2 1,494,176,144 320 2289
3 1,494,684,672 -24 2899
4 1,494,292,376 2,152 3393
5 1,495,260,472 64 3499

反序列化测试代码

void JsonNetRead()
{
	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data2.json");
		var jsonData = File.ReadAllText(path);
		var data = Newtonsoft.Json.JsonConvert.DeserializeObject<List<User>>(jsonData);
	})
	.Dump();
}

测试结果

次数 分配内存 内存提高 耗时
1 92,556,920 63,216 275
2 92,659,784 48 314
3 92,407,736 24 245
4 92,616,912 24 276
5 92,416,128 24 305

3、ProtobufNet 性能测试

序列化测试代码

void ProtobufNetWrite()
{
	var data = WriteDataTwo();
	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data3.bin");
		using var file = File.Create(path);
		Serializer.Serialize(file, data);
	}).Dump();
}

文件大小:7.71MB

测试结果

次数 分配内存 内存提高 耗时
1 712,168 163,512 170
2 6,760 -192 111
3 7,040 280 97
4 6,760 24 66
5 244,200 0 68

反序列化测试代码

void ProtobufNetRead()
{
	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "test-data3.bin");
		using var file = File.OpenRead(path);
		Serializer.Deserialize<List<UserProtobuf>>(file);
	}
	).Dump();
}

测试结果

次数 分配内存 内存提高 耗时
1 29,485,888 1,084,240 113
2 28,242,856 48 96
3 28,340,672 24 85
4 28,333,088 24 80
5 28,242,856 24 76

4、MessagePack-Net 性能测试

序列化测试代码

void MessagePackNetWrite()
{
	var data = WriteDataThreee();
	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "UserMessagePackData.bin");
		using var file = File.Create(path);
	   	MessagePackSerializer.Serialize(file, data);
	}).Dump();
}

文件大小:7.21MB

测试结果

次数 分配内存 内存提高 耗时
1 80,552 9,512 52
2 7,432 24 46
3 7,432 24 45
4 120,400 -1,072 46
5 7,432 24 48

反序列化测试代码

void MessagePackNetRead()
{
	Measure(() =>
	{
		string path = Path.Combine(Environment.GetFolderPath(Environment.SpecialFolder.Desktop), "UserMessagePackData.bin");
		byte[] bytes = File.ReadAllBytes(path);
		MessagePackSerializer.Deserialize<List<UserMessagePack>>(bytes);
	}).Dump();
}

测试结果

次数 分配内存 内存提高 耗时
1 35,804,728 24 82
2 35,804,728 24 65
3 35,804,728 24 56
4 35,804,728 32 66
5 35,806,248 848 80

结论

序列化性能测试结果

性能测试名称 分配内存平均数 (bytes) 耗时平均数 (ms) 文件大小 (MB) 分配内存百分比 (%) 耗时百分比 (%) 文件大小百分比 (%)
Newtonsoft.Json 1,494,489,872 2,855 14.3 100 100 100
System.Text.Json 1,429,784,099 2,678 14.3 95 93.8 100
ProtobufNet 195,385 102 7.71 0.013 3.5 53.9
MessagePack-Net 44,649 47 7.21 0.0029 1.6 50.4

反序列化性能测试结果

性能测试名称 分配内存平均数 (bytes) 耗时平均数 (ms) 分配内存百分比 (%) 耗时百分比 (%)
Newtonsoft.Json 92,531,496 283 100 100
System.Text.Json 42,807,420 152 46.2 54.7
ProtobufNet 28,529,072 90 30.8 31.8
MessagePack-Net 35,805,032 69 38.6 24.3

注:

1、 分配内存比例、耗时比例和文件大小比例都以 Newtonsoft.Json 的数值为基准,计算出的百分比表示在相比于 Newtonsoft.Json 的表现。
2、 分配内存平均数、耗时平均数是通过将给定的五次测试结果取平均值得出的。
3、 文件大小是由测试代码生成的文件大小,计算出的百分比表示在相比于 Newtonsoft.Json 的表现。

基于上述表格,我们可以得出以下结论:

  1. 内存分配:在内存分配方面,ProtobufNet 和 MessagePack-Net 显著优于 System.Text.Json 和 Newtonsoft.Json。它们的内存分配仅为 Newtonsoft.Json 的 0.01% 和 0.003%,这表明它们在处理大数据时的内存效率非常高。

  2. 耗时:在耗时方面,ProtobufNet 和 MessagePack-Net 也表现出超过其他两个库的性能。ProtobufNet 的耗时为 Newtonsoft.Json 的 3.6%,而 MessagePack-Net 的耗时仅为 2.1%。这意味着它们在处理大量数据时的速度非常快。

  3. 文件大小:在生成的文件大小方面,ProtobufNet 和 MessagePack-Net 的文件大小明显小于 System.Text.Json 和 Newtonsoft.Json。ProtobufNet 和 MessagePack-Net 的文件大小分别为 Newtonsoft.Json 文件大小的 53.9% 和 50.4%。这说明它们的序列化效率更高,能够生成更小的文件。

  4. System.Text.Json vs Newtonsoft.Json:在比较这两个库时,System.Text.Json 在内存分配和耗时方面都稍微优于 Newtonsoft.Json,但差距不大。在文件大小方面,它们的表现相同。

综上所述,如果考虑内存分配、处理速度和文件大小,ProtobufNet 和 MessagePack-Net 的性能明显优于 System.Text.Json 和 Newtonsoft.Json。

5、总结

基于上面的数据,个人一些看法,虽然我们平常用的是Newtonsoft.Json,但了解一些其他一些比较好的库的使用可以扩展视野,本次测试的库虽然加入了写入文件这方面的因素,但对性能影响不是很大,本以为ProtobufNet已经是性能最好的了,但上面的测试结果,显然 MessagePack-Net 性能最好,还有一个意外发现,针对NetCore 6.0,新出的库System.Text.Json性能比Newtonsoft.Json好5%

作者 => 百宝门瞿佑明

原文地址:https://blog.baibaomen.com/深度比较常见库中序列化和反序列化性能的性能差/

标签:文件大小,Newtonsoft,性能,耗时,Json,内存,库中,序列化
From: https://www.cnblogs.com/baibaomen-org/p/17710883.html

相关文章

  • 页面输出太多会严重影响web程序的性能
    我有这样一个小程序:asp+sqlserver2000。数据量增加的很快,最近发现它的性能非常差,每次打开都需要十几秒,甚至几十秒,因为我的程序分页用的是我自己的分页程序:难道这个分页程序有问题,但是其他地方用到它没有感觉到慢呀,我没事就琢磨他,到网上查资料,结果没有具体查到说到我......
  • 序列化和反序列化
    什么是序列化?什么是反序列化?如果我们需要持久化Java对象比如将Java对象保存在文件中,或者在网络传输Java对象,这些场景都需要用到序列化。简单来说:序列化:将数据结构或对象转换成二进制字节流的过程反序列化:将在序列化过程中所生成的二进制字节流转换成数据结构或者对象......
  • destoon关于archiver归档的性能优化
    今天在处理一个项目时候发现archiver单个模块归档超过百万数据,打开速度就特慢,所以打开archiver下index.php文件进行分析,发现有句sql作怪,查询需要三四分钟,所以要修改这个。$result=$db->query("SELECTtitle,linkurl,addtimeFROM{$table}WHERE$conditionORDERBYaddtimeDES......
  • SPI、序列化、IO
    1.SPI即ServiceProviderInterface,字面意思就是:“服务提供者的接口”,我的理解是:专门提供给服务提供者或者扩展框架功能的开发者去使用的一个接口。 序列化:将数据结构或对象转换成二进制字节流的过程反序列化:将在序列化过程中所生成的二进制字节流转换成数据结构或者对象......
  • 性能测试学习笔记(二)
    1.性能指标综述通常我们都从两个层面定义性能场景的需求指标:业务指标和技术指标。这两个层面需要有映射关系,技术指标不能脱离业务指标。所有的技术指标都是在有业务场景的前提下制定的,而技术指标和业务指标之间也要有详细的换算过程。这样一来,技术指标就不会是一块飞地。同时,在......
  • destoon关于archiver归档的性能优化
     今天在处理一个项目时候发现archiver单个模块归档超过百万数据,打开速度就特慢,所以打开archiver下index.php文件进行分析,发现有句sql作怪$result=$db->query("SELECTtitle,linkurl,addtimeFROM{$table}WHERE$conditionORDERBYaddtimeDESCLIMIT$offset,$pagesize"......
  • 【wp】文件上传phar反序列化
    题目文件泄露,得到两个文件:index.php<!DOCTYPEhtml><html><head><title>JustUpload!</title><metacharset="UTF-8"><style>.container{display:flex;flex-direction:......
  • 从 MongoDb 集合中选择文档返回响应时出现不可序列化错误
    当从MongoDB集合中选择文档返回响应时出现不可序列化错误,可能是因为以下原因:数据类型不可序列化:检查文档中的数据类型是否可被序列化。某些数据类型,如日期对象或二进制数据,可能无法直接序列化为常见的数据格式(如JSON)。在这种情况下,您可能需要先对这些数据进行处理,将其转换为可序列......
  • java中使用JNA调用C/C++动态链接库中的函数
    目录C++部分创建动态库项目JAVA部分pom依赖工程结构测试类jna提供C与JAVA数据类型映射参考C++部分创建动态库项目注意:动态库中的头文件,必须要将需要导出的函数包裹在extern"C"{}中,否者在使用侧java工程中,就无法加载并使用JAVA部分pom依赖<dependencies><dependenc......
  • 深入探讨Spring Boot的性能调优
    前言SpringBoot是一个非常流行的Java开发框架,它提供了很多便利的功能,但是在高并发场景下,性能问题也是不可避免的。本文将深入探讨SpringBoot的性能调优,帮助开发者更好地优化应用程序。优化数据库连接池数据库连接池是一个非常重要的组件,它可以提高应用程序的性能。在SpringBo......