由于LLM的发展, 很多的数据集都是以DF的形式发布的,所以通过Pandas操作字符串的要求变得越来越高了,所以本文将对字符串操作方法进行基准测试,看看它们是如何影响pandas的性能的。因为一旦Pandas在处理数据时超过一定限制,它们的行为就会很奇怪。
我们用Faker创建了一个100,000行的测试数据
https://avoid.overfit.cn/post/2633908f89b14e0bb14bcaab443c3fec
标签:cn,DF,测试,字符串,操作,Pandas From: https://www.cnblogs.com/deephub/p/17650413.html