大家好,我是皮皮。
一、前言
前几天在Python白银交流群【大侠】问了一个Pandas
实战的问题,一起来看看吧。上一篇文章说到,看上去AI给的答案,似乎让【大侠】不满意,遂来白银交流群问问大佬们。这一篇文章,我们一起来看看【瑜亮老师】给的代码。
二、实现过程
粉丝的原始数据中,还是有些乱的,比方说存在空格、中文、存在*号、存在漏括号等等,若想进一步的挖掘数据,必须对原始数据进行预处理。
这里【瑜亮老师】给了具体的代码,如下图所示:
import re
import pandas as pd
result = []
# 打开原始的txt文件
with open('data.txt', 'r', encoding='utf-8') as f:
# 逐行读取原始文件
for line in f:
if '[' in line and ']' in line:
result.append(eval(line))
elif '数据' in line:
if "备注" not in line:
line = re.sub(r"[\u4e00-\u9fa5【】!\]]", "", line).strip()
result.append(eval(line))
elif "*" not in line:
line = line.replace("]", "")
result.append(eval(line))
res = [result[i:i+3] for i in range(0, len(result), 3)]
df = pd.DataFrame(res)
df = df.explode([1, 2], ignore_index=True)
df.columns = ["日期", "股票代码", "data"]
print(df)
df.to_excel("data.xlsx")
代码运行之后,可以得到预期的结果,如下图所示:
后来粉丝按照上述思路,顺利地解决了粉丝的问题。事实证明,能让AI都无法解决的代码问题,大都是自己并没有问清楚,论准确表达的重要性。
三、总结
大家好,我是皮皮。这篇文章主要盘点了一个Pandas
实战的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。
最后感谢粉丝【大侠】提出的问题,感谢【巭孬
标签:yyds,粉丝,Python,代码,df,盘点,result,line,append From: https://blog.51cto.com/u_13389043/9134228