代码:
1 #encoding=utf-8 2 import re 3 4 # read file 5 dic={} 6 pattern="([0-9]{6})\s+([\u4e00-\u9fa5]+)" 7 with open(r'C:\new_tdx\T0002\export\20220918.txt') as infile: 8 for line in infile: 9 list=re.findall(pattern,line) 10 if len(list)>0: 11 code=list[0][0] 12 name=list[0][1] 13 dic[code]=name 14 15 # concat lines 16 sn=0 17 lines="" 18 for code,name in dic.items(): 19 sn=sn+1 20 line=str(sn)+"."+code+" "+name+"\n" 21 lines=lines+line 22 23 # write file 24 with open(r'C:\Users\ufo\Desktop\output.txt','w') as outfile: 25 outfile.write(lines)
剖析:
这段代码是将股票行情软件导出的自选股文本文件提取股票代号和名称又存成文本文件用的。
第2行import re是载入py的正则库,程序中将用到正则来识别股票名称;
第3行到第13行意在读取导出的文件,将代号和名称放到一个字典中。py中字典初始化用开闭大括号就行,它相当于java中的哈希表,赋值时用dic[key]=value就行;
第16行到21行意在读取字典键值,将其拼接到一个字符串里面去,这个字符串最终将存到文本文件中去。py中字符串的拼接用加号就行,如a=a+‘b’
第24行到25行就是将一个字符串写入一个文本文件的标准写法。
参考链接:https://www.cnblogs.com/pyhy/p/16698107.html
END
标签:code,name,Python,list,py,lines,dic,tdxExp2 From: https://www.cnblogs.com/pyhy/p/16741747.html