power query索引列、重复列、拆分和提取
一、索引列
1、 进入PQ编辑器 2、添加索引列 添加列——索引列——可自定义索引列二、重复列
功能:数据清洗时想保证数据的完整性,但又需要对某些列进行拆分、提取等操作时,一般先重复想处理的列 1、添加列——选中要重复的列——点击‘重复列’三、拆分列
功能:数据清洗中需要一列数据中的某个特定部分时,常采用拆分列。
1、 按分隔符拆分 转换——拆分列——按分隔符拆分(可按分隔符位置分裂)—确定2、按字符数拆分
转换——拆分列——按字符数拆分(可选拆分位置和次数)—确定3、按位置拆分
转换——拆分列——按字符数拆分—在对话框里编辑拆分位置索引(“0英文逗号2”即拆分从0号位置开始到2之前的字符)—确定
注意:字符串中字符的位置编号从0开始。四、提取
功能:与拆分列类似,都用于提取出一列数据中存储的特定信息
1、按长度:(提取出的是文字的长度)
转换——提取——按“长度”(按字符长度,英文一个字符,汉字一个字符) 注意:字符长度与字符位置(从0开始编码)不同,这里的字符长度指的是字符的个数(从1开始); 2、按首字符: 选中要提取的列——转换——按“首字符”——对话框中填写要提取几个字符长度(从首字符开始数)——确定 3、按结尾字符: 选中要提取的列——转换——按“尾字符”——对话框中填写要提取几个字符(从尾字符开始数)——确定 4、按范围 选中要提取的列——转换——按“范围“——对话框中填写”起始索引“(此处为字符位置,从0编码)和”字符数“——确定 5、按分隔符 分隔符可以自自定义 选中要提取的列——转换——选择提取哪种分隔符形式(分隔符前、分隔符后、分隔符之间)——对话框中定义分隔符是什么(汉字、字母、数字、符号等)——确定。标签:字符,提取,power,对话框,索引,拆分,分隔符,query From: https://www.cnblogs.com/shanyushan/p/17895629.html