TSV文件与CSV文件的区别
TSV为用制表符tab分隔的文本文件。 CSV为用逗号,分隔的文本文件。
TSV文件的打开方式
1.使用nodepad++等文本工具打开,使用记事本打开会导致某些行的格式错误。
2.打开一个Excel,直接将tsv文件拖进去即可。
JAVA TSV文件的解析
1.添加 univocity-parsers jar包依赖
<dependency>
<groupId>com.univocity</groupId>
<artifactId>univocity-parsers</artifactId>
<version>2.6.1</version>
</dependency>
如果项目无法加载该依赖,可以去下面网站下载该依赖的jar包,放到maven仓库的文件夹中。
网站地址:https://mvnrepository.com/
2.JAVA代码示例
/**
* 解析TSV文件
*
* @param fileUrl 原文件地址
* @param keyword 关键字
* @return
* @throws FileNotFoundException
* @throws UnsupportedEncodingException
*/
public static List<String[]> readTsv(String fileUrl, String keyword) throws FileNotFoundException, UnsupportedEncodingException {
List<String[]> list = new ArrayList<>();
// 创建tsv解析器settings配置对象
TsvParserSettings settings = new TsvParserSettings();
settings.getFormat().setLineSeparator("\n");
TsvParser parser = new TsvParser(settings);
DataInputStream in = new DataInputStream(new FileInputStream(new File(fileUrl)));
BufferedReader br = new BufferedReader(new InputStreamReader(in, "UTF-8"));
List<String[]> allRows = parser.parseAll(br);
for (int i = 0; i < allRows.size(); i++) {
String[] row = allRows.get(i);
if (row != null && Arrays.asList(row).contains(keyword)) {
list.add(row);
}
// String str = (allRows.get(i)[4].trim()).replaceAll("\"", "");
// 获取tsv文件指定位置字符串
}
return list;
}
JAVA TSV文件的生成
1.csv相关依赖
1.下载 javacsv jar包,嵌入到项目中
2.或者添加 opencsv 依赖
<dependency>
<groupId>com.opencsv</groupId>
<artifactId>opencsv</artifactId>
<version>5.6</version>
</dependency>
2.Java代码示例
/**
* 导出TSV文件
*
* @param result 数据
* @param fileUrl 生成的文件地址
* @throws IOException
*/
public static void createTsvFile(List<String[]> result, String fileUrl) throws IOException {
File tsvFile = new File(fileUrl);
BufferedWriter writer = new BufferedWriter(new FileWriter(tsvFile, true));
CsvWriter cwriter = new CsvWriter(writer, '\t');//将制表符换成逗号,即可生成csv文件,使用Excel打开即可。
for (int i = 0; i < result.size(); i++) {
cwriter.writeRecord(result.get(i), true);
}
cwriter.close();
}
标签:文件,JAVA,String,TSV,new,fileUrl,解析,throws
From: https://blog.51cto.com/u_16470648/8968936