我有两种不同语言的文本文件,它们是逐行对齐的.即textfile1中的第一行应该等于textfile2中的第一行,依此类推.
有没有办法同时逐行读取这两个文件?
下面是文件应该如何显示的示例,假设每个文件的行数大约为1,000,000.
textfile1:
This is a the first line in English This is a the 2nd line in English This is a the third line in English
textfile2:
C'est la première ligne en Français C'est la deuxième ligne en Français C'est la troisième ligne en Français
期望的输出
This is a the first line in English\tC'est la première ligne en Français This is a the 2nd line in English\tC'est la deuxième ligne en Français This is a the third line in English\tC'est la troisième ligne en Français
目前,我可以使用它,但在RAM中保存几百万行将杀死我的机器.
String english = "/home/path-to-file/english";
String french = "/home/path-to-file/french";
BufferedReader enBr = new BufferedReader(new FileReader(english));
BufferedReader frBr = new BufferedReader(new FileReader(french));
ArrayList<String> enFile = new ArrayList<String>();
while ((line = enBr.readLine()) != null) {
enFile.add(line);
}
int index = 0;
while ((line = frBr.readLine()) != null) {
String enSentence = enFile.get(index);
System.out.println(line + "\t" + enSentence);
index++;
}
解决方法
将调用nextLine放在同一循环中的两个读取器上:
String english = "/home/path-to-file/english";
String french = "/home/path-to-file/french";
BufferedReader enBr = new BufferedReader(new FileReader(english));
BufferedReader frBr = new BufferedReader(new FileReader(french));
while (true) {
String partOne = enBr.readLine();
String partTwo = frBr.readLine();
if (partOne == null || partTwo == null)
break;
System.out.println(partOne + "\t" + partTwo);
}