如何在Java中逐个字符读取输入?
我习惯了c风格,但似乎没有什么可以与java相提并论的。我正在构建一个词法分析器,我需要逐个字符地读取输入。getchar()
我知道我可以使用扫描仪扫描令牌或行,并逐个字符地解析令牌,但对于跨越多行的字符串来说,这似乎很笨拙。有没有办法从Java中的输入缓冲区中获取下一个字符,或者我应该直接插入Scanger类?
输入是文件,而不是键盘。
我习惯了c风格,但似乎没有什么可以与java相提并论的。我正在构建一个词法分析器,我需要逐个字符地读取输入。getchar()
我知道我可以使用扫描仪扫描令牌或行,并逐个字符地解析令牌,但对于跨越多行的字符串来说,这似乎很笨拙。有没有办法从Java中的输入缓冲区中获取下一个字符,或者我应该直接插入Scanger类?
输入是文件,而不是键盘。
使用 Reader.read()。返回值 -1 表示流的结束;否则,施法为炭。
此代码从文件参数列表中读取字符数据:
public class CharacterHandler {
//Java 7 source level
public static void main(String[] args) throws IOException {
// replace this with a known encoding if possible
Charset encoding = Charset.defaultCharset();
for (String filename : args) {
File file = new File(filename);
handleFile(file, encoding);
}
}
private static void handleFile(File file, Charset encoding)
throws IOException {
try (InputStream in = new FileInputStream(file);
Reader reader = new InputStreamReader(in, encoding);
// buffer for efficiency
Reader buffer = new BufferedReader(reader)) {
handleCharacters(buffer);
}
}
private static void handleCharacters(Reader reader)
throws IOException {
int r;
while ((r = reader.read()) != -1) {
char ch = (char) r;
System.out.println("Do something with " + ch);
}
}
}
上述代码的坏处在于它使用系统的默认字符集。只要有可能,最好选择已知的编码(理想情况下,如果您有选择,请使用Unicode编码)。有关详细信息,请参阅字符集类。(如果您觉得受虐狂,可以阅读此字符编码指南。
(您可能要注意的一件事是补充Unicode字符 - 那些需要两个字符值来存储的字符。有关更多详细信息,请参阅字符类;这是一个边缘情况,可能不适用于家庭作业。
结合其他人关于指定字符编码和缓冲输入的建议,我认为这是一个非常完整的答案。
假设您有一个表示要读取的文件的对象:File
BufferedReader reader = new BufferedReader(
new InputStreamReader(
new FileInputStream(file),
Charset.forName("UTF-8")));
int c;
while((c = reader.read()) != -1) {
char character = (char) c;
// Do something with your character
}