如何在Java中逐个字符读取输入?

2022-08-31 17:31:17

我习惯了c风格,但似乎没有什么可以与java相提并论的。我正在构建一个词法分析器,我需要逐个字符地读取输入。getchar()

我知道我可以使用扫描仪扫描令牌或行,并逐个字符地解析令牌,但对于跨越多行的字符串来说,这似乎很笨拙。有没有办法从Java中的输入缓冲区中获取下一个字符,或者我应该直接插入Scanger类?

输入是文件,而不是键盘。


答案 1

使用 Reader.read()。返回值 -1 表示流的结束;否则,施法为

此代码从文件参数列表中读取字符数据:

public class CharacterHandler {
    //Java 7 source level
    public static void main(String[] args) throws IOException {
        // replace this with a known encoding if possible
        Charset encoding = Charset.defaultCharset();
        for (String filename : args) {
            File file = new File(filename);
            handleFile(file, encoding);
        }
    }

    private static void handleFile(File file, Charset encoding)
            throws IOException {
        try (InputStream in = new FileInputStream(file);
             Reader reader = new InputStreamReader(in, encoding);
             // buffer for efficiency
             Reader buffer = new BufferedReader(reader)) {
            handleCharacters(buffer);
        }
    }

    private static void handleCharacters(Reader reader)
            throws IOException {
        int r;
        while ((r = reader.read()) != -1) {
            char ch = (char) r;
            System.out.println("Do something with " + ch);
        }
    }
}

上述代码的坏处在于它使用系统的默认字符集。只要有可能,最好选择已知的编码(理想情况下,如果您有选择,请使用Unicode编码)。有关详细信息,请参阅字符集类。(如果您觉得受虐狂,可以阅读此字符编码指南

(您可能要注意的一件事是补充Unicode字符 - 那些需要两个字符值来存储的字符。有关更多详细信息,请参阅字符类;这是一个边缘情况,可能不适用于家庭作业。


答案 2

结合其他人关于指定字符编码和缓冲输入的建议,我认为这是一个非常完整的答案。

假设您有一个表示要读取的文件的对象:File

BufferedReader reader = new BufferedReader(
    new InputStreamReader(
        new FileInputStream(file),
        Charset.forName("UTF-8")));
int c;
while((c = reader.read()) != -1) {
  char character = (char) c;
  // Do something with your character
}