日食字符编码

我正在使用扫描仪扫描Java中的.txt文档。但是,当我在 Eclipse 中打开.txt文档时,我注意到某些字符未被识别,并且它们被替换为如下所示的内容:

这些字符甚至不允许我扫描文件

    while(scan.hasNext)

自动返回false(如果这些字符不存在,那么我可以很好地扫描文档)。

那么,如何让 Eclipse 识别这些字符,以便进行扫描呢?我无法手动删除它们,因为文档非常大。谢谢。


答案 1

如果需要更改整个 Eclipse 工作区的字符编码,请转到窗口 ->首选项。然后在“常规 ->工作区”下,将“文本文件编码”更改为适当的字符编码(在本例中为 UTF-8)。

Eclipse Preferences - Changing Character Encoding


答案 2

您正在读取的文件必须包含UTF-8或其他一些编码字符,当您尝试在控制台上打印它们时,您将获得一些字符作为'。这是因为默认的控制台编码在 eclipse 中不是 UTF-8。您需要通过转到运行配置 ->通用 ->编码 ->从下拉列表中选择 UTF-8 来设置它。检查下面的截图:

enter image description here


推荐