如何在 Java 中将分隔符与 Scanner.useDelimiter 一起使用?笔记

2022-08-31 14:47:05
sc = new Scanner(new File(dataFile));
sc.useDelimiter(",|\r\n");

我不明白分隔符是如何工作的,有人可以用外行的术语来解释这一点吗?


答案 1

扫描程序还可以使用空格以外的分隔符。

来自扫描仪 API 的简单示例:

 String input = "1 fish 2 fish red fish blue fish";

 // \\s* means 0 or more repetitions of any whitespace character 
 // fish is the pattern to find
 Scanner s = new Scanner(input).useDelimiter("\\s*fish\\s*");

 System.out.println(s.nextInt());   // prints: 1
 System.out.println(s.nextInt());   // prints: 2
 System.out.println(s.next());      // prints: red
 System.out.println(s.next());      // prints: blue

 // don't forget to close the scanner!!
 s.close(); 

关键是要了解 Scanner::useDelimiter 中的正则表达式 (regex)。在此处查找教程。useDelimiter


要从这里正则表达式开始,您可以找到一个不错的教程。

笔记

abc…    Letters
123…    Digits
\d      Any Digit
\D      Any Non-digit character
.       Any Character
\.      Period
[abc]   Only a, b, or c
[^abc]  Not a, b, nor c
[a-z]   Characters a to z
[0-9]   Numbers 0 to 9
\w      Any Alphanumeric character
\W      Any Non-alphanumeric character
{m}     m Repetitions
{m,n}   m to n Repetitions
*       Zero or more repetitions
+       One or more repetitions
?       Optional character
\s      Any Whitespace
\S      Any Non-whitespace character
^…$     Starts and ends
(…)     Capture Group
(a(bc)) Capture Sub-group
(.*)    Capture all
(ab|cd) Matches ab or cd

答案 2

使用扫描仪时,默认分隔符是空格字符。

但是 Scanner 可以根据一组分隔符定义令牌的开始结束位置,可以通过两种方式指定:

  1. 使用扫描仪方法:使用省略号(字符串模式)
  2. 使用 Scanner 方法:使用Delimiter(Pattern pattern),其中Pattern是指定分隔符集的正则表达式。

因此,方法用于标记扫描程序输入,并且行为类似于StringTokenizer类,请查看以下教程以获取更多信息:useDelimiter()

下面是一个示例

public static void main(String[] args) {

    // Initialize Scanner object
    Scanner scan = new Scanner("Anna Mills/Female/18");
    // initialize the string delimiter
    scan.useDelimiter("/");
    // Printing the tokenized Strings
    while(scan.hasNext()){
        System.out.println(scan.next());
    }
    // closing the scanner stream
    scan.close();
}

打印此输出:

Anna Mills
Female
18

推荐