如何在 Java 中将分隔符与 Scanner.useDelimiter 一起使用?笔记
2022-08-31 14:47:05
sc = new Scanner(new File(dataFile));
sc.useDelimiter(",|\r\n");
我不明白分隔符是如何工作的,有人可以用外行的术语来解释这一点吗?
sc = new Scanner(new File(dataFile));
sc.useDelimiter(",|\r\n");
我不明白分隔符是如何工作的,有人可以用外行的术语来解释这一点吗?
扫描程序还可以使用空格以外的分隔符。
来自扫描仪 API 的简单示例:
String input = "1 fish 2 fish red fish blue fish";
// \\s* means 0 or more repetitions of any whitespace character
// fish is the pattern to find
Scanner s = new Scanner(input).useDelimiter("\\s*fish\\s*");
System.out.println(s.nextInt()); // prints: 1
System.out.println(s.nextInt()); // prints: 2
System.out.println(s.next()); // prints: red
System.out.println(s.next()); // prints: blue
// don't forget to close the scanner!!
s.close();
关键是要了解 Scanner::useDelimiter
中的正则表达式 (regex
)。在此处查找教程。useDelimiter
要从这里正则表达式开始,您可以找到一个不错的教程。
abc… Letters
123… Digits
\d Any Digit
\D Any Non-digit character
. Any Character
\. Period
[abc] Only a, b, or c
[^abc] Not a, b, nor c
[a-z] Characters a to z
[0-9] Numbers 0 to 9
\w Any Alphanumeric character
\W Any Non-alphanumeric character
{m} m Repetitions
{m,n} m to n Repetitions
* Zero or more repetitions
+ One or more repetitions
? Optional character
\s Any Whitespace
\S Any Non-whitespace character
^…$ Starts and ends
(…) Capture Group
(a(bc)) Capture Sub-group
(.*) Capture all
(ab|cd) Matches ab or cd
使用扫描仪时,默认分隔符是空格字符。
但是 Scanner 可以根据一组分隔符定义令牌的开始和结束位置,可以通过两种方式指定:
因此,方法用于标记扫描程序输入,并且行为类似于StringTokenizer类,请查看以下教程以获取更多信息:useDelimiter()
下面是一个示例:
public static void main(String[] args) {
// Initialize Scanner object
Scanner scan = new Scanner("Anna Mills/Female/18");
// initialize the string delimiter
scan.useDelimiter("/");
// Printing the tokenized Strings
while(scan.hasNext()){
System.out.println(scan.next());
}
// closing the scanner stream
scan.close();
}
打印此输出:
Anna Mills
Female
18