从字符串中删除非字母数字字符

2022-08-30 00:05:26

我想将以下字符串转换为提供的输出。

Input:  "\\test\red\bob\fred\new"
Output: "testredbobfrednew"

我还没有找到任何可以处理特殊字符的解决方案,如,,等。\r\n\b

基本上,我只是想摆脱任何不是字母数字的东西。这是我尝试过的...

Attempt 1: "\\test\red\bob\fred\new".replace(/[_\W]+/g, "");
Output 1:  "testedobredew"

Attempt 2: "\\test\red\bob\fred\new".replace(/['`~!@#$%^&*()_|+-=?;:'",.<>\{\}\[\]\\\/]/gi, "");
Output 2:  "testedobred [newline] ew"

Attempt 3: "\\test\red\bob\fred\new".replace(/[^a-zA-Z0-9]/, "");
Output 3:  "testedobred [newline] ew"

Attempt 4: "\\test\red\bob\fred\new".replace(/[^a-z0-9\s]/gi, '');
Output 4:  "testedobred [newline] ew"

另一次尝试多个步骤

function cleanID(id) {
    id = id.toUpperCase();
    id = id.replace( /\t/ , "T");
    id = id.replace( /\n/ , "N");
    id = id.replace( /\r/ , "R");
    id = id.replace( /\b/ , "B");
    id = id.replace( /\f/ , "F");
    return id.replace( /[^a-zA-Z0-9]/ , "");
}

与结果

Attempt 1: cleanID("\\test\red\bob\fred\new");
Output 1: "BTESTREDOBFREDNEW"

任何帮助将不胜感激。

工作解决方案:

Final Attempt 1: return JSON.stringify("\\test\red\bob\fred\new").replace( /\W/g , '');
Output 1: "testredbobfrednew"

答案 1

删除非字母数字字符

以下是从输入字符串中去除非字母数字字符的正确正则表达式:

input.replace(/\W/g, '')

请注意,这等效于 - 它包括下划线字符。要同时删除下划线,请使用例如:\W[^0-9a-zA-Z_]

input.replace(/[^0-9a-z]/gi, '')

输入格式不正确

由于测试字符串包含各种非字母数字的转义字符,因此它将删除它们。

如果要按字面意思理解字符串中的反斜杠,则需要转义:

"\\test\\red\\bob\\fred\\new".replace(/\W/g, '')
"testredbobfrednew" // output

处理格式错误的字符串

如果您无法正确转义输入字符串(为什么不呢?),或者它来自某种不可信/配置错误的源 - 您可以执行如下操作:

JSON.stringify("\\test\red\bob\fred\new").replace(/\W/g, '')
"testredbobfrednew" // output

请注意,字符串的 json 表示形式包括引号:

JSON.stringify("\\test\red\bob\fred\new")
""\\test\red\bob\fred\new""

但它们也被替换正则表达式删除。


答案 2

目前所有的答案仍然有怪癖,我能想到的最好的事情是:

string.replace(/[^A-Za-z0-9]/g, '');

下面是一个示例,它捕获了我在键盘上可以找到的每个键:

var string = '123abcABC-_*(!@#$%^&*()_-={}[]:\"<>,.?/~`';
var stripped = string.replace(/[^A-Za-z0-9]/g, '');
console.log(stripped);

产出:“123abcABC”。