正则表达式仅允许字母数字、逗号、连字符、下划线和分号

2022-08-30 21:01:27

我已经有一些工作代码,但我需要有人帮助解释为什么它可以工作,如果他们可以的话!

我正在使用PHP替换字符串中的任何内容,如果它不是a-z,A-Z,0-9,逗号,分号,下划线或连字符(最终应该表示单个用户名或逗号/分号分隔的用户名列表)。

以下工作原理:

$data = preg_replace('/[^,;a-zA-Z0-9_-]/s', '', $data);

但以下情况并非如此:

$data = preg_replace('/[^a-zA-Z0-9_-,;]/s', '', $data);

为什么这只在逗号和分号在开头时才有效?把它们放在最后似乎会破坏事情(这是我最初遇到/[^a-zA-Z0-9_-]/s时尝试的。

顺便说一句,我还使用以下方法来修剪任何尾随分号(复数)或逗号(复数),有人可能会建议一种更有效和/或更优雅的方法来做到这一点?

if(preg_match('/;$/', $data))
{
    $data = rtrim($data, ';' );
}
if(preg_match('/,$/', $data))
{
    $data = rtrim($data, ',' );
}

感谢您的任何帮助:)


答案 1

这不是导致您问题的逗号和分号;它是连字符。查看角色类的各个部分,并考虑它们的含义:

0-9 # Anything from '0' to '9', meaning 0, 1, 2, ... 9
A-Z # Anything from 'A' to 'Z', meaning A, B, C, ... Z
_-, # Anything from '_' to ',', meaning...uh...hmmm.

没有从 到 的明确进展,因此正则表达式引擎不确定该怎么做。在字符类中,如果要按字面解释连字符,则需要在类的最开头或结尾(或使用反斜杠转义)。因此,这些中的任何一个都可以工作:_,

[^,;a-zA-Z0-9_-]
[^-,;a-zA-Z0-9_]
[^a-zA-Z0-9_\-,;]

至于修剪结束,您可以在一个正则表达式替换中完成所有这些操作:

$data = preg_replace('/[^,;a-zA-Z0-9_-]|[,;]$/s', '', $data);

答案 2

我相信重要的是连字符的位置 - 必须在开头或结尾才能成为连字符(文字),否则它被用来定义一个范围。


推荐