java.nio.file.InvalidPathException:格式错误的输入或输入在使用国家/地区字符时包含不可映射的字符

2022-09-04 04:44:58

我正在尝试创建一些具有国家符号的目录,例如“äöü”等。不幸的是,每当尝试这样做时,我都会得到这个例外:

java.nio.file.InvalidPathException: Malformed input or input contains unmappable characters: /home/pi/myFolder/löwen
        at sun.nio.fs.UnixPath.encode(UnixPath.java:147)
        at sun.nio.fs.UnixPath.<init>(UnixPath.java:71)
        at sun.nio.fs.UnixFileSystem.getPath(UnixFileSystem.java:281)
        at java.nio.file.Paths.get(Paths.java:84)
        at org.someone.something.file.PathManager.createPathIfNecessary(PathManager.java:161)
...
        at java.lang.Thread.run(Thread.java:744)

我的代码出现的地方看起来像这样:

public static void createPathIfNecessary(String directoryPath) throws IOException {
        Path path = Paths.get(directoryPath);
        // if directory exists?
        if (!Files.exists(path)) {
            Files.createDirectories(path);
        } else if (!Files.isDirectory(path)) {
            throw new IOException("The path " + path + " is not a directory as expected!");
        }
    }

我搜索了可能的解决方案,并且大多数建议将语言环境设置为UTF-8,所以我想如果我将Linux中的区域设置设置为UTF-8,我会解决这个问题,但我发现它已经一直是UTF-8,尽管新设置了它,我仍然有同样的问题。

 $ locale
LANG=en_US.UTF-8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=

我在Windows 7上没有遇到这个问题,它完美地创建了目录,所以我想知道我是否需要改进java代码以更好地处理这种情况,或者在我的Linux中更改某些内容。

我运行它的Linux是Raspberry Pi 2上的Raspbian:

$ cat /etc/*-release

    PRETTY_NAME="Raspbian GNU/Linux 7 (wheezy)"
    NAME="Raspbian GNU/Linux"
    VERSION_ID="7"
    VERSION="7 (wheezy)"
    ID=raspbian
    ID_LIKE=debian
    ANSI_COLOR="1;31"
    HOME_URL="http://www.raspbian.org/"
    SUPPORT_URL="http://www.raspbian.org/RaspbianForums"
    BUG_REPORT_URL="http://www.raspbian.org/RaspbianBugs"

我在Tomcat 7服务器上运行我的应用程序(我相信Java版本是1.8),我的 setenv.sh 以以下开头:export JAVA_OPTS="-Dfile.encoding=UTF-8 ...

有人有解决这个问题的方法吗?我需要能够在目录/文件名中使用这些国家符号...

编辑:

在为Tomcat添加额外的选项Dsun.jnu.encoding=UTF-8 setenv.sh 并重新启动某些更改后。

目前我 setenv.sh 的开始看起来像这样

export JAVA_OPTS="-Dsun.jnu.encoding=UTF-8 -Dfile.encoding=UTF-8 

似乎这个例外已经消失,并且创建了带有国家符号的文件夹,但是问题似乎没有完全解决,每当我尝试在该目录中创建/写入文件时,我现在得到:

java.io.FileNotFoundException: /home/pi/myFolder/löwen/Lowen.tmp (No such file or directory)
        at java.io.FileOutputStream.open(Native Method)
        at java.io.FileOutputStream.<init>(FileOutputStream.java:206)
        at java.io.FileOutputStream.<init>(FileOutputStream.java:156)
        at org.someone.something.MyFileWriter.downloadFiles(MyFileWriter.java:364)
        ...
        at java.lang.Thread.run(Thread.java:744)

发生这种情况的代码如下所示:

// output here
File myOutputFile = new File(filePath);
FileOutputStream out = (new FileOutputStream(myOutputFile));
out.write(bytes);
out.close();

它似乎在(新的FileOutputStream(myOutputFile))上失败);当它尝试使用File对象初始化FileOutputStream时,该对象具有从上述异常中的路径中检索的字符串创建的路径,并在末尾添加了文件名。

因此,现在目录已创建,但是在其中写入或创建任何内容仍然会导致上述异常,尽管其中的文件不包含国家符号。

当它们没有国家符号时,在其中创建路径和文件的工作方式与 setenv.sh 更改之前一样完美,因此看起来问题仍然与路径中的国家符号有关......


答案 1

只需设置环境变量“LANG=en_US。UTF-8“或其他”xxx.UTF-8”。(https://www.gnu.org/software/gettext/manual/html_node/Locale-Environment-Variables.html)

JNIEXPORT jboolean JNICALL
Java_java_io_UnixFileSystem_createDirectory(JNIEnv *env, jobject this,
                                            jobject file)
{
    jboolean rv = JNI_FALSE;
 
    WITH_FIELD_PLATFORM_STRING(env, file, ids.path, path) {
        if (mkdir(path, 0777) == 0) {
            rv = JNI_TRUE;
        }
    } END_PLATFORM_STRING(env, path);
    return rv;
}
#define WITH_PLATFORM_STRING(env, strexp, var)                                
    if (1) {                                                                  
        const char *var;                                                      
        jstring _##var##str = (strexp);                                       
        if (_##var##str == NULL) {                                            
            JNU_ThrowNullPointerException((env), NULL);                       
            goto _##var##end;                                                
        }                                                                     
        var = JNU_GetStringPlatformChars((env), _##var##str, NULL);           
        if (var == NULL) goto _##var##end;
 
#define WITH_FIELD_PLATFORM_STRING(env, object, id, var)                      
    WITH_PLATFORM_STRING(env,                                                 
                         ((object == NULL)                                    
                          ? NULL                                              
                          : (*(env))->GetObjectField((env), (object), (id))), 
                         var)
  1. Java在此方法中将所有字符串本机转换为平台的本地编码:jdk/src/share/native/common/jni_util.c - JNU_GetStringPlatformChars() 。系统属性 sun.jnu.encoding 用于确定平台的编码。

  2. sun.jnu.encoding 的值在 jdk/src/solaris/native/java/lang/java_props_md.c - GetJavaProperties() 使用 libc 的 setlocale() 方法设置。环境变量 LC_ALL 用于设置 sun.jnu.encoding 的值。在命令提示符下使用 -Dsun.jnu.encoding 选项提供给 Java 的值将被忽略。

由 https://stackoverrun.com/cn/q/3020937)


答案 2

如果源中的国家/地区字符已硬编码,请将源文件转换为相同的编码。您可以使用 vim:

vim SourceClassWithHardcodedCharacters.java
:set fileencoding=utf-8<Enter>
:w<Enter>

如果出现问题,您将收到一条消息(“不可映射的字符 (...)”)。

对我来说,这个问题与1有关。硬编码字符编码不正确或 2。在将路径传递给方法的过程中以某种方式丢失了编码。


推荐