快捷搜索:  as  test  1111  test aNd 8=8  test++aNd+8=8  as++aNd+8=8  as aNd 8=8

澳门新莆京app官网:浅析Servlet和Jsp中的多国语言显示



由于不停不信Java竟会有不能混排显示多国说话的BUG,这个周末钻研了澳门新莆京app官网一下Servlet、Jsp的多国说话 显示的问题,也便是Servlet的多字符集问题,因为我对字符集的观点还不是很清晰以是写出的器械未必 是准确的,我是这样理解Java中的字符集的:在运行时,每个字符串工具中存储的都是编码为UNICODE内 码的(笔者觉得所有的说话中都是有响应编码的,由于在谋略机内部字符串老是用内码来表示的,只不过 一样平常谋略机说话中的字符串编码时平台相关的,而Java则采纳了平台无关的UNICODE)。

Java从一个byte流中读取一个字符串时,将把平台相关的byte转变为平台无关的Unicode字符串。在输 出时Java将把Unicode字符串转变为平台相关的byte流,假如某个Unicode字符在某个平台上不存在,将会 输出一个´?´。举个例子:在中文Windows中,Java读出一个"GB2312"编码的文件 (可所以任何流)到内存中构造字符串工具,将会把GB2312编码的翰墨转变为Unicode编码的字符串,如 果把这个字符串输出又将会把Unicode字符串转化为GB2312的byte流或数组:"中文测试"---- ->"u4e2du6587u6d4bu8bd5"----->"中文测试"。

byte[] bytes = new byte[]{(byte)0xd6, (byte)0xd0, (byte)0xce,

(byte)0xc4, (byte)0xb2, (byte)0xe2, (byte)0xca, (byte)0xd4};//GBK编码的"中文测试 "

java.io.ByteArrayInputStream bin = new java.io.ByteArrayInputStream(bytes);

java.io.BufferedReader reader =new java.io.BufferedReader(new java.io. InputStreamReader澳门新莆京app官网 (bin,"GBK"));

String msg = reader.readLine();

System.out.println(msg)

这段法度榜样放到包孕"中文测试"这四个字的系统(如中体裁系)中,可以精确地打印出这些 字。msg字符串中包孕了精确的"中文测试"的Unicode编码: "u4e2du6587u6d4bu8b澳门新莆京app官网d5",打印时转换为操作系统的默认字符集,是否可以精确显示依附于操 作系统的字符集,只有在支持响应字符集的系统中,我们的信息才能精确的输出,否则获得的将会是垃圾 。

话入正题,我们来看看Servlet/Jsp中的多说话问题。我们的目标是,任一国家的客户端经由过程Form向 Server发送信息,Server把信息存入数据库中,客户端在检索时仍旧能够看到自己发送的精确信息。事实 上,我们要包管,终极Server中的SQL语句中保存的时包孕客户端发送翰墨的精确Unicode编码;DBC与数 据库通讯时采纳的编码要领能包孕客户端发送的翰墨信息,事实上,最好让JDBC直接应用UNICODE/UTF8与 数据库通讯!这样就可以确保不会损掉信息;Server向客户端发送的信息时也要采纳不损掉信息的编码方 式,也可所以Un澳门新莆京app官网icode/Utf8。

假如不指定Form的Enctype属性,Form将把输入的内容依照当前页面的编码字符集urlencode之后再提 交,办事器端获得是urlencoding的字符串。编码后获得的urlencoding字符串是与页面的编码相关的,如 gb2312编码的页面提交"中文测试",获得的是"%D6%D0%CE%C4%B2%E2%CA%D4",每个 "%"后跟的是16进制的字符串;而在UTF8编码时获得的却是"%E4%B8%AD%E6%96%87%E6% B5%8B%E8%AF%95",由于GB2312编码中一个汉字是16位的,而UTF8中一个汉字却是24位的。中日韩三 国的ie4以上浏览器均支持UTF8编码,这种规划肯定体贴了这三国说话,以是我们假如让Html页面应用 UTF8编码那么将至少可以支持这三国说话。

然则,假如我们html/Jsp页面应用UTF8编码,由于利用法度榜样办事器可能不知道这种环境,由于假如浏 览器发送的信息不包孕charset信息,至多Server知道读到Accept-Language哀求投标,我们知道仅靠这个 投标是不能获知浏览器所采纳编码的,以是利用法度榜样办事器不能精确解析提交的内容,为什么?由于Java 中的所有字符串都是Unicode16位编码的,HttpServletRequest.request(String)的功能便是把客户端提 交的Urlencode编码的信息转为Unicode字澳门新莆京app官网符串,有些Server只能觉得客户真个编码和Server平台相同,简 单地应用URLDecoder.decode(String)措施直接解码,假如客户端编码正好和Server相同,那么就可以得 到精确地字符串,否则,假如提交地字符串中包孕了当地字符,那么将会导致垃圾信息。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

您可能还会对下面的文章感兴趣: