android部分中文字乱码

       原文:http://book.51cto.com/art/201112/306309.htm

中文汉字中出现少部分中文乱码。这种现象看起来很怪异,往往在开发过程中,读者都有可能这样操作了,但没有发现。这种现象是怎么造成的呢?先看例子程序。

实例:

读取文件的核心代码如下(为了测试多一些的汉字,本例将把很多汉字写在test.txt里放在assets文件夹下):

………………..省略部分代码……………… inputStream = this.getAssets().open("test.txt"); byte buffer[] = new byte[100]; StringBuffer sb = new StringBuffer(); int i = 0; while ((i = inputStream.read(buffer)) != -1) { sb.append(new String(buffer, 0, i)); } textView_1.setText(sb.toString()); ………………..省略部分代码………………

由上述代码产生的效果如图10-19所示。

部分乱码的现象出现了,原因我先不讲,先改动代码再看看效果。把byte buffer[] = new byte[100]改成byte buffer[] = new byte[inputStream.available()],运行后得到的效果如图10-20所示。

思考一下:100和inputStream.available()的区别,就会出现中文部分乱码的问题?原因是有可能在读取100个字节的时候正好遇到一个汉字的前半个字节,后100个字节的第一位置的字节也是这个字的后半个字节,半个字节是汉字吗?这样当然会出现乱码了。把字节的数组直接设置成输入流的长度,在读取的时候,一次性读取,那么就不会出现所谓的半个字的现象,当然也不会出现乱码的问题了。

 
图10-19  中文乱码
 
图10-20  中文乱码
还有一个解决办法,就是不以字节的方式读取文件,以字符的方式读取,一个字符装一个汉字是合法的,看一下代码。

………………..省略部分代码……………… inputStream = this.getAssets().open("test.txt"); StringBuffer sb = new StringBuffer(); InputStreamReader isr=new InputStreamReader(inputStream); char buf[] = new char[20]; int nBufLen = isr.read(buf); while(nBufLen!=-1){ sb.append(new String(buf, 0, nBufLen)); nBufLen = isr.read(buf); } textView_1.setText(sb.toString()); ………………..省略部分代码………………

得到的结果当然是没有乱码的效果。读者在开发过程中遇到中文乱码问题,要认真分析和思考,总能解决问题的。