it技术指南:www.itedus.com
  • 信息订阅

IT指南

  • TNT五分钟问卷赢IPOD
  • 贝塔斯曼
  • 广告联盟
  • No pay, More gain!
  • 单价15元-网络广告平台
  • 注册阿里妈妈赚广告费
  • 首页
  • 新闻资讯
  • 网页制作
  • 软件使用
  • 操作系统
  • 软件编程
  • 网络编程
  • 图象处理
  • 网站欣赏
  • 数据库
  • 认证考试
  • 站长知识
正在浏览栏目导航:首页 > 网页制作 > 心得技巧 >

教你制作GBK与Unicode的对照表

时间:2007-08-26 17:58:40   来源:  作者:

  前段时间,在所参与的项目中遇到了一个unicode与gb之间转码失败的问题,一些不常用汉字的编码都被转成了“??”,这些汉字没有显示出来,于是自己对相关的问题做了一些研究并最终使问题得以解决。现在就结合前面两篇的unicode与GB方面的基本原理,介绍这种制作GBK-Unicode编码对照表的方法。

  Java的字符串String类功能强大,不但能进行一些基本的字符串操作,还可以根据需要构造指定字符集的字符串,本文所介绍的方法正是利了这一点,这种方法的基本思路是:

  1、遍历GBK编码表中的所有汉字,使用该字的GB编码构造一个字符串。GBK编码表中各部分的汉字分块比较整齐,很容易遍历。

  2、使用getBytes()方法取得该字符的字节数组,由于Java是用unicode来表示字符的,所以此汉字的unicode就在其中。

  以下是一段示例代码:

以下是引用片段:
{
    int count = 0;
    for(int segIndex=0xb0; segIndex<=0xf7; segIndex++) {
        for(int charIndex=0xa1; charIndex<=0xfe; charIndex++) {
            byte [] gbkBytes = new byte[] {(byte)(segIndex), (byte)charIndex};
            byte [] unicodeBytes;
            String str = new String(gbkBytes,"GBK");
                
            unicodeBytes = str.getBytes("unicode");
            if(unicodeBytes.length == 4) {
                count++;
                String buffer = "";
                for (int i=0;i<gbkBytes.length;i++)
                    buffer += (int)(0x00ff&gbkBytes[i]) + " ";
                for (int i=3;i>1;i--)
                    buffer += (int)(0x00ff&unicodeBytes[i]) + " ";
                buffer += " ";
                osw.write(buffer);
            }
        }
    }
}

   这一段是对GBK/2区的汉字进行遍历并处理的代码,GBK/2区的首字节范围在[0xb0,0xf7],尾字节范围在[0xa1,0xfe],在构造字符串时使用的字符集为GBK:

以下是引用片段:
String str = new String(gbkBytes,"GBK");


  在使用getBytes()取得的字节数组中会有四个元素,前两个不知是做什么用的,可能与字符串本身的结构有关,接下来的两个字节才是真正的unicode码。但这两个字节是倒序的,要从最后一个字节开始取,之所以这样是与big_endian和little_endian有关的,这里不多说。

  当每一次内层循环结束时,buffer字符串中前两个数字就是一个GB码,后面两个数字就是一个unicode码,把它写到文件中就行了。

  这样的文件得到之后,再在另外的程序中载入文件,把Unicode值装入数组,以GB码为索引,就可以很方便地由GB码查得Unicode码。

关键字:
关闭此页
上一篇:常用网页播放器代码
下一篇:揭开正则表达式的神秘面纱

相关文章

    无相关信息
本栏目推荐

排行榜

  • 1如何提高自己的编程水平
  • 2学习网页制作你应该了解的几点知识!
  • 3滚动字幕的制作 marquee
  • 4网页刷新方法
  • 5SEO:Sitemaps将使用统一标准
  • 6frameset 使用心得
  • 7HTML-加速、再加速
  • 8DIV与Table布局在大型网站的可用性比较

最新信息

  • 如何提高自己的编程水平
  • 学习网页制作你应该了解的几点知识!
  • 网页编程安全漏洞全接触
  • 巧妙实现很酷的动态背景文字
  • 搜索引擎技术核心揭密
  • 实现浏览器全屏窗口的几种方法
  • 为网页添加放大或缩小文字
  • 公司建站完全手册--网页色彩设计点滴
关于站点 - 广告服务 - 联系我们 - 返回顶部
Copyright © 2007 www.itedus.com . All rights reserved.QQ群:8814225
如果碰到相关技术问题可以联系我们,原创相关问题请与站长及时联系.鄂ICP备07005792号