none
IE本身是什么编码做出来的? RRS feed

  • 问题

  • IE本身,就是它自己,是什么编码做出来的?

    IE又是如何识别网页的编码的?就算是知道是什么编码,还是,它没有相应的字符集。

    这个时候,它能正常显示吗?
    本人现在使用Windows Server 2003, CentOS Linux 5.2, Windows XP, VirtualBox 2.1.4, Visual Studio 2005, Eclipse 3.4, Microsoft.NET Framework 2.0 SP2, C# 2.0, IIS 6.0, Apache 1.3.41, Nginx-0.6.36, SQL Server 2000, MySQL 5.0, FireBird 2.1.1, PHP 5.2.4, Office 2007, OpenOffice 3.0和永中Office2009.
    2009年5月7日 7:26

答案

  • UFT8不管你网站的编码
    www.wkfield.cn
    • 已标记为答案 dvdvip 2009年5月8日 1:15
    2009年5月8日 1:08
  • 1.IE本身属于Windows 应用程序,应该是vc/c++开发出来的。
    2.IE又是如何识别网页的编码,网页使用HTML语言,应该说这个是一个特定的行业标准,只有根据公共的标准,IE才能进行解析和展示网页。这里更多的是TAG标签的解析。就好比语言的翻译一样。英语是公共语言,不管各个地方的语言有什么不同,只要和英语有对应的行业标准,就可以互换翻译。
    3.网页的编码:IE又是如何识别网页的编码是另外一个范畴。
    Unicode:
    unicode.org制定的编码机制, 要将全世界常用文字都函括进去.
    在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.

    UTF: Unicode/UCS Transformation Format
    UTF-8, 8bit编码, ASCII不作变换, 其他字符做变长编码, 每个字符1-3 byte. 通常作为外码. 有以下优点:
    * 与CPU字节顺序无关, 可以在不同平台之间交流
    * 容错能力高, 任何一个字节损坏后, 最多只会导致一个编码码位损失, 不会链锁错误(如GB码错一个字节就会整行乱码)
    UTF-16, 16bit编码, 是变长码, 大致相当于20位编码, 值在0到0x10FFFF之间, 基本上就是unicode编码的实现. 它是变长码, 与CPU字序有关, 但因为最省空间, 常作为网络传输的外码.
    UTF-16是unicode的preferred encoding.
    UTF-32, 仅使用了unicode范围(0到0x10FFFF)的32位编码, 相当于UCS-4的子集.

    UTF与unicode的关系:
    Unicode是一个字符集, 可以看作为内码.
    而UTF是一种编码方式, 它的出现是因为unicode不适宜在某些场合直接传输和处理. UTF-16直接就是unicode编码, 没有变换, 但它包含了0x00在编码内, 头256字节码的第一个byte都是0x00, 在操作系统(C语言)中有特殊意义, 会引起问题. 采用UTF-8编码对unicode的直接编码作些变换可以避免这问题, 并带来一些优点.

    中国国标编码:
    GB 13000: 完全等同于ISO 10646-1/Unicode 2.1, 今后也将随ISO 10646/Unicode的标准更改而同步更改.
    GBK: 对GB2312的扩充, 以容纳GB2312字符集范围以外的Unicode 2.1的统一汉字部分, 并且增加了部分unicode中没有的字符.
    GB 18030-2000: 基于GB 13000, 作为Unicode 3.0的GBK扩展版本, 覆盖了所有unicode编码, 地位等同于UTF-8, UTF-16, 是一种unicode编码形式. 变长编码, 用单字节/双字节/4字节对字符编码. GB18030向下兼容GB2312/GBK.
    GB 18030是中国所有非手持/嵌入式计算机系统的强制实施标准.

    you have a dream,you gonna protect it!
    • 已标记为答案 dvdvip 2009年5月11日 23:50
    2009年5月11日 16:25
    版主

全部回复

  • UFT8不管你网站的编码
    www.wkfield.cn
    • 已标记为答案 dvdvip 2009年5月8日 1:15
    2009年5月8日 1:08
  • 1.IE本身属于Windows 应用程序,应该是vc/c++开发出来的。
    2.IE又是如何识别网页的编码,网页使用HTML语言,应该说这个是一个特定的行业标准,只有根据公共的标准,IE才能进行解析和展示网页。这里更多的是TAG标签的解析。就好比语言的翻译一样。英语是公共语言,不管各个地方的语言有什么不同,只要和英语有对应的行业标准,就可以互换翻译。
    3.网页的编码:IE又是如何识别网页的编码是另外一个范畴。
    Unicode:
    unicode.org制定的编码机制, 要将全世界常用文字都函括进去.
    在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.

    UTF: Unicode/UCS Transformation Format
    UTF-8, 8bit编码, ASCII不作变换, 其他字符做变长编码, 每个字符1-3 byte. 通常作为外码. 有以下优点:
    * 与CPU字节顺序无关, 可以在不同平台之间交流
    * 容错能力高, 任何一个字节损坏后, 最多只会导致一个编码码位损失, 不会链锁错误(如GB码错一个字节就会整行乱码)
    UTF-16, 16bit编码, 是变长码, 大致相当于20位编码, 值在0到0x10FFFF之间, 基本上就是unicode编码的实现. 它是变长码, 与CPU字序有关, 但因为最省空间, 常作为网络传输的外码.
    UTF-16是unicode的preferred encoding.
    UTF-32, 仅使用了unicode范围(0到0x10FFFF)的32位编码, 相当于UCS-4的子集.

    UTF与unicode的关系:
    Unicode是一个字符集, 可以看作为内码.
    而UTF是一种编码方式, 它的出现是因为unicode不适宜在某些场合直接传输和处理. UTF-16直接就是unicode编码, 没有变换, 但它包含了0x00在编码内, 头256字节码的第一个byte都是0x00, 在操作系统(C语言)中有特殊意义, 会引起问题. 采用UTF-8编码对unicode的直接编码作些变换可以避免这问题, 并带来一些优点.

    中国国标编码:
    GB 13000: 完全等同于ISO 10646-1/Unicode 2.1, 今后也将随ISO 10646/Unicode的标准更改而同步更改.
    GBK: 对GB2312的扩充, 以容纳GB2312字符集范围以外的Unicode 2.1的统一汉字部分, 并且增加了部分unicode中没有的字符.
    GB 18030-2000: 基于GB 13000, 作为Unicode 3.0的GBK扩展版本, 覆盖了所有unicode编码, 地位等同于UTF-8, UTF-16, 是一种unicode编码形式. 变长编码, 用单字节/双字节/4字节对字符编码. GB18030向下兼容GB2312/GBK.
    GB 18030是中国所有非手持/嵌入式计算机系统的强制实施标准.

    you have a dream,you gonna protect it!
    • 已标记为答案 dvdvip 2009年5月11日 23:50
    2009年5月11日 16:25
    版主