代码页

概况

代码页是字元集编码的别名，也有人称"内码錶"。早期，代码页是IBM称呼电脑BIOS本身支持的字元集编码的名称。当时通用的作业系统都是命令行界面系统，这些作业系统直接使用BIOS供应的VGA功能来显示字元，作业系统的编码支持也就依靠BIOS的编码。现在这BIOS代码页被称为OEM代码页。图形作业系统解决了此问题，图形作业系统使用自己字元呈现引擎可以支持很多不同的字元集编码。

早期IBM和微软内部使用特别数字来标记这些编码，其实大多的这些编码已经有自己的名称了。虽然图形作业系统可以支持很多编码，很多微软程式还使用这些数字来点名某编码。

简介

概述

对于字元和Unicode数据的位模式的定义，此模式代表特定字母、数字或符号（例如 0x20 代表一个空格，而 0x74 代表字元“t”）。一些数据类型每个字元使用一个位元组；每个位元组可以具有 256 个不同的位模式中的一个模式。

在计算机中，字元由不同的位模式（ON 或 OFF）表示。每个位元组有 8 位，这 8 位可以有 256 种不同的 ON 和 OFF 组合模式。对于使用 1 个位元组存储每个字元的程式，通过给每个位模式指派字元可表示最多 256 个不同的字元。2 个位元组有 16 位，这 16 位可以有 65,536 种唯一的 ON 和 OFF 组合模式。使用 2 个位元组表示每个字元的程式可表示最多 65,536 个字元。

单位元组

单位元组代码页是字元定义，这些字元映射到每个位元组可能有的 256 种位模式中的每一种。代码页定义大小写字元、数字、符号以及 !、@、#、% 等特殊字元的位模式。每种欧洲语言（如德语和西班牙语）都有各自的单位元组代码页。虽然用于表示 A 到 Z 拉丁字母表字元的位模式在所有的代码页中都相同，但用于表示重音字元（如"é"和"á"）的位模式在不同的代码页中却不同。如果在运行不同代码页的计算机间交换数据，必须将所有字元数据由传送计算机的代码页转换为接收计算机的代码页。如果源数据中的扩展字元在接收计算机的代码页中未定义，那幺数据将丢失。如果某个资料库为来自许多不同国家的客户端提供服务，则很难为该资料库选择这样一种代码页，使其包括所有客户端计算机所需的全部扩展字元。而且，在代码页间不停地转换需要花费大量的处理时间。

双位元组

仅靠单位元组字元集存储许多语言所使用的字元也是不够的。例如，一些亚洲语言包含上千个字元，所以每个字元必须使用双位元组。双位元组字元集正是为这些语言定义的。但是，这些语言都有各自的代码页，在运行不同双位元组代码页的计算机之间传输数据也存在困难。

描述

1258 越南语

1257 波罗的语

1256 阿拉伯语

1255 希伯来语

1254 土耳其语

1253 希腊语

代码页

代码页

基本介绍

概况

简介

概述

单位元组

双位元组

描述

标準

SQL相关

设定方法

通过DOS命令

通过C语言函式

现状

相关推荐