发表日期: 2022-05-29 13:38:24 浏览次数:167
贵州省安顺网站建设_网站制作_公司开发设计_一站式全包_10多年经验满意为止

名称 | 区划代码 | 人口(万人) | 面积(平方千米) | 政府驻地 |
|---|---|---|---|---|
安顺市 | 520400 | 286 | 9269 | 西秀区 |
西秀区 | 520402 | 88 | 1705 | 东关街道 |
平坝区 | 520403 | 36 | 999 | 安平街道 |
普定县 | 520422 | 48 | 1092 | 定南街道 |
镇宁布依族苗族自治县 | 520423 | 39 | 1721 | 白马湖街道 |
关岭布依族苗族自治县 | 520424 | 38 | 1468 | 关索街道 |
紫云苗族布依族自治县 | 520425 | 37 | 2284 | 松山街道 |
西秀区 |
街道(8)·南街街道·东街街道·西街街道·北街街道·东关街道·华西街道·西航街道·新安街道 镇(10)·宋旗镇·幺铺镇·宁谷镇·龙宫镇·双堡镇·大西桥镇·七眼桥镇·蔡官镇·轿子山镇·旧州镇 乡(7)·新场布依族苗族乡·岩腊苗族布依族乡·鸡场布依族苗族乡·杨武布依族苗族乡·东屯乡·黄腊布依族苗族乡·刘官乡 |
平坝区 |
街道(2)·安平街道·鼓楼街道 镇(7)·白云镇·高峰镇·天龙镇·夏云镇·马场镇·乐平镇·齐伯镇 乡(2)·十字回族苗族乡·羊昌布依族苗族乡 |
普定县 |
街道(4)·定南街道·穿洞街道·黄桶街道·玉秀街道 镇(6)·马官镇·化处镇·马场镇·白岩镇·坪上镇·鸡场坡镇 乡(3)·补郎苗族乡·猴场苗族仡佬族乡·猫洞苗族仡佬族乡 |
镇宁布依族苗族自治县 |
街道(5)·白马湖街道·环翠街道·丁旗街道·双龙山街道·宁西街道 镇(8)·黄果树镇·马厂镇·良田镇·扁担山镇·募役镇·江龙镇·本寨镇·六马镇 乡(3)·沙子乡·革利乡·简嘎乡 |
关岭布依族苗族自治县 |
街道(4)·顶云街道·关索街道·龙潭街道·百合街道 镇(9)·永宁镇·岗乌镇·上关镇·坡贡镇·白水镇·新铺镇·沙营镇·花江镇·断桥镇 乡(1)·普利乡 |
紫云苗族布依族自治县 |
街道(3)·松山街道·五峰街道·云岭街道 镇(8)·格凸河镇·猴场镇·猫营镇·板当镇·宗地镇·大营镇·坝羊镇·火花镇 乡(2)·白石岩乡·四大寨乡 |
前面我们已经讲到,计算机是以二进制的形式来存储数据的,它只认识 0 和 1 两个数字,我们在屏幕上看到的文字,在存储之前都被转换成了二进制(0和1序列),在显示时也要根据二进制找到对应的字符。
可想而知,特定的文字必然对应着固定的二进制,否则在转换时将发生混乱。那么,怎样将文字与二进制对应起来呢?这就需要有一套规范,计算机公司和软件开发者都必须遵守,这样的一套规范就称为字符集(Character Set)或者字符编码(Character Encoding)。
严格来说,字符集和字符编码不是一个概念,字符集定义了文字和二进制的对应关系,为字符分配了唯一的编号,而字符编码规定了如何将文字的编号存储到计算机中。我们暂时先不讨论这些细节,姑且认为它们是一个概念,本节中我也混用了这两个概念,未做区分。
字符集为每个字符分配一个唯一的编号,类似于学生的学号,通过编号就能够找到对应的字符。
可以将字符集理解成一个很大的表格,它列出了所有字符和二进制的对应关系,计算机显示文字或者存储文字,就是一个查表的过程。
在计算机逐步发展的过程中,先后出现了几十种甚至上百种字符集,有些还在使用,有些已经淹没在了历史的长河中,本节我们要讲解的是一种专门针对英文的字符集——ASCII编码。
在正式介绍 ASCII 编码之前,我们先来说说什么是拉丁字母。估计也有不少读者和我一样,对于拉丁字母、英文字母和汉语拼音中的字母的关系不是很清楚。
拉丁字母也叫罗马字母,它源自希腊字母,是当今世界上使用最广的字母系统。基本的拉丁字母就是我们经常见到的 ABCD 等26个英文字母。
拉丁字母、阿拉伯字母、斯拉夫字母(西里尔字母)被称为世界三大字母体系。
拉丁字母原先是欧洲人使用的,后来由于欧洲殖民主义,导致这套字母体系在全球范围内开始流行,美洲、非洲、澳洲、亚洲都没有逃过西方文化的影响。中国也是,我们现在使用的拼音其实就是拉丁字母,是不折不扣的舶来品。
后来,很多国家对 26 个基本的拉丁字母进行了扩展,以适应本地的语言文化。最常见的扩展方式就是加上变音符号,例如汉语拼音中的ü,就是在u的基础上加上两个小点演化而来;再如,áà就是在a的上面标上音调。
总起来说:
基本拉丁字母就是 26 个英文字母;
扩展拉丁字母就是在基本的 26 个英文字母的基础上添加变音符号、横线、斜线等演化而来,每个国家都不一样。
计算机是美国人发明的,他们首先要考虑的问题是,如何将二进制和英文字母(也就是拉丁文)对应起来。
当时,各个厂家或者公司都有自己的做法,编码规则并不统一,这给不同计算机之间的数据交换带来不小的麻烦。但是相对来说,能够得到普遍认可的有 IBM 发明的 EBCDIC 和此处要谈的 ASCII。
我们先说 ASCII。ASCII 是“American Standard Code for Information Interchange”的缩写,翻译过来是“美国信息交换标准代码”。看这个名字就知道,这套编码是美国人给自己设计的,他们并没有考虑欧洲那些扩展的拉丁字母,也没有考虑韩语和日语,我大中华几万个汉字更是不可能被重视。
但这也无可厚非,美国人自己发明的计算机,当然要先解决自己的问题
ASCII 的标准版本于 1967 年第一次发布,最后一次更新则是在 1986 年,迄今为止共收录了 128 个字符,包含了基本的拉丁字母(英文字母)、阿拉伯数字(也就是 1234567890)、标点符号(,.!等)、特殊符号(@#$%^&等)以及一些具有控制功能的字符(往往不会显示出来)。
在 ASCII 编码中,大写字母、小写字母和阿拉伯数字都是连续分布的(见下表),这给程序设计带来了很大的方便。例如要判断一个字符是否是大写字母,就可以判断该字符的 ASCII 编码值是否在 65~90 的范围内。
EBCDIC 编码正好相反,它的英文字母不是连续排列的,中间出现了多次断续,给编程带来了一些困难。现在连 IBM 自己也不使用 EBCDIC 了,转而使用更加优秀的 ASCII。
ASCII 编码已经成了计算机的通用标准,没有人再使用 EBCDIC 编码了,它已经消失在历史的长河中了。
标准 ASCII 编码共收录了 128 个字符,其中包含了 33 个控制字符(具有某些特殊功能但是无法显示的字符)和 95 个可显示字符