2.1 数据文字的表示方式
创始人
2024-06-03 09:11:22
0

2.1数值与编码

信息的数字化表示概念

1.信息: 计算机能够处理的如数值、文字、符号、语音、图形等数据称为信息。

2.数据: 传递(携带)信息的实体,是信息的具体表现形式。信息是数据的内容或解释。

3.编码: 就是用少量、简单的基本符号,选用一定的组合规则,以表示大量复杂多样的信息。如12345,Computer就是现实生活的典型例子.计算机中使用的是二进制编码又称基二码。如果表示的是数值数据,则称为二进制数。

数据与编码的关系: 数据→适合传输的数字信号

4.信号:电流、电位、脉冲等,数据以信号的形式在介质中传播。是数据的具体物理表现。

5. 二进制编码的作用

(1) 基二码在物理上最容易实现。如触发器具有两个稳定的状态可表示0和1,又很 方便地实现翻转。

(2)二进制算术运算规则简单,为提高计算机的运算速度,降低实现成本奠定了基础;

(3)基二码的两个基本符号“0”和“1”能方便地与逻辑命题的“是”和“否”,或称“真”和“假”相对应。

6.在计算机中所有的数据均用二进制表示和存储

例如:用来表示外界各种信息的数值数据、非数值数据

计算机内部的各种指令,状态,地址和数据等

7.计算机中所有的运算都最终转化为二值运算,基于布尔代数运算规则

一、进位计数制(二、八、十、十六进制数)

凡是需要计算机处理的信息,无论其表现形式是文本、字符、图形,还是声音、图象,都必须以二进制数的形式来表示。因此必须首先掌握计算机中数的表示和编码。人们最常用的数是十进制数。为了总结各种进制数的共同特点,这里首先归纳十进制的主要特点。

十进制数有两个主要特点:

①有十个不同的数字符号:0,1,2…,9。

② 遵循“逢十进一”原则。

一般地,任意一个十进制数N都可以表示为:

编辑

式(2.1)是十进制按权的展开式。

式中,10称十进制数的基数,i表示数的某一位, 10i称该位的权,Ki表示第i位的数码,它可以是0~9中的任意一个数,由具体的数N确定。m和n为正整数, n为小数点左边的位数, m为小数点右边的位数。式(2-1)可以推广到任意进位计数制。

编辑

设基数用R表示,则对于二进制,R=2,K为0或1,逢二进一。

对于八进制,R=8,K为0~7中的任意一个,逢八进一。

对于十六进制,R=16,K为0~9、A、B、C、D、E、F共16个数码中的任意一个,逢十六进一。

综上可见,上述几种进位制有以下共同点:

① 每种进位制都有一个确定的基数R,每一位的系数K有R种可能的取值。

② 按“逢R进一”方式计数,在混合小数中,小数点左移一位相当于乘以R,右移一位相当于除以R。

二、数制间的转换

1.二、八、十六进制数转换为十进制数

这种转换只需将二、八、十六进制数按权展开。

例:(110.01)2 = 1×22+1×21+0×20+0×2-1+1×2-2 =(6.25)10

(175)8 =1×82+7×81+5×80 =(125)10

(B2C)16 =11×162+2×161+12×160=(2860)10

2.十进制转换成二、八、十六进制数

十进制数转换成二、八、十六进制数时,需要把整数部分与小数部分分别转换,然后拼接起来。

(1)整数部分的转换——除基取余法 (2)小数的转换——乘基取整法

3.二进制与八进制、十六进制的相互转换

由于8=23,16=24,因此二进制与八进制或十六进制之间的转换就很简单。将二进制数从小数点位开始,向左每3位产生一个八进制数字,不足3位的左边补零,这样得到整数部分的八进制数;向右每3位产生一个八进制数字,不足3位右边补0,得到小数部分的八进制数。同理,将二进制数转换成十六进制数时,只要按每4位分割即可。

例:(101101.101001)2=(55.51)8=(2D.A4)16

很明显,八或十六进制要转换成二进制,只需将八或十六进制数分别用对应的三位或四位二进制数表示即可。

一个数值型数据的完整表示包括三个方面:

(1)采用什么进位计数制,就是逢几进位;

(2)如何使符号数字化,即机器数的编码方法;

(3)如何处理小数点位置,即采用定点表示或浮点表示。

一、机器数与真值

机器数是一个数在计算机中的表示形式,一个机器数所表示的数值称为真值。上面提到的二进制数,没有提到符号问题,故是一种无符号数的表示。对无符号数,机器数与真值相同,此时计算机的全部有效位都用来存放数据,它能表示的最大数值取决于计算机的字长;对于n位字长的计算机来说,表示无符号的整数范围为0~2n–1。 带符号数的习惯表示方法是在数值前用“+”号表示正数,“–”号表示负数。计算机只能识别0和1,对数值的符号也不例外。对于带符号的数,在计算机中,通常将一个数的最高位作为符号位,最高位为0,表示符号位为正;最高位为1,表示符号位为负。

例如:真值 机器数

+82=0 1010010

–82=1 1010010

式中等号左边的+82和–82分别是等号右边的机器数所代表的实际数,即真值。

二、原码、反码与补码

1.原码

上述以最高位为0表示正数,1表示负数,后面各位为其数值,这种数的表示法称为原码表示法。

原码的几个特点:

(1)数值部分即为该带符号数的二进制值。

(2)“0”有+0和- 0之分,若字长为八位,则:(+0)原=0 0000000,(–0)原=1 0000000。(这里之前老师问到了不会)😂(我的理解:即符号位不同有正0和负0)

(3)8位二进制原码能表示的数值范围为:01111111~11111111,即+127~–127。(问的数值范围不是问这个数是多少不一样的)

那么,对于n位字长的计算机来说,其原码表示的数值范围为~

原码简单,与真值转换方便。但是若两个异号数相加或两个同号数相减时,必须做减法。在计算机机器内部,为了避免做减法,把减法运算统一转换为加法运算,即用一个加法器来完成加减法运算,便引入了反码和补码。

2.反码

对于正数其反码形式与其原码相同,最高位0表示正数,其余位为数值位。

例如:X=+5, [X]原=[X]反=0 0000101

X=+127, [X]原=[X]反=0 1111111

X=+0, [X]原=[X]反=0 0000000

对于负数将其原码除符号位以外,其余各位按位取反,即可得到其反码表示形式。

例如:X=–5, [X]原=1 0000101, [X]反=11111010

X=–127, [X]原=1 1111111,[X]反=10000000

X=–0, [X]原=1 0000000, [X]反=11111111

从以上几例,可归纳出二进制反码的特点:

(1)“0”有+0和-0之分。

(2)8位二进制反码所能表示的数值范围为+127~–127,一般地,对于n位字长的计算机来说,其反码表示的数值范围为~.

(3)8位带符号的数用反码表示时,若最高位为“0”(正数),则后面的7位即为数值;若最高位为“1”(负数),则后面7位表示的不是此负数的数值,必须把它们按位取反,才是该负数的二进制值。

例如:[X]反=10101010,它是一个负数,其中后7位为0101010,取反得1010101,所以负数:X=–(1×26+1×24+1×22.+1×20)=–85

3.补码

正数的补码与其原码具有相同的表现形式,最高位为符号位,其余为数值位。

例如:X=+127,[X]原=[X]反=[X]补=0 1111111

X=+0, [X]原=[X]反=[X]补=0 0000000

负数的补码即为它的反码在最低位加上1。

例如:X=–5, [X]原=1 0000101,[X]反=1 1111010,[X]补=1 1111011

X=–0, [X]原=1 0000000,[X]反=1 1111111, [X]补=0 0000000

X=–128,[X]补=1 0000000

从以上几例,可归纳出二进制补码的几个特点:

(1)[+0]补=[–0]补=00000000,无+0和–0之分。

(2)正因为补码中没有+0和–0之分,所以8位二进制补码所能表示的数值范围为+127~–128;同理可知,n位二进制补码表示的范围为+2n-1–1~–2n-1。在原码、反码和补码三者中,只有补码可以表示–2n-1。

(3)一个用补码表示的二进制数,当为正数时,最高位(符号位)为“0”,其余位即为此数的二进制值;当为负数时,最高位(符号位)为“1”,其余位不是此数的二进制值,必须把它们按位取反,且在最低位加1,才是它的二进制值。

总结:

(1)只有源码和反码有两个0(即+0,-0),但是补码只有一个0

BCD(二-十进制)码是一种常用的数字代码,它广泛应用于计算机中。这种编码法分别将每位十进制数字编成4位二进制代码,从而用二进制数来表示十进制数。

计算机中采用的是二进制数,由于二进制数不直观,人们不习惯,因此计算机在输入和输出时,通常仍采用十进制数,只不过它要用二进制编码来表示,这时使用BCD码就很方便。

最常用的BCD码是标准BCD码或称8421码(这是根据这种表示中各位的权值而定的,其权值与普通的二进制相同)。表2.1列出了标准BCD码与十进制数字的编码关系。

表2.1标准BCD码与十进制数字的编码关系

十进制数

标准BCD码

十进制数

标准BCD码

0

0000

8

1000

1

0001

9

1001

2

0010

10

00010000

3

0011

11

00010001

4

0100

12

00010010

5

0101

15

00010101

6

0110

63

01100011

7

0111

94

10010100

十进制基数为10,它有10个不同的数码。因此为了能表示十进制数的某一位,必须选择至少4位二进制数(4位二进制数可以表示16种不同的状态,所以用以表示十进制数时要丢掉6种状态)。在BCD码中,0~9之间的十进制数的BCD码与二进制数中的表示形式是一样的,而1010~1111这6种状态不使用,因此用标准BCD码表示十进制数时,只要对每个十进制数字用适当的二进制数代替即可。

例如:十进制数123可以表示成:0001 0010 0011。

例如:十进制小数0.456可以表示成:0.0100 0101 0110。

二、字符的编码

各种字符信息应用到计算机中时,都必须编写成二进制格式的代码,也就是字符信息用数据表示,称为符号数据。

计算机中最通用的字符信息编码为美国标准信息交换码,简称ASCⅡ码,这种代码用一个字节(8位二进制码)来表示一个字符,其中低7位是字符的ASCⅡ码值,例如:英文字母A是41H。小于20H的是不可显示字符,通常是命令代码,如0AH是换行命令符。

三、汉字的编码(输入码、内码、字模码)

用计算机进行汉字信息处理,首先必须将汉字代码化,即对汉字进行编码,称为汉字输入码。汉字输入码送入计算机后还必须转换成汉字内部码,才能进行信息处理。处理完毕之后,再把汉字内部码转换成汉字字模码,才能在显示器或打印机输出。因此汉字的编码有输入码、内码、字模码三种。

1.汉字的输入编码(数字编码、拼音码、字形编码)

目前,计算机一般是使用西文标准键盘输入的,为了能直接使用西文标准键盘输入汉字,必须给汉字设计相应的输入编码方法。其编码方案有很多种,主要的分为三类:数字编码、拼音码和字形编码。

(1)数字编码

常用的是国标区位码,用数字串一个汉字输入。区位码是将国家标准局公布的6763个两级汉字分为94个区,每个区分94位,实际上把汉字表示成二维数组,每个汉字在数组中的下标就是区位码。区码和位码各两位十进制数字,因此输入一个汉字需按键四次。例如:“中”字位于第54区48位,区位码为5448。数字编码输入的优点是无重码,输入码与内部编码的转换比较方便,缺点是代码难以记忆。

(2)拼音码

拼音码是以汉语拼音为基础的输入方法。凡掌握汉语拼音的人,不需训练和记忆,即可使用,但汉字同音字太多,输入重码率很高,因此按拼音输入后还必须进行同音字选择,影响了输入速度。

(3)字形编码

字形编码是用汉字的形状来进行的编码。汉字总数虽多,但是由一笔一划组成,全部汉字的部件和各行其是是有限的。因此,把汉字的笔划部件用字母或数字进行编码,按笔划的顺序依次输入,就能表示一个汉字了。例如:五笔字型编码是最有影响的一种字形编码方法。

2.汉字内码

同一个汉字以不同输入方式进入计算机时,编码长度以及0、1组合顺序差别很大,使汉字信息进一步存取、使用、交流十分不方便,必须转换成长度一致、且与汉字惟一对应的能在各种计算机系统内通用的编码,满足这种规则的编码叫汉字内码。

汉字内码:是用于汉字信息的存储、交换检索等操作的机内代码,一般采用两个字节表示。英文字符的机内代码是七位的ASCII码,当用一个字节表示时,最高位为“0”。为了与英文字符能够区别,汉字机内代码中两个字节的最高位均规定为“1”。

有些系统中字节的最高位用于奇偶校验位或采用扩展ASCII码,这种情况下用三个字节表示汉字内码。

3.汉字字模码

字模码:是用点阵表示的汉字字形代码,它是汉字的输出形式。计算机内的汉字需要在屏幕上显示或在打印机上输出时,需要知道汉字的字形信息,汉字内码并不能直接反映汉字的字形,而要采用专门的字形码。

根据汉字输出的要求不同,点阵的多少也不同。简易型汉字为16×16点阵,提高型汉字为24×24点阵、32×32点阵,甚至更高。点阵越大,描述的字形越细致美观,质量越高,所占存储空间也越大。汉字点阵的信息量是很大的,以16×16点阵为例,每个汉字要占用32个字节,国标两级汉字要占用256K字节。因此字模点阵只能用来构成汉字库,而不能用于机内存储。

综上所述,汉字从送入计算机到输出显示,汉字信息编码形式不尽相同。汉字的输入编码、汉字内码、字形码是计算机中用于输入、内部处理、输出三种不同用途的编码,不要混为一谈。

相关内容

热门资讯

清朝有很多有名的历史人物,能给... 清朝有很多有名的历史人物,能给大家说几个清朝的历史人物吗?林则徐,张之洞,乾隆皇帝,曾国藩,朱耷,这...
曹丕的“太子四友”指的是谁 曹丕的“太子四友”指的是谁首先说,曹丕这四个,陈群司马懿是顶级的谋士和政治家,吴质有些小聪明,朱铄不...
在这次遇难者中存在了几名幸存者... 在这次遇难者中存在了几名幸存者。这句话是不是逻辑错误这句话的逻辑没有问题,有问题的是用词不当。遇难者...
在中国古代,有许多充满哲学智慧... 在中国古代,有许多充满哲学智慧的成语典故、寓言故事,如...在中国古代,有许多充满哲学智慧的成语典故...
清澈的意思是什么,… 清澈的意思是什么,…清净而明澈清而透明【造句】看着他清澈而又天真的眼眸,我的心久久不能平静……
蚂蚁森林合种爱情树一方退出怎么... 蚂蚁森林合种爱情树一方退出怎么找回来两个人合种的爱情树,我退出来,我怎么再次加入进去继续合作那个树?...
有好看的古代修炼小说推荐吗? 有好看的古代修炼小说推荐吗?古代重生穿越修炼......让我帮你找一下这些古代修炼的小说,找到这些类...
女主重生爱上前世辜负的人 女主重生爱上前世辜负的人重生我是你正妻渣女重生之竹马重生之弃渣重生之夫君可欺重生之换我疼你重生妇归来...
华胥引有广播剧吗 华胥引有广播剧吗现有的华胥引的广播剧是忆语广播剧社出品的,只有十三月和杯(这个是错字,请无视,居然输...
选文韩麦尔先生在说了,我的朋友... 选文韩麦尔先生在说了,我的朋友们我就要离开你们呢了,再见了银头鲑鱼tj75rt6yturdrruv ...
中通快递从北京保定市到广东揭阳... 中通快递从北京保定市到广东揭阳普宁要多久?中通快递从北京保定市到广东揭阳普宁要多久?从北京到广东需要...
关于离婚悲伤的歌曲 关于离婚悲伤的歌曲关于离婚悲伤的歌曲林俊杰《可惜没如果》 张靓颖《我走以后》 金志文《流着泪说分手》...
形容文笔差怎么说啊? 形容文笔差怎么说啊?哥哥姐姐,麻烦问下,我是做文员的,形容文案方面的工作很差应该怎么说啊?粗鄙怎么样...
我想做未婚妈妈,可行吗? 我想做未婚妈妈,可行吗?没关系吧?我同学好多他们妈妈都是30岁以后省得他们,都没事啊,但是如果你自己...
如何在两个excel表格里筛选... 如何在两个excel表格里筛选出重复的名字如何在两个excel表格里筛选出重复的名字1、电脑打开EX...
且试天下 哪些小说是用白绫做武... 且试天下 哪些小说是用白绫做武器的?神雕侠侣吖- -..小龙女一开始就是用白绫的聊斋 辛十四娘嘿嘿~...
自带高冷体质,笑起来温暖又治愈... 自带高冷体质,笑起来温暖又治愈的星座,你了解吗?虽然天生高冷体质,但是笑起来特别的温暖治愈的新作用天...
火星未解之谜 火星未解之谜多列举一些,每个事例最好长一点,谢啦~“火星人脸”, “地表被水冲击河道”,“原始大气和...
我是1991年10月4号生的,... 我是1991年10月4号生的,是什么星座啊有的说是处女座有的说是天平座,糊涂了,到底是什么啊很负责任...
梦见白狐狸,然后当时我骑着自行... 梦见白狐狸,然后当时我骑着自行车,我想躲开它,他很凶的的追赶我,最后它向我扑了过来,然后我就醒乐.你...