窝牛号

关于计算机网络技术主要学什么的一些介绍

今天窝牛号就给我们广大朋友来聊聊计算机网络技术主要学什么,以下关于的观点希望能帮助到您找到想要的百科。

数据结构是计算机存储、组织数据的方式,运用计算机网络编程技术处理统计数据就是采用计算机常用的数据结构来存储、组织统计数据。

统计数据是对自然和社会现象进行统计工作的结果,统计研究离不开统计数据。可以说凡是人们用某种载体记录下来的、能反映自然界和人类社会某种信息的,就可称之为数据。步入现代信息社会,信息的种类和数量越来越丰富,载体也越来越多。数字是数据,文字是数据,图像、音频、视频等都是数据。统计方法和技术被广泛运用于这些多样化的数据,统计数据的含义已经大大超出传统范畴,通过网络技术构建功能强大的统计数据处理和展示平台势在必行。

一、传统统计学数据的主要分类

1、统计数据的计量类型

统计指标的可量性决定了,在对于社会经济现象的数量方面进行研究时,必须予以量化,从数据量化的抽象程度不同分为以下几个层次:

I、定类尺度

定类尺度(nominal scale)或称作列名尺度,就是将研究对象按某种特征划分成若干部分,并给每一类别定名,但不对类别之间的关系做任何假定。定类尺度是最粗略、精度最低的计量尺度,也是最基本的尺度。例如,在人口统计中按地区分组、民族分组,并用数字作为代号,如北京为01,河北为02等。这种测定尺度和分组在实际统计活动中使用得很广泛,主要用于计算各组数值占总体数值的比重和众数等特征值,以及进行逻辑运算等,但不能对各类编号进行加减乘除计算。

II、定序尺度

定序尺度(ordinal scale)或称为顺序尺度,它是把各类事物按一定特征的大小、高低、强弱等顺序排列起来,构成定序数据。例如,将产品按其质量高低列成一等品、二等品、三等品,学生的成绩排列为优、良、中、及格、不及格等,这种测定尺度的量度层次要比定类尺度高一些,它不仅可以分类,而且可以确定这些类别的顺序,各类之间还能比较等级和次序上的差别。在运算上,各类量值除了具有等与不等的特征外,还有大于或小于之分,但其序号仍不能进行加减乘除计算。定序尺度除了可用来计量比重(频率)外,还可进行累计频数(率)、中位数等特征值的计算。

III、定距尺度

定距尺度(interval scale)或称间隔尺度,它是把定序排列的各类事物间的差距,以一定的度量单位明确起来,构成定距的数据。这是更精确的计量尺度,一般要求建立某种物理的量度单位。如考试成绩以“分”计量;长度以“米”计量等等。成绩每分之间的间隔是相等的,80分与90分的差距等同于90分与100分的差距。在运算上,除了等于、不等于、大于、小于之外,还可进行加减运算,但不能进行乘除运算。例如可以说30℃与25℃相差5℃,且它与10℃与5℃之间的差距相等,却不能说10℃比5℃热一倍。

IV、定比尺度

定比尺度(ratio scale)或称比率尺度,是量度层次最高的数据测定尺度。它是在定距尺度的基础上增加了一个绝对零点,并抽象掉事物的度量差异的测定尺度。换言之,定距尺度中的“0”只表示某一个值,即0值;而定比尺度中的“0”是绝对零点,表示没有。定距尺度与定比尺度的差别,在于是否存在绝对零点,“0”在两者间的意义是不同的,如某人数学考试得0分,只能表示他的数学成绩是0分,不等于说他完全没有数学水平,但如说某人的身高为0米,则表示此人是不存在的。在运算上,定比尺度可以用于任何统计运算和比较。所以应用广泛,许多统计的最终结果是以定比尺度给出的。

在测定尺度的应用中,同类事物用不同的尺度量化,就会得到不同的尺度数据。如农民收入数据按实际值填写就是定距尺度;按高、中、低收入水平分别记载就是定序尺度;而按有无收入计量则成为定类尺度了;如果说某人的收入是另一人的两倍,则是定比尺度。又如,学生成绩若具体打分就是定距尺度,用优、良、中、及格、不及格划分就是定序尺度。一般因研究的目的和内容不同,计量尺度也会不同,若不担心损失信息量,就可降低量度层次,从而实现它们间的转化。例如,性别在医学上若根据荷尔蒙的比例来区分,就是定距尺度,而性别分为男、女,则是定类尺度。

2、统计数据的时空特征分类

统计数据按被说明对象的时间或空间的分布特征,可分为截面数据、时间序列、和面板数据等三类,具体介绍如下:

I、截面数据

截面数据(cross-section data)又称为横截面数据集(Cross-sectional data set),它是指在同一时间对总体中的各不同单位的数量进行观察而获得的静态数据,它所描述的是现象在某一时刻的不同单位间的变化情况。如2008年我国各地区的国内生产总值就是截面数据,它是2008年这一时间的固定标志下, GDP在各单位的空间分布情况。

II、时间序列

时间序列(Time series)也叫时间数列,又称为动态数列或时间序列数据集(Time series data set)。它多指某一单位的某一数量标志,在不同的时间的表现数据。也可以是同一总体的数量特征在不同时间所获得的数据序列,它所描述的是现象随时间而变化的情况。如2000—2008年我国的国内生产总值等数据序列。

不论是截面数据,还是时间序列,在软件中多数情况下都是以向量(数组)来表述。

III、面板数据

面板数据Panel data是截面和时间序列数据的结合,它使数据库具有三维特点,即截面空间个体i、时间t、指标信息k的数据结构。 面板数据还有很多名称和叫法,主要有时间序列截面数据(time series and cross section data)、综列数据或纵横数据(longitudina data)等。

这类数据在软件中,常使用矩阵或数组来表述。主要分类如下:

平衡与非平衡面板数据:如果面板数据系统中的每一个单位和每一个时期都有观测值,则称其谓平衡面板数据(balanced panel data)或叫平行数据;若面板数据中丢失若干个时间或空间的观测值,则称为非平衡面板数据(unbalanced panel data)。独立混合截面数据:独立混合截面 (Independently pooled cross section)数据是指来自同一总体的,在不同时点上随机抽样获取的数据,其各数据并不是同一成员单位在不同时间上的反映,所以在不同时点上的观察点不是同分布(identically distributed)的。

利用计算机进行数据处理,必须让计算机可以识别判断其将要进行处理数据结构,上述传统统计数据分类及构成显然不适合计算机操作处理。

二、网络统计学数据结构

在计算机网络技术支撑下进行统计工作,统计数据必须便于计算机软硬件在线或离线进行存储、处理、交换和展示。

网络统计数据类型分为:

数值型数据:最常见的统计数据类型,实质上是以我们前述的定序、定距、及定比等各种数据为主,以整数、小数型数值表示的常规数据;字符型数据:各种文字符号在统计上并不算作数据资料,最接近的就是定类尺度的数据。而在计算机上主要处理的就是字符类的数据,为此在软件中对字符类数据多采用引号的方式来定义字符类数据。如,而A=”中华人民共和国”时,则是表示A就是中华人民共和国这七个字符,即这时它属于字符型的数据;逻辑型数据:只能表示两个可能的取值,即 true(真)和 false(假)。逻辑型数据通常用于表示逻辑条件的结果,例如某个条件是否成立、某个状态是否为真、某个变量是否具有某种属性等;日期型数据:统计数据和时间密切相关。日期型数据包含年、月、日、时、分、秒等多个部分,可以用来表示具体的时间点或时间段。在计算机科学中,日期型数据广泛应用于处理时间和日期相关的问题,例如计算机系统中的时钟、日历、任务调度、事件记录等等。在软件开发中,日期型数据也经常用于处理时间戳(timestamp)、时间间隔(duration)、日期格式化(date formatting)等问题。

由于网络统计学方法主要处理软件为Javascript、网络文档为HTML,借鉴计算机技术广泛运用的数据格式和规范,网络统计学数据结构如下:

1、格式化字符(串)

将统计数据按指定特殊字符进行有规律地标记分割,使得计算机容易识别和转换。

例如,某种商品价格和销售量统计数据如下表:

价格(元)

87

76

86

69

85

70

78

83

88

78

销量(台)

23

34

20

25

21

28

21

23

19

24

表中的价格和销售量数据可以固定按格式书写为:

"87,76,86,69,85,70,78,83,88,78|23,34,20,25,21,28,21,23,19,24"

这里我们分别采用“,”为表格数据列分割符、“|”为表格数据行分割符。

2、数组

所谓数组,就是相同数据类型的元素按一定顺序排列的集合,就是把有限个类型相同的变量用一个名字命名,然后用编号区分他们的变量的集合,这个名字称为数组名,编号称为下标。组成数组的各个变量称为数组的分量,也称为数组的元素,有时也称为下标变量。数组是在程序设计中,为了处理方便, 把具有相同类型的若干变量按有序的形式组织起来的一种形式。这些按序排列的同类数据元素的集合称为数组。

以流行的网页设计脚本语言JavaScript(JS)为例,表中价格数据可以用一维数组表示:

var myArray=[87,76,86,69,85,70,78,83,88,78];

JavaScript脚本语言中,“[ ]”为数组标记,意思是把价格数据作为数组赋值给变量myArray。 表中价格和销售量数据可以用二维数组表示:

var myArray=[ [87,76,86,69,85,70,78,83,88,78], [23,34,20,25,21,28,21,23,19,24] ];

文本字符也可以用数组表示,但文本要用单引号或双引号括起来,如:

var myText=['中国','美国','英国','法国','德国'];

3、JSON(JavaScript Object Notation)

一种轻量级的数据交换格式,JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C、C 、C#、Java、JavaScript、Perl、Python等)。这些特性使JSON成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成(网络传输速率)。

从结构上看,所有的数据(data)最终都可以分解成三种类型:

第一种类型是标量(scalar): 也就是一个单独的字符串(string)或数字(numbers),比如"北京"这个单独的词;第二种类型是序列(sequence):也就是若干个相关的数据按照一定顺序并列在一起,又叫做数组(array)或列表(List),比如"北京,上海";第三种类型是映射(mapping): 也就是一个名/值对(Name/value),即数据有一个名称,还有一个与之相对应的值,这又称作散列(hash)或字典(dictionary),比如"首都:北京"。

数据构成的最小单位竟是如此的简单。在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。21世纪初,Douglas Crockford寻找一种简便的数据交换格式,能够在服务器之间交换数据。当时通用的数据交换语言是XML(Extensible Markup Language,可扩展标记语言),但是Douglas Crockford觉得XML的生成和解析都太麻烦,所以他提出了一种简化格式,也就是JSON。

JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C、C 、C#、Java、JavaScript、Perl、Python等)。这些特性使JSON成为理想的数据交换语言。易于人阅读和编写,同时也易于机器解析和生成(网络传输速率)。

Json的规格比较简单,只用一个页面几百个字就能说清楚,而且Douglas Crockford声称这个规格永远不必升级,因为该规定的都规定了。JSON数据格式规则:

并列的数据之间用逗号(", ")分隔; 映射用冒号(": ")表示; 并列数据的集合(数组)用方括号("[]")表示; 映射的集合(对象)用大括号("{}")表示。

上面四条规则,就是Json格式的所有内容。比如,下面这句话:

"北京市的面积为16800平方公里,常住人口1600万人;" "上海市的面积为6400平方公里,常住人口1800万。"

写成json格式就是这样:

[ {"城市":"北京","面积":16800,"人口":1600}, {"城市":"上海","面积":6400,"人口":1800} ]

如果事先知道数据的结构,上面的写法还可以进一步简化:

[["北京",16800,1600],["上海",6400,1800]]

由此可以看到,json非常易学易用。所以,在短短几年中,它就取代xml,成为了互联网上最受欢迎的数据交换格式。

关于json数据规则更多信息参见JSON数据结构 - 网络统计学编程。JSON数据结构是描述各类型统计数据的最佳选择,为统计数据处理带来巨大便利条件。

今天的内容先分享到这里了,读完本文《关于计算机网络技术主要学什么的一些介绍》之后,是否是您想找的答案呢?想要了解更多,敬请关注baike.ccv168.com,您的关注是给小编最大的鼓励。

本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除

窝牛号 wwww.93ysy.com   沪ICP备2021036305号-1