社会统计学第一讲课堂笔记

统计学第一讲


第一节

作业1

1.统计的概念和来源

维基百科: 统计手法最早可以追溯至公元前5世纪。最早的统计著作来自公元9世纪的《密码破译》(Manuscript on Deciphering Cryptographic Messages)一书,由阿拉伯人肯迪编著。在书中 ,肯迪 详细记录了如何使用统计数据和频率分析进行密码破译。根据沙特阿拉伯工程师易卜拉欣·阿凯笛(Ibrahim Al-Kadi)的说法, 统计学和密码学 分析便如此一同诞生了


佛罗伦萨银行家、执政官乔瓦尼·维伦(英语:Giovanni Villani)编订了佛罗伦萨14世纪历史书籍Nuova Cronica ,包括了如人口、法令、商贸、教育、宗教场所在内的统计数据,被誉之为历史上统计学入门的第一本书。[8]一些学者将1663年约翰·格兰特根据死亡率统计表编订出版的 《自然与政治观察》 (Natural and Political Observations)一书定格为统计学的诞生。[9]

统计学的英语词statistics是源于现代拉丁语statisticum collegium(国会)以及意大利语statista(国民或政治家)。德语Statistik,最早是由Gottfried Achenwall(1749)所使用, 代表对国家的数据进行分析的学问 ,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及数据中探究其意义,并且由John Sinclair引进到英语世界。

统计学的初衷是作为政府(通常是中央政府)以及管理层次结构的工具。 它大量透过国家以及国际统计服务搜集国家以及本土的数据。另外依照各方面,普查则提供关总体的信息。统计背后牵涉到更多数学导向的领域,如概率,或是从经验科学(特别在天文学)中获得的经验证据设置估计参数。在今日的世界里统计已经被使用在不仅仅是国家或政府的事务,更延伸到商业,自然以及社会科学,医疗等甚至更多方面。因为统计学拥有深厚的历史以及广泛的应用性,统计学通常不只被认为是数学所处理的对象,而是与数学本身的哲学定义与意义有密切的关系。许多知名的大学拥有独立的数理统计学系。统计学也在如心理学,教育学以及公共卫生学系中被视为是一门主科。

统计学的数学基础创建在17世纪布莱兹·帕斯卡和皮埃尔·德·费马发展的概率论上。概率论从研究几率得来。最小二乘法由卡尔·弗里德里希·高斯于1794年第一次得出。现代计算机可以进行更大尺度的统计运算,生成了许多无法用人工计算的新公式。

百度百科: 在实际应用中,人们对统计一词的理解一般有三种涵义: 统计工作 、统计资料和 统计科学

(1)统计工作。指利用科学的方法搜集、整理和分析和提供关于社会经济现象数量资料的工作的总称,是统计的基础。 也称统计实践,或统计活动,是在一定统计理论指导下,采用科学的方法,搜集、整理、分析统计资料的一系列活动过程。它是随着人类社会的发展、治国和管理的需要而产生和发展起来的,至今已有四五千年的历史。现实生活中,统计工作作为一种认识社会经济现象总体和自然现象总体的实践过程,一般包括 统计设计 统计调查 统计整理 和统计分析四个环节。

(2)统计资料。指通过统计工作取得的、用来反映社会经济现象的数据资料的总称。 统计工作所取得的各项数字资料及有关文字资料,一般反映在 统计表 统计图 、统计手册、统计年鉴、统计资料汇编和统计分析报告中。也称 统计信息 ,是反映一定社会经济现象总体或自然现象总体的特征或规律的数字资料、文字资料、图表资料及其他相关资料的总称。包括刚刚调查取得的原始资料和经过一定程度整理、加工的次级资料,其形式有: 统计表 统计图 、统计年鉴、 统计公报 、统计报告和其他有关统计信息的载体。

(3)统计科学。也称 统计学 ,是统计工作经验的总结和理论概括,是系统化的知识体系。指研究如何搜集、整理和分析统计资料的理论与方法。统计学是 应用数学 的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

总体来说,“统计”一词的三方面涵义是紧密联系的,统计资料是统计工作的成果,统计工作与统计科学之间是实践与理论的关系。

统计学的性质

研究对象:客观现象的数量

总体现象的数量特征和规律性

属性:方法论科学

统计学的作用

统计和数学

统计体现相对性,数学体现绝对性

统计研究方法

大量观察法 综合分析法 统计分组法 归纳推断法

统计分析方法

描述统计(图表)

推断统计(样本推断总体)

三、统计学的几个基本概念



第二节:社会科学概述



根据应用数学的程度从小到大对学科进行分类:文学-政治-管理-经济-统计-机械-物理

2.1社会研究特点:

复杂性(随机性、模糊性、彼此相关的非线性关系)

依赖性(以来与自然科学)

主观性(主观因素制约、民族性、阶级性)

难验证性(较长运行周期、时间上具有不可逆性)

2.2社会科学相对落后于自然科学



2.3社会研究的发展趋势:自然科学化

2.3.1社会科学与自然科学的关系

社会事物是一种特殊的自然事物

社会规律是一种特殊的自然然规律

社会科学是一种特殊的自然科学

2.3.2社会科学自然科学化的 必要性性

1.随着社会生产力的不断发展,社会事物的复杂化程度进一步提高,人们的主观反映所产生的误差也越来越大,由此所产生的社会危害越来越重,推动社会科学朝着精确性和客观性方向发展的动力越来越大。

2.由于社会分工日趋细微,社会结构日趋复杂,社会控制的手段也随之越来越丰富多样、准确及时,各种法律条文日趋具体化、精确化,这就在技术上产生了对社会科学精确性和客观性越来越高的要求。

2.3.3社会研究实现自然科学化的可能性

1.社会不管怎么复杂,终归是自然的产物,它与自然界在更高的意义上是同一的。人类不管怎么超感性、超物质,终归是物质运动的一种表现形式,人与社会的复杂性与神秘性最终都可以通过自然科学的高度发展来充分地、精确地、客观地揭示和描述。自然科学与社会科学最终都将无限地趋近于同一轴线而完全融为一体,从而可以完全消除当前社会科学中普遍存在的主观性、模糊性和不精确性。

2.3.4社会研究实现自然科学化的具体途径

社会科学实现自然科学化,并不是指社会科学个别地或部分地引入自然科学的研究方法,而是指社会科学必须完全以自然科学的基本公理为假设前提,所有推理论证与运算必须严格遵循规定的逻辑程序,所得结论必须经得起严格的实践或实验的检验。

社会学+统计学--->社会科学的自然科学化

第三节:变量与数据

分类及等级(从小到大):定类变量-->定序变量-->离散变量-->连续变量

3.1无序类别变量(分类变量、定性变量)

特点:

1.计量层次最低

2.对事物进行平行的分类

3.各类别可以指定数字代码表示

4.使用时必须符合类别穷尽和互斥的要求

5.数据表现为“类别”

6.具有=或不等的数学特性

3.2有序类别变量(定序变量、等级资料)

特点:

1.对事物顺序进行分类

2.数据表现为“类别”,但有序

3.比定类尺度精确

4.未测量出类别之间的准确差值

5.具有>或<的数学特性

注意:序次的可传递性

在给序次编排号码时,往往采用阿拉伯数字,定序变量的标号只是一个序数而不是一个基数,它不具有数量差的含义。

3.3数值变量(定量变量)

1.对事物的准确测度

2.比类别尺度精确

3.数据表现为“数值”

4.具有 + 或 – 与´ 或 ¸的数学特性



p.s在收集资料时,应尽可能地运用高水平的测量,因为低水平测量资料可以根据高水平测量资料加工而成。

有时候除了以上研究变量,还有备检变量

第四节:统计与计算机

4.1主要用spss。相关传送门SPSS 25/64位下载地址: pan.baidu.com/s/1mFiCAJ

提取码: zqxz

SPSS 25/32位下载地址: pan.baidu.com/s/1vUOFtb

提取码:jhxq

授权码在安装教程内,安装教程: mp.weixin.qq.com/s/IZJ1

本文件网盘传送门:

提取码:vyts

发布于 2020-02-19 11:29