公告:ppt120网初上线试运行,难免会遇到使用问题,请加Q1615251280及时解决,谢谢。

当前位置:首页 > 医药管理 > 医学统计学(全部课程666张PPT).ppt

医学统计学(全部课程666张PPT).ppt

本ppt课件为原文件,可正常修改编辑,

文字版

医学统计学(全部课程666张PPT).ppt

医学统计学(全部课程666张PPT).ppt

  1

  医 学 统 计 学

  主讲 xxx

  The teaching plan for medical students

  Professor Cheng Cong

  Dept. of Preventive Medicine Taishan Medical College

  预防医学教授,硕士生导师。男,1959年6月出生。汉族,无党派。1982年12月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。1994年7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。2003年12月晋升教授。现任预防医学教研室副主任。主要从事《医学统计学》、《预防医学》,《医学人口统计学》等课程的教学及科研工作,每年听课学生500-800人。自2000年起连续六年,为硕士研究生开设《医学统计学》、《SPSS统计分析简明教程》、《卫生经济学》等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文30多篇。代表作有“锌对乳癌细胞生长、增殖与基因表达的影响”,,“行列相关的测度” 等。主编、副主编各类教材及专著8部,代表作有《医学统计学》、《SPSS统计分析简明教程》获得院级科研论文及科技进步奖8项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获2004年泰山医学院首届十大教学名师奖。

  程琮教授简介

  医学统计学总目录

  第1章绪论

  第2章定量资料统计描述

  第3章总体均数的区间估计和假设检验

  第4章方差分析

  第5章定性资料的统计描述

  第6章总体率的区间估计和假设检验

  第7章二项分布与泊松分布

  第8章秩和检验

  第9章直线相关与回归

  第10章实验设计

  第11章调查设计

  第12章统计表与统计图

  第1章绪论 目录

  第五节 学习统计学应注意的几个问题

  第二节 统计工作的基本步骤

  第三节 统计资料的类型

  第四节 统计学中的几个基本概念

  第一节 医学统计学的定义和内容

  第一章 绪论 第一节 医学统计学的定义和内容

  医学统计学(medical statistics) ---是以医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌握事物内在客观规律的一门学科。

  医学研究的对象----主要是人以及与其健康有关的各种影响因素。 医学统计学的主要内容 : 1.统计设计 包括实验设计和调查设计,它可以合理地、科学地安排实验和调查工作,使之能较少地花费人力、物力和时间,取得较满意和可靠的结果。 2.资料的统计描述和总体指标的估计 通过计算各种统计指标和统计图表来描述资料的集中趋势、离散趋势和分布特征况(如正态分布或偏态分布);利用样本指标来估计总体指标的大小。

  3.假设检验 是通过统计检验方法(如t检验、u检验、F检验、卡方检验、秩和检验等)来推断两组或多组统计指标的差异是抽样误差造成的还是有本质的差别。 4.相关与回归 医学中存在许多相互联系、相互制约的现象。如儿童的身高与体重、胸围与肺活量、血糖与尿糖等,都需要利用相关与回归来分析。

  5.多因素分析 如多元回归、判别分析、聚类分析、正交设计分析、主成分分析、因子分析、logistic回归、Cox比例风险回归等,都是分析医学中多因素有效的方法(本书不涉及,请参考有关统计书籍)。这些方法计算复杂,大部分需借助计算机来完成。 6.健康统计 研究人群健康的指标与统计方法,除了用上述的某些方法外,他还有其特有的方法,如寿命表、生存分析、死因分析、人口预测等方法

  医学统计工作可分为四个步骤: 统计设计、搜集资料、整理资料和分析资料。 这四个步骤密切联系,缺一不可,任何一个步骤的缺陷和失误,都会影响统计结果的正确性。

  第二节 统计工作的基本步骤

  设计(design)是统计工作的第一步,也是关键的一步,是对统计工作全过程的设想和计划安排。 统计设计---就是根据研究目的确定试验因素、受试对象和观察指标,并在现有的客观条件下决定用什么方式和方法来获取原始资料,并对原始资料如何进行整理,以及整理后的资料应该计算什么统计指标和统计分析的预期结果如何等。

  一、统计设计

  搜集资料(collection of date) —— 是根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。 医学统计资料的来源主要有以下三个方面: 1.统计报表 统计报表是医疗卫生机构根据国家规定的报告制度,定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。

  二、搜集资料

  2.医疗卫生工作记录 如病历、医学检查记录、卫生监测记录等。 3.专题调查或实验研究 它是根据研究目的选定的专题调查或实验研究,搜集资料有明确的目的与针对性。它是医学科研资料的主要来源。

  整理资料(sorting data)的目的就是将搜集到的原始资料进行反复核对和认真检查,纠正错误,分类汇总,使其系统化、条理化,便于进一步的计算和分析。整理资料的过程如下: 1.审核:认真检查核对,保证资料的准确性和完整性。 2.分组:归纳分组,分组方法有两种: ①质量分组,即将观察单位按其类别或属性分组,如按性别、职业、阳性和阴性等分组。 ②数量分组,即将观察单位按其数值的大小分组,如按年龄的大小、药物剂量的大小等分组。

  三、整理资料

  3.汇总: 分组后的资料要按照设计的要求进行 汇总,整理成统计表。原始资料较少时用手工汇 总,当原始资料较多时,可使用计算机汇总。 四、分析资料 分析资料(analysis of data) —— 是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,作出科学合理的解释。

  1.统计描述(descriptive statistics) 将计算出的统计指标与统计表、统计图相结合,全面描述资料的数量特征及分布规律。 2.统计推断(inferential statistics) 使用样本信息推断总体特征。通过样本统计量进行总体参数的估计和假设检验,以达到了解总体的数量特征及其分布规律,才是最终的研究目的。

  统计分析包括以下两大内容:

  医学统计资料按研究指标的性质一般分为定量资料、定性资料和等级资料三大类。 一、定量资料 定量资料(quantitative data) 亦称计量资料(measurement data),是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa)等为数值变量,其组成的资料为定量资料。

  第三节 统计资料的类型

  定性资料(qualitative data) 亦称计数资料(enumeration data)或分类资料(categorical data),是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料称定性资料。 定性资料的观察指标为分类变量(categorical variable)。如人的性别按男、女分组;化验结果按阳性、阴性分组;动物实验按生存、死亡分组;调查某人群的血型按A、B、O、AB分组等,观察单位出现的结果为分类变量,分类变量没有量的差别,只有质的不同,其组成的资料为定性资料。

  二、定性资料

  三、等级资料

  等级资料(ranked data)亦称有序分类资料(ordinal categorical data),是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。 如治疗结果分为治愈、显效、好转、无效四个等级。

  根据需要,各类变量可以互相转化。若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。 如调查某人群的尿糖的情况,以人为观察单位,结果可分—、±、+、++、+++五个等级。

  同质(homogeneity) 是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。 变异(variation) 由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。

  第四节 统计学中的几个基本概念 一、同质与变异

  二、总体与样本

  样本(sample):是从总体中随机抽取的部分观察单位变量值的集合。样本的例数称为样本含量(sample size)。 注意: 1。总体是相对的,总体的大小是根据研究目的而确定的。 2。样本应有代表性,即应该随机抽样并有足够的样本含量。

  图示:总体与样本

  population

  sample2

  sample1

  sample3

  sample4

  sample5

  三、参数与统计量

  参数(parameter):由总体计算或得到的统计指标称为参数。总体参数具有很重要的参考价值。如总体均数μ,总体标准差σ等。 统计量(statistic):由样本计算的指标称为统计量。如样本均数,样本标准差s等。 注意:一般不容易得到参数,而容易获得样本统计量。

  四、抽样误差

  抽样误差(sample error): 由于随机抽样所引起的样本统计量与总体参数之间的差异以及样本统计量之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率的差别等。 注意:抽样误差是不可避免的。无论抽样抽得多么好,也会存在抽样误差。

  五、概率

  概率(probability):是描述随机事件发生可能性大小的量值。用英文大写字母P来表示。概率的取值范围在0~1之间。当P=0时,称为不可能事件;当P=1时,称为必然事件。 小概率事件:统计学上一般把P≤0.05或P≤0.01的事件称为小概率事件。 小概率原理:小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设检验。

  第五节 学习医学统计学应注意的问题

  1.重点掌握医学统计学的基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事项。 2.要培养科学的统计思维方法,提高分析问题、解决问题的能力。 3.掌握调查设计和实验设计的原则,培养搜集、整理、分析统计资料的系统工作能力。

  课后作业

  列举出计量资料、分类资料、等级资料各10个实例。 列举出可能事件、必然事件、不可能事件及小概率事件各10个。 认真复习本章已学过的基本概念2-3遍。

  Best Wishes to All of You! Thank You for Listening!

  THE END

  医学本科生用

  主讲 程 琮

  泰山医学院预防医学教研室 zcheng@tsmc.edu.cn

  医学统计学

  The teaching plan for medical students

  Professor Cheng Cong

  Dept. of Preventive Medicine Taishan Medical College

  第2章定量资料的统计描述 目录

  第二节 集中趋势的描述

  第三节 离散趋势的描述

  第四节 正态分布

  第一节 频数分布表

  统计描述:是用统计图表、统计指标来描述资料的分布规律及其数量特征。 频数分布表(frequency distribution table):主要由组段和频数两部分组成表格。

  第一节 频数分布表

  第二章 定量资料的统计描述

  二、频数分布表的编制

  编制步骤 : 1. 计算全距 (range): 一组变量值最大值和最小值之差称为全距(range),亦称极差,常用R表示。 2. 确定组距(class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上限。一般分为8~15组。 ; 4. 统计频数: 将所有变量值通过划记逐个归入相应组段 ; 5.频率与累计频率: 将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。

  表2-2 某年某市120名12岁健康男孩身高(cm)的频数分布

  二、频数分布表的用途

  1.揭示资料的分布类型 2.观察资料的集中趋势和离散趋势 3.便于发现某些特大或特小的可疑值 4.便于进一步计算统计指标和作统计处理

  第二节 集中趋势的描述

  集中趋势 :代表一组同质变量值的集中趋势 或平均水平。 常用的平均数有算术均数、几何均数和中位数。 另外不常用的有:众数,调和平均数和调整均数等。

  一、算术均数

  算术均数 (arithmetic mean): 简称均数。 适用条件:对称分布或近似对称分布的资料。 习惯上以希腊字母μ表示总体均数(population mean),以英文字母表示样本均数(sample mean)

  1. 直接法:用于观察值个数不多时

  计算方法

  2.加权法(weighting method):用于变量值个数 较多时。

  注意:权数即频数f,为权重权衡之意。

  表2-4 120名12岁健康男孩身高(cm)均数和标准差加权法计算表

  120名12岁健康男孩身高均数为143.07cm。

  计算结果

  几何均数(geometric mean,简记为G):表示其平均水平。 适用条件:对于变量值呈倍数关系或呈对数正态分布(正偏态分布),如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。 计算公式:有直接法和加权法。

  二、几何均数

  1.直接法: 用于变量值的个数n较少时

  直接法计算实例

  2.加权法 : 用于资料中相同变量值的个数f(即频数)较多时。

  表2-5 50名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表

  50名儿童麻疹疫苗接种后平均血凝抑制抗体滴度为1:60.55。

  计算结果:将有关已知数据代入公式有

  ①变量值中不能有0; ②不能同时有正值和负值; ③若全是负值,计算时可先把负号去掉,得出结果后再加上负号。

  计算几何均数注意事项:

  ㈠中位数 定义:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。 适用条件:①变量值中出现个别特小或特大的数值;②资料的分布呈明显偏态,即大部分的变量值偏向一侧;③变量值分布一端或两端无确定数值,只有小于或大于某个数值;④资料的分布不清。

  三、中位数及百分位数

  定义:百分位数(percentile)是一种位置指标,以Px表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按顺序排列,理论上有x%的变量值比Px小,有(100-x)%的变量值比Px大。故P50分位数也就是中位数,即P50=M 。

  ㈡ 百分位数

  ①描述一组资料在某百分位置上的水平; ②用于确定正常值范围; ③计算四分位数间距。

  百分位数的应用条件:

  计算方法:有直接法和加权法

  1.直接法:用于例数较少时

  n为奇数时

  n为偶数时

  2.频数表法: 用于例数较多时

  中位数

  百分位数

  表2-6 145例食物中毒病人潜伏期分布表

  先找到包含Px的最小累计频率; 该累计频率同行左边的组段值为L; L同行右边的频数为fx(或fm); L前一行的累计频数为∑fL; 将上述已知条件代入公式计算Px或P50 。

  计算中位数及百分位数的步骤:

  计算结果:

  定义:用来说明变量值的离散程度或变异程度。 注意:仅用集中趋势尚不能完全反映一组数据的特征。故应将集中趋势和离散趋势结合起来才能更好地反映一组数据的特征。 常用离散指标有:极差、四分位数间距、标准差、方差、变异系数。

  第三节 离散趋势的描述

  甲组: 184 186 188 190 192 乙组: 180 184 188 192 196 两组球员的平均身高都是188cm,但甲组球员身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。

  实例分析

  ㈠极差 极差(range,简记为R)亦称全距,即一组变量值中最大值与最小值之差 。 特点:计算简单,不稳定,不全面,易变化;可用于各种分布的资料。

  一、极差和四分位数间距

  ㈡四分位数间距

  公式: Q= P75-P25 特点:比极差稳定,只反映中间两端值的差异。 计算不太方便。可用于各种分布的资料。

  二、方差和标准差

  ㈠方差(variance)

  总体方差

  样本方差

  自由度(degree of freedom)的概念

  n-1是自由度,用希腊小写字母ν表示,读作[nju:]。 定义:在N维或N度空间中能够自由选择的维数或度数。 例:A+B=C,共有n=3个元素,其中只能任选2个元素的值,故自由度ν=n-1=3-1=2。

  方差的特点

  充分反映每个数据间的离散状况,意义深刻; 指标稳定,应用广泛,但计算较为复杂,不易理解; 方差的单位与原数据不同,有时使用时不太方便; 在方差分析中应用甚广而极为重要。

  (二)标准差(standard deviation)

  总体标准差

  样本标准差

  牢记:离均差平方和展开式:

  标准差的特点:

  意义同方差,是方差的开平方; 标准差的单位与原数据相同,使用方便,意义深刻,应用广泛;故一般已作为医学生物学领域中反映变异的标准,故称标准差。

  标准差的计算方法:可分为直接法和加权法。

  1.直接法

  2.加权法

  直接法:标准差计算实例:

  例2.12 例2.2中7名正常男子红细胞数(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,计算其标准差。 ∑x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 ∑x2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99

  计算结果:

  例2.13 对表2-4资料用加权法计算120名12岁健康男孩身高值的标准差。

  加权法:标准差计算实例:

  在表2-4中已算得∑fx=17168,∑fx2 =2460040, 代入公式

  变异系数(coefficient of variation): 简记为CV ; 特征:①变异系数为无量纲单位,可以比较不同单位指标间的变异度;②变异系数消除了均数的大小对标准差的影响,所以可以比较两均数相差较大时指标间的变异度。

  三、变异系数

  例2.14 某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm; 体重均数为53.72kg, 标准差为4.96kg。试比较身高与体重的变异程度。

  变异系数 计算实例

  身高

  体重

  变异系数 计算结果

  第四节 正态分布

  一、正态分布的概念和特征

  正态分布(normal distribution):也称高斯分布,是医学和生物学最常见的连续性分布。如身高、体重、红细胞数、血红蛋白等。

  图2-1 120名12岁健康男孩身高的频数分布

  ㈠ 正态分布的函数和图形

  正态分布的密度函数,即正态曲线的方程为:

  图2-2 频数分布逐渐接近正态分布示意

  为了应用方便,常按公式(2.19)作变量变换

  u值称为标准正态变量或标准正态离差,有的参考书也将u值称为z值。

  这样将正态分布变换为标准正态分布 (standard normal distribution)

  图2-3 正态分布的面积与纵高

  ㈡正态分布的特征

  1. 集中性 正态曲线的高峰位于正中央, 即均数所在的位置。 对称性 正态曲线以均数为中心,左右对称, 3. 正态分布有两个参数,即均数和标准差。 4. 正态曲线下面积有一定的分布规律

医学统计学(全部课程666张PPT).ppt
  • 标签:
注意:本内容由网友上传,仅供学习交流使用,严禁临床等其它用途,否则后果自负。
邮箱
昵称
密码
确认密码
-->