浅谈统计学专业相关论文

发布时间:2017-03-23 21:03

随着计算机网络技术的发展和普及,传统的统计学教学模式已经不能满足当代经济社会对财会人员的要求,增强网络及计算机在教学活动中的作用变得极为迫切。下面是小编为大家整理的统计学专业相关论文,供大家参考。

统计学专业相关论文范文一:农业科技中存在的统计学问题及分析

农业科技期刊作为实施国家科技兴农、科教兴国战略及推动中国传统农业转化成现代农业的重要智力支撑和信息保障的重要阵地,在社会主义经济建设和精神文明建设中占有独特的地位并发挥着重要作用[1]。编辑工作是科研成果创作和传播过程中不可缺少的环节,而编辑的素质直接影响到期刊的质量和科技信息的正确传播[2]。农业统计学是一门新兴而发展中的学科,与其他部门统计学相比,其研究对象(农业经济现象的数量方面)受自然条件影响较大;研究内容上具有较大的综合性,即研究农业多个部门(农林牧副渔)经济的综合发展及五业之间的相互关系;研究客体方面的农业所有制形式变动较大,研究范围较广[3]。农业统计学应是农业科技论文作者必备的基础知识。

1 农业科技论文中普遍存在的统计学问题

1.1 设计方法不合理

设计方法中存在样本量少、缺乏代表性或没有随机抽样,对照设置不合理,统计软件应用和统计方法错误等。如:“在一篇论文中对菠萝蜜蜜饯中二氧化硫残留的风险评估”一文中,菠萝蜜消费量采用水果的消费量数据,其中水果的种类繁多,不能代表菠萝蜜消费量。

1.2 统计学方法使用不当

结果与分析中数据不采用统计学分析,直接从数据的大小进行比较;所采用的统计学方法与设计方法的要求不符合;将重复结果作为独立变量进行分析;t检验与方差分析混用(t检验是假设检验,用来检验一个正态总体或2个正态总体的均值假设,也可检验成对数据的均值假设问题,一般适用于2个变量均数间的差异检验,多于2个变量间的均数比较要用方差分析);多元统计分析不正确等[4],如下例。

“热研2号柱花草高效固氮根瘤菌的筛选”一文中对柱花草含氮量、茎叶干重、株高、鲜重、根瘤数、固氮酶活性、磷含量及根瘤鲜重等指标进行主因子分析,前2个因子的累积贡献率已达到72.5 %,因此,只要提炼2个公因子即可(表1)。第一主因子主要由茎叶干重、鲜重及根瘤鲜重决定。这3个变量在因子F1上有较高的正载荷,因此第一因子F1主要代表了产量性状,同时第一公因子F1对各变量的方差贡献率达58.3 %。第二公因子F2主要由含氮量、固氮酶活性及平均磷含量决定。因此,第二公因子F2主要代表了植株氮及磷的含量,代表了柱花草的品质性状。F2对各变量方差的贡献率占14.2 %。前2个公因子对8个指标变量的累积方差贡献率已达到58.30 %,说明这2个主因子基本上概括了8个变量的主要信息(表2)。

此例运用因子分析结果存在以下错误:(1)一般情况下,累积贡献率超过75 %即可,前3个因子的累积贡献率达到81.74 %,可提炼3个公因子。(2)表1中F1-8表示错误,应为干重、含氮量、鲜重、株高、固氮酶活性、根瘤数、根瘤鲜重及平均磷含量等指标。(3)表1和表2数据可通过最大方差旋转法得到旋转因子载荷矩阵(表3)。一般情况下,将载荷绝对值大于0.4的视为高载荷;第一公因子(F1)包括干重、含氮量、鲜重、株高等4个指标;第二公因子(F2)包括固氮酶活性、根瘤数、根瘤鲜重等3个指标;第三公因子(F3)包括磷含量1个指标。

1.3 误解p值含义

误解p值含义、过分相信小样本研究得出的结果等。如: A、B两市随机抽取的桂圆肉,每个区各抽取25份样品,调查二氧化硫含量,其均值在限量标准以下,则认为2个市的桂圆肉中二氧化硫含量未超过食品添加剂使用标准规定100 mg/kg的限量标准。

2 论文出现统计学问题的原因分析

2.1 对农业统计学的作用认识不足

相关科研单位对统计学在科技和经济发展中的作用认识不足、重视不够,国家级重大科研课题在科研设计和统计分析上严重缺乏强有力的统计学指导和支撑[5]。近年来,某些单位或政府部门重视SCI源期刊发表的科技论文的数量,以SCI论文标准作为评价、考核、聘用科研人员和评审科技期刊的重要依据。而对学术论文的设计方法是否正确,分析结果是否严谨,调查或试验数据是否真实,结论是否能经得起推敲,科技成果的技术含量和学术水平如何等问题,却不够重视。高等农业院校对统计学教学不够重视,很多高等农业院校未开设农业统计学课程;或教学质量差,学起来枯燥;或教材与研究实际不符,导致学不能致用。

2.2 不重视统计学方法的应用

统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象本质的目的,甚至预测该对象未来规律的一门综合性科学[6],其公式概念多,逻辑性强,与数学联系紧密。部分农业科研人员由于对统计学知识掌握不够或不重视统计学方法的使用,导致对科技论文数据缺乏统计分析或统计方法使用不当。

2.3 编辑缺乏统计学知识

农业科技期刊编辑人员所学专业主要有农学、分子生物学、植物保护、质量检测等,有些专业并没有开设统计学这门学科,缺乏农业统计学知识的系统学习。而且,统计学原理的理解较难,统计方法使用灵活,编辑人员很难做到精通,难以判断科技论文中的设计方法、结果分析和结论等方面出现的问题,大大降低了科技论文的可靠性和科学性。

3 给作者的建议

3.1 增强统计学思维判断能力

作者在书写农业科技论文时,首先应考虑其研究方案、结果与分析、讨论与结论中是否应用统计方法以及如何应用统计学方法进行分析,做到合理、正确使用统计方法分析数据。

3.2 加强统计学知识学习

统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。农业科技论文作者应加强农业统计学知识学习,其方法主要有:(1)积极参加培训。目前,有关统计学方面的培训主要有全国生物医学统计学培训、高校的统计学培训等。(2)利用业余时间自学。统计学基础薄弱的作者,可以看些简单易懂的统计学以及统计软件书籍,比如《统计学世界》(戴维·S·穆尔著)、《统计学》(M·R·斯皮格尔 L·J·斯蒂芬斯著)、《统计学原理》(S·伯恩斯坦 R·伯恩斯坦著)、《多元统计分析与SAS系统》、《SPSS中文版教程》等。

3.3 重视论文中的统计学问题

论文中是否应用统计学知识进行分析,已成为其科研成果是否具有科学性的一个重要标志[7]。农业科技论文中普遍存在不应用统计分析方法、乱用或错用统计分析方法等现象,从而影响论文的科学性、先进性、实用性和持续性。作者应重视农业科技论文中的统计学分析问题,按农业期刊稿约中明确规定的统计学要求规范论文书写。

作者应掌握农业统计学知识,增强统计学思维判断能力,这样才能写好一篇高质量的农业科技论文。作者倘若对统计学知识的掌握不够深入,忽略论文中统计学方法的应用,将会影响研究结果的可靠性和时效性。因此,作者掌握农业统计学知识是农业科技论文具备科学性和可靠性的重要保证。

统计学专业相关论文范文二:医学统计学方法应用的错误解析

一、引 言

医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。

二、医学论文统计学方法应用概况

医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。

(一)材料与方法部分

正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,

方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的FBAT1.7.3版本。

(二)论文结果部分

论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。

结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。

关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。

1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取0.05与0.01作为检验显著性,对于结果的计算要求具体的P值,如P=0.23或P=0.02。

2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<0.05,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。

变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。

三、医学论文统计学方法应用的常见错误分析

(一)“材料与方法”中的统计学方法应用的常见错误

“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。

(二)“结果”统计学方法应用的常见错误

1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。

2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。

3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为6.7 ±2.4 和1.2 ±0.6 ( P = 0.000 1) 。按空腹血糖值低于7.7mmol/L的疗效判定有效率,研究组和对照组的有效率分别为75.6%和12.4% ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效(24.4%)。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 0.015或P = 0.321等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。

四、小 结

提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。

参考文献:

[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).

[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).

[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).

浅谈统计学专业相关论文相关文章:

1.浅谈统计工作重要性

2.浅谈人力资源管理统计学论文

3.统计学论文

4.统计学专业实践教学环节改革与人才培养论文

5.统计学的论文

浅谈统计学专业相关论文的评论条评论