舌尖上的精灵
去知网找,那里肯定有你要的论文,自己可以先搜搜看,不知道怎样找的话,可以去我百度空间里,有如何在网络上找论文的文章介绍 
1、变量之间关系可以分为两类函数关系:反映了事物之间某种确定性关系。相关关系:两个变量之间存在某种依存关系,但二者并不是一一对应的;反映了事务间不完全确定关系;2、为什么要对相关系数进行显著性检验?实际上完全没有关系的变量,在利用样本数据进行计算时也可能得到一个较大的相关系数值(尤其是时间序列数值)。当样本数较少,相关系数就很大。当样本量从100减少到40后,相关系数大概率会上升,但上升到多少,这个就不能保证了;取决于你的剔除数据原则,还有这组数据真的可能不存在相关性;改变两列数据的顺序,不会对相关系数,和散点图(拟合的函数曲线)造成影响;对两列数据进行归一化处理,标准化处理,不会影响相关系数;我们计算的相关系数是线性相关系数,只能反映两者是否具备线性关系。相关系数高是线性模型拟合程度高的前提;此外相关系数反映两个变量之间的相关性,多个变量之间的相关性可以通过复相关系数来衡量。3、增加变量个数,R2会增大;P值,F值只要满足条件即可,不必追求其值过小。4、多重共线性与统计假设检验傻傻分不清?多重共线性与统计假设没有直接关联,但是对于解释多元回归的结果非常重要。相关系数反应两个变量之间的相关性;回归系数是假设其他变量不变,自变量变化一个单位,对因变量的影响,而存在多重共线性(变量之间相关系数很大),就会导致解释困难;比如y~x1+x2;x·1与x2存在多重共线性,当x1变化一个单位,x2不变,对y的影响;而x1与x2高度相关,就会解释没有意义。一元回归不存在多重共线性的问题;而多元线性回归要摒弃多重共线性的影响;所以要先对所有的变量进行相关系数分析,初步判定是否满足前提---多重共线性。
《河北省脑瘫患儿生存质量状况调查与经济负担评价_崔巍》文中 表12计算错误。统计表核算“合计”结果是错的。按照表里的数据,计算一下就知道了。
计学,可以说无处不在,我们每个人的日常生活都会受到统计学的影响。但是很多人,即使受过统计学的正规训练,也会在不知不觉之间犯一些常见的分析错误。下面这篇文章,我就和大家分享一些现实生活中比较常见的统计研究错误。 参照组(Control group)那天我恰好在网上看到一篇文章,叫做《眼保健操对于保护眼睛有作用么?》。作者的观点是眼保健操没有什么作用,列举的证据是眼保健操在中国的学校里推行了50多年,小学生和中学生的近视率大大上升了,而非下降。因此作者得出结论:眼保健操对视力有害。乍一看,好像确实是这么回事:50多年前我们开始在学校里要求学生们做眼保健操。但是现在孩子们的近视率,则要比当时的那些孩子的近视率高出很多。但是如果就因为这个而得出眼保健操没用的结论,则是谬之大矣。主要原因在于:没有参照组。和建国初那时候的孩子们相比,现在的孩子由于功课压力,在室内花的时间(读书,做作业,上补习班等)大幅度增长,用眼的“诱惑”也大大增加,比如电视,电脑,手机等等。因此无论是否做眼保健操,现在孩子的视力肯定都不及当时的孩子。这也不是中国独有的现象,日本,韩国,新加坡等国的情况也类似。而这些国家都没有眼保健操。如果要真正研究眼保健操对于保护视力是否有效,那么就应该通过参照组来对比。研究人员应该找到两组情况类似的样本(比如同一个学校里的孩子)进行研究。这两组样本的区别除了他们是否做眼保健操以外,在其他方面越相似越好。然后通过一定时间的跟踪调查,研究人员才可能得出更加客观和可靠的研究结果。1747年,苏格兰医生James Lind在一艘名叫Salisbury的船上成功的找到了治疗坏血病的方法:就是通过吃橙子和柠檬补充维他命C。而他找到该疗法的关键就是运用了参照组实验方法。坏血病是一种非常可怕的疾病。坏血病的发病特征包括皮下出血(因此腿会变黑),极度疲劳,牙床腐烂,肌肉变软。长期出海的船员和海盗是坏血病的多发人群。James Lind使用的参照组实验是这样进行的。在Salisbury这艘船上,Lind医生找到了12个坏血病严重程度差不多的病人,将他们两人一组分成6组。对于这6组病人,Lind医生给予了他们6种不同的治疗方法,包括橙子,柠檬,苹果酒,醋和盐水等。后来Lind医生发现,食用橙子和柠檬的那组病人的恢复速度显然比其他组别要快很多,因此得出结论橙子和柠檬可以治疗坏血病。现在我们知道,橙子中的维他命C才是坏血病的克星。Lind医生通过参照组实验获得的这项重要发现,帮助挽救了成千上万的水手的生命。如果没有参照组这个重要的分析方法,Lind医生能否找到正确的解药要打一个大问号。当时,Lind医生一度怀疑坏血病的病因和啤酒有关。Lind医生观察到,每次船上的啤酒被喝光时,往往也伴之以坏血病的大面积流行。但事实上,啤酒喝光,和坏血病盛行,只是一个巧合而已。因为坏血病往往多发于长期航海旅途中,而在海上旅行久了,啤酒自然也会被喝完。如果不通过参照组方法去分析真正的原因,那么就可能得出啤酒能够治疗坏血病这样错误的结论。在我们阅读分析一些统计研究报告时,一个很重要的地方就是要看该研究有没有参照组进行对比。如果研究只是比较了几个变量之间的关系而缺乏参照组进行对照,那么该研究的结论就值得怀疑。 随机取样(Random Sampling)下面来讲讲“随机取样(Random Sampling)”这个问题。在现实中,我们经常面对的问题是,需要研究的样本量太大,无法收集到完整的数据。比如我们想要了解全国十几亿人的想法,或者想要知道所有沿海城市的中产阶级的消费偏好,等等。要想精确的回答这些问题,我们就需要随机抽取一些代表性样本,通过样本的表现来推测整体的特征。如何确保收集到的样本真正“随机”,是一个技术含量很高的问题。在这方面有很多失败的例子可供我们学习。1936年,美国的总统选举大战在罗斯福(FDR)和兰登(Alf Landon)之间展开。在选举投票前,当时一家非常大的调查机构Literary Digest发出了1千万张明信片来收集美国人的投票倾向。在这1千万张明信片中,Literary Digest收到了2百万份回复。在这些回复中,绝大部分人都倾向于选兰登。因此Literary Digest得出结论:兰登将赢得总统选举。当时还有另外一家新成立不久的调查公司,名叫Gallup。Gallup没有Literary Digest那么大的预算。他们只是有针对性的选了几千个受访者做了民意调查,并得出罗斯福将会赢得总统大选的结论。