小饼干的受力
是什么让有的学者可以将学术文章发表在高影响学术期刊,而有的就只能发表在低影响学术期刊上呢?近期的一个研究调查就对这个问题进行了探索和剖析,即通过在线问卷调查的方式收集到了世界各地期刊作者们的资料,涉及他们的个性特征、资金状况、对研究质量的主观障碍、工作和生活的平衡、职业满意度以及职业动力等各方面。作者的手稿撰写以及期刊发表的过程评估是通过一个特地为此调查设计的网上问卷来进行,然后根据收集到的数据将学者们分成“高影响”(high-impact)和“低影响”(low-impact)两组进行逻辑回归模型(Logic regression models)分析。此研究中提到的影响因子(Impact factor/IF)是一个数字指标,用来评估科研学术期刊质量的度量手法之一。这个数字与在一段时间内文章被引用的次数有关。另一个在调查中用到的评估指标是h指数(h-index),取决于学术研究出版物被引用的数量,是用来衡量研究学者工作质量的。这篇调查报告是由来自巴西Barretos肿瘤医院的Carlos Eduardo Paiva及其合作者发起的一项研究,其主要目的就是想探索在“高影响”和“低影响”的两类学者之间到底存不存在各方面特质的差异。他们最后得出的结论是:英语语言能力、对科研和文章撰写所贡献的时间以及所获得的经济资源都是区分 “高影响”和“低影响”两类研究学者们的条件,并且具有高IF指数的研究学者获得定期的政府资金也通常占有更高比例。当然这项研究只能代表此类调查探索的一个方面,也存在诸多问题。首先,在此次调查中存在基于样本的偏差,即由于调查的低响应率(18%),导致了最终只有269份有效问卷可以用来分析;另外,因为问卷调查是通过主观判断的方式获得的数据,所有的引发因素(起因)并不能被证实。 
线性回归要求因变量必须是连续性数据变量;逻辑回归要求因变量必须是分类变量,二分类或者多分类的;比如要分析性别、年龄、身高、饮食习惯对于体重的影响,如果这个体重是属于实际的重量,是连续性的数据变量,这个时候就用线性回归来做;如果将体重分类,分成了高、中、低这三种体重类型作为因变量,则采用logistic回归。线性回归的特征:回归分析中有多个自变量:这里有一个原则问题,这些自变量的重要性,究竟谁是最重要,谁是比较重要,谁是不重要。所以,spss线性回归有一个和逐步判别分析的等价的设置。原理:是F检验。spss中的操作是“分析”~“回归”~“线性”主对话框方法框中需先选定“逐步”方法~“选项”子对话框。
逻辑回归模型是统计分析模型的一种表述,主要理解就是寻找一个逻辑上存在的曲线、直线或者平面使得数据中的大部分点都落在这个平面或者线条上。在数据挖掘中逻辑回归模型指的就是采用mse损失函数的线性模型,主要是拟合曲线,贴近数据点。逻辑回归模型适用于寻找具有一定规律的连续数据,比如简单的线性方程y=ax+b等,或者其他的一些连续数据。简单理解就是产生的结果是范围性的数值的叫做逻辑回归,是提前指定的数值的就是分类。想要更系统的了解逻辑回归模型的概念,建议找本初级教材学习下。