叶石纹
样本量大概在300~500左右最为合适。在毕业论文当中如果涉及到调查问卷,那么一定要有调查的样本,样本量不能太少,如果样本量太少的话是不足以说明问题的,所以基本的样本量应该控制在300~500左右。这样才能在论文当中作为数据的支撑,才能在评审过程中通过。 
会导致过拟合。论文的样本量太少会导致过拟合,过拟合就是为了得到一致假设而使假设变得过度复杂称为过拟合。想像某种学习算法产生了一个过拟合的分类器,这个分类器能够百分之百的正确分类样本数据(即再拿样本中的文档来给它,它绝对不会分错),但也就为了能够对样本完全正确的分类,使得它的构造如此精细复杂,规则如此严格,以至于任何与样本数据稍有不同的文档它全都认为不属于这个类别。