嘟嘟小怪物
会导致过拟合。论文的样本量太少会导致过拟合,过拟合就是为了得到一致假设而使假设变得过度复杂称为过拟合。想像某种学习算法产生了一个过拟合的分类器,这个分类器能够百分之百的正确分类样本数据(即再拿样本中的文档来给它,它绝对不会分错),但也就为了能够对样本完全正确的分类,使得它的构造如此精细复杂,规则如此严格,以至于任何与样本数据稍有不同的文档它全都认为不属于这个类别。 
向网站或者周边投放调查问卷,搜集足够的数据资料。现在网站投放链接很方便,自己把问卷资料整理出来,发散式投放,很快就可以搜集足够的数据了。经管论文数据太少会严重影响论文的质量,虽然思路与创新很重要,但一切支撑还得靠事实说话。
其实,毕业论文的调查数据没必要很多啊,估计100-200份就可以了,我之前都是在问卷网上设计问卷,然后发布问卷的,发给同学之类的,让他们帮填一下,很方便的。