wuming2008
应聘数据分析员,要遵守岗位职责:持证上岗。热爱本职工作,具有高度的责任心和忘我的工作精神,爱岗敬业,工作认真细致,能认真完成公司交给的各项工作任务。要求掌握较深的业务知识和计算机应用知识,能用行业各种应用软件进行各种数据分析和综合数据处理,加工成有用的信息提供领导进行决策;能配合系统管理员进行计算机网络维护及管理。负责本公司计算机信息网络数据的收集、传递(主要是上报)和管理工作,对各网点上报的数据和本机房传递的信息数据,要做好详细的“数据传递纪录”,对未按时间要求漏报和数据有误的网点要及时督促,每月将各经营站、点数据上报情况通报一次;负责各类数据的整理、汇总和分析处理工作,及时向本公司领导及有关部门上报信息数据,做好相关纪录;负责本公司网络信息数据的安全管理,及时做好各类数据及报表的备份工作,做好归档、保管工作,做好信息数据的保密工作,严禁向未授权单位、部门及个人提供各类信息数据;负责机房文件收发、归档和保管工作。遵守特定的工作时间:必须等各网点数据传输完毕核对无误后才能下班。数据分析员的工作不算很累,比较程序员的工作轻松多了至于前途问题谁都说不定啊月薪的话,就要看你是做在什么公司做什么数据分析了在公司当然有前途,月薪高 
数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。 数据挖掘能做什么? 1)数据挖掘能做以下六种不同事情(分析方法): · 分类 (Classification) · 估值(Estimation) · 预言(Prediction) · 相关性分组或关联规则(Affinity grouping or association rules) · 聚集(Clustering) · 描述和可视化(Des cription and Visualization) 2)数据挖掘分类 以上六种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘 · 直接数据挖掘 目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以 理解成数据库中表的属性,即列)进行描述。 · 间接数据挖掘 目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系 · 分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘 3)各种分析方法的简介 · 分类 (Classification) 首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分 类模型,对于没有分类的数据进行分类。 例子: 信用卡申请者,分类为低、中、高风险 分配客户到预先定义的客户分片 注意: 类的个数是确定的,预先定义好的 · 估值(Estimation) 估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的 输出;分类的类别是确定数目的,估值的量是不确定的。 例子: 根据购买模式,估计一个家庭的孩子个数 根据购买模式,估计一个家庭的收入 估计real estate的价值 一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的 连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运 用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。 · 预言(Prediction) 通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用 于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。 预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时 间后,才知道预言准确性是多少。 · 相关性分组或关联规则(Affinity grouping or association rules) 决定哪些事情将一起发生。 例子: 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则) 客户在购买A后,隔一段时间,会购买B (序列分析) · 聚集(Clustering) 聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先 定义好的类,不需要训练集。 例子: 一些特定症状的聚集可能预示了一个特定的疾病 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群 聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一 类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集, 回答问题,可能效果更好。 · 描述和可视化(Des cription and Visualization) 是对数据挖掘结果的表示方式。 数据挖掘的商业背景 数据挖掘首先是需要商业环境中收集了大量的数据,然后要求挖掘的知识是有价值的。有 价值对商业而言,不外乎三种情况:降低开销;提高收入;增加股票价格。 1)数据挖掘作为研究工具 (Research) 2)数据挖掘提高过程控制(Process Improvement) 3)数据挖掘作为市场营销工具(Marketing) 4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management) 数据挖掘的技术背景 1)数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力 2)数据挖掘和机器学习(Machine Learning) · 机器学习是计算机科学和人工智能AI发展的产物 · 机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决 策树) · 数据挖掘由来 数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴 的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预 言模型的经济学家之间没有技术的重叠。 3)数据挖掘和统计 统计也开始支持数据挖掘。统计本包括预言算法(回归)、抽样、基于经验的设计等 4)数据挖掘和决策支持系统 · 数据仓库 · OLAP(联机分析处理)、Data Mart(数据集市)、多维数据库 · 决策支持工具融合 将数据仓库、OLAP,数据挖掘融合在一起,构成企业决策分析环境。 数据挖掘的社会背景 数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上 ,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中 神秘,它不可能是完全正确的。 客户的行为是与社会环境相关连的,所以数据挖掘本身也受社会背景的影响。比如说,在 美国对银行信用卡客户信用评级的模型运行得非常成功,但是,它可能不适合中国。 数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合 数据仓库,英文名称为Data Warehouse,可简写为DW。 数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。 ◆面向主题:操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织的。 ◆集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。 ◆相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。 ◆反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。 数据仓库是一个过程而不是一个项目。 数据仓库系统是一个信息提供平台,他从业务处理系统获得数据,主要以星型模型和雪花模型进行数据组织,并为用户提供各种手段从数据中获取信息和知识。 从功能结构化分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分 数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。 并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索(information retrieval)领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的能力。 数据挖掘和数据仓库以数据库为基础。
数据挖掘(Data Mining),又称为数据库中的知识发现(Knowledge Discovery in Database, KDD),就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程,简单的说,数据挖掘就是从大量数据中提取或“挖掘”知识。 比如,软件开发专业,具体以来的学科多了,给你个 网址:自己看下吧。很清楚了 !
1、大数据属于数学一类的专业。相关专业名称有:“信息与计算科学”、“数学与应用数学”、“统计学”等。大数据是众多学科与统计学交叉产生的一门新兴学科。大数据牵扯的数据挖掘、云计算一类的,所以是数学一类的专业。(1)统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科学的各个领域。(2)数学与应用数学是一个学科专业,该专业培养掌握数学科学的基本理论与基本方法,具备运用数学知识、使用计算机解决实际问题的能力,受到科学研究的初步训练。能在科技、教育和经济部门从事研究、教学工作或在生产经营及管理部门从事实际应用、开发研究和管理工作的高级专门人才。(3)信息与计算科学专业是以信息领域为背景用将迈向的数学与信息,管理相结合的交叉学科更深入和专业。2、大数据专业简介大数据专业将从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地帮助企业掌握大数据应用中的各种典型问题的解决办法,包括实现和分析协同过滤算法、运行和学习分类算法、分布式Hadoop集群的搭建和基准测试、分布式Hbase集群的搭建和基准测试、实现一个基于、Mapreduce的并行算法、部署Hive并实现一个的数据操作等等,实际提升企业解决实际问题的能力。大数据领域对于人才的需求总量大、层次多、范围广,产业对于人才的需求呈井喷式增长,相关行业拥有海量的岗位需求。
一般从事数据分析员的人都是统计学或数学专业的人。 数据分析师职位要求 : 1、计算机、统计学、数学等相关专业本科及以上学历; 2、具有深厚的统计学、数据挖掘知识,熟悉数据仓库和数据挖掘的相关技术,能够熟练地使用SQL; 3、三年以上具有海量数据挖掘、分析相关项目实施的工作经验,参与过较完整的数据采集、整理、分析和建模工作; 4、对商业和业务逻辑敏感,熟悉传统行业数据挖掘背景、了解市场特点及用户需求,有互联网相关行业背景,有网站用户行为研究和文本挖掘经验尤佳; 5、具备良好的逻辑分析能力、组织沟通能力和团队精神; 6、富有创新精神,充满激情,乐于接受挑战。