大数据技术专业以统计学、数学、计算机为三大支撑性学科;生物、医学、环境科学、经济学、社会学、管理学为应用拓展性学科。此外还需学习数据采集、分析燃早、处理软件,学习数学建模软件及计算机编程语言等。
1、大数据技术专业学习的课程主要有:《程序设计基础》、《Python程序设计》、《数据分析基础》、《Linux操作系统》、《Python爬虫技术》、《Python数据分析》、《Java程序设计》、《Hadoop大数据框架》、《Spark技术与应用》、《HBASE分布式数据库》等。
2、大数据技术专业是结合国家大数据、人工智能产业发展战略而设置的新皮局雀兴专业,该专业面向大数据应用领域,主要学习大数据运维、采集、存储、分析、可视化知识和技术技能。
3、大数据技术与应用研究方向是将大数据分析挖掘与处理、移动开发与架构、软件开发、云计算的前沿技术相结合的“互联网+"前沿科技专业。该专业毕业生可从事大数据项目实施工程师、大数据平台运维工程师、大数据平台开发工程师之类的工作。
4、本专业旨在培养学生系统掌握数据管理及数据挖掘方法,成为具备大数据分析处理、数据腊吵仓库管理、大数据平台综合部署、大数据平台应用软件开发和数据产品的可视化展现与分析能力的高级专业大数据技术人才。
大数据本身是一个抽象的概念。从一般意义上讲,大数据是指无法在有限时间内用常规软件工具对其进行获取、存储、管理和处理的数差衡据集合。
目前,业界对大数据还没有一个统一的定义,但是大家普遍认为,大数据具备 Volume、Velocity、Variety 和 Value 四个特征,简称“4V”,即数据体量巨大、数据速度快、数据类型繁多和数据价值密度低,如图 1 所示。下面分别对每个特征作简要描述。
1)Volume:表示大数据的数据体量巨大。
数据集合的规模不断扩大,已经从 GB 级增加到 TB 级再增加到 PB 级,近年来,虚穗做数据量甚至开始以 EB 和 ZB 来计数。
例如,一个中型城市的视频监控信息一天就能达到几十 TB 的数据量。百度首页导航每天需要提供的数据超过 1-5PB,如果将这些数据打印出来,会超过 5000 亿张 A4 纸。图 2 展示了每分钟互联网产生的各类数据的量。
2)Velocity:表示大数据的数据产生、处理和分析的速度在持续加快。
加速的原因是数据创建的实时性特点,以及将流数据结合到业务流程和决策过程中的需求。数据处理速度快,处理模式已经开始从批处理转向流处理。
业界对大数据的处理能力有一个称谓——“ 1 秒定律”,也就是说,可以从各种类型的数据中快速获得高价值的信息。大数据的快速处理能力充分体现出它与传统的数据处理技术的本质区别。
3)Variety:表示大数据的数据类型繁多。
传统 IT 产业产生和处理的数据类型较为单一,大部分是结构化数据。随着传感器、智能设备、社交网络、物联网、移动计算、在线广告等新的渠道和技术不断涌现,产生的数据类型无以计数。
现在的数据类型不再只是格式化数据,更多的是半结构化或者非结构化数据,如 XML、邮件、博客、即时消息、视频、照片、点击流、 日志文件等。企业需要整合、存储和分析来自复杂的传统和非传统信息源的数据,包括企业内部和外部的数据。
4)Value:表示大数据的数据价值密度低。
大数据由于体量不断加大,单位数据的价值密 度在不断降低,然而数据的整体价值在提高。以监控视频为例,在一小时的视频中,有用的数据可能仅仅只有一两秒,但是却会非常重要。现在许多专家已经将大数据等同于黄金族世和石油,这表示大数据当中蕴含了无限的商业价值。
通过对大数据进行处理,找出其中潜在的商业价值,将会产生巨大的商业利润
大数据技术是指从各种各样类型的数据中,快速获得有价值信息的能力。适用于大数据的技术。
包括大规模并行处理(MPP)数据库,数据挖掘电网,分布式文件系统,分布袜仔轮式数据库,云计算平台,互联网,和可扩展的存储系统。
大数据的应用:大数据是信息产业持续高速增长的新引戚脊擎,几乎各个行业都会逐步引入大数据技术,尤其是那些将要实告信现互联网信息化转型的传统企业。
面向大数据市场的新技术、新产品、新服务、新业态会不断涌现。在硬件与集成设备领域,大数据将对芯片、存储产业产生重要影响,还将催生一体化数据存储处理服务器、内存计算等市场。在软件与服务领域,大数据将引发数据快速处理分析、数据挖掘技术和软件产品的发展。
数据科学与大数据技术是普通高等学校本科专业,属于计算机类专业,是2016年中国高校新增设置的本科专业。
本专业旨在培养社会急需的具备大数据处理及分析能力的高级复合型人才。具体包括:掌握计算机科学、大数据科学与信息技术的基本理论、方法和技能,受到系统的科学研究训练,具备一定的大数据科学研究能力慧罩与数据工程实施的基本能力,掌握大数据工程项目的规划、应用、管理及决策方法,具有大数据工程项目设计、研发和实施能力的复合型、应用型卓越人才。
课程教学体系涵盖了大数据的发现、处理、运算、应用等核心理论与技术,具体课程包薯碧李括:大数据概论、大数据存储与管理、大数据挖掘、机器学习、人工智能基础、Python程序设计、统计学习、神经网络与深度学习方法、多媒体信息处理、数据可视化技术、智能计算技术、分布式与并行计算、云计算与数据安全、数据库原理及应用、算法设计与分析、高级语言程序设计、优化理论与方法等。
毕业生能在互联网企业、金融机构、科研院所、高等院校等从事大数据分析、挖掘、处理、服务、应用和研究工作,亦可从事各行业大数据系统的集成、设计、开发数迟、管理、维护等工作,也适合在高等院校及科研院所的相关交叉学科继续深造。
本文转载自互联网,如有侵权,联系删除