課程架構︰
階段學習+階段實戰+項目實戰+兩個選修方向+面試指導
課程內容︰
30%原理精講+60%項目實戰+10%解決方案+24小時實時答疑

立即報名
了解詳情>>
了解詳情>>

需要的基礎一︰SQL & Java

課程一︰Oracle數據庫以及SQL
課程二︰Java8編程入門
課程三︰Java8面向對象
課程四︰Java8高級編程
課程五︰深入Java虛擬機
課程六︰Java業務分析設計實例

需要的基礎二︰Linux基礎

課程一︰CentOS 7虛擬機知識以及安裝
課程二︰Linux基礎命令
課程三︰Linux權限相關
課程四︰bash shell基本編程
課程五︰大數據集群需要的基本環境

第一階段︰大數據技術入門Hadoop

課程一︰HDFS
課程二︰Zookeeper
課程三︰MapReduce & Yarn
課程四︰avro & parquet & sequenceFile
階段實戰一︰HDFS文件的恢復、備份
階段實戰二︰Zookeeper實現配置管理
階段實戰三︰Zookeeper實現分布式鎖
階段實戰四︰Hadoop的HA配置
階段實戰五︰HDFS小文件的合並
階段實戰六︰企業級Yarn資源的分配
階段實戰七︰NCDC氣象數據分析

第二階段︰Scala語言的學習

課程一︰認識Scala
課程二︰十二步體驗Scala
課程三︰面向對象編程基礎
課程四︰函數式編程基礎
課程五︰模式匹配
課程六︰隱式系統
課程七︰類型系統
課程八︰集合框架
階段實戰一︰編寫更函數式程序

第三階段︰Spark核心技術

課程一︰Spark環境(開發和集群)的搭建
課程二︰正確理解Spark
課程三︰Spark核心編程模型之RDD
課程四︰正確提交Spark應用(實操課程)
課程五︰Schedulers On Driver(原理加實操課程)
課程六︰Spark SQL的前生今世以及未來
課程七︰有SQL基礎就可以玩轉Spark SQL
階段實戰一︰Spark topN問題
階段實戰二︰網站流量分析之session切分
階段實戰三︰地圖切片
階段實戰四︰Spark SQL中schema的合並
階段實戰五︰Spark SQL各種數據源的讀寫
階段實戰六︰數據挖掘之關聯規則挖掘
階段實戰七︰Spark怎麼處理Json格式
階段實戰八︰物聯網設備信息ETL
階段實戰九︰Spark SQL分析出租車數據
階段實戰十︰Spark航班延遲預測

第四階段︰大數據實時流技術

課程一︰Spark Streaming編程模型
課程二︰Spark Streaming性能與穩定
課程三︰Spark Streaming容錯與語義
課程四︰Flume
課程五︰Kafka
階段實戰一︰Spark Streaming集成Flume
階段實戰二︰Spark Streaming集成Kafka
階段實戰三︰Flume與Kafka集成
階段實戰四︰實時計算網站訪問指標
階段實戰五︰網站用戶行為實時分析

第五階段︰NoSQL數據庫-HBase

課程一︰核心原理之架構原理
課程二︰核心原理之緩存機制
課程三︰核心原理之Region切分機制
課程四︰Java客戶端操作HBase
課程五︰Solr
階段實戰一︰RegionServer內存規劃
階段實戰二︰Compaction以提高性能
階段實戰三︰處理Region太多的場景
階段實戰四︰Spark RDD讀寫HBase
階段實戰五︰Spark Streaming讀寫HBase
階段實戰六︰Bulk Load
階段實戰七︰HBase + Solr分析產品質量數據
階段實戰八︰構建一個Java Web網站

第六階段︰SQL On Hadoop

課程一︰Hive
課程二︰Spark SQL兼容Hive
課程三︰Impala + kudu
課程四︰sqoop
課程五︰Oozie
課程六︰Hue
課程七︰Zeppelin
階段實戰一︰Spark SQL與Hive的優秀實踐
階段實戰二︰配置Hive跑在Spark上
階段實戰三︰基于Hive的ETL實例
階段實戰四︰爬取豆瓣電影數據進行數據分析
階段實戰五︰NBA出色球員分析實戰

選修一︰大數據+AI方向

課程一︰微積分基礎
課程二︰線性代數基礎
課程三︰概率統計基礎
課程四︰線性回歸及其實戰
課程五︰模型性能調試
課程六︰邏輯回歸(分類)及其實戰
課程七︰支持向量機(SVM)及其實戰
課程八︰決策樹算法及其實戰
課程九︰K-Means聚類算法及其實戰
課程十︰PCA降維算法及其使用
課程十一︰神經網絡及其實戰

選修二︰大數據進階方向

課程一︰Java設計模式講解
課程二︰JVM虛擬機高級特性
課程一︰Spark內核原理(源碼分析)
課程二︰Kafka內核原理(源碼分析)
課程三︰ElasticSearch優秀實踐
課程四︰分布式實時計算之Storm
課程五︰Flink

面試指導

1、一對一面試指導
2、往屆畢業學員面試經驗
3、全面系統的面試題
6
大實戰
項目六︰
用戶畫像系統
說明︰幫您掌握用戶的每一個細節,實現數據驅動利潤
項目一︰
手把手教你搭建大數據集群
說明︰本地搭建大數據小集群,集群雖小,五髒俱全,學習之本,應用之源
項目五︰
互聯網多媒體智能推薦系統(大數據 + AI項目)
說明︰在每一個對外提供服務的互聯網企業,推薦系統都是其核心所在。掌握推薦系統就是掌握公司的核心技術。
項目二︰
構建企業級大數據數據倉庫(大數據平台)
說明︰每一個大數據企業的心髒,離它越近,薪水越高
項目四︰
億級用戶訪問日志實時分析系統
說明︰在大數據的項目另一個非常重要的方向就是實時分析項目,實時把握用戶的行為
項目三︰
奧運會CNTV網站流量分析(PB級別數據量)
說明︰基于數據倉庫之上的洞察網站用戶訪問行為的系統,互聯網公司的決策之源實時分析
1/隨到隨學

學員報名之後立馬就可以開始學習,無需再等人數夠了再開班,每個學員都可以根據自己的時間安排制定自己的學習計劃,不會再因為時間不統一落下課。 點擊查看詳情>>

2/4對1輔導

授課老師、助教老師、班主任、就業指導老師4對1的服務模式,學員可以在線與授課老師和助教老師1對1溝通問題,班主任會通過學習平台可視化數據督促學員學習,就業指導老師會在就業前對學員進行1對1就業指導。 點擊查看詳情>>

3/闖關式學習

我們的課程是闖關式教學,學員需要完成每一關的作業測試及與助教的視頻考核,合格之後才能進去到下一個階段的學習,保證學員是真正學會了,彌補了學員無法參加面授,沒人監督而無法保證自制力和持久力,通過作業測試視頻考核也可以檢驗學員的學習效果,讓學員知道自己的學習的程度和效果。 點擊查看詳情>>

金融領域
應用案例︰投資理財
功能描述︰通過對個人的信用評估,風險承擔能力評估,結合眾多理財產品,推薦相應的投資理財產品
崗位需求︰數據分析師、數據挖掘工程師、數據分析專家、數據倉庫工程師
交通領域
應用案例︰智能交通
功能描述︰通過對車流量等海量數據的收集,估算,預測該路段一定時間內的車流量情況,給用戶提供便利。
崗位需求︰Hadoop開發工程師、數據質量稽查工程師、數據可視化工程師、數據分析師
電信領域
應用案例︰智慧營業廳
功能描述︰通過對用戶當前的行為習慣,偏好,節假日的相應數據變化,調整自身業務結構,做到按需分配。
崗位需求︰Flink開發工程師、爬蟲開發工程師、數據模型開發工程師
安防領域
應用案例︰人臉識別
功能描述︰通過人臉識別,一一匹配,存儲用戶數據,結合人工智能,分析及甄別用戶行為,預防犯罪等行為發生。
崗位需求︰算法工程師、數據質量稽查工程師、數據可視化工程師、數據分析師
傳媒領域
應用案例︰猜你喜歡
功能描述︰通過受眾人群的大數據分析,結合對應的算法,將受眾喜歡的進行交互推薦,使猜你喜歡變為你會喜歡。
崗位需求︰Spark開發工程師、數據挖掘工程師、數據可視化工程師、數據分析師
電商領域
應用案例︰精準廣告位
功能描述︰通過用戶的瀏覽行為,點擊行為等大數據采集,分析,挖掘用戶的二層三層喜歡,擴大產出。
崗位需求︰廣告系統開發工程師、爬蟲開發工程師、Hive工程師、數據挖掘工程師
政府領域
應用案例︰便民服務
功能描述︰通過對用戶使用習慣,使用頻率等大數據采集分析,結合人臉識別,人工智能算法,實現便民服務。
崗位需求︰Hadoop開發工程師、機器學習開發工程師、數據可視化工程師、數據分析架構
醫療領域
應用案例︰智慧醫療
功能描述︰通過對海量病例大數據的存儲,匹配,檢索,結合用戶的飲食,行為等習慣,搭建智慧醫療體系。
崗位需求︰爬蟲開發工程師、數據質量稽查工程師、大數據平台運維工程師、數據分析師

大數據工程師學習之路
你我一起全力以赴!

點擊了解詳情