歡迎來到趣招生!
授課機(jī)構(gòu):昆明海文國際IT培訓(xùn)
地址:昆明市西山區(qū)前興路昆明西山萬達(dá)廣場
網(wǎng)報(bào)價(jià)格:¥電詢
課程原價(jià):¥電詢
咨詢熱線:400-168-8684
課程詳情 學(xué)校簡介 學(xué)校地址 網(wǎng)上報(bào)名
關(guān)鍵詞:昆明大數(shù)據(jù)開發(fā)培訓(xùn) 昆明大數(shù)據(jù)IT培訓(xùn) 昆明數(shù)據(jù)庫培訓(xùn)班
Linux系統(tǒng)做為大數(shù)據(jù)平的企業(yè)級操作系統(tǒng),本部分是基礎(chǔ)課程,幫大家打好Linux基礎(chǔ),以便更好地學(xué)習(xí)Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等眾多課程。這是進(jìn)入大數(shù)據(jù)領(lǐng)域的必須掌握的基礎(chǔ)技術(shù)因?yàn)槠髽I(yè)中的項(xiàng)目基本上都是使用Linux環(huán)境下搭建或部署的。
本課程是整套大數(shù)據(jù)課程的基石:其一,分布式文件系統(tǒng)HDFS用于存儲海量數(shù)據(jù),無論是Hive、HBase或者Spark分析的數(shù)據(jù)是存儲在HDFS里面;其二是分布式資源管理框架YARN是用來在Hadoop 云操作系統(tǒng)(也稱數(shù)據(jù)系統(tǒng))管理集群資源和分布式數(shù)據(jù)處理框架MapReduce、Spark應(yīng)用的資源調(diào)度與監(jiān)控的;分布式并行計(jì)算框架MapReduce目前是海量數(shù)據(jù)并行處理的一個(gè)最常用的框架。Hadoop 2.x的編譯、環(huán)境搭建、HDFS Shell使用,YARN 集群資源管理與任務(wù)監(jiān)控,MapReduce編程,分布式集群的部署管理(包括高可用性HA)必須要掌握的。
hive是基于Hadoop的一個(gè)數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供基本的SQL查詢功能,可以將SQL語句轉(zhuǎn)換為MapReduce任務(wù)進(jìn)行運(yùn)行。其優(yōu)點(diǎn)是學(xué)習(xí)成本低,可以通類SQL語句快速實(shí)現(xiàn)簡單的MapReduce統(tǒng)計(jì),不必開發(fā)專門的MapReduce應(yīng)用,十分適合數(shù)據(jù)倉庫的統(tǒng)計(jì)分析。
Sqoop是一款開源的工具,主要用于在Hadoop(Hive)與傳統(tǒng)的數(shù)據(jù)庫mysql、Oracle、SQLServer、postgresql等RDBMS數(shù)據(jù)間進(jìn)行數(shù)據(jù)的傳遞,可以將一個(gè)關(guān)系型數(shù)據(jù)庫,例如 : MySQL 、Oracle 、SQLServer、Postgres等RDBMS中的數(shù)據(jù)導(dǎo)進(jìn)到關(guān)系型數(shù)據(jù)庫中。Sqoop項(xiàng)目開始于2009年,最早是作為Hadoop的一個(gè)第三方模塊存在,后來為了讓使用者能夠快速部署,也為了讓開發(fā)人員能夠更快速的迭代開發(fā),Sqoop獨(dú)立成為一個(gè)Apache項(xiàng)目。
Hue是一個(gè)開源的Apache Hadoop UI系統(tǒng),最早是由Cloudera Desktop演化而來,由Cloudera貢獻(xiàn)給開源社區(qū),它是基于Python Web框架Django實(shí)現(xiàn)的。通過使用Hue我們可以在瀏覽器端的Web控制臺上與Hadoop集群進(jìn)行交互來分析處理數(shù)據(jù),例如操作HDFS上的數(shù)據(jù),運(yùn)行MapReduce Job等等。
HBase是一個(gè)分布式的、面向列的開源數(shù)據(jù)庫,該技術(shù)來源于 Fay Chang 所撰寫的Google論文“Bigtable:一個(gè)結(jié)構(gòu)化數(shù)據(jù)的分布式存儲系統(tǒng)”。HBase在Hadoop之上提供了類似于Bigtable的能力,是一個(gè)高可靠性、高性能、面向列、可伸縮的分布式存儲系統(tǒng),利用HBase技術(shù)可在廉價(jià)PC Server上搭建起大規(guī)模結(jié)構(gòu)化存儲集群;
Storm是Twitter開源的分布式實(shí)時(shí)大數(shù)據(jù)處理框架,被業(yè)界稱為實(shí)時(shí)版Hadoop。 隨著越來越多的場景對Hadoop的MapReduce高延遲無法容忍,比如網(wǎng)站統(tǒng)計(jì)、推薦系統(tǒng)、預(yù)警系統(tǒng)、金融系統(tǒng)(高頻交易、股票)等等, 大數(shù)據(jù)實(shí)時(shí)處理解決方案(流計(jì)算)的應(yīng)用日趨廣泛,目前已是分布式技術(shù)領(lǐng)域最新爆發(fā)點(diǎn),而Storm更是流式計(jì)算技術(shù)中的佼佼者和主流。 按照storm作者的說法,Storm對于實(shí)時(shí)計(jì)算的意義類似于Hadoop對于批處理的意義。Hadoop提供了map + reduce的原語,使我們的批處理程序變得簡單和高效。 同樣,Storm也為實(shí)時(shí)計(jì)算提供了一些簡單高效的原語,而且Storm的Trident是基于Storm原語更高級的抽象框架,類似于基于Hadoop的Pig框架, 讓開發(fā)更加便利和高效。本課程會(huì)深入、全面的講解Storm,并穿插企業(yè)場景實(shí)戰(zhàn)講述Storm的運(yùn)用。 淘寶雙11的大屏幕實(shí)時(shí)監(jiān)控效果沖擊了整個(gè)IT界,業(yè)界為之驚嘆的同時(shí)更是引起對該技術(shù)的探索。 學(xué)完本課程你可以自己開發(fā)升級版的“淘寶雙11”,一起來學(xué)習(xí)吧!
為什么要學(xué)習(xí)Scala?源于Spark的流行,Spark是當(dāng)前最流行的開源大數(shù)據(jù)內(nèi)存計(jì)算框架,采用Scala語言實(shí)現(xiàn),各大公司都在使用Spark:IBM宣布承諾大力推進(jìn)Apache Spark項(xiàng)目,并稱該項(xiàng)目為:在以數(shù)據(jù)為主導(dǎo)的,未來十年最為重要的新的開源項(xiàng)目。這一承諾的核心是將Spark嵌入IBM業(yè)內(nèi)領(lǐng)先的分析和商務(wù)平臺,Scala具有數(shù)據(jù)處理的天然優(yōu)勢,Scala是未來大數(shù)據(jù)處理的主流語言;
Spark是UC Berkeley AMP lab所開源的類,是Hadoop MapReduce的通用并行框架,Spark擁有Hadoop MapReduce所具有的優(yōu)點(diǎn)。啟用了內(nèi)存分布數(shù)據(jù)集,除了能夠提供交互式查詢外,它還可以優(yōu)化迭代工作負(fù)載。Spark Streaming: 構(gòu)建在Spark上處理Stream數(shù)據(jù)的框架,基本的原理是將Stream數(shù)據(jù)分成小的時(shí)間片斷(幾秒),以類似batch批量處理的方式來處理這小部分?jǐn)?shù)據(jù);
本課程主要講解目前大數(shù)據(jù)領(lǐng)域熱門、火爆、有前景的技術(shù)——Spark。在本課程中,會(huì)從淺入深,基于大量案例實(shí)戰(zhàn),深度剖析和講解Spark,并且會(huì)包含完全從企業(yè)真實(shí)復(fù)雜業(yè)務(wù)需求中抽取出的案例實(shí)戰(zhàn)。課程會(huì)涵蓋Scala編程詳解、Spark核心編程.
本階段主要就之前所學(xué)內(nèi)容完成大數(shù)據(jù)相關(guān)企業(yè)場景與解決方案的剖析應(yīng)用及結(jié)合一個(gè)電子商務(wù)平臺進(jìn)行實(shí)戰(zhàn)分析,主要包括有: 企業(yè)大數(shù)據(jù)平臺概述、搭建企業(yè)大數(shù)據(jù)平臺、真實(shí)服務(wù)器手把手環(huán)境部署、使用CM 5.3.x管理CDH 5.3.x集群;
離線數(shù)據(jù)分析平臺是一種利用hadoop集群開發(fā)工具的一種方式,主要作用是幫助公司對網(wǎng)站的應(yīng)用有一個(gè)比較好的了解。尤其是在電商、旅游、銀行、證券、游戲等領(lǐng)域有非常廣泛,因?yàn)檫@些領(lǐng)域?qū)?shù)據(jù)和用戶的特性把握要求比較高,所以對于離線數(shù)據(jù)的分析就有比較高的要求了。 本課程講師本人之前在游戲、旅游等公司專門從事離線數(shù)據(jù)分析平臺的搭建和開發(fā)等,通過此項(xiàng)目將所有大數(shù)據(jù)內(nèi)容貫穿,并前后展示!
課程基于1號店的業(yè)務(wù)及數(shù)據(jù)進(jìn)行設(shè)計(jì)和講解的,主要涉及:
1、課程中完整開發(fā)3個(gè)Storm項(xiàng)目,均為企業(yè)實(shí)際項(xiàng)目,其中一個(gè)是完全由Storm Trident開發(fā)。 項(xiàng)目源碼均可以直接運(yùn)行,也可直接用于商用或企業(yè)。
2、每個(gè)技術(shù)均采用最新穩(wěn)定版本,學(xué)完后會(huì)員可以從Kafka到Storm項(xiàng)目開發(fā)及HighCharts圖表開發(fā)一個(gè)人搞定!讓學(xué)員身價(jià)劇增;
3、搭建CDH5生態(tài)環(huán)境完整平臺,且采用Cloudera Manager界面化管理CDH5平臺。讓Hadoop平臺環(huán)境搭建和維護(hù)都變得輕而易舉。
4、分享實(shí)際項(xiàng)目的架構(gòu)設(shè)計(jì)、優(yōu)劣分析和取舍、經(jīng)驗(yàn)技巧,陡直提升學(xué)員的經(jīng)驗(yàn)值;
本階段通過對歷來大數(shù)據(jù)公司企業(yè)真實(shí)面試題的剖析,講解,讓學(xué)員真正的一個(gè)菜鳥轉(zhuǎn)型為具有1年以上的大數(shù)據(jù)開發(fā)工作經(jīng)驗(yàn)的專業(yè)人士,也是講師多年來大數(shù)據(jù)企業(yè)開發(fā)的經(jīng)驗(yàn)之談。
國內(nèi)關(guān)于Java性能調(diào)優(yōu)的課程非常少,如此全面深入介紹Java性能調(diào)優(yōu); 本套課程系多年工作經(jīng)驗(yàn)與心得的總結(jié),課程有著很高的含金量和實(shí)用價(jià)值,本課程專注于java應(yīng)用程序的優(yōu)化方法,技巧和思想,深入剖析軟件設(shè)計(jì)層面、代碼層面、JVM虛擬機(jī)層面的優(yōu)化方法,理論結(jié)合實(shí)際,使用豐富的示例幫助學(xué)員理解理論知識。
Java自面世后就非常流行,發(fā)展迅速,對C++語言形成有力沖擊。在全球云計(jì)算和移動(dòng)互聯(lián)網(wǎng)的產(chǎn)業(yè)環(huán)境下,JAVA更具備了顯著優(yōu)勢和廣闊前景,基于JAVA的項(xiàng)目也越來越多,對JAVA運(yùn)行環(huán)境的要求也越來越高,很多JAVA的程序員只知道對業(yè)務(wù)的擴(kuò)展而不知道對java本身的運(yùn)行環(huán)境的調(diào)試,例如虛擬機(jī)調(diào)優(yōu),服務(wù)器集群等,所以也滋生本門課程的產(chǎn)生。 本課程重點(diǎn)講解JAVA企業(yè)級開發(fā)中必須掌握的應(yīng)用服務(wù)器;
隨著互聯(lián)網(wǎng)的發(fā)展,高并發(fā)、大數(shù)據(jù)量的網(wǎng)站要求越來越高。而這些高要求都是基礎(chǔ)的技術(shù)和細(xì)節(jié)組合而成的。本課程就從實(shí)際案例出發(fā)給大家原景重現(xiàn)高并發(fā)架構(gòu)常用技術(shù)點(diǎn)及詳細(xì)演練。通過該課程的學(xué)習(xí),普通的技術(shù)人員就可以快速搭建起千萬級的高并發(fā)大數(shù)據(jù)網(wǎng)站平臺,課程涉及內(nèi)容包括:LVS實(shí)現(xiàn)負(fù)載均衡、Nginx高級配置實(shí)戰(zhàn)、共享存儲實(shí)現(xiàn)動(dòng)態(tài)內(nèi)容靜態(tài)化加速實(shí)戰(zhàn)、緩存平臺安裝配置使用、mysql主從復(fù)制安裝配置實(shí)戰(zhàn)等。
隨著Web技術(shù)的普及,Internet上的各類網(wǎng)站每天都在爆炸式增長。但這些網(wǎng)站大多在性能上沒做過多考慮。當(dāng)然,各種情況不同。有的是Web技術(shù)本身的原因(主要是程序代碼問題),還有就是由于Web服務(wù)器未進(jìn)行優(yōu)化。不管是哪種情況,一但用戶量在短時(shí)間內(nèi)激增,網(wǎng)站就會(huì)明顯變慢,甚至拒絕放訪問。要想有效地解決這些問題,就只有依靠不同的優(yōu)化技術(shù)。本課程就是主要用于來解決大型網(wǎng)站性能問題,能夠承受大數(shù)據(jù)、高并發(fā)。主要涉及 技術(shù)有:nginx、tomcat、memcached、redis緩存、負(fù)載均衡等高級開發(fā)技術(shù);
項(xiàng)目實(shí)戰(zhàn):PB級通用電商網(wǎng)站性能優(yōu)化解決方案
本部分通過一個(gè)通用電商訂單支付模塊,外加淘寶支付接口的實(shí)現(xiàn)(可用于實(shí)際項(xiàng)目開發(fā)),剖析并分析過程中可能遇到的各種性能瓶頸及相關(guān)的解決方案與優(yōu)化技巧。最終目標(biāo),讓具備PHP基礎(chǔ)或JAVA基礎(chǔ)的學(xué)員迅速掌握Linux下的開發(fā)知識,并對涉及到nginx、tomcat、memcached、redis緩存、負(fù)載均衡等高級開發(fā)技術(shù)有一個(gè)全面的了解;
本課程名為深入淺出數(shù)據(jù)挖掘技術(shù)。所謂“深入”,指得是從數(shù)據(jù)挖掘的原理與經(jīng)典算法入手。其一是要了解算法,知道什么場景應(yīng)當(dāng)應(yīng)用什么樣的方法;其二是學(xué)習(xí)算法的經(jīng)典思想,可以將它應(yīng)用到其他的實(shí)際項(xiàng)目之中;其三是理解算法,讓數(shù)據(jù)挖掘的算法能夠應(yīng)用到您的項(xiàng)目開發(fā)之中去。所謂“淺出”,指得是將數(shù)據(jù)挖掘算法的應(yīng)用落實(shí)到實(shí)際的應(yīng)用中。課程會(huì)通過三個(gè)不同的方面來講解算法的應(yīng)用:一是微軟公司的SQL Server與Excel等工具實(shí)現(xiàn)的數(shù)據(jù)挖掘;二是著名開源算法的數(shù)據(jù)挖掘,如Weka、KNIMA、Tanagra等開源工具;三是利用C#語言做演示來完成數(shù)據(jù)挖掘算法的實(shí)現(xiàn)。根據(jù)實(shí)際的引用場景,數(shù)據(jù)挖掘技術(shù)通常分為分類器、關(guān)聯(lián)分析、聚類算法等三大類別。本課程主要介紹這三大算法的經(jīng)典思想以及部分著名的實(shí)現(xiàn)形式,并結(jié)合一些商業(yè)分析工具、開源工具或編程等方式來講解具體的應(yīng)用方法;
本課程由淺入深的介紹了Lucene4的發(fā)展歷史,開發(fā)環(huán)境搭建,分析lucene4的中文分詞原理,深入講了lucenne4的系統(tǒng)架構(gòu),分析lucene4索引實(shí)現(xiàn)原理及性能優(yōu)化,了解關(guān)于lucene4的搜索算法優(yōu)化及利用java結(jié)合lucene4實(shí)現(xiàn)類百度文庫的全文檢索功能等相對高端實(shí)用的內(nèi)容,市面上一般很難找到同類具有相同深度與廣度的視頻,集原理、基礎(chǔ)、案例與實(shí)戰(zhàn)與一身,不可多得的一部高端視頻教程;
本教程從最基礎(chǔ)的solr語法開始講解,選擇了最新最流行的開源搜索引擎服務(wù)框架solr5.3.1,利用Tomcat8搭建了solr的集群服務(wù);本教程可以幫助學(xué)員快速上手solr的開發(fā)和二次開發(fā),包括在hadoop集群的使用,海量數(shù)據(jù)的索引和實(shí)時(shí)檢索,通過了解、學(xué)習(xí)、安裝、配置、集成等步驟引導(dǎo)學(xué)員如何將solr集成到項(xiàng)目中;
SPSS Modeler是業(yè)界極為著名的數(shù)據(jù)挖掘軟件,其前身為SPSS Clementine。SPSS Modeler內(nèi)置豐富的數(shù)據(jù)挖掘模型,以其強(qiáng)大的挖掘功能和友好的操作習(xí)慣,深受用戶的喜愛和好評,成為眾多知名企業(yè)在數(shù)據(jù)挖掘項(xiàng)目上的軟件產(chǎn)品選擇。本課程以SPSS Modeler為應(yīng)用軟件,以數(shù)據(jù)挖掘項(xiàng)目生命周期為線索,以實(shí)際數(shù)據(jù)挖掘項(xiàng)目為例,講解了從項(xiàng)目商業(yè)理解開始,到最后軟件實(shí)現(xiàn)的全過程。
ETL是數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換、加載的過程,是數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫進(jìn)行大數(shù)據(jù)分析的載入過程,目前流行的數(shù)據(jù)進(jìn)入倉庫的過程有兩種形式,一種是進(jìn)入數(shù)據(jù)庫后再進(jìn)行清洗和轉(zhuǎn)換,另外一條路線是首先進(jìn)行清洗轉(zhuǎn)換再進(jìn)入數(shù)據(jù)庫,我們的ETL屬于后者。 大數(shù)據(jù)的利器大家可能普遍說是hadoop,但是大家要知道如果我們不做預(yù)先的清洗和轉(zhuǎn)換處理,我們進(jìn)入hadoop后僅通過mapreduce進(jìn)行數(shù)據(jù)清洗轉(zhuǎn)換再進(jìn)行分析,垃圾數(shù)據(jù)會(huì)導(dǎo)致我們的磁盤占用量會(huì)相當(dāng)大,這樣無形中提升了我們的硬件成本(硬盤大,內(nèi)存小處理速度會(huì)很慢,內(nèi)存大但CPU性能低速度也會(huì)受影響),因此雖然hadoop理論上解決了一堆普通服務(wù)器拼起來解決大問題的問題,但是事實(shí)上如果我們有更好的節(jié)點(diǎn)速度必然是會(huì)普遍提升的,因此ETL在大數(shù)據(jù)環(huán)境下仍然是必不可少的數(shù)據(jù)交換工具;
本課程面向從未接觸過數(shù)據(jù)分析的學(xué)員,從最基礎(chǔ)的R語法開始講起,逐步進(jìn)入到目前各行業(yè)流行的各種分析模型。整個(gè)課程分為基礎(chǔ)和實(shí)戰(zhàn)兩個(gè)單元:基礎(chǔ)部分包括R語法和統(tǒng)計(jì)思維兩個(gè)主題、R語法單元會(huì)介紹R語言中的各種特色數(shù)據(jù)結(jié)構(gòu),以及如何從外部抓取數(shù)據(jù),如何使用包和函數(shù),幫助學(xué)員快速通過語法關(guān)。統(tǒng)計(jì)思維單元會(huì)指導(dǎo)如何用統(tǒng)計(jì)學(xué)的思想快速的發(fā)現(xiàn)數(shù)據(jù)特點(diǎn)或者模式,并利用R強(qiáng)大的繪圖能力做可視化展現(xiàn)。在實(shí)戰(zhàn)部分選擇了回歸、聚類、數(shù)據(jù)降維、關(guān)聯(lián)規(guī)則、決策樹這5中最基礎(chǔ)的數(shù)據(jù)分析模型,詳細(xì)介紹其思想原理,并通過案例講解R中的實(shí)現(xiàn)方案,尤其是詳細(xì)的介紹了對各種參數(shù)和輸出結(jié)果的解讀,讓學(xué)員真正達(dá)到融會(huì)貫通、舉一反三的效果。并應(yīng)用到自己的工作環(huán)境中;
Mahout 是 Apache Software Foundation(ASF) 旗下的一個(gè)開源項(xiàng)目,提供一些可擴(kuò)展的機(jī)器學(xué)習(xí)領(lǐng)域經(jīng)典算法的實(shí)現(xiàn),旨在幫助開發(fā)人員更加方便快捷地創(chuàng)建智能應(yīng)用程序。課程包括:Mahout數(shù)據(jù)挖掘工具,及Hadoop實(shí)現(xiàn)推薦系統(tǒng)的綜合實(shí)戰(zhàn),涉及到MapReduce、Pig和Mahout的綜合實(shí)戰(zhàn);
近年來,金融領(lǐng)域的量化分析越來越受到理論界與實(shí)務(wù)界的重視,量化分析的技術(shù)也取得了較大的進(jìn)展,成為備受關(guān)注的一個(gè)熱點(diǎn)領(lǐng)域。所謂金融量化,就是將金融分析理論與計(jì)算機(jī)編程技術(shù)相結(jié)合,更為有效的利用現(xiàn)代計(jì)算技術(shù)實(shí)現(xiàn)準(zhǔn)確的金融資產(chǎn)定價(jià)以及交易機(jī)會(huì)的發(fā)現(xiàn)。量化分析目前已經(jīng)涉及到金融領(lǐng)域的方方面面,包括基礎(chǔ)和衍生品金融資產(chǎn)定價(jià)、風(fēng)險(xiǎn)管理、量化投資等。隨著大數(shù)據(jù)技術(shù)的發(fā)展,量化分析還逐步與大數(shù)據(jù)結(jié)合在一起,對海量金融數(shù)據(jù)實(shí)現(xiàn)有效和快速的運(yùn)算與處理。在量化金融的時(shí)代,選用一種合適的編程語言對于金融模型的實(shí)現(xiàn)是至關(guān)重要的。在這方面,Python語言體現(xiàn)出了不一般的優(yōu)勢,特別是它擁有大量的金融計(jì)算庫,并且可以提供與C++,java等語言的接口以實(shí)現(xiàn)高效率的分析,成為金融領(lǐng)域快速開發(fā)和應(yīng)用的一種關(guān)鍵語言,由于它是開源的,降低了金融計(jì)算的成本,而且還通過廣泛的社交網(wǎng)絡(luò)提供大量的應(yīng)用實(shí)例,極大的縮短了金融量化分析的學(xué)習(xí)路徑。本課程在量化分析與Python語言快速發(fā)展的背景下介紹二者之間的關(guān)聯(lián),使學(xué)員能夠快速掌握如何利用Python語言進(jìn)行金融數(shù)據(jù)量化分析的基本方法。
本課程介紹了基于云計(jì)算的大數(shù)據(jù)處理技術(shù),重點(diǎn)介紹了一款高效的、實(shí)時(shí)分析處理海量數(shù)據(jù)的強(qiáng)有力工具——數(shù)據(jù)立方。數(shù)據(jù)立方是針對大數(shù)據(jù)處理的分布式數(shù)據(jù)庫,能夠可靠地對大數(shù)據(jù)進(jìn)行實(shí)時(shí)處理,具有即時(shí)響應(yīng)多用戶并發(fā)請求的能力,通過對當(dāng)前主流的大數(shù)據(jù)處理系統(tǒng)進(jìn)行深入剖析,闡述了數(shù)據(jù)立方產(chǎn)生的背景,介紹了數(shù)據(jù)立方的整體架構(gòu)以及安裝和詳細(xì)開發(fā)流程,并給出了4個(gè)完整的數(shù)據(jù)立方綜合應(yīng)用實(shí)例。所有實(shí)例都經(jīng)過驗(yàn)證并附有詳細(xì)的步驟說明,無論是對于云計(jì)算的初學(xué)者還是想進(jìn)一步深入學(xué)習(xí)大數(shù)據(jù)處理技術(shù)的研發(fā)人員、研究人員都有很好的參考價(jià)值。
ZooKeeper是Hadoop的開源子項(xiàng)目(Google Chubby的開源實(shí)現(xiàn)),它是一個(gè)針對大型分布式系統(tǒng)的可靠協(xié)調(diào)系統(tǒng),提供的功能包括:配置維護(hù)、命名服務(wù)、分布式同步、組服務(wù)等。Zookeeper的Fast Fail 和 Leader選舉特性大大增強(qiáng)了分布式集群的穩(wěn)定和健壯性,并且解決了Master/Slave模式的單點(diǎn)故障重大隱患,這是越來越多的分布式產(chǎn)品如HBase、Storm(流計(jì)算)、S4(流計(jì)算)等強(qiáng)依賴Zookeeper的原因。Zookeeper在分布式集群(Hadoop生態(tài)圈)中的地位越來越突出,對分布式應(yīng)用的開發(fā)也提供了極大便利,這是迫切需要深入學(xué)習(xí)Zookeeper的原因。
本課程主要內(nèi)容包括Zookeeper深入、客戶端開發(fā)(Java編程,案例開發(fā))、日常運(yùn)維、Web界面監(jiān)控,“一條龍”的實(shí)戰(zhàn)平臺分享給大家;
Docker是一種開源的應(yīng)用容器引擎,使用Docker可以快速地實(shí)現(xiàn)虛擬化,并且實(shí)現(xiàn)虛擬化的性能相對于其他技術(shù)來說較高。并且隨著云計(jì)算的普及以及對虛擬化技術(shù)的大量需求,使得云計(jì)算人才供不應(yīng)求,所以一些大型企業(yè)對Docker專業(yè)技術(shù)人才需求較大。本教程從最基礎(chǔ)的Dokcer原理開始講起,深入淺出,并且全套課程均結(jié)合實(shí)例實(shí)戰(zhàn)進(jìn)行講解,讓學(xué)員可以不僅能了解原理,更能夠?qū)嶋H地去使用這門技術(shù);
2013年,云計(jì)算領(lǐng)域從此多了一個(gè)名詞“Docker”。以輕量著稱,更好的去解決應(yīng)用打包和部署。之前我們一直在構(gòu)建Iaas,但通過Iaas去實(shí)現(xiàn)統(tǒng)一功 能還是相當(dāng)復(fù)雜得,并且維護(hù)復(fù)雜。將特殊性封裝到鏡像中實(shí)現(xiàn)幾乎一致得部署方法,它就是“Docker”,以容器為技術(shù)核心,實(shí)現(xiàn)了應(yīng)用的標(biāo)準(zhǔn)化。企業(yè)可以快速生成研發(fā)、測試環(huán)境,并且可以做到快速部署。實(shí)現(xiàn)了從產(chǎn)品研發(fā)環(huán)境到部署環(huán)境的一致化。Docker讓研發(fā)更加專注于代碼的編寫,并且以“鏡像”作 為交付。極大的縮短了產(chǎn)品的交付周期和實(shí)施周期;
OpenStack是一個(gè)由Rackspace發(fā)起、全球開發(fā)者共同參與的開源項(xiàng)目,旨在打造易于部署、功能豐富且易于擴(kuò)展的云計(jì)算平臺。OpenStack企圖成為數(shù)據(jù)中心的操作系統(tǒng),即云操作系統(tǒng)。從項(xiàng)目發(fā)起之初,OpenStack就幾乎贏得了所有IT巨頭的關(guān)注,在各種OpenStack技術(shù)會(huì)議上人們激情澎湃,幾乎所有人都成為OpenStack的信徒。 這個(gè)課程重點(diǎn)放在Openstack的部署和網(wǎng)絡(luò)部分。課程強(qiáng)調(diào)實(shí)際的動(dòng)手操作,使用vmware模擬實(shí)際的物理平臺,讓大家可以自己動(dòng)手去實(shí)際搭建和學(xué)習(xí)Openstack。課程內(nèi)容包括云計(jì)算的基本知識、虛擬網(wǎng)絡(luò)基礎(chǔ)、Openstack部署和應(yīng)用、Openstack網(wǎng)絡(luò)詳解等;
本課程希望用簡單易懂的語言帶領(lǐng)大家探索TensorFlow(基于1.0版本API)。課程中講師主講TensorFlow的基礎(chǔ)原理,TF和其他框架的異同。并用具體的代碼完整地實(shí)現(xiàn)了各種類型的深度神經(jīng)網(wǎng)絡(luò):AutoEncoder、MLP、CNN(AlexNet,VGGNet,Inception Net,ResNet)、Word2Vec、RNN(LSTM,Bi-RNN)、Deep Reinforcement Learning(Policy Network、Value Network)。此外,還講解了TensorBoard、多GPU并行、分布式并行、TF.Learn和其他TF.Contrib組件。本課程能幫讀者快速入門TensorFlow和深度學(xué)習(xí),在工業(yè)界或者研究中快速地將想法落地為可實(shí)踐的模型;
本課程重點(diǎn)講解開發(fā)推薦系統(tǒng)的方法,尤其是許多經(jīng)典算法,重點(diǎn)探討如何衡量推薦系統(tǒng)的有效性。課程內(nèi)容分為基本概念和進(jìn)展兩部分:前者涉及協(xié)同推薦、基于內(nèi)容的推薦、基于知識的推薦、混合推薦方法,推薦系統(tǒng)的解釋、評估推薦系統(tǒng)和實(shí)例分析;后者包括針對推薦系統(tǒng)的攻擊、在線消費(fèi)決策、推薦系統(tǒng)和下一代互聯(lián)網(wǎng)以及普通環(huán)境中的推薦。課程中包含大量的圖、表和示例,有助于學(xué)員理解和把握相關(guān)知識等:
本課程主要講解人工智能的基本原理、實(shí)現(xiàn)技術(shù)及其應(yīng)用,國內(nèi)外人工智能研究領(lǐng)域的進(jìn)展和發(fā)展方向。內(nèi)容主要分為4個(gè)部分:
第1部分是搜索與問題求解,系統(tǒng)地?cái)⑹隽巳斯ぶ悄苤懈鞣N搜索方法求解的原理和方法,內(nèi)容包括狀態(tài)空間和傳統(tǒng)的圖搜索算法、和聲算法、禁忌搜索算法、遺傳算法、免疫算法、粒子群算法、蟻群算法和Agent技術(shù)等;
第2部分為知識與推理,討論各種知識表示和處理技術(shù)、各種典型的推理技術(shù),還包括非經(jīng)典邏輯推理技術(shù)和非協(xié)調(diào)邏輯推理技術(shù);
第3部分為學(xué)習(xí)與發(fā)現(xiàn),討論傳統(tǒng)的機(jī)器學(xué)習(xí)算法、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法、數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù);
第4部分為領(lǐng)域應(yīng)用,分別討論專家系統(tǒng)開發(fā)技術(shù)和自然語言處理原理和方法。 通過對這些內(nèi)容的講解能夠使學(xué)員對人工智能的基本概念和人工智能系統(tǒng)的構(gòu)造方法有一個(gè)比較清楚的認(rèn)識,對人工智能研究領(lǐng)域里的成果有所了解;
本項(xiàng)目采用Java語言實(shí)現(xiàn),絕對基于真實(shí)的爬蟲項(xiàng)目進(jìn)行改進(jìn)和優(yōu)化,希望進(jìn)一步提升大家的大數(shù)據(jù)項(xiàng)目經(jīng)驗(yàn)。本項(xiàng)目基本涵蓋了爬蟲項(xiàng)目的整個(gè)流程,包括數(shù)據(jù)爬蟲、全文檢索、數(shù)據(jù)可視化、爬蟲項(xiàng)目監(jiān)控、爬蟲項(xiàng)目維護(hù)等等。解決了爬蟲項(xiàng)目中遇到的棘手問題,包括破解網(wǎng)站反爬策略、網(wǎng)站模板定期變更、網(wǎng)站頻繁訪問IP被封等等問題; 技術(shù)架構(gòu):
Java、HttpClient、Redis、Solr、HBase、Zookeeper、HighChart、HTMLEmail
本項(xiàng)目主要采用目前大數(shù)據(jù)領(lǐng)域最成熟的實(shí)時(shí)計(jì)算框架Spark,它是目前主流企業(yè)在實(shí)時(shí)計(jì)算方向采用的主流框架。本項(xiàng)目使用了Spark技術(shù)生態(tài)棧中的三個(gè)技術(shù)框架:Spark Core、Spark Streaming和Spark MLlib,進(jìn)行道路交通實(shí)時(shí)流量監(jiān)控預(yù)測系統(tǒng)的開發(fā)。業(yè)務(wù)實(shí)現(xiàn)包括數(shù)據(jù)產(chǎn)生模塊、數(shù)據(jù)實(shí)時(shí)收集處理模塊、特征數(shù)據(jù)提取模塊、模型預(yù)測模塊、數(shù)據(jù)存儲模塊; 技術(shù)架構(gòu):
Spark Core、Spark Streaming和Spark MLlib
海文創(chuàng)立于2012年,是一家專注于青年人才服務(wù)領(lǐng)域的綜合型企業(yè)機(jī)構(gòu),是深受用戶喜愛的科技型人力資源服務(wù)提供商。海文通過全面引入甲骨文的技術(shù)標(biāo)準(zhǔn),現(xiàn)已分別在山東濟(jì)寧、廣西北海、貴州遵義、河北秦皇島、江蘇徐州和湖南常德建立六個(gè)與甲骨文合作的OAEC人才產(chǎn)業(yè)基地,分別在萊蕪、煙臺建立了兩個(gè)甲骨文OAEC教育解決方案中心,并在北京、上海、杭州、南京、濟(jì)南、重慶、長沙、石家莊等地建立了十多個(gè)海文互聯(lián)網(wǎng)和IT實(shí)訓(xùn)中心。
海文通過服務(wù)理念和服務(wù)模式創(chuàng)新,服務(wù)鏈、價(jià)值鏈、產(chǎn)業(yè)鏈構(gòu)建,行業(yè)人才服務(wù)全程支持平臺---海文人才、海文國際、海文在線等公共服務(wù)平臺打造,全面引入甲骨文的技術(shù)標(biāo)準(zhǔn),目前已發(fā)展成為一家以18-28歲年齡段青年、用人企業(yè)、人才研究機(jī)構(gòu)、政府及社團(tuán)企業(yè)為主要客戶對象,以自主開發(fā)的互聯(lián)網(wǎng)和IT實(shí)訓(xùn)中心及運(yùn)營平臺為依托,集教育、就業(yè)、資訊、服務(wù)、技術(shù)、解決方案等功能于一體,以線上線下相結(jié)合的方式為客戶提供人才教育及人才輸出解決方案和增值服務(wù)的技術(shù)型、平臺型、資源型、集團(tuán)型企業(yè)。
海文國際是專注于互聯(lián)網(wǎng)和IT人才培養(yǎng)與輸送的現(xiàn)代化職業(yè)教育品牌,在中國打造的互聯(lián)網(wǎng)和IT實(shí)訓(xùn)中心。目前在上海、杭州、南京、濟(jì)南、重慶、長沙、石家莊、煙臺、合肥、南昌、貴陽等地運(yùn)營面積超過20000平米,同時(shí)容納數(shù)千人培訓(xùn)。
海文國際以”求真,務(wù)實(shí)”的嚴(yán)謹(jǐn)作風(fēng),始終致力于為中國培養(yǎng)實(shí)戰(zhàn)型,緊缺型和創(chuàng)新型的信息化人才。
學(xué)校名稱:昆明海文國際IT培訓(xùn)
固定電話:400-168-8684
授課地址:昆明市西山區(qū)前興路昆明西山萬達(dá)廣場 預(yù)約參觀