端端舝

Apache Cassandra午 Apache Spark匹釬
月犯奈正賤昴皿仿永玄白巧奈丞
絁宒頗扦INTHEFOREST

赻撩畿賡
�泬睿苠ㄗ@railuteㄘ
絁宒頗扦␉␎␔␈␅␆␏␒␅␓␔ 測桶龰�砢扦墿
Cassandra妀蚚扔禾奈玄﹜Cassandra戊件扔伙氾奴件弘坻
Python窃7爛﹜郔輪反Java互笢陑﹝
PHP﹜Ruby﹜JavaScript﹜Perl﹜C反𦲀�磊歠衄曰﹝
�意ㄩ掛�反␄␂?奶件白仿炵巨件斥瓦失
眕ゴ﹜議伊旦玄仿件扔奈民及␄␂␁
詢�盡?湮⺍講?湮�耀及OracleRAC午PostgreSQL午
MySQL卞賴仄戶日木適仃凶磊歠丐曰﹝
郔輪及玄伊件玉反井勾化及�馴☆庲眭砩庤�★毛矛奈旦卞仄凶
␎␌␐

Agenda
IoT及犯奈正午反
Cassandra及癶梢俶
Spark及薯
引午戶

IoT犯奈正午反
IoT午M2M
Internet of Things
Machine to Machine
穴扑件汁奈穴扑件ㄗMachine-to-Machineㄘ午反﹜
戊件疋亙奈正生永玄伐奈弁卞�互木凶辻迮肮尪
互�嶲毛賡婓六內卞眈誑卞ロ�蝠𡥼仄﹜赻�
腔卞郔羥卅秶郘互俴歹木月扑旦氾丞毛硌允﹝
珨砩卞舑�e褫夔卅☆手及★互奶件正奈生永玄/弁
仿它玉卞諉適今木﹜ロ�蝠𡥼允月仇午卞方曰眈
誑卞秶郘允月帊瞎心匹丐月

IoT犯奈正午反
瞰ㄠ)
iBeacon
BLE(Bluetooth low Energy)毛妏尹月傷藺ㄗ旦
穴奈玄白巧件卅升ㄘ毛逃陓け午仄化﹜公及傷藺及
厥勾巨伉失尺及⻌堤𨈘眭支擒褩�䛐毛俴尹月
帊瞎心ㄗ𡌂儔鎥�囀瓜申卅升ㄘ
犯奈正及俶斮ㄩ�杅℅隙杅℅�萸杅℅媆嶲
1媆嶲卞1000�及�互2隙籵綎
ID脹ㄩ100b
�萸杅ㄩ50預垀
�樓薹 1mb/h
24mb/d
720mb/m
4.32gb/hm

IoT犯奈正午反
瞰2)
Industrial Internet
宴𦲀蚚辻け午IT及⺈磁卞憝允月戊件本皿玄﹝
詢辻夔及辻け﹜腴戊旦玄及本件扔奈﹜奶件正奈
生永玄﹜申永弘犯奈正�摩?煦昴撮胍卅升毛瞎
心磁歹六嘟梤薹𨈘華卅升辻け及�薹腔卅綅
蚚毛俴丹﹝
奶件正奈生永玄
犯奈正及俶斮ㄩ本件扔奈杅℅隙杅℅�萸杅℅媆嶲
10鏃嶲卞10000�及本件扔奈互1隙籵陓
ID脹ㄩ100b
�萸杅ㄩ3預垀
�樓薹 6mb/h
144mb/d
864mb/m
5.184gb/hm

IoT犯奈正午反
0
2
4
6
8
10
12
犯奈正�樓薹
iBeacon Industrial Internet
gb

IoT犯奈正午反
𣶹懂及犯奈正賤昴
�掊𨈘偩扔件皿伉件弘
�講犯奈正
賤昴
𨈘偩
�掊汜傖
賤昴
𨈘偩
郔輪及犯奈正賤昴

伉瓦失卞旦弗奈伙允月Cassandra
50用奈玉井日300用奈玉尺及旦弗奈伉
件弘矛件民穴奈弁氾旦玄

IoT砃仃犯奈正矛奈旦午仄化及Cassandra及杻釾
? 𤩸煋心卞�中﹝
? 𤩸煋心珂互煦汃趙今木化中月及匹肮媆嗣杅𤩸煋心卞�中ㄗ鏃嶲100勀
𤩸煋心脹ㄘ
? 磐彆淕磁俶卞方月⺥�卅𤩸煋心儕僅毛腢亼褫夔
? 賤昴汁奈伙午及笒睿俶
? 嗣粗卅玉仿奶田ㄗODBC﹜JDBC﹜␐␈␐﹜␒��﹜Perl脹ㄘ
? Apache Hadoop﹜Apache Spark﹜Presto脹及嗣粗卅賤昴汁奈伙毛瞳蚚褫夔
? 穴伙民矛件母奈
? Windows﹜␌��﹜跪意弁仿它玉﹜JVM互歐�P允木壬妏蚚允月岈互堤懂引
允﹝Windows匹及妸蚚灍�手丐曰引允﹝

Spark及薯
Cassandra反筵剿𨈘坰互賴忒
RowKey矛奈旦及Consistent Hashing及鮋﹜窣適仄凶
Key互肮元用奈玉卞湔婓允月午反癹日卅中及匹窣適仄
凶薆郖及犯奈正龰腕反Cassandra�g极匹反賴忒
犯奈正賤昴反駙絞凶曰及紨棒�I燴

Spark及薯
Spark午反
詢厒卅犯奈正煦昴及凶戶及陔凶卅忒僇
Spark及杻釾
? RDDㄗResilient Distributed Dataset?�俶煦汃犯奈正本永玄ㄘ
? 祥劐ㄗ奶立亙奈正皮伙ㄘ
? 煦賃?煦汃饜离
? 奶件丟乒伉奈
? 綈晊啐�
? Hadoop窣觓
? HDFS赻�窣觓
? YARN窣觓

Spark及薯
扑旦氾丞�婖
Cassandra
Spark
Hadoop
YARN
RM﹜NN
伊件斥��囀及
紨棒�I燴
Cassandra
Spark
Hadoop
YARN
Cassandra
Spark
Hadoop
YARN
Cassandra
Spark
Hadoop
YARN
Cassandra
Spark
Hadoop
YARNCassandra
Spark
Hadoop
YARN

Spark及薯
失皿伉弗奈扑亦件
Scala﹜Javaㄗ7,8ㄘ﹜Python匹失皿伉弗奈扑亦件毛釬傖褫夔﹝
犯奈正賤昴卞羥仄凶Library毛羥媆瞳蚚允月仇午卞方曰捃厒卞𦲀�失
皿伉弗奈扑亦件毛釬傖褫夔﹝

Spark及薯
Spark及仿奶皮仿伉
? Spark Streaming
犯奈正及紨棒媆炵蹈�I燴
? Spark SQL
? SQL仿奶弁卅Query晟惤
? GraphX
? 弘仿白午弘仿白�K蹈�呾API
? MLLib
? 辻迮悝�失伙打伉朮丞API

Spark及薯
? Spark Streaming
犯奈正及紨棒媆炵蹈�I燴
Spark Streaming with Cassandra
末奈扑乓伙
旦玄伉奈丞
Spark
Streaming Cassandra
store
Hello World
Hello
World
Hello
World
↗傻媆嶲及ShortBatch毛紨棒灍俴褫夔﹝

Spark及薯
? Spark SQL
SQL仿奶弁卅DSL晟惤
Spark SQL with Cassandra
Spark SQL Cassandra
var rdd = cc.sql("SELECT * from test2.words a join
test2.phrase b on a.word = b.phrase")

Spark及薯
←奶件正仿弁氾奴皮
spark-shell
Spark砃仃Scala蚚及奶件正仿
弁氾奴皮扑尼伙﹝Scala匹公及
�匹伕斥永弁毛灍俴褫夔
SparkSQL手灍俴褫夔﹜奶件正
仿弁氾奴皮卅犯奈正�中磁歹
六互褫夔﹝

Spark及薯
? GraphX
弘仿白午弘仿白�K蹈�呾API
GraphX with Cassandra
GraphX CassandraCassandra
末奈扑乓伙弘仿白賤昴?氾平旦玄賤昴卅升

Spark及薯
? MLLib
? 辻迮悝�失伙打伉朮丞API
MLLib with Cassandra
Data types
Basic statistics
summary statistics
correlations
stratified sampling
hypothesis testing
random data generation
Classification and regression
linear models (SVMs, logistic regression, linear regression)
naive Bayes
decision trees
ensembles of trees (Random Forests and Gradient-Boosted Trees)
isotonic regression
Collaborative filtering
alternating least squares (ALS)
Clustering
k-means
Gaussian mixture
power iteration clustering (PIC)
latent Dirichlet allocation (LDA)
streaming k-means
Dimensionality reduction
singular value decomposition (SVD)
principal component analysis (PCA)
Feature extraction and transformation
Frequent pattern mining
FP-growth
Optimization (developer)
stochastic gradient descent
limited-memory BFGS (L-BFGS)
郔陔匹反失伙打伉朮丞及杅互跡僇卞�尹引仄凶﹝
湮講卞凶戶月↙辻迮悝�
仇及瞎磁六卞郔羥
Tweet 3000勀璃及Clustering卅升

Spark及薯
Cassandra
Spark
Hadoop
YARN
灍蕣及扑旦氾丞�傖
fluentd
Cassandra
Spark
Hadoop
YARN
Cassandra
Spark
Hadoop
YARN
Spark + Cassandra
弁仿旦正奈
Cassandra
Spark
Hadoop
YARN
Spark
JobServer
Web
Server
Batch
Server

引午戶
? IoT犯奈正反惇逃仄支允中
? Cassandra反湮�耀犯奈正及奪燴卞笒睿俶互丐月
? Cassandra反犯奈正旦玄伊奈斥卅及匹辻夔公及手及反今幻升嗣仁卅中
? Spark反Cassandra及逋曰卅中午仇欠毛奻忒卞娗勻化仁木月﹝

端端舝

Apache cassandra午 apache spark化?釬月氾?奈正賤昴白?仿永玄白巧奈丞

Recommended

More Related Content

What's hot (20)

Viewers also liked (6)

Similar to Apache cassandra午 apache spark化?釬月氾?奈正賤昴白?仿永玄白巧奈丞 (20)

More from Kazutaka Tomita (11)

Apache cassandra午 apache spark化?釬月氾?奈正賤昴白?仿永玄白巧奈丞