端端舝

EF犯奈正喲堤汁奈伙

𡌂儔湮悝
雈諳啥淏

DPC犯奈正毛煦昴卞妏丹卞反
? HIS卞方月扑旦氾丞趙詢

? DPC煦昴末白玄(扔奈申旦)及瞳蚚衄�

每 ARROWS/EVE/甲仿末伙????? 腴中

? 赻煦匹DB趙仄化煦昴剠蹋

旃噶啤互本立瓜奈匹
盓堔

瓟谿儂憝赻日嗨詁毛釬勻化煦昴允
月
? 丟伉永玄
每戊旦玄互井井日卅中
每煦昴卞斛猁卅蕉尹源互旯卞勾仁
每 1僅釬勻化仄引尹壬﹜肮元犯奈正毛黱隙堤允及
卞反忒嶲互井井日卅中
? 午反中勻化手
每煦昴蚚犯奈正本永玄毛釬月及卞反忒嶲午媆嶲
互井井月

瞰尹壬???
? ACCESS匹及犯奈正煦昴
? 黱堎及Data及奶件禾奈玄卞井井月忒嶲
? 煦昴仄凶中手及卞𡛟元化釬月笢嶲氾奈皮伙及
偞�
? 犯奈正毛党淏仄凶午五及船仄杸尹及忒嶲

? 黱堎𢜪引勻凶手及毛堤允OR赻煦匹詢僅卅煦昴
毛仄凶中(仄匹五月旦平伙互丐月)及匹卅中午
輥適仄卅中ˋˋ

煦昴及磐彆幻仄中手及
? 黱堎輥適仄化幻仄中手及
? 1隙井2隙犯奈正毛堤六壬坋煦卅手及

犯奈正及��
譑五
㦤逋僅

1 2 3 4 5 6 7 8 10 20
煦昴隙杅

磐彆午仄化
? 切斤勻午1隙犯奈正及煦昴磐彆毛�化心凶
中
? 丐引曰忒嶲毛井仃凶仁卅中

午中勻凶洷咡互堤化仁月﹝公丹允月午

? DB趙反醱給﹜DPC及犯奈正白央奶伙毛公及
引引妏勻化煦昴匹五卅中井卅丐???﹝

仇仇井日反旃噶啤�及�
? 公手公手旃噶咘俴及凶戶卞斛猁卅及匹﹜
ロ�扑旦氾丞ㄚ煦昴扑旦氾丞毛�慷
? 赻煦凶切互妏中支允中方丹﹜丐月中反方
曰嗣仁及傖彆互堤月方丹卞蜊謎支用它甩
它及匎搪毛筳戶化五凶﹝

旃噶啤匹及煦昴扑旦氾丞及窃妢
? 場ヽ緙�末白玄ㄗSPSS/STATA)ㄚACCESS

仇木匹反�I燴仄五木卅仁卅勻化

? 笢ヽ SQL扔奈田奈ㄚ緙�末白玄ㄚBI末白玄
每 BI末白玄ㄗQlikView/Spotfire???ㄘ

仇仇匹腕凶用它甩它支Data Management忒楊毛
本立瓜奈匹瓟�辻憝及諂�卞�啋

輪爛及旃噶啤卞云仃月梆啦腔諺枙
ㄠ
? SQL扔奈田奈匹反講毛仇卅六卅中ˋˋ
每 2009爛 F白央奶伙9�|俴
每 2010爛 E/F緙磁白央奶伙 16�|俴
每 7爛煦匹廣1000勀豖埏煦及犯奈正
每 F白央奶伙𡥼呾廣50�|俴煦

�I燴卞媆嶲互井井月﹜凶中尺氏???﹝踏爛手
引凶16�|俴煦及犯奈正???﹝準都卞丹木仄中
仃升???﹝

輪爛及旃噶啤卞云仃月梆啦腔諺枙
ㄡ
? �恅卞卅勻凶曰﹜鼠桶仄凶曰仄凶傖彆毛
釬月凶戶卞瞳蚚仄凶樓馱犯奈正及樓馱失
奶犯奴失支伕斥永弁互公及丐午云佡⻌
曰???﹝

? ㄗ丐曰互凶中仇午匹允互ㄘ爛嶲杅坋掛及
�恅傖彆﹜仇及犯奈正及釬傖伕斥永弁赻
极手岍及笢卞�瓬匹五卅中分欠丹井

掝觳1毛賤𢜪允月凶戶卞
? 踏☆反支曰★及煦汃�I燴扑旦氾丞毛妏丹仇午
卞仄引仄凶﹝
? Hadoop/Pig
? 凶仁今氏及戊件疋亙奈正毛�K蹈匹妏勻化犯奈
正互�尹化手辻第及怢杅毛�支允分仃匹賤𢜪﹝
? �I燴毛允月凶戶及旦弁伉皿玄晟惤反緙�末白
玄及旦弁伉皿玄�K心
仇木反中中午中丹仇午匹爀⻌
(�仄中掊隴反摽扴)

煦汃�I燴扑旦氾丞
? 仇木井日反BigData及媆測??
? 旦弗奈伙失永皿方曰旦弗奈伙失它玄
? SQL卅氏化嘉中﹜仇木井日反NOSQL及媆測

? 卅氏化手化反支今木化中引允
? 卅氏午中勻化手OSSㄗ左奈皿件末奈旦末白玄
它巨失ㄘ卅及匹剠�匹妏尹月

允壬日仄中﹜支反曰媆測反仇切日卞???
ㄗBy 𡌂儔及IT挌今氏ㄘ

手切欠氏
? SQL扔奈田奈毛妏蚚仄適仃卅互日犯奈正講毛
仇卅允�觳毛賤𢜪允月忒楊手丐曰引允﹝
每 SSDㄚ詢厒RAID毛妏丹
每犯奈正矛奈旦毛煦賃允月
每辻迮及俶夔毛奻仆月
? 仇切日及忒楊手旃噶啤囀匹反瞳蚚仄化中引引
匹及SQL匹鑠勻凶揃宴毛汜井允�心手支勻化
中引允﹝
? ㄗ凶分﹜仇及忒楊反湮講犯奈正毛�I燴允月凶
戶及用它甩它卅及匹﹜公仇引匹犯奈正講及卅
中瓟�辻憝及諂�卞�啋匹五月傖彆互屾卅中
匹允ㄘ

午反ˋ
? Google及價末白玄失及弁伕奈件
屜它尼
每 Google File System, MapReduce
? Yahoo Research 及 Doug Cutting庌互嶱逃
每啋〝反Lucene及扔皮皿伕斥尼弁玄
每 Apache Project
? Java匹�扴!

紼硃梯賊梗餃喝釵梗及灍俴白伕奈

<k, v>* ? <k＊, v＊>*
<k, v>*
Data Map <k＊, <v＊>*>* ? <k＊＊, v＊＊>*

Reduce Data
<k, v>* ? <k＊, v＊>*
<k, v>*
Data Map Shuffle

Reduce Data
<k, v>* ? <k＊, v＊>*
<k, v>* <k＊, <v＊>*>* ? <k＊＊, v＊＊>*
Data Map

Pig
? Hadoop毛㜳中支允仁允月立玉伙它尼失及ㄠ勾
? Pig Latin午中丹�蚚晟惤匹��g卞DWH腔卅�I
燴毛𤩸仃月方丹卞仄凶立玉伙它尼失
每 Java毛妏蚚六內卞﹜SQL腔卅晟惤匹MapReduce�I燴
毛�扴允月岈互堤懂月
每 Google匹反﹜肮�卞Sawzall午中丹旦弁伉皿玄晟惤
匹﹜MapReduce�I燴互��g卞𤩸仃月方丹卞卅勻化
中月
? Yahoo!互嶱逃
? 犯奈正及伕奈玉?磐磁支白奴伙正�I燴毛㜭卞
𤩸仃月

扑旦氾丞嶱逃及ゴ枑沭璃
? 瞳蚚氪反旃噶氪
每煦昴反赻煦及忒騻木凶末白玄匹�俴嶒悷毛靜曰殿
仄卅互日妏中凶中
每 SAS/SPSS/STATA/R脹及緙�末白玄毛妏丹ㄚ扑件
正永弁旦什日中反井仃月ㄗ燴賤匹五月ㄘ

? 磐彆犯奈正反1遞氪1伊戊奈玉及CSV犯奈正午
仄化釬傖﹜公木眕奻及樓馱反仄卅中
? Pig午中丹旦弁伉皿玄晟惤毛瞳蚚仄﹜幻仄中
犯奈正毛喲堤允月旦弁伉皿玄反瞳蚚氪互赻煦
匹釬傖允月ㄗUI毛釬日卅中ㄘ

嶱逃及衙猁
? 踏隙及喲堤?樓馱毛俴丹凶戶及UDFㄗ旦弁
伉皿玄晟惤匹妏丹憝杅ㄘ毛嶱逃仄﹜公木
毛瞳蚚仄凶釬𦲀互俴尹月方丹卞允月
? UDF匹灍政允月囀⺍
每喲堤?樓馱囀⺍毛隅膽仄凶隅膽白央奶伙互歹
井曰支允仁井仃月
每隅膽白央奶伙毛妏勻化斛猁卅伊戊奈玉毛喲堤
允月
每隅膽白央奶伙毛妏勻化弁伕旦桶毛釬傖允月
每ㄗ云引仃ㄘ゜葆犯奈正及龰曰㜳中毛㜭卞允月

GroupFilterFormat
ㄗ喲堤?摩�蚚隅膽ㄘ
? 白巧奈穴永玄
每 <弘伙奈皿靡>(<�醴靡>:[<葆樓�>, ... ], ... ), ...
? 扔件皿伙
示旦立件(642450005[1,蛁],
642450164[2,蛁],
620517902[1 ,蛁]),
伐伙白央伉件(613330003[1,嫽],
621938101[0.2,�薜])

釬傖仄凶憝杅
憝杅隅膽
Exists 硌隅仄凶恅趼互漪引木月井瓚隅允月﹝

ValueJoin 硌隅仄凶葆樓�毛 Bag 午仄化袚樓允月﹝
InnerGroup Bag 毛 Group 仄化正皿伙卞允月﹝
GetDaySpan 2勾及゜葆井日磊綎゜杅毛呾堤允月﹝

GetYearSpan 2勾及゜葆井日磊綎爛杅毛呾堤允月﹝

AddDaySpan ゜葆卞�毛樓呾仄化゜葆毛腕月﹝
Bag 笢匹�互窣適仄化中月正皿伙分仃龰曰
PickupSequenceValues
堤允﹝

�I燴厒僅
? 掛旃噶弅囀虐噫匹ㄡㄟㄟㄨ爛DPC犯奈正井
日ㄡㄟ意�最僅及犿�?�I离及灍囥及衄
剠毛ㄠ遞氪ㄠ伊戊奈玉倰卞𤩸五堤允樓馱
? �宒ㄠ廣ㄢㄟㄟ勀? F白央奶伙廣ㄨㄝ
ㄤ�|俴
怢杅 �I燴媆嶲
2 6900sec
4 3650sec
8 2080sec
16 1010sec
48 380sec

掛扑旦氾丞及踏摽
? 仇及扑旦氾丞反�I燴互DPC犯奈正卞杻趙仄
化中卅中凶戶﹜嗣�卅𡛟蚚互褫夔
每左奈母伉件弘及犯奈正
每 �赽伊本皿玄犯奈正
每 Web及失弁本旦伕弘???
? 旦弁伉皿玄及�徭互��g匹丐月仇午毛復
悵仄卅互日﹜憝杅毛�支仄化中仁﹝
? 肮元旦弁伉皿玄毛瓟�辻憝匹�晞卞ㄗ由
末戊件ㄠ怢匹ㄘ瞳蚚匹五月皿伕弘仿丞手
嶱逃笢

陔仄中煦昴末白玄及仍畿賡
? 旃噶啤匹煦汃�I燴撮胍及嶱逃毛俴勻化五
凶萵宴昜午仄化匹五凶末白玄
? 由末戊件1怢匹灍俴褫夔
? DPC犯奈正午�I燴蚚及旦弁伉皿玄毛⻌木木
壬公及�匹磐彆白央奶伙毛反五堤允﹝

嗨捩唬犯奈正喲堤?淕倛皿伕弘仿丞ㄗ籵備
Durokㄘ

嗨捩唬犯奈正喲堤?淕倛皿伕弘仿
丞
? 瓟�辻憝及☆DB趙反醱給﹜DPC及犯奈正白央
奶伙毛公及引引妏勻化��g卞煦昴匹五卅中井
卅丐???★毛灍政/手切欠氏OSS卅及匹剠蹋
ㄗ凶分仄剠悵偩ㄘ
每ㄗ蛁ㄘ卅云��g井升丹井卞勾中化反覜元源卞��
船互丐曰引允﹝
? 旃噶啤�及☆仇及犯奈正及釬傖伕斥永弁赻极
手岍及笢卞�瓬匹五卅中分欠丹井★卞勾中化
手灍政褫夔
每筍仄眕ゴ及犯奈正反恚螝卅SQL煦毛闒妏仄化釬傖
今木化中引允及匹﹜踏摽及煦昴煦井日午卅曰引允

末白玄它尼失及妏蚚源楊
? 手仄井允月午仇仇井日互掛觳
? 末白玄及⻌忒源楊
每𡌂儔湮悝瓟�磊�淉習悝及石奈丞矢奈斥井日
每酖爛僅旃噶啤及�豢𤩸DVD及笢井日

每𡌂湮及矢奈斥卞反踏井日掊隴允月扔件皿伙旦
弁伉皿玄手珨髯卞离中化丐曰引允﹝
每仇及旦弁伉皿玄反呴媆袚樓軑隅
http://plaza.umin.ac.jp/hmp/

末白玄毛蕾切奻仆月午

煦昴毛允月卞反

仇氏卅餫卞5預垀卞白央奶伙毛偞隅仄化灍俴示正件毛挹仄引允﹝

扔件皿伙旦弁伉皿玄1
? 緙磁EF白央奶伙喲堤旦弁伉皿玄
每瓟�揃埭毛手勻午手芘⻌仄凶�瓷靡及ICD10互
♀♀匹丐月遞氪及緙磁EF白央奶伙及犯奈正分仃毛
㠙五堤仄凶白央奶伙毛釬月旦弁伉皿玄

? ☆仇及旦弁伉皿玄反屾杅及遞氪今氏及犯奈正
分仃卞卅勻化中木壬赻煦匹手ㄗEXCEL井睡井
匹ㄘE/F白央奶伙及煦昴互匹五月及卞★午
佷勻化中月源卞﹜杻隅及遞氪及EF犯奈正及心
毛㠙五堤仄化白央奶伙毛釬傖允月手及匹允﹝

Master1白央奶伙及笢旯
仇及穴旦正奈卞喲堤�砓ICD戊奈玉毛1俴1仇勿勾�
徭仄引允﹝ ? 白央奶伙囀及ICD10伉旦玄
E100 毛喲堤仄化幻仄中ICD10及
E101
E102 伉旦玄卞𤩸五𡥼尹引允﹝
E103
E104
E105
E106
E107
E108
E109
E110
E111
E112
E113
E114
E115
E116
E117
E118
E119

犯奈正喲堤旦弁伉皿玄及笢旯
MASTER = load 'master.txt'; ? 仇切日反杻僇中
A = JOIN FF1 by $32,MASTER by $0; 元月斛猁反丐曰
引六氏﹝
A1 = Foreach A generate $0,$3,$9,$2;
A2 = FILTER A1 by $3==0;
B = JOIN A2 by ($0,$1,$2),EF by
($0,$1,$3);
FINALDATA =FOREACH B generate
$4,$5,$6,$7,$8,$9,$10,
$11,$12,$13,$14,$15,$16,$17,$18,$19,
$20,$21,$22,$23,$24,$25,$26,$27,$28,
$29,$30,$31,$32,$33,$34;

磐彆白央奶伙
? 堤薯白巧伙母奈卞output.txt午中丹白央奶
伙互匹五引允﹝公仇卞喲堤今木凶遞氪及
緙磁EF白央奶伙互𤩸五堤今木引允﹝
ㄗ白巧奈穴永玄反公及引引匹允ㄘ

? 丐午反云疑心匹EXCEL匹手ACCESS匹手匹
白央奶伙毛嶱中化煦昴毛俴勻化仁分今中﹝

扔件皿伙旦弁伉皿玄2
? 㻢𨃨趙侚厗掀�呾旦弁伉皿玄
每弊蕾瓷埏辻�互ⅸ傖22爛僅瓟�及斮啐�?鼠
桶芢筳岈𦲀卞云仃月霹散啐�硌㻢卞云中化鼠
桶(http://www.hosp.go.jp/7,9502.html )仄凶㻢𨃨
趙侚厗掀及�呾源楊卞價勿中化﹜赻煦及犯奈
正匹㻢𨃨趙侚厗掀毛�呾允月旦弁伉皿玄匹允﹝

妏中源
? Durok卞化緙磁EF白央奶伙?�宒1白央奶
伙?掛旦弁伉皿玄摯太穴旦正奈毛腢亼仄﹜
灍俴仄引允﹝
? 堤薯白巧伙母奈及output.txt午中丹白央奶
伙卞犯奈正互𤩸五堤今木引允﹝

堤薯犯奈正
酘井日�卞
每瓟�辻憝楓瘍
每豖埏遞氪杅
每侚厗豖埏遞氪杅
每軑䛐侚厗杅
每ㄗ灍ㄘ侚厗豖埏薹
每軑䛐侚厗豖埏薹
每㻢𨃨趙侚厗掀
每㻢𨃨趙侚厗掀及95ㄔ陓螸Е嶲奻癹
每㻢𨃨趙侚厗掀及95ㄔ陓螸Е嶲狟癹
及�卞�徭今木化中引允﹝

仇及幻井卞仇及末白玄匹匹五月
仇午
遞氪楓瘍伊本皿玄戊奈玉靡備芘迵講萸杅灍囥゜
田奶失旦疋伉件嫽ㄠㄟㄟ
1000036 610443053 1 5.8 20101220
咐
1000036 610443053 1 5.8 20101224
咐伕弘倰犯奈正井日
1000036 610443053 1 5.8 20101229
咐
1000036 610443053 1 5.8 20101229
咐
1002404 610443053 1 5.8 20100805
咐
1002404 610443053 1 5.8 20100812
咐
弘伉本左奈伙蛁ㄡㄟㄟ�
1002404 620002191 3 909 20100729
�
弘伉本左奈伙蛁ㄡㄟㄟ�
1002404 620002191 田奶失旦疋伉件 20100730
3 909 弘伉本左奈伙
�
遞氪楓瘍芘迵講� 場隙芘迵゜郔皺芘迵゜芘迵講� 場隙芘迵゜郔皺芘迵゜
1000036 4 20101220 20101229
1002404 2 20100805 20100812 6 20100729 20100730

1遞氪1伊戊奈玉倰尺及犯奈正劐𡥼

仇木匹緙�末白玄匹﹜煦昴互匹五月

1遞氪1伊戊奈玉倰及
犯奈正劐𡥼旦弁伉皿玄
? 政婓�砩皿伕弘仿丞嶱逃笢
? 扑件皿伙卞桶政匹五月旦弁伉皿玄匹仇及
�I燴互匹五月方丹卞卅月軑隅
? 醴㻢踏爛狦互皺歹月引匹﹝

? 踏及末白玄及引引匹手灍政褫夔匹允互﹜
旦弁伉皿玄互恚螝/厒僅互綈中及匹政婓鼠
嶱毛�磁歹六化中引允﹝

赻煦匹旦弁伉皿玄互𤩸五凶中
? 手切欠氏赻煦匹𤩸仁仇
午手匹五引允﹝
? ゜掛惤匹畿賡今木化中
月掛匹妏尹月手及反仇
及掛
? 3800� 450矢奈斥
? Pig及旦弁伉皿玄卞勾中
化𤩸井木化中月窒煦反
20矢奈斥丐引曰匹允﹝

? 煦汃�I燴公及手及卞鶸
庤互丐月�卞反準都卞
云允允戶匹允﹝

引午戶 DPC犯奈正毛煦昴卞妏丹卞
反
? HIS卞方月扑旦氾丞趙詢

? DPC煦昴末白玄(扔奈申旦)及瞳蚚衄�

每 ARROWS/EVE/甲仿末伙????? 腴中

? 赻煦匹DB趙仄化煦昴剠蹋

? DPC犯奈正井日眻諉煦昴毛允月
旃噶啤陔�及支曰源及枑偶

端端舝

嗨捩唬犯奈正ㄗ楚/幛白央奶伙ㄘ煦昴汁奈伙及庄賡

More Related Content

嗨捩唬犯奈正ㄗ楚/幛白央奶伙ㄘ煦昴汁奈伙及庄賡