端端舝

賊喝莉聆卞方月弁伕奈仿奈羲逃
2015/02/26(Thur) kada

contents
1. 弁伕奈仿奈及衙猁
2. webweb匹及魂蚚瞰
3. 灍蚾匹嬪勻凶仇午
4. 皮仿它扒正奶皿及弁伕奈仿奈

1. 弁伕奈仿奈及衙猁
弁伕奈仿奈午反ˋ
- 扑旦氾丞互web矢奈斥毛赻�挐隙仄化ロ�毛�摩允
月皿伕弘仿丞
ex. google及𨈘坰巨件斥件﹜穴奈弗氾奴件弘煦昴
憝窣仿奶皮仿伉
- anemone, nokogiri, kconv, capybara, poltergeist,
selenium-webdriver, etc...

弁伕奈仿奈及�婖
<anemone及丟奶件�I燴>
Ｋ挐隙扔奶玄及URL毛硌隅
Ｌ壺俋�砓矢奈斥及URL由正奈件毛硌隅
Ｍ挐隙�砓矢奈斥及URL毛硌隅
Ｎ龰腕仄凶矢奈斥卞�仄化﹜淏�桶政匹珨祡仄凶矢奈
斥及心�I燴
Ｏ龰腕仄凶允屯化卞�仄化及�I燴
Ｐ旦玄伊奈斥卞�允月�I燴

example
踏隙反龰腕仄凶中URL互
http://media-
radar.jp/detail****.html
及倛毛仄化中月及匹﹜�絞窒煦
毛淏�桶政匹㠙�匹五月﹝
(凶分仄挐隙及旮今反
depth_limit=>1午仄化中月)
xpath支CSS本伊弁正匹�恅賤
昴仄化手謎中﹝
??? 龰腕仄凶中URL => Ｎ卞丐凶月
??? skip仄凶中URL

2. webweb匹及魂蚚瞰
web矢奈斥及meta正弘賤昴
- description, comment及龰腕
- 挐隙仄卅仁化手龰腕匹五月�磁反nokogiri互價掛
戊奈玉伉奈犯奴件弘ㄐ

example
1. scrape丟末永玉
- 硌隅仄凶URL及HTML毛由奈旦
- xpath匹meta正弘及�恅賤昴
2. get_description丟末永玉
- meta name = ※description§及content窒煦毛必永
玄ㄐ

3. 灍蚾匹嬪勻凶仇午
- 恅趼趙仃(kconv匹幻廿賤𢜪ㄐ)
- xpath硌隅
- 伉母奶伊弁玄(open_uri_redirections匹賤𢜪ㄐ)
- proxy偞隅(湮悝匹匹五卅中orz)

4. 皮仿它扒正奶皿及弁伕奈仿奈
- anemone反白巧奈丞⻌薯卞方月賒醱腛痄?��I燴
支JavaScript及灍俴反扔禾奈玄今木化中卅中ㄐ
- 氾旦玄赻�趙及煦珧匹及皮仿它扒毛紱釬允月仿奶皮
仿伉毛魂蚚 => Capybara, Selenium

Capybara衙癩�
Capybara
DSL
Driver
Cucumber
MiniTest::Spec
Test::Unit
Rspec
Poltergeist
RackTest
Webkit
Selenium
氾旦玄白伊奈丞伐奈弁
皮仿它扒扑立亙伊奈正

統蕉�𤩸
- ☆賊喝莉聆卞方月弁伕奈仿奈羲逃撮楊★

端端舝

賊喝莉聆卞方月弁伕奈仿奈羲逃

More Related Content

賊喝莉聆卞方月弁伕奈仿奈羲逃