狠狠撸

狠狠撸Share a Scribd company logo
aozorahackと
青空文庫の
現状とこれから
2016/02/27
株式会社達人出版会 / aozorahack
高橋征義
自己紹介
●
高橋征義
●
株式会社達人出版会代表
●
一般社団法人日本Rubyの会代表
●
OSS的には主にRubyで活動
●
Re:VIEWコミッタ
●
textlint試用中
本日のお话
本日のお话の流れ
●
aozorahackと青空文庫(+本の未来基金)
●
现状のしくみと課題
●
理想形
●
OSCなので、というわけでもないけどOSS化
●
理想の実現に向けて
●
さらなる展開と今後
●
まとめ
aozorahack
と青空文庫
(+本の未来基金)
それぞれ独立して活動
青空文庫
本の未来基金 aozorahack
それぞれ独立して活動
●
青空文庫
「青空文庫は、誰にでもアクセスできる自由な電子
本を、図書館のようにインターネット上に集めよう
とする活動です。」
●
本の未来基金
「青空文庫の今後の活動支援等の原資として、広く
賛同者から寄付を募り、「本の未来基金」を創設し
ます。」
●
aozorahack
「青空文庫をハックしたい人、募集中。」
aozorahackの組織形態
●
青空文庫をハックしたいプロジェクトの集まり
●
代表とかは置いてない
●
平たく言うと「青空文庫関連のリポジトリのための
Organization(github的な意味で)」
●
難しく言うと「技術コミュニティのコミュニティ=
メタコミュニティ」
●
各プロジェクトの運営はプロジェクト(リポジ
トリ)ごとにお任せ
●
何かあったら本の未来基金と連携
●
aozorahack.orgは本の未来基金が提供
●
青空文庫の運営にも基本関わってない
青空文庫
本の未来基金 aozorahack
資金?
サポート
協力
技術
现状のしくみ
と課題
?注意?
現状はもろもろ未定で、この発表
で話した内容が実現するかどうか
はまったくの白紙です。
単純に「こうなるといいなあ」と
いう理想(願望)を反映させたも
のだとご理解ください。
青空文庫とは
何なのか
青空文庫≒図書館?
●
ある意味ではそうだけど、それだけではない
●
入力をする人がいる
●
校正をする人がいる
●
書誌情報とURLをリンクさせる
●
?一種の「出版(者|社)」でもあるのでは
●
新しいコンテンツを「創作」していなくても
publishingはしている
●
新しい翻訳作品が公開されたりもする
青空文庫≒図書館+出版(者|社)
●
図書館的な機能
●
著作権切れ等の自由に配布できるコンテンツを公開
する
●
?静的ファイルの配信サービス的なもの
●
出版(者|社)的な機能
●
入力?校正の状態を管理する
●
入力済み?校正済みのファイルを管理する
●
?機能としてはCMS的なもの
现状のしくみ
现状のしくみ
公開コンテンツ
(静的ファイルツ)
入力?校正管理
(CMS+状態管理)
公開Webサーバ
(レンタルサーバ)
管理用Webサーバ
(自前物理サーバ)
図書館部分
出版部分
现状のしくみ
公開コンテンツ
(静的ファイルツ)
入力?校正管理
(CMS+状態管理)
公開Webサーバ
(レンタルサーバ)
管理用Webサーバ
(自前物理サーバ)
←現状はそんなに
 問題はなさそう
?静的ファイルのみ
?サーバ管理不要
?アクセスは余裕あり
现状のしくみ
公開コンテンツ
(静的ファイルツ)
入力?校正管理
(CMS+状態管理)
公開Webサーバ
(レンタルサーバ)
管理用Webサーバ
(自前物理サーバ)
←こっちが問題
现状のしくみ
DBファイル
?? ?
耕作員 点検グループ
公開サーバへ
HTML生成
バッチ
管理用アプリ
现状の课题
現状の具体的な課題
●
サーバの代替機がない
●
データ等のバックアップがあってもそこ
からリストアする先が確保されていない
●
サーバの監視がない
●
異常があるかどうかを検出するしく
み?事象発生時の一次対応等のワーク
フローがない
●
技術的な活動に難がある(らしい)
●
(ここは詳しくないのでパス)
aozorahack
からみた課題
aozorahackからの課題
●
手が出せない
●
仕様が公開されていない
●
実装も公開されていない
●
全体として1つのアプリとして制作され
ているので改修するとしても全体に手を
入れる必要がありそう
●
個人情報も抱えているのでいきなりもろ
もろ大公開、みたいなことはできない
●
要するにhackできない?
ここまでのまとめ
●
青空文庫
●
物理サーバは変えないとまずそう
●
監視とかもされていないのもまずい
●
そういう話を進められる人がいない
●
aozorahack
●
青空文庫本体がhackできないのは
うれしくない
– 青空文庫のコンテンツはhackできるけど
まとめて解決
していきたい
理想形
理想形
●
青空文庫で使われているアプリ
ケーションやサービスがOSS
になる
●
青空文庫の開発プロセスが
OSSのバザール開発的になる
?開発コミュニティによる開
発?運用が行われるようになる
これが理想形の理由
●
特定の企業?サービス?人に依
存しなくて済むから
●
青空文庫は大抵の企業やサー
ビスや個人よりも長い寿命が
期待されている
–移行コストを最小限にする
●
青空文庫ぽい気がするから
aozorahackの理想形
●
青空文庫開発?運用コミュニティ(の一
部)になる
●
全部になる必要はない
●
青空文庫そのものに関わらない人たち
も巻き込みたい
●
青空文庫以外への応用もぜひやるべき
●
実際にはしばらく過渡期が続く
●
気長に進めるしかない
理想の実現に
向けて
まずやること
●
サーバ移転する
●
せめて監視入れる
●
aozorahackが手を入れられ
る部分を作る
●
「出版部分」と「図書館部
分」を切り分ける
●
「図書館部分」をハックする
サーバの移転
●
VPSかクラウド
●
物理的な管理はしなくて済むように
●
諸事情により国内に置きたい
●
実作業等は本の未来基金+高橋が
協力する方向で検討していただい
ているところ
監視
●
普通に監視サービスを使う?
●
あとバックアップとかも
现状のしくみ
DBファイル
?? ?
耕作員 点検グループ
公開サーバへ
HTML生成
バッチ
管理用アプリ
機能の切り分け
●
DBのサブセット(公開DB)を作る
●
公開用データのみを入れる
– テーブル単位、あるいはカラム単位で削る
– 個人情報等は入ってないようにする
●
常にDB本体と同期をとる
機能の切り分け
●
公開DBから公開コンテンツを生成でき
るプログラムを用意する
●
図書カードとか作品別作家リストとか
●
現状の生成プログラムでほぼいけるはず
公開DB
HTML
新しいしくみ
DBファイル
?? ?
耕作員 点検グループ
公開サーバへ
HTML生成
バッチ
管理用アプリ
公開DB
さらなる展開
●
aozorahackで公開コンテンツ生成プ
ログラムをOSSで作り直す
●
機能の追加?拡張
●
見た目の修正
●
JSONとかも
公開DB
HTML
今後の展開に向けて
●
工作院プロジェクト
●
aozora.json
●
aozoraflow
●
pubserver
●
specs
●
aozora2html
理想形
●
青空文庫の開発プロセスが
OSSのバザール開発的になる
?開発コミュニティによる開
発?運用が行われるようになる
?「文化」の導入
文化の醸成
和田卓人「組織にテストを書く文化を根付かせる戦略と戦術」
http://www.slideshare.net/t_wada/test-strategy-and-tactics
文化の醸成
●
OSSは「技術」でもあり「文化」でもある
●
後者も導入できないと失敗しやすい
●
青空文庫を技術的に支えるために、OSSの
技術と文化を輸入したい
●
長い時間をかけてこれから文化を育ててい
きたい
●
そのための下地作りを本の未来基金と行
い、aozorahackに渡していければ理想的
まとめ
●
青空文庫入力?校正管理サーバはお引っ越しする
(予定)
●
公開版DBを用意する(予定)
●
青空文庫の公開用HTMLの生成プログラムはOSS
にしたい(願望)
●
ついでにHTML以外もいろいろ吐き出せると便利
そう(妄想)
●
その他いろいろ活動しましょう(希望)
●
続きはハッカソンで!

More Related Content

aozorahackと青空文庫の現状とこれから (OSC 2016 Tokyo/Spring)