More Related Content
What's hot (20)
PDF
2021年度 人工知能学会全国大会 第35回博三 太田?
PPTX
Dynamic Entity Representations in Neural Language ModelsShun Kiyono?
PPTX
Nl220 Pitman-Yor Hidden Semi Markov ModelKei Uchiumi?
PDF
Jsai2021 winter ppt_ota_20211127博三 太田?
PDF
最先端NLP勉強会“Learning Language Games through Interaction”Sida I. Wang, Percy L...Yuya Unno?
PDF
Logics 18th ota_20211201博三 太田?
Viewers also liked (20)
PPTX
ビジネスで使えるオープンデータの技术@ビジネス活用のためのオープンデータセミナー(2016.01.22)Ikki Ohmukai?
PPT
Brain Profile Ppt 01 10IIR?
PPTX
検索のダウンタイム0でバックアップから颈苍诲别虫をリストアする方法kbigwheel?
Similar to おとなのテキストマイニング (20)
PDF
2010 ase-automatic detection of nocuous coordination ambiguities in natural l...n-yuki?
More from Munenori Sugimura (8)
Recently uploaded (7)
PDF
础滨技术共有会2025-06-05冲顿别别辫搁别蝉别补谤肠丑の理解と実践.辫诲蹿Takuma Oda?
PDF
Forguncy 10 製品概要资料 - ノーコードWebアプリ開発プラットフォームフォーガンシー?
PPTX
Protect Your IoT Data with UbiBot's Private Platform.pptxユビボット 株式会社?
おとなのテキストマイニング
- 8. テキストマイニング
テキストマイニング( text mining )は、テキストを対象と
したデータマイニングのことである。通常の文章からなる
データを単語や文節で区切り、それらの出現の頻度や共出現
の相関、出現傾向、時系列などを解析することで有用な情報
を取り出す、
テキストデータの分析方法である。
http://ja.wikipedia.org/wiki/テキストマイニング
- 14. 英語の場合
Mankind has arrived at Jupiter for
the first time today.
日本語の場合
今日人類が初めて木星に着いたよ
。
- 15. 英語の場合
Mankind has arrived at Jupiter for
the first time today.
日本語の場合
今日人類が初めて木星に着いたよ
。
わかち書きが必要
- 17. わかち書き(形態素解析)
$ 今日人類が初めて木星に着いたよ
今日 名詞 , 副詞可能 ,*,*,*,*, 今日 , キョウ , キョー
人類 名詞 , 一般 ,*,*,*,*, 人類 , ジンルイ , ジンルイ
が 助詞 , 格助詞 , 一般 ,*,*,*, が , ガ , ガ
初めて 副詞 , 一般 ,*,*,*,*, 初めて , ハジメテ , ハジメテ
木星 名詞 , 一般 ,*,*,*,*, 木星 , モクセイ , モクセイ
に 助詞 , 格助詞 , 一般 ,*,*,*, に , ニ , ニ
着い 動詞 , 自立 ,*,*, 五段?カ行イ音便 , 連用タ接続 , 着く ,
ツイ , ツイ
た 助動詞 ,*,*,*, 特殊?タ , 基本形 , た , タ , タ
よ 助詞 , 終助詞 ,*,*,*,*, よ , ヨ , ヨ
- 39. Luigi とは
? Perl で書かれた类似検索エンジン。
? 近似型のインデックスを使っています
。
? そこそこ精度がよく高速に動作します
。
実験的なコードなので CPAN にはアップされていません
GitHub: https://github.com/miki/Luigi
Editor's Notes
- #30: 嗜好 = しこう
- #31: 嗜好 = しこう
- #40: 説明はしないで 类似検索を実現するために使っているライブラリです。