狠狠撸
Submit Search
読解支援 5 19
May 19, 2015
0 likes
248 views
K
kentshioda
読解支援
Read less
Read more
1 of 13
Download now
Download to read offline
Recommended
日本语の语汇特性について
日本语の语汇特性について
AsakuraYasunobu
?
闯痴厂:フリーの日本语多数话者音声コーパス
闯痴厂:フリーの日本语多数话者音声コーパス
Shinnosuke Takamichi
?
闯痴厂:フリーの日本语多数话者音声コーパス
02 登録、フォロー
02 登録、フォロー
Yoshifumi Murakami
?
ツイッターを使った日本语教育の授业の第二回目
音声生成の基础と音声学
音声生成の基础と音声学
Akinori Ito
?
音声生成の基础と音声学 東北大学大学院情報科学研究科「学際情報科学論」スライド
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
Shinnosuke Takamichi
?
https://connpass.com/event/152316/
小学生の読解支援に向けた语釈文による换言
小学生の読解支援に向けた语釈文による换言
长冈技术科学大学 自然言语処理研究室
?
语汇の教え方、学び方
语汇の教え方、学び方
Yoshifumi Murakami
?
フエ集中日本語教育セミナー 深い処理仮説 エビングハウスの忘却曲線 間隔効果 自己関与効果 偶発的学習 心内辞書(心的辞書) 岡田式繰り返し書き取り 辞書を作って自作あなうめ Smart.fm
小学生の読解支援に向けた复数の换言知识を併用した语汇平易化と评価
小学生の読解支援に向けた复数の换言知识を併用した语汇平易化と评価
长冈技术科学大学 自然言语処理研究室
?
読解支援_2本目
読解支援_2本目
kentshioda
?
読解支援
読解支援6 5
読解支援6 5
kentshioda
?
読解支援
読解支援7 3
読解支援7 3
kentshioda
?
読解支援7/3
読解支援7 10
読解支援7 10
kentshioda
?
読解支援7/10
Naacl 読み会
Naacl 読み会
kentshioda
?
狈础础颁尝読み会
読解支援6 19
読解支援6 19
kentshioda
?
読解支援 勉强会
読解支援6 26
読解支援6 26
kentshioda
?
読解支援
読解支援7 17
読解支援7 17
kentshioda
?
読解支援
読解支援 5 26
読解支援 5 26
kentshioda
?
読解支援5/26
読解支援フ?レセ?ン 4 28
読解支援フ?レセ?ン 4 28
kentshioda
?
読解支援 4/28
読解支援_2本目
読解支援_2本目
kentshioda
?
読解支援
読解支援_1本目
読解支援_1本目
kentshioda
?
読解支援
日本語学習者の文章読解支援のための語彙制限 フ?ースター
日本語学習者の文章読解支援のための語彙制限 フ?ースター
kentshioda
?
日本語学習者の文章読解支援のための語彙制限 ブースター NLP若手の会 第10回シンポジウム
?の推し本紹介2024: 『脱?日本語なまり 英語(+α)実践音声学』
?の推し本紹介2024: 『脱?日本語なまり 英語(+α)実践音声学』
Kent Ohashi
?
自然言语処理概要
自然言语処理概要
ratchiratchi
?
自然言语処理とは何か简単にまとめたもの
自分の教科書をつくる読書会 ?001『なぜ人と組織は変われないのか』 v1
自分の教科書をつくる読書会 ?001『なぜ人と組織は変われないのか』 v1
Daisuke Kikuchi
?
DOKKAIWA Lesson 09 ws
DOKKAIWA Lesson 09 ws
Tomonari Kuroda
?
国语辞典を使った放送ニュースの名词の平易化
国语辞典を使った放送ニュースの名词の平易化
Kodaira Tomonori
?
論文紹介 美野秀弥, 田中英輝. 国语辞典を使った放送ニュースの名词の平易化. 言語処理学会第16回年次大会発表論文集, pp.760-763, 2010.
Let's write understandable Japanese! (Complete Version)
Let's write understandable Japanese! (Complete Version)
Yoshinobu Machida
?
以前に公開した「わかりやすい日本語を書こう」の完全版です。取り上げた日本語の問題をすべて解説しています。 本資料を使って札幌と仙台で勉強会を開催しました。そのときの演習結果を末尾に掲載しています。
第3回 京都外国語大学 日本語?日本語
第3回 京都外国語大学 日本語?日本語
Marie Adachi
?
2014年12月22日発表
N3 (Moji-Goi)
N3 (Moji-Goi)
Mae
?
自分の教科書をつくる読書会 ?002『ザプロフィット』 v1
自分の教科書をつくる読書会 ?002『ザプロフィット』 v1
Daisuke Kikuchi
?
More Related Content
Viewers also liked
(13)
読解支援_2本目
読解支援_2本目
kentshioda
?
読解支援
読解支援6 5
読解支援6 5
kentshioda
?
読解支援
読解支援7 3
読解支援7 3
kentshioda
?
読解支援7/3
読解支援7 10
読解支援7 10
kentshioda
?
読解支援7/10
Naacl 読み会
Naacl 読み会
kentshioda
?
狈础础颁尝読み会
読解支援6 19
読解支援6 19
kentshioda
?
読解支援 勉强会
読解支援6 26
読解支援6 26
kentshioda
?
読解支援
読解支援7 17
読解支援7 17
kentshioda
?
読解支援
読解支援 5 26
読解支援 5 26
kentshioda
?
読解支援5/26
読解支援フ?レセ?ン 4 28
読解支援フ?レセ?ン 4 28
kentshioda
?
読解支援 4/28
読解支援_2本目
読解支援_2本目
kentshioda
?
読解支援
読解支援_1本目
読解支援_1本目
kentshioda
?
読解支援
日本語学習者の文章読解支援のための語彙制限 フ?ースター
日本語学習者の文章読解支援のための語彙制限 フ?ースター
kentshioda
?
日本語学習者の文章読解支援のための語彙制限 ブースター NLP若手の会 第10回シンポジウム
読解支援_2本目
読解支援_2本目
kentshioda
?
読解支援6 5
読解支援6 5
kentshioda
?
読解支援7 3
読解支援7 3
kentshioda
?
読解支援7 10
読解支援7 10
kentshioda
?
Naacl 読み会
Naacl 読み会
kentshioda
?
読解支援6 19
読解支援6 19
kentshioda
?
読解支援6 26
読解支援6 26
kentshioda
?
読解支援7 17
読解支援7 17
kentshioda
?
読解支援 5 26
読解支援 5 26
kentshioda
?
読解支援フ?レセ?ン 4 28
読解支援フ?レセ?ン 4 28
kentshioda
?
読解支援_2本目
読解支援_2本目
kentshioda
?
読解支援_1本目
読解支援_1本目
kentshioda
?
日本語学習者の文章読解支援のための語彙制限 フ?ースター
日本語学習者の文章読解支援のための語彙制限 フ?ースター
kentshioda
?
Similar to 読解支援 5 19
(11)
?の推し本紹介2024: 『脱?日本語なまり 英語(+α)実践音声学』
?の推し本紹介2024: 『脱?日本語なまり 英語(+α)実践音声学』
Kent Ohashi
?
自然言语処理概要
自然言语処理概要
ratchiratchi
?
自然言语処理とは何か简単にまとめたもの
自分の教科書をつくる読書会 ?001『なぜ人と組織は変われないのか』 v1
自分の教科書をつくる読書会 ?001『なぜ人と組織は変われないのか』 v1
Daisuke Kikuchi
?
DOKKAIWA Lesson 09 ws
DOKKAIWA Lesson 09 ws
Tomonari Kuroda
?
国语辞典を使った放送ニュースの名词の平易化
国语辞典を使った放送ニュースの名词の平易化
Kodaira Tomonori
?
論文紹介 美野秀弥, 田中英輝. 国语辞典を使った放送ニュースの名词の平易化. 言語処理学会第16回年次大会発表論文集, pp.760-763, 2010.
Let's write understandable Japanese! (Complete Version)
Let's write understandable Japanese! (Complete Version)
Yoshinobu Machida
?
以前に公開した「わかりやすい日本語を書こう」の完全版です。取り上げた日本語の問題をすべて解説しています。 本資料を使って札幌と仙台で勉強会を開催しました。そのときの演習結果を末尾に掲載しています。
第3回 京都外国語大学 日本語?日本語
第3回 京都外国語大学 日本語?日本語
Marie Adachi
?
2014年12月22日発表
N3 (Moji-Goi)
N3 (Moji-Goi)
Mae
?
自分の教科書をつくる読書会 ?002『ザプロフィット』 v1
自分の教科書をつくる読書会 ?002『ザプロフィット』 v1
Daisuke Kikuchi
?
120817 Ondoku reading aloud
120817 Ondoku reading aloud
Tomonari Kuroda
?
Mel20140709 12key
Mel20140709 12key
youwatari
?
mel_12
?の推し本紹介2024: 『脱?日本語なまり 英語(+α)実践音声学』
?の推し本紹介2024: 『脱?日本語なまり 英語(+α)実践音声学』
Kent Ohashi
?
自然言语処理概要
自然言语処理概要
ratchiratchi
?
自分の教科書をつくる読書会 ?001『なぜ人と組織は変われないのか』 v1
自分の教科書をつくる読書会 ?001『なぜ人と組織は変われないのか』 v1
Daisuke Kikuchi
?
DOKKAIWA Lesson 09 ws
DOKKAIWA Lesson 09 ws
Tomonari Kuroda
?
国语辞典を使った放送ニュースの名词の平易化
国语辞典を使った放送ニュースの名词の平易化
Kodaira Tomonori
?
Let's write understandable Japanese! (Complete Version)
Let's write understandable Japanese! (Complete Version)
Yoshinobu Machida
?
第3回 京都外国語大学 日本語?日本語
第3回 京都外国語大学 日本語?日本語
Marie Adachi
?
N3 (Moji-Goi)
N3 (Moji-Goi)
Mae
?
自分の教科書をつくる読書会 ?002『ザプロフィット』 v1
自分の教科書をつくる読書会 ?002『ザプロフィット』 v1
Daisuke Kikuchi
?
120817 Ondoku reading aloud
120817 Ondoku reading aloud
Tomonari Kuroda
?
Mel20140709 12key
Mel20140709 12key
youwatari
?
読解支援 5 19
1.
頻出語ではなく使用者が多い語が 自然な日本語である 荒牧英治?増川佐知子?宮部真衣?森田瑞樹?保田祥 言語処理学会第19回年次大会発表論文集pp.544 547 発表者:塩田健人 1
2.
概要 ?? どういう問題を解いたのか ? o?
日本語を構成する語の集合は不明確であり、自然な日本語かど うかの明確な区切りが必要な時がある ? 例?「腐女子」「イクメン」「DVD」 ? o? 語の使用統計をもとにして、自然の日本語と不自然な日本語を 選別及び、辞書に載せるべき語かどうかの振り分け ? ?? どうやって解いたのか ? 1.? 岩波国語辞典に収載されている語を?自然な?日本語 2.? 使?用頻度度が?高い語ではなく、使?用者が多い語が?自然な?日本語 3.? ツイートを形態素解析して、出?力力された語の使?用者数が多いも のが辞書に収載されるべき?自然な?日本語とする 2
3.
分析する材料 ?? データ期間 o? 2009/11/03~2010/03/25の143日間 ??
総ツイート数 o? 約2.5億ツイート(253,482,784ツイート) ?? ユーザー数 o? 約10万人(99,964人) ?? ユーザー抽出条件 o? 毎月5ツイート以上投稿していること o? 総ツイート数が5,000以上 ?? 形態素解析にはjuman7.0を使用 o? 解析器が出力した形態素の単位を語とする 3
4.
提案?手法 ?? 解析器が出力した語wを辞書に載せるかどうかの指標 ? o?
freq(w):語wの出現頻度 ? o? Rfreq(w):語wの出現頻度の順位 ? o? user(w):語wの使用者数 ? o? Ruser(w):語wの使用者数の順位 ? ?? ベースライン ? o? 出現頻度が多いものが辞書に収載されるとする ? ?→Rfreq(w)が閾値順以内の語 ? ?? 提案手法 ? o? 使用者数が多いものが辞書に収載されるとする ? ?→Ruser(w)が閾値順以内の語 ? 4
5.
比較するベース ?? 頻度ベース:Rfreq ? Rfreq(w)
?< ?α1 ? ?? 使用者数ベース:Ruser ? Rfreq(w) ?< ?α2 ? ?? 頻度重み付け使用者数ベース:Ruser’ ? -?‐log(freq(w))?user(w) ?< ?α3 ? ?? 使用者数と頻度の比ベース:Ruser/Rfreq ? Ruser(w) ?/ ?Rfreq(w) ?< ?α4 ? ? (パラメータαを0~∞に動かす) ? 5
6.
評価尺度 ?? 出現頻度と使用者数のバランスを考える ? ??
Ruser(w) ?= ?Rfreq(w) ? 語の使用に個人の偏りがないとき ? ? ?? Ruser(w) ?> ?Rfreq(w) ? 限られた使用者のみが複数回使っている語があるとき ? ?? Ruser(w) ?< ?Rfreq(w) ? 使用者に偏りなく使われる語 ? ? ?? 以下の式によって辞書収載を判定することが出来る ?? Ruser(w) ?= ?α?Rfreq(w) ? ?? 重み定数α 6
7.
実験 ?? 対象の語 ? o?
Wikipediaの日本語エントリーの語で、Twitter上から抽出した 2.5億ツイートからさらに無作為に選んだ4,000語 ? ?? このうち2,598語は岩波国語辞典に収載 ? ?? 語の集計 ? o? 語ごとに独立に集計 ? o? 「東京大学」→「東京|大学」「東京」「大学」 ? o? 形態素境界が一致しない「京大」は× 7
8.
結果 8
9.
結果 9
10.
結果 最?大のF値 最?大の適合率率率 F値 Precision
Recall F値 Precision Recall Rfreq 0.804 0.716 0.916 0.062 0.890 0.003 Ruser 0.813 0.734 0.912 0.066 0.950 0.066 Ruser?’ 0.812 0.733 0.911 0.066 0.940 0.034 Ruser/Rfreq 0.741 0.590 0.993 0.069 0.980 0.035 10 ?Ruserは安定して高い精度を保っている ? ? ?高い精度が必要な場合はRuser/Rfreq
11.
辞書に収載されておらず、Ruser/Rfreqが低い語 11
12.
まとめ ?? 調査の限界 ? o?
使用者バイアス ? 今回扱ったTwitterユーザーは30%が東京におり、20代のユーザー が多い ? o? 環境バイアス ? キーボード/スマートフォンの入力にはIMEの語が好まれて使われ ている ? ?? 応用可能性 ? o? 特定のコミュニティで使われている語彙から学習することに よって今までより効率的な語彙学習が可能 ? o? 同じような語彙力を持つ使用者の特定も可能 ? 12
13.
まとめ ?? 使用者数順位が安定して高精度(Ruser) ? ??
一部について ? ?使用者数順位(Ruser)/頻度順位(Rfreq)比が高精度 ? ? ?? 使用者数は単語の使用頻度よりも語の辞書収載に ? ?関して重要な要因である ? 13
Download