狠狠撸
Submit Search
用言等换言辞书の构筑
?
0 likes
?
694 views
长冈技术科学大学 自然言语処理研究室
Follow
吉倉 孝太郎. 用言等换言辞书の构筑. 長岡技術科学大学課題研究報告書 (2013.3)
Read less
Read more
1 of 13
Download now
Download to read offline
More Related Content
用言等换言辞书の构筑
1.
電気系 山本研究室 09319689
吉倉 孝太郎
2.
換言:ある言語表現を別の言語表現に変換する処理 犬と散歩する →
犬と歩く 散歩すると歩くは換言可能な対である このような換言可能な対を集めることで ?文章の平易化 ?語彙の制限による処理精度の向上
3.
?シソーラス(上位下位関係を使って換言) ?国語辞書の語釈文 などを用いて換言処理を行なっている
→これらの換言が人間の感覚に沿った換言 となっているかどうか検討されていない
4.
人間の感覚に沿った平易な換言を行いたい →現状、人間の感覚に沿った換言を行うための →言語資源は存在しない
→本研究では人間の感覚に沿って平易に →換言することの出来る言語資源を構築する
5.
?換言対象語は形態素解析器JUMANから抽出 ?換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 ?なるべく平易な表現に換言する
?换言にはシソーラスや国语辞书等は利用しない
6.
換言の流れ:例として動詞”和える”を利用 ①”和える”を使った例文を考える ごまと和える
②”和える”と置き換えて意味の通じる語を考えて換言 ごまと和える → ごまと混ぜる ③”和える”と”混ぜる”は換言可能として辞書に追加 和える-混ぜる の対を取得
7.
効率良く構築するため以下の場合換言しない ?より平易な表現が思いつかない →投げる、言う、話す
など ?換言するときの必要語数が多い →一進一退する など ?意味が明確に分からない →笑み割れる、かがる など
8.
品詞 換言対象語数 換言対作成数
無記入数 動詞 3,608語 3,206語 481語 サ変名詞 5,627語 4,494語 1,141語 形容詞 2,335語 1,851語 496語 副詞 1,243語 785語 463語 合計 12,813語 10,336語 2,585語 →およそ13,000語の単語を換言して 約10,000語の換言対を得られた
9.
?無記入としたものについて 換言困難と判断したものがおおよそ3分の1 理解できない換言対象語がおおよそ3分の2となった
→無記入の妥当性や理解できないものへの対策 今回構築した辞書を用いて換言出来るようになった →実際に換言を行った結果を考察し、 →辞書に反映させることで辞書の質を向上させる
10.
ご清聴ありがとうございました。
11.
?多義性がある語の換言 複数文脈に使われる可能性のある語を換言する場合 それぞれについて換言を行う。
例:仰ぐの場合 空を仰ぐ → 空を見る 師匠を仰ぐ → 師匠を尊敬する 指示を仰ぐ → 指示を求める この場合、仰ぐの候補は3つ全て追加することになる
12.
?格変化を伴う換言 換言する際に格関係を修正する必要がある場合がある 例:背く
上司に背く → 上司に裏切る →不適切 上司に背く → 上司を裏切る →適切 この場合「に背く」を「を裏切る」へと換言することになる
13.
?慣用的表現 複数形態素の一部に換言する語が含まれている 例:入れる
ギターを手に入れる →入れる単体での換言は不可 →ギターを得るへの換言は可 この場合、手に入れるはまとめて得ると換言する
Download