- 自然言語処理スレッド その4
313 :デフォルトの名無しさん[]:2015/06/20(土) 06:18:33.41 ID:hFZryW7a - 2.1 述語項構造に基づく共起関係のモデル化
述語項構造は, 述語とその任意個の項の関係を記述するものである. 例えば, HPSG に基づく構文解析器 Enju によると, 以下の文 An importer might be able to make payment in his own domestic currency. に関して表 1 のような述語と項の関係が得られる.Enju における述語項構造では, 動詞だけでなく任意の単語が述語として扱われる. 表 1 では, 主語と目的語に対応する 名詞句を項とする他動詞 make に加え,動詞句の付加部を構成する前置詞 in も述語 として扱われている. これにより, 様々な種類の述語を介して句と句の関係が記述される. http://www.logos.t.u-tokyo.ac.jp/~hassy/publications/nlp2015/paper.pdf
| - 自然言語処理スレッド その4
314 :デフォルトの名無しさん[]:2015/06/20(土) 07:25:49.31 ID:hFZryW7a - 3.1 よく知られている単語の抽出
スクリーニング検査の被験者は,一般的に高齢者が多く,「三単語復唱」で用いる単語には新造語や流行語 は適切ではない.これに対し,童話や童謡は,対象が幼児,児童である故に,そこに出現する単語の多くは, あらゆる年代の人間に親しみ深く,非常に認知度が高い.そこで,本研究では童話や童謡歌詞を題材とし, それらに出現頻度の高い名詞を抽出して,「三単語」の候補とすることにした. 本研究では,日本の童話 210 編,童謡 90 曲1をコーパスとして用い,そこから,出現頻度の高い名詞を自 動抽出した.抽出された名詞を日本語語彙大系2の一般名詞意味属性体系に準拠させて「食べ物」,「乗り物」, 「植物」,「動物」,「建築物」,「日用品」,「スポーツ」,「空想物」の 8 つのカテゴリに分類して格納する. これら 8 つのカテゴリは,互いに意味属性体系上の包含関係が生じないように定めた.この作業の終了後, 「三単語」に適さないと思われる名詞を手動で削除し,さらに,各カテゴリに,適切と思われる名詞を適量ずつ追加した. http://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/B4-4.pdf
| - 自然言語処理スレッド その4
315 :デフォルトの名無しさん[]:2015/06/20(土) 08:37:02.94 ID:hFZryW7a - 言語処理部とシミュレータ部を組み合わせることで、「場合の数・確率」の文章題に自動で解答する
システムを開発中であるが、現状では正答率は低い。シミュレータ部では、多くの問題タイプに対応 できるようにして、より汎用的なプログラムにする必要がある。言語処理部では、問題文を変換する パターンを増やしていき、変換可能率をあげるとともに、オブジェクトが玉でないものにも対応する必要がある。 数学確率文章題の自動解答システムの開発 http://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/B2-3.pdf これができるようになれば、東ロボは東大理3入ってるだろう。
| - 自然言語処理スレッド その4
316 :デフォルトの名無しさん[sage]:2015/06/20(土) 12:11:28.08 ID:hFZryW7a - 文章中の数箇所をワイルドカードで置き換えることによって
表現されるいわゆる文章テンプレートは, 自然言語生成の分野 で使われ, また, ワイルドカードに入る語を見ることで関係抽 出にも使われる. 次々に新しいテンプレートを増やす必要があ る場合, 人手でテンプレートを作る作業は高コストであり自動 的にテンプレートを抽出する必要がある. http://www.anlp.jp/proceedings/annual_meeting/2015/pdf_dir/D1-2.pdf
|
|