人気コラムニスト・ゼネット藺藤卓実氏によるRubyコラム「Rubyで始めよう! 形態素解析」が公開
CTC教育サービスで私が編集支援している、人気コラムニスト・ゼネット藺藤卓実氏によるRubyコラム「Rubyで始めよう! 形態素解析」が公開されました。
今日は「形態素解析」の話です。
※形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。
(WikiPedia引用:https://ja.wikipedia.org/wiki/%E5%BD%A2%E6%85%8B%E7%B4%A0%E8%A7%A3%E6%9E%90)
興味がある方はどうぞ!
###
こんにちは。 藺藤です。
最近「私たちが作っているWebサービスでも何か応用できないか」と気になっているものがあります。 それは「形態素解析」と呼ばれるものです。(*1)
形態素解析を行う実装は様々なものがあるようですが、今回はGem「natto」(*2)を使ってRubyプログラム上から形態素解析エンジン「MeCab」(*3)を利用する方法を説明します。
動作確認した環境は以下のとおりです。
・CentOS 7.0
・MeCab 0.996
・Ruby 2.3.1
・natto 1.1.0
初めに断っておきますと、申し訳ありませんがRubyコラムにも関わらず前半はRubyコードが全く出てきません。 ですが、後半の準備となる部分ですので読み飛ばさないで頂ければと思います。 それではさっそく始めましょう。
(この続きは以下をご覧ください)
http://www.school.ctc-g.co.jp/columns/masuidrive/masuidrive28.html