自作OSSパッケージをPYPIに登録するなど::MeCabとgensimをつかってただの文章をベクトルに変換して特徴を比較できるようにするまでのメモ
- 出版社/メーカー: Open Merchant Account Ltd
- 発売日: 2013/06/20
- メディア: アプリ
- この商品を含むブログを見る
これも以前取り組んだことの記録なのですが、
Mecab(のラッパーのNatto.py)と自然言語処理モジュールで有名なgensimを使ってただの文章をベクトルに変換・特徴を比較できるようにするまで過程のメモになります。あんまりこの手のモジュール触ったことない人に役立つかもしれないのでリンクを貼っておきます。(特定の品詞だけ抽出などの丁寧な処理はしておらず、単に分かち書きしただけなのでざっくり流れを見るというものです)
github.com
これらのメモを元に、1個自作の機械学習モジュールのラッパー分類モジュールを作ってみているので、それをいつか増強したいと思っているのですが、なかなか時間がなく・・・これです↓