MawaLog

一日一日、楽しく生きる。技術と音楽が好き。

自作OSSパッケージをPYPIに登録するなど::MeCabとgensimをつかってただの文章をベクトルに変換して特徴を比較できるようにするまでのメモ

Python

Python

これも以前取り組んだことの記録なのですが、
Mecab(のラッパーのNatto.py)と自然言語処理モジュールで有名なgensimを使ってただの文章をベクトルに変換・特徴を比較できるようにするまで過程のメモになります。あんまりこの手のモジュール触ったことない人に役立つかもしれないのでリンクを貼っておきます。(特定の品詞だけ抽出などの丁寧な処理はしておらず、単に分かち書きしただけなのでざっくり流れを見るというものです) github.com

これらのメモを元に、1個自作の機械学習モジュールのラッパー分類モジュールを作ってみているので、それをいつか増強したいと思っているのですが、なかなか時間がなく・・・これです↓

pypi.python.org