joppot

コピペで絶対動く。説明を妥協しない

mac unix

MacにMacPortsを使ってmecabを入れる

投稿日:2013年12月8日 更新日:

Pocket

ピングドラムの回想電光掲示板

概要

みなさんこんにちはcandleです。形態素解析エンジンmecabをmacに入れてみましょう。

mecabは日本語を分析し、名刺や形容詞などの種類に分けたりできる便利なソフトです。
よく使われる例ではtwitterと連動して、つぶやきの傾向を解析したり、自然言語を話せるAIの作成など、幅広い分野で使われます。

前提

1,MacPortsが予め入っている事
2,Linuxコマンドが最低限使える

MacPortsでmecabを探す

次のコマンドをうって、macportsにmecabのパッケージがあるか確認しましょう。

$port search mecab

様々なmecabに関するパッケージが現れます。その中に、mecabと堂々と書いてあるものがあります。それをインストールします。

ターミナル — bash — 112×38-3

mecabをインストールする

sudoコマンドとmacportsのインストールコマンドを掛け合わせたコマンドを打ち込みます。

sudoは権限を与えて実行するという意味です。特に、macのシステムに関わるときはこれを入れておくと無難に動きます。

$sudo port install mecab

問題なくインストールできたでしょうか?

mecabの辞書を探す

もしも、あなたのターミナルがeucの文字エンコーディングを使っているなら、直ぐにmecabが使えます。最後まで飛んでください。しかし、多くのターミナルはutf8を使っていると思います。もしも、utf-8を使っているならばこの作業を行ってください。

次に、辞書をインストールします。mecabは辞書を参照して、解析をしているので、辞書がなければなりまんせん。初期設定ではeucの文字エンコーディングの辞書が入っていますが、utf-8の文字エンコーディングの方が使用率が高いので、utf-8対応の辞書をインストールします。先ほどと同じように、

$port search mecab

と打ち込むと、様々なmecabのライブラリがでてきます。その中に、

mecab-ipadic-utf8 @2.7.0-20070801 (textproc, japanese)
    ipadic of utf8 encoding for MeCab

があります。

ターミナル — bash — 112×38-4

utf-8のパッケージがあるのを確認しました。

mecabの辞書mecab-ipadic-utf8をインストール

mecabを入れた要領で、

$sudo port install mecab-ipadic-utf8

インストールする。

mecabの設定フィアルを探す

utf8の辞書をインストールしても、設定しない限りはeucの辞書のままです。

mecabが使う辞書を mecab-ipadic-utf8に変更すします。

変更するにはmecabrcファイルを編集します。もしも、OSがlionの場合はおそらくルートディレクトリのoptディレクトリ以下に保存されていと思います。

mecabrcをfindコマンドで探してみよう。一般的にファイルを探すときは下のコマンドを打ちます。

$find 探したいディレクトリ名 -name "ファイルのキーワード"

optディレクトリ内にあると予想して mecabrcを探すには

$find /opt/ -name "mecabrc"

になります。
図を見て分かるようにopt以下にmecabrcがあることがわかります。
ターミナル — bash — 99×43

もしも見つからない場合は、探すフォルダをoptではなくusrかetc、varで検索してみましょう。

見つけたらmecabrcがあるディレクトリに移動します。

$cd /opt/local/etc/

ターミナル — bash — 99×41

mecabrcの編集

それではmecabrcのファイルを編集します。
私はemacsを使っていますがエディタは何でも平気です。

$sudo emacs mecabrc

設定ファイルを見ると辞書のパスがsysdicになっています。

ターミナル — emacs — 99×41

ipadic-utf8に変更します。

dicdir = /opt/local/lib/mecab/dic/sysdic

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ 

dicdir = /opt/local/lib/mecab/dic/ipadic-utf8


ターミナル — emacs — 99×41-1
mecabrcファイルを保存します。

mecabを使ってみる

以上で設定は終わりです。
ターミナルにmecabと打ち込みます。

$mecab

mecabと打ち込んだら、続けて日本語の文書を書き込みましょう。

試しに「私は今朝コーヒーを飲んだ」と打ち込みましょう。
無事に日本語が解析されれば成功です。

ターミナル — mecab — 111×49


まとめ

macにmecabを入れてみました。mecabは様々な使い方ができる面白いソフトなので、色々調べて使っていくと良いと思います。このサイトでも今後紹介できればと思っています。

スポンサードリンク

「為になったなぁ」と思ったら、シェアお願いします。

-mac, unix
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

Git diffで新規作成したファイル情報を表示させる

概要 みなさんこんにちはcandleです。今回はgitのdiffを使ってどの様なファイルが作成されたか確認する方法を紹介します。 gitのdiffは一般にファイルの差分を表示させたりするために使うもの …

userstyles.orgにある「原宿」テーマをsafariのstylishに適応する

概要 みなさんこんにちはcandleです。今回はuserstyles.orgにある原宿バージョンのテーマをsafariに適応していきます。 前提 safariを持っていること stylishがインスト …

Mac OS MavericksにX11(Xquartz)をインストールする

概要 みなさんこんにちはcandleです。今回はX11のインストールを行います。MavericksからかMountain Lionからか忘れましたが、MacではX11が標準でインストールされなくなりま …

ターミナルに奇麗な色をSolarizedで付ける(一般的な方法)

概要 重要なことなので最初に書いておきますが、marveriksではsolarizedの公式サイトで配布しているテーマの色がうまく反映されません。 2013年12月23日現在未だ不調です。 しかし、来 …

Mac OSで使われているポート番号を確認する(portsscan)

概要 みなさんこんにちはcandleです。今回はMacで使われているポートの確認方法を紹介します。 ポート番号とはパソコンがインターネット(とは限らないのですが)、外部からのアクセスを受け付けている番 …

  • English
  • 日本語

プロフィール


ベンチャー企業のCTOをやってます。大学時代にプログラミングを始め、javaから入門し、C++へて、PHPへと進み、会社ではRailsを使用。自動化が大好きなプログラマー

スポンサードリンク

アーカイブ