joppot

コピペで絶対動く。説明を妥協しない

mac unix

MacにMacPortsを使ってmecabを入れる

投稿日:2013年12月8日 更新日:


概要

みなさんこんにちはcandleです。形態素解析エンジンmecabをmacに入れてみましょう。

mecabは日本語を分析し、名刺や形容詞などの種類に分けたりできる便利なソフトです。
よく使われる例ではtwitterと連動して、つぶやきの傾向を解析したり、自然言語を話せるAIの作成など、幅広い分野で使われます。

前提

  1. MacPortsが予め入っている事
  2. Linuxコマンドが最低限使える

MacPortsでmecabを探す

次のコマンドをうって、macportsにmecabのパッケージがあるか確認しましょう。

port search mecab

様々なmecabに関するパッケージが現れます。その中に、mecabと堂々と書いてあるものがあります。それをインストールします。

ターミナル — bash — 112×38-3

mecabをインストールする

sudoコマンドとmacportsのインストールコマンドを掛け合わせたコマンドを打ち込みます。

sudoは権限を与えて実行するという意味です。特に、macのシステムに関わるときはこれを入れておくと無難に動きます。

sudo port install mecab

問題なくインストールできたでしょうか?

mecabの辞書を探す

もしも、あなたのターミナルがeucの文字エンコーディングを使っているなら、直ぐにmecabが使えます。最後まで飛んでください。しかし、多くのターミナルはutf8を使っていると思います。もしも、utf-8を使っているならばこの作業を行ってください。

次に、辞書をインストールします。mecabは辞書を参照して、解析をしているので、辞書がなければなりまんせん。初期設定ではeucの文字エンコーディングの辞書が入っていますが、utf-8の文字エンコーディングの方が使用率が高いので、utf-8対応の辞書をインストールします。先ほどと同じように、

port search mecab

と打ち込むと、様々なmecabのライブラリがでてきます。その中に、

mecab-ipadic-utf8 @2.7.0-20070801 (textproc, japanese)
    ipadic of utf8 encoding for MeCab

があります。

ターミナル — bash — 112×38-4

utf-8のパッケージがあるのを確認しました。

mecabの辞書mecab-ipadic-utf8をインストール

mecabを入れた要領で、

sudo port install mecab-ipadic-utf8

インストールします。

mecabの設定フィアルを探す

utf8の辞書をインストールしても、設定しない限りはeucの辞書のままです。

mecabが使う辞書を mecab-ipadic-utf8に変更します。

変更するにはmecabrcファイルを編集します。もしも、OSがlionの場合はおそらくルートディレクトリのoptディレクトリ以下に保存されていと思います。

mecabrcをfindコマンドで探してみよう。一般的にファイルを探すときは下のコマンドを打ちます。

find 探したいディレクトリ名 -name "ファイルのキーワード"

optディレクトリ内にあると予想して mecabrcを探すには

find /opt/ -name "mecabrc"

になります。
図を見て分かるようにopt以下にmecabrcがあることがわかります。

もしも見つからない場合は、探すフォルダをoptではなくusrかetc、varで検索してみましょう。

見つけたらmecabrcがあるディレクトリに移動します。

cd /opt/local/etc/

mecabrcの編集

それではmecabrcのファイルを編集します。
私はemacsを使っていますがエディタは何でも平気です。

sudo emacs mecabrc

設定ファイルを見ると辞書のパスがsysdicになっています。

ipadic-utf8に変更します。

dicdir = /opt/local/lib/mecab/dic/sysdic

↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓

dicdir = /opt/local/lib/mecab/dic/ipadic-utf8

mecabrcファイルを保存します。

mecabを使ってみる

以上で設定は終わりです。
ターミナルにmecabと打ち込みます。

mecab

mecabと打ち込んだら、続けて日本語の文書を書き込みましょう。

試しに「私は今朝コーヒーを飲んだ」と打ち込みましょう。
無事に日本語が解析されれば成功です。

まとめ

macにmecabを入れてみました。mecabは様々な使い方ができる面白いソフトなので、色々調べて使っていくと良いと思います。このサイトでも今後紹介できればと思っています。

スポンサードリンク

「為になったなぁ」と思ったら、シェアお願いします。

-mac, unix
-,

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

mecabで文章を分かち書きする

概要 みなさんこんにちはcandleです。今回は「分かち書き」をしてみましょう。 分かち書きというのは文章を品詞毎に分ける事です。品詞とは名詞や動詞などのことです。 ちょっとみてみましょうか。 「私は …

Macのターミナルに奇麗な色をSolarizedで付ける

概要 (追記、2018年11月に書き直しました) みなさんこんにちはcandleです。 今回はターミナルに色を付けていきます。 ターミナルってデフォルトだと色と表示に迫力がありません。白地に黒文字って …

Aptana studio 3をmacにインストールする

概要 みなさんこんにちはcandleです。今回は統合開発環境のAptana studio 3の導入をやってみましょう。統合開発環境というのはプログラミングをする時様々な機能やサポートを盛り込んだエディ …

Mac YosemiteのFinderをカスタマイズして使いやすくする

概要 みなさんこんにちはcandleです。今回はfinderの設定を行い、より使いやすいfinder構成を行いましょう。 finderはプログラマーでもよく使うソフトでこれが使いにくいとストレスしかた …

macにnodenvをbrewで入れ、nodeをバージョン管理する

概要 みなさんこんにちはcandleです。 今回はnodenvを使ってmacにnodeの環境を構築したいと思います。 最近はreactの開発も活発になってきて、様々な場面でnodeを使うことが多くなっ …

  • English
  • 日本語

ベンチャー企業のCTOをやってます。大学時代にプログラミングを始め、javaから入門し、C++へて、PHPへと進み、会社ではRailsを使用。自動化が大好きなプログラマー