How to install CMU Sphinx

CMU Sphinx は音声認識システムの構築に必要となるパッケージを、機能別に提供しています。
  • Sphinx4 - Java言語で書かれた調整可能、変更可能な音声認識プログラム
  • Pocketsphinx - C言語で書かれた軽量な音声認識プログラム
  • Sphinxbase - Pocketsphinxが使用するコアライブラリ
  • CMUclmtk - 言語モデルツール
  • Sphinxtrain - 音響モデルトレーニングツール

Sphinx4のインストール

ハードウェア要件

Sphinx4 は実行時にかなりのリソースを消費します。1GB以上のRAMと、Intel Pentium 4クラス以上のCPUの使用をお勧めします。(Sphinx4 はMac OS-X, Win32, Linux/Unixでテストされています。)[[BR]]

また、入力音源として外部からの音声を使用する場合は、別途PC用マイクが必要です。(WAV形式などのファイルからも音声認識できます。)[[BR]]

必要なソフトウェア

Sphinx4 をビルドするには、以下のソフトウェアが必要です。
インストールを開始する前に、必要なソフトウェアをセットアップしてください。
  • JDK(Java Development Kit) 6 以降
    Oracle社のサイト から最新版のJDKを入手し、インストーラに従ってインストールして下さい。
  • Ant 1.6.0 以降
    ant.apache.org よりダウンロードできます。サイトにAntのインストール方法や使い方の説明がありますので、その内容に従ってインストールして下さい。
  • Subversion (SVN)
    リリースバージョンではなく最新のソースでビルドしたい場合は、[https://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/truhttps://cmusphinx.svn.sourceforge.net/svnroot/cmusphinx/truSVNリポジトリ

インストールの前に

Sphinx4 はバイナリ版とソースコード版がリリースされています。
インストール作業を行う前に、どちらをダウンロードするかを用途によって判断してください。[[BR]]

  '''snx4-{version}-bin.zip (バイナリ版)'''
  実行ファイル(JAR), ドキュメント, デモプログラムが含まれています。
  '''snx4-{version}-src.zip (ソースコード版)'''
  ソースコード、ドキュメント, デモプログラム、単体/回帰テストのソースが含まれています。[[BR]]

  __バイ版が必要なケース__
  • Sphinx4 のデモを実行してみたい。
  • Sphinx4 の実行ファイルのみが必要で、ソースコードは触らない。
  __ソーード版が必要なケース__
  • 全てのソースコードを取得して、Sphinx4 がどのように動くかを理解したい。
  • ソースの状態からビルドしたい。
  • 単体/回帰テストを実行したい。
  • 音声認識アプリケーションを開発したい。
ここでは '''ソースコー のインストール方法を説明します。

インストール手順

  1. Sphinx4 (ソースコード版) のダウンロード
    Sphinx4 (ソースコード版) の最新バージョンを以下のURLからダウンロードします。
    http://osdn.jp/projects/sfnet_cmusphinx/releases/

  2. ダウンロードしたファイルを解凍
    ダウンロードしたファイルを、jarコマンドで解凍します。
    > jar xvf sphinx4-version-src.zip
    "sphinx4-{version}" というディレクトリが作成されます。[[BR]]

  3. JSAPIを作成
    Sphinx4 の実行には「Java Speech API(JSAPI)」が必要ですが、ライセンスの関係でJava Speech APIのJarファイルが同梱されていないので、ここで作成します。
    Windowsの場合は lib/jsapi.exe、Unix/Linuxの場合は lib/jsapi.sh を実行するとjsapi.jarが作成されます。[[BR]]

  4. ビルドの実行
    "sphinx4-{version}" ディレクトリで、コマンド 「ant」 を実行します。
    > ant
    これにより、Sphinx4 のビルドが始まります。[[BR]]

    「BUILD SUCCESSFUL」のメッセージが出れば、ビルド完了です。
    bldディレクトリにクラスファイル、libディレクトリに Sphinx4 本体(sphinx4.jar)、binディレクトリにデモプログラムのJARファイルが作成されています。

動作確認

 __クからの音声認識テスト__[[BR]]

  1. パソコンにマイクをセットしてください。[[BR]]

  2. "sphinx4-{version}" ディレクトリで、以下のコマンドを実行します。
    > java -Xmx256m -jar bin/HelloWorld.jar

    下記が表示され、音声入力モードになります。
    Loading...
    Say: (Good morning | Hello) ( Bhiksha | Evandro | Paul | Philip | Rita | Will )
    Start speaking. Press Ctrl-C to quit.

  3. マイクに向かって 「Good Morning Paul」 と話してください。
    「You said: good morning paul」''' されれば、正しく音声認識できています。
    音声入力モードを終了するには 「Ctrl-C」 を押します。[[BR]]

 __Vファイルからの音声認識テスト__
  1. "sphinx4-{version}" ディレクトリで、以下のコマンドを実行します。
    > java -jar bin/Transcriber.jar

    下記が表示されれば、正しく音声認識できています。
    one zero zero zero one
    nine oh two one oh
    zero one eight zero three