Fujitsu The Possibilities are Infinite

 

Inspirium 音声合成ライブラリ V3.0

新たな最適化素片複合方式による自然な読み上げを実現

仕様

方式 OS CPU 言語辞書
(size)
波形辞書
サンプリング(size) 声種
高品質版 μITRON, Windows Vista/ XP/2000/CE, Linux ARM, IA32, FR-V, SH 17万語 (1.5Mbytes) 8.00kHz(18Mbytes)
16.00kHz(35Mbytes)
22.05kHz(50Mbytes)
標準:男声1種、女声2種
追加(男2種、女3種)可
省資源版 8.00kHz(3.2Mbytes)
16.00kHz(6.5Mbytes)
標準:男声1種、女声2種

言語辞書・波形辞書のサイズについては、カスタマイズの内容によって変動します。

API仕様(概要)

Inspirium音声合成ライブラリは、言語処理APIと音響処理APIから構成されます。以下、各APIを簡単に紹介します。

注: API仕様の記載内容については、予告なく変更することがありますのでご了承ください。


言語処理API

種別 概要
言語処理オブジェクトの生成と破棄
  • 言語処理オブジェクトの生成
  • 言語処理オブジェクトの破棄
言語処理
  • 表音文字列への変換
  • ライブラリが確保したメモリ領域の解放
パラメーターの処理 以下のパラメーターの取得と設定
  • 英字列読みモード
  • 数詞読みモード
  • 区切りモード
  • 記号読みモード
  • 文書コマンドモード
辞書関連の処理
  • ユーザー言語辞書の変更
  • ユーザー言語辞書からの単語の削除
  • ユーザー言語辞書への単語の登録
  • ユーザー辞書に登録された単語の検索
  • 検索結果領域の解放
  • ユーザー辞書の形式チェック

音響処理API

種別 概要
音響処理オブジェクトの生成と破棄
  • 音響処理オブジェクトの生成
  • 音響処理オブジェクトの破棄
音響処理
  • 合成音声データ生成の準備
  • 合成音声データの生成
  • 合成音声データ生成の終了
パラメーターの処理 以下のパラメーターの取得と設定
  • 声の高さ
  • 発声スピード
  • 音量
  • イントネーションレベル
  • 話速変化レベル
  • 高域協調の有無

処理シーケンス

アプリケーションからAPIを使用するときの処理シーケンスを紹介します。

表音文字列の作成

表音文字列作成時の処理シーケンス

合成音声の作成

合成音声作成時の処理シーケンス

|  特長   |  事例・用途   |  機能・構成   |  製品・サービス   |  仕様   |  ファイル作成ツール  |

ご相談・お見積り