Hitachi
お問い合わせ

既存のシステムに音声を組込み

ボイスソムリエ ネオ マリアージュ

ユーザーアプリケーションに高品位音声を
新音声合成エンジン搭載で、より自然で上質な音声を実現

「ボイスソムリエ ネオ マリアージュ」は、音声合成技術を、さまざまなユーザーアプリケーションから簡単に利用することができるミドルウェア商品です。
用意された音声合成関数により、ユーザーアプリケーションで利用している漢字かな混じりテキストデータから、高品位な音声を作成することができます。
音声合成ライブラリでの提供となるため、プログラム上でテキストデータからの音声合成が動的(自動的)に可能となります。 テキストの内容がリアルタイムで変わる音声サービスや、自社ソフトウエアに音声機能を組み込む場合に適しています。

合成音声ライブラリ「ボイスソムリエ ネオ マリアージュ」では
このような課題を解決します!

課題
  • 自社で開発しているアプリケーションに付加価値を付けたい。
  • ナレーターによる収録音声を利用したシステム開発を検討しているが、ナレーター手配や収録にコストが掛かる。
解決
  • 自社開発のアプリケーションやシステムに音声機能を追加し、「ユーザビリティの向上」「他社商品との差別化」といった付加価値を追加可能
  • ナレーションの内容が定期的に変更・追加される場合や、随時変化する情報を音声で長時間提供する場合などにおいて、ナレーターによる再収録が不要なためコスト削減が可能になります。

「ボイスソムリエ ネオ マリアージュ」の
お問い合わせ、お申し込みはこちらから!
ご不明点やご要望などもお気軽にお問い合わせください!

合成音声ライブラリ『ボイスソムリエ ネオ マリアージュ』の特長

Microsoft Visual Studioに対応

音声合成機能はマイクロソフト社のVisual C++やC#などから利用可能なライブラリ(DLL、LIBファイル)として提供

音声合成機能はマイクロソフト社のVisual C++やC#などから利用可能なライブラリ(DLL、LIBファイル)として提供します。また、Microsoft Speech API 5.3準拠のライブラリ(DLLファイル)(*1)も用意しています。
*1日本語版のみ

サンプル音声

ボイスソムリエ ネオで作成した、各言語別の高品質な音声サンプルをお聞きいただけます。

日本語の音声サンプル

音声合成サンプル(日本語)

サンプル音声ファイルダウンロード

下記リンク先から、日本語のサンプル音声をダウンロードできます。

英語(米国語)の音声サンプル

音声合成サンプル(英語)

サンプル音声ファイルダウンロード

下記リンク先から、英語(米国語)のサンプル音声をダウンロードできます。

中国語(北京語)の音声サンプル

音声合成サンプル(中国語)

サンプル音声ファイルダウンロード

下記リンク先から、中国語(北京語)のサンプル音声をダウンロードできます。

*本ページのサンプル音声は、圧縮しているため、実際と音質は異なります。

合成音声をアプリケーションプログラム上のあらゆるシーンで利用可能

プログラム中から任意の音声を作れるので、さまざまなシーンにご利用いただけます。
以下は、利用シーンの一例です。

機器や施設の状態監視通知音声に

サーバや施設などの状態監視システムと連動することで、
従来のメールや通知ランプによる警告の他に、音声による具体的情報の通知をおこなうことができます。

機器や施設の状態監視通知音声に

自社アプリケーション商品への音声機能に

自社アプリケーションに音声機能を組み込むことで、新たな付加価値を生み出すことができます。
例えば音声による操作ガイダンスや入力データの読み合わせなどに利用することで、利用者にやさしいシステムを構築することがきます。

自社アプリケーション商品への音声機能に

デジタルサイネージなどの音声ガイドに

街角の電子広告などで、従来テロップのようにテキストとして提供していた天気予報や交通情報などを自動的に音声に変換してアナウンスすることで、利用者へより効果的にアピールすることができます。

デジタルサイネージなどの音声ガイドに

公共情報の提供に

テレビ放送などの災害・緊急時のテロップを自動的に音声に変換してアナウンスすることで、視聴者へより効果的に注意を呼びかけることができます。

公共情報の提供に

ユニバーサルデザインの商品に

音声ガイダンスを付加することで、ユニバーサルデザインに配慮した、だれもが使いやすいハードウェア商品やソフトウエア商品を開発することができます。

ユニバーサルデザインの商品に

使いやすいAPI関数群

テキストデータから、音声合成結果をPCMデータとして取得することが可能です。
また、テキストデータやテキストファイルから、音声ファイルとして出力したり、PCのサウンドデバイスで再生するなどの高水準関数も用意してますので、簡単に音声合成機能を実現できます。

解析方法や発音の詳細な設定が可能

解析設定(英文字、記号や日付表現の解析方法)(*2)や、発音設定(声の大きさ、速さなど)、出力ビットレートについての詳細な設定が行えます。
*2日本語版のみ

多言語対応

日本語だけでなく、英語(米国語)、中国語(北京語)にも対応しています。
複数言語の音声作成で、より音声合成の利用シーンが広がります。

英語版の音声は、ボイスソムリエ Webデモで確認いただけます。
https://www.hitachi-solutions-create.co.jp/solution/voice/webdemo/

既存のシステムに音声を組込み「ボイスソムリエ ネオ マリアージュ 」の機能一覧

①「ボイスソムリエ ネオ マリアージュ」独自インターフェイス

音声合成を行なうアプリケーションでは、ライブラリ化されているAPI関数を利用することで、マイクロソフト社のVisualC++やC#などから音声合成処理を行うことが可能です。

音声合成API 主な機能一覧

機能 概要
音声合成エンジンの初期化/終了 音声合成エンジンを初期化・終了する。
音声合成インスタンスの生成/破棄 音声合成処理を行うための、音声合成インスタンスを生成する。
マルチスレッドで音声を合成する場合は、スレッド単位に複数生成する。
音声合成オプション値の取得/設定/初期化

音声合成における、読み解析方法、発話方法を取得/設定する。

  • 字句解析オプション
    テキストの解釈方法(記号/数字/電話番号/英字日付/英文字/ローマ字/日付/時刻/曜日/0)について指定を行う。
  • 読み解析オプション
    読み上げ方についての指定を行う。
  • 発話オプション
    発話の仕方(話速/アクセント強度/抑揚/音の高さ/音量 等)についての指定を行う。

音声合成フォーマットの取得/設定

音声合成した結果の出力サウンドフォーマットを取得/設定する。

指定可能なフォーマットは以下の通り 出力ファイル:MP4ファイル(AAC-LC形式)、WAVファイル(LinerPCM形式、μ-Law PCM形式)、ボイスソムリエ ネオ音声合成ファイル(htpn形式)

  • WAVファイルの場合
    サンプリングレート: 8,000/11,025/16,000/22,050/32,000/44,100/48,000 Hz
    量子化ビット数 :8 /16 bit (μ-law形式は8bitのみ)
    チャンネル数 :モノラル/ステレオ
  • MP4ファイル(AAC-LC形式)の場合
    ビットレート:96/128/160/192 kbps
    チャンネル数:モノラル/ステレオ

テキストデータを元に音声合成

漢字かな混じりテキストデータから音声合成を行なう。

合成結果は以下の出力が可能。

  • WAV形式の音声ファイルへ出力。
  • ボイスソムリエ ネオ形式音声合成ファイル(*.htpn)へ出力。
  • PCMデータとしてメモリ上に作成して返す。
    (PCMデータ領域は、データ利用後に解放関数を使って解放する)
  • Windowsサウンドデバイスで音声再生。

テキストデータを元に
発音記号列を作成

漢字かな混じりテキストを入力し、発音を表す独自形式の発音記号列を返す。

以下の2通りの出力が可能。

  • 入力テキスト全体を、1つの発音記号列として返す。
  • 入力テキストをワード※単位に分割し、ワード毎の入力テキストと発音記号列を返す。
※ワードとは音声合成時の、文章の最小分割単位を指します。

テキストファイルを元に
音声合成

漢字かな混じり文が記載されたテキストファイルから音声合成を行なう。

合成結果は以下の出力が可能。

  • WAV形式の音声ファイルへ出力する。
  • ボイスソムリエ ネオ形式音声合成ファイル(*.htpn)へ出力する。
  • Windowsサウンドデバイスで音声再生する。

ボイスソムリエ ネオ形式音声合成
ファイルを元に音声合成

ボイスソムリエ ネオ形式音声合成ファイルを入力し、音声合成する。

合成結果は以下の出力が可能。

  • WAV形式の音声ファイルへ出力。
  • Windowsサウンドデバイスで音声再生。

ボイスソムリエ ネオで作成した発音記号列を元に音声合成

アプリケーションタイプで作成した発音記号列※を入力し、音声合成を行なう。
※発音記号列ファイル(拡張子 .prn)に出力された文字列

合成結果は以下の出力が可能。

  • WAV形式の音声ファイルへ出力する。
  • PCMデータとしてメモリ上に作成して返す。
    (PCMデータ領域は、データ利用後に開放関数を使って開放する)
  • Windowsサウンドデバイスで音声再生する。

音声再生用論理プレーヤーの利用

作成したPCMデータを使って、Windowsサウンドデバイスで音声再生する論理プレーヤーを利用可能。
プレーヤーによる同時発音数の上限はPC環境でサポートしている数に依存。

プレーヤーでは以下の動作が可能。

  • PCMデータを使った音声を、再生/一時停止/再開/停止。
  • プレーヤーが再生中かどうかの状態を取得。
  • プレーヤーの現在の再生位置(ms)の取得。
  • ・プレーヤーが音声再生終了したタイミングで指定ハンドルへのメッセージポストを実行。

ユーザー辞書の管理

  • 音声合成に利用するユーザー辞書を、指定された辞書データファイルに変更する。
  • ユーザー辞書情報を記述したCSVファイルを元に、辞書データファイルを作成する。

定型文辞書の管理

  • 音声合成に利用する定型文辞書を、指定された定型文辞書ファイルに変更する。
※「定型文辞書」は「ボイスソムリエ ネオ」で作成。

②SAPI対応インターフェイス

「ボイスソムリエ ネオ マリアージュSAPI対応ライブラリ」は、SAPI Runtimeから「ボイスソムリエ ネオ 音声合成エンジン」を操作可能とするためのISpTTSEngineインターフェースを実装したものです。
音声合成を行うアプリケーションでは、SAPI RuntimeのSpVoiceクラスを介することで、様々な音声合成エンジンを同じ方法で操作することが可能です。

GUIコンポーネントの主な機能

「ボイスソムリエ ネオ マリアージュ X」で提供されるGUIコンポーネントは、読み変更、発音編集を行うためのGUIがWPFコンポーネントとしてライブラリ化されています。
※WPF4.0対応。利用には.NET Framework4が必要です。

「ボイスソムリエ ネオ マリアージュ」の独自インターフェースAPIと組み合わせて利用することで、発音の編集機能を持った音声合成機能付きのアプリケーションの開発が可能です。

GUIコンポーネント 主な機能一覧

コンポーネント 機能概要
読み変更コンポーネント ユーザ操作
  • 表記(漢字かな混じり文)の入力
  • 読み(ひらがな)の入力
  • スライドバーによるアクセント位置の指定
  • プレビューボタン(再生ボタン/スライダー変更時)
コンポーネント制御
  • 表示内容の設定(漢字かな混じり文/発音記号列)
  • 調査結果の取得(発音記号列/PCMデータ)
発音編集コンポーネント ユーザ操作
  • 文節区切りの追加・削除
  • フレーズ区切り(ブレス)の追加・削除、フレーズ間隔(10段階)の設定
  • アクセント位置設定
  • 文節単位のアクセント強度(10段階)の設定
  • 無声音・鼻濁音の設定(ON/OFF)
  • フレーズ単位での発話設定[話速・抑揚・声の高さ・声の大きさの変更(各10段階)]
  • Undo機能
コンポーネント制御
  • 表示内容の設定(漢字かな混じり文/発音記号列)
  • 調整結果の取得(発音記号列/PCMデータ)

「ボイスソムリエ ネオ マリアージュ」の
お問い合わせ、お申し込みはこちらから!
ご不明点やご要望などもお気軽にお問い合わせください!

参考価格

ボイスソムリエ ネオ マリアージュの参考価格です。
問い合わせはこちら

「ボイスソムリエ ネオ マリアージュ」価格表

品名 形名 価格(税別)
ボイスソムリエ ネオ マリアージュ4 P-VSN601 498,000円
ボイスソムリエ ネオ マリアージュ2 P-VSN602 438,000円
ボイスソムリエ ネオ マリアージュX4 P-VSN701 898,000円
ボイスソムリエ ネオ マリアージュX2 P-VSN702 788,000円
ボイスソムリエ ネオ マリアージュ ランタイム4 P-VSN603 198,000円
ボイスソムリエ ネオ マリアージュ ランタイム2 P-VSN604 138,000円
  • 本ソフトウェアを組み込んだ商品や作成した音声を再配布したり、商用目的で利用する場合は、別途ライセンス契約が必要です。

「ボイスソムリエ ネオ マリアージュ」年間サポートサービス価格表

ボイスソムリエ ネオ マリアージュを快適に利用していただくため、年間サポートサービスの契約をお願いしております。
サポートサービスは次の内容が含まれます。

  • メールによる各種お問い合わせ
  • 希望者へのリビジョンアップ版の無償提供
  • バージョンアップ版の特別価格での提供
品名 形名 価格(税別)
ボイスソムリエ ネオ マリアージュ4
年間サポートサービス
M-VSN601 74,700円
ボイスソムリエ ネオ マリアージュ2
年間サポートサービス
M-VSN602 65,700円
ボイスソムリエ ネオ マリアージュX4
年間サポートサービス
M-VSN701 134,700円
ボイスソムリエ ネオ マリアージュX2
年間サポートサービス
M-VSN702 118,200円
ボイスソムリエ ネオ マリアージュ ランタイム4
年間サポートサービス
M-VSN603 29,700円
ボイスソムリエ ネオ マリアージュ ランタイム2
年間サポートサービス
M-VSN604 20,700円

「ボイスソムリエ ネオ マリアージュ 外国語版」価格表

品名 形名 価格(税別)
ボイスソムリエ ネオ マリアージュ英語 P-VSI601 438,000円
ボイスソムリエ ネオ マリアージュ中国語 P-VSI602 438,000円
ボイスソムリエ ネオ マリアージュ ランタイム英語 P-VSI603 198,000円
ボイスソムリエ ネオ マリアージュ ランタイム中国語 P-VSI604 198,000円

「ボイスソムリエ ネオ マリアージュ 外国語版」年間サポートサービス価格表

ボイスソムリエ ネオ マリアージュを快適に利用していただくため、年間サポートサービスの契約をお願いしております。
サポートサービスは次の内容が含まれます。

  • メールによる各種お問い合わせ
  • 希望者へのリビジョンアップ版の無償提供
  • バージョンアップ版の特別価格での提供
  • 日本語によるお問い合わせのみとなります
品名 形名 価格(税別)
ボイスソムリエ ネオ マリアージュ英語
年間サポートサービス
M-VSI601 65,700円
ボイスソムリエ ネオ マリアージュ中国語
年間サポートサービス
M-VSI602 65,700円
ボイスソムリエ ネオ マリアージュ ランタイム英語
年間サポートサービス
M-VSI603 29,700円
ボイスソムリエ ネオ マリアージュ ランタイム中国語
年間サポートサービス
M-VSI604 29,700円

動作環境

ボイスソムリエ ネオ マリアージュの動作環境はこちら

既存のシステムに音声を組込み「ボイスソムリエ ネオ マリアージュ」の導入事例

既存のシステムに音声を組込み「ボイスソムリエ ネオ マリアージュ」の導入事例:東京スバル株式会社 様

事例01東京スバル株式会社 様

スタッフ全員に来客を音声通知、サービス提供までの時間短縮と顧客満足度の向上

原鉄道模型博物館様では、「ボイスソムリエ ネオ」で作成した音声を館内放送としてご利用いただいております。
ボイスソムリエ ネオを活用することで読み間違い防止、担当スタッフがいない場合のナレーション作成でができ、博物館運営時の音声案内作業効率化を実現しました。

関連ソリューション

簡単操作で合成音声を作成「ボイスソムリエ ネオ」

パソコン上で手軽に音声ファイルを作成したい方はボイスソムリエ ネオのページをご覧ください。
ボイスソムリエ ネオの詳細はこちら

関連キーワード