iRocket VoxTalker のユーザーガイド
iRocket VoxTalkerは、テキスト読み上げ、音声合成、音声クローン、音声変換、ノイズリダクション、AIによるラップ作成、 音声からテキストへの変換、録音、音声フォーマット変換、音声編集機能を備えたマルチメディアツールソフトウェアです。
テキスト読み上げ機能は100+以上の言語に対応しており、ユーザーは様々なパラメーターを調整してテキストを好みの声に変換することができます。 さらに、画像やPDF内のテキストも認識して読み上げることができます。
さらに、このソフトでは、録音のために高品質、中品質、低品質の音声を選択することができ、ローカルマイクと仮想デバイスの録音をサポートしています。 音声ファイルをインポートすると、それを文字起こししたり、MP3、AAC、またはWAVに変換したり、さらにはカットして編集することもできます。
このページでは、VoxTalker製品の登録方法やさまざまな機能の使い方について紹介します。 左側の目次を使って、興味のある部分にすばやく移動することもできます。
製品の登録方法
ステップ 1: VoxTalkerを起動する
VoxTalkerをダウンロードして起動したら、右上隅の「アカウント」アイコンをクリックしてください。
ステップ 2: 「ログイン」または「サインアップ」を選択する
その後、会員登録画面が表示されます。以下の使用状況に従って進めてください。
- 公式ウェブサイトでライセンスを購入すると、iRocketアカウントが自動的に作成されます。製品として会員登録する場合は、 「ログイン」を選択し、ライセンス購入時に使用したメールアドレスと受け取ったパスワードを入力して、再度「ログイン」をクリックしてください(パスワードはいつでも変更できます。)。
- iRocketアカウントをお持ちでなく、ソフトウェア内でライセンスを購入した場合は、製品の会員になるために手動で登録する必要があります。 「新規登録」をクリックし、メールアドレス、パスワード、お名前を入力し、「アカウントを作成」をクリックしてください。
ステップ 3: アカウント情報を確認する
アカウントを作成したら、ブラウザが自動的に起動し、会員センターにアクセスします。そこで、購入したライセンスを確認できます。同時に、ソフトウェアも自動的にアカウントにログインします。
ログインした状態でソフトウェアの右上にある「アカウント」アイコンをクリックすると、ライセンスに関する情報を確認できます。ここでライセンスを購入したり、受け取ったクーポンや他の製品をチェックしたりすることもできます。
また、VoxTalkerアカウント画面の右上にある「?」アイコンをクリックすると、アカウントのログイン、登録、パスコードの変更などの詳細を確認できます。
インターフェースの左上には、利用可能の読み上げ文字数、文字起こしの時間、および音声クローンの回数が表示されます。それをクリックして、対応するアイテムの追加特典を購入できます。
テキスト読み上げ
ステップ 1: 言語とボイスを選択する
「テキスト読み上げ」タブに移動し、右側のアバターアイコンをクリックして、読み上げたい言語と好みの声を選択します。また、キーワードを入力して声を検索することもできます。
ステップ 2:テキストを入力する
読み上げたい内容を入力してください。また、特定の単語を選択して、「ポーズ」、「速度」、「ピッチ」、「読み方」、「強調」などのパラメーターを右側で設定することもできます。
ステップ 3: 音声に変換と出力
「生成」をクリックし、しばらくお待ちください。生成されたオーディオは下部に表示されます。それを再生して出力します。編集へ進んだり、履歴を削除したりすることもできます。
Tips
ステップ 1. テキスト入力ウィンドウの下部にある「行を追加」をクリックします。
ステップ 2. 必要に応じて各文を入力し、話者、言語、速度、ピッチを設定します。さらに行を追加したり、上下に調整したりすることもできます。
ステップ 3. 「すべて生成」をクリックし、しばらく待ってから、生成された音声が下部に表示されます。再生して保存しましょう。
文書/画像ファイル読み上げ
VoxTalkerは、PDF/DOC/DOCXの文書ファイルやPNG/JPG/JPEG/BMP/TIFFの画像ファイル内の文字を認識して読み上げることができます。
ステップ 1: ファイルをインポートする
「テキスト読み上げ」タブに移動し、「テキストのインポート」をクリックし、読み上げたい画像または文書ファイルをインポートしてください。
ステップ 2:言語選択と文字抽出
画像ファイルをインポートしている場合は、テキストの言語を選択し、「読み取り」をクリックしてテキストを識別します。
文書ファイルをインポートしている場合は、特別な操作は必要ありません。文字は自動的に識別されます。
必要に応じて、テキストウィンドウで修正を行います。その後、テキストの分割方法を設定し、「インポート」をクリックして読み上げ設定に進みます。
ステップ 3: 音声に変換と出力
右側のパラメータを設定し、「生成」をクリックしてください。しばらくお待ちいただき、生成されたオーディオが下部に表示されます。それを再生して出力します。編集へ進んだり、履歴を削除したりすることもできます。
音声クローン
VoxTalkerのプレミアムプランを購入すると、「音声クローン」機能を使用して声を合成できます。合成されたら、それを使用して任意のテキストを読み上げることができます。
音声のクローンを作成するには、声のサンプルを提供する必要があります。
ステップ 1: 音声サンプルを提供
「音声クローン」タブに移動し、「新しいクローンを作成」をクリックします。
ビデオまたは音声ファイルをアップロードまたは録音する方法を選択してください。
ファイルをアップロードする場合は、モデルを選択し、クリックまたはドラッグして音声ファイルをインポートします。その後、「クローンを開始」をクリックしてください。
テキスト読み上げを選択した場合は、画面に表示されるテキストを読み上げて、録音を完了してください。その後、モデルを選択し、「クローンを開始」をクリックします。
ステップ 2:合成した音声の確認と使用
しばらく待ってから、クローンされた声が作成され、履歴に表示されます。名前を変更することもできます。「使用」をクリックすれば、それを使って入力したテキストを読み上げることができます。
また、テキスト読み上げタブでスピーカー選択画面を開き、「My Cloned Voice」に絞り込むこともできます。
音質の向上
もし録音に背景ノイズ、音質の悪さ、音量の不均等などの問題がある場合は、この機能をご利用いただくことをおすすめします。
ステップ 1: 音質強化モードを選択
「音質強化」タブに移動し、必要に応じて修正モードを1つ選択してください。
ステップ 2: ファイルをインポート
録音タイプを選択し、オーディオファイルをクリックまたはドラッグしてインポートします。 次に、「次へ」をクリックします。
ステップ 3: 調整した音声ファイルを確認と保存
数分後、処理されたオーディオが表示されます。 オリジナルファイルと比較して確認できます。 下部の「エクスポート」を使用して保存できます。
文字起こし
VoxTalkerは、mp3/wav/m4a/mp4/movなどの動画や音声ファイルから文字を抽出して保存することができます。これは、動画の字幕作業を行う際に非常に便利な機能です。
ステップ 1: ファイルをインポート
「文字起こし」タブに移動し、「ファイルを追加」をクリックするか、動画または音声ファイルをドラッグして、読みたいテキストを含むファイルをインポートします。
ステップ 2: 言語選択と文字抽出
上部で言語を選択し、右下の「変換」をクリックして、動画または音声をテキストに変換します。
ステップ 3: 変換した文字を保存
変換された文字を確認します。右上には、それをコピーしたり、txtファイルとして出力したりすることができます。
音声変換
VoxTalkerは、AI音声変換と呼ばれる機能も追加されました。これは、お手元のオーディオファイルの声を有名人の声に変換できる機能です。
対応しているオーディオフォーマットはmp3/wav/ogg/opus/flac/aiff/aac/m4aです。
ステップ 1: ファイルをインポート
「音声変換」タブに移動し、音声を変換したいオーディオファイルをインポートするために、クリックまたはドラッグしてください。
ステップ 2: AI声を選択
ご希望のAIボイスをクリックして試聴し、使用したいものを選択してください。
ステップ 3: 変換と保存
「生成」をクリックして、しばらくお待ちください。変換が完了すると、ファイルは自動的に保存されます。下部でファイルを再生するか、場所を開くことができます。
AIラップ生成
VoxTalkerでは、AIを使用してラップや歌詞を自動生成するサービスも提供しています。音声制作が必要な場合は、ぜひお試しください。
ステップ 1: ラッパーを選択
「AI生成ラップ」タブに切り替えて、右側の人形アイコンをクリックしてラッパーを選択してください。
ステップ 2: 歌詞を入力
歌詞をテキスト入力窓に入力し、必要に応じて改行を追加してください。「AI歌詞を生成」をクリックし、テーマを説明すれば、歌詞を生成してコピーできます。
ステップ 3: ラップ 生成と保存
右側のビートを選択する前に、そのビートを聴いてください。その後、「生成」をクリックし、しばらくお待ちいただくと、生成されたラップが下部に表示されます。再生または出力が可能です。
録音
VoxTalkerではリアルタイムで録音し、MP3/AAC/WAV形式で出力することができます。この機能を使用すると、オンラインミーティング、個人のメモ、スピーチ、講義、および歌の録音や編集が簡単に行えます。
ステップ 1: 音質などを設定
「録音」タブに移動します。右上の「設定(歯車)」アイコンをクリックして、音質と保存先を選定します。また、ツールバーで録音の「音量」「デバイス」「ファイル形式」を設定します。
ステップ 2: 録音を開始
画面の赤い「●」ボタンをクリックして録音を開始します。再度クリックして録音を終了します。
ステップ 3: 録音を確認して出力
新しい録音は下のリストに追加され、ファイル名、サイズ、長さ、作成日が表示されます。右側では、書き起こし、編集、再生/停止、フォルダを開く、削除などができます。
音声形式変換
VoxTalkerには、フォーマット変換機能もあります。動画や音声ファイルをMP3、WAV、OGG形式に変換して保存できます。
ステップ 1: ファイルをインポート
「フォーマット変換」タブに移動します。「ファイルを追加」をクリックするか、ファイルをドラッグして変換したいファイルをインポートします。複数のファイルを一度にインポートして変換することもできます。
ステップ 2: 変換して保存
出力形式と保存先を選択し、「すべて変換」をクリックして、音声形式の変換を自動的に開始します。変換されたファイルは自動的に選択した場所に保存されます。
音声編集
VoxTalkerで簡単なオーディオ編集ができます。録音した音声ファイルやインポートしたオーディオファイルのカット、トリミングは可能です。
ステップ 1: ファイルをインポート
「編集」タブに移動し、「ファイルを追加」をクリックして編集したいファイルをインポートします。
ステップ 2: オーディオを編集
選択ボックスが表示されますので、編集したい部分を囲んでください。
ツールバーで必要な操作を選択します。
ステップ 3: 試聴と出力
編集が完了したら、下部でオーディオを再生します。次に、すべてのクリップを出力するか、選択したクリップを出力するかを選択します。
「Export」をクリックして、編集したオーディオを保存するファイル形式と保存先を選択します。