Notta VS Whisper、どっち?精度、使い勝手、機能、速さから徹底検証
文字起こしサービスの中に、NottaとWhisperの知名度が高いです。でも、この2つのツールはどっちがいいでしょうか?
この記事では、NottaとWhisperの機能、文字起こし精度、使い勝手などから比較します。どっちを選ぶ方がいいのかと迷う方は、ぜひこの記事を読んでください。
文字起こしアプリNottaとは、どんなことができる
Nottaは、Notta株式会社が提供した文字起こしアプリです。このアプリを利用すれば、Web会議やインタビューなどのビジネスシーンで音声を文字に変換することができます。そして、個人シーンでも動画の音声を文字に変換し、字幕をつけることもできます。また、内容の要約を自動的にまとめたり、起こした文字を翻訳したり、文章を校正したりすることもできます。
Nottaを利用することにより、以前数時間かかる仕事を数分間で完了でき、作業効率がかなり向上されます。今まで既に2000万ダウンロード突破した人気アプリです。
長所
- 高精度の文字起こし、最大98.86%の認識率
- 文字起こしのスピードが速い、1時間の動画を5分間で完了できる
- URLから動画の文字を認識
- 話者を分けることができる
- ガイドなどがわかりやすく、使い方も簡単
- 2つの言語を同時に文字起こし可能
- PCだけでなく、iPhoneとAndroid版も提供される
- 親会社は日本であるため、サポートは充実
短所
- 無料プランでは、月に120分間まで利用できるが、1ファイルに対して最初の3分間のみが文字起こし対象となる;
- 利用する度にインタネットへの接続が必要;
- ノイズのある環境では、音声認識の精度が著しく低下する。
文字起こしアプリNottaで文字起こしする方法
Step 1: Notta の公式ページを開き、ホーム画面の「Nottaをはじめる」をクリックます。
初じめてご利用の方は、登録ページでNottaに新規登録します。既にアカウントがある方は、「ログイン」に切り替えてアカウントを登録します。
Nottaは、Google、Microsoftアカウント、AppleID、SSO、メールアドレスで登録できます。
登録完了したら、自分のアカウント管理画面に遷移されます。アカウント管理画面の右側から利用したい機能を選ぶことができます。
- 「録音開始」は声を録音しながらリアルタイムで文字起こしする機能
- 「インポート」はローカルファイルや共有サービスからのコンテンツを文字起こしする機能
- 「Web会議の文字起こし」は会議アプリの招待URLを入力して会議の内容を文字起こす機能
- 「画面収録」はPC画面やWebカメラなどを録画できる機能
本記事では、「インポート」を選択し、ローカルファイルの文字起こしを例にします。
「インポート」の画面で、認識する言語を選択し、ファイルをアップロードします。
アップロード完了後、アカウント管理画面に表示されます。該当ファイルをクリックすると、文字起こしされた内容を確認できます。
人気関連記事:NottaとAmiVoiceの比較:精度、使い勝手、機能から徹底検証
Nottaを使った筆者の感想:
筆者は以前からNottaの無料版を利用したことがあります。Nottaの文字起こしの正確率は非常に高く、1ファイルの中の誤りは少ないため、自分から修正する点も少ないです。また、使い勝手もいいし、機能の説明もわかりやすいです。簡単に文字起こししたいならNottaがおすすめですね。
文字起こしアプリWhisperとは、どんなことができる
Whisperは、音声をテキストに変換できる文字起こしサービスです。Whisper はOpenAIの技術を基にしており、日本語を含め合計99言語に対応しています。ローカルファイルをアップロードしたら、Whisperはそのファイルを認識し、ファイル内容のテキストを生成ます。Whisperの文字起こし精度も比較的に高く、ノイズのある環境でも効果的です。そのAPIは有料ですが、APIではなく、Google Colabeを活用することで、Whisperを無料で利用できます。
長所
- 対応言語は多い
- Google ColabeかGithubを利用すれば、無料で利用可能
- ノイズのある環境でも、比較的高い認識精度を保つ
短所
- 使い方が面倒、初心者に向いてない
- 句読点をつけない
- 文字の要約をまとめることはできない
文字起こしアプリWhisperで文字起こしする方法
Whisperの使い方はやや複雑です。WhisperをGoogle Colaboratoryに追加して設定を完了してからファイルの文字起こしを開始できます。以下では、その使い方を詳しく解説します。
1.Whisperの環境設定を行う
Google Colaboratoryにアクセスして、「ノートブックを新規作成」をクリックします。https://colab.research.google.com/?hl=ja
次に、「編集」タブを開き、「ノートブックの設定」をクリックして、ハードウェアアクセラレータで「T4 GPU」を選択し、「保存」をクリックします。
次に、編集ページでWhisperのインストールコード「!pip install git+https://github.com/openai/whisper.git」を入力したら、隣の実行アイコンをクリックしてください。
Whisperのコードの読み込みが完了したら、コードの最後尾にスクロールし、「+コード」をクリックして、「import whisper」を入力し、実行アイコンをクリックします。
上記が、whisperの設定でした。設定が完了後、次のファイルをインポートします。
2.Whisperモデルでファイルの文字起こしを行う
操作画面の左にある「ファイル」のアイコンをクリックして、ファイルをアップロードします。
アップロードが完了したら、「+コード」をクリックして、下記のコードを入力し、実行アイコンをクリックしてください。
model = whisper.load_model(‘base’)
result = model.transcribe(‘ファイル名’)
print(result[‘text’])
ファイル名を自分がアップロードしたファイルの名前(本記事は日本語音声.mov)に変更し、ほかのコマンドをそのままにしてください。
数秒待つと、ファイルのテキストは表示されます。
Whisperを使った筆者の感想:
Whisperの使い方はやや複雑ですが、手順に慣れたらそれほど大きな問題はありません。文字起こしのスピードも速いです。ただ、文字起こしの際に、誤りはNottaより多いです。ただ、無料で利用できるから、この程度の誤りば許せる範囲と思います。
Notta VS Whisper、文字起こし比較表
Notta | Whisper | |
開発元 | 株式会社Notta | Openai |
使い勝手 | ⭐︎⭐︎⭐︎⭐︎⭐︎ | ⭐︎⭐︎⭐︎ |
対応デバイス | ブラウザ、iOS、Android | ブラウザ |
対応言語 | 日本語を含む58言語 | 日本語を含む99言語 |
文字起こし精度 | ⭐︎⭐︎⭐︎⭐︎⭐︎ | ⭐︎⭐︎⭐︎⭐︎ |
速さ | ⭐︎⭐︎⭐︎⭐︎ | ⭐︎⭐︎⭐︎⭐︎⭐︎ |
料金 | 1,317円/月から | API利用しない場合は無料 |
オンライン利用 | できる | できる |
リアルタイム文字起こし | できる | できない |
以上では、NottaとWhisperを比較したものでした。個人的から見れば、Nottaの使い方と精度はより高いです。会議などが頻繁の会社と取材などが多い記者やテレビ局の方にNottaが
おすすめです。個人で文字起こしを試してみたい方にWhisperを利用してみても良いでしょう。