北海道馬産地ファイターズ
第174回 『文字起こしアプリ』
2023.06.16
Tweet
前回のコラムでも書かせてもらったように、4月下旬から北海道競馬ライブ生月の生配信が始まった。阪神の核となる予想はさておいて、やはり問題となるのは、生配信の7時間という時間である。何か始まってみるとあっという間とまではいかないか、ポンポンと次のレースの時間がやってくるので、疲れをさほど感じないことに番組が進行していた』とここまで読んでいただいた方の中には、「生月って何?」「阪神の核って、クリーンアップを打っている、大山か佐藤(輝)のことかい!」と思ったタイガーズファンの方がいらっしゃるのかもしれない。
実はここまでの文章は、最近パソコンにインストールした文字起こしアプリの「Notta」に録音した原稿を自分が朗読。それを文字起こしした結果である。「Notta」とは最新のAI音声認識エンジンを使った文字起こしアプリである。普段からテープ起こしでひいひい言っている自分の救世主になるのではと思い、4月から使用してみたものの、そこそこ使い勝手が良いので、今ではICレコーダーに録音した音声データを、ほぼ「Notta」に取り込んでいる。
では、自分が描いた文章との差違を見ていこう。まずは「北海道競馬」だが、これは正式には「ホッカイドウ競馬」と表記されなければいけない。問題の「生月」は「なまちゃき」(なまらとはっちゃきの北海道弁を掛け合わせた造語)と言っている。これは造語だけに変換できなかったと考えるべきだろう。
しかしながら続く「阪神の核」だが、これは「番組の核」と言ったつもりだった。普段から活舌の悪いのは認めるところだが、プロ野球ファンとしての思いが、言葉からもにじみ出てしまったのかもしれない。だが、他の文章に関してはほぼ、作った原稿通りにまとめられている。恐るべし翻訳アプリというところだが、実際に取材で使用してみると、そこまで正確に会話や、そこで出てきた単語を翻訳できていないようだ。
これは文章の読み上げと、会話のスピードが違うことも関係していると言える。また、取材だと相槌を打ったり、会話の途中で違った声(取材対象者orインタビュアー)が重なってくると、前後の言葉がくっ付いた形で翻訳されてしまうからだ。
また、牧場の休憩室で取材をした際には、テレビの競馬中継の声も録音されていたこともあって、翻訳の結果では全く違った馬の名前が入っていたこともあった。
また、競馬に限ったことではないのだが、その世界でしか使われていないような言葉に関しても、翻訳をするのが苦手なようだ。その結果が面白い言葉になることもあり、「お前としては何とか文字にしようと頑張ってくれたんだよね」とアプリを励ましたくなることもある。
まあ「競馬用語」(もしくは競馬界だけでしか用いられていない言葉)の翻訳は難しいとしても馬名やレース名はせめて翻訳されてくれないと、文字起こしの意味がない。
活舌が悪い(このコラム2回目)自分が、冒頭の文章に翻訳されていた程度のスピードで、馬名やレース名を読み上げた結果だが、以下のように翻訳された。以下、先に書かれた文字が自分の話した言葉で、後の文字が翻訳結果となる。
◎ディープインパクト→ディープインパクト
◎ハーツクライ→ハーツクライ
△マジェスティックウォリアー→マジェスティックWarrior
×ステラヴェローチェ→捨てるべろって
巻き舌っぽい発音の馬名が上手く翻訳できなかったのは自分の力不足かもしれないが、まずまずの結果と言える。ちなみに今年春のGⅠ馬でトライしたところ、イロゴトシが「色落とし」になった以外は、全て実際の馬名で翻訳されていた。
注目すべきはステラヴェローチェは翻訳できなかったのに、レース名では「朝日杯フューチュリティステークス」も阪神ジュベナイルフィリーズ」も、自分の活舌で翻訳されていたという事実である。
これは最新のAI音声認識エンジン恐るべし! といったところだが、ちなみによく使う言葉は辞書登録もできるらしく、マジェスティックウォリアーもステラヴェローチェも、早速登録しておこうかと思った。
『というわけで、今後の取材では、ⅠCレコーダーに録音した音声データを乗った2取り込みそれをもとに原稿を書いていこうと思う。次第を受けていただく皆さんも、自分の言葉が文字になるので、今後は発言に気をつけていただきたい』
やっぱり、まだまだですね(笑)。
実はここまでの文章は、最近パソコンにインストールした文字起こしアプリの「Notta」に録音した原稿を自分が朗読。それを文字起こしした結果である。「Notta」とは最新のAI音声認識エンジンを使った文字起こしアプリである。普段からテープ起こしでひいひい言っている自分の救世主になるのではと思い、4月から使用してみたものの、そこそこ使い勝手が良いので、今ではICレコーダーに録音した音声データを、ほぼ「Notta」に取り込んでいる。
では、自分が描いた文章との差違を見ていこう。まずは「北海道競馬」だが、これは正式には「ホッカイドウ競馬」と表記されなければいけない。問題の「生月」は「なまちゃき」(なまらとはっちゃきの北海道弁を掛け合わせた造語)と言っている。これは造語だけに変換できなかったと考えるべきだろう。
しかしながら続く「阪神の核」だが、これは「番組の核」と言ったつもりだった。普段から活舌の悪いのは認めるところだが、プロ野球ファンとしての思いが、言葉からもにじみ出てしまったのかもしれない。だが、他の文章に関してはほぼ、作った原稿通りにまとめられている。恐るべし翻訳アプリというところだが、実際に取材で使用してみると、そこまで正確に会話や、そこで出てきた単語を翻訳できていないようだ。
これは文章の読み上げと、会話のスピードが違うことも関係していると言える。また、取材だと相槌を打ったり、会話の途中で違った声(取材対象者orインタビュアー)が重なってくると、前後の言葉がくっ付いた形で翻訳されてしまうからだ。
また、牧場の休憩室で取材をした際には、テレビの競馬中継の声も録音されていたこともあって、翻訳の結果では全く違った馬の名前が入っていたこともあった。
また、競馬に限ったことではないのだが、その世界でしか使われていないような言葉に関しても、翻訳をするのが苦手なようだ。その結果が面白い言葉になることもあり、「お前としては何とか文字にしようと頑張ってくれたんだよね」とアプリを励ましたくなることもある。
まあ「競馬用語」(もしくは競馬界だけでしか用いられていない言葉)の翻訳は難しいとしても馬名やレース名はせめて翻訳されてくれないと、文字起こしの意味がない。
活舌が悪い(このコラム2回目)自分が、冒頭の文章に翻訳されていた程度のスピードで、馬名やレース名を読み上げた結果だが、以下のように翻訳された。以下、先に書かれた文字が自分の話した言葉で、後の文字が翻訳結果となる。
◎ディープインパクト→ディープインパクト
◎ハーツクライ→ハーツクライ
△マジェスティックウォリアー→マジェスティックWarrior
×ステラヴェローチェ→捨てるべろって
巻き舌っぽい発音の馬名が上手く翻訳できなかったのは自分の力不足かもしれないが、まずまずの結果と言える。ちなみに今年春のGⅠ馬でトライしたところ、イロゴトシが「色落とし」になった以外は、全て実際の馬名で翻訳されていた。
注目すべきはステラヴェローチェは翻訳できなかったのに、レース名では「朝日杯フューチュリティステークス」も阪神ジュベナイルフィリーズ」も、自分の活舌で翻訳されていたという事実である。
これは最新のAI音声認識エンジン恐るべし! といったところだが、ちなみによく使う言葉は辞書登録もできるらしく、マジェスティックウォリアーもステラヴェローチェも、早速登録しておこうかと思った。
『というわけで、今後の取材では、ⅠCレコーダーに録音した音声データを乗った2取り込みそれをもとに原稿を書いていこうと思う。次第を受けていただく皆さんも、自分の言葉が文字になるので、今後は発言に気をつけていただきたい』
やっぱり、まだまだですね(笑)。