音声配信サービス「audiobook・jp」を運営する株式会社オトバンクは7月14日、株式会社PKSHA Technology(PKSHA)の音声関連技術をもとにAI音声合成サービス「カタリテ」を開発したことと、日本経済新聞社「日経電子版」と連携して同日からこの技術を利用した活字コンテンツの音声化に関する実証実験を始めたことを発表した。
「カタリテ」は、PKSHAの開発する音声合成プラットフォーム「PKSHA Phonetics(フォネティクス)」に、オトバンクが持つオーディオブック音声データベースを学習させることで実現したAI音声合成サービス。音声合成技術を活用して、収録から編集に必要な制作時間を短縮し、即時性の高いコンテンツを適時に音声化し提供できる環境の実現を目指す。
コンテンツの音声化に対応すべく「カタリテ」では、PKSHAが開発した自然な発音を再現するアクセント推定技術「tdmelodic」を実用化することで、一般的な音声合成ソフトウェアでは難しいアクセントの制御を可能にする。「tdmelodic」を導入したサービスの実用化は今回が初の取り組みだという。
「日経電子版」による実証実験は、速報コーナーで配信された記事の一部を抽出し、その見出しから生成した音声コンテンツを、毎週月曜から金曜日の平日18 時に更新し、オトバンクが運営するaudiobook・jp の聴き放題プランで配信する。日経電子版見出し読み上げサンプル。
今回の取り組みについてオトバンク・久保田裕也代表取締役社長は「今後も『聞き入る文化』の創造を目指し、『音のこだわり』をさまざまな観点から実現できる取り組みに挑戦する」とし、一方、日本経済新聞社デジタル編成ユニットサービス開発グループ・筧尚武グループ長は「日経電子版では、読者のコンテキストに合わせた情報発信を常に模索している。
この自動処理の取り組みは、今後、見出しの自動翻訳や精度の高いタグ付けにも繋がると考えている。引き続き、耳で伝えるための技術研究に取り組む」とのコメントを発表した。