HOME > 全文掲載 >

V.トレンド「TTSの活用によって市場掘り起こす――電子書籍のアクセシビリティ向上に向けた取り組み/上」

2013/03 『M&D Report』2013年3月号, MM総研.

last update:20130326

p19
 本誌 199号(13年1月号)では電子書籍のアクセシビリティについて IBM東京基礎研究所の取り組みなどを紹介したが、本号と次号の2回にわたって TTS(Text to Speech)などの「音声合成技術」に焦点をあてたアクセシビリティを報告する。一般社団法人「電子出版制作・流通協議会」(AEBS)で TTS研究部会・部会長を務める岡山将也氏(日立コンサルティング所属)のほか、AEBS事務局の池田敬二氏(大日本印刷所属)、EPUB形式の電子書籍オーサリングソフト「FUSEe®」を開発・販売するフューズネットワーク社長の池田実氏に話を聞いた

■文書読み込みを重視するTTS
 TTS(Text to Speech)とは音声合成技術の一つ。主力製品としては日立ソリューションズ・ビジネス(神奈川県横浜市)の『ボイスソムリエ』や、HOYAサービス(東京都新宿区)の『VoiceText(ボイステキスト)』などがある。元々は各社がカーナビ向けなどに音声案内の活用を想定したことから、組み込み系が主流となってきた。09年頃から日立や HOYAなどが製品として販売を開始している。TTSを電子書籍に組み込むことで、健常者、読書障害者に関係なく誰もが本を読めるようにしようと技術開発が進められている。
 音声合成では、「初音ミク」で有名なヤマハのVOCALOID(ボーカロイド)がある。文章を読むことに重きを置くTTSに対し、VOCALOIDは音楽などエンターテインメント向けに開発された。

■読み方のルール付けが不可欠
 TTSを電子書籍に組み込む際には、実際に耳で聞きながらイントネーションやアクセント、語尾の上げ下げなど、より自然に聞こえるように編集作業を行い、その後、WAV(ワブ、ウェーブ、ウェブ)やMP3などの音声ファイルを生成する。特に長文の場合、重複文はアクセントが若干変わるため、イントネーションが変わってくる。そこで短い文章に切ることも必要になるそうだ。
 「人間が話す場合には、どこでアクセントを入れたらよいのか脳が判断している。これに対し、機械は文章を1つ1つ解釈しながら読んでいく。例えば『行った』は「いった」なのか、「おこなった」なのかを解析しならが読む。このためイントネーションがおかしくなってしまう。こういったアクセントなどを含めたルールを、テレビ局などのアナウンサーの話し方の規則などに則り各社が開発している」とTTS研究部会の岡山部会長。
 人間に近づけるための工夫以外にも、「読み方の違い」という問題もある。岡山部会長が続ける。
「私の名前は『将也』と書くが、「のぶや」と読む。同じ漢字でも「まさや」と読む人もいる。このように同姓同名でも読み方が異なってくるので、『辞書登録』をする必要がある。しかし、登録する場合にも『この場合にはのぶやと読ませる』といったように定義づけなければ、全文で「将也=のぶや」と機械が判断してしまう。ほかの箇所では本来の読み方が「まさや」であっても」。
 このように、電子書籍にTTSを組み込むにあたって、ルール決めをどのようにコントロールするのかなどが課題となっている。

■障害者の雇用促進にも貢献
 以上のように通常の書籍の編集作業に加えて、音の編集作業という 2つの編集が必要となり、コストもかかる。しかし、岡山部会長は「制作段階から音での編集作業を組み込んでいくことで、編集コストを下げられる」という。
 AEBS事務局の池田氏も次のように指摘する。
「AEBSがニューズレターを作成する際、まず PDFで作成した後に TTS機能が付加された EPUB(イーパブ)版を作成する。この作業を音での編集作業に切り替えると平均3〜4個の間違いが見つかる。人間の目は意外といい加減で、例えば『こんにちは』が『こんちには』となっていても推測して読んでしまう。しかし、耳で聞くと『なんだこれ?』と気づくことが多い」。
 現状、TTSの活用事例はAEBSのニューズレターなど僅かに留まっているが応用範囲は広い。電子書籍への応用可能性として、岡山部会長は「通常、校正作業ではOCRで読み込んだ後、チェック、修正をしている。この段階で、多くの人が耳で聞くことで違和感を覚えた部分をクリックしてもらい、しおりをつけることで校正の効率化ができるのではないか」と語る。
 応用事例に対する世間の注目度も高まっている。12年 7月に開催された「第 16回国際電子出版EXPO」で、障害者雇用を積極的に行っている NTTクラルティ(東京都武蔵野市)と NTTアイティ(神奈川県横浜市)が TTSを活用した料理レシピの電子書籍などを出展したが、マスコミの取材依頼が多かったという。
 岡山部会長によると電子書籍以外への応用例もある。従来、保険業界では書類の不備がないように手書きの書類を必ず二人一組で読み上げていたという。しかし、このチェック作業を機械で読み上げて耳で聞くように変更したところ、「1.5〜2倍程度効率が上がり、コストが下がった事例もある」。AEBS内の TTS研究部会では、機械の修繕マニュアルにTTSを組み込むなど、応用可能性についてアイデ


p20
ア探しを行っているという。

■「耳で読む」ライフスタイルを提案
 TTSを普及させるにあたって AEBSの池田氏は「『耳で読む』という新しいライフスタイルを提案できるかどうかにかかっている」と指摘する。オーディオブックが広まる環境は世界的にもあるそうだ。
 「米国ではクリントン氏が大統領を辞めた後に自伝を出したところ、多くの人がオーディオブックとして聞いていたそうだ。ロシアでは、古くから吟遊詩人が存在し、ペレストロイカ以前の娯楽が限られていた頃には朗読レコードを聴く習慣があった。日本でも琵琶法師などの口承文芸、落語、民話などの文化があり、オーディオブックがより浸透する土壌が存在している」。
 オーディオブックの市場規模についても触れておこう。AEBSの池田氏は「全米出版協会の報告によるとセルマーケットで 1,167億円、ダウンロードマーケット市場で692億円と大きなオーディオブック市場が確立している。印税の契約についても紙の書籍とは別にオーディオブック向けの印税契約がある」と指摘。岡山部会長も「日本でも紙の書籍向け、オーディオブック向けなどと印税の契約形態を分けられれば、オーディオブックの市場が立ち上がってくるのではないか。これから出版される予定の書籍から新しい契約形態を創って出していくことが一番早い」と同調する。

■ DRM問題など課題も
 TTSの応用事例やオーディオブックなどに注目が集まる一方で、TTSを組み込む上での課題もある。1つ目は法的課題、2つ目は技術的課題だ。まず「法的課題」は、DRM(デジタル著作権管理)との関係だ。DRMは映画や音楽、電子書籍などのコンテンツの無制限な複製を防ぐための技術であるが、これがTTSの組み込みを邪魔しているのである。
 フューズネットワークの池田社長は「実際に DRMで利用が制限されたPDFファイルでは読み上げ機能が作動しなかったといった例もあり、電子書籍でも同様の事態が起こりうる」と危惧する。
 DRM問題は今後、どのような方向に向かうのだろうか。AEBSの岡山部会長、池田氏は個人的な意見としながらも「DRMはいずれ外れていくと考えている。音楽配信でも開始当初は DRMがかかっていたものの、現在では外れている状況にある。電子書籍の DRMも音楽配信と同様の方向にあるのではないか」と予想する。
 ただ、AEBSの池田氏は「現在も出版社は複製に対して非常にナイーブだ」と指摘する。「12年9月に発売したソニーリーダーはエバーノート、フェイスブックに投稿、保存するなどの連携機能を備えていた。これに対し、フェイスブックとの連携について一部の関係者の理解を得られない可能性があるとして、リリース後1、2週間程度で取り下げる事態となった」。
 一方で違法複製が横行している点も無視できない。フューズネットワークの池田社長は「以前、電子書籍のスクリーンショットを自動で撮影し統合することで本が創れるといった謳い文句を見たことがある。電子書店のパピレスなどが中心となって内容証明まで出すなど抗議したものの、未だに名称を変えながら営業を続けている」と指摘する。
 岡山部会長は「違法業者が存在するものの、性善説で進めていく以外に市場が拡大するための方法はない。違法複製は、もはやビジネスの領域ではなく商法の領域。最終的には訴訟に行き着く」として、ケースバイケースに切り分けて考えていく必要性を強調する。
 次に、「技術的な課題」について岡山部会長は語る。「TTSのメーカーは通常、JIS X 0208に規定した漢字コード体系を使っている。JIS X 0208は第 1水準、第 2水準までをカバーしているが、通常、出版社ではJIS X 0213に規定した漢字コード体系を使う。0213は第3、第 4水準まで含めた漢字コード体系を指す。従って0213までカバーすればほとんどのビジネス書はオーディオブックで読めるようになる」。
 「異体字は基準となっている親字(第1、第 2水準の漢字)があるため、オーディオブックを制作する際には、見た目は異体字、システム上読み上げる際の漢字は親字といった形にする必要がある。しかし、ルビを入れた途端に機械が判断できなくなる。例えば『海でかきを拾った』の『かき』は流れてきた柿か、生物の牡蠣か判断できない」。この点についてAEBSの池田氏からは「現在、TTS研究部会でこういった課題に対応すべくTTS対応電子出版制作ガイドラインの作成を進めている」。

■読書困難者向けは3,000億円市場とも
 様々な期待がなされる一方で、幾つかの課題を抱えるアクセシビリティ関連の市場であるが、その市場規模は未知数だ。岡山部会長によると「統計上、視覚障害者は31万人程度存在するとされているが、視力が極端に低いが障害と認定されていない方を含めた広義の意味での読書困難者は800万人程度存在する。さらに老眼や白内障なども加えていくと何千万人という規模に膨れ上がる」。アクセシビリティにかかわる潜在的な市場規模は莫大なのだ。AEBSでは弱視や広義の視覚障害者、高齢者、発達障害など含めた読字障害者は 20年に 1,500万人、市場規模にして 3,000億円に達すると試算している。
(ネットワーク・ソリューション研究グループ/山口泰裕)

※「TTSの活用によって市場掘り起こす――電子書籍のアクセシビリティ向上に向けた取り組み/下」はこちらからご覧いただけます。

*作成:青木 千帆子
UP: 20130301 REV: 0326
全文掲載  ◇電子書籍 
TOP HOME (http://www.arsvi.com)