動画キャプション (字幕) の表記スタイル

先の記事「音声を伴う動画にはキャプション (字幕) を付ける」で、Web コンテンツとして動画 (音声を伴うもの) を用いる場合、アクセシビリティ上の配慮としてキャプション (字幕) を付けることが求められると書きました。

このキャプション、主な用途として聴覚障害者に対する情報保障という意味合いがあるので、内容的には、発話 (セリフ) 以外にも様々な情報 (たとえば、効果音や状況説明など) が含まれます。こういった様々な情報をどう書き分けるのか、その表記スタイルには決まった統一基準や指針があるのか、実際に、いざキャプションを書こうとすると、気になるところです。

「WCAG 2.0」での規定は?

まず気になって調べてみたのが、W3C が勧告する Web コンテンツのアクセシビリティ指針「WCAG 2.0」です。

WCAG 2.0 の関連文書である「実装方法集 (Techniques for WCAG 2.0)」の中に、「G87 : クローズド・キャプションを提供する」というページがありますが、そこを読む限り、特に表記スタイルについての言及はありません。同ページの「キャプションのガイダンス」の項で、「Captioning Key : Guidelines and Preferred Techniques」と「Best Practices in Online Captioning」が参考リンクとして紹介されていますが、これらのリンク先でも表記スタイルに関する記述は見当たりませんでした。

標準的なキャプション表記スタイル (ただし統一基準ではない)

そこで、Web アクセシビリティの観点で動画キャプションの表記スタイルに触れているサイトを、Google 検索を通じて探してみたのですが、その中で下記のサイトを見つけました。

いずれも、学校教育関係者向けの情報リソースですが、これらに書かれている内容から考えると、動画キャプションの表記スタイルは以下のようにまとめることができます。

動画キャプションの表記スタイル
情報の種類 表記スタイル
発話、ナレーション、音 (擬音語や擬声語) 括弧などで括らずに記述する。
話者の特定 丸括弧 (parenthesis) で括る。例 : (寅さん)
状況の説明、効果音である旨 (何の音かの説明)、その他補足 (モノローグやナレーションである旨など) 角括弧 (bracket) で括る。例 : [風の音]

実際、上記に則ったキャプション表記をしている動画が多い気がしますし、運用上さほど複雑なルールでもないので (コンテンツ制作者の間で無理なく徹底できそう)、これを動画キャプションの「標準的な表記スタイル」と考えてよいと思います。

ただ、これは統一基準として規定されたものではなく、あくまでも慣習に過ぎないようです。たとえば、YouTube ヘルプ「スタート ガイド : 字幕と文字起こし」を見ると、その中の「字幕ファイル」というセクションに以下の記述があります (話者の特定を、丸括弧ではなく「>>」で表記するインストラクションになっています)。

字幕を読みやすくするための一般的なヒントを紹介します :

  • [音楽] や [笑い] のように説明を角かっこで囲むと、耳の不自由なユーザーも動画で何が起きているかを理解できます。
  • 行の先頭に「>>」のようなタグを付けると、誰が話し手か、または話し手が変わったことがわかります。

少なくとも同一サイト内では表記スタイルの一貫性を保つこと

このように現状では統一基準のない、動画キャプションの表記スタイルですが、少なくとも同一サイト内では、表記スタイルに一貫性が保たれていることが大切です。

その際には、以下の点を、十分考慮したいところです。

  • サイト独自の、特殊な表記スタイルは、極力用いないこと (ユーザーのメンタルモデル形成、認知/学習負荷軽減に配慮する)。
  • あまり細かな表記ルールを設けないこと (運用上、コンテンツ制作者の間で継続的に徹底できるようにする)。

こうした考慮点に基づいて、キャプション表記ガイドラインを用意し、サイトのコンテンツ制作者間で共有する...というのも有効だと思います。