motchie.com

The Golden Rule

JIS X 8341-3:2010 達成基準7.3.1.5の日本語実装と「やさしい日本語」の研究

はじめに

この記事は、Web Accessibility Advent Calendar 2015の20日目の記事です。

この記事では、JIS X 8341-3:2010の制定以来、僕がずっと悩んできた達成基準7.3.1.5の日本語での実装方法について、研究した内容を書きたいと思います。

Webアクセシビリティと言うと、マークアップに関する話題がほとんどという印象がありますが、より本質的に「理解可能なコンテンツ」とするための方法を探ります。

[イメージ写真]

Photo credit: Chasing Daisy / Visualhunt.com / CC BY

達成基準の内容

まず、達成基準7.3.1.5とはどのような達成基準でしょうか。WAICによる日本語訳には以下のように書かれています。

3.1.5 読解レベル: テキストが前期中等教育レベルを超えた読解力を必要とする場合は、補足コンテンツ又は前期中等教育レベルを超えた読解力を必要としない版が利用できる。 (レベル AAA)

ウェブサイトのコンテンツで、書かれているテキスト(文章)が難解である場合に、その文章の、よりやさしい表現による代替コンテンツを用意せよと書かれています。その代替コンテンツは、要約版などの補足コンテンツか、コンテンツ全体の情報を含む版かを選べるようです。

“Understanding WCAG 2.0”には、この達成基準に関する意図が記載されています。

コンテンツは、可能な限り明快かつ簡潔に書かれているべきである。この達成基準の意図は以下の通りである:

  • 難解又は複雑な文章を理解しやすくするために、補足的コンテンツを提供すること。
  • そのような補足的コンテンツがどういうときに必要なのかを示すテスト可能な基準を定めること。

JIS X 8341-3:2010 およびその基礎であるWCAG 2.0では、各達成基準は「テスト可能」である必要があります。 この「テスト可能性」の定義についてWAICのサイトではツールあるいは専門家によって客観的に判断できるので,適合性評価が可能(なはず)と説明されています。

達成基準7.3.1.5は「文章の読みやすさ」に関する達成基準であり、達成基準である以上、それは「テスト可能」である必要があります。今回の達成基準では、そのテスト可能性はどのようにあるべきなのでしょうか。順に考えます。

対象のコンテンツが難解かどうかの判断
達成基準に「テキストが前期中等教育レベルを超えた読解力を必要とする場合は」と書かれているので、対象のコンテンツが「前期中等教育レベルを超えた読解力を必要とするほど難解かどうか」の判断がまず必要です。 別の言い方をすれば、この達成基準7.3.1.5を「適用」とすべきか「非適用」とすべきかを判断する基準が必要です。
読みやすくしたコンテンツが、本当に読みやすいのか否かの検証
テキストが前期中等教育レベルを超えた読解力を必要とした場合、代替コンテンツ(同じ情報を持つ読みやすい版)を用意するか、読みやすい要約を用意します。最後に、用意したコンテンツが読みやすいのか検証するための試験が必要になります。

さすがは達成等級AAAです、文章の読みやすさなんて、どう判断するんだろうか…と思いながら"Understanding WCAG 2.0"を読みます。解説の前半を要約すると次のようになります。

  • この達成基準は、読字障害のある利用者の助けとなる(専門知識を持つ高学歴の読者も含め)
  • 文章の難しさは、その理解に必要な教育水準から説明される
  • 文章をそれ以上読みやすくできない場合、かつ、中学校の教育レベルを超える読解力が必要な場合は補足的コンテンツが必要となる
  • よく使われる単語で構成される短い文章は理解しやすく、長い又はなじみのない単語を用いた文章や、長い文章には読解力が必要である

ふむふむ…結局、読みやすさの評価はどうするのかな? と思って読み進めると、関連しそうなのは以下の内容です。

  • 読みやすさ(リーダビリティ: readability)は、ウェブページ上の文章から抽出した節を解析することで測定することができる
  • 教育者(資格のある教師など)は、文章を読むのに必要とされる教育レベルをローカルの教育標準に従って測定することができる。
  • コンテンツのリーダビリティは、抽出した節にリーダビリティの計算式を適用することで判断できることもある
  • 多くの言語のリーダビリティ計算式は、単語数、単語長、文の長さと数などからスコアを算出している
  • いくつかの言語では、人気のあるソフトウェアのスペルチェック機能でリーダビリティ評価が可能である

具体的な「前期中等教育レベルを超えた読解力を必要とするほど難解かどうか」の判断は、ツールまたは教師のスキルによって行うことができるそうです。

実装方法を見ると、「読みやすくする」は、単にテキストの修正だけでなく、 図・シンボルや写真を用いたり、音声化したり、手話バージョンを提供したりすることも含まれているようです。これはこれで視野を広げるよい情報ですが、当初の達成基準からは離れている気もします。 というのも、情報は理解しやすくなるかもしれませんが、「中学校の教育レベルを超える読解力が必要かどうか」の判断がいつまでたってもできません。

注記に関連しそうな記述がありました。

…読み書きと理解に問題を抱えたすべての人の能力に合致する文章を書くことは不可能だろうといわれている。最も明快で、かつ最も簡易な言葉遣いを用いることが非常に望ましいが、 WCAG ワーキンググループではそれが達成されているかどうかを検証する方法を見つけることができなかった。 読解レベルを用いているのは、明快な文章を推奨する達成基準にテスト可能性を持たせるためである。 認知の障害の種類や程度によっては、補足的コンテンツを提供することが効果的な実装方法の一つとなりえる。

これは、文章の読みやすさを「最も読みやすい文章とせよ」という達成基準ではなく、「中学校の教育レベル」のように少しレベルを上げたことに対する注釈のように読めます。 同時に、この解説や実装方法周辺の状況を見ると、読解レベルの設定そのものが難しいのではという印象も受けました。

例えばこの問題を正面から取り上げている実装方法はG153ですが、ここを見ても状況は同じでした。 訳注として以下は英語における留意点であると考えられ、日本語の場合には当てはまらないものも含まれているかもしれません。と書いていただいています。

どうやら、達成基準7.3.1.5について、日本語での実装については未検討のようです。新たな研究分野が見つかるとワクワクします。「日本語文章の読みやすさの計測」について、少し調べることにしました。

文章の読みやすさの計測について

英文でのリーダビリティ指標

文章の読みやすさ(リーダビリティ)について調べていると、どうも英語圏ではかなり古くから取り組まれており、かなり進んでいるようです。

最も有名なものがWhy Johnny Can’t Read?: And What You Can Do About Itの著者で知られる、作家でリーダビリティ専門家であるRudolf Fleschが提唱したFRESです。

FRESは、英文の表現や意味ではなく、1文あたりの平均単語数や1単語あたりの平均音節数などを利用して算出される読みやすさの指標です。次のような計算式で算出されます。

206.835 - 1.015 total words total sentences - 84.6 total syllables total words

この指標では、最高ポイントが100になり、読みやすい文章ほどスコアが高くなります。スコアが60~70が easily understood by 13- to 15-year-old studentsとのことで、ちょうど「前期中等教育レベル」に合致します。

同じFleschと教育学者J. Peter Kincaidが1975年に開発した FKGLはFRESの拡張で、計算式から「そのテキストは(米国の)どの学年であれば理解できるのか」を算出することができます。次のような計算式で算出されます。

0.39 total words total sentences + 11.8 total syllables total words - 15.59

この指標は、スコアが8.0の場合は、8年生が理解できる文書であることを意味します。

FRESおよびFKGLとも、テスト文書内の各単語の音節を把握する必要があり、これが計算機での算出には処理が重いとして、音節の必要ないARIなど様々な指標が公開されていますが、 Microsoft OutlookとMicrosoft Wordが上記FRESおよびFKGLの算出をサポートしていて簡単に扱えるからか、“Understanding WCAG 2.0”の関連リソースにも登場するなど、よく利用されているようです。

Webサービスとして利用できるツールとしては、Readability-Score.comThe Readability Test Toolがあるようです。

日本語でのリーダビリティ指標

日本語にも、FRESやFKGLのような、文体などの情報をもとに算出されるリーダビリティ指標はあるのでしょうか。

比較的よく参照されているのが、情報処理学会に投稿された論文建石由佳, 小野芳彦, 山田尚勇: 日本文の読みやすさの評価式です。

この論文では、過去の日本語リーダビリティに関する論文の手法の長所・短所を分析した結果、日本語文章の読みやすさの要因を次の4つとしています。

  1. 文の平均の長さ(文字)
  2. 各文字種(英字、ひらがな、漢字、カタカナ)の連(同一文字種の文字の一続き)の相対頻度
  3. 文字種ごとの連の平均長さ
  4. 読点の数の句点の数に対する比

論文では、これらの4つの要因を主成分分析を用いて特徴となる成分を抽出し、10変数を用いた線形式を導き出し、その後式を簡略化して、次のような6変数による式を導いています。

RS = - 0.12 × 1s - 1.37 × 1a + 7.4 × 1h - 23.18 × 1c - 5.4 × 1k - 4.67 × cp + 115.79

ここで、 RS は評価、 1s は文の平均の長さ(文字数)、 1a はアルファベット連の平均の長さ(文字数)、 1h はひらがな連の平均の長さ(文字数)、 1c は漢字連の平均の長さ(文字数)、 1k はカタカナ連の平均の長さ(文字数)、 cp は句点あたりの読点の数を表します。

FRESやFKGLは、Microsoft Wordでサポートされていました。この建石論文の評価式については、最近Node.jsで書かれたtextstatにてプラグインtextstat-plugin-jaの機能として実装されました。 よって、これを用いることで機械的なチェックが可能です。

建石論文の評価式は、ちょうど英文におけるFRESのように、読者に関係のない評価式になっていました。これに対し、長岡技術科学大学の柴崎教授がサイトで公開されているリーダビリティー公式は、小学1年生から中学3年生までの学年を判定することができる式になっています。

Y = - 0.148 x 1 + 1.585 x 2 - 0.117 x 3 - 0.126 x 4 + 15.581

ここで、 Y は学年、 x 1 は文章中の平仮名の割合、 x 2 は1文の平均述語数、 x 3 は1文の平均文字数、 x 4 は1文の平均文節数を表します。

また、柴崎教授らのリーダビリティー・リサーチ・ラボでは、日本語リーダビリティー測定を公開されており、前記の式を用いたテキストの判定が可能です。 このツールを用いて、リーダビリティ値が10以下であれば、そのテキストは中学校3年生のレベルになっていると言えます。

ということで、大変長い旅でしたが、当初の目的であった「前期中等教育レベルを超えた読解力を必要とするほど難解かどうか」をツールを用いて判断するめどがついてきました。

さらに対応が望まれる実装方法を考える: やさしい日本語

ここまで、英語、日本語と、文章の読みやすさを計測する方法を調べてきました。もともと、JIS X 8341-3:2010の達成基準を満たす実装方法を調べるところから出発しているため、客観的な読みやすさの計測に力を入れてきました。

しかし、調べれば調べるほど、モヤモヤがおさまりません。なぜでしょうか。ここまでの公式にあるとおり、これらの指標は文章に含まれる文字種に大きな影響を受けます。また、二重否定や婉曲表現、複雑な係り受けなど、文章表現には一切触れていません。

客観的・機械的な計測は無理かもしれないけど、根本的に表現や内容を書き換えるアプローチはないのだろうか…。また、少し旅に出ることにしました。

やさしい日本語

調査の結果わかったことが、「やさしい日本語」を使う活動がこれにあたるということです。「やさしい日本語」は、主に行政が発信する災害などの情報について、普段使われている言葉を外国人にもわかるように配慮した、簡単な日本語のことです。

当初弘前大学人文学部 社会言語学研究室から始まった活動とのことですが、東日本大震災以降、全国の自治体のサイトにて、やさしい日本語を使った情報発信が行われているようです。

書き換えの例:

津波災害から身を守るためには「日頃の備え」と「迅速な避難」が必要です。
津波つなみから自分じぶんまもるためには「ふだんの準備じゅんび」と 「はや避難ひなん(はやげること)」が必要ひつようです。

既存の文書をやさしい日本語に書き換えるためのルールや基準が公開されています。

取り組みとしては自治体の災害対策が主流ですが、NHKによるNEWS WEB EASYのような、やさしい日本語によるニュースサイトや、MATCHAのようなWebマガジンにも広がりを見せています。

よって、難解な文章を達成基準7.3.1.5をより高いレベルで適合とするには:

  1. 「やさしい日本語」のルールに基づいて全面的に書き換える
  2. 柴崎教授らの日本語リーダビリティー測定で検証を行う

という作業を行うことが、「さらに対応が望まれる実装方法」だと考えます。

参考リンク

は!

は、WEBTENNAさんによる「色について(仮)」です。お楽しみに!