motchie.com

The Golden Rule

アクセシビリティ=マルチモダリティ・アーキテクチャ

はじめに

この記事はアクセシビリティの祭典2017『話題の技術とアクセシビリティ(IoT、VR、AR、音声など)』のトークセッションでお話しようと準備した内容をまとめたものです。

ここまで、IoTVRシステムAI音声アシスタントの事例を通して、それらのシステムのアクセシビリティについて見てきました。

では、これらの事例から、私たちが今後アクセシブルなシステムを設計する上で大切な共通の知見を得ることはできるでしょうか。

[イメージ写真]

Photo credit: michaelseangallagher via Visualhunt / CC BY-SA

音声アシスタントからヒントを得る

私は、ヒントは音声アシスタントにあると考えました。

例えばSiriやCortana、Googleアシスタントは、音声アシスタントの機能もありますが、音声の代わりにテキストでも指示を出し、結果をテキストで受けとることができます。

つまり、発話による指示(入力)と聴覚に対する音声でのフィードバック(出力)に限らず、(支援技術によるものも含め)テキストによる指示(入力)とテキストでのフィードバック(出力)が可能になっています。

このように、システムに対して複数の感覚器による同等の入出力が可能であるシステムを 「マルチモダリティ・アーキテクチャ(multimodality architecture)」と呼ぶことにします。

この概念で新規システムを設計すると、シングルモダリティなシステムに比べアクセシビリティが向上すると考えられます。また、同じ概念を用いて既存システムのアクセシビリティを評価することができるのではないかと考えます。

モダリティという用語

「モダリティ」という用語は、さまざまなジャンルでさまざまな定義がありますが、ここでは、人間とコンピューターのインタラクションの分野で用いられる以下の定義を指しています。

In the context of human–computer interaction, a modality is the classification of a single independent channel of sensory input/output between a computer and a human.

つまりは、人間同士、あるいは人間とコンピューター間の情報伝達における手段を指し、そのようなコミュニケーションにおけるチャネルや経路ということができます。

人間とコンピューター間のモダリティの例:

  • 視覚
  • 聴覚
  • 振動その他の動き

マルチモダリティ・アーキテクチャ

クラウド・コンピューティングと、スマートフォン、タブレットの急速な普及に伴って、クラウドを利用したサービスを展開する際には「マルチデバイス対応」を行うことが一般的になりました。サービス・デザインや設計・開発のすべてにおいて、この「マルチデバイス対応」を意識しておく必要があります。

同様に、今後何かサービスを開発する場合には、「マルチモダリティ・アーキテクチャ」を採用する方がよりアクセシブルなサービスになると考えます。

「マシンリーダブル=アクセシビリティ」との関連

昨年の「アクセシビリティの祭典」のスローガンでもあり、今年もセッションが設けられる「マシンリーダブル=アクセシビリティ」については、「リーダブル」と書いてありますので、 主に消費するコンテンツのアクセシビリティに主眼が置かれていると考えます。

これに対し、IoTや音声アシスタントなど、入出力を伴うシステム(サービスやアプリケーション)においては、出力である"read"以外に、 ユーザーからシステムに対する入力に関してもカバーする必要があります。

このようにカバーする範囲を広げてアクセシビリティを考える場合には、「マルチモダリティ」が重要であると考えます。

マルチモダリティの視点で、既存システムのアクセシビリティを評価し改善方針を立てる

ここまで議論してきた、IoT、VRシステム、AI音声アシスタントのアクセシビリティのすべてが、この「マルチモダリティ」で評価し、改善方針を立てることができます。

電源の状態をLEDランプだけで知らせるIoTデバイス
視覚に頼った情報提供のため、モダリティが複数ではありません。ブザーを鳴らす、バイブレーションで振動することで、マルチモダリティになります。
ヘッドトラッキング機能付きHMDを使うVRシステム
視覚とに頼った情報提供である可能性があります。3次元サウンドを併用することで、マルチモダリティになります。
音声のみで指示を出し、音声でフィードバックを返すスマートスピーカー
聴覚に頼った入力および出力のため、モダリティが複数ではありません。スマートフォン・アプリなど、別の入出力チャネルを設けることで、マルチモダリティになります。

コンテンツのアクセシビリティへの応用

「マルチモダリティ・アーキテクチャ」は、システムの入出力に注目した概念だと書きましたが、より拡張した概念ですので、もちろんコンテンツにも応用できます。

例えば、代替テキストのない画像については、視覚に頼った情報提供であり、モダリティが複数ではないと考えることができます。これは、代替テキストを提供することで、マルチモダリティになると考えることができます。

まとめ

コンテンツだけでなく、アプリケーションやシステムを設計する際には、そのユーザーである人間とのモダリティが複数あるかどうかに注目します。

その結果、複数のモダリティを提供する設計になっていれば、単一のモダリティに比べ、アクセシビリティが向上していると言えます。