視覚に頼らないでデータサイエンスを学習する方法の模索

Takashi Hasuo
Feb 20, 2021

--

視覚障害者などのスクリーンリーダーユーザが直面する、データサイエンス習得における障壁を理解し、改善の糸口を探ります

ノートパソコンの画面を背景に、そのキーボード上に置かれたメガネ
Photo by Kevin Ku on Unsplash

はじめに

目覚ましいAI技術の発展に伴い、その技術を取り巻く多様性について、論じられることが増えてきました。しかしながら、データや学習結果の多様性に関する話題は盛況な一方で、技術を学ぶ環境の多様性に関する議論はまだあまりされていないように感じています。AI社会の持続可能性のためには、その開発プロセスにおける多様な人々の関与が不可欠であり、今後はAI開発環境のアクセシビリティに関しても議論が増えていくことを願っています。

特に日本国内においては、高校の情報教育などでデータサイエンスが取り扱われることも分かってきました(以下、高等学校情報化教材へのリンク参照)。それゆえ、データサイエンス教育のアクセシビリティの課題について、真っ先に直面するのではないかいう懸念があります。

高等学校情報科「情報Ⅱ」教員研修用教材

実際、AI技術の根幹を成すデータサイエンスの世界では、分析手法や教材など、視覚的に捉える必要のある物事が多くあります。それゆえ、視覚障害者など、視覚に頼らずにスクリーンリーダーなどを活用して、コンピュータを操作する人々にとって、データサイエンスは、大変敷居の高い分野であると言えるでしょう。

本記事では、データサイエンスを取り巻く開発環境や教材について、そのアクセシビリティ状況を簡単に俯瞰し、特に課題だと感じているデータのグラフ可視化による分析手法や分析環境等に関する、私の改善プロジェクトに関して紹介したいと思います。

各種開発ツールのアクセシビリティについて

プログラミング用エディタとして人気のあるVisual Studio Codeは、スクリーンリーダーに最適化されたモードを標準で備えているなど 、プログラミングを取り巻く環境は、以前に比べてだいぶ改善してきており、とても良い傾向だと思います。一方で、データサイエンスに欠かせないnotebook-likeな分析環境に関して言うと、一般的なWebサイトに比べて、そのアクセシビリティが不十分なところも多く、まだまだ使いづらいと感じます。ただし、Google Colabは工夫すればある程度の操作は可能になっており、よりポピュラーなJupyterに関しても改善の兆しがあるので、今後に期待できると思います。

Visual Studio Code Accessibility
JupyterLab Accessibility Meetings Minutes

学習教材のアクセシビリティについて

現在では、論文や技術記事など、データサイエンス系の書物は、オンライン上で公開されているなど、スクリーンリーダーで読めるものが多くなっています。また、データサイエンスに欠かせない数式なども、MathML等で記述されていれば、スクリーンリーダーで理解することも可能だと思います。しかしながら、一般的なWebサイト同様、まだまだアクセシビリティが不十分なケースも目立ちます。特にデータサイエンスでは、図解に頼る説明が多いので、アクセシビリティに配慮すべき箇所も多くなりがちです。一般的なアクセシビリティ技術の向上に伴って、改善されていくことに期待したいと思います。

データの可視化など視覚に依存する分析手法について

データサイエンスのアクセシビリティにおいて、最大の障壁かつ、これまで述べてきた課題のように、他分野での改善に伴う解決を見込めそうにないのが、データのグラフによる可視化など、視覚に頼った分析手法に関する諸問題です。また近年では、大量のデータを対象とすることが基本となりつつあるため、代替手段として個々の生データを逐次確認するだけでは、成果を出すのも相当困難となります。データを可視化したりして、素早く多角的に分析するような手法の重要性は、ビジネスや科学、あらゆる分野で高まっています。このような背景から、データ社会で視覚障害者が取り残されないためにも、視覚に依存しないデータ分析の手段を色々と講じることは必要不可欠でしょう。

改善への糸口

まずは、データサイエンスの典型的なチュートリアルを、スクリーンリーダーでひと通り学習できることを目標に、最低限のアクセシビリティを改善するためのツールを開発しています。そうすることにより、データサイエンスを学べる視覚障害者が少しずつでも増えてくれば、徐々に課題も浮き彫りになり、改善が加速するのではないかと考えています。

具体的には、データサイエンスのチュートリアルを公開するのによく用いられているGoogle Colaboratoryを主な対象とし、操作に伴う視覚的な変化などを音声化するライブラリをまずは開発しました。そして、ひと通りの基本操作が出来るようになったのち、今度は本丸であった、グラフデータの音声化に取り組みました。過去グラフデータの音声化に挑戦した際、単純に音声化したものを再生するだけではなく、データサイエンティストが行っているように、インタラクティブにデータの確認が出来るようにして欲しいというフィードバックなどを受けていたので、タッチパッドやマウスを用いて、なぞるようにグラフデータを確認出来るようなツールも開発しました。これにより、データの比較などを細かく行えるようになり、データ分析の幅をひろげることが出来たと思います。

そして、スクリーンリーダーの利用を前提とした、基本的なデータサイエンス実行環境と分析手法のプロトタイプに目処がたったことにより、それらを活用して、基本的な機械学習や高度なディープラーニングのチュートリアルを用意することも出来ました。

まだ暫定版ではありますが、色々とフィードバックを頂きながら、継続して改善を続けていきたいと思っています。また、可能であれば協力者も得られれば嬉しいです。以下に、各種ライブラリやチュートリアルを公開しているページへのリンクを貼っておきます。

さいごに

もし、データサイエンスを学ぶことに興味をもった、スクリーンリーダー利用者のお知り合いがいらっしゃいましたら、ぜひ本プロジェクトのことをお伝え頂けると幸いです。

また、本プロジェクトにてオープンソースとして公開しているものは、まだまだ暫定版ですので、問題点や疑問点だけに限らず、アイデアやアドバイスなどあらゆるご意見を頂けるととても嬉しいです。

もしかすると、将来あなたが視覚障害者になったときにも役立つかもしれませんし、あるいは視覚障害者の中に埋もれている才能を呼び起こすきっかけになるかもしれません。そういった、あらゆる可能性の限界を少しでも広げるためにも、今後も継続して取り組みを続けていければと思っています。ぜひ応援して頂けると励みになります。

注釈: 現状などの整理については、個人的な過去との比較に関する所感であり、現状のアクセシビリティで十分だと考えているわけではない故、誤解がないと助かります。アクセシビリティは、障害の有無が関係なくなる程度の品質を、最終的に目指すべきだと思いますが、本プロジェクトで目指しているのは、そもそも狭い道ですら存在しないような山道を開拓しようとするような段階だと思って取り組んでいます。

--

--

Takashi Hasuo

I’m a data scientist working for an energy data analytics startup in Japan. As a side project, I’m interested in Accessibility for AI.