データサイエンスを学ぶ際に必要なことを、データサイエンティスト育成の目線から考えてみた話:SAS Global Forum レポート②

SAS Global Forum レポート②

ーデータサイエンスを学ぶ際に必要なことを、データサイエンティスト育成の目線から考えてみた話ー

レポート①につづいて、レポート②では、SAS Global Forum 2017で、データサイエンスを体系的に知る上でも印象的だったセッションについて、私の視点からご紹介します。

 

■アナリティクスの祭典は想像以上に華やかな世界

SAS Global Forumに参加して、まずびっくりしたのが、想像以上に華やかだったこと。

その中の一部ですが、メイン会場のスクリーンすごい大きいし、横に長い!!

カラフル!

f:id:shiori310c:20170525000323j:plain

画面に収まりきってないけど、左右にもさらにスクリーンがあります。

だから、どこの席に座っても、スピ―カーの顔がはっきりわかる!

(過去に東京ドームで開催された、とある有名な世界的女性アーティストのライブでは、スクリーンを斜め30度くらいの角度から見ていたため、非常に見づらかったのを思い出します)

 

f:id:shiori310c:20170525142611j:plain

この会場は毎朝行われるゼネラルセッションの会場で、いわば朝会会場のような感じでした!学校でいうところの体育館?やホールに相当。

開会セレモニーもここでやってました。

終了後は新宿駅の通勤ラッシュ時並みの混雑。

f:id:shiori310c:20170525144241p:plain

この方たち、おそらく皆さん全員データサイエンス関連の人!まさにアナリティクスの祭典です。(お顔にモザイク加工を入れさせていただいてます)

 

■領域もトピックも多様すぎて回り切れない

4日間フルで回っても回り切れないのには、まず、セッションの数が多いから。

データサイエンスに関する仕事には、川上から川下までありますが、そういった川上~川下のトピックに、業界を掛け合わせた結果、トピックが膨大にあるのです。

 

今回は、ヘルスケアとか、アカデミックなセッション中心に聞いてきました。

このフォーラムは、SASユーザー(企業・個人・教育機関・その他機関)向けで、その中に学生のセッションやコンペが確立されていました。

 

その他にも、金融とか教育機関、メディア、エネルギーや行政や研究機関や保険、製造業やサービス業、スポーツなど、様々な業界のパートナー企業の方のセッションなどもありました。

 

そこで、データサイエンスと各業界とのつながりなども知りました。

 

■データサイエンスを体系的に知るきっかけ

数あるセッションの中で、 印象的なセッションだったのが、「学問分野においてデータサイエンスは発展しているかーまたは消滅の危機に瀕しているかー 英:"How Data Science is Evolving (or Facing Extinction) across the Academic Land Scape"」といったタイトルのセッションです。このセッションはケネソー州立大学の先生がスピーカーとなり、大学が学生に対してサポートできること、等についてお話しされていました。

 

ここのセッションで、データサイエンスを体系的に知るきっかけとなりました。

 

というのも、先ほども書きましたが、データサイエンティストの仕事は、データアーキテクトの仕事や、データクリーニングの仕事といった川上の仕事から、川下の、予測モデルの構築やビジュアライゼーションやストーリーを伝えるといった仕事まであるのです。

(言い切りになっていますが、この話もこのセッションで初めて理解できました)

 

データサイエンスの仕事というと、漠然と分析とその関連というイメージだったのですが、その部分がこの話を聞いて少しクリアになりました。

 

あと、SAS Global Forumで分かったのは、アナリティクス(Analytics)って、翻訳かけると、「分析」とか「分析論」って出てきますが、分析だけのことを指しているんじゃないようです。データサイエンスでいうアナリティクスの指すところの範囲も広いです。

 

スピーカーの先生は、このセッションの中で、「数学、統計学、コンピューターサイエンスの3つが合わさった結果、ビジネス市場にも生き残れる”データサイエンス”が形成されていった」といったことを、ダーウィンの種の形成理論になぞらえて話していたことも印象的でした。

 

このセッションの中で、私が特に重要だと思ったポイントは3つ。

 

①データサイエンスを取り巻く環境は変化し続ける

データは時間とともに生成され続けます。様々な場所で。

 

②大学が学生にできるサポートは、専門スキルと潜在的なスキルを身に着けさせること

専門スキルはテクニカルスキルのことです。数学、統計学コンピュータサイエンス等。学生はたくさんこれらを学ぶのにたっぷり時間がある!といったところでしょうか。たしかに社会人になってから、こういったスキルを仕事をしながら1から学ぶのは大変ですよね。

 

潜在的なスキルとは、ノンテクニカルスキルのこと。ここでいうと、思考スキルなどにあたります。複雑な問題(解なし、もしくは解2つ以上の問題)を解決する力が、変化し続ける環境に適応する力につながるといったことをおっしゃっていました。

 

③民間セクター(企業)と大学とのパートナーシップの重要性

学生の視点からいうと、リアルデータ(実データ)を在学中に見るor分析することが重要という点で、大学と企業とがパートナーシップを組む重要性について強調されていました。

 

データサイエンティスト育成の教育の役割みたいな視点からこういった情報を得ることができて、自分に必要なスキルを再考するきっかけにもなりました。

 

このセッションのペーパーが公開されているので、是非ご覧ください。

SAS Global Forum 2017サイト(English)に行きますhttp://support.sas.com/resources/papers/proceedings17/0837-2017.pdf

 

■データサイエンティストになって、何がやりたいかによっても必要なスキルのバランスも変わってくる

 

こちらは、日本に帰ってきてから、SAS社員さんの話などから教えていただいたことになりますが、データサイエンティストになって、どういうことがしたいかによっても必要なスキルのバランスがかわってくるということです。

 

下図のレーダーチャートでは、ジョブロールごとに有効なデータサイエンスのスキルが示されています。

 

 (Analyticsweekの2015年9月23日付の記事より:2017年5月25日アクセス

https://analyticsweek.com/content/investigating-data-scientists-their-skills-and-team-makeup/

こうやって見ても、リサーチャー系データサイエンティストなのか、ディベロッパー系のデータサイエンティストのなのかで有効なスキルの比重も変わってくることが分かります。

■じゃあ文系出身の学生が今できることって?

大学院に入学してから、データサイエンスの授業で手を動かして分析をした経験はありますが、理論的なところはまだまだ。。

上のチャートを見てもわかるように、ある程度は、どのスキルも必要になってきます。

私はひとまず来月6月の統計検定受験に向けて、勉強していきます。ここで、理論的な知識で不足している部分を補うのが目的です。

 

ここまででレポート②は以上です。

ここまで読んでくださってありがとうございます。