データサイエンスに必要だったRはもう要らなくなる。
皆さんこんにちは、リトマです。
先日、このような記事を目にしました。
Oracle社の書いた、「データサイエンティストのブームは終焉を迎えるのか」といった記事。
この記事では題名の通り、データサイエンティストの今後が描かれていました。
私もデータサイエンティストを一時期は目指していたので、この記事は個人的にとても興味深かったです。
データサイエンティストといえば、「2018年最もセクシーな職業」と謳われた職業。そんな職業が早くもなくなろうとしている、という摩訶不思議な内容。
本日はそんな「データサイエンティストはなくなるか」について、記事の内容に触れながら見ていきたいと思います。
Rを学ぶ意味とは
私といえば「データサイエンティスト」に未来を感じ、今からちょうど一年前ぐらいに勉強を始めました。(データサイエンティストに関しては「学部紹介(同志社大学・文化情報学部」を参照にしてネ)
大学のサポートも充実しており、研究ゼミもそれ関連のモノに入って、日々パソコンを叩いていました。
データサイエンティストに「プログラミングスキル」が必要ってのは皆さん聞いたことがあるかもしれませんが、多くの人は統計解析言語「R」というのを使ってデータサイエンスをします。
今日はこのRにまつわるお話です。
記事で述べられているRが要らない理由は2つありました。
ビッグデータの黎明期には、アルゴリズムは統計解析言語の「R」などで逐次処理しなければならなかった。//「いまではRのアルゴリズムのほとんどは並列化されたビッグデータ環境に移植されているので、以前のような過大なデータ入出力処理に煩わされることはなくなりました。データごとにいちいちアルゴリズムを調整するのではなく、アルゴリズムをそのままデータに適用すればいいのです」//「このようなツールはつい数年前までは存在しませんでした。データ分析を行うには、統計モデルを作ってカスタマイズしたり自分でプログラムを書いたりと、何もかもゼロから始める必要があったのです」
こちらがまず一つ目。つまり、ひと昔前はビッグデータをRを使って自力で解析しないといけなかったが、今はその必要がなくなったということ。
今までカレーを作るのには、「自分でジャガイモを切って、ニンジンを切って、それを煮込んで、刻んだルーを入れて…」といった過程を自分で行う必要があったが、
今ではもう、「機械に入れたらジャガイモやニンジンが勝手に切られる。そしてそれを取り出して次の機械に入れれば勝手に時間通り煮込んでくれて、最後は機械が刻んだルーを入れるだけ」というようになってしまった、というような感じです。
自分で野菜を切ったりする技術(Rの知識)は要らなくなったと。
しかし「Rを学ぶ必要がない理由」はそれだけにとどまりません。
もうひとつの大きな変化は、(例えば「Oracle Big Data Discovery」のような)データ視覚化ツールの登場である。これらのツールによって、ITの専門スキルのない一般のビジネス・パーソンであっても、Hadoopやデータ・ウェアハウスに格納された膨大な非構造化データおよび構造化データを容易に分析できるようになった。データの解析やグラフ化を裏で支えている統計モデルや機械学習のライブラリについて、もはやその存在を意識する必要すらないのである。
これが二つ目に挙げられている理由です。これは先ほどの例でいうと、
「もう野菜を機械にぶっこめば、カレーが出てくる(しかも盛り付けられて)」
ってことです。「野菜を切った後には茹でないといけない」だとか、「ルーは時間をおいてから入れる」だとかそういった類の知識(統計の知識)ももはや要らないということ。
AIや新しい解析ソフトの発達によって、わざわざRを使って「泥試合」をすることもなくなるわけです。
そんななかRを使うのは非効率といわざるを経ない、人間がやらなくていいものをさせるプログラミングにおいて、しなくていいこと(使わなくていい知識を覚えること)に時間を使うのはナンセンスですよね。
こういった2つの理由から、かつてあれほどまでに親しまれていた「R」を学ぶ意義はどんどん減少しているといわれています。
データサイエンティストは終わる?
では、「R」を学ぶ意義が減ったからと言って、データサイエンティストがなくなるのでしょうか。
いいえ、そんなことはありません。
彼らは、「さらに高度な予測モデルを構築すること」に研鑽しなければならない。
さっき言った例でいえば、「カレーを作る機械」を改良していく必要がある、その「誰か」が務まるのは他でもないデータサイエンティストというわけです。
この機械の処理は本当にこれが最適なのか、機械からでてきたカレーに塩っけが足りないのは何故なのか。彼らが考えなければいけないことは多々あります。
これからの時代、データサイエンティストを目指すための選択肢から、「Rを学ぶ」という選択が消えるのかもしれませんね。
「R」を学んできた私としては少し寂しい部分もありますが、時代移りの激しい分野でこれは致し方ないでしょう。
おわりに
いかがでしたでしょうか。
それでもRを学んでみたいという方は、いろいろな講義情報を搭載しておりますので、ぜひそちらもご覧くださいネ。
ご精読ありがとうございました。
データサイエンスを学べる大学ランキングはこちら「データサイエンティストを目指す方にオススメの大学ランキング(関西編)」へどうぞ。