ビッグデータの活用により大きく利益をあげる企業が登場し、IT専門家と数学的な統計・分析スキルを持つデータサイエンティストの需要が高まっています。
当記事では、データサイエンティストの年収や仕事内容、必要とされるスキルについて紹介します。
- データサイエンティストの年収は250万円~1000万円と幅が広く、今後も平均年収は上がる可能性あり
- データサイエンティストの仕事は、非定型なSNSなどのビッグデータをビジネスで活用できる形に分析・加工すること
- データサイエンティストには、SEやプログラマー、統計学の専門家、ビジネスアナリストからの転職のケースあり
目次
データサイエンティストの給料・年収
データサイエンティストの年収は約250~1000万円と非常に幅が広いです。DODA「キャリアコンパス」によると平均年収はおよそ500万円です。また能力給、技術手当といった区分けをとる企業もあり、給料が非公開の企業も見受けられます。IT業界全般に言えますがデータサイエンティストも人手不足であり、今後平均年収は上る可能性があります。
データサイエンティストの生涯年収
平均年収から順当に役職を昇格していったと仮定すると推定で28,000万円ほどになります。日本の労働者全体の生涯年収が18,000万円ほどなので10,000万円程度多いです。ただし基準となるデータが少ないので参考程度の数値になります。
データサイエンティストの仕事内容・役割
データサイエンスという言葉が使われ始めたのは1960年にデンマークのコンピュータ科学者、ピーター・ナウアが計算機科学に対する言葉として使ったのが始まりとされています。著書「Concise Survey of Computer Methods」ではデータの処理技法やその応用技術が記載され、近年データサイエンティストが職業として取り上げられると再評価を受けています。
ビッグデータとは?
データサイエンティストの仕事内容を説明する前にビッグデータについて説明する必要があるでしょう。時折耳にするビッグデータとは従来型のデータベースでは記録や解析が出来ない程の巨大かつ複雑なデータ群のことを指します。どのくらい大きなデータかというとビッグデータの中でも巨大なものになるとエクサバイト(1兆メガバイト)単位にも及びます。因みに2014年度の日本におけるビッグデータ流通量は総務省の発表で約14.5エクサバイトです。これは通常のパソコンでは到底処理しきれない莫大なデータです。しかも幾つものデータ形式に分かれて非構造化、非定形型のデータとして存在するので、これを従来のデータベースに置き換えることは困難とされ、またビッグデータ自体常に更新され続けています。
非構造化データとは「CVSデータ」「固定長データ」「Excelファイル」の様に表に置き換えられるデータ以外ものの事で、非定形型データとは画像データや音声データ、動画データのように規則性のないデータのことです。
規則性のあるデータであれば検索すれば簡単に解析できるのですが、画像や音楽、動画といったデータは個別に見ないとそれがどういった内容の物なのか判断できません。ビッグデータが全てテキストベースのデータであれば量だけの問題なのでそれを処理可能な大容量のコンピューターを用意すれば解析可能なのですが、非定形型データの解析はそれだけでは難しいのです。
データサイエンティストの仕事内容
例えばTwitterやFacebookといった媒体には貴重な情報が詰まっているとよく言われます。企業も事業戦略のために様々な手段を用いてその目的のためにいろいろな媒体からデータ収集を行っています。ところが企業が収集したデータというのは統計されておらず、データ形式もバラバラで整理されていません。しかしその中には貴重な情報が眠っているのです。
データサイエンティストの仕事はこれらの情報を統計学、コンピュータサイエンスを駆使しデータを解析し、企業が見易いように情報を整理しその解析結果を出すことです。これの対称となるのがビッグデータで、ビッグデータは非定形型のデータを含むので人為的な解析が不可欠となりデータサイエンティストという職種が成立している要因にもなっています。
データサイエンティストの役割
データサイエンティストの企業での役割は得た情報をビジネスにどのように活用していくのか?利益を得るためにはどうすればよいのか?これを得られた解析結果を元にして予想モデルを構築します。このように単に解析するだけではなく、それを企業の利益に還元できるように役立てるところまでがデータサイエンティストの役割になります。
【関連記事】
▶データサイエンティストの求人に応募する前に知ってほしい2つのこと
データサイエンティストになるには
データサイエンティストになるには特別な資格や学歴は必要ありません。しかしながらビッグデータの解析に関するノウハウや統計学に関する高い知識が必要です。特にビッグデータ解析には一般的な数学の知識は勿論、プログラミングやビジネスに関する知識、調べる対象によっては医療、材料系などその分野の専門知識も必要となります。大企業になると博士号を持つ人間がデータ解析に当たることもあるほどです。「完璧なデータサイエンティストと呼べる人間は居ない」と言われるほど要求されるハードルが高い仕事がデータサイエンティストです。ではデータサイエンティストになるにはどうしたら良いのでしょう?幾つかのケースを見てみましょう。
プログラマーやSEから転職
プログラミングの実務経験はある筈なので、数学の基礎統計学を学び直し機械学習を習得しましょう。実際のビジネス問題は範囲が広すぎるのでケースバイケースでの対応になるでしょう。なお機械学習とは人工知能における要素のひとつで、自己学習をするコンピューターソフトウェアやそのプログラミング技法を指します。厳密な意味ではデータマイニングとは違うのですが、かなりの部分で重複するので同じ意味合いで用いられることが多いです。これひとつで本が何冊も書けるほど深く、習得にはそれ相応の時間がかかります。なお機械学習にも統計学が必須なので、先にある程度統計学を学び直してから機械学習の方の勉強に取り掛かったほうが良いでしょう。
ウェブ系企業への内定率100%のプログラミングスクールはこちら
統計学の知識がある人が転職
統計ソフトのRかSAS、SPSSなどの知識があると良いです。データ分析で汎用的に活用されるプログラミング言語はPythonなのでこれを学ぶと良いでしょう。他にデータベースのアクセス言語であるSQLの知識も必要となりますが、Pythonの方をある程度学習していればSQL自体はそれほど難しくはありません。また機械学習やデータマイニング、レコメンドエンジンなどの論文(有名な論文は殆ど英語です)に目を通すと実務への応用ヒントが見つかるでしょう。データサイエンティストという職種は定義こそ古いものの実際に専門職として成立したのは割りと最近の話であり、まだ未開拓の部分が沢山残っています。技術的にも仕事の内容的にも洗練されるのはこれからなのです。
ビジネスアナリストから転職
先ほどのRとデータマイニングの学習から入ると良いでしょう。エンジニアとしての実務経験はなくてもビジネスアナリストとして今まで仕事をされてきたのであればビジネスへの理解力は他の職種より高い筈なので、それを武器にデータサイエンティストとして仕事が出来るでしょう。
【関連記事】
▶データサイエンティストとして採用されるには?
データサイエンティストの将来性
データサイエンティストはIT職種として新しい部類です。まだ仕事の技法やデータ解析の手順など細かい部分は試行錯誤の連続で、現在発展途上です。将来性しかありません。人工知能やクルマの自動運転技術など最新のIT技術とも密接に結びついており、伸びしろしか無い状態ですので今後ますます発展するでしょう。
まとめ
データサイエンティストはIT業界の中でも新しい職業で、まだ未発展の部分があり今後ますます発展します。年収は約250~1000万円と大きな開きがあるものの今後均一化されていくでしょう。
データサイエンティストで高収入を目指してみましょう。
データサイエンティストに必要とされるスキルの一つ、プログラミング技術を効率よく学ぶには、ポテパンキャンプなどのオンラインスクールを検討すると良いでしょう。