sagantaf

なんでも自分の思ったこと、経験したことを書いて生きます。

データサイエンティストになるために何を学ぶか

データ分析業務に就くにあたって、何を学んでおくべきかを調べて、考えてみた。 

 

データサイエンティストに必要なスキル

3種類に分かれるらしい。

・IT系

 データを操るスキル。RDBMSSQLHadoopPythonJavaLinuxコマンドなど。

・分析系

 仮説を立てて検証を繰り返す、論理に当てはめる、といったスキル。統計解析、機械学習アルゴリズムの知識など。

・ビジネス系

 分析対象としているビジネスの理解、ストーリーを作り出す力、コミュニケーション力といった明確に示しづらいスキル。質問力、理解力、説得力、伝達力など。

 

 

 

どんなスキルをどうやって磨いていくか

 

分析系は理論に近く、IT系は実務に近い。分析系を学び、IT系で実践して血肉にするという意味で、二つは同時に習得していくことで、相乗効果が生まれると思う。だから、スキルで分割した学習の方法(分析系の習得にこれをやって、IT系の習得にはこれをやる)ではなくて、技術で分割した学習の方法で進める。

例えば、k-means法について理論からPythonのscikit-learnを使った実装方法までを一気通貫で学ぶ、とか。

ただし、データ分析の実装手段であるIT技術は入れ替わりが早い特徴がある。逆にデータ分析の根本である理論は変わらないので、理論を中心に学習を進める。

× あるひとつの理論の様々な実装方法を習得する

○ 複数の理論に対し、少なくとも1種類の実装方法を習得する

 

一方、ビジネス系は独立しているけど、どんなビジネスマンにも必要なスキルだと思う。インプットを理解し、アウトプットを説明する時、つまり最初と最後に必要になる。

ある程度は書籍で学べるかもしれないけど、抽象的な部分を抜け出せない気がする。

これに関しては実務あるのみ、で顧客の業務を理解し、要望を聞いたり、結果を説明するなど実践したことに対して、反省し次へ活かすプロセス(PDCA)を回すことで習得していく。 

 

 

 

EOF