コラム

今さら聞けないデータサイエンティストとは?スキル・仕事内容・必要な資格

2020年09月28日

データサイエンティスト

データサイエンティストは、数学や統計学などの知識を持ち、ビッグデータ分析を通じてビジネスの課題解決や新たなビジネスチャンスへとつなげる仕事です。2012年に「ハーバード・ビジネス・レビュー」で21世紀でもっともかっこいい仕事として紹介され、一気に認知度が上がりました。データサイエンスという言葉自体はもう少し古くからあり、1960年ごろから使われています。
ビッグデータの活用がビジネスで不可欠となる中、日本でのデータサイエンティストの需要は依然として高いと考えられます。「データサイエンティスト」の定義や役割、必要なスキルについて解説します。

データサイエンティストとは

データサイエンティストとは、統計学やAI・機械学習などの技術を用いてデータを分析し、ビジネス課題を解決するデータサイエンスの専門職です。ビッグデータと呼ばれる大規模なデータの活用が企業において重要視される中、ビッグデータを分析して新たなビジネスの価値や知見を生み出していくデータサイエンティストの役割に注目度が高まっています。

データサイエンスとは

データサイエンスとは、さまざまなデータを分析して問題を解決したり、新たな価値を生み出す研究分野です。ITスキルやプログラミングスキル、統計学や数学などのデータ分析に関する知識と、各種の専門分野の知識とを掛け合わせることで、データから新たな知見を得ます。
インターネットや科学技術、AIの発展などにより、ビジネスだけでなく医療や教育などの現場でもデータサイエンスは活用されています。

データサイエンティストが生まれた背景

データサイエンティストが生まれた背景として、ビッグデータ市場の拡大が挙げられます。ビッグデータとは、データの量が多いだけでなく、さまざまな形頻繁に更新されるデータです。
2000年代以降のインターネット技術の進化、スマートフォンの普及などで、個々人のインターネット上での行動が収集されるようになりました。またIoTの発達によってモノがインターネットにつながり、センサーによって自動でデータの取得が可能になっています。
静止画や動画、音声、気温や湿度といった気象データ、モノの位置や稼働状況、人の移動などさまざまなデータの収集・蓄積が可能になったのです。

あわせて読みたい

【将来やセキュリティについても解説】参考になるIoT活...

最近では生活においてもビジネスにおいても、「IoT(Internet of Things)」という言葉をよく聞くようになりました。IoTではパソコンやスマートフォンに限らず、あらゆる身の回りのモノがモジュールを通してインターネットに接続し、デ...

ビッグデータと呼ばれるこれらのデータを本格的に活用し、競争力を高めたいと考える企業が増えたことで、データ分析を行い課題を解決したり、新しいビジネスの価値を生み出すデータサイエンティストの需要が高まりました。

ビジネスにおけるデータサイエンティストの役割

データサイエンティストの仕事は、データを分析しビジネス上の課題を解決したり、マーケティングや経営戦略に活かしていくことです。データサイエンティストの仕事を細分化すると、大きく以下の4項目に分かれます。

・課題の把握
・データの収集と整理・蓄積
・データの可視化と分析
・レポート作成と報告

課題の把握

データを収集して分析を行う前に必要なのは、課題を正確に把握し、目標値や解決すべきことを明確にすることです。
具体的にはビジネス現場にヒアリングを行い、課題を抽出します。各課題に達成目標を設定し、優先度の決定仮説の洗い出しなどを行います。

データの収集と整理・蓄積

データの収集では、できる限り多くのデータを集めます。収集したデータの形式を分析しやすい適切な形式に加工変換して整え、データベースに蓄積しています。
またはデータレイクと呼ばれる加工や変換が不要なデータ保存のソリューションを利用し、必要に応じてデータを選んで分析対象とします。

あわせて読みたい

データレイクとは?DWHとの違い、データレイク構築サー...

データレイクとは データレイクとは、さまざまなソースからのビッグデータを加工・変換などせずに元の形式のままで保持する広大な領域のことです。データレイク(Data Lake)という名称の通り、発生したままの状態で支流から流れ込むデータを魚...

データの可視化と分析

蓄積されたデータはBIツールなどを利用して可視化し、データ分析を行います。このプロセスにおいては、R言語、Pythonなどのプログラミングスキルだけでなく、統計学や経営視点など幅広い知識が求められます。

レポート作成と報告

データ分析結果をまとめ、改善点や戦略などをレポートとして作成します。データの内容を専門知識がない人にもしっかりと把握してもらうため、図形やグラフィックなどを使ってわかりやすい形式に整えるのも、データサイエンティストの仕事です。

データサイエンティストに必要なスキル

データサイエンティストに求められるスキルは、幅広いITスキル統計解析のスキル、さらに経営学やマーケティングなどのビジネススキルと多岐に渡ります。「一般社団法人 データサイエンティスト協会」ではデータサイエンティストに必要なスキルを3つに分類しています。

データサイエンス力:情報処理、人工知能、統計学などの情報科学系の知恵を理解し、使う力
データエンジニアリング力:データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力
ビジネス力:課題背景を理解した上で、ビジネス課題を整理し、解決する力

出典:http://www.datascientist.or.jp/symp/2019/pdf/1115-1155_skill.pdf

ここではデータサイエンティストに必要なスキルを細かく説明していきます。

数学、統計学

データサイエンティストの基本的なスキルと言えるのは、データ分析において重要となる数学統計学です。
データ分析では最低でも高校卒業程度の数学知識(確率・統計や行列、微分積分など)が求められます。さらに専門的なデータ分析を行う場合は、大学初級程度の数学で学ぶ解析学や線形代数なども理解しておく必要があります。
統計処理や数理モデルを用いてデータ分析を行うため、統計学の知識も必要です。統計用語についての理解に加えて、求められるレポートを出すためにはどの分析方法を使えばいいかなど、統計処理の手法についての知識も要求されます。
一般的にデータ分析はBIツールなどを用いて行われます。そのため、データ分析ツールを使いこなせるスキルも必要です。

AIに関する知識(機械学習、ディープラーニング)

機械学習ディープラーニングなど高度なAI開発・実装も、データサイエンティストに求められるスキルの一つです。
機械学習とは、コンピュータがデータを学習し、特定のタスクを実行するためのアルゴリズムやモデルを自動的に構築するAI技術の一部です。ディープラーニングは大量のデータから規則性や関連性を抽出し、特徴を定義する作業を自動化したもので、機械学習の一分野とも言えます。
膨大なデータを分析処理するにあたり、人の手を介した作業には限界があります。データ分析の一部をコンピュータが自動的に行ってくれることで、短時間でより多くのデータ分析を行うことができます。また、人では気づかない着眼点をコンピュータによって発見することも可能です。

プログラミング

データサイエンティストの仕事の実務上ではプログラムを書くケースがあるため、プログラミングの知識は必須と言えます。

SAS、R、Pythonなどのコーディング言語

データ分析ではSPSSやSASなどの統計ツールを活用することもありますが、データ収集の際のバッチ処理やデータの形式を統一する際などに、R言語やPythonといったオープンソースのプログラミング言語を書く機会があります。
R言語やPythonは統計処理向けのプログラミング言語のため、他のプログラミング言語に比べて効率的にデータ分析ができます。Pythonは汎用性が高く、AIや人工知能の開発に活かせる他Webアプリの作成にも利用されています。
R言語またはPythonのような統計解析向けプログラミング言語の習得は、データサイエンティストの実務上で必須のスキルと言えるでしょう。

MySQLやPostgresSQLなどのデータベース

膨大な量のデータはデータベースに格納され、必要な時にデータベースから抜き出してデータ分析を行います。そのため、データベースの知識もデータサイエンティストには必要です。MySQLやPostgresSQLなどのデータベース管理システムや、データを操作するための言語SQLに関する使用経験や知識が求められます。

ビッグデータの取り扱い

ビッグデータはデータの容量が多いためデータ蓄積や操作、分析には特別なツールやプラットフォームを利用します。ビッグデータを取り扱うデータサイエンティストには、それらのツールを取り扱うための知識も必要です。たとえばHadoopMapReduce.はよく使われるオープンソースです。

HadoopとMapReduce.

Hadoopとは、分散処理技術を利用して大容量のデータを蓄積・分析するオープンソースのソフトウェアフレームワークです。MapReduceはHadoopフレームワーク内の必要コンポーネント一つで、Hadoopのファイルシステム内に格納されたビッグデータにアクセスする際に使うモジュールです。
ビッグデータの分析においては、Hadoopや同様に分散処理技術を利用して高速処理を行うSparkなどの操作知識が必要となるでしょう。

クラウドなどのインフラ構築

ビッグデータの分析は負荷が高い処理になるため、ローカルPCではなくクラウドで行われるのが一般的です。データサイエンティストにはクラウド技術の基礎的な知識や、ストレージネットワークリソースなどインフラ構築の知識も備わっていることが求められます。

ビジネススキル

仮説を元にデータを分析し、課題を解決するためのレポートや新しいビジネス価値を生み出すデータサイエンティストには、ビジネスに関する深い知見が求められます。
分析対象のビジネスの仕組みを理解し、課題の抽出からデータ分析、レポートの作成まで行う必要があります。データ分析から結論を出す過程においては論理的な思考が求められ、ロジックツリーやピラミッドストラクチャー、MECEなどロジカルシンキングの手法を利用します。
どんなに適切で価値のある分析結果も相手に伝わらなければ意味がありません。データサイエンティストには、プレゼンの能力も必要です。ITや統計の知識がない人でもわかる形に分析結果をまとめ、課題の解決方法や新しいビジネス価値が理解できるようなプレゼンテーションスキルが重要となります。

専門分野を持つ

データサイエンティストには幅広い知識が必要とされますが、技術職や研究出身で統計解析の深い専門知識がある人や、コンサルタント出身などでビジネススキルを持った人など、得意分野はさまざまです。医療やバイオといった専門分野の知識や、マーケティングなどの深い知識を持ったうえでデータ分析を行うことで、膨大なデータから意味のある結果にたどり着くことができます。
専門分野によっては、IT業界だけでなく、金融やメーカーなど活躍できるフィールドも広がります。データサイエンティストとして実務経験を積めば、マネジメント、スペシャリスト、転職や独立など、広いキャリアパスが描けるでしょう。

データサイエンティストになるには

Harvard Business Reviewにおいて「21世紀で最もセクシーな職業」と言われたデータサイエンティストは、近年人気の職業です。データサイエンティストになるための特定の資格はないため、実務経験やスキルがあればデータサイエンティストになることもできます。
ここではデータサイエンティストの需要や、取得しておくと役立つ資格をご紹介します。

データサイエンティストの需要

AIやビッグデータの取り扱いができるデータサイエンティストは、現在高い需要のある仕事です。実務経験や深い専門知識があるデータサイエンティストはそう多くないため、ビジネスだけでなく教育や医療分野など幅広いフィールドで活躍できるでしょう。
一方で、将来必ずしもデータサイエンティストの需要があり続けるとは言い切れない点にも注意が必要です。
データサイエンティストの需要は、AIの進化の影響を受けると考えられます。現在データサイエンティストが行なっている作業も、高度なAI技術や自動化されたソフトウェアの進化により、人の手を介さずに行うことができるようになる可能性があります。
データサイエンスのみの知識や技術ではAIとの差別化は難しく、アナリストやコンサルタント、エンジニアなどのスキル、専門分野への深い造詣や高いプレゼン能力を持ったデータサイエンティストだけが生き残るという状況が考えられます。
とはいえ、ビッグデータの市場は拡大しており、AIができない仕事領域もまだあるため、データサイエンティストの需要がすぐなくなることはないでしょう。データサイエンティストとしてスキルアップするためには、常に新しい技術にアンテナを張り、調査や分析などのアウトプットを続ける努力が必要です。

データサイエンティストに関連する資格

データサイエンティストになるための特定の資格はありませんが、取得しておくと役立つ資格があります。ここではデータサイエンティストに関連する資格の概要や難易度(合格率)、受験要項を紹介します。

情報処理技術者試験(基本・応用)

情報処理技術者試験は情報処理の知識・技能が求められる試験で、ITエンジニアが取得する資格です。基本的な知識や技能は基本情報技術者試験、応用の知識や技能は応用情報技術者試験があり、IT全般の知識が求められます。

資格種類:国家試験
試験日程:4月・10月
合格率:基本情報技術者 28.5% 応用情報技術者 23%
受験資格:特になし
受験料:5,700円
公式サイト:https://www.jitec.ipa.go.jp/
運営団体:独立行政法人 情報処理推進機構(IPA)

データスペシャリスト試験

データスペシャリスト試験は情報処理技術者試験の資格の一つで、高度な知識・技能が求められる高度(プロフェッショナル)試験に該当します。膨大なデータを管理するデータベースシステムの構築や、データ分析基盤を提供するエンジニアが取得する資格です。

資格種類:国家試験

試験日程:春期(4月第3日曜日) 秋期(10月第3日曜日)

合格率:14.4%

受験資格:特になし

受験料:5,700円

公式サイト:https://www.jitec.ipa.go.jp/

運営団体:独立行政法人 情報処理推進機構(IPA)

OSS-DB技術者認定試験

オープンソースのデータベース(OSS-DB)に関する技術力や知識認定するIT技術者のための資格です。データベースシステムの設計・開発・導入・運用など基礎知識が問われるSilverと、大規模データベースシステムの改善・運用管理・コンサルティングができる技術者向けのGoldの2種類の資格があります。

資格種類:民間資格

試験日程:随時開催

合格率:非公開

受験資格:Goldの試験はShilver資格保持者のみ

受験料:15,000円

公式サイト:https://oss-db.jp/

運営団体:特定非営利活動法人 エルピーアイジャパン(LPI-Japan)

統計検定(1~4級)

統計検定とは、統計に関する知識や活用力を認定する資格です。データサイエンスにおいて基礎となる統計に関しての知識や能力を客観的に評価してもらうことができます。1級〜4級までのレベルがありますが、データサイエンティストとしては「実社会の課題に対する適切な手法の活用力」とされる準1級以上の取得が望ましいです。

資格種類:公的資格

試験日程:6月・11月・2〜4級はCBTで随時

合格率:準一級 21%

受験資格:特になし

受験料:1級(統計数理および統計応用) 10,000円

準1級 8,000円

2級 5,000円

3級 4,000円

4級 3,000円

公式サイト:https://www.toukei-kentei.jp/

運営団体:一般財団法人 統計質保証推進協会

統計士・データ解析士

統計士・データ解析士は、一般財団法人実務教育研究所の通信講座を修了すると取得できる資格です。統計士の取得は「現代統計実務講座」を8ヶ月受講、データ解析士の取得は「多変量解析実務講座」を4ヶ月受講する必要があります。文部科学省認定講座で、優秀な成績を納めた場合には修了時に文部科学大臣から「文部科学大臣賞」が授与されます。

資格種類:民間資格

試験日程:通年

合格率:非公開

受験資格:通信講座の受講

受験料:統計士 入学金5,000円 受講料54,800円

データ解析士 入学金5,000円 受講料49,500円

公式サイト:http://www.jitsumu.or.jp/

運営団体:一般財団法人 実務教育研究所

G検定・E資格

G検定・E資格はAI技術に関する資格で、G検定はディープラーニングを活用する人材向け、E資格は実装するエンジニア向けです。データサイエンティストに求められるスキルの一つ、機能学習やディープラーニングに関する知識や技能を測ることができます。

資格種類:公的資格

試験日程:G検定 3月・7月・11月 E資格 2月・8月

合格率:G検定 68.2%(累計)E資格 67.4%(累計)

受験資格:E資格は認定プログラムの受講修了後に受験可能

受験料:G検定 一般12,000円 学生5,000円

E資格 一般33,000円 学生22,000円 会員27,500円

公式サイト:https://www.jdla.org/

運営団体:日本ディープラーニング協会(JDLA)

Python 3 エンジニア認定基礎試験

Pythonは、データサイエンティストとしての業務上役立つプログラミング知識です。Python 3 エンジニア認定基礎試験は文法基礎を問われる試験となるため、まずは基礎試験を受験すると良いでしょう。さらにPythonを使ったデータ分析や方法まで踏み込んで習得するのであれば、Python 3 エンジニア認定データ分析試験があります。

資格種類:民間資格

試験日程:通年

合格率:正答率70%で合格

受験資格:特になし

受験料:一般10,000円 学生5,000円

公式サイト:https://www.pythonic-exam.com/pythonic

運営団体: 一般社団法人 Pythonエンジニア育成推進協会

画像処理エンジニア検定

画像処理エンジニア検定は画像処理の開発・設計に関する資格で、取得しておくとデータサイエンティストの実務上役立ちます。画像処理に関する基礎知識を問われるベーシックと、専門知識の理解と応用力が求められるエキスパートの2種類があります。

資格種類:公的資格

試験日程:7月・11月

合格率:ベーシック 67.9% エキスパート 32.60%(2019年後期)

受験資格:特になし

受験料:ベーシック 5,600円 エキスパート 6,700円

公式サイト:https://www.cgarts.or.jp/kentei/about/img_engineer/index.html

運営団体:公益財団法人 画像情報教育振興協会(CG-ARTS協会)

まとめ

データサイエンティストは、ビッグデータの活用が重要視される時代に求められる専門職種です。数学や統計学だけでなく、AIやプログラミング知識、経営戦略やビジネススキルなど幅広い知識や技術が要求されますが、常に新しい技術をキャッチアップして専門性を高めていくことで、長く活躍するデータサイエンティストになることができるでしょう。

この記事を書いた人

QEEE編集部

QEEEmagazineはマーケター、人事、エンジニア、営業企画などの企画者に役立つコンテンツをそれぞれ領域のスペシャリストが発信していきます。

投稿一覧へ

他サービスはこちら