第一回【データサイエンスって何?】データサイエンスの基礎〜データ解析の意味と 重要なポイント〜

第一回【データサイエンスって何?】データサイエンスの基礎〜データ解析の意味と 重要なポイント〜

本連載の意義

巷でよく聞く 「データサイエンス」。
でも、データサイエンスって具体的に何だろう?
そんな近くて遠そうなデータサイエンス、データサイエンスの基盤となる統計学について、基礎的な考えから代表的な手法までを、アイディオットのデータサイエンティストがわかりやすくお伝えします。

連載スケジュール

スケジュールは全6回。
ビジネスや仕事における身近なデータから入り、統計学の代表的な手法についてお伝えする予定です。
なお、スケジュールは本連載掲載時のものであり、予告なく変更する場合もありますので、ご容赦ください。
第1回は、「ビジネスにおけるデータの意味とデータサイエンスの重要なポイント」についてお伝えいたします。

第1回の目的

  1. 業務ビジネスにおけるデータのイメージを持つ
  2. データサイエンスは難しいものではない、といったイメージを持つ
  3. データサイエンスにおける最も重要なポイントを知る

ビジネス・業務におけるデータとは?

身の回りのデータ

突然ですが、みなさん、普段の生活や業務において、自分の身の回りにどんなデータがあるかイメージしていただけますか?
銀行の貯金額、毎月の支出、1つのプロジェクトにかける工数…
色々思い浮かぶかと思いますが、これらがあることで、皆さんはあるメリットを受けていますよね?
貯金額や支出であれば、自分の金銭の管理ができる。
プロジェクトの工数であれば、そのプロジェクトの管理ができる。
そう、 データとはマネジメントするためのツール なのです。

メーターとしてのデータ

ある有名な話として、データは車のメーターやナビに例えられます。
以下の図のように、車のメーターやナビが分からないと、今のスピードや自分がどこにいるか、どう進めばいいか、残りの燃料などわからないですよね?
まさしく事故を起こすために走っているようなものです。

一方、車のメーターやナビがわかれば、スピードや燃料、自分の現在地などがわかり、目的地に到着するまでに何キロのスピードで走ればいいか、いつ燃料を補給すればいいのか、などの目処を立てることもできます。
データは、 普段の生活や業務をマネジメントするためのツールなのです。

データサイエンスの重要なポイント

データ分析の流れ

次に、データサイエンスの重要なポイントを、データ分析の流れに従って見ていきます。
データ分析の基本的な流れは、以下の8つのステップになります。

 

 

手前味噌で恐縮ですが、私の大学院生時代の研究を当てはめていきます。
私はちょうどコロナ禍が始まった2020年に大学院に進学し、リモートワークでの不安の増加や業務効率の低下といった課題に対し、VR による解決策を考案しました。
当然、この裏には VR で一儲けできないかと甘い目論見もありましたので、最終的にデモを作成し、ビジコンで発表したりしていました。
そのため、ビジネス的な考え方の例として取り上げられるかと思います。

さて、ここで『データ』と名前のつくものは『データ収集』と『データ解析』の2つになります。
データ分析、ひいては研究において重要なところはその前段階、 「課題」・「調査」・「仮説立案」・「目的」 になります。
ここの「合理性」・「社会的価値」・「新規性」の3つが揃わない限り、いくら面白そうな研究でも通りません。
これはビジネスでも同じことだと思います。
どんな対象がどんな課題を持っていて、その原因は何かをしっかり調査し、どんなソリューションや仮説が考えられるか、達成したいことは何か、
以上をはっきりさせない限り、ビジネスや普段の業務は先に進みません。

まとめ

第1回は、以下3点を目標にして内容を見てきました。
これまでの内容を振り返り、答えを下に加えて改めて整理します。

1.業務やビジネスにおけるデータのイメージを持つ

→ データは普段の業務やビジネスをマネジメントするためのツール

2.データサイエンスは難しいものではない、といったイメージを持つ

→ データは周りにありふれたものであり、データサイエンスは難しいものでない。

3.データサイエンスにおける最も重要なポイントを知る

→ 重要なことは、プロジェクトの課題・目的・仮説。データサイエンスは手段

次回

次回、第2回はデータの種類、ばらつきについてお伝えする予定です。
目標として、データの種類と様々なデータのばらつきについてイメージを持っていただくことです。
ここまでお読みいただき、ありがとうございました。

データカテゴリの最新記事