本連載の意義
巷でよく聞く 「データサイエンス」。
でも、データサイエンスって具体的に何だろう?
そんな近くて遠そうなデータサイエンス、データサイエンスの基盤となる統計学について、基礎的な考えから代表的な手法までを、アイディオットのデータサイエンティストがわかりやすくお伝えします。
連載スケジュール
スケジュールは全6回。
ビジネスや仕事における身近なデータから入り、統計学の代表的な手法についてお伝えする予定です。
なお、スケジュールは本連載掲載時のものであり、予告なく変更する場合もありますので、ご容赦ください。
第1回は、「ビジネスにおけるデータの意味とデータサイエンスの重要なポイント」についてお伝えいたします。
第1回の目的
- 業務やビジネスにおけるデータのイメージを持つ
- データサイエンスは難しいものではない、といったイメージを持つ
- データサイエンスにおける最も重要なポイントを知る
ビジネス・業務におけるデータとは?
身の回りのデータ
突然ですが、みなさん、普段の生活や業務において、自分の身の回りにどんなデータがあるかイメージしていただけますか?
銀行の貯金額、毎月の支出、1つのプロジェクトにかける工数…
色々思い浮かぶかと思いますが、これらがあることで、皆さんはあるメリットを受けていますよね?
貯金額や支出であれば、自分の金銭の管理ができる。
プロジェクトの工数であれば、そのプロジェクトの管理ができる。
そう、 データとはマネジメントするためのツール なのです。
メーターとしてのデータ
ある有名な話として、データは車のメーターやナビに例えられます。
以下の図のように、車のメーターやナビが分からないと、今のスピードや自分がどこにいるか、どう進めばいいか、残りの燃料などわからないですよね?
まさしく事故を起こすために走っているようなものです。
一方、車のメーターやナビがわかれば、スピードや燃料、自分の現在地などがわかり、目的地に到着するまでに何キロのスピードで走ればいいか、いつ燃料を補給すればいいのか、などの目処を立てることもできます。
データは、 普段の生活や業務をマネジメントするためのツールなのです。
データサイエンスの重要なポイント
データ分析の流れ
次に、データサイエンスの重要なポイントを、データ分析の流れに従って見ていきます。
データ分析の基本的な流れは、以下の8つのステップになります。
手前味噌で恐縮ですが、私の大学院生時代の研究を当てはめていきます。
私はちょうどコロナ禍が始まった2020年に大学院に進学し、リモートワークでの不安の増加や業務効率の低下といった課題に対し、VR による解決策を考案しました。
当然、この裏には VR で一儲けできないかと甘い目論見もありましたので、最終的にデモを作成し、ビジコンで発表したりしていました。
そのため、ビジネス的な考え方の例として取り上げられるかと思います。
さて、ここで『データ』と名前のつくものは『データ収集』と『データ解析』の2つになります。
データ分析、ひいては研究において重要なところはその前段階、 「課題」・「調査」・「仮説立案」・「目的」 になります。
ここの「合理性」・「社会的価値」・「新規性」の3つが揃わない限り、いくら面白そうな研究でも通りません。
これはビジネスでも同じことだと思います。
どんな対象がどんな課題を持っていて、その原因は何かをしっかり調査し、どんなソリューションや仮説が考えられるか、達成したいことは何か、
以上をはっきりさせない限り、ビジネスや普段の業務は先に進みません。
まとめ
第1回は、以下3点を目標にして内容を見てきました。
これまでの内容を振り返り、答えを下に加えて改めて整理します。
1.業務やビジネスにおけるデータのイメージを持つ
→ データは普段の業務やビジネスをマネジメントするためのツール
2.データサイエンスは難しいものではない、といったイメージを持つ
→ データは周りにありふれたものであり、データサイエンスは難しいものでない。
3.データサイエンスにおける最も重要なポイントを知る
→ 重要なことは、プロジェクトの課題・目的・仮説。データサイエンスは手段。
次回
次回、第2回はデータの種類、ばらつきについてお伝えする予定です。
目標として、データの種類と様々なデータのばらつきについてイメージを持っていただくことです。
ここまでお読みいただき、ありがとうございました。