Goalist Developers Blog

Amazon QuickSightで求人データを可視化しました

こんにちは、ゴーリストの鈴木です。

2016年11月16日より、Amazon QuickSightというBIツールの一般提供が開始されました。

f:id:suzutt:20161118212646j:plain Amazon QuickSightが一般提供開始 – 高速で利用が簡単なビッグデータ用ビジネスアナリティクス | Amazon Web Services ブログ

というわけで早速、Amazon QuickSightを使って全国の求人データを可視化してみました。
本記事を読んでAmazon QuickSightを使うと何ができるかというイメージを掴んでもらえればと思います。

Amazon QuickSightとは

冒頭の紹介の通り、Amazonが提供するBIツールです。用意したデータを自分の好きな形式で可視化することができます。
特にAWS上のデータをグラフ化することが得意なようです。

Amazon QuickSightの概要については、公式ページに分かりやすく書いてあるので、一度読んでおくとよいかと思います。

アカウント作成

アカウントを作成します。
2016年11月24日現在、Amazon QuickSightは東京リージョンで提供されていないので、オレゴンリージョンを使うことにしました。

データセットの作成

可視化対象のデータを定義します。具体的には、ローカル環境のcsvデータをアップロードします。

今回は大泉洋さんのCMでおなじみの「リクナビNEXT」の11月14日分の求人データを対象にします。(6000件程度)

もちろんデータセットとしてローカル環境のcsvデータだけでなく、S3、RedShift、RDBなどのAWS上のデータや、オンプレ環境のDBなどを使うことが可能です。
詳細は公式ページをご参照ください。

Analysisの作成

データセットの作成が終わったので、次はAnalysisの作成です。
ここではどのように可視化するか(どのグラフを使うか)を設定します。

手順としては、基本的には以下の2つとなっています。簡単ですね。

  1. どのグラフ(Visual types)を使うかを選択する
  2. どの項目をグラフに反映させるかを選択する

今回は分析の目的を設定せず、できるだけ多くのグラフを使ってみようと思います。
使用可能な表、グラフは公式サイトに記載があります。
2016年11月24日現在、13種類の表、グラフがあります。
今後は、ヒストグラム、箱ひげ図、分散の可視化(マップ)が追加予定のようです。期待大ですね!

では、早速、可視化をしていきます。。

求人掲載件数ランキング(企業 × 掲載件数)

f:id:suzutt:20161118175716j:plain (クリックで拡大)

データをグループ化、ソートして表示することが可能なので、企業の求人掲載件数ランキングを作成しました。

やはり上位は大企業が占めています。

設定は以下の通りです。

設定項目
Visual types Horizontal bar chart
Y axis 企業名

職種別掲載件数比(職種 × 掲載件数)

f:id:suzutt:20161118175908j:plain (クリックで拡大)

集計軸を「企業名」から「職種」に変えると、職種別掲載件数の割合を可視化できます。

営業、事務、企画職の求人が多く、半数以上を占めていることがわかります。ITエンジニアの求人は少なめなのでしょうか。

設定は以下の通りです。

設定項目
Visual types Pie chart
Group/Color 職種

ITエンジニア求人掲載件数ランキング(職種 × 企業 × 掲載件数)

f:id:suzutt:20161118180106j:plain
(クリックで拡大)

もちろん、検索対象をフィルタリングすることができるので、このように職種別の掲載件数ランキングも集計できます。
今回はITエンジニアの求人のみを対象としてみました。

いわゆるWeb系の大手企業などはランク外でした。別の求人媒体をメインで使っているのでしょうか。気になります。。。

設定は以下の通りです。

設定項目
Visual types Pivot table
Rows 企業名
Values 企業名(COUNT)
Filter 職種 include "ITエンジニア(システム開発、インフラなど)"

エリア別掲載件数(エリア × 掲載件数)

f:id:suzutt:20161118180213j:plain (クリックで拡大)

関東エリアの掲載件数がその他の地域と比べてかなり多いですね。

設定は以下の通りです。

設定項目
Visual types Vertical bar chart
X axis エリア

ダッシュボード

f:id:suzutt:20161118180306j:plain (クリックで拡大)

作成したグラフをまとめたダッシュボードを作りました。

すごい、BI感がでていますね!!
ただ、分析目的がないので、特に使い道はありません...はい、よく陥りがちなやつです。皆さん気をつけてください。。

まとめ

データの可視化、いかがでしたか。

ざっと触った感想は、

  • サービス名の通り、データの可視化を簡単な操作で行える。
  • スモールスタートが可能なのがGood。(1ユーザ9USDで1GBのデータを分析できる)
  • 通信環境にもよるのかと思いますが、ダッシュボードを表示するまでに7秒くらい掛かり、やや遅め...?東京リージョンの対応が待たれる。。
  • 使う側が目的を設定して使わないと、意思決定に役立たないグラフが量産される(世の中のBIツール全般に当てはまると思いますが、一応)

です。

最も良いなと思ったのは「スモールスタートが可能」という点です。1000円/月くらいで試せます。AWSの醍醐味ですね。

引き続き、Amazon QuickSightを追っていきますので、ご期待ください。

ちなみにですが、弊社サービス 3Chartでは、複数の媒体をまたいだ求人データの分析・集計が可能です。
今回取り上げたような職種別、エリア別の集計もできます。無料でお試しいただけるので、ご興味がある方はWEBページよりお申込みください。