Goalist Developers Blog

統計・マーケ・機械学習 Meetup! #4 @ ゴーリスト

そういえば,数か月ぶりの執筆担当だ....

お久しぶりです.新卒エンジニアのナカノです.

今回は,ゴーリストオフィスで行われた勉強会のレポートを書こうと思います.

勉強会のテーマは「統計・機械学習」です.

目 次
  • 勉強会の概要
  • 何はともあれ、まずはカンパーイ!
  • LTの内容
    • 1. 使えるデータの作り方
    • 2. DBスペシャリストに合格して自由を手に入れた話
    • 3. AICについて
    • 4. 統計検定を受けてみた
    • 5. pythonとmatlabを使った最適化とこれから読みたい本
    • 6. GoogleのAI分析の結果を、実地で確かめてみた
    • 7. 機械学習初心者が短期間でTensorFlowで作ったMNISTモデルをAndroidアプリに組み込んだ話
    • 8. IT勉強会開催の進めと「続ける」技術
    • 9. ピクトさん量産計画
    • 10. 分析手法紹介
  • 締め括り



勉強会の概要

以下のURL先のページに,勉強会の概要が書かれております.一度ご覧頂ければと思います. data-refinement.connpass.com



何はともあれ、まずはカンパーイッ!

Meetupということで,飲み食いしながら様々なLTが堪能出来る形式となっております.

さてさて,まずは各自飲み物を持って,せーの......カンパーイッ!

f:id:r-nakano:20180125015027j:plain

思いの外参加者が多く,その分だけこれから始まるLTの発表に胸が高鳴るナカノでした.

お~,ドキがムネムネッ!(某クレヨンし○ちゃんのネタ)



LTの内容

各LTの発表のまとめを,self-containedな形で以下に与えておこうと思います.

1. 使えるデータの作り方

f:id:r-nakano:20180125155328j:plain

主に,データの必要不可欠さとデータの加工に関することを発表されておりました.

何事においてもデータは必須であり,それを有効活用するためには「必要な時に必要な形」でデータが使える様にする必要があります.

そのために,CrawlingやScrapingという技術を用いてデータの加工整形が行われます.


2. DBスペシャリストに合格して自由を手に入れた話

f:id:r-nakano:20180125022557j:plain

発表によると,即戦力になるためにはやはり少なくとも資格を取得しておいた方が良いとのことです.

ですがその一方で,mqtsuo02さん自身が様々な業務を経験してきた結果から,資格の取得だけでなく「自分次第な部分を変えるための実践」も非常に大切だと説いていらっしゃいました.


3. AICについて

f:id:r-nakano:20180125135827j:plain

相関係数の話から発表は始まり,次第にAICに関する様々なツールや概念を概説されていらっしゃいました.

その時,聴講者たちはどんな表情をしていたのでしょうか...?

f:id:r-nakano:20180125140752j:plainf:id:r-nakano:20180125140801j:plain

おっと,何とも言えない表情をされていらっしゃるゾ....


4. 統計検定を受けてみた

f:id:r-nakano:20180125135915j:plain

cougarさんの「フリーランスになった経緯」から「統計検定を受けた時の状況」などについて,発表されておりました.

統計や機械学習がビジネスで活かせそうだとcougarさんは考えており,特に「顧客サービスの休止ユーザーに関する分析」への応用に期待していらっしゃるそうです.


5. pythonとmatlabを使った最適化とこれから読みたい本

飛び込みLTの発表その1です.発表者のmoritaさんは「人工衛星により捉えた生物の住む森林のエリアの画像を分析し,そのエリアの面積の変化を調査する」ということを行ってらっしゃるそうです.

その際にpythonやmatlabを使った最適化処理を実施されているのですが,現状ではデータ分析の方法や手順や方法が確立されているが分析精度の大小などは評価しづらいとのことです.

それ故にデータを観察し想定や着想などを持つことが大事であり,それは機械学習の利用においても言えることであるそうです.

また,発表の最後にオススメの関連書籍を紹介されておりました.


6. GoogleのAI分析の結果を、実地で確かめてみた

飛び込みLTの発表その2です.発表内容は,Googleの「スマートクッキー」プロジェクトに関するものでした.AI分析の結果として出力されたレシピは非常にシンプルでした.

AIの判定を実験的に確かめるため,そのレシピをもとにいざ作ってみたそうです.結果ですが,レシピに改善すべき点が幾つかみられました.

判明したことですが,AIのアウトプットは業務に落とし込む部分の手前のものなので,やはりその様な部分で人の役割は必要不可欠であるということです.


7. 機械学習初心者が短期間でTensorFlowで作ったMNISTモデルをAndroidアプリに組み込んだ話

発表内容は「数字が写っている画像を認識して正解の数字を特定するアプリの開発」に関してです.

開発の際に,Kerasという「Tensor Flowなどをバックエンドとしたニューラルネットワーク用ラッパーライブラリ」を使用しているとのことです.

まえすとろさんによれば,Kerasは初学者でもアプリ開発で何とかなる有能なツールだそうです.


8. IT勉強会開催の進めと「続ける」技術

発表によると,IT勉強会の開催のメリットとしては「勉強会はやりとりや知識・認識の共有がしやすい環境であるため,参加する意義がある」とのことです.

また,継続は力なりということも説いていらっしゃいました.

例えば「30日間をどのように続けるか?」とか「反抗期、不安定機、倦怠期などの作業継続が困難になりがちなフェーズに陥った場合,如何にして乗り越えるか?」などの話がありました.

聞いているうちに,継続は力なりという言葉は非常にシンプルだが大変重要だなと再認識しました.


9. ピクトさん量産計画

写真からのピクトの生成に関して発表されておりました.

ピクトの生成の際にDeep Learningによるポーズ推定が行われており,その結果として「画像にある人のポーズから様々なピクトの生成が可能」となっております.

ポーズ推定ですが,対象が一人或いは複数人の場合のそれぞれで推定を行います.

複数人の場合は,まずはそれぞれの部分を切り取り,そこから先は「一人の場合の推定方法」を使って推定が行われます.

推定の実験の中で,何故か大阪のグリコの画像からはピクト変換出来なかったそうです.


10. 分析手法紹介

最後の発表は,様々な分析手法の紹介に関してでした.発表の中で

  • 数理最適化(近藤次郎(最適化))、探索問題(近藤次郎(最適化))
  • 応用待ち行列(本間鶴千代(待ち行列の理論))
  • 世論調査モデル(深尾毅(分散システム論))
  • 昇給報酬モデル(羽鳥裕久(有限マルコフ連鎖))

といったものが紹介されていました.



締め括り

以上が,勉強会で発表された内容のまとめでした.各々のまとめの内容に凹凸があり,非常に稚拙なまとめとなってしまいました.

ただ,勉強会の状況や様子をお伝えすることは出来たかなと思っております.

私は現在インフラ関連の業務を行なっておりますが,統計・機械学習・関数型言語の分野にも興味があるため,分野に囚われずに積極的に勉強していければと思います.