项目作者: nomutsugu

项目描述 :
Part1 ようこそデータ分析の世界へ • Chapter1 データ分析業界最前線 <1節> • 分析業界の近況とデータサイエンンスを活かせる職業(のむら)  -データが変える世界  「遊園地のアトラクションの待ち時間がゼロになれば・・・」、「明日の試験の出題傾向がわかれば・・・」、「相手が次何をするか事前にわかれば・・・」。誰しもこのようなことを考えたことはないだろうか。そして、現在それが現実のものとなり始めている。  2003年に「マネーボール」という書籍が発売された(日本では2004年、2011年に映画化)。この本は弱小であった金銭的に貧弱であったオークランド・アスレチックスの成功を書籍化したものである。当時のGMのビリー・ビーンは野球を「27個のアウトを取られるまで終わらない競技」と定義し、過去の野球に関する膨大なデータの回帰分析から「得点期待値」を設定し、これに基づき勝率を上げるための要素を分析した。この影響ははかりしれず、出塁率や長打率という現在重要視される要素が認められ始めた。このデータに基づく理論や戦略は、野球だけに留まらず、バレーボールやサッカー、アメリカンフットボールなど多くのスポーツに影響を与えた。各選手の動き全てが位置情報として管理され、プレー全てにタグが付けられ分析の対象となる。オークランド・アスレチックスが大リーグの全球団で最高勝率を上げた約15年後、2016年にデータによって可能性が皆無と示されていたチームがプレミアリーグで優勝をしても、現在スポーツとデータ分析は切っても切り離せないものとなっている。  現在、スポーツに留まらずほぼあらゆるものがデータ分析とは切っても切り離せないものとなっている。例えば、日常的な朝の風景を思い浮かべてみよう。朝起きてスマートフォンを見る、家電のスイッチをいれる。シャワーを浴び、顔を洗う。そうすればその情報はログデータとなり、メーカーや通信業者、インフラ業者の分析対象となる。コンビニやカフェでコーヒーを買うと、POS情報が生み出され、マーケティング事業部の元へ行くかもしれない。電車やバスを待つ間に通販サイトで商品を眺めれば、履歴に即した別な商品が推薦される。そしてそのときの行動により、より最適な商品が推薦されるようになる。電車やバスに乗れば、その電車やバスは位置情報や速度が記録され、渋滞や混雑緩和のためのデータをICカードの情報と共に提供し続ける。車内では時間潰しのために友達のつぶやきや投稿にリアクションを行い、好きなブログを購読する。そうすると端末上に昨日と変わった(または同じ)WEB広告が現れ、その広告をついつい見てしまう。その結果をアドテク(広告)業者が分析する。  このように普段の何気ない行動のほとんどが分析対象となっている。また、最近では健康管理のために、GPSと連動した行動記録のアプリや時計などのガジェットがブームとなっており、人によっては全ての行動が(といっても言い過ぎではないだろう)データとして分析の対象となっている。 しかし、このようにデータで行動や志向を読み解こうとする試み自体はいまに始まったものではない。それは半世紀以上前どころか、古代から国勢調査などの形で行われている。統計学という学問も17世紀から盛んとなり、ベイズ統計学を生み出したベイズは18世紀の数学者である。ではなぜ、この21世紀になりこのように盛り上がりを見せているのだろうか。 そのキーワードとなるのが「クラウド・コンピューティング」(以下「クラウド」)と「ビッグデータ」である。「クラウド」という言葉は2006年にエリック・シュミットが発した「ブラウザの種類も、アクセス手段も、パソコンかマックか、携帯電話かも無関係です。“雲(クラウド)”のような、巨大なインターネットにアクセスすれば、その利益、恵みの雨を受けられる時代になっています」という言葉より生まれたといわれている。端末の中のデータやアプリケーションを利用するのではなく、ウェブブラウザなどを介してサービスの形でアプリケーションを使うことで、データをコンピュータ外に保存する。そうすることで、いつでもどこでもネットワークさえつながればサービスを利用できるようになる。ネットワーク網が発展した現在だからこそ出来る業であるが、このような「クラウド」型のサービスの発展によりこれまでそれぞれの端末上にしかなかったデータが一箇所に集約することとなり、結果として爆発的にデータが増えることとなった。この増え続ける大規模データ(「ビッグデータ」)をビジネスや生活に活かそうと考えたのが現在なのである。    -データサイエンティストとは   2009年にGoogleのチーフエコノミストであるハル・ヴァリンはニューヨークタイムズ誌に寄せた記事の中で「これからの10年で最もセクシーな職業は統計学者(statisticians)である言い続けている」と述べ、日本においても「統計学」に関する本が数々出版され、統計学やパターン認識、機械学習などのデータ解析技法を用いる「データマイニングエンジニア」やデータの「意味」を可視化やナレッジとして創出する「データアナリスト」と呼ばれる職業が注目を浴びるようになる。 そして2012年「ハーバード・ビジネスレビュー」誌が「21世紀で最も魅力的な職業」”The Sexiest Job of the 21st Century”としてデータサイエンティストを紹介し、この頃より「データサイエンティスト」という言葉がバズワード化する。日本においてもこのような状況を危惧した一般社団法人データサイエンティスト協会により “「データサイエンティストとは、データサイエンス力、データエンジニアリング力を ベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」” としてデータサイエンティストの定義が出されるに至っている。 では「データアナリスト」と「データマイニングエンジニア」と「データサイエンティスト」の違いとはなんであろうか。端的にいうと「データサイエンティスト」は「データアナリスト」、「データマイニングエンジニア」を包括するものである。統計や情報工学に基づくデータサイエンス力、データサイエンスを意味の在る形に使えるように「可視化」したいりナレッジ化するデータエンジニア力、そして課題背景を理解したうえでビジネス課題を解決に導くビジネス力、この3つの能力が揃った職業がデータサイエンティストなのである。 特に産業界はデータサイエンティストに対して単にデータを収集してその統計分析をすることを期待しているのではなく、むしろ「データに基づき予測し、その結果をビジネスに活用する」ことを期待している。このため、データサイエンティストには、① 顧客の課題をデータ分析や情報技術に落としこむ能力、② 本質的な問題を見抜く能力などコンサルタント的な能力を求めている。 なお、アカデミアで考えられているデータサイエンティストは「第4の科学」と呼ばれる方法論を実践する研究者を指すこともある。近年、自然科学分野においても、データが津波のごとく押し寄せており、データ科学と呼ばれるものが登場しつつある。そのようなビッグデータ利活用の専門家をデータサイエンティストと呼んでいる。  しかし、このような素質を全て備えた人材はどこにいるのであろうか。国内ではデータサイエンティストが約25万人不足するとも言われている。文部科学省は独り立ち可能レベルのデータサイエンティストを年間5000人育成行うプログラムを検討するなど、データサイエンティストの育成は国家的な事業ともなりつつある。また、IBMをはじめとするIT企業は競ってBIツールの開発を行っている。例えば、WATSON Analyticsはデータサイエンティストのデータサイエンス力、データエンジニア力を提供するサービス・ツールであり、「分析のノウハウがなくても、誰もがスピーディに分析結果を利用し、ビジュアライズできる」ようにすることでデータサイエンティスト不足に対して一つの解と成りうる可能性を秘めている。しかし、いくらこのようなBIツールが発展しても自社に即したデータ分析基盤の見極めが必要となり、容易に利用できるツールが生まれれば生まれるほどデータサイエンティストの価値はより高まるものと思われる。このような状況にたいしてデータサイエンティストを1人の人材とみなさず、複数の人材の掛け合わせによって補う動きも存在している。いづれにせよ、  -ビジネスの世界で活かされるデータ   Web、金融(FinTech アクチュアリー等)、小売、飲食、製造業、行政、など
高级语言:
项目地址: git://github.com/nomutsugu/chapter1-1.git
创建时间: 2016-07-26T12:29:27Z
项目社区:https://github.com/nomutsugu/chapter1-1

开源协议:

下载