ビッグデータ時代に押さえておきたい 統計データの見方のキホン
目次
日本の食料事情は危機的なのか?
21世紀で最もセクシーな職業は何か、ご存知だろうか?
「データサイエンティスト」と呼ばれる人たちである。膨大な数字やデータを分析し、必要な情報を取り出し、必要な形にまとめ提供するプロフェッショナルたちのことだ。IoT技術、IT、AIの長足の進化により、その活躍の場はどんどん広がり、アメリカでは最も人気ある職業となっている。日本でもその育成が急務となっている。
今後ビジネスで扱われるデータはますます膨大となり、よりスピーディで的確な分析が求められるようになる。
それも単にデータを分析するのではなく、どのようなデータをどう取り込み、どう読んでいくかがカギを握るとも言われている。すなわちデータの読み方の”思想” が問われるのだ。
たとえば公的機関や新聞などの調査から集まった統計データ。そこから導き出された理屈や定説は、正しい、もしくは妥当と思われがちですが、そうではないことも多い。
その1つの例として食料自給率がある。
農水省のデータによると日本の食料自給率は、カロリーベースでおよそ38%、生産額ベースでは約68%(2016年度)となっている。かなり低い数字だ。
国は2015年に当面カロリーベースで45%の自給率を目指しているが、欧米と比べるとまだまだ低い。
年によっても違うが、広大な敷地をもつオーストラリアがだいたい200%~ 300%、同様に広い国土を持つカナダが140 ~ 180%と優に100%を超えているほか、フランスがだいたい120 ~ 140 %、アメリカが120 ~ 150% と100% 超。100%を超えない国でもドイツが80 ~ 100%、スペインが90 ~100%、イギリス、イタリアが70~ 80%前後を行き来している。こと先進国を見る限り、日本は危険水域だとも言える。
この計算式はどうなっているのだろう。たとえばカロリーベースの計算は図Aのとおり。
式が意味するのは、1日に国内で供給されるカロリーのうち国産分のカロリーという意味だ。
ここで注意したいのは、供給カロリー=摂取カロリーとならないことだ。食料ジャーナリストの浅川芳裕さんによれば、「食料として提供されているのにもかかわらず、摂取されない分も含まれている」(『日本は世界5位の農業大国』)ということだ。
廃棄される食料もカウントされるカロリー自給率
厚生労働省のデータによれば、たとえば2011年の平均摂取カロリーは1788キロカロリーであるのに対して、流通に回っている食料のカロリーは2436キロカロリー。およそ700キロカロリーが「どこか」でなくなっている。
この差は外食やスーパー、コンビニなどの店頭やそこに供給している食品工場などで廃棄された分だ。このほかこうした流通の川下のみならず、川上である生産農家の段階で、収穫した作物の形が悪かったり、豊作過ぎたりして廃棄されてしまうケースもある。農水省と厚労省という出所の違いはあるものの38%という自給率は、誰も食べない分も含めた自給率であることが言えるのだ。つまり廃棄される分も含めて食料としてカウントすれば、当然自給率は高まる。
さらにカロリーベースという計算方法は、昨今の先進国の実態にそぐわない。近年のダイエット志向の強まりを受け、野菜を中心としたサラダなどの人気が高まっている。野菜はもともとカロリーが低い。ダイエット志向、野菜食志向が高まれば高まるほど、トータルカロリーは低く出る。浅川さんの推測では、「野菜をカロリーで はなく重量換算で計算すれば、自 給率は80%を超えている」という。また牛肉や豚肉、鶏卵などは国 内で飼育されたものであっても、カウントされるのは国産の飼料で飼 育されたものだけとなり、輸入さ れた餌は除外されてしまう。した がって「実際のカロリーベースの自給率は68%くらい」(浅川さん )となるが、農水省の定義に従うとカロリーベースの肉類の約17%まで落ち込んでしまう。
個人GDPの低いアフリカで高い自給率
カロリーベースの自給率が実態を反映していないことは、世界を比較するとわかる。というのもアフリカなどの国々のほうが自給率では日本を上回っている国が多いからだ。
FAO(国際連合食料農業機関) の穀物自給率調査(2003年)では、日本は27%と、かなり低くなっているが、このデータでは毎年のように食糧不足が問題となっている北朝鮮が自給率78%と日本の約3 倍も高くなっている。ほかにもマラウィが96%、ニジェールが95%、タンザニアが80%など、アフリカ諸国で高自給率が目立つ。なぜこうなるかと言えば、こうした国々は個人のDGPが少ないために輸入食物の比率が低く、自給率が高くなってしまうからだ。
つまり日本の食料自給率が低い一因は「従来の穀物などより、より所得の上がる野菜や果物にシフトしてきた」(浅川さん)ためで、それはすなわち「大豆や小麦より競争力のある、カロリーの低い農産物だった」(浅川さん)からと言える。
もちろん、食料自給率が低すぎてはいけない。だが100%が理想ではない。食料安全保障の点からも、国内が不作になった場合の緊急輸入先としてルートを確保しておく必要もあるためだ。
食料に関する政策がどれが正しいとは、ここでは言わない。だがこのように統計データをどう読むかで見えてくるものは大きく変わってくることだけは、言っておきたい。
新聞や雑誌の記事はデータを先に見る 癖をつける
ではデータ分析の専門家は統計データをどう見ているのだろうか。
『統計思考力』という本を著した統計学の専門家である東北学院大学の神永正博さんは、データのついている新聞や雑誌の記事を読むときには、本文より前に「データを先に見てから読むと、記事に書かれていないことまで見えてくる」と言う。
そうすることで、「記事があえて無視していること」や「ささいなことが大げさに書かれていること」、「グラフに対して数字が抜けている」、「そもそもデータが不足している」といったことが見えることがあると語っている。
現代のビジネスでは、文書化して説明する機会が増えている。その際にどのようなデータを使うかで、相手の印象は大きく変わることは言うまでもない。
ただそこで心しておきたいのが、「自分の考えを補強するデータが見つかったからと言って、それが事実とは限らない」ということだ。
そういう場合は「試しに反対の意見を補強するデータを検索してみましょう。おそらく出てくるはずです」(神永さん)とのこと。そういったデータを見て検討して、記事やレポートにしていけば、より説得力のある内容になることは確かだ。
神永さんによれば、データを使うとき大事なことは、
・データを先に見る
・誰かが解釈する前のデータを見る
・自分の仮説に反するデータも集める
の3つだ。
特に誰かが解釈する前のデータを見ることはデータに対する「読む力」を高めてくれるはずだ。
アメリカはベンチャー大国ではない!
神永さんの本にはこんな事例が載っている。
よくアメリカとの比較論で、日本はアメリカに比べてベンチャー企業が少ない。アメリカは、リスクをとって起業する若者が多いが、日本の若者は少ないということが語られることが多いようだが、神永さんはこれに疑問符を投じる。
ケース・ウエスタン・リザーブ大学のスコット・シェーンという教授の著書によれば、OECD諸国のなかで自営業率が最も高いのはトルコで30%。アメリカは7.2%と下から2番目だったという。これは日本の10.8%より低く、その率は90年代より低下していると言う。
その理由はトルコが農業比率の高い国だからだ。農業比率が高いと企業雇用者比率が低くなるのだ。ほかにもこの本からアメリカ=ベンチャー大国のイメージを覆すような事実がいくつも出てきている。例えば…
1)起業はたいてい1人で行われる(76%が一人で起業)
2) ベンチャーキャピタルから起業時に融資を受けているケースはほとんどない(0.3%)
3)若いビジネスオーナーは少ない(18 ~ 34才は9%)。最も多いのは45 ~ 64才で53%。
4)たいていは革新的とは言えないビジネスをやっている(他社が提供していないサービスや製品を提供しているのは10%)
5)学歴は高い方が有利。ただし、博士号を取るまではやりすぎである
…といった内容だ。
神永さんの解説によれば、シェーン教授がやったことは、各国のデータをきちんと見たこと、だ。専門家らしい込み入った分析もあるが、単にきちんとしたデータを比較するだけでも物事の実態は違って見えてくる。
夏におでんを売ったセブン−イレブンのデータ読法
学者や研究者の場合は、見えたことをレポートや論文にすることが1つのゴールとなる。だがビジネスの場合は違ってくる。見えたことをいかに具体化していくかが問われる。俗に名経営者には、統計データの取り方、読み方に優れた人が多いようだ。
日本にコンビニエンスストアというビジネス形態を根付かせたセブン−イレブンの創業者、鈴木敏文さんは、その一人だろう。
鈴木さんが開発した、売り上げデータがそのまま本部の仕入れや開発部に直結するPOS(販売時点情報管理)システムは、セブン−イレブンの全国制覇への足がかりとなっただけでなく、流通に革命を起こし、いまや流通業界、小売業界になくてはならないシステムとなった。
鈴木さんの素晴らしさは、データに予断を持たず判断してきたことにある。なにせ夏に店頭でおでんを売ったのだから。
「夏におでん」―多くの小売り業者なら、「そんなもの売れないよ」と、ハナから取り合わなかっただろう。だが、鈴木さんは、人は気温が下がればたとえ夏であっても温かいものを欲しがると読んだ。そして夏に店頭に堂々と熱々のおでんを置き、売ったのだった。現在セブン−イレブンには、1年を通じおでんを販売している店が全国各地にある。逆に夏の定番である冷やし中華そばも、セブン−イレブンでは真冬の2月に出すこともある。
データは分母で結論が変わる
なぜこんな発想が生まれたのか。鈴木さんがよく言っていたのが「分母を変える」ということ。つまり同じ気温25度でも、分母が「夏」と「冬」では皮膚感覚が大きく違ってくるということである。
分母が夏なら「寒い」となり、コンビニでおでんが売れ、分母が冬なら「暑い」となって、コートの下に着るインナーが半袖やノースリーブが売れるのだと。
この分母を変えて見るという考えは、鈴木式データ分析の真骨頂とも言える。
例えば「おいしいもの」を分子とした場合、
おいしいもの/売り手=売れるもの
おいしいもの/買い手=買いたいもの
…と一致する。
しかしこれに時間や回数が因子として加わると、
おいしいもの/売り手×時間・回数=儲かる
おいしいもの/買い手×時間・回数=飽きる
…とズレがどんどん大きくなってくるのだという。このことに多くの売り手が気がつかないと鈴木さんは語っていた。
POSシステムのデータは、仮説を検証するためにある
そもそも鈴木さんは、POSシステムを、単に在庫切れをなくすためや売れ筋商品を知るために使っていない。仮説検証の道具として使っているのだ。
「POSシステムは、基本的に仮説が正しかったかどうかを検証するためのものであって、POSが出した売り上げランキングの結果をもとに発注するのではない」(「鈴木敏文の『統計心理学』」)
なぜならPOSシステムは「明日の売れ筋」データを教えてくれるわけではないからだ。
また鈴木さんは、「ABC分析は昨日までのデータであって明日を読むことはできない」とも語っている。
ABC分析とは、商品管理の代表的手法で、販売に関わっている方なら知っていると思う。
最も売れている商品群をA、その次の商品群がB、その次がCと、売れ行きに応じてABCとランク付けし、そのランク付けの割合で仕入れすると売上が最も高くなるという考え方だ。だいたいAが売り上げの7割を占め、AとBで9割を占める。残りのCを「死に筋商品」と言ったりもする。
よってAランクの商品群を重点的に仕入れていけば、当然より高い売り上げが期待できる。しかしABC分析に準じた仕入れでは早晩在庫を抱えることになりかねないと鈴木さんは指摘する。
話を単純化してみる。仮に商品X、Y、Zがあるとする。Xは80個仕入れて50個が売れ、Yは50個仕入れて40個が、Zは35個仕入れて35 個が売れたとする。この場合、どれを仕入れていけばいいか。
POSデータではXがトップに来る。しかし実は過去3日で見るとZは1日で35個売れ、Yは2日間で40個売れ、Xは50個売れたが30個が残っていた場合はどうだろう。この場合売り手側からすれば、X が売れ筋となる。だが買い手側からすれば、Zが売れ筋になる。1 日で売れたのは、みんながほしがっていた商品だからで、2日目以降売れなかったのは単に店頭になかったからかもしれない。
つまり「売れた量の結果データだけを見て、将来を予測してはいけないのです」(「鈴木敏文の『統計心理学』」)
先行情報が仮説力を決める!
鈴木さんは、こう続ける。
「今日と違って明日という日が何が売れるかは、自分なりに常に問題意識を持ち、仮説を立てていかないと分かりません。仮説を立てる際に必要なのが情報です。情報には”経験情報”と”先行情報” があり、先行情報は、これから先のお客の心理と行動を察知するための情報です。先行情報をもとに仮説を立て、発注を繰り返し、その結果、売り上げはどうだったかをPOSで検証する」のです。
先行情報の代表は、明日の天気だ。晴れか雨か、風はどうか、気温はどうか等々で、人間の行動や計画は変わっていく。地域のイベントやスケジュールも典型的な先行情報だ。明日地域で運動会があれば、飲み物やおにぎりが普段より多く売れるだろうと読む。
先行情報はほかにもまだまだある。この先行情報をどう集め、どう読むかが、ビジネスの行方を左右するのである。
弱小プロ野球球団をAクラスに導いたデータ思考法
セブン-イレブンの鈴木敏文さんのほかにも独特の見方をする経営者はいる。
リクルートから出向し、盛岡グランドホテルの再生や、万年Bクラスだったプロ野球球団・ダイエーホークス(現在のソフトバンクホークス)をAクラス球団に育て、昨年逝去した高塚猛さんなども、データの捉え方のうまい人だった。
毀誉褒貶のある人だったが、特にダイエーをAクラス球団に育てた手腕は、見事なものだった。
球場に足を運ばせ、さらに福岡、九州全土にファンをつくった手法は、野球の本質をビジネスから捉えていたからだ。
高塚さんは野球で勝つこととは何かを考えた。野球で勝つということは得点を入れる確率を高くすることだ。それは塁に出た選手を返すことにほかならない。
野球でヒットが出る確率はおよそ3割。3回か4回に1つ。1塁に出たランナーを返すには基本的に2本のヒットが出ないと点にならない。ホームランなら1本で点が入るが、ホームランは狙っても20回に1度程度しか実現できない。すると長打を狙うよりも、ヒットをつないでいくほうが点を返しやすいことがわかる。
しかし打者の心理として、ランナーが塁にいるとヒットでは点にならないと思い、10回に1、2回は長打を打ちたいという気持ちになる。するとランナーが1塁にいたときの打率は低くなる。当時(1999年)のデータでは、ランナー1塁時の打率はどの球団でも下がっていた。そこで高塚さんは選手の評価にこんな加点をした。
ランナーが1塁にいるとき、バッターが得点圏に送って、次の打者がヒットを打って返したら、そのバッターと前のバッターにも打点を付けるとしたのだ。もちろん公式に打点は付かない、ダイエーでの業務評価として付けた。
その結果ランナー1塁時の打率は、チーム打率の2割6分1厘を超える3割1厘まで上がったのだ。
さらに盗塁を積極的に評価した。盗塁はどのチームでもだいたい7割が成功する。打率に比べて成功率は倍以上。高塚さんはここに目をつけた。ただし盗塁の場合は「成功すると思って走った」結果の7割で、成功するかどうか分からないときに走った場合、成功率は5割程度に落ちるかもしれない。それでもヒットで塁に出る確率より高い。
事実この盗塁と独自の打点評価で選手の意識と戦略が変わったダイエーは翌年見事優勝したのだった。もちろん監督の采配、コーチ陣、スタッフ、選手の努力、能力もある。だがまったく野球と縁遠い道を歩んできた経営者が、1つの球団を見事に変えたことは、あまり例がない。
使えるグラフは変化の激しい個所を詳しく見せる
統計データに強くなるには、統計データを実際に集め、表やグラフを作ってみるといい。今は、表計算ソフトを使えばかなり簡便にグラフが作れる。
その際、注意しなければならないのは、目的を掘り下げることだ。
『東大式ビジネス文章術』の著者で産業技術総合研究所の中田亨さんは「丁寧に作られたグラフは重要な部分が詳しく描かれている」と語る。
「変化が激しい個所や本題に関する部分に焦点が当てられて、そこだけが特に詳しくなっている」(中田さん)グラフがいいグラフで、より目的にフォーカスした使えるグラフなのだ。
例えば横に時間軸をとった1日の売り上げグラフをつくるとしよう。その場合一般には1時間ごととか30分ごとの均等な目盛りを付けるだろう。そこに時間ごとの売上データをマークして折れ線グラフをつくったとすると、理系の大学では「生ぬるい」と叱責されるそうだ。
「グラフとは『数量を絵で表したもの』ではなく、『数字の挙動を問い詰めた尋問調書』」(中田さん)だからだ。
グラフAではピークは12時に来ている。しかし挙動を問い詰めると正確なピークは12時30分になっていることがわかる(グラフB)。もしなんらかの対策を取ることが目的なら、12時30分前後1時間を中心に対策を考えればいいことが見えてくる。
このように、どういうデータを集めるか、データをどう読むかを目的(思想)に照らして追究することにより、そこから見えてくるものは違ってくる。5年後、10年後を確実に予測することは難しい。だがデータの読み方を追究していけば、ちょっとだけ未来に備えることはできるはずだ。
POINT
■ 日本の自給率には廃棄されている食べ物も含まれている
■ 野球は打率を上げるより盗塁にチャレンジするほうが勝てる!
■ アメリカはベンチャー大国ではない
■ データは分母で変わる。
■ グラフは「数字の挙動を問い詰めた尋問調書」
■ 新聞や雑誌の記事はデータから見るべし!
■ ABC 分析の売れ筋は在庫予備軍
■ データは時間と回数を加えてみる
■ POS システムのデータは仮説検証のためにある
■ 質のいい先行情報がビジネスを左右する
【newcomer&考察】深く適切な眠りに「Sleep Tech(スリープテック)」働き方改革で加速!?
サッカーのワールドカップが終わり、ようやく寝不足から体調も戻ったかなと思ったら、間もなくアジア競技大会が始まる。またも熱戦が続けば、寝不足も続くことに。大丈夫か、自分……と不安がのしかかる人も多いだろう。
心配無用だ。いまはテクノロジー万能時代、フィンテックにアグリテック、アドテック、ファッションテックにエドテック、リーガテック、トランステック、リアルエステートテック…えっ?なんのこと?って……。
すべてわからなくてもいい。要はいまどきのたいがいの問題はテクノロジーが解決してくれるということだ。
そう寝不足や不眠の悩みもテクノロジーが解決してくれる。それがスリープテックなる技術だ。日本人の睡眠時間は世界的にも短いことで知られてきた。平均で7.9時間。OECD各国では下から2番めの短さだ。実際はこれほど睡眠が取れているビジネスパーソンは少ないと思われる。
短くてもいいから質の高い眠りがほしいと思うのは、人類共通の願望だろう。
眠りが社会問題化したのは、2003年山陽新幹線の運転手が居眠り運転をして駅をオーバーランしたことに始まる。このとき記者会見したJR西日本は、前日に当該運転手が十分な睡眠時間をとっていたにもかかわらず、居眠りをしてしまったことを呆れたように発表していたが、後に本人が睡眠時無呼吸症候群=SASであったことが判明すると、態度を一変、不明を恥じた。会社全体としSAS対策を進め、乗客の安全と安心を確保することを表明することとなった。SASは一気に社会問題化した。質の悪い眠りは、本人だけでなく、周囲や社会にも大きな影響を及ぼすということが認識されていったのである。
2006年に日本大学の内山真教授は、睡眠不足や睡眠障害によって引き起こされる日本の経済損失を、約3兆4600億円と試算している。睡眠不足や睡眠障害は根性や気合で克服できるものではなくなっている。正しい理解と適切な対応、場合によって治療が必要となるのだ。それに呼応するように医療機関でも睡眠外来など専門外来が増え、またドリエルなど市販の睡眠導入剤も販売されるようになった。一方ビジネスホテルでも枕を選べたり、眠りやすい寝具を揃えて宿泊客にアピールするなど、睡眠は宿泊業における差別化の源泉にもなっていった。
寝具業界の業界紙「寝具新聞」によれば、睡眠ビジネスの市場は、約1兆1200億円(2016年)で、潜在的には3兆円とも5兆円とも言われている。
睡眠ビジネス市場に風が吹いているのは、従来の延長から関心の高まりだけでなく、国が進める働き方改革があるからだ。国は電通や国立競技場建設現場などでおきた相次ぐ過労死問題を受け、働き方改革の一環として「勤務間インターバル制度」の導入を勧めている。
勤務間インターバル制度とは、勤務終了後、次の勤務まで一定の休憩時間をとらせる制度だ。国としては、適切なインターバル休憩を確保することで、事故を防ぎ、国民に健康を維持してもらい、ひいては医療費削減を図る狙いがある。
厚労省は勤務間インターバル制度を導入するために、設備や機器の導入、コンサルタントのアドバイスを受ける企業に一定金額を助成する助成金制度も行っている。具体的にどんな設備・機器が助成対象になるかは、詳らかではないが、同省のサイトには、テレワーク用の通信機器の導入や労務管理用の機器、パソコンやスマートフォンなどを除く労働効率の増進のための設備・機器となっている。
果たして、その設備・機器にスリープテック機器が入っているといいのだが……。
スリープテックでもっとも代表的なものは、人間の睡眠リズムに合わせて、目覚ましをかけるアプリやスマートウォッチだ。スマートフォンメーカーのノキアは、布団の下に敷いて、睡眠サイクルやいびき心拍数などをトラッキングし、理想の眠りのタイミングやサイクルを知らせてくれる「Nokia Sleep」を販売している。単に睡眠をトラッキングするだけでなく、眠りに入るタイミングで室内の明かりを落としていったり、朝目覚めのタイミングで明かりを点けたり、エアコンの暖房を入れたり、コーヒーを淹れてくれることも可能だ。
また蓄積したデータをベースに、本人にあった睡眠サイクルの改善プログラムも利用できる。
フランスのスタートアップ企業のRhythm社は、つけるだけですぐに入眠できるヘアバンド「Dream」を開発した。脈拍、呼吸、体の向きなど、睡眠に関わる生体情報をキャッチして分析、骨伝導を通じて入眠しやすい音を流す。
一方、いつでもどこでも眠れるという夢のようなゴーグルが「Sana」。かけていると音や光によって脳に特定の働きを引き起こし、自然な眠りにつくという。慣れるまでは4回ほど練習する必要があるというが、慣れれば10分ほどで眠りに落ちるようになるという。
「Somnox」は、オランダのベンチャーが開発した、新しい枕。ふわふわとした素材の一見すると抱き枕。抱えるとスイッチが入り、人間と同じように呼吸をする。すると次第にこの枕と呼吸を同調させるようになり、いつの間にか眠っているというもの。
眠りを制する者が、ビジネスを制する時代になってきたようだ。