2020年08月27日

正しいデータに基づく判断

少し前に「With 新型コロナウイルス」というタイトルで、弥生内での新型コロナウイルス感染症拡大に対する対応レベルを8月頭に一部拠点でレベル2からレベル3に引き上げたこと、そして当該記事執筆時点(8/17)には再びレベル2への変更が視野に入っていることをお話ししました。

2020082701.png

引き続き拠点のある(および一般的にその通勤圏の)都道府県のデータを日次で追っていますが、8月10日過ぎまでは赤色の警報(人口10万人あたりの過去7日間の新規検査陽性者数が15以上)が点灯していますが、以降は徐々に減少傾向にあることが見て取れるかと思います。政府の分科会でも「7月末をピークに緩やかに減っている」と分析しているそうです。このデータに基づき、弥生では今週火曜日から全拠点を再びレベル2の対応としています。

日次でこのデータを追っていて気が付いたのですが、このデータは結構揺れるのです。このデータは前々日まで(今日8/27基準で言えば8/25)はこちらの東洋経済オンラインの特設サイト、前日は日本経済新聞の速報(今日基準で言えば、こちらの昨日の速報)を基にしています。しかし、翌日になると前日のデータが変わっていることが頻発しています。例えば、上記の表の8/26の数字は日本経済新聞の速報値ですが、これは翌日になると、東洋経済オンラインの数値に置き換わります。この際に結構数字がぶれます(正確に言えば、ぶれる都道府県とぶれない都道府県があります)。これは速報値から確定値に置き換わるものなので、ある程度ぶれることはやむを得ないと思います。

しかし、例えば上記の表の8/25の数字は東洋経済オンラインの数値なのですが、翌日に確認すると数字が置き換わっていることがかなりの頻度で発生しています。色々と調べてみると、東洋経済オンラインの元データは厚生労働省が毎日発表する数字なのですが、どうもこの元データが結構揺れているようです。表を見てみると気が付くと思いますが、8/18には、北海道でも、埼玉県でも、千葉県でも新規の検査陽性者が発生していません。ただ、前後の日の数字を見る限り、それはありえません。実は、元データである厚生労働省のデータは、日々の発生件数ではなく、累計での記載のため、何らかの理由で更新がかからないと、見た目上ゼロ件の日が生まれてしまうのです。8/18は集計なのか、発表なのか何らかの問題があったのではないかと思います。

実はちょうどこのタイミングで、レベル変更の判定をしようとしていたため、データが欠落していることにより判断が難しくなり閉口しました。ちなみに大阪府もこのデータ上は8/18がなしになっていますが、翌8/19には372件とドカンと増えています。これはどう見ても2日分の数字が1日で計上されてしまったのかと思います。また、数字の検証のために各都道府県の公表値とも比較していたのですが、福岡県の公表数値は、東洋経済オンラインの数字(元データは厚生労働省)と1日のずれがあります。例えば、上記の表で福岡県の8/25は51ですが、福岡県の公表数値ではこれは8/24の数値です。

なお、弥生におけるレベル変更の判断自体は7日間の累計の数字を採用していますので、こういったデータの揺らぎはある程度吸収することができています。それでも、もうちょっと何とかならないのか、と思います。新型コロナウイルス感染症は今まさに動いている事象であり、ビジネススクールのケースのように、揺らぎが全くない、カチッとしたデータにはなりません。ただ、新型コロナウイルス感染症との戦いで必要なのは、現状を定量的に、可能な限り正しく把握すること。その観点で言えば、データの定義や更新/集計のサイクルなどが統一されていないことは大きな課題だと感じています。

新型コロナウイルス感染症については色々な意味で備えが十分ではなかった。これは日本に限らず全世界がそうでしょう。備えがない中対応している訳ですから、こういった課題はやむを得ないのかもしれません。しかし、今後またいつ新しい疾病が発生するかもしれません。その時にまた今回のようになってはいけないのだと思います。(可能な限り)正しいデータが(可能な限り)タイムリーに集計され、それに基づいて(可能な限り)正しい判断ができるようにしていかなければならないのではないでしょうか。
posted by 岡本浩一郎 at 19:28 | TrackBack(0) | デジタル化