オルタナティブ・ブログ > 路の上で >

日頃考えていることをぽちぽち書きます。

Google Cloud COVID-19感染予測(日本版)を調べてみた

»

昨年から、GoogleがCOVID-19の感染予測を提供しています。
COVID-19 感染予測 (日本版) の公開について
本リリースによると、決めた日までのデータでトレーニングし、その後の予測値と実測値を比較し、十分な精度が得られたとか。

さらに次のように論文があります。
Interpretable Sequence Learning for COVID-19 Forecasting
僕にはほとんど理解できませんが、既存の予測モデル、例えばSIRやSEIRを超える野心的な目標を掲げたことはわかりました。これらのモデルは、まさに、元北海道大学、現京都大学の西浦教授がシミュレーションに使用しているものです。

さて、直感的には、非常に野心的な目標に思います。なぜならば、素人目にも次のような問題があると思うからです。

  • 学習元にするデータの適正
  • 選んだデータの精度
  • その他のパラメーターになりうるもの - 例えば、休日その他の人の活動

西浦教授も今後の予測をしているわけではなく、今のままだとか、対策の効果で実行再生産率が落ちたら、とかのシミュレーションです。1日単位で予測を出していくのは何か違う感じがします。一方、もし日本の昨年の第二波が終わりそうな時に、次の第三波のおおよその時期と規模を予測できていたら、十分に対策に役立ちそうです。

理論は理解できないので、予測値と実測値を比較してみました。以下リンクを最初に見た時は、1月10日から2月6日までの28日間でした。今は開始日が変わっています。
COVID-19 感染予測(日本版)
1日単位に比較してもあまり意味ないと思うため、1月10日から16日までの一週間分の新規要請者の合計を神奈川県、福島県で比較します。
神奈川県は、予測値: 6,100、実測値: 5,782でした。
福島県は、予測値: 189、実測値: 231でした。
これらだけ見る限りは、当たっているとは言い難いです。

実測値は厚生労働省の以下サイトから入手しました。
データからわかる-新型コロナウイルス感染症情報-

Comment(0)