感染者の年齢分布と感染経路不明の割合の関係

しばらく前に以下のように書きましたが、実際のデータで関係があるかどうか見てみました。
    無症状者の割合を 40% と仮定しましたが、この値(p)が変化すると感染経路不明者の
    割合も変わります。p=50%、k=5 とすると、感染経路不明者の割合は 60% になりま
    す。また発症者の濃厚接触者として検査される集合の無症状者の割合が、年齢分布
    などの要因で全体の無症状者の割合より少ないと、感染経路不明者の割合が高くな
    と思います。
まず東京都が公開しているデータをグラフ化したのが以下です。感染経路不明の割合は日々の変化が大きいため、7日間の移動平均の値を使っています。

f:id:march_rabbit:20200903194233p:plain

感染者の年齢分布と感染経路不明率(東京都)
前回書いたように、新宿区が集中的にPCR検査を行った結果、q(追跡検査では捕まらない無症状者の割合)が下がって検査で捕まる感染経路不明者の割合が下がった後、市中感染が広がって感染経路不明者の割合が60%に上昇した傾向がわかります。
その後30代以下の感染者の割合が少し下がって、感染経路不明の割合がわずかに下がっているようにも見えますが、あまりにも微妙で良くわかりません。
そこで大阪府が公開しているデータをグラフ化したのが以下です。感染経路不明の割合は日々の変化が大きいため、7日間の移動平均の値を使っています。

f:id:march_rabbit:20200903194429p:plain

感染者の年齢分布と感染経路不明率(大阪府)
ここでは8月初から8月10日頃にかけて、もう少しはっきりと30代以下の感染者の割合が下がっており、同じ頃に感染経路不明の割合も60%強から10%くらい下がってます。感染経路不明の割合は感染者の年齢分布と関係はありそうです。
 

新型コロナの感染経路不明者の割合の過渡的な変化を説明してみた

今回は感染経路不明者の割合の過渡的な変化が説明できるか見てみます。以下は東京都が発表している感染者数などをグラフ化したものになります。

f:id:march_rabbit:20200830163744p:plain

東京都の感染者数のグラフ

第二波の最初の頃を見ると、7月から感染経路不明者の割合が40%の状態から上昇して60%に収束する動きがみられます。
最初の状態では、感染者は新宿区の接待を伴う飲食店に集中しており、新宿区が集中的にPCR検査を行っていた時期になります。この状況では感染者を効率良く検査で捕まえることができるため、q(追跡検査では捕まらない無症状者の割合)が下がっていることが考えられます。そこで検査で捕まる感染経路不明者の割合が40%になるようにqが下がった後、市中感染が広がって感染経路不明者の割合が60%に上昇したと仮定して、どのようなグラフになるか計算してみます。

p=0.5, k=5の条件感染経路不明者の割合が40%となるqを求め、そこから前回までの計算を使って
  Ns(k+1), Ns(k+2), Ns(k+3), ...
  Nas(k+1), Nas(k+2), Nsa(k+3), ...
  Naa(k+1), Naa(k+2), Naa(k+3), ...
から各世代の感染経路不明者の割合を出します。詳しい計算は省略しますが、結果的に感染経路不明者の変化はkpに依存し、kとpのそれぞれの値には依存しない結果となります。

世代毎の値を時間軸に当てはめるため、Serial intervalを6日とします(グラフ化する都合上整数値を使用)。
結果のグラフを以下に示しますが、概ね実測値に合う結果が得られました。

f:id:march_rabbit:20200830163806p:plain

感染経路不明者の割合の実測値と計算値

新型コロナの市中の感染者数は発表される一日の感染者数の 7~8倍と推定される

最近の東京都の発表する数字を見ると感染経路不明の割合は 60% 程度に収束してきているように見えます。この条件で新型コロナの市中の感染者数を推定してみます。
前回同様、無症状者が伝染す人数/感染者が伝染す人数(k = Ra/Rs) と、無症状者の割合(p) と置きます。

  Ns(k): 第 k世代で検査で捕まった感染者の人数
  Na(k): 第 k世代で検査されな無症状者の人数

第 k世代 (全体の感染者数を 1と置く)
  Ns(k) = 1-q
  Na(k) = q

前々回の計算から感染経路不明者の割合は
  1 - 1/(kp) = 0.6
より
  kp = 2.5

発症の二日前から伝染する可能性があるため、発表される一日の感染者数の 2 倍程度の(将来の)発症者が世の中にいると推定されます。
検査でつかまらない人数はこの q/(1-q) 倍おり、自己隔離しないため発症者より k 倍の時間感染能力がある状態で市中に存在するため、全体の人数を計算すると、
  2 * {1 + kq/(1-q)}
倍となります。前々回の計算から q = (kp-1)/(k-1) なので
  2 * {1 + kq/(1-q)}
  = 2 * {1 + k(kp-1)/(k-1-kp+1)}
  = 2 * {1 + (kp-1)/(1-p)}
  = 2 * {1 + 1.5/(1-p)}
  = 2 + 3/(1-p)
ここから先は p の値を決まっている必要があります。

(1) p=0.4 とすると (kp=2.5 から k=6.25)
    2 + 3/0.6 = 7
  となるため、市中の感染者数は発表される一日の感染者数の 7倍となります。
(2) p=0.5 とすると (kp=2.5 から k=5)
    2 + 3/0.5 = 8
  となるため、市中の感染者数は発表される一日の感染者数の 8倍となります。

23区内で考えると、人口は 957万人であり、ここ一週間の23区内の感染者数は一日当たり 173人くらいなので、だいたい 8000人~9000人に一人キャリアがいる計算となります。

新型コロナの無症状者の実効再生産数を試しに計算してみた(3)

この前の計算で無症状者が伝染す人数/感染者が伝染す人数(k = Ra/Rs) と、無症状者の割合(p) から感染経路不明者の割合を計算すると 1-1/(kp) となりましたが、kp≦1 だとこの値は (0,1) の範囲に収まりません。kp≦1 だとどうなるか考えて見ましたが、世代の経過とともに感染経路不明者の割合は 0 に収束しました。

 

Ns(k): 第 k世代で検査で捕まった感染者の人数
Na(k): 第 k世代で検査されな無症状者の人数

第 k世代 (全体の感染者数を 1と置く)
  Ns(k) = 1-q
  Na(k) = q
第 k+1世代
  Nss(k+1) = Ns(k)*Rs*(1-p) = (1-p)*(1-q)*Rs
  Nsa(k+1) = Ns(k)*Rs*p = p*(1-q)*Rs
  Nas(k+1) = Na(k)*Ra*(1-p) = (1-p)*q*Ra
  Naa(k+1) = Na(k)*Ra*p = p*q*Ra

Naa(k+1)/(Nss(k+1)+Nsa(k+1)+Nas(k+1)+Naa(k+1)
  = p*q*Ra / {(1-q)*Rs+q*Ra}
  = p*q*k*Rs / {(1-q)*Rs + q*k*Rs}
  = p*q*k / (1-q+q*k)
以下では説明をわかりやすくするため k=1 の場合を考えると、
  = p*q

同様に
Nas(k+2)/(Nss(k+2)+Nsa(k+2)+Nas(k+2)+Naa(k+2)
  = p*p*q
Nas(k+3)/(Nss(k+3)+Nsa(k+3)+Nas(k+3)+Naa(k+3)
  = p*p*p*q
となります。
一般的に p<1 であるため、kを大きくするとこの値は 0 に収束します。

逆に kp>1 の場合、感染経路不明者の割合は 0 ではなく、無症状者が伝染す人数/感染者が伝染す人数(k)と無症状者の割合(p)から決まる正の値に収束します。

新型コロナの無症状者の実効再生産数を試しに計算してみた(2)

次は逆に Ra/Rs = k とした時、p と k を用いて感染経路不明者の割合を計算してみます。各記号の意味は前と同じとします。

 

第 k世代 (全体の感染者数を 1と置く)
  Ns(k) = 1-q
  Na(k) = q
第 k+1世代
  Nss(k+1) = Ns(k)*Rs*(1-p) = (1-p)*(1-q)*Rs
  Nsa(k+1) = Ns(k)*Rs*p = p*(1-q)*Rs
  Nas(k+1) = Na(k)*Ra*(1-p) = k*(1-p)*q*Rs
  Naa(k+1) = Na(k)*Ra*p = k*p*q*Rs

検査では以下の人数が計測されます。
  濃厚接触者: Nss(k+1) + Nsa(k+1)
  感染経路不明者: Nas(k+1)
前と同様に検査は完璧で、濃厚接触者と発症した感染者は全て捕まると仮定します。

・第 k+1世代で感染者のうち検査で捕まる人数の比率が 1-q になる(定常状態)
  Na(k) : Ns(k) = Naa(k+1) : Nas(k+1)+Nsa(k+1)+Nss(k+1)
  q : 1-q = k*p*q*Rs : k*(1-p)*q*Rs + p*(1-q)*Rs + (1-p)*(1-q)*Rs
    = k*p*q : k*(1-p)*q + 1-q
  q*{k*(1-p)*q + 1-q} = (1-q)*k*p*q
  k*(1-p)*q + 1-q = k*p*(1-q) --- (2)
  k*q - q - k*p*q + 1 = k*p - k*p*q
  (k-1)q = k*p - 1
  q = (k*p - 1)/(k-1)

・感染経路不明者の割合を計算すると
  Nas(k+1) / {Nas(k+1) + Nsa(k+1) + Nss(k+1)}
    = k*(1-p)*q*Rs / {k*(1-p)*q*Rs + p*(1-q)*Rs + (1-p)*(1-q)*Rs}
    = k*(1-p)*q / {k*(1-p)*q + 1-q}
  (2)より
    = k*(1-p)*q / {k*p*(1-q)}
    = (1-p)/p * q/(1-q)
    = (1-p)/p * (k*p - 1)/(k-1) / {1 - (k*p-1)/(k-1)}
    = (1-p)/p * (k*p - 1) / {k-1 - (k*p-1)}
    = (1-p)/p * (k*p - 1) / (k - k*p)
    = (1-p)/p * (k*p - 1) / k / (1-p)
    = (k*p - 1) / kp
    = 1 - 1/(kp)

 

計算では感染経路不明者の割合は、k と p が決まれば一定の値になってます。
変動する要因としては以下のようなものが考えられます。

[感染経路不明者の割合を下げる要因]
・第 k+1 世代の濃厚接触者には、その人に伝染した第 k 世代の無症状者も含まれるはずで、これにより q が下がり感染経路不明者の割合が下がります。

[感染経路不明者の割合を上げる要因]
・感染経路不明者の一部が自己隔離をして、そこから発生する無症状者を追跡できなくなると q が上がり感染経路不明者の割合が上がります。
・無症状者の割合を 40% と仮定しましたが、この値(p)が変化すると感染経路不明者の割合も変わります。p=50%、k=5 とすると、感染経路不明者の割合は 60% になります。また発症者の濃厚接触者として検査される集合の無症状者の割合が、年齢分布などの要因で全体の無症状者の割合より少ないと、感染経路不明者の割合が高くなると思います。

新型コロナの無症状者の実効再生産数を試しに計算してみた

新型コロナのニュースが連日報道されていて、無症状者が話題になってますが、無症状者と発症者で実効再生産数はかなり違うのではないかと思いました。
誰か既に思いついた人はいると思いますが、試しに計算してみました。

感染経路不明者を50%、全体の実効再生産数を 1.6とした場合に推定される、無症状者と発症者の実効再生産数の値
発症者の実効再生産数: 0.8人
無症状者の実効再生産数: 4.0人

--------------------------------------------------------------------------------
理論的な話は詳しくないのと、値も厳密に推定できているわけではないので、簡単に以下のようなモデルを使いました。

記号は以下の意味で使います。
p: 無症状者の割合
Ns(k): 第 k世代で検査で捕まった感染者の人数
Na(k): 第 k世代で検査されな無症状者の人数
Nss(k+1): Ns(k)から感染した第 k+1世代の発症者の人数
Nsa(k+1): Ns(k)から感染した第 k+1世代の無症状者の人数
Nas(k+1): Na(k)から感染した第 k+1世代の発症者の人数
Naa(k+1): Na(k)から感染した第 k+1世代の無症状者の人数
Rs: 検査で捕まる感染者 1人が次世代で何人の感染者に伝染すか
Ra: 検査されない無症状者 1人が次世代で何人の感染者に伝染すか
q: 感染者のうち検査で捕まらない割合 Na/(Ns+Na)

第 k世代 (全体の感染者数を 1と置く)
Ns(k) = 1-q
Na(k) = q
第 k+1世代
Nss(k+1) = Ns(k)*Rs*(1-p) = (1-p)*(1-q)*Rs
Nsa(k+1) = Ns(k)*Rs*p = p*(1-q)*Rs
Nas(k+1) = Na(k)*Ra*(1-p) = (1-p)*q*Ra
Naa(k+1) = Na(k)*Ra*p = p*q*Ra

検査では以下の人数が計測されます。
濃厚接触者: Nss(k+1) + Nsa(k+1)
感染経路不明者: Nas(k+1)
検査は完璧で、濃厚接触者と発症した感染者は全て捕まると仮定します。

全体の実効再生産数を 1.6 として Rs、Ra を推定します。
無症状者の割合は p = 40% を仮定します。
https://www.afpbb.com/articles/-/3291491

・感染経路不明者数の割合: 50%
Nss(k+1) + Nsa(k+1) = Nas(k+1)
(1-p)*(1-q)*Rs + p*(1-q)*Rs = (1-p)*q*Ra
(1-q)*Rs = (1-p)*q*Ra --- (1)

・実効再生産数: 1.6
第 k世代の検査で判明した陽性者数: 1-q
第 k+1世代の検査で判明した陽性者数: Nss(k+1)+Nsa(k+1)+Nas(k+1)
Nss(k+1)+Nsa(k+1)+Nas(k+1)
= (1-p)*(1-q)*Rs + p*(1-q)*Rs + (1-p)*q*Ra
= (1-q)*Rs + (1-p)*q*Ra
(1)を使うと
= 2*(1-q)*Rs
第 k+1世代の感染者数が第 k世代の感染者数に増加率をかけたものであることを使い、
2*(1-q)*Rs = 1.6*(1-q)
Rs = 0.8

・第 k+1世代で感染者のうち検査で捕まる人数の比率が 1-q になる(定常状態)
k+1世代の検査で捕まる人数
Ns(k+1) = Nss(k+1) + Nsa(k+1) + Nas(k+1)
= (1-p)*(1-q)*Rs + p*(1-q)*Rs + (1-p)*q*Ra
= (1-q)*Rs + (1-p)*q*Ra
(1)を利用して
Ns(k+1) = 2*(1-q)*Rs
全体の人数は
Ns(k+1)+Na(k+1) = Nss(k+1) + Nsa(k+1) + Nas(k+1) + Naa(k+1)
= (1-p)*(1-q)*Rs + p*(1-q)*Rs + (1-p)*q*Ra + p*q*Ra
= (1-q)*Rs + q*Ra
(1)を利用して
Ns(k+1)+Na(k+1) = (1-q)*Rs + (1-q)/(1-p)*Rs = (2-p)/(1-p)*(1-q)*Rs
比率が 1-qになるため、
2*(1-q)*Rs = (1-q)*(2-p)/(1-p)*(1-q)*Rs
2 = (1-q)*(2-p)/(1-p)
1-q = 2*(1-p)/(2-p) = 1.2 / 1.6 = 0.75
q = 0.25
(1)より
Ra = (1-q)*Rs/(1-p)/q = 0.75*0.8/0.6/0.25 = 4.0


ここで Ra/Rs (無症状者が伝染す人数/感染者が伝染す人数 = 5) について少し考えて見ます。

発症する場合、発症前二日間ほど症状はないけど、人に伝染す期間があると言われています。発症した後は、通常は自己隔離するため、それ以降人に伝染す可能性は下がります。

新型コロナウィルスの場合、唾液による飛沫感染と言われています。さらに唾液PCR 検査では、発症後九日間以上経つと、唾液中のウィルスの量が減少して感度が悪くなると言われています。もし無症状の場合も移す仕組みが発症者と同じで
症状が出ていないだけとすると、2+9日の間、人に伝染する期間があることになります。

この比率はだいたい 5 程度であり、計算で出た値とほぼ符合するので、無症状者の実効再生産数が高い理由は、無症状者が社会に滞留しやすいからと思われます。

発症の二日前から伝染する可能性があるため、発表される一日の感染者数の 2 倍程度の(将来の)発症者が世の中にいて、他に無症状者が 5/3 倍いる計算になります (合計すると発表される数の 16/3倍)。