同日同店ペアを 5,581 件、数えた
商業口コミの中で、同じ店に、同じ日付に、別の 2 人が投稿した イベントを全部数えると、5,581 件 あった。このイベントを 2 人組(ペア)単位 で集計し直す。同じ 2 人が、同日同店に並んだ回数を数える。
| 同じペアが同日同店に並んだ回数 | ペア数 |
|---|---|
| 1 回だけ | 4,486 組 |
| 2 回 | 321 組 |
| 3 〜 4 回 | 86 組 |
| 5 〜 9 回 | 26 組 |
| 10 回以上 | 1 組(最大 11 回) |
ペア全体は 4,920 組。2 回以上同じ日に並んだペアは合計 434 組(全体の約 9%)。ここから偶然性が薄れ始める水準になる。5 回以上同じ日に並んだペアは 27 組 で、その中の最大は 同じ 2 人組で 11 回(複数店舗をまたいでいる)。
偶然と区別がつくか ── 簡易シミュレーション
5,581 件の同日同店イベントは、人気店なら偶然でもそれなりに発生する。だから「同日に並んだ=あやしい」とすぐには言えない。問題は 同じペアが何度も繰り返し並んでいるか だ。1 〜 2 回なら偶然の範囲、5 回・10 回なら話が変わる ── というのが直観だが、念のため計算で確かめておく。
つまり「5 回以上並ぶペアが 27 組存在すること自体」は、偶然の枠内に収まる。タイトルの問いに正直に答えるなら、ここまでの数字だけでは "たまたま" の側に振れる。
ただしこのシミュレーションの前提は、4,920 組のペアが店をランダムに選んでいる、というかなり強い仮定だ。実際は人気店に投稿が集中するし、書き手にも好みの店がある。期待値約 30 組という数字は、あくまで 偶然のラインがどの辺にあるか を眺めるための目安として読む。次の節では、この仮定からはみ出す動きに目を移す。
1 店舗集中ペアこそ、黄信号
ここから一段絞り込む。共通店舗が 1 店舗だけで 5 回以上重なる ペアに目を向けると、話が変わる。ペアの行く店がランダムに散らばる前提なら、同じ 1 店舗に何度も集中する確率はもっと低くなる。1 店舗集中型のペアの存在 が、偶然から外れたシグナルになる。
観察記録の中で、共通店舗が 1 つだけのペアの上位はこうなる。
- ペア A:1 店舗 / 9 回 / 約 1.5 年で
- ペア B:1 店舗 / 8 回 / 半年で
- ペア C:1 店舗 / 7 回 / 約 5 ヶ月で
短い期間で、同じ 2 人組が同じ 1 店舗に 7 〜 9 回並んでいる。これは「人気店にたまたま居合わせた」では説明しづらい構造だ。たとえばペア A の 9 回を 1.5 年で割ると 月 0.5 回ペース。2 人がそれぞれ月 1 回ずつ同じ店に通っていたとして、たまたま投稿日が重なるのが月 1 回近いペースで起きている計算になる。これを偶然で説明し切るには、2 人がよほど密に同じ店に通っている必要がある。
1 店舗集中ペアこそ、黄信号。
それでも「示し合わせ確定」とは言わない
ここでも観察者として一度立ち止まる必要がある。同じ 2 人組が同じ店に何度も並ぶことは、次の可能性で説明できる。
- 同じ店の固定客同士で、それぞれ独立に通っているだけ
- 同じグループ(友人・知人・SNS 経由)で、店の情報を共有して通っている
- 店主導の動員で、同じ日に複数人が投稿している
最後の可能性が一番疑わしいが、観察記録だけからはどれが真かを断定できない。本記事は「1 店舗集中型のペアが繰り返し並ぶ構造が実在する」という事実までを示す。「いつもの店」が 2 人で被っているだけ、という解釈も残しておく必要がある。第 6 話 で見た看板客観察と組み合わせることで、初めて警戒の根拠として機能する形になる。
持ち帰れる発明 ── 同調率
口コミを読むとき、書き手のハンドル名と投稿日を見ながら、同じ日付に複数のハンドル名が並んでいるか を見ておく。
- 同調率 = あるペアの「重なった日数 ÷ 投稿日数」
これが普通のペアなら 0.01 以下に収まる。0.1 を超えるあたりから、偶然以上の同調が疑われる。同じハンドル名 2 つが、同じ日付に 5 回以上並んでいたら、その店の口コミは少し距離を取って読む。確認の手順はシンプル。
- 店舗ページの口コミ一覧で、同じ日付に複数の投稿が並んでいる日をマーク。1 店舗あたり数日〜十数日見つかることが多い
- その日付の投稿者ハンドル名を 2 人ずつ控えておく。3 人以上並んでいる日があれば、別カテゴリとしてメモ(第 8 話で扱う「店レベル」の話に進む)
- 別の日付でも同じ 2 人組が並んでいるかを見ていく。1 〜 2 回なら偶然の範囲
- 3 日以上で同じペアが並んでいたら、口コミ全体の評価から、その 2 人を抜いて読む
ここでいう「投稿日数」は、ペアの 2 人それぞれの総投稿日数のうち 少ないほうの値 を使う。回数の少ない側が分母になることで、ペアの動きが偶然か構造かを公平に判定できる。
同調率 ── 重なった日数 ÷ 投稿日数(少ないほう)。普通のペアは 0.01 以下、0.1 を超えると偶然以上の同調が疑われる。1 店舗だけで同調するペアは特に黄信号。第 6 話で見た常連の集中(常連寄与率)と組み合わせ、看板客+同調ペアの店は、その 2 人の投稿を除いた平均で評価し直す。