あなたは無料で自動運転を手伝っている

「信号機をすべて選択してください」「横断歩道を含む画像をクリックしてください」- Web サイトにログインするたびに表示されるこの画像認証。面倒ですよね。しかし、あの作業には「ロボットでないことを証明する」以外に、もう一つの重要な目的があります。

あなたは、Google の自動運転技術のトレーニングデータを無料で作成しているのです。

CAPTCHA の進化の歴史

CAPTCHA は「人間とコンピュータを区別するテスト」として 2000 年代初頭に登場しました。最初は歪んだ文字を読み取る方式でしたが、技術の進化とともに形を変えてきました。

  • 第 1 世代 (2000 年代): 歪んだ文字を入力する。OCR 技術の進化で突破されるようになった
  • 第 2 世代 (reCAPTCHA v1、2009 年〜): 古い書籍のスキャン画像から、OCR が読み取れなかった単語を人間に読ませる。Google Books のデジタル化に貢献
  • 第 3 世代 (reCAPTCHA v2、2014 年〜): 「私はロボットではありません」チェックボックス + 画像選択。信号機、横断歩道、バス、自転車の画像が登場
  • 第 4 世代 (reCAPTCHA v3、2018 年〜): ユーザーの行動パターンをスコアリングし、怪しい場合のみ画像認証を表示。多くのユーザーは CAPTCHA を見ずに通過

なぜ「信号機」と「横断歩道」なのか

reCAPTCHA v2 で信号機、横断歩道、バス、自転車、消火栓の画像が使われるのは偶然ではありません。これらはすべて、自動運転車が認識する必要があるオブジェクトです。

Google は 2009 年に reCAPTCHA を買収し、2016 年に自動運転部門 Waymo を設立しました。reCAPTCHA で収集された画像のラベリングデータ (「この画像に信号機が含まれている」という情報) は、機械学習モデルのトレーニングに活用されています。

つまり、あなたが「信号機をすべて選択してください」に答えるたびに、自動運転車が信号機を認識する精度が少しずつ向上しているのです。世界中の何億人ものユーザーが、毎日無料でこの作業を行っています。一方で CAPTCHA には、クレデンシャルスタッフィングのような自動化攻撃からサービスを守る役割もあります。

「私はロボットではありません」の裏側

「私はロボットではありません」のチェックボックスをクリックするだけで通過できることがありますが、あの一瞬で Google は驚くほど多くの情報を分析しています。

  • マウスの動き: 人間のマウスの動きは微妙に揺れるが、ボットは直線的に動く
  • クリックの位置: チェックボックスのどの位置をクリックしたか。人間はわずかにずれるが、ボットは正確すぎる
  • ページの滞在時間: ページを開いてからクリックするまでの時間
  • Cookie と閲覧履歴: Google アカウントにログインしているか、過去の reCAPTCHA の解答履歴
  • IP アドレス: 同じ IP アドレスから大量のリクエストが来ていないか

これらの情報を総合的に判断し、「人間らしい」と判定されればチェックボックスだけで通過、「怪しい」と判定されれば画像選択が表示されます。

CAPTCHA の未来 - 見えない認証へ

reCAPTCHA v3 では、ユーザーに何も操作させずにバックグラウンドで人間かボットかを判定します。ページ上でのスクロール速度、タイピングのリズム、タッチスクリーンの圧力など、行動パターンを分析してスコアを算出します。この仕組みはAPI セキュリティの観点からも重要で、ボットによる不正なリクエストを水際で防ぐ役割を果たしています。

将来的には、CAPTCHA は完全に「見えない」ものになり、ユーザーが意識することなく認証が完了する世界が来るかもしれません。

まとめ

CAPTCHA の画像選択で信号機や横断歩道を選ぶたびに、あなたは Google の自動運転技術のトレーニングに貢献しています。「私はロボットではありません」の裏では、マウスの動き、クリック位置、IP アドレスなど多数の情報が分析されています。CAPTCHA の判定材料として使われている自分の IP アドレスがどう見えているか、IP 確認さんでチェックしてみてください。次に CAPTCHA が表示されたら、「自動運転の未来に貢献している」と思えば、少しだけ面倒さが和らぐかもしれません。

CAPTCHA と AI の関係を深く知りたい方には、機械学習の入門書が参考になります。

この記事の関連用語

IP アドレス reCAPTCHA は IP アドレスも判定材料の一つとして使用する。 Cookie 過去の reCAPTCHA 解答履歴が Cookie に保存され、次回の判定に影響する。 ブラウザフィンガープリント reCAPTCHA はブラウザの特徴も分析して人間かボットかを判定する。