Vol.122 ボットを弾く"CAPTCHA"をAIで突破!

ボットを弾く"CAPTCHA"をAIで突破!

効率は従来のディープラーニングの300倍以上!?

皆さまは、“CAPTCHA”という文字画面をご存知でしょうか。Webサイト上での会員登録や会員認証(ログイン)、コメント投稿などを行う際に、「私はロボットではありません」という文言と共に、グニャグニャと曲がった文字が表示される文字画面のことを指します。“CAPTCHA”に表示される文字を微妙に読み違えて、何度もトライすることになり、イライラした経験をお持ちの方も多いかと思います。
“CAPTCHA”は「Completely Automated Public Turing test to tell Computers and Humans Apart」の略で、Webサイトをクロールする「ボット」による不正アクセスを防ぐために、人間とマシンを判別する「チューリングテスト」として広く活用されています。つまりセキュリティ認証の一環として使われているツールです。
ところがアメリカのAI企業Vicarious社は、この“CAPTCHA”に表示された文字を認識できてしまう、AIによる学習モデルを、科学雑誌「Science」で発表しました。その驚くべき内容は、従来のAIのディープラーニング手法のように膨大なデータを使用せず、1文字あたりわずか5つの訓練サンプルのみで、Google、Yahoo、PayPal、Captha.comといった最新の“CAPTCHA”において、実に90%という高い精度での解読を実現してしまったということです。通常は正答率が1%を越えれば「突破」と判断されるため、いかに高い精度かがうかがえます。

彼らが作成した学習モデルは、少ない例から学習・一般化が可能な人間の脳などを参考に、「再帰的皮質ネットワーク(Recursive Cortical Network)」と呼ばれるもので、従来のディープラーニングの約300倍も効率的になったと発表しています。また、少ないデータで実際に“CAPTCHA”を突破できてしまったことから、「Webサイトはボットを弾くためにより強固なメカニズムに移行するべき」と警鐘を鳴らしています。
ボットを完全に弾くために“CAPTCHA”を複雑化させてしまうと、今度は人間が文字を判別できなくなってしまい、本末転倒ですので、“CAPTCHA”はチューリンングテストとしての限界を迎えているとも言えそうですね。
今回登場した学習モデル「再帰的皮質ネットワーク」が、人間の脳を参考にしていることを考えると、“CAPTCHA”の解読はその技術の序章に過ぎず、今後は自ら学べる「人」に近い人工知能の開発が進んでいくことになるのかも知れません。今後もAIの動向には着目して参りたいと思います。

■Vicarious Inc.公式サイト:2017年10月26日公開
コモンセンス、Cortex、CAPTCHA
https://www.vicarious.com/2017/10/26/common-sense-cortex-and-captcha/

ページトップへ