中国インターネット事情

ITを中心に中国の事 もろもろ

中国第2の検索エンジン曰く 百度がうるさいのですが なにか? 3B大戦

8月28日深夜 360の百度への侵攻計画が始まったのだという。
これは、360側がrobot.txtを無視して百度のサイトをクロールし始めたという話。
この件に関して、百度が困っているという記事が掲載されている。

Hitwiseが発表した8月時点での検索エンジン市場シェアは、百度が64.9から55.1へ下落、Googleが10%から7%へ下落しているという。
検索すると3回に1度は、嫌がらせで真っ白の画面が表示されるGoogleがまだ7%保っているというのはGoogleの凄さだが、
百度の下落は広告ばかりが表示されるので必然であろうか。
筆者が思うに百度の検索結果は質が悪い。中国人でもGoogleがいろいろと使いにくくなってしまったので、仕方なしに使っているという話をしている人もいる。

さて、そんな中、360がユーザー数に物を言わせて一週間程度で中国第二のサーチエンジン(シェア10%前後)に躍り出たのだという。
そして、360のクローラがrobot.txtを無視して百度のサイト内で激しくクロールを開始した。

百度が文句もいうのはある意味普通のことかもしれない。
Google中国の元プログラマーによると、サーチエンジンの結果をそのままコピーすることは、テストで他人の答案をそのまま書き写すことだという。
サーチエンジンの結果を構築するのには永い時間が必要だからというのが、彼の話の趣旨である。
だから、360はrobot.txtを無視して、激しくクロールしているのだからケシカランとった記事が、中国ではそれなりに流れている。
これは、百度側からすれば、当然のことかもしれない。

しかし、筆者はそういった記事とは少し違う見方だ。
そもそも、サーチエンジンのみならず全てのWEBサイトは、構築に時間をかけているのだから別にサーチエンジンのみが特別ではない。
そして、robot.txtの件は、以前やっていた事を思い出せば、百度に関しては全く意味を成さないことが、すぐにわかるはずである。
百度がどうやってそのデータを構築したか? 百度のクローラがrobot.txtを守っていたか?

さて、この360というのは実に喧嘩の仕方がうまいというか、彼ら自身が別に公正明大というわけではないのだが百度に対しこの様な奇襲をかけるところもまた面白い。
当然、百度自身がrobot.txtを守っていなかったことを知っての戦略であろう。
もろろんこの事自体は、以前紹介したとおり日本のwikipediaにも書かれている情報で、知っている人は知っているのだが、それをうまく使って一気に中国第二のサーチエンジンを作り上げるやり方は大したものだ。
中国ではこれくらいやらないと、勝てないということなのだろう。

この3B大戦、記事はそれなりにあるが、以前の3Qのような盛り上がりは見せていない。
百度が独占しすぎなので、かえって良いという見方もあるようだ。