aws memo

AWS関連の備忘録 (※本ブログの内容は個人的見解であり、所属組織及び企業の意見を代弁するものではありません。1年以上古いエントリは疑ってかかってください)

CS:CloudSearchでWikipediaを検索するデモサイト

いつまであるかわからないけど。。。

Search Technologies, Wikipedia / Amazon CloudSearch Demo

 

仕組みの解説 http://www.searchtechnologies.com/wikipedia-cloudsearch-lab.html

Aspireというコンテンツ処理プラットフォーム経由でWikipediaのダンプファイルをxml化してCloudSearchにPostしているぽい。インデクシングのスピードは、 400ドキュメント/秒 以上とのこと。かなり速い。

検索結果は、TwiqKitで表示させている、と。

 

そして、その詳解記事

Blog: Searching Wikipedia with Amazon CloudSearch