
朝日新聞社(本社:東京都中央区)は、2007年9月に小・中・高等学校向けオンライン記事データベースサービス「朝日けんさくくん」のリニューアルをおこなった。リニューアルの主眼であった「検索機能の性能強化」を、Pana Search/KBシリーズによって実現。500万件という膨大な記事数、そして「検索要求の集中」という厳しい運用環境を克服し、サイトのさらなる利便性向上に貢献している。
「朝日けんさくくん」は、朝日新聞・AERA・週刊朝日の記事検索、天声人語をはじめとする朝日新聞のコラム、漢字や英語の日替わり学習素材、大学入試センター試験対策ページなど、授業や受験対策に役立つコンテンツを揃えた、小・中・高等学校向けのオンライン記事データベースサービスだ。学校向けという性質上、コンテンツ内容やページデザインなどの点で、一般の個人・法人向けページと差別化が図られているのは言うまでもない。しかし、より根本的にサイトの構築方法に影響を及ぼす違いが両者にはある。プロジェクトリーダーの山本和人氏は次のように説明してくれた。

「両者の大きな違いは、検索の要求率です。『朝日けんさくくん』は授業でも活用されますから、クラスの生徒全員が同時に使用するなど、一般の個人・法人向けページに比べて検索要求が集中しやすいのです。」(山本氏)

そこで2007年3月より着手された「朝日けんさくくん」のリニューアルプロジェクトでは、検索要求の集中による高負荷下でもスピーディーに必要な記事を探し出せる、高性能の検索機能を実現することが主要な課題となった。さらに、山本氏が検索エンジンにこだわる理由はシステム的な観点にとどまらない。
「学生たちの新聞離れが叫ばれる中、『新聞を通して社会を知る』ことを『朝日けんさくくん』で体験してもらうことが私たちの願いです。その入口として重要なのは、押し付けられたものではなく、自分自身のキーワードで記事を探すことだと思います。学校向けのサイトだからこそ、なおのこと検索機能にこだわりたかったのです。」(山本氏)
|
 |
検索エンジンの選定で、候補に上がったのは3社の製品。3カ月にわたる入念な検討の結果、選ばれたのはPana Search/KBシリーズだった。構築担当主任の岩本和樹氏は、おもな評価のポイントとして以下の3点をあげる。
1. 検索スピード
「『朝日けんさくくん』の収録記事数は、過去20年以上の朝日新聞に、AERA、週刊朝日の記事を加えた500万件を超える非常に大規模なものです。しかも先述のとおり、検索要求の集中によって負荷が大きくなる傾向があります。このような環境下でも圧倒的に高速な検索レスポンスを確保できたのが、Pana Search/KBシリーズでした。」(岩本氏)
2. 開発のしやすさ
 |
「リニューアルプロジェクトを共に進めるウェブプログラミング会社の意向も踏まえながら、開発、機能カスタマイズ、性能チューニングのしやすさという点でも検討を重ねました。その結果、一つの設定ファイルのハンドリングで開発要件やシステム環境に合わせたデータベースや検索仕様の設計・変更が可能である、その設定ファイルを元にクライアントAPIを用いて検索アプリケーションの作り込みも可能である点などから、Pana Search/KBシリーズは開発難易度の低減が図られていると判断しました。また開発にあたり、パナソニックのPana Search/KBシリーズ開発チームに通じた方から、直接、開発サポートを受けられる点も助かりました。」(同氏)
|
3. インデックスの登録・追加スピード
「Pana Search/KBシリーズは、インデックスの登録および追加スピードの点でも優れていました。約500万件の初回インデックス登録は1時間弱でおこなえましたし、毎日約1,500件のペースでおこなわれる追加登録も5分とかからずにできます。」(同氏)
| お客様の検討メモ |
- Pana Search/KBシリーズは、ヒット件数が多いキーワードでも性能劣化が小さい。また、属性指定や期間指定と組み合わせた検索クエリーでも性能劣化がない。
- 2〜15単語のAND/OR/NOT検索で性能測定したところ、Pana Search/KBシリーズはキーワードの個数による性能劣化が小さいことが確認された。
- 100件超〜1,000件超ヒットするキーワードでの検索を標準とするならば、Pana Search/KBシリーズは1秒間につき40件の検索クエリー処理(※評価時)が期待できる。
|
システム構築では、パナソニックのスタッフも開発・設計に参画し、サポートをおこなった。パナソニックのサポート部隊に期待されたのは、検索要求が集中した時のさらなるレスポンス向上。そこで、約2カ月間をかけてデータベースの構成やハードスペックの検討を重ね、応答秒数約0.01という、さらなる高速化を実現した。
Pana Search/KBシリーズを用いて、約500万件という記事数、検索要求の集中という高負荷下でも応答秒数約0.01の高速検索機能を実現した新生「朝日けんさくくん」。その検索スピードは、利用者からも好評を博しているという。
最後に、山本・岩本両氏に、リニューアルプロジェクトを終えての感想と今後の展望について、それぞれ伺った。

「このプロジェクトに携わるまで、検索エンジンというと『高価』とか『扱いづらい』というイメージがあったのですが、Pana Search/KBシリーズに接してみてイメージが変わりました。むしろ、今後の仕事を考える上で有効なノウハウを得られたと思います。やはり、優れたコンテンツを持っているサイトであれば、それを人に知ってもらうためにも検索機能をサイトの中心に据えた方が良いですからね。優れた検索機能を実現し、ますます自信を持って『朝日けんさくくん』をお勧めできるようになると思います。」(山本氏)
「学生が興味を持った1つのキーワードが、検索を通してさらに広がり、発想を膨らませる契機となる。これが私たちの目指している検索機能です。既に概念検索を用いて、検索結果に関連したキーワードを表示するようにしていますが、今後も『(記事を)絞り込む』だけではなく、『(発想を)膨らませる』検索機能を目指して、引き続きナビゲーションの充実を図っていきたいですね。」(岩本氏)

新聞、そして社会へと学生をいざなう入口として。ますます魅力的なサイトを実現するために、Pana Search/KBシリーズの挑戦はこれからも続く。
 |
朝日新聞社 様

1879年(明治12年)に設立された朝日新聞社は、日刊紙「朝日新聞」の発行を中心に、雑誌、書籍、年鑑などの出版事業や、文化・スポーツ・環境・福祉といった多岐にわたる分野での事業活動を展開。定評のある確かな情報、鋭い調査・検証、わかりやすい論説を通し、日本を代表する言論・報道機関として着実な取り組みを続けられています。
また、デジタルメディア部門ではニュースサイト「アサヒ・コム」を中心に携帯サイトや記事データベース事業などネット分野でのサービス開発にも積極的に取り組まれています。

●所在地: 東京都中央区築地5-3-2
|
*本サイト上で記載されている製品名および商品名は、それぞれの会社の商標または登録商標です。