AV・PC・ソリューション > Pana Search/KB > FAQ > Answer

ここから本文です。

知的全文検索ソフトウェア Pana Search/KBシリーズ

Answer


■基本編

Q Pana Search/KBシリーズって何?
A データベース機能と検索エンジン機能を併せ持った、松下電器独自の全文検索エンジンソフトウェアです。これまで、検索サービスシステム構築のコアソフトウェアとしての実績を数多く積んできたPana Searchシリーズのノウハウを盛り込んだパッケージ製品として開発されました。Oracle®やDB2®のようなRDBMSを使用せずに、Pana Search/KBシリーズだけでデータベースシステムを構築することも可能です。
 

Q V4.0からV4.5への仕様変更点は何ですか?
A 以下の項目が挙げられます。
 
■機能面
V4.5は メモリエラーフリー検索 が追加されています。
 
■性能面
4.5は差分更新機能の高速化が図られており、小規模なデータベースの版に対する保守ツール(create_db、diff_updt、merge_db、defrag_db)の実行時間がV4.0に比べ、最大10分の1程度に短縮されます。
 
■対応OS
V4.5はSolaris™ 8/9をサポートしていません。
 

Q Pana Search/KBシリーズとPana Search/SSシリーズはどのような関係ですか?
A Pana Search/KBシリーズとPana Search/SSシリーズは、ともに松下電器の全文検索エンジンです。Pana Search/KBシリーズは、Pana Search/SSシリーズで培ったノウハウや課題を基に、新たな全文検索エンジンとして全く異なるアーキテクチャで設計されました。
 

Q どのような製品ラインナップがありますか?
A 二つのEditionを用意しています(下記参照)。構築するシステム及びプラットフォームに合せたEditionをご選択ください。各Editionの内容は、本サイトの製品ラインナップ をご覧ください。
 
Standard Edition
Enterprise Edition
 

Q 他社との差別化ポイントは?
A 以下の項目が挙げられます。
 
・豊富な検索方式が実現可能
・全文検索が高速
・データの更新が高速
・書誌項目が検索可能
・データベースの世代管理によるデータの安全性確保
 


 
■設計・実装編

Q 検索エンジンに投入するデータの形式は?
A EUCやシフトJIS、UTF-8(文字コード)などのプレーンテキスト形式の入力データが登録できます。フィールドの区切り及びレコード区切りは、データベース設計時に定義したものを使用します。
 

Q 索引のサイズはどのくらいになりますか?
A Pana Search/KBシリーズ独自の索引方式(特許取得済)により、索引サイズを最大で入力データの130%程度に抑えています。索引の圧縮設定や不要語の設定により、入力データの60%程度にすることも可能です。従来のn-gram方式の全文検索エンジンでは、同値400%程度、RDBにて索引を設定した場合は、同値500%程度になります。
 

Q 他社RDBとの連携は可能ですか?
A Pana Search/KBシリーズは、単独で動作するRDB機能を持った検索エンジンです。他社RDBとのインターフェースは持っていません。ただし、アプリケーションレベルでの連携は可能です。
 
■Oracle®との連携について
アプリケーションレベルでの連携例テキスト及び書誌項目の検索をPana Search/KBでおこない、Pana Search/KBから検索結果にIDのみを取得し、Oracle®より実体を取得します。Pana Search/KBシリーズは、RDB機能を持った検索エンジンですので、システムの条件にさえ合えば、Oracle®を使わずにデータベースシステムを構築することが可能です。
 

Q 動作OSは?
A Editionにより動作OSが異なります。
 
 
Solaris™ 8
Solaris™ 9
Red Hat Enterprise Linux®
〜 AS3 Update5(以降)
〜 ES3 Update5(以降)
〜 AS4 Update1(以降)
〜 ES4 Update1(以降)
Windows®
server 2003 SP1
Standard Edition
Enterprise Edition ×
*V4.5はSolaris™ 8/9をサポートしていません
 


 
■検索編

Q どのような検索ができますか?
A 以下のような高度検索機能を持っています。
 
・全文検索(文字列検索、単語検索、近傍検索)
・書誌検索(記号型、数値型、統計情報取得)
・概念検索(キーワード抽出、類似文書検索、自然文検索)
 
 * 類似文書検索・自然文検索などの高度検索機能は、Enterprise Editionのみの対応となります
 

Q PDFやWord/Excelのデータを検索することはできますか?
A ユーザー側でご用意いただいたソフトウェアにより、各アプリケーションファイルからテキストを抽出し、登録することで可能となります。テキスト抽出プログラムは、ユーザー側でご用意いただきます。
 

Q 大文字と小文字を区別しますか?
A Pana Search/KBシリーズでは、原則として登録したデータの文字はすべて登録したままの文字として扱われます。つまり登録さえしておけば、大文字や小文字、半角、全角文字は、すべて区別し、別の文字として扱われるということです。ただし、索引作成時にフィルタープログラムを用いることで、大文字、小文字や半角、全角を区別しないこともできます。大文字、小文字の区別を望まれないユーザー向けに、フィルタープログラムのサンプルをご用意しています。
 

Q 検索属性(データタイプ)と検索方式にはどのようなものがありますか?
A テキスト型、記号型、数値型の3種類があります。
 
■テキスト型
長文のテキストを対象とし、以下の検索機能が可能です。
・文字列検索
・単語検索
・キーワード抽出
・類似文書検索
・自然文検索

■記号型
単語、商品コード、名前等の比較的短い文字列を対象とします。
完全一致、前方一致、後方一致、中間一致、範囲検索、ワイルドカード検索が可能です。
カンマ区切り(CSV形式)のデータを登録することが可能です。

■数値型
10進数の整数を対象とします。
1バイト整数型〜8バイト整数型(約19桁)の数値データを扱うことができ、完全一致と範囲検索が可能です。


Q キーワード抽出は検索サービスにおいてどのような用途がありますか?
A 次のような利用方式をご提案できます。
 
■検索結果の要約として利用
検索結果の中から、該当文書を特徴付けるキーワードを提示することで、
内容を把握することができます。

■検索キーワードの提示
検索結果全体から、検索結果の特徴を示すキーワードを提示することで、
検索者に絞り込みのための検索キーワードを提供することができます。


Q Pana Search/KBシリーズは検索結果のソート機能を持っていますか?
A 持っています。検索結果の出力順序については、検索キーワードをベースとしたランキング機能と、記号型、数値型データによるソート機能があります。
どちらもカスタマイズが可能で、容易に複数ソートキーの指定や昇順・降順の切り替えができます。またランキング機能とソート機能の組み合わせも可能です。
 

Q 一回の検索処理における、最大結果取得件数は?
A 約10万件までの範囲で自由に設定可能です。(通常は2,000件程度を設定)
 


 
■データベース編

Q どのような形式のデータベース構造を持つことができますか?
A 単一形式のデータベースから、複数形式のデータベースを一つのエンジンで管理することが可能です。例えば、以下のような形式のデータベースを構築できます。
 
■例1:単一形式
データ形式が同一のデータベースを年次単位で構成することが可能です。
検索対象は各年次単位もしくは全年次において可能となります。

■例2:複数形式
雑誌データベースと新聞データベースのようなデータ項目の異なるデータベースを
結合させた構成が可能です。


Q SQLは使えますか?
A 使えません。APIに対して検索要求等をおこないます。データ登録・更新は、専用のツールを利用します。
 

Q 検索サービスを停止することなくデータベースの更新は可能ですか?
A 可能です。データベースの世代管理と差分更新機能を使うことにより、検索サービスを停止することなくデータの更新が可能となります。
 

Q 繰り返し項目はどのようにして扱うのですか?
A 記号型データを定義することで、CSV形式のデータをそのままPana Search/KBシリーズに投入可能です。正規化の必要はありません。また、1フィールドのデータは、その制限値の範囲内であれば、データのサイズや繰り返し数を定義する必要もありません。
 

Q 1レコードを構成するフィールドの制限値はいくつですか?
A 256個です。
 

Q 1フィールドのデータの制限値はいくつですか?
A 134,217,727バイトです。