検索用語
検索式には用語とオペレータが含まれます。用語には、単語とフレーズの 2 種類があります。
単語とは、「car」や「engine」のような 1 語を指します。
フレーズとは、「electric car」のように、引用符で囲まれた複数の単語の集まりを指します。
複数の用語を組み合わせた複合的な検索をするには、ブール検索オペレータを使用します (下記参照)。
注意:英語が検索言語として設定されている場合は、用語の解析には英語の語幹処理が適用されます。例えば、「electrical」という単語は「electric」や「electricity」などのように語幹処理されます。
このことを踏まえて、検索の初期画面では適切な言語を選択してください。
語幹処理
英語: ポーター語幹処理アルゴリズム (Porter Stemming Algorithm) の標準的なルシーン (Lucene) を使用しています。検索用語の一般的な語尾変化を取り除いて標準化する処理です。
例:「riding」、「rides」、「horses」は、それぞれ「ride」、「ride」、「horse」となります。
その他の言語: 語幹処理アルゴリズムは、フランス語、ドイツ語、スペイン語、ロシア語にも使用されます。詳細については Snowball のサイトを参照してください。
検索フィールド
検索フィールドのシンボルと半角コロン「:」(または半角スラッシュ「/」) に続けて検索用語を入力することで、各検索フィールドを検索できます。
例:
「EN_ALL」 (全てのフィールド (英語)) はデフォルトの検索フィールドのため、このフィールド シンボルを入力する必要はありません。
注意:検索フィールドの指定は、検索フィールド シンボルの直後の検索用語についてのみ適用します。したがって、
EN_TI:("wind turbine" AND electric) solar
と入力した場合、発明の名称 (英語) の中からは「wind turbine」および「electric」のみが検索され、「solar」はデフォルトの検索フィールド (「EN_ALL」) の中から検索されます。
注意:検索フィールド シンボルとその値を区切るセパレータには、半角コロン「:」または半角スラッシュ「/」のどちらも使用できます。
ワイルドカード検索
単語の中の 1 文字または複数の文字にワイルドカードを適用して検索することができます。1 文字にワイルドカードを使用するには、半角の「?」記号を使用してください。複数の文字にワイルドカードを使用するには、半角の「*」記号を使用してください。
1 文字にワイルドカードを使用した検索では、その 1 文字が置き換えられて一致する各用語を検索します。例えば、「text」または「test」という用語を検索するには、次のように検索します。
複数文字のワイルドカード検索は、0 かそれ以上の複数の文字を検索します。例えば、「electric」、「electrical」、または「electricity」を検索するには、次のように検索します。
ワイルドカードは、検索用語の中間にも使用できます。
注意:ワイルドカード検索はすべて、語幹処理が適用されない検索フィールドに対して実行されます。例えば、「EN_TI_S:mot*」は「EN_TI:mot*」と変換されます。
注意:ワイルドカードが見つからない場合は、フレーズ検索の語幹処理が保たれます。例えば、「EN_TI_S:"electric mot*"」には、ワイルドカード (*) があるため語幹処理が適用されず、「EN_TI/”electric mot*”」と変換されますが、「EN_TI:"electric motor"」には語幹処理が適用されます。
注意:「PCT/US/2009/0*」のように ID/番号を使用して検索する場合は、検索フィールド シンボル「ALLNUM」を使用してください。デフォルトの「EN_ALL」を使用する場合は、(PCT US/2009/0*) のように入力してください。
注意: 「*」や「?」の記号は、検索用語の最初の文字 (語頭) には使用できません。
注意: 1 回の検索式 (クエリ) で使用可能なワイルドカードは、全体で 50 個までです。また、フィールドごとに使用可能なワイルドカードの数に上限があります。正確な上限数は、フィールドの種類と、使用される用語の単位 (単語、文など) によって異なります。
近傍検索
特定の単語数だけ離れている複数の単語を検索できます。近傍検索をするには、半角のチルダ「~」をフレーズの最後に使用してください。例えば 10 単語以内の近傍にある「electric」と「car」の 2 単語を検索する場合、次のように検索します。
注意: 次のような構文を使用することもできます。
この場合、構文は「"electric car"~5」と変換されます。
簡易日付検索
年月日のいずれかによる簡易検索ができます。
例:
範囲検索と日付検索
範囲検索を使用すると、フィールドの値が、指定範囲内の値に該当する文献が表示されます。また、範囲の上限と下限の基準値を含めるか含めないか選択できます。基準値を含む検索には半角のブラケット「[ ]」を使用し、基準値を含めない検索には半角の波カッコ「{ }」を使用します。検索結果は辞書順 (ABC 順、番号順) に表示されます。
例えば、公開日が「01.01.2000」から「01.01.2001」の範囲内 (基準日含む) の文献を探すには、次のように検索します。
注意: 範囲検索の対象は、日付フィールドに限られるものではありません。日付フィールド以外でも、範囲検索を行うことができます。
検索フィールドのデータ有無による検索
特定のフィールドのデータ有無によって文献を検索するには、「Field_Name:[* TO *]」を使用します。例えば、ロシア語の発明の名称が存在する文献を検索する場合、次のように検索します。
ダイナミック日付検索
検索実行日の日付を参照する特殊なキーワード「TODAY」を使用することができます。さらに、「DAY(s)」「WEEK(s)」「MONTH(s)」「YEAR(s)」を使って、特定の日数や週数、月数、年数を差し引くこともできます。次の例を参照してください。
ファジー検索
ファジー検索は、レーベンシュタイン距離 (Levenshtein Distance) または編集距離 (Edit Distance) アルゴリズムに基づき、検索用語と似たつづりの単語を検索します。ファジー検索を行うには、半角のチルダ「~」を単語の語尾に使用してください。例えば「roam」と似たつづりの単語 (例: 「foam」や「roams」) を検索するには、次のようにしてファジー検索を行います。
また、パラメーターを使用して近似度を指定することが可能です。パラメーターの値は 0 と 1 の間で指定し、1 に近づくにしたがって高い近似度を持つ単語が表示されます。次の例を参照してください。
ブール検索オペレータ (演算子)
ブール検索オペレータ (演算子) を使用して、複数の検索用語をブール論理によって組み合わせることができます。
使用可能なオペレータは、「AND」、「+」、「OR」、「NOT」、「ANDNOT」、「-」です。
「AND」がデフォルトのオペレータです。したがって、2 つの検索用語の間にオペレータが入力されていない場合、デフォルトで「AND」オペレータが使用されます。
例えば、「electric car」と「solar」を両方含む文献を検索するには、次のように検索します。
グループ分け
複数の用語をカッコで括ってグループ化することで、サブ検索式 (サブクエリ) を組み込むことができます。検索の際にブール論理を調整するのに便利な機能です。
例えば、「solar」または「wind」と「turbine」を検索するには、次のように検索します。
検索フィールドのグループ分け
カッコを使用して複数の用語をグループにまとめ、1 つの検索フィールドとします。
例えば、単語「battery」とフレーズ「electric car」を両方含む英語の発明の名称を検索するには、次のように検索します。
ID、AN、WO、PN、ALLNUM 検索構文
WO:YYYYNNNNNN, YYYY/NNNNNN, YY/NNNNNN, YYNNNNNN, YYYY/..NNNN, YY/..NNNN,YYYY..NNNN, YY..NNNN, YYYY, NNNNNN, ..NNNN (「...NNN」は、先頭の 0 が除かれたものです)
これらの構文の先頭には、次のように「WO/」やワイルドカード「*」を加えることができます。
AN:CCYYYYNNNNNN, CC/YYYY/NNNNNN, CC/YY/NNNNNN, CCYYNNNNNN, CC/YYYY/..NNNN, CC/YY/..NNNN,CCYYYY..NNNN, CCYY..NNNN, YYYY, NNNNNN, ..NNNN (「...NNN」は、先頭の0が除かれたものです)
これらの構文の先頭には「PCT/」を加えることができます。
国内公開番号 (PN:)
韓国: PN の形式は、102001NNNNNNN 100NNNNNN です。NNNNNNN, NNNNNNN, ..NNNNNNN, KR/NNNNNNN, KR/..NNNNN NNNNNNN, NNNNNNN, ..NNNNNNN, KR/NNNNNNN, KR/..NNNNN の検索が可能です。
南アフリカ: PN の形式は、YYYY/NNNNN です。YYYYNNNNN, ZA/YYYY/NNNNN, ZA/YYYYNNNNN, YYYY, NNNNNYYYY/NNNNN, YYYYNNNNN, ZA/YYYY/NNNNN, ZA/YYYYNNNNN, YYYY, NNNNN の検索が可能です。
ベトナム: PN の形式は、NNNN または NNNNN です。NNNNN, VN/NNNN, VN/..NN, ..NN の検索が可能です。
キューバ: PN の形式は NNNNNです。NNNNN, CU/NNNN, CU/..NN,..NN の検索が可能です。
アフリカ広域知知的所有権機関: PN の形式は、AP/P/YYYY/NNNNNN または 'AP N{1,4}' です。NNNNNN, ..NN, AP/YYYY/NNNNNN, AP/..NN, YYYY, YYYY/..NNNNNNNN, ..NN, AP/YYYY/NNNNNN, AP/..NN, YYYY, YYYY/..NN の検索が可能です。
シンガポール: PN の形式は、NNNNN または NNNNNN です。NNNNN, SG/NNNNN の検索が可能です。
イスラエル: PN の形式は、NNNNN または NNNNNN です。NNNNN, IL/NNNNN の検索が可能です。
メキシコ: PN の形式は CC/a/YYYY/NNNNNN です。NNNNNN, ..NN, MX/YYYY/NNNNNN, MX/..NN, YYYY, YYYY/..NN MX/..NN, YYYY, YYYY/..NN の検索が可能です。
外部関連資料
PATENTSCOPE search relevance algorithm
Search relevancy now uses Okapi BM25; this improves how the 'best results' are showing at the top of the result list, basically, the main difference being that high term frequency doesn't have an impact on the final score. |
Read more.. |