Национальные фонды - Синтаксис запроса |
ТерминыЗапрос можно осуществлять по терминам и с помощью операторов. Существует два вида терминов: одиночные термины и словосочетания. Одиночный термин представляет собой отдельное слово, как, например, "автомобиль" или "двигатель". Словосочетание представляет собой группу слов, взятых с обеих сторон в кавычки, как, например, "электрический автомобиль". Для составления более сложного запроса несколько терминов могут быть объединены с помощью логических операторов (см. ниже). Примечание:Если выбран английский язык, то анализ терминов и словосочетаний, указанных в строке запроса, будет существляться по основе английского слова. Например, термин "electrical" будет сопоставляться с основой слов "electric", "electricity" и т. д. Поэтому важно выбрать язык на стартовой странице запроса. |
Сокращение до основы словаАнглийский:Стандартное применеие LuceneСтеммер Портера, процесс нормализации, заключающийся в удалении наиболее часто встречающихся окончаний слов. Например:"riding", "rides", "horses" ==> "ride", "ride", "hors". Другие языки:Стеммеры используются также для испанского, немецкого, русского и французского языков. Более подробно см. на сайте проекта Snowball. |
ПоляДля поиска по любому из полей необходимо напечатать имя поля, а затем, отделив его дветочием, ":" или "/", напечатать искомый термин. Примеры: |
|
EN_TI:("wind turbine" AND electric) solar |
Поскольку полем по умолчанию является EN_ALL , его указывать не требуется. Примечание: Указание поля относится только к следующему за ним термину, и поэтому в ответ на запрос EN_TI:("wind turbine" AND electric) solar в поле названия будут найдены только термины"wind turbine" AND electric. В поле, установленном по умолчанию (в данном случае EN_ALL field), будет найден термин "solar" . Примечание:Разделителем между именем поля и его значением может служить ":" или "/". |
Поиск по шаблонуШаблоном можно заменить один или несколько символов в одиночном термине. Для замены одного символа следует использовать знак "?". Для замены сразу нескольких символов следует использовать знак "*". Если шаблоном заменен один символ, осуществляется поиск всех терминов, которые отличаются друг от другатолько этим символом. Например, для поиска терминов "text" и "test" можно использовать поиск : |
| te?t |
Если шаблоном заменено несколько символов, осуществляется поиск терминов, которые отличаются друг от друга на 0 или более символов. Например, для поиска терминов "electric", "electrical" или "electricity" можно использовать поиск: |
| electric* |
Шаблоны можно также использовать в середине термина. |
| elec*ty |
Примечание:Любой поиск по шаблону осуществляется только применительно к полям, в которых слова не сокращены до основы: EN_TI_S/mot* преобразуется в EN_TI/mot* Примечание:При запросе, в котором содержатся словосочетания, сохраняется возможность сокращения слова до его основы при условии отсутствия шаблонов: EN_TI/"electric motor" сокращается до основы, а EN_TI_S/"electric mot*" преобразуется в EN_TI/"electric mot*" Примечание:При запросах с использованием таких идентификаторов, как PCT/US/2009/0*, следует использовать поля ALLNUM; в противном случае следует использовать поле по умолчанию EN_ALL и формулировать запрос, например, следующим образом: (PCT US/2009/0*) |
| ALLNUMM:PCT/US/2009/0* |
Примечание:Знак * или ? нельзя использовать в качестве первого символа в запросе. |
Поиск поблизостиПо такому запросу осуществляется поиск слов, которые расположены на определенном расстоянии друг от друга. Для поиска поблизости следует использовать символ тильда "~" в конце словосочетания. Например, для поиска терминов "electric" и "car", которые в документе отстоят друг от друга не более чем на 10 слов, следует использовать поиск: |
| "electric car"~10 |
Примечание:Можно также использовать синтаксис: |
| electric NEAR car |
, который преобразуется в "electric car"~5 |
Простой поиск по датеДопускается простой поиск по году, месяцу или дню. Например: |
| DP:01.02.2000 |
| DP:20000201 |
| DP:02.2000 |
| DP:200002 |
| DP:2000 |
Поиск по интервалу значений и датамПоиск по интервалу значений позволяет найти документы, даты публикации которых находятся между определенными в полях запроса нижним и верхним значениями. Верхнее и нижнее значения могут быть как включены в поиск, так и исключены из него. Сортировка производится лексикографически. |
| DP:[01.01.2000 TO 01.01.2001] |
По такому запросу будут найдены все документы, даты публикации которых, указанные в соответсвующих полях, находятся в интервале между 01.01.2000 и 01.01.2001 включительно. Следует принять к сведению, что поиск по интервалу значений не ограничивается только датами. Можно также осуществлять поиск по интервалу значений для иных полей, а именно не связанных с датой: |
| --> IN:{Smith TO Terence} |
По такому запросу будут найдены документы, в которых имена изобретателей находятся в интервале между Smith и Terence, но не включают сами имена Smith и Terence. Запросы по интервалу с включением верхнего и нижнего значений обозначаются квадратными скобками.Запросы по интервалу с исключением верхнего и нижнего значений обозначаются фигурными скобками. Примечание:Для интервалов дат можно также использовать синтаксис: |
| DP:01.01.2000->01.01.2001 |
Поиск по пустым полямДля поиска по пустым/непустым полям следует использовать Field_Name:[* TO *]. Например, для того чтобы найти все документы, в которых не указан изобретатель, а поле с русским названием не является пустым, можно использовать поиск: |
| RU_TI:[* TO *] |
Нечеткий поискНечеткий поиск основывается на алгоритме вычисления расстояния Левенштейна, или дистанции редактирования. Для нечеткого поиска следует использовать символ тильда "~" в конце одиночного термина. Например, для поиска термина, схожего по орфографии с "roam", следует использовать нечеткий поиск: |
| roam~ |
По такому запросу будут найдены термины, подобные "foam" и "roams". Степень схожести может быть задана определенным параметром. Его значение составляет от 0 до 1, при этом чем значение ближе к 1, тем выше степень схожести терминов. Например: |
| roam~0.8 |
Логические операторыЛогические операторы позволяют комбинировать термины с применением определенных логических связок. В качестве логических операторов используются следующие: AND, "+", OR, NOT, ANDNOT и "-". Опепатор связки AND является оператором по умолчанию. Это означает, что если два термина не связаны никаким логическим оператором, то используется оператор AND. Для поиска документов, в которых одновременно содаржатся термины "electric car" и "solar", следует использовать запрос: |
| "electric car" solar |
ГруппированиеС помощью круглых скобок можно группировать операторы для оформления подзапросов.Это может оказаться особенно удобным для построения логики запроса. Для поиска терминов "solar" или "wind" и "turbine" следует использовать запрос: |
| (wind OR solar) AND turbine |
Группирование полейС помощью круглых скобок можно группировать несколько операторов в рамках одного поля. Для поиска английского названия, содержащего одновременно слово "battery" и словосочетание "electric car", следует использовать запрос: |
| EN_TI:(+battery +"electric car") |
Синтаксис запросов ID,AN,WO,PN,ALLNUM WO:YYYYNNNNNN, YYYY/NNNNNN, YY/NNNNNN, YYNNNNNN, YYYY/..NNNN, YY/..NNNN,YYYY..NNNN, YY..NNNN, YYYY, NNNNNN, ..NNNN (...NNN означает, что все ведущие 0 удалены) В начале любого такого запроса можно добавить WO/ и шаблон (*), как, например: |
| WO:WO/1994* |
| WO:WO/1994/12* |
| WO:WO/12* |
| WO:12* |
AN:CCYYYYNNNNNN, CC/YYYY/NNNNNN, CC/YY/NNNNNN, CCYYNNNNNN, CC/YYYY/..NNNN, CC/YY/..NNNN,CCYYYY..NNNN, CCYY..NNNN, YYYY, NNNNNN, ..NNNN (...NNN означает, что все ведущие 0 удалены) В начале любого такого запроса можно добавить PCT/ |
Номер национальной публикации (НП:)Корея: формат НП является следующим: 102001NNNNNNN 100NNNNNN. Поиск можно осуществлять по NNNNNNN, NNNNNNN, ..NNNNNNN, KR/NNNNNNN, KR/..NNNNN Южная Африка: формат НП является следующим: YYYY/NNNNN. Поиск можно осуществлять поYYYY/NNNNN, YYYYNNNNN, ZA/YYYY/NNNNN, ZA/YYYYNNNNN, YYYY, NNNNN Вьетнам: формат НП является следующим: NNNN или NNNNN. Поиск можно осуществлять поNNNNN, VN/NNNN, VN/..NN, ..NN Куба: формат НП является следующим: NNNNN. Поиск можно осуществлять поNNNNN, CU/NNNN, CU/..NN,..NN АРОИС: формат НП является следующим: AP/P/YYYY/NNNNNN или 'AP N{1,4}'. Поиск можно осуществлять по NNNNNN, ..NN, AP/YYYY/NNNNNN, AP/..NN, YYYY, YYYY/..NN Сингапур: формат НП является следующим: NNNNN или NNNNNN. Поиск можно осуществлять поNNNNN, SG/NNNNN Израиль: формат НП является следующим: NNNNN или NNNNNN. Поиск можно осуществлять по NNNNN, IL/NNNNN Мексика: формат НП является следующим: CC/a/YYYY/NNNNNN. Поиск можно осуществлять поNNNNNN, ..NN, MX/YYYY/NNNNNN, MX/..NN, YYYY, YYYY/..NN |
| PN:0001 |
| PN:(0001 VN) |
| PN:(1 VN) |
| PN:(VN/0001) |
| PN:(VN/1) |
Внешние ресурсы |
| Синтаксис Lucene |
| Синтаксис PATENTSCOPE |