Nationale Sammlungen - Suchsyntax |
SuchbegriffeEine Recherche besteht aus Begriffen und Operatoren. Es gibt zwei Arten von Begriffen: Einfache Begriffe und Wortgefüge. Ein einfacher Begriff ist ein einfaches Wort wie "Auto" oder "Maschine". Ein Wortgefüge ist ein Gruppe von Wörtern in Anführungszeichen wie "elektrisches Auto". Mehrere Begriffe können durch die Nutzung von booleschen Operatoren zu einer komplexeren Recherche verbunden werden (siehe unten). Anmerkung:Wenn die Sprachoption "deutsch" gewählt wurde, werden Begriffe und Wortgefüge im Recherchefeld mit der deutschen Trunkierungsfunktion analysiert. Zum Beispiel wird der Begriff "elektrisch" in "elektri" tunkiert und ergibt dann "Elektrizität" usw. Es ist deshalb wichtig, die passende Sprachoption im Startfenster auszuwählen. |
TrunkierungDeutsch:Standardumsetzung durch Lucene vom Porter Stemming Algorithmus, ein Normalisierungsverfahren, das häufige Endungen von Wörtern entfernt. Beispiel:"reiten", "reitet", "Pferde" ==> "reit", "reit", "Pferd". Andere Sprachen:Trunkierungsalgorithmen werden auch für Englisch, Französich, Russisch, und Spanisch verwendet. Für weitere Informationen zu diesem Thema, wenden Sie sich bitte an die Snowball Referenzdokumentation. |
RecherchefelderJedes Feld kann durchsucht werden, indem der Feldindikator gefolgt von einem Doppelpunkt ":" oder einem Schrägstrich "/" gefolgt von dem jeweiligen Suchbegriff eingegeben wird. Beispiel: |
|
EN_TI:("wind turbine" AND electric) solar |
Da das "Alle Daten (Deutsch)" Feld (Feldercode DE_ALL) das Standardfeld für eine deutschsprachige Recherche ist, wird kein Feldindikator benötigt. Anmerkung: Dieses Feld ist nur gültig für den unmittelbar vorangehenden Begriff, so dass die Abfrage DE_TI:(Windturbine AND elektrisch) solar nur das Ergebnis Windturbine AND elektrisch im deutschen Titelfeld finden wird. Der Suchbegriff solar wird im Standardfeld gesucht (in diesem Fall das DE_ALL Feld). Anmerkung:Das Trennzeichen zwischen dem Feldindikator und dem dazugehörigen Suchbegriff kann entweder ":" oder "/" sein. |
Platzhalter (Wildcard, Joker)Sie können sowohl einfache als auch erweiterte Recherchen mit Platzhaltern durchführen. Um eine Recherche mit einem Platzhalter für ein einzelnes Zeichen durchzuführen, ist das Symbol "?" zu verwenden. Um eine Recherche mit einem Platzhalter für mehrere Zeichen durchzuführen, ist das Symbol "*" zu verwenden. Der Platzhalter für ein einzelnes Zeichen erlaubt eine Recherche nach passenden Begriffen mit dem einzelnen ersetzten Zeichen.Zum Beispiel kann eine Recherche nach "Text" oder "Test" folgenderweise durchgeführt werden: |
| te?t |
Der Platzhalter für mehrere Zeichen kann beliebig viele Zeichen (auch null) ersetzen. Zum Beispiel kann eine Recherche nach "electricity" (Elektrizität), "electronic" (Elektronik oder elektronisch) oder "electricity" (Elektrizität) folgenderweise durchgeführt werden: |
| electric* |
Platzhalter können auch in der Mitte eines Begriffs eingesetzt werden. |
| elec*ty |
Anmerkung:Abfragen mit Platzhaltern werden in nicht-trunktierten Recherchefeldern durchgeführt, z.B. wird EN_TI_S/mot* in EN_TI/mot* konvertiert. Anmerkung:Die Recherche nach Wortgefügen behält die Trunkierungsoption bei, wenn keine Platzhalter gefunden werden: EN_TI/"elektrischer Motor" wird trunkiert, während EN_TI_S/"elektrischer mot*" in EN_TI/"electric mot*" konvertiert wird. Anmerkung:Verwenden Sie bitte das ALLNUM Feld für Abfragen mit Kennnummern wie z.B. PCT/US/2009/0* oder verwenden Sie bitte Standardeinstellungen. Für das EN_ALL Feld sollte die Abfrage folgendermaßen formuliert werden: (PCT US/2009/0*) |
| ALLNUMM:PCT/US/2009/0* |
Anmerkung:Platzhalter für ein einzelnes Zeichen (?) oder für mehrere Zeichen (*) können nicht am Anfang eine Suchbegriffs verwendet werden. |
AbstandsoperatorenSie können nach Begriffen suchen, die in einem gewissen Abstand zueinander stehen. Um eine Recherche nach Abstand durchzuführen, ist das Tilde-Symbol "~" gefolgt vom erwünschten Abstand am Ende des Wortgefüges zu verwenden. Um zum Beispiel "electric" (elektrisch) und "car" (Auto) innerhalb eines Abstands von 10 Wörtern in einem Dokument zu finden, ist folgende Suche durchzuführen: |
| "electric car"~10 |
Anmerkung:Auch die folgende Syntax ist gültig: |
| electric NEAR car |
die konvertiert wird in "elektrisches Auto"~5 |
Einfache DatumsrechercheEs ist möglich, einfache Recherchen nach Jahr, Monat oder Tag durchzuführen. Zum Beispiel: |
| DP:01.02.2000 |
| DP:20000201 |
| DP:02.2000 |
| DP:200002 |
| DP:2000 |
Recherche nach IntervallenIntervallsuchen ermöglichen Ihnen, Dokumente abzurufen, deren Felderwerte sich zwischen dem von der Abfrage bezeichneten unteren und oberen Grenzwert befinden. Intervallsuchen schließen bei Nutzung von eckige Klammern die Grenzwerte ein, während sie bei der Nutzung von geschwenkten Klammern die Grenzwerte ausschließen. Die Anordnung erfolgt lexikografisch. |
| DP:[01.01.2000 TO 01.01.2001] |
Abgerufen werden Dokumente deren Veröffentlichungsdatum zwischen 01.01.2000 und 01.01.2001 einschließlich (da eckige Klammern) liegen. Es ist anzumerken, dass sich Intervallsuchen nicht nur auf Datumsfelder beschränken müssen. Intervallsuchen können auch für sonstige Felder (z.B. Namen) verwendet werden: |
| --> IN:{Smith TO Terence} |
Abgerufen werden alle Dokumente, in denen der Name des Erfinders zwischen"Smith" und "Terence" liegt, aber Smith und Terence nicht einschließt (da geschwenkte Klammern). Anmerkung:Nur für Datumsintervalle kann ebenso folgende Syntax verwendet werden: |
| DP:01.01.2000->01.01.2001 |
Recherche nach leeren FeldernMit Feldindikator:[* TO *] kann nach leeren/nicht leeren Feldern gesucht werden. Um zum Beispiel nach allen Dokumenten zu suchen, bei denen keine Erfinder angegeben ist und der russische Titel nicht leer ist, kann folgende Suche angewendet werden: |
| RU_TI:[* TO *] |
Unscharfe RechercheUnscharfe Recherchen beruhen auf dem Levenshteinschen Vergleich, oder Edit Distance Algorithmus. Zur Durchführung einer unscharfen Suche ist das Tilde-Symbol "~" am Ende eines einzelnen Begriffs zu verwenden. Um zum Beispiel nach einem Begriff mit ähnlicher Schreibweise wie "roam" (umhergehen) zu suchen, ist folgende unscharfe Suche durchzuführen: |
| roam~ |
Diese Suche wird Begriffe wie z.B. roam, roams, und foam abrufen. Ein Parameter kann die gewünschte Ähnlichkeit festlegen. Der Wert liegt zwischen 0 und 1, mit einem Wert, der näher an 1 liegt, werden nur Begriffe mit höherer Ähnlichkeit ausgewählt. Zum Beispiel: |
| roam~0.8 |
Boolesche OperatorenMittels boolescher Operatoren können Suchbegriffe mit einander verbunden werden. Folgende boolesche Operatoren können verwendet werden: AND, "+", OR, NOT, ANDNOT und "-". Der AND Operator ist der Standard-Verknüpfungsoperator. Das bedeutet, wenn kein boolescher Operator zwischen zwei Begriffen steht, wird der AND Operator verwendet. Um nach Dokumenten zu suchen, die sowohl "electric car" (Elektroauto) als auch "solar" erhalten, ist folgende Suche durchzuführen: |
| "electric car" solar |
GruppierungKlammern sind zu verwenden, um Begriffe zu gruppieren. Das kann sich als sehr nützlich erweisen, wenn die boolesche Logik einer Abfrage bestimmt werden soll. Um entweder "solar" oder "wind" und "turbine" zu suchen, ist folgende Abfrage durchzuführen: |
| (wind OR solar) AND turbine |
FeldgruppierungUm mehrere Begriffe zu einem einzigen Feld zu gruppieren, sind Klammern zu verwenden. |
| EN_TI:(+battery +"electric car") |
ZahlenformateFür PCT-Veröffentlichungsnummern (Feldercode "WO") können folgende Formate verwendet werden: Veröffentlichungsjahr gefolgt von der Seriennummer, mit oder ohne WO (z.B. WO/2009/001234 oder 2009/001234) mit oder ohne Schrägstrich (z.B. WO/2009/001234 oder WO2009001234) mit zweistelliger oder vierstelliger Jahreszahl (z.B. WO/09/001234 oder WO/2009/001234) mit oder ohne führende Nullen in der Seriennummer (z.B. WO/2009/001234 oder WO/2009/1234) sowie mit allen Kombinationen dieser Formate. Desweiteren können Platzhalter für mehrere Zeichen (*) verwendet werden: |
| WO:WO/1994* |
| WO:WO/1994/12* |
| WO:WO/12* |
| WO:12* |
Für alle Anmeldungsnummern (Feldercode "AN") können folgende Formate verwerdet werden: Ländercode (PCT mit Schrägstrich für PCT-Anmeldungen) gefolgt von Anmeldejahr und Seriennummer, mit oder ohne Schrägstrich (AP/2009/001234 oder AP2009001234) mit zweistelliger oder vierstelliger Jahreszahl (z.B. AP/09/001234 oder AP/2009/001234) mit oder ohne führende Nullen in der Seriennummer (z.B. AP/2009/001234 oder AP/2009/1234) sowie alle Kombinationen dieser Formate. Ländercode, Anmeldejahr und Seriennummern können unbestimmt gelassen werden, um z.B. mit 2009/001234 Dokumente von allen verfügbaren Ämtern abzurufen oder mit 001234 alle Dokumente mit dieser Seriennummer (von allen Ämtern und allen Jahren) abzurufen. |
Nationale VeröffentlichungsnummernFür alle nationale Veröffentlichungsnummern (Feldercode "PN") sollte der Ländercode angegeben werden. Desweiteren gelten folgende Formatierungsrichtlinien: ARIPO: "AP/P/" gefolgt von der vierstelligen Jahreszahl under der sechsstelligen Seriennummer, mit Schrägstrichen (z.B. AP/P/2009/012345) Israel: Fünf- oder sechsstellige Seriennummer Mexiko: "MX/a/" gefolgt von der vierstelligen Jahreszahl und der sechsstelligen Seriennummer, mit Schrägstrichen (z.B. MX/a/2009/012345) Korea (KR): "10" gefolgt von der vierstelligen Jahreszahl und der siebenstelligen Seriennummer (z.B. 1020090001234) Kuba: Fünfstellige Seriennummer Singapur: Fünf- oder sechsstellige Seriennummer Südafrika: Vierstellige Jahreszahl gefolgt von der fünfstelligen Seriennummer, mit Schrägstrichen (z.B. 2009/00123) Vietnam: Vier- oder fünfstelligen Seriennummer |
| PN:0001 |
| PN:(0001 VN) |
| PN:(1 VN) |
| PN:(VN/0001) |
| PN:(VN/1) |
Externe Ressourcen |
| Lucene Syntax |
| PATENTSCOPE Syntax |