WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2004006133) TEXT-MACHINE CODE, SYSTEM AND METHOD
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2004/006133    International Application No.:    PCT/US2002/021198
Publication Date: 15.01.2004 International Filing Date: 03.07.2002
IPC:
G06F 17/30 (2006.01)
Applicants: IOTAPI., COM, INC. [US/US]; 514 Bryant, Suite 119, Palo Alto, CA 94301 (US) (For All Designated States Except US).
DEHLINGER, Peter, J. [US/US]; (US) (For US Only).
CHIN, Shao [US/US]; (US) (For US Only)
Inventors: DEHLINGER, Peter, J.; (US).
CHIN, Shao; (US)
Agent: DEHLINGER, Peter,; Perkins Coie LLP, P.O. Box 2168, Menlo Park, CA 94026 (US)
Priority Data:
Title (EN) TEXT-MACHINE CODE, SYSTEM AND METHOD
(FR) CODE, SYSTEME ET PROCEDE D'ADAPTATION A UN TEXTE
Abstract: front page image
(EN)An automated method, system and machine readable code for comparing an input text in a selected field with each of a plurality of natural-language texts in the same field are disclosed. In the method, each of a plurality of terms characterizing the input text (32) is associated with a selectivity value (40) related to the frequency of occurrence of that term in a database (38) of digitally processed texts in the selected field (30), relative to the frequency of occurrence of the same term in a database of digitally processed texts in one or more unrelated fields. For each of the plurality of natural-language texts in the same field, a match score related to the number of terms derived from that text that match those of the input text, weighted by selectivity values of the matching terms, is determined. The highest-score matches are then determined.
(FR)L'invention concerne un procédé automatisé, un système et un code lisible par machine, permettant de comparer un texte d'entrée dans un domaine sélectionné avec chacune des pluralités de textes en langage naturel dans le même domaine. Dans le procédé selon l'invention, chaque pluralité de termes caractérisant le texte d'entrée (32) est associée à une valeur de sélectivité (40) ayant trait à la fréquence d'occurrence de ce terme dans une base de données (38) de textes traités numériquement dans le domaine sélectionné (30), par rapport à la fréquence d'occurrence du même terme dans une base de données de textes traités numériquement dans un ou plusieurs domaines sans rapport avec l'objet. Pour chacune des pluralités de textes en langage naturel dans le même domaine, on détermine une cotation de correspondance ayant trait au nombre de termes dérivés de ce texte qui correspondent à ceux du texte d'entrée, pondéré par des valeurs de sélectivité des termes se rapprochant. Les correspondances aux cotes les plus élevées sont alors déterminées.
Designated States: AE, AG, AL, AM, AT, AU, AZ, BA, BB, BG, BR, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DZ, EC, EE, ES, FI, GB, GD, GE, GH, GM, HR, HU, ID, IL, IN, IS, JP, KE, KG, KP, KR, KZ, LC, LK, LR, LS, LT, LU, LV, MA, MD, MG, MK, MN, MW, MX, MZ, NO, NZ, OM, PH, PL, PT, RO, RU, SD, SE, SG, SI, SK, SL, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VN, YU, ZA, ZM, ZW.
African Regional Intellectual Property Organization (GH, GM, KE, LS, MW, MZ, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, IE, IT, LU, MC, NL, PT, SE, SK, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)