WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2008100849) SEMANTICS-BASED METHOD AND SYSTEM FOR DOCUMENT ANALYSIS
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2008/100849    International Application No.:    PCT/US2008/053575
Publication Date: 21.08.2008 International Filing Date: 11.02.2008
IPC:
G06F 17/00 (2006.01)
Applicants: CYCORP, INC. [US/US]; 7718 Wood Hollow, Suite 250 Austin, TX 78731 (US) (For All Designated States Except US)
Inventors: WITBROCK, Michael John; (US).
SCHNEIDER, David Andrew; (US).
RODE, Benjamin, Paul; (US).
ALDAG, Bjoern; (US)
Agent: ADAMS, Michael, P.; Winstead Sechrest & Minick P.C., P.O. Box 50784, Dallas, TX 75201 (US)
Priority Data:
11/706,716 15.02.2007 US
60/857,379 07.11.2006 US (IA Considered Withdrawn 11.06.2008)
Title (EN) SEMANTICS-BASED METHOD AND SYSTEM FOR DOCUMENT ANALYSIS
(FR) SYSTÈME ET PROCÉDÉ BASÉS SUR LA SÉMANTIQUE POUR L'ANALYSE DE DOCUMENT
Abstract: front page image
(EN)A system and method for producing semantically-rich representations of texts which amplify and sharpen the interpretation of the texts The method relies on the fact that there is a substantial amount of semantic content associated with most text strings that is not explicit in the strings, or in the mere statistical co-occurrence of the stnngs with other strings, but which is nevertheless relevant to the text This additional information is used to sharpen the representations derived directly from the text string, and also augment the representation with content that, while not explicitly mentioned in the string, can be used to support the performance of text processing applications including document indexing and retrieval, document classification, document routing, document summarization, and document tagging.
(FR)La présente invention concerne un système et procédé destinés à produire des représentations de texte riches d'un point de vue sémantique afin d'amplifier et d'affiner l'interprétation de textes. Le procédé repose sur le fait qu'il existe une quantité substantielle de contenu sémantique associé à la plupart des chaînes de texte qui n'est pas explicite dans ces chaînes, mais qui est néanmoins extrêmement pertinente au texte. Cette information supplémentaire est utilisée pour affiner les représentations découlant directement de la chaîne de texte, ainsi que pour augmenter la représentation avec du contenu qui, bien que non explicitement mentionnée dans la chaîne, est implicite dans le texte et, si rendue explicite, elle peut être utilisée pour appuyer la performance des applications de traitement de texte y compris la récupération et l'indexation de document, la classification de document, l'acheminement de document, la récapitulation de document et l'étiquetage de document. Ces améliorations peuvent être utilisées pour appuyer le traitement en aval, tel que la lecture et la compréhension automatisées de document, la mise en place d'annonces en ligne, le commerce électronique, la gestion de connaissance d'entreprise, et des applications d'intelligence gouvernementale et d'entreprise.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PG, PH, PL, PT, RO, RS, RU, SC, SD, SE, SG, SK, SL, SM, SV, SY, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LS, MW, MZ, NA, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MT, NL, NO, PL, PT, RO, SE, SI, SK, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: English (EN)
Filing Language: English (EN)