WIPO logo
Mobile | Deutsch | English | Español | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Recherche dans les collections de brevets nationales et internationales
World Intellectual Property Organization
Recherche
 
Options de navigation
 
Traduction
 
Options
 
Quoi de neuf
 
Connexion
 
Aide
 
Traduction automatique
1. (WO2016145266) IDENTIFICATION DE PHRASES EN FONCTION DU CONTEXTE
Dernières données bibliographiques dont dispose le Bureau international   

N° de publication :    WO/2016/145266    N° de la demande internationale :    PCT/US2016/021892
Date de publication : 15.09.2016 Date de dépôt international : 11.03.2016
CIB :
G06F 17/27 (2006.01)
Déposants : MICROSOFT TECHNOLOGY LICENSING, LLC [US/US]; Attn: Patent Group Docketing (Bldg. 8/1000) One Microsoft Way Redmond, Washington 98052-6399 (US)
Inventeurs : KAPPLER, Thomas; (US).
KIEFER, Bernd; (US).
STENGÅRD, Peter Johan; (US)
Mandataire : MINHAS, Sandip; (US)
Données relatives à la priorité :
62/131,932 12.03.2015 US
14/836,361 26.08.2015 US
Titre (EN) CONTEXT SENSITIVE PHRASE IDENTIFICATION
(FR) IDENTIFICATION DE PHRASES EN FONCTION DU CONTEXTE
Abrégé : front page image
(EN)A computing device for processing textual information from at least one source of textual information is provided. The computing device includes a processor that is a functional component of the computing device and is configured to execute instructions to process the textual information. A listener component is configured to receive the textual information from the at least one source. A context analyzer is coupled to the listener component and is configured to generate context information relative to the textual information. A content analyzer is coupled to the listener component and is configured to identify a set of n-grams from the textual information and to provide filtered content by removing at least some n-grams using a probabilistic data structure that determines if a given element is a member of a set. An indexing component is configured to index the filtered content.
(FR)Un dispositif informatique destiné à traiter des informations textuelles à partir d'au moins une source d'informations textuelles est fourni. Le dispositif informatique comprend un processeur qui est un composant fonctionnel du dispositif informatique et qui est configuré pour exécuter des instructions pour traiter les informations textuelles. Un composant d'écoute est configuré pour recevoir les informations textuelles à partir de l'au moins une source. Un analyseur de contexte est couplé au composant d'écoute et est configuré pour générer des informations de contexte par rapport aux informations textuelles. Un analyseur de contenu est couplé au composant d'écoute et est configuré pour identifier un ensemble de n-grammes à partir des informations textuelles et pour fournir un contenu filtré par élimination d'au moins certains n-grammes à l'aide d'une structure de données probabilistique qui détermine si un élément donné est membre d'un ensemble. Un composant d'indexation est configuré pour indexer le contenu filtré.
États désignés : AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
Organisation régionale africaine de la propriété intellectuelle (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Office eurasien des brevets (OEAB) (AM, AZ, BY, KG, KZ, RU, TJ, TM)
Office européen des brevets (OEB) (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
Organisation africaine de la propriété intellectuelle (OAPI) (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG).
Langue de publication : anglais (EN)
Langue de dépôt : anglais (EN)