WIPO logo
Mobile | Deutsch | Español | Français | 日本語 | 한국어 | Português | Русский | 中文 | العربية |
PATENTSCOPE

Search International and National Patent Collections
World Intellectual Property Organization
Search
 
Browse
 
Translate
 
Options
 
News
 
Login
 
Help
 
Machine translation
1. (WO2012101170) AUTOMATIC CLASSIFICATION OF A DOCUMENT POOL USING A NEURAL SYSTEM
Latest bibliographic data on file with the International Bureau   

Pub. No.:    WO/2012/101170    International Application No.:    PCT/EP2012/051135
Publication Date: 02.08.2012 International Filing Date: 25.01.2012
IPC:
G06N 3/02 (2006.01), G06N 3/08 (2006.01), G06F 17/27 (2006.01)
Applicants: SUPERWISE TECHNOLOGIES AG [DE/DE]; Bahnhofstraße 26 82515 Wolfratshausen (DE) (For All Designated States Except US).
SCHRÖDER-BERGEN, Eckart [DE/DE]; (DE) (For US Only).
HOFMANN, Solveig [DE/DE]; (DE) (For US Only).
WINKLER, Maria [DE/DE]; (DE) (For US Only)
Inventors: SCHRÖDER-BERGEN, Eckart; (DE).
HOFMANN, Solveig; (DE).
WINKLER, Maria; (DE)
Agent: ASCHERL, Andreas; Kehl & Ettmayr Patentanwaelte Friedrich-Herschel-Straße 9 81679 München (DE)
Priority Data:
10 2011 009 376.1 25.01.2011 DE
Title (DE) AUTOMATISCHE KLASSIFIKATION EINES DOKUMENTENPOOLS MIT EINEM NEURONALEN SYSTEM
(EN) AUTOMATIC CLASSIFICATION OF A DOCUMENT POOL USING A NEURAL SYSTEM
(FR) CLASSIFICATION AUTOMATIQUE D'UN GROUPE DE DOCUMENTS AU MOYEN D'UN SYSTÈME NEURONAL
Abstract: front page image
(DE)Gemäß der Erfindung wird ein Verfahren zur Erzeugung einer Klassifizierung einer Vielzahl von Textdokumenten mittels eines Computers unter Verwendung eines neuronalen Netzes beschrieben, wobei das neuronale Netz eine Vielzahl von vorbestimmbaren Startwörtern aus einem oder mehreren Wörtern aufweist und in mehreren Ebenen strukturiert ist, umfassend die folgenden Schritte: Einlesen von Textdokumenten mit einer beliebigen Vielzahl von Wörtern in das neuronale Netz; Bilden eines Primärkontextes wenigstens eines vorbestimmten Startworts aus sämtlichen Assoziationsrelationen, die von dem Startwort ausgehen; Zuordnen einzelner Texteinheiten der Textdokumente zu den Startbegriffen oder dem Primärkontext; Erzeugen und/oder Ermitteln von Assoziationsrelationen zwischen einem oder mehreren Startwörtern bzw. ihres Primärkontextes und den Wörtern der Texteinheiten der Textdokumente, wobei die Anzahl der ermittelten Assoziationsrelationen zwischen jedem Startwort und den Wörtern der Texteinheit als Maßstab zum Klassifizieren des Textdokumentes dient; Klassifizieren eines Texdokumentes durch Kumulieren von Klassifizierungswerten aus den Textelementen; und Erzeugen wenigstens eines Taxonomiebaums mit Taxonomiezweigen und/oder Taxonomieknoten bzw. Neuronen und/oder Unterbäumen und/oder Taxonomieebenen aus Assoziationsrelationen der Startwörter, wobei Synapsenverbindungen zwischen den Neuronen und/oder Taxanomieknoten, welche den Startwörtern zuordenbar sind, in automatisierter Form hergestellt werden und wobei zu jedem Startwort wenigstens ein Unterbaum erzeugt wird.
(EN)The invention relates to a method for producing a classification of a plurality of text documents by means of a computer using a neural network, wherein the neural network has a plurality of start words that can be predetermined, comprising one or more words, and is structured in several levels. The method comprises the following steps: reading text documents having an arbitrary number of words into the neural network; forming a primary context of at least one predetermined start word from all association relations that proceed from the start word; associating individual text units of the text documents with the start terms or the primary context; producing and/or determining association relations between one or more start words or the primary context thereof and the words of the text units of the text documents, wherein the number of determined association relations between each start word and the words of the text unit is used as a scale for classifying the text document; classifying a text document by accumulating classification values from the text elements; and producing at least one taxonomy tree having taxonomy branches and/or taxonomy nodes or neurons and/or sub-trees and/or taxonomy levels from association relations of the start words, wherein synapse connections between the neurons and/or taxonomy nodes, which can be associated with the start words, are produced in an automated manner, and wherein at least one sub-tree is produced for each start word.
(FR)L'invention concerne un procédé pour créer une classification d'une pluralité de documents textuels au moyen d'un ordinateur en faisant appel à un réseau neuronal qui comporte une pluralité de mots de départ, pouvant être déterminés au préalable et constitués d'un ou de plusieurs mots, et qui est structuré sur plusieurs niveaux, ledit procédé comprenant les étapes suivantes : entrée de documents textuels contenant une pluralité quelconque de mots dans le réseau neuronal; formation d'un contexte primaire d'au moins un mot de départ prédéfini à partir de toutes les relations d'association qui partent du mot de départ; affectation d'unités textuelles individuelles des documents textuels aux concepts de départ ou au contexte primaire; création et/ou détermination de relations d'association entre un ou plusieurs mots de départ ou leur contexte primaire et les mots des unités textuelles des documents textuels, le nombre des relations d'association déterminées entre chaque mot de départ et les mots de l'unité textuelle servant d'échelle pour classifier le document textuel; classification d'un document textuel par cumul de valeurs de classification à partir des éléments textuels; et création d'au moins un arbre taxonomique comportant des branches taxonomiques et/ou des noeuds taxonomiques ou des neurones et/ou des sous-arbres et/ou des niveaux taxonomiques à partir des relations d'association des mots de départ, des connexions synaptiques entre les neurones et /ou les noeuds taxonomiques, pouvant être associés aux mots de départ, étant créées sous forme automatique, au moins un sous-arbre étant produit pour chaque mot de départ.
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IS, JP, KE, KG, KM, KN, KP, KR, KZ, LA, LC, LK, LR, LS, LT, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW.
African Regional Intellectual Property Organization (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, MD, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, ML, MR, NE, SN, TD, TG).
Publication Language: German (DE)
Filing Language: German (DE)