Processing

Please wait...

Settings

Settings

1. WO2012162405 - SEMIOTIC INDEXING OF DIGITAL RESOURCES

Publication Number WO/2012/162405
Publication Date 29.11.2012
International Application No. PCT/US2012/039168
International Filing Date 23.05.2012
IPC
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
E
OPTICAL COMPUTING DEVICES
1
Devices for processing exclusively digital data
G06E 1/00 (2006.01)
CPC
G06F 16/353
G06F 16/355
Applicants
  • NAMESFORLIFE, LLC [US/US]; 325 Grand River Avenue, Suite 300 East Lansing, MI 48823, US (AllExceptUS)
  • PARKER, Charles, T. [US/US]; US (UsOnly)
  • GARRITY, George, M. [US/US]; US (UsOnly)
Inventors
  • PARKER, Charles, T.; US
  • GARRITY, George, M.; US
Agents
  • KEATING, Thomas, J.; Michael Best & Friedrich LLP 100 E. Wisconsin Avenue Suite 3300 Milwaukee, WI 53202, US
Priority Data
61/489,36224.05.2011US
Publication Language English (EN)
Filing Language English (EN)
Designated States
Title
(EN) SEMIOTIC INDEXING OF DIGITAL RESOURCES
(FR) INDEXATION SÉMIOTIQUE DE RESSOURCES NUMÉRIQUES
Abstract
(EN)
A method of classifying a plurality of documents. The method includes steps of providing a first set of classification terms and a second set of classification terms, the second set of classification terms being different from the first set of classification terms; generating a first frequency array of a number of occurrences of each term from the first set of classification terms in each document; generating a second frequency array of a number of occurrences of each term from the second set of classification terms in each document; generating a first similarity matrix from the first frequency array; generating a second similarity matrix from the second frequency array; determining an entrywise combination of the first similarity matrix and the second similarity matrix; and clustering the plurality of documents based on the result of the entrywise combination.
(FR)
Procédé permettant de classifier une pluralité de documents. Le procédé comprend les étapes consistant à fournir un premier ensemble de termes de classification et un deuxième ensemble de termes de classification, le deuxième ensemble de termes de classification étant différent du premier ensemble de termes de classification ; générer un premier tableau de fréquence d'un nombre d'occurrences de chaque terme à partir du premier ensemble de termes de classification dans chaque document ; générer un deuxième tableau de fréquence d'un nombre d'occurrences de chaque terme à partir du deuxième ensemble de termes de classification dans chaque document ; générer une première matrice de similarité à partir du premier tableau de fréquence ; générer une deuxième matrice de similarité à partir du deuxième tableau de fréquence ; déterminer une combinaison d'entrée de la première matrice de similarité et de la deuxième matrice de similarité ; et regrouper la pluralité de documents en fonction du résultat de la combinaison d'entrée.
Also published as
Latest bibliographic data on file with the International Bureau