Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

1. WO2007143914 - PROCÉDÉ, DISPOSITIF ET SYSTÈME DE SAISIE POUR LA CRÉATION D'UNE BASE DE DONNÉES DE FRÉQUENCE DE MOTS BASÉE SUR DES INFORMATIONS ISSUES DU WEB

Numéro de publication WO/2007/143914
Date de publication 21.12.2007
N° de la demande internationale PCT/CN2007/001758
Date du dépôt international 01.06.2007
CIB
G06F 17/27 2006.01
GPHYSIQUE
06CALCUL; COMPTAGE
FTRAITEMENT ÉLECTRIQUE DE DONNÉES NUMÉRIQUES
17Équipement ou méthodes de traitement de données ou de calcul numérique, spécialement adaptés à des fonctions spécifiques
20Manipulation de données en langage naturel
27Analyse automatique, p.ex. analyse grammaticale, correction orthographique
CPC
G06F 16/951
GPHYSICS
06COMPUTING; CALCULATING; COUNTING
FELECTRIC DIGITAL DATA PROCESSING
16Information retrieval; Database structures therefor; File system structures therefor
90Details of database functions independent of the retrieved data types
95Retrieval from the web
951Indexing; Web crawling techniques
Déposants
  • 北京搜狗科技发展有限公司 BEIJING SOGOU TECHNOLOGY DEVELOPMENT CO., LTD. [CN/CN]; 中国北京市海淀区中关村东路1号院搜狐网络大厦9层01房间, Beijing 100084 Room 01, Level 9 Sohu. com Internet Plaza No. 1 Park Zhongguancun East Road Haidian District Beijing 100084, CN (AllExceptUS)
  • 佟子健 TONG, Zijian [CN/CN]; CN (UsOnly)
  • 郭奇 GUO, Qi [CN/CN]; CN (UsOnly)
Inventeurs
  • 佟子健 TONG, Zijian; CN
  • 郭奇 GUO, Qi; CN
Mandataires
  • 北京集佳知识产权代理有限公司 UNITALEN ATTORNEYS AT LAW; 中国北京市朝阳区建国门外大街22号赛特广场7层, Beijing 100004 7 Floor Scitech Place No.22, Jian Guo Men Wai Ave. Chao Yang District Beijing 100004, CN
Données relatives à la priorité
200610084299.902.06.2006CN
200610086577.430.06.2006CN
Langue de publication chinois (ZH)
Langue de dépôt chinois (ZH)
États désignés
Titre
(EN) METHOD, DEVICE AND INPUTTING SYSTEM FOR CREATING WORD FREQUENCY DATABASE BASED ON WEB INFORMATION
(FR) PROCÉDÉ, DISPOSITIF ET SYSTÈME DE SAISIE POUR LA CRÉATION D'UNE BASE DE DONNÉES DE FRÉQUENCE DE MOTS BASÉE SUR DES INFORMATIONS ISSUES DU WEB
(ZH) 基于互联网信息的输入法词频库的生成方法、装置和输入法系统
Abrégé
(EN)
A method, a device and an inputting system for creating word frequency database based on web information are disclosed. The method which creates the inputting word frequency database includes the following steps: obtaining the web page, segmenting the web page to obtain the lexical entry, calculating the word frequency of the lexical entry, and saving it to create the web word frequency database. Because of the word frequency information of the inputting system obtained from the web information, which is public and real-time, the word frequency information created is the newest and best. The system word frequency database of the inputting system can be updated by a variety of simple methods, so that the word frequency information in the system word frequency database can be consistent with the word frequency information in the web page. The subject solution of the invention improves the hit rate of the preferred word chosen by the user and increases the inputting speed and efficiency.
(FR)
L'invention concerne un procédé, dispositif et système de saisie pour la création d'une base de données de fréquence de mots basée sur des informations issues du web. Le procédé de création de la base de données de fréquence de mots saisis comprend les étapes suivantes : obtenir la page web, segmenter la page web pour obtenir l'entrée lexicale, calculer la fréquence des mots de l'entrée lexicale et la mémoriser pour créer la base de données de fréquence de mots du web. Du fait des informations de fréquence de mots du système de saisie obtenues à partir des informations issues du web, qui sont publiques et en temps réel, les informations de fréquence de mots créées sont les plus récentes et les meilleures. La base de données de fréquence de mots du système de saisie peut être mise à jour par divers procédés simples, de telle sorte que les informations de fréquence de mots présentes dans la base de données de fréquence de mots du système puissent être cohérentes avec les informations de fréquence de mots présentes dans la page web. La solution qui fait l'objet de l'invention améliore le taux d'impact du mot préféré choisi par l'utilisateur et augmente la vitesse et le rendement de la saisie.
Dernières données bibliographiques dont dispose le Bureau international