Search International and National Patent Collections
Some content of this application is unavailable at the moment.
If this situation persists, please contact us atFeedback&Contact
1. (WO2017097166) DOMAIN NAMED ENTITY RECOGNITION METHOD AND APPARATUS
Latest bibliographic data on file with the International Bureau

Pub. No.: WO/2017/097166 International Application No.: PCT/CN2016/108426
Publication Date: 15.06.2017 International Filing Date: 02.12.2016
IPC:
G06F 17/27 (2006.01)
G PHYSICS
06
COMPUTING; CALCULATING; COUNTING
F
ELECTRIC DIGITAL DATA PROCESSING
17
Digital computing or data processing equipment or methods, specially adapted for specific functions
20
Handling natural language data
27
Automatic analysis, e.g. parsing, orthograph correction
Applicants:
北京国双科技有限公司 BEIJING GRIDSUM TECHNOLOGY CO., LTD. [CN/CN]; 中国北京市 海淀区双榆树小区知春路76号翠宫饭店8层 8/F Jadepalace Hotel 76 Zhichun Road, Shuangyushu Community, Haidian District Beijing 100086, CN
Inventors:
徐文斌 XU, Wenbin; CN
何鑫 HE, Xin; CN
Agent:
北京鼎佳达知识产权代理事务所(普通合伙) BEIJING DINGJIADA IP FIRM; 中国北京市朝阳区北苑路172号欧陆大厦A2002刘铁生 LIU Tiesheng Room A2002, Oulu Building, No.172,Beiyuan Road, Chaoyang District Beijing 100101, CN
Priority Data:
201510921228.911.12.2015CN
Title (EN) DOMAIN NAMED ENTITY RECOGNITION METHOD AND APPARATUS
(FR) PROCÉDÉ ET APPAREIL DE RECONNAISSANCE D’ENTITÉ NOMMÉE PAR DOMAINE
(ZH) 识别领域命名实体的方法及装置
Abstract:
(EN) A domain named entity recognition method and apparatus, relating to the technical field of natural language processing, and mainly for the purpose of effectively reducing the impact of the word segmentation result on the domain named entity recognition effect, thereby improving the accuracy of named entity recognition. The method comprises: performing word segmentation on a text to be recognized (101); labeling, according to a label set of a domain corresponding to the text to be recognized, each word in the text to be recognized (102), the label set comprising a basic label set based on domain named entity recognition and a label set to which a corresponding domain pertains, the basic label set comprising positional labels of related words constituting a domain named entity; extracting the labeled words according to a domain named entity extraction rule (103); and forming a domain named entity by using the extracted words (104).
(FR) L’invention concerne un procédé et un appareil de reconnaissance d’entité nommée par domaine, se rapportant au domaine technique du traitement de langage naturel, et essentiellement destinés à réduire de manière efficace l’impact du résultat de segmentation de mot sur l’effet de reconnaissance d’entité nommée par domaine, permettant ainsi d’améliorer la précision de reconnaissance d’entité nommée. Le procédé comprend les étapes suivantes : réaliser une segmentation de mot sur un texte à reconnaître (101) ; marquer, selon un ensemble d’étiquettes d’un domaine correspondant au texte à reconnaître, chaque mot dans le texte à reconnaître (102), l’ensemble d’étiquettes comprenant un ensemble d’étiquettes de base basé sur une reconnaissance d’entité nommée par domaine et un ensemble d’étiquettes auquel un domaine correspondant appartient, l’ensemble d’étiquettes de base comprenant des étiquettes de position de mots associés constituant une entité nommée par domaine ; extraire les mots marqués selon une règle d’extraction d’entité nommée par domaine (103) ; et former une entité nommée par domaine par utilisation des mots extraits (104).
(ZH) 一种识别领域命名实体的方法及装置,涉及自然语言处理技术领域,主要目的在于有效的减少了分词结果对领域命名实体识别效果的影响,提高了命名实体识别的准确率。所述方法包括:对待识别文本进行分词(101);根据待识别文本对应领域的标签集合,对待识别文本中的每个分词进行标签标注(102),该标签集合包含基于领域命名实体识别的基础标签集合和对应领域所属标签集合,其中,所述基础标签集合包含组成领域命名实体相关词语的位置标签;按照领域命名实体抽取规则对标签标注的分词进行抽取(103);将抽取的分词组成领域命名实体(104)。
front page image
Designated States: AE, AG, AL, AM, AO, AT, AU, AZ, BA, BB, BG, BH, BN, BR, BW, BY, BZ, CA, CH, CL, CN, CO, CR, CU, CZ, DE, DJ, DK, DM, DO, DZ, EC, EE, EG, ES, FI, GB, GD, GE, GH, GM, GT, HN, HR, HU, ID, IL, IN, IR, IS, JP, KE, KG, KN, KP, KR, KW, KZ, LA, LC, LK, LR, LS, LU, LY, MA, MD, ME, MG, MK, MN, MW, MX, MY, MZ, NA, NG, NI, NO, NZ, OM, PA, PE, PG, PH, PL, PT, QA, RO, RS, RU, RW, SA, SC, SD, SE, SG, SK, SL, SM, ST, SV, SY, TH, TJ, TM, TN, TR, TT, TZ, UA, UG, US, UZ, VC, VN, ZA, ZM, ZW
African Regional Intellectual Property Organization (ARIPO) (BW, GH, GM, KE, LR, LS, MW, MZ, NA, RW, SD, SL, ST, SZ, TZ, UG, ZM, ZW)
Eurasian Patent Organization (AM, AZ, BY, KG, KZ, RU, TJ, TM)
European Patent Office (AL, AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HR, HU, IE, IS, IT, LT, LU, LV, MC, MK, MT, NL, NO, PL, PT, RO, RS, SE, SI, SK, SM, TR)
African Intellectual Property Organization (BF, BJ, CF, CG, CI, CM, GA, GN, GQ, GW, KM, ML, MR, NE, SN, TD, TG)
Publication Language: Chinese (ZH)
Filing Language: Chinese (ZH)
Also published as:
US20180365211