Traitement en cours

Veuillez attendre...

Paramétrages

Paramétrages

Aller à Demande

1. WO2020155750 - PROCÉDÉ, APPAREIL ET DISPOSITIF DE COLLECTE DE CORPUS BASÉS SUR L'INTELLIGENCE ARTIFICIELLE, ET SUPPORT DE STOCKAGE


Avertissement La version image (PDF) disponible dans PATENTSCOPE est la version officielle. Cette version HTML en ligne est fournie pour aider les utilisateurs. Malgré le grand soin apporté à la compilation pour assurer une représentation précise et exacte des données figurant sur le document/les images imprimés, des erreurs et/ou des omissions ne peuvent pas être exclues en raison des processus de transmission et de conversion de données et des limitations inhérentes aux processus de traduction (éventuellement) automatique utilisés. Les liens hypertexte suivis de ce symbole sont associés à des ressources externes qui ne sont pas contrôlées par l'OMPI. L'OMPI décline toute responsabilité concernant les points mentionnés ci-dessus.

INTERNATIONAL SEARCH REPORT (ISR)
Part 1:  1  2  3  4  5  6          Part 2:  A  B  C  D  E 
国际申请号 申请人或代理人的档案号
PCT/CN2019/117261 P2019I13743
国际申请日 (年/月/日) (最早的)优先权日 (年/月/日)
2019年 11月 11日 2019年 1月 28日
申请人
平安科技(深圳)有限公司
关于后续行为: 见PCT/ISA/220表和 适用时,见下面第5项
按照条约第18条,本国际检索报告由本国际检索单位做出并送交申请人。报告副本送交国际局。
它还附有本报告所引用的各现有技术文件的副本。
1. 报告的基础
a. 关于语言,进行国际检索基于:
国际申请提交时使用的语言。
该国际申请的                                          语言译文,为了国际检索的目的提供该种语言的译文(细则12.3(a)和23.1(b))。
b.
本国际检索报告考虑了本单位许可或被通知的根据细则91所做出的明显错误更正(细则43.6之二(a))。
c.
关于国际申请中所公开的任何核苷酸和/或氨基酸序列,国际检索是基于下列序列表进行的:
2. 某些权利要求被认为是不能检索的
3. 缺乏发明的单一性
4. 发明名称
同意申请人提出的发明名称。
发明名称由本单位确定如下:
5. 摘要
同意申请人提出的摘要。
根据细则38.2(b),摘要由本单位制定,如第IV栏中所示。自本国际检索报告发文日起一个月内,申请人可以向本单位提出意见。

一种基于人工智能的语料收集方法、装置、设备及存储介质,属于自然语言处理技术领域。该方法包括获取用户输入的配置项信息(S101);从视频网站下载通过检索所述目标视频关键字得到的目标视频的视频数据,视频数据包括视频文件和SRT字幕文件(S102);从视频文件中分离出音频文件,并将SRT字幕文件解析出来的字幕文本内容拆分成字幕块(S103);根据每个字幕块的分段时间切分音频文件,获得分段音频(S104);建立分段音频和字幕块之间的关联(S105);对关联后的分段音频和字幕块按照预设筛选关键词进行分类筛选后一起存储为目标语料(S106)。该方法能够实现自动快速收集到符合某一类场景需要的语料的目的,效率高而且成本低。


6. 附图
a.
随摘要一起公布的附图是:     1    
按照申请人建议的。
由本单位选择的,因为申请人没有建议一幅图。
由本单位选择的,因为该图能更好地表示发明的特征。
b.
没有与摘要一起公布的附图

A. 主题的分类

按照国际专利分类(IPC)或者同时按照国家分类和IPC两种分类

B. 检索领域

检索的最低限度文献(标明分类系统和分类号):
     G06F
包含在检索领域中的除最低限度文献以外的检索文献:
在国际检索时查阅的电子数据库(数据库的名称,和使用的检索词(如使用)):
CNKI;CNPAT;WPI;EPODOC;IEEE: 音频,字幕,关键词,视频,切分,分段,分块,语料,情绪,audio,subtitle,key word,video,segment,corpus,emotion

C. 相关文件

类 型* 引用文件,必要时,指明相关段落 相关的权利要求
(1)
PX
CN 110008378 A (平安科技深圳有限公司) 2019年 7月 12日 (2019-07-12)
1-21
权利要求1-10,说明书第[0124]段
(2)
Y
CN 103324685 A (大连理工大学) 2013年 9月 25日 (2013-09-25)
1-4, 7-14, 16-19
说明书第[0005]-[0036]段
(3)
Y
CN 104978961 A (腾讯科技深圳有限公司) 2015年 10月 14日 (2015-10-14)
1-4, 7-14, 16-19
说明书第[0036]-[0048]段
(4)
Y
CN 105047203 A (腾讯科技深圳有限公司) 2015年 11月 11日 (2015-11-11)
1-4, 7-14, 16-19
说明书第[0035]-[0047]段
(5)
Y
CN 108122552 A (上海智臻智能网络科技股份有限公司) 2018年 6月 5日 (2018-06-05)
3-4, 7, 13-14, 18-19
说明书第[0026]-[0047]段
(6)
A
CN 108268539 A (上海交通大学) 2018年 7月 10日 (2018-07-10)
1-21
全文
(7)
A
US 2007253678 A1 (SARUKKAI, RAMESH R.) 2007年 11月 1日 (2007-11-01)
1-21
全文
*
引用文件的具体类型:
"A"
认为不特别相关的表示了现有技术一般状态的文件
"D"
申请人在国际申请中引证的文件
"E"
在国际申请日的当天或之后公布的在先申请或专利
"L"
可能对优先权要求构成怀疑的文件,或为确定另一篇引用文件的公布日而引用的或者因其他特殊理由而引用的文件(如具体说明的)
"O"
涉及口头公开、使用、展览或其他方式公开的文件
"P"
公布日先于国际申请日但迟于所要求的优先权日的文件
"T"
在申请日或优先权日之后公布,与申请不相抵触,但为了理解发明之理论或原理的在后文件
"X"
特别相关的文件,单独考虑该文件,认定要求保护的发明不是新颖的或不具有创造性
"Y"
特别相关的文件,当该文件与另一篇或者多篇该类文件结合并且这种结合对于本领域技术人员为显而易见时,要求保护的发明不具有创造性
"&"
同族专利的文件

D. 关于同族专利的信息

检索报告引用的专利文件 公布日
(年/月/日)
同族专利 公布日
(年/月/日)
CN 110008378 A
2019年 7月 12日
CN 103324685 A
2013年 9月 25日
CN 104978961 A
2015年 10月 14日
WO 2016188329 A1
IN 201727044950 A
US 2018158469 A1
EP 3340238 A1
JP 2018522288 A
2016年 12月 1日
2018年 4月 20日
2018年 6月 7日
2018年 6月 27日
2018年 8月 9日
CN 105047203 A
2015年 11月 11日
CN 108122552 A
2018年 6月 5日
HK 1256390 A0
2019年 9月 20日
CN 108268539 A
2018年 7月 10日
US 2007253678 A1
2007年 11月 1日
WO 2007130799 A1
US 2011211814 A1
2007年 11月 15日
2011年 9月 1日
ISA/CN的名称和邮寄地址 :
中国国家知识产权局(ISA/CN)
中国北京市海淀区蓟门桥西土城路6号 100088
传真号 (86-10)62019451
国际检索实际完成的日期:
2020年 1月 15日
国际检索报告邮寄日期:
2020年 1月 31日
受权官员:
穆滢
电话号码 86-(10)-53961531
Top    Part 1: 1 2 3 4 5 6         Part 2: A B C D E