이 애플리케이션의 일부 콘텐츠는 현재 사용할 수 없습니다.
이 상황이 계속되면 다음 주소로 문의하십시오피드백 및 연락
1. (CN103778151) Method and device for identifying characteristic group and search method and device
유의사항: 이 문서는 자동 광학문자판독장치(OCR)로 처리된 텍스트입니다. 법률상의 용도로 사용하고자 하는 경우 PDF 버전을 사용하십시오
一种识别特征群体的方法及装置和搜索方法及装置


技术领域
本申请涉及交易信息处理领域,特别是涉及一种识别特征群体的方法 和装置,以及一种搜索方法和装置。
背景技术
互联网上大部分网站都具有账号注册功能,一些大型网站甚至拥有上亿 的用户。
目前,一些购物网站的卖家为了宣传自己的商品,会人工地或者程 序自动地在网站上注册大量无用的账号。网站上的大量恶意注册账号常 常会给网站的正常运营造成巨大的破坏,例如,利用恶意注册账号购买 某个商品,会产生大量的虚假销售记录,消费者会被虚假的销售记录欺 骗而购买该商品。
目前,针对网站恶意注册的行为,可以通过注册前预防和注册后处 理两个环节来处理,注册前预防一般是通过在网站用户注册阶段增加验 证码输入的步骤,这种方法能在一定程度上防止基于程序自动注册的恶 意注册行为;注册后处理是针对预防无效情况下已产生的恶意注册账号, 针对某一种用户标识,如Cookie,若在同一个Cookie下登录过的不同账 号数大于预设值,则判断这些账号属于恶意注册账号。
以上现有技术中存在的问题是,针对注册前预防的方式,目前已有 具备验证码识别功能的自动注册程序可以破解验证码,并且该方式无法 预防通过大量人工注册的恶意注册行为;注册后处理的方式只考虑了账 号间的直接关联关系,只能发现少量的恶意注册账号,由于大部分恶意 注册账号未必会共用一个用户标识。比如,以Cookie为例,同一个网站 用户在不同时间不同机器上使用账号,其关联的Cookie很可能是不相同 的,这种情况下简单的查看一个Cookie关联的账号数并不能有效的发现 异常信息。
因此,目前需要本领域技术人员解决的一个技术问题就是,提供一种 识别特征群体的机制,以识别出恶意注册的网站账号群体,避免买家参 与到虚假交易,进而提高网络购物的交易安全。
发明内容
本申请所要解决的技术问题是提供一种识别特征群体的方法,以识 别出恶意注册的网站账号群体,避免买家参与到虚假交易,进而提高网 络购物的交易安全。
本申请还提供了一种识别特征群体的装置,用以保证上述方法在实 际中的应用及实现。
为了解决上述问题,本申请公开了一种识别特征群体的方法,包括:
在预置数据库中提取第一对象、第二对象,以及第一对象与第二对 象的映射关系数据;
依据所述映射关系数据,提取包括多个所述第一对象和第二对象的 候选群体,所述候选群体中任意一个第一对象或第二对象,与另一个任 意的第一对象或第二对象,均通过一个或多个第一对象和/或第二对象进 行关联;
将所述候选群体中第一对象的个数作为第一特征值,参考所述第一 特征值判断所述候选群体是否为特征群体。
优选的,所述方法还包括:
针对各第一对象,将关联同一第二对象的第一对象确定为直接关联 对象;
依据各第一对象的直接关联对象的个数,生成候选群体对应的第二 特征值。
优选的,所述方法还包括:
在参考所述第一特征值判断所述候选群体是否为特征群体的同时, 参考所述第二特征值。
优选的,所述第一对象为用户账号,所述第二对象为用户标识;所 述映射关系数据包括,各用户账号与其所关联的所有用户标识的映射关 系列表,以及各用户标识与其所关联的所有用户账号的映射关系列表。
优选的,所述第一对象和第二对象具备属性值,所述依据映射关系 数据,提取包括多个第一对象和第二对象的候选群体的步骤包括:
针对各个第一对象或第二对象,依据所关联的第一对象或第二对象 对应的属性值,更新对应的属性值;
提取属性值相同的第一对象和第二对象,组成候选群体。
优选的,所述针对各个第一对象或第二对象,依据所关联的第一对 象或第二对象对应的属性值,更新对应的属性值的步骤包括:
步骤1、针对各个第一对象或第二对象,依据所述映射关系数据,确 定所关联的第一对象或第二对象;
步骤2、提取所述关联的第一对象或第二对象所对应的属性值;
步骤3、将提取的属性值中最小的值作为该第一对象或第二对象对应 的修正值;
步骤4、判断各第一对象或第二对象的属性值,与对应的修正值是否 相同,若是,则结束操作,若否,则以修正值替换属性值,并返回步骤1。
优选的,所述候选群体包括一个或多个,所述第一对象的属性值的 初始值为账号ID的字符串,所述第二对象的属性值的初始值与用户标识 相同或是用户标识的字符串。
优选的,所述针对各第一对象,确定其直接关联对象的步骤包括:
针对各第一对象,确定关联的第二对象,并确定各关联的第二对象 所关联的第一对象;
将所有关联的第二对象所关联的第一对象进行合并,去重,将去重 后的第一对象作为直接关联对象。
优选的,所述第一特征值记为n,所述第二特征值为各第一对象的直 接关联对象的个数加和后,再除以n(n-1)的结果。
优选的,所述参考第一特征值,判断候选群体是否为特征群体的步 骤包括:
若所述第一特征值大于第一阀值,则所述候选群体为特征群体。
优选的,参考第一特征值和第二特征值,判断候选群体是否为特征 群体的步骤包括:
若所述第一特征值大于第一阀值,且所述第二特征值大于第二阀值, 则所述候选群体为特征群体。
本申请还提供了一种搜索方法,包括:
接收特征群体的搜索请求;
通过上述识别特征群体的方法识别特征群体,并返回特征群体的属 性信息。
本申请还提供了一种识别特征群体的装置,包括:
映射关系数据提取模块,用于在预置数据库中提取第一对象、第二 对象,以及第一对象与第二对象的映射关系数据;
候选群体提取模块,用于依据所述映射关系数据,提取包括多个所 述第一对象和第二对象的候选群体,所述候选群体中任意一个第一对象 或第二对象,与另一个任意的第一对象或第二对象,均通过一个或多个 第一对象和/或第二对象进行关联;
特征群体判断模块,用于将所述候选群体中第一对象的个数作为第 一特征值,并按照所述第一特征值判断所述候选群体是否为特征群体。
本申请还提供了一种搜索装置,包括:
搜索请求接收模块,用于接收特征群体的搜索请求;
信息返回模块,用于通过权利要求上述识别特征群体的装置识别特 征群体,并返回特征群体的属性信息。
与现有技术相比,本申请具有以下优点:
本申请依据用户账户和用户标识的对应关系,利用图论的方法,先 找出有直接或间接关联的用户账户和用户标识作为一个候选群体,将具 有间接关联关系的账户归于同一个账户群体,然后依据各用户账户直接 关联的账户数计算候选群体的群体密度,依据账户数,或是结合候选群 体密度和账户数来判断是否是恶意注册账户群体。相比于现有技术,本 申请依据账户之间的间接关联关系可以找出潜在的恶意注册账号,发现 恶意注册账号群体,从而可以避免买家参与到虚假交易,提高网络购物 的交易安全。
附图说明
图1是本申请的一种识别特征群体的方法实施例1的流程图;
图2是本申请的一种识别特征群体的方法实施例2的流程图;
图3是本申请的一种的搜索方法实施例的流程图;
图4是本申请的一种识别特征群体的装置实施例1的结构框图;
图5是本申请的一种识别特征群体的装置实施例2的结构框图;
图6是本申请的一种搜索装置实施例的结构框图;
图7是本申请的邻接表对应的示意图
图8为本申请的候选群体的示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合 附图和具体实施方式对本申请作进一步详细的说明。
参考图1,示出了本申请的一种识别特征群体的方法实施例1的流程 图,具体可以包括以下步骤:
步骤101、在预置数据库中提取第一对象、第二对象,以及第一对象 与第二对象的映射关系数据。
在具体的实现中,所述第一对象可以为用户账号,一个用户可以注 册一个或多个账号;所述第二对象可以为用户标识,用户标识是账号在 浏览网站的过程中留下的,能够确定用户身份的信息,例如,登录时产 生的cookie、账户绑定的邮箱、手机号、或者是多种信息通过一定算法计 算出来的一个值,一个账号可以对应多个用户标识,一个用户标识也可 以用于多个账号。
所述映射关系数据可以包括,各用户账号与其所关联的所有用户标 识的映射关系列表,以及各用户标识与其所关联的所有用户账号的映射 关系列表。用户账号与用户标识的关联关系可以存放在预置的数据库中, 数据库中具体包括了,各用户账号所关联的所有的用户标识的列表,以 及,每个用户标识所关联的所有用户账号的列表。
具体的,可以在预置数据库中提取一段时间内(例如最近3个月) 的映射关系数据,这些映射关系数据可以视为图论中用于表示一个图的 邻接表。例如,A 1 、A 2 、A 3 分别表示三个用户账号,B 1 、B 2 、B 3 分别表 示三个用户标识,假设数据库中保存的映射关系可以表示为(A 1 ,B 1 )、(A 1 , B 2 )、(A 2 ,B 2 )、(A 2 ,B 3 )、(A 3 ,B 3 ),那么,该映射关系构成的邻接表对应 的示意图如图7所示。
该邻接表所表示的图有以下特点:图中的顶点为所有的用户账号或者用 户标识,每一条边只连接一个用户账号或一个用户标识,表示某账号与某用 户标识存在关联关系。
通过解析网站的行为日志可以获取映射关系数据,具体而言,记录 登录用户在网站上的行为日志,行为日志中包含了用户账号以及对应的 用户标识,解析行为日志即可获取用户账号与用户标识的对应关系,例 如账号登录网站时,可以得到账号的cookie之间的关联,用户在填写自 己的邮箱时,可以得到账号与邮箱之间的关联。解析出映射关系后,可 以存放在预置的数据库中。
步骤102、依据所述映射关系数据,提取包括所述第一对象和第二对 象的候选群体,所述候选群体中任意一个第一对象或第二对象,与另一 个任意的第一对象或第二对象,均通过一个或多个第一对象和/或第二对 象进行关联。
依据映射关系数据可以初步提取出一个或多个恶意注册账号群体的 候选群体。候选群体中,任意两个对象之间均是连通的。更具体而言, 任意两个第一对象之间可以通过一个或多个第一对象和/或第二对象关 联;任意两个第二对象可以通过一个或多个第一对象和/或第二对象关联; 任意一个第一对象和任意一个第二对象之间也可以通过一个或多个第一 对象和/或第二对象关联。
如图8所示,给出了本申请所述的候选群体的示意图,其中,A 1 ,A 2 ,A 3 , A 4 为用户账号,B 1 ,B 2 ,B 3 为用户标识,连线表示具备关联关系。由图可知, 账号A 1 与标识B 1 和B 2 关联,标识B 1 分别与账号A 1 ,A 2 和A 3 关联,标识 B 2 分别与账号A 1 ,A 3 和A 4 关联,账号A 4 分别与标识B 2 和B 3 关联;并且, 任意一个用户账号或用户标识,与另一个任意的账号或用户标识,可以 通过一个或多个用户账号或用户标识进行关联,如账号A 1 与A 2 可以通过 标识B 2 关联,账号A 1 与标识B 3 可以通过标识账号A 1 和标识B 2 关联。
在本申请的一种优选实施例中,所述第一对象和所述第二对象均可 以具备属性值,优选的,所述候选群体可以包括一个或多个,所述第一 对象的属性值的初始值可以为账号ID的字符串,例如,第一对象用户账 号名为amy,对应的账号ID为12345,对应的属性值为“12345”;所述 第二对象的属性值的初始值可以与用户标识相同或是用户标识的字符 串,例如,第二对象用户标识为手机号21231441或邮箱amy123.com, 相应的,第二对象的属性值的初始值可以是“21231441”或 “amy123.com”。
具体的,可以通过以下步骤提取候选群体:
子步骤S11、针对各个第一对象或第二对象,依据所关联的第一对象 或第二对象对应的属性值,更新对应的属性值。
在具体的实现中,可以通过以下步骤更新属性值:
子步骤S11-1、针对各个第一对象或第二对象,依据所述映射关系数 据,确定所关联的第一对象或第二对象;
子步骤S11-2、提取所述关联的第一对象或第二对象所对应的属性 值;
子步骤S11-3、将提取的属性值中最小的值作为该第一对象或第二对 象对应的修正值;
子步骤S11-4、判断各第一对象或第二对象的属性值,与对应的修正 值是否相同,若是,则结束操作,若否,则以修正值替换属性值,并返 回子步骤S11-1。
以某个第一对象A 1 为例,对应的属性值为a 1 依据映射关系数据,可 以确定其对应的第二对象B 1 ,B 2 ,B 3 …B n ,收集这些第二对象的属性值 b 1 ,b 2 ,b 3 …b n ,比较b 1 ,b 2 ,b 3 …b n 的大小,取其中最小的值,例如b 2 ,作为 该第一对象对应的修正值a 1 ′=b 2 ;同样的方法,生成各个第二对象对应 的修正值。然后对比各第一对象或第二对象的属性值与其对应的修正值 是否相同,例如对于第一对象A 1 ,即判断a 1 是否等于b 2 。若存在不相同 的情况,则以修正值替换相应的属性值,并且返回到子步骤S11-1中,重 复执行上述步骤,直至各第一对象或第二对象的属性值与其对应的修正 值相同为止。
具体而言,对各个属性值的比较可以通过比较两个字符串的字典序 来实现。例如,对于两个字符串S 1 和S 2 ,将S 1 和S 2 利用任意一种编码 方式(例如使用UTF8编码)转成两个字节码数组C 1 和C 2 。比较C 1 和 C 2 的第一个元素;如果两者不相等,则第一个元素值小的数组的字典序 靠前,否则比较两个数组的第二个元素;如果第二个元素两者不相等, 则值小数组的字典序靠前,否则依次类推;如果遍历过程中某个数组已 被遍历,那么该数组的字典序靠前。
例如,当S 1 =”abc”,S 2 =”123”时。将S 1 和S 2 按ASCII码转成对 应的字节码数组C 1 ={97,98,99},C2={49,50,51},由于S 2 的第一个元素小 于S 1 ,那么S 2 的字典序靠前。字典序靠前的字符串为比较小的字符串, 由此对多个属性值的字符串进行比较,可以找到最小的属性值。
子步骤S12、提取属性值相同的第一对象和第二对象,组成候选群体。
通过步骤S11,各第一对象或第二对象的属性值均与修正值相同之 后,可以将属性值相同的第一对象和第二对象,组成候选群体,即在候 选群体中,包括多个第一对象和第二对象,无论是第一对象的属性值还 是第二对象的属性值均相同。
对于映射关系数据表示的邻接表,在对应的图中,将每个用户账户 和用户标识作为一个顶点,以上提取候选群体的步骤可以理解为图论中 利用标记扩散法(label propagation)寻找连通子图的过程。
Step 1、针对每个顶点对应有唯一的标记值(上面步骤中的属性值), 对于每个顶点,确定与其相连的多个顶点;
Step 2、对于每个顶点,获取与之相连的其他顶点的标记值;
Step 3、若某个顶点的所关联的其他顶点的标记值中的最小值和该顶 点的当前标记值不同,则以最小标记值取代当前标记值,并返回到Step 1, 若相同,则提取具备相同标记的顶点,作为一个连通子图。
此处得到的连通子图即为候选群体,连通子图中的每两个点都可以 通过其他的点连接起来,即所述候选群体中任意两个第一对象或第二对 象(任意两个第一对象,任意两个第二对象,任意两个第一对象和第二 对象)均通过一个或多个第一对象或第二对象进行关联。
其中,具备相同的第二对象的两个第一对象称为直接关联账号,通 过多个第一对象或第二对象进行关联的两个第一对象称为间接关联账 号,例如,对于账号A和账号B,如果能找能一系列账号X 1 ,X 2 ,..X n (n>=1), 使得A与X 1 直接关联,X i 与X i+1 (1<=i<=n-1)直接关联,X n 与B直接关 联,则A与B是间接关联账号。通过连通子图的方法找到的候选群体, 不仅找出了具备直接关联关系的账号,还把具备间接关联关系的多个账 号集合在一起。
步骤103、将所述候选群体中第一对象的个数作为第一特征值,参考 所述第一特征值,判断所述候选群体是否为特征群体。
在本申请的一种优选实施例中,所述步骤103可以包括:
子步骤S21、若所述第一特征值大于第一阀值,则所述候选群体为特 征群体。
针对各候选群体,以第一特征值来判断是否为特征群体,优选的, 当候选群体所包含的账号数大于第一阀值,则认为该候选群体为恶意注 册账号的特征群体。
其中,第一阀值的具体取值与网站性质、规模以及恶意注册行为的具体 标准相关,在具体的实现中可以根据数据进行必要的调试。优选的,第一阀 值的取值可以为几百到几千。
相比于现有技术,本申请依据账户之间的直接关联关系和间接关联 关系确定候选群体,从而可以找出更多潜在的恶意注册账号,依据候选 群体中账号的个数进一步确定恶意注册账号群体,从而可以避免买家参 与到虚假交易,提高网络购物的交易安全。
参考图2,示出了本申请的一种识别特征群体的方法实施例2的流程 图,具体可以包括以下步骤:
步骤201、在预置数据库中提取第一对象、第二对象,以及第一对象 与第二对象的映射关系数据。
步骤202、依据所述映射关系数据,提取包括所述第一对象和第二对 象的候选群体,所述候选群体中任意一个第一对象或第二对象,与另一 个任意的第一对象或第二对象,均通过一个或多个第一对象和/或第二对 象进行关联。
步骤203、针对各第一对象,将关联同一第二对象的第一对象确定为 直接关联对象。
在本申请的一种优选实施例中,所述步骤203可以包括:
子步骤S31、针对各第一对象,确定关联的第二对象,并确定各关联 的第二对象所关联的第一对象;
子步骤S32、将所有关联的第二对象所关联的第一对象进行合并,去 重,将去重后的第一对象作为直接关联对象。
第一对象的直接关联对象是指具有相同的第二对象的另一个第一对 象,即具有相同用户标识的两个账号。
具体的,针对某个用户账号,先找出与其关联的用户标识,以及各 用户标识关联的多个用户账号;然后将各用户标识关联的多个用户账号 进行合并,去重,即可得到第一对象的直接关联对象。例如,账号A与 标识B和标识C关联,标识B与账号D和账号E关联,标识C与账号D 和账号F关联,将标识B和标识C所关联的账号进行合并得到4个账号, 分别为账号D、账号E、账号D和账号F,进行去重得到账号D、账号E 和账号F,即为A的三个直接关联对象。
步骤204、依据各第一对象的直接关联对象的个数,生成候选群体对 应的第二特征值。
在图论中,各第一对象的直接关联对象的个数即为第一对象的度数。 本申请中,第二特征值即为图论中的群体密度,针对某个候选群体,将 候选群体中的用户账号的个数记为n,所述第二特征值可以为各第一对象 的度数加和后,再除以n(n-1)的结果,在具体的实现中,群体密度的 取值范围在0~1之间。
步骤205、将所述候选群体中第一对象的个数作为第一特征值,参考 所述第一特征值和第二特征值,判断所述候选群体是否为特征群体。
所述步骤205可以包括:
子步骤S41、若所述第一特征值大于第一阀值,且所述第二特征值大 于第二阀值,则所述候选群体为特征群体。
与上个实施例不同的是,本实施例针对各候选群体,以第一特征值 结合第二特征值来判断是否为特征群体,可以使得恶意群体的识别更为 准确。优选的,当候选群体所包含的账号数大于第一阀值,群体密度大 于第二阀值,则认为该候选群体为恶意注册账号的特征群体。
其中,第一阀值和第二阀值的具体取值与网站性质、规模以及恶意注册 行为的具体标准相关,在具体的实现中可以根据数据进行必要的调试。优选 的,第一阀值的取值可以为几百到几千,第二阀值的取值可以为0.7到0.9 之间。
参考图3,示出了本申请的一种搜索方法实施例的流程图,具体可以 包括以下步骤:
步骤301、接收特征群体的搜索请求。
步骤302、识别特征群体,并返回特征群体的属性信息。
所述特征群体通过实施例1或2所述的方法识别出。用户提交搜索请 求,请求搜索恶意注册的账号群体,服务器接收到搜索请求,会按照实 施例1或2所述的方法确定特征群体,特征群体中包括了用户账户和用 户标识,依据用户账户还可以搜索到特征群体相关用户的其他属性信息, 例如,注册时间,信誉值,交易历史数据等,然后可以将特征群体以及 相关的属性信息返回给用户。
综上所述,本申请依据用户账户和用户标识的对应关系,利用图论 的方法,先找出有直接或间接关联的用户账户和用户标识作为一个候选 群体,将具有间接关联关系的账户归于同一个账户群体,然后依据各用 户账户直接关联的账户数计算候选群体的群体密度,依据账户数,或是 结合候选群体密度和账户数来判断是否是恶意注册账户群体。相比于现 有技术,本申请依据账户之间的间接关联关系可以找出潜在的恶意注册 账号,发现恶意注册账号群体,从而可以避免买家参与到虚假交易,提 高网络购物的交易安全。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组 合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的 限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其 次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选 实施例,所涉及的动作和模块并不一定是本申请所必须的。
参考图4,示出了本申请的一种识别特征群体的装置实施例1的结构 框图,具体可以包括以下模块:
映射关系数据提取模块401,用于在预置数据库中提取第一对象、第 二对象,以及第一对象与第二对象的映射关系数据;
候选群体提取模块402,用于依据所述映射关系数据,提取包括多个 所述第一对象和第二对象的候选群体,所述候选群体中任意一个第一对 象或第二对象,与另一个任意的第一对象或第二对象,均通过一个或多 个第一对象和/或第二对象进行关联;
第一判断模块403,用于将所述候选群体中第一对象的个数作为第一 特征值,参考所述第一特征值,判断所述候选群体是否为特征群体。
在本申请的一种优选实施例中,所述第一对象可以为用户账号,所 述第二对象可以为用户标识;
所述映射关系数据可以包括,各用户账号与其所关联的所有用户标 识的映射关系列表,以及各用户标识与其所关联的所有用户账号的映射 关系列表。
在本申请的一种优选实施例中,所述第一对象和所述第二对象均可 以具备属性值,所述候选群体提取模块可以包括:
属性值更新子模块,用于针对各个第一对象或第二对象,依据所关 联的第一对象或第二对象对应的属性值,更新对应的属性值;
候选群体组成子模块,用于提取属性值相同的第一对象和第二对象, 组成候选群体。
在本申请的一种优选实施例中,所述属性值更新子模块可以包括:
子单元1,用于针对各个第一对象或第二对象,依据所述映射关系数 据,确定所关联的第一对象或第二对象;
子单元2、用于提取所述关联的第一对象或第二对象所对应的属性 值;
子单元3、用于将提取的属性值中最小的值作为该第一对象或第二对 象对应的修正值;
子单元4,用于判断各第一对象或第二对象的属性值,与对应的修正 值是否相同,若是,则结束操作,若否,则以修正值替换属性值,并返 回子单元1。
在本申请的一种优选实施例中,所述候选群体可以包括一个或多个, 所述第一对象的属性值的初始值可以为账号ID的字符串,所述第二对象 的属性值的初始值可以与用户标识相同或是用户标识的字符串。
在本申请的一种优选实施例中,所述第一判断模块可以包括:
第一特征值判断子模块,用于若所述第一特征值大于第一阀值,则 所述候选群体为特征群体。
参考图5,示出了本申请的一种识别特征群体的装置实施例2的结构 框图,具体可以包括以下模块:
映射关系数据提取模块501,用于在预置数据库中提取第一对象、第 二对象,以及第一对象与第二对象的映射关系数据;
候选群体提取模块502,用于依据所述映射关系数据,提取包括多个 所述第一对象和第二对象的候选群体,所述候选群体中任意一个第一对 象或第二对象,与另一个任意的第一对象或第二对象,均通过一个或多 个第一对象和/或第二对象进行关联;
直接关联对象确定模块503,用于针对各第一对象,将关联同一第二 对象的第一对象确定为直接关联对象;
特征值生成模块504,用于依据各第一对象的直接关联对象的个数, 生成候选群体对应的第二特征值;
第二判断模块505,用于将所述候选群体中第一对象的个数作为第一 特征值,参考所述第一特征值和第二特征值,判断所述候选群体是否为 特征群体。
在本申请的一种优选实施例中,所述直接关联对象确定模块可以包 括:
第一对象确定子模块,用于针对各第一对象,确定关联的第二对象, 并确定各关联的第二对象所关联的第一对象;
合并子模块,用于将所有关联的第二对象所关联的第一对象进行合 并,去重,将去重后的第一对象作为直接关联对象。
在本申请的一种优选实施例中,所述第一特征值可以记为n,所述第 二特征值可以为各第一对象的直接关联对象的个数加和后,再除以n (n-1)的结果。
在本申请的一种优选实施例中,所述第二判断模块可以包括:
第二特征值判断子模块,用于若所述第一特征值大于第一阀值,且 所述第二特征值大于第二阀值,则所述候选群体为特征群体。
参考图6,示出了本申请的一种搜索装置实施例的结构框图,具体可 以包括以下模块:
搜索请求接收模块601,用于接收特征群体的搜索请求;
信息返回模块602,用于通过实施例4或5所述的装置识别特征群体, 并返回特征群体的属性信息。
由于所述装置实施例基本相应于前述图1-图3所示的方法实施例, 故本实施例的描述中未详尽之处,可以参见前述实施例中的相关说明, 在此就不赘述了。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个 人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处 理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网 络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计 算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描 述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽 象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布 式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络 而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块 可以位于包括存储设备在内的本地和远程计算机存储介质中。
在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他 性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅 包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为 这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况 下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、 方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种识别特征群体的方法和一种搜索方法, 以及,一种识别特征群体的方法和一种搜索装置进行了详细介绍,本文 中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例 的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领 域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上 均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。