首页 > 专利 > 杭州电子科技大学 > 一种面向技术领域的专业人才搜索方法专利详情

一种面向技术领域的专业人才搜索方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2018-05-31
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2018-11-30
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2021-07-02
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2038-05-31
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201810544758.X 申请日 2018-05-31
公开/公告号 CN108763520B 公开/公告日 2021-07-02
授权日 2021-07-02 预估到期日 2038-05-31
申请年 2018年 公开/公告年 2021年
缴费截止日
分类号 G06F16/30G06Q10/06 主分类号 G06F16/30
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 1
引用专利数量 0 被引证专利数量 0
非专利引证 1、CN 107229738 A,2017.10.03CN 107480936 A,2017.12.15CN 104268720 A,2015.01.07KR 20120095593 A,2012.08.29杨志华.“行业特色型大学教师科技创新能力评价指标研究”《.中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》.2018,;
引用专利 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 徐小良、顾高飞 第一发明人 徐小良
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 2
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
浙江千克知识产权代理有限公司 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
周希良
摘要
本发明公开了一种面向技术领域的专业人才搜索方法。本发明首先对海量科技成果数据资源进行文本处理和知识挖掘,生成技术领域词库和对应的词向量库。然后构建人才‑技术领域专业能力模型:对科技成果所属技术领域进行智能化标注并生成人才与技术领域的关系;综合科技成果的质量评分、人才贡献度、技术领域偏重度,构建人才‑技术领域专业能力模型。最后根据步骤2中的人才‑技术领域专业能力模型,计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现面向技术领域的专业人才搜索引擎。本发明基于大数据实现人才‑技术领域专业能力评分的智能计算,面向技术领域进行人才搜索比较便捷高效,排序结果比较科学合理。
  • 摘要附图
    一种面向技术领域的专业人才搜索方法
  • 说明书附图:图1
    一种面向技术领域的专业人才搜索方法
  • 说明书附图:图2
    一种面向技术领域的专业人才搜索方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2021-07-02 授权
2 2018-11-30 实质审查的生效 IPC(主分类): G06F 17/30 专利申请号: 201810544758.X 申请日: 2018.05.31
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种面向技术领域的专业人才搜索方法,其特征在于,该方法包含如下步骤:
步骤1:生成技术领域词库和词向量库
利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A;
步骤2:构建人才‑技术领域专业能力模型
步骤2.1:生成人才‑技术领域关系
通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系;
步骤2.2:计算科技成果的质量评分
Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:
Spaper=log(l·dc+10)·grade(dr)
Spatent=patentType(da)
Sproject=fund(db)·projectType(de)
其中,dc为论文被引用次数,l为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级,grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型,patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值;
步骤2.3:计算科技成果的人才贡献度
科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:
其中,m表示人才在该科技成果中的排名,即第几成员,1≤m≤4,排名靠后的成员忽 略不计;
步骤2.4:计算科技成果的技术领域偏重度
使用相关技术领域词向量的加权平均来表示科技成果的主题向量,该主题向量与技术领域词向量的归一化余弦相似度,即为该科技成果的技术领域偏重度;
为科技成果k的主题向量,设tki为科技成果k中的第i个技术领域词,aki为对应的词向量,tki∈T,aki∈A,xki为tki在科技成果k中出现的词频,n表示科技成果k中包含的技术领域词总数量,xk为上式中的xki之和;
Wki表示科技成果k对于tki的技术领域偏重度,通过计算词向量aki与主题向量 的归一化余弦相似度得到;
将tki用tf表示,tf∈T,tf表示T中第f个技术领域词,则对应的aki可以表示为af,Wki表示为W′kf,则得到下式
步骤2.5:构建人才‑技术领域专业能力模型
将科技成果的质量评分、人才贡献度和技术领域偏重度三者相乘,计算得到人才就参与该科技成果的技术领域专业能力分值;人才‑技术领域专业能力是该人才所参与的各相关科技成果的技术领域专业能力分值之和,人才‑技术领域专业能力模型如下:
其中,Vpf表示人才p对于技术领域tf的专业能力,Sk为科技成果k的质量评分,Cpk为该人才p在科技成果k中的贡献度;
科技成果k可以是学术论文、专利或科研项目,Sk可以如下表示如下:
其中,α、β和γ则分别是学术论文、专利或科研项目三种类型科技成果质量权重的调节因子,三者的取值范围为[0,1],其和为1;
步骤3:生成索引文件实现搜索引擎
根据步骤2中的人才‑技术领域专业能力模型进行计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现搜索引擎;用户在搜索框中输入技术领域词,即可搜索得到该技术领域专业能力从高到低排序的人才列表。
说明书

技术领域

[0001] 本发明涉及搜索引擎技术领域,特别是涉及一种面向技术领域的专业人才搜索方法。

背景技术

[0002] 人才是第一资源,企业在创新过程中对专业技术人才求贤若渴。虽然高校院所等科研机构拥有大量的技术人才,但是由于科技信息“不对称”、缺乏科技大数据和智能搜索技术,企业往往缺少有效途径快速找到特定技术领域的专业人才。目前一些所谓的人才库或专家库系统只是收集了有限的人才及其技术领域描述信息,很多信息描述是主观填写的,不能客观反映人才的专业能力情况,不能满足根据特定技术领域精准有效搜索匹配专业人才的需求。
[0003] 随着大数据与人工智能技术的兴起,科技成果数据资源的开发和利用将有效解决上述的这些问题。本发明中的科技成果指的是学术论文、专利、科研项目三大类,这些科技成果数据信息包含成果类型、名称、成员、关键词、摘要、全文描述等文本信息。2016年5月,国务院办公厅印发的《促进科技成果转移转化行动方案》,明确鼓励运用云计算、大数据等新一代信息技术,加强科技成果数据资源的开发利用,提供符合用户需求的精准科技成果信息。因此,针对海量科技成果数据资源进行分析处理,实现智能化的技术领域人才搜索方法与系统是非常必要和有意义的。

发明内容

[0004] 本发明的目的在于利用科技人才及其学术论文、专利和科研项目等客观存在的科技成果数据资源,通过自然语言处理和机器学习等技术生成技术领域词库和词向量库、构建人才‑技术领域专业能力模型,并实现面向技术领域的专业人才搜索方法。
[0005] 本发明方法包括以下步骤:
[0006] 步骤1:生成技术领域词库和词向量库
[0007] 利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A;对每一个技术领域词ti∈T,都有且只有一个对应的词向量ai∈A。
[0008] 步骤2:构建人才‑技术领域专业能力模型
[0009] 步骤2.1:生成人才‑技术领域关系
[0010] 通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果的关联、人才与技术领域的关联关系。
[0011] 步骤2.2:计算科技成果的质量评分
[0012] Spaper、Spatent和Sproject分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,其表达式如下:
[0013] Spaper=log(k·dc+10)·grade(dr)
[0014] Spatent=patentType(da)
[0015] Sproject=fund(db)·projectType(de)
[0016] 其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级, grade(dr)表示对应论文期刊等级的常数影响值;da表示专利类型, patentType(da)为不同专利类型对应的常数影响值;db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值。
[0017] 步骤2.3:计算科技成果的人才贡献度
[0018] 科技成果的人才贡献度C,用正比例函数来表示其排名与贡献程度的关系:
[0019]
[0020] 其中,m表示人才在该科技成果中的排名,即第几成员, 1≤m≤4。
[0021] 步骤2.4:计算科技成果的技术领域偏重度
[0022] 使用相关技术领域词向量的加权平均来表示科技成果的主题向量,该主题向量与技术领域词向量的归一化余弦相似度,即为该科技成果的技术领域偏重度;
[0023]
[0024] 为科技成果k的主题向量,设tki为科技成果k中的第i个技术领域词,aki为对应的词向量,tki∈T,aki∈A,xki为tki在科技成果k中出现的词频,n表示科技成果k中包含的技术领域词总数量,xk为上式中的xki之和;
[0025]
[0026] Wki表示科技成果k对于tki的技术领域偏重度,通过计算词向量 aki与主题向量的归一化余弦相似度得到;
[0027] 将tki用tf表示,tf∈T,tf表示T中第f个技术领域词,则对应的aki表示为af,Wki表示为W′kf,则得到下式
[0028]
[0029] 步骤2.5:构建人才‑技术领域专业能力模型
[0030] 将科技成果的质量评分、人才贡献度和技术领域偏重度三者相乘,计算得到人才就参与该科技成果的技术领域专业能力分值;人才‑技术领域专业能力是该人才所参与的各相关科技成果的技术领域专业能力分值之和,人才‑技术领域专业能力模型如下:
[0031]
[0032] 其中,Vpf表示人才p对于技术领域tf的专业能力,k代表该人才p参与的第几项科技成果,Sk为科技成果k的质量评分,Cpk为该人才p在科技成果k中的贡献度。
[0033] 科技成果k是学术论文、专利或科研项目,Sk表示如下:
[0034]
[0035] 其中,α、β和γ则分别是学术论文、专利或科研项目三种类型科技成果质量权重的调节因子,三者的取值范围为[0,1],其和为1。
[0036] 步骤3:生成索引文件实现搜索引擎
[0037] 根据步骤2中的人才‑技术领域专业能力模型进行计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现搜索引擎;用户在搜索框中输入技术领域词,即可搜索得到该技术领域专业能力从高到低排序的人才列表。
[0038] 与现有技术相比,本发明有如下优点:
[0039] 本发明通过对海量科技成果数据资源的文本处理和知识挖掘,生成技术领域词库和语义词向量;实现科技成果所属技术领域的智能化标注,并得到人才与技术领域的关系;综合科技成果的质量评分、人才贡献度、技术领域偏重度,构建了人才‑技术领域专业能力模型;有效实现了一种面向技术领域的专业人才搜索排序方法和系统。

实施方案

[0042] 以下结合附图1对本发明作进一步说明:
[0043] 本发明的具体步骤是:
[0044] 1.生成技术领域词库和词向量库
[0045] 利用自然语言处理与机器学习技术,对海量科技成果数据资源进行文本处理、技术领域词识别等知识挖掘,形成技术领域词库T,同时通过词向量训练得到对应的词向量库A。对每一个技术领域词 ti∈T,都有且只有一个对应的词向量ai∈A。
[0046] 2.构建人才‑技术领域专业能力模型
[0047] 人才针对特定技术领域的专业能力,与人才‑技术领域的关系、科技成果的质量评分、人才贡献度和技术领域偏重度有关,下面介绍人才‑技术领域专业能力模型的构建,见图2。
[0048] 2.1生成人才‑技术领域关系
[0049] 通过对海量科技成果数据资源进行文本处理,实现科技成果所属技术领域的智能化标注,进而得到人才与科技成果以及人才与技术领域的关联关系。
[0050] 2.2计算科技成果的质量评分
[0051] 要衡量人才的能力水平,首先需要计算该人才所参与的科技成果的质量,所以需要一种评分模型对所有科技成果进行打分。本发明以 Spaper、Spatent和Sproject来分别表示学术论文、专利、科研项目三种类型科技成果的评分模型,表达式如下:
[0052] Spaper=log(k·dc+10)·grade(dr)
[0053] Spatent=patentType(da)
[0054] Sproject=fund(db)·projectType(de)
[0055] 其中,dc为论文被引用次数,k为调节因子,调节论文引用次数对于分值的影响,dr为论文发表期刊的等级, grade(dr)表示对应论文期刊等级的常数影响值。da表示专利类型, patentType(da)为不同专利类型对应的常数影响值。db和de分别为项目经费和项目类别,fund(db)和projectType(de)分别为项目经费和项目类别对项目质量的影响值。
[0056] 2.3计算科技成果的人才贡献度
[0057] 对于特定科技成果的所有参与成员,一般来说排名越靠前的成员对该科技成果的贡献度越高。科技成果的人才贡献度C,可以用简单的正比例函数来表示其排名与贡献程度的关系:
[0058]
[0059] 其中,m表示人才在该科技成果中的排名,即第几成员, 1≤m≤4,排名靠后的成员忽 略不计。
[0060] 2.4计算科技成果的技术领域偏重度
[0061] 一项科技成果可以同时属于多个技术领域,但与这些技术领域的相关度是不同的,这是对计算人才对于特定技术领域的专业能力是有关系的。
[0062] 本发明使用相关技术领域词向量的加权平均来表示科技成果的主题向量,该主题向量与技术领域词向量的归一化余弦相似度,即可得到该科技成果的技术领域偏重度。
[0063]
[0064] 为科技成果k的主题向量,设tki为科技成果k中的第i个技术领域词,aki为对应的词向量,tki∈T,aki∈A,xki为tki在科技成果k中出现的词频,n表示科技成果k中包含的技术领域词总数量,xk为上式中的xki之和。
[0065]
[0066] Wki表示科技成果k对于tki的技术领域偏重度,通过计算词向量 aki与主题向量的归一化余弦相似度得到。
[0067] 将tki用tf表示,tf∈T,tf表示T中第f个技术领域词,则对应的aki可以表示为af,Wki表示为W′kf,则得到下式
[0068]
[0069] 2.5构建人才‑技术领域专业能力
[0070] 将科技成果的质量评分、人才贡献度和技术领域偏重度三者相乘,可以计算得到人才就参与该科技成果的技术领域专业能力分值。人才 ‑技术领域专业能力是该人才所参与的各相关科技成果的技术领域专业能力分值之和,人才‑技术领域专业能力模型如下:
[0071]
[0072] 其中,Vpf表示人才p对于技术领域tf的专业能力,k代表该人才p参与的第几项科技成果,Sk为科技成果k的质量评分,Cpk为该人才p在科技成果k中的贡献度。
[0073] 科技成果k可以是学术论文、专利或科研项目,因此Sk可以如下表示:
[0074]
[0075] 其中,α、β和γ则分别是学术论文、专利或科研项目三种类型科技成果质量权重的调节因子,三者的取值范围为[0,1],其和为1。
[0076] 3.生成索引文件实现搜索引擎
[0077] 根据人才‑技术领域专业能力模型进行计算得到所有人才在各技术领域的专业能力评分,生成相应索引文件并部署实现面向技术领域的专业人才搜索引擎。用户在搜索框中输入技术领域词,即可搜索得到该技术领域专业能力从高到低排序的人才列表。

附图说明

[0040] 图1是本发明的流程图。
[0041] 图2是人才‑技术领域专业能力关联图。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号