开年以来,DeepSeek 在各行业应用场景的讨论热度不减。作为领先的以技术驱动的整体人力资源解决方案服务商,科锐国际一直秉持着对前沿技术的敏锐洞察,积极探索“ AI + HR ”的深度融合场景。如今,科锐国际成功接入 DeepSeek-R1 大模型,在人力资源智能化转型的道路上迈出关键一步。钛媒体对这一重要事件进行了独家报道,以下内容转载自「钛媒体」。
钛媒体独家获悉,科锐国际已接入 DeepSeek-R1 大模型,探索 AI 大模型与招聘(特别是中高端招聘领域)的深度融合,以期提升人才匹配效率。科锐国际 CTO 刘之指出,春节前后中国 DeepSeek-R1 推理大模型惊艳世界,这将进一步推动 Agents 技术的成熟。
他告诉钛媒体,“DeepSeek-R1 是跟 OpenAI o1 平替但更经济的版本。DeepSeek-R1 在大规模强化学习的原创式创新开创了先河。虽然模型的优势并不一定总是持续,社区会跟进得很快。但将工程和算法等跨学科深度融合的团队总是能做出特别优秀的创新,这才是最值得敬佩和学习的。”
但他同样指出,“虽然 OpenAI 去年 9 月就发布了 o1 推理大模型,我们已经在尝试使用 o1 为跨数据源的复杂 RAG 任务提供更高效的任务拆解能力,同时也在预研更需要推理能力的 Agents。DeepSeek-R1 和 o1 的推理能力类似,所以并没有因此改变我们的产品方案和策略。
但与 o1 不同的是,DeepSeek-R1 的思维链是透明化的,所以在进行意图理解和任务规划时可以将产品转变成交互会话式的,这会极大提高用户体验。”
刘之预计,“随着科锐国际在不同场景接入更多不同模型,DeepSeek-R1 作为 RAG 和 Agents 的主力模型是完全可以的。”
早在去年5月,不少大模型提供商均在争相降价期间,DeepSeek-V2 就已经体现出与闭源模型如 GPT-4-Turbo 和 文心4.0 在语言理解与生成方面的综合实力。直至年底12月 DeepSeek-V3 和1月20日 DeepSeek-R1 的先后发布,客观上为 OpenAI 等大模型厂商带来了压力。
尽管 DeepSeek-R1 训练成本并未公布,但 DeepSeek-V3 据公布的训练预算为“2048个GPU、2个月、近600万美元”,外界认为 R1 在对标 OpenAI o1 模型的同时,训练成本也可能更低。
短短一个春节假期过后,国内外从芯片厂到云厂商都迅速公布了对 DeepSeek 支持。可以预期的是,在不同 GPU 和云算力平台上,DeepSeek 系列模型会有不同的性能表现。
刘之指出,“目前独立部署 DeepSeek-R1 满血版的成本仍太高,所以我们直接采用了云服务厂商的 API。”
钛媒体注意到,科锐国际在2023年下半年就公开表示,已经训练了面向技能与招聘的行业级预训练语言模型 CRE (CareerInternational Recruitment Embedding)。但科锐国际如今没有选择直接走训练行业垂直大模型的路线,而是选择以行业垂直的
Embedding 模型和 RAG 技术为核心技术路线。
科锐国际在2023年的两点判断是:
其一,AI 的计算范式开始转变,即通过大量数据和算力而非单纯依赖模型架构的改进来提升性能。这不仅仅是大模型,也包括其他模型。比如时间序列模型、Embedding 模型等;
其二,通用大模型的集中化趋势是肯定的,而垂直行业大模型面临诸多难以短期解决的技术难题。例如小模型的推理能力和知识不够,而大模型又难以微调且知识陈旧。
科锐国际一直在研发 Embedding 模型和提供 RAG 能力的 MatchSystem 匹配系统,以提升招聘效率和精准性。
刘之对钛媒体指出,“大模型总是要接入企业内部数据的。现在就三种方法:RAG、ICL 上下文学习和微调。在拥有大量数据的情况下,RAG 这条路是绕不过去的。而 RAG 又离不开搜索系统和 Embedding。”
从2022年起,科锐国际开始布局数据中台建设,逐渐构建了一个庞大的数据系统。这些数据广泛覆盖20多个行业与细分领域。数据的多样性使得 CRE Embedding 模型能够在真实场景中更好地贴合实际分布,从而有效提升匹配的精准度和效率。
据刘之透露,CRE Embedding 模型基于 700GB 公开数据和 40GB 行业简历与招聘需求数据进行预训练和任务微调。它能够深刻理解岗位需求和候选人简历中的复杂语义关系。由于招聘数据与连贯性文本是不同的两类数据,招聘数据不需要从头到尾阅读,通常会采用扫视阅读。因此在模型架构设计时更加关心局部关系。同时,通过多粒度特征融合和 Transformer 变体等技术使得 CRE 模型更符合招聘场景。
另外,Embedding 模型也有一些缺陷是需要关键词检索来进行弥补的,因此 MatchSystem 是一个结合 Embedding 和关键词检索的混合检索系统。同时,MatchSystem 也结合了 RAG(检索增强生成),以满足一些更灵活的查询需求。
针对 MatchSystem 匹配系统的研发路径,刘之告诉钛媒体,“其实我们走到这一步,不只是大环境的影响,而是原来的技术方案确实不奏效了。”
以招聘场景中“人岗匹配”为例,过去招聘系统会使用一些标签或者知识图谱的方法,以实现人岗匹配。但这种匹配在一些中高端岗位中就会遇到问题,“比如招聘一位高级算法工程师,其实这个岗位是很难去定义的,对岗位人员使用的技术栈、工具平台、解决的问题和业务场景(推广搜)等等都有诸多考量。”岗位细分类型多、招聘需求因“岗”而异,为猎头顾问带来了不小的匹配难度。开源模型如智谱的向量模型 BGE 并不能满足招聘场景的需求,所以才开始自研。
在他看来,“
招聘业务核心要解决匹配撮合,但不同的岗位和层次的痛点都不一样,所以解决方案也要进行调整。在基础岗位和初级岗位的招聘中,AI 技术应该更强调自动化,例如通过自动化筛选简历,自动联系和跟进;而在中高端岗位招聘领域,AI 技术应该更强调辅助,例如通过智能分析候选人背景和岗位适配度,帮助猎头顾问更精准地定位目标候选人。基础和初级岗位的招聘有望实现全流程自动化,而中高级岗位的招聘在部分流程中也将实现部分自动化。”
据悉,MatchSystem 可准确匹配垂直类岗位的招聘需求,而不是泛泛的匹配。例如算法工程师这个岗位是非常细分的,但是通过 MatchSystem 系统,哪怕是细微的招聘差别,它都能实现精准匹配。再比如,在获客方面,原先需要花费一周时间来匹配候选人与企业用人需求的繁琐过程,现在通过 MatchSystem 系统可以实时完成。
“随着实时多模态大模型、长上下文、推理大模型等技术的逐渐成熟,科锐国际将抓住 Agents 的最佳进入时机,于2025年将推出 PC 端寻访自动化 Agent 和关系图谱预测的 CRN(CareerInternational Relation Network)等。”刘之表示。
来源:首发于钛媒体APP 作者 | 杨丽,编辑 | 盖虹达
科锐国际
科锐国际是领先的以技术驱动的整体人才解决方案服务商,于2017年6月正式在深交所上市,成为国内首家登陆A股的人力资源服务企业(300662.SZ)。公司目前在中国、新加坡、马来西亚、美国、英国、德国、荷兰、澳大利亚等全球市场拥有100 余家分支机构,近3,000名自有员工。通过构建“技术+平台+服务”的商业模式,在20+个细分行业及领域为客户提供中高端人才访寻、招聘流程外包、灵活用工、人力资源咨询、培训与发展等人力资源全产业链服务,以及HR SaaS、垂直领域招聘平台、人力资源产业互联平台等技术和生态产品,为企业人才配置与业务发展提供一体化支撑,为区域引才就业与产才融合提供全链条赋能。过去一年中,公司链接企业近37,000家,贡献收入客户6,000余家,运营招聘岗位22万余个,成功推荐中高端管理及专业技术人员近20,000名,灵活用工累计派出人员38.3万余人次,聚合合作伙伴近13,000家。