上海油压工作室

Qodo推出开源代码嵌入模型,性能超越OpenAI和Salesforce

2025-03-03 14:31  浏览:  

Qodo,前身为Codium,是一家专注于人工智能驱动的代码质量平台的公司。近日,该公司发布了Qodo-Embed-1-1.5B,这是一款开源的代码嵌入模型,拥有15亿个参数,旨在提升代码搜索、检索和理解的能力。该模型在行业基准测试中表现优异,超越了OpenAI和Salesforce的大型模型,同时以更小的规模和更高的效率树立了新的企业标准。

上海油压工作室对于管理庞大复杂代码库的企业开发团队来说,Qodo-Embed-1-1.5B代表了AI驱动软件工程工作流程的重大进步。通过实现更准确、更高效的代码检索,该模型解决了AI辅助开发中的关键挑战——大型软件系统中的上下文感知问题。

代码嵌入模型的重要性

AI驱动的编码工具传统上侧重于代码生成,大型语言模型(LLM)因其编写新代码的能力而备受关注。然而,Qodo的首席执行官兼联合创始人Itamar Friedman指出:“企业软件可能包含数千万甚至数亿行代码。仅仅生成代码是不够的,还需要确保代码质量高、功能正常,并与系统的其他部分无缝集成。”

代码嵌入模型在AI辅助开发中扮演着关键角色,能够有效搜索和检索相关代码片段。这对于代码量庞大、涉及多个团队、存储库和编程语言的大型组织尤为重要。Friedman强调:“在当今的软件开发中,上下文至关重要。要从庞大的代码库中获取正确的上下文,必须依赖高效的搜索机制。”

Qodo-Embed-1-1.5B的性能与效率

Qodo-Embed-1-1.5B以其高效性和准确性脱颖而出。尽管许多先进模型依赖数十亿个参数(如OpenAI的text-embedding-3-large拥有70亿个参数),Qodo的模型仅用15亿个参数就实现了卓越的性能。在代码信息检索基准(CoIR)测试中,Qodo-Embed-1-1.5B得分为70.06,优于Salesforce的SFR-Embedding--2_R(67.41)和OpenAI的text-embedding-3-large(65.17)。

上海油压工作室这种性能水平对企业尤为重要,因为该模型能够在低成本GPU上运行,降低了基础设施成本,同时提高了软件质量和开发效率。

上海油压工作室解决代码复杂性与细微差别

AI驱动软件开发中的一大挑战是外观相似的代码可能具有截然不同的功能。Friedman举例说明:“嵌入代码的最大挑战之一是,两个几乎相同的函数(如‘withdraw’和‘deposit’)可能只差一个加号或减号。它们在向量空间中需要接近,但又必须明显区分。”

为了解决这一问题,Qodo开发了一种独特的训练方法,结合高质量的合成数据和真实代码样本。通过与Nvidia和AWS的合作,Qodo改进了模型训练过程,使其能够识别功能相似代码中的细微差异,确保开发人员检索到正确的结果。

多语言支持与未来扩展

上海油压工作室Qodo-Embed-1-1.5B已针对10种最常用的编程语言(包括Python、JavaScript和Java)进行了优化,并支持其他语言和框架。未来,Qodo计划进一步扩展模型功能,提供更深入的企业开发工具集成和更多语言支持。

Friedman表示:“许多嵌入模型难以区分编程语言,有时会混淆来自不同语言的代码片段。我们专门训练了模型以防止这种情况,重点关注企业开发中最常用的10种语言。”

企业部署与可用性

Qodo通过多种渠道提供其新模型。1.5B参数版本可在Hugging Face上免费获取,采用OpenRAIL++-M许可证,允许开发人员自由集成到工作流程中。企业用户可选择商业许可版本,获取更多功能。此外,Qodo还提供企业级平台,能够自动更新代码嵌入,确保模型在代码库变化时保持准确性。

该模型还将通过Nvidia的NIM平台和AWS SageMaker JumpStart提供,便于企业部署和集成到现有开发环境中。

上海油压工作室AI在企业软件开发中的未来

上海油压工作室随着AI驱动的编码工具快速发展,其重点正从代码生成转向代码理解、检索和质量保证。Qodo-Embed-1-1.5B等工具将在使AI系统更可靠、高效和经济高效方面发挥关键作用。

Friedman总结道:“对于财富15,000强企业的开发人员来说,AI不仅仅是代码生成工具。他们的工作流程需要对大型代码库有深入理解。高质量的代码嵌入模型正是解决这一需求的关键。”

Qodo的最新模型为企业在复杂软件生态系统中理解、管理和优化代码提供了高性能的解决方案,标志着AI在软件开发中的应用迈出了重要一步。

免责声明:本网转载自合作媒体、机构或其他网站的信息,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。本网所有信息仅供参考,不做交易和服务的根据。本网内容如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。
相关推荐
英飞凌在印度开设研发中心

英飞凌在印度开设研发中心

3月24日消息,欧洲芯片大厂英飞凌科技在印度古吉拉特邦艾哈迈达巴德的研发中心正式开业。据介绍,英飞凌的全球能力中心 (GCC) 位于古吉拉特邦国际金融技术城 (GIFT City),将在未来五年内雇用 500 名工程师。该中心将专注于半导体芯片设计和产品软件的研发,以及信息技术、供应链管理和系统和应用工程。目前英飞凌印度在该国拥有 2500 多名员工,的新研发中心的启用意味着英飞凌现在印度的五个地点设有代表处,其中班加罗尔是最大的。我们新的...

英伟达携手联发科发力ASIC市场,打造NVLink IP、长距离224G Serdes

联发科与英伟达的合持续深化,除了硬件之外,在半导体IP方面,双方也将携手打造NVLink IP、长距离224G Serdes、车规AEC。业界分析,英伟达欲跨入ASIC领域,然由于品牌包袱,所以藉由联发科将更能快速扩展。未来将有更多CSP业者寻求与联发科合作,而一旦客户采用NVLink IP,也能增加英伟达Switch解决方案之客户采购意愿、达到双赢局面。在近期的英伟达GTC大会上,联发科介绍了其Premiun ASIC设计服务,显示联发科与英伟达的合作扩展至IP领域,更弹性的商业...
继芯片与人工智能后,美国或考虑推出机器人国家战略

继芯片与人工智能后,美国或考虑推出机器人国家战略

继芯片、人工智能等产业之后,美国政府和国会接下来可能将考虑把智能机器人行业的发展纳入国家战略。美东时间周三,包括特斯拉、波士顿动力(Boston Dynamics)和敏捷机器人(Agility Robotics)在内的多家美国机器人公司代表前往国会山,会见了美国议员,并敦促他们开启一项国家机器人战略,建立一个专注于促进机器人行业发展的联邦办公室,从而推动美国公司在全球竞争中开发下一代机器人。美国企业敦促推出机器人国家战略美国德克萨斯州的人形机...
库克重申:加大在华投资规模

库克重申:加大在华投资规模

苹果CEO库克近两年来持续加强与中国市场的联系。自上周末到访中国以来,他从北京到杭州,一路表达着对中国创新的赞誉。库克访华之际,正值苹果iPhone销量增长乏力之时。不过苹果重申了对加大中国投资规模的承诺。尽管近期其在高端市场表现不佳,但苹果正在从新产品到新功能等多方蓄力。盛赞DeepSeek和黑悟空库克此次访华的重头戏在杭州,这也是火遍全球的AI应用DeepSeek的诞生地。他被媒体问到对DeepSeek的看法时称:DeepSeek的模型非常出色。...
中国自主研发12英寸碳化硅衬底全自动激光切割技术

中国自主研发12英寸碳化硅衬底全自动激光切割技术

记者27日从西湖大学获悉,由该校孵化的西湖仪器(杭州)技术有限公司成功开发出12英寸碳化硅衬底自动化激光剥离技术,解决了12英寸及以上超大尺寸碳化硅衬底切片难题。与传统的硅材料相比,碳化硅具有更宽的禁带能隙以及更高的熔点、电子迁移率和热导率,可在高温、高电压条件下稳定工作,已成为新能源和半导体产业迭代升级的关键材料。碳化硅衬底激光剥离系统。图片来源:西湖大学西湖大学工学院讲席教授仇旻介绍,碳化硅行业降本增效的重要途径之...

推荐阅读

Copyright © 上海油压工作室