上海油压工作室

Qodo推出开源代码嵌入模型,性能超越OpenAI和Salesforce

2025-03-03 14:31  浏览:  

Qodo,前身为Codium,是一家专注于人工智能驱动的代码质量平台的公司。近日,该公司发布了Qodo-Embed-1-1.5B,这是一款开源的代码嵌入模型,拥有15亿个参数,旨在提升代码搜索、检索和理解的能力。该模型在行业基准测试中表现优异,超越了OpenAI和Salesforce的大型模型,同时以更小的规模和更高的效率树立了新的企业标准。

对于管理庞大复杂代码库的企业开发团队来说,Qodo-Embed-1-1.5B代表了AI驱动软件工程工作流程的重大进步。通过实现更准确、更高效的代码检索,该模型解决了AI辅助开发中的关键挑战——大型软件系统中的上下文感知问题。

代码嵌入模型的重要性

AI驱动的编码工具传统上侧重于代码生成,大型语言模型(LLM)因其编写新代码的能力而备受关注。然而,Qodo的首席执行官兼联合创始人Itamar Friedman指出:“企业软件可能包含数千万甚至数亿行代码。仅仅生成代码是不够的,还需要确保代码质量高、功能正常,并与系统的其他部分无缝集成。”

上海油压工作室代码嵌入模型在AI辅助开发中扮演着关键角色,能够有效搜索和检索相关代码片段。这对于代码量庞大、涉及多个团队、存储库和编程语言的大型组织尤为重要。Friedman强调:“在当今的软件开发中,上下文至关重要。要从庞大的代码库中获取正确的上下文,必须依赖高效的搜索机制。”

上海油压工作室Qodo-Embed-1-1.5B的性能与效率

上海油压工作室Qodo-Embed-1-1.5B以其高效性和准确性脱颖而出。尽管许多先进模型依赖数十亿个参数(如OpenAI的text-embedding-3-large拥有70亿个参数),Qodo的模型仅用15亿个参数就实现了卓越的性能。在代码信息检索基准(CoIR)测试中,Qodo-Embed-1-1.5B得分为70.06,优于Salesforce的SFR-Embedding--2_R(67.41)和OpenAI的text-embedding-3-large(65.17)。

上海油压工作室这种性能水平对企业尤为重要,因为该模型能够在低成本GPU上运行,降低了基础设施成本,同时提高了软件质量和开发效率。

解决代码复杂性与细微差别

AI驱动软件开发中的一大挑战是外观相似的代码可能具有截然不同的功能。Friedman举例说明:“嵌入代码的最大挑战之一是,两个几乎相同的函数(如‘withdraw’和‘deposit’)可能只差一个加号或减号。它们在向量空间中需要接近,但又必须明显区分。”

为了解决这一问题,Qodo开发了一种独特的训练方法,结合高质量的合成数据和真实代码样本。通过与Nvidia和AWS的合作,Qodo改进了模型训练过程,使其能够识别功能相似代码中的细微差异,确保开发人员检索到正确的结果。

多语言支持与未来扩展

Qodo-Embed-1-1.5B已针对10种最常用的编程语言(包括Python、JavaScript和Java)进行了优化,并支持其他语言和框架。未来,Qodo计划进一步扩展模型功能,提供更深入的企业开发工具集成和更多语言支持。

Friedman表示:“许多嵌入模型难以区分编程语言,有时会混淆来自不同语言的代码片段。我们专门训练了模型以防止这种情况,重点关注企业开发中最常用的10种语言。”

企业部署与可用性

上海油压工作室Qodo通过多种渠道提供其新模型。1.5B参数版本可在Hugging Face上免费获取,采用OpenRAIL++-M许可证,允许开发人员自由集成到工作流程中。企业用户可选择商业许可版本,获取更多功能。此外,Qodo还提供企业级平台,能够自动更新代码嵌入,确保模型在代码库变化时保持准确性。

该模型还将通过Nvidia的NIM平台和AWS SageMaker JumpStart提供,便于企业部署和集成到现有开发环境中。

上海油压工作室AI在企业软件开发中的未来

上海油压工作室随着AI驱动的编码工具快速发展,其重点正从代码生成转向代码理解、检索和质量保证。Qodo-Embed-1-1.5B等工具将在使AI系统更可靠、高效和经济高效方面发挥关键作用。

Friedman总结道:“对于财富15,000强企业的开发人员来说,AI不仅仅是代码生成工具。他们的工作流程需要对大型代码库有深入理解。高质量的代码嵌入模型正是解决这一需求的关键。”

Qodo的最新模型为企业在复杂软件生态系统中理解、管理和优化代码提供了高性能的解决方案,标志着AI在软件开发中的应用迈出了重要一步。

免责声明:本网转载自合作媒体、机构或其他网站的信息,登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。本网所有信息仅供参考,不做交易和服务的根据。本网内容如有侵权或其它问题请及时告之,本网将及时修改或删除。凡以任何方式登录本网站或直接、间接使用本网站资料者,视为自愿接受本网站声明的约束。
相关推荐
Qodo推出开源代码嵌入模型,性能超越OpenAI和Salesforce

Qodo推出开源代码嵌入模型,性能超越OpenAI和Salesforce

Qodo,前身为Codium,是一家专注于人工智能驱动的代码质量平台的公司。近日,该公司发布了Qodo-Embed-1-1.5B,这是一款开源的代码嵌入模型,拥有15亿个参数,旨在提升代码搜索、检索和理解的能力。该模型在行业基准测试中表现优异,超越了OpenAI和Salesforce的大型模型,同时以更小的规模和更高的效率树立了新的企业标准。对于管理庞大复杂代码库的企业开发团队来说,Qodo-Embed-1-1.5B代表了AI驱动软件工程工作流程的重大进步。通过实现更准确、更高...
OpenAI计划将Sora视频生成器整合至ChatGPT

OpenAI计划将Sora视频生成器整合至ChatGPT

OpenAI近日宣布,计划将其AI视频生成工具Sora直接集成到其广受欢迎的消费者聊天机器人应用ChatGPT中。这一消息是在OpenAI周五的Discord办公时间会议上由公司领导层透露的。目前,Sora仅通过12月推出的专用Web应用程序提供,用户可以通过该应用生成最长20秒的视频片段。然而,OpenAI的Sora产品负责人Rohan Sahai表示,公司计划将Sora扩展到更多平台,并增强其生成能力。Sora最初在发布前的几个月内主要面向创意人员和视频制作工作室推广。如今,Op...
亚马逊通过模型混合、代理和浏览器使用重建Alexa

亚马逊通过模型混合、代理和浏览器使用重建Alexa

亚马逊正在通过混合模型、代理互作性和浏览器使用功能,重新设计其旗舰语音助手Alexa,使其更加智能和高效。新版本名为Alexa+,旨在提供更强大的功能,例如主动通知用户他们最喜欢的作者是否有新书发布,或者他们最喜欢的艺术家是否在附近演出,甚至可以帮助购票。Alexa+通过推理和调用不同知识库中的专家来回答用户问题并完成任务。例如,它可以回答离办公室最近的披萨店在哪里?我的同事会喜欢吗?如果觉得他们会喜欢,就预订吧。这种能力使Alexa+...
英伟达CEO黄仁勋淡看DeepSeek影响销售额创纪录新高

英伟达CEO黄仁勋淡看DeepSeek影响销售额创纪录新高

英伟达主张黄仁勋在周三的财报电话会议上表达了对公司前景的坚定信心。他明确表示,DeepSeek 的出现动摇销售预期。 R1模型因训练所需芯片数量激增,导致英伟达股价上月出现大幅下跌。然而,黄仁勋将其视为出色的创新,指出推理模型对计算需求的拉动对公司构成利好。他提到,推理模型的计算耗时达普通模型的百倍,导致未来需求进一步增加。DeepSeek R1的开源引发了全球热潮,几乎所有AI开发者都在积极应用这一级推理模型。英伟达的业绩数据印证了...
苹果开发者服务登陆微信,加码中国市场布局

苹果开发者服务登陆微信,加码中国市场布局

苹果公司本周宣布,将其Apple Developer服务引入中国微信应用程序,进一步加大对中国市场的投资。这一服务包括面向开发者的新闻、公告及即将举办的活动信息,此前主要通过苹果官网和开发者应用提供。此举被视为苹果在中国市场应对销量下滑的重要举措。近期,iPhone在中国市场的销量出现下滑。最新财报显示,苹果在中国的销售额同比下降11.1%,部分原因是来自Oppo和华为等本土品牌的激烈竞争。为应对这一挑战,苹果推出了售价599美元的iPhone 16e,...

推荐阅读

热文

Copyright © 上海油压工作室