alixixi 10 月 17 日消息,科技媒体 Appleinsider 昨日(10 月 16 日)发布博文,报道称苹果公司公布了 3 项 AI AI 研究成果,深入探讨了如何运用人工智能(AI)与大语言模型(LLM)提升软件开发与测试的效率。

这些研究分别聚焦于自动化质量工程(QE)测试、修复代码错误以及预测软件缺陷,旨在解决传统手动测试耗时、昂贵且易出错的痛点。

一、Agentic RAG Framework

第一项研究提出了一个“智能体 RAG 框架”(Agentic RAG Framework),专门用于软件自动化测试。

传统模式下,质量工程师需要花费 30-40% 的时间手动编写测试方案和脚本。为解决此问题,苹果设计了一个由六个专业 AI 智能体组成的协同系统,分别负责法规遵从、历史案例分析、测试生成等任务。

该框架取得了显著成效:不仅将测试准确率从 65% 提升至 94.8%,还将所需时间大幅缩短了 85%,同时 BUG 检测率也提高了 35%。

二、SWE-Gym

第二项研究则推出了一个名为“SWE-Gym”的训练环境,专门用于培养 AI 智能体解决真实世界的软件工程问题。

该环境整合了来自 11 个知名 Python 代码库的 2438 个真实 GitHub 问题,让 AI 在模拟环境中学习诊断并修复错误。

经过训练,基于语言模型的 AI 智能体成功解决了 72.5% 的编程任务。这项研究旨在通过 AI 辅助提升开发人员的生产力,并为探索“人机协作”编程模式提供了新方向。

三、ADE-QVAET

第三项研究聚焦于软件 BUG 的“事前预测”,并为此开发了名为“ADE-QVAET”的 AI 模型。

它结合了自适应优化技术(ADE)与量子变分自动编码器(QVAET),通过深度学习和模式识别来精准定位高维特征中的异常。

该研究的目标是利用 AI 从“被动修复”转向“主动预防”,从根本上提升软件质量。

alixixi附上参考地址

Agentic RAG for Software Testing with Hybrid Vector-Graph and Multi-Agent Orchestration

Training Software Engineering Agents and Verifiers with SWE-Gym

Software Defect Prediction using Autoencoder Transformer Model

本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]