一项最新研究表明,像OpenAI的ChatGPT这样的人工智能聊天机器人可以以快速、经济高效的方式运营一家软件公司,并将人为干预降至最低。在这项研究中,由布朗大学和多所中国大学的研究团队进行了一系列实验,探究使用ChatGPT 3.5版本的语言模型来驱动人工智能机器人完成软件开发过程的可行性。
为了测试这一点,研究人员创建了一个虚拟的软件开发公司,名为ChatDev。该公司根据瀑布模型的顺序方法,将软件开发过程分为设计、编码、测试和文档四个阶段。
随后,研究人员通过为每个机器人提供“关键细节”来分配特定的角色。这些“关键细节”描述了“指定任务和角色、通信协议、终止标准和约束”。一旦机器人被分配了角色,它们就会按照阶段被分配到相应的任务。例如,ChatDev的“CEO”和“CTO”在设计阶段工作,“程序员”和“美术设计师”在编码阶段工作。在每个阶段,人工智能工作者通过最少的人工输入进行相互交流,完成软件开发过程的特定部分,从决定使用哪种编程语言到识别代码中的错误,直到软件完成。
研究人员对不同的软件场景进行了实验,并进行了一系列分析,以了解ChatDev完成不同类型的软件所需的时间和成本。
例如,研究人员要求ChatDev“设计一款基本的五子棋游戏”,这是一种抽象策略棋盘游戏。在设计阶段,CEO要求CTO提出一种具体的编程语言,以满足新用户的需求。CTO回答使用Python作为编程语言,此时CEO表示“太棒了!”并解释这种编程语言的简单性和可读性使其成为初学者和经验丰富的开发人员的热门选择。
在CTO回答“让我们开始吧”后,ChatDev进入编码阶段。CTO要求程序员编写一个文件,然后程序员要求设计者为软件提供一个漂亮的图形用户界面。这样的聊天链在每个阶段重复,直到软件开发完成。
在完成了70个任务后,研究发现这个由人工智能驱动的公司平均可以在不到七分钟内以不到一美元的成本完成整个软件开发过程,并且能够通过其记忆和自我反思的能力识别和解决潜在的问题。论文中写道,大约86.66%的生成软件系统是完美执行的。
研究人员在论文中写道:“我们的实验结果证明了CHATDEV驱动的自动化软件开发过程的效率和成本效益。”
该研究的结果表明,像ChatGPT这样强大的生成式人工智能技术可以以多种方式执行特定的工作职能。然而,这项研究也发现了一些局限性,例如语言模型中的错误和偏见,这可能会导致软件创建过程中的问题。尽管如此,研究人员表示这些发现对于现实世界中的初级程序员或工程师可能是有所帮助的。