OpenAI推出SWE-bench Verified!现有框架低估模型软件工程能力

0123456