第1天数据出来后,团队开始怀疑“是不是搞错了”;第2天,网上的讨论进一步扩大;才到了第3天,团队就意识到这个模型真·火了;并且进入第4天,他们意识到ChatGPT将改变世界。 据Nick Turley回忆,ChatGPT刚发布的那段时间相当混乱,所有人都以为是不是出了故障,怀疑它的爆火只是昙花一现,奥特曼还曾私下调侃道: 随着ChatGPT的一路走红,研究人员反而陷入困扰,面对GPU短缺、数据库连接耗尽、服务商速率限制导致的系统宕机,他们创建了“fail whale”页面,通过生成一首由GPT-3完成的诗歌自我调侃,提醒用户:我们宕机了! 经常宕机的情况并没有持续多久,OpenAI开始积极根据用户反馈改进ChatGPT,主要是通过RLHF(使用人类反馈的强化学习),当用户为对话提供积极反馈时,模型会训练自己生成更迎合用户的响应。 Nick Turley表示,ChatGPT作为一个实用产品,长期的优化目标并不在用户的使用时长上,而是用户的长期留存率,这也是他们构建产品的核心机制。 并且他还预测,其他模态(如语音和视频)也会有类似的魔法时刻——当它们达到用户预期时,不仅会改变人们的生活,而且会进一步扩大ChatGPT的影响力。 比如对于ChatGPT,团队预期它会是一个纯粹的实用产品,但实际上人们经常拿来娱乐;而对于ImageGen,本来以为人们会拿来搞搞表情包娱乐一下,结果大部分都是用于实际工作生活,如制作ppt插图或家居设计。 就拿生成人物肖像来说,当他们首次在ChatGPT推出图像上传功能时,还曾考虑要不要对图片进行模糊处理,从而避免人们基于肖像进行推断或说一些刻薄之言。 ChatGPT是实时响应模型,输入提示,就立马给出答案,而Agentic编码是指模型接受一个复杂的任务后,将在后台长时间处理,最终返回一个接近最佳答案的结果。 如何保障代码的正确性,如何构建组织内部的软件、编写好的测试和文档,如何处理代码分歧等,这些都是AI模型未来需要集中学习的“品位”和“风格”元素。 此外,OpenAI专注构建通用技术,像Codex,虽然当前定位是专业的软件工程师,但考虑到其他用户的使用需求,未来他们将继续迭代优化,希望能降低编程门槛,让人人得以软件开发。 关于OpenAI内部如何使用这些工具,Nick Turley表示,他们的工程师使用Codex分担测试任务,分析师会使用它来自动标记日志错误,也有员工用它来规划未来的待办事项。 OpenAI鼓励员工使用编程工具,帮助提高生产力的同时,可以预测产品的未来走向。他们不会将自己不认可的产品推向市场,内部使用是一个预先检验,能让他们及时了解到人们适应新工作流程所需的时间。 AI领域有太多未知的东西。员工需要保持谦逊,因为在真正深入研究和尝试理解之前,你无法得知什么是有价值的,什么又是存在风险的,唯有强烈的好奇心能驱使人们不断学习和探索。 总之在Nick Turley看来,OpenAI之所以能快速推出产品,正是因为公司里有如此多具备行动力、能够真正“交付”(ship)产品的人,并且公司内部的繁文缛节很少。 与此同时,随着OpenAI的规模从最初的150-200人增长至约2000人,他们还通过独立项目精简人员配置、定期举办黑客马拉松保持文化和精神。 Mark Chen表示,在未来12~18个月内,最大的惊喜无疑是AI所展现出的“推理能力”,这种能力符合他们之前讨论的“Agentic范式”,且目前已经能看到它在数学、科学和编程领域取得了巨大进展。 举个例子,对企业来说,目前模型还无法解决一些本质上很难的问题(如软件工程、数据分析、卓越的客户支持),但实际上这些问题很容易描述和评估。 对消费者也同样,许多个人生活中相对麻烦的事情(如报税、旅行规划、购买高价值商品),所有这些问题都需要“多一点智能”和“合适的表现形式”。


