此外,Deep Research 能够独立发现、推理和整合来自网络的见解。为了实现这一点,它接受了需要使用浏览器和 Python 工具的现实任务的训练,使用了 OpenAI 第一个推理模型 o1 背后的相同强化学习方法。