在2024年的AI领域,OpenAI宣布了一项令人振奋的技术突破——强化微调API(Reinforcement Fine-Tuning,RFT)。这一新工具的出现,不仅承接了当下大型语言模型的发展趋势,也让强化学习的应用前景更加广阔,新的技术可能会进一步推动AI模型的智能化和可用性。 在AI技术的不断进步中,Yann LeCun在2016年提出的“智能蛋糕比喻”依然熠熠生辉。根据这个比喻,智能的构 ...
最近,OpenAI在其年度直播中公布了一项令人瞩目的新技术——强化微调(Reinforcement Fine-Tuning),这一产品主要面向企业和开发者用户。这一发布无疑 ...
2024年12月6日,OpenAI宣布推出一项名为强化微调(Reinforcement Fine-Tuning)的新技术,旨在帮助开发者和机器学习工程师构建针对特定复杂领域的专家模型。
让 AI 更懂你的需求 OpenAI 最新推出的偏好微调(Preference Fine-Tuning)功能,让 AI 模型的个性化定制变得更加简单和高效。这项技术采用了一种叫做 ...
在去年底的十二天发布会期间,OpenAI以新一代推理模型o1正式上线激活揭开序幕。首席执行官Sam Altman表示,OpenAI的模型技术,开始从通用型的LLM,转向具有复杂推理能力的新一代模型系列。 第一天:新一代推理模型o1正式上线 ...
OpenAI 宣布为ChatGPT 增加新功能Reinforcement Fine-Tuning。 据悉,Reinforcement Fine-Tuning可以帮助用户根据自己的数据来量身定制 OpenAI 的强大推理模型 o1。
当地时间12月5日-20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播,从首日的满血版o1模型重磅发布,再到期待许久的Sora Turbo正式发布,最终又以新一代推理模型o3收官,OpenAI CEO山姆·奥特曼(Sam Altman ...
OpenAI考虑开发人形机器人,布局初现。 最新爆料称,OpenAI正在考虑开发一款人形机器人。从搜索引擎、网页浏览器到服务器芯片、数据中心,再到 ...
直播现场,OpenAI官宣了全新的微调方法——偏好微调(preference fine-tuning)。通过使用直接偏好优化(DPO)能帮助开发者创建更符合用户偏好的模型。
OpenAI表示,o3在ARC-AGI评估中获得破纪录的分数,o3在某些条件下可以接近实现通用人工智能。 OpenAI展示新模型o3 当地时间周五,OpenAI在为期12个工作 ...
使用微信扫码将网页分享到微信 前不久刚刚完成「12 日直播发布活动」的 OpenAI,近日又被曝出正在考虑开发一种「人形机器人」。 与之前的消息连 ...