最近,OpenAI在其年度直播中公布了一项令人瞩目的新技术——强化微调(Reinforcement Fine-Tuning),这一产品主要面向企业和开发者用户。这一发布无疑 ...
2024年12月6日,OpenAI宣布推出一项名为强化微调(Reinforcement Fine-Tuning)的新技术,旨在帮助开发者和机器学习工程师构建针对特定复杂领域的专家模型。
让 AI 更懂你的需求 OpenAI 最新推出的偏好微调(Preference Fine-Tuning)功能,让 AI 模型的个性化定制变得更加简单和高效。这项技术采用了一种叫做 ...
OpenAI年终大戏第二场推出了 强化微调RFT (Reinforcement Fine-Tuning),它可以让你用 几十到几千个 的训练数据,为特定的复杂任务构建专家模型, 加强了 ...
在去年底的十二天发布会期间,OpenAI以新一代推理模型o1正式上线激活揭开序幕。首席执行官Sam Altman表示,OpenAI的模型技术,开始从通用型的LLM,转向具有复杂推理能力的新一代模型系列。 第一天:新一代推理模型o1正式上线 ...
当地时间12月5日-20日,人工智能巨头OpenAI完成了连续12个工作日的12场直播,从首日的满血版o1模型重磅发布,再到期待许久的Sora Turbo正式发布,最终又以新一代推理模型o3收官,OpenAI CEO山姆·奥特曼(Sam Altman ...
直播现场,OpenAI官宣了全新的微调方法——偏好微调(preference fine-tuning)。通过使用直接偏好优化(DPO)能帮助开发者创建更符合用户偏好的模型。