Openai Fine-Tune - 搜索 News

1 个月

在2024年的AI领域，OpenAI宣布了一项令人振奋的技术突破——强化微调API（Reinforcement Fine-Tuning，RFT）。这一新工具的出现，不仅承接了当下大型语言模型的发展趋势，也让强化学习的应用前景更加广阔，新的技术可能会进一步推动AI模型的智能化和可用性。在AI技术的不断进步中，Yann LeCun在2016年提出的“智能蛋糕比喻”依然熠熠生辉。根据这个比喻，智能的构 ...

搜狐1 个月

OpenAI推出强化微调技术：AI领域的新转机与未来前景

最近，OpenAI在其年度直播中公布了一项令人瞩目的新技术——强化微调（Reinforcement Fine-Tuning），这一产品主要面向企业和开发者用户。这一发布无疑 ...

搜狐1 个月

OpenAI强化微调：AI技术的新突破与应用前景

2024年12月6日，OpenAI宣布推出一项名为强化微调（Reinforcement Fine-Tuning）的新技术，旨在帮助开发者和机器学习工程师构建针对特定复杂领域的专家模型。

腾讯网1 个月

OpenAI发布会第九天：o1 模型开放API使用，开发者最关心的更新有哪些？

让 AI 更懂你的需求 OpenAI 最新推出的偏好微调（Preference Fine-Tuning）功能，让 AI 模型的个性化定制变得更加简单和高效。这项技术采用了一种叫做 ...

来自MSN1 天

从十二天发布来看OpenAI的2025战略布局

在去年底的十二天发布会期间，OpenAI以新一代推理模型o1正式上线激活揭开序幕。首席执行官Sam Altman表示，OpenAI的模型技术，开始从通用型的LLM，转向具有复杂推理能力的新一代模型系列。第一天：新一代推理模型o1正式上线 ...

来自MSN1 个月

OpenAI 发布ChatGPT 新功能Reinforcement Fine-Tuning，满足企业特定需求

OpenAI 宣布为ChatGPT 增加新功能Reinforcement Fine-Tuning。据悉，Reinforcement Fine-Tuning可以帮助用户根据自己的数据来量身定制 OpenAI 的强大推理模型 o1。

腾讯网1 个月

OpenAI如何叩响AGI之门：12天12场直播，秀出哪些新肌肉

当地时间12月5日-20日，人工智能巨头OpenAI完成了连续12个工作日的12场直播，从首日的满血版o1模型重磅发布，再到期待许久的Sora Turbo正式发布，最终又以新一代推理模型o3收官，OpenAI CEO山姆·奥特曼（Sam Altman ...

36氪29 天

终结者降临，OpenAI被曝重启人形机器人计划，AI植入机脑开启天网2.0？

OpenAI考虑开发人形机器人，布局初现。最新爆料称，OpenAI正在考虑开发一款人形机器人。从搜索引擎、网页浏览器到服务器芯片、数据中心，再到 ...

36氪1 个月

OpenAI圣诞第9天：满血o1 API放出，开发者大狂欢，实时API升级音频token ...

直播现场，OpenAI官宣了全新的微调方法——偏好微调（preference fine-tuning）。通过使用直接偏好优化（DPO）能帮助开发者创建更符合用户偏好的模型。

第一财经1 个月

AI周报｜OpenAI展示新模型o3;智谱完成新一轮30亿元融资

OpenAI表示，o3在ARC-AGI评估中获得破纪录的分数，o3在某些条件下可以接近实现通用人工智能。 OpenAI展示新模型o3 当地时间周五，OpenAI在为期12个工作 ...

爱范儿29 天

OpenAI 考虑开发人形机器人，或与其「投资对象」直接竞争

使用微信扫码将网页分享到微信前不久刚刚完成「12 日直播发布活动」的 OpenAI，近日又被曝出正在考虑开发一种「人形机器人」。与之前的消息连 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果