Embedding - 搜索 News

7 小时

在高速发展的数字时代，海量数据从医疗、金融、营销、教育到政府等多个领域持续涌现。面对大数据带来的机遇与挑战，数据挖掘技术正成为揭示隐藏模式、关联和知识的核心工具。然而，如何理解这些信息、优化算法并确保数据安全，已成为研究的重点。

在人工智能浪潮席卷全球的今天，大语言模型 (LLM) 正在重塑软件开发流程。近日，字节跳动首次对外披露其内部广泛应用的代码审查系统 BitsAI-CR 的技术细节，展示了 AI 在提升企业研发效率方面的重要进展。

6 小时

最近，纽约大学研究者在Nature Medicine上发表了一项最新研究，为大模型在医疗中的使用敲响了警钟。在一次模拟的数据攻击中，研究者仅将0.001%的训练token替换为错误信息，就训练出了更有可能传播错误医学的模型。

1 天

近年来，大型语言模型（LLMs）在诸如安全对齐、指令微调等领域均取得了卓越表现。然而，在对这些模型进行持续训练时，人们经常观察到旧任务性能的骤降。传统观点往往将其归结为灾难性遗忘。但我们的最新研究发现，这种表观遗忘实际上是一种虚假遗忘——在大多数情况 ...

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

6 天

通用性行业KG可以支持建构各种企业KG，并结合GCN等模型，来支持众多企业AI的下游任务。例如，也能支持建立发酵食材的IngGraph，来实践另一项下游客制化任务。发酵过程中的食材（例如：酸奶、酱油、啤酒、泡菜等）往往会经历复杂的化学反应和微生物活动 ...

一些您可能无法访问的结果已被隐去。