在高速发展的数字时代,海量数据从医疗、金融、营销、教育到政府等多个领域持续涌现。面对大数据带来的机遇与挑战,数据挖掘技术正成为揭示隐藏模式、关联和知识的核心工具。然而,如何理解这些信息、优化算法并确保数据安全,已成为研究的重点。
在人工智能浪潮席卷全球的今天,大语言模型 (LLM) 正在重塑软件开发流程。近日,字节跳动首次对外披露其内部广泛应用的代码审查系统 BitsAI-CR 的技术细节,展示了 AI 在提升企业研发效率方面的重要进展。
最近,纽约大学研究者在Nature Medicine上发表了一项最新研究,为大模型在医疗中的使用敲响了警钟。在一次模拟的数据攻击中,研究者仅将0.001%的训练token替换为错误信息,就训练出了更有可能传播错误医学的模型。
近年来,大型语言模型(LLMs)在诸如安全对齐、指令微调等领域均取得了卓越表现。然而,在对这些模型进行持续训练时,人们经常观察到旧任务性能的骤降。传统观点往往将其归结为灾难性遗忘。但我们的最新研究发现,这种表观遗忘实际上是一种虚假遗忘——在大多数情况 ...
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
通用性行业KG可以支持建构各种企业KG,并结合GCN等模型,来支持众多企业AI的下游任务。例如,也能支持建立发酵食材的IngGraph,来实践另一项下游客制化任务。发酵过程中的食材(例如:酸奶、酱油、啤酒、泡菜等)往往会经历复杂的化学反应和微生物活动 ...