-
阿里云周靖人:阿里云今日将发布通义千问2.0
在2023年的云栖大会上,阿里巴巴集团的创始合伙人、董事长蔡崇信表示,智能化时代已经来临,人工智能将成为新的生产力,推动各行各业快速发展。 同时,他强调了算力的重要性,指出中国80%的科技企业以及一半的大模型公司都在使用阿里云作为他们的云服务提供商。 蔡...
-
ChatGPT、Llama-2等大模型,能推算出你的隐私数据!
ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。 瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddi...
-
像搭乐高一样做数学定理证明题,GPT-3.5证明成功率达新SOTA
背景 作为长链条严格推理的典范,数学推理被认为是衡量语言模型推理能力的重要基准,GSM8K 和 MATH 等数学文字问题(math word problem)数据集被广泛应用于语言模型的测评和比较中。事实上,数学作为一项科学研究并不仅仅包括计算具体实例,...
-
小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更...
-
可能被“偷窥”了!大模型隐私推理准确率95.8%
Reddit上的一位用户发表了一句关于通勤路线的状态: 我的通勤路上有个恼人的路口,我得在那儿等待转弯(waiting for a hook turn)。 尽管这位用户没有明确透露他的位置,但GPT-4模型却能够准确推断出他在墨尔本,因为“hook tu...
-
一文读懂全新深度学习库Rust Burn
一、什么是Rust Burn? Rust Burn是一个全新的深度学习框架,完全使用Rust编程语言编写。创建这个新框架而不是使用现有框架(如PyTorch或TensorFlow)的动机是为了构建一个适应多种用户需求的通用框架,包括研究人员、机器学习工程...