-
AI大模型排排坐——通义千问、文心一言、讯飞大模型使用体验
目前,通义千问、文心一言和讯飞大模型是较为受欢迎的AI模型,它们在使用方面各有区别和优劣势。以下是笔者近期使用三个模型的一点浅见: 一、通义千问 优势: 丰富的知识库:通义千问拥有庞大的知识库,能够为用户提供广泛的信息支持。 高效的检索能力:...
-
RAFT:引领 Llama 在 RAG 中发展
每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同...
-
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
把AlphaGo的核心算法用在大模型上,“高考”成绩直接提升了20多分。 在MATH数据集上,甚至让7B模型得分超过了GPT-4。 一项来自阿里的新研究引发关注: 研究人员用蒙特卡洛树搜索(MCTS)给大语言模型来了把性能增强,无需人工标注解题步骤,也能...
-
新型文生视频AI——Gatekeep 可将数学物理问题转换为视频内容
随着人工智能技术的不断发展,其在教育领域的应用也日益广泛。最近,一款名为Gatekeep的新型文本转视频AI引起了人们的关注。这款AI的独特之处在于,它专注于将数学和物理问题通过文本提示转化为视频内容,帮助学习者更直观地理解和掌握知识。 体验地址:htt...
-
迅易可下单Copilot for M365,助您「整顿」低效数字职场!
当多数打工人还把“今天搬砖不狠,明天地位不稳”挂在嘴边时,一种颠覆人类办公的“智能辅助”早已走进大家的视线。 近日,微软正式发布面向普通消费者和小企业开放的人工智能助手Copilot高级订阅新服务Copilot Pro,消息一出,炸翻整个技术圈。早在去年...
-
AIGC智能编程:编程革新还是就业陷阱?
AIGC智能编程:程序员的失业陷阱? 引言 随着人工智能的迅猛发展,智能编程技术也越来越受到关注。AIGC智能编程是一种利用人工智能技术自动生成代码的方法,它能够极大地提高编程效率和质量。然而,这种技术的兴起也引发了人们对程序员就业前景的忧虑。本文...
-
RAG高阶技巧-如何实现窗口上下文检索
在本文中,我们将介绍一种提高RAG(Retrieval-Augmented Generation)模型检索效果的高阶技巧,即窗口上下文检索。我们将首先回顾一下基础RAG的检索流程和存在的问题,然后介绍窗口上下文检索的原理和实现方法,最后通过一个实例展...
-
消灭「幻觉」!谷歌全新ASPIRE方法让LLM给自己打分,效果碾压10x体量模型
大模型的「幻觉」问题马上要有解了? 威斯康星麦迪逊大学和谷歌的研究人员最近开发了一个名为ASPIRE的系统,可以让大模型对自己的输出给出评分。 如果用户看到模型的生成的结果评分不高,就能意识到这个回复可能是幻觉。 如果系统可以进一步筛选评分的结果进行输...
-
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。 谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要...
-
小红书搜索团队提出全新框架:验证负样本对大模型蒸馏的价值
大语言模型(LLMs)在各种推理任务上表现优异,但其黑盒属性和庞大参数量阻碍了它在实践中的广泛应用。特别是在处理复杂的数学问题时,LLMs 有时会产生错误的推理链。传统研究方法仅从正样本中迁移知识,而忽略了那些带有错误答案的合成数据。 在 AAAI 2...
-
AI平台:工作台 - 造作AI
工作台 - 造作AIWe're sorry but AI-Robot doesn't work properly without JavaScript enabled. Please enable it to continue.造作AI助手更智能的创作工具...
-
【网安AIGC专题10.19】论文4:大模型(CODEX 、CodeGen 、INCODER )+自动生成代码评估:改进自动化测试方法、创建测试输入生成器、探索新的评估数据集扩充方法
Is Your Code Generated by ChatGPT Really Correct? 写在最前面 主要贡献 这篇论文的创新点,为之后的论文提供了一些的启发 未来研究的方向:改进自动化测试方法、创建测试输入生成器、探索新的评估数...
-
微软提出变色龙框架,让模型自带工具箱开挂,数学推理任务准确率98%
教大模型调用工具,已经是AI圈关注度最高的话题之一了。 这不,又有一项研究登上最新NeurIPS 2023—— 它是一个叫做Chameleon(变色龙)的框架,号称能将大语言模型直接变成魔法师的工具箱,来自微软与加州大学洛杉矶分校(UCLA)。 相比其它...
-
表格数学推理准确率达98.78%!UCLA推出全新「变色龙推理框架」
在自然语言处理任务中取得显著成就的大型语言模型(LLMs)尽管表现出色,但在实时信息获取、外部工具利用和精确数学推理方面仍显不足。 为了应对这些挑战,来自UCLA等机构的研究人员打造了全新的Chameleon框架,其独特的即插即用模型融合了多种工具,包括...
-
Google发布AI编程助手AlphaCode2,基于Gemini系统
谷歌日前发布了AlphaCode2,这是一款由Gemini模型驱动的AI编程工具,是对前代AlphaCode的改进版本。与Gemini模型同时亮相,AlphaCode2在编程竞赛中表现出色,尤其在动态规划等复杂问题上具备更强大的能力。 研究人员通过在Co...
-
一文搞懂 AI Agents 的不同类型
Hello folks,我是 Luga,今天我们继续来聊一下人工智能(AI)生态领域相关的技术 - AI Agents(AI 代理) ,本文将聚焦在针对不同类型的 AI Agents 技术进行解析,使得大家能够了解不同 AI Agents 实现机制以及所...
-
参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了
如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力,可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布中实现均衡的性能,因此更倾向于通用模型。 不过如果想要在某一领域(如医学、金融或科学)内最大限...