-
DeepSeek 发布全新开源大模型,数学推理能力超越 LLaMA-2
自从 LLaMA 被提出以来,开源大型语言模型(LLM)的快速发展就引起了广泛研究关注,随后的一些研究就主要集中于训练固定大小和高质量的模型,但这往往忽略了对 LLM 缩放规律的深入探索。 开源 LLM 的缩放研究可以促使 LLM 提高性能和拓展应用领域...
-
AIGC介绍篇
AIGC介绍篇 AIGC 最近横空出世,对社会产生了多冲击。AIGC 发展到现在,其实也就是最近几个月被 ChatGPT (22年11月推出的)带火的,ChatGPT 你可以理解为是所有 AIGC 的一个大脑,其他各种各样的 model 都是四肢,由 C...
-
剧透GPT-5,物色芯片厂,2024年的Sam Altman已经火力全开,只因不敢停下来
尽管如今的AI圈花样层出、新闻满天,但OpenAI的新动向仍然一直是人们最关注的话题之一。 最近, OpenAI首席执行官 Sam Altman就在参加达沃斯论坛时高调表示,公司目前的首要任务就是推出下一代大型语言模型,可能被称为GPT-5。 他还剧透了一...
-
GPT-4击败华尔街?最新研究:选股回报超40%
如果把选股这事交给GPT-4来处理,会是怎样一种结果? 一项对美国标普100指数(S&P 100)展开的研究给出了答案: GPT-4表现比基准指数高出13%,回报率高达40%,同时保持了与市场相当的风险状况。 这个在GPT-4基础上打造的选股A...
-
无需训练实现价值观实时动态对齐:上交开源价值观对齐方法OPO,闭源与开源大模型均适用
随着人工智能技术的发展,以 GPT-4 为代表的大语言模型依靠其强大的能力正在对社会产生深远的影响。与此同时,大模型本身的安全性问题也变得尤为重要。如何确保大语言模型可以和人类的价值、真实的意图相一致,防止模型被滥用、输出有害的信息,这是大模型安全治理的...
-
傅盛发布猎户星空大模型Orion-14B 拥有140亿参数规模
1月21日,猎户星空在傅盛2024开年 AI 大课暨猎户星空大模型发布会上发布了猎户星空大模型(Orion-14B)。这是一款由猎户星空研发的预训练多语言大语言模型,拥有140亿参数规模,覆盖了常见语言和专业术语,并在多个第三方测试集上取得了同级别模型的最...
-
可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。 谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要...
-
法唠AI体验入口 AI法律人工智能聊天助手在线使用地址
法唠AI是一种结合了人工智能和法律领域的技术,也称为法律人工智能。它利用大语言模型预训练的机器人对法律知识和案例进行深度学习和分析,以提供法律咨询、法律文书撰写、法律案例研究等服务。法唠AI的出现,对律师行业的专业提供方式及案例判例研究方面产生了深远的影响...
-
世界顶尖多模态大模型开源!又是零一万物,又是李开复
领跑中英文两大权威榜单,李开复零一万物交出多模态大模型答卷! 距离其首款开源大模型Yi-34B和Yi-6B的发布,仅间隔不到三个月的时间。 模型名为Yi Vision Language(Yi-VL),现已正式面向全球开源。 同属Yi系列,同样具有两个版本...
-
Midjourney V6刷屏,但它最可怕的地方居然不是那些神图?
Midjourney在沉寂九个月后推出了Midjourney V6,这个文生图产品体现出的更细腻的细节处理,更强大的语言理解能力和更加“不像AI”的图片效果在过去几天引发一片惊呼。 作为一个闭源的模型产品,Midjourney的魔法配方并不为人所知,但就...
-
AIGC重塑基础设施,高密数据中心为何众望所归?
凯文·凯利在《必然》中认为,科技在本质上有所偏好,使得它朝往某种特定方向。 毫无疑问,进入到数字经济时代,人工智能技术飞速发展与加速应用之际,这个特定方向逐渐明朗:即算力科技,算力已经成为新一轮科技和产业革命的核心生产力,发展先进的数据中心基础设施是数字...
-
一周 AIGC 丨苹果下架多款 AIGC 应用,阿里云开源通义千问 70 亿参数模型
多个 AIGC 应用在苹果应用商店下架,包含数据采集和使用不够规范等问题。阿里云开源通义千问 70 亿参数模型,包括通用模型 Qwen-7 B 和对话模型 Qwen-7 B-Chat。腾讯混元大模型开始应用内测,内部多个业务线接入测试。百度智能...
-
AIGC的初识
🌞欢迎来到自然语言处理的世界 🌈博客主页:卿云阁 💌欢迎关注🎉点赞👍收藏⭐️留言📝 🌟本文由卿云阁原创! 📆首发时间:🌹2023年12月26日🌹 ✉️希望可以和大家一起完成进阶之路! 🙏作者水平很有限,如果发现错误,请留言轰炸哦!万分...
-
针对特定领域较小的语言模型是否与较大的模型同样有效?
经过2023年的发展,大语言模型展示出了非常大的潜力,训练越来越大的模型成为有效性评估的一个关键指标,论文《A Comparative Analysis of Fine-Tuned LLMs and Few-Shot Learning of LLMs f...
-
企业如何安全地找到实用的GenAI用例
AI,特别是GenAI和大型语言模型,已经在技术上取得了巨大的进步,并正在到达行业广泛采用的拐点。麦肯锡的报告称,AI领域的佼佼者已经在“全力以赴”,企业知道,他们必须接受最新的AI技术,否则就会被甩在后面。 然而,AI安全领域仍然不成熟,这给使用该技...
-
AIGC 大模型纷纷部署,企业如何为 AI 数据降本增效
编辑 | 宋慧 出品 | CSDN 云计算 AIGC 从年初开始持续爆火,国内各种大模型纷纷涌现,其中模型参数轻松突破千亿数量级。模型中数据的形态、部署也是多种多样的,庞大数据量背后的管理和成本不容小觑。 混合数据厂商肯睿 Cloudera...
-
OpenAI拟将ChatGPT军用?与五角大楼合作军事禁令解除,谷歌前CEO:AI会变成核弹
AI武器化? 自大语言模型诞生以来,人们对其可能带来的影响的讨论就没停过。不过,更多人还是从普通人的视角出发,从LLM能对人们的日常工作生活带来哪些变化来思考的问题。 然而从稍微宏观一点的视角,我们就会发现LLM以及AI可能对整个社会甚至国家带来一些改变...
-
Agent触摸汉堡辨冷热,首次拥有类人感官!UCLA等发布3D多模态交互具身智能大模型
具身智能,是大模型未来应用的一个重要方向。 现在,大模型加持下的智能体,能够参与3D环境,不仅有了听觉视觉,还有了触觉等多种感官能力。 卧室里有什么物体,一眼辨认。 听到门铃响了,LLM便会告诉你家里来客人了。 大模型加持的NPC,在触摸桌子的香蕉后,...
-
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊
AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。 1月9号他们发布了一篇论文,提出关于“Sleeper Agen...
-
Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
Stable Diffusion要王者归来了? Stability AI CEO Emad Mostaque最新推文,四段视频引人无数遐想。 不少网友怀疑,这是Stable Video Diffusion新版本的演示Demo。 因为从效果上看,不管是...
-
一文了解AIGC与ChatGPT
关注微信公众号掌握更多技术动态 --------------------------------------------------------------- 一、AIGC简介 1.AIGC基础 (1 AIGC是什么 AIGC是人...
-
【AIGC】如何让AI一键生成PPT
这估计是职场人最关心的事儿了,当然,最好是免费的! 当然,我不认为PPT是个很好的效率工具,字节就不主张做PPT,能用一句话说清楚的事,绝对不要忽悠成一段话。但是,这并不影响PPT作为一个好的沟通工具,而且,这个PPT,代表了你或者你们公司的综合水平,对...
-
【创作活动】ChatGPT 和文心一言哪个更好用?
文章目录 文心一言 优点 缺点 ChatGPT 优点 缺点 Java编码能力比较 对人工智能的看法 ChatGPT是由OpenAI开发的交互式AI大模型, 文心一言是由百度研发的知识增强大语言模型,本文从Java开发...
-
AIGC内容分享(四十一):国内AIGC独角兽冲出几家?
目录 2023年新晋AI独角兽 智谱AI:清华计算机系KEG科研成果 百川智能:原搜狗CEO王小川创业项目 零一万物:李开复筹建的新项目 Minimax:前商汤副总裁创业项目 结尾: 2023年新晋AI独角兽 根据IT桔子数据,截...
-
AI搜索Perplexity来了,谷歌搜索真正有了对手
要说在互联网世界中什么才是“王冠顶上的明珠”,或许就非搜索引擎莫属了,毕竟在太平洋两岸也分别造就了百度和谷歌这两大巨头的基业长青。如此美妙的生意自然从来都不缺乏挑战者,国内市场有360、搜狗,海外也有Bing、雅虎,以及DuckDuckGo。而随着AI大模...
-
大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4
大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。 最近,来自 Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新的震撼。 在新方法中,作者...
-
快速上手的 AI 工具-文心一言
简介 最近正打得火热的AIGC概念,相信大家肯定也都多少接触到了,那么AIGC概念股到底是什么呢?我个人最近也看了一些平台如:文心一言、通义千问、讯飞星火、豆包等等!各位朋友也千万不要错过啦,真是各有各的特长!今天咱们主要说一下百度文心一...
-
Bard!谷歌对 ChatGPT 的最强反击,悄咪咪的支持中文了!
“ ChatGPT、Bard,哪个是更好的AI人工智能大语言模型。” 01 — ChatGPT 这么火,而且这款产品是 OpenAI 以谷歌的大模型架构 transformer 为基础迭代的。谷歌自然不甘落后,早在3月份推出自家的人...
-
ChatGPT与文心一言的差距不仅亿点点
文心一言不如ChatGPT对同一问题(矩阵论)的求解 下图为文心一言的回答 下图为ChatGPT3.5的回答 通过比较可以发现,ChatGPT给你的答案更加条理清晰,并且给出的理由很充分,结果也是正确的,然后文心一言,首先,结果是错误的,而且...
-
AIGC在天猫商品海报生成上的探索
灵感艺术家项目,旨在通过AIGC绘图能力,联合商家打造低门槛+高趣味性的宣传海报设计大赛,本文分享我们的方案和优化方向。建议对AIGC感兴趣的工程、算法方向的同学阅读。 项目背景 灵感艺术家项目,旨在通过AIGC绘图能力,联...
-
AI对决:文心一言 VS ChatGPT 全方面比拼
目录 背景 对比环节 文章生成 GhatGPT: 文心一言: 故事编写 ChatGPT: 文心一言: 代码生成 ChatGPT: 文心一言: 技术教学 ChatGPT: 文心一言: 评价环节 背景 ...
-
【AI语言大模型】文心一言功能使用介绍
一、前言 文心一言是一个知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。 最近收到百度旗下产品【文心一言】的产品,抱着试一试的心态体验了一下,整体感觉:...
-
AI游戏设计的半年度复盘;大模型+智能音箱再起波澜;昇思大模型技术公开课第2期;出海注册经验分享;如何使用LoRA微调Llama 2 | ShowMeAI日报
👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 🔥 进步or毁灭:Nature 调研显示 1600+ 科学家对AI的割裂态度 国际顶级期刊 Nature 最近一项调研很有意思,全球 1600 多名科...
-
世纪华通脑科学研究成果持续落地 数药智能孤独症训练好帮手《AI星河》问世
继本月数药智能自主研发的专数达®《注意力强化训练软件》成功启动商业化进程之后,另一款孤独症康复训练软件《AI星河》也正式问世,进一步扩展了公司的产品线,以满足不断增长的市场需求和客户期望。 孤独症康复训练软件《AI星河》情景模拟对话之餐厅 孤独症康复训...
-
四种通过LLM进行文本知识图谱的构建方法对比介绍
我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。但是对于知识图谱的创建是一个很复杂的过程,比如需要对属性增加限制,创建符合特定主题/模式的图谱,并且有时文档非常大,无法作为单个提示处理,所以在切分后的提示中创建的图谱需要前后一致。...
-
2023-12-30 AIGC-LangChain介绍
摘要: 2023-12-30 AIGC-LangChain介绍 LangChain介绍 1. https://youtu.be/Ix9WIZpArm0?t=353 2. https://www.freecodecamp.org/news/la...
-
AI成达沃斯论坛讨论热点 各行各业更关注结果准确性
1月19日消息,在瑞士达沃斯举办的世界经济论坛2024年年会上,Salesforce、微软和谷歌等全球最大科技公司纷纷展示自家在人工智能方面技术实力,生成式人工智能也已经成为今年会议讨论的焦点。 英特尔首席执行官帕特·盖尔辛格(Pat Gelsinge...
-
Data-Copilot: 大语言模型做你最贴心省事的数据助手
Data-Copilot: Bridging Billions of Data and Humans with Autonomous Workflow 无需繁琐操作,只需要输入一句话, Data-Copilot自动帮你完成查数据,分析数据,管理数据,预测趋...
-
免费商用 Meta 发布开源大语言模型 Llama 2
Meta 和微软深度合作,正式推出下一代开源大语言模型 Llama 2,并宣布免费提供给研究和商业使用。 Llama 2 论文地址:Llama 2: Open Foundation and Fine-Tuned Chat Models 据介...
-
AIGC学习笔记(1)——AI大模型提示词工程师
文章目录 AI大模型提示词工程师 1 Prompt工程之原理 1.1 AIGC的发展和产业前景 前言 AIGC时代的到来 发展趋势和应用展望 1.2 大模型的类型和特点 大模型的对比 上手 特点 1.3 大模型技术原理和发展 成语...
-
字节跳动基础架构SRE-Copilot获得2023 CCF国际AIOps挑战赛冠军
近日,2023 CCF国际AIOps挑战赛决赛暨“大模型时代的AIOps”研讨会在北京成功举办,活动吸引了来自互联网、运营商、科研院所、高校、软硬件厂商等领域多名专家学者参与,为智能运维的前沿学术研究、落地生产实践打开了新思路。决赛中,从初赛两百多支...
-
防火墙再“进化”,更智能是否更安全?
当黑客进行网络攻击时,首先会扫描系统对外开放的端口,例如公司公网 IP中用于SSH服务的22 端口,然后尝试爆破登录,以获取服务器的控制权。如果企业部署了防火墙防火墙,就可以屏蔽掉开放的 22 端口,并能拦截爆破的请求。 防火墙作为面向外部入侵的第一道防...
-
马毅LeCun谢赛宁曝出多模态LLM重大缺陷!开创性研究显著增强视觉理解能力
Sam Altman在各种场合都提到,大语言模型的多模态能力,是未来AI技术能够造福人类的最亟待突破的领域。 那么现在在多模态大模型的视觉功能能否达到与语言功能匹配的水平? 当前多模态模型取得的进步很大程度上归功于大语言模型(LLM)的推理能力。但在视...
-
最强AI手机选天玑!联发科天玑9300拿下终端、芯片双AI榜一
快科技1月18日消息,AI Benchmark发布了终端AI性能排行榜和芯片AI性能排行榜。 其中联发科天玑9300拿下终端、芯片双榜一,堪称最强AI手机芯片。 根据榜单,前三名OPPO Find X7、vivo X100 Pro、vivo X100都是天...
-
新一代注意力机制Lightning Attention-2:无限序列长度、恒定算力开销、更高建模精度
大语言模型序列长度的限制,极大地制约了其在人工智能领域的应用,比如多轮对话、长文本理解、多模态数据的处理与生成等。造成这一限制的根本原因在于当前大语言模型均采用的 Transformer 架构有着相对于序列长度的二次计算复杂度。这意味着随着序列长度的增加...
-
AIGC大模型必备知识——LLM ,你知道它是如何训练的吗?小白必读深度好文
Look!👀我们的大模型商业化落地产品 📖更多AI资讯请👉🏾关注 Free三天集训营助教在线为您火热答疑👩🏼🏫 近年来,人工智能(AI)领域经历了令人瞩目的增长,尤其是自然语言处理(NLP)。你知道是什么推动了NLP领域的这种飞速发展吗?没错,那...
-
基于大语言模型赋能智体的建模和仿真:综述和展望
本文经自动驾驶之心公众号授权转载,转载请联系出处。 23年12月论文“Large Language Models Empowered Agent-based Modeling and Simulation: A Survey and Perspecti...
-
能做鬼脸、摇滚、自拍,听懂你说的话!GPT-4驱动的实体机器人
东京大学的研究人员将GPT-4模型,集成在实体机器人Alter3中,可将文本、语言直接转化成机器人动作,例如,做一个自拍动作;装一个“鬼样”;做一个摇滚音乐动作等,就连微笑、眨眼这样的面部表情动作也没问题。 在GPT-4的帮助下,Alter3建立了语言反馈...
-
一文读懂大型语言模型参数高效微调:Prefix Tuning与LLaMA-Adapter
芝士AI吃鱼 在快速发展的人工智能领域中,高效、有效地使用大型语言模型变得日益重要,参数高效微调是这一追求的前沿技术,它允许研究人员和实践者在最小化计算和资源占用的同时,重复使用预训练模型。这还使我们能够在更广泛的硬件范围内训练...
-
得帆信息创始人-张桐,受邀出席 BV百度风投AIGC主题论坛
近日,得帆信息创始人兼CEO张桐,作为百度风投被投代表企业创始人受邀出席“向未来,共成长” BV百度风投AIGC主题论坛。 与包括上海市徐汇区相关部门领导、百度集团相关事业部负责人及代表,以及来自国寿资本、中网投、麦顿投资的投资人、BV百度风投其...