对话数据第2页 - AIGC资讯

大模型入门（一）—— LLaMa/Alpaca/Vicuna

LLaMa模型是Meta开源的大模型，模型参数从7B到65B不等，LLaMa-7B在大多数基准测试上超过了GPT3-173B，而LLaMa-65B和Chinchilla-70B、PaLM-540B相比也极具竞争力。相比于ChatGPT或者GPT4来说，LL...

大数据 2023-12-02 人工智能

834阅读

OpenAI在中国申请“GPT-6”“GPT-7”商标此前表示GPT5已在训练中

天眼查App显示，近日，欧爱运营有限责任公司（OPENAI OPCO， LLC）申请多枚“GPT-6”“GPT-7”商标，国际分类为科学仪器、网站服务，当前商标状态均为等待实质审查。此前，OpenAI CEO Sam Altman透露，OpenAI正在...

人工智能 2023-12-01 人工智能

765阅读

【LLM系列之LLaMA2】LLaMA 2技术细节详细介绍！

Llama 2 发布！ Meta 刚刚发布了 LLaMa 2，它是 LLaMA 的下一代版本，具有商业友好的许可证。?? LLaMA 2 有 3 种不同的尺寸：7B、13B 和 70B。 7B & 13B 使用与 LLaMA 1 相同的架构，并且是...

大数据 2023-11-29 人工智能

1493阅读

提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

【新智元导读】最近，来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA，使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能，并在图片、视频的13个基准上达到先进的性能。这个结果表明，统一L...

AIGC 2023-11-23 人工智能

901阅读

中科大联合封神榜团队发布中文医疗领域大模型ChiMed-GPT

中科大和 IDEA 研究院封神榜团队合作开发了一款名为 ChiMed-GPT 的中文医疗领域大语言模型（LLM）。该模型基于封神榜团队的 Ziya2-13B 模型构建，拥有130亿个参数，并通过全方位的预训练、监督微调和人类反馈强化学习来满足医疗文本处理的...

生成式AI 2023-11-20 人工智能

882阅读

AI重塑媒体行业，凤凰卫视重磅入场AI数据赛道

媒体人在2023年或多或少都有点“失业”焦虑——媒体人被认为是最可能被ChatGPT取代的高危职业之一。面对人工智能的冲击，部分媒体选择以防御之态应对，保护自己的内容不受大语言模型的“侵略”。根据《卫报》的报道，CNN、纽约时报和路透社等多个媒体巨头在...

生成式AI 2023-11-17 人工智能

888阅读

【大模型系列 06】LLaMA-7B/13B for PyTorch 昇腾迁移

源码链接 https://gitee.com/ascend/ModelZoo-PyTorch/tree/master/PyTorch/built-in/foundation/LLaMA-13B LLaMA-7B/13B for PyTorch...

AIGC 2023-11-16 人工智能

1001阅读

已经有团队开始用 AI 训练人了……

今天早起看到星球的一个提问，一时兴起评论了1000字…… 场景非常新奇:配置 AI 机器人，来训练人类。图源备注：图片由AI生成，图片授权服务商Midjourney 下面是原问题: 请教各位大大一个问题? 公司希望用AI来模拟真实用户，来与我们的销售对...

生成式AI 2023-11-16 人工智能

1009阅读

OPPO明日将发千亿参数安第斯大模型：对话能力获提升

快科技11月15日消息，据媒体报道，OPPO将于明日发布个人专属、对话增强的安第斯大模型（AndesGPT），这是基于千亿参数的对话增强语言模型。 OPPO明日将会在上海世博中心举行OPPO开发者大会，正式发布ColorOS 14，与之同台登场的还有And...

生成式AI 2023-11-16 人工智能

773阅读

中国AIGC数据标注全景报告：百亿市场规模，百万就业缺口

数据标注，正迎来关键洗牌时刻。大模型时代到来，以数据为中心的AI开发模式加速走向台前，数据的价值从未向今天这样被充分挖掘—— 大模型从训练到部署应用迭代，AIGC众多垂直场景落地，通用智能、具身智能等前沿领域探索，都与高质量、专业化的场景数据密不可分。...

生成式AI 2023-11-14 人工智能

854阅读

OpenAI创始人透露 GPT5已在训练中

在最新一期的FT采访中，OpenAI CEO Sam Altman透露了公司的多项规划，展望未来。首先，公司与微软的合作进展顺利，预计将从科技巨头和其他投资者处筹集更多资金，以解决构建更复杂AI模型的高昂成本问题。这与早些时候微软向OpenAI投资100亿...

人工智能 2023-11-14 人工智能

755阅读

【AIGC】BaiChuan7B开源大模型介绍、部署以及创建接口服务

模型介绍 baichuan-7B是由百川智能开发的一个开源的大规模预训练模型。基于Transformer结构，在大约1.2万亿tokens上训练的70亿参数模型，支持中英双语，上下文窗口长度为4096。在标准的中文和英文权威benchmark（C-EV...

人工智能 2023-11-12 人工智能

1026阅读

使用LoRA对大语言模型LLaMA做Fine-tune

使用LoRA对大语言模型LLaMA做Fine-tune 前言下载配置环境模型的训练 Fine-tune 模型的使用 Inference 参考问题汇总前言目前有大量对LLM（大语言模型）做Fine-tune的方式，不...

AIGC 2023-11-11 人工智能

1167阅读

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用

开启想象翅膀：轻松实现文本生成模型的创作应用，支持LLaMA、ChatGLM、UDA、GPT2、Seq2Seq、BART、T5、SongNet等模型，开箱即用 TextGen: Implementation of Text Generation...

生成式AI 2023-11-09 人工智能

853阅读

阿里云发布通义星尘、通义灵码等产品推出大模型应用开发平台阿里云百炼

在昨日的2023云栖大会上，阿里云发布了多个重要的产品和技术。首先是通义大模型家族的更新。阿里云发布了千亿级参数规模的大模型通义千问2.0，综合性能超过了 GPT-3.5，正在追赶 GPT-4。此外，通义千问 APP 也在各大手机应用市场上线，用户可以直...

AIGC 2023-11-02 人工智能

913阅读

小模型如何比肩大模型，北理工发布明德大模型MindLLM，小模型潜力巨大

大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更...

AIGC 2023-10-28 人工智能

1068阅读