10 月17 日的百度世界大会即将开始了,我还是挺期待今年的百度世界大会的,得益于百度在AI赛道的积累,李彦宏将在现场做主题为「手把手教你做AI原生应用」演讲,现场将会展示文心大模型的理解、⽣成、逻辑和记忆四项核心能⼒在生活中的高频应用。
为了验证百度大模型的能力,我最近也在尝试接入文心一言,在这个过程中我发现文心一言插件功能极其强大,能够提供一些标准版文心一言没有的功能:
比如这个网页解析功能就很实用,相信读者们最近在网上也看到了类似的网页内容总结插件,提供高效的知识整理,那么这种插件其实我们利用文心一言的网页解析插件就可以实现。
这些插件都是申请即可以使用,如果觉得插件内容不够自定义的话,我们也可以通过自定义插件的方式来提供一些专属于我们自己内容的独家功能。
最近我就在摸索着利用文心一言的插件编排能力为我自己的知识输出内容提供自然语言提问的能力,折腾了几天之后的最终效果我还是非常满意的,今天这篇文章会给出具体的教程步骤,先来带大家看一下具体的效果:
比如我对标准版文心一言进行一个提问:Spring Security 的启动流程是怎样的?它给我的结果是这样的:
虽然能看,但是不够细致,基本上和官网的总结翻译差不多,但是如果我使用了自定义插件的文心一言,它给的结果就是这样的:
由于整个屏幕无法完全展示它的所有输出,所以我只截图了大部分输出内容,但是仍可以看到它提供了更细致的回答,这一切都要得益于我在插件知识库中加入了我自己所写的关于 Spring Security 启动流程的文章。
这特别适用于有大量知识输出的公众号主们,通过这个功能可以读者可以直接通过自然语言提问来获得文章内容的总结,接下来我就详细列出所有步骤以供大家参考~
1. 创建应用
进入百度智能云千帆大模型官网,点击屏幕中间的立即使用,就可以进入到百度智能云千帆大模型控制台:
然后在左侧的导航栏中,点击应用接入,再点击创建应用 :
输入你要起的应用名字和相应的应用描述,其他默认,然后就可以创建出一个应用了,我这里已经创建了一个叫做:芋艿智能助手的应用。
2. 创建知识库
创建完应用之后,我们先不着急创建插件,先创建一个私有知识库,这个知识库中会存放我们自定义的内容,比如自己的文章内容、或者一些参考文档等。
在左侧导航栏中点击知识库,并点击创建知识库,就来到了创建知识库页面:
输入知识库名称和描述,然后选择我们刚刚创建好的应用,点击下一步:
然后就可以在这个页面上传文件了,导入方式一共有三种:本地上传、BOS(百度智能云的OSS)和分享链接(通过这个链接下载对应文件)。
由于我导入的文章数据都在本地,所以我都是使用本地上传,大家可以通过自己的情况选择对应的导入格式。
有一点需要注意的是:知识库导入对格式有要求,目前只支持上图中的那几种格式,如果你导入的是压缩包的话,它会自动扫描那几种格式的文件,如果没有的话也会解析失败。
对于大部分公众号主来说,写的文章原始稿件一般都是md格式的,你可以批量把md格式的文件后缀改为 txt,这样它也可以成功上传并解析。
为了演示方便,这里我就上传一些我自己的文章内容,然后点击下一步:
这里的清洗配置目前只有自动分段可选,同时还会显示一个训练费用,可能是我上传文件过少的缘故,目前还没有进行任何扣费,所以初期一般不必担心扣费。
接下来我们直接点击确定即可,然后就可以在我们的知识库列表里面看到导入的文件了:
它会自动对你上传的内容进行分段、建立索引等操作,之后你在提问的时候就有可能命中到其中的内容。
3. 自定义插件编排
知识库文件设置完毕后,接下来就可以进行自定义插件设置了。
自定义插件同样是在左边导航栏选择插件编排,然后点击配置插件应用服务:
选择对应的场景和插件名称之后,我们创建即可,由于我们是一个对话场景的应用,所以选择对话场景即可:
创建完插件之后,我们需要对插件进行配置,点击配置,就可以跳转到一个如下页面:
在这个页面可以对插件配置自定义的开场白,也可以配置一些 Prompt 模版,但是我们今天的重点不是这两个,而是知识库功能:
在插件中关联一个自定义知识库,在问答输出过程中文心一言就会参考我们自定义知识库的内容,这样如果你问的内容正好是知识库中有的内容,则可以给出更具有自定义偏向的回答。
我们点击关联知识库,然后选择我们刚刚创建好的文章知识库即可:
接下来对此插件点击右上角的发布,插件功能就被集成到我们创建的应用中了~
接着可以点击插件列表中的体验,然后就可以在一个体验页面进行体验了:
然后我尝试提问一个和我导入的知识库内容相关的问题:
可以看到在体验功能下,它的回答会明确告诉你使用了知识库进行作答,而不是通过百度搜索所得出的答案。
这样我们自定义的这个文心一言就可以输出一些符合我们预想的回答了,这对于拥有大量知识输出的文章作者来说效果非常不错。
4. 应用接入
完成以上步骤后,我们的芋艿智能助手就可以进行外部接入了,目前百度一共提供了两种接入方式:Http请求接入和SDK接入(Python3.7以上),百度智能云还提供了在线测试系统,可以直接在线上调试API:
有了这个在线测试系统可以很方便的看到对应API的回复结果,这样接入起来就会大大省力了~
当你接入完常用的接口之后,如果是公众号主的话我建议你可以直接接入到公众号回复中去,只需要在公众号设置中打开服务器配置,用户发往公众号的消息就会被转发到你配置的Http服务中去:
我们利用这个特性就可以将用户发往公众号的消息发往我们自己部署的文心一言服务,然后将文心一言的回复转发给用户。
这样公众号主的粉丝们就可以直接通过公众号对号主的文章内容进行自然语言提问了~
5. 结语
领教完百度大模型的插件系统后,我感觉百度世界大会这次真的有点东西,或许真的可以实现李彦宏所说的 AI 原生应用,即:大模型提供能力,开发者只需要提供创作能力调用大模型的能力。
所以对于本次百度世界大会我还是比较期待的,更加期待百度世界大会之后有更多AI原生应用涌现~