日本女优 小白必读:你可能需要的AI大模子常识手册
文 | 要道刷日本女优
从 ChatGPT 问世到 Deepseek 的出现,AI 给东谈主类带来的惊艳已无需多言,AI 大模子的发展速率远进步咱们遐想。「如何掀开脑洞让 AI 帮你作念 PPT?」、「如何写 prompt 指示词让 AI 显得更专科?」,咫尺市面上并不枯竭教你如何更好使用 AI 大模子的内容。
今天我想要和人人聊聊的是:除了这些人人皆知的,还需要知谈哪些 AI 大模子的常识?
01 中枢问题是…?
动作非 AI 范畴的东谈主,可能并不需要长远了解其技能旨趣和运作方式,但在刻下历害的技能波澜下,你总有一天会遭遇这么的问题:
如何充分哄骗 AI 大模子,
融入我方的居品蓄意,
更好野蛮用户需求?
在此之前,你可能传闻过一些名词,诸如微调、常识库、Token、插件、MCP 等,但知其名,不知其意。
此外,咫尺 AI 大模子也种类繁密,外洋的 OpenAI、Google Gemini、Anthropic Claude、Meta Llama、xAI Grok …以及国内的 Deepseek、阿里通义千问、月之暗面 Kimi、字节豆包、腾讯混元…
纵令乱花渐欲迷东谈主眼,但其实大体上中枢基本才气相似,分支专科范畴各有长处。
动作居品司理,有必要对这些才气有一些基本了解。别比及不得不拥抱 AI 的时候,你能猜想的只好一个输入框。
02 他们能作念什么?
接下来我将要要点先容 AI 的一些基本才气,不错匡助你更好地去定制和蓄意 AI,让 AI 与你的居品愈加契合。
但愿了解这些常识后你或然掀开想路,幸免千人一面教条化 AI 接入。
结构化输出,让 AI 学会「填表」
这个很好领略,即是让 AI 按照规矩的要道来语言,别「瞎逼逼」。
填表比语言更灵验率
咱们正常也时常会「填表」,标的即是让咱们按照规矩的要道来输入信息,这么的数据或然更好地网罗和处理。否则张三李四各说一个版块,你也搞不清亮要害的信息是否网罗到位了。
让大模子「填表」
对于大模子,你也不错条目 AI 用你规矩的要道来往答问题。
{
" 居品称呼 ": " 智能音箱 ",
" 型号 ": "X100",
" 价钱 ": "499",
" 库存 ": "200",
"image": " 图片地址 ",
"url": " 流通地址 "
}
这么作念的平正包括但不限于:
※ 秩序回答要道,一定经由幸免 Ta 放飞自我;
※ 便捷缔造工程师对数据进行二次包装或者处理;
※ 切换不同大模子时,能得回相对秩序长入的回答。
唐突举几个应用例子:
※ 让 AI 从用户差评中自动提真金不怕火「问题类型 - 严重经由 - 心扉评分」;
※ 把目田要道的会议纪要调遣成「议题 - 细腻东谈主 - 时刻节点」的表格;
※ 让大模子笔据需要,回复用户不同要道的音讯:文本、图片、视频、跳转流通等等…
小结
通过结构化输出,你不错进一步压榨 AI 大模子,让 Ta 和你想要蓄意的功能、想要野蛮的需求更高效地结伙起来,AI 不再只是偶尔嘴上跑火车的对话框了。
学会用用具,告别「光说不练假把式」
数百万年前,东谈主类运行学会制作和使用用具,用具的使用又反过来鼓吹了东谈主类的进化。
指雁为羹
试问,在不借助任何用具的情况下,你能不行白手作念好一桌大餐?
很难吧。
若是给你有余的用具,比方菜刀、铲子、锅碗瓢盆、微波炉、烤箱、榨汁机、一个不错查询食谱的电脑…是不是事情会 easy 好多?
同样的,一个只会对话和回答问题的 AI 皆是键盘侠,聊以自慰圮绝。但若是学会了使用用具,AI 实力将得到极大的栽培。
例如一个具体的场景,当你想要去成皆旅游时,可能会问 AI 大模子一些基础的攻略:
但若是让 Ta 学会调用旅游关系的用具,事情就会变得挑升义:
※ 查一查成皆最近的天气是否允洽旅游;
※ 帮你订好到成皆的机票;
※ 查询飞机降落的信息,实时提醒在那边取行李;
※ 帮你预约好接机的网约车;
※ 帮你预订好合适的货仓;
※ 帮你预定好每一天的行程、博物馆的门票、用餐的餐厅等等;
※ 你每到一个场地,皆按照你的意思为你素养;
……
纯粹来讲,你是不错造就 AI 怎样去使用你提供的用具的,基本的方法是:
※ 先告诉大模子 Ta 不错使用哪些用具,这些用具分裂是干什么的,怎样用;
※ 当你向 AI 提议一个需求时,Ta 会我方判断是奏凯回答照旧调用合适的用具来帮你完成任务;
※ AI 会按照用具的使用证实书,自动生成调用指示,向用具发出恳求;
※ 用具处理完恳求后,复返收尾,AI 再将收尾整理、优化并反应给你。
咫尺,用具调用常见的意见有两个:
单个用具调用(Function Calling)和用具包调用(MCP)。
Function Calling
大多主流大模子皆提供了 Function Calling 的才气,你不错提供好多个 Function 给大模子使用,每个 Function 终了不同的功能。
这就像用具箱里一个个不同用途的用具:螺丝刀、钳子、锤子、扳手、锯子…每个用具皆有不同用途。大模子会笔据对话需求,自行决定是否调用用具以及调用什么用具。
需要驻防的是,这些用具需要你亲手作念好,并写好证实书教大模子如何使用。天然大差不大,但每个大模子对 Function Calling 司法和尺度不尽相似,当你切换不同大模子时,可能需要针对性「私东谈主定制」一下。
MCP
比较 Function Calling,MCP 则更像是一个个打包好的、不同用途的用具箱,比方刚才提到的螺丝刀、钳子、锤子、扳手、锯子…就不错打包成一个「维修用具包」。
除此除外,咱们还不错把创口贴、纱布、棉花、剪刀、碘伏等打包成一个「医疗急救包」。
同样的,把指甲刀、锉刀、修眉刀、挖耳勺等聚首到一齐,又不错成为一个「日常照应包」。
没错,你不错把 MCP 看作念是一个尺度化的、不休不同范畴问题的「聚首用具包」,Ta 把某一范畴需要用到的功能皆打包在了一齐,况且用尺度化的公约来招引大模子。这么一来,不同的大模子皆或然长入地使用用具包里的每一个用具 .
MCP(Model Context Protocol,模子凹凸文公约)是由 Anthropic 公司推出的灵通尺度公约,咫尺这个技能尺度还在发展当中,愈加复杂的技能意见就不在这里赘述了,感意思的一又友不错搜索更多资讯进一步了解。
二者对比
多模态:给 AI 嘴巴、眼睛和耳朵
除了传统的文本对话和用具调用除外,当代 AI 大模子正缓缓具备强大的多模态才气。这意味着,AI 不仅能"说",还能"看"图像、听语音,以致处理视频内容,从而为居品带来更多维度的交互体验。
具体来说,多模态才气体咫尺以下方面:
※ 视觉识别与生成
能看图,也能绘制。AI 不错看懂图片,也不错笔据姿色自动生成相宜营风的图片素材。
※ 语音识别与合成
听东谈主话,说东谈主话。AI 能听懂用户说的话,也或然通过语音回复用户。
※ 视频内容理会
看视频,作念视频。AI 能看懂视频的内容,况且有我方的领略。与此同期,AI 也在缓缓具备生成视频的才气,仍在发展中。
通过多模态交互,你不错让 AI 大模子变得愈加"全能",不仅限于翰墨对话,而是通过视觉、听觉等多个感官渠谈与用户互动,为居品更动提供更多可能。
AI Agent
最近到处皆在讲的 AI Agent,即是把这些才气整合在一齐,通过感知、决议和使用用具,成为一个能自主想考并完成任务的智能助手。
小结
你不错把你居品的多样才气按需包装成「用具」或者「用具包」,AI 不啻会「说」,还能真实去「作念」。
此外,可按需接入多模态才气,赋予 AI「看」、「听」、「说」的才气。
这么一来,AI 同你居品的结伙度会愈加紧密,也不错更好地野蛮用户的需求。
PUA 大模子,教 Ta 作念事
大模子什么皆懂,但 Ta 不一定懂你。那怎样让大模子知你懂你、按照你想要的方式和谜底去回答用户呢?
请掌抓好两大「PUA」大法:模子微调(Fine-tuning) 和 检索增强生成(RAG)。
说东谈主话即是:喂饭 和 给辞典。
给 AI 喂饭:模子微调(Fine-tuning)
俗语说,熟读唐诗三百首,不会作诗也会吟。若是你对 AI 针对某些问题的回答不够舒坦,就不错用填鸭式教学的方式不停地给 Ta 例如子,让 Ta 缓缓酿成你想要的神气。
通过「喂饭」,不错把一个通用大模子出动为「医疗问答人人」,或者一个「中二少年」。需要驻防的是,天然这里叫「微调」,但 AI 的「饭量」很大,你需要提供有余多的数据,Ta 才气够有愈加平安可靠、相宜祈望的进展。
给 AI 辞典:检索增强生成(RAG)
在不借助互联网的情况下,若是你要搞懂「折冲樽俎」这个谚语的含义,你会怎样办?
查辞典是一个比较高效的主张。
同样的,若是想要 AI 专精一些冷门或专科性常识,比方客服回复话术或居品使用证实。
那就不错丢给 Ta 一个常识库文档,AI 会我方去检索文档内容,结伙文档的常识来往答用户问题。
值得一提的是,这里 AI 使用的不是咱们传统的「要害词搜索」,而是「语义检索」。
正常咱们搜索一个文档,「番茄」即是「番茄」,「西红柿」即是「西红柿」,你搜索「番茄」是找不到「西红柿」的。
而语义检索不错作念到搜索「番茄」也找到「西红柿」。这让 AI 对常识库的检索才气变得比东谈主更强大。
小结
你不错把一些居品特地的常识教给 AI,这么 AI 就不错酿成你期待的形势。
和 AI 对话,一场东谈主格分裂的变装上演
率先,人人皆知,AI 能对话。
除了在 Ta 们提供的聊天框内与他们对话,你还不错调用 API(灵通接口)才气,与 Ta 对话。
```
# 每一次音讯皆要带上之前说过的话,否则 AI 不知谈之前说了啥。
messages = [
{
"role": "system",
"name": " 唐墨客人 ",
"content": (
" 你是一位唐朝诗东谈主助手,或然笔据凹凸文上演不同的唐代诗东谈主。"
" 请确保通盘回答皆会通唐朝诗东谈主的文风。"
" 笔据用户条目,分裂模拟李白和杜甫的作风:"
" 李白应进展豪放奔放,而杜甫应进展千里稳密致。"
},
"role": "user",
"name": " 王工 ",
"content": " 李白,请你描画一下秋天的惬心。"
},
"role": "assistant",
"name": " 李白 ",
"content": (
" 秋风荒僻,落叶纷飞;云海飘渺中,激起我心中无穷情绪。"
},
"role": "user",
"name": " 用户 ",
"content": " 杜甫,请你点评李白的这段形容。"
},
"role": "assistant",
"name": " 杜甫 ",
"content": (
" 李白兄之词,虽豪放奔放,但略显浮薄;秋景虽好意思,情想更需千里稳密致。"
},
"role": "user",
"name": " 刘总 ",
"content": " 李商隐你来评价一下李白和杜甫。"
},
]
# 调用接口,把包括新对话的聊天纪录传往日
response = openai.ChatCompletion.create (
model="gpt-3.5-turbo",
messages=messages
)
# 收到回复,打印出来望望
print ( response.choices [ 0 ] .message [ 'content' ] )
```
看不懂不贫窭,也不需要太懂,我举个例子来逐个评释。
遐想甲乙丙三方公司通过邮件进行相似:
① role(变装)
变装即身份,有点肖似邮箱 @后的域名,你来自哪个公司一眼就看出来了。对于 AI 来说,主要有 3 种身份:
※ system(系统)
肖似于第三方监管机构,邮箱地址:xxx@system.com。主要细腻制定一些基本司法,教乙方作念事,让乙方在甲方眼前诚恳点,别放飞自我整幺蛾子。
※ user(用户)
高高在上、提议需求的甲方,邮箱地址:xxx@user.com。甲方说啥即是啥,有啥问题皆简陋提。甲方不错是一个东谈主,也不错是多个东谈主。
※ assistant(助手)
这里即是指 AI 大模子,发愤忘餐野蛮需求的乙方,邮箱地址:xxx@assistant.com。甲方说啥即是啥,乙方必须来者不拒。同样的,乙方也不错是一个「东谈主」或多个「东谈主」。
② name(名字)
有点肖似邮箱 @前边的账号名,你是甲方的谁谁谁或者乙方的谁谁谁就分得很清亮了:
※ 唐墨客人指挥 @system.com
※ 刘总 @user.com、王工 @user.com
※ AI 李白 @assistant.com
※ AI 杜甫 @assistant.com
※ AI 李商隐 @assistant.com
一般来说,咱们不会默许使用 name,因为 role 的三种变装仍是有余了。但若是你构想的居品需要有多用户和多变装的时候(比方东谈主机混战脚本杀),那么 name 就能派上用场。
③ content(内容)
顾名想义,写邮件的时候确定会包含邮件正文,甲乙丙三方皆通过邮件正文传递信息。
④ forgetful(忘记)
三级每封邮件必须包含之前通盘的对话历史。
很灾难,这个邮箱对话系统极度简陋,每次只可看刻下收到的邮件内容,不归档之前说过什么,甲乙丙也皆是「金鱼脑」,什么皆不铭刻。
因此,为了让人人显著来龙和去脉,每一次发邮件的时候,皆需要带上之前通盘的对话。只好这么,AI 才气显著之前琢磨过哪些问题,进而作念出连贯、准确的回答。
但这么也带来两个硬伤:
※ AI 对话的挂牵有限,早晚会失忆;
※ 对话轮次越多,糟蹋的 token ( RMB? ) 也呈指数级增长。
小结
了解以上的信息之后,结伙不同的 system、user、assistant,慑服你仍是有了好多新的想法和创意。
更多小常识
动作甲方的你,除了不错和大模子对话,还不错提一些小条目。
我就纯粹说几个人人可能常用的:
stream:流式输出
不错放浪 AI 的回答是全部就绪了一次性发给你,照旧一个字一个字蹦给你。是的,咱们正常看大模子回答一直在打字,即是用的流式传输。由于大模子输出完满谜底的时刻咫尺还比较长,流式输出不错灵验减少用户的恭候惊悸。
frequency_penalty:重叠率
-2 到 2 的一个数字,减少重叠内容,幸免复读机。若是 frequency_penalty>0,AI 回答问题一朝出现已有文本中就会被扣工资。
temperature:温度
天然叫温度,但其实代表着 AI 的立时性、创造性。温度低,AI 就比较老到得当,对同样问题尽可能保持一致回答,反之想维则愈加发散、回答的立时性更多。还有一个参数叫 top_p,作用肖似就不赘述了,免得把你绕晕了。
小结
若是你还想知谈更多对于大模子的参数,你不错去稽查各个大模子官网的 API 文档,内部有愈加详备的证实。
03 AI 的幻觉
AI 幻觉,纯粹来说即是 AI「一册正经地瞎掰八谈」,Ta 有时候会给出看似逻辑领略、有鼻子有眼,但实质上不相宜事实、和你问题八竿子打不着的回答。
这是因为:
※ 瞎念书,读瞎书:
磨真金不怕火数据中包含了太多虚伪的、质料不高的信息,走火入魔、误入邪道了;
※ 想太多,太多想:
AI 会强行关联高频出现的词汇(比如:看到「加拿大」就想「多伦多」,但你的问题其实是加拿广泛门在那边);
※ 好顺眼,怕冷场:
咫尺的大模子更多被蓄意成"宁可死鸭子插嗫瞎编也不承认我方不知谈",遭遇拿不准的就会一册正经的瞎掰八谈。
是以,除非你是专门作念 AI 类的居品,否则最佳让 AI 成为你居品功能的「拓展」,而不是「替代」。
毕竟,AI 不是随时皆靠谱。
04 他们分裂擅长什么?
主流大模子就像武侠天下的各路妙手,有的内力深厚允洽硬刚代码,有的轻功杰出擅长处理万字长文,有的暗器精妙专攻多模态花活。结伙你的居品需求选对刀兵,才气让 AI 真实成为你的「六脉神剑」。
以下是国表里部分主流大模子的对比(表格较大,PC 稽查成果更佳):
以上的回来不一定准确,人人照旧以各大模子官网和巨擘测评为准。
05 写在终末
大模子不是全能药,它更像是居品更动的「催化剂」。领略才气界限,善用用具组合,才气让 AI 真实成为用户的「超等助手」。
一个比较个东谈主主不雅的想法:
咱们哄骗 AI 的中枢任务
是用 AI 放大用户价值
而非追赶技能炫技
很运道见证这个 AI 迅速发展的期间,也正因为如斯,AI 关系的技能日眉月异。这篇著述也只是先容了一些稍有拓展的基本意见。若是你对 AI 感意思,不妨在满足时多关心一些。
历史的车轮仍在上前,惊悸不按期待。
【钛媒体作家先容】
Hello,不错叫我 JJW,idol 是张小龙。
鹅厂高档居品锦鲤,搞不懂什么抓手也不太会赋能,但曾经一步步把细腻的业务从〇迭代到千万级 DAU。
先后履新于两款头部居品日本女优,心爱游戏,也心爱谋整齐些杂然无章看起来没啥用的东西。