😨大模型(LLM)前言
Author:zzm | Editor:S4kana
零、前言
大型语言模型,简称 “大模型”,已成为当今社会的一大热点。
经过几年的发展,各类大模型的应用引发了无数人的质疑与期待 ——
有人畅想未来,憧憬着机器替代人类劳动的美好世界;有人则感到担忧,害怕机器会取代自己的工作岗位;有人甚至已经开始脑补机器人占领地球毁灭人类的剧情…… 都什么鬼?
然而,有一点是确定的:如今的大模型已经能够完成许多任务,并且仍蕴含着无尽可能。
它们能实现什么,将如何改变世界,这一切都取决于我们如何运用它们。
现在,让我们继续前行吧!😎👇
一、LLM 是什么?
大型语言模型(Large Language Model) 是一种以 "实现通用语言生成能力" 闻名的语言模型。
简而言之,经过充分训练后,这类 AI 模型能够接近通过图灵测试的标准,展现出类似人类的对话能力,从而搭建起了机器与人类社会之间的沟通桥梁。
近年来,LLM 技术发展迅猛,模型的参数规模已经达到了数个 TB,这也促进了基于 LLM 的各种应用和服务的涌现。
你要问具体有哪些应用和服务?你在 AI 工具推荐里已经见识到了🤨
模型大小变化曲线
点击跳转👉大模型可视化链接
🤔LLM 和深度学习是什么关系?
LLM 本身并不一定要用深度学习来实现,但是近几年的 LLM 都是基于深度学习技术发展起来的,可以说没有深度学习就没有现代的 LLM。深度学习提供了强大的框架和方法论,使 LLM 能够理解和生成自然语言。所以在之后的 LLM 训练基础中,你能看到不少深度学习中看到过的身影。
🤔为什么 LLM 作为大 “语言” 模型,会有图像 / 音频的能力掺和进来?
大型语言模型(LLM)最初设计主要是为了处理文本数据,但随着技术的发展,一些 LLM 开始展示出多模态的能力,即除了文本之外还能够处理其他类型的数据,如图像、音频等。
所以在 LLM 之下又分出不少类别,例如 NLP(自然语言处理) 就着眼于 “语言” 本身,而 CV(计算机视觉) 就关注图片的生成。
在如此发展之下,大 “语言” 模型逐渐变成一个很模糊的概念,并不是只能生成 “语言” 了。之后的实操项目中也会有文生图的项目出现,我们姑且把他归在 LLM 的类别之下。
二、LLM 的现状?
如今的大型语言模型已经深入到了众多领域:
- 写作📝:例如 “文心一言” 能够撰写报告和文案(猜猜本文的文本是不是文心写的?);
- 聊天💬:淘 X,拼 XX 的机器人客服与小爱同学等聊天机器人;用户满意度的搜集;
- 绘图🎨:生成可爱的猫咪图像,还有前段时间热度颇高的 “龙年吉祥物”;
- 教育📚:GitHub Copilot 这样的工具通过提供代码修正建议;
- 媒体📰:许多电视台正在试验利用 LLM 技术生成新闻播报;
- 艺术🎭:一些 AI 画展,AI 生图也算是一个热门的方向;
1. LLM 与文字✏
LLM 对语言的精妙把握可以让它以你感兴趣的作家风格改写故事,例如对《灰姑娘》这一故事而言:
莎士比亚的展开
在那不勒斯的一座古老城堡中,一场盛大的舞会正在举行。水晶鞋的主人,一位名叫莉安娜的贫穷女子,因一场奇妙的遭遇而与富有的公子爵士埃德蒙相遇。埃德蒙被她的美丽和智慧深深吸引,但莉安娜在午夜钟声响起时匆匆离去,只留下一只水晶鞋。
"哦,命运的残酷,为何让我们相遇却又立刻分离?" 埃德蒙在月光下悲叹。他决定寻遍整个城堡,找到这只水晶鞋的主人。
经过一系列的误会和挑战,两人终于重逢。在一段充满智慧和机智较量的对话后,埃德蒙和莉安娜的爱情得到了所有人的祝福。舞台上,他们的故事被演绎成一出关于爱情、命运和选择的戏剧。
芥川龙之介的展开
在一个灰蒙蒙的雨天,一位名叫绫子的女子在旧货市场发现了一只古老的水晶鞋。这只鞋子引领她进入了一个复杂的谜团中,涉及一个古老家族的秘密和一段未解的历史。
绫子逐渐发现,这只水晶鞋与一起百年前的悲剧有关。那时,一个美丽的女子因为这双鞋而被诅咒,她的爱情和命运从此走向了灾难。绫子在追寻真相的过程中,被卷入了一个关于欲望、背叛和救赎的故事中。
莫言的展开
在一个遥远的村庄里,一个名叫小红的女孩偶然间从一个奇怪的老妇人那里得到了一双玻璃鞋。这双鞋子拥有魔法,能够带领穿着它的人进入一个充满奇幻和冒险的世界。
小红穿上玻璃鞋后,开始了一段充满了神奇生物、奇异景观和不可思议事件的旅程。在这个旅程中,她遇到了会说话的动物、能够预知未来的河流和控制时间的老人。
近两年的很多网文也是借助了 LLM 相关工具来完成的。对于那些有遗憾的故事,我们可以借助 LLM 按照自己的心愿来写下结局。
2. LLM 与多模态🎙
LLM 并不拘泥于 “语言” 这个词,通过多模态学习与注意力机制,LLM 可以理解音频与图像包括之中要表达的内容与情感,甚至可以理解与创造视频。对于 LLM 来说,理解与使用意义明确的表情包已经不是难事了。
- 例如我让它用 emoji 介绍原神:
🎮 原神 🌀✨是🇨🇳开放世界冒险🏞️。扮演旅行者,探索神秘大陆🗺️,寻找亲人👫,揭秘。特点:广阔世界🌄,美画面🎨,元素反应💧🔥。自由探索🚶,任务解谜🧩,收集角色🤺。元素战斗⚔️:风🍃,火🔥,水💧,电⚡,元素连击💥。发布📅:2020 年 9 月,全球热门🌍💖。
3. LLM 与技术🖥
虽然文学艺术领域似乎远离我们的日常生活,但技术领域同样面临着巨大的变革!
ACM 竞赛的含金量众所周知,然而许多复杂的编程题目往往让人绞尽脑汁。然而,当这些问题交给擅长代码的大型语言模型(LLM)时,却能迅速得到解决。ChatGPT 等模型展示出强大的编写和修改代码的能力,这让每个熟练掌握 AI 技术的程序员都变得更为强大。
也就是说,如果仅仅停留在传统技术上,我们很可能会被这个飞速发展的时代抛在后面。
三、我们应该做些什么?
我想大家看完上面这些,可能会有 “LLM 有这么厉害吗?” 或者 “LLM 也不过如此嘛” 之类的想法,先别急,在接下来的学习中你会逐渐看穿 LLM 的面纱,了解到 LLM 的强大与不足😎
🤔LLM 的缺陷
首先我们要明确,LLM 作为 AI 产物,是服务于人类的,虽然其很强大,但也有颇多不足。
- LLM 的训练依赖于大量的数据。如果这些数据包含偏见或不准确的信息,LLM 也会学习这些偏见,导致结果的不公正与误导。
- LLM 在训练时固化了那一刻的知识状态,无法自动更新或学习新发生的事件和信息,除非进行重新训练。
- LLM 的决策是一个 “黑箱”,难以解释为什么做出特定的决策。这对于需要高度透明度和可解释性的应用场景构成挑战。
- LLM 缺乏真正的理解能力。它们无法进行深层次的逻辑推理或理解复杂的人类情感和细微差别。
LLM 作为工具,那我们为什么不尝试去 “升级工具” ?既然 AI 这么强,为什么不去看看 AI 相关的工作?
- 随着 AI 技术在各个行业的应用不断扩大,对 AI 专业人才的需求也在增长。如机器学习工程师、数据科学家等。(人才缺口大,稀缺性)
- AI 技术的应用跨越了医疗、金融、教育、娱乐等多个行业,为专业人才提供了广泛的职业道路和发展机会。(多面性,大不了换条路)
- AI 领域的快速发展要求从业者持续学习最新的技术和方法,这为个人职业成长提供了良好的机遇。(保持学习性,前路无垠)
四、结语
可以肯定的是,人工智能(AI)注定将成为未来生活中不可或缺的一部分,成为我们的强大助力工具。
正如历史所展示的那样,蒸汽机和纺织机的发明虽然导致了许多纺织工人的失业,但同时也创造了更多的就业机会,并极大地推动了生产力的发展。
因此,面对 AI 带来的变革而自怨自艾是毫无意义的。站在新时代的门槛上,我们有能力掌握自己的命运,迎接随之而来的各种挑战。