穿越智算奇点解锁大模型的无限可能(本材料所有文本,插图,均由a/自动生成腾讯云秦若教2024.6 目content01大模型的02大模型的03大模型的04大模型的基础概念关键技术典型应用未来发展 >他来了!他来了!01他脚踏祥云走来了!大模型的基础概念 你的新伙伴已经上线你在和一个智能系统约会,那是什么感觉?2013年电影《her(触不到的她)》 大模型有多“大"”chatgptgeminidall-e 3midjourneyanthropicmmetaalstability.aimistralai_商汤日日新chatglm腾讯混元安通义大模型360智脑文心一言参数规模大:大于1,000,000,000,000个参数川百川智能数据需求大:大于12个牛津图书馆kimi智能助手lichuanai资源消耗大:单次训练需耗费1.5亿人民币 你从哪里来?我的朋友大模型的历史脉络1950人工智能的起源1956早期的探索:人工得能概念最早可追溯到20世纪40年代和50年代1956年的达特茅斯会议,“人工智能"被正式提出1950年,阿兰图灵提出图灵测试早期的ai研究集中在基于规则的系统和专家系统1990神经网络的兴起与衰退:2006机器学习的复兴:20世纪60年代至80年代,神经网络开始受到关注21世纪,机器学习开始迅速发展由于算力和数据的限制,神经网络在90年代初遭遇低谷2006年,杰册里辛额等人提出“深度学习“概念2012大模型的诞生:2017transformer(转换器)架构的革命:2012年,alexnet实现图像识别领域的突破、2017年,谷歌提山transformer架构随后,大模型开始在各个领域展现出其强大的能力,transformer渠构为后续大模型的发展提供关键支撑2022预训练模型的兴起:now多模态模型的探索gpt等预训练模型出现,在语言任务领域取得突破探索将文本、图像、声音等多种模态数据融合的大模型预训练模型通过大量文本数据训练,能够更好地理解和多模态模型为创意、娱乐、教育等领域提供新的可能性生成自然语言 “千万里,我追寻着你”国际大模型的创新浪潮mmetallama 3midjourneymeta于2024年4月发布专注于图像生成的ai模型开源,应用非常广泛艺术创作、设计领域claude 3.5语言视觉dall-e 3anthropic于2024年6月发布模型模型openal开发,文生图的先驱多榄态能力、非英语语言处理图像细节、多样性表现claude 3gpt-40stable diffusionopenal的最新多模态模型开源的文生图大模型更商的参数蛋,当前最强大模型开源、可控生成、模型多样性 中国欢迎你,为你开天辟地”:国内大模型的极速崛起腾讯混元:多模态智能的领跑者月之暗面kimi长文理解的先驱012024年5月,发布元宝、开源中文文生阁模型042024年3月,放支持200万字超长文本应用:戏,杜交、广告等场灵应用:长文本理解、名能写作等件..f.i2出.q智谱清言阿里通义千间:电商智能的新篇章智谱清言:分析与编程的高手022024年6月,开源qwen2052024年6月,开源glm-4-8bchatglm应用:电商与营销领战的智能化应用:f代码生成、excal分析缩写通义千间数超分行百度文心一言:探索知识的深海百川百小应:会提的小助手032023年10月,发布文心一言4.0文心一06·2024年5月,发布*古小应"app应用:在线搜索,知识问答、学研究wwebotj应用:通过主动追问,引导月户提出需求d. i- ty 你是电,你是光,你是唯一的神话”部分gpt-4基准测试结果huan avg. gpt-4100mmusabc*unitom earsatadvancedwinegrardeexayscmmeliar(commonserse)gpt4的考试成绩远超人类均值ai生成作品在人类艺术竞赛获奖美国生物奥林匹克竞赛:超过99%考生2022.10美国科罗拉多州年度艺术竞赛美国律师资格考试:超过90%考生midjoumey生成的作品获得蓝丝带奖美国高考:1410/600(写作 数学) 刷题不刷万亿遍02哪敢自称学霸?大模型的关键技术 学霸的书架:海量训练数据gpt4共学习13万亿token的洲练数据、类似子读完5200万本《唐持三百首》书架熟读唐诗三百首不会作诗也会大脑心脏数据数据数据数据数据采集清洗标注融合增强书桌作业本 学霸的大脑:基底大模型(foundationmodel)01基底大模型的定义:智能的基石书架通常具有数十亿其至数方亿的参数基底人模型为智能系统提供基础能力大脑心脏02模型规模与性能:规模的力量oo基底大模型的性能与规模密切相关当前最大规模:gpt4,1.8万亿参数03模型压缩:效率与性能的平衡压缩模型,以减少模型的算力需求、技术:知识蒸馅、迁移、剪枝书桌作业本 学霸的心脏:智算底座书架高性能集群·gpu组成的大规模并行计算集群,要点:并行处理、高速互联、资源调度大脑心脏高性能网络·0.1%的掉包,会损失50%的算力,要点:低时延、高可靠高性能存储·读写数据时,gpu资源处于等待状态■要点:快速读写、高吞吐,冷热分层书桌作业本 学霸的书桌:训练平台书架资源优化与训练效率提升,简单堆机器,会导致分布式性能反降大脑·优化算法,提高资源利用率,提升推理训练速度心脏点一站式服务的训练平台,功能:模型选型,训练共建、部署应用训练方法:监督训练、人工反馈、强化学习数据管理与模型版本控制训练数据的准备、知识挖掘与增强、数据清洗与切块*向虽库建设与维护、模型版本控制书桌作业本 学霸的作业本:模型优化finetunino书架模型精调:领域专家的塑造者,技术:针对特定任务或数据集进一步训练,日的:学习特定领域知识、提升专业任务表现大脑应用举例:医疗行业,更好地理解电子健康记录心脏promntenaineerind提示工程:智能引导的艺术,技术:设计精确的输入提示来引导模型:目的:在没有大量训练数据的情况下解决特定任务应用举例:教育行业,快速生成定制化学习材料oratior检索增强:获得实时的海量信息:技术:检索外部信息源,提供软助信息:且的:提供更加精准,更加及时的信息应用举例:金融分析领城的智能投研助手书桌作业本 >你是我的阿拉丁神灯吗?03大模型的典型应用 通才或者专才:通用大模型与行业大模型通用大模型行业大模型,概念:捕捉通用特征,处理多种通用任务概念:针对特定行业定制,基丁通用大模型精调vs构建方式:侧重于广泛的数据覆盖构建方式:侧重于特定领域数据的深度和质量训练月标:良好的泛化能力训练目标:特定任务的性能·场景举例:搜索引擎、语言翻译、内容推荐场景举例:医疗诊断、法律分析、金融风险评估 个性化智能:面向个人的大模型应用辅助创作个性化教育·文案创作·语言学习·音乐创作·编程学习图像生成·知识问答虚拟助理娱乐互动,日程管理·虚拟陪伴信息查询·游戏角色智能家居控制虚拟偶像 个性化智能:全球c端大模型应用概览大模型赋能大模型原生市场已有产品数量>2300搜素g googlebai爸百族l new bing[i perplexity>150search会议市microsoft tearrs腾讯会议>20文档腾讯文档dofficevwps>450fdiscorscharacter.ai陪伴inflection pi(replikaljl mnimax>150游戏王者荣耀网易术哈游坏3adunge&ninworld>50个人助理 windows copilotnrewindadept>1000学习x科态duolingo>150来源:腾讯研究院 浅窥智能生活:腾讯的c端大模型应用案例腾讯会议:自动会议纪要腾讯云智能:ai写真腾讯文档:智能起草天涯明月刀:npc@a小奶于 x5智期手国x输入过去5分钟测了什么?1:47我喜r你好逸ros,表量用文档高用阿暖刷附讨论内客驾括:出,小郭介组限录会议认证产品合作速度,已收80款申请,20个初步通过,需复你可以尝试这样提问测和优化,扩大理分场量围盖。业文档起单,小林表示已达成25家合作晶滤,完成60%生态建设日标,需加强个人外设蒙志格生或潜设计收票表品牌合作。小赵问国际晶牌合作,小郭提到已进行中生成甲维寻亚目选文档答三轮治读,关注得摄会议rooms系线和天路模组方案,与会人员讨论合作跳战、优化认证流程、提高产品质量和用户体验等问题。内密出a生6心基是好喝期说了什么总请会议更多闯题oti*#$ 13 企业智能化:面向企业的大模型应用业务价值革新生成式ai应用场景矩阵横轴:企业业务流程(内部<=>外部)纵轴:业务改造程度分类(改善<=>创新)88四大场景价值象限详解企业内部流程外部用户体验运营效率提升象限:内部用户降本增效客户体验提升象限:外部用户提升体验产品价值创新象限:外部用户颠覆服务模式业务流程重塑象限:内部用户/构内部流程业务流程增强 企业智能化:大模型技术的行业渗透情况日标市场渗透100%广告软件教育传媒金融出行电商%0肆筑发展阶段探索孵化期试验加速期采纳成长期落地成热期来源:腾讯研究院,2024年初调研 企业智能化:ai百大应用场景bratr地产教育物业泛互..文旅金融传媒运营商生成式ai应用场景盘点-11322323医药政务r制造出行r零告能源来源:腾讯云《生成式ai产业落地路径研究报告》ate 运营效率提升:以金融行业落地案例为例生成式ai应用场景渗透金融业务流程企业内部流程生成式ai应用场景it代码助手办公办公管理营销个性化营销运营(法务&人事&财务&行政)数据分析it业务流程优化办公业务流程简化营销业务流程赋能运营业务流程自动化,高信息化程度的金融机构会议纪要的白动生成,客户经理面对的产品知识序,定期向监管机构报送数据·牛成式ai铺斯代码补全,理解并准确生成专业术语·牛成式ai拱供快速问答,捐助获取分析数据与生成报告·如速app研发送代速度,从流程中释放员工,节省学习理解产品的时间,对话式交互快速定位异常原因 客户体验提升:以医疗行业落地案例为例“生成式ai应用场景渗透医疗服务流程外部用户体验生成式ai应用场景诊前 (售前)智能导诊诊中(售中)检查报告自动生成诊后(售后)智能随访复诊诊前环节优化诊中环节辅助诊后环节关怀解决挂错诊室、医生不匹配等问题忠者面对检查报告的困感弥补诊后与医生的交互空缺生成式ai机器人协助忠者了解就诊科室·生成式ai提供医疗辅助诊断报告生成式ai随时解答忠者用药疑感完成预约挂号与精准医生推荐:提升医生检查效率提醒用药,持续关心患者健康 大模型应用落地的三大路线购买自建1.标准软件2. 标准模型能力增强3.定制化模型精调训练减于生感式a板型能力的开箱而用的查用软件基于标注生成式a模型,通过r6g等提示工程增强模型策力加人企业专属致据精动练,自注企业专局大模型,说池模型资产深佑婚成hghhgh开发相入出内客险料开减损入台作分工服务座托售企业参与服务商托管服务商托管应用开发模型精诺训茶立用开发原用发基注模型建提示工程与改索增强生发基注澳型构速提示工理与验索增张生文基比模型构速提示二程与检索增函生成腾讯云产品方案·积型服务·款招平台·应用研发·级爵平台·a开发平台·硬牛创新·云原生平台·智能增强软件·gend手·ai开发平台·云原生台·应用研发·云原生平台·软硬加连·分布武a境力滤元大模型、行业大模型、开源型合核安全防护 标准软件:腾讯云ai代码助手4个代码场景应用场录代码补全技术对话单元测试代码诊断1个数握石板batch计尊,300ms强识基于湿元进行大校型指令对齐和强化学习进行行业模型训练和推理优化通过sft微丽,预训练更小的代码情重反读真实场景下的badbase代码生成率maas代码采纳率客户专属模型精调细分领域模型训练平台应用平台全链路遥测1个训练对话采纳率平台maasti-datatruth数据标注平台ti-one训练平台ti-matrix应用平台测试生成率angel机器学习框架qps技术底座耗时腾讯湿混元大模型行