WAIC，蝙蝠老大没来的地方，真正的AI时刻正在发生

日期：2023-07-12 11:38:52 / 人气：419

在大模型时代，科学家、企业家和管理者已经走到了前台。
有人说是大机型的iPhone时刻。一条全新的万亿轨道将被开启，2023年的大模型元年也将成为科技史上的重要里程碑。
也有人说，只是大型号的“BP机”的一瞬间。再过几年，看似繁荣的大模特行业将会像过去式一样被忽视。
现在的大模特是什么样的时刻？在7月8日刚刚结束的WAIC上，包括BAT、华为盘古、商汤日日新、京东云颜夕大模型、第四范式“世说”等30多个大模型亮相，400多家科技企业齐聚一堂。不要听别人怎么说，也要去WAIC2023(世界人工智能大会)自己看，自己问，自己用。
BAT大佬没来，大佬们的AI会到现场了。
在本次世界人工智能大会上，BAT大佬李彦宏、马花藤、马云都没有来到现场。对比2020世界人工智能大会，李彦宏、马花藤、马斯克、马云通过现场或线上谈人工智能；2021年大会，和360周参会；2022年，李彦宏依然来到现场参加会议；在这次大会上，国内互联网巨头几乎没有一家出席。
但更多AI大咖的到来，足以点燃这个大模型时代的现场气氛。
AI生态的完善吸引了众多开发者，这是百度在ALL in AI中最有底气的地方。在国内大机型的争夺战中，百度也是率先实践和落地的。
百度首席技术官、深度学习技术与应用国家工程研究中心主任王海峰在大会上披露，截至目前，Feipaddle已聚集750万开发者，这也是百度自2023年以来首次披露Feipaddle生态的最新数据。飞鱼是国内首个自主研发的深度学习行业级开源平台，连续两年国内深度学习平台综合市场占有率第一。文心大模型的最新成果也得益于飞桨和文心深度学习平台的联合优化。
百度最新的文心大模型3.5也在对标ChatGPT3.5，文心伊彦也有官方插件百度搜索和ChatFile。百度搜索是默认内置的插件，使得文心安怡能够生成实时准确的信息。ChatFile是一个长文本摘要和问答插件，支持长文本输入。
再做一遍似乎是阿里的特色语言。“面对AI时代，所有产品都值得用一个大模型重做。”将于9月正式卸任阿里巴巴董事局主席兼首席执行官、阿里云智能集团专职董事长兼首席执行官的张勇曾表示。在大模式之战中，阿里云也以促进生态繁荣为首要目标。这是为了抢百度的台词吗？
7月7日，阿里云智能事业群CTO周宣布，阿里云大模型家族迎来了一位新成员——依桐万象AI绘画创作大模型。依桐万象首批有三个功能:创建图片的基本功能、生成相似图片的功能、传递图像风格的功能。只需要一个模型就可以支持多种类型的图像生成任务，研究成果已经发表在国际顶级AI会议ICML2023上。未来，该模型可应用于艺术设计、电子商务、游戏、文创等多种应用场景。据悉，阿里云模式的多模态能力将逐步向行业客户开放。
2022年，阿里云提出了MaaS(模型即服务)的概念。周静人大还表示，MaaS的最低含义是围绕作为重要生产要素的车型生命周期来设计和提供产品和技术。
关于生态的重要性，周指出，大模型的研发是一个系统工程，包含了底层计算能力、网络、存储、大数据、AI框架、AI模型等复杂技术，需要AI和云计算的全栈技术能力。大模型的应用需要丰富的生态土壤。总之，光有计算能力，没有模型是不够的。有模式，没生态，还不够。开发一个大模型，算力、模型、生态缺一不可。
阿里云的依桐大模型落地了很多场景。比如听意懂，凭借其强大的语音转文字能力，正在抢占科大讯飞的传统市场。两人都在BAT前秀肌肉，但一直稳中求进没有速度的Mark自然要在大模型上加快进度。
有意思的是，百度提出的是ALL in AI，而腾讯提出的是AI in ALL。作为一个巨头，腾讯当然不是在创造概念，而是在实实在在地付诸行动。
7月6日，腾讯集团高级执行副总裁、云与智慧产业集团CEO唐道生在大会上表示，基于大产业模式，企业自建专属模式可能是更好的选择。目前，腾讯自有的企业级应用已经接入了行业的大模型能力。比如腾讯企业智能客服、腾讯数码智能人都已经全面升级。
根据腾讯云MaaS服务全景图，腾讯将基于腾讯云TI平台建设大型选模店，为金融、文旅、政务、医疗、传媒、教育等10个行业提供50多个解决方案。企业用户只需添加自己独有的场景数据，一键生成“专属模型”。
依托腾讯自研的AI能力，只需要3点钟真人口播视频和100句语音素材，平台就能通过音频和文本的多模态数据输入，实时建模生成高清人像，24小时内做出一个与真人相似的“数字智人”；在“刷掌支付”展区，参观者只需将手掌放在识别区上方2-3秒，便可通过最先进的“掌纹+掌脉”识别技术进行支付。
腾讯互动翻译也在论坛上大显身手。据介绍，腾讯同传通过微信凌志定制的增强型语音识别引擎和交互式翻译TranSmart实时融合技术，不断优化翻译结果，确保会议内容能够准确高效地传递给不同语言和文化背景的与会者。
在交互翻译领域，基于行业模型技术，同传技术不再需要百万级的训练数据，只需要小样本训练就能达到很好的效果。专业领域的翻译还可以减少人工优化的参与，保证翻译效果，这一点在很多垂直行业都有落地。
有意思的是，腾讯其实还有另一个翻译产品——腾讯翻译机君，但显然，有更多AI能力支撑的腾讯互动翻译比翻译机君更受集团重视，在腾讯内部的赛马竞争机制下，多生孩子不一定整体更容易拼，但一定有一个孩子最能拼。
在2017年的博览会上，马云认为“数据是原材料，没有数据什么都做不了”；李彦宏认为“创新和技术比数据更重要”；马花藤补充说，“更重要的元素是场景”。三大巨头的争论一时间传遍了IT界。现在，创始人逐渐躲在幕后，但他们在AI行业的意志仍在发挥作用，他们不同的产品开发体现了不同老板的性格特点。
科学家是大模特创业大潮中的主角。
据WAIC2023主办方介绍，本届大会嘉宾总数再创新高，国内外知名学者、知名企业家、国际组织代表等1400多位重量级嘉宾已确认参会。其中有四位图灵奖得主(大卫·帕特森、约瑟夫·斯发基斯、曼努埃尔·布鲁姆和姚期智)和一位诺奖得主(迈克尔·莱维特)。特斯拉、微软、亚马逊、苹果、华为、阿里等50余位国内外领军企业负责人齐聚一堂，80位国内外院士、20位知名高校校长、86位独角兽企业负责人踊跃参会。
在7月6日上午的开幕演讲中，香港中文大学汤晓鸥教授、2018年图灵奖获得者、Meta AI基础人工智能研究(FAIR)团队首席AI科学家Yann LeCun、图灵奖获得者、上海知止研究院院长姚期智等多位知名科学家做了重要演讲或对话。
Yann LeCun与Horizon创始人兼首席执行官余凯进行了在线交流。杨丽坤重申，ChatGPT不是AGI的终结，视频和图像生成革命亟待推进。杨丽坤直言，“我不喜欢AGI这个词，因为每一个智能都是特殊的，人类的智能也是非常专业和特殊的。”
在杨丽坤看来，大模型一个接一个地生成代币，但它们并不了解物理世界，没有规划和推理就无法实现目标。这也意味着智能系统缺少非常重要的组件。在律师考试中，大模型可以发挥其强大的检索能力，获得良好的结果，但它没有足够智能的系统将盘子放入洗碗机。
在亿欧主办的AI商业落地论坛上，中国工程院院士吴志强发表了题为《全大脑:AI走向社会智能时代》的演讲。“在过去的两年里，我们为许多大脑重新提出了一个新的社会智能框架。它的目标是让AI学习一个社交社区如何组织和合作。这是一种对学习、主动性、异质性、预见性等各方面都开放的社群智能模式。”他说，城市不再是单一的大脑结构，而是由主脑、辅脑、分脑和端脑组成的多脑系统，完成群体学习和协同决策的过程。每个大脑既可以独立运作，又可以相互协作，实现分布式协同决策。
科学家的WAIC演讲主要集中在长期规划和人工智能的高级管理上。
微软全球资深副总裁、微软大中华区董事长兼首席执行官侯阳博士预测，未来每家公司的每一个应用都将由AI驱动，微软将在各个领域挖掘数字产业的发展潜力。
这主要是一个宏观层面的AI叙事。在具体的细分领域，各个企业的首席科学家都在摩拳擦掌，准备大打出手。
商汤科技联合创始人兼首席科学家、绝影智能汽车集团总裁王晓刚在7月7日的一场论坛演讲中指出，虽然智能汽车中有很多传感器，包括摄像头、麦克风、激光雷达等，但不同类型传感器的信号无法很好地整合，多模态数据处于碎片化状态。因为汽车的决策和控制模块是基于规则的，无法针对不同的环境和个人给出个性化的输出，给终端用户的体验会更加机械，所以有人说这种体验是假AI。大模型与智能汽车的结合，商汤期待它能带给你真正的AI体验。
王晓刚表示，商汤的语言模型可以充分发挥其决策推理能力和内容生成能力，成为汽车客舱的大脑，控制车内所有部件，包括汽车与外界连接的各种应用。通过知识融合，构建每个乘客独有的记忆模块，通过外部知识库的模式和模型连接，提供千人个性化服务。
针对人工智能和大规模模型开发带来的社会风险，如何保证数据安全，如何保证算法不会产生不良归纳等AI监管问题，虽然科学家对于让科技真正造福人类的看法是一致的，但是不同的科学家也有不同的AI监管视角。
在世界人工智能大会开幕式上，2018年图灵奖得主、Meta AI基础人工智能研究所团队首席人工智能科学家杨丽坤表示，他完全不同意“因为任何人都可以用人工智能做任何事情，情况可能会非常危险，所以有必要对人工智能进行严格监管”的说法
在他看来，从长远来看，让人工智能平台安全、良好、实用的唯一途径就是开源。
杨丽坤谈到了人工智能如何变得智能和可控。“如果你认为实现人类级别人工智能的方式是做一个更大的自回归LLM(大型语言模型)，然后用多模型数据进行测试，那么你可能会认为这些人工智能系统并不安全。但实际上，我并不认为这个系统能有多智能。我觉得让它们智能化的方法也是让它们可控的方法，也就是目标驱动的人工智能的思想。本质上，这是他们必须达到的目标。”
杨丽坤认为，人工智能系统不会通过一点一点的渗透来欺骗或主宰人类。人类可以设定迫使人工智能诚实的目标，比如迫使人工智能屈服于人类的目标，小心那些希望它们好奇的目标，小心让它们接触到不应该有的资源。“所以我认为这些系统将是完全可控和可操作的。系统可以设计成安全的，但这并不容易。设计这些目标并使系统安全将是一项艰巨的工程挑战。”
唐晓鸥更以他的三个学生、何、林大华为荣。他形象地说，林晓刚在深度学习的早期就种下了原创的种子，何明凯奠定了深度学习的坚实基础，林大华通过开源和大模型使其蓬勃发展。
当然，这些科学家在行业中也有非常重要的影响力。但他们显然很珍惜自己的科学家身份。其实不像很多领域，存在着科学进步和技术脱节的现象；在AI大模型领域，任何公司的技术进步和新业务拓展几乎都是一种科学进步，最新的研究成果在各种顶级期刊上获奖。
AI的概念和理论进步，在大模型时代，几乎意味着技术实践上的快速应用和实践。
科技产品背后的人文与浪漫
技术方向的引领者和科学理论的基础对于行业的发展尤为关键。但是产品的落地和成功，离不开产品经理、程序员、工程师的努力和热爱。
百度的一个产品经理在和亿欧聊网盘的产品开发理念时，提到了一个带字母a的竞品网盘，很是得意，可见这种对我们自己产品的偏爱是真诚的。
产品经理往往是文艺青年——百度网盘产品经理的朋友圈，连百度产品的广告或宣传文案都看不到。而是分享各种电影、音乐、戏剧、小宇宙播客。他最新的一首歌是伍佰的《纯白的起点》:“弄乱我的头发，遮住我的眼睛假装悲伤，其实我觉得今天比昨天更好”。
我们平时用的很多产品，要么好用，要么不好用，要么骂骂咧咧，要么赞不绝口，背后都是产品经理和程序员的努力。这种努力主要在于技术，但他们也有自己的文学喜好，还有自己喜欢的歌手和乐队。如果技术不人性化，如何洞察人的细微需求？
在本次世界人工智能大会上，MidJourney的创始人David Holtz也通过视频分享了自己的演讲，并透露了MidJourney名字的浪漫来源:原来他最喜欢看两种书，一种是科幻文学，一种是中国古典文学。中道之名的来源是《庄子》中庄周梦蝶的故事，对应汉语中的“中道”。
谁能想到中旅这个名字会这么浪漫？
在回答AIGC技术未来将如何发展的问题时，戴维·霍尔茨回应道，“很难说未来的技术会是什么样。我们在这个领域的发展才刚刚开始，未来会有10倍、100倍的进步，不仅是技术，在用户界面、产品等领域也会有更多的进步。”
技术带来的改变才刚刚开始。WAIC的登陆也迈出了一大步。据上海市经济和信息化委员会主任吴金成在闭幕式上介绍，本次大会对接上下游企业210家，达成意向采购金额110亿元，促成重大产业项目签约32个，总投资288亿元。
但人们的热情也可以预测未来的AI场景:展会上，很多人带着孩子去参观展览，很多人推着婴儿车去参观展览，甚至还有很多白发苍苍的老人来参观展览。当新技术产品的展览可以像商场一样吸引人；当老人和孩子都对人工智能和新技术感兴趣时，中国的人工智能业务将不会只是泡沫，而是有更多真正改变的可能性。"

作者：傲世皇朝平台

WAIC，蝙蝠老大没来的地方，真正的AI时刻正在发生

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →