让机器拟人化，从“人工智障”到“人工智能”

日期：2023-06-25 17:36:44 / 人气：167

会议的主题是“预见新世界，构建新格局”。卡耐基梅隆大学计算机学院前副院长、达沃斯世界经济论坛(WEF)计算机全球未来理事会前主席Justin Kassel，以及来自360集团、致远研究院、昆仑万伟、云知声、蓝色光标、万兴科技、智创宇等众多行业的高管到场，与数千名与会者进行了深入交流。
峰会上，云知声创始人兼CEO黄伟以“智慧未来之路”为主题进行了分享。
以下是分享内容的汇编:

云知声是个创业老手。在过去的十年里，他专注于语音识别和自然语言处理。我们的技术领域是最接近大模型的。5月24日，我们在北京发布了山海大学的模型。作为一个初创公司，键入大模式演变的经验。
一开始我们希望按照专家的方式，给机器一些方法论。十年前，机器开始从错误的反馈中学习。这些都是过去人工智能技术中大致的阶段和路径。
今天OpenAI推出了ChatGPT和预训练模型，整个智能变得更加拟人化。第一，我们用非常强大的计算能力阅读全世界已知的所有文本，并训练形成一个大模型。特别像婴儿的大脑，可能有几百亿或者几千亿的参数。和人类的大脑不同，婴儿最多只是继承了父母的外貌和性格，而大模型的大脑继承了知识，这只是初始状态。然后通过微调等手段，像孩子在成长过程中会有各种教育，整个大模型的进化会更加拟人化。
这是整个人工智能的变化。
今天的AGI和以前相比有什么本质的变化？在2022年12月之前，整个人工智能还是一种有鉴别力的人工智能，做判断题，特殊系统和智能模块，做一些特定的任务。一方面，人工智能的性能没有那么智能，经常被别人诟病“你提供的是人工智障”，以至于过去人工智能的天花板很低。
第二，在很多场景下，客户的需求千差万别，但是人工智能的能力没有那么强，很多公司和团队用各种定制来满足。人工智能企业不像高科技公司。过去十年，是只能做歧视性AI的手工作坊时代。但是现在有了大模型和更强大的通用能力，人工智能开始进入产业化时代。
有了新的生成能力和涌现能力，一个模型可以在很多场景下解决不同的问题。当今时代，人工智能的大模型就是生成器。在发动机发明之前，中东国家没有那么富裕，石油的价值也没有那么大。就像今天，你可以把数据变成燃料和能力，用这种能力去赋能千万个行业。
为什么云知声能在短时间内推出自研大型机型？
我们成立于2012年，是国内第一次将深度学习应用于语音能力。我们以前在科幻片里看到过。2012年推出了基于深度学习的语音识别引擎。当时深度学习被视为云知声的整个技术框架。
2016年看AlphaGo，我们把医疗产品放在医院里帮助北京协和医院的医生，大大提高了工作效率。在医院的场景中，仅仅使用效率工具是不够的。人工智能真正的智能是认知智能。Transformer是2017年提出的，认知智能的背后需要相对强大的计算能力。
有了这些准备，我们在学术和工程方面都积累了很多经验。这种体验对个人来说是你的谋生能力，但对公司来说是在市场上取胜的核心竞争力。看了ChatGPT框架，发现没有一个是新的，只是一些已有的工程组合。我们很快就把这种能力结合起来，投入到大型号的研发中。
三天前，我们发布了一个叫山海的大型商业模型。所有的前期训练，指令微调，基于人的反馈的强化学习都贯穿其中，看到了期待已久的涌现能力。当时团队在想要不要给它起个名字。那段时间经常出差，觉得名字挺好的。大海波澜壮阔，海纳百川，体现了大模型的无限生成能力。山高，知道什么能说，什么不能说。这恰恰是为了既强调大模型的生成能力，又强调大模型的安全性和合规性。
有一个很有意思的现象。每个人都在谈论大模型。国内对大模型的关注是春节后的事，但大家都不谈，也没什么想法。时至今日，有一种观点认为，这件事仅靠技术是做不到的。即使所有人都到位了，培训成本也很高，极其昂贵。大模型不是科学革命，也不是新算法的发明，而是现有算法的组合，让它变得更大。大部分都是有价格的，当然也有很多项目在里面。观点是对的。
另一方面，如果你认为大模式是未来10-20年的大机会，BAT投不进去，你就放弃了。我觉得还有机会。
前几年，云知声并不需要一个特别优秀的科学家。我甚至不认为这个东西是科学家做的。科学家没发挥过那么大的计算能力，不知道场景在哪里，结果肯定不好。有场景的厂商最有可能成功。
山海之名还有一层意思，就是山海即使相隔也可以。
山海的力量是十项全能。生成能力是很主观的。当场景真的落下时，语言的理解能力很重要。为什么之前觉得是人工智障？因为你缺乏理解和编码的能力。代码能力的提升可以帮助提升大模型的推理能力，输出的结果必须符合国内的法律法规甚至道德价值观。我们还采用GPT-4插件的架构，帮助企业和客户提供数据优化、模型训练、模型部署等一条龙服务。
为什么大型模型具有复杂的逻辑推理能力？我们今天做到了，但是不知道为什么500亿参数好还是1000亿参数好，但是很难说，可能1000亿参数的神经元还没有被激活。
此外，还有医疗。一开始，我们在做一个大模型。很多人以为云知声做的是垂直行业模式，其实不是。我们在做行业应用。挑战了最严重的一幕——医疗。通过前期训练阶段，我们收集了很多医学文献、专著、书籍、病历，积累了几千万的真实标记数据，这些数据可以转化为我们的微调数据。
此外，2019年获得北京市科技进步一等奖。获奖项目为大规模知识地图构建的关键技术及应用。我们有中国最大的医学知识图谱之一。我们把知识图谱分解成知识插件，嵌入到大语言模型中，让大模型成为医学领域的专家。
MedQA是一个非常权威的医学知识问答集，包括Google的Med-PaLM，ChatGPT和GPT-4，都公布了他们的评测结果。山海在最近的测评中得了81分，大大超过了GPT-4的71分。领域增强后，大模型可以变成某个领域的专家。还有一个图可以横向对比。医学院毕业生必须通过临床医师考试。目前已知的最高AI成绩是456分，山海大约511分。这就是大模在领域增强后获得的超能力。
做一个大模型是相当困难的，门槛很高。除了很多钱，优秀的算法工程师和算法，我们还需要很多能力。我们总结为山海之功。直观来说，大模型本身就是大数据集，大模型是工程师的作品。为什么云知声能在几个月内做出非常权威客观的评测数据？我们会在内部进行评估，不仅是医疗方面，一般领域也是如此。云知声就是其中的佼佼者。
计算平台不仅仅是买多少卡插多少卡。云知声几乎有200P的计算能力。利用聚类的效率达到行业顶尖水平，可以用相对较少的卡快速训练我们的模型。
目前GPU集群的利用率可以达到50%，大型机型需要多卡。目前行业水平在42%左右。大模型也要进行3D混合并行训练。什么是3D？它是模型、数据和管道的并行化。需要将任务拆分到很多不同机器的不同卡片上分别计算，最终快速得到响应结果。此外，在模型推理上做了很多优化，推理速度提升了5倍。怎么把训练卡和推理卡分开？训练卡是A800，推理卡在单卡A6000上，可以实现快速推理。
另外，数据很重要，数据规模、数据多样性、数据质量都很高。现在，我们可以支持10T级快速重复数据消除。ChatGPT的训练数是45T，但是优化后我们用了几百g的数据进行训练。
有了这些能力，基于Atlas和UniDataOps的能力，我们可以更好地为山海和行业客户的能力提供服务。
智能物联网也是公司的重要业务。我们有很多落地，过去用的效果真的不太好。希望山海之后，物联网现有的产品都用一个大模型做出来。
医疗是我们看好的方向。以前医疗产品主要有两个方面。一种是直接用麦克风说话，不用敲键盘，大大提高了医生的工作效率，将输入病历的时间从3小时缩短到1小时。第二，有了病历之后，还有一个系统，通过AI大脑审核病历，检查病历有没有错误。现在用AI大模型能力可以做什么？
对话过程中的所有对话都会被记录下来，里面的关键信息会被识别为信息的摘要。有了沟通后的关键信息，就可以一键引导生成案例。以前需要医生逐字阅读病历，现在可以根据关键信息形成病历。
山海的愿景是通过人工智能，创造一个互联、直观的世界。以前人工智能的定义是让机器服从人。今天，我希望机器更加拟人化。人与物的交流会变得更加直观，新的能力会带来新的产品和新的商业模式。我非常愿意和在座的各位一起迎接大模特的新时代。

黑马AIGC工业营地
理解AIGC的基本逻辑，一步到位地了解行业的未来。
3个核心认知，6个前沿主题
(扫描下方二维码，立即加入)
↓↓↓"

作者：奇亿娱乐

让机器拟人化，从“人工智障”到“人工智能”

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →