新闻动态
科技向善 安全可信
我国首部生成式AI立法正式施行,智慧眼等大模型厂商有望受益
公司新闻
2023.09.08

近日,我国首部针对生成式人工智能产业的规范性政策—《生成式人工智能服务管理暂行办法》(以下简称办法)正式施行,引发行业人士和相关政策研究者的高度关注。

国家互联网信息办公室有关负责人表示,出台《办法》,旨在促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。

《办法》的出台,一方面体现了国家对生成式人工智能产业发展的鼓励和支持,既为产业创新提供了政策导向和法律保障,另一方面又为产业监管提供了科学合理且平衡适度的框架。

过去几年,商业化一直是困扰整个人工智能行业的难题,大模型的出现为AI商业化提供了新契机。作为极具开拓性且高速发展的新业态,大模型的赛道之分,成为了业内争论不休的话题。现有大模型大致可分为两类:通用大模型,像ChatGPT,面向人群以及场景适用范围十分广泛,但由于需要巨大的计算资源和数据量,已经成为国内外大厂的重点项目;垂直大模型,在特定的领域或行业中经过训练和优化,针对特定场景提供更精准和高效的解决方案,更好地满足用户在某个领域或者场景下的需求和期待,如:医疗、金融等。

此次《办法》强调了:应采取有效措施,提升生成式人工智能服务的透明度,提高生成内容的准确性和可靠性。从“准确性‘’“可靠性”这两点要求来说,通用大模型由于爬取网上可能存在错误、偏见的信息,会导致精准度不够,生成有误或有偏见的响应,其不足逐渐显露,无法切实满足各行各业的需求。相比较而言,垂直大模型更能发挥其价值,它需要学习大量行业的专精语料和经验知识,具有更强的领域专业性和任务针对性,能够更好地解决特定领域的问题和提供更加精准的服务,也更容易找到其商业模式。

以医疗健康领域为例,医疗场景对问题的容错率低,这就对大模型提出了更高的要求,即AI需要基于医疗专业语料给出更专业、更精准的医疗建议;其次,目前医疗数据中有超过90%的数据来自于医学影像,这也意味着一个切实有效的、能做复杂决策的医疗人工智能大模型,需要融合医学影像、文本,甚至语音或是视频等多模态信息以赋能各种医疗场景。最后,考虑到现阶段医院实际的部署环境和数据安全性要求,“大模型”不能无限“大”,需要让数据飞轮和模型训练能够很好结合,发挥效果更好、成本更低。

此外,《办法》中还提到,采取有效措施提高训练数据质量,增强训练数据的真实性、准确性、客观性、多样性”这体现 “让产业向高质量方向发展”的政策导向

智慧眼砭石大模型在此方面做了重点考量,一方面,采用知识图谱与大模型相结合的技术路线,通过在训练过程中加入知识图谱对训练过程进行知识增强,结合RLHF技术,在500亿参数条件下比单纯使用大模型技术,医学问题回答准确度提升近10%。另一方面,隐私计算条件下的大模型联邦训练,保证了数据的多样化和高质量,充分释放数据要素价值,真正做到数据的“可用不可见”、“数据不出域”。此外,砭石医疗大模型能够支持医疗领域多模态的输入,包括医疗领域文本、图像、视频和音频形式,可以有机整合不同的信息,相比单模态信息更加全面,让AI充分施展拳脚,方便医药机构使用。

当前,在《办法》的催化下,各家通用大模型、垂类大模型厂商正加紧进行自身战略布局、提升产品的安全合规性,共同构建安全可信的、自主可控的大模型生态,智慧眼亦将坚持科技向善,为医疗健康产业的可持续发展做出价值贡献。