9月22日,主题为“智见大模型·驱动新未来”的“2023大模型创业大会”在沪成功举办。大会广邀互联网大平台、高校科研院所、细分领域行业领军企业和垂直领域创业公司领袖齐聚上海杨浦,聚焦国内大模型产业的创业生态,共话大模型产业的创新未来。
大会由上海市杨浦区人民政府、新华社上海分社主办,北京坤倪管理咨询有限责任公司、北京学说科技有限公司、上海市信息服务业行业协会、杨浦区科学技术委员会承办。学说平台作为官方平台全程直播。大会由清华大学金融科技研究院副院长、北京金融科技研究院副院长魏晨阳主持。
在领导致辞环节中,新华社上海分社社长王永前表示,科技创新是国家发展的重要引擎,而人工智能技术作为当今世界最为重要的领域之一,在推动国家发展和产业升级方面具有关键性作用。近年来,我国人工智能产业在技术创新和产业应用方面取得了显著进展,特别是大语言模型的成功应用,标志着人工智能领域取得了重大突破。
中共上海市杨浦区委书记薛侃提出,当前以大模型为代表的新一代人工智能正迅速崛起,对社会各领域产生深远影响,成为推动产业升级和经济社会发展的引擎。薛书记强调,杨浦区在人工智能领域具有独特优势,杨浦区是上海创新密度最高、创业氛围最浓郁的城区之一,拥有一大批人工智能产业链上下游企业,以及一系列创新型平台。特别值得一提的是,长阳创股已成为上海市人工智能应用试点园区,为人工智能企业提供了广阔的发展舞台。
中国工程院院士郑纬民表示,要大力开展基于国产系统的大模型的研究工作,要改变国产卡的生态系统不好的局面,只有确保生态系统的健康,才能实现产业的持续增长。此外,郑院士就大规模模型的使用提出了相关建议,包括数据模型的优化、支持人工智能模型经验所需的数据模型以及生态系统的共赢。他还强调了对政府政策的重要性,以促进大模型技术的创新和应用。
在主题论坛“大模型的学术探索”中,清华大学人工智能研究院知识智能研究中心主任、教授李涓子针对大型语言模型的发展提到了三个主要技术方向:千亿级基础模型、有监督指令微调和人类反馈学习,以及知识认知能力的提升。李涓子表示,大型语言模型在知识的记忆、理解、应用和创造等方面与人类认知还存在差距,但这也是未来研究的方向之一。
哈尔滨工业大学国际人工智能研究院院长刘劼表示大模型的成功离不开高质量数据、联邦学习等新技术,同时指出大模型是知识的总结与归纳,对各领域具有广泛应用前景。此外,刘劼提到,AI未来或将进一步探索未知领域,超越人类认知,既令人期待又引发关切。
认知智能全国重点实验室副主任、科大讯飞副总裁、讯飞研究院执行院长王士进指出,大模型的泛化能力将不断增强,为教育、办公、汽车等多个行业带来更多机遇。同时,他提到了大模型在行业中的选择与切入赛道的重要性,强调了科学评估的必要性。科大讯飞发布了新一代多模态大模型,积极推动大模型技术在国内实际应用。
杨浦区委常委、常务副区长尼冰介绍了杨浦区的独特区情,包括百年工业、大学、市政和根脉的传承,以及创新发展的道路和成就。该区在数字经济、智能制造、创意设计、人工智能等领域取得显著进展,吸引了众多在线新经济企业入驻。杨浦区致力于打造温暖的营商环境,吸引了大量优秀人才和企业落户,成为创新创业的热土。
在主题发言一:基础通用大模型·自研与创新中,百川智能联合创始人茹立云提到百川智能近日发布了其最新一代AI模型,被称为“百川二代”,标志着大模型时代的进一步发展。
智谱AI COO张帆表示,大型模型在多领域应用上表现出色,包括文本生成、信息抽取、媒体内容生产、人力资源等。智谱AI 强调其开放和灵活的商业模式,为企业提供API和云端私有化解决方案,引领AI商业化进程。
IDEA认知计算与自然语言讲席科学家张家兴指出,大模型技术的发展经历了模型结构创新、训练技术进步、算力提升和数据积累等过程,形成了“封神榜”等代表性大模型。此外,张家兴还强调了多模型协作训练的优势,通过该方法,小模型也能表现出色。
声智科技创始人兼CEO陈孝良指出,大型AI模型已在代码生成、医疗分诊、养老康健、智慧政务、能源调度、金融税务等领域取得显著进展。此外,多语言、音乐生成等多模态交叉学习应用正逐渐崭露头角。陈孝良强调,产业应更好地探索AI在各领域的潜力,促进技术创新与应用融合。
瑞莱智慧CEO田天表示,只有通过建通用AI模型能力,强化AI对齐,才能确保人工智能在实际应用中发挥作用,为人类社会带来更多福祉。
下午的大会由来自浙江大学Arclab实验室主任的陈文智教授主持。
在主题发言二:大模型时代的算力新基建的环节中,沐曦MetaX首席架构师付轩指出算力是人工智能的支撑,当前数据暴增,数据种类更加多样,算力需求与供给矛盾突显。值得注意的是,CPU+GPU异构计算引领数据中心计算新趋势。
摩尔线程联合创始人兼执行总裁王东表示,数字经济时代下,算力是拉动经济增长的核心引擎,中国算力指数全球第二,是算力领跑者国家。
登临科技联合创始人王平提到,数据中心是数字基础设施的核心要素,预计到2025年数据中心提供算力总规模将达400EFlops。同时,他指出,数据中心发展出现了集群化、集约化,绿色低碳成为发展新焦点,智算需求爆发三点新变化。
墨芯人工智能创始人兼CEO王维强调稀疏计算最具发展潜力,稀疏计算将是学术和行业巨头的重点研究方向。同时,他还对比了人类大脑与GPT-3.5大模型的计算速度。
清微智能联合创始人兼CTO欧阳鹏指出,数据流计算方式成为解决大模型算力问题的趋势,数据流式架构本质是解决大模型算力芯片日益凸显的三个问题,即提高单位晶体管算力、解决通信墙成本高和减少访存墙瓶颈。
主题大会三围绕“垂直大模型应用、机遇与挑战”展开探讨。医渡科技CTO、首席人工智能科学家闫峻就医疗垂直领域大模型发表主题演讲。他表示,数据、算法、算力是人们熟知的影响大模型的关键要素,而对垂直行业来讲,应用场景也非常重要。大模型的引入在院端科研、管理、临床辅助,政府公共卫生,患者服务,生物制药,健康保险等场景都将产生十分积极的影响。
华鲤智能科技创始人、CEO李津介绍了数字劳动力在金融领域的应用。“生成式AI有望为全球经济贡献约7万亿美元的价值”,李津表示,基于大模型能力的数字劳动力“数字员工”将全力激活人效潜能。到2030年,数字化劳动力将形成一片价值1.73万亿元的蓝海。
感易智能董事长胡殿明表示,高价值、高质量的数据是大模型应用投产的前提。胡殿明介绍了大模型在训练、推理、答案和应用四个阶段要解决的关键问题。他指出,在训练阶段要增强泛化能力,在推理阶段要增强任务精度,在答案阶段要对齐生成质量,在应用阶段要建立数字闭环,以此将海量、多源、异构数据映射到大模型较小的上下文窗口,进行统一的构建与编排。
松应科技创始人聂凯旋以“AI+协作定义3D内容生产新范式”为题发表演讲。他表示,3D垂直领域的AIGC需要有效解决内容生产的效率和质量,而庞大的数据资产质量是影响未来3D内容生产的关键要素。“3D内容数据总量远少于2D或文本,仅为其万分之一,但3D内容数据的复杂程度却远远高于2D”,聂凯旋介绍到,基于这些痛点,松应科技打造了中国首款云原生3D智能协作平台Orca Studio。他表示,AIGC不是完全替代传统的工作流,而是融入并提升效率。
基于自身探索与实践,熵简科技创始人费斌杰讲述了大语言模型对金融投研领域的影响。他表示,金融投资研究依赖大模型的可靠性,而这正是一个有待突破的问题。针对一些专业问题,大模型和专家的回答可能相距甚远。他表示,研究报告、会议纪要和深度投研指标中有很多金融投研领域的专业语料,将这些语料库嵌入到大模型中,是非常有价值的。
在主题发言四:资本共话·大模型的创新与未来中,启赋资本创始合伙人傅哲宽从大模型的用途、投资方向和应用场景等方向与大家展开探讨。傅哲宽站在投资人的角度跟大家分析了当前大模型的投资方向。目前在投资机构的眼中,一般的创业公司在大模型领域是缺少机会的,不仅是人才和资金方向,更重要的是数据层面的积累。
慕华科创创始合伙人张妤以AI2.0时代的投资和思考为主题,从投资人的角度跟大家深入探讨了大模型发展遇到的问题和未来发展的趋势。她表示大模型的发展就如同之前几次工业革命的历程一样,一定会碰到困难,但是问题也一定能解决。 她将AIGC产业比作“夜空下最善良的星”,认为我国AIGC产业规模的爆发式增长将会提前到来。张妤认为国内模型创业才刚开始,但头部效应已经显现,其中应用层的交易最为频繁。这种高频融资的背后反映的是优质的投资标的的稀缺。
创新工场执行董事王震翔就AIGC时代大模型发展与落地趋势为主题,分享了自己在投资领域对大模型的一些理解和展望。王震翔表示近几年自然语言实现了从感知智能到认知智能的巨大突破,大规模预训练模型时代已经到来。他详细讲述了预训练模型的发展脉络和分发方式,并认为预训练模型作为NLP的基础设施应该是易获得、高效能的。
本次大会以线上线下相结合的形式召开,引起社会各界广泛关注及热烈反响。大会通过专家学者与产业界代表的深度对话,搭建学术理论研究和产业实践应用的桥梁,助力大模型产业的蓬勃发展。