浙江大学DeepSeek系列公开课|第二期 DeepSeek模型优势:算力、成本角度解读

随着DeepSeek等先进人工智能大模型的不断涌现,其在逻辑推理、数学计算、复杂问答任务等类人能力方面展现出了强大的潜力。然而,随之而来的算力成本问题,已成为制约人工智能大模型技术进步与商业化落地的核心瓶颈。本报告将深入解析算力的基本概念,梳理大模型对算力需求的特征,探讨DeepSeek在面对算力被卡脖子的国情下,如何与人工智能系统进行优化配合,并对未来发展趋势进行前瞻性展望。
报告嘉宾:王则可研究员
浙江大学“百人计划”研究员,隶属于浙江大学计算机与科学技术学院人工智能研究所、人工智能协同创新中心。创建浙江大学 RC4ML实验室,主要研究方向是使用异构硬件搭建低成本、高性能人工智能大模型系统LoHan,曾获得2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖、华为火花奖、2023年度国际超算比赛IndySCC第一名。
报告摘要
随着DeepSeek等先进人工智能大模型的不断涌现,其在逻辑推理、数学计算、复杂问答任务等类人能力方面展现出了强大的潜力。然而,随之而来的算力成本问题,已成为制约人工智能大模型技术进步与商业化落地的核心瓶颈。本报告将深入解析算力的基本概念,梳理大模型对算力需求的特征,探讨DeepSeek在面对算力被卡脖子的国情下,如何与人工智能系统进行优化配合,并对未来发展趋势进行前瞻性展望。















