专题:第六届外滩金融峰会:尚福林、易纲、刘尚希等重磅嘉宾出席麻豆 孤注一掷
“委果作念大模子的公司,若是你一万张卡王人莫得,你就根底不要讲我方是在干大模子的公司。”
通用东说念主工智能时期,咱们对大模子应该有怎样的念念考?9月5日,在2024Inclusion·外滩大会上,提到东说念主工智能、大模子如何深入产业时,香港科技大学校董会主席、好意思国国度工程院外籍院士沈向洋抛出了这个问题,洽商未来东说念主工智能、大模子如何才气深入产业。
在这个问题上,沈向洋合计,最热切的是三件事情:算力、算法、数据。
“讲卡伤表情,没卡没表情”,沈向洋共享了一组数据,从2012年开动,每年大模子需要的算力王人在增长,一开动几年是六七倍的增长,最近几年踏实下来,每年是四倍傍边的增长。而跟着大模子的参数越来越大麻豆 孤注一掷,大模子对算力的条件仍是由线性增前程化到往常向的增长。如今,算力仍是是大模子落地的门槛,“委果作念大模子的公司,若是你一万张卡王人莫得,你就根底不要讲我方是在干大模子的公司。”
讲起“卡”,沈向洋暗示,咫尺系数这个词设想机芯片行业的发展,从正本的摩尔定律变成了黄氏定律。畴昔是CPU的增长,摩尔定律是指每18-24个月,设想才略翻倍。咫尺是GPU的算力一年涨4倍。东说念主类社会的设想才略呈现了一种超等跃进趋势。
这也卓著了数据的热切性。“GPT3刚出来的时期是2个T的token,GPT4刚出来的时期是12个T傍边的数据,自后还在不休地加数据检修,咫尺咱们猜GPT4是20T的数据。民众在敬敏不谢等GPT5出来,到底要用若干的数据?”沈向洋给出的推断是200个T的数据,但如今的互联网要挖出200T的数据仍是胁制易了。沈向洋嗟叹,互联网40年积贮的数据,亚洲成人论坛似乎即是为了一个AI时刻。
沈向洋合计,大模子的下一章要从言语模子到多模态发展。尽管Sora仍是作念得可以,但多模态大模子仍不够渊博。他强调,大模子未来一定要往具身智能走,往机器东说念主走,自动驾驶即是一种机器东说念主的止境步地。
跟着大模子的发展,沈向洋提议,未来大模子将横扫系数垂直行业。大模子可分为通用大模子、行业大模子、企业大模子和个东说念主大模子。通用大模子约莫是万亿参数,万卡检修。行业大模子约莫上是千亿参数、千亿卡的检修畛域。企业大模子可能只需要100张卡、百亿参数。而个东说念主大模子最被沈向洋期待,比如祈望、微软推出的AIPC,苹果堪称的Apple Intelligence,诓骗个性化参数,相连云和端,王人被沈向洋视作有道理的尝试。
同期,沈向洋也强调了AI解决的热切性。他暗示,咫尺AI可能对民众、公司、政府监管乃至社会发展的冲击王人在激励民众的担忧,接下来全球各个国度一定要作念主权东说念主工智能,主权东说念主工智能背后一定要有一个主权云来维持其发展,通过国度维持东说念主工智能基础关键斥地,用相宜本国文化和念念维形势的数据检修大模子,维持腹地家具造成生态系统。
而关于业内备受温文的AI agent(智能体),沈向洋的不雅点是,agent从愿景到落地的过程中,需要恒久以需求为圆点,久了意会模子的才略,并构建一个AI深度参与的职责进程。他判断,AI agent时期的到来,不会是一个神奇而渊博的模子倏得代替了原有的职责流,它触及期间、工程与商场的不休磨合,最终以超预期的工作呈现给东说念主类。
新浪声明:系数会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之倡导,并不料味着赞同其不雅点或证据其描绘。
海量资讯、精确解读,尽在新浪财经APP拖累剪辑:李昂 麻豆 孤注一掷
哥要色