TIME访谈:IBM首席执行官Arvind Krishna如何看待AI和量子计算

   日期:2025-03-14     作者:7p4mf       评论:0    移动:http://www.wrujm.cn/mobile/news/8354.html
核心提示:2月11日,在阿拉伯联合酋长国迪拜举行的世界政府峰会上,IBM首席执行官Arvind Krishna。IBM是20世纪计算机领域的巨头之一。它帮

图片

2月11日,在阿拉伯联合酋长国迪拜举行的世界政府峰会上,IBM首席执行官Arvind Krishna。


IBM是20世纪计算机领域的巨头之一。

它帮助设计了现代个人电脑,并创造了第一个在国际象棋比赛中击败人类冠军的人工智能。

但是,当你想到人工智能时,IBM可能不是你第一个想到的公司,甚至可能都不是你第十个想到的公司。它既不训练大模型,也不生产面向消费者的产品,而是专注于面向企业销售。

IBM首席执行官Arvind Krishna在最近接受《时代》周刊采访前开玩笑说“我们是一家B2B公司,向普通读者解释我们是做什么的,我们会接受所有能得到的帮助”。

不过,在这个历史悠久的企业内部,还潜藏着一个有趣的人工智能故事。

IBM的确在构建人工智能模型,但不是像OpenAI的GPT4-o或谷歌的双子座(Gemini)这样的大型模型,而是设计那种可以在高风险环境中使用的小模型,因为这种环境对准确性的要求很高。

随着人工智能业务愈加成熟,华尔街和硅谷投资者心目中一直有一个重要困惑:人工智能带来的经济收益会主要来自那些训练大型“基础模型”的公司(比如OpenAI)吗?还是会流向像IBM这种能够为公司量身定制最精简、廉价、准确模型的公司?行业的未来可能取决于此。”

二月初,《时代》周刊在授予Krishna“TIME100人工智能影响力奖”的颁奖典礼前采访了他。
为清晰起见,本访谈内容经过压缩和编辑。
Q1:
20世纪90年代,IBM打造了第一个击败人类冠军的国际象棋人工智能 “深蓝”。然后,在2011年,IBM的Watson第一个赢得了游戏节目《危险边缘》(Jeopardy!)。但如今,IBM并没有像OpenAI或谷歌那样训练大型人工智能系统。可以解释一下为什么决定在人工智能竞赛中退居二线吗?
纵观国际象棋和《危险边缘》,接受这些挑战是正确的。你选择了一个人们认为计算机做不到的事情,如果你能做到,那就传达了技术的力量。
我们就是在这里走火入魔的,选择开始建立被我称为 “单体”的系统,并开始说“让我们去解决癌症这样的问题”。
然而事实证明,这种做法是错误的。但癌症绝对值得我们去解决,所以我并不责怪团队当时的做法。
我们是以行医而闻名的吗?我们了解医院和协议是如何运作的吗?我们了解监管机构在该领域的工作方式吗?
答案都是否定的。

现在回想起来,真希望我们一开始考虑几分钟。

于是我们说,好吧,你可以制作越来越大的模型,它们需要的计算量也会越来越大。所以方案一是用十亿美元的计算量制作一个模型。现在,为了获得回报,你必须向大家收取一定的费用。

那么,我们能否将其简化为一个更小的模型?它可能不需要那么多的计算量,运行成本也低得多,但却适合商用。这就是商业视角的由来。

Q2:

但过去10年深度学习领域的一个重要启示似乎是,和“让人工智能系统专注于某一领域”相比,让它们成为通用型系统能让人工智能系统发挥更大作用,对吗?这就是所谓的 “惨痛教训”。

我可能会礼貌地表示不同意。如果你愿意接受只有90%准确率的答案,也许可以。但如果想控制一座高炉,它就必须100%准确。这个模型最好包含一些时间序列分析的概念。

它不是一台决定以某种方式通过直觉从《白鲸记》中得出答案的通用机器。所以,恕我直言,不行。如果你真的想去一些需要更高精度的地方,那么使用小模型可能会更好。

实际上,我相信会有一些非常大的模型,它们的训练成本将高达几十亿美元,甚至更多。同时,也会有成千上万的小型模型可以满足需要。

他们会利用大型模型进行教学,但不会真正利用其固有的知识。

Q3:

人工智能带来的主要经济效益是否将归于那些训练基础模型的最大公司?还是将这些模型应用于特定用例的小公司?

我认为这是一个确切的“和”,人工智能的比喻可能最接近互联网的早期。那么,在互联网上,问自己一个问题:它只对大公司有用,还是对小公司有用?

举两个相反的例子。如果我要建立一个视频流媒体业务,拥有的内容越多、能服务的人就越多,就可以获得网络效应和规模经济。另一方面,你有一个像Etsy这样的店面,突然间,那些一年只做两件商品的工匠也能在市场上占有一席之地,因为分销成本极低。

Q4:

您对这个问题的回答是如何影响您的业务方向的?

我们对此进行了深入思考。早在2020年,我们就曾说过:是否应该把所有投资都投入到建立一个大模型上?如果是大模型,运行成本就是模型规模的平方。

因此,如果有一个100亿参数的模型和一个1万亿参数的模型,运行超大模型的成本要高出1万倍。然后,大家会反过来问一个问题:如果它只比我的模型好1%,我真的愿意多花1万倍的钱吗?

在商业世界里,答案几乎都是否定的。

但如果能缩小10倍,那就非常值得了,因为这样就能降低90%以上的运行成本。这就是我们做出决定的原因。

Q5:

让我们来谈谈量子计算。IBM是量子领域的大投资者。你们在这方面的大战略是什么?

我们在十多年前就选择了量子作为投资领域。

得出的结论是:这是一个工程问题,而不是科学问题。当它成为一个工程问题时,就必须再问自己一个问题:你能解决两个基本问题吗?

首先,错误率确实很高,但普通计算机的错误率也很高。人们没有意识到有一些技术可以让它看起来没有错误,即使在我们所使用机器的最基本的层面上也存在着深层次的错误,它们会自行纠正,所以我们看不到它们。

其次,由于量子的本质是在量子水平上运行,极微量的能量就会导致所谓的相干性损失,所以它们不能长时间工作。

我们相信如果能接近一毫秒,就可以进行一些更加仔细的计算。

于是我们沿着这条路走下去,并在纠错方面取得了很大进展。

在相干时间上,我们大概达到了十分之一毫秒,还没有达到一毫秒。而我们认为在未来的三、四、五年(目标是到十年末),可以在这方面取得成就。

Q6:

如果能够实现在十年后取得巨大成就的目标,IBM将何去何从?这是否会使你在下一波技术浪潮中处于主导地位?

有硬件,就有使用硬件的人。

我先来讲这个,用它的人将是我们所有的客户。他们将获得价值,无论是材料发现、更好的电池、更好的肥料还是更好的药物,这些价值都将由我们的客户累积。

但是,谁能给他们一台可以工作的量子计算机呢?假设我所说的时间线和突破得以实现,我们将会在该市场中占据巨大优势和先发地位,以至于我认为我们将成为这些技术的实际答案。

 
特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

举报收藏 0打赏 0评论 0
 
更多>同类最新资讯
0相关评论

相关文章
最新文章
推荐文章
推荐图文
最新资讯
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号