设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了

2023-12-17 23:27:03 来源:

  谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  科技巨头谷歌的新大模型Gemini一夜爆红,受到市场看好,但有分析指出,谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  当地时间12月6日,谷歌宣布推出“最大、最强、最通用”的新大型语言模型Gemini。Gemini将是首个直接在手机上运行的大模型,被应用于谷歌Pixel 8 Pro智能手机和聊天机器人Bard。Gemini被视为对于AI(人工智能)新锐巨头OpenAI旗下最新大模型GPT-4的直接回应,也象征着一度因聊天机器人ChatGPT而处于被动状态的谷歌终于正式冲回赛道。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  据谷歌介绍,Gemini在MMLU(大规模多任务语言理解)的得分率达到90.0%,是第一个在MMLU测试中超过人类专家的模型。Gemini将包括一套三种不同规模的模型,其中,Gemini Ultra被定位为GPT-4的竞争对手,Gemini Pro的性能优于GPT-3.5,Gemini Nano则用于特定任务和移动设备。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  凭借强大的性能,Gemini一夜爆红,引来了华尔街的关注。12月7日,谷歌母公司Alphabet(Nasdaq:GOOG)的股价涨5.31%,收于136.93美元,迎来自今年8月29日以来表现最好的一天,总市值达到1.72万亿美元。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  美国银行的分析师在6日指出,由于人们对于谷歌的AI能力感到担忧,Alphabet今年承受了一定的压力,而一款“具有良好品牌形象的、竞争力较强的模型”可能会吸引更多消费者使用谷歌搜索,并对云服务的销售产生积极影响:“数据显示谷歌拥有一流的、不可复制的AI能力,这可能对公司在2024年上半年的股票走势产生积极影响。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  摩根大通的分析师在6日的一份报告中写道,尽管市场在当天没有对Gemini给出明显的反应,能够看到谷歌在“这一主要技术转变”中的进展还是十分“鼓舞人心”。然而,摩根大通也指出,大模型在“搜索领域的货币化路径存在不确定性”,可能会在未来带来一些阻力。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在7日的报告中,摩根大通的分析师写道:“虽然现在还处于其发展早期,但Gemini的推出象征着在生成式AI获得广泛商业化并得到广泛传播的第二年中,谷歌做出了重大创新。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  目前看来,谷歌如何在整体业务、尤其是最重要的搜索业务中将Gemini进行商业化是备受华尔街关注的一点。目前,谷歌计划在本月晚些时间通过谷歌云将Gemini授权给客户,并将在未来几个月与谷歌服务中的其他产品集成,但还没有公布后续的商业化策略。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  富国银行(Wells Fargo)的分析师表示,Gemini的推出应该足以平息关于“谷歌在AI领域究竟应该何去何从”的争论,不过,关键问题在于谷歌如何利用Gemini获得营利:“简而言之,我认为谷歌证明了他们仍然具有一些竞争力。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  而KeyBanc的分析师也表示,Gemini是谷歌今年众多AI公告的“顶峰”,但要让AI对谷歌的业绩增长和盈利能力产生积极影响需要时间:“Gemini仍在努力进入搜索等核心产品,因此我们建议耐心观察其影响。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  不同于华尔街的整体看好,在科技领域中有声音指出,Gemini或许存在“夸大宣传”的质疑。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在Gemini于6日推出后不久,就有网友指出了宣传资料中的一些不妥之处。例如,当谷歌称Gemini的MMLU的得分率高于GPT-4时,显示GPT-4的得分率是86.4%,但根据谷歌发布的60页技术报告,Gemini Ultra的MMLU测试结果下有“CoT@32”的小字注释,表示其使用了思维链提示技巧,尝试了32次并从中选择最好结果。而作为对比的GPT-4却是无提示词技巧给5个示例,在这个标准下,Gemini Ultra的测试结果其实是83.7%,低于GPT-4的86.4%。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  如果是同样使用CoT@32的方法,虽然成绩仍低于Gemini Ultra,GPT-4的得分率达到了87.29%。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  如果像谷歌DeepMind首席科学家杰夫・迪恩(Jeff Dean)回应的那样,这种写法只是为了显示两种不同方法间的比较,对于Gemini测试视频的质疑则显得更加难以反驳。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在推出Gemini后,谷歌发布了一个时长六分钟的演示视频,展现了测试员和Gemini的一些有趣互动,其中包括让Gemini识别图片并用多种语言描述、让Gemini利用一张地图设计智力问答、和Gemini玩杯子游戏和推理小游戏等等。在整个过程中,Gemini的反应速度都非常快,还会生成音频和图片来辅助回答,并用上一些口语化乃至幽默化的表达,可谓是让人大开眼界。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  然而,很快就有网友从视频开篇的文字免责声明中发现了问题,认为其可能暗示了视频中展示的是精心挑选的好结果,不是实时录制,而经过剪辑的。随后,谷歌在一篇博客文章中解释了多模态交互过程,基本上也间接承认了只有使用静态图片和多段提示词拼凑,才能达成演示视频中的效果。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有分析指出,这和谷歌在视频中所暗示的可以说是完全不同,因为从视频看来,Gemini可以实时观察周围的世界并做出反应,用户可以与Gemini进行流畅的语音对话。沃顿商学院教授伊桑・莫利克(Ethan Mollick)也在X平台上进行了演示,如果是使用静态图片和多段提示词,完全可以通过ChatGPT Plus来复制Gemini的表现。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  在质疑发酵后,谷歌DeepMind产品副总裁伊莱・柯林斯(Eli Collins)对外媒回应称,视频中的画鸭子演示(画一个鸭子的简笔画,Gemini可以对每一步骤做出正确的解释)确实是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔・维尼亚尔斯(Oriol Vinyals)也在X(原推特)平台上发布长文,解释了团队是如何制作该视频的:“视频中的所有用户提示和输出都是真实的,只是为了简洁而进行了缩短。”维尼亚尔斯还表示:“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  然而,维尼亚尔斯的回应引发了更多的争议。有网友评论道:“如果你想激励开发者,为什么不发布真实的内容呢?被缩短的用户提示就不算‘真实’。这样做既不真诚,又具有误导性。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有谷歌员工对外媒透露,他们认为这段视频描绘了一幅“不切实际的画面”。有员工表示,对这种夸张的演示并不感到惊讶,因为员工们已经习惯了公司会对产品在某种程度上进行夸大营销:“我认为大多数使用过大语言模型技术的员工都知道,要对(演示中的)这一切持保留态度。”tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  有外媒认为,谷歌“庞大的官僚体系和各级产品经理使其直到现在都无法像OpenAI那样敏捷地推出产品”。对于正在应对AI转型影响的社会而言,这并不是坏事。但对于谷歌最近这种迅速推进的表现,应该保持一定的保留态度。tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

  记者 胡含嫣tiK流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:谷歌大模型爆红后被质疑造假!承认演示视频剪辑过:为了简洁缩短了http://www.llsum.com/show-5-3916-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 加拿大对国际留学生提高生活费存款要求

下一篇: 克里米亚东部一天然气管道起火 约3万居民生活受影响

热门资讯

  • 外媒:研究称未来10年AI对美国经济影响将达万亿美元

      中新经纬1月11日电 据《华尔街日报》中文网11日报道,据Cognizant Impact周三发布的一份研究报告称,在未来10年内,生成性人工智能对美国经济的影响力将达到惊人的1万亿美元,

  • 春节假期全国安全形势总体平稳 较大事故起数同比下降75%

      春节假期全国安全形势总体平稳  未发生重大灾害事故,较大事故起数同比下降75%  本报北京2月18日电 (记者王冬梅)今年春节假期长、人员流动多,全国应急管理系统全力做

  • 国家粮食和物资储备局紧急部署做好寒潮雨雪天气应对工作

      国家粮食和物资储备局紧急部署做好寒潮雨雪天气应对工作  中新网北京2月18日电 (记者 陈溯)据气象部门预测,近期我国出现大范围寒潮雨雪天气,中央气象台18日将寒潮预警

  • 春节假期武铁发送旅客511万人次

      春节假期武铁发送旅客511万人次  中新网武汉2月18日电 (记者 张芹)记者18日从中国铁路武汉局集团有限公司(以下简称“武铁”)获悉,2024年春节假期,武铁共发送旅客511万

  • 中国消费者“点燃”奢侈品市场

      买买买!去年中国奢侈品市场达到6077亿元,约占全球22%   中国消费者“点燃”奢侈品市场  羊城晚报记者 陈泽云  中国人“买买买”奢侈品的热情和实力又回归了!  近

  • 牵住“牛鼻子” 京津冀协同发展迈向更高水平

    “首都南大门”保定,中创燕园在这里新扩建的厂房已完成装修,北京大学物理学院的专家每周都前来开展研发工作,这是“北京研发,保定落地”的一个缩影;海河

  • 甘肃成县:务虚求实明方向 凝心聚力鼓干劲

    中国经济导报 中国发展网讯 2月20日,龙年春节热闹欢乐的氛围还未散去,甘肃成县就以开局就是决战的干劲、起步就是冲刺的拼劲的崭新面貌召开2024年工作务虚会,

  • 巴安水务转让资产遭一董事反对 公司称“执行”与本次交易无关

      巴安水务转让资产遭一董事反对 公司称“执行”与本次交易无关  2月22日晚,巴安水务(300262.SZ,股价2.17元,市值14.53亿元)公告称,为改善公司经营和财务状况,缓解公司资金需

  • 欧盟为网络平台立规矩

      欧盟为网络平台立规矩  在社交媒体上观看喜爱的“网红”晒美食、逛商圈、秀时尚单品,已经成为许多网友的一种休闲活动。殊不知,在许多“网红”刻意营造的“惬意”生活方

  • 2024年北京将开通运营3条地铁线路

      2024年北京将开通运营3条地铁线路  昨天,北京市重大项目建设指挥部召开轨道交通建设工作动员部署会。北京青年报记者从会上获悉,《2024年北京市城市轨道交通建设计划》

  • 春节档还是挣钱的好档期吗?

      春节档还是挣钱的好档期吗?  中新网北京2月23日电(记者 张曦)2024春节档已进入尾声。  如果要用一个词来形容今年的表现,无疑是“魔幻”。  一边是80.16亿创纪录的

  • 自然资源部:22个省级国土空间规划已获批准实施

      自然资源部:22个省级国土空间规划已获批准实施  中新社北京2月22日电 (记者 庞无忌)中国正加速推进各级国土空间规划编制实施。  中国自然资源部22日透露,截至目前,所

推荐资讯

  • 四川松潘希尔顿逸林酒店签约

    近日,松潘希尔顿逸林酒店项目在川主寺镇签约。酒店位于川主寺镇日渣路1号,项目由松潘名轩文化旅游发展有限公司投资建设。酒店占地89.78亩,建筑面积约3.5万平方米,共有458间(套)客

  • 韩国乐天集团决定出售沈阳乐天城项目

      近日,据业界消息,乐天集团决定将中途停建的沈阳“乐天城”项目出售给沈阳市皇姑区一国企。这距离该项目因“萨德”矛盾被中断已过8年。据消息,乐天集团已与沈阳皇姑诚信发

  • 新濠博亚娱乐集团与石基集团达成合作

    4月28日,新濠博亚娱乐有限公司(以下简称:新濠)与石基集团(以下简称“石基”)达成合作,选择石基企业平台推动其全球度假村的数字化转型升级。新濠在亚洲和欧洲拥有并经营多个综合性

  • 千味央厨:2023年实现营收19.01亿元,同比增长27.69%

    4月28日,千味央厨披露2023年年度报告。2023年,公司实现营业收入19.01亿元,同比增长27.69%;归母净利润为1.34亿元,同比增长31.43%。其中2023年因股权激励产生的费用为1791.08万元,

  • 鄂尔多斯市首家智慧酒店开建,计划投资5亿

    据东胜商务微讯消息,近日,内蒙古自治区鄂尔多斯市首家智慧酒店——康泰智慧酒店在东胜区全面开工建设。该项目位于东胜区广场街南、科技街北、东环路东(汽车站南),占地面积17655.

  • 荣盛发展:2023年酒店方面营收6.96亿元,同比增长27.42%

    4月29日,荣盛发展(002146)披露2023年年报。2023年,公司实现营业总收入589.60亿元,同比增长84.87%;归母净利润3.85亿元,同比扭亏;扣非净利润3.19亿元,同比扭亏;经营活动产生的现金流量

  • 走近名家日常,回忆一个时代

    《近处看名家》是由一位资深编辑倾情撰写的与名家交往故事的散文集。在书中,通过一位资深编辑的回忆,便可走近一个时代的大家风采,走近杨宪益、铁凝、

  • 途牛:五一假期国内长线游,出境游火爆

      5月5日,途牛旅游网发布《2024五一出游消费盘点》。《报告》数据显示,“五一”假期,一线、新一线城市用户的出游热情更高,出游人次占比达69%,北京、上海、南京、成都、广州、

  • 古兜控股(08308)2023年收入5268.4万元,同比增加25.74%

    近日,古兜控股(08308)发布截至2023年12月31日止年度业绩,该集团期内取得收入5268.4万元(人民币,下同),同比增加25.74%。公告称,收入增加主要由于集团的温泉度假村及酒店营运业务

  • 锦江酒店(中国区)成立度假公寓事业部、中高端业务部

    近日,在锦江酒店(中国区)的2024年度会议上,锦江酒店(中国区)CEO王伟首次公布公司全新品牌战略。此轮品牌架构优化中,还特别成立了独立的度假公寓事业部,形成以覆盖不同细分市场的暻

  • 第二家马拉斯卡酒店将于7月亮相泰国苏梅岛

    5月7日消息,马拉斯卡酒店及度假村(Marasca Hotels & Resorts)的全新度假酒店——马拉斯卡苏梅酒店(Marasca Samui)将在7月正式开业。马拉斯卡酒店及度假村由那莱酒店集团(Nar

  • 许鞍华:仍有想法 还想拍下去

    北京大学教授戴锦华评价导演许鞍华是“香港半部电影史”,“她是我最尊敬的女导演,没有之一。”在有关许鞍华的纪录片《好好拍电影》中,有一个段落是许

  • 日榜
  • 周榜
  • 月榜