OpenAI公布2024年计划 机构:续看好大模型千行百业落地机遇

智通财经APP获悉,近日,OpenAI联合创始人兼首席执行官Sam Altman在社交平台公布,AGI(稍晚一些)、GPT-5、更好的语音模型、更高的费率限制;更好的GPTs;更好的推理能力;对唤醒/行为程度的控制;视频模型;个性化;更好地浏览;开源,将是OpenAI在2024年要实现的目标。根据最新财报显示,OpenAI在人工智能领域的市场份额和营收持续增长。此次公布的目标显示出该公司在未来一年内的野心和计划,尤其是在AGI和GPT领域的发展上。据了解,关于GPT-5最早的消息,要追溯到今年的7月31日。当时一位名叫Josh Gerben的商标律师,代理了OpenAI申请GPT-5的商标信息。公开信息显示,OpenAI是在7月18日提交的申请,GPT-5提供的功能包括自然语言处理、文本生成、理解、语音转录、翻译、预测和分析等,实际发布功能可能会有变动。与此同时,OpenAI在融资方面亦取得了显著的成就。今年1月,微软再次向OpenAI注资100亿美元,这进一步巩固了OpenAI的实力。除此之外,OpenAI在4月还成功融资超过3亿美元。有消息称,OpenAI的估值有望达到800-900亿美元。同时,公司还计划组织一轮要约收购,以吸引外部投资者从员工手中购买股份。这显示出OpenAI在融资方面有着强大的能力。另据12月25日最新消息指出,OpenAI正以1000亿美元或更多的估值寻求新一轮融资,同时与G42洽谈数十亿美元的芯片合作计划。有业内人士认为,OpenAI的持续高资本投入和融资成功,是其在AI领域取得领先地位的重要原因之一。未来,OpenAI有望实现更多的资本募集,以支持其发展壮大。而作为OpenAI的竞争对手,谷歌于近日宣布发布新一代大模型Gemini,这也再次引发市场对人工智能产业的持续关注。据悉,Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在性能上是第一个在MMLU上超越人类专家的模型。模型根据体量大小分为Gemini Ultra、Gemini Pro、以及Gemini Nano三个版本,支持在云端以及边缘测运行。同时谷歌同步发布最新版本的计算芯片TPU v5p,相较上一代TPU v4性价比提升2.3倍。中信证券认为,多模态Gemini模型的正式发布,一方面可以拓宽应用场景的拓展,另一方面能够带来算力需求的持续升级。为此,持续看好后续AI产业的前景,认为后续GPT-5等模型的发布亦将带来更多的催化。谈及未来大模型的发展趋势,科大讯飞董事长刘庆峰表示,接下来大模型的进化方向有3个,首先还是需要更大的模型参数,有算力可支持上万亿浮点参数(GPT-4的模型参数在1.8万亿左右)的训练,这对大模型来说是基本盘。其次,要打造AI人设,让AI可以主动问答,特别是能进行启发性、引导性的提问。最后,大模型要在各个行业场景内做更纵深的定制和服务,把大模型的多模态能力、后台的知识学习表达能力跟各个场景深度融合。12月25日,IDC咨询联合钉钉发布《2024 AIGC应用层十大趋势报告》。据报告预测,2023年全球企业将在生成式人工智能解决方案上投资160亿美元,到2027年,支出预计将超过1400亿美元,年复合增长率超过70%,几乎是同期全球IT支出年复合增长率的13倍。AIGC的创新商业模式也将不断出现,到2024年,全球2000强企业的33%将利用新商业模式,使AIGC的货币化潜力翻番。报告称,未来,将会由少数大型厂商领衔基础大模型的训练和迭代工作,而大量的跟进者将聚焦于大模型基础之上的应用场景和行业工具平台;从投资收益的角度看,具备广阔增长空间的领域恰恰是AI赋能的长尾场景创新应用层的开发。中信证券研报指出,通用大模型追求高泛化能力,可以高质量完成自然语言理解和生成任务。基于底层Transformer,模型形成三大主流技术路线,OpenAI的GPT模型采用解码器路线,得到广泛关注和认可。海外大模型技术保持高速推进,以视觉能力为核心的大模型多模态能力不断展现,模型视觉理解和生成能力快速发展,有望带来广阔市场机遇,推动AI商业化进程加速和市场天花板打开。中信证券持续看好大模型千行百业的落地机遇,建议关注相关领域AI公司。相关概念股:百度集团-SW(09888):10月17日,百度推出了文心大模型4.0,并称这是迄今为止最强大的文心大模型,综合能力与GPT-4相比不逊色。据介绍,百度文心大模型调用量居国内首位,日均调用量达数千万次,每月服务企业超过1万家;截至11月,文心一言用户数超过7000万,覆盖场景4300个。阿里巴巴-SW(09988):在11月9日召开的2023年世界互联网大会乌镇峰会“互联网企业家论坛”上,阿里巴巴集团CEO吴泳铭透露,阿里巴巴即将开源720亿参数大模型。商汤-W(00020):近日,商汤科技联合中国信通院云大所共同发布行业首个《大模型可信赖研究报告》。报告指出,目前,商汤SenseTrust相关技术已服务于“商汤秒画SenseMirage”文生图平台、“商汤如影SenseAvatar”数字人等多个产品,以及内容创作、大数据客户,以及银行安全系统。商汤也将持续通过“商汤AI安全治理开放平台”等多种形式,为行业提供AI治理公益技术服务,推动建设安全可信的人工智能产业生态。

抖音内测“AI搜”功能?抖音相关负责人:相关功能还在测试中 目前尚不成熟

一则“抖音测试‘AI搜’功能,可从抖音APP智能搜索总结答案”的消息在网络引发热议。综合多家媒体报道,抖音近日在APP内测试了一项新的功能,名为“AI搜”。这是一种基于人工智能的搜索问答服务,可以为用户提供回答。对此,抖音相关负责人对记者表示,相关功能还在测试中,目前尚不成熟。记者尝试使用这一功能,但发现自己的抖音APP内未显示。行业人士称该功能可能在灰度测试中,没有全量上线。

谷歌Gemini自曝用百度文心一言训练

钛媒体App 12月18日消息,今日有网友爆出,在对谷歌Gemini进行测试时,如果用中文询问Gemini的身份,其会坚称自己是“百度”。若输入“小度”或“小爱同学”等提示词,就能把Gemini直接唤醒,不仅承认自己就是小度或者小爱,还询问用户有什么需要帮忙之事。 对此,有关媒体进行了更细致的测试,其在谷歌Vertex AI平台使用Gemini进行中文对话,发现Gemini-Pro确实完全带入了百度文心一言大模型的身份,直接表示自己是百度语言大模型。但如果换成英文与之交流,它就恢复到了谷歌大模型的身份认知,表现很是正常。如果在融入了Gemini-Pro的Bard上进行测试,不论是使用中文或英文提示词,得到的答案都很正常,没有涉及到文心一言的部分。 今日下午,对Gemini-Pro做类似的身份测试时,发现其已进行了模型优化,不再承认自己与百度之间的“瓜葛”。不过,在追问之下,Gemini承认有训练语料来自百度,还详述了从百度内部获得数据的方式。截至发稿,百度方面尚未对此问题作出回应。(界面)

北京互联网法院审理全国首例“AI声音侵权案”

钛媒体App 12月13日消息,据北京互联网法院官微,12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案”。该案中,原告殷某某以配音为职业,曾录制多部有声作品。殷某某意外发现,自己的声音被AI化后,在一款名为“魔音工坊”的APP上以“魔小璇”的名义对外出售。因此,殷某某以被告行为侵害其声音权为由,将“魔音工坊”的运营主体北京小问智能科技有限公司等五被告起诉到北京互联网法院。在合议庭的组织下,各方当事人在庭审现场展开了激烈的辩论。涉案AI声音产品是否有原告合法授权?被诉行为是否侵权?如构成侵权,相应的损害后果如何?侵权责任又该如何承担?目前,该案仍在进一步审理中。

便携式AI系统可将大脑思想翻译成语言

钛媒体App 12月13日消息,据物理学家组织网11日报道,澳大利亚悉尼科技大学科学家开发出了首款便携式、非侵入性的人工智能系统,可解码无声的想法并将其转化为有形的文本。这项技术可帮助那些因疾病或受伤(包括中风或瘫痪)而无法说话的人进行沟通,也有望实现人与仿生手臂或机器人等设备之间的无缝通信。最新研究代表了将原始脑电图(EEG)直接翻译成语言的开创性努力,标志着该领域的一次重大突破。(科技日报)

业界预期多家PC品牌厂将于2024CES上推出首波AI PC产品

钛媒体App 12月12日消息,据台湾经济日报,2024美国消费电子大展(CES)将于明年1月举办,随着英特尔导入AI功能的PC芯片将于本周上市,以及英伟达有望于CES期间发表全新RTX 40 SUPER系列显卡,业界预期,宏碁、华硕、微星、技嘉等品牌厂都会在CES推出首波AI PC及电竞产品,象征AI PC暖身赛开打。 (科创板日报)

商汤:编程助手代码小浣熊即日起开放公测

钛媒体App 12月7日消息,商汤科技官微宣布,基于商汤自研大语言模型的智能编程助手——代码小浣熊Raccoon,即日起开放公测。据介绍,在实际应用中,代码小浣熊可帮助开发者提升编程效率超50%;未来,应用代码小浣熊,开发者可以将80%的编写工作交由AI完成。

知网AI生成文本检测专利公布,可检测文本是否为AI生成

钛媒体App 12月5日消息,天眼查App显示,近日,同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利公布。摘要显示,通过将待检测文本输入文本分类模型,得到文本为AI生成的第一概率值;基于待检测文本及目标损失函数,得到文本的偏离度特征;基于待检测文本、预测模型及预设字典,得到文本的扩散度特征值;基于待检测文本,得到文本的句子长度特征及字词分布特征;根据上述第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征,判定文本是否为AI生成文本。该专利不仅检测效率高,且不受审核人员的主观影响,检测结果更加准确。