今日AI热点新闻
1.马斯克的xAI发布API,开发者可将Grok集成至其他应用
2. Meta为WhatsApp开发AI聊天记忆功能
3. 谷歌整合AI战略:Gemini将并入DeepMind,强化AI竞争力
4. 微软推出AI工具,推动企业效率与创新
5.霍尼韦尔携手谷歌云,将生成式AI Gemini应用于工业领域
6. 快手分拆AI芯片业务,凌川科技与镕铭微展开VPU竞争
7.北京新增12款生成式AI服务备案,总数达94款
8.智源研究院发布多模态模型Emu3,革新AI生成范式
马斯克的xAI发布API,开发者可将Grok集成至其他应用
10月22日,伊隆·马斯克旗下的人工智能公司xAI正式发布其应用程序编程接口(API),开发者现可将xAI的人工智能工具Grok集成到各种应用程序中。
这一消息由马斯克在周一通过社交媒体公布,同时xAI公司在其官方网站上也发布了API的相关链接。早在今年8月,马斯克曾确认将为Grok推出API,并在今年3月公开了该软件的模型权重。
想要访问和使用该API,用户需登录xAI账号,并在个人资料设置中选择“Request Access”选项来申请使用PromptIDE和API。目前API支持的模型名为“grok-beta”,其收费标准为每百万输入token收费5美元(约合人民币35.6元),每百万输出token收费15美元(约合人民币107元)。
此外,API还支持函数调用功能,使Grok能够与数据库、搜索引擎以及其他外部软件工具实现集成。【来源:IT之家】
Meta为WhatsApp开发AI聊天记忆功能
10月21日消息,Meta正在为其聊天平台WhatsApp引入一项新的功能,赋予内置的Meta AI机器人“记忆”能力。据《AndroidAuthority》报道,这一功能将允许聊天机器人记住用户过去提供的信息,比如食物偏好、生日和个人兴趣等,并根据这些细节定制未来的回复。
用户将拥有对这项记忆功能的完全控制权,可以随时更新或删除保存的信息。虽然Meta尚未确认这项功能的具体细节或发布时间表,但它有望在未来进一步提升WhatsApp的用户体验。
谷歌整合AI战略:Gemini将并入DeepMind,强化AI竞争力
10月21日,谷歌宣布了重大的管理层变动和AI团队整合计划。尼克·福克斯(Nick Fox)将接替普拉巴卡尔·拉加万(Prabhakar Raghavan),成为谷歌搜索与广告业务的负责人,而拉加万将在领导该核心部门四年后转任首席技术专家。福克斯自2003年加入谷歌以来,一直在推动Assistant产品的设计与开发,此次升任标志着他将在公司内部承担更大的责任。
与此同时,谷歌宣布其AI项目Gemini团队将并入由德米斯·哈萨比斯(Demis Hassabis)领导的DeepMind部门。这一战略整合旨在集中AI资源,增强Gemini模型的研发能力,以更好地应对来自OpenAI和Anthropic等竞争对手的压力。
过去半年中,谷歌一直在重组AI部门,先是在4月将模型、研究与AI团队并入DeepMind,并随后与Google Brain合并。此次Gemini团队的加入将进一步增强DeepMind的整体实力,形成更为强大的AI「超级单元」。哈萨比斯曾表示,谷歌的目标是创造下一个突破性技术——类似Transformer的进展,并通过AlphaGo和Gemini的合作实现AI技术的新飞跃。【来源:ITBears】
微软推出AI工具,推动企业效率与创新
10月21日,微软公司宣布推出一套全新的AI工具,旨在帮助用户更高效地发送电子邮件、管理记录及执行日常任务。这些工具的发布标志着微软在AI领域的进一步突破,并与Salesforce等竞争对手展开激烈竞争。
据微软透露,已有60%的《财富500强》企业开始使用Microsoft 365 Copilot来加速业务成果并提升团队效率。美国电信公司Lumen Technologies预计,通过Copilot每年可节省5000万美元的成本。而霍尼韦尔公司更是将生产力提升效果比作增加了187名全职员工。英国的金融软件公司Finastra则通过AI将创意制作时间从七个月缩短至仅七周。
这一系列AI工具的推出,显示出微软在提升企业生产力方面的雄心,也为各行业提供了创新的智能化解决方案。
霍尼韦尔携手谷歌云,将生成式AI Gemini应用于工业领域
10月21日,霍尼韦尔(Honeywell)宣布与谷歌云(Google Cloud)达成合作,计划将谷歌的生成式人工智能模型Gemini引入工业领域。霍尼韦尔是一家多元化高科技和制造企业,业务范围涵盖航空产品、楼宇与工业控制技术、汽车产品、涡轮增压器以及特殊材料等。
霍尼韦尔首席执行官指出,生成式人工智能有望帮助公司应对工业领域的劳动力短缺问题。通过这次合作,霍尼韦尔正在探索如何在网络边缘使用Gemini Nano,在设备如扫描仪、传感器和控制器上提供自主运行的AI服务,即便这些设备不连接互联网,仍可依托AI提供智能化功能。
Gemini模型的多模态功能支持处理文本、代码、图像、视频和音频,使霍尼韦尔的设备能够在各种数据类型下提供智能解决方案。根据谷歌云的计划,首批基于Gemini的解决方案将于2025年面向霍尼韦尔客户推出,助力工业设备提升数据处理和操作效率。【来源:IT之家】
快手分拆AI芯片业务,凌川科技与镕铭微展开VPU竞争
10月21日消息,快手宣布将旗下异构计算与芯片事业部分拆为独立公司凌川科技,专注于开发下一代AI大模型训推一体芯片。目前,快手仅持有凌川科技24.12%的股权。凌川科技的自研VPU(视频处理单元)和NPU芯片主要应用于视频在线转换和处理,已与多家互联网巨头达成合作或进入测试阶段。
据知情人士透露,分拆前凌川科技的部分产品已实现量产,并在快手内部大规模使用,帮助公司节省了数十亿元的成本。随着团队的扩展,凌川科技的员工数量已从最初的30余人增长至100多人。当前,凌川科技正积极进行VPU芯片的融资工作,以进一步推进视频处理技术在业内的应用与发展。【来源:新流研究】
北京新增12款生成式AI服务备案,总数达94款
根据《生成式人工智能服务管理暂行办法》,截至10月21日,北京市新增12款已完成备案的生成式人工智能服务,累计备案数量达到了94款。根据规定,所有上线的生成式人工智能应用或功能必须在显著位置或产品详情页面公示所使用的已备案生成式人工智能服务的相关信息,包括模型名称和备案编号,以确保透明度和合规性。
智源研究院发布多模态模型Emu3,革新AI生成范式
10月21日,智源研究院发布了其原生多模态世界模型Emu3。该模型无需使用扩散模型或组合方法,仅通过基于下一个token的预测机制,即可在文本、图像和视频等多种模态数据的生成与理解任务中取得突破性表现。Emu3超越了多个知名开源模型,包括SDXL、LLaVA和OpenSora等,在图像生成、视频生成和视觉语言理解等任务中取得优异成绩。
值得注意的是,Emu3在不依赖扩散模型、CLIP视觉编码器或预训练大型语言模型(LLM)的情况下,依然能高效执行任务。智源研究院已将Emu3的关键技术和模型开源,为开发者提供了更多的创新机会。【来源:IT之家】