今日AI热点新闻:
1.Midjourney 宣布发布 V6.1 图像模型,让事物看起来“更加美丽”
2.OpenAI 推出 ChatGPT 语音助手,解决安全问题后重新上线
3.Meta等公司联合提出元奖励语言模型,Llama 7B击败GPT-4
4.苹果CEO库克:开发人员开始测试AppleIntelligence
5.消息称TikTok成为微软AI服务最大客户之一,每月花费近2000万美元
6.消息称TikTok成为微软AI服务最大客户之一,每月花费近2000万美元
7.阿里巴巴将推出人工智能对话式采购引擎,预计9月发布
8.阿里通义免费开放奥运AI大模型
9.可灵AI官方打假:可灵AI目前没有App
Midjourney 宣布发布 V6.1 图像模型,提升图像生成质量和速度
今天,Midjourney 宣布推出了其最新版本的图像模型,V6.1。这一版本带来了多项新功能和改进,旨在进一步提升图像生成的质量和用户体验。
V6.1 版本的主要新功能包括:
- 更连贯的图像生成,涵盖手臂、腿部、手部、身体、植物和动物等多个细节。
- 图像质量的显著提升,包括减少像素伪影、增强纹理和皮肤细节等方面。
- 更精确、更详细、更准确的小图像特征,例如眼睛、小脸和远处的手等。
- 新的 2 倍升级器提供更高质量的图像和纹理。
- 标准图像生成速度提升约 25%。
- 改进的文本准确性,在处理“引号”绘制单词时表现更出色。
- 新的个性化模型,具备更好的细微差别和精准度,为用户带来更多惊喜和个性化体验。
- 个性化代码版本控制,允许用户在新作业中使用旧作业中的个性化模型和数据。
尽管 V6.1 增加了图像质量和个性化选项,但新的--q 2 模式有时需要额外时间来添加更多纹理,这可能会降低图像的整体连贯性。
不过,Midjourney 也明确指出,V6.1 并未引入新的修复模型。因此,如果用户需要使用缩放、重构、重新绘制或改变区域的功能,系统将会回滚至 V6.0 模型。
未来展望:Midjourney 表示,他们计划在接下来的一个月左右推出 V6.2,并进一步改进图像生成技术。然而,为了确保新版本的稳定性和优化,他们首先需要收集尽可能多的 V6.1 用户数据。
从今天起,Midjourney 将 V6.1 设置为所有用户的默认模型,以便用户能够即刻享受到新版本带来的优势和创新。
OpenAI 推出 ChatGPT 语音助手,解决安全问题后重新上线
2024年7月31日,OpenAI宣布将向部分付费ChatGPT Plus用户推出语音功能。这项新功能将提供四种预设声音,但无法模仿其他人的语音。此前,由于安全问题,该功能的发布曾被推迟。
OpenAI表示,已添加新的过滤器,以确保软件能识别并拒绝生成音乐或其他受版权保护音频的请求。公司表示:“通过逐步推出,我们可以密切监控使用情况,并根据实际反馈不断改进模型的功能和安全性。”
语音功能是OpenAI今年5月发布的GPT-4o产品发布会上的核心内容。GPT-4o是GPT-4模型的更新版本,具备更强的实时处理文本、音频和图像的能力。
OpenAI在声明中重申,计划在秋季向所有付费ChatGPT Plus用户推出语音功能。此外,公司仍在开发5月发布会展示的视频和屏幕共享功能,但这些功能的具体发布日期尚未确定。
Meta等公司联合提出元奖励语言模型,Llama 7B击败GPT-4
Meta、加州大学伯克利分校(UC Berkeley)和纽约大学(NYU)联合推出了一种元奖励语言模型,通过AI自我监督和自我改进模型对齐。这一新模型在预训练和对齐阶段消耗大量数据,研究发现,即使不依赖人工标注,语言模型也能通过自我评估提高性能。
例如,Llama-3-8B-Instruct模型在AlpacaEval 2上的胜率从22.9%提升至39.4%,在Arena-Hard上提高至29.1%。元奖励模型的一个优势在于,“不仅Judge不需要人类,Meta-Judge也能自给自足,从而摆脱对人类监督的依赖。”
这一研究展示了通过AI自我监督和自我改进的潜力,为未来的语言模型发展提供了新的方向。
苹果CEO库克:开发人员开始测试AppleIntelligence
2024年7月31日,苹果公司CEO蒂姆·库克在X平台上发布消息称,AppleIntelligence将为用户打开一个充满新可能性的世界,并表示非常高兴看到开发人员已经开始使用这一新技术进行开发。据此前媒体报道,苹果计划最早于本周通过iOS 18.1和iPadOS 18.1测试版首次向软件开发人员提供AppleIntelligence进行早期测试。
消息称TikTok成为微软AI服务最大客户之一,每月花费近2000万美元
有消息称,截至今年3月,TikTok每月向微软支付近2000万美元,用于通过微软购买OpenAI的模型。这笔金额几乎占据了微软AI收入的四分之一,使TikTok成为微软AI服务的最大客户之一。
在全球云计算市场的竞争中,微软通过整合OpenAI的人工智能技术,成功地将其云服务转化为一项利润丰厚的业务。微软的云AI业务有望实现年收入10亿美元(约合72.48亿元人民币)。然而,该报道指出,如果TikTok开发出自己的大型语言模型,可能不再需要如此大量地依赖微软的AI能力。
马斯克旗下xAI据悉考虑收购人工智能聊天机器人初创公司Character.AI
据《The Information》报道,马斯克的人工智能初创公司xAI正在考虑收购聊天机器人制造商Character.AI,以寻找更多的方法来测试其Grok聊天机器人。尽管报道指出此次讨论“可能不会”促成交易,但xAI公司内部的讨论表明,像Character.AI这样的AI初创公司在与财力雄厚的大企业竞争时,面临着训练和运行模型的高昂成本。因此,未来这种类型的合作可能会变得越来越普遍。
阿里巴巴将推出人工智能对话式采购引擎,预计9月发布
2024年7月31日,阿里巴巴国际数字商业集团发布公告,宣布将于今年9月推出人工智能对话式采购引擎。这项新服务专注于B2B电商业务,旨在改变中小企业的全球采购流程,使其更加直观和高效。
根据声明,该引擎将整合所有电商平台,专注于理解自然语言并将其转化为专业采购请求,同时可以预测采购需求并提供建议。此举将进一步提升阿里巴巴在国际电商市场的竞争力。
阿里通义免费开放奥运AI大模型
2024年7月31日,阿里通义宣布免费开放其奥运AI大模型。据悉,该模型具备奥运专业知识和翻译功能,用户即日起可以在通义App上免费使用。此次巴黎奥运会被誉为AI应用最广泛的一届奥运会,阿里巴巴的云计算和AI技术正在全面支撑奥运转播和赛事运营。
可灵AI官方打假:可灵AI目前没有App
2024年7月31日消息,快手官方今日发布“可灵AI打假声明”,声明称可灵AI目前没有App,也未在任何应用商店和网站上线可供下载的App。快手强调,凡是标有“可灵AI”或暗示为可灵AI官方或得到官方授权的App都是假的。