AI资讯每日速递(20241105)
迪士尼成立名为技术赋能办公室的新部门,旨在把AI(AI)和混合现实技术整合到电影、电视和主题公园业务中。新部门将由现任首席技术官Jamie Voris领导,他的职位将由Eddie Drake接替。技术赋能办公室的主要任务是确保技术项目与公司的战略目标相一致,而不是集中管理。这一办公室预计扩展至约100名员工,展示了迪士尼在技术创新上的积极姿态。通过前沿技术的整合,迪士尼希望提升使用者真实的体验并在激烈的娱乐竞争中保持领头羊,尤其是在内容创作、观众互动和沉浸体验方面。
Apple Inc. 于上周五宣布收购 Pixelmator,这一举动引发广泛关注。作为知名照片编辑应用的开发者, Pixelmator 的加入可能会为苹果平台带来重大转变。尽管部分人对这一交易持怀疑态度,但乐观者认为这有助于解决 iPad 上缺乏复杂软件的问题。与 Adobe 的 Photoshop for iPad相比,虽然功能强大,却不被全用户接受。
尽管 Pixelmator 团队正在开发 iPad 版 Pixelmator Pro,但进展缓慢。用户希望苹果加快推出步伐,并避免转变为订阅服务,喜欢一次性购买的形式,如 Final Cut Pro 和 Logic Pro。收购对 iPad 使用者真实的体验的影响,以及 Pixelmator Pro 在平板上的表现备受期待,标志着苹果在软件领域的又一重要举措。
据彭博社报道,亚马逊的语音助手 Alexa 原定于今年年底进行一次重要的人工智能升级,现已推迟至2025年。这次升级旨在增强 Alexa 的智能性和对话能力,以更好地处理信息。
报告显示,测试阶段的 AI 版 Alexa 遇到了诸多问题。测试用户反馈表示,AI 提供的回答往往冗长且紧凑,与原始问题并不贴合,甚至会出现幻觉现象,同时在与智能设备如灯开关的兼容性上表现不稳定。
虽然亚马逊尚未正式确认延误,测试版也已关闭,用户无法体验升级版的对话功能。推迟的计划可能会对亚马逊在语音助手市场的竞争力造成影响,令用户失望。
Gabor Cselle,前Pebble CEO及联合发起人,近日宣布加入OpenAI,参与一个神秘项目,此消息通过他在X平台(原Twitter)的官方帖确认。Cselle于今年十月加入OpenAI,并表示正在学习新知识,将在未来分享项目细节。
作为一位连续创业者,Cselle的成就颇为显著。他创办的reMail公司获得Y Combinator支持,之后被Google收购,而Namo Media公司则被Twitter收购。Cselle曾在Twitter任职产品组经理,负责多个核心功能,2016年离开后曾任Google孵化器Area120领导。2022年,他与前Discord工程总监共同创办Pebble(原T2),该平台专注于安全和内容审核,但最终未能获持续增长并于去年关闭。
此外,OpenAI的竞争者Anthropic也迎来重磅人物,Embark创始人Alex Rodrigues宣布加入担任AI安全研究员。高管们的变动反映出AI人才竞争的持续加剧,未来更多创新项目值得期待。
据36Kr报道,孙兆志创办的上海萝卜智能科技有限公司完成了数千万人民币的天使轮融资,大多数来源于行业投资者。该企业成立于2024年1月,专注于AI伴侣机器人,首款产品定位为“AI潮流玩具”,已完成前三轮原型设计,计划明年量产。孙兆志曾担任小鹏汽车内饰设计负责人,拥有丰富的使用者真实的体验和工业设计经验。他指出AI伴侣领域正受到创业者关注,特别是满足年轻女性的情感需求。萝卜智能的机器人将兼顾桌面及可穿戴场景,拥有多自由度硬件设计,具备情感识别和信息记忆,利用多模态技术优化音视频互动并引入长期记忆和自学习特性。
根据最新多个方面数据显示,北京智慧华章科技有限公司(Zhipu AI的子公司)完成了工商注册变更,加入了新股东:北京人工智能产业互助基金(有限合伙)、深圳招数科创新私募股权投资基金合伙企业和湖北长江中信移动通信科技产业投资基金合伙企业。其注册资本从约2791万元增至3107万元。成立于2019年的北京智慧华章科技有限公司,业务包括人工智能基础软件和应用软件的开发、软件开发、数据处理与存储支持等服务。智谱AI在今年3月完成了一轮融资,其中北京AI产业投资基金参与,使其成为该基金成立以来首个获得资助的AI大模型公司,此投资标志着智谱AI在AI领域的发展与战略调整。
AI搜索公司Perplexity最近推出了选举信息中心,旨在为选民提供较为可靠的投票信息。此平台将通过AI生成回答、候选人概况,并在11月5日实时跟踪投票结果,数据由提供。
该中心的信息基于非营利组织Democracy Works的资料,包括投票要求、地区及时间。此外,Perplexity承诺其生成的选举信息来自多个可靠来源,如Ballotpedia和主要新闻机构。用户可输入地址获取特定选票内容,选举日亦可实时查看总统及国会选举的状态。
然而,测试中发现部分AI生成的候选人摘要存在错误,例如漏提已退出竞选的罗伯特·F·肯尼迪。而且一名名为“未来女总统”的候选人链接到副总统卡马拉·哈里斯的摘要及搞笑图片。Perplexity发言人莎拉表示,正对此类错误进行调查。
AI公司DecartAI与Etched携手推出的Oasis世界模型声称能够运行类似Minecraft的游戏,而无需传统的游戏引擎、逻辑或代码。此AI生成的游戏引发了众多争议和批评,主要因为其视觉质量糟糕,仅提供360p分辨率和20FPS的低帧率,甚至比Nintendo 64时代的游戏更差。更为严重的是,该AI模型存在很明显的幻觉现象,造成了极其不稳定的游戏体验,玩家在执行简单挖掘等操作时还可能意外传送回地表,游戏中的物体也缺乏持久性,无法保存建造成果。尽管Oasis号称其代码是开源的,但他人的侵权质疑依然存在,因其训练数据集来自70,000小时的OpenAI Minecraft VPT在线视频。虽然一些AI爱好者认为利用AI技术进行经典游戏的改进是一种进步,但大多数玩家依然认为真实的游戏引擎和硬件是游戏体验的最佳途径。通过Oasis的发布,我们再次看到AI在游戏领域所面临的挑战,真正复杂和原创的游戏仍需依靠人类创造力和技术。
Gabor Cselle,前 Twitter 对手 Pebble 的首席执行官及联合发起人,最近加入 OpenAI,从事一个秘密项目。根据他的 LinkedIn 信息,自十月起,他就在 OpenAI 工作,并在 X(前 Twitter)上透露此消息,表示将适时分享更多工作细节,称“我已经学到了很多”。
Cselle 是一位资深企业家,他的第一家公司 reMail(移动电子邮件初创公司)曾被谷歌收购。随后,Cselle 创办了原生广告初创企业 Namo Media,该公司被 Twitter 收购,且在 Elon Musk 收购后更名为 X。
在加入 OpenAI 前,他曾是 Twitter 的产品经理,负责使用者真实的体验,并于2016年离开 Twitter。他在 Google 担任一个孵化器项目的负责人。2022年,他与前 Discord 工程经理合作开发了偏重安全和管理的社交平台 Pebble(前称 T2),尽管建立了小型活跃社区,却未能实现可持续增长,并于去年十月关闭,后于十一月以 Mastodon 实例重新再启动。OpenAI 的竞争者 Anthropic 也招募了新员 Alex Rodrigues,此为无人驾驶卡车公司 Embark 的创始人,曾通过 SPAC 合并上市,并在2023年低价出售给 Applied Intuition,现宣布将为 Anthropic 担任 AI 安全研究员。
开源AI聊天工具LobeChat在经过一个月的公测后,宣布云服务月收入已突破30,000人民币(约4,000美元),付费用户数超过60,标志着初步成功。LobeChat团队表示这一成就揭示了开源项目的商业化潜力,尽管用户数仅为约60个,使团队得以维持日常运营,与传统互联网追求百万用户的方式截然不同。
然而,LobeChat面临付费用户转化率不足的挑战,尽管注册用户已超7,000,实际付费用户却不足1%。团队认为,市场之间的竞争激烈和功能相比于ChatGPT和Claude仍有差距是造成该问题的原因,而开源性质也使用户更倾向于免费使用。
为改善此情况,LobeChat计划未来专注于发展差异化功能与增值服务,如即将推出的文件上传和知识库对话功能。
团队还将调整固定使用订阅模型,推出较低的基础服务费加按需代币购买的模式,缓解用户压力。
LobeChat承诺承担因设计缺陷导致的额外损失,并呼吁用户在遇问题时畅快沟通。最近的月收入大多数都用在覆盖经营成本,利润空间存在限制,团队将持续关注每月经常性收入(MRR)以保持项目可持续发展。
随着人工智能(AI)技术的进步,银行业正面临重大的转型机遇。麦肯锡全球研究所的最新报告说明,生成式AI(GenAI)有望为全球银行业每年增加2000亿至3400亿美元的收入,增幅为2.8%至4.7%。生产力的提升是这一增长的关键驱动力。
在印度,AI在银行业的应用快速地发展。2023年,埃森哲发布的研究揭示了AI在提升客户服务效率和交易量方面的巨大潜力。2017年,DFC银行推出了Eva,这是印度首个基于AI的客户助理,能够同时处理数百万客户咨询。
2020年,ICICI银行推出了与亚马逊Alexa和谷歌助手兼容的聊天机器人iPal,使用户能通过语音进行简单银行交易。尽管该服务于2021年停止,但其创新性仍然备受瞩目。近期,印度国家银行(SBI)也启动了AI战略,计划建立数据仓库和数据湖,以增强决策及运营效率,并与金融科技公司合作推动共同贷款。
国际上,德意志银行正在与谷歌云和英伟达合作加快其AI战略的发展,以增强在AI领域的竞争力。
然而,AI技术的应用也带来了安全风险隐患。Kroll的调查显示,67%的高管预期金融犯罪上升,57%认为第三方中介是风险源。全球每年约有2万亿美元洗钱,银行逐渐转向AI技术以应对挑战。汇丰银行与谷歌云合作,利用AI强化反洗钱能力,更有效地识别可疑交易。
此外,Infosys Finacle的AI解决方案为银行提供快速集成AI的工具,提升数字运营效率,Axis Bank也在加大对AI领域的投资。
苹果公司将在12月的第一周,也就是12月2日,在全球推出iOS18.2系统更新,为用户所带来更多人工智能功能。根据知名分析师马克·古尔曼的消息,此次更新将集成ChatGPT技术,使Siri具备文本和图像生成能力,用户无需注册就可免费使用,并且Siri在回答用户问题时也会优先寻求用户意见。
iOS18.2的更新将带来显著的Siri效率提升,ChatGPT的集成将远超之前的写作工具和图像生成能力,令Siri更精准地执行指令。苹果重视用户隐私,承诺在使用ChatGPT时保护用户IP地址,并不保存任何请求记录。
此外,苹果还计划于明年4月推出iOS18.4,将逐渐增强Siri的上下文理解和命令解析能力,使其任务完成更为准确。新型Siri将配备生成性AI机制,扩大其功能,助力用户快速设置提醒、管理日程以及总结信息。
升级后的Siri还将实现自然流畅的对话能力,超越简单的问答形式,进行更深入的交流。这次Siri升级标志着苹果在AI行业的重要进步,彰显其提高使用者真实的体验的决心。
本周,麻省理工学院(MIT)发布了一种创新的机器人训练模型,抛弃了传统的数据集驱动方法,转而使用海量信息,类似于训练大型语言模型(LLMs)。研究显示,模仿学习在应对小挑战时可能会失效,如环境变化和新障碍,导致机器人数据不足以适应。
受GPT-4等模型启发,研究团队使用数据驱动的方法,创建了名为异构预训练变压器(HPT)的新架构,它融合了来自不同传感器和环境的信息。变压器越大,输出效果越优。此外,用户都能够输入机器人设计和任务。
“希望有一个通用机器人大脑,无需训练即可下载使用,”卡耐基梅隆大学副教授David Held表示。这项研究得到丰田研究所的支持,并与波士顿动力公司开展了重要合作。
Meta FAIR、加州大学伯克利分校和纽约大学的研究团队联合开发了新技术Thought Preference Optimization(TPO),旨在提升大型语言模型(LLM)在处理指令时的响应质量。与传统模型不同,TPO允许模型在给出最终答案前进行内部思考,从而生成更准确、连贯的回答。核心是改进的Chain of Thought(CoT)推理方法,促使模型在训练时构建结构化的内在思维。在训练中,模型首先生成多个思考,再整合为最终回应,输出结果通过“评判”模型评估以选择最佳和最差回答,为直接偏好优化(DPO)提供“选择”和“拒绝”对,持续提升响应质量。基准测试表明,TPO方法超越传统基线,表现优于“思维提示”的Llama-3-8B-Instruct模型。TPO不仅适用于逻辑和数学任务,在市场营销和健康等创意领域也显示其优势。专家Karan Verma对此表达期待,认为其在医疗上的应用前景良好。综合看来,TPO技术可能使大型语言模型在多种场合下灵活性更好、高效,适合复杂指令的处理,推动更深层次的响应生成。
Meta FAIR Lab近日发布了名为Sparsh的创新技术,这是一种具有人类特征的多模态指尖触觉感知系统,能够彻底变革机器人操作领域,使机器人获得近似人类的触觉感知能力。
Sparsh模型使用自监督学习,通过超过460,000张触觉图像进行预训练,避免了手动数据标注,能够创建通用触觉表征。该模型兼容多种视觉-触觉传感器,例如DIGIT、GelSight2017和GelSight Mini,极大提升了机器人在触觉任务中的性能,包括力估计、滑动检测、姿态估计、抓取稳定性预测及面料识别。此外,研究人员还开发了标准化基准测试平台TacBench,以测试不同触觉传感器和模型的性能。
测试根据结果得出,Sparsh在TacBench的六个任务中表现优异,尤其在数据少的情况下,超过传统的特定任务及传感器模型。例如,在力估计和滑动检测任务中,即使只用1%的标注数据,Sparsh也能取得满意效果。这显示出Sparsh能帮助机器人更有效理解物体物理属性,实现更精准的操作。
Sparsh模型的面世标志着AI触觉感知领域的重要里程碑。未来,随着数据的积累和模型持续优化,Sparsh预计将改变机器人与物理世界的互动方式,推动机器人技术在更广泛的领域应用。
随着人工智能技术的发展,Google和Meta利用用户评论生成AI响应,面临新的诽谤法律风险。澳大利亚法律有经验的人指出,在用户发布可能涉及诽谤的评论时,传统上是用户承担相应的责任。然而,2021年澳大利亚高等法院在Dylan Voller案裁定,承载这些评论的平台也可能承担法律责任。
历史上,这些科技公司多次因诽谤被起诉。例如,2022年Google因托管恶意视频被迫赔偿新南威尔士前副首席部长John Barilaro超过70万澳元,2020年因链接一篇关于律师的新闻而被判赔偿4万澳元,虽然这一裁决后来被推翻。
最近,Google在美国推出了基于AI的Gemini地图功能,而Meta则在Facebook上应用AI生成评论摘要。法律专家警告,如果Meta利用用户评论生成诽谤性响应,可能会承担出版社的责任。虽然公司可能会辩称“无辜传播”,这种辩护的成功可能性较低。悉尼大学法学高级讲师指出,新的法律改革未能充分应对AI带来的挑战。
Google副总裁Miriam Daniel表示正在积极消除虚假评论,确保AI技术提供“平衡视角”,Meta也承认其AI在持续优化中。
最近,社会化媒体平台X的一位用户揭露,OpenAI的新o1模型曾通过网址?model=o1短暂开放给部分用户访问,不久即被关闭。用户反馈显示,该模型可处理约20万个单词,并具备图像分析能力。
OpenAI称o1为其“最强大模型”,很适合需要创造力和高级推理的任务。与前版本相比,该模型在性能上大幅度的提高,更能使用户得到满足在复杂场景中的需求。
目前公众可用o1的迷你版和预览版,但完整版本尚未正式对外发布。OpenAI尚未透露完整版具体上市时间,但预计将在今年晚些时候推出。相比即将发布的GPT-5,o1的发布引发了更多期待。此发展在AI领域引起关注,慢慢的变多人开始意识到新一代模型的应用潜力。尽管用户对o1模型的短暂体验引发热议,但大家也在期待何时能够全面使用该模型。
随着人工智能(AI)技术快速的提升,慢慢的变多消费者倾向于通过AI代理获得快速服务。Salesforce的调查显示,来自全球超过15,000名受访者对AI代理的认可度上升,但信任依然是个挑战。调查显示,72%的受访者认为对公司的信任会降低,60%认为AI技术的进步突显了信任建立的重要性。同时,54%的AI用户对训练数据的安全性表示担忧。此外,80%的消费者认为优质的客户体验与产品本身同样重要,65%的人认为公司在处理客户数据时过于急功近利。69%的受访者期望与不同部门之间保持一致的互动,部分受访者对繁琐的退货流程或购体验感到不满,甚至影响忠诚度。调查还发现,虽然54%的消费者不在意互动方式,只要问题能够迅速解决,约三分之一的消费者愿意使用自动化或数字化方法购物,34%希望借助AI代理减少问题重复。透明度是关键,45%的消费者希望能清晰了解升级渠道,44%希望AI的运行逻辑得到解释。尽管年轻人对AI代理的接受度较低,整体上花了钱的人AI代理的期望和接受度仍在增长。总结来看,建立信任、提高反应速度、保障个性化服务是AI代理未来成功的关键所在。
随着生成式人工智能技术的迅速发展,预计未来几年电子废弃物将显著上升。全球研究表明,到2030年,AI相关电子废弃物预计从2023年的2600吨激增至250万吨,几乎每人都将丢弃两部iPhone,引发对环境的严峻担忧。
生成式人工智能的迅猛增长促使硬件和芯片技术频繁更新,导致电子设备快速过时。丢弃的设备往往含有铅和铬等有毒金属,构成健康及环境危害。此外,许多旧设备内含贵金属如黄金、白银和铂,可回收利用,但电子废物的激增使回收难度加大。
研究团队来自中国科学院和以色列的Reichman University,在《Nature Computational Science》期刊上发表文章称,2020年至2030年间的电子废弃物总量可能达到120万至500万吨。他们指出,地理政治学因素、半导体进口限制、及频繁更换服务器等趋势,可能加剧这一问题。
研究还显示,北美(美国和加拿大)将承受超过58%的未处理电子废弃物,东亚(中国、韩国和日本)贡献25%,而欧盟和英国占14%。美国对高端GPU对华销售的限制,将影响环境,促使中国数据中心使用过时的服务器,降低计算效率,增加物理服务器需求。
研究团队还提出解决方案,建议实施循环经济策略,以减少86%的电子废弃物,包括延长AI硬件的常规使用的寿命、重用旧的GPU和电池、开发更高效的算法和提升芯片算力等措施。
苹果最近发布的研究引发了关于生成性人工智能(AI)在金融领域有效性的讨论。调查显示,慢慢的变多的消费者,尤其是年轻人,正在使用生成性AI工具如ChatGPT寻求财务建议。据Motley Fool的调查,54%的美国人通过ChatGPT获取金融理财产品推荐,但对具体产品的兴趣仍然有限,比如只有25%希望获得信用卡推荐。受访者对ChatGPT的推荐一般持“比较满意”的态度,满意度为3.7分(满分5分)。然而,苹果的研究指出,现有大型语言模型在逻辑和数学推理上存在非常明显缺陷,尤其面对复杂数学问题时表现不佳。TechCrunch的文章也提到AI在数学计算中所犯的错误和挑战,强调机器学习在金融建议中的局限性。研究结果警示,银行和信用社目前不应依赖AI提供金融咨询,未来改进的可能性仍存,但面临的挑战依然显著。