当前位置: 聚焦 > > 正文

天天观点：AI见闻日报：将上下文学习能力从语言迁移到视觉，MetaVL开启下一个多模态时代 | 见智研究

2023-06-06 19:33:05 来源：华尔街见闻

今日要点：

1、苹果在 iOS17 中加入transformer语言模型，用于提高文字和语音转文字时的准确性。

2、苹果开发人员：Vision Pro里用了“脑机接口”，通过检测眼睛等准确预测用户下一步要做什么

【资料图】

3、MetaVL: 将上下文学习能力从语言模型迁移到视觉，开启下一个多模态时代

4、Runway获得1亿美元D轮融资，谷歌领投

见闻视角

海外AI

1、苹果在ios17中加入transformer语言模型，用于提高文字和语音转文字时的准确性。

苹果在今日更新的ios系统介绍中，阐述了使用transformer语言模型，用于提高文字和语音转文字时的准确性，通过用于单词预测——提高了用户每次键入时的体验和准确性。而这个模型如同苹果一直以来强调对用户的隐私保护一样，是在手机端的模型。

见智研究认为，苹果使用transformer模型用于一些基础应用符合苹果一直以来的务实精神，苹果从不强调某项技术是否先进，而是要在用户体验上做到极致。这也是苹果一直强调技术落地到应用的体现。

见智研究相信苹果设备在明年将会拥有自己的llm模型，而这个模型按照苹果一贯的隐私保护模式，应为纯本地化的模型。

2、苹果开发人员：Vision Pro里用了“脑机”，通过检测眼睛准确预测用户下一步要做什么

一位在AR/VR领域工作十年、担任苹果AR神经技术研究员的网友Sterling Crispin发推文，介绍了苹果AR的神经技术研发

根据Crispin的介绍和苹果的专利说明，苹果的神经技术可以做到预测用户行为、根据用户状态调整虚拟环境。

最酷的结果是在用户实际点击之前预测他们会点击什么，人们的瞳孔在点击之前往往有反应，原因是人们会期望在点击之后会发生什么。

这时可以通过监测用户的眼睛行为来创造生物反馈，并实时重新设计用户界面，以创造更多预期的瞳孔反应。这是一个通过眼睛实现的粗略“脑机接口”，用户不用接受侵入性的脑部外科手术。

推断认知状态的其他技术，包括以用户可能无法察觉的方式向他们快速闪现视觉或声音，然后测量他们的反应。

见智研究认为，苹果通过全新的神经技术对人的行为进行预测，从而大幅减小了vision产品整个UI操作的延迟，大幅提升用户体验。从无数细节中可以看到，苹果在用搬山能力处理每一个细节，这个软硬整合能力，不是谁能可以随便模仿的，它所体现的每一个细节，都看出苹果花费巨大的功夫在解决交互体验。这也是苹果之所以伟大的地方。

3、MetaVL: 将上下文学习能力从语言模型迁移到视觉，开启下一个多模态时代

动机：研究如何在视觉-语言领域实现上下文学习，将单模态的元学习知识转移到多模态中，以提高大规模预训练视觉-语言(VL)模型的能力。方法：首先在自然语言处理(NLP)任务上元训练一个语言模型，实现上下文学习，然后通过连接一个视觉编码器将该模型转移到视觉-语言任务上，以实现跨模态的上下文学习能力的转移。优势：实验证明，跨模态的上下文学习能力可以转移，该模型显著提高了视觉-语言任务上的上下文学习能力，并且在模型大小方面能够有显著的优化，例如在VQA、OK-VQA和GQA上，所提出方法在参数数量减少约20倍的情况下超过了基准模型。

见智研究一句话总结:

M Monajatipoor, L H Li, M Rouhsedaghat, L F. Yang, K Chang探索了将元学习的上下文学习能力从单模态迁移到多模态的可能性，证明了在视觉-语言任务中通过迁移可以显著提升上下文学习能力，甚至在模型大小方面实现优化。

这意味着多模态情况下的对话能力将得到加强，对于现有的文生图来说可能会带来新的变化，生成模式对用户将更友好。

4、Runway获得1亿美元D轮融资，谷歌领投

生成式AI平台Runway获得1亿美元D轮融资（约7亿元），估值15亿美元，本次由谷歌领投。谷歌投资Runway的最大原因之一是为了争夺云计算客户。

Runway曾在4月底与谷歌签订了7500万美元的3年商业协议，同时Runway已从谷歌获得了价值2000万美元的云计算资源用于产品运营和研发。

见智研究曾使用过GEN-1生成相应视频特效，但目前可玩性不算高。Gen-2是Runway在今年3月最新发布的，但目前手机客户端还未提供使用。Gen-2可以通过文本、图片、文本+图片直接生成视频，同时支持风格化和渲染添加好莱坞式大片特效，仅需要几分钟即可完成所有操作。

风险提示及免责条款市场有风险，投资需谨慎。本文不构成个人投资建议，也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资，责任自负。

关键词：

上一篇:RNGM官方：暴风锐正式回归并担任主教练一职-全球速递下一篇:最后一页

推荐阅读更多

x 广告

资讯更多

行业更多

河北省5家医院入选第一批国家外科基础技能提升项目培训基地

日前，国家卫生健康委医院管理研究所公布了外科基础技能提升项目培训基地(第一批)评估结果，我省5家医院入选。经多轮专家审议和申报材料审

产业更多

6万人参与砍价不成功？拼多多：“未砍成功”不实，商品已送达

近日，有媒体报道称，一位游戏主播参与拼多多的砍价免费领手机活动，在直播间几万名观众的帮助下，耗时2个小时砍到了小数点后6位，但未砍成

受“春节不打烊”影响 2月快递公司的完成业务量出现了明显变化

电商件对于快递公司的业务量影响至深。3月19日，顺丰、韵达、圆通和申通四家快递公司发布了2月经营数据。数据显示，受春节不打烊政策影响，

国内碳酸锂价格大幅飙涨多部门部署引导锂盐价格回归理性

今年以来，国内碳酸锂价格大幅飙涨。受原材料价格高企、补贴退坡等因素影响，国内新能源汽车企业掀起涨价潮。工信部3月18日晚间发布消息称

上海涉疫垃圾呈较快增长态势 7天累计处置3015吨

随着疫情防控需要排查和管控的人数增加，近期涉疫垃圾呈较快增长态势，特别是隔离点涉疫垃圾持续保持高位。来自上海城投集团的数据显示，3

2021年结婚人数有何变化？广东河南结婚人数最多

近年来，我国结婚人数持续减少、结婚平均年龄日渐增长、单身群体日益扩大、出生人口持续减少等问题，备受关注。刚刚过去的2021年，我国结婚

x 广告

天天观点：AI见闻日报：将上下文学习能力从语言迁移到视觉，MetaVL开启下一个多模态时代 | 见智研究

见闻视角

1、苹果在ios17中加入transformer语言模型，用于提高文字和语音转文字时的准确性。

2、苹果开发人员：Vision Pro里用了“脑机”，通过检测眼睛准确预测用户下一步要做什么

3、MetaVL: 将上下文学习能力从语言模型迁移到视觉，开启下一个多模态时代

4、Runway获得1亿美元D轮融资，谷歌领投

天天观点：AI见闻日报：将上下文学习能力从语言迁移到视觉，MetaVL开启下一个多模态时代 | 见智研究

RNGM官方：暴风锐正式回归并担任主教练一职-全球速递

新消息丨她曾是重庆最美高考状元，如今成为央视主持人，现42岁仍孑然一身

荣信文化06月06日主力资金大幅流出|世界热门

加大财政支持促教育资源均衡

环球观天下！自主高端高开低走?

天天快看：简约中透露着科技 疑似广汽传祺全新M6内饰谍照

苹果首款头显 Vision Pro 发布！你的下一台 iPhone 何必是手机

今日聚焦!珠峰登山季结束 已致12死5失踪 春季登山季上山人数超过1500人

【世界热闻】林咸殉难_关于林咸殉难概略

全球观热点：关店！被告！天然呆奶茶合同纠纷涉影星关晓彤

世界快讯:消息称BrookField考虑为其第五只旗舰房地产基金募资150亿美元

今年南山荔枝丰产 早熟品种妃子笑已上市30元/千克-新动态

环球报道:易方达中证国新央企科技引领交易型开放式指数证券投资基金增加广发证券为网下现金发售代理机构的公告

与家人争吵后女孩欲跳水轻生，崇阳警方分秒必争成功营救 全球报道

浙江途博网络荣耀入驻中国康养产业互联网平台-天天时快讯

视频拍的遗嘱有效吗？

王字旁怎么打出来word_王字旁怎么打出来

剪影是什么意思摄影（剪影是什么意思）_每日简讯

世界速递！法国斗牛犬好养吗优缺点_法国斗牛犬好养

三大指数集体收跌 北上资金全天净买入14.31亿元

河北昌黎黄金海岸国家级自然保护区时隔三年再次发现卷羽鹈鹕

经济运行实现平稳开局 外资长期向好信心不变

历时四年，海南国际碳排放权交易中心获批设立

疫情常态化之后 餐饮行业又将发生怎么样的变局？

河北省5家医院入选第一批国家外科基础技能提升项目培训基地

日前，国家卫生健康委医院管理研究所公布了外科基础技能提升项目培训基地(第一批)评估结果，我省5家医院入选。经多轮专家审议和申报材料审

6万人参与砍价不成功？拼多多：“未砍成功”不实，商品已送达

近日，有媒体报道称，一位游戏主播参与拼多多的砍价免费领手机活动，在直播间几万名观众的帮助下，耗时2个小时砍到了小数点后6位，但未砍成

受“春节不打烊”影响 2月快递公司的完成业务量出现了明显变化

电商件对于快递公司的业务量影响至深。3月19日，顺丰、韵达、圆通和申通四家快递公司发布了2月经营数据。数据显示，受春节不打烊政策影响，

国内碳酸锂价格大幅飙涨 多部门部署引导锂盐价格回归理性

今年以来，国内碳酸锂价格大幅飙涨。受原材料价格高企、补贴退坡等因素影响，国内新能源汽车企业掀起涨价潮。工信部3月18日晚间发布消息称

上海涉疫垃圾呈较快增长态势 7天累计处置3015吨

随着疫情防控需要排查和管控的人数增加，近期涉疫垃圾呈较快增长态势，特别是隔离点涉疫垃圾持续保持高位。来自上海城投集团的数据显示，3

2021年结婚人数有何变化？广东河南结婚人数最多

近年来，我国结婚人数持续减少、结婚平均年龄日渐增长、单身群体日益扩大、出生人口持续减少等问题，备受关注。刚刚过去的2021年，我国结婚

天天快看：简约中透露着科技疑似广汽传祺全新M6内饰谍照

今日聚焦!珠峰登山季结束已致12死5失踪春季登山季上山人数超过1500人

今年南山荔枝丰产早熟品种妃子笑已上市30元/千克-新动态

与家人争吵后女孩欲跳水轻生，崇阳警方分秒必争成功营救全球报道

三大指数集体收跌北上资金全天净买入14.31亿元

经济运行实现平稳开局外资长期向好信心不变

疫情常态化之后餐饮行业又将发生怎么样的变局？

国内碳酸锂价格大幅飙涨多部门部署引导锂盐价格回归理性