华中科技大学开源多模态大模型“Monkey”
Monkey是华中科技大学软件学院白翔教授领衔的 VLRLab 团队发布的一款开源大模型,Monkey 引入了一种高效的训练方法,可以有效地将输入分辨率提高到 896 x 1344 ,同时不需要从开始进行预训练。
AI早报:科大讯飞星火大模型 V3.5 将于 1 月 30 日发布;微软推出免费AI工具“Reading Coach”
科大讯飞星火大模型 V3.5 将于 1 月 30 日发布;微软推出免费AI工具“Reading Coach”
OmniConsistency – 图像风格化一致性
OmniConsistency是一种基于扩散Transformer模型的通用一致性插件,用于增强图像到图像风格化管道中的风格化一致性和泛化能力,同时防止风格退化。
Seed LiveInterpret: 端到端同声传译技术
Seed LiveInterpret 是一项由字节 ByteDance Seed 团队开发的端到端同声传译 (SI) 技术。
Canva Text to Image
Canva Text to Image 是一款由 Canva 开发的应用,可以通过输入文本描述来生成图像。同时可以选择不同的风格和尺寸,比如照片、绘画、3D、概念艺术等,变成独一无二的图像。
OPPO 申请“AndesGPT”“AndesAI”商标
OPPO 广东移动通信有限公司上周申请注册了多个“AndesGPT”“AndesAI”商标,国际分类为科学仪器、通讯服务、网站服务,当前商标状态均为申请中。