首页 > 生活分享 > 免费教学 > 微软Phi-3-vision基准测试,和Gemini 1.0 Pro相当

微软Phi-3-vision基准测试,和Gemini 1.0 Pro相当

发布时间:2024-05-28 22:43:12

之家 5 月 28 日消息,微软在 Build 2024 大会上发布了 Phi-3 家族的最新成员--Phi-3-vision,主打“视觉能力”,能够理解图文内容,同时据称可以在移动平台上流畅高效运行。

Phi-3-vision 是一款多模态小型语言模型(SLM),主要用于本地 AI 场景,该模型参数量为 42 亿,上下文长度为 128k token,能够为常规视觉推理任务和其他任务提供支持。

那么 Phi-3-vision 有多厉害?微软今天发布了新的论文 [PDF],表示该 SLM 和 Claude 3-haiku、Gemini 1.0 Pro 等其他模型不相上下。

微软在论文中对比了 ScienceQA、MathVista 和 ChartQA 等模型,Phi-3-vision 的参数虽然不多,但性能非常优秀。

IT之家此前报道,微软提供了 Phi-3-vision 相较于字节跳动 Llama3-Llava-Next(8B)、微软研究院和威斯康星大学、哥伦比亚大学合作的 LlaVA-1.6(7B)、阿里巴巴通义千问 QWEN-VL-Chat 模型等竞品模型的比较图表,其中显示 Phi-3-vision 模型在多个项目上表现优异。

目前微软已经将该模型上传至 Hugging Face,感兴趣的小伙伴们可以访问项目地址:点此进入。

 

免费教学更多>>

Intel大小核梦开始的地方:12代酷睿处理器停产在即! 宏碁推Acer Chromebook (Spin) 311:采Kompanio 540,面向教育 苹果胜诉:美国加州iPhone隐私收集案指控被驳回 vivo五连冠,小米创新高,OPPO三合一 ColorOS 16一月体验升级内容推送:支持iPhone通信互联 年货消费“变天”了!AI正在改写电商的底层逻辑 百度文心5.0正式版上线,模型参数达2.4万亿 一键复制 10 年工作经验,Coze 2.0 Skill 实测|AI 上新 OpenWrt One路由器装Debian系统,摇身变轻量级服务器! 今年Pro Max旗舰扎堆亮相:国产TOP5厂商集体跟进 对标苹果 联想moto X70 Air Pro官宣支持中国国家地理山河四季联合影像 OpenAI正式进军脑机接口,投了自家CEO阿尔特曼的新公司 民企纳税百万可买原价飞天,自营店:满足条件即可,茅台销售公司:仅针对原有客户 OpenAI想造“AI耳机”,但可能闹了个笑话 钱不白花!老主板升级50显卡带不动?实测解除你的焦虑 REDMI Turbo 5 Max跑分曝光 天玑新款旗舰芯片 网传小米阔折叠9月发布,拥有自研AP芯片、折叠OS等卖点 阿里千问发布会在即 神州数码蹭上阿里云热度 库克退意已决!新CEO候补是个「硬件控」 王自如放话安卓做不出好Air?荣耀李坤:你远离圈子太久了 真我Neo8真机亮相!赛博紫+觉醒光环,这波设计我直接跪了 2026开年王炸!TCL把旗舰级Mini LED价格打下来了 苹果Vision Pro邀你“坐”在场边看湖人队比赛:150Mbps码率 华为余承东带队前往广汽集团交流共建鸿蒙生态 vivo X300系列:双芯加持+影像续航双革新,1月底换机别错过! 华为和北汽的合作项目享界,结果余承东跑来看了,改成旅行车。 传长安汽车因2025年销量未达目标而取消员工年终奖引发不满! 丰田凯美瑞VS星海S7,到底谁才是真正的“家用王炸”? 现代起亚2025全球销售727.39万辆!坐稳全球TOP3 别克至境SUV预告图发布 延续概念车设计2026年内上市