您当前位置:网站首页 >> 新闻资讯
AI公司MosaicML推出70亿参数模型MPT-7B-8,号称“一次处理 8000 字长文本、可商用”
文章来源:IT之家  作 者:漾仔   上传时间:2023-7-28  浏览量:474

AI 创业公司 MosaicML 近日发布了其 70 亿参数模型 MPT-7B-8K,据悉,该模型一次可以处理 8000 字文本,相当擅长处理长文重点摘要和问答,还能在 MosaicML 平台上根据特定任务,进一步微调相关配置。

据悉,系列模型采用了 150 万个 Token,并以 256 块 H100 GPU 花 3 天完成模型训练而成。MosaicML 本次发布了 3 个版本模型,包括 MPT-7B-8k、MPT-7B-8k-Instruct 和 MPT-7B-8k-Chat。

其中,第一个版本 MPT-7B-8k、是以 Transformer 解码器为基础,并以 FlashAttention 和 FasterTransformer 机制来加速训练与推论,能一次处理 8000 字文本,MosaicML 公司表示,该模型开源、允许商用。

第二个版本 MPT-7B-8k-Instruct 是以第一个版本 MPT-7B-8k 微调而成,MosaicML 公司表示,MPT-7B-8k-Instruct 模型可处理长篇指令,特别注重于生成“摘要和问答”,该模型一样开源且可商用。

第三个版本 MPT-7B-8k-Chat 则是机器人对话式的 AI 模型,MosaicML 公司宣称,该模型额外多用了 15 亿个聊天数据 Token,在第一版模型 MPT-7B-8k 之上继续训练而成,该模型开源,但不允许商用。

据此前报道,MosaicML 公司也推出了一款号称训练成本仅为竞品零头的 MPT-30B 开源模型,该公司日前已将所有开源模型发布于 Huggingface 平台,感兴趣的小伙伴们可以前往进行相关了解,还可以在本地硬件上使用自己的数据,在下载后,对模型进行各种微调。

编 辑:章芳

10

2022-06

大厂忙“种草”: 腾讯推出“企鹅惠买”,抖音内测新功能

大厂忙“种草”: 腾讯推出“企鹅惠买”,抖音内测新功能

23

2022-09

从华为到苹果 指间的卫星通信

从华为到苹果 指间的卫星通信

23

2022-12

为了追赶对手 英特尔将图形芯片部门一分为二

为了追赶对手 英特尔将图形芯片部门一分为二

07

2025-03

IDC 报告 2024 印度平板出货量:三星 42.6%、宏碁 18.7%、苹果 11%、联想小米均 9%

IDC 报告 2024 印度平板出货量:三星 42.6%、宏碁 18.7%、苹果 11%、联想小米均 9%

02

2024-02

手机市场格局生变:市场排名刷新 厂商加速“内卷”

手机市场格局生变:市场排名刷新 厂商加速“内卷”

26

2024-07

中国电信邵广禄:“云、网、数、智、安” 助力数智经济发展

中国电信邵广禄:“云、网、数、智、安” 助力数智经济发展

30

2024-08

联通元景大模型通过国家网信办双备案

联通元景大模型通过国家网信办双备案

29

2022-04

数字经济多项技术突围 元宇宙被赋予更多想象

数字经济多项技术突围 元宇宙被赋予更多想象
返回顶部
客服电话
用微信扫一扫关注我们
请各公司推销人员注意:我单位拒绝任何方式、任何形式的电话推销,请勿拔打我单位客服热线进行电话推销,谢谢合作!
公司名称:100元4个小时上门服务电话
100元4个小时上门服务电话-同城约茶服务十点击查看网站【www.sscmtv.com】200元3小时上门不限次二维码-微信qq上600块3小时不限次数-一百【点击进入立即约茶】。小妹
关键词:新闻资讯:AI公司MosaicML推出70亿参数模型MPT-7B-8,号称“一次处理 8000 字长文本、可商用”,100元4个小时上门服务电话【点击进入网站查看约茶服务】。网上怎么找上门服务,附近品茶服务,喝茶服务联系方式,附近初中生300块电话号码,不限次品茶,一条龙的服务上门二维码,100块钱上门服务电话号码,200元1小时做完付款十同城附近约茶服务:【进入平台查看预约服务】。同城包小妹电话是,小姐服务,本地同城附近200元,24小时上门二维码,1243567800元3小时上门服务电话,500块钱3小时上门服务电话,,联系同城约茶服务,【点击这里进入上门服务】。 附近大泡50元的电话
云南网站建设,云南网页设计,昆明网站建设,昆明网页设计  网站管理
【版权声明】本站部分内容由互联网用户自行发布,著作权或版权归原作者所有。如果侵犯到您的权益请发邮件致info@ynjwz.com,我们会第一时间进行删除并表示歉意。