小红书首次开源文本大模型

2个月前 来源: 观看:54

6月9日消息,小红书近日开源了首个大模型——dots.llm1。jwd即热新闻——关注每天科技社会生活新变化gihot.com

dots.llm1是一个中等规模的Mixture of Experts(MoE)文本大模型,由小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队研发,总参数量 142B,激活参数 14B。jwd即热新闻——关注每天科技社会生活新变化gihot.com

具体来说,在激活14B参数的情况下,dots.llm.inst模型在中英文通用场景、数学、代码、对齐任务上的表现亮眼,与 Qwen2.5-32B-Instruct、Qwen2.5-72B-Instruct相比具备较强的竞争力。同时与Qwen3-32B相比,在中英文、数学、对齐任务上表现接近。jwd即热新闻——关注每天科技社会生活新变化gihot.com

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:小红书jwd即热新闻——关注每天科技社会生活新变化gihot.com

此外,dots.llm1最大特色是使用了11.2万亿token的非合成高质量训练数据,这在现阶段的开源大模型中非常罕见。jwd即热新闻——关注每天科技社会生活新变化gihot.com

今年以来,小红书在AI、大模型方面的动作频频。年初,小红书内部大模型技术与应用产品团队升级为hi lab,并启动了“人文训练师”的招聘,邀请有深厚人文背景的研究者加入到对AI的训练中,将人类更全面的智慧和价值感注入AI,最终让AI成为人类有益的伙伴。jwd即热新闻——关注每天科技社会生活新变化gihot.com

5月27日,小红书hi lab与复旦大学哲学学院共同成立“AI人文人才训练营”,展开AI后训练相关的人文课题共创,培养“AI+人文”复合型人才。大模型的训练通常分为预训练(pre-train)和后训练(post-train)两个阶段。人文训练就属于后训练的一部分,对AI在人性化表达、人类价值对齐等方面的表现起到关键作用。jwd即热新闻——关注每天科技社会生活新变化gihot.com

watermark,image_d2F0ZXJtYXJrLnBuZz94LW9zcy1wcm9jZXNzPWltYWdlL3Jlc2l6ZSxQXzEy,g_south,t_55,x_1,y_20

图源:小红书jwd即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-12-34324-0.html小红书首次开源文本大模型

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:京东工业与音飞储存达成战略合作

下一篇:淘宝开始用火箭送快递

为你推荐
1月24日消息,苏宁易采云近日与广东德玛仕智能厨房设备有限公司达成战略合作,未来双方将强化商用厨房数字化采购建设,共拓千亿商厨市场。未来双方将充分集成AI人工智能、物联网...
02-07
2月18日消息,中经汇达实业有限公司(以下简称:中经汇达)董事长邱云飞一行近日到访涂多多。国联股份高级副总裁、涂多多CEO刘斋,涂多多高级副总裁、跨境产发部总经理邵春生代表公司...
02-18
2月20日消息,智联招聘发布《2024中国海归就业调查报告》。智联招聘数据显示,2024年,在国内求职的海归人数较2023年增长7%,达到2018年的1.44倍;其中,回国求职的应届留学生人数较202...
02-21
3月6日消息,饿了么推出“骑手权益月恳谈会”创新机制,通过定期举办骑手、商家、用户、专家等沟通互动,进行算法公开和主题调研,听取各方反馈,持续完善相关建议。为了进一步推动算...
03-09
全球性金融券商集团英国EBC Group平台始终致力于以领先生态,与全球交易者共塑交易的未来。 自第一届交易大赛起,为赤忱的热爱和卓越的才华提供舞台,在全球内寻找交易好手以赋能...
01-24
在全球化的大背景下,中国品牌凭借自身实力与创新能力,在国际舞台上愈发耀眼。近日,来自拉丁美洲的一则消息引起了行业广泛关注:远大智能工业集团博林特电梯,成功中标哥伦比亚麦德...
02-09
《最终幻想7:重生》“轻松抓陆行鸟”mod出自mod制作者LordGregory之手。有了它,你就无需重玩那些必定失败的潜行环节,在这些环节中,你得悄悄靠近当地的陆行鸟。通...
02-10
随着AI的快速发展,部分科学家开始借助AI设计芯片,然而AI设计的部分芯片过于复杂,甚至超出人类的理解范畴。 普林斯顿大学Sengupta实验室的科学家团队主导了这项...
02-10
当地时间2月5日下午,法国国民议会举行极左翼政党“不屈法国”提出的两项针对现任政府的不信任动议投票,两项动议均未获通过。当晚,法国总理贝鲁宣布再次使用宪法相关条款授权,直...
02-06
春运期间,火车站客流增大。旅客携带行李换乘电梯时一定要关注人身安全,避免意外。近日,铁路公安民警就及时救助了多名从扶梯上摔下的旅客。近日,旅客张女士来到徐州东站准备乘扶...
02-09
1月20日,哈尔滨第九届亚冬会火种采集仪式在哈尔滨太阳岛广场上举行。千年巨石太阳石后,连绵的群山造型冰雕在阳光照耀下晶莹剔透,冰雪工匠们以精湛技...
01-21
记者1月18日从中国铁建股份有限公司了解到,由中铁十七局承建的雄商高铁全线控制性工程建设取得新进展,雄商高铁阳谷特大桥跨三干渠连续梁顺利合龙。...
01-21
  今天是春运第12天,交通出行迎来节前客流高峰。交通部门积极应对不利天气对春运带来的影响,全...
01-27
  辽宁省海洋预警监测中心1月27日16时发布海浪Ⅳ级蓝色警报。  受强冷空气和气旋共同影响,预计27日...
01-28
原标题:新就业群体“新”在哪、“难”在哪、关爱工作“落”在哪积极回应新就业群体期盼(青年观察·关注新就业群体)——访中央社会工作部副部长赵世堂数据来源:中央社会工作...
01-21
▲超市购物。图/IC photo据报道,春节将至,有市民在采购年货时留意到,市面上那些内含独立小包装的食品,不少独立包装上没有标注生产日期或保质期等信息,其中有的会注明“单片/单个...
01-21
2 月 3 日消息,近年来随着汽车辅助驾驶技术的不断发展,越来越多的司机依赖这些系统来减轻驾驶负担,有些人甚至在某些情况下完全放手不管,然而这种行为相当危险,极易引发...
02-04
2 月 7 日消息,在福特 2024 年财报电话会议上,首席执行官吉姆・法利向媒体坦言,全尺寸电动或增程电动汽车并不是拖车的理想选择。他说:“它并不完美。如果你需要拖车,这...
02-07
最近打开社交应用,经常能看到关于《痞子无间道》第8集剧情的讨论。这部剧的粉丝们对此非常关注,今天就来聊聊这一集的内容。在第8集中,费仁在大飞的房间里寻找...
02-19
最近,“协商的技术男主是谁演的”成为了热门话题。这部作品自宣传阶段就吸引了大量关注,播出后更是让观众感到惊喜,不负众望。在韩剧《协商的技术》中,李帝勋饰...
02-21
  不少网友在春节期间  开启了天天吃剩菜的生活  这样的“剩宴”安全吗?  哪些食物不适...
02-05
编者按:一个人工智能(AI)机器人,在短短8天内独立完成了668项实验,合成了668种化合物,并成功研发出一种全新的化学催化剂。这一壮举令人赞叹。AI...
02-11
近日,省委、省政府决定,单耀军同志任河北工程大学党委委员、常委、副书记,校...
01-21
  教学和布置作业不依赖电子产品,使用电子产品开展教学时长原则上不超过教学总时长的30%……近日,省教...
01-21
  近日,中国太平保险集团有限公司在香港成功发行了亚洲首只采用双风险、双触发机制的巨灾债券...
01-21
白羊座的男生通常充满活力、热情和冲动,他们喜欢追求刺激和新鲜感。如果你想让一个白羊...
01-22
天蝎男是一个神秘而深沉的星座,他们喜欢与人保持一定的距离感,不轻易展示自己的内心世界...
01-22
世界知名大学?1哈佛大学美国2斯坦福大学美国3牛津大学英国4剑桥大学英国5麻省理工学院美国6东京大学日本7哥伦比亚大学美国8巴黎大学法国9耶鲁大学美国10普林斯顿大学美国11...
02-07
ysl官网怎么退? valentino法国官网?ysl官网怎么退?ysl官网你可以申请退款,然后联系下客服,就说想要退,他们会给你一个地址,然后你寄过去就可以了,他们会把钱通过原路返给你的。其实...
02-17
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮