钞能力：阿联酋的Falcon-40B语言模型OpenLLM排名第一、持续霸榜_当前最新_城市科技网

(资料图)

IT之家 6 月 13 日消息，众所周知，阿联酋在科技及教育产业方面投入的预算一直不菲，近日，阿联酋科技创新研究所（TII）打造出了 400 亿参数的语言模型 Falcon-40B，在 Hugging Face 的 OpenLLM 排行榜上排名第一，并持续霸榜，赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。

▲ 图源阿联酋科技创新研究所（TII）

据称，Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量，团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试，表现比 LLaMA、Vicuna 和 Alpaca 更加出色。

此外，团队还采用了“多重查询注意力”（Multiqery attention）机制，来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询，来更好表示同一序列中，不同 token 之间的关系，以在加速模型运算效率的同时，降低模型的复杂性，进而提高模型整体的可维护性。

阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示：“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义，但这仅仅是个开始”。

IT之家注意到，Falcon 模型已经在 huggingface 上开源，目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等，IT之家的小伙伴们可以在这里访问。

标签：

责任编辑： jkl2

返乡送“技”助农增收，辛巴辛选教育团队在通河县开展助农电商培训|环球新视野
近日，辛选集团董事长——辛巴辛有志通过一场直播电商公益助...
鱼岳镇三湖社区：助力省级食品安全示范县创建
6月12日，鱼岳镇三湖社区对辖区内食品经营场所、超市开展食品...
梦见狗追着咬没咬到是什么意思（梦见被狗追）-资讯推荐
1、梦见狗咬着自己不撒手，说明最近你给别人的建议很有可能不...
格力主播穿免职裙被吐槽：价值观不同不会购买
近日，格力官方旗舰店直播，主播因身着此前引发热议的“免职...
朱晓彤卸任特斯拉长春公司法定代表人，仍担任董事长
天眼查App显示，近日，特斯拉汽车销售服务（长春）有限公司发...
天天观速讯丨310万元拆迁款谁来保管？
患有精神病、系限制民事行为能力人的丁春容为何将巨额拆迁款...
不要太帅哦，广东一条东西向城际大动脉将连通，经济增长新动力_环球观天下
目前，广州着力构建粤港澳大湾区“枢纽共享、网络互联、中心...
网传腾讯解除川大地铁事件女生实习合同，已进入离职流程_天天实时
近日，广州地铁18号线发生了一件“大叔自证清白仍被女子曝光...
达人带货日榜「2023年6月12日」：快手77英姐家族多次上榜，云上珠宝居抖音第一
【达人带货日榜】是鞭牛士推出的多个平台达人每日直播带货榜...
穿越8年周期发现3只能当“传家宝”的老基金_速递
（来源：Wind，统计区间：2015 06 12-2023 06 12）　　但同期中国经济

智能

智联世界，元生无界！快手虚拟人IP亮相2022人工智能大会

2022-09-07 10:47:54
机器人界“奥林匹克”！2022世界机器人大会8月18日举行

2022-08-10 09:58:58
2025年全球人口将达到90亿！机器人将在农业领域大显身手

2022-07-14 09:41:10
中科院院士蒋华良：AI+分子模拟与药物研发将大有可为

2022-07-14 09:37:00
“千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕

2022-07-07 09:28:34

消费