(资料图)
IT之家 6 月 13 日消息,众所周知,阿联酋在科技及教育产业方面投入的预算一直不菲,近日,阿联酋科技创新研究所(TII)打造出了 400 亿参数的语言模型 Falcon-40B,在 Hugging Face 的 OpenLLM 排行榜上排名第一,并持续霸榜,赢过此前 LLaMA、StableLM 和 RedPajama 等竞争者。
据称,Falcon-40B 使用了 384 颗 GPU 来进行 2 个月的训练、利用将近 5 亿个 Token 训练而成。为提高训练过程的质量,团队还自己组建了一套工作流程来筛选出“最高质量的的资料”供给 AI 模型训练。经多个基准测试,表现比 LLaMA、Vicuna 和 Alpaca 更加出色。
此外,团队还采用了“多重查询注意力”(Multiqery attention)机制,来提高模型的效率。“多重查询注意力”机制即模型可以对每个 Token 进行多个查询,来更好表示同一序列中,不同 token 之间的关系,以在加速模型运算效率的同时,降低模型的复杂性,进而提高模型整体的可维护性。
阿联酋科技创新研究所首席执行官 Ray O. Johnson 博士表示:“2023 年将是人工智能之年。Falcon 模型对我们来说具有里程碑意义,但这仅仅是个开始”。
IT之家注意到,Falcon 模型已经在 huggingface 上开源,目前开源的版本有 Falcon-7B-Instruct 和 Falcon-40B-Instruct 等,IT之家的小伙伴们可以在这里访问。
标签:
-
返乡送“技”助农增收,辛巴辛选教育团队在通河县开展助农电商培训|环球新视野近日,辛选集团董事长——辛巴辛有志通过一场直播电商公益助...
-
鱼岳镇三湖社区:助力省级食品安全示范县创建 6月12日,鱼岳镇三湖社区对辖区内食品经营场所、超市开展食品...
-
梦见狗追着咬没咬到是什么意思(梦见被狗追)-资讯推荐1、梦见狗咬着自己不撒手,说明最近你给别人的建议很有可能不...
-
格力主播穿免职裙被吐槽:价值观不同不会购买近日,格力官方旗舰店直播,主播因身着此前引发热议的“免职...
-
朱晓彤卸任特斯拉长春公司法定代表人,仍担任董事长天眼查App显示,近日,特斯拉汽车销售服务(长春)有限公司发...
-
天天观速讯丨310万元拆迁款谁来保管?患有精神病、系限制民事行为能力人的丁春容为何将巨额拆迁款...
-
不要太帅哦,广东一条东西向城际大动脉将连通,经济增长新动力_环球观天下目前,广州着力构建粤港澳大湾区“枢纽共享、网络互联、中心...
-
网传腾讯解除川大地铁事件女生实习合同,已进入离职流程_天天实时近日,广州地铁18号线发生了一件“大叔自证清白仍被女子曝光...
-
达人带货日榜「2023年6月12日」:快手77英姐家族多次上榜,云上珠宝居抖音第一【达人带货日榜】是鞭牛士推出的多个平台达人每日直播带货榜...
-
穿越8年周期 发现3只能当“传家宝”的老基金_速递(来源:Wind,统计区间:2015 06 12-2023 06 12) 但同期中国经济
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34