【资料图】
近日,由“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试版正式上线。据介绍,该平台涵盖390部经典古籍,主要来自《四部丛刊》,共计3000多万字,即日起向公众免费开放。未来三年将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,届时将全部免费开放。
据了解,上述实验室系今年3月北京大学与字节跳动合作成立,将人工智能技术应用于古籍资源的智能化整理。“识典古籍”平台上线是双方合作的最新进展。与其他古籍数字化平台相比,“识典古籍”页面简洁、浏览流畅,提供影印底本作为参照,还具备主题词检索和繁简体转换功能,后续将上线手机移动版平台。
当前,中国的古籍数字化还处于初级阶段,面临技术难度高、资金缺口大、人才紧张等难点。相关资料显示,现存的20多万种古籍中,只有8万种完成影像数字化扫描,近4万种完成文本数字化。据专家统计,从1949年到2019年,国内共修复整理出版古籍近3.8万种,要将现存古籍全部修复整理出来,可能需要300年时间;若利用人工智能技术辅助修复整理,大概二三十年就能完成。
据“识典古籍”项目负责人介绍,该平台当前主要使用了三种技术,包括文字识别、自动标点和命名实体识别。据悉,目前行业内OCR识别准确率平均为93%至94%,“识典古籍”的准确率为96%至97%。
-
当前头条:寄回问题耳机索尼签收拒退款,淘宝客服:商家拒收了快递来自河北石家庄的张女士(化名),花了700多元在索尼官方旗舰...
-
世界热资讯!谷歌2023年前将在日本开设首个数据中心据国外媒体报道,谷歌首席执行官(CEO)桑达尔·皮查伊(Sund...
-
天天速读:星巴克中国董事长王静瑛重新担任公司首席执行官今天上午,星巴克中国向员工宣布了公司当前董事长王静瑛重新...
-
【环球热闻】千禾味业产品遭消费者“哄抢”,公司董秘办:我们的配料表足够干净据橡果Acorn报道,昨日,受到海天味业“添加剂风波”影响,千...
-
最新:抖音推出“端内在线履约”功能:提供订单服务履约的全套解决方案抖音电商日前发布了关于教育培训抖音端内在线履约功能及迁移...
-
天天快报!上海市监局:“双十一”期间禁止电商“虚假打折”上海市市场监督管理局召集上海市重点电子商务企业,就“双十...
-
全球动态:北大携字节跳动推出古籍数字化平台,搭建免费开放的“智能图书馆”鞭牛士报道10月11日,由“北京大学—字节跳动数字人文开放实...
-
即时看!碧桂园回应打折出售核心资产:该说法存在误读据证券时报报道,近日有部分声音认为,转让广州国际金融城项...
-
视讯!刘强东投身乡村振兴的重要支点:为家乡宿迁打造“霸王蟹”新名片鞭牛士报道金秋十月,一筐筐大闸蟹成熟上市、整装待发,江苏...
-
全球快看点丨三星在巴西推出24款5G智能手机,涵盖高端到低端机型据国外媒体报道,三星在巴西推出了24款5G智能手机,涵盖了高...
- 智联世界,元生无界!快手虚拟人IP亮相2022人工智能大会
2022-09-07 10:47:54
- 机器人界“奥林匹克”!2022世界机器人大会8月18日举行
2022-08-10 09:58:58
- 2025年全球人口将达到90亿!机器人将在农业领域大显身手
2022-07-14 09:41:10
- 中科院院士蒋华良:AI+分子模拟与药物研发将大有可为
2022-07-14 09:37:00
- “千垛之城荷你有约” 2022兴化市荷文化旅游节正式开幕
2022-07-07 09:28:34
智能