中易中标 首页  
     
    Javascript DHTML Drop Down Menu Powered by dhtml-menu-builder.com Javascript DHTML Drop Down Menu Powered by dhtml-menu-builder.com Javascript DHTML Drop Down Menu Powered by dhtml-menu-builder.com Javascript DHTML Drop Down Menu Powered by dhtml-menu-builder.com  
     
  【中易服务】  
 
古籍数字化加工
近现代文献数字化
档案数字化加工
家谱数字化加工
扫 描 服 务
数字古籍发布系统
数字家谱发布系统
数字梳理 内码转换

◆《地方志》全文数字化样张
◆《清史-随手档》全文数字化样张

我们能帮您优质快速地处理一切汉字信息!
将您认为最困难的汉字资源数字化交给我们!
    中易公司是在继承文字学泰斗郑易里教授对汉字研究半个世纪,在奠定了中国汉字字形编码的理论基础上,后期和郑珑女士和中易公司共同合作,研发而成的重大发明和成果。经国家评审、推荐,是唯一的规范、易学、快速、通用的形码系统。

    中易公司在《郑码》基础上,又研发设计了各种汉字字库,方向是将常用的四套宋体、仿宋、楷书、黑体做好,做精,做标准。在国内优秀字模师和专家指导下,一经推出,就获我国各方面专家审定为“国内外领先水平”的最高评价。

    然后,公司在《郑码》能处理大字符集的基础上,就汉字库在1998年做到10万个,然后用《郑码》检索,并扩大了Windows 98的支持和Word的扩大和支持,使10万汉字运用自如,解决了利用计算机处理一切汉字信息的历史难题,从而荣获《北京科技进步一等奖》;《国家科技进步二等奖》和《世界华人发明大奖》。现在,这项创新成果,已扩大到23万个汉字,其中包括甲骨文、金文、小篆等,世界领先!

    中易公司集三代人半个世纪的努力,做到了能利用计算机处理一切汉字的软件研发公司。它将公司成立20多年研发的成果,来进行技术服务,做一切古籍及一切汉字的全文数字化服务,并且建立了生产线,全部用计算机系统来生产管理、控制。

    经过几年努力,从扫描一切纸质资料、全文数字化、补字、校对、版式还原、管理发布系统等,完成了统一配套的系统。它是国内外唯一的。

    这个系统特点是标准化、规范化、国际化、持久化。在这个系统上完成的全文数字化工程,可一劳永逸的解决中华资源的全文数字化。它做成的CD电子版、网络版,建成网站,可供全世界浏览和检索,将中华文化走向全世界。

    几年来,中易公司不但为国家图书馆、国家清史整理委员会、国家新闻出版总署、第一历史档案馆、浙江图书馆等完成了几十亿字的高水平全文数字化工程,而且也为韩国、日本、台湾、的国等完成中国古籍和佛经的工程。

    能快速的、全面的、标准的、优质的将一切古籍、佛经、字典等有大量生僻字进行全文数字化的目前只有本公司一家。欢迎各方专家、客户前来咨询、考察!

Email:cstc@china-e.com.cn
电话:8610-84887403
传真:8610-84887401

全文数字化加工服务

1、古籍、近代文献、档案全文数字化

    中易中标经过十多年的相关技术积累,在十数亿字的工程经验中,不断完善适用于近现代文献以及古籍等资源的数字化加工生产线,采用大规模集约化生产加工方式,由C/S结构中心控制各工序的合理调配、数据管理、质量控制和人员的分配管理,实现统一的集中式管理,全程无纸操作,提供高精度、高品质的数字化产品。

    中易数字化加工中心具有大规模古籍数字化的生产加工能力,超过200个机位,全部人员均接受严格的专业培训,具有丰富的古籍数字化加工经验。

    2003年,中国国家图书馆确定将古籍《地方志》的全部数字化数据,建立在能处理超大字符集的《中易超大型中文网络国际应用平台》上,全文数字化内容超过6亿字;针对数字资源检索的中易全汉字管理发布系统也以此应用平台为基础。

    中易提供“一站式”服务,从扫描、全文化识别、疑问字处理、补造字、全文检索、数字资源发布、及计算机外字处理等所有环节,皆有相对应的专有技术及解决方案,对项目的整体控制能力强,是项目顺利实施的重要保障。

    中易从事数字化行业多年,商业信誉良好,对数据的安全性提供多重保障。中易以其雄厚的技术积累、完整的解决方案、以及丰富的工程经验,确保为用户提供高品质的数字化产品。

■中易全文数字化优势:

    采用国际标准ISO/IEC 10646:2005(等同于Unicode 4.0)编码,涵盖70,195个汉字,解决了古籍中绝大部分的生僻用字,并使在线阅读、检索、数据交换、存储的过程,全部在国际标准编码的框架中进行,是古籍数字化的科学选择。

    基于中易专业的造字技术,在业内率先提供7万余字的Unicode 5.0宋体、楷体两套字模,达到与原书最接近的还原风格。

文字识别:   采用郑码输入法和OCR识别。郑码获日内瓦发明金奖,获中、美、英三国专利, 为Windows预装输入法,可快速输入7万-10万汉字,是古籍等高难度文献数字化 顺利实施的强有力保障工具。
校对:   采用计算机辅助人工校对,多重环节的校对,确保高精度。
补造字:   Unicode 5.0以外的汉字,由中易提供专业的补造字服务。由于Windows采用中易 的字模作为系统字,补造字可无缝的衍接,并可自动批量回填,保证精度。
问题字处理:   处理步骤包括归类、统计、规范处理、造字、扩充输入法等。疑难字、模糊字 由专家最终审定。也可提供和客户协同工作模式。
版面还原:   自动版面还原,表格、批注、大小字混排等繁杂版式可与原书一比一对应。
元数据提取:   根据要求,可提取三级目录,以及一些特殊类型的元数据。
发布应用:   采用XML进行数据描述,一套数据满足不同的应用,如传统印刷,Internet发布 和电子光盘的制作。
2、家谱全文数字化

    近年来,越来越多的人希望通过对家谱的研究,来追溯家族发展的历史。家谱里所记载的丰富宝贵的资料,不但可以帮助人们了解自己的祖先以及同辈的人,而且也是历史学、社会学、民族学、文化人类学、人口学、优生学等学科的宝贵资料,有着巨大的学术研究价值。

    基于在中文信息处理领域多年的专业经验及领先技术,中易自行设计开发了中易家谱系统。这一系统是利用计算机对中文家谱进行数字化及管理,适用于处理现代或古代中文的家谱。

■ 家谱数字化的特殊性

数据量巨大。
大多是由古代写到现代,多用中文繁体字;后续的也有简、繁体字共存的。涉及到很多人名、地名,不但用到很多生僻字,而且还有大量的异体字、异构字及早字,用字量大。
书目信息需遵照“汉语文古籍机读目录格式”的要求。
一般较珍贵,不能拆开扫描。
世系图、世系表的排版格式特殊,多以树状形式排列,文字既有横写,又有竖写。
世系图、世系表、传、图像、内容各部分之间有较强的联系,但树状的排版格式给人以分散的观感。
一个家族由一人世代繁衍,能发展到数百人至数千人,用纸质家谱研究不便,大多数家谱纸张易损。

■ 家谱数字化的难点

● 很难发挥OCR识别高效率作业的优势
□ 内容用字多为繁体,也夹杂许多异体字,有的家谱纸张陈旧,字迹模糊,OCR识别准确率极低。
□ 很多年代久远的家谱版面复杂很不规范,在一个页面中,文字经常既有横排,又有竖排,与现代书籍相差甚远,需要投入大量人工进行手工切分与调整。
□ 版面遗留的斑点和污迹较多,需要花费人工清除。
□ 只能采用人工校对,效率低。

● 对中文平台系统的特殊需求
□ 现有平台系统只能处理20000字,远远无法涵盖家谱的全部用字,需对平台系统进行扩充。
□ 平台系统扩充后,要处理4字节汉字带来的输入法管理、检索、屏幕显示、WEB方式运行等多方面的技术难题。
□ 一般的键盘输入法无法支持4字节汉字的输入,做家谱的数字化加工很困难。
□ 世系图与表的格式特殊,传承关系繁复,如果没有专用录入工具,某些信息将会重复录入,容易搞错继承关系,增加校对与修正的工作量,给后期数据整理带来困难,还容易产生遗漏信息等问题。

● 对支持超大字符集全文检索搜索引擎需求

■ 核心技术

    采用ISO/IEC10646:2003标准(等同于国标GB18030-2005及Unicode 4.0标准),包括70,195个汉字,最大限度覆盖家谱中的生僻字及异体字";
· 可对家谱中所有信息进行全文数字化;
· 可对人名谱系逻辑关系进行连接;
· 制作人物分项元数据,如生卒日期、子女、配偶等;
· 在扫描图像和XML数据中标引人名座标位置信息,以便于查找;
· 制作三级书目,并将标引词(家谱目录中的卷数、卷名)与标引对象(图像文件与卷数、卷名相对应的正文)正确的结合;
· 原谱系错位信息判别和修正;
· XML数据格式转换及入库。

国家图书馆首期《地方志》全文数字化工程,已由中易公司实施。
此项目涉及宋、元、明、清、民国的全国各地方志,总字数约二十亿字,共三百三十万页,
是我国目前最大的古籍全文数字化工程。
原扫描图像
(点击图像看大图)
全文数字化版式还原文档
(点击图像看大图)
点击图像看大图 点击图像看大图
点击图像看大图 点击图像看大图
点击图像看大图 点击图像看大图
点击图像看大图 点击图像看大图
点击图像看大图 点击图像看大图
点击图像看大图 点击图像看大图
点击图像看大图 点击图像看大图
 
 
     

版权所有 © 中易中标电子信息技术有限公司
2005 ZhongYi Electronic Ltd. All Rights Reserved
请使用 IE 5.0 以上版本浏览器
800×600 或更高分辨率浏览本网站
简体中文 繁體中文 English