目前,我国大多数行业,包括证券、保险、工商、地税、土管、和银行业等,都有对各种信息资料实现现代化管理的迫切需要。对于来源繁多的信息资料,专业人士根据信息的格式加以划分,将其分为结构化信息和非结构化信息两大类:
●结构化信息——我们通常接触的数据库所管理的信息,包括生产、业务、交易、客户信息等方面的记录;
●非结构化信息——专业术语为内容,所涵盖的信息更为广泛,可分为:
1)营运内容(operational content):如合约、发票、书信与采购记录;
2)部门内容(workgroup content):如文书处理、电子表格、简报档案与电子邮件;
3)Web内容:如HTML与XML等格式的信息;
4)多媒体内容(Rich Media Content):如声音、影片、图形等。
如果说结构化信息更多的忠实、详实地记录了企业的生产交易活动,是显性的表示,那么非结构化信息则隐性包含了掌握着企业命脉的关键,隐含着许多提高企业效益的机会。对于企业来说,企业内部,以及企业与供应商、客户、合作伙伴和员工数字化共享所有形式的数据资源,已越来越重要。
根据行业估计结果,超过85%的商业信息来源以非结构化形式表现,虽然许多企业都拥有数据库管理系统,但其仅能处理结构性资料,如数字等;对于这些非结构化数据的信息,其中只有不到5%进行了数字化。内容管理技术应运而生。
伴随着数据管理技术将迎来它的又一次重大革新——信息管理(Information Management),信息管理软件不再只是一个数据库,而是一个实现“随需应变”的开放、智能、完整的数据管理解决方案。它以开放系统、跨平台的数据库系统为基础,以内容管理(Content Management,简称CM)、数据仓库管理、智能分析为核心,在信息集成软件支持下,为人们提供整合信息。其中,内容管理作为一种专门的非结构化信息管理技术,伴随着非结构化数据规模和应用需求的不断增长,逐渐成为数据管理技术发展的一个重要方向。
ECM是企业发展的必需
内容管理在其发展过程中,经历了数据库+LOB(大对象的扩展插件)、数据库+文件系统等数据库平台阶段,但是随着应用的业务规模与种类的不断飞速发展,越来越多的问题如性能、功能、安全、二次开发能力等,不断呈现在终端用户和应用商面前,归根结底,结构化数据库不适合内容的管理。随着上个世纪80年代中期,企业内容管理(EntERPrise Content Management,ECM)概念的推出,在90年代初期形成专门的文档资料/多媒体管理平台,并在90年代中后期产品成熟,标志着ECM进行着一次新的变革。
ECM是指内容管理将从办公自动化以及某些局部应用拓展到整个企业。Gartner Group 在2001年给出的企业内容管理的定义中,将之定位为“运用技术对贯穿企业的内容进行创建、捕获、分发、客户化以及管理的过程”。面对日益复杂的IT环境,企业如何有效地采集、管理、应用各种非结构化和半结构化的资源,并且将与企业业务系统(如ERP、CRM等)中的各种结构化信息集成起来,已经成为ECM发展的瓶颈。
ECM所涵盖的范围包括内容的采集和创建、存贮和管理、工作流管理、内容复制和分发、内容检索和导航、安全控制管理、用户管理等功能。
丰富的内容采集功能
内容采集是指内容管理系统获取非结构化信息的能力,由于所要处理的内容丰富多彩,内容的来源也迥然不同:影像内容大多是由纸质资料通过影像采集设备转换而来,这些影像采集设备可能是高速批量扫描仪、平板扫描仪、数码摄像机、模拟摄像机、传真机等等;企业报表由报表生成程序来生成,一般直接输出到打印机;电子文档由文档编辑器生成;电子邮件由相应的邮件服务器来发送等等,对于如此多种多样的内容来源,内容管理系统必须有与之相适应的内容采集功能来获取内容。
多样的内容处理
获取内容后,需要对此内容作相应地处理和整理,最终转换成系统内部所定义的表现形式存放在内容管理库中。内容处理的功能包括:裁剪和优化、关键字提取、全文提取、编目和摘要等。各种内容的处理方式也各不相同:图像内容需要图像优化、智能识别等;报表文件需要作打印流转换、关键字提取、报表再分析等;电子文档需要关键字分析、自动编目、自动摘要等;声像流内容则需要声音或影像智能识别、流文件压缩、流文件摘要等。
快捷的内容检索
内容检索首先是提高其检索效率。同时所提供的检索形式能够更贴合人类的日常活动习惯,在内容管理系统中通常包含的检索技术有;参量检索、关键字检索、音/视频特征检索、全文检索、语义检索等多种检索技术。检索需要有相应的查询语言支持,查询语言能够基于各种标准,以便不同系统间的互联互通。
统一的发布平台
内容最终将通过一定的权限限制向企业内部或外部发布。内部可能是不同业务部门的业务应用软件,外部可能是企业的客户服务网站。这些内容发布要求需要通过一个统一的发布平台进行管理控制,发布平台首先需要经过权限认证,认证通过后再把这些发布请求转化为内部查询语句从各个内容库中搜索相关内容,查询到内容后再按照一定的格式反馈。
灵活的二次开发能力
内容管理不是一个独立的系统,需要和其他周边的系统进行集成。每个项目在实施过程中,都有不同程度的客户化工作。完整的内容管理必须有灵活的二次开发接口,所提供的接口形式应该包括C++、Java,一般应该同时能够适应J2EE和.NET两种架构。
总之,ECM有着巨大的应用需求、成熟的技术支持和完善的系统功能,作为信息管理的核心内容之一,将成为数据管理技术的一个重要发展方向。
相关链接:内容管理市场诱人
下面是一些市场专业统计数据:
1)Aberdeen集团对IT购买意向进行的调查显示,内容管理软件、安全软件、硬件是IT买主在2002年最希望购买的三大类产品。在其早在2001年年底进行的一项调查显示,按应用的类型分,45%的用户表示计划购买内容管理应用,计划购买Web分析、客户支持/服务应用的用户分别为43.7%和42.6%。
2)有关资料显示,全球现有2000家规模最大的公司2002年有80%把内容管理列入发展计划,而2004年,内容管理市场规模将超过80亿美元。
3)根据META Group的研究报告指出,至2004年,全球约有95%的前200家大企业将发展内容管理基础建设,市场需求超过100亿美元。
4)Ovum咨询公司把内容管理分为工具和服务两个领域,并认为,到2004年内容管理工具和服务的市场规模将发展到53亿美元和80亿美元。
5)根据新近IDC调查报告显示,内容管理服务市场以复合年增长率44%发展,到2006年将达到大约244亿美元。IDC定义的内容管理服务市场为规范化的服务--包括为客户提供计划和设计、实施、运营、培训和支持,帮助达到有效的企业内容管理。
虽然各专业统计的具体数字有所差异,但内容管理的市场前景勿容置疑。根据Forrester Research的统计数据,非结构化“内容”量在以每年200%的速度增长。而分析师估计,一般员工大约花费35%的时间寻找工作所需的非结构化信息。一方面是低下的内容处理效率,另一方面是不断膨胀的内容量。简单的事实对比已经隐含了一个迫切需求:我们需要有一个工具,能同结构化信息一样,有效地管理我们的非结构化信息。这就是内容管理技术的职责。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:ECM:在业务系统中提炼信息