電子檔案歸檔格式思考

2022-12-17 06:06:04 字數 3706 閱讀 1671

(上傳時間:2023年10月17日)

檔案資訊資源是資訊資源的基礎性資源,構成檔案資訊資源的是乙個乙個的檔案,其型別可分為文字檔案、資料庫檔案、圖形、影象檔案和**檔案等。這些種類的檔案又有多種不同的格式,僅文字庫案就有諸如.doc、.

txt、.pdf等格式。多種格式的存在對各個立檔單位電子檔案的歸檔工作造成了很多的困擾,也使檔案館對所接收電子檔案的長期可讀性心存疑慮。

本文僅就文字庫案的歸檔格式進行**。

一、國內主要使用文字型電子檔案的格式

目前,我國市場上存在多種辦公軟體,國外的如微軟office、sun的starsuite、corel的wordperfect office等,國內的如金山wps、紅旗中文2000的redoffice等,它們生成的文件格式各不相同。微軟office的格式是.doc、.

xsl、.ppt,starsuite的格式是.odf,金山wps的格式是.

wps、redoffice的格式是.sxw。由於微軟在作業系統上的壟斷地位,微軟office在市場上也處於的優勢地位,據天極網對2023年國內辦公軟體市場主要產品的調查結果,微軟office市場占有率達到71.

22%,金山wps為14.08%;wordperfect office為4.58%;starsuite為3.

15%。另據北京市檔案局2023年9月對市屬單位電子檔案歸檔格式進行的調查來看,採用doc格式歸檔的為41.67%,wps格式為5%,xml格式為20%,txt格式為20%。

從調查的情況來看,目前文字庫案歸檔時多種格式並存,且doc格式占有較大

比例,wps等格式所佔比例較小。然而,國標《電子檔案歸檔與管理規範》(gb/t18894-2002)推薦的歸檔檔案格式為xml、rtf和txt三種格式,占有率較高doc格式並不是國標推薦的格式。

二、國內外文字型電子檔案格式發展的最新狀況

隨著可擴充套件標記語言xml在世界範圍內被廣泛關注,特別是自2023年2月xml被w3c推薦標準後,許多辦公軟體的廠商都推出了基於xml的辦公軟體,並採用了一些新的文件的格式。以下就基於xml的odf、openxml、uof三種格式和基於二進位制方式儲存的pdf格式作簡要的介紹。

(一)odf(open document format)格式

odf格式於2023年5月正式被國際標準化組織審核通過成為國際標準格式,標準號為iso/iec 26300。odf格式由oasis負責制定,它是一種開放格式,可以讓不同程式、平台之間都自由的交換檔案而不需要理會是何種應用程式所產生的檔案。目前,odf文件格式受到了很多**機構的青睞,例如美國麻薩諸塞州州**、德國慕尼黑市**、新加坡國防部、法國財政部等就率先宣布支援這種格式。

odf文件是基於xml語言的純文字文件。odf格式的文字文件的擴充套件名為?鄢.

odt。乙個odf文件實質上是乙個打包的檔案,並且通常都經過了zip格式的壓縮。我們完全可以用現有的任意一款壓縮軟體將odf檔案解壓。

以下軟體支援odf格式:sun的starsuite,corel的wordperfect,ibm的workplace,以及國內紅旗中文2000的redoffice3.0等。

微軟雖然不直接支援odf格式,但近來微軟推出了office open xml轉譯器(open xml translator),使用

者可將office檔案轉換成odf格式的檔案。為了在全球推廣odf文件格式,sun、ibm等公司建立的odf聯盟。2023年7月,世界軟體巨頭google宣布支援odf格式並加入該聯盟,增強了odf聯盟的力量。

目前google的**文字處理程式writely已經支援odf格式。

(二)open xml format格式

作為全球辦公軟體提供商,2007 office的正式版本已於2023年1月30日向全球同步發售。除了功能上的提公升以外,2007 office最引入矚目的是採用open xml這一新的文件格式,新格式副檔名分別是.docx、.

xlsx和.pptx。當前支援open xml format的軟體只有微軟2007 office。

長期以來,以往由於微軟在市場上極高的占有率,使它的檔案格式成為事實上的工業標準,我國國內軟體廠商雖然有自己的格式,但其格式往往須和微軟的格式相容。對以往的.doc、.

xls以及.ppt格式,微軟一直沒有公開其技術,並希望借助這種方式持續保持其競爭優勢。但是,現在這種形勢發生了微妙的變化。

由於odf成為國際標準,是一種公開的文件格式,得到了一些**的公開支援,微軟封閉的格式受到了很大的壓力。為了改變這種狀況,微軟已將其新的格式open xml format提交給國際標準組織,希望成為國際標準,但目前尚未被國際標準組織批准。

(三)uof格式

uof格式,中文名稱為「標文通」,英文全稱為「unified officedocument format」,意思是統一的文件格式。不要以為這是乙個舶來品,該格式由國家電子政務總體組所屬的中文辦公軟體基礎標準工作組組織制訂,具有完全的自主智財權。

uof規定了包括文書處理、電子**和演示文件應用的辦公軟

件文件的結構描述形式,支援不同辦公軟體之間文件的相容和互換。

(四)pdf格式

與以上三種基於xml的格式不同,pdf格式是一種以二進位制方式儲存的格式。pdf格式,英文全稱「portable documentformat」,意思是可攜式檔案格式。它是美國的adobe公司於2023年開發的一種電子檔案格式。

pdf格式有很多特點,如它不依賴計算機的硬體配置、作業系統和建立檔案時的應用程式,能忠實地再現原文,還具有文字檢索和檔案審閱等功能,所以pdf格式在國際上被迅速推廣應用。據adobe稱,目前pdf文件已經佔據了網際網路上所有內容的10%。pdf格式已於2023年被國際標準化組織審核通過成為國際標準格式,標準號為iso 19005-1:

2005。

pdf格式和xml等結構化的檔案格式一樣,包含有關鍵字,分隔符,資料等等。不同的是pdf檔案是按照二進位製流的方式儲存的,xml檔案則是文字方式儲存的,當你開啟乙個xml檔案就能知道所有顯示的文字,而pdf檔案不能用文字方式開啟。

目前在國際的學術界與高科技業界,pdf格式的應用非常廣泛。此外,在各國**機構的電子政務領域中,pdf格式也被廣泛應用,包括美國**、英國**、德國**、新加坡**、台灣**、香港**、印度、澳大利亞等等。另外一些**機構也在大量使用pdf,僅在美國的就有:

美國聯邦法院、美國太空總署、美國藥物食品管理局(fda)、美國35個州**財稅局、美國郵政服務、疾病控制與預防中心、小型企業管理局、人口普查局等等。在我國台灣的「公文電子交換推廣計畫」中也要求各級機關、學校、事業機構等全面實施公文電子交換,並使用acrobat軟體。

製作pdf檔案的「官方」軟體為adobe公司的adobe acrobat。微軟的2007 office和google的writely都可以將文件直接儲存為pdf格式。其他軟體如go2pdf、pdffactory pro、win2pdf等也可將文件轉換為pdf格式。

pdf檔案也可由國產軟體方正apabi reader開啟。我國金山公司wps office 2005辦公軟體宣稱可直接將檔案儲存為pdf格式。

三、面對紛繁複雜的文件格式,檔案行政管理部門應採取的對策

隨著資訊化建設的發展,已有的檔案格式很多,新的檔案格式也不斷產生出來。檔案部門作為永久儲存電子檔案的基地,應採取各種措施積極應對這種挑戰。

(一)檔案部門應積極參與我國文件格式標準的制定制定乙個統一的文字型電子檔案歸檔格式標準,對我國的檔案資訊化建設極為重要。我國已經開始著手制定《基於xml的電子公文格式規範》,並於2023年發布了國家標準(gb/t19667-2005),該規範包括七個部分,即總則、公文體、顯現、辦理、交換、歸檔、安全等,目前正式出台了總則和公文體兩個部分,其餘包括歸檔在內的五個部分尚未出台。令人欣慰的是,歸檔的部分是檔案部門承擔的。

機關電子檔案及檔案歸檔

摘要 在世界性的科技進步浪潮的不斷推動下,電子檔案越來越多地進入我們生活 工作的各個領域,隨之而來的給我們檔案工作者帶來了乙個新的課題,檔案管理作為國有企業人力資源管理的主要方法,受到了越來越多的重視。然而,我國國有企業人事檔案管理方面還存在很多不足,需要進一步發展與完善。本文闡述了電子檔案歸檔方式...

電子檔案歸檔與電子檔案管理辦法

1 總則 1 1 對電子檔案的形成 積累 鑑定 歸檔及電子檔案的保管實行全過程管理,應當由主管部門統一協調,指定專門機構或人員負責,保證管理工作的連續性。1 2 電子檔案形成部門負責電子檔案的積累 保管和整理工作,檔案部門要進行指導與監督。1 3 電子檔案的管理由檔案部門負責,電子檔案形成部門要提供...

電子檔案歸檔與電子檔案管理辦法

1 總則 1 1對電子檔案的形成 積累 鑑定 歸檔及電子檔案的保管實行全過程管理,應當由主管部門統一協調,指定專門機構或人員負責,保證管理工作的連續性。1 2電子檔案形成部門負責電子檔案的積累 保管和整理工作,檔案部門要進行指導與監督。1 3電子檔案的管理由檔案部門負責,電子檔案形成部門要提供協助和...