根據(jù)《國(guó)務(wù)院辦公廳關(guān)于印發(fā)政府網(wǎng)站發(fā)展指引的通知》國(guó)辦發(fā)〔2017〕47號(hào)及《政府網(wǎng)站網(wǎng)頁(yè)歸檔指南》DA/T80-2019,網(wǎng)站網(wǎng)頁(yè)歸檔勢(shì)在必行!今天筆者帶你走進(jìn)北京冠群信息技術(shù)股份有限公司(簡(jiǎn)稱冠群信息),了解更加專業(yè)的網(wǎng)站網(wǎng)頁(yè)歸檔技術(shù)。
何為 網(wǎng)頁(yè)歸檔 webpage archiving
網(wǎng)頁(yè)歸檔是對(duì)政府網(wǎng)站歷史網(wǎng)頁(yè)進(jìn)行整理、存儲(chǔ)和利用的過(guò)程。政府網(wǎng)站遇整合遷移、改版等情況,要對(duì)有價(jià)值的原網(wǎng)頁(yè)進(jìn)行歸檔處理。歸檔后的頁(yè)面要能正常訪問(wèn),并在顯著位置清晰注明“已歸檔”和歸檔時(shí)間。
網(wǎng)站網(wǎng)頁(yè)歸檔 的意義
在互聯(lián)網(wǎng)時(shí)代,各級(jí)政務(wù)網(wǎng)站作為政府部門(mén)的官方網(wǎng)絡(luò)媒體,其網(wǎng)頁(yè)是政府機(jī)構(gòu)業(yè)務(wù)活動(dòng)的記錄和憑證,是對(duì)政務(wù)公開(kāi)等業(yè)務(wù)信息進(jìn)行回顧、分析和證明的重要資源,具有憑證價(jià)值、情報(bào)價(jià)值和檔案價(jià)值。長(zhǎng)期妥善保存網(wǎng)站網(wǎng)頁(yè),對(duì)于記錄政府機(jī)構(gòu)的職能活動(dòng)及保存社會(huì)記憶有著重要的意義。
發(fā)達(dá)國(guó)家網(wǎng)站網(wǎng)頁(yè)歸檔工作
鑒于大部分網(wǎng)站網(wǎng)頁(yè)存活期不到一年,聯(lián)合國(guó)教科文組織已經(jīng)將網(wǎng)站網(wǎng)頁(yè)列為重要的數(shù)字遺產(chǎn)來(lái)源。國(guó)際上發(fā)達(dá)國(guó)家早已經(jīng)進(jìn)行網(wǎng)站網(wǎng)頁(yè)歸檔工作。
1996年,美國(guó)成立了世界上第一個(gè)因特網(wǎng)檔案館,其任務(wù)就是將公開(kāi)的網(wǎng)頁(yè)和數(shù)字形式的文化產(chǎn)品盡可能完整地歸檔,到2005年6月,已保存了400億頁(yè)網(wǎng)頁(yè)。
1996年,澳大利亞檔案館的網(wǎng)上檔案館正式運(yùn)行,目標(biāo)是長(zhǎng)期保存有關(guān)澳大利亞的網(wǎng)上出版物和澳大利亞的網(wǎng)站,并為公眾提供檢索入口。
2004年,英國(guó)正式啟動(dòng)第一個(gè)公眾網(wǎng)絡(luò)信息保存計(jì)劃UKWAC,對(duì)英國(guó)網(wǎng)站信息進(jìn)行選擇性保存。
中國(guó)政府 網(wǎng)站網(wǎng)頁(yè)歸檔 工作
中國(guó)政府已認(rèn)識(shí)到網(wǎng)站網(wǎng)頁(yè)數(shù)字遺產(chǎn)的保存工作的重要性,正在緊鑼密鼓推行該項(xiàng)工作。
2016年11月3日,中共中央辦公廳印發(fā)《國(guó)家電子文件“十三五”規(guī)劃》,明確提出推進(jìn)政府網(wǎng)頁(yè)電子文件歸檔。
2017年5月,國(guó)務(wù)院辦公廳印發(fā)《政府網(wǎng)站發(fā)展指引》,指出網(wǎng)頁(yè)歸檔是對(duì)政府網(wǎng)站歷史網(wǎng)頁(yè)進(jìn)行整理、存儲(chǔ)和利用的過(guò)程。
2019年12月27日,國(guó)家檔案局正式發(fā)布DA/T 80—2019 《政府網(wǎng)站網(wǎng)頁(yè)歸檔指南》,標(biāo)志檔案行業(yè)正式啟動(dòng)政府網(wǎng)站網(wǎng)頁(yè)歸檔工作。
網(wǎng)站網(wǎng)頁(yè)歸檔 , 中國(guó)核心技術(shù)企業(yè)在行動(dòng)
冠 群信息 網(wǎng)站 網(wǎng)頁(yè)歸檔 管理系統(tǒng) , 面向政府網(wǎng)站,進(jìn)行網(wǎng)頁(yè)采集、生成、歸檔、管理、利用,實(shí)現(xiàn)標(biāo)準(zhǔn)格式的網(wǎng)頁(yè)電子文件集中存儲(chǔ)、統(tǒng)一管理和應(yīng)用,從而達(dá)到對(duì)網(wǎng)頁(yè)電子文件長(zhǎng)久保存利用的目的。滿足黨政部門(mén)對(duì)本單位網(wǎng)站歸檔的需求,可對(duì)網(wǎng)站網(wǎng)頁(yè)進(jìn)行采集,并形成符合國(guó)家標(biāo)準(zhǔn)和檔案行業(yè)標(biāo)準(zhǔn)的電子文件,同時(shí)可保存原有網(wǎng)頁(yè)中的文字、圖形、圖像和鏈接邏輯等重要內(nèi)容,歸檔后的內(nèi)容可供用戶查詢利用。
—— 冠 群信息 網(wǎng)站網(wǎng)頁(yè)歸檔 系統(tǒng) 分為三個(gè)子系統(tǒng) :
1.網(wǎng)頁(yè)采集系統(tǒng)。使用優(yōu)化的網(wǎng)絡(luò)爬蟲(chóng)技術(shù),將指定網(wǎng)站的網(wǎng)頁(yè)采集下來(lái),直接存儲(chǔ)為WARC文件。
2.網(wǎng)頁(yè)電子文件管理系統(tǒng)。將采集到的網(wǎng)頁(yè)經(jīng)版式轉(zhuǎn)換服務(wù)轉(zhuǎn)換成OFD版式文件,然后存儲(chǔ)到網(wǎng)頁(yè)電子文件管理系統(tǒng)中,并依據(jù)電子文件管理系統(tǒng)通用功能建設(shè)要求,對(duì)網(wǎng)頁(yè)電子文件提供自動(dòng)分類、設(shè)定保管周期、鑒定處置、查詢利用等管理功能。
3.網(wǎng)頁(yè)電子文件展示利用系統(tǒng)。用于重現(xiàn)不同歷史時(shí)間點(diǎn)上采集下來(lái)的網(wǎng)站網(wǎng)頁(yè)信息,利用時(shí)間軸方式提供網(wǎng)站展示、專題展示、關(guān)鍵詞檢索和下載等功能。
【關(guān)于冠群 信息 】
冠群信息是參與制訂網(wǎng)站網(wǎng)頁(yè)歸檔管理系統(tǒng)的核心技術(shù)—網(wǎng)頁(yè)轉(zhuǎn)換格式國(guó)家標(biāo)準(zhǔn)GB/T 33190《電子文件存儲(chǔ)與交換格式版式文檔》和DA/T 80—2019《政府網(wǎng)站網(wǎng)頁(yè)歸檔指南》)的廠家之一;是該系統(tǒng)另一核心技術(shù)WARC網(wǎng)頁(yè)存儲(chǔ)格式(國(guó)家標(biāo)準(zhǔn)GB/T33994《信息和文獻(xiàn)-WARC文件格式》)在中國(guó)的最佳實(shí)踐者,擁有自然資源部和國(guó)家信息中心等部委級(jí)成功案例;是中國(guó)網(wǎng)站網(wǎng)頁(yè)歸檔管理系統(tǒng)最有經(jīng)驗(yàn)的實(shí)施者,可以為政府快速構(gòu)建基于SaaS模式或獨(dú)立模式的網(wǎng)站網(wǎng)頁(yè)歸檔管理系統(tǒng)。
免責(zé)聲明:以上內(nèi)容為本網(wǎng)站轉(zhuǎn)自其它媒體,相關(guān)信息僅為傳遞更多信息之目的,不代表本網(wǎng)觀點(diǎn),亦不代表本網(wǎng)站贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性。如稿件版權(quán)單位或個(gè)人不想在本網(wǎng)發(fā)布,可與本網(wǎng)聯(lián)系,本網(wǎng)視情況可立即將其撤除。