Hướng dẫn lựa chọn Di sản số để bảo quản lâu dài
UNESCO/PERSIST
Hướng dẫn lựa chọn di sản số để bảo quản lâu dài[1]
Mở đầu
Các cơ quan di sản (thư viện, lưu trữ, bảo tàng) chịu trách nhiệm bảo quản tài nguyên trí tuệ và văn hóa sản sinh bởi toàn xã hội. Sứ mệnh quan trọng này đang lâm nguy trên phạm vi toàn thế giới do lượng thông tin số được tạo ra và chia sẻ hàng ngày. Không chỉ đơn giản hóa quá trình tạo lập và chia sẻ nội dung, công nghệ số còn là cội nguồn của sự gia tăng thông tin số theo cấp số nhân. Cứ hai năm, dữ liệu số lại tăng gấp đôi quy mô và tăng gấp 10 lần từ năm 2013 đến năm 2020. Bảo quản lượng thông tin đầu ra khổng lồ này là một nhiệm vụ khó khăn, một phần vì quy mô nhưng phần lớn là vì tuổi thọ ngắn. Thông tin số không có cùng tuổi thọ với vật mang tin, tài liệu và sách - thường tồn tại qua nhiều thế kỷ. Các định dạng file số, phương tiện và hệ thống lưu trữ liên tục thay đổi, do đó khả năng đọc hiểu và tính toàn vẹn của di sản số trong tương lai bị đặt vào vòng nguy hiểm có thời hạn ngắn hơn nhiều so với thời gian hư hại của tài liệu giấy và hiện vật; ngoài ra, dữ liệu số không phải lúc nào cũng sẵn sàng để phục vụ thu thập. Sự trường tồn của di sản số ít được đảm bảo hơn so với tài liệu truyền thống trong các sưu tập của chúng ta. Việc xác định những di sản số quan trọng và can thiệp sớm là điều cần thiết để bảo quản lâu dài những di sản này.
Để hỗ trợ các cơ quan quản lý di sản trong việc thực hiện nhiệm vụ quan trọng này, Dự án UNESCO/PERSIST (Nền tảng nhằm nâng cao tính bền vững của xã hội thông tin trên toàn cầu) đã biên soạn Hướng dẫn lựa chọn di sản số để bảo quản lâu dài. PERSIST được đưa ra thảo luận tại Hội nghị Chương trình Ký ức thế giới tại Vancouver, Canada (9/2012). Sau Hội nghị, Tuyên bố Vancouver UBC/UNESCO Chương trình Ký ức thế giới trong Kỷ nguyên số: Số hóa và Bảo tổn đã được thông qua như một lời kêu gọi hành động để bảo tồn di sản số của thế giới trước khi quá muộn. Hưởng ứng lời kêu gọi này, dự án PERSIST được giới thiệu tại Hội nghị quốc tế ở Thành phố La Hay (The Hague), Hà Lan (05 - 06/12/2013), như một liên kết giữa UNESCO, Liên đoàn quốc tế các Hội và Cơ quan thư viện (IFLA), Hội đồng Lưu trữ quốc tế (ICA) và một số đối tác khác. PERSIST được tổ chức gồm 03 bộ phận chính (chính sách, công nghệ và nội dung), mỗi bộ phận giải quyết các thách thức khác nhau đặt ra đối với việc bảo quản lâu dài dữ liệu số. HƯỚNG DẪN này do Bộ phận nội dung biên soạn để xin ý kiến của UNESCO và cộng đồng di sản.
HƯỚNG DẪN nhằm mục đích cung cấp một xuất phát điểm mang tính bao quát cho các cơ quan lưu trữ, thư viện, bảo tàng và các cơ quan di sản khác khi hoạch định chính sách riêng về lựa chọn di sản số để bảo quản lâu dài. Các chính sách đang áp dụng tại cơ quan có thể bị đánh giá là đi ngược lại HƯỚNG DẪN và phải sửa đổi nếu cần.
HƯỚNG DẪN hướng tới đối tượng công chúng đa dạng. Do di sản số có thể có nhiều điểm khác biệt giữa các cộng đồng, khu vực và đất nước, việc bảo quản chúng đòi hỏi sự tham gia và hợp tác của cả hai lĩnh vực công và tư cũng như các chủ thể tạo lập nội dung. Trong khi các cơ quan công có thể chịu trách nhiệm pháp lý trong việc quản lý các sưu tập di sản thì các tổ chức tư nhân hẳn cũng có thể đối mặt với thách thức về bảo quản và đảm bảo khả năng tiếp cận thông tin số. Điều này có thể do các yêu cầu chế định và trách nhiệm với các cơ quan, tổ chức, nhưng có một trách nhiệm xã hội chung trong việc hỗ trợ sự tăng trưởng và phát triển bền vững của cộng đồng, khu vực và thế giới bằng cách bảo tồn và giúp các thế hệ tương lai tiếp cận những di sản số có giá trị.
HƯỚNG DẪN thừa nhận rằng các cơ quan lưu trữ, thư viện, bảo tàng và các cơ quan hữu quan khác rất đa dạng về chức năng, nhiệm vụ và phương pháp thu thập và quản lý tài liệu, hiện vật. Tuy nhiên, với sự phát triển của công nghệ thông tin cũng như yêu cầu và kỳ vọng ngày càng cao của người dùng về việc tiếp cận nhanh chóng và tích hợp các sưu tập của thư viện, lưu trữ và bảo tàng, mọi cơ quan di sản và nhà cung cấp thông tin đang đứng trước những thách thức giống nhau trong việc lựa chọn và bảo quản dữ liệu số. Do đó, HƯỚNG DẪN nhằm mục đích đánh giá lại những tài liệu hướng dẫn lựa chọn; nhấn mạnh các vấn đề quan trọng và cung cấp chỉ dẫn trong việc xây dựng chính sách của cơ quan/tổ chức. Bộ phận nội dung cũng ghi nhận khía cạnh đạo đức trong lựa chọn di sản để bảo quản nhưng không khai thác chi tiết khía cạnh này.
Vai trò của các cơ quan và mạng lưới quốc gia
Các cơ quan cấp quốc gia phải đóng vai trò then chốt, cung cấp chỉ dẫn cho cộng đồng di sản về các vấn đề lựa chọn và bảo quản tài liệu số. Ở nhiều nước, các cơ quan như vậy có quy định về việc nộp lưu di sản văn hóa chẳng hạn như nộp lưu chiểu ấn phẩm hoặc các văn kiện chính thức của Chính phủ. Những quy định hiện hành, nếu chỉ áp dụng cho tài liệu giấy/hiện vật, cần được điều chỉnh để áp dụng cho tài liệu số.
Tiếp nhận và thu thập di sản số, thông qua nền tảng và nhiều kênh đa dạng, đòi hỏi nỗ lực và nguồn lực rất lớn. Cùng một tên miền quốc gia có thể có tới hàng ngàn đến hàng triệu website; trên đó hàng triệu đến hàng tỷ file được đăng tải, cập nhật hoặc gỡ bỏ hàng ngày. Một lượng lớn di sản số ngoại tuyến cũng xứng đáng được lưu giữ cho tương lai (chẳng hạn như dữ liệu chưa được xử lý từ các nghiên cứu, tài liệu của chính phủ, các file số của các tổ chức và cá nhân). Do phạm vi của thách thức này, các cơ quan quốc gia đương nhiên phải giữ vai trò chỉ đạo, bằng cách xây dựng những chính sách và hệ thống phù hợp để thu thập và quản lý dữ liệu số hay điều hành mạng lưới phối hợp trong việc thống nhất các phương thức lựa chọn và bảo quản. Chúng tôi khuyến cáo các cơ quan và mạng lưới quốc gia phát triển các chiến lược lựa chọn có sự tham vấn của cộng đồng quản lý di sản. Một điều hết sức quan trọng đó là các đối tác khác như Chính phủ, các trường học, trung tâm nghiên cứu, các tổ chức phi lợi nhuận và tư hữu giữ vai trò và trách nhiệm quản lý. Chẳng hạn, các cơ quan quốc gia có thể hợp tác xây dựng các tiêu chuẩn và quy trình thu thập, tổ chức và bảo quản thông tin số trong khi các đối tác khác hoàn thiện những tiêu chuẩn và quy trình này. Các tổ chức quốc tế (như Hội đồng Lưu trữ quốc tế (ICA), Liên đoàn quốc tế các thư viện và Hiệp hội thư viện (IFL) và Hội đồng Bảo tàng quốc tế (ICOM)) cũng cần tham gia vào công việc này bởi vì bảo quản di sản số là thách thức toàn cầu.
Ảnh hưởng của môi trường pháp lý đối với việc lựa chọn
Môi trường pháp lý có quan hệ mật thiết đối với việc lựa chọn và bảo quản di sản số. Các bộ luật quốc gia và quốc tế, với nhiều điểm khác nhau, quy định việc quảng bá, nhân bản, tiếp cận và sử dụng di sản số nhưng internet đang vượt mọi ranh giới lãnh thổ, khiến cho việc xác định người nào đang giữ bản quyền và luật nào có thể áp dụng hay áp dụng cho ai trở nên khó khăn. Các luật và quy định của Chính phủ - tôn trọng việc bảo vệ quyền sở hữu trí tuệ, quyền riêng tư, bí mật Nhà nước và việc truy cập thông tin rộng rãi - đều ảnh hưởng đến việc di sản số nào có thể được bảo quản và bảo quản như thế nào, cũng như có nên và khi nào thì công chúng được tiếp cận những di sản đó. Luật Bản quyền, trừ một số ngoại lệ và hạn chế, có thể cấm tạo bản sao và gây ra những vấn đề mới trong môi trường số mà trong đó việc lập bản sao là cần thiết để bảo quản lâu dài. Hơn nữa, thiết bị số thường là phần mềm cần thiết đối với việc tìm kiếm và khôi phục, đồng thời, phần mềm này cũng có thể được bảo vệ bằng bản quyền. Một số quốc gia đã ban hành những đạo luật nhằm ngăn chặn việc vi phạm các biện pháp bảo vệ công nghệ được sử dụng để chống sao chép và phân phối lại, và điều này có thể gây khó khăn cho việc bảo quản cũng như tiếp cận dữ liệu số sau này. Các trở ngại pháp lý đối với việc bảo quản và cung cấp tiếp cận di sản số sẽ gây áp lực lớn lên các quyết định lựa chọn.
Có một rủi ro lớn đó là môi trường pháp lý chặt chẽ sẽ ảnh hưởng bất lợi đến tuổi thọ lâu dài của di sản số quan trọng. Các Thỏa thuận riêng hoặc Thỏa thuận nhóm với người giữ bản quyền có thể là cách duy nhất để bảo vệ và bảo quản một số loại hình di sản (chẳng hạn như Thỏa thuận của Thư viện Quốc hội và Twitter). Chúng tôi khuyến cáo việc thông qua luật quốc tế và trong nước nhằm vượt qua các rào cản về lựa chọn và bảo quản dữ liệu số phục vụ sự tiếp cận của công chúng.
Tư duy toàn cầu: Vấn đề lựa chọn di sản số đối với các cơ quan di sản
Thách thức bảo quản lâu dài trong thời đại số đòi hỏi phải suy nghĩ lại về cách các cơ quan di sản xác định ý nghĩa và đánh giá giá trị. Do sự gia tăng và dồi dào của di sản và thông tin số cùng đặc tính dễ thay đổi và biến mất của rất nhiều trong số đó, cơ quan quản lý di sản cần chủ động trong việc xác định các di sản và thông tin số cần bảo quản lâu dài trước khi chúng biến mất. Điều gì cần được bảo tồn để phục vụ lợi ích lâu dài của nhân loại? Các loại hình truyền thống của di sản văn hóa - sách, tạp chí định kỳ, văn kiện của chính phủ, thư từ cá nhân, nhật ký, bản đồ, phim, ảnh, ghi âm, hiện vật, tác phẩm nghệ thuật - đều đã có phiên bản số, phù hợp với sứ mệnh và thực tiễn hiện nay. Nhưng môi trường số cũng tạo ra nhiều hình thức biểu đạt mới, từ trang web và mạng truyền thông xã hội tương tác đến cơ sở dữ liệu tra cứu cá nhân hay môi trường trò chơi trực tuyến, xóa nhòa ranh giới và phạm vi trách nhiệm, đồng thời, thách thức các phương pháp thu thập trong quá khứ.
Hầu hết các quy định và chính sách thu thập hiện nay không đề cập đến những loại hình di sản số này. Sự thờ ơ chung của chúng ta đối với những loại hình mới này có nguy cơ tạo ra một lỗ hổng lớn về di sản văn hóa đối với các thế hệ mai sau. Chẳng hạn, dù giá trị của các bài viết cá nhân trên blog hoặc truyền thông xã hội không quá lớn, nhưng nếu được tập hợp lại, chúng tạo thành tài liệu có một không hai về xã hội, các cuộc thảo luận, tư tưởng và thành tích của hàng triệu cá nhân đương đại. Nếu được bảo quản, chúng sẽ là một nguồn tri thức đặc biệt cho thế hệ tương lai. Chỉ tập trung vào phần “tốt nhất” của sản phẩm đầu ra này có thể gây ra thành kiến và cản trở việc phân tích quá trình tạo lập dữ liệu số đương đại. Nhưng rất ít, nếu không nói là không có cơ quan quản lý di sản nào có nguồn lực hay có quyền trong một vài trường hợp, thu thập và bảo quản tập trung sản phẩm đầu ra dưới dạng số. Đó là nghịch lý của việc lựa chọn trong thời đại số. Việc lựa chọn rất quan trọng vì việc thu thập toàn bộ dữ liệu số hiện nay là không thể, nhìn từ góc độ kinh tế - kỹ thuật và bị cấm, nhìn từ khía cạnh luật pháp. Do đó, lựa chọn để bảo quản lâu dài là chức năng then chốt của các cơ quan quản lý di sản trong thời đại số.
Dù một số ranh giới truyền thống giữa thư viện, lưu trữ và bảo tàng đang mờ dần trong thời đại số, những cơ quan này vẫn có những mối quan tâm cốt lõi chung trong bảo quản di sản. Vì vậy, những vấn đề đặc thù dưới đây sẽ liên quan ít nhiều đến từng cơ quan:
Thư viện sẽ đối mặt với thách thức lựa chọn tài liệu số gắn liền với vấn đề xuất bản trực tuyến, thu thập dữ liệu website và nội dung thuộc sở hữu cá nhân trên các trang truyền thông xã hội như Facebook và YouTube. Các thư viện quốc gia đang cố gắng thu thập toàn bộ, với truyền thống nộp lưu chiểu, sẽ phải áp dụng chính sách lựa chọn với những ấn phẩm dạng số có tuổi thọ ngắn. Trong quá khứ, việc chọn lọc được thực hiện bởi nhà xuất bản - đơn vị “xác định” các sản phẩm đầu ra sáng tạo thông qua các lựa chọn về xuất bản (tức là xác định thứ gì được xuất bản). Trong thế giới dân chủ của tự xuất bản và e-book, các thư viện quốc gia cần điều chỉnh phương pháp thu thập toàn bộ trong quá khứ và thông qua các tiêu chí để lựa chọn tài liệu bảo quản lâu dài. Nhưng không phải mọi thư viện đều là cơ quan “bảo tồn”, nhiều thư viện chỉ có chức năng hỗ trợ người sử dụng hoặc nhu cầu nghiên cứu tạm thời của cộng đồng. Lựa chọn di sản số để bảo quản lâu dài đối với những thư viện này có thể chủ yếu tập trung vào việc xác định giá trị những ấn phẩm đã có trong bộ sưu tập, vốn được bổ sung để sử dụng tạm thời, thay vì xác định giá trị những ấn phẩm mới để mua thêm.
Bảo tàng với nhiều bộ sưu tập hiện vật văn hóa phong phú thường bổ sung thêm hiện vật để bảo quản lâu dài và quyết định phát triển các bộ sưu tập theo hướng này. Di sản văn hóa dạng số ngày càng phổ biến (máy móc được điều khiển bởi phần mềm máy tính như: tác phẩm nghệ thuật số, tư liệu số hóa về các di chỉ khảo cổ vv…). Thông tin nghiên cứu về các sưu tập hiện vật bảo tàng cũng ngày càng phổ biến dưới dạng số. Do đó, di sản số ở bảo tàng có thể chia thành các nhóm sau: di sản số trong sưu tập, thông tin số hoặc số hóa về sưu tập và phiên bản số của hiện vật trong sưu tập (ảnh số hoặc scan 3D). Theo cách phân loại này, bảo tàng thường ưu tiên bảo quản lâu dài nhóm 1 và nhóm 2. Nhóm 2 và nhóm 3 còn bao gồm tài liệu hành chính do bảo tàng sản sinh.
Không hề phóng đại khi nói về tầm quan trọng của siêu dữ liệu (thông tin về di sản số và hiện vật) đối với bảo tàng. Siêu dữ liệu này bao gồm thông tin bối cảnh về di sản hiện vật và di sản số trước khi đưa vào bảo tàng và thông tin bối cảnh về “cuộc sống” của tài liệu tại bảo tàng. Nguyên tắc về xuất xứ cũng quan trọng đối với các bảo tàng.
Cơ quan lưu trữ có truyền thống thu thập tài liệu gốc hoặc độc bản để bảo quản lâu dài và thường phụ thuộc vào quãng thời gian từ khi tài liệu sản sinh đến khi tài liệu được nộp lưu vào lưu trữ để áp dụng quan điểm lịch sử trong việc đưa ra quyết định lựa chọn. Tuy nhiên, sự lỗi thời nhanh chóng của các định dạng số, phương tiện lưu trữ số và phần mềm, phần cứng của hệ thống đang làm giảm cơ hội được lựa chọn của tài liệu số, với nguy cơ bị mất tài liệu hoặc những tài liệu được thu thập sớm có thể vẫn chưa “chứng minh” được tầm quan trọng của chúng theo thời gian. Trong khi những tư liệu do thư viện thu thập được phát tán thành nhiều bản hay có sẵn trên mạng tài liệu số thường được lưu trữ ngoại tuyến trong các hệ thống, máy chủ và mạng nội bộ, không cho phép công chúng tiếp cận. Việc tiếp cận và lựa chọn cần được thảo luận với chủ sở hữu tài liệu, thậm chí với các cơ quan thuộc Chính phủ nơi có nhiệm vụ nộp lưu tài liệu. Các cơ quan lưu trữ tập trung vào tầm quan trọng của tính xác thực, xuất xứ và bối cảnh trong việc xác định giá trị tài liệu nộp lưu, nhưng tính chất dễ chỉnh sửa và nhân bản của tài liệu số làm cho việc đánh giá những nhân tố nói trên trong lựa chọn tài liệu trở nên khó khăn. Môi trường pháp lý thường ấn định thông tin số nào cần được cơ quan lưu trữ thu thập và bằng cách nào đưa những thông tin đó đến công chúng và giới nghiên cứu.
Những nhân tố ảnh hưởng đến việc lựa chọn như trên không phải chỉ áp dụng riêng cho cộng đồng lưu trữ, thư viện và bảo tàng. Thực tế gần như chắc chắn rằng sự giao thoa nhất định giữa 3 lĩnh vực. Nhưng việc xem xét lại sự đa dạng của cộng đồng giúp làm sáng tỏ những vấn đề các cơ quan đang vướng mắc trong việc xác định và lựa chọn di sản để bảo quản lâu dài.
Kế hoạch hành động 1: Chiến lược thu thập di sản số
Các cơ quan di sản cần điều chỉnh các phương pháp đang áp dụng cho phù hợp với môi trường số. Có khả năng rằng hầu hết các cơ quan sẽ điều chỉnh một hoặc một nhóm các chiến lược hay phương pháp sau để hoàn thành nhiệm vụ thu thập của mình:
Thu thập toàn bộ
Phương pháp này sử dụng để thu thập toàn bộ tài liệu được sản sinh về một chủ đề, một khoảng thời gian hoặc một khu vực địa lý và đòi hỏi nguồn lực tài chính lớn từ cơ quan hoặc cần được giới hạn ở phạm vi hẹp. Việc nộp lưu chiểu ấn phẩm có lẽ là phương pháp thường gặp nhất, qua đó thư viện nỗ lực thu thập toàn bộ xuất bản phẩm của quốc gia thông qua việc yêu cầu các nhà xuất bản nộp lưu chiểu một số bản của mỗi ấn phẩm do họ phát hành. Bảo tàng cũng có thể tập hợp toàn bộ các tác phẩm được sáng tác trong một khoảng thời gian nhất định hoặc cơ quan lưu trữ có thể thu thập toàn bộ tài liệu liên quan đến một nhân vật có tầm ảnh hưởng.
Thu thập đại diện
Thu thập đại diện là một phương pháp khác để xác định tài liệu cần bảo quản lâu dài. Phương pháp này thường được áp dụng khi một cơ quan không có đủ nguồn lực hoặc khả năng để thu thập toàn bộ và việc phân loại tài liệu theo các tiêu chí lựa chọn đặc thù là một vấn đề nan giải. Trong trường hợp này, phương pháp thu thập đại diện đưa ra một phương pháp để thu thập các ảnh tiêu biểu, khiến việc lựa chọn và bảo quản trở nên dễ thực hiện hơn và đòi hỏi ít nguồn lực hơn. Chẳng hạn, một thư viện quốc gia có thể thực hiện thu thập thông tin thường xuyên đối với toàn bộ các website có tên miền quốc gia (web crawling[2]) (như .dk hoặc .fr) để bảo quản một hình ảnh trực tuyến đại diện của quốc gia ở những thời điểm khác nhau. Một cơ quan lưu trữ có thể lựa chọn một số hồ sơ kiện tụng của Chính phủ bằng phương pháp thu thập đại diện, chẳng hạn như chỉ bảo quản những hồ sơ kiện tụng được ghi chép một cách đầy đủ nhất, hay hồ sơ sản sinh trong một năm nhất định hoặc bắt đầu bằng một chữ cái nhất định trong bảng chữ cái.
Lựa chọn
Phương pháp lựa chọn được áp dụng khi các chuyên gia di sản - cán bộ lưu trữ, thư viện và bảo tàng - xác định tài liệu/hiện vật để bổ sung vào bộ sưu tập trên cơ sở các tiêu chí đặc thù. Các tiêu chí này có thể rất đa dạng, phụ thuộc vào loại hình cơ quan, nhiệm vụ thu thập, nguồn lực và loại hình cùng quy mô của tài liệu/hiện vật cần thu thập. Tiêu chí lựa chọn thường được mô tả hoặc xác định trong chính sách thu thập, và có thể dựa trên các tiêu chí sau (các tiêu chí này cũng có thể kết hợp):
- Chủ đề: Một cơ quan có thể tập trung hoặc dẫn chứng bằng tài liệu cho một hoặc nhiều chủ đề. Chẳng hạn, tất cả các website về một họa sĩ địa phương cụ thể hoặc một trang web thu thập thông tin về một sự kiện nhất định như bầu cử hoặc lễ hội nghệ thuật.
- Cơ quan sản sinh/Nguồn gốc xuất xứ: Một cơ quan có thể tập trung vào một số cơ quan sản sinh hoặc nguồn gốc xuất xứ nhất định của di sản. Chẳng hạn, cơ quan lưu trữ có thể thu thập tài liệu số của các tác giả ở một khu vực nhất định; bảo tàng có thể thu thập tác phẩm của các nghệ sĩ thuộc một trào lưu nhất định.
- Loại hình/định dạng: Một cơ quan có thể thu thập theo loại hình hoặc định dạng nội dung (ảnh số, ghi âm, phim, video game…)
Trong một số trường hợp, các cơ quan, tổ chức có thể lựa chọn thu thập toàn bộ di sản số lúc bấy giờ và giai đoạn sau mới áp dụng tiêu chí lựa chọn theo hình thức lựa chọn được hoãn lại (deferred selection).
Kế hoạch hành động 2: Xây dựng tiêu chí lựa chọn cho một cơ quan
Mỗi cơ quan lưu trữ, thư viện và bảo tàng nên lựa chọn, xác định ưu tiên cho di sản số như thế nào trước khi chúng biến mất? Chức năng, nhiệm vụ và chính sách phát triển các sưu tập tài liệu/hiện vật đang áp dụng hiện nay, trong hầu hết các trường hợp, sẽ cung cấp xuất phát điểm và những chỉ dẫn thiết yếu để xác định giá trị và lựa chọn di sản số. Những nội dung này cần được điều chỉnh ngay bây giờ để áp dụng cho cả tài liệu số.
Xác định giá trị di sản số phải dựa trên các nguyên tắc tương tự đã được áp dụng đối với tài liệu truyền thống, đồng thời, phải xem xét những vấn đề mới về khả năng tiếp cận, sử dụng và bảo quản lâu dài trong quá trình ra quyết định. Một cơ quan cần trả lời những câu hỏi trên bằng cách đánh giá ý nghĩa (significance) tương đối của di sản số đối với nhiệm vụ của cơ quan và đối với công chúng; đánh giá độ bền (sustainability) của di sản, tức là khả năng bảo quản để có thể tiếp cận và sử dụng lâu dài; xem xét sự hiện diện (availability) của di sản đó ở các cơ quan di sản khác, khả năng di sản có thể được bảo quản ở nơi khác và cơ quan nào bảo quản di sản đó thì phù hợp nhất. Các khái niệm giá trị và độ bền trong hoàn cảnh này phải được đánh giá trên cơ sở chức năng nhiệm vụ và nguồn lực của cơ quan. Khái niệm sự hiện diện hướng tới các cơ quan khác trong cộng đồng di sản để đánh giá mức độ rủi ro đối với tuổi thọ lâu dài của di sản số. Cần đặc biệt lưu ý đến các di sản có nhiều rủi ro biến mất ở tầm ngắn và trung hạn. Di sản số có giá trị nhân văn rộng rãi, chẳng hạn như các phương thức biểu đạt (expression) của các dân tộc bản địa dưới dạng số, cần được xác định và bảo quản trước khi chúng gặp rủi ro.
Nhận thức được rằng mỗi cơ quan bảo tồn đều có chức năng nhiệm vụ, chính sách thu thập và nguồn lực riêng, dưới đây, chúng tôi đề xuất các bước và vấn đề có thể ảnh hưởng đến quyết định lựa chọn di sản số. Phương pháp này có thể điều chỉnh cho phù hợp với nhu cầu riêng của các cơ quan với những mục đích và quy mô khác nhau. Dù không được áp dụng, những bước này có thể tạo thành xuất phát điểm cho việc thảo luận trong cơ quan về việc lựa chọn di sản số để bảo quản lâu dài.
Cây quyết định để lựa chọn trong từng cơ quan
Phương pháp này gồm 4 bước, đưa ra một loạt các câu hỏi để hỗ trợ việc đánh giá một cách chắc chắn và có căn cứ:
Bước 1: Xác định
Xác định tài liệu cần thu thập hoặc đánh giá.
- Tiêu đề, cơ quan, tổ chức, cá nhân sản sinh ra tài liệu, xuất xứ, phạm vi, điều kiện?
- Loại và dung lượng siêu dữ liệu sẵn có?
- Xác định các thông số của dự án, nếu phù hợp.
- Quyết định kiểu Đồng ý/Không đồng ý là đủ?
- Có cần đánh giá tương đối (cao, trung bình, thấp hoặc thang giá trị bằng con số) để so sánh di sản đó với các tài liệu khác?
- Ghi lại/ lưu lại quyết định của quý vị trong bước này (cách quý vị đạt được nó) và lưu hồ sơ. Đảm bảo rằng hồ sơ được cập nhật và có thể tiếp cận.
Bước 2: Khung pháp lý
- Cơ quan, tổ chức có nghĩa vụ pháp lý phải bảo quản tài liệu này không?
- Nhiệm vụ hoặc chính sách về bảo quản và phát triển các sưu tập số hóa của cơ quan, tổ chức có yêu cầu phải bảo quản tài liệu này không?
- Nếu có, hãy bảo quản. Quyết định bảo quản đã được thông qua, không cần tiến hành các bước tiếp theo.
- Ghi lại/ lưu lại quyết định của bạn quý vị trong bước này (cách quý vị đạt được nó) và lưu hồ sơ. Đảm bảo rằng hồ sơ được cập nhật và có thể tiếp cận.
Bước 3: Áp dụng các tiêu chí lựa chọn
Nếu không có nghĩa vụ pháp lý phải thu thập di sản số, cơ quan, tổ chức có thể đánh giá tài liệu bằng cách sử dụng 3 tiêu chí lựa chọn: giá trị, tính bền vững và sẵn có để xác định tài liệu có nên được bảo tồn hay không. Các tiêu chí này nên được đánh giá theo một thứ tự hiệu quả nhất đối với cơ quan, thường bắt đầu từ tiêu chí dễ nhất để đánh giá và tiếp tục cho đến khi đưa ra quyết định cuối cùng.
3a. Ý nghĩa (Significance)
- Giá trị lâu dài của di sản số có xứng đáng với việc bảo quản hay không?
- Di sản có giá trị xã hội, văn hóa, lịch sử hoặc nghệ thuật đối với cộng đồng mà cơ quan đang phục vụ hay không?
- Di sản có giá trị thông tin, nội dung, sử dụng, triển lãm hoặc nghiên cứu hay không?
- Những giá trị này hỗ trợ và phù hợp ở mức độ nào với chức năng và nhiệm vụ của cơ quan, tổ chức?
- Nguồn gốc xuất xứ, tính quý, hiếm, độc đáo hoặc tính điển hình của tài liệu có ảnh hưởng đến giá trị của nó hay không?
- Các cá nhân, tổ chức có quan hệ với cơ quan (khách hàng, nhà bảo trợ, xã hội) sẽ bị ảnh hưởng như thế nào nếu di sản số này không được bảo quản?
- Nếu di sản số quan trọng đối với chức năng, nhiệm vụ của cơ quan, hãy xem xét việc bảo quản.
- Ghi lại/ lưu lại quyết định của quý vị trong bước này (cách quý vị đạt được nó) và lưu hồ sơ. Đảm bảo rằng hồ sơ được cập nhật và có thể tiếp cận.
3b. Tính bền vững (Sustainability)
- Cơ quan, tổ chức có đủ nguồn lực và kinh phí để bảo quản di sản này lâu dài không?
- Cơ quan, tổ chức có năng lực kỹ thuật để đọc, chuyển đổi và bảo quản di sản số không?
- Có cần các quyền đặc thù để gửi hoặc chuyển đổi tài liệu sang định dạng khác hoặc vật mang tin khác.
- Có đủ siêu dữ liệu để bảo tồn và tiếp cận di sản số không?
- Cơ quan, tổ chức có thể cho phép tiếp cận vì mục đích nghiên cứu, triển lãm hoặc mục đích không để đáp ứng mong muốn của công chúng không?
- Nếu các câu trả lời chủ yếu là “không”, nên cân nhắc để không bảo quản chúng.
- Ghi lại/ lưu lại quyết định của quý vị trong bước này (cách quý vị đạt được nó) và lưu hồ sơ. Đảm bảo rằng hồ sơ được cập nhật và có thể tiếp cận.
3c. Sự hiện diện (availability)
Xem xét sự hiện diện của di sản số ở các cơ quan khác trong cộng đồng hoặc mạng lưới di sản.
- Cơ quan (của quý vị) có phải là cơ quan duy nhất bảo quản tài liệu này hay có những bản sao y đang được bảo quản tại những cơ quan khác?
- Đây là tài liệu hiếm hoặc độc bản hay đã được sao chép rộng rãi?
- Ở đâu thì tài liệu sẽ được sử dụng nhiều nhất hoặc sẽ mang lại lợi ích lớn nhất cho công chúng?
- Tài liệu có gặp rủi ro nếu bảo quản ở các cơ quan khác hay không?
- Cơ quan (của quý vị) có phải là nơi phù hợp nhất và tốt nhất để bảo quản và cung cấp tiếp cận di sản số này?
Lưu ý: Để việc bảo quản di sản số được an toàn, việc lưu trữ nhiều hơn 1 bản là cần thiết.
- Nếu câu trả lời là “Không”, có lẽ di sản số nên được bảo quản bởi một cơ quan khác. Nhưng các tiêu chí còn lại có thể được cân nhắc để xem xét lại câu trả lời này.
- Ghi và lưu biên bản quyết định lần này. Đảm bảo rằng biên bản được cập nhật và có thể tiếp cận.
Bước 4: Quyết định
Biên soạn và xem xét lại toàn bộ hồ sơ đã lập trong quá trình đánh giá và đưa ra quyết định dựa trên các kết quả từ bước 1 đến bước 3. Lập biên bản ghi rõ lý do đánh giá hoặc quyết định. Đây là việc làm có ý nghĩa sống còn đối với công tác quản trị cũng như để thu thập thông tin quan trọng cho việc đánh giá lại có thể xảy ra trong tương lai. Chuẩn bị một báo cáo bằng văn bản về ý nghĩa của di sản số và các vấn đề kỹ thuật trong bảo quản di sản số, kèm theo các câu trả lời cho những câu hỏi ở các bước từ 1 đến 3. Những nhận xét phía sau quyết định thường quan trọng hơn so với bản thân quyết định. Cần tạo một biểu mẫu đánh giá tiêu chuẩn của cơ quan hoặc xác định giá trị của tài liệu để ghi lại những nhận xét này và là hồ sơ chứng thực cho quyết định. Tài liệu về cơ sở lý luận và chứng thực cho việc đánh giá hoặc ra quyết định có ý nghĩa rất quan trọng đối với công tác quản trị cũng như để thu thập thông tin quan trọng cho việc đánh giá lại tiềm năng trong tương lai.
Phương pháp này rất linh hoạt, một cơ quan không cần áp dụng toàn bộ các câu hỏi. Trật tự các tiêu chí cũng có thể thay đổi; chẳng hạn trong một số trường hợp, bước 3c nên được thực hiện trước bước 3a và 3b, đặc biệt nếu thấy rõ rằng cơ quan khác phù hợp hơn. Nhưng việc áp dụng phương pháp này sẽ giúp các cơ quan di sản đưa ra những quyết định đúng đắn hơn trong việc lựa chọn tài liệu số để bảo quản lâu dài.
Kết luận
Bảo quản lâu dài di sản số có lẽ là thách thức khó khăn nhất mà các cơ quan di sản đang phải đối mặt hiện nay. Xây dựng và áp dụng các tiêu chí lựa chọn và chính sách thu thập là bước đầu tiên đảm bảo quản rằng di sản số quan trọng được bảo quản vì lợi ích của các thế hệ hôm nay và mai sau.
Phụ lục 1: Quản lý công tác bảo quản lâu dài di sản số và siêu dữ liệu
Việc lựa chọn di sản số gắn bó mật thiết với các vấn đề liên quan đến bảo quản lâu dài và tiếp cận. Việc mất mát di sản số quan trọng có thể không tránh khỏi nhưng rủi ro này có thể được giảm thiểu bằng cách áp dụng các phương pháp tốt nhất trong bảo quản dữ liệu số, bao gồm việc nhân bản, quản lý tích cực và quản lý siêu dữ liệu.
Sao bảo hiểm
Di sản số quan trọng, bao gồm các tệp chính với siêu dữ liệu được liên kết, phải có nhiều bản sao được lưu trữ ở ít nhất hai vị trí khác nhau. Các cơ quan di sản có thể sử dụng kết hợp các hình thức lưu trữ trực tuyến (on-site), ngoại tuyến (off-site) và điện toán đám mây, nhưng bản gốc phải được sao lưu ở ít nhất một vị trí khác. Các địa điểm bảo quản phải được lựa chọn để giảm thiểu rủi ro mất mát do thiên tai hoặc thảm họa và khủng hoảng kinh tế hoặc chính trị.
Quản lý tích cực
Các cơ quan di sản phải quản lý một cách tích cực di sản số của mình để đảm bảo khả năng tiếp cận và tính toàn vẹn lâu dài của di sản. Di sản số phải được bảo quản với định dạng file mở và đầy đủ thông tin kèm theo, không mã hóa và ít nhất là nén không mất dữ liệu. Phương pháp này rất phù hợp với các cơ quan di sản trong việc quản lý tích cực các đối tượng số. Lưu trữ nên sử dụng hai hay nhiều loại phương tiện khác nhau, trong phạm vi từ máy chủ của cơ quan đến phương tiện lưu trữ di động (đĩa từ, phương tiện quang học, băng từ…).
Sự cố hệ thống trong thời gian dài có thể làm mất thông tin quan trọng đối với các di sản số được lưu trữ. Nhiều cơ quan phòng tránh lỗi hệ thống bằng cách sử dụng phương tiện làm mới định kỳ, bao gồm việc đọc dữ liệu số, kiểm tra lỗi bằng cách sử dụng kỹ thuật sửa lỗi và viết lại trên phương tiện mới. Để tránh lỗi phần mềm, chủ sở hữu dữ liệu số thường sử dụng giao thức tiêu chuẩn để tiếp cận kho dữ liệu, nơi các trang web lưu trữ khác nhau đang chạy các cài đặt khác nhau của phần mềm lưu trữ. Do đó, tính toàn vẹn và độ tin cậy của dữ liệu không phụ thuộc vào tính toàn vẹn và độ tin cậy của bất kỳ cài đặt đơn lẻ nào.
Quản lý siêu dữ liệu
Siêu dữ liệu thường được mô tả là “dữ liệu về dữ liệu”, dù sát nhưng không thật sự chính xác. Trong các cơ quan di sản, siêu dữ liệu nên được nhìn nhận như mọi thông tin (dưới dạng số hoặc dạng vật lý) rất cần thiết để đảm bảo rằng dữ liệu số đang được bảo quản đang và sẽ có thể tiếp cận được, hiểu được và sử dụng được theo thời gian. Siêu dữ liệu cung cấp cho các cơ quan những thông tin cần thiết để truy cập và bảo quản di sản số trong tương lai.
Các cơ quan di sản thường bảo quản 3 loại hình siêu dữ liệu chính gắn liền với di sản số cần được bảo quản lâu dài:
- Siêu dữ liệu cấu trúc yêu cầu về năng lực kỹ thuật để đọc nội dung số.
- Siêu dữ liệu đặc tả (chứa thông tin bối cảnh thư mục, lưu trữ hoặc bảo tàng, có thể do hệ thống tự khởi tạo hoặc được tạo lập bởi các chuyên gia về di sản, phụ trách nội dung hoặc người dùng).
- Siêu dữ liệu hành chính (cung cấp tư liệu về việc quản lý đối tượng số thuộc bộ sưu tập).
Nếu di sản số là “nội dung” thì siêu dữ liệu cung cấp “bối cảnh”.
Dưới đây là 5 yêu cầu chức năng cơ bản đối với siêu dữ liệu số:
Nhận dạng (Identification)
Siêu dữ liệu phải cho phép mỗi đối tượng số được nhận dạng một cách duy nhất và rõ ràng. Việc này thường đòi hỏi gắn cho mỗi đối tượng một mã nhận dạng duy nhất.
Vị trí (Location)
Siêu dữ liệu phải cho phép định vị và truy xuất từng đối tượng số. Giá trị lâu dài của dữ liệu vị trí này cần được đảm bảo để các tài liệu không bị mất khi hệ thống được di chuyển hoặc cập nhật.
Mô tả (Description)
Cần một bản mô tả đối tượng số để tạo điều kiện cho việc khôi phục và giải thích dữ liệu. Siêu dữ liệu mô tả gồm 2 nhóm: dữ liệu về nội dung và dữ liệu về bối cảnh. Dữ liệu về nội dung của một tài liệu có thể được tái tạo bằng cách kiểm tra và tra cứu. Tuy nhiên, dữ liệu về nội dung vẫn có ích như một công cụ hỗ trợ tìm kiếm để khôi phục tài nguyên. Dữ liệu về bối cảnh, khi nào, ở đâu và do ai mà đối tượng được tạo ra, đối tượng được sử dụng vào mục đích gì, vị trí của đối tượng trong tương quan với toàn bộ cơ sở dữ liệu, quan trọng hơn nhiều trong việc khôi phục một đối tượng bị mất.
Khả năng đọc (Readability)
Cần siêu dữ liệu về cấu trúc, định dạng và mã hóa đối tượng số để đảm bảo rằng các đối tượng số đang và sẽ đọc được. Yêu cầu chức năng này đặc biệt quan trọng đối với các đối tượng số vì chúng không thể đọc được khi không có công nghệ trung gian. Siêu dữ liệu này phải xác định các tiêu chuẩn liên quan và cung cấp tham chiếu đến tài liệu kỹ thuật, các tệp tiêu đề chuẩn và các tài liệu liên quan khác cần thiết đối với việc khôi phục tài nguyên số. Phải đảm bảo rằng tất cả các lớp (layer) của đối tượng số có thể được diễn giải: từ định dạng tệp đóng gói tới việc mô tả và mã hóa dữ liệu.
Quản lý các quyền (Rights management)
Các quyền, điều kiện sử dụng và hạn chế áp dụng với từng đối tượng số cần được ghi lại trong siêu dữ liệu. Siêu dữ liệu này phải xác định các luật và công ước có thể áp dụng và cung cấp chỉ dẫn tới các tư liệu pháp lý, hợp đồng liên quan…cũng như các chủ sở hữu.
Lưu trữ siêu dữ liệu (Storage of metadata)
Nhiều định dạng file số cho phép ghi siêu dữ liệu vào chính file đó. Lợi ích của việc này là đảm bảo sự liên kết giữa dữ liệu và siêu dữ liệu. Tuy nhiên, siêu dữ liệu cần được lưu trữ độc lập với tài nguyên số mà nó mô tả; điều này là cần thiết để đáp ứng những yêu cầu chức năng trên. Chẳng hạn, một đối tượng số mã hóa không thể đọc được nếu bộ mã chỉ được tìm thấy trong chính đối tượng đó.
Siêu dữ liệu
Một số dữ liệu về nguồn gốc và cách thức tạo lập siêu dữ liệu cũng cần thiết để tạo nên độ tin cậy và tính xác thực của siêu dữ liệu; siêu dữ liệu do ai tạo ra và tạo ra khi nào? Siêu dữ liệu được thu thập tự động hay thủ công? Công cụ và kỹ thuật nào được sử dụng? Để truy xuất và hiểu được thông tin số trong tương lai, cần phải bối cảnh hóa siêu dữ liệu.
Phụ lục 2: Giải thích thuật ngữ
Các định nghĩa được lấy từ các nguồn liệt kê tại Phụ lục 3
Tính xác thực của di sản số là mức độ đáng tin của một tài liệu hoặc đối tượng, tức là chất lượng của những gì mà đối tượng hoặc tài liệu sẽ trở thành là tài liệu gốc hoặc bản sao đáng tin cậy bắt nguồn từ các quy trình được ghi lại một cách đầy đủ từ bản gốc.
Lựa chọn nội dung là quá trình quyết định đối tượng nào hoặc tài liệu nào xứng đáng được bảo quản thông qua việc đánh giá ý nghĩa và giá trị văn hóa, khoa học, bằng chứng lâu dài hoặc các giá trị khác của tài liệu cũng như mức độ khả thi của việc bảo quản và tiếp cận dựa trên các nguyên tắc, chính sách, quy trình và tiêu chuẩn đã có.
Di sản số là di sản được tạo thành từ các dữ liệu vi tính, cho dù được tạo ra từ các dữ liệu số hay số hóa từ các định dạng khác, sản sinh bởi các cộng đồng, các ngành nghề, lĩnh vực, khu vực khác nhau và đòi hỏi phương pháp bảo quản tích cực để đảm bảo tính xác thực, khả năng tiếp cận và sử dụng qua thời gian.
Di sản là tài sản từ quá khứ, là những gì mà ngày nay chúng ta đang sống cùng và những gì cần được lưu truyền từ thế hệ này sang thế hệ khác bởi ý nghĩa và giá trị của chúng.
Siêu dữ liệu là các thông tin mô tả, giải thích, định vị hoặc làm cho việc đọc hiểu, khôi phục, sử dụng, quản lý, kiểm soát hay bảo quản một đối tượng hoặc tài nguyên thông tin trở nên dễ dàng hơn.
Phụ lục 3: Tài liệu tham khảo
Danh sách các tài liệu tham khảo sau đây là một lựa chọn nhưng không có nghĩa là đầy đủ:
2015 National Agenda for Digital Stewardship, 2014
CENL/FEP Statement on the Implementation of (Statutory and Voluntary) Deposit Schemes for Non-Print Publications, FEP and CENL, 2012
Digital Legal Deposit, an IPA [International Publishers Association] Special Report, 2014
Bonnel, Sylvie and Oury, Clément, “Selecting websites in an encyclopaedic national library: a shared collection policy for internet legal deposit at the BnF”, 2014
Caroline Brazier, British Library, “http://library.ifla.org/222/1/198-brazier-en.pdf.”, 2013
British Library, British Library digital preservation strategy 2013 – 2016, 2013.
Bailey, Catherine A. “Past Imperfect? Reflections on the Evolution of Canadian Federal Government Records Appraisal”, Archivaria 75, 2013.
Canada, Canadian Heritage Information Network, Digital Preservation Toolkit, 2013.
Kenneth Crews, “Study on Copyright Limitations and Exceptions for Libraries and Archives”, Standing Committee on Copyright and Related Rights, World Intellectual Property Organization, Twenty-ninth Session, Geneva, December 8 to 12, 2014
Cunningham, Adrian, “Recent Developments in Standards for Archival Description and Metadata” IASA Journal no 16, 2000.
Digital Preservation Coalition, Digital Preservation Handbook Definitions and Concepts, 2008
Duff, Wendy and van Ballegooie, Marlene, Archival Metadata, DCC Digital Curation Manual, 2006.
Harvey, R. "Appraisal and selection" DCC Digital Curation Manual (2006) (which aims to offer a generic selection framework)
IFLA, IFLA Statement on Legal Deposit, 2011
InterPARES 2 Project, “Preserver Guidelines - Preserving Digital Records: Guidelines for Organizations”, 2007
InterPARES 2 Project, InterPARES 2 Project Dictionary, 2015.
ISAD(G), “General International Standard Archival Description 2nd Edition”, Ottawa: ICA, 2000.
ISO 15489-1 Information and documentation – Records management – Part 1: General, ISO 2001.
ISO, ISO 16175-1:2010(E) Information and documentation – Principles and functional requirements for records in digital office environments – Part 1: Overview and statements of principles, 2010.
ISO, Information and documentation — Statistics and Quality Indicators for Web Archiving , 2013 (draft available).
Koerbin, Paul, Colin Webb, and David Pearson, “Oh, you wanted us to preserve that?!'
Statements of Preservation Intent for the National Library of Australia's Digital Collections”, D-Lib Magazine, 2013, Volume 19, Number 1/2
Lariviere, Jules, “Guideline for Legal Deposit Legislation”, UNESCO, 2000
Library of Congress Digital Preservation Webpage
NYARC Reframing Collections for a Digital Age Report from Consultant No. 2, 2012, USA
Netherlands, Cultural Heritage Agency, “Assessing Museum Collections: Collection Valuation in Six Steps”, 2014.
Niu, Jinfang "Appraisal and Selection for Digital Curation", International Journal of Digital Curation, 2014 Vol. 9 Issue 2, 65-82.
Niu, Jinfang, “An Overview of Web Archiving”, D-Lib Magazine, 2012, Volume 18, Number 3/4.
Noonan, D.W. “Digital preservation policy framework: A case study’, Educause Review 2014
Paradigm Project, Workbook on Digital Private Papers, United Kingdom, 2005-2007
Sheridan, John, Amanda Spencer, and David Thomas, “UK Government Web Continuity: Persisting Access through Aligning Infrastructures”, The International Journal of Digital Curation Issue 1, Volume 4, 2009.
Society of American Archivists, A Glossary of Archival and Records Terminology, 2005
The State of Digital Preservation: An International Perspective, Conference proceedings, Washington D.C., April 24-25, 2002. Washington, DC, 2002
UBC/UNESCO Vancouver Declaration The Memory of the World in the Digital Age:
Digitization and Preservation, Canada, 2012
UNESCO, Charter on the Preservation of Digital Heritage, 2003
Van der Werf, T. and B., ‘The paradox of selection in the digital age’, 2014
Helmus, W., “Survey on selection and collecting strategies of born digital heritage - best practices and guidelines”, 2015
Verheul, I. “Networking for Digital Preservation: Current Practice in 15 National Libraries”, München, 2006