Microsoft Word - bai2.doc
BÀN TIN THƯ VIỆN – CÔNG NGHỆ THÔNG TIN
THÁNG 4/2004

14
PHẦN MỀM NGUỒN MỞ HÒN ĐÁ XANH VÀ
VIỆC PHÁT TRIỂN THƯ VIỆN SỐ

ThS. ĐOÀN HỒNG NGHĨA
Head of Software Solutions, 990 Company
Chief Architect, Integrated e-Solutions Ltd.

“… Một hòn đá không thể lớn lên được, nó chỉ có thể bị mòn
đi hoặc rã ra. Một sinh vật sống có thể lớn lên, thích nghi,
hoàn thiện và tiến hoá. Đây cũng chính là sự khác biệt giữa
phần mềm thương mại và phần mềm nguồn mở. Phần mềm
thương mại không có sự tương tác của người sử dụng, trong
khi đó phần mềm nguồn mở được hoàn thiện, thích nghi với
yêu cầu của từng người sử dụng và có khả năng tiến hoá
theo những nguyên tắc chung của cộng đồng sử dụng đề ra
…”
Bob Young – Kiến trúc sư trưởng RedHat Linux

háng 8 năm 2003, Thạc sĩ Nguyễn Minh Hiệp, Giám đốc Thư viện Cao học
Trường Đại học Khoa học Tự nhiên có đặt ra vấn đề quản lý các tài nguyên số để
phục vụ cho công tác xây dựng thư viện số. Vấn đề quản lý và sử dụng các nguồn
tài nguyên số được Thư viện Cao học và Liên hiệp thư viện các trường đại học phía Nam
(FESAL) rất quan tâm do nhu cầu cung cấp tài nguyên số cho công tác giảng dạy, học tập
và nghiên cứu khoa học. Công ty Integrated e-Solutions Ltd. đã nghiên cứu nhu cầu và
khảo sát các phần mềm thương mại và nguồn mở trong nước và trên thế giới. Phần mềm
nguồn mở Hòn Đá Xanh (Greenstone) được xác định là giải pháp phần mềm cho bài toán
đặt ra.

Hòn Đá Xanh là một bộ phần mềm giúp xây dựng và phân loại các bộ sưu tập
(collection) của thư viện số. Hòn Đá Xanh đưa ra một cách tiếp cận mới trong việc tổ
chức và xuất bản thông tin trên mạng nội bộ, Internet hoặc trên CD-ROM. Hòn Đá Xanh
là kết quả của dự án thư viện số tại trường đại học Waikato, NewZealand (New Zealand
Digital Library Project), đã được triển khai và phân phối với sự hợp tác của hai tổ chức
UNESCO và Human Info NGO. Hòn Đá Xanh là một phần mềm nguồn mở có sẵn tại địa
chỉ http://www.greenstone.com , tuân thủ theo GNU General Public License. Mục tiêu
của phần mềm thư viện số Hòn Đá Xanh là nhằm giúp cho các tổ chức như các trường
đại học, các tổ chức Liên hiệp quốc, các tổ chức phi chính phủ, phi lợi nhuận và các
chính phủ trong việc tạo ra các loại thông tin có thể được phân phối trực tuyến hoặc trên
các CD-ROM. Phần mềm Hòn Đá Xanh đã được Công ty Integrated e-Solutions Ltd.
phối hợp với Thư viện Cao học đã Việt hoá hoàn toàn các thành phần giao diện đến các
tài liệu hướng dẫn sử dụng, quản trị hệ thống và phương pháp xây dựng các bộ sưu tập
số. Bên cạnh đó Công ty và Thư viện đã biên soạn sách “Thực hành xây dựng thư viện
số” và thiết kế Chương trình Tập huấn Xây dựng Thư viện số là những công cụ hết sứu
hữu ích cho việc xây dựng kho tài nguyên số cho các thư viện.
T
BÀN TIN THƯ VIỆN – CÔNG NGHỆ THÔNG TIN
THÁNG 4/2004

15
hư viện số là gì? Thư viện số là một tập hợp các bộ sưu tập số (digital collections)
của các đối tượng số hoặc đã được số hoá (digital objects – text, video, audio) với
hai khả năng chính:
— Các phương thức truy cập, chọn lọc và hiển thị tài nguyên số (dành cho độc giả)
— Các phương thức xây dựng, tổ chức và lưu hành (dành cho cán bộ thư viện)

Kho tài nguyên thông tin của thư viện số là nơi tập trung các loại tài liệu khác
nhau: sách, tạp chí, bài giảng, luận văn, cơ sở dữ liệu, … dưới nhiều dạng khác nhau:
dạng văn bản (text), Postscript, Adobe PDF, Microsoft Word, HTML, CSDL SQL, …
Các tài liệu này đa phần được tổ chức với các cấu trúc bên trong của tài liệu khác nhau
(chương, mục, …) nhưng có thể phân ra từng nhóm (từng bộ sưu tập) theo chủ đề, hoặc
lĩnh vực khoa học, … Khi phân loại các nhóm tài liệu này chúng ta có thể thấy ngay các
cấu trúc tổ chức và cách thức biên mục, chỉ mục cần thiết cho các nhóm tài liệu này.
Công tác sưu tầm và tổ chức tài liệu hiện nay thực ra là việc tổ chức các sưu tập số, tuy
người sử dụng chưa nhận ra điều này. Khác với các tài liệu dạng bản in, việc tin học hoá
và số hoá của các thông tin này cho phép chúng ta có khả năng phân loại và đánh dấu
(indexing) cấu trúc tổ chức, cấu trúc biên mục tài liệu (biểu ghi thư tịch), các thành phần
nội dung (chương, mục, dòng, các hình ảnh, biểu đồ, bản vẽ, cụm từ đặc trưng, …) Đây
là những khả năng mà nhiều phần mềm thương mại hiện nay chưa thể hỗ trợ ví dụ như
các phần mềm này không thể cho người dùng tự tổ chức các biểu ghi thư tịch (thường chỉ
cung cấp duy nhất một loại biểu ghi) và cách quản lý, đánh dấu nội dung bên trong
(thường chỉ đánh dấu các từ). Ví dụ như các sưu tập về âm nhạc, đi kèm theo các bài
nhạc có mô tả nốt nhạc hoàn toàn có cấu trúc khác biệt so với một tài liệu là bản đồ chia
theo nhiều vùng khác nhau. Sự khác biệt này không chỉ đơn thuần về cách hiển thị mà
còn là vấn đề xử lý cấu trúc bên trong của thông tin. Do khả năng cần tích hợp với các
dạng thông tin khác nhau, thư viện số cần đáp ứng các nhu cầu lưu trữ tập trung (tại trung
tâm tài nguyên) và phân tán (tại các khoa, bộ môn, …) nhưng vẫn cần đáp ứng nhu cầu
quản lý tập trung và tích hợp dễ dàng. Các vấn đề khác không kém phần quan trọng là
việc “tự động hoá” công tác nhập dữ liệu (một bộ sưu tập số hoá không thể nhập thủ
công), khả năng xuất bản “một” hoặc “vài” bộ sưu tập số từ trong kho tài nguyên ra CD-
ROM hoặc DVD-ROM, khả năng “nhập một bộ sưu tập” từ CD/DVD vào trực tiếp trong
kho tài nguyên chỉ cần vài thao tác trên giao diện, … Ngoài ra, vấn đề hỗ trợ đa ngôn ngữ
(Việt, Anh, Pháp, Nga, Nhật, Trung Quốc, Ả rập, …) là vấn đề hết sức cần thiết vì chúng
ta không thể phụ thuộc vào phần mềm, chờ đợi các phiên bản mới cho một ngôn ngữ mới
nếu như ví dụ chúng ta cần thêm chỉ một bộ sưu tập về bia đá đời Đường của Trung Quốc
với các hình ảnh chụp và các chú dẫn tiếng Trung Quốc.

Đây là những câu hỏi mà các phần mềm thương mại khó trả lời được, đơn giản là vì khả
năng có được đội ngũ lập trình vừa thông thạo về nghiệp vụ thư viện, các chuẩn quốc tế
nhằm trao đổi và xử lý thông tin thư viện, khả năng tích hợp các công cụ hiện đại trên
nền nguồn mở. Đây cũng là những yếu kém cơ bản do yếu kém về nghiệp vụ thư viện, về
công nghệ thông tin trong thư viện và về năng lực phần mềm của cộng đồng thư viện -
công nghệ thông tin của chúng ta.
T

BÀN TIN THƯ VIỆN – CÔNG NGHỆ THÔNG TIN
THÁNG 4/2004

16
Chúng ta cần làm gì khi xây dựng thư viện số?
Trước khi bắt đầu, bạn nên quan tâm đến những câu hỏi dưới đây:
o Mục tiêu thư viện số của bạn là gì?
o Nhóm đối tượng mà bạn quan tâm?
o Nhóm đối tượng này đa dạng như thế nào, địa phương, tôn giáo hay toàn cầu?
o Số lượng tài liệu bạn muốn có trong thư viện số?
o Tổng cộng bao nhiêu trang?
o Có bao nhiêu tài liệu lại hình ảnh đồ họa?
o Tài liệu có cần thiết được chia thành các phần được tra cứu bởi một số ít người
đọc và các phần được tham khảo một cách phổ biến?
o Các tài liệu đã ở sẵn dạng kỹ thuật số chưa?
o Nếu vậy, chúng ở dạng nào?
o Quyền hạn và bản quyền của các tài liệu là gì?
o Ai sở hữu bản quyền?
o Có những tổ chức nào khác có cùng nhóm đối tượng không?
o Bạn có sẵn sàng hợp tác với những tổ chức khác không?
o Ngân quỹ bạn dành cho toàn bộ dự án thư viện số là bao nhiêu?
o Bao nhiêu nhân lực bạn dành cho việc biên tập tài liệu, quét tài liệu và lập trình?
o Cần bao nhiêu máy tính cho dự án?
o Bao nhiêu đĩa CD-ROM bạn muốn phát hành?
o Chúng là miễn phí hay để bán?

Chúng tôi xin đưa ra một so sánh đầu tư (Global Help Project, Antwerp, UN agencies)

Đầu tư bản in và phần mềm thương mại:
o 160,000 trang, 30,000 ảnh
o 800 sách, 430 tạp chí
o 340 kg
o Máy vi tính, máy chủ
o Phần mềm: 20,000 USD

Đầu tư tài liệu số hoá và Hòn Đá Xanh:
o CD-ROM
o Máy vi tính, máy chủ
o Phần mềm: 10,000,000 VND



Từ Thư viện Quốc hội Hoa Kỳ đến thư viện làng Kataanyi, Kakunyu, Uganda đều sử dụng Greenstone

BÀN TIN THƯ VIỆN – CÔNG NGHỆ THÔNG TIN
THÁNG 4/2004

17
hần mềm Hòn Đá Xanh là một bộ phần mềm phục vụ công tác xây dựng, lưu
hành, truy cập các sưu tập số hoá của thư viện số với đầy đủ các chức năng cơ bản
quản lý tài nguyên thư viện thông thường và số hoá:
o Xuất phát từ NZ Digital Library Project, do cộng đồng mã nguồn mở phát triển
o Cung cấp: UNESCO; Human Info NGO; NCSI – Bangalore; UCT – Cape Town,
Integrated e-Solutions Ltd. & Thư viện Cao học, ĐHKHTN
o CD-ROM, GNU license
o Giao diện qua Web (Internet Explorer, Netscape) tiếng Anh, Nga, ... và tiếng Việt
o Hoạt động trên tất cả các hệ điều hành thông dụng: Unix/Linux/Windows/Mac OS
o Dạng tài liệu: HTML, Word, PDF, PS, text, email, audio, video, ...
o Các chuẩn dữ liệu: MARC, DC, XML
o Các chuẩn liên thông: Open eBook, SDLIP, Greenstone, OAI, Z39.50
o Tài liệu sử dụng, quản trị, tạo bộ sưu tập bằng tiếng Anh, Nga, Pháp, ... và tiếng
Việt
o Phát triển thêm các chức năng theo yêu cầu

Một số ví dụ về các thư viện đang sử dụng phần mềm Hòn Đá Xanh:



New York Botanical Garden
P
BÀN TIN THƯ VIỆN – CÔNG NGHỆ THÔNG TIN
THÁNG 4/2004

18




Lehigh University Digital Bridges Collections





University of Chicago, Chopin Early Editions Collections

THAM KHẢO

1.
http://www.greenstone.org

2.
http://www.glib.hcmuns.edu.vn