CHÍNH SÁCH QUYỀN RIÊNG TƯ CỦA DIGICHECKER
DigiChecker vận hành dựa trên DigiQC API Framework v0.6.0, nhằm phát hiện và tổng hợp các nhóm lỗi kỹ thuật cơ bản trong tài liệu PDF số hóa, bao gồm: lỗi cắt mất nội dung, lỗi toàn vẹn kỹ thuật, lỗi chất lượng ảnh, lỗi bố cục, lỗi OCR và lỗi cấu trúc PDF.
DigiChecker là công cụ thử nghiệm nội bộ hỗ trợ cán bộ thư viện kiểm tra và diễn giải kết quả chất lượng kỹ thuật của tài liệu PDF số hóa.
DigiChecker v1.0-API Beta vận hành dựa trên DigiQC API Framework v0.6.0, nhằm phát hiện và tổng hợp các nhóm lỗi kỹ thuật cơ bản trong tài liệu PDF số hóa, bao gồm: lỗi cắt mất nội dung, lỗi toàn vẹn kỹ thuật, lỗi chất lượng ảnh, lỗi bố cục, lỗi OCR và lỗi cấu trúc PDF.
DigiChecker không thay thế cán bộ kiểm tra chất lượng tài liệu số hóa. Mọi kết quả do hệ thống tạo ra là kết quả kiểm tra kỹ thuật tự động, cần được cán bộ thư viện rà soát, đối chiếu và quyết định trước khi nghiệm thu, lưu trữ hoặc đưa tài liệu vào khai thác.
Khi người dùng sử dụng DigiChecker, hệ thống có thể xử lý các loại dữ liệu sau:
File PDF do người dùng tải lên để kiểm tra chất lượng kỹ thuật;
Tên file PDF;
Thông tin kỹ thuật của file như dung lượng, số trang, khả năng đọc file, thông tin OCR/text layer;
Các chỉ số kỹ thuật phục vụ kiểm tra chất lượng, bao gồm nhưng không giới hạn ở: độ phân giải, độ sắc nét, độ sáng/tối, độ lệch trang, hướng chữ, kích thước trang, thông tin text layer và các chỉ số liên quan đến OCR;
Kết quả kiểm tra lỗi kỹ thuật do DigiQC API trả về, bao gồm mã lỗi, nhóm lỗi, trang lỗi, mức độ lỗi, độ tin cậy và khuyến nghị xử lý;
Báo cáo diễn giải kết quả kiểm tra do DigiChecker tạo ra;
Nhật ký kỹ thuật cơ bản phục vụ vận hành thử nghiệm, bao gồm thời điểm gọi API, endpoint được gọi, trạng thái xử lý, tên file, thời gian xử lý và thông tin lỗi kỹ thuật nếu có.
DigiChecker không yêu cầu người dùng nhập dữ liệu cá nhân để thực hiện chức năng kiểm tra chất lượng kỹ thuật PDF.
Người dùng không nên tải lên hoặc nhập vào DigiChecker các dữ liệu sau nếu không cần thiết cho mục đích kiểm tra kỹ thuật tài liệu số hóa:
Dữ liệu cá nhân của sinh viên, cán bộ, giảng viên hoặc người học;
Thông tin tài khoản, mật khẩu, mã truy cập, khóa API hoặc thông tin xác thực hệ thống;
Dữ liệu mật, dữ liệu nội bộ chưa được phép chia sẻ;
Hồ sơ cá nhân, hồ sơ học tập, hồ sơ tài chính, hồ sơ sức khỏe hoặc các loại dữ liệu nhạy cảm khác;
Tài liệu không thuộc phạm vi được phép kiểm tra, số hóa hoặc xử lý theo quy định của Nhà trường và của Thư viện.
Người dùng chỉ nên tải lên các file PDF cần kiểm tra chất lượng kỹ thuật phục vụ hoạt động số hóa, nghiệm thu, hậu kiểm hoặc quản lý tài liệu số của Thư viện.
Dữ liệu được xử lý nhằm:
Kiểm tra chất lượng kỹ thuật của file PDF số hóa;
Phát hiện các lỗi kỹ thuật thuộc phạm vi DigiQC API Framework v0.6.0;
Tổng hợp lỗi theo nhóm lỗi, mã lỗi, trang lỗi và mức độ ảnh hưởng;
Hỗ trợ cán bộ thư viện xác định tài liệu cần rà soát, xử lý hậu kỳ hoặc quét lại;
Tạo báo cáo kiểm tra chất lượng PDF phục vụ quy trình số hóa và nghiệm thu tài liệu;
Ghi nhận lỗi kỹ thuật phục vụ vận hành thử nghiệm, cải tiến quy trình và nâng cao chất lượng công cụ.
DigiChecker không sử dụng dữ liệu người dùng để đánh giá nội dung học thuật, phân tích quan điểm cá nhân, nhận diện người dùng, theo dõi hành vi cá nhân hoặc phục vụ mục đích ngoài phạm vi kiểm tra kỹ thuật tài liệu số hóa.
Trong giai đoạn thử nghiệm, file PDF được tải lên DigiChecker được chuyển tới DigiQC API để xử lý kỹ thuật. Hệ thống chỉ xử lý file nhằm tạo kết quả kiểm tra và báo cáo tương ứng.
DigiChecker/DigiQC API không chủ trương lưu trữ lâu dài file PDF người dùng tải lên, trừ trường hợp cán bộ phụ trách chủ động lưu lại để phục vụ kiểm tra lỗi, đối chiếu kết quả hoặc hoàn thiện bộ mẫu thử nghiệm nội bộ.
Nhật ký kỹ thuật cơ bản có thể được lưu tạm thời trên máy chủ hoặc máy tính vận hành API nhằm phục vụ việc kiểm tra lỗi, bảo trì hệ thống và đánh giá hiệu quả vận hành thử nghiệm.
Cán bộ phụ trách có trách nhiệm quản lý, rà soát và xóa các file hoặc nhật ký thử nghiệm khi không còn cần thiết cho mục đích vận hành, kiểm thử hoặc cải tiến công cụ.
DigiChecker không chủ động chia sẻ dữ liệu người dùng cho bên thứ ba ngoài các dịch vụ, thành phần kỹ thuật cần thiết để thực hiện chức năng kiểm tra PDF, bao gồm:
ChatGPT/GPT Actions để tiếp nhận yêu cầu, điều phối quy trình và trả báo cáo cho người dùng;
DigiQC API Framework để xử lý file PDF và tạo kết quả kiểm tra kỹ thuật;
Gateway/API trung gian và hạ tầng kết nối public HTTPS phục vụ việc chuyển tiếp yêu cầu từ DigiChecker tới DigiQC API trong giai đoạn thử nghiệm;
Các thành phần kỹ thuật cần thiết khác phục vụ vận hành nội bộ, giám sát lỗi và bảo trì hệ thống.
Dữ liệu và kết quả kiểm tra chỉ phục vụ hoạt động thử nghiệm, kiểm tra chất lượng tài liệu số hóa và nghiệp vụ quản lý tài liệu số của Trung tâm Thông tin - Thư viện.
Người dùng cần:
Chỉ tải lên các file PDF cần kiểm tra chất lượng kỹ thuật;
Không tải lên dữ liệu cá nhân, dữ liệu nhạy cảm, tài liệu mật hoặc tài liệu không được phép xử lý;
Kiểm tra kỹ báo cáo do DigiChecker tạo ra trước khi sử dụng trong quy trình nghiệm thu hoặc xử lý tài liệu;
Không xem kết quả của DigiChecker là kết luận tuyệt đối về chất lượng tài liệu;
Rà soát thủ công các trang được hệ thống cảnh báo lỗi, đặc biệt với các lỗi có mức độ high hoặc critical;
Đối chiếu với bản gốc hoặc file nguồn khi cần xác nhận các lỗi liên quan đến mất nội dung, thiếu trang, sai thứ tự trang hoặc lỗi cần phán đoán nghiệp vụ;
Thông báo cho cán bộ phụ trách nếu phát hiện hệ thống trả kết quả bất thường, thiếu chính xác hoặc không xử lý được file.
DigiChecker là công cụ hỗ trợ thử nghiệm. Kết quả kiểm tra do hệ thống tạo ra dựa trên bộ rule kỹ thuật hiện có của DigiQC API Framework v0.6.0 và có thể chưa bao quát toàn bộ lỗi phát sinh trong thực tế.
DigiChecker có thể hỗ trợ phát hiện các lỗi kỹ thuật như: lỗi cắt mất nội dung, trang trắng, trang trùng, ảnh mờ, ảnh độ phân giải thấp, trang xoay sai chiều, OCR thiếu hoặc lỗi cấu trúc PDF. Tuy nhiên, hệ thống không thay thế hoàn toàn việc rà soát thủ công.
DigiChecker không cam kết phát hiện chắc chắn các lỗi cần phân tích nội dung hoặc đối chiếu ngữ nghĩa phức tạp, chẳng hạn:
Chèn nhầm trang không liên quan nhưng hình thức kỹ thuật vẫn bình thường;
Thiếu chương, thiếu mục hoặc thiếu phần nội dung cần đối chiếu với mục lục;
Sai thứ tự logic nội dung;
Sai nội dung học thuật;
OCR có text layer nhưng sai nghĩa ở mức cần đọc hiểu sâu;
Các lỗi cần so sánh với bản gốc hoặc dữ liệu nguồn bên ngoài.
Trách nhiệm kiểm tra, xác nhận và quyết định xử lý cuối cùng thuộc về cán bộ thư viện hoặc bộ phận phụ trách quy trình số hóa.
Mọi phản hồi về vận hành thử nghiệm DigiChecker vui lòng liên hệ:
Trung tâm Thông tin - Thư viện
Đại học Công nghiệp Hà Nội
Email: lic.haui.edu.vn@gmail.com
Website: https://lic.haui.edu.vn
Thứ Sáu, 11:41 12/06/2026
Copyright © 2018 Hanoi University of Industry.