[Demo] KHAI PHÁ DỮ LIỆU HỆ GEN BẰNG PHƯƠNG PHÁP MẠNG LƯỚI
Công trình nghiên cứu này đã phát triển một phương pháp tiếp cận mới trong phân cụm dữ liệu quan hệ, với mục tiêu khai thác tri thức tiềm ẩn phục vụ chẩn đoán và điều trị ung thư.
Nguyễn Minh Tân () , Trung tâm Thông tin - Thư viện, ĐH Công nghiệp Hà Nội
Dùng phương pháp mạng lưới tìm ra gen có khả năng gây bệnh cao.
Công trình nghiên cứu này đã phát triển một phương pháp tiếp cận mới trong phân cụm dữ liệu quan hệ, với mục tiêu khai thác tri thức tiềm ẩn phục vụ chẩn đoán và điều trị ung thư. Trọng tâm của phương pháp là xây dựng một thuật toán đo lường độ tương đồng giữa các bản ghi trong cơ sở dữ liệu, từ đó thiết lập mạng lưới biểu diễn mối quan hệ và áp dụng các kỹ thuật khoa học mạng để phát hiện cấu trúc phân cụm. Phương pháp modularty và các kỹ thuật mạng phức hợp tìm ra core của mạng. Sau đó kết hợp với thuật toán gần gũi thứ bậc để xếp hạng các gen, những gen nào có thứ bậc cao là các gen có khả năng gây bệnh cao.
Khi triển khai trên bộ dữ liệu sàng lọc ung thư gồm hơn 177.000 bản ghi tại Bệnh viện Ung bướu Trung ương Việt Nam, nhóm nghiên cứu đã phát hiện được những quy luật có ý nghĩa về sự phân bố ung thư, chẳng hạn mối liên hệ giữa một số loại ung thư với yếu tố gia đình và khu vực sinh sống. Kết quả này không chỉ gợi mở khả năng ứng dụng các kỹ thuật phân tích mạng trong lĩnh vực tin sinh học, mà còn đóng góp trực tiếp vào việc nhận diện các yếu tố nguy cơ, hỗ trợ công tác dự phòng và điều trị ung thư tại Việt Nam. Phương pháp phân cụm dựa trên khoa học mạng do đó có tiềm năng trở thành một công cụ hữu hiệu trong khai thác dữ liệu quan hệ quy mô lớn.
Công trình công bố: M. T. Nguyen, D. T. Pham, V. H. Tran, and D. T. Tran, “Identification of cancer rules in Viet Nam by network modularity”, Vietnam J. Sci. Technol., vol. 60, no. 6, pp. 1134–1148, Dec. 2022. DOI: https://doi.org/10.15625/2525-2518/16678
Toàn văn báo cáo:
Thứ Hai, 10:58 25/08/2025
Copyright © 2018 Hanoi University of Industry.