Phòng nghiên cứu Cơ sở dữ liệu và Hệ thống thông tin

Địa chỉ: Phòng 609, nhà E3 – Viện Công nghệ Thông tin, Đại học Quốc gia Hà Nội

PGS.TS. Vũ Việt Vũ
Trưởng phòng

Email: vuvietvu@vnu.edu.vn

Phòng Cơ sở dữ liệu và Hệ thống thông tin có nhiệm vụ: (1) Triển khai các hoạt động nghiên cứu khoa học, phát triển công nghệ và triển khai ứng dụng trong lĩnh vực Cơ sở dữ liệu và Hệ thống thông tin; (2) Triển khai đào tạo nguồn nhân lực Tiến sỹ và đào tạo ngắn hạn chuyên sâu về Trí tuệ nhân tạo, học máy và khai phá dữ liệu cũng như các lĩnh vực liên quan; (3) Thực hiện các dịch vụ tư vấn và chuyển giao công nghệ thuộc lĩnh vực Cơ sở dữ liệu và Hệ thống thông tin và chuyển đổi số.

Hiện tại, Phòng Cơ sở dữ liệu và Hệ thống thông tin tập trung một số hướng nghiên cứu sau:

  • Trí tuệ nhân tạo
  • Học máy, học sâu
  • Khai phá dữ liệu
  • Cơ sở dữ liệu, dữ liệu lớn
  • Xứ lý ảnh trong y tế
  • Chuyển đổi số và các ứng dụng thông minh

Đội ngũ

1. PGS.TS Vũ Việt Vũ
2. GS.TS Vũ Đức Thi
3. Cao Ngọc Ánh – Nghiên cứu sinh
4. Lê Hồng Lam – Nghiên cứu sinh
5. Đặng Vũ Tuấn – Nghiên cứu sinh
6. Nông Minh Ngọc – Nghiên cứu sinh

Đội ngũ cộng tác viên

1. PGS.TS. Nguyễn Hà Nam – Viện nghiên cứu cao cấp về Toán
2. PGS.TS Trần Doãn Vinh
3. TS. Nguyễn Hải Minh
4. TS. Vũ Việt Thắng
5. ThS Đào Trần Chung
6. ThS Trần Công Mậu
7. ThS. Lê Thị Kiều Oanh

Một số đề tài, dự án khoa học công nghệ nổi bật

1. Nghiên cứu và đề xuất các thuật toán phân cụm tích hợp ràng buộc và học sâu Mục tiêu của đề tài là nghiên cứu phát triển các thuật toán học máy trong việc khai phá và phân tích dữ liệu. Cụ thể đề tài sẽ tập trung phát triển hai dạng thuật toán là thuật toán học sâu và thuật toán phân cụm bán giám sát.

Hình 1. Ví dụ về thuật toán học sâu áp dụng cho ảnh nội soi (Hội nghị ACOMP, 2021)

Với thuật toán học sâu, nhóm nghiên cứu sẽ tập trung vào các kiến trúc mạng học sâu tiên tiến dựa trên CNN, RNN. Hình 1 minh họa ví dụ về một số mạng học sâu cho bài toán phân loại ảnh trào ngược dạ dày. Các hệ thống phát hiện đối tượng trong ảnh, phân loại ảnh hiện nay đang được ứng dụng nhiều trong lĩnh vực y tế thông minh.Hướng nghiên cứu thứ hai trong đề tài là nghiên cứu các kỹ thuật học chủ động (active learning) cho bài toán phân cụm bán giám sát. Các thuật toán phân cụm bán giám sát (semi-supervised clustering) sử dụng các ràng buộc (must-link, cannot-link) để tích hợp vào quá trình phân cụm để tăng chất lượng phân cụm. Trong hướng nghiên cứu này, các phương pháp học chủ động sẽ được phát triển nhằm lựa chọn ra các rang buộc tối ưu nhất có thể để tích hợp vào thuật toán phân cụm. Hình 2 minh họa thuật toán của chúng tôi trong việc tìm các ràng buộc tối ưu áp dụng cho các thuật toán phân cụm bán giám sát.

Hình 2. Các ràng buộc thu thập được bằng phương pháp học chủ động (must-link, cannot-link tương ứng với các đoạn nét liền và nét đứt) (Hội nghị ICACT, 2022)

2. Phát triển các phương pháp phân cụm bán giám sát phục vụ cho bài toán phân loại trạng thái cảm xúc khuôn mặtMục tiêu nghiên cứu của đề tài là phân loại các trạng thái cảm xúc khuôn mặt từ cơ sở dữu liệu ảnh. Cụ thể đầu vào của hệ thống có thể là các video, các tập ảnh hoặc các ảnh khuôn mặt và hệ thống sẽ chuẩn hóa dữu liệu về dạng ảnh khuôn mặt. Tiếp đó hệ thống sẽ sử dụng các thuật toán phân cụm hiệu quả cho việc phân nhóm các ảnh khuôn mặt tương ứng với các biểu cảm khuôn mặt như biểu cảm hạnh phúc, ngạc nhiên, sợ hãi, buồn chán, ghê tởm, giận dữ. Đối với bài toán này hai cách tiếp cận có thể áp dụng đó là sử dụng các thuật toán phân cụm hoặc các thuật toán phân lớp (CNN, Support Vector Machine, Random Forest,…). Trong nghiên cứu của chúng tôi sẽ sử dụng các phương pháp phân cụm bán giám sát. Cụ thể chúng tôi đã phát triển một số số thuật toán phân cụm bán giám sát như MCSSDBS (tạp chí IDA, 2019), thuật toán MCSSGC (Hội nghị KSE, 2017) để áp dụng vào việc phân nhóm các khuôn mặt dựa trên biểu cảm.

Hình 3. Ví dụ về xác định biểu cảm khuôn mặt.

Một số công trình khoa học tiêu biểu trong 5 năm gần đây

  • Viet-Vu Vu, Byeongnam Yoon, Cuong Le, Hong-Quan Do, Hai-Minh Nguyen, Tran-Chung Dao, Viet-Thang Vu, Cong-Mau Tran, Doan-Vinh Tran, Tien-Dung Duong, Active learning for density peak clustering, IEEE International Conference on Advanced Communications Technology (ICACT), 2022.
  • Viet-Vu Vu, Byeongnam Yoon, Hong-Quan Do, Hai-Minh Nguyen, Tran-Chung Dao, Cong-Mau Tran, Doan-Vinh Tran, Thi-Nhuong Phi, Viet-Thang Vu, Tien-Dung Duong, Active constraints selection based on density peak, IEEE International Conference on Advanced Communications Technology (ICACT), 2022.
  • Viet-Vu Vu, Byeongnam Yoon, Hong-Quan Do, Hai-Minh Nguyen, Tran-Chung Dao, Cong-Mau Tran, Doan-Vinh Tran, An emperical study for density peak clustering, IEEE International Conference on Advanced Communications Technology (ICACT), 2022.
  • Hong-Quan Do, T.H. An Nguyen, Quoc Anh Nguyen, Trung Hieu Nguyen, Viet-Vu Vu, Cuong Le, A Fast Clustering based Recommender System for Big Data, IEEE International Conference on Advanced Communications Technology (ICACT), 2022.
  • Dinh-Lam Pham, Viet-Vu Vu, Byeongnam Yoon, Kyoung-Sook Kim, Kwanghoon Pio Kim, A Conceptual Architecture for Deep-learning-based Video-Objects Retrieving System, IEEE International Conference on Advanced Communications Technology (ICACT), 2022.
  • Hong-Quan Do, Thi-Ha Nguyen, Viet-Vu Vu, Thi-Mai Hoang, Hai-Minh Nguyen and T. Thuy-Duong Nguyen, Evaluation of U-Net and Its Variants in Solving Upper Gastrointestinal Endoscopy Segmentation, International Conference on Advanced Computing and Applications (ACOMP), 2021.
  • Sergey Avdoshin, Thanh Quyen Bui Thi, Nhich Dam Van, Tien Do Nam, Mariia Gordenko, Egor Gritsenko, Vladimir Muhamadiev, Alexey Nazarov, Ngoc Diep Nguyen, Tien Loi Nguyen, Dmitry Pantiukhin, Ilya Voronkov, Thang Vu Viet, Vu Vu Viet and Thang Vu Tat, Neural networks for rare intrusions detection in wireless networks: survey and perspectives, International Conference Actual Problems of System and Software Engineering (APSSE), 2021.
  • Vu-Tuan Dang, Hong-Quan Do, Viet-Vu Vu, Byeongnam Yoon, 2021, Facial expression recognition: A survey and its application, In proceeding of International Conference on Advanced Communication and Technology.
  • Vu-Tuan Dang, Viet-Vu Vu, Hong-Quan Do, Thi Kieu Oanh Le, 2021, Semi-supervised graph based clustering and active learning, Journal of Computer Science and Cybernetics.
  • Ahmad Ali Abin, Viet-Vu Vu, 2020, A Density-based Approach for Querying Informative Constraints for Clustering, Expert System with Applications, Vol. 161. [ISI, Q1]
  • Mahdi Dehghan, Hossein Ali Rahmani, Ahmad Ali Abin, Viet-Vu Vu, 2020, Mining Shape of Expertise: A Novel Approach Based on Convolutional Neural Network, Information Processing and Management, Vol. 57(4) [ISI, Q1].
  • Van-Hung Le, Van-Nam Hoang, Hai Vu, Thi-Lan Le, Thanh-Hai Tran, and Viet-Vu Vu, 2020, Hand PointNet-based 3D Hand Pose Estimation in Egocentric RGB-D Images, In Proc. of International Conference on Advanced Technologies for Communications (ATC).
  • Hai Vu, Van Ngoc Duong, and Viet-Vu Vu, 2020, Exploiting the fine-grained similarity of a large-scale rice species using shape motif discovery. In Proc. of the IEEE International Conference on Computing and Communication Technologies (RIVF).