Hướng dẫn cách xóa dữ liệu trùng trong Excel nhanh chóng
Khi làm việc trên trang tính, chắc chắn một lúc nào đó các bạn sẽ cần đến thao tác lọc dữ liệu trong Excel, đặc biệt là với các bảng có khối lượng nội dung khổng lồ như báo cáo tổng hợp. Làm thế nào để phát hiện và loại bỏ tất cả các giá trị trùng lặp? Trong bài viết ngày hôm nay, Trung tâm Tin học sẽ giới thiệu đến bạn các phương pháp xóa dữ liệu trùng trong Excel nhanh chóng và hiệu quả nhất.
Phương thức đơn giản và phổ biến nhất để xóa dữ liệu trùng trong Excel chính là chức năng Remove Duplicates. Hãy cùng tìm hiểu về chức năng này và các bước lọc dữ liệu trong Excel bằng phương thức cơ bản nhất nhé.
Thấu hiểu việc lặp dữ liệu trong bảng tính là không thể tránh khỏi, Microsoft đã thiết kế một chức năng giúp người dùng lọc dữ liệu trong Excel ngay trên giao diện trang tính mà không cần thao tác phức tạp. Chức năng này được gọi là Remove Duplicates. Như tên gọi của nó, chức năng Remove Duplicates có nhiệm vụ tự động xóa dữ liệu trùng trong Excel mà không cần người dùng phải thao tác thủ công.
Khi sử dụng chức năng Remove Duplicates, bạn nên lưu ý rằng mọi dữ liệu sau quá trình lọc sẽ bị loại bỏ hoàn toàn khỏi trang tính. Do đó, hãy chắc chắn rằng bạn đã kiểm tra kĩ nội dung bảng tính của mình. Một mẹo nhỏ trong trường hợp này, bạn hãy sao chép phần dữ liệu gốc sang một trang tính khác để đảm bảo không xóa nhầm bất cứ thông tin nào quan trọng.
Với các bản báo cáo chứa hàng chục đến hàng trăm dòng số liệu, chúng ta cần đặc biệt lưu ý đến thao tác xóa dữ liệu trùng trong Excel vì định dạng có thể trở nên rối mắt, khó khăn cho việc phát hiện thông tin thừa. Do đó, các bạn hãy tham khảo kỹ năng phân tích số liệu trong báo cáo Excel dưới đây nhé.
Để xóa dữ liệu trùng trong Excel bằng chức năng Remove Duplicates, các bạn hãy thực hiện các bước sau đây:
Bước 1: Chọn toàn bộ vùng dữ liệu cần lọc trên trang tính. Nếu bạn cần áp dụng bộ lọc dữ liệu trong Excel cho toàn bộ trang tính, hãy nhấn tổ hợp phím tắt Ctrl+A.
Bước 2: Vào tab Data > nhóm Data Tools > Remove Duplicates.
Bước 3: Hộp thoại Remove Duplicates hiện lên. Bạn chọn cột chứa các dữ liệu trùng cần loại bỏ. Nếu bảng tính của bạn có các dòng tiêu đề thì hãy tích chọn ô My data has headers.
Bước 4: Nhấn OK để đóng hộp thoại. Bạn sẽ nhận được thông báo từ Excel về số lần lặp dữ liệu đã được loại bỏ và số dòng dữ liệu duy nhất còn lại trong bảng tính.
Chức năng Sort & Filter được thiết kế để giúp người dùng lọc dữ liệu trong Excel một cách nhanh chóng và hiệu quả. Khi bạn sử dụng chức năng này, chỉ những mục bạn đã chọn mới được hiển thị trên giao diện trang tính. Điều này nghĩa là toàn bộ các mục còn lại sẽ được ẩn tạm thời.
Với chức năng Sort & Filter, bạn có thể lọc dữ liệu trong Excel bằng giá trị, định dạng hoặc các điều kiện tự xác định. Sau khi áp dụng bộ lọc cho dữ liệu của mình, bạn vẫn có thể sao chép, chỉnh sửa, tạo các đồ thị, biểu đồ Excel hoặc thiết lập chế độ in ấn với những dữ liệu được hiển thị mà không cần phải sắp xếp lại toàn bộ danh sách.
>>Xem thêm: Cách dùng hàm VLOOKUP trong Excel lọc dữ liệu trùng nhau
Sử dụng chức năng Copy, chúng ta sẽ xóa dữ liệu trùng trong Excel bằng cách sao chép các phần dữ liệu không bị trùng lặp sang một vị trí khác. Các bạn hãy thực hiện các bước sau đây:
Bước 1: Chọn toàn bộ vùng dữ liệu cần lọc trên trang tính. Nếu bạn cần áp dụng bộ lọc dữ liệu trong Excel cho toàn bộ trang tính, hãy nhấn tổ hợp phím tắt Ctrl+A.
Bước 2: Vào tab Data > nhóm Sort & Filter > Advanced.
Bước 3: Hộp thoại Advanced Filter hiện lên. Bạn thiết lập các thông tin như dưới đây.
Bước 4: Nhấn OK để đóng hộp thoại. Toàn bộ dữ liệu không trùng lặp sẽ được copy sang một vị trí khác.
>>Xem thêm: Cách copy từ Excel sang Word giữ nguyên định dạng đơn giản nhất
Để xóa dữ liệu trùng trong Excel, chúng ta sẽ kết hợp 2 hàm dưới đây:
a. Hàm COUNTIFS
b. Hàm IF
Với hàm COUNTIFS và hàm IF, chúng ta sẽ tạo một công thức kiểm tra liệu dữ liệu có lặp hay không bằng cách đếm số lần xuất hiện dữ liệu. Nếu kết quá công thức trả về là 1 nghĩa là dữ liệu là duy nhất. Ngược lại, nếu kết quả trả về lớn hơn 1 nghĩa là dữ liệu đã lặp lại. Lúc này, chúng ta sẽ phải xóa dữ liệu trùng trong Excel.
Khi sử dụng công thức hàm này, chúng ta cần phân biệt rõ ràng 2 trường hợp sau:
=IF(COUNTIFS($A$2:$A2, $A2, $B$2:$B2, $B2, $C$2:$C2, $C2)>1, "Duplicate row", "Unique")
=IF(COUNTIFS($A$2:$A$10, $A2, $B$2:$B$10, $B2, $C$2:$C$10, $C2)>1, "Duplicate row", "Unique")
Sau khi sử dụng công thức hàm để xác định các dòng dữ liệu lặp, chúng ta sẽ nhờ đến sự trợ giúp của chức năng Filter để lọc dữ liệu trong Excel.
Bước 1: Chọn toàn bộ dữ liệu bao gồm cột kết quả của công thức hàm.
Bước 2: Vào tab Data > nhóm Sort & Filter > Filter.
Bước 3: Tích chọn mục Duplicate row rồi nhấn OK.
Bước 4: Chọn tất cả các dòng đã lọc, nhấn chuột phải và chọn Delete Row.
>>Xem thêm: Cách đặt công thức mặc định cho 1 cột, tự động tính tổng trong Excel
Như vậy, chúng ta đã tìm hiểu ba phương pháp xóa dữ liệu trùng trong Excel. Các bạn có thể áp dụng một trong ba cách này để đảm bảo file dữ liệu của mình không còn dữ liệu thừa. Để tìm hiểu thêm nhiều thủ thuật Excel hữu dụng khác, các bạn hãy tham khảo các bài viết tại website của Trung tâm Tin học và đăng kí khóa học về Tin học văn phòng với chúng mình nhé. Chúc các bạn thành công!
-----------------------------------
Mọi thắc mắc về khóa học vui lòng liên hệ:
Hotline: 0388.312.226 // 0961.174.239
Inbox: m.me//vitc.vnua
Web: https://vitc.edu.vn/
P306, Khu làm việc của các Khoa, Viện, TT - HVNNVN