Hướng dẫn sử dụng công cụ lọc trùng dữ liệu trong Excel
Trong quá trình làm việc với Excel, việc trùng lặp dữ liệu là điều thường xuyên xảy ra, nhất là trong những tài liệu có nhiều dữ liệu. Nhiều khi bạn cần phải tiến hành lọc những dữ liệu trùng đó và xóa bỏ nó. Tuy nhiên bạn không thể nào ngồi dò từng dòng và xóa từng dữ liệu trùng theo cách thủ công đó được. Và để giải quyết vấn đề trên, chúng ta có thể sử dụng những công cụ lọc dữ liệu trùng nhau trong Excel. Vậy những công cụ lọc trùng dữ liệu đó là gì, cách sử dụng ra sao thì hãy cùng Trung tâm Tin học tìm hiểu trong bài viết này nhé.
Lọc dữ liệu là một thao tác của người soạn thảo, dựa vào những công cụ trên Excel tiến hành tìm những dữ liệu bị trùng nhau trên cùng một vùng dữ liệu (một file, một sheet hoặc nhiều sheet khác nhau). Việc lọc dữ liệu rất quan trọng bởi:
Đây là một tính năng thông dụng vì được cài đặt mặc định trên toàn bộ mọi phiên bản của Excel. Tính năng này sẽ giúp bạn lọc những dữ liệu trùng nhưng sẽ tự động xóa chúng đi. Vì vậy bạn cần cân nhắc khi sử dụng công cụ này nhé. Để thực hiện chúng ta làm như sau:
Bước 1: Bôi đen vùng dữ liệu mà bạn cần lọc. Sau đó trên thanh công cụ bạn vào tab Data, ở phần Data Tools chọn mục Remove Duplicates.
Lọc dữ liệu trùng bằng tính năng Remove Duplicates
Bước 2: Khi đó hộp thoại Remove Duplicates sẽ hiện ra:
Tại ô My data has headers, bạn có thể tích chọn nếu muốn loại dòng đầu tiên (tên cột) ra khỏi vùng lọc dữ liệu.
Có hai mục là Select All nếu bạn muốn lọc toàn bộ vùng dữ liệu được lựa chọn và Unselect All, nếu bạn hủy bỏ lọc toàn bộ vùng dữ liệu có thể lựa chọn. Còn nếu bạn muốn lọc một số dữ liệu có thể tích thủ công tại mục Columns.
Lọc dữ liệu trùng bằng tính năng Remove Duplicates
Bước 3: Sau khi hoàn tất bạn nhấn OK. Lúc này Excel sẽ trả về thông báo là số giá trị giống nhau (duplicate values) đã được xóa đi và số giá trị duy nhất (unique values) còn lại trong vùng dữ liệu của bạn. Hãy kiểm tra kết quả tại vùng dữ liệu bạn nhé.
Lọc dữ liệu trùng bằng tính năng Remove Duplicates
Đây là cách giúp bạn nhấn mạnh những vùng dữ liệu bị trùng lặp. Việc đánh dấu sẽ không tự động xóa dữ liệu của bạn. Và việc có xóa dữ liệu trùng hay không do bạn tự quyết định. Để đánh dấu dữ liệu trùng lặp bạn tiến hành làm như sau:
Bước 1: Bôi đen vùng dữ liệu bạn muốn lọc, chọn tab Home và vào Styles, nhấn vào Conditional Formatting, sau đó chọn Highlight Cells Rules, tiếp đến chọn Duplicates Values (Như trong hình)
Đánh dấu dữ liệu trùng lặp bằng Conditional Formatting
Bước 2: Hộp thoại Duplicate Values hiện ra, bạn có hai sự lựa chọn ở ô đầu tiên:
Ở ô thứ hai bạn có thể lựa chọn màu để làm nổi bật dữ liệu, và màu đang được mặc định là ô màu đỏ nhạt với chữ đỏ đậm (Light Red Fill with Dark Red Text).
Đánh dấu dữ liệu trùng lặp bằng Conditional Formatting
Bước 3: Sau khi đã cài đặt xong bạn nhấn OK để hoàn tất. Và bạn có thể thấy dữ liệu bạn muốn đã được đổ màu và nổi bật trong tài liệu của bạn rồi đó.
Xem thêm: Hướng dẫn chuyển định dạng dấu phẩy sang dấu chấm trong Excel cực đơn giản
Tính năng Advanced Filter sẽ hoạt động tương tự với một filter thông thường ở trong Excel, tức là bạn chỉ lọc ra những giá trị bạn muốn, những giá trị còn lại vẫn nằm ở đó, không bị mất đi. Để lọc dữ liệu trùng lặp bằng Advanced Filter, các bạn làm theo các bước sau:
Bước 1: Bôi đen vùng dữ liệu và vào tab Data, chọn phần Sort & Filter và chọn Advanced.
Lọc dữ liệu trùng bằng Advanced Filter
Bước 2: Hộp thoại Advanced Filter xuất hiện, bạn có thể tiến hành thiết lập theo những ý sau:
Ở mục Action có hai lựa chọn cho bạn đó là:
Ô Unique records only để lọc ra các giá trị trùng, chỉ giữ lại các giá trị duy nhất.
Lọc dữ liệu trùng bằng Advanced Filter
Bước 3: Sau khi hoàn tất lựa chọn nhấn OK và cùng xem kết quả nhé.
Cách lọc này thích hợp với những file Excel có nhiều Sheet, giúp bạn lọc dữ liệu một lúc nhiều Sheet khác nhau. Cách làm như sau:
Giả sử bạn có dữ liệu như trong ảnh, bạn muốn tìm ra những giá trị nào bị trùng lặp của cột Họ và Tên giữa hai vùng dữ liệu, hãy làm theo các bước sau:
Lọc dữ liệu trùng bằng công thức
Bước 1: Thêm một cột Kiểm Tra vào vùng dữ liệu thứ 1.
Bước 2: Nhập công thức cho cột Kiểm Tra tại ô E2 như sau:
=IF(ISNA(VLOOKUP(B2,Sheet2!B:C,1,0)),"Unique","Duplicate")
Lọc dữ liệu trùng bằng công thức
Bước 3: Áp dụng công thức cho toàn bộ cột Kiểm Tra. Những giá trị bị trùng lặp thì cột Kiểm Tra sẽ trả về giá trị “Duplicate”, giá trị duy nhất sẽ trả về giá trị “Unique”. Ta có kết quả như hình bên dưới.
Lọc dữ liệu trùng bằng công thức
Như vậy để lọc dữ liệu trùng trong Excel không hề khó như bạn tưởng đúng không nào. Chỉ với vài thao tác đơn giản như chúng mình đã hướng dẫn, bạn đã có thể lọc, hoặc thậm chí là xóa những dữ liệu bị trùng trong Excel. Hy vọng bài viết đã mang đến nhiều kiến thức bổ ích dành cho các bạn. Nếu bạn muốn quan tâm đến các khóa học Tin học văn phòng thì hãy liên hệ ngay đến Trung tâm tin học Học viện Nông nghiệp Việt Nam nhé.
-----------------------------------
Mọi thắc mắc về khóa học vui lòng liên hệ:
Hotline: 0388.312.226 // 0961.174.239
Inbox: m.me//vitc.vnua
Web: https://vitc.edu.vn/
P306, Khu làm việc của các Khoa, Viện, TT - HVNNVN