Tinh lọc trung vị trong xử lý ảnh

We’ve updated our privacy policy so that we are compliant with changing global privacy regulations and to provide you with insight into the limited ways in which we use your data.

You can read the details below. By accepting, you agree to the updated privacy policy.

Thank you!

View updated privacy policy

We've encountered a problem, please try again.

Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản

• Bộ lọc trung vị được dùng phổ biến, bởi vì một số loại nhiễu nhất định,

nó có thể lọc nhiễu rất tốt với độ mờ thấp so với bộ lọc tuyến tính cùng

kích thước.

Ý tưởng: Ý tưởng chính của thuật toán lọc trung vị như sau: Sử dụng

một cửa dổ lọc [ma trận 3 x 3] quét qua lần lượt từng điểm ảnh của ảnh

đầu vào input. Tại vị trí mỗi điểm ảnh lấy giá trị của các điểm ảnh tương

ứng trong vùng 3 x 3 của ảnh gốc “lấp” vào ma trận lọc. Sau đó sắp xếp

điểm ảnh nằm chính giữa [trung vị] của dãy giá trị điểm ảnh đã được sắp

xếp ở trên cho giá trị điểm ảnh đang xét của ảnh đầu ra input.

Các bước thực hiện:

• Trung vị E của một tập hợp là giá trị mà một nữa các giá trị trong tập

hợp nhỏ hơn hoặc bằng E, một nửa các giá trị trong tập hợp lớn hơn

hoặc bằng E.

• Chức năng cơ bản của bộ lọc trung vị là thiết lập trị của các điểm với

các mức xám khác nhau thành giá trị có ve như gần giống với giá trị của

điểm lân cận.

• Khi áp dụng bộ lọc trung vị có kích thước mxn, các điểm ảnh à có số

lượng các điểm lân cận cùng mức xám với nó nhỏ hơn m*n/2 sẽ không

bị ảnh hưởng, điều này khắc phục được nhược điểm làm mờ ảnh khi áp

dụng bộ lọc trung bình.

VD:

Có ma trận 3x3 như sau:

50

65

52

63

255

58

61

60

57

Các giá trị sau khi sắp xếp

50

52

57

58

60

61

63

65

255

20

Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản

Kết quả là giá trị 255 sẽ được thay thế bằng giá trị 60.

• Hạn chế của lọc trung vị là chậm do mỗi lần tính giá trị mói phải thực hiện sắp

xếp lại nxn lần.

• Tính chất của lọc trung vị:

- Có lợi cho việc loại bỏ các điểm ảnh hay các hàng mà vẫn đảm bảo

an toàn độ phân giải

- Hiệu quả giảm khi số điểm trong ma trận lớn hay bằng một nửa số

điểm trong ma trận. Điều này dễ giải thích vì trung vị là [N w + 1]/2

giá trị lớn nhất nếu Nw lẻ. Lọc trung vị trường hợp hai chiều coi như

lọc trung vị tách được theo từng chiều.

• Một số bộ lọc thường dùng:

[1,

1,

1]

[1,

[1,

8,

1]

[2,

[1,

1,

1]

[1,

Kích thước của bộ lọc [2N – 1, 2M - 1], ví dụ 3x3, 5x5…

2,

4,

2,

1]

2]

1]

Đặt tâm của bộ lọc lên điểm ảnh cần xét, không xét những điểm nằm

trên biên vùng ảnh.

2.2.

Quá trình xử lý ảnh văn bản

2.2.1. Nhị phân hóa ảnh văn bản

Trong thực tế, ảnh văn bản mà chúng ta nhận vào ban đầu để xử lý là ảnh màu.

Vì vậy để có thể thực hiện được quá trình phân tích và nhận dạng, chúng ta cần phải

chuyển chúng thành ảnh nhị phân trong đó mỗi điểm ảnh [pixel] được biểu diễn bởi

một trong 2 giá trị là 0 hoặc 255. Đầu tiên, ảnh màu nhận vào sẽ được chuyển thành

ảnh xám với các mức xám có giá trị từ 0 đến 255 dựa trên ba giá trị RED, GREEN,

BLUE của ảnh đầu vào. Từ ảnh xám này, chúng ta sẽ so sánh mức xám của từng điểm

với một ngưỡng cho trước để quyết định điểm đó sẽ là 0 hoặc 255, giá trị 0 biểu diễn

cho màu đen và 255 biểu diễn cho màu trắng.

21

Tìm hiểu kỹ thuật xử lý ảnh và xây dựng ứng dụng tách ảnh ký tự từ ảnh văn bản

Giới thiệu phương pháp OTSU:

Otsu là tên một nhà nghiên cứu người Nhật đã nghĩ ra ý tưởng cho việc tính

ngưỡng T một cách tự động [adaptive] dựa vào giá trị điểm ảnh của ảnh đầu vào

nhằm thay thế cho việc sử dụng ngưỡng cố định [fixed hay const]. Phương pháp này

cho kết quả là mỗi ảnh khác nhau có một ngưỡng tương ứng khác nhau bằng các bước

xử lý như sau:

Bước 1: Chọn một giá trị khởi tạo cho T [nên chọn giá trị mang tính công thức,

ví dụ T = [min + max] / 2, T = giá trị trung bình, ... tránh dùng các giá trị mang tính

định lượng thiết lập cứng].

Bước 2: Phân hoạch ảnh sử dụng T. kết quả của bước này sẽ tạo ra 2 nhóm điểm

ảnh: G1 chứa tất cả các điểm ảnh với giá trị [intensity] > T và G2 chứa các điểm ảnh

với giá trị [intensity]

Chủ Đề